KR102149070B1 - 조사적 세포 기반 분석 및 이의 사용 - Google Patents
조사적 세포 기반 분석 및 이의 사용 Download PDFInfo
- Publication number
- KR102149070B1 KR102149070B1 KR1020147030700A KR20147030700A KR102149070B1 KR 102149070 B1 KR102149070 B1 KR 102149070B1 KR 1020147030700 A KR1020147030700 A KR 1020147030700A KR 20147030700 A KR20147030700 A KR 20147030700A KR 102149070 B1 KR102149070 B1 KR 102149070B1
- Authority
- KR
- South Korea
- Prior art keywords
- delete delete
- cell
- cells
- data
- disease
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P1/00—Drugs for disorders of the alimentary tract or the digestive system
- A61P1/16—Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P27/00—Drugs for disorders of the senses
- A61P27/02—Ophthalmic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P29/00—Non-central analgesic, antipyretic or antiinflammatory agents, e.g. antirheumatic agents; Non-steroidal antiinflammatory drugs [NSAID]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/04—Anorexiants; Antiobesity agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P3/00—Drugs for disorders of the metabolism
- A61P3/08—Drugs for disorders of the metabolism for glucose homeostasis
- A61P3/10—Drugs for disorders of the metabolism for glucose homeostasis for hyperglycaemia, e.g. antidiabetics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P35/00—Antineoplastic agents
- A61P35/02—Antineoplastic agents specific for leukemia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P9/00—Drugs for disorders of the cardiovascular system
- A61P9/10—Drugs for disorders of the cardiovascular system for treating ischaemic or atherosclerotic diseases, e.g. antianginal drugs, coronary vasodilators, drugs for myocardial infarction, retinopathy, cerebrovascula insufficiency, renal arteriosclerosis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/02—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
- C12Q1/025—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/5005—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells
- G01N33/5008—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving human or animal cells for testing or evaluating the effect of chemical or biological compounds, e.g. drugs, cosmetics
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/68—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Medicinal Chemistry (AREA)
- Organic Chemistry (AREA)
- Biomedical Technology (AREA)
- Hematology (AREA)
- Biotechnology (AREA)
- Urology & Nephrology (AREA)
- Analytical Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Veterinary Medicine (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Animal Behavior & Ethology (AREA)
- Public Health (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Food Science & Technology (AREA)
- Cell Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Theoretical Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Toxicology (AREA)
- Diabetes (AREA)
Abstract
본 명세서에서는 모델 구축을 통해 생물학적 시스템 또는 과정(예를 들어, 암과 같은 질병 조건)을 분석하기 위한 발견 플랫폼 기술이 기술된다.
Description
본 출원은 조사적 세포 기반 분석 및 이의 사용에 관한 것이다.
관련 출원
본 출원은 2012년 4월 2일 출원된 미국 예비 특허 출원 제 61/619326호; 2012년 7월 6일 출원된 미국 예비 특허 출원 제 61/668617호; 2012년 4월 4일 출원된 미국 예비 특허 출원 제 61/620305호; 2012년 6월 28일 출원된 미국 예비 특허 출원 제 61/665631호; 2012년 8월 1일 출원된 미국 예비 특허 출원 제 61/678596호; 및 2012년 8월 1일 출원된 미국 예비 특허 출원 제 61/678590호의 우선권을 주장하며, 각 출원의 전체 내용은 참조를 통해 본 명세서에 명시적으로 통합된다.
1964년 오늘날 분자생물학이라 불리는 분야의 선구자인 제임스 왓슨(James Watson)과 프란시스 크릭(Francis Crick)에 의해 DNA가 발견된 이후, 신약 개발이 크게 향상되었다. 분자생물학의 도구와 제품들로 인해 빠르고 상세하며 정확한 유전자 조절의 측정이 DNA 및 RNA 수준 모두에서 가능하게 되었다. 패러다임을 뒤바꾼 이 발견 이후 30년간 녹다운(knock-out) 동물 모델 및 핵심 효소결합 반응이 나타났고, 앞서 언급한 플랫폼으로부터 질병 메커니즘과 병리생리학을 새롭게 이해할 수 있게 되었다. 2000년 봄, 크레이그 벤토(Craig Ventor)와 프란시스 콜린스(Francis Collins)는 인간 게놈의 초기 염기 서열을 발표하였고, 과학계에는 새로운 의약품의 파고가 몰아치게 되었다.
게놈의 매핑은 즉각적으로, 예를 들어, 유전자 치료를 사용하여 알츠하이머 또는 파킨슨 씨 병을 일으키는 뇌의 퇴행적 과정을 역전시킴으로써 질병이 시작되기 이전에도 이를 통제할 수 있고, 또한 정상적인 조직 구조와 생리학적 상태를 복원시키면서도 종양 위치에 도입하여 질병을 근절시킬 수 있는 구조체를 만들 수 있다는 희망을 불러 일으켰다. 다른 사람들은 이러한 논쟁에서 더 나가 눈이나 머리 색깔, 키 등에 대해 원하는 대로 자손을 창출하는 개념을 제안하기도 하였다. 그러나, 10년이 지났지만, 아직도 많은 사람들이 유전자 치료의 지속 가능한 성공, 또는 심지어 유전학적 과정의 초보적 제어를 기다리고 있을 뿐, 이에 대한 가시적 경로는 보이지 않고 있다.
따라서, 최소한 구조체를 지지하는 것과는 독립적인 유전학은 최종적인 생리상태를 창출하지는 않는다는 것이 눈에 보이는 현실이다. 실제로, 전사 후 변형, 변이, 단일 뉴클레오타이드 다형성(SNP), 및 전사 변형 등과 같은 많은 과정들이 자연적 섭리로 주어진 유전자 및/또는 이 유전자의 부호화된 보완 단백질을 변화시킬 수 있으며, 따라서 이를 통해 질병 과정에 기여할 수 있다.
정보 시대가 도래하고 인터넷이 나타남에 따라 과도한 정보가 쏟아지고 있지만, 국제적 협동과 비평 또한 쉽게 이루어지게 되었다. 역설적이게도, 상기 언급된 현실은 과학계가 몇 개의 단순한 점들을 간과하는 원인이 될 수 있는데, 여기에는 신호 증폭의 통신과 세포 및/또는 조직 간의 교차 대화(상호 대화)가 무엇인가 잘못되었을 때 항상성 및 시정적 메커니즘을 위한 메시지를 발생토록 한다는 것이다.
이와 관련된 사항은 심장병(CVD)과 연관된 것으로, 이 질병은 미국 및 많은 선진국에서 주요 사망 요인으로 남아 있으며, 미국에서만 2.8명의 사망자 중 1명이 심장병과 관련되어 있다. 또한, CVD는 만성 신장 질환(미국에서 약 천9백만 사례), 만성 피로 증후군, 및 대사증후군에서의 핵심 요소와 같은 연관 합병증에 기여하는 병리 현상의 배경으로 작용한다. 진단법과 관련된 기술, 외과적 시술을 최소화하는 치료 기술, 수용 약제 혈관 삽입 및 효과적인 임상적 관리 등에서의 상당한 진보는 시술 심장학 분야에서 유래 없는 성장의 시기를 만들어 냈으며, 또한 보다 효과적인 CVD 관리를 가능하게 하였다. 그러나, CVD, 당뇨 및 주변 혈관 질병과 같은 연관된 보조 이병률과 관련된 질병 원인론은 아직 충분히 밝혀지지 않았다.
질병 조건(예를 들어, CVD)의 원인론과 같은 생물학적 과정에 포함된 메커니즘 및 경로를 탐구하고 핵심 조절 경로 및/또는 목표 분자(예를 들어, “약제로 치료할 수 있는 목표(drugable targets)”) 및/또는 보다 나은 질병 진단, 관리 및/또는 치료를 위한 표지 인자를 파악하기 위한 새로운 접근 방법들은 아직도 부족하다.
본 명세서에서 기술된 발명은 최소한 부분적으로는 네트워크 생물학, 게놈, 단백질체, 대사체 및 전사체에 대한 학문과 생체 정보학의 도구 및 방법론의 신규의 협업적 활용에 기반한 것으로서, 이들이 결합된다면, 암, 당뇨, 비만, 심장병, 및 신생 혈관 생성을 포함하여 선택된 질병 조건과 같은 관심의 대상인 생물학적 시스템을 조직적인 생물학 연구방법을 이용하여 연구하는데 사용될 수 있다. 첫 번째 단계로서, 질병 과정과 같은 다양한 생물학적 시스템을 탐구하기 위해 세포 모델링 시스템이 개발되었으며, 이 시스템은 다양한 질병 관련 환경 자극(예를 들어, 고혈당증, 저산소 상태, 면역 스트레스, 및 지질 과산화, 세포 밀도, 혈관 형성 작용 물질 및 억제 물질)을 겪는 질병 관련 세포들을 포함한다. 일부 실시예에서, 이러한 세포 모델링 시스템은 반응에 참여하는 다양한 세포 유형들(예를 들어 대동맥의 평활근 세포(HASMC), 기부 세관 신장 세포(HK-2), 대동맥 내피 세포(HAEC), 및 진피 섬유아세포(HDFa)) 사이의 세포 간 상호 대화 메커니즘을 포함한다. 세포 모델 시스템으로부터의 고성능 생물학적 해독은 기술들의 조합을 통해 얻어지며, 이러한 기술들은 예를 들어, 최신의 질량 분광학(LC/MSMS), 유동 세포 계수법, 세포-기반 분석, 및 기능적 분석 등이 포함된다. 고성능의 생물학적 해독은 생물정보학적 분석을 거쳐 생체 외, 생체 내, 및 컴퓨터 모의 모델링에 의해 합치되는 데이터 경향을 연구한다. 이로부터 비롯되는 매트릭스를 통해 상호 연관된 데이터 마이닝이 가능하며 이로부터 결정적인 압점(또는 “허브”)에 이를 수 있는 선형 및 비선형 회귀 분석이 개발되었다. 본 명세서에서 제시되는 이들 “허브”들은 신약 발견의 후보가 된다. 특히, 이들 허브들은 잠재적 약품 타겟 및/또는 질병 표지 인자를 나타낸다.
분별의 분자 서명은 질병의 시작과 발달에 이르는 조직의 마이크로환경에서의 변이를 지배하는 메커니즘에 대한 통찰력을 가지게 해 준다. 이들을 모두 통합하면, 이전에 언급된 기술 플랫폼들을 전략적 세포 모델링과 조합함으로써 견고한 지성적 방법을 채택하여 질병에 대한 보다 나은 이해를 확립하고 동시에 치료 수준을 임상적으로 확장시킬 수 있는 생물학적 표지 인자 라이브러리와 약품 후보 물질을 생성하는 것이 가능하게 된다.
또한, 이 접근 방식은 질병 진단 또는 시술에 유용할 뿐만 아니라, 둘 또는 그 이상의 세포 시스템이 반응하는 생물학적 시스템과 같이 사실상 생물학적 시스템 내의 모든 병리학적 또는 비병리학적 조건들에 일반적으로 적용할 수 있다. 예를 들어, 이 접근 방식은 약제의 독성에 연관되어 있거나 인과 관계를 가지는 메커니즘을 이해하는 통찰력을 얻는데 유용하다. 따라서 본 발명은 광범위한 스펙트럼의 설정에 일반적으로 적용될 수 있는 조사적 생물학적 평가를 위한 프레임워크를 제공한다.
본 발명의 플랫폼의 의미 있는 특징은 이러한 AI 기반 시스템이 생물학적 과정과 관련하여 알려진 생물학적 관계와 같은 해당 분야의 기존 지식에 의존하거나 이를 고려하지 않으면서(즉, 어떠한 데이터 포인트도 인위적이지 않으면서) 세포 모델 시스템으로부터 획득된 데이터 집합에 기반하고 있다는 것이다. 이에 따라, 이러한 플랫폼으로부터 생성되어 결과적으로 나타나는 통계적 모델은 편향되어 있지 않다. 예를 들어, 이로부터 얻어진 세포 모델 시스템 및 데이터 집합과 같은 본 발명의 플랫폼 및 그 구성 요소의 또 다른 의미 있는 특징은 이로부터 (예를 들어, 새로운 세포 및/또는 조건을 도입함으로써) 시간에 걸친 연속적인 세포 모델의 구축이 가능하다는 것이며, 이에 따라 생물학적 시스템 또는 과정에 대한 세포 모델로부터 생성된 초기의 “최초 세대”의 합치 인과 관계 네트워크가 세포 모델 자체의 진화에 따라 다중 생성 인과 관계 네트워크로 진화해 나갈 수 있다는 것이다(또한 델타 또는 델타-델타 네트워크가 이로부터 얻어진다). 이러한 방식으로, 세포 모델과 이 세포 모델로부터의 데이터 집합, 및 이 세포 모델로부터 플랫폼 기술 방법을 사용하여 생성된 인과 관계 네트워크 모두가 끊임없이 진화하고 이러한 플랫폼 기술로부터 얻은 이전의 지식 위에 구축될 수 있다.
본 발명은 생물학적 시스템의 조절 인자 식별 방법을 제공하며, 상기 방법은:
생물학적 시스템의 특징적 측면을 나타내기 위해 생물학적 시스템에 연관된 세포를 이용하여 생물학적 시스템에 대한 모델을 수립하는 단계;
상기 모델로부터 생물학적 시스템과 연관된 세포 내에서 단백질체의 전역적 변화를 나타내는 제 1 데이터 집합을 획득하는 단계;
상기 모델로부터 생물학적 시스템과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합을 획득하는 단계로서, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 효소의 전역적 활성이 생물학적 시스템과 연관된 세포 내의 효소 대사 물질 또는 기질(substrate)에 미치는 영향을 포함하는 단계;
프로그래밍된 컴퓨터 장치를 사용하여 제 1 및 제 2 데이터 집합에만 기반하여 상기 단백질체의 전역적 변화 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 제 1 및 제 2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및
상기 합치 인과 관계 네트워크로부터 생물학적 시스템에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계와 연관된 최소한 하나의 효소는 생물학적 시스템의 조절 인자로서 식별되는 단계를 포함한다.
특정 실시예에서, 제 1 데이터 집합은 단일 단백질체의 데이터 집합이다. 특정 실시예에서, 제 2 데이터 집합은 생물학적 시스템과 연관된 세포의 단일 기능적 활성 또는 세포 반응을 나타낸다. 특정 실시예에서, 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 지질체적 데이터를 더 포함한다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 지질체적 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성을 포함한다.
특정 실시예에서, 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 하나 또는 그 이상의 지질체적, 대사체, 전사체, 게놈 및 SNP 데이터를 더 나타낸다. 특정 실시예에서, 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 둘 또는 그 이상의 지질체적, 대사체적, 전사체적, 게놈적 및 SNP 데이터를 더 나타낸다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈, 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 최소한 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 영향을 더 포함한다.
특정 실시예에서, 상기 효소의 전역적 활성은 전역 키나아제 활성을 포함한다. 특정 실시예에서, 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과는 세포의 인산 단백질체를 포함한다.
특정 실시예에서, 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 더 포함한다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈, 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 최소한 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 영향을 포함하며, 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 더 포함한다.
본 발명의 특정 실시예에서, 상기 생물학적 시스템의 모델은 생물학적 시스템과 연관된 세포의 생체 외 배양을 포함한다. 본 발명의 특정 실시예에서, 상기 생물학적 시스템의 모델은 제어 세포의 합치되는 생체 외 배양을 선택 사항으로 더 포함한다.
본 발명의 특정 실시예에서, 상기 생물학적 시스템의 모델의 세포의 생체 외 배양은 환경적 교란을 겪으며, 합치 제어 세포의 생체 외 배양은 환경적 교란을 겪지 않은 세포와 동일하다. 특정 실시예에서, 상기 생물학적 시스템의 모델에서의 환경적 교란은 생물체에 작용하는 제제와의 한 번 또는 그 이상의 접촉, 배양 조건에서의 변화, 유전학적 수정 / 변이의 도입, 및 유전학적 수정 / 변이를 야기하는 매개 수단의 도입을 포함한다. 특정 실시예에서, 상기 생물학적 시스템의 모델에서의 환경적 교란은 세포를 효소 활성 억제 인자와 접촉시키는 것을 포함한다. 특정 실시예에서, 생물학적 시스템의 모델 내의 효소 활성 억제 인자 는 키나아제 억제 인자다. 특정 실시예에서, 상기 환경적 교란은 상기 세포를 CoQ10와 접촉시키는 것을 포함한다. 특정 실시예에서, 상기 환경적 교란은 상기 세포를 CoQ10과 더 접촉시키는 것을 포함한다.
본 발명의 특정 실시예에서, 상기 생성 단계는 인공 지능 (AI) -기반 정보학 플랫폼에 의해 수행된다. 특정 실시예에서, 상기 AI 기반 정보학 플랫폼은 통계적 압점을 적용하지 않고 모든 데이터 입력을 제 1 및 제 2 데이터 집합으로부터 수신한다. 본 발명의 특정 실시예에서, 상기 생성 단계에서 수립된 상기 합치 인과 관계 네트워크는 합치 인과 관계 네트워크 내의 하나 또는 그 이상의 인과 관계의 예측에 대한 신뢰 수준을 제공하기 위해, 식별 단계 이전에, 입력 데이터에 기반한 컴퓨터 모의 시뮬레이션에 의해 시뮬레이션 인과 관계 네트워크로 더 개량된다.
본 발명의 특정 실시예에서, 상기 고유한 인과 관계는 생물학적 시스템과 연관된 세포에 고유하게 존재하고 상기 합치된 제어 세포에 존재하지 않는 분별 인과 관계 네트워크의 일부로서 식별된다. 특정 실시예에서, 상기 고유한 인과 관계는 환경적 교란을 겪은 세포에 고유하게 존재하고 상기 합치된 제어 세포에 존재하지 않는 분별 인과 관계 네트워크의 일부로서 식별된다.
본 발명의 특정 실시예에서, 상기 식별된 고유한 인과 관계는 유전자의 발현 및 지질의 수준; 유전자의 발현 및 전사체의 수준; 유전자의 발현 및 대사 물질의 수준; 제 1 유전자의 발현 및 제 2 유전자의 발현; 유전자의 발현 및 SNP의 존재; 유전자의 발현 및 기능적 활성; 지질의 수준 및 전사체의 수준; 지질의 수준 및 대사 물질의 수준; 제 1 지질의 수준 및 제 2 지질의 수준; 지질의 수준 및 SNP의 존재; 지질의 수준 및 기능적 활성; 제 1 전사체의 수준 및 제 2 전사체의 수준; 전사체의 수준 및 대사 물질의 수준; 전사체의 수준 및 SNP의 존재; 제 1 전사체의 수준 및 기능적 활성의 수준; 제 1 대사 물질의 수준 및 제 2 대사 물질의 수준; 대사 물질의 수준 및 SNP의 존재; 대사 물질의 수준 및 기능적 활성; 제 1 SNP의 존재 및 제 2 SNP의 존재; 및 SNP의 존재 및 기능적 활성으로 이루어지는 군으로부터 선택되는 최소한 한 쌍 사이의 관계이다. 특정 실시예에서, 상기 식별된 상기 고유한 인과 관계는 최소한 지질의 수준, 유전자의 발현, 및 하나 또는 그 이상의 기능적 활성 사이의 관계이며, 이때 상기 기능적 활성은 키나아제 활성이다.
본 발명은 질병 과정의 조절 인자 식별 방법을 제공하며, 상기 방법은:
질병 과정의 특징적 측면을 나타내기 위해 질병에 관련된 세포를 사용하여 질병 과정에 대한 모델을 수립하는 단계;
상기 모델로부터 제 1 데이터 집합을 획득하는 단계로서, 이때 상기 제 1 데이터 집합은 질병에 관련된 세포 내의 단백질체의 전역적 변화를 나타내는 단계;
상기 모델로부터 제 2 데이터 집합을 획득하는 단계로서, 이때 상기 제 2 데이터 집합은 생물학적 시스템과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내며, 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 질병에 관련된 세포 내의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과를 포함하는 단계;
상기 세포의 단백질체의 전역적 변화 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 제 1 및 제 2 데이터 집합만을 기반으로 프로그래밍된 컴퓨터 장치를 사용하여 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 제 1 및 제 2 데이터 집합을 제외한 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및
상기 합치 인과 관계 네트워크로부터 질병 과정에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계에 연관된 최소한 하나의 효소는 질병 과정의 조절 인자로서 식별되는 단계를 포함한다.
특정 실시예에서, 상기 제 1 데이터 집합은 단일 단백질체의 데이터 집합. 특정 실시예에서, 제 2 데이터 집합은 생물학적 시스템과 연관된 세포의 단일 기능적 활성 또는 세포 반응을 나타낸다. 특정 실시예에서, 상기 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 지질체 데이터를 더 나타낸다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 지질체 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성을 포함한다. 특정 실시예에서, 상기 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터를 더 나타낸다. 특정 실시예에서, 상기 제 1 데이터 집합은 생물학적 시스템과 연관된 세포를 특징지우는 둘 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터를 더 나타낸다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 최소한 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과를 포함한다.
본 발명의 특정 실시예에서, 상기 효소의 전역적 활성은 전역 키나아제 활성을 포함하며, 이때 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과는 세포의 인산 단백질체를 포함한다. 특정 실시예에서, 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 상기 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 더 포함한다. 특정 실시예에서, 상기 합치 인과 관계 네트워크는 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 포함한다.
본 발명의 특정 실시예에서, 상기 질병 과정은 암, 당뇨, 비만, 심장병, 노화 관련 황반 변성, 당뇨성 망막증, 또는 감염성 질병이다. 특정 실시예에서, 상기 질병 과정은 신생 혈관 생성을 포함한다. 특정 실시예에서, 상기 질병 과정은 간세포 암종, 폐암, 유방암, 전립선암, 흑색종, 암종, 육종, 림프종, 백혈병, 비늘형의 세포암종(squamous cell carcinoma, 편평상피암), 결장암, 췌장암, 갑상선암, 자궁 내막암, 방광암, 신장암, 고형 종양, 백혈병, 비 호지킨(non-Hodgkin) 림프종, 또는 약제 저항형 암을 포함한다.
본 발명의 특정 실시예에서, 상기 질병 모델은 질병 세포의 생체 외 배양을 포함하며, 제어 또는 정상 세포의 합치되는 생체 외 배양을 선택적으로 더 포함한다. 특정 실시예에서, 상기 질병 세포의 생체 외 배양은 환경적 교란을 겪으며, 상기 합치된 제어 세포의 생체 외 배양은 환경적 교란을 겪지 않은 질병 세포와 동일하다. 특정 실시예에서, 상기 환경적 교란은 생체에 작용하는 제제와의 한 번 또는 그 이상의 접촉, 배양 조건에서의 변화, 유전학적 수정 / 변이의 도입, 및 유전학적 수정 / 변이를 야기하는 매개 수단의 도입을 포함한다. 특정 실시예에서, 상기 환경적 교란은 세포를 효소 활성 억제 인자와 접촉시키는 것을 포함한다. 특정 실시예에서, 상기 효소 활성 억제 인자는 키나아제 억제 인자다. 특정 실시예에서, 상기 환경적 교란은 상기 세포를 CoQ10와 접촉시키는 것을 포함한다. 특정 실시예에서, 상기 환경적 교란은 상기 세포를 CoQ10과 더 접촉시키는 것을 더 포함한다.
특정 실시예에서, 상기 질병 과정의 특징적 측면은 저산소 상태 조건, 고혈당 조건, 젖산 풍부 배양 조건, 또는 이들의 조합을 포함한다. 특정 실시예에서, 상기 생성 단계는 인공 지능(AI) 기반 정보학 플랫폼에 의해 수행된다. 특정 실시예에서, 상기 AI 기반 정보학 플랫폼은 통계적 압점을 적용하지 않고 모든 데이터 입력을 제 1 및 제 2 데이터 집합으로부터 수신한다.
특정 실시예에서, 생성 단계에서 수립된 상기 합치 인과 관계 네트워크는 합치 인과 관계 네트워크 내의 하나 또는 그 이상의 인과 관계에 대한 예측의 신뢰 수준을 제공하기 위해 입력 데이터에 기반한 컴퓨터 모의 시뮬레이션에 의해 식별 단계 이전에 모의 인과 관계 네트워크로 더욱 개량된다. 특정 실시예에서, 상기 고유한 인과 관계는 질병 세포의 모델 내에 고유하게 존재하며 합치된 제어 세포에는 존재하지 않는 분별 인과 관계 네트워크의 일부로서 식별된다. 특정 실시예에서, 상기 고유한 인과 관계는 환경적 교란을 겪은 세포 내에 고유하게 존재하며 합치된 제어 세포에는 존재하지 않는 분별 인과 관계 네트워크의 일부로서 식별된다.
본 발명은 생물학적 시스템의 조절 인자 식별 방법을 제공하며, 상기 방법은:
생물학적 시스템의 특징적 측면을 나타내기 위해 생물학적 시스템에 연관된 세포를 이용하여 생물학적 시스템에 대한 모델을 수립하는 단계;
상기 모델로부터 세포 내에서 단백질체의 전역적 변화 및 생물학적 시스템과 연관된 세포를 특징지우는 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈, 및 SNP 데이터를 나타내는 제 1 데이터 집합을 획득하는 단계;
상기 모델로부터 하나 또는 그 이상의 기능적 활성 또는 생물학적 시스템과 연관된 세포의 세포 반응을 나타내는 제 2 데이터 집합을 획득하는 단계로서, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 전역 키나아제 활성 및/또는 상기 전역 키나아제 활성이 생물학적 시스템과 연관된 세포 내의 키나아제 대사 물질 또는 기질에 미치는 영향을 포함하는 단계;
프로그래밍된 컴퓨터 장치를 사용하여 제 1 및 제 2 데이터 집합에만 기반하여 상기 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터, 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 제 1 및 제 2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및
상기 합치 인과 관계 네트워크로부터 생물학적 시스템에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계와 연관된 최소한 하나의 키나아제는 생물학적 시스템의 조절 인자로서 식별되는 단계를 포함한다.
본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하기 위한 방법을 제공하며,
상기 방법은 이러한 방법을 필요로 하는 포유류에 본 명세서에서 제공된 방법 중의 어느 하나에 의해 식별된 조절 인자에 영향을 미쳐서, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하게 해주는 생체 작용 물질을 포함하는 약학적 조성을 치료적으로 효과적인 양으로 투여(administrating)하는 단계를 포함한다.
본 발명은 대상 포유류에서의 질병을 진단 또는 예단하는 방법을 제공하며, 상기 방법은:
본 명세서에서 제공된 방법 중 어느 하나를 사용하여 식별된 하나 또는 그 이상의 조절 인자의, 대상으로부터 얻은 생물학적 표본 내에서의, 발현 또는 활성 수준을 결정하는 단계; 및
대상에서의 수준을 제어 표본에서의 하나 또는 그 이상의 조절 인자의 발현 수준 또는 활성과 비교하는 단계를 포함하며,
이때 대상에서의 수준과 제어 표본에서의 하나 또는 그 이상의 조절 인자의 발현 수준 또는 활성 사이의 차이는 대상이 질병에 걸렸거나, 질병이 진전될 상태에 있거나, 또는 질병에 대한 치료에 우호적으로 반응함을 나타내며, 이에 의해 대상 포유류의 질병을 진단하거나 예단할 수 있다.
본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 치료적 화합물을 식별하는 방법을 제공하며, 상기 방법은:
대상 포유류로부터의 생물학적 표본을 검사 화합물에 접촉시키는 단계;
생물학적 표본 내에서 본 명세서에서 제공된 방법 중의 어느 하나에 의해 식별된 하나 또는 그 이상의 조절 인자의 발현 수준을 결정하는 단계;
상기 생물학적 표본 내 하나 또는 그 이상의 조절 인자의 발현 수준을 검사 화합물과 접촉되지 않은 제어 표본과 비교하는 단계; 및
상기 생물학적 표본 내 하나 또는 그 이상의 조절 인자의 발현 수준을 조절하는 검사 화합물을 선택하는 단계를 포함하며,
이에 의해 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 치료적 화합물을 식별할 수 있다.
본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 방법을 제공하며,
상기 방법은 이러한 방법을 필요로 하는 포유류에 본 명세서에서 제공된 방법 중의 어느 하나에 의해 식별된 치료적 화합물을 포함하는 약학적 조성물을 치료적으로 효과적인 양으로 투여하는 단계를 포함하며, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방할 수 있다.
본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 방법을 제공하며,
상기 방법은 이러한 방법을 필요로 하는 포유류에 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21 중 어느 하나 또는 그 이상의 발현 또는 활성에 영향을 미치는 생체 작용 물질을 포함하는 약학적 조성물을 치료적으로 효과적인 양으로 투여하는 단계를 포함하며, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방할 수 있다. 특정 실시예에서, 상기 질병은 간세포 암종이다.
본 발명은 대상 포유류에서의 질병을 진단 또는 예단하는 방법을 제공하며, 상기 방법은:
대상으로부터 얻은 생물학적 표본 내에서 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21 중 하나 또는 그 이상의 단백질의 발현 또는 활성 수준을 결정하는 단계; 및
대상 내에서의 상기 수준을 제어 표본 내 하나 또는 그 이상의 단백질의 발현 수준 또는 활성과 비교하는 단계를 포함하며,
이때 대상에서의 수준과 제어 표본에서의 하나 또는 그 이상의 단백질의 발현 수준 또는 활성 사이의 차이는 대상이 질병에 걸렸거나, 질병이 진전될 상태에 있거나, 또는 질병에 대한 치료에 우호적으로 반응함을 나타내며, 이에 의해 대상 포유류의 질병을 진단하거나 예단할 수 있다. 특정 실시예에서, 상기 질병은 간세포 암종이다.
본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 치료적 화합물을 식별하는 방법을 제공하며, 상기 방법은:
대상 포유류로부터의 생물학적 표본을 검사 화합물에 접촉시키는 단계;
생물학적 표본 내에서, TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21 중 어느 하나 또는 그 이상의 단백질의 발현 수준을 결정하는 단계;
상기 생물학적 표본 내 하나 또는 그 이상의 단백질의 발현 수준을 검사 화합물과 접촉되지 않은 제어 표본과 비교하는 단계; 및
상기 생물학적 표본 내 하나 또는 그 이상의 단백질의 발현 수준을 조절하는 검사 화합물을 선택하는 단계를 포함하며,
이에 의해 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 치료적 화합물을 식별할 수 있다. 특정 실시예에서, 상기 질병은 간세포 암종이다.
본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방하기 위한 방법을 제공하며,
상기 방법은 이러한 방법을 필요로 하는 포유류에 본 명세서에서 제공된 방법 중의 어느 하나에 의해 식별된 치료적 화합물을 포함하는 약학적 조성물을 치료적으로 효과적인 양으로 투여하는 단계를 포함하며, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방할 수 있다.
본 발명은 신생 혈관 생성의 조절 인자 식별 방법을 제공하며, 상기 방법은:
(1) 신생 혈관 생성의 특징적 측면을 나타내기 위해 신생 혈관 생성과 연관된 세포를 사용하여 신생 혈관 생성에 대한 모델을 수립하는 단계;
(2) 상기 신생 혈관 생성에 대한 모델로부터 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 데이터를 나타내는 제 1 데이터 집합을 획득하는 단계;
(3) 상기 신생 혈관 생성에 대한 모델로부터 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합을 획득하는 단계;
(4) 프로그래밍된 컴퓨터 장치를 사용하여 제 1 및 제 2 데이터 집합에만 기반하여 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성 (SNP) 데이터, 및 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 상기 제 1 데이터 집합 및 제 2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및
(5) 상기 합치 인과 관계 네트워크로부터 신생 혈관 생성에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계와 연관된 유전자, 지질, 단백질, 대사 물질, 전사체, 또는 SNP는 신생 혈관 생성의 조절 인자로서 식별되는 단계를 포함한다.
본 발명은 신생 혈관 생성의 조절 인자 식별 방법을 제공하며, 상기 방법은:
(1) 신생 혈관 생성의 특징적 측면을 나타내기 위해 신생 혈관 생성과 연관된 세포를 사용하여 신생 혈관 생성에 대한 모델을 수립하는 단계;
(2) 상기 신생 혈관 생성에 대한 모델로부터 지질체 데이터를 나타내는 제 1 데이터 집합을 획득하는 단계;
(3) 상기 신생 혈관 생성에 대한 모델로부터 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합을 획득하는 단계;
(4) 프로그래밍된 컴퓨터 장치를 사용하여 제 1 및 제 2 데이터 집합에만 기반하여 리피도믹스 데이터 및 기능적 활성 또는 세포 반응 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 상기 제 1 데이터 집합 및 제 2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및
(5) 상기 합치 인과 관계 네트워크로부터 신생 혈관 생성에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계와 연관된 지질은 신생 혈관 생성의 조절 인자로서 식별되는 단계를 포함한다.
특정 실시예에서, 상기 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합은 효소의 전역적 활성 및 신생 혈관 생성과 연관된 세포 내에서 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과를 나타낸다.
본 발명은 신생 혈관 생성의 조절 인자 식별 방법을 제공하며, 상기 방법은:
(1) 신생 혈관 생성의 특징적 측면을 나타내기 위해 신생 혈관 생성과 연관된 세포를 사용하여 신생 혈관 생성에 대한 모델을 수립하는 단계;
(2) 상기 신생 혈관 생성에 대한 모델로부터 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성 (SNP) 데이터를 나타내는 제 1 데이터 집합을 획득하는 단계;
(3) 상기 신생 혈관 생성에 대한 모델로부터 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 키나아제를 나타내는 제 2 데이터 집합을 획득하는 단계로서, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및/또는 상기 효소의 전역적 활성이 신생 혈관 생성과 연관된 세포 내의 효소 대사 물질 또는 기질에 미치는 영향을 포함하는 단계;
(4) 프로그래밍된 컴퓨터 장치를 사용하여 제 1 및 제 2 데이터 집합에만 기반하여 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 및 신생 혈관 생성과 연관된 세포의 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 이때 상기 합치 인과 관계 네트워크의 생성은 제 1 및 제 2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계; 및
(5) 상기 합치 인과 관계 네트워크로부터 신생 혈관 생성에 고유한 인과 관계를 식별하는 단계로서, 이때 상기 고유한 인과 관계와 연관된 효소는 신생 혈관 생성의 조절 인자로서 식별되는 단계를 포함한다.
본 발명의 특정 실시예에서, 상기 효소의 전역적 활성은 전역 키나아제 활성을 포함하며 상기 효소의 전역적 활성이 신생 혈관 생성과 연관된 세포 내의 효소 대사 물질 또는 기질에 미치는 영향은 세포의 인산 단백질체를 포함한다. 특정 실시예에서, 상기 효소의 전역적 활성은 전역 프로테아제 활성을 포함한다.
본 발명의 특정 실시예에서, 상기 조절 인자는 신생 혈관 생성을 자극하거나 촉진한다. 본 발명의 특정 실시예에서, 상기 조절 인자는 신생 혈관 생성을 억제한다.
특정 실시예에서, 신생 혈관 생성과 연관된 세포를 포함하는 상기 신생 혈관 생성에 대한 모델은 생체 외 세포 배양 신생 혈관 생성 모델, 쥐의 대동맥 미세 혈관 모델, 새로 태어난 생쥐의 망막 모델, 병아리 융모 요막(CAM) 모델, 각막 혈관 형성 성장 요소 주머니 모델, 피하 이식 혈관 형성 성장 요소 이식 모델, 마트리겔(MATRIGEL®) 혈관 형성 성장 요소 이식 모델, 및 종양 이식 모델로 이루어진 군으로부터 선택되며; 상기 신생 혈관 생성 모델은 제어 세포를 포함하는 신생 혈관 생성의 제어 모델을 선택적으로 더 포함한다. 특정 실시예에서, 상기 생체 외 배양 신생 혈관 생성 모델은 마트리겔(MATRIGEL®) 관 형성 분석, 이주 분석, 보이든(Boyden) 챔버 분석, 스크래치 분석으로 이루어지는 군으로부터 선택된다.
특정 실시예에서, 생체 외 배양 모델에서의 상기 신생 혈관 생성과 연관된 세포는 인간 내피의 혈관 세포(HUVEC)이다. 특정 실시예에서, 각막 혈관 형성 성장 요소 주머니 모델, 피하 해면 혈관 형성 성장 요소 이식 모델, 또는 마트리겔(MATRIGEL®) 혈관 형성 성장 요소 이식 모델에서의 상기 혈관 형성 성장 요소는 FGF-2 및 VEGF로 이루어진 군으로부터 선택된다.
본 발명의 특정 실시예에서, 상기 신생 혈관 생성의 모델 내의 세포는 환경적 교란을 겪으며, 신생 혈관 생성의 합치된 모델 내의 세포는 환경적 교란을 겪지 않은 세포와 동일하다. 특정 실시예에서, 상기 환경적 교란은 제제와의 한 번 또는 그 이상의 접촉, 배양 조건에서의 변화, 유전학적 수정 또는 변이의 도입, 및 유전학적 수정 또는 변이를 야기하는 매개 수단의 도입 및 국소 빈혈의 유도를 포함한다.
특정 실시예에서, 상기 제제는 혈관 형성 촉진 제제 또는 항혈관 형성 제제이다. 특정 실시예에서, 상기 혈관 형성 촉진 제제는 FGF-2 및 VEGF로 이루어진 군으로부터 선택된다. 특정 실시예에서, 상기 항혈관 형성 제제는 VEGF 억제 인자, 인테그린 억제 물질, 안지오스타틴, 엔도스타틴, 텀스타틴, 아바스틴, 넥사바(Sorafenib), 수니티니브, 파조파니브, 및 에버롤리머스, 용해성 VEGF-수용기, 안지오포이에틴 2, 트롬보스폰딘1, 트롬보스폰딘 2, 바소스타틴, 칼레티큘린, 프로트롬빈(크링글 도메인-2), 안티트롬빈 III 파편, 혈관 내피의 성장 억제 인자 (VEGI), 단백질 (FS-E)의 폴리스타틴 영역에 해당하는 산성 및 풍부한 시스테인 내 분비 단백질(SPARC) 및 SPARC 펩티드, 및 코엔자임 Q10으로 이루어지는 군으로부터 선택된다.
다른 실시예에서, 상기 제제는 효소 활성 억제 인자이다. 다른 실시예에서, 상기 제제는 키나아제 활성 억제 인자이다.
본 발명의 다른 실시예에서, 상기 제 1 데이터 집합은 게놈 데이터 집합 내 다수의 유전자의 단백질 및/또는 mRNA 발현 수준을 포함한다. 본 발명의 특정 실시예에서, 상기 제 1 데이터 집합 둘 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 데이터를 포함한다. 본 발명의 특정 실시예에서, 상기 제 1 데이터 집합은 셋 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 데이터를 포함한다.
본 발명의 다른 실시예에서, 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포 외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 더 포함한다.
본 발명의 어떠한 실시예에서, 제 1 데이터 집합은 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 데이터 중 하나와 같은 단일 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 두 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 세 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 네 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 다섯 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 여섯 개의 데이터 집합일 수 있다.
본 발명의 다른 실시예에서, 상기 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS 및 시호스(Seahorse) 분석 데이터로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 포함하는 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중 하나와 같은 단일 데이터 집합이다. 본 발명의 실시예 중 어느 하나에서, 상기 제 2 데이터 집합은 두 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 세 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 네 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 다섯 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 여섯 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 일곱 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 여덟 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 아홉 개의 데이터 집합일 수 있다. 본 발명의 실시예 중 어느 하나에서, 상기 제 1 데이터 집합은 열 개의 데이터 집합일 수 있다.
본 발명의 다른 실시예에서, 상기 효소 활성은 키나아제 활성일 수 있다. 본 발명의 다른 실시예에서, 상기 효소 활성은 프로테아제 활성일 수 있다.
본 발명의 특정한 실시예에서, 상기 단계(4)는 인공 지능 (AI) -기반 정보학 플랫폼에 의해 수행된다. 특정 실시예에서, 상기 AI 기반 정보학 플랫폼은 REFS(TM)을 포함한다. 특정 실시예에서, 상기 AI 기반 정보학 플랫폼은 통계적 압점을 적용하지 않고 모든 데이터 입력을 제 1 데이터 집합 및 제 2 데이터 집합으로부터 수신한다. 특정 실시예에서, 상기 단계(4)에서 수립된 합치 인과 관계 네트워크는 합치 인과 관계 네트워크 내의 하나 또는 그 이상의 인과 관계에 대한 예측의 신뢰 수준을 제공하기 위해 단계(5) 이전에 입력 데이터에 기반한 컴퓨터 모의 시뮬레이션에 의해 시뮬레이션 인과 관계 네트워크로 더 개량된다.
본 발명의 특정 실시예에서, 상기 고유한 인과 관계는 세포 내에 고유하게 존재하며, 합치된 제어 세포 내에는 존재하지 않는 분별 인과 관계 네트워크의 일부로서 식별된다.
본 발명에서, 상기 고유한 인과 관계는 유전자의 발현 및 지질의 수준; 유전자의 발현 및 전사체의 수준; 유전자의 발현 및 대사 물질의 수준; 제 1 유전자의 발현 및 제 2 유전자의 발현; 유전자의 발현 및 SNP의 존재; 유전자의 발현 및 기능적 활성; 지질의 수준 및 전사체의 수준; 지질의 수준 및 대사 물질의 수준; 제 1 지질의 수준 및 제 2 지질의 수준; 지질의 수준 및 SNP의 존재; 지질의 수준 및 기능적 활성; 제 1 전사체의 수준 및 제 2 전사체의 수준; 전사체의 수준 및 대사 물질의 수준; 전사체의 수준 및 SNP의 존재; 제 1 전사체의 수준 및 기능적 활성의 수준; 제 1 대사 물질의 수준 및 제 2 대사 물질의 수준; 대사 물질의 수준 및 SNP의 존재; 대사 물질의 수준 및 기능적 활성; 제 1 SNP의 존재 및 제 2 SNP의 존재; 및 SNP의 존재 및 기능적 활성으로 이루어지는 군으로부터 선택되는 최소한 한 쌍 사이의 관계로 식별된다.
특정 실시예에서, 상기 기능적 활성은 생명 에너지론, 세포 증식, 세포 자살, 기관 기능, 세포 이주, 관 형성, 효소 활성, 주화성, 세포외 기질 퇴화, 및 분출, 및 ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관으로 이루어지는 군으로부터 선택된다. 특정 실시예에서, 상기 기능적 활성은 키나아제 활성이다. 특정 실시예에서, 상기 기능적 활성은 프로테아제 활성이다.
본 발명의 특정 실시예에서, 상기 식별된 고유한 인과 관계는 최소한 지질의 수준, 유전자의 발현, 및 하나 또는 그 이상의 기능적 활성 사이의 관계이며, 이때 상기 기능적 활성은 키나아제 활성이다.
본 발명에서, 상기 방법은 신생 혈관 생성 내의 상기 식별된 고유한 인과 관계를 증명하는 단계를 더 포함할 수 있다.
본 발명은 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델을 제공하기 위한 방법을 제공하며, 상기 방법은:
신생 혈관 생성의 특징적 측면을 나타내기 위해, 신생 혈관 생성과 연관된 세포를 사용하여 신생 혈관 생성에 대한 모델을 수립하는 단계로서, 상기 신생 혈관 생성에 대한 모델은 플랫폼 방법에서 사용된 데이터 집합을 생성하기에 유용한 단계를 포함하며;
이에 의해 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델을 제공한다.
본 발명은 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델로부터 제 1 데이터 집합 및 제 2 데이터 집합을 획득하기 위한 방법을 제공하며, 상기 방법은:
(1) 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델로부터 제 1 데이터 집합을 획득하는 단계로서, 상기 신생 혈관 생성에 대한 모델은 신생 혈관 생성과 연관된 세포를 포함하며, 상기 제 1 데이터 집합은 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성(SNP) 데이터를 포함하는 단계;
(2) 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델로부터 제 2 데이터 집합을 획득하는 단계로서, 상기 제 2 데이터 집합은 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 단계를 포함하며;
이에 의해 플랫폼 방법에서 사용하기 위한 신생 혈관 생성에 대한 모델로부터 제 1 데이터 집합 및 제 2 데이터 집합을 획득한다.
본 발명은 신생 혈관 생성의 조절 인자 식별 방법을 제공하며, 상기 방법은:
(1) 신생 혈관 생성에 대한 모델로부터 얻어진 제 1 데이터 집합 및 제 2 데이터 집합 중에서 합치 인과 관계 네트워크를 생성하는 단계로서, 상기 모델은 신생 혈관 생성과 연관된 세포를 포함하고, 상기 제 1 데이터 집합은 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성 (SNP) 데이터를 나타내며; 상기 제 2 데이터 집합은 프로그래밍된 컴퓨터 장치를 사용하여 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내고, 상기 합치 인과 관계 네트워크의 생성은 제 1 데이터 집합 및 제 2 데이터 집합을 제외한 어떠한 알려진 생물학적 관계에도 기반하지 않는 단계;
(2) 상기 합치 인과 관계 네트워크로부터, 신생 혈관 생성에 고유한 인과 관계를 식별하는 단계로서, 상기 고유한 인과 관계와 연관된 최소한 하나의 유전자, 지질, 단백질, 대사 물질, 전사체, 또는 SNP가 신생 혈관 생성의 조절 인자로서 식별되는 단계를 포함하며,
이에 의해 신생 혈관 생성의 조절 인자를 식별할 수 있다.
본 발명은 신생 혈관 생성의 조절 인자 식별 방법을 제공하며, 상기 방법은:
(1) 신생 혈관 생성에 대한 모델로부터 생성된 합치 인과 관계 네트워크를 제공하는 단계;
(2) 상기 합치 인과 관계 네트워크로부터, 신생 혈관 생성에 고유한 인과 관계를 식별하는 단계로서, 상기 고유한 인과 관계와 연관된 최소한 하나의 유전자, 지질, 단백질, 대사 물질, 전사체, 또는 SNP가 신생 혈관 생성의 조절 인자로서 식별되는 단계를 포함하며,
이에 의해 신생 혈관 생성의 조절 인자를 식별할 수 있다.
특정 실시예에서, 상기 합치 인과 관계 네트워크는 신생 혈관 생성에 대한 모델로부터 획득된 제 1 데이터 집합 및 제 2 데이터 집합 중에서 생성되고, 상기 모델은 신생 혈관 생성과 연관된 세포를 포함하고, 상기 제 1 데이터 집합은 신생 혈관 생성과 연관된 세포를 특징지우는 하나 또는 그 이상의 게놈 데이터, 지질체 데이터, 단백질체 데이터, 대사체 데이터, 전사체 데이터, 및 단일 뉴클레오타이드 다형성 (SNP) 데이터를 나타내며;
상기 제 2 데이터 집합은 프로그래밍된 컴퓨터 장치를 사용하여 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내고, 상기 합치 인과 관계 네트워크의 생성은 제 1 데이터 집합 및 제 2 데이터 집합을 제외한 어떠한 알려진 생물학적 관계에도 기반하지 않는다.
특정 실시예에서, 상기 신생 혈관 생성에 대한 모델은 생체 외 세포 배양 신생 혈관 생성 모델, 쥐의 대동맥 미세 혈관 모델, 새로 태어난 생쥐의 각막 모델, 병아리 융모 요막(CAM) 모델, 각막 혈관 형성 성장 요소 주머니 모델, 피하 해면 혈관 형성 성장 요소 이식 모델, 마트리겔(MATRIGEL®) 혈관 형성 성장 요소 이식 모델, 및 종양 이식 모델로 이루어진 군으로부터 선택되며; 상기 신생 혈관 생성의 모델은 제어 세포를 포함하는 신생 혈관 생성의 합치된 제어 모델을 선택적으로 더 포함한다.
특정 실시예에서, 상기 제 1 데이터 집합은 리피도믹스 데이터를 포함한다. 특정 실시예에서, 상기 제 1 데이터 집합은 리피도믹스 데이터만을 포함한다.
특정 실시예에서, 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 상기 제 2 데이터 집합은 효소의 전역적 활성, 및 신생 혈관 생성과 연관된 세포 내의 효소 대사 물질 또는 기질에 대한 효소의 전역적 활성의 영향을 포함한다.
특정 실시예에서, 상기 제 2 데이터 집합은 키나아제 활성 또는 프로테아제 활성을 포함한다. 특정 실시예에서, 제 2 데이터 집합은 키나아제 활성 또는 프로테아제 활성만을 포함한다.
특정 실시예에서, 신생 혈관 생성과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 상기 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론 프로파일링, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 키나아제 활성, 및 프로테아제 활성; 및 ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택된 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 포함한다.
본 발명의 특정 실시예에서, 상기 신생 혈관 생성은 질병 상태에 관련된다.
본 발명은 포유류 대상에서 신생 혈관 생성 조절 방법을 제공하며, 상기 방법은:
이러한 방법을 필요로 하는 포유류에 본 명세서에서 제공된 방법 중 어느 하나에 의해 식별된 조절 인자에 영향을 주는 생체 작용 물질을 포함하는 약학적 조성을 치료적으로 효과적인 양으로 투여하여, 이에 의해 신생 혈관 생성을 조절하도록 하는 단계를 포함한다.
본 발명은 포유류 대상에서 조절된 신생 혈관 생성을 탐지하는 방법을 제공하며, 상기 방법은:
대상으로부터 얻어진 생물학적 표본 내에서의 본 명세서에서 제공된 방법 중 어느 하나에 의해 식별된 하나 또는 그 이상의 조절 인자의 수준, 활성, 또는 존재를 결정하는 단계; 및
상기 수준, 활성, 또는 존재를 제어 표본 내에서의 하나 또는 그 이상의 조절 인자의 수준, 활성, 또는 존재와 비교하는 단계를 포함하며,
이때 대상에서의 상기 수준, 활성, 또는 존재와 제어 표본 내의 하나 또는 그 이상의 조절 인자의 존재 하에서의 상기 수준, 활성, 또는 존재 사이의 차이가 포유류 대상에서 신생 혈관 생성이 조절되었다는 것을 나타낸다.
본 발명은 대상 포유류에서 신생 혈관 생성을 조절하는 치료적 화합물을 식별하는 방법을 제공하며, 상기 방법은:
대상 포유류로부터의 생물학적 표본을 검사 화합물과 접촉시키는 단계;
생물학적 표본 내에서 본 명세서에서 제공된 방법 중 어느 하나에 의해 식별된 하나 또는 그 이상의 조절 인자의 발현 수준을 결정하는 단계;
생물학적 표본 내에서의 상기 하나 또는 그 이상의 조절 인자의 수준, 활성, 또는 존재를 상기 검사 화합물과 접촉하지 않은 제어 표본과 비교하는 단계; 및
생물학적 표본 내에서의 상기 하나 또는 그 이상의 조절 인자의 수준, 활성, 또는 존재를 조절하는 검사 화합물을 선택하는 단계를 포함하며,
이에 의해 대상 포유류에서 신생 혈관 생성을 조절하는 치료적 화합물을 식별하는 치료적 화합물을 식별할 수 있다.
본 발명은 대상 포유류에서 신생 혈관 생성을 조절하기 위한 방법을 제공하며, 상기 방법은:
이러한 방법을 필요로 하는 포유류에 본 명세서에서 제공된 방법 중 어느 하나에 의해 식별된 치료적 화합물을 포함하는 약학적 조성을 치료적으로 효과적인 양으로 투여하여, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단할 수 있다.
특정 실시예에서, “환경적 교란”은 본 명세서에서 “외부 자극 성분”으로도 불리며, 치료용 제제를 의미한다. 특정 실시예에서, 이러한 외부 자극 성분은 소형 분자 (예를 들어, 5 kDa, 4 kDa, 3 kDa, 2 kDa, 1 kDa, 500 달톤, 또는 250 달톤 이하의 소형 분자)이다. 특정 실시예에서, 이러한 외부 자극 성분은 생물학적이다. 특정 실시예에서, 이러한 외부 자극 성분은 화학적이다. 특정 실시예에서, 이러한 외부 자극 성분은 세포에 대해 내생적이거나 외생적이다. 특정 실시예에서, 이러한 외부 자극 성분은 MIM 또는 에피시프터(epishifter)이다. 특정 실시예에서, 이러한 외부 자극 성분은 저산소 상태, 고혈당증, 고지질증, 고인슐린증, 및/또는 풍부한 젖산 조건과 같은 세포 시스템에 대한 스트레스 요소이다.
특정 실시예에서, 이러한 외부 자극 성분은 질병 조건을 치료하기 위한 치료용 제제 또는 치료용 제제 후보를 포함할 수 있으며, 여기에는 화학 치료용 제제, 단백질 기반 생물학적 제제, 항체, 융합 단백질, 소형 분자 약제, 지질, 다당류, 핵산 등이 포함된다.
특정 실시예에서, 이러한 외부 자극 성분은 저산소 상태, 고혈당 조건, (젖산 치료로 모방할 수 있는) 산성 환경 등을 포함하는 다양한 질병 조건 하에서 생체 내에서 자주 접하게 되는 하나 또는 그 이상의 스트레스 요소를 포함할 수 있다.
다른 실시예에서, 이러한 외부 자극 성분은 이하에서 정의되는 하나 또는 그 이상의 MIM 및/또는 에피시프터(epishifter)를 포함할 수 있다. 예시적 MIM은 코엔자임 Q10(본 명세서에서 CoQ10로도 기술됨) 및 비타민 B군 내 화합물, 또는 비타민 B군 내 화합물을 포함하는 뉴클레오시드, 모노뉴클레오타이드 또는 디뉴클레오타이드를 포함한다. 특정 실시예에서, 이러한 외부 자극은 CoQ10이 아니다. 특정 실시예에서, 이러한 외부 자극은 비타민 B 또는 비타민 B군 내 화합물이 아니다.
세포의 출력을 측정함에 있어서(단백질 발현, 지질 수준 등), 절대적 양(예를 들어, 발현 또는 전체 양)이나 상대적 수준 (예를 들어, 상대적 발현 수준 또는 양)이 사용될 수 있다. 일 실시예에서는, 절대적 양(예를 들어, 발현 또는 전체 양)이 사용된다. 일 실시예에서는, 상대적 수준 또는 양(예를 들어, 상대적 발현 수준 또는 양)이 사용된다. 예를 들어, 세포 시스템의 상대적 단백질 발현 수준을 결정하기 위해서는, 세포 시스템에 대한 외부 자극이 존재하거나 존재하지 않는 상태에서 세포 시스템 내에서 주어진 단백질의 양을 적절한 제어 세포 라인 또는 세포 라인들의 혼합물(예를 들어, 동일한 실험에 사용된 모든 세포) 및 주어진 배수 증가 또는 배수 감소 값과 비교할 필요가 있다. 통상의 기술자라면 유전자 및/또는 RNA 전사 수준, 지질의 수준, 또는 예를 들어, 세포 자살의 수준, 독성의 수준, 또는 본 명세서에서 기술된 ECAR 또는 OCR와 같은 어떠한 기능적 출력 등의 세포의 모든 출력 측정에서도 절대량 또는 상대량을 채택할 수 있다는 것을 인식할 것이다. 배수 증가에 대한 소정의 임계 수준(예를 들어, 최소한 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 75나 100 또는 그 이상의 배수 증가), 또는 배수 감소에 대한 임계 수준(예를 들어, 최소한 0.9, 0.8, 0.75, 0.7, 0.6, 0.5, 0.45, 0.4, 0.35, 0.3, 0.25, 0.2, 0.15, 0.1 또는 0.05 배수로의 감소, 또는 90%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10% 또는 5% 또는 그 이하로의 감소)이 의미 있는 분별을 선택하기 위해 사용될 수 있으며, 의미 있는 분별을 위한 세포의 출력 데이터가 본 발명의 방법의 플랫폼 기술을 사용하는 데이터 집합(예를 들어, 제 1 및 제 2 데이터 집합)에 포함될 수 있다. 위의 목록에서 제시된 모든 값들은 범위의 상한 또는 하한으로서, 예를 들어, 1.5와 5 배 사이, 5와 10 배, 2와 5 배, 또는 0.9와 0.7 사이, 0.9와 0.5, 또는 0.7과 0.3 배 사이 등일 수 있으며, 본 발명의 일부로서 이해되어야 한다.
본 출원 전체에 걸쳐, 예를 들어 위에서 언급된 것과 같이 목록에서 제시되는 모든 값들은 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있다.
본 발명의 방법의 일 실시예에서, 인과 관계 네트워크 내에서 관찰된 모든 인과 관계가 생물학적 의미를 가지는 것은 아닐 수 있다. 본 발명의 조사적 생물학적 평가가 적용되는 어떠한 주어진 생물학적 시스템에 대해, 인과 관계(또한 이들과 관련된 유전자들)의 일부(또는 전부일 수 있음)는 특정한 생물학적 현안 문제에 대해 “결정론적”일 수 있는데, 예를 들어, 질병 조건(치료적 시술을 위한 잠재적 타겟)을 야기하는 것에 책임이 있거나 질병 조건(잠재적인 진단적 또는 예후의 요소)에 대한 생물학적 표지 인자이다. 일 실시예에서, 생물학적 시스템에 고유한 관찰된 인과 관계는 당면한 특정한 생물학적 문제에 대하여 결정론적이다. 일 실시예에서, 생물학적 시스템에 고유한 관찰된 모든 인과 관계 당면한 특정 문제에 대해 결정론적인 것은 아니다.
이러한 결정론적 인과 관계는 대상 방법의 최종 사용자가 선택할 수 있으며, 또는 이러한 관계는 REFS, DAVID-활성 비교 경로 분석 프로그램과 같은 생물정보학 소프트웨어 프로그램, 또는 KEGG 경로 분석 프로그램에 의해 선택될 수 있다. 특정 실시예에서, 하나 이상의 생물정보학 소프트웨어 프로그램이 사용되었으며, 둘 또는 그 이상의 생물정보학 소프트웨어 프로그램으로부터의 합치된 결과를 사용하는 것이 바람직하다.
본 명세서에서 사용되는, 세포의 출력의 “분별”은 세포의 출력의 어떠한 하나 또는 그 이상의 매개변수에서의 변화(예를 들어, 증가되거나 감소된 수준)를 포함한다. 특정 실시예에서, 이러한 분별은 mRNA 전사 내 분별, 단백질 발현, 단백질 활성, 대사 물질 / 중간 물질 수준, 및/또는 리간드-타겟 상호 반응으로 이루어지는 군으로부터 각각 독립적으로 선택된다. 예를 들어, 단백질 발현 수준에 대하여, 외부 자극 성분에 의한 치료 이전과 이후의 세포 시스템과 관련된 출력과 같은 두 세포의 출력 사이의 분별이 측정될 수 있으며, 질량 분광학 기반 측정과 같이 기술 분야에서 인식된 기술(예를 들어, iTRAQ, 2D-LC-MSMS 등)을 사용하여 정량화될 수 있다.
한 측면에서, 생물학적 시스템을 위한 세포 모델은 세포 간 상호 대화 시스템을 포함하며, 이때 외부 자극 성분이 있는 제 1 세포 환경을 가지는 제 1 세포 시스템은 제 1 수정된 세포 환경을 생성함으로써 제 2 세포 환경을 가지는 제 2 세포 시스템을 제 1 수정된 세포 환경에 노출하게 되어 상호 대화 세포 시스템이 확립된다.
일 실시예에서, 최소한 하나의 의미 있는 세포 간 상호 대화 분별이 상기 상호 대화 세포 시스템으로부터 생성되며; 최소한 하나의 결정론적 세포 간 상호 대화 분별이 식별되어 조사적 생물학적 평가가 발생하게 된다. 특정 실시예에서, 상기 최소한 하나의 의미있는 세포 간 상호 대화 분별은 다수의 분별이다.
특정 실시예에서, 최소한 하나의 결정론적 세포 간 상호 대화 분별이 최종 사용자에 의해 선택된다. 다른 방법으로서, 또 다른 실시예에서, 최소한 하나의 결정론적 세포 간 상호 대화 분별이 정량적 단백질체학 데이터에 기반한(예를 들어, REFS, KEGG 경로 분석 또는 DAVID-활성 비교적 경로 분석과 같은) 생물 정보학 소프트웨어 프로그램에 의해 선택된다.
특정 실시예에서, 이 방법은 제 1 세포 시스템을 위한 의미 있는 세포의 출력 분별을 생성하는 것을 포함한다.
특정 실시예에서, 분별은 mRNA 전사 내 분별, 단백질 발현, 단백질 활성, 대사 물질 / 중간 물질 수준, 및/또는 리간드-타겟 상호 반응로 이루어진 군에서 각각 독립적으로 선택된다.
특정 실시예에서, 제 1 세포 시스템 및 제 2 세포 시스템은 균일한 군집의 제 1 세포, 암 세포 라인, 또는 정상 세포 라인으로부터 독립적으로 선택된다.
특정 실시예에서, 제 1 수정된 세포 환경은 제 1 세포 시스템에 의해 제 1 세포 환경으로 분비된 요소를 포함하며, 결과적으로 제 1 세포 시스템을 외부 자극 성분과 접촉시키게 된다. 상기 요소는 분비된 단백질 또는 기타 신호 발생 분자들을 포함할 수 있다. 특정 실시예에서, 제 1 수정된 세포 환경은 실질적으로 원래의 외부 자극 성분을 가지지 않는다.
특정 실시예에서, 이러한 상호 대화 세포 시스템은 삽입 구획을 가지는 트랜스웰(transwell) 및 막으로 구분되는 웰(well) 구획을 포함한다. 예를 들어, 제 1 세포 시스템은 삽입 구획(또는 웰 구획)에서 성장할 수 있으며, 제 2 세포 시스템은 웰 구획(또는 삽입 구획)에서 성장할 수 있다.
특정 실시예에서, 이러한 상호 대화 세포 시스템은 제 1 세포 시스템을 성장시키기 위한 제 1 배양, 및 제 2 세포 시스템을 성장시키기 위한 제 2 배양을 포함한다. 이 경우에, 제 1 수정된 세포 환경은 제 1 세포 시스템으로부터 매체로 조건이 가해질 수 있다.
특정 실시예에서, 제 1 세포 환경 및 제 2 세포 환경은 동일할 수 있다. 특정 실시예에서, 제 1 세포 환경 및 제 2 세포 환경은 다를 수 있다.
특정 실시예에서, 상호 대화 세포 시스템은 제 1 세포 시스템 및 제 2 세포 시스템의 공생 배양을 포함한다.
본 발명의 방법은 임의의 개수의 “조사적 생물학적 평가”를 위해 사용되거나 이에 적용될 수 있다. 본 발명의 방법을 조사적 생물학적 평가에 적용함으로써 생물학적 시스템 또는 과정의 생물학적 시스템 또는 결정론적 세포 과정 “추진 인자”의 하나 또는 그 이상의 조절 인자를 식별할 수 있게 된다.
본 발명의 방법은 광범위한 범위의 조사적 생물학적 평가를 수행하기 위해 사용될 수 있다. 특정 실시예에서, 상기 조사적 생물학적 평가는 질병 상태를 진단하는 것이다. 특정 실시예에서, 상기 조사적 생물학적 평가는 약의 효능을 결정하는 것이다. 특정 실시예에서, 상기 조사적 생물학적 평가는 약의 독성을 결정하는 것이다. 특정 실시예에서, 상기 조사적 생물학적 평가는 질병 상태의 단계를 구분하는 것이다. 특정 실시예에서, 상기 조사적 생물학적 평가는 노화 방지 화장품의 타겟을 식별하는 것이다.
본 명세서에서 사용되는, “조사적 생물학적 평가”는 생물학적 시스템의 하나 또는 그 이상의 조절 인자, 예를 들어, 환경적 교란 또는 외부 자극 성분, 또는 생물학적 시스템 또는 과정 특유의 고유한 인과 관계와 관련된 결정론적 세포 과정 “추진 인자”(예를 들어, 생물학적 경로, 또는 경로의 핵심 멤버, 또는 경로의 멤버의 핵심 조절자의 활성에 있어서의 증가 또는 감소)의 식별을 포함할 수 있다. 이는 상기 식별된 결정론적 세포 과정 추진 인자가 생체 내 동물 모델 및/또는 생체 외 조직 배양 실험을 포함하는 환경적 교란 또는 외부 자극 성분과 관련된 후속 이벤트에 필요한지의 여부 및/또는 이를 위해 충분한지의 여부를 테스트하거나 증명하기 위하여 설계된 추가적 단계를 더 포함한다.
특정 실시예에서, 상기 조사적 생물학적 평가는 질병 상태의 진단 또는 단계 파악이며, 이때 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 치료적 시술을 받을 수 있는 질병 표지 인자 또는 치료적 타겟 중 하나를 나타낸다. 본 발명의 조사적 생물학적 분석은 이론적으로 어떠한 질병 조건에도 적절하지만, 종양학 / 암 생물학, 당뇨, 비만, 심장병, 및 신경학적 조건들(특히, 제한 없이, 알츠하이머 병, 파킨슨씨 병, 헌팅턴 병, 루게릭 병(ALS), 및 노화 관련 신경 퇴행성 질환 등과 같은 퇴행성 신경 질환), 및 신생 혈관 생성과 연관된 조건들과 관련된 분야에 특히 유용한 것으로 밝혀질 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 약의 효능의 결정이며, 이때 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 상기 식별된 조절 인자는 성공적인 약제의 전형적 특징일 수 있으며, 또한 MIM 또는 에피시프터(epishifter)와 같이 동일한 질병 조건을 치료하기 위한 추가적 제제를 식별하기 위해 사용될 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 감염을 예방하고 치료하기 위한 약제 타겟의 식별이며, 이때 상기 식별된 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 감염 상태를 유발하는 표지 인자/지표 또는 핵심 생물학적 분자일 수 있으며, 또한 감염 방지 제제를 식별하기 위해 사용될 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 예를 들어, 주어진 질병 프로필에 대한 약제와 같은 제제의 분자 효과에 대한 평가이며, 이때 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 하나 또는 그 이상의 생물학적 경로, 또는 경로(들)에서의 핵심 멤버, 또는 경로(들)의 멤버들의 핵심 조절 인자의 활성에 있어서의 증가 또는 감소일 수 있으며, 또한, 예를 들어, 주어진 질병에 대한 제제의 치료적 효능을 예측하기 위해 사용될 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 예를 들어, 세포, 조직, 기관 또는 기관계에 대한 약제와 같은 제제의 독성 프로필에 대한 평가이며, 이때 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 예를 들어, 세포 독성과 같은 독성의 지표일 수 있으며, 또한 제제의 독성 프로필을 예측하고 식별하기 위해 사용될 수 있다. 일 실시예에서, 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 약제 또는 약제 후보의 심장 독성의 지표일 수 있으며, 또한 약제 또는 약제 후보의 독성 프로필을 예측하고 식별하기 위해 사용될 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 질병을 야기하는 원생동물, 균류, 박테리아, 저항 인자, 바이러스, 또는 독소와 같은 생물학적 무기에 의해 야기되는 질병 또는 질환을 예방하고 치료하기 위한 약제 타겟의 식별이며, 이때 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자 예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 상기 질병 또는 질환을 야기하는 표지 인자/지표 또는 핵심 생물학적 분자일 수 있으며, 또한 생물학적 방어 제제를 식별하기 위해 사용될 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 노화 방지 화장품과 같은 노화 방지 제제의 타겟의 식별이며, 이때 상기 식별된 생물학적 시스템, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)의 조절 인자는 노화 과정, 특히 피부에서의 노화 과정의 표지 인자 또는 지표일 수 있으며, 또한 노화 방지 제제를 식별하기 위해 사용될 수 있다.
본 발명의 방법에서 노화 방지 화장품의 타겟을 식별하기 위해 사용되는 노화에 대한 한 예시적 세포 모델에서, 상기 세포 모델은 예를 들어, 자외선(환경적 교란 또는 외부 자극 성분)으로 처리된 노화하는 상피의 세포, 및/또는 또한 선택적으로 자외선으로 처리된 신생아의 세포를 포함한다. 일 실시예에서, 노화를 위한 세포 모델은 세포 간 상호 대화 시스템을 포함한다. 노화 방지 화장품을 위한 타겟을 식별하기 위해 확립된 2-세포 상호 대화 시스템의 예시적인 일례에서, 노화되는 상피의 세포(제 1 세포 시스템)는 자외선 (외부 자극 성분)으로 처리되고, 신생아의 세포를 매체의 조건을 겪은 처리된 노화 상피의 세포에 접촉시킴으로써 신생아의 세포(제 2 세포 시스템) 내에서의 생기는 변화, 예를 들어, 단백질체의 변화 및/또는 기능적 변화와 같은 변화가 측정될 수 있으며, 예를 들어, 단백질체 변화를 종래의 정량적 질량 분광학으로 측정하거나, 노화에 고유한 인과 관계를 데이터로부터 생성된 인과 관계 네트워크로부터 식별할 수 있다.
또 다른 측면에서, 본 발명은 발견을 위한 플랫폼 기술을 사용하여 조사적 생물학적 평가를 수행하기 위한 키트를 제공하며, 상기 키트는 본 발명의 방법으로부터 생성된 인과 관계 네트워크의 대상인 분석 성분의 존재 여부의 탐지 및/또는 그 양의 정량화를 위한 하나 또는 그 이상의 반응 제제를 포함한다. 일 실시예에서, 상기 분석 성분은 생물학적 시스템에 독특한 인과 관계, 예를 들어, 생물학적 시스템 내의 독특한 인과적 관계와 관련된 유전자의 대상이다. 특정 실시예에서, 상기 분석 성분은 단백질이며, 상기 반응 제제는 단백질에 대한 항체, 단백질을 위한 라벨, 및/또는 고성능 분석(예를 들어, 질량 분광학 기반의 염기서열 결정)을 위한 단백질을 준비하기 위한 하나 또는 그 이상의 제제를 포함한다.
또 다른 측면에서, 본 발명은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하기 위한 방법을 제공한다. 상기 방법은 이러한 방법을 필요로 하는 포유류에 치료적으로 효과적인 양의 약학적 조성을 투여하는 것을 포함하며, 상기 약학적 조성은 하나 또는 그 이상의 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21의 발현 또는 활성에 영향을 미치며, 이에 따라 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하게 해 주는 생물학적으로 활성화된 물질을 포함한다. 일부 실시예에서, 이러한 질병은 암, 예를 들어 간세포의 암종이다. 다양한 실시예들에서, 이러한 방법은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 또는 34 개의 키나아제를 사용할 수 있다. 일 실시예에서, 상기 조성물은 하나 또는 그 이상의 키나아제의 발현 및/또는 활성을 증가시킨다. 또 다른 실시예에서, 상기 조성물은 하나 또는 그 이상의 키나아제의 발현 및/또는 활성을 감소시킨다.
또 다른 측면에서, 상기 기술은 대상 포유류의 질병을 진단하기 위한 방법을 제공한다. 상기 방법은 (i) 대상으로부터 획득한 생물학적 표본에서 하나 또는 그 이상의 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21의 발현 또는 활성 수준을 결정하고, (ii) 대상에서의 수준을 제어 표본 내의 하나 또는 그 이상의 단백질의 발현 수준 또는 활성과 비교하는 것을 포함하며, 이때 대상에서의 수준을 제어 표본 내의 하나 또는 그 이상의 단백질의 발현 수준 또는 활성 사이의 차이는 대상이 질병을 겪고 있거나, 질병이 전개될 예후 상태에 있거나, 질병에 대한 치료에 우호적으로 반응하고 있음을 나타내며, 이에 따라 대상 포유류의 질병을 진단할 수 있다. 일부 실시예에서, 상기 질병은 암, 예를 들어 간세포의 암종이다. 다양한 실시예에서, 이러한 방법은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 또는 34 개의 키나아제를 사용할 수 있다. 일 실시예에서, 상기 차이는 하나 또는 그 이상의 키나아제의 발현 및/또는 활성의 증가이다. 또 다른 실시예에서, 상기 차이는 하나 또는 그 이상의 키나아제의 발현 및/또는 활성의 감소이다.
또 다른 측면에서, 상기 기술은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하기 위한 치료용 화합물을 식별하기 위한 방법을 제공한다. 상기 방법은 (i) 대상 포유류로부터의 생물학적 표본을 검사 화합물에 접촉시키고, (ii) 생물학적 표본 내에서 하나 또는 그 이상의 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21의 발현 수준을 결정하며, (iii) 생물학적 표본 내의 하나 또는 그 이상의 단백질의 발현 수준을 검사 화합물에 접촉하지 않은 제어 표본의 수준과 비교하고, (iv) 생물학적 표본 내의 하나 또는 그 이상의 단백질의 발현 수준을 조절하는 검사 화합물을 선택하는 것을 포함하며, 이에 의해 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하기 위한 치료용 화합물을 식별하기 위한 치료적 화합물을 식별하게 된다. 일부 실시예에서, 상기 질병은 암, 예를 들어 간세포 암종이다. 다양한 실시예에서, 상기 방법은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 또는 34 개의 키나아제를 사용할 수 있다. 일 실시예에서, 상기 화합물은 하나 또는 그 이상의 키나아제의 발현 및/또는 활성을 증가시킨다. 또 다른 실시예에서, 상기 화합물은 하나 또는 그 이상의 키나아제의 발현 및/또는 활성을 감소시킨다.
또 다른 측면에서, 상기 기술은 대상 포유류의 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하기 위한 방법을 제공한다. 상기 방법은 본 발명의 방법을 필요로 하는 포유류에 치료적으로 효과적인 양의 약학적 조성을 투여하는 것을 포함하며, 상기 조성물은 상기 기술된 측면에 의해(즉, 하나 또는 그 이상의 TCOF1, TOP2A, CAMK2A, CDK1, CLTCL1, EIF4G1, ENO1, FBL, GSK3B, HDLBP, HIST1H2BA, HMGB2, HNRNPK, HNRPDL, HSPA9, MAP2K2, LDHA, MAP4, MAPK1, MARCKS, NME1, NME2, PGK1, PGK2, RAB7A, RPL17, RPL28, RPS5, RPS6, SLTM, TMED4, TNRCBA, TUBB, 및 UBE21을 사용하여) 식별된 치료적 화합물을 포함하며, 이에 의해 질병의 증세를 치료하고 완화하거나, 질병의 전개를 억제하거나, 질병을 예방, 진단 또는 그 예후를 판단하게 된다. 일부 실시예에서, 상기 질병은 암, 예를 들어 간세포의 암종이다. 다양한 실시예에서, 상기 방법은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 또는 34개의 키나아제를 사용할 수 있다.
본 명세서에 기술된 모든 실시예는, 예시적으로만 설명된 실시예를 포함하여, 본 발명의 일반적인 기술의 일부로 이해되어야 하며, 본 명세서에서 명시적으로 배제되거나 부적절한 것으로 기술되지 않는 한 다른 실시예와 조합할 수 있다.
본 발명의 개시의 다양한 실시예들은 아래의 다음과 같은 도면을 참조하여 설명된다:
도 1은 치료제를 식별하기 위한 접근 방식의 예시도이다.
도 2는 암의 시스템 생물학 및 다중 생리학적 상호 반응 출력 조절의 결과의 예시도이다.
도 3은 MIMS를 사용한 생물학적 관련성의 체계적 조사에 대한 예시도이다.
도 4는 조사 생물학적 질의를 가능케 하기 위한 암 네트워크 모델링의 예시도이다.
도 5는 조사 생물학 플랫폼 기술의 예시도이다.
도 6은 본 플랫폼 기술에서 채택한 기술의 예시도이다.
도 7은 데이터 수집, 데이터 통합, 및 데이터 마이닝을 포함하는 본 발명의 플랫폼의 구성 요소를 개략적으로 나타낸다.
도 8은 “체학(omics)” 캐스케이드로부터의 반응 데이터의 MIMS 및 수집을 사용한 체계적 조사를 개략적으로 나타낸다.
도 9는 정상 및 당뇨성 상태를 나타내는 생체 외 모델을 구축하기 위해 채택되는 구성 요소를 개략적으로 나타낸다.
도 10은 질병 생리병리학과 관련하여 단백질의 인과 네트워크를 생성하기 위해 사용되는 정보학 플랫폼 REFS™를 개략적으로 나타낸다.
도 11은 당뇨성 상태 대 정상적 상태 및 MIMS에 의한 치료에 의해 정상적 상태로 회복된 당뇨성 노드에서의 분별 네트워크의 생성을 위한 접근 방식을 개략적으로 나타낸다.
도 12는 당뇨성 상태 대 정상적 상태에서의 대표적인 분별 네트워크이다.
도 13은 노드 및 연관된 관심 있는 간선(중앙의 노드 1)을 개략적으로 나타낸다. 각 간선과 연관된 상기 세포 기능성이 도시된다.
도 14는 일부 실시예에 따른 예시적 방법의 고 수준 흐름도이다.
도 15A-15D는 일부 예시적 실시예에서 사용될 수 있는 AI 기반 정보학 시스템의 구성 요소 및 과정에 대한 고 수준의 개략적 예시도이다.
도 16은 일부 예시적 실시예에서 사용될 수 있는 AI 기반 정보학 시스템의 과정의 흐름도이다.
도 17은 본 명세서에서 기술된 예시적 실시예를 실시하기에 적절한 예시적 컴퓨팅 환경을 개략적인 묘사이다.
도 18은 예 1에 기술된 사례 연구 설계의 예시도이다.
도 19는 하향 노드에 대한 CoQ10 치료의 효과를 도시한다.
도 20은 CoQ10 치료가 암 세포 라인 HepG2에서 LDHA의 발현을 감소시킴을 보여 준다.
도 21은 구축된 모든 모델 중에서, 70% 파편 빈도에서 Paca2, HepG2 및 THLE2 세포 라인으로부터의 데이터에 기반한 REFS 합치된 네트워크의 예시적 단백질 상호 반응을 도시한다.
도 22는 두 암 세포 라인 내에서 LDHA 발현 시뮬레이션에 반응하는 단백질이 본 플랫폼 기술을 사용하여 식별되었음을 보여 준다.
도 23은 LDHA - PARK7 네트워크의 진정 경로 보조(Ingenuity Passway Assist®) 분석이 TP53를 상향 허브로 식별함을 보여 준다.
도 24는 SKMEL28 암 세포 라인에서 TP53 발현 수준에 대한 CoQ10 처리의 효과를 보여 준다.
도 25는 SKMEL28 암 세포 라인에서 세포 자살을 실현하는 BCL-2 단백질의 변경된 발현과 연관된 TP53의 활성화와 SKMEL28 내의 Bcl-2, Bax 및 카스파제3 발현 수준에 대한 CoQ10 처리의 효과를 보여 준다.
도 26은 델타-델타 네트워크의 생성에 대한 수학적 접근 방식을 예시한다.
도 27은 ECAR 및 OCR을 추진하는 암- 건강 표본 분별(델타-델타) 네트워크이다. 각 추진 인자는 간선의 두께로 표현되는 종단점에 대한 분별 효과를 가진다. 사이토스케이프(Cytoscape)에서 간선의 두께는 배수 변화의 강도를 나타낸다.
도 28은 IPA를 사용하는 조사적 플랫폼 기술 출력으로부터의 PARK7 매핑 및 연관된 노드를 보여 준다: 회색 모양은 IPA로 가져온 조사적 플랫폼 기술 출력으로부터의 PARK7과 연관된 모든 노드를 나타낸다. 채워지지 않은 모양은 (이름과 함께) 완전한 맵을 생성하기 위해 IPA에 의해 통합된 새로운 연결이다.
도 29는 본 발명의 조사 플랫폼 기술을 예시하며, PARK7과 연관된 노드의 신규의 연관을 보여 준다. 대시 라인으로 나타낸 간선은 노드를 가지나 IPA 내의 중간 물질 노드를 가지지 않는 시뮬레이션에서의 중간 물질 내 두 노드 사이의 연결이다. 점선으로 나타낸 간선은 노드를 가지나 IPA 내에서 서로 다른 중간 물질 노드를 가지는 시뮬레이션에서의 중간 물질 내 두 노드 사이의 연결이다.
도 30은 델타-델타 네트워크의 생성에 대한 수학적 접근 방식을 예시한다. NG∩HG 델타 네트워크 내 NG로부터의 고유한 간선들을 HG∩HGT1 델타 네트워크 내 HGT1의 고유한 간선들과 비교한다. NG 및 HGT1의 교집합 내의 간선들은 T1에 의해 NG로 회복된 HG 간선이다.
도 31은 NG∩HG 델타 네트워크 상에 중첩된 코엔자임 Q10 처리에 의해 정상으로 회복된 당뇨성 간선들의 델타-델타 네트워크 이다.
도 32는 정상 지질 상태 ∩ 고지질증 델타 네트워크 상에 중첩된 코엔자임 Q10 처리에 의해 정상으로 회복된 고지질증 간선들의 델타-델타 네트워크이다.
도 33은 질병 및 약제 치료 내 지방산 운명의 변화를 개략적으로 나타낸다. ATP 생성을 위한 자유 지방산(FFA)의 활용과 막 생물학 교란에 대한 반응으로서 막 리모델링 사이의 균형이 약제 유도 심장 독성과 관련된다.
도 34는 당뇨성 심장근 세포에서의 약제 유도 독성을 연구하기 위해 사용된 실험적 설계 및 모델링 매개변수를 개략적으로 나타낸다.
도 35는 당뇨성 심장근 세포 내의 인간 미토콘드리아의 약제 처리(T)에 의한 에너지 대사 유전자의 전사적 네트워크 및 발현의 조절 장애를 나타낸다: 구조 분자(R)는 유전자 발현을 정상화시킨다.
도 36: A. 약제 치료(T)가 고혈당증의 조건을 겪은 심장근 세포로부터의 미토콘드리아 내 GPAT1 및 TAZ의 발현을 유도하였다. 구조 분자와 조합하여(T+R) GPAT1 및 TAZ의 수준이 정상화되었다. B. G3P 로부터 TAG의 합성을 보여준다.
도 37: A. 약제 치료(T)가 고혈당증의 조건을 겪은 심장근 세포내 미토콘드리아의 OCR (산소 소모율)을 감소시켰다. 구조 분자(T+R)가 OCR을 정상화한다. B. 약제 치료(T)가 고혈당증의 조건을 겪은 심장근 세포내 미토콘드리아의 ATP 합성을 억제한다.
도 38은 약제 치료에 의해 하향 조절된 단백질의 GO 주석을 보여준다. 미토콘드리아의 에너지 대사에 포함된 단백질은 약제 치료에 의해 하향 조절되었다.
도 39는 델타 네트워크의 생성에 대한 수학적 접근 방식을 예시한다. 양 모델이 당뇨성 환경에 있을 때 T 대 UT로부터의 고유한 간선을 비교한다.
도 40은 약제 유도 독성의 생리병리학을 추진하는 잠재적 단백질 허브 및 네트워크를 나타내는 개략도이다.
도 41은 생물학적 시스템 또는 질병 과정의 조절 인자를 식별하는 방법의 예시도이다.
도 42는 ENO1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 ENO1 발현에 대해서는 그렇지 않음을 보여 준다.
도 43은 PGK1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 PGK1 단백질 발현에 대해서는 그렇지 않음을 보여 준다.
도 43은 PGK1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 PGK1 단백질 발현에 대해서는 그렇지 않음을 보여 준다.
도 44는 넥사바(Sorafenib)로 처리한 HepG2에서 LDHA 활성의 상당한 감소를 도시한다.
도 45는 AI 기반 REFS™ 시스템을 사용하여 결과적인 데이터 집합을 분석함으로써 생산될 수 있는 인과적 분자의 상호 반응 네트워크를 예시한다.
도 46은 베이지안(Bayesian) 네트워크 추정 알고리즘을 채택하는 다중체적 데이터의 통합이 어떻게 간세포 암종에서의 신호 전달 경로의 이해로 귀결되는지를 예시한다. 노란색 사각형은 전사후 수정(인산) 데이터를 나타내며, 파란색 삼각형은 활성 기반(키나아제) 데이터를, 녹색 원은 단백질체 데이터를 나타낸다.
도 47은 간세포 암종에서의 신호 전달 경로에서의 자동 조절과 역 피드백 조절이 어떻게 플랫폼에 의해 추정될 수 있는지를 예시한다. 사각형은 PMT(인산) 데이터(회색/어두움 = 키나아제, 노란색/밝음 - 키나아제 활성 없음)를 나타내며, 사각형은 활성 기반(키나아제) + 단백질체학 데이터(회색/어두움 = 키나아제, 노란색/밝음 - 키나아제 활성 없음)를 나타낸다.
도 48 내지 51은 플랫폼에 의해 추정된 신호 전달 경로에서의 도출된 인과적 연관의 예시도이다. 키나아제 동형 단백질은 대표적인 사각형과 원으로 나타내어 졌으며, 연결기에 의해 나타나는 인과적 연관을 보여 준다.
도 52A와 B는 (A) 융합성 또는 (B) 하위융합성 배양에서 성장한 인간 배꼽의 정맥 내피의 세포(HUVEC)자 표시된 농도 범위의 CoQ10으로 24시간 동안 처리되었음을 보여 준다. 융합성 세포는 '정상' 세포와 매우 유사함에 반해 하위 융합성 세포는 증식 세포의 혈관 형성 표현형을 매우 유사하게 나타낸다. 융합성 배양에서, 농도를 증가시킨 CoQ10의 첨가는 EC의 보다 밀접한 연관, 연장 및 정렬을 가져왔다. 5000μM은 원형화된 세포에서 미묘한 증가를 가져 왔다.
도 53A-C는 HUVEC 세포의 융합성 (A) 및 하위 융합성 (B) 배양이 100 또는 1500μM CoQ10으로 24시간 동안 처리되고 요오드화프로피디엄 양성 세포 사멸제 세포에 대해 분석된 것을 도시한다. CoQ10 융합에서 처리된 EC를 보호하는 경향이 있으며, 반면에 하위-융합성 세포는 CoQ10에 민감하고 1500μM CoQ10에서 증가하는 세포 자살을 보여 주었다. (C) 하위-융합성 제어 EC(왼쪽), 100μM CoQ10(중앙) 및 1500μM CoQ10(오른쪽)의 대표적인 히스토그램을 도시한다.
도 54A-C는 HUVEC 세포의 하위 융합성 배양이 100 또는 1500μM CoQ10으로 72시간 동안 처리되고 요오드화프로피디엄 통합 분석(G2/M 위상 DNA를 탐지)을 사용하여 세포의 개수(A) 및 증식(B) 모두에 대한 분석을 도시한다. 높은 농도의 CoQ10는 세포의 개수에서 상당한 감소를 가져 왔으며 EC 증식에 대한 투여량에 의존하는 효과를 보여 주었다. CoQ10의 농도가 증가함에 따라 세포 증식이 낮아지는 것을 보여 주는 세포 사이클의 G2/M 위상 내의 세포에 대한 대표적인 세포 증식 게이팅의 히스토그램[제어 EC(왼쪽), 100μM CoQ10(중앙) 및 1500μM CoQ10(오른쪽)]이 (C)에 도시되었다.
도 55는 HUVEC 세포가 "스크래치" 분석을 사용하는 이주를 위해 검사되는 융합으로 성장하였음을 보여 준다. 100 또는 1500μM의 CoQ10가 스크래치 시 가해졌으며 정리된 영역의 폐쇄가 48시간에 걸쳐 모니터링되었다. 100μM의 CoQ10가 제어 표본에 비해 내피의 폐쇄를 지연시켰다. 1500μM CoQ10를 추가하면 48시간 까지도 폐쇄가 방지되었다(데이터 미도시).
도 56는 3-D 마트리겔 형태의 튜브에서 시간에 따라 성장하는 내피의 세포를 보여 준다. 관 형성에 대한 100μM 및 1500 μM CoQ10의 분별 효과가 관찰되었다. 저해된 세포에서 세포로의 연관 및 초기 관 구조의 붕괴가 1500 μM CoQ10에 상당히 발생하였다. 도시된 영상 72시간에 촬영되었다.
도 57A-B는 하위융합성 및 융합성 배양 내에서 성장한 내피의 세포가 CoQ10의 존재 또는 부재 하에 정상 및 혈중 산소 감소 조건에서 성장하였음을 보여 준다. CoQ10 및 저산소 상태에 대한 반응으로서 산화질소(NO)(A) 및 반응성 산소 종(ROS)(B)의 생성이 분석되었다.
도 58A-D는 지정된 성장 조건 하에서 미토콘드리아의 산소 소모를 분석하기 위해 내피의 세포가 CoQ10의 존재 또는 부재 하에서 하위 융합성 또는 융합성 배양에서 성장되는 것을 도시한다. 전체 OCR의 평가(A); 미토콘드리아의 OCR(B); ATP 생산(C); ECAR(D)이 도시된다.
도 1은 치료제를 식별하기 위한 접근 방식의 예시도이다.
도 2는 암의 시스템 생물학 및 다중 생리학적 상호 반응 출력 조절의 결과의 예시도이다.
도 3은 MIMS를 사용한 생물학적 관련성의 체계적 조사에 대한 예시도이다.
도 4는 조사 생물학적 질의를 가능케 하기 위한 암 네트워크 모델링의 예시도이다.
도 5는 조사 생물학 플랫폼 기술의 예시도이다.
도 6은 본 플랫폼 기술에서 채택한 기술의 예시도이다.
도 7은 데이터 수집, 데이터 통합, 및 데이터 마이닝을 포함하는 본 발명의 플랫폼의 구성 요소를 개략적으로 나타낸다.
도 8은 “체학(omics)” 캐스케이드로부터의 반응 데이터의 MIMS 및 수집을 사용한 체계적 조사를 개략적으로 나타낸다.
도 9는 정상 및 당뇨성 상태를 나타내는 생체 외 모델을 구축하기 위해 채택되는 구성 요소를 개략적으로 나타낸다.
도 10은 질병 생리병리학과 관련하여 단백질의 인과 네트워크를 생성하기 위해 사용되는 정보학 플랫폼 REFS™를 개략적으로 나타낸다.
도 11은 당뇨성 상태 대 정상적 상태 및 MIMS에 의한 치료에 의해 정상적 상태로 회복된 당뇨성 노드에서의 분별 네트워크의 생성을 위한 접근 방식을 개략적으로 나타낸다.
도 12는 당뇨성 상태 대 정상적 상태에서의 대표적인 분별 네트워크이다.
도 13은 노드 및 연관된 관심 있는 간선(중앙의 노드 1)을 개략적으로 나타낸다. 각 간선과 연관된 상기 세포 기능성이 도시된다.
도 14는 일부 실시예에 따른 예시적 방법의 고 수준 흐름도이다.
도 15A-15D는 일부 예시적 실시예에서 사용될 수 있는 AI 기반 정보학 시스템의 구성 요소 및 과정에 대한 고 수준의 개략적 예시도이다.
도 16은 일부 예시적 실시예에서 사용될 수 있는 AI 기반 정보학 시스템의 과정의 흐름도이다.
도 17은 본 명세서에서 기술된 예시적 실시예를 실시하기에 적절한 예시적 컴퓨팅 환경을 개략적인 묘사이다.
도 18은 예 1에 기술된 사례 연구 설계의 예시도이다.
도 19는 하향 노드에 대한 CoQ10 치료의 효과를 도시한다.
도 20은 CoQ10 치료가 암 세포 라인 HepG2에서 LDHA의 발현을 감소시킴을 보여 준다.
도 21은 구축된 모든 모델 중에서, 70% 파편 빈도에서 Paca2, HepG2 및 THLE2 세포 라인으로부터의 데이터에 기반한 REFS 합치된 네트워크의 예시적 단백질 상호 반응을 도시한다.
도 22는 두 암 세포 라인 내에서 LDHA 발현 시뮬레이션에 반응하는 단백질이 본 플랫폼 기술을 사용하여 식별되었음을 보여 준다.
도 23은 LDHA - PARK7 네트워크의 진정 경로 보조(Ingenuity Passway Assist®) 분석이 TP53를 상향 허브로 식별함을 보여 준다.
도 24는 SKMEL28 암 세포 라인에서 TP53 발현 수준에 대한 CoQ10 처리의 효과를 보여 준다.
도 25는 SKMEL28 암 세포 라인에서 세포 자살을 실현하는 BCL-2 단백질의 변경된 발현과 연관된 TP53의 활성화와 SKMEL28 내의 Bcl-2, Bax 및 카스파제3 발현 수준에 대한 CoQ10 처리의 효과를 보여 준다.
도 26은 델타-델타 네트워크의 생성에 대한 수학적 접근 방식을 예시한다.
도 27은 ECAR 및 OCR을 추진하는 암- 건강 표본 분별(델타-델타) 네트워크이다. 각 추진 인자는 간선의 두께로 표현되는 종단점에 대한 분별 효과를 가진다. 사이토스케이프(Cytoscape)에서 간선의 두께는 배수 변화의 강도를 나타낸다.
도 28은 IPA를 사용하는 조사적 플랫폼 기술 출력으로부터의 PARK7 매핑 및 연관된 노드를 보여 준다: 회색 모양은 IPA로 가져온 조사적 플랫폼 기술 출력으로부터의 PARK7과 연관된 모든 노드를 나타낸다. 채워지지 않은 모양은 (이름과 함께) 완전한 맵을 생성하기 위해 IPA에 의해 통합된 새로운 연결이다.
도 29는 본 발명의 조사 플랫폼 기술을 예시하며, PARK7과 연관된 노드의 신규의 연관을 보여 준다. 대시 라인으로 나타낸 간선은 노드를 가지나 IPA 내의 중간 물질 노드를 가지지 않는 시뮬레이션에서의 중간 물질 내 두 노드 사이의 연결이다. 점선으로 나타낸 간선은 노드를 가지나 IPA 내에서 서로 다른 중간 물질 노드를 가지는 시뮬레이션에서의 중간 물질 내 두 노드 사이의 연결이다.
도 30은 델타-델타 네트워크의 생성에 대한 수학적 접근 방식을 예시한다. NG∩HG 델타 네트워크 내 NG로부터의 고유한 간선들을 HG∩HGT1 델타 네트워크 내 HGT1의 고유한 간선들과 비교한다. NG 및 HGT1의 교집합 내의 간선들은 T1에 의해 NG로 회복된 HG 간선이다.
도 31은 NG∩HG 델타 네트워크 상에 중첩된 코엔자임 Q10 처리에 의해 정상으로 회복된 당뇨성 간선들의 델타-델타 네트워크 이다.
도 32는 정상 지질 상태 ∩ 고지질증 델타 네트워크 상에 중첩된 코엔자임 Q10 처리에 의해 정상으로 회복된 고지질증 간선들의 델타-델타 네트워크이다.
도 33은 질병 및 약제 치료 내 지방산 운명의 변화를 개략적으로 나타낸다. ATP 생성을 위한 자유 지방산(FFA)의 활용과 막 생물학 교란에 대한 반응으로서 막 리모델링 사이의 균형이 약제 유도 심장 독성과 관련된다.
도 34는 당뇨성 심장근 세포에서의 약제 유도 독성을 연구하기 위해 사용된 실험적 설계 및 모델링 매개변수를 개략적으로 나타낸다.
도 35는 당뇨성 심장근 세포 내의 인간 미토콘드리아의 약제 처리(T)에 의한 에너지 대사 유전자의 전사적 네트워크 및 발현의 조절 장애를 나타낸다: 구조 분자(R)는 유전자 발현을 정상화시킨다.
도 36: A. 약제 치료(T)가 고혈당증의 조건을 겪은 심장근 세포로부터의 미토콘드리아 내 GPAT1 및 TAZ의 발현을 유도하였다. 구조 분자와 조합하여(T+R) GPAT1 및 TAZ의 수준이 정상화되었다. B. G3P 로부터 TAG의 합성을 보여준다.
도 37: A. 약제 치료(T)가 고혈당증의 조건을 겪은 심장근 세포내 미토콘드리아의 OCR (산소 소모율)을 감소시켰다. 구조 분자(T+R)가 OCR을 정상화한다. B. 약제 치료(T)가 고혈당증의 조건을 겪은 심장근 세포내 미토콘드리아의 ATP 합성을 억제한다.
도 38은 약제 치료에 의해 하향 조절된 단백질의 GO 주석을 보여준다. 미토콘드리아의 에너지 대사에 포함된 단백질은 약제 치료에 의해 하향 조절되었다.
도 39는 델타 네트워크의 생성에 대한 수학적 접근 방식을 예시한다. 양 모델이 당뇨성 환경에 있을 때 T 대 UT로부터의 고유한 간선을 비교한다.
도 40은 약제 유도 독성의 생리병리학을 추진하는 잠재적 단백질 허브 및 네트워크를 나타내는 개략도이다.
도 41은 생물학적 시스템 또는 질병 과정의 조절 인자를 식별하는 방법의 예시도이다.
도 42는 ENO1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 ENO1 발현에 대해서는 그렇지 않음을 보여 준다.
도 43은 PGK1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 PGK1 단백질 발현에 대해서는 그렇지 않음을 보여 준다.
도 43은 PGK1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 PGK1 단백질 발현에 대해서는 그렇지 않음을 보여 준다.
도 44는 넥사바(Sorafenib)로 처리한 HepG2에서 LDHA 활성의 상당한 감소를 도시한다.
도 45는 AI 기반 REFS™ 시스템을 사용하여 결과적인 데이터 집합을 분석함으로써 생산될 수 있는 인과적 분자의 상호 반응 네트워크를 예시한다.
도 46은 베이지안(Bayesian) 네트워크 추정 알고리즘을 채택하는 다중체적 데이터의 통합이 어떻게 간세포 암종에서의 신호 전달 경로의 이해로 귀결되는지를 예시한다. 노란색 사각형은 전사후 수정(인산) 데이터를 나타내며, 파란색 삼각형은 활성 기반(키나아제) 데이터를, 녹색 원은 단백질체 데이터를 나타낸다.
도 47은 간세포 암종에서의 신호 전달 경로에서의 자동 조절과 역 피드백 조절이 어떻게 플랫폼에 의해 추정될 수 있는지를 예시한다. 사각형은 PMT(인산) 데이터(회색/어두움 = 키나아제, 노란색/밝음 - 키나아제 활성 없음)를 나타내며, 사각형은 활성 기반(키나아제) + 단백질체학 데이터(회색/어두움 = 키나아제, 노란색/밝음 - 키나아제 활성 없음)를 나타낸다.
도 48 내지 51은 플랫폼에 의해 추정된 신호 전달 경로에서의 도출된 인과적 연관의 예시도이다. 키나아제 동형 단백질은 대표적인 사각형과 원으로 나타내어 졌으며, 연결기에 의해 나타나는 인과적 연관을 보여 준다.
도 52A와 B는 (A) 융합성 또는 (B) 하위융합성 배양에서 성장한 인간 배꼽의 정맥 내피의 세포(HUVEC)자 표시된 농도 범위의 CoQ10으로 24시간 동안 처리되었음을 보여 준다. 융합성 세포는 '정상' 세포와 매우 유사함에 반해 하위 융합성 세포는 증식 세포의 혈관 형성 표현형을 매우 유사하게 나타낸다. 융합성 배양에서, 농도를 증가시킨 CoQ10의 첨가는 EC의 보다 밀접한 연관, 연장 및 정렬을 가져왔다. 5000μM은 원형화된 세포에서 미묘한 증가를 가져 왔다.
도 53A-C는 HUVEC 세포의 융합성 (A) 및 하위 융합성 (B) 배양이 100 또는 1500μM CoQ10으로 24시간 동안 처리되고 요오드화프로피디엄 양성 세포 사멸제 세포에 대해 분석된 것을 도시한다. CoQ10 융합에서 처리된 EC를 보호하는 경향이 있으며, 반면에 하위-융합성 세포는 CoQ10에 민감하고 1500μM CoQ10에서 증가하는 세포 자살을 보여 주었다. (C) 하위-융합성 제어 EC(왼쪽), 100μM CoQ10(중앙) 및 1500μM CoQ10(오른쪽)의 대표적인 히스토그램을 도시한다.
도 54A-C는 HUVEC 세포의 하위 융합성 배양이 100 또는 1500μM CoQ10으로 72시간 동안 처리되고 요오드화프로피디엄 통합 분석(G2/M 위상 DNA를 탐지)을 사용하여 세포의 개수(A) 및 증식(B) 모두에 대한 분석을 도시한다. 높은 농도의 CoQ10는 세포의 개수에서 상당한 감소를 가져 왔으며 EC 증식에 대한 투여량에 의존하는 효과를 보여 주었다. CoQ10의 농도가 증가함에 따라 세포 증식이 낮아지는 것을 보여 주는 세포 사이클의 G2/M 위상 내의 세포에 대한 대표적인 세포 증식 게이팅의 히스토그램[제어 EC(왼쪽), 100μM CoQ10(중앙) 및 1500μM CoQ10(오른쪽)]이 (C)에 도시되었다.
도 55는 HUVEC 세포가 "스크래치" 분석을 사용하는 이주를 위해 검사되는 융합으로 성장하였음을 보여 준다. 100 또는 1500μM의 CoQ10가 스크래치 시 가해졌으며 정리된 영역의 폐쇄가 48시간에 걸쳐 모니터링되었다. 100μM의 CoQ10가 제어 표본에 비해 내피의 폐쇄를 지연시켰다. 1500μM CoQ10를 추가하면 48시간 까지도 폐쇄가 방지되었다(데이터 미도시).
도 56는 3-D 마트리겔 형태의 튜브에서 시간에 따라 성장하는 내피의 세포를 보여 준다. 관 형성에 대한 100μM 및 1500 μM CoQ10의 분별 효과가 관찰되었다. 저해된 세포에서 세포로의 연관 및 초기 관 구조의 붕괴가 1500 μM CoQ10에 상당히 발생하였다. 도시된 영상 72시간에 촬영되었다.
도 57A-B는 하위융합성 및 융합성 배양 내에서 성장한 내피의 세포가 CoQ10의 존재 또는 부재 하에 정상 및 혈중 산소 감소 조건에서 성장하였음을 보여 준다. CoQ10 및 저산소 상태에 대한 반응으로서 산화질소(NO)(A) 및 반응성 산소 종(ROS)(B)의 생성이 분석되었다.
도 58A-D는 지정된 성장 조건 하에서 미토콘드리아의 산소 소모를 분석하기 위해 내피의 세포가 CoQ10의 존재 또는 부재 하에서 하위 융합성 또는 융합성 배양에서 성장되는 것을 도시한다. 전체 OCR의 평가(A); 미토콘드리아의 OCR(B); ATP 생산(C); ECAR(D)이 도시된다.
I. 개요
본 발명의 예시적 실시예들은 질병 생리병리학 또는 신생 혈관 생성과 같은 광범위한 범위의 생물학적 과정들을 이해할 수 있는 도구이며 질병 과정을 가능하게 하는 요소들을 포함하여 이러한 생물학적 과정의 기반이 되는 핵심적 분자의 추진 인자인 조사적 생물학 플랫폼(“플랫폼”)을 사용하여 수행될 수 있는 방법들을 통합한다. 일부 예시적 실시예들에는 이 플랫폼의 최소한 일부 또는 전체를 통합할 수 있는 시스템이 포함된다. 일부 예시적 방법들은 이 플랫폼의 최소한 일부 또는 전체를 채택할 수 있다. 이 플랫폼을 포함하는 일부 예시적 실시예의 목표와 목적은 일반적인 예시의 목적으로 이하에서 개략적으로 설명된다:
i) 생물학적 과정(예를 들어, 질병 과정, 신생 혈관 생성)의 임계 성분의 추진 인자로서 이들이 전반적인 생물학적 과정에 관계되는 특정한 분자 서명을 창출한다.
ii) 다른 생물학적 단계(예를 들어, 정상적 상태)에 대하여 특정 생물학적 상태(예를 들어, 질병 상태, 신생 혈관 생성 상태)를 구분하는 분별 분자 서명을 식별하고, 두 생물학적 상태 간의 변화(예를 들어, 정상 상태에서 질병 상태 또는 신생 혈관 생성 상태로의)의 메커니즘을 중재하는 서명 또는 분자 객체 전체에 대한 이해를 발전시키는데 도움을 줄 수 있는, 생물학적 과정과 관련된 분자 서명 또는 분별 맵을 생성한다.
iii) 생물학적 과정의 외부 제어를 위한 잠재적 시술 타겟으로서(예를 들어, 허브를 잠재적 치료적 타겟 또는 신생 혈관 생성의 조절을 위한 타겟으로 사용), 또는 문제가 되는 생물학적 과정을 위한 잠재적 생물학적 표지 인자로서(예를 들어, 예후 및/또는 치료 진단(theranostics)에서의 사용에서의 질병에 특정한 생물학적 표지 인자 및 혈관 형성 특정한 표지 인자)의 분자 활성 “허브”의 역할을 조사한다.
이 플랫폼을 포함하는 일부 예시적 방법들은 다음 특성 중 하나 또는 그 이상을 포함할 수 있다:
1) 하나 또는 그 이상의 모델, 바람직하게는 생체 외 모델 또는 실험실 모델(예를 들어, CAM 모델, 각막 주머니 모델, 마트리겔(MATRIGEL®) 모델)에서 생물학적 과정과 연관된 세포를 사용하여 생물학적 과정(예를 들어, 질병 과정, 혈관 형성 과정) 및/또는 생물학적 과정(예를 들어, 질병 생리학 및 생리병리학, 신생 혈관 생성의 생리학)의 구성 요소에 대한 모델링. 예를 들어, 상기 세포는 문제가 되는 생물학적 과정에 정상적으로 참여하는 인간에서 유래한 세포일 수 있다. 상기 모델은 해당 생물학적 과정(예를 들어, 질병, 신생 혈관 생성)에 특정된 여러 세포의 알림 신호 / 조건 / 교란을 포함할 수 있다. 이상적으로, 상기 모델은 생물학적 (질병, 신생 혈관 생성) 조건의 정적 평가가 아닌 여러(질병, 신생 혈관 생성) 상태 및 플럭스(flux) 성분을 나타낸다.
2) 해당 분야에서 알려진 수단을 사용한 mRNA 및/또는 단백질 서명의 프로파일링. 예를 들어, 정량적 중합효소 연쇄 반응 (qPCR) 및 질량 분광학(MS)과 같은 단백질체학 분석 도구. 이러한 mRNA 및 단백질 데이터 집합은 환경 / 교란에 대한 생물학적 반응을 나타낸다. 적용할 수 있고 가능한 경우에, 리피도믹스, 대사체학, 및 전사체학 데이터 또한 문제가 되는 생물학적 과정을 위한 보조적 또는 대체적 수단으로 통합?? 수 있다. SNP 분석은 때때로 과정에서 사용할 수 있는 또 다른 구성 요소이다. 이는, 예를 들어, SNP 또는 특정한 변이가 생물학적 과정에 영향을 미치는 지의 여부를 조사하는데 도움이 될 수 있다. 이들 변수들은 생물학적 과정을 정적인 “순간 상태(snapshot)” 또는 동적 과정의 표현 중 하나로 기술하기 위해 사용될 수 있다.
3) 신호 및 교란에 대한 하나 또는 그 이상의 세포 반응의 평가로서, 생명 에너지론 프로파일링, 세포 증식, 세포 자살, 및 기관계 기능을 포함하나 이에 한정되지 않음. 진정한 유전자형-표현형 연관이 ATP, ROS, OXPHOS, 시호스(Seahorse) 분석, 카스파제 분석, 이주 분석, 주화성 분석, 관 형성 분석 등과 같은 기능적 모델을 채택함으로써 실현된다. 이러한 세포 반응들은 생물학적 과정(또는 이들의 모델)에서의 mRNA / 단백질 발현, 및 상기 2)에서 기술된 다른 관련 상태의 해당 상태(들)에 대한 세포의 반응을 나타낸다.
4) 상기 3)에서 단백질체학으로 이렇게 획득한 기능적 분석 데이터 및 상기 2)에서 획득한 기타 데이터를 통합하고, 인과 관계에 의해, 인공 지능(AI) 기반 정보학 시스템 또는 플랫폼에 의해 추진되는 단백질 연관을 결정. 이러한 AI 기반 시스템은 생물학적 과정에 대한 기존 지식에 의존하지 않고 상기 2) 및/또는 3)에서 획득한 데이터 집합에, 바람직하게는 상기 데이터 집합에만 기반한다. 바람직하게는, 어떠한 데이터 포인트도 통계적으로 또는 인위적으로 잘려나가지 않는다. 그 대신, 획득된 모든 데이터 단백질연관의 결정을 위한 AI 시스템으로 공급된다. 상기 통합 과정의 한 목표 또는 출력은 서로 다른 생물학적 상태(예를 들어, 질병 상태 대 정상적 상태) 사이의 하나 또는 그 이상의 분별 네트워크(다른 경우에 본 명세서에서 “델타 네트워크”로 또는 일부 경우에는 경우가 의미하는 바에 따라 “델타-델타 네트워크”로 불릴 수 있다)이다.
5) 활성의 각 허브를 잠재적 치료적 타겟 및/또는 생물학적 표지 인자로 탐구하기 위한 AI 기반 정보학 플랫폼으로부터의 출력에 대한 프로파일링. 이러한 프로파일링은 어떠한 실제 수중 실험실 실험에 의존하지 않고 획득한 데이터 집합에 기반한 컴퓨터 시뮬레이션만으로 수행될 수 있다.
6) 분자의 및 세포 기술을 채택하여 활성의 허브를 증명. 이러한 수중 실험실 세포-기반 실험에 의한 출력에 대한 정보 취득 이후 증명은 선택 사항일 수 있으나, 완전히 순환적인 조사를 창출하는데 도움이 될 것이다.
상기 개략적으로 설명된 것 중 어느 하나 또는 모든 접근 방식이 최소한 부분적으로는 특정한 적용의 특성에 따라 생물학적 과정에 대해 특정하게 적용될 수 있다. 즉, 상기 개략적으로 설명된 것 중 하나 또는 그 이상의 접근 방식이 생략되거나 수정될 수 있으며, 하나 또는 그 이상의 추가적인 접근 방식이 특정한 적용에 따라 채택될 수 있다.
상기 플랫폼을 예시하는 여러 개략적 예시가 제공된다. 특히, 상기 플랫폼을 사용하여 치료제를 식별하기 위한 예시적 접근 방식의 예시가 도 1에서 묘사된다. 암 및 통합된 다중 생리학적 상호 반응 출력 조절의 결과의 시스템 생물학에 대한 예시가 도 2에서 묘사된다. MIMS를 사용한 생물학적 관련성의 체계적 조사의 예시가 도 3에서 묘사된다. 조사적 생물학적 질의를 가능하게 하기 위한 암 네트워크의 모델링의 예시가 도 4에서 묘사된다.
상기 플랫폼에서 채택된 조사적 생물학 플랫폼 및 기술의 예시가 도 5 및 6에서 묘사된다. 데이터 수집, 데이터 통합, 및 데이터 마이닝을 포함하는 상기 플랫폼의 구성요소의 개략적 표현이 도 7에서 묘사된다. MIMS 및 “체학(omics)” 증폭으로부터의 반응 데이터의 수집을 이용한 체계적 조사에 대한 개략적 표현이 도 8에서 묘사된다.
도 14는 예시적 방법(10)에 대한 고 수준의 흐름도로서, 예시적 방법을 수행하기 위해 사용될 수 있는 예시적 시스템의 구성 요소를 나타낸다. 초기에, 일반적으로 생물학적 과정과 연관된 세포를 사용하여 생물학적 과정 (예를 들어, 질병 과정) 및/또는 생물학적 과정 (예를 들어, 질병 생리학 및 생리병리학)의 구성 요소를 위한 모델(예를 들어, 생체 외 모델)을 수립한다(단계 12). 예를 들어, 상기 세포는 생물학적 과정(예를 들어, 질병)에 정상적으로 참여하는 인간으로부터 유래된 세포일 수 있다. 세포 모델은 생물학적 과정(예를 들어, 질병)에 특유한 여러 세포 단서, 조건, 및/또는 교란을 포함할 수 있다. 이상적으로, 상기 세포 모델은 생물학적 과정의 정적 평가가 아닌 생물학적 과정(예를 들어, 질병)의 여러 (질병) 상태 및 플럭스 성분을 나타낸다. 상기 비교 세포 모델은 제어 세포 또는 정상(예를 들어, 질병이 없는) 세포를 포함할 수 있다. 이 세포 모델의 추가적인 설명은 이하 제 III.A절 및 IV절에서 주어진다.
제 1 데이터 집합은 생물학적 과정을 위한 세포 모델로부터 얻어지며, 알려진 과정 또는 시스템(예를 들어, 정량적 중합효소 연쇄 반응(qPCR) 및 질량 분광학(MS)과 같은 단백질체학 분석 도구)을 사용하여 다수의 유전자(예를 들어, mRNA 및/또는 단백질 서명)의 발현 수준을 나타내는 정보를 포함한다(단계 16).
제 3 데이터 집합은 비교 생물학적 과정을 위한 세포 모델로부터 얻어 진다(단계 18). 상기 제 3 데이터 집합은 비교 세포 모델로부터의 비교 세포 내의 다수의 유전자의 발현 수준을 나타내는 정보를 포함한다.
본 발명의 방법의 특정 실시예에서, 이들 제 1 및 제 3 데이터 집합은 본 명세서에서 총체적으로 생물학적 시스템과 연관된 세포(비교 세포를 포함하는 모든 세포) 내에서 다수의 유전자의 발현 수준을 나타내는 “제 1 데이터 집합”으로 통칭된다.
제 1 데이터 집합 및 제 3 데이터 집합 하나 또는 그 이상의 mRNA 및/또는 단백질 서명 분석 시스템(들)로부터 얻어질 수 있다. 제 1 및 제 3 데이터 집합 내의 상기 mRNA 및 단백질 데이터는 환경 및/또는 교란에 대한 생물학적 반응을 나타낼 수 있다. 적용 또는 가능한 경우, 리피도믹스, 대사체, 및 전사체 데이터가 상기 생물학적 과정에 대한 보조적이거나 대체적 수단으로서 통합될 수 있다. SNP 분석은 상기 과정에서 때때로 사용될 수 있는 또 다른 구성 요소이다. 이는, 예를 들어, 단일 뉴클레오타이드 다형성(SNP) 또는 특정한 변이가 생물학적 과정에 영향을 미치는지를 조사하는데 도움이 될 것이다. 이러한 데이터 변수는 정적 “순간 상태(snapshot)” 또는 동적 과정의 표현 중 하나로서 생물학적 과정을 기술하는데 사용될 수 있다. 세포 내 다수의 유전자의 발현 수준을 나타내는 정보에 관한 추가적인 설명은 이하 제 III.B절에서 주어진다.
제 2 데이터 집합은 생물학적 과정을 위한 세포 모델로부터 얻어지며, 세포의 기능적 활성 또는 반응을 나타내는 정보를 포함한다(단계 20). 마찬가지로, 제 4 데이터집합은 생물학적 과정을 위한 세포 모델로부터 얻어지며, 비교 세포의 기능적 활성 또는 반응을 나타내는 정보를 포함한다(단계 22).
본 발명의 방법의 특정 실시예에서, 이들 제 2 및 제 4 데이터 집합은 본 명세서에서 총체적으로 생물학적 시스템과 관련된 세포(비교 세포를 포함하는 모든 세포)의 기능적 활성 또는 세포 반응을 나타내는 “제 2 데이터 집합”으로 통칭한다.
하나 또는 그 이상의 기능적 분석 시스템이 기능적 활성 또는 세포 또는 비교 세포의 반응에 관한 정보를 얻기 위해 사용될 수 있다. 신호 및 교란에 대한 기능적 세포 반응과 관련된 상기 정보는 생물에너지론 프로파일링, 세포 증식, 세포 자살, 및 기관계의 기능을 포함하나 이에 한정되지는 않는다. 과정 및 경로에 대한 기능적 모델(예를 들어, 아데노신 3 인산(ATP), 활성 산소종(ROS), 산소 첨가 인산화(OXPHOS), 시호스(Seahorse) 분석, 카스파제 분석, 이주 분석, 주화성 분석, 관 형성 분석 등)들이 진정한 유전자형-표현형 연관을 얻기 위해 채택될 수 있다. 상기 기능적 활성 또는 세포 반응은 mRNA / 단백질 발현의 해당 상태(들) 및 기타 관련된 적용 조건 또는 교란에 대한 반응에서 생물학적 과정(또는 이들의 모델) 내 세포의 반응을 나타낸다. 세포의 기능적 활성 또는 반응을 나타내는 정보 획득에 대한 추가적 정보는 이하 제 III.B절에서 제공된다.
상기 방법은 또한 컴퓨터로 구현된 세포 및 제어 세포 내에서의 생물학적 과정의 모델을 생성하는 것을 포함한다. 예를 들어, 다수의 유전자 발현 수준 및 기능적 활성 또는 세포 반응 사이의 하나 또는 그 이상의 (예를 들어, 이들의 모임) 인과 관계의 베이지안(Bayesian) 네트워크가 제 1 데이터 집합 및 제 2 데이터 집합으로부터 세포 모델(“생성된 세포 모델 네트워크”)에 대해 생성될 수 있다(단계 24). 상기 생성된 세포 모델 네트워크는, 개별적으로 또는 총체적으로, 관계에 대한 정량적 확률적 방향 정보를 포함한다. 상기 생성된 세포 모델 네트워크는 제 1 데이터 및 제 2 데이터 집합으로부터의 정보를 제외하고는 유전자 발현 및/또는 기능적 활성 또는 세포 반응 사이의 알려진 생물학적 관계에 기반하지 않는다. 상기 하나 또는 그 이상의 생성된 세포 모델 네트워크는 총체적으로 합치된 세포 모델 네트워크라 칭할 수 있다.
예를 들어, 다수의 유전자 발현 수준 및 기능적 활성 또는 세포 반응 사이의 하나 또는 그 이상의 (예를 들어, 이들의 모임) 인과 관계의 베이지안(Bayesian) 네트워크가 제 1 데이터 집합 및 제 2 데이터 집합으로부터 비교 세포 모델(“생성된 비교 세포 모델 네트워크”)에 대해 생성될 수 있다(단계 26). 상기 생성된 비교 세포 모델 네트워크는, 개별적으로 또는 총체적으로, 관계에 대한 정량적 확률적 방향 정보를 포함한다. 상기 생성된 세포 네트워크는 제 1 데이터 및 제 2 데이터 집합으로부터의 정보를 제외하고는 유전자 발현 및/또는 기능적 활성 또는 세포 반응 사이의 알려진 생물학적 관계에 기반하지 않는다. 상기 하나 또는 그 이상의 생성된 비교 세포 모델 네트워크는 총체적으로 합치된 세포 모델 네트워크라 칭할 수 있다.
상기 생성된 세포 모델 네트워크 및 생성된 비교 세포 모델 네트워크는 인공 지능(AI) 기반 정보학 플랫폼을 사용하여 창출할 수 있다. 생성된 세포 모델 네트워크의 창출, 생성된 비교 세포 모델 네트워크의 창출 및 AI 기반 정보학 시스템에 대한 보다 자세한 사항은 이하 제 III.C절 및 도 2A-3에 대한 설명에서 주어진다.
다른 많은 AI 기반 플랫폼 또는 시스템이 정량적 확률적 방향 정보를 포함하는 인과 관계의 베이지안(Bayesian) 네트워크를 생성하기 위해 사용될 수 있음을 인식하여야 한다. 본 명세서에서 기술된 특정 예들이 특정한 상용으로 사용할 수 있는 시스템, 즉, GNS(캠브리지, MA)로부터의 REFS™ (역 엔지니어링/정방향 시뮬레이션)을 채택하였지만, 실시예는 이에 한정되지 않는다. 일부 실시예를 구현하기에 적절한 AI 기반 시스템 또는 플랫폼은 입력 변수(예를 들어, 제 1 및 제 2 데이터 집합)들 사이의 인과 관계를 잠재적, 확립된 생물학적 관계 및/또는 증명된 생물학적 관계에 대한 어떠한 기존의 지식에도 의존하지 않고 입력 데이터에만 기반하여 확립하기 위해 수학적 알고리즘을 채택한다.
예를 들어, REFS™ AI 기반 정보학 플랫폼은 실험적으로 도출된 가공되지 않았거나(원래의) 또는 최소한으로 처리된 입력 생물학적 데이터(예를 들어, 유전학적, 게놈 관련, 후성유전학, 단백질체, 대사체, 임상적 데이터)를 활용하며, 분자가 완전한 시스템 내에서 서로 어떻게 반응하는지를 결정하기 위해 수 조 회의 계산을 빠르게 수행한다. REFS™ AI 기반 정보학 플랫폼은 입력 데이터를 기반으로 기반이 되는 생물학적 시스템을 정량적으로 나타내는 컴퓨터로 구현된 컴퓨터 모의 세포 모델(예를 들어, 생성된 세포 모델 네트워크)을 생성하기 위한 목표로 역 엔지니어링 과정을 수행한다. 또한, 가설과 관련하여 연관된 신뢰 수준을 수반하는 예측을 얻어내기 위해, 기반이 되는 생물학적 시스템에 대한 가설이 개발되고 컴퓨터로 구현된 세포 모델를 기반으로 빠르게 모의될 수 있다.
이러한 접근 방식을 사용하여, 생물학적 시스템이 어떠한 환자가 주어진 치료 식이 요법에 반응할지를 결정하는 생물학적 시스템(예를 들어, 질병)의 상세한 메카니즘, 효과적인 시술 전략, 및/또는 임상적 생물학적 표지 인자를 알아내기 위한 “시술” 이 모의되는 정량적 컴퓨터로 구현된 세포 모델로 나타내어 진다. 알려진 생물학의 모델링에 기반한 접근 방식뿐만 아니라 종래의 생물정보학 및 통계적 접근 방식은 일반적으로 이러한 유형의 통찰을 제공하지 못한다.
상기 생성된 세포 모델 네트워크 및 상기 생성된 비교 세포 모델 네트워크가 만들어진 후에, 이들은 각각 비교된다. 생성된 세포 모델 네트워크의 최소한 일부에 존재하는 하나 또는 그 이상의 인과 관계, 및 상기 생성된 비교 세포 모델 네트워크에 부재하거나 최소한 하나의 의미 있는 다른 매개변수를 가지는 인과 관계가 식별된다(단계 28). 이러한 비교는 결과적으로 네트워크의 생성을 일으킬 수 있다. 이러한 비교, 식별, 및/또는 분별(델타) 네트워크 생성은 분별 네트워크 생성 모듈을 사용하여 수행될 수 있으며, 이 모듈은 이하 제 III.D절 및 도 26의 설명과 관련하여 보다 상세히 기술된다.
일부 실시예에서, 입력 데이터 집합은 하나의 세포 유형 및 하나의 비교 세포 유형으로부터 유래하며, 이는 하나의 세포 유형에 기반한 세포 모델 네트워크들의 모임 및 하나의 비교 제어 세포 유형에 기반한 또 다른 비교 세포 모델 네트워크들의 모임을 생성할 수 있다. 분별이 한 세포 유형의 네트워크들의 모임과 비교 세포 유형(들)의 네트워크들의 모임 사이에 수행될 수 있다.
다른 실시예에서, 입력 데이터 집합은 다중 세포 유형(예를 들어, 둘 또는 그 이상의 암 세포 유형, 예를 들어, 서로 다른 혈관 형성 촉진 자극에 의해 유도된 서로 다른 신생 혈관 생성 상태에서의 둘 또는 그 이상의 세포 유형), 다중 비교 세포 유형(예를 들어, 둘 또는 그 이상의 정상, 암세포가 아닌 유형, 둘 또는 그 이상의 비혈관 형성 및 혈관 형성 세포 유형)으로부터 유래된다. 세포 모델 네트워크들의 모임은 각각의 세포 유형 및 각각의 비교 세포 유형에 대해 개별적으로 생성되고, 또한/또는 다중 세포 유형 및 다중 비교 세포 유형으로부터의 데이터가 각자의 합성 데이터 집합으로 결합될 수 있다. 상기 합성 데이터 집합은 다중 세포 유형(합성 데이터)에 해당하는 네트워크들을 모임 및 다중 비교 세포 유형(비교 합성 데이터)에 해당하는 네트워크들의 또 다른 모임을 생성할 수 있다. 분별이 비교 합성 데이터에 대한 네트워크들의 모임과 비교하여 합성 데이터에 대한 네트워크들의 모임에 수행될 수 있다.
일부 실시예에서, 분별은 두 개의 서로 다른 분별 네트워크 사이에서 수행될 수 있다. 이 출력은 델타-델타 네트워크로 불릴 수 있으며, 이하 도 26과 관련하여 설명된다.
정량적 관계 정보 생성된 세포 모델 네트워크의 각 관계에 대해 식별될 수 있다(단계 30). 마찬가지로, 생성된 비교 세포 모델 네트워크 내에서의 각 관계에 대한 정량적 관계 정보가 식별될 수 있다(단계 32). 관계에 대한 상기 정량적 정보는 인과율을 나타내는 방향, 관계에 대한 통계적 불확실성의 척도(예를 들어, 커브 아래 면적(Area Under the Curve: AUC) 통계적 측정), 및/또는 관계의 강도에 대한 정량적 양(예를 들어, 배수)의 발현을 포함할 수 있다. 생성된 세포 모델 네트워크 내의 상기 여러 관계는 잠재적 치료적 타겟 및/또는 생물학적 표지 인자로서의 활성 네트워크 내의 각 허브를 탐구하기 위해 정량적 관계 정보를 사용하여 프로파일링될 수 있다. 이러한 프로파일링은 실제의 수중 실험실 실험에 의존하지 않고 완전히 생성된 세포 모델 네트워크로부터의 결과에 기반한 컴퓨터 시뮬레이션으로 수행할 수 있다.
일부 실시예에서, 활성 네트워크 내의 허브는 분자 및 세포 관련 기술을 채택하여 증명될 수 있다. 수중 실험실 세포 기반 실험에 의한 출력에 대해 이러한 사후 정보 인증을 수행할 필요는 없지만, 이는 완전히 순환적인 조사를 수행하는데 도움이 될 것이다. 도 15는 예시적 AI 기반 정보학 시스템 (예를 들어, REFS™ AI 기반 정보학 시스템) 및 AI 기반 시스템 과 조사적 생물학 플랫폼 (“플랫폼”)의 기타 요소 또는 부분 사이의 상호 반응의 기능성의 단순화된 고 수준의 표현을 개략적으로 묘사한다. 도 15A에서, 약제의 투여, 치료의 실행, 단백질 발현, mRNA 발현, 및 기타 다수의 연관된 기능적 조치들(OCR, ECAR과 같은)과 같은 생물학적 과정 (예를 들어, 질병 모델)에 대한 모델로부터 얻어진 여러 데이터 집합들이 AI 기반 시스템으로 공급된다. 도 15B에서 보인 바와 같이, 입력 데이터 집합으로부터, AI-시스템은 생물학적 과정 (예를 들어, 질병), 베이지안(Bayesian) 파편 일람표(도 15B)로 불리는 과정에서의 분자의 메커니즘을 추진하는 변수들(단백질, 지질 및 대사 물질)을 포함하는 “네트워크 파편들”의 라이브러리를 생성한다.
도 15C에서, 상기 AI 기반 시스템은 라이브러리에서 네트워크 파편의 부분 집합을 선택하여 상기 파편으로부터 초기 시도 네트워크를 구성한다. 상기 AI 기반 시스템은 또한 라이브러리에서 네트워크 파편의 다른 부분 집합을 선택하여 또 다른 초기 시도 네트워크를 구성한다. 결과적으로 라이브러리 내 네트워크 파편의 서로 다른 부분 집합들로부터 초기 시도 네트워크들의 모임(예를 들어, 1000개의 네트워크)이 생성된다. 이 과정은 병행 모임 샘플링이라 부를 수 있다. 모임 내의 각각의 시도 네트워크는 라이브러리로부터의 추가적인 네트워크 파편의 추가, 차감 및 대입에 의해 진화하거나 최적화된다. 추가적인 데이터가 얻어지는 경우, 이 추가적인 데이터는 라이브러리 내 네트워크 파편들로 통합될 수 있으며 각 시도 네트워크의 진화를 통해 시도 네트워크의 모임들로 통합될 수 있다. 최적화/진화 과정이 완료된 이후, 이 시도 네트워크들의 모임은 생성된 세포 모델 네트워크로서 기술될 수 있다.
도 15D에서 보인 바와 같이, 생성된 세포 모델 네트워크들의 모임은 생물학적 시스템의 거동을 시뮬레이션하기 위해 사용될 수 있다. 상기 시뮬레이션은 수중 실험실 세포-기반, 또는 동물-기반 실험에 의해 증명될 수 있는 조건의 변화에 대한 생물학적 시스템의 거동을 예측하기 위해 사용될 수 있다. 또한, 생성된 세포 모델 네트워크에서의 관계의 정량적 매개변수는 생성된 세포 모델 네트워크 내 다른 노드에 대한 영향을 관찰하면서 시뮬레이션된 교란을 각 노드 개별적으로 적용함으로써 시뮬레이션 기능성을 사용하여 추출할 수 있다. 이에 대한 보다 상세한 사항은 이하 제 III.C절에서 설명된다.
도 2A-2D에서 묘사된 AI 기반 정보학 시스템 자동화된 역 엔지니어링 과정은 편향되지 않고 체계적인 컴퓨터 기반 세포 모델 네트워크인 생성된 세포 모델 네트워크들의 모임을 생성한다.
상기 역 엔지니어링은 데이터 내에서의 분자의 측정과 관심의 대상인 표현형 결과 사이의 확률 방향적 네트워크 연결을 결정한다. 분자의 측정에서의 변동은 이러한 객체들 및 종단점들에서의 변화 사이의 확률적인 원인 결과 관계를 학습할 수 있게 해 준다. 플랫폼의 기계 학습적 성격은 또한 끊임없이 진화하는 데이터 집합에 기반한 훈련 및 예측을 가능하게 해 준다.
데이터 내에서의 분자 측정들 사이의 네트워크 연결은 “확률적”이며, 이는 부분적으로 이러한 연결이 컴퓨터 알고리즘에 의해 “학습된” 관찰된 데이터 집합들 사이의 상호 관계에 기반할 수 있기 때문이다. 예를 들어, 단백질 X의 발현 수준과 단백질 Y의 발현 수준이 긍정적 또는 부정적으로 상호 관련되어 있다면, 데이터 집합의 통계적 분석을 기반으로, 단백질 X 및 Y 사이의 네트워크를 수립하도록 인과 관계가 지정될 수 있다. 이러한 추정 상의 인과 관계의 신뢰성은 이러한 연결의 확률로써 정의될 수 있으며, p-값(예를 들어, p < 0.1, 0.05, 0.01, 등)으로 측정될 수 있다.
데이터 내에서의 분자 측정들 사이의 네트워크 연결은 “방향성”을 가지며, 이는 부분적으로 역 엔지니어링 과정으로 결정되는 분자 측정들 사이의 네트워크 연결이 연결된 유전자 / 단백질 사이의 관계의 원인과 결과를 반영함으로써 이로 인해 한 단백질의 발현 수준을 올리는 것이 상기 연결이 발현을 촉진하는지 저지하는지에 따라 다른 단백질의 발현 수준을 올리거나 내릴 수 있기 때문이다.
데이터 내에서 분자의 측정들 사이의 네트워크 연결은 “정량적”이며, 이는 부분적으로, 이 과정에 의해 결정되는 분자의 측정 사이의 네트워크 연결 이 기존의 데이터 집합 및 이 데이터와 연관된 확률적 척도에 기반한 컴퓨터 시뮬레이션으로 모의될 수 있기 때문이다. 예를 들어, 분자의 측정들 사이에 확립된 네트워크 연결에서, 주어진 단백질(네트워크 내의 “노드”)의 발현 수준을 증가 또는 감소시키는 것이(예를 들어, by 1, 2, 3, 5, 10, 20, 30, 50,100-배수 또는 그 이상) 이론적으로 가능할 수 있으며, 이의 네트워크 내의 다른 연결된 단백질에 대한 영향을 정량적으로 모의할 수 있다.
데이터 내에서 분자의 측정들 사이의 네트워크 연결은 “편향되지 않으며(unbiased)”, 이는 최소한 부분적으로는 어떠한 데이터 포인트도 통계적으로 또는 인위적으로 배제되지 않기 때문이며, 부분적으로는 상기 네트워크 연결이 문제가 되는 생물학적 과정에 대한 기존의 지식을 참조하지 않고 입력 데이터에만 기반하기 때문이다.
데이터 내에서 분자의 측정들 사이의 네트워크 연결은 “체계적”이며 (또한 편향되지 않으며), 이는 부분적으로 모든 입력 변수들 사이의 모든 잠재적 연결이 예를 들어, 쌍 단위의 방식으로 체계적으로 탐구되었기 때문이다. 이러한 체계적인 탐구를 실행하기 위한 컴퓨터 연산에 대한 의존은 입력 변수의 개수가 증가할수록 기하학적으로 늘어난다.
일반적으로, 보통 약 1,000개에 이르는 네트워크의 모임이 모든 측정된 개체들 사이의 확률적, 인과적, 정량적 관계를 예측하기에 충분하다. 네트워크들의 모임은 데이터 내의 불확실성을 포획하며 각 모델 예측에 대한 신뢰도 척도의 계산을 가능하게 한다. 네트워크들의 모임을 함께 사용하여 생성된 예측에서, 모임 내 개별적 네트워크로부터의 예측에 있어서의 차이는 예측 내의 불확실성의 정도를 나타낸다. 이러한 특성은 상기 모델로부터 생성된 임상적 반응의 예측에 대한 신뢰성 척도를 지정할 수 있게 해준다.
모델들이 일단 역 엔지니어링되면, 질병 조건과 같은 문제가 되는 생물학적 과정에 대한 핵심 분자의 추진 인자를 결정하기 위해 추가적인 시뮬레이션 질의가 모델들의 모임에 수행될 수 있다.
정상 및 당뇨성 상태들을 나타내는 표본적 생체 외 모델을 구축하기 위해 채용된 구성 요소의 개략적 묘사가 도 9에 도시되었다. 질병 생리병리학과 관련하여 단백질의 인과 네트워크를 생성하기 위해 사용되는 정보학 플랫폼 REFS™의 개략적 표현이 도 10에서 묘사된다. 당뇨성 상태 대 정상적 상태 및 MIMS에 의한 치료에 의해 정상적 상태로 회복된 당뇨성 노드에서의 분별 네트워크의 생성을 위한 접근 방식은 도 11에서 개략적으로 묘사된다. 당뇨성 상태 대 정상적 상태에서의 대표적인 분별 네트워크는 도 12에서 묘사된다. 노드 및 연관된 관심 있는 간선(중앙의 노드 1) 및 각 간선과 연관된 상기 세포 기능성이 도 13에서 도시된다.
본 발명을 위에서 일반적으로 기술하였으므로, 이하의 명세서 부분들에서는 본 명세서에서 기술된 방법을 사용하여 분석될 수 있는 하나 또는 그 이상의 특정한 생물학적 시스템을 가지는 상기 일반적인 발명의 여러 측면 또는 요소에 대한 보다 상세한 설명이 제공될 것이다. 그러나, 이하 예시적 목적으로 사용된 특정한 생물학적 시스템들은 본 발명을 한정하기 위한 것이 아닌 것으로 이해되어야 한다. 반대로, 대체적 시스템 및 수정된 시스템을 포함하여 다른 별개의 생물학적 시스템들 및 이들과 균등한 사항들 또한 마찬가지로 본 발명의 플랫폼 기술을 사용하여 분석될 수 있을 것이다.
II
. 정의
본 명세서에서 사용되며 특정한 의도로 정의되었으나 본 명세서의 다른 절에서 아직 정의되지 않은 특정 용어들을 여기에서 정의한다.
본 명세서에서 사용된 용어 “하나” 및 “하나의”는 영문 명세서의 관사에 해당하며 본 명세서에서 하나 또는 하나 이상(즉, 최소한 하나)의 문법적 객체를 나타낸다. 예로써, “한 요소”는 하나의 요소 또는 하나 이상의 요소를 의미한다.
용어 “포함하는”은 본 명세서에서 “포함하나 이에 한정되지 않는”의 의미로 사용되며, 이들 용어들은 서로 교차적으로 사용된다.
용어 “또는”은 본 명세서에서 용어 “및/또는”의 의미로 사용되며, 다르게 명확하게 지정되지 않는 한 이들 용어들은 서로 교차적으로 사용된다.
용어 “와 같은”은 본 명세서에서 용어 “와 같은 그러나 이에 한정되지 않는”의 의미로 사용되며, 이들 용어들은 서로 교차적으로 사용된다.
“대사 경로”는 한 화합물을 다른 화합물로 변환하고 세포 기능을 위한 중간 단계와 에너지를 제공하는 일련의 효소 중재 반응들을 말한다. 이러한 대사 경로는 선형 또는 환형 또는 분지형일 수 있다.
“대사 상태”는 주어진 시점에서 건강 또는 질병 상태와 관련하여 다양한 화학적, 생물학적 지표에 의해 측정되는 특정한 세포, 다중 세포 또는 조직 환경의 분자의 내용물을 말한다.
“신생 혈관 생성” 이미 존재하는 혈관으로부터의 새로운 혈관의 성장을 포함하는 생리학적 과정을 말한다. 신생 혈관 생성의 최소한 혈관 내피의 세포의 증식, 일반적으로 화학요법 제제에 대한 반응으로서 혈관 내피의 세포의 이주, 일반적으로 기질 금속 단백질 분해 효소의 생성으로 인한 세포 외 기질의 퇴화, 기질 금속 단백질 분해 효소 생성, 관상 형성, 혈관 루멘 형성, 혈관 분출, 일반적으로 인테그린 발현인 접착 분자 발현, 및 분화를 포함한다. 배양 시스템(예를 들어, 일차원 대 삼차원) 및 세포 유형에 따라, 여러 측면의 신생 혈관 생성이 생체 내뿐만 아니라 생체 외에서 성장한 세포에서 관찰될 수 있다. 혈관 형성 세포 또는 혈관 형성 세포의 특성 중 최소한 하나의 특성을 보이는 세포는 위에서 설명한 특성 중 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 그 이상의 특성을 보인다. 신생 혈관 생성의 조절 인자는 위에서 설명한 특성 중 최소한 하나를 증가 또는 감소시킨다. 신생 혈관 생성은 혈관의 자생적 형성인 맥관 생성이나 기존의 혈관이 나뉘어져 새로운 혈관이 형성되는 세포의 영양분 삽입 성장(intussusception)을 나타내는 용어와는 다른 것이다.
용어 “미세 배열”은 종이, 나일론 또는 다른 유형의 막, 필터, 칩, 유리 슬라이드, 또는 기타 다른 적절한 고체 지지체와 같은 기질 상에서 합성된 별개의 폴리뉴클레오타이드, 올리고뉴클레오타이드, 폴리펩티드(예를 들어, 항체) 또는 펩티드의 배열을 말한다.
용어 “질환” 및 “질병”은 포괄적으로 사용되며 신체의 어떠한 부분, 기관 또는 체계(이들의 임의의 조합)가 정상적 구조 또는 기능으로부터 벗어나는 것을 말한다. 특정한 질병은 생물학적, 화학적 및 물리적 변화를 포함하는 특유한 증상 및 신호에 의해 발현되고, 때때로 다양한 다른 요소들과 관련되어 있으며, 이러한 요소들은 인구 통계학적, 환경적, 고용 관련, 유전학적 및 의학적 이력과 관련된 요소들을 포함하나 이에 한정되지는 않는다. 특정한 특유 신호, 증상, 및 관련 요소들이 진단적 정보를 생성하기 위해 다양한 방법으로 정량 측정될 수 있다.
용어 “발현”은 DNA와 같은 폴리뉴클레오타이드로부터 폴리펩티드가 생산되는 과정을 포함한다. 이 과정은 유전자의 mRNA로의 전사 및 이 mRNA의 폴리펩티드로의 번역을 포함할 수 있다. 용어가 사용되는 문맥에 따라, “발현”은 RNA, 단백질 또는 둘 모두의 생산을 말할 수 있다.
용어 “유전자의 발현 수준” 또는 “유전자 발현 수준”은 pre-mRNA 발생기의 전사체(들), 전사체 처리 중간체, 성숙한 mRNA(들) 및 퇴행 산물뿐만 아니라 mRNA의 수준, 또는 세포 내 유전자에 의해 부호화된 단백질의 수준을 말한다.
용어 “조절”은 반응의 상향 조절(즉, 활성화 또는 자극), 하향 조절(즉, 금지 또는 억제), 또는 이 둘의 조합 또는 각각을 말한다. “조절 인자”는 조절을 수행하는 화합물 또는 분자이며, 예를 들어, 작용 물질, 억제 물질, 활성 인자, 자극 인자, 억제 인자, 또는 금지 인자일 수 있다.
표현 “조절 인자에 대한 영향”은 조절 인자의 발현을 변화시키거나, 그 수준을 변화시키거나, 또는 그 활성을 변화시키는 것으로 이해된다.
본 명세서에서 사용되는 용어 “트롤라민”은 트롤라민 NF, 트리에탄올아민, TEAlan®, TEAlan 99%, 트리에탄올아민, 99%, 트리에탄올아민, NF 또는 트리에탄올아민, 99%, NF를 말한다. 이러한 용어들은 본 명세서에서 교차적으로 사용될 수 있다.
용어 “게놈”은 생물학적 객체(세포, 조직, 기관, 시스템, 기관계)의 유전학적 정보 전체를 말한다. 이는 DNA 또는 RNA(예를 들어, 특정 바이러스에서) 중 하나에서 부호화된다. 게놈은 유전자 및 DNA 부호화되지 않은 염기서열 모두를 포함한다.
용어 “단백질체”는 주어진 시점에 게놈, 세포, 조직, 또는 기관계에 의해 표현되는 단백질의 전체 집합을 말한다. 보다 특정적으로, 이는 주어진 시점에 정의된 조건 하에서 주어진 유형의 세포 또는 기관계에서 발현된 단백질의 전체 집합을 말할 수 있다. 단백질체는, 예를 들어, 유전자의 대체적 이어 맞추기 및/또는 (글리코실화 또는 인산화와 같은) 전사 후 변형으로 인한 단백질 이형체를 포함할 수 있다.
용어 “전사체”는 주어진 시점에 하나 또는 군집으로 된 세포로부터 생산된 mRNA, rRNA, tRNA, 마이크로 RNA, 다이서 기질 RNA, 및 기타 비 코딩 RNA를 포함하는 전사된 RNA 분자의 전체 집합을 말한다. 이 용어는 주어진 기관계 내의 전체 집합의 전사체에, 또는 특정한 세포 유형에 존재하는 특정한 전사체의 부분 집합에 적용될 수 있다. 주어진 세포 라인(변이는 제외)에 대략적으로 고정되어 있는 게놈과는 달리, 전사체는 외부 환경적 조건에 따라 변화할 수 있다. 이는 세포 내의 모든 mRNA 전사체를 포함하기 때문에, 전사체는 주어진 시점에 활성으로 발현되고 있는 유전자를 반영하나, 전사적 감쇄와 같은 mRNA 퇴화 현상은 제외한다.
전사체학의 연구는, 발현 프로파일링으로도 불리며, 주어진 세포 군집 내에서 mRNA의 발현 수준을 검사하며, 때로는 DNA 미세 배열 기술에 기반한 고성능 기술을 사용한다.
용어 “대사체”는 단일 기관계와 같은 생물학적 표본에서 주어진 시점에 주어진 조건 하에서 발견되는 (대사적 중간 물질, 호르몬 및 기타 신호 생성 분자, 및 2차 대사 물질과 같은) 소형 분자 대사 물질들의 완전한 집합을 말한다. 상기 대사체는 동적이며, 매 초마다 변화할 수 있다.
용어 “지질체”는 주어진 시점에 주어진 조건 하에서 단일 기관계와 같은 생물학적 표본 내에서 발견되는 지질들의 전체 집합을 말한다. 지질체는 동적이고, 매 초마다 변화할 수 있다.
용어 “상호 작용체”는 연구 중인 생물학적 시스템(예를 들어, 세포) 내의 분자의 상호 반응들의 전체 집합을 말한다. 이는 방향성을 가진 그래프로 보여 질 수 있다. 분자의 상호 반응은 다른 생화학적 그룹(단백질, 핵산, 지질, 탄수화물 등)에 속하는 분자들 사이에서, 또한 주어진 그룹 내부 에서 일어날 수 있다. 단백질체학의 관점에서 기술하면, 상호 작용체는 단백질-단백질 상호 반응 네트워크(PPI), 또는 단백질 상호 반응 네트워크(PIN)를 말한다. 광범위하게 연구된 또 하나의 유형의 상호 작용체는 단백질-DNA 상호작용체 (전사 요소(또한 DNA 또는 염색질 조절 단백질)에 의해 형성된 네트워크) 및 이들의 타겟 유전자이다.
용어 “세포의 출력”은 매개변수, 바람직하게는 세포 상태와 관련된 측정가능한 매개변수의 수집을 포함하며 다음을 포함한다(이에 한정되지는 않는다): (예를 들어, RT-PCR, qPCR, 미세 배열 등으로 측정 가능한) 하나 또는 그 이상의 유전자의 전사의 수준, (예를 들어, 질량 분광학 또는 서부 블롯에 의해 측정 가능한) 하나 또는 그 이상의 단백질에 대한 발현 수준, (예를 들어, 기질 변환률로서 측정 가능한) 하나 또는 그 이상의 효소 또는 단백질의 절대적 활성 또는 (예를 들어, 최대 활성에 대한 % 값으로 측정 가능한) 상대적 활성, 하나 또는 그 이상의 대사 물질 또는 중간 물질의 수준, (예를 들어, 산소 소모율 또는 OCR에 의해 측정 가능한) 산소 첨가 인산화의 수준, (예를 들어, 외부 세포 산화율 또는 ECAR에 의해 측정 가능한) 해당 과정의 수준, 리간드-타겟 결합 또는 상호 반응의 정도, 세포 외 분비 분자의 활성 등. 세포의 출력은 소정 개수의 타겟 유전자 또는 단백질 등에 대한 데이터를 포함할 수 있으며, 또는 모든 탐지 가능 유전자 또는 단백질에 대한 전역 평가를 포함할 수 있다. 예를 들어, 어떠한 특정한 단백질이 표본 또는 세포 군집 내에서 발현될지에 대한 사전 지식 없이 주어진 표본 또는 세포 군집 내에서 발현된 모든 탐지 가능 단백질을 식별하고, 또한/또는 정량화하기 위해 질량 분광학이 사용될 수 있다.
본 명세서에서 사용되는, “세포 시스템”은 균일하거나 불균일한 세포의 군집을 포함한다. 세포 시스템 내의 상기 세포는 자연적 또는 생리학적 환경 하에서 생체 내에서 성장하거나, 예를 들어, 제어된 조직 배양 환경과 같은 생체 외에서 성장하고 있을 수 있다. 시스템 내의 상기 세포는 상대적으로 균일하거나(예를 들어, 70%, 80%, 90%, 95%, 99%, 99.5%, 99.9% 이상으로 균일), 또는 보통 밀접한 근접성의 생체 내에서 성장하는 것으로 발견되는 세포 유형, 또는 예를 들어, 근거리 분비 또는 다른 먼 거리의 세포 간 통신을 통해 또 다른 생체 내 세포 유형과 반응할 수 있는 세포 유형과 갈은 둘 또는 그 이상의 세포 유형을 포함할 수 있다. 세포 시스템 내의 상기 세포는 암 세포 라인, 불멸의 세포 라인, 또는 정상 세포 라인을 포함하는 확립된 세포 라인으로부터 도출되거나 주된 세포 또는 살아 있는 조직 또는 기관으로부터 분리된 세포일 수 있다.
세포 시스템 내의 세포는 일반적으로 영양분, 기체(산소 또는 CO2 등), 화학제품, 또는 세포의 거동에 영향을 미치는 조건을 제공할 수 있는 단백질계 / 비단백질계 자극 물질을 제공할 수 있는 “세포 환경”과 접촉한다. 상기 세포 환경은 정의된 화학적 성분 및/또는 다소 잘 정의되지 않은 조직 추출물 또는 혈청 성분을 가지는 화학적 매체일 수 있으며, 세포가 성장하는 특정한 pH, CO2 내용물, 압력, 및 온도를 포함할 수 있다. 대체적 방법으로, 상기 세포 환경은 자연적이거나 또는 특정한 세포 시스템에 대해 생체 내에서 발견되는 생리학적 환경일 수 있다.
특정 실시예에서, 세포 환경은 생물학적 시스템 또는 과정의 한 측면, 예를 들어, 질병 상태, 과정, 또는 환경을 시뮬레이션하는 조건을 포함한다. 이러한 배양 조건들은, 예를 들어, 고혈당증, 저산소 상태, 또는 젖산 풍부 조건을 포함한다. 몇 개의 이러한 조건들이 본 명세서에서 기술된다.
특정 실시예에서, 특정한 세포 시스템에 대한 세포 환경은 또한 수용기의 유형 또는 세포 표면 상의 리간드 및 이들 각각의 활성, 탄수화물 또는 지질 분자의 특성, 막의 극성이나 흐름성, 특정 막 단백질의 뭉친 상태 등과 같은 세포 시스템의 특정한 세포 표면 특성을 포함한다. 이러한 세포 표면 특성들은 다른 세포 시스템에 속하는 세포와 같은 근접한 세포들의 기능에 영향을 줄 수 있다. 그러나, 다른 특정한 실시예에서, 상기 세포 시스템의 세포 환경은 세포 시스템의 세포 표면 특성을 포함하지 않는다.
상기 세포 환경은 “수정된 세포 환경”이 되도록 변경될 수 있다. 변경은 하나 또는 그 이상의 “외부 자극 성분”을 세포 환경에 추가하는 것을 포함하는 세포 환경에서 발견되는 하나 또는 그 이상의 성분에 있어서의 변화(예를 들어, 증가 또는 감소)를 포함할 수 있다. 상기 환경적 교란 또는 외부 자극 성분은 세포 환경에 내생적이거나(예를 들어, 상기 세포 환경이 일정 수준의 자극제를 포함하고, 그 이상의 자극제가 그 수준을 증가시키기 위해 첨가됨), 세포 환경에 외생적(예를 들어, 상기 자극제가 변경 이전의 세포 환경에 대체적 방법으로 존재하지 않음)일 수 있다. 상기 세포 환경은 외부 자극 성분을 추가함으로써 야기되는 2차적 변화에 의해 더 변경될 수 있으며, 이는 상기 외부 자극 성분이 세포 시스템에 의해 세포 환경으로 분비된 분자를 포함하여 세포 시스템의 세포의 출력을 변화시킬 수 있기 때문이다.
본 명세서에서 사용되는 “외부 자극 성분”은 본 명세서에서 “환경적 교란”으로도 불리며, 세포의 기능에 영향을 줄 수 있는 어떠한 외부의 물리적 및/또는 화학적 자극을 포함한다. 이는 어떠한 대형 또는 소형의 기관 관련 또는 기관 내의 분자, 자연적이거나 합성된 화학 물질, 온도의 전이, pH 변화, 복사, 빛(UVA, UVB 등), 마이크로 웨이브, 초음파, 전기 전류, 변경되거나 변경되지 않은 자기장 등을 포함할 수 있다.
용어 “MIM ( Multidimensional Intra Cellular Molecule: 다차원 세포 내 분자)”은 신체에 의해 자연적으로 생산되고 또한/또는 인간의 최소한 하나의 세포에 존재하는 내생 분자의 분리된 버전 또는 합성적으로 생산된 버전이다. MIM은 세포 내로 진입할 수 있으며, 상기 세포 내로의 진입은 분자의 생물학적으로 활성화된 부분이 세포 내로 완전히 들어가는 한, 완전하거나 부분적인 세포 내로의 진입을 포함한다. MIM는 세포 내에서 신호 형질 도입 및/또는 유전자 발현 메커니즘을 유도할 수 있다. MIM은 분자들이, 예를 들어, 약 전달과 같은 치료적 효과 및 담체 효과를 모두 가지므로 다차원적이다. MIM는 또한 분자들이 질병 상태에서는 특정 방식으로 정상적 상태에서는 이와 다른 방식으로 행동하므로 다차원적이다. 예를 들어, CoQ-10의 경우, VEGF의 존재 하에서 흑색종 세포에 대한 CoQ-10의 투여는 결과적으로 감소된 수준의 Bcl2를 야기하며, 이는 다시 흑색종 세포에 대한 감소된 종양 형성 가능성을 야기한다. 반면에, 정상적인 섬유아세포에서는, CoQ-10 및 VEFG의 보조 투여가 Bcl2의 수준에 영향을 미치지 않는다.
일 실시예에서, MIM은 또한 에피시프터이며, 또 다른 실시예에서, MIM은 에피시프터가 아니다. 또 다른 실시예에서, MIM은 하나 또는 그 이상의 상기 기술한 기능으로 특징지워진다. 또 다른 실시예에서, MIM은 둘 또는 그 이상의 상기 기술한 기능으로 특징지워진다. 추가적인 실시예에서, MIM은 셋 또는 그 이상의 상기 기술한 기능으로 특징지워진다. 추가적인 또 다른 실시예에서, MIM은 상기 기술한 기능 모두로 특징지워진다. 해당 분야의 통상의 기술자는 본 발명의 MIM이 둘 또는 그 이상의 내생 분자의 혼합물을 포함하는 것으로 의도되었다는 것을 인식할 수 있을 것이며, 이때 상기 혼합물은 하나 또는 그 이상의 상기 기술한 기능으로 특징지워진다. 혼합물 내의 상기 내생 분자는 혼합물이 MIM으로서 기능할 수 있는 비율로 존재한다.
MIM은 지질 기반 또는 비지질 기반 분자일 수 있다. MIM의 예는 CoQ10, 아세틸 Co-A, 팔미틸 Co-A, L-카르니틴, 예를 들어, 타이로신, 페닐알라닌 및 시스테인과 같은 아미노산을 포함하나 이에 한정되지는 않는다. 일 실시예에서, 상기 MIM은 소형 분자이다. 본 발명의 일 실시예에서, 상기 MIM은 CoQ10가 아니다. MIM은 본 명세서에서 상세히 기술된 분석 방법을 사용하여 해당 분야의 통상의 기술자에 의해 통상적으로 식별될 수 있다. MIM은 미국 특허 12/777,902 (US 2011-0110914)에서 보다 상세히 기술되며, 그 전체 내용은 본 명세서에 참조로써 명시적으로 통합된다.
본 명세서에서 사용되는, “에피메타볼릭 시프터(에피대사적 시프터)” (에피시프터: epi-shifter)는 건강한(또는 정상의) 상태로부터 질병 상태로의 대사 전이 및 그 반대의 전이를 조절함으로써 이에 의해 인간에서의 세포, 조직, 기관, 시스템 및/또는 숙주의 건강을 유지하거나 재확립하는 분자이다. 에피시프터는 조직의 마이크로환경 내에서 정규화를 촉발시킬 수 있다. 예를 들어, 에피시프터는 세포에 첨가되거나 이로부터 고갈되었을 때 세포의 마이크로환경(예를 들어, 대사 상태)에 영향을 줄 수 있는 모든 분자를 포함한다. 해당 분야의 통상의 기술자는 본 발명의 에피시프터가 둘 또는 그 이상의 분자의 혼합물도 또한 포함하도록 의도된 것임을 인식할 수 있을 것이며, 이때 상기 혼합물은 상기 기술한 기능들 중 하나 또는 그 이상으로 특징지워진다. 상기 혼합물 내의 분자들은 혼합물이 에피시프터로 기능하도록 하는 비율로 존재한다. 에피시프터의 예는 CoQ-10; 비타민 D3; 피브로넥틴과 같은 ECM 성분; TNFa 또는 어떠한 인터루킨, 예를 들어, IL-5, IL-12, IL-23와 같은 면역조절 인자; 혈관 형성 요소; 및 세포 사멸 요소를 포함하나 이에 한정되지는 않는다.
일 실시예에서, 상기 에피시프터는 또한 MIM이다. 일 실시예에서, 상기 에피시프터는 CoQ10가 아니다. 에피시프터는 본 명세서에 상세하게 기술된 분석을 사용하여 해당 분야에서의 기술들 중 하나로써 통상적으로 식별될 수 있다. 에피시프터는 미국 특허 12/777,902(US 2011-0110914)에 보다 상세하게 설명되며, 그 전체 내용은 참조로써 본 명세서에 명시적으로 통합된다.
각 용어가 나타나는 시점의 적용에 있어서 정의되지 않은 용어들은 해당 분야의 통상의 전문가들이 보통 이해하는 의미를 가진다.
III
. 본 플랫폼 기술의 예시적 단계 및 구성 요소
단지 예시의 목적으로, 본 발명의 플랫폼 기술의 다음 단계들이 암 모델로부터 획득된 데이터를 통합하기 위해, 또한 암의 발병을 추진하는 신규의 단백질 / 경로를 식별하기 위해 사용되는 예시적 활용으로서 이하의 본 명세서에서 기술될 수 있다. 이러한 분석의 결과로 얻어지는 관계적 맵은 암과 관련된 진단적 / 예후적 표지 인자뿐만 아니라 암 치료 타겟을 제공한다. 그러나, 본 플랫폼 기술은 어떠한 생물학적 시스템 또는 과정에도 일반적으로 적용될 수 있으며, 및 특정한 암 또는 기타 특정 질병 모델에 한정되지 않는다.
추가적으로, 하기의 설명이 일 부분에서는 비연속적인 단계로 기술되기는 하지만, 이는 예시적 목적 및 단순성을 위한 것이며, 따라서 실제로는 순서 및/또는 단계간의 구분을 그렇게 엄격히 규정하는 것은 아니다. 또한, 본 발명의 단계들은 분리되어 수행될 수 있으며, 본 명세서에서 제공되는 발명은 본 발명의 플랫폼 기술의 개별적 단계들을 하나 또는 그 이상(예를 들어, 어느 하나, 둘, 셋, 넷, 다섯, 여섯 또는 일곱 개의 모든 단계)의 단계들의 조합뿐만 아니라 이들을 각각 분리하여 포함하기 위한 것이며, 상기 단계들은 남아 있는 단계들에 관계없이 독립적으로 수행될 수 있다.
본 발명은 또한 본 발명의 플랫폼 기술이 모든 측면을 별개의 성분들과 및 본 발명의 실시예로서 포함하도록 의도된 것이다. 예를 들어, 상기 생성된 데이터 집합들은 본 발명의 실시예로서 의도된 것이다. 추가적인 예로서, 상기 생성된 인과 관계 네트워크, 생성된 합치 인과 관계 네트워크, 및/또는 생성된 모의 인과 관계 네트워크 또한 본 발명의 실시예로서 의도된 것이다. 생물학적 시스템에서 특유한 것으로 식별된 상기 인과 관계는 본 발명의 실시예로서 의도된 것이다. 또한, 특정한 생물학적 시스템에 대한 상기 필요에 따라 구축된 모델 또한 본 발명의 실시예로서 의도된 것이다. 예를 들어, 질병 상태 또는 과정에 대한 필요에 따라 구축된 모델, 예를 들어, 신생 혈관 생성에 대한 모델, 암, 비만/당뇨/심장병에 대한 세포 모델, 또는 약제의 독성 (예를 들어, 심장 독성)에 대한 필요에 따라 구축된 모델과 같은 필요에 따라 구축된 모델 또한 본 발명의 실시예로서 의도된 것이다.
A.
필요에 따른
모델(custom model) 구축
본 플랫폼 기술의 제 1 단계는 생물학적 시스템 또는 과정에 대한 모델을 수립하는 것이다.
1. 신생 혈관 생성 모델
신생 혈관 생성의 생체 외 및 생체 내 모델 모두가 알려져 있다. 예를 들어, 인간 배꼽의 제대혈관 내피 세포(HUVEC)를 사용하는 생체 외 모델이 예에서 상세히 기술된다. 간단하게 설명하면, HUVEC가 하위-융합성 배양에서 성장하면, 이는 혈관 형성 세포의 특성을 보인다. HUVEC가 융합성 배양에서 성장하면, 이는 혈관 형성 세포의 특성을 보이지 않는다. 내피의 세포 증식, 이주 및 분화를 포함하는 혈관 형성 캐스케이드에서의 대부분의 단계는 생체 외에서 분석될 수 있다. 증식 연구는 세포 계수, 티미딘 통합, 또는 세포 증식을 위한(PCNA 의 측정에 의한) 면역 조직화학 검사 염색 또는 (단말 디옥시뉴클레이타이딜 전달 효소-중재 dUTP 닉 말단 라벨링 또는 투넬(Tunel) 분석에 의한) 세포 사멸에 기반한 것이다. 주화성은 막 필터로 구분되는 상부 및 하부 웰로 구성되는 보이든(Boyden) 챔버 내에서 검사될 수 있다. 화학 주화성 용액은 하부 웰에 위치하고, 세포는 상부 웰에 추가되며, 배양 기간 후에 화학 주화성 자극 쪽으로 이주해 온 세포가 막의 하부 표면에서 계수된다. 세포 이주는 하기 예에서 제공되는 “스크래치(scratch)” 분석을 사용하여서도 연구될 수 있다. 분화는 이차원 및 삼차원 응결, 콜라겐 겔 및 마트리겔을 포함하는 서로 다른 ECM 성분의 내피의 세포를 배양함으로써 생체 외 유도가 가능하다. 미세 혈관 또한 3차원 피브린 겔 내에 삽입된 생쥐 대동맥의 링으로부터 성장한 것으로 밝혀 졌다. 매트릭스 금속 단백질 분해효소 발현은 지모겐 분석에 의해 분석될 수 있다.
망막의 맥관 구조는 생쥐가 탄생할 때 완전히 형성되지 않는다. 혈관 성장 및 신생 혈관 생성의 이 모델에서 상세히 연구되어 왔다. 단계적 상태의 망막이 정상적 생물학적 과정으로서의 신생 혈관 생성을 분석하기 위해 사용될 수 있다.
병아리 융모 요막(CAM) 측정은 해당 분야에서 잘 알려져 있다. 초기의 병아리 배아는 성숙한 면역 시스템이 결여되어 있으며, 따라서 종양 유도 신생 혈관 생성 연구를 위해 사용된다. 조직 그라프트는 달걀 껍질에 만들어진 창을 통해 CAM 상에 위치한다. 이는 구현 후 4일 내에 혈관의 그라프트 쪽으로의 전형적인 반지름 방향의 재배치와 그라프트 근처 혈관의 분명한 증가를 야기하였다. 그라프트로 들어가는 혈관들은 스테레오 현미경 하에서 계수된다. 시험 물질의 항-혈관 형성 또는 혈관 형성 활성을 분석하기 위해, 상기 화합물은 느리게 생성되는 중합체 펠릿에서 생성되어 젤라틴 스폰지로 흡수되거나, 또는 플라스틱 디스크 상에서 공기로 건조된 후 CAM 상에 심어 진다. 페트리 접시 내의 껍질 없는 배아의 배양을 포함하는 CAM 분석의 다양한 이형, 및 서로 다른 정량화 방법들(즉 방사능으로 라벨링된 프롤린을 사용한 기반 막의 생체합성 비율 측정, 현미경 또는 영상 분석 하의 혈관의 개수 세기)이 기술되었다.
각막은 생체 내 혈관 현장을 제공한다. 따라서, 연곽으로부터 각막 지질로 통과하는 혈관은 새로이 형성된 것으로 식별될 수 있다. 혈관 형성 반응을 유도하기 위해, 혈관 형성 물질(즉 VEGF의 FGF-2)을 포함하는 느린 분비의 중합체 펠릿[즉 폴리-2-하이드록시에틸-메타크릴레이트(하이드론) 또는 에틸에네비닐 아세테이트 공중합체(ELVAX)]이 쥐의 각막 지질 내에 생성된 "주머니"에 이식되었다. 또한, 광범위한 조직, 세포, 세포 추출물 및 조건을 겪은 매체가 각막 내에서 이들의 신생 혈관 생성의 효과에 대해 조사되었다. 혈관 반응 각막에 인디아 잉크를 관류시킨 이후 컴퓨터 영상 분석에 의해 정량 측정될 수 있다. 각막은 수확되어 본 명세서에서 제공된 플랫폼 방법을 이용하여 분석될 수 있다.
마트리겔(MATRIGEL®)은 엥겔브레스-홀름-스왐(Engelbreth-Holm-Swarm) 쥐과 동물 육종으로 알려진 생쥐의 기반 막 종양 기질이다. 이는 라미닌, 콜라겐 유형 IV, 헤파란 황화물, 피브린 및 성장 요소를 포함하는 기반 막 단백질의 복잡한 혼합물이며, EGF, TGF-b, PDGF 및 IGF-1을 포함한다. 이는 원래 내피의 생체 외 세포 분화를 연구하기 위해 개발되었다. 그러나, 마트리겔(MATRIGEL®)-함유 FGF-2는 생쥐의 피하에 주입될 수 있다. 마트리겔(MATRIGEL®)은 4°C에서 액화되지만 37°C에서 고체 겔을 형성하여 성장 요소를 포획함으로써 분비가 서서히 일어나게 한다. 일반적으로 10일 후에, 이 마트리겔(MATRIGEL®) 플러그가 제거되며 신생 혈관 생성이 플러그 부분에서 조직학적으로 또는 형태측정세포학적으로 정량화된다. 마트리겔(MATRIGEL®) 플러그는 본 명세서에서 제공된 플랫폼 방법을 사용하여 수확되고 분석될 수 있다.
2. 생체 외 질병 모델
생물학적 시스템 또는 과정의 일례로 암을 들 수 있다. 다른 복잡한 생물학적 과정 또는 시스템과 마찬가지로, 암은 다중의 특유 측면으로 특징지울 수 있는 복잡한 병리학적 조건을 가지고 있다. 예를 들어, 높은 성장 속도로 인해, 많은 암 세포들이 저산소 조건에서도 성장할 수 있도록 적응되며, 상향 조절된 해당 과정 및 감축된 산화적 인산화 대사 경로를 가진다. 결과적으로, 암 세포는 잠재적 약제의 의한 치료와 같은 환경적 교란에 대해, 정상 세포가 동일한 치료에 대한 반응과 비교하여 다르게 반응할 수 있다. 따라서, 정상 세포의 반응과 비교하여 약 치료에 대한 암의 독특한 반응을 판독하는 것이 관심의 대상이 될 것이다. 이러한 목적을 위해, 암 세포의 환경, 예를 들어, 생체 내 종양 내의 암 세포의 조건을 매우 근사하게 나타내는 세포 배양 조건을 생성함으로써 환경조건을 시뮬레이션하거나, 암 세포의 다른 성장 조건을 분리함으로써 암 성장의 여러 측면을 모방하는 주문형 암 모델이 수립될 수 있다.
이러한 암 “환경”, 또는 성장 스트레스 조건 중 하나는 고형 종양 내에서 일반적으로 발견되는 저산소 상태이다. 저산소 상태는 해당 분야에 알려진 방법을 세포 내에서 사용하여 세포 내에서 유도될 수 있다. 예를 들어, 저산소 상태는 세포 시스템을 5% CO2, 2% O2 및 93% 질소를 함유하는 산업 기체 혼합물로 흘러 넘치게 할 수 있는 모듈라 배양기 챔버(MIC-101, Billups-Rothenberg Inc. Del Mar, CA)내에 위치시킴으로써 유도될 수 있다. 소정의 기간 후, 예를 들어, 저산소 상태 처리 후 24시간 후에, 추가적인 외부 자극 성분들(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 부 존재 하에서 효과를 측정할 수 있다.
마찬가지로, 세포의 젖산 치료는 종양 환경 생체 내에 존재하는 방식의 해당 과정 활성이 높은 세포 환경을 모방한다. 젖산 유도 스트레스는 소정의 시간, 예를 들어, 24 시간에서 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 비 존재 하에서 약 12.5 mM의 최종 젖산 농도로 조사될 수 있다.
고혈당증은 보통 당뇨에서 발견되는 조건이다; 그러나, 많은 암 세포들이 자신들의 주된 에너지 원으로서 글루코스에 의존하기 때문에 고혈당증은 어느 정도 암 성장의 일 측면을 모방한다. 대상 세포를 일반적인 고혈당 조건에 노출시키는 것은 매체 내 글루코스의 최종 농도가 약 22 mM가 되도록 10% 배양 등급의 글루코스를 적절한 매체에 첨가하는 것을 포함할 수 있다.
암 성장의 다른 측면을 반영하는 개별적 조건들이 필요에 따라 구축된 암 모델에서 별도로 조사되고 또한/또는 함께 조합될 수 있다. 일 실시예에서, 암 성장 / 조건의 서로 다른 측면들을 반영하거나 모의하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 암 모델에서 조사된다. 일 실시예에서, 개별적 조건 및, 추가적으로, 암 성장 / 조건의 서로 다른 측면들을 반영하거나 모의하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 암 모델에서 조사된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 1과 20 사이, 1과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이, 또는 10과 50 사이의 서로 다른 조건들일 수 있다.
세포를 처리하기 위해 사용될 수 있는 조건들의 몇 개의 예시적 조합들이 여기에 열거된다. 수행되는 특정한 조사적 생물학적 평가에 따라 다른 조합들이 형성될 수 있다.
1. 매체만 존재
2. 50 μM CTL 코엔자임 Q10 (CoQ10)
3. 100 μM CTL 코엔자임 Q10
4. 12.5 mM 젖산
5. 12.5 mM 젖산 + 50 μM CTL 코엔자임 Q10
6. 12.5 mM 젖산 + 100 μM CTL 코엔자임 Q10
7. 저산소 상태
8. 저산소 상태 + 50 μM CTL 코엔자임 Q10
9. 저산소 상태 + 100 μM CTL 코엔자임 Q10
10. 저산소 상태 + 12.5 mM 젖산
11. 저산소 상태 + 12.5 mM 젖산 + 50 μM CTL 코엔자임 Q10
12. 저산소 상태 + 12.5 mM 젖산 + 100 μM CTL 코엔자임 Q10
13. 매체 + 22 mM 글루코스
14. 50 μM CTL 코엔자임 Q10 + 22 mM 글루코스
15. 100 μM CTL 코엔자임 Q10 + 22 mM 글루코스
16. 12.5 mM 젖산 + 22 mM 글루코스
17. 12.5 mM 젖산 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10
18. 12.5 mM 젖산 + 22 mM 글루코스 +100 μM CTL 코엔자임 Q10
19. 저산소 상태 + 22 mM 글루코스
20. 저산소 상태 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10
21. 저산소 상태 + 22 mM 글루코스 + 100 μM CTL 코엔자임 Q10
22. 저산소 상태 +12.5 mM 젖산 + 22 mM 글루코스
23. 저산소 상태 +12.5 mM 젖산 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10
24. 저산소 상태 + 12.5 mM 젖산 + 22 mM 글루코스 +100 μM CTL 코엔자임 Q10
하나 또는 그 이상의 정상 세포 라인(예를 들어, THLE2 및 HDFa)이 제어로서 단백질 또는 경로(이하 참조)에 고유한 암을 식별하기 위해 비슷한 조건에서 배양된다. 상기 제어는 상기 기술된 비교 세포 모델일 수 있다.
단일 암 세포 유형과는 반대로, 같거나 다른 근원의 다중 암 세포들(예를 들어, 암 라인 PaCa2, HepG2, PC3 및 MCF7)이 암 모델에 포함될 수 있다. 특정한 상황에서 서로 다른 암 세포들(예를 들어, HepG2 및 PaCa2) 사이의 상호 대화 또는 ECS 실험이 다양한 상호 관련된 목적을 위해 수행될 수 있다.
상호 대화를 포함하는 일부 실시예에서, 상기 세포 모델에 수행된 실험은 정의된 치료 조건(예를 들어, 고혈당증, 저산소 상태(국소 빈혈)) 하에서 세포 상태 또는 하나의 세포 시스템 또는 군집(예를 들어, 간 암종 세포 HepG2)의 기능에 대한 또 다른 세포 시스템 또는 군집(예를 들어, 췌장 관련 암 PaCa2)에 의한 조절을 결정하도록 설계된다. 전형적인 설정에 따르면, 제 1 세포 시스템 / 군집은 후보 분자(예를 들어, 소형 약제 분자, 단백질) 또는 후보 조건 (예를 들어, 저산소 상태, 고글루코스 환경)와 같은 외부 자극 성분에 접촉된다. 반응에서, 제 1 세포 시스템 / 군집 변화는 그 전사체, 단백질체, 대사체, 및/또는 상호 작용체로서, 세포의 내부 및 외부에서 쉽게 탐지될 수 있는 변화에 이르게 한다. 예를 들어, 전사체에서의 변화는 다수의 타겟 mRNA에서의 전사 수준에 의해 측정될 수 있다; 단백질체에서의 변화는 다수의 타겟 단백질의 발현 수준에 의해 측정될 수 있다; 또한 대사체 내 변화는 특히 주어진 대사 물질에 대해 설계된 분석을 통한 다수의 타겟 대사 물질의 수준에 의해 측정될 수 있다. 대체적 방법으로, 대사체 및/또는 단백질체에서의 상기 기준 변화는, 최소한 특정 분비 대사 물질 또는 단백질에 대해서는, 전사체, 단백질체, 대사체, 및 제 2 세포 시스템 / 군집의 상호작용체의 조절을 포함하는 제 2 세포 시스템 / 군집에 대한 이들의 영향에 의해 측정될 수 있다. 따라서, 상기 실험들은 서로 다른 치료 조건 하에서 제 2 세포 시스템 / 군집에 제 1 세포 시스템 / 군집에 의해 분비된 관심있는 분자(들)의 영향을 식별하기 위해 사용될 수 있다. 상기 실험들은 또한 예를 들어, 단백질체학의 분별 선별에 의해 제 1 세포 시스템 (외부 자극 성분 치료에 대한 반응으로)에서 또 다른 세포 시스템으로의 신호 전달의 결과로 조절되는 어떠한 단백질을 식별하기 위해 사용될 수 있다. 동일한 실험적 설정이 제 2 세포 시스템들 사이의 상호 효과 또한 분석될 수 있도록 역 설정에 대해서도 적응될 수 있다. 일반적으로, 이러한 유형의 실험에 대해, 세포 라인 쌍의 선택은 근원, 질병 상태 및 세포 기능 등과 같은 요소에 크게 기반한다.
2-세포 시스템이 일반적으로 이러한 유형의 실험적 설정에 관련되기는 하지만, 예를 들어, 각각의 별개의 세포 시스템을 별도의 고형 지지체에 고정시킴으로써 유사한 실험들이 둘 이상의 세포 시스템에 대해서도 설계될 수 있다.
일단 필요에 따른 모델이 구축되면, 환자에서 환자로의 유전학적 변이, 또는 특정 약제 또는 사전 약제로 치료되거나 치료되지 않은 것과 같은 하나 또는 그 이상의 “교란”이 시스템에 적용될 수 있다. 이에 대해서는 도 15D을 참조한다. 질병 관련 암 세포 및 질병 관련 정상 제어 세포에 대한 영향을 포함하여 이러한 교란이 시스템에 미치는 영향은 이하 제 III.B절에 기술된 해당 분야에서 알려진 다양한 방법 또는 특정 시행자의 수단을 사용하여 측정될 수 있다.
예시적 실험에서, 암 라인 PaCa2, HepG2, PC3 과 MCF7, 및 정상 세포 라인 THLE2과 HDFa는 각 고혈당증, 저산소 상태, 및 젖산 풍부 조건과 함께 이들 조건들 모두 또는 둘 또는 셋으로 조합된 조건을 겪게 되며, 이와 함께 환경적 교란, 특히 코엔자임 Q10에 의한 치료가 추가되거나 추가되지 않을 수 있다.
상기 필요에 따라 구축된 세포 모델은 본 명세서에서 기술된 단계들을 수행함으로써, 본 발명의 플랫폼 기술의 단계들에 걸쳐서 생물학적 시스템에 고유한 인과 관계를 궁극적으로 식별하기 위해 확립되어 사용될 수 있다. 그러나, 해당 분야의 통상의 기술자는 생물학적 과정에 대해 초기의, “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 사용된 필요에 따라 구축된 세포 모델이, 예를 들어, 추가적인 암 또는 정상 세포 라인 및/또는 추가적인 암 조건을 도입함으로써 시간이 지남에 따라 지속적으로 진화 또는 확장될 수 있음을 이해할 것이다. 진화된 세포 모델로부터의 추가적인 데이터, 즉, 세포 모델의 새롭게 추가된 부분(들)로부터의 데이터가 수집될 수 있다. 확장되거나 진화된 세포 모델로부터 수집된 상기 새로운 데이터, 즉, 새롭게 추가된 부분(들)로부터의 세포 모델이 이후 이전에 보다 견고한 “제 2 세대” 합치 인과 관계 네트워크를 생성하기 위해, "제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 사용된 데이터 집합에 도입될 수 있다. 생물학적 시스템에 고유한 새로운 인과 관계는 이제 “제 2 세대” 합치 인과 관계 네트워크로부터 식별될 수 있다. 이러한 방식으로, 상기 세포 모델의 진화는 합치 인과 관계 네트워크의 진화를 제공하며, 이에 의해 새롭고 또한/또는 보다 신뢰성있는 생물학적 시스템의 조절 인자에 대한 통찰을 제공한다.
필요에 따라 구축된 세포 모델의 추가적 예들이 본 명세서에서 상세히 설명된다.
B.
데이터 수집
일반적으로, 두 가지 유형의 데이터가 특정 필요에 따라 구축된 모델 시스템으로부터 수집될 수 있다. 이러한 데이터의 한 유형(예를 들어, 제 1 데이터 집합, 제 3 데이터 집합)은 보통 DNA, RNA, 단백질, 지질 등과 같은 특정 마크로 분자의 수준에 관련된다. 이러한 범주의 예시적 데이터 집합은 단백질체의 데이터(예를 들어, 표본으로부터의 모든 또는 실질적으로 모든 측정 가능한 단백질의 발현에 관련된 정성적 및 정량적 데이터)이다. 다른 유형의 데이터는 일반적으로 제 1 유형의 데이터에서의 변화의 결과로 나타나는 표현형 변화를 반영하는 기능적 데이터(예를 들어, 제 2 데이터 집합, 제 4 데이터 집합)이다.
일부 실시예에서, 제 1 유형의 데이터에 대해 정량적 중합효소 연쇄 반응(qPCR) 및 단백질체학이 정량적 중합효소 연쇄 반응(qPCR) 및 단백질체학에 의한 세포 mRNA 및 단백질 발현에서의 변화를 프로파일링하기 위해 수행된다. 전체 RNA는 상용의 RNA 분리 키트를 사용하여 분리될 수 있다. cDNA 합성에 뒤이어, 상용으로 사용 가능한 신생 혈관 생성, 세포 자살, 및 당뇨와 같은 질병 영역 또는 세포 과정에 대한 특정한 qPCR 배열(예를 들어, SA 바이오사이언스로부터의 제품), 이 제조사의 사용 지침에 따라 유전자의 사전 정의된 집합을 프로파일링하기 위해 채택될 수 있다. 예를 들어, Biorad cfx-384 증폭 시스템이 모든 전사 관련 프로파일링 실험에 사용될 수 있다. 데이터 수집(Ct)에 뒤이어, 최종 배수 변화에 걸친 제어가 제조사의 프로토콜에서 설명된 δCt 방법을 사용하여 결정될 수 있다. 단백질체의 표본 분석은 이후의 절에서 설명된 대로 수행될 수 있다.
대상 방법은 유사한 성격의 수 백 개의 표본을 가지는 대규모의 고 출력 성능의 정량적 단백질체의 분석을 채용할 수 있으며, 및 세포의 출력 분별을 식별하기 위해 필요한 데이터를 제공한다.
이러한 목적으로 사용하기에 적절한 몇 개의 기술들이 해당 분야에 알려져 있다. 예시적 기술로서, 질량 분광학과 조합된 iTRAQ 분석이 아래에서 간단히 소개된다.
정량적 단백질체학 접근 방식은 펩티드 식별 및 정량화를 위해 8-plex iTRAQ 반응 제제 및 2D-LC MALDI MS/MS를 사용한 안정된 동위원소 라벨링에 기반한다. 이러한 기술을 사용한 정량화는 상대적이다: 펩티드 및 단백질은 기준 표본에 대한 상대적 존재 비율로서 지정된다. 다중 iTRAQ 실험에서의 통상의 기준 표본들이 다중의 iTRAQ 실험에 걸쳐 표본의 비교를 용이하게 해 준다.
예를 들어, 이 분석 방법 체계를 구현하기 위해, 여섯 개의 주요 표본 및 두 개의 제어 풀 표본이 제조사의 제안에 따라 하나의 8-plex iTRAQ 혼합물로 결합될 수 있다. 이러한 여덟 개 표본의 혼합물은 다시 일차원에서의 강한 양이온 교환 (SCX), 및 이차원에서의 역위상 HPLC로 구성되는 이차원 액체 크로마토그래피로 분리될 수 있으며, 질량 분광학적 분석으로 분석될 수 있다.
채택 가능한 예시적 실험실 과정에 대한 간단한 검토가 본 명세서에서 제공된다.
단백질 추출: 세포는 프로테아제를 금지 인자로 하여 8 M 요소 용균 버퍼에 용해되어(서모 사이언티픽 홀트(Thermo Scientific Halt) 프로테아제 금지 인자, EDTA 없음) 얼음 위에서 매 10 분 마다 5초간의 버텍스로서 30 분 간 배양할 수 있다. 5 초 단위로 초음파 처리하여 용균을 완수할 수 있다. 세포 용해물은 세포 조각을 제거하기 위해 14000 x g에서 15분 간(4 °C) 원심 분리될 수 있다. 단백질 농도를 결정하기 위해 브래폴드(Bradford) 분석이 수행될 수 있다. 각 표본으로부터의 100ug 단백질이 환원(10mM Di티오트레이톨 (DTT), 55 °C, 1 시간), 알킬화(25 mM 이오도 아세타마이드, 실온, 30 분)되고 트립신으로 소화될 수 있다(1:25 w/w, 200 mM 트리에틸암모늄 탄산수소염 (TEAB), 37 °C, 16시간).
세크리톰 표본 준비: 1) 일 실시예에서, 상기 세포는 혈청이 없는 매체에서 배양될 수 있다: 조건을 겪은 매체는 냉동 건조기에 의해 농축되고, 환원되며(10mM 디티오트레이톨 (DTT), 55 °C, 1 시간), 알킬레이트화되고(25 mM 이오도 아세타마이드, 실온, 30분 간 배양), 이후 아세톤 침전에 의해 제염된다. 농축되어 조건을 겪은 매체로부터의 동일한 양의 단백질이 트립신 (1:25 w/w, 200 mM 트리에틸암모늄 탄산수소염(TEAB), 37 °C, 16시간)으로 소화될 수 있다.
일 실시예에서, 상기 세포는 혈청을 포함하는 매체에서 배양될 수 있다: 매체의 부피는 3k MWCO Vivaspin 기둥(GE 헨스케어 라이프(Healthcare Life) 사이언스)을 사용하여 감소시킬 수 있고, 이후 1xPBS(인비트로젠)로서 재구성될 수 있다. 혈청 알부민은 조건 매체를 최적화하여 적용시키기 위해 버퍼-교환과 더불어 제조사의 지침에 따라 알부보이드(AlbuVoid) 기둥(Biotech Support Group, LLC)을 사용하여 모든 표본으로부터 고갈시킬 수 있다.
iTRAQ 8 Plex 라벨링 : 실험적 설정에서 각각의 트립신 소화로부터의 부분 표본은 함께 모아 제어 표본의 풀을 형성할 수 있다. 각 표본 및 제어 표본들의 풀로부터의 동등한 부분 표본들은 iTRAQ 8 Plex 반응 제제에 의해 제조사의 프로토콜(AB Sciex)에 따라 라벨링될 수 있다. 상기 반응은 결합되어, 진공으로 건조되고, 0.1% 포름산을 첨가하여 다시 현탁한 후, LC-MS/MS에 의해 분석될 수 있다.
2D- NanoLC - MS / MS : 라벨링된 모든 펩티드 혼합물들은 온라인 2D-나노 LC에 의해 분리되고 전극 분사 탠덤 질량 분광학으로 분석될 수 있다. 상기 실험은 나노 전기 분광 이온 소스를 장착한 LTQ 오비트랩 벨로스(오비트랩 벨로스(Velos)) 질량 분광계(Thermo Electron, Bremen, 독일)에 연결된 엑시겐트(Eksigent) 2D NanoLC 울트라 시스템 상에서 수행될 수 있다.
상기 펩티드 혼합물은 4 μL / min의 흐름으로 5 cm SCX 기둥(PolyLC, 콜롬비아, MD 제 300μm ID, 5μm, 폴리설포에틸 아스타르트마이드 기둥)으로 주입되어 10 이온 교환 용출 세그먼트에서 C18 트랩 기둥(메서추세츠, 워본 뉴오브젝티브(New Objective) 사의 2.5 cm, 100μm ID, 5μm, 300 A ProteoPep II)으로 녹여서 분리되고 H2O/0.1%FA로 5분 간 세척될 수 있다. 이러한 분리는 이후 15 cm 용융 실리카 기둥(메서추세츠, 워본 뉴오브젝티브 사의75μm ID, 5μm, 300 A ProteoPep II)에 대해 300 nL/min에서 2-45% B (H2O /0.1%FA (용매 A) 및 ACN /0.1%FA (용매 B))의 기울기를 사용하여 120분 간 더 수행될 수 있다.
완전 주사 MS 스펙트럼(m/z 300-2000)이 오비트랩 내에서 30,000의 해상도로 획득될 수 있다. 가장 강렬한 이온(10에 이름)이 고 에너지 C-트랩 분리(HCD)를 사용하여 연속적으로 분리될 수 있으며 30 초 간 동적으로 배제될 수 있다. HCD는 1.2 Da의 분리 폭으로 수행될 수 있다. 결과적으로 나타나는 파편 이온은 오비트랩 내에서 7500의 해상도로 주사될 수 있다. LTQ 오비트랩 벨로스(Velos)는 파운데이션 1.0.1의 엑스칼리버(Xcalibur) 2.1에 의해 제어될 수 있다.
펩티드/단백질 식별 및 정량화: 펩티드 및 단백질은 스위스프로트(SwissProt) 데이터베이스에 대해 마스코트 탐색 엔진을 탑재한 단백질체 발견용 소프트웨어(Thermo Electron)를 사용하는 자동화된 데이터베이스 탐색에 의해 식별될 수 있다. 탐색 매개변수는 MS 허용치에 대해 10 ppm, MS2 허용치에 대해 0.02 Da, 및 2개까지의 분할 손실을 허용하는 완전한 트립신 소화를 포함할 수 있다. 카르바미도메틸화(C)가 고정된 조절로서 설정될 수 있다. 산화(M), TMT6, 및 탈아미드화(NQ)가 동적 조절로서 설정될 수 있다. 펩티드 및 단백질 식별은 마스코트 상당 임계(p<0.05)로써 필터링될 수 있다. 상기 필터는 99%의 단백질 식별 신뢰 수준(1% FDA)으로 허용될 수 있다.
단백질체 발견 소프트웨어는 보고자 이온에 대한 보정 요소를 적용할 수 있으며, 모든 정량 측정 채널이 존재하지 않는 경우에는 모든 정량 측정값을 거부할 수 있다. 상대적 단백질 정량 측정은 중간 강도의 정규화를 통해 성취할 수 있다.
제 2 유형의 데이터에 대해, 일부 예시적 실시예에서, 암 및 정상 모델의 생명 에너지론적 프로파일링은 해당 과정 및 산소 첨가 인산화 성분의 이해를 가능하도록 하기 위해 시호스(Seahorse™) XF24 분석기를 채택할 수 있다.
특히, 세포는 시호스(Seahorse) 배양 플레이트 상에서 최적의 밀도로 놓여질 수 있다. 이들 세포들은 100 μl의 매체 내에 놓여지거나 치료 후 37oC 배양기에서 5% CO2로 유지될 수 있다. 두 시간 후에, 세포가 24개 웰 플레이트에 부착되면, 추가적인 150 μl의 매체 또는 치료 용액 중 하나가 추가될 수 있으며 플레이트는 배양 인큐베이터 내에 하루 밤 동안 놓여질 수 있다. 이러한 두 단계의 뿌리는 절차는 세포들이 배양 플레이트 내에 고르게 분포될 수 있게 해 준다. 산소 및 pH를 함유하는 시호스(Seahorse) 카트리지는 CO2를 포함하지 않는 37oC의 배양기 내의 조정액 내에서 하루밤 동안 수화시킬 수 있다. 세 개의 미토콘드리아 약제가 일반적으로 카트리지의 세 포트에 적재된다. 올리고마이신, 복합체 III 금지 인자, FCCP, 공역 방지제 및 로테논, 복합체 I 금지 인자가 카트리지의 포트 A, B 및 C로 각각 적재될 수 있다. 모든 재고 약제가 버퍼링되지 않은 DMEM 매체 내에서 10x의 농도로 준비될 수 있다. 상기 카트리지는 분석 전에 먼저 CO2를 포함하지 않는 배양기 내에서 미토콘드리아의 화합물로 약 15분 간 배양될 수 있다. 배양 플레이트는 글루코스를 포함하는 DMEM 기반 버퍼링되지 않은 매체에서 정상 성장 매체에서 발견되는 농도로 세척될 수 있다. 이 세포들은 630 ul의 버퍼링되지 않은 매체로 적층될 수 있으며 사전 조정된 카트리지를 장착한 시호스(Seahorse) 기기에 놓여지기 전에 CO2를 포함하지 않는 배양기 내에서 평형의 맞추어질 수 있다. 이 기기는 포트를 통한 약제의 투입이 시작되기 전에 기반을 형성하기 위해 혼합, 대기 및 측정의 사이클로 이루어지는 세 개-네 개의 루프에서 동작할 수 있다. 다음 약제가 도입되기 전에 두 개의 루프가 있을 수 있다.
OCR(산소 소모율) 및 ECAR(세포 외 산화율)는 7 ul 챔버 내의 전극에 의해 기록될 수 있으며, 상기 해마 배양 플레이트에 밀어 넣어지는 카트리지를 사용하여 생성될 수 있다.
C.
데이터 통합 및
컴퓨터 모의
모델 생성
적합한 데이터 집합이 얻어지면, 컴퓨터로 구현된 통계적 모델의 데이터 집합 및 세대의 통합이 AI 기반 정보학 시스템 또는 플랫폼 (예를 들어, REFS™ 플랫폼)을 사용하여 수행될 수 있다. 예를 들어, 예시적 AI 기반 시스템은 대사적 종단점(ECAR/OCR)의 핵심 추진 인자로서 단백질 연관의 시뮬레이션-기반 네트워크를 생성할 수 있다. 이에 대해서는 도 15를 참조한다. REFS™ 시스템에 대한 상세한 배경 설명은 징(Xing) 등의 “네트워크 앙상블 시뮬레이션을 사용한 류머티스 관절염과 관련된 유전학적 및 유전자 발현 데이터 예측 유전자의 인과적 모델링” PLoS Computational Biology, 제 7권. 제 3판, 1-19 (2011년 3월) (e100105) 및 페리왈(Periwal)의 미국 특허 제 7,512,497호에서 찾아볼 수 있으며, 각 문서의 내용은 참조로써 본 명세서에 전체적으로 통합된다. 이전에 기술된 설명에서, 상기 REFS™ 시스템은 본질적으로 입력 변수들(예를 들어, 단백질 발현 수준, mRNA 발현 수준, 및 시호스(Seahorse) 배양 플레이트 상에서 측정된 OCR / ECAR 값과 같이 이에 해당하는 기능적 데이터)들 사이의 인과 관계를 확립하기 위해 수학적 알고리즘을 채택하는 AI 기반 시스템이다. 이 과정은 어떠한 잠재적이고, 확립되고 또한/또는 증명된 생물학적 관계에 대한 기존 지식을 고려하지 않고 입력 데이터에만 기반할 수 있다.
특히, 본 발명의 플랫폼의 상당한 이점은 상기 AI 기반 시스템이 생물학적 과정과 관련된 분야에서의 기존 지식에 의존하거나 이를 고려하지 않고 세포 모델로부터 얻어진 데이터 집합에 기반한다는 것이다. 또한, 바람직하게는, 어떠한 데이터 포인트도 통계적으로 또는 인위적으로 잘려나가지 않으며, 그 대신, 획득된 모든 데이터가 단백질 연관을 결정하기 위한 AI 시스템으로 공급된다. 이에 따라, 상기 플랫폼에서 생성되어 결과로 나타나는 통계적 모델은 어떠한 알려진 생물학적 관계도 고려하지 않기 때문에 편향되지 않는다.
특히, 단백질체학 및 ECAR/OCR으로부터의 데이터가 AI 기반 정보 시스템으로 입력될 수 있으며, 상기 설명된 데이터 연관에 기반한 통계적 모델을 구축한다. 이 후, 단백질 연관의 시뮬레이션-기반 네트워크가 다음 방법을 사용하여 치료 및 조건을 포함하는 각 질병 대 정상 시나리오에 대해 도출된다.
상기 생성된(예를 들어, 최적화되거나 진화한) 네트워크의 구축을 위한 예시적 과정의 상세한 설명은 도 16과 관련한 기술 아래 나타난다. 상기 기술한 바와 같이, 단백질체 및 기능적 세포 데이터로부터의 데이터는 AI 기반 시스템으로 입력된다(단계 210). 상기 입력 데이터는 가공되지 않았거나 최소한으로 가공된 데이터일 수 있으며, 정규화(예를 들어, 가변 위치 함수 또는 내부 표준을 사용하여)를 포함할 수 있는 사전 처리 단계를 거친다(단계 212). 상기 사전 처리는 사라진 데이터 값들을 (예를 들어, K-최접근 이웃(K-NN) 알고리즘을 사용하여) 충당하는 과정을 포함할 수 있다(단계 212).
사전 처리된 데이터는 네트워크 파편 라이브러리를 구축하기 위해 사용된다(단계 214). 상기 네트워크 파편은 가능한 측정된 변수(입력 데이터)의 모든 소형 집합들(예를 들어, 2-3 원소 집합 또는 2-4 원소 집합) 사이의 정량적, 연속적 관계를 정의한다. 파편 내 변수들 사이의 관계는 선형, 로지스틱, 다항 분포형, 우성 또는 열성의 동형 접합적 등의 관계일 수 있다. 각 파편에서의 관계는 후보 관계가 얼마나 입력 데이터에 주어질 수 있는 지를 반영하고, 또한 관계에 수학적 복잡성으로 인한 벌칙을 부과하는 베이지안(Bayesian) 확률적 스코어에 지정된다. 입력 데이터로부터 추정되는 가능한 모든 쌍 및 삼각 관계(또한 일부 실시예에서 사각 관계도 가능)에 대한 스코어를 부과함으로써, 라이브러리 내의 가장 유망한 파편이 식별될 수 있다(유망한 파편). 관계의 정량적 매개변수 또한 입력 데이터를 기반으로 계산될 수 있으며 각 파편에 대해 저장될 수 있다. 파편 일람표 내의 여러 모델 유형이 사용될 수 있으며, 여기에는 선형 회귀, 로지스틱 회귀, (분산의 분석) ANOVA 모델, (공분산의 분석) ANCOVA 모델, 비선형/다항 회귀 모델 및 균등 비 매개 변수 회귀가 포함되나 이에 한정되지는 않는다. 모델 매개변수에 대한 사전 가정에서 걸(Gull) 분포 또는 모델에서 사용된 매개변수의 개수에 관련된 베이지안(Bayesian) 정보 기준(BIC) 벌칙이 가정될 수 있다. 네트워크 추정 과정에서, 초기 시험 네트워크 모임 내의 각 네트워크는 파편 라이브러리 내 파편들의 부분 집합으로부터 구축된다. 초기 시험 네트워크들의 모임 내의 각 초기 시험 네트워크는 라이브러리 내 다른 파편들의 부분 집합으로부터 구된다(단계 216).
베이지안(Bayesian) 네트워크 및 네트워크 파편의 기반을 이루는 징(Xing) 외, “류머티스 관절염과 관련된 유전학적 및 유전자 발현 데이터 예측의 네트워크 앙상블 시뮬레이션을 사용한 인과적 모델링” PLoS Computational Biology, 제 7권. 제 3판, 1-19 (2011년 3월) (e100105)에 기반한 수학적 표현에 대한 개요가 이하에서 설명된다.
임의 변수 를 가지는 다중 변량 시스템 많은 수의 매개변수 Θ를 포함하는 다중 변량 확률 분포 함수 에 의해 특성화될 수 있다. 상기 다중 변량 확률 분포 함수는 요소로 표현되어 다음과 같은 국지적 조건 확률 분포의 곱으로 나타낼 수 있다:
상기 다중 변량 확률 분포 함수는 각 특정한 요소화 및 해당 매개변수가 별개의 확률적 모델인 다른 방법으로 요소화될 수 있다. 각각의 특정한 요소화(모델)는 각 변수 에 대한 정점 및 국지적 조건 분포 에서 변수를 사이의 의존성을 나타내는 정점들을 잇는 방향을 가지는 간선을 가지는 방향성 아크릴 그래프(Directed Acrylic Graph: DAC)로 표현할 수 있다. 각각 정점을 가지고 방향성 간선과 연관된 DAG의 하위 그래프는 네트워크 파편들이다.
모델은 주어진 입력 데이터에 대해 가장 유망한 요소화 및 가장 유망한 매개변수를 결정함으로써 진화하거나 최적화된다. 이는 “베이지안(Bayesian) 네트워크의 학습” 또는, 달리 표현하면, 입력 데이터의 훈련 집합이 주어졌을 때, 입력 데이터에 가장 잘 합치되는 네트워크를 찾는 것이라 할 수 있다. 이는 입력 데이터에 대해 각 네트워크를 평가하는 스코어링 함수를 사용하여 성취된다.
입력 데이터가 주어졌을 때 베이지안(Bayesian) 프레임워크가 요소화의 확률을 결정하기 위해 사용된다. 베이즈의 법칙에 따르면, 데이터의 확률, P(D),이 모델 전체에 걸쳐 일정하다고 가정하면, 데이터 D가 주어진 모델 가정, ,에 대해 데이터의 후반 확률의 곱에 비례한다고 하면, 에 모델의 사전 확률, 을 곱한 값이다. 이는 다음과 같은 식으로 표현된다:
모델을 가정하는 데이터의 후반 확률은 매개변수들의 이전 분포에 대한 데이터 확률의 적분이다:
모든 모델들이 동일한 확률을 가진다고 가정하면(즉, P(M)가 상수인 경우), 데이터 D가 주어졌을 때, 모델 후반 확률, M,은 다음과 같이 각 네트워크 파편 Mi에 대한 매개변수에 대한 적분의 곱으로 요소화될 수 있다:
상기 식에서 중요한 상수 항이 생략되었음을 주목해야 한다. 일부 실시예에서, 모델의 조건부 확률 의 음의 로그를 취하는 베이지안(Bayesian) 정보 기준(BIC)이 다음과 같이 각 모델의 “스코어”를 정하기 위해 사용될 수 있다:
여기서 모델 M에 대한 전체 스코어 S tot 는 각각의 국지적 네트워크 파편의 국지적 스코어 S i 의 합이다. BIC는 각 개별적 네트워크 파편의 스코어를 결정하기 위한 표현을 더 제공한다:
여기서 κ(M i )은 모델 M i 내에서 합치되는 매개변수의 개수이며 N은 표본(데이터 포인트)의 개수이다. S MLE (M i )은 네트워크 파편에 대한 확률 함수의 음의 로그로서 이 함수는 각각의 네트워크 파편에 대해 사용된 기능적 관계로부터 계산될 수 있다. BIC 스코어에 대해, 스코어가 낮을 수록, 모델이 입력 데이터에 합치할 확률이 높아진다.
상기 시도 네트워크들의 모임은 전역적으로 최적화되며, 이는 네트워크의 최적화 또는 진화로 설명될 수 있다(단계 218). 예를 들어, 상기 시도 네트워크들은 메트로폴리스 몬테카를로 샘플링 알고리즘을 사용하여 진화되거나 최적화될 수 있다. 시뮬레이션된 아닐링 또한 국지적 변환을 통해 모임 내 시험 네트워크를 최적화하거나 진화시키기 위해 사용될 수 있다. 아닐링 과정을 시뮬레이션하는 예에서, 각 시험 네트워크는 라이브러리로부터 네트워크 파편을 추가하고, 시험 네트워크로부터 네트워크 파편을 제거하며, 네트워크 파편을 차감하거나 달리 네트워크 토폴로지를 변경시킴으로써 변화되며, 이 후 네트워크에 대한 새로운 스코어가 계산된다. 일반적으로 말하면, 스코어가 개선되면, 변화가 유지되고 스코어가 나빠지면 변화는 거부된다. “온도” 매개변수는 유지되는 스코어를 악화시키는 일부 국지적 변화를 허용하여, 국지적 최소값들을 피하기 위한 최적화 과정에 도움을 주게 된다. “온도” 매개변수는 최적화/진화 과정이 수렴하도록 하기 위해 시간이 지남에 따라 감소된다.
네트워크 추정 과정의 전부 또는 일부는 서로 다른 시험적 네트워크들에서 병렬로 수행될 수 있다. 각 네트워크는 별도의 프로세서 및/또는 별도의 컴퓨터 장치들에서 병렬로 최적화될 수 있다. 일부 실시예에서, 상기 최적화 과정은 병렬로 동작하는 수백 내지 수천 개의 프로세서가 통합된 수퍼 컴퓨터에서 수행될 수 있다. 정보는 병렬 프로세서에서 수행되는 최적화 과정들 사이에서 공유될 수 있다.
상기 최적화 과정은 전체적인 점수에 대한 임계 표준을 충족시키지 못하는 특정 네트워크를 모임으로부터 제거하는 네트워크 필터를 포함할 수 있다. 제거된 네트워크는 새로운 초기 네트워크로 교체될 수 있다. 또한 “확장성이 없는(scale free)” 특정 네트워크 또한 모임으로부터 제거될 수 있다. 네트워크들의 모임이 최적화되거나 진화한 이후에, 그 결과는 생성된 세포 모델 네트워크들의 모임으로 불릴 수 있으며, 총체적으로 생성된 합치 네트워크로 불릴 수 있다.
D
.
정량적 관계 정보를 추출하고 예측하기 위한 시뮬레이션
생성된 세포 모델 네트워크에서의 각 관계에 관련된 정량적 매개변수 정보를 추출하기 위해 시뮬레이션이 사용될 수 있다(단계 220). 예를 들어, 정량적 정보 추출을 위한 시뮬레이션은 각각 10배의 노드 네트워크 내의 교란(증가하거나 감소하는)와 모델 내 다른 노드들(예를 들어, 단백질)에 대한 사후 분포의 계산을 포함할 수 있다. 종단점은 t-검사에 의해 그룹 당 100개 표본의 가정과 비교되며, 0.01은 잘라내는 것을 의미 한다. 상기 t-검사 통계는 100회의 t-검사의 중간값이다. 이러한 시뮬레이션 기술의 사용을 통해, 예측의 강도를 나타내는 AUC(곡선 아래 면적) 및 종단점을 구동하는 노드의 컴퓨터 모의 세기를 나타내는 배수 변화가 네트워크의 모임 내 각 관계에 대해 생성된다.
지역 컴퓨터 시스템의 관계 정량화 모듈이 AI 기반 시스템이 교란을 수행하도록 지도하고 AUC 정보 및 배수 정보를 추출하기 위해 채택될 수 있다. 상기 추출된 정량적 정보는 부모 노드를 자식 노드에 연결하는 각 간선에 대한 배수 변화 및 AUC를 포함할 수 있다. 일부 실시예에서, 필요에 따라 구축된 R 프로그램 이 상기 정량적 정보를 추출하기 위해 사용될 수 있다.
일부 실시예에서, 생성된 세포 모델 네트워크의 모임은 시뮬레이션을 통해 조건에서의 변화에 대한 반응을 예측하기 위해 사용될 수 있으며, 이는 추후에 수중 실험실 세포-기반 또는 동물-기반 실험에 의해 증명될 수 있다.
AI 기반 시스템의 출력은 정량적 관계 매개변수 및/또는 다른 시뮬레이션 예측(222)일 수 있다.
E.
분별(델타) 네트워크의 생성
분별 네트워크 생성 모듈이 생성된 세포 모델 네트워크와 생성된 비교 세포 모델 네트워크 사이의 분별(델타) 네트워크를 생성하기 위해 사용될 수 있다. 상기 설명한 바와 같이, 일부 실시예에서, 상기 분별 네트워크는 생성된 세포 모델 네트워크 및 생성된 비교 세포 모델 네트워크 내에서의 관계의 모든 정량적 매개변수를 비교한다. 상기 분별 네트워크 내의 각 관계에 대한 정량적 매개변수는 비교에 기반한 것이다. 일부 실시예에서, 분별이 델타-델타 네트워크로 칭해지는 여러 분별 네트워크들 사이에서 수행될 수 있다. 델타-델타 네트워크의 예는 이하 예 부분에서 도 26과 관련하여 설명된다. 상기 분별 네트워크 생성 모듈은 프로그램이거나 PERL로 작성된 스크립트일 수 있다.
F. 네트워크의 시각화
네트워크 및 분별 네트워크의 모임에 대한 관계 값들은 네트워크 시각화 프로그램(예를 들어, 사이토스케이프(Cytoscape) 컨소시엄으로부터의 복잡한 네트워크 분석 및 시각화를 위한 사이토스케이프 오픈 소스 플랫폼)을 사용하여 시각화될 수 있다. 상기 네트워크의 시각적 묘사에 있어서, 각 간선(예를 들어, 단백질을 연결하는 각 선분)의 두께는 배수 변화의 강도를 나타낸다. 상기 간선들은 또한 방향적 지시 인과성일 수 있으며, 각 간선은 연관된 예측 신뢰 수준을 가진다.
G.
예시적 컴퓨터 시스템
도 17은 일부 실시예에서 AI 기반 정보학 시스템과 통신하기 위해, 분별 네트워크를 생성하기 위해, 네트워크를 시각화하기 위해, 데이터를 보관하고 저장하기 위해, 또한/또는 사용자와 상호 반응하기 위해 채택될 수 있는 예시적 컴퓨터 시스템/환경을 개략적으로 묘사한다. 상기 설명된 대로, AI 기반 정보학 시스템을 위한 계산은 상기 예시적 컴퓨터 시스템과 직접적 또는 간접적으로 반응하는 수백 또는 수천 개의 병렬 프로세서를 가지는 별도의 수퍼 컴퓨터로 수행될 수 있다. 상기 환경은 관련 주변 장치를 가진 컴퓨터 장치(100)를 포함한다. 상기 컴퓨터 장치(100) 는 본 명세서에서 밝힌 여러 방법, 또는 상기 방법의 일부를 수행하기 위한 실행 가능 코드(150)를 구현하기 위한 프로그래밍이 가능하다. 상기 컴퓨터 장치(100)는 하드 드라이브, CD-ROM, 또는 기타 비휘발성 컴퓨터 판독 가능 매체와 같은 저장 장치(116)를 포함한다. 상기 저장 장치(116)는 운영 체제(118) 및 기타 관련 소프트웨어를 저장한다. 상기 컴퓨터 장치(100)는 메모리(106)를 더 포함할 수 있다. 상기 메모리(106)는 컴퓨터 시스템 메모리 또는 DRAM, SRAM, EDO RAM 등과 같은 임의 접근 메모리를 포함할 수 있다. 상기 메모리(106)는 또한 다른 유형의 메모리, 또는 이들의 조합을 포함할 수 있다. 상기 컴퓨터 장치(100)는 저장 장치(116) 및/또는 메모리(106) 내에 실행 가능 코드(150)의 각 부분을 구현하고 처리하기 위한 명령어를 저장할 수 있다.
상기 실행 가능 코드(150)는 상기 AI 기반 정보학 시스템(190)과 통신하기 위한 코드, 분별 네트워크(예를 들어, 분별 네트워크 생성 모듈)를 생성하기 이한 코드, 상기 AI 기반 정보학 시스템으로부터 정량적 관계 정보(예를 들어, 관계 정량화 모듈)를 추출하기 위한 코드 및 네트워크를 시각화하기 위한 코드(예를 들어, 사이토스케이프(Cytoscape))를 포함할 수 있다.
일부 실시예에서, 컴퓨터 장치(100)는 상기 AI 기반 정보학 시스템(190)(예를 들어, REFS를 실행하기 위한 시스템)과 직접적으로 또는 간접적으로 통신할 수 있다. 예를 들어, 상기 컴퓨터 장치(100)는 데이터 파일(예를 들어, 데이터 프레임)은 상기 AI 기반 정보학 시스템(190)에 네트워크를 통해 전송함으로써 AI 기반 정보학 시스템(190)과 통신할 수 있다. 또한, 상기 컴퓨터 장치(100)는 AI 기반 정보학 시스템(190)으로의 인터페이스 및 실행 명령을 제공하는 실행 가능 코드(150)를 가질 수 있다.
일부 실시예에서, 상기 컴퓨터 장치(100)는 입력 데이터 집합에 대한 데이터를 제공하는 하나 또는 그 이상의 실험적 시스템(180)과 직접적 또는 간접적으로 통신할 수 있다. 데이터를 생성하기 위한 실험적 시스템(180)은 질량 분광학 기반 단백질체학, 미세 배열 유전자 발현, qPCR 유전자 발현, 질량 분광학 기반 대사체학, 및 질량 분광학 기반 리피도믹스, SNP 미세 배열, 기능적 분석의 패널, 및 기타 체외 생물학 플랫폼 및 기술을 위한 시스템을 포함할 수 있다.
컴퓨터 장치(100)는 또한 메모리(106)에 저장된 소프트웨어 및 시스템 하드웨어 제어를 위한 다른 프로그램을 실행하기 위한 프로세서(102)를 포함하며, 하나 또는 그 이상의 추가적인 프로세서(들)(102)를 포함할 수 있다. 상기 프로세서(102) 및 상기 프로세서(들)(102) 각각은 단일 코어 프로세서 또는 다중 코어(104 및 104) 프로세서일 수 있다. 컴퓨터 장치(100)에서 가상화를 채용하여 컴퓨터 장치 내의 기반 구조 및 자원을 동적으로 공유하도록 할 수 있다. 가상화된 프로세서는 저장 장치(116)에 저장된 실행 가능 코드(150) 및 다른 소프트웨어와 함께 사용될 수 있다. 가상화 기계(114)는 상기 프로세스가 다중이 아닌 단일 컴퓨터 자원만을 사용하는 것처럼 보이도록 다중 프로세서에서 동작하는 프로세스를 다루기 위해 제공될 수 있다. 다중 가상 기계는 하나의 프로세서에서도 사용할 수 있다.
사용자는 사용자 인터페이스(124) 또는 기타 인터페이스를 보여 줄 수 있는 컴퓨터 모니터와 같은 시각적 디스플레이 장치(122)를 통해 컴퓨터 장치(100)와 통신할 수 있다. 상기 디스플레이 장치(122)의 사용자 인터페이스(124)는 가공되지 않은 데이터, 네트워크의 시각적 표현 등을 보여줄 수 있다. 상기 디스플레이 장치(122)는 또한 예시적 실시예(예를 들어, 저장 장치(116)에 대한 아이콘)의 다른 측면 또는 요소들을 보여 줄 수 있다. 상기 컴퓨터 장치(100)는 키보드 또는 다중 포인트 터치 인터페이스(108) (예를 들어, 터치 스크린) 및 포인팅 장치(110) (예를 들어, 마우스, 트랙볼 및/또는 트랙 패드)와 같이 사용자로부터 입력을 받기 위한 I/O 장치를 포함할 수 있다. 상기 키보드(108) 및 상기 포인팅 장치(110) 는 시각적 디스플레이 장치(122) 및/또는 상기 컴퓨터 장치(100)에 유선 및/또는 무선 연결로 연결될 수 있다.
상기 컴퓨터 장치(100)는 네트워크 장치(126)와 상호 작용할 수 있는 근거리 통신망(LAN), 원거리 통신망(WAN) 또는 표준 전화선, LAN 또는 WAN 연결(예를 들어, 802.11, T1, T3, 56kb, X.25), 광대역 연결(예를 들어, ISDN, 프레임 릴레이, ATM), 무선 연결, 제어기 영역 네트워크(CAN), 또는 상기의 일부 또는 모든 조합을 포함하나 이에 한정되지는 않는 다양한 연결을 통한 인터넷 네트워크 인터페이스(112)를 포함할 수 있다. 상기 네트워크 인터페이스(112)는 내장 네트워크 어댑터, 네트워크 인터페이스 카드, PCMCIA 네트워크 카드, 카드 버스 네트워크 어댑터, 무선 네트워크 어댑터, USB 네트워크 어댑터, 모뎀 또는 컴퓨터 장치(100)가 어떠한 유형의 네트워크와도 통신할 수 있게 하며 본 명세서에서 기술된 동작을 수행할 수 있도록 해주기에 적절한 기타 장치를 포함할 수 있다.
또한, 상기 컴퓨터 장치(100)는 워크스테이션, 데스크탑 컴퓨터, 서버, 노트북, 핸드헬드 컴퓨터 또는 통신이 가능하며 본 명세서에서 기술된 동작을 수행하기에 충분한 프로세서 파워와 메모리 용량을 가지는 다른 형태의 연산 또는 전기 통신 장치와 같은 컴퓨터 시스템일 수 있다.
상기 컴퓨터 장치(100)는 마이크로소프트의 모든 버전의 윈도우즈 운영 체제, 서로 다른 판의 유닉스 및 리눅스 운영 체제, 매킨토시 컴퓨터를 위한 모든 버전의 맥 오에스, 모든 임베디드 운영 체제, 모든 실시간 운영 체제, 모든 오픈 소스 운영 체제, 모든 사적으로 보유한 운영 체제, 모바일 컴퓨터 장치를 위한 모든 운영 체제, 또는 상기 컴퓨터 장치에서 구동되며 본 명세서에서 기술된 동작을 수행하는 기타 다른 운영 체제 등의 어떠한 운영 체제(118)에서도 구동할 수 있다. 상기 운영 체제는 네이티브 모드 또는 에뮬레이션 모드에서 동작할 수 있다.
IV
. 생물학적 시스템에 대한 모델 및 그 사용
A.
생물학적 시스템을 위한 모델 수립
모든 생물학적 시스템 또는 과정은 시각적으로 서로 다른 세포 유형 및/또는 기관 시스템들 사이의 복잡한 상호 반응을 포함한다. 한 세포 유형 또는 기관에서의 핵심 기능의 교란은 다른 상호 반응 세포 유형 및 기관에 대한 이차 효과로 이어질 수 있으며, 이러한 하방 흐름의 변화는 다시 초기 변화로 피드백되어 더 복잡한 상황을 야기할 수 있다. 따라서, 생물학적 시스템 또는 과정에 대한 보다 완전하고 전역적인 시각을 가지기 위해서는 주어진 생물학적 시스템 또는 과정을 세포 유형 또는 기관의 쌍 사이의 상호 반응과 같은 구성 요소로 분할하여 이들 구성 요소 사이의 상호 반응을 체계적으로 탐구하는 것이 도움이 된다.
이에 따라, 본 발명은 생물학적 시스템에 대한 세포 모델을 제공한다. 이러한 목적을 위해, 출원인들은 본 발명의 발견 플랫폼 기술에서 채택된 다양한 예시적 생물학적 시스템에 대한 세포 모델을 구축하였다. 출원인들은 생물학적 시스템에 고유한 인과 관계를 포함하는 합치 인과 관계 네트워크를 생성하기 위해 본 발명의 발견 플랫폼 기술을 사용하여 세포 모델에 대한 실험을 수행하였으며, 이에 의해 특정한 생물학적 시스템 또는 과정에 대해 중요한 “조절 인자” 또는 핵심 분자의 “추진 인자”를 식별하였다.
본 발명의 플랫폼 기술 및 그 구성 요소의 의미있는 이점 중 하나는, 예를 들어, 세포 모델로부터 획득한 상기 필요에 따라 구축된 세포 모델 및 데이터 집합에서, 생물학적 시스템 또는 과정에 대해 생성된 초기의 “제 1 세대” 합치 인과 관계 네트워크가, 예를 들어, 추가적인 세포 라인/유형 및/또는 추가적인 조건의 도입에 의해 시간이 지남에 따라 지속적으로 진화 또는 확장할 수 있다는 것이다. 진화한 세포로부터의 추가적인 데이터, 즉, 세포 모델의 새롭게 추가된 부분(들)으로부터의 데이터가 수집될 수 있다. 확장되거나 진화된 세포 모델, 즉, 세포 모델의 새롭게 추가된 부분(들)으로부터 수집된 이러한 새로운 데이터는 보다 견고한 “제 2 세대” 합치 인과 관계 네트워크를 생성하기 위해 다시 이전에 “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 생성된 데이터 집합에 도입될 수 있다. 생물학적 시스템에 고유한 새로운 인과 관계는 이 후 “제 2 세대” 합치 인과 관계 네트워크로부터 식별될 수 있다. 이러한 방식으로, 세포 모델의 진화가 합치 인과 관계 네트워크의 진화를 제공하며, 이에 의해 생물학적 시스템의 조절 인자로의 새로운 통찰 및/또는 보다 신뢰성 있는 통찰을 제공한다. 이러한 방식으로, 세포 모델로부터의 데이터 집합과 본 플랫폼 기술 방법을 사용하여 세포 모델로부터 생성된 인과 관계 네트워크의 양 세포 모델 모두가 지속적으로 진화하여 상기 플랫폼 기술로부터 획득한 이전의 지식을 확대해 나갈 수 있게 된다.
이에 따라, 본 발명은 본 플랫폼 기술에서 채택된 세포 모델로부터 생성된 합치 인과 관계 네트워크를 제공한다. 이들 합치 인과 관계 네트워크는 제 1 세대의 합치 인과 관계 네트워크, 또는 다중 세대의 합치 인과 관계 네트워크, 예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20번째 또는 이를 초과하는 세대의 합치 인과 관계 네트워크일 수 있다. 또한, 본 발명은 본 플랫폼 기술에서 채택된 세포 모델로부터 생성된 합치된 모의 인과 관계 네트워크를 제공한다. 이들 합치된 모의 인과 관계 네트워크는 제 1 세대의 합치된 모의 인과 관계 네트워크, 또는 다중 세대의 합치된 모의 인과 관계 네트워크, 예를 들어, 두 번째, 세 번째, 네 번째, 다섯 번째, 여섯 번째, 일곱 번째, 여덟 번째, 아홉 번째, 열 번째, 열한 번째, 열두 번째, 열세 번째, 열네 번째, 열다섯 번째, 열여섯 번째, 열일곱 번째, 열여덟 번째, 열아홉 번째, 스무 번째 또는 이를 초과하는 모의된 세대의 합치 인과 관계 네트워크들일 수 있다. 본 발명은 본 발명의 합치 인과 관계 네트워크로부터 생성된 델타 네트워크 및 델타-델타 네트워크를 더 제공한다.
생물학적 시스템 또는 과정에 대한 필요에 따라 구축된 세포 모델은 생물학적 시스템과 관련된 하나 또는 그 이상의 세포를 포함한다. 생물학적 시스템/과정에 대한 상기 모델은 생물학적 시스템 또는 과정의 특징적 측면을 모방하는 조건(예를 들어, 세포 배양 조건)을 생성함으로써 생물학적 시스템의 환경, 예를 들어, 암 세포의 생체 내 환경을 모의하기 위해 수립될 수 있다.
동일하거나 다른 근원의 다중 세포들은, 단일 세포 유형과는 반대로, 상기 세포 모델에 포함될 수 있다. 일 실시예에서, 최소한 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 50 또는 그 이상의 서로 다른 세포 라인 또는 세포 유형들이 세포 모델에 포함된다. 일 실시예에서, 상기 세포는 모두 동일한 유형, 예를 들어, 모두 유방암 세포 또는 식물 세포이거나, 서로 달리 수립된 세포 라인, 예를 들어, 서로 달리 수립된 유방암 세포 또는 식물 세포의 세포 라인일 수 있다. 앞의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 세포 라인 또는 세포 유형일 수 있다.
본 발명의 세포 모델에 포함될 수 있는 세포 유형에는 인간 세포, 동물 세포, 포유류 세포, 식물 세포, 효모, 박테리아, 또는 균류가 포함되나 이로 한정되지는 않는다. 일 실시예에서, 본 세포 모델의 세포는 암 세포 또는 박테리아에 의해 또는 바이러스에 의해 감염된 세포, 질병에 걸린 세포를 포함할 수 있다. 일 실시예에서, 본 세포 모델의 세포는 당뇨, 비만 또는 심장병 상태에 관련된 세포와 같은 질병과 연관된 세포, 예를 들어, 대동맥의 평활근 세포 또는 간 세포를 포함할 수 있다. 해당 분야의 통상의 기술자라면 예를 들어, 질병 상태/과정과 같은 특정한 생물학적 상태/과정에 포함되거나 관련된 이들 세포들, 및 이러한 모든 세포들이 본 발명의 세포 모델에 포함된다는 것을 인식할 수 있을 것이다.
본 발명의 세포 모델은 하나 또는 그 이상의 “제어 세포”를 포함할 수 있다. 일 실시예에서, 제어 세포는 처리되지 않거나 교란되지 않은 세포일 수 있다. 또 다른 실시예에서, “제어 세포”는 정상 세포, 예를 들어, 질병에 걸리지 않은 세포일 수 있다. 일 실시예에서, 최소한 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 또는 그 이상의 서로 다른 제어 세포들이 상기 세포 모델에 포함된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 제어 세포 라인 또는 제어 세포 유형일 수 있다. 일 실시예에서, 상기 제어 세포는 모두 같은 유형이지만 해당 세포 유형의 다르게 확립된 세포 라인일 수 있다. 일 실시예에서, 하나 또는 그 이상의 정상, 예를 들어, 질병에 걸리지 않은 세포 라인이, 제어로서, 생물학적 상태 또는 과정에 고유한 단백질 또는 경로를 식별하기 위해 유사한 조건에서 배양되고, 또한/또는 세포 모델의 주된 세포로서 동일한 교란에 노출된다.
본 발명의 필요에 따라 제작된 세포 모델은 또한 생물학적 상태 또는 과정의 특징적 측면을 모방하는 조건을 포함할 수 있다. 예를 들어, 종양 환경 생체 내의 암 세포의 조건, 또는 심장병을 앓는 환자의 대동맥의 평활근 세포의 조건을 매우 가깝게 근사하는 세포 배양 조건이 선택될 수 있다. 일부 경우에, 상기 조건은 스트레스 조건이다. 여러 조건 / 스트레스 인자가 본 발명의 세포 모델에서 채택될 수 있다. 일 실시예에서, 이들 스트레스 인자 / 조건들은 세포 시스템에 대한 “교란”, 예를 들어, 외부 자극을 구성할 수 있다. 한 예시적 스트레스 조건은 저산소 상태로서, 이는, 예를 들어, 고형 종양 내에서 일반적으로 발견되는 조건이다. 저산소 상태는 해당 분야에서 알려진 방법들을 사용하여 유도할 수 있다. 예를 들어, 저산소 상태는 세포 시스템을 5% CO2, 2% O2 및 93% 질소를 함유하는 산업용 기체로 흘러 넘치게 할 수 있는 모듈라 배양기 챔버(MIC-101, Billups-Rothenberg Inc. Del Mar, CA) 내에 위치시킴으로써 유도할 수 있다. 그 효과는 저산소 상태 치료 이후 소정의시간, 예를 들어, 24 시간 후에 추가적인 외부 자극 성분들(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 비존재 하에서 측정될 수 있다. 마찬가지로, 젖산 치료는 해당 과정 활성이 높은 세포 환경을 모방한다. 젖산 유도 스트레스는 약 12.5 mM의 최종 젖산 농도에서 소정의 시간, 예를 들어, 24시간에서, 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 부재 하에서 조사될 수 있다. 고혈당증은 암뿐만 아니라 당뇨에서도 발견되는 조건이다. 대상 세포를 치료하기 위해 사용될 수 있는 전형적인 고혈당 조건은 매체 내 글루코스의 최종 농도를 약 22 mM로 하기 위해 적절한 매체에 첨가된 10% 배양 등급 글루코스를 포함한다. 고지혈증은, 예를 들어, 비만 및 심장병에서 발견되는 조건이다. 고지질증 조건은 세포를 0.15 mM 나트륨 팔미테이트를 포함하는 매체에서 배양함으로써 제공될 수 있다. 고인슐린증은, 예를 들어, 당뇨에서 발견되는 조건이다. 고인슐린증 조건은 세포를 1000 nM 인슐린을 포함하는 매체에서 배양함으로써 유도될 수 있다.
개별적 조건들이 본 발명의 필요에 따라 구축된 세포 모델에서 별개로 조사되거나 함께 조사되거나 두 조사를 병행할 수 있다. 일 실시예에서, 생물학적 시스템의 서로 다른 특성적 측면을 반영하거나 시뮬레이션하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50개 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 세포 모델에서 조사되었다. 일 실시예에서, 개별적 조건 및, 추가적으로 생물학적 시스템의 서로 다른 특성적 측면을 반영하거나 시뮬레이션하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 20, 25, 30, 35, 40, 45, 50개 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 세포 모델에서 조사되었다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이, 또는 10과 50 사이의 서로 다른 조건일 수 있다.
일단 필요에 따라 구축된 세포 모델이 구축되면, 하나 또는 그 이상의 환자에서 환자로의 유전학적 변이, 또는 특정 약제 또는 사전 약제에 의한 치료 또는 비치료와 같은 “교란”이 상기 시스템에 적용될 수 있다. 도 15D를 참조한다. 이러한 교란이 세포 모델 시스템에 미치는 영향은 해당 분야에서 인식되거나 특정적으로 수행되는 여러 수단을 사용하여 측정될 수 있으며, 이러한 수단들은 아래 제 III.B절에서 설명된다.
상기 필요에 따라 구축된 세포 모델은 예를 들어, “환경적 교란” 또는 “외부 자극 성분”과 같은 교란에 노출될 수 있다. 이러한 “환경적 교란” 또는 “외부 자극 성분”은 세포 환경에 내생적(예를 들어, 세포 환경이 일정 수준의 자극제를 포함하고 수준을 증가시키기 위해 그 이상의 자극제가 추가됨)이거나, 세포 환경에 외생적(예를 들어, 자극제/교란이 변이 이전의 세포 환경에 전반적으로 존재하지 않음)일 수 있다. 상기 세포 환경은 환경적 교란 또는 외부 자극 성분의 추가의 결과로 나타나는 이차적 변화에 의해 더 변경될 수 있으며, 이는 외부 자극 성분이 세포 시스템에 의해 세포 환경으로 분비된 분자를 포함하여 세포 시스템의 세포의 출력을 변화시킬 수 있기 때문이다. 상기 환경적 교란 또는 외부 자극 성분은 세포 기능에 영향을 미칠 수 있는 어떠한 외부 물리적 및/또는 화학적 자극을 포함할 수 있다. 이는 자연적이거나 합성된 화학 물질인 어떠한 크거나 작은 기관 또는 기관 내 분자의, 온도 변화, pH 변화, 복사, 빛(UVA, UVB 등), 마이크로웨이브, 초음파, 전기 전류, 조절되거나 조절되지 않는 자기장 등을 포함할 수 있다. 상기 환경적 교란 또는 외부 자극 성분은 또한 유전학적 수정 / 변이를 야기하는 도입된 유전학적 수정 또는 변이 또는 매개 수단(예를 들어, 벡터)을 포함할 수 있다.
(i) 상호 대화 세포 시스템
둘 또는 그 이상의 세포 시스템들 간의 상호 반응이 조사되는 것이 바람직한 특정한 상황에서, “상호 대화 세포 시스템”이, 예를 들어, 제 1 세포 시스템의 수정된 세포 환경을 제 2 세포 시스템에 접촉도록 하여 제 2 세포 시스템의 세포 출력에 영향을 줌으로써 형성될 수 있다.
본 명세서에서 사용되는, “상호 대화 세포 시스템”은 둘 또는 그 이상의 세포 시스템을 포함하며, 제 2 세포 시스템 내의 최소한 하나의 세포의 출력이 변화되거나 영향을 받도록 이 시스템 내에서 상기 최소한 하나의 세포 시스템의 세포 환경이 이차 세포 시스템과 접촉하게 된다. 특정 실시예에서, 상기 상호 대화 세포 시스템 내의 세포 시스템은 직접 접촉할 수 있다. 다른 실시예에서, 어떠한 세포 시스템도 서로 직접적으로 접촉하지 않는다.
예를 들어, 특정 실시예에서, 상기 상호 대화 세포 시스템은 제 1 세포 시스템이 삽입체 내에서 성장하고 제 2 세포 시스템이 해당 웰 구획에서 성장하는 트랜스웰의 형태일 수 있다. 상기 2-세포 시스템은 동일하거나 서로 다른 매체에 접촉시킬 수 있으며, 매체 성분의 일부 또는 전부를 교환할 수 있다. 한 세포 시스템에 추가된 외부 자극 성분은 한 세포 시스템에 의해 실질적으로 흡수될 수 있고, 또한/또는 다른 세포 시스템에 분산될 기회를 가지기 이전에 저하될 수 있다. 대체적 방법으로, 상기 외부 자극 성분은 결과적으로 상기 2 세포 시스템의 평형에 접근해 가거나 이에 도달할 수 있다.
특정 실시예에서, 상기 상호 대화 세포 시스템은 각 세포 시스템이 자신의 매체 및/또는 배양 조건(온도, CO2 내용물, pH 등)을 가지거나, 유사하거나 동일한 배양 조건을 가지는 별도로 배양된 세포 시스템의 형태를 채택할 수 있다. 상기 2-세포 시스템은, 예를 들어, 조건을 겪은 매체를 한 세포 시스템에서 취하여 다른 세포 시스템과 접촉케 함으로써 서로 접촉할 수 있다. 2-세포 시스템 사이의 직접적인 세포-세포 간 접촉 또한 필요한 경우 수행될 수 있다. 예를 들어, 2-세포 시스템의 세포들은 필요한 경우 어떠한 포인트에서 공생 배양될 수 있고, 상기 공생 배양된 세포 시스템은 이후 최소한 하나의 세포 시스템 내의 세포가 정렬 가능한 표지 인자 또는 라벨(예를 들어 안정되게 발현된 형광 표지 인자 단백질 GFP)을 가지게 될 때, 예를 들어, FACS 정렬에 의해 분리될 수 있다.
마찬가지로, 특정 실시예에서, 상기 상호 대화 세포 시스템은 단순한 공생 배양일 수 있다. 상기 공생 배양 내의 처리된 세포를 다른 세포 시스템의 세포와 배양시키기 전에, 하나의 세포 시스템 내에서의 세포의 선택적 치료가 먼저 해당 세포 시스템 내의 세포를 처리함으로써 실시될 수 있다. 상기 공생 배양 상호 대화 세포 시스템 설정은, 예를 들어, 외부 자극 성분에 의한 제 1 세포 시스템의 자극 이후에 제 1 세포 시스템에서의 세포 표면 변화에 의해 야기된 2차 세포 시스템에 대한 영향을 연구하는 것이 바람직한 경우에 도움이 될 수 있다.
본 발명의 상호 대화 세포 시스템은 특정한 소정의 외부 자극 성분의 하나 또는 양 세포 시스템의 세포의 출력에 대한 영향을 탐구하기에 특히 적절하다. 이러한 자극이 (자극이 직접적으로 접촉되는) 제 1 세포 시스템에 미치는 일차적 영향은 제 1 세포 시스템이 상기 외부 자극과 접촉하기 이전과 이후의 세포의 출력(예를 들어, 단백질 발현 수준)을 비교함으로써 결정될 수 있으며, 이는, 본 명세서에서 사용되는 표현에서는, “(상당한) 세포의 출력 분별”로 불릴 수 있다. 이러한 자극이 제 2 세포 시스템에 미치는 부차적 효과는 (이의 세크리톰과 같은)제 1 세포 시스템의 수정된 세포 환경을 통한 중재이며, 이 또한 마찬가지로 측정될 수 있다. 이때, 예를 들어, 제 2 세포 시스템의 단백질체와의 비교가 제 1 세포 시스템에 대한 외부 자극 치료가 행해진 제 2 세포 시스템의 단백질체 및 제 1 세포 시스템에 대한 외부 자극 치료가 행하여 지지 않은 제 2 세포 시스템의 단백질체 사이에서 수행될 수 있다. (단백질체 또는 관심 대상인 다른 세포의 출력에서) 상당한 변화가 관찰되는 경우 이는 “상당한 세포 간 상호 대화 분별”로 불릴 수 있다.
(단백질 발현과 같은) 세포의 출력 측정을 수행함에 있어서, 절대적 발현량 또는 상대적 발현 수준이 사용될 수 있다. 예를 들어, 제 2 세포 시스템의 상대적 단백질 발현 수준을 결정하기 위해, 제 1 세포 시스템에 대한 외부 자극이 존재하거나 존재하지 않는 제 2 세포 시스템 내의 주어진 단백질의 양이 세포 라인의 적절한 제어 세포 라인 및 혼합물 및 주어진 배수 증가 또는 배수 감소값과 비교될 수 있다. 이러한 배수 증가(예를 들어, 최소한 1.2, 1.3, 1.4, 1.5, 1.6, 1.7, 1.8, 1.9, 2, 2.5, 3, 3.5, 4, 4.5, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 75 또는 100 또는 그 이상의 배수 증가) 또는 배수 감소(예를 들어, 최소한 0.95, 0.9, 0.8, 0.75, 0.7, 0.6, 0.5, 0.45, 0.4, 0.35, 0.3, 0.25, 0.2, 0.15, 0.1 또는 0.05 배수, 또는 90%, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10% 또는 5% 또는 그 이하로의 감소)에 대한 소정의 임계 수준이 상당한 세포 간 상호 대화 분별을 선택하기 위해 사용될 수 있다. 상기 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위, 예를 들어, 1.5와 5 배 사이, 2와 10배 사이, 1과 2배 사이, 또는 0.9와 0.7배 사이의 상한 또는 하한일 수 있다.
본 출원 전체에 걸쳐, 목록으로 제시된 모든 값들, 예를 들어, 위에서 기술된 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있다.
이를 예시하기 위해, 심장병 모델의 측면을 모방하기 위해 수립된 한 예시적인 2-세포 시스템에서, 심장 평활근 세포 라인(제 1 세포 시스템)이 저산소 상태 조건 (외부 자극 성분)에 의해 처리되고, 신장 세포를 심장 평활근의 조건을 겪은 매체에 접촉시킨 결과로 발생하는 신장 세포 라인(제 2 세포 시스템)에서의 단백질체 변화가 통상의 정량적 질량 분광학에 의해 측정될 수 있다. 이들 신장 세포에서의 상당한 세포 간 상호 대화 분별이 적절한 제어(예를 들어, 저산소 상태 조건으로 처리되지 않은 마찬가지로 배양된 심장 평활근 세포의 조건을 겪은 매체와 접촉한 마찬가지로 배양된 신장 세포)와의 비교를 기반으로 결정될 수 있다.
관찰된 모든 상당한 세포 간 상호 대화 분별이 생물학적 의미를 가지지 않을 수 있다. 대상의 조사적 생물학적 평가가 적용된 주어진 생물학적 시스템에 대해, 일부(또는 모두일 수 있음)의 상당한 세포 간 상호 대화 분별은 문제가 되는 특정한 생물학적 문제에 대해 “결정론적”일 수 있다, 예를 들어, 질병 조건(치료적 시술을 위한 잠재적 타겟)을 야기하는 것에 책임이 있거나 질병 조건(잠재적 진단적 또는 예후의 요소)에 대한 생물학적 표지 인자이다.
이러한 결정론적 상호 대화 분별은 해당 방법의 최종 사용자에 의해 선택되거나, DAVID-활성 비교 경로 분석 프로그램, 또는 KEGG 경로 분석 프로그램과 같은 생물정보학 소프트웨어 프로그램에 의해 선택될 수 있다. 특정 실시예에서, 하나 이상의 생물정보학 소프트웨어 프로그램이 사용되며, 둘 또는 그 이상의 생물정보학 소프트웨어 프로그램으로부터의 합치된 결과를 사용하는 것이 바람직하다.
본 명세서에서 사용되는 세포의 출력의 “분별”은 세포의 출력의 하나 또는 그 이상의 매개변수들에서의 차이(예를 들어, 증가되거나 감소된 수준)를 포함한다. 예를 들어, 단백질 발현 수준에 대해, 외부 자극 성분에 의한 치료 이전 및 이후의 세포 시스템과 연관된 출력과 같은 두 세포의 출력사이의 분별이 질량 분광학 기반 분석(예를 들어, iTRAQ, 2D-LC-MSMS 등)과 같이 해당 분야에서 알려진 기술을 사용하여 측정되고 정량화될 수 있다.
(ii)
암 특정 모델
생물학적 시스템 또는 과정의 한 예는 암이다. 다른 복잡한 생물학적 과정 또는 시스템과 마찬가지로, 암은 다양한 여러 측면에 의해 특징지워지는 복잡한 병리학적 조건이다. 예를 들어, 그 높은 성장률로 인해, 많은 암 세포들이 저산소 상태 조건에서 성장하도록 적응되며, 상향 조절된 해당 과정 및 감소된 산소 첨가 인산화 대사 경로를 가진다. 결과적으로, 암 세포는 잠재적 약제에 의한 치료와 같은 환경적 교란에 대해, 동일한 치료에 대한 정상 세포의 반응과 비교하여, 다르게 반응할 수 있다. 따라서, 정상 세포의 반응과 비교하여 암의 약제 치료에 대한 고유한 반응을 판독하는 것이 관심사일 수 있다. 이러한 목적으로, 적절한 암 세포 라인을 선택하고 질병 상태 또는 과정의 특징적 측면을 모방하는 세포 배양 조건을 창출함으로써, 필요에 따라 제작된 암 모델이 암 세포의 환경, 예를 들어, 종양 생체 내 환경을 모의하기 위해 수립될 수 있다. 예를 들어, 세포의 조건을 매우 가깝게 근사하거나, 종양 생체 내 암 성장의 여러 측면을 모방하는 세포 배양 조건이 암 세포의 서로 다른 성장 조건을 분리함으로써 선택될 수 있다.
단일 암 세포 유형과 반대로 동일하거나 서로 다른 근원을 가지는 다중 암 세포(예를 들어, 암 라인 PaCa2, HepG2, PC3 및 MCF7)이 상기 암 모델에 포함될 수 있다. 일 실시예에서, 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 또는 그 이상의 다른 암 세포 라인 또는 암 세포 유형이 상기 암 모델에 포함된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 암 세포 라인 또는 세포 유형일 수 있다.
일 실시예에서, 상기 암 세포들은 모두 동일한 유형, 예를 들어, 모두 유방암 세포이지만, 세포 라인들은 예를 들어, 다르게 수립된 유방암의 세포 라인과 같이, 다르게 수립된 암세포 라인이다.
상기 암 모델에 포함될 수 있는 암 세포 유형의 예는 폐암, 유방암, 전립선암, 흑색종, 비늘형의 세포암종, 결장암, 췌장암, 갑상선암, 자궁 내막암, 방광 암, 신장 암, 고형 종양, 백혈병, 비 호지킨(non-Hodgkin) 림프종을 포함하나 이에 한정되지는 않는다. 일 실시예에서, 약제 저항 암 세포가 상기 암 모델에 포함될 수 있다. 암 모델에 포함될 수 있는 세포 라인의 특정 예는 PaCa2, HepG2, PC3 및 MCF7 세포를 포함하나 이에 한정되지는 않는다. 다수의 암 세포 라인들이 해당 분야에서 알려져 있으며, 이러한 암 세포 라인이 본 발명의 암 모델에 포함될 수 있다.
본 발명의 세포 모델은 하나 또는 그 이상의 “제어 세포”를 포함할 수 있다. 일 실시예에서, 제어 세포는 처리되지 않거나 또는 교란되지 않은 암 세포이다. 또 다른 실시예에서, “제어 세포”는 정상의, 암에 걸리지 않은 세포일 수 있다. 다수의 정상의, 암에 걸리지 않은 세포 라인 중 어느 하나가 상기 세포 모델에 포함될 수 있다. 일 실시예에서, 상기 정상 세포는 하나 또는 그 이상의 THLE2 및 HDFa 세포이다. 일 실시예에서, 최소한 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 또는 그 이상의 서로 다른 정상 세포 유형이 상기 암 모델에 포함된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 정상 세포 라인 또는 세포 유형일 수 있다. 일 실시예에서, 상기 정상 세포는 모두 동일한 유형, 예를 들어, 모두 건강한 상피의 또는 유방 세포이거나, 다르게 수립된 세포 라인, 예를 들어, 다르게 수립된 상피의 또는 유방 세포의 세포 라인일 수 있다. 일 실시예에서, 제어로서, 하나 또는 그 이상의 정상적인 비 암 세포 라인(예를 들어, THLE2 및 HDFa)들이 암에 고유한 단백질 또는 경로를 식별하기 위해 비슷한 조건 하에서 배양될 수 있고, 또한/또는 세포 모델의 암 세포와 동일한 교란에 노출될 수 있다.
필요에 따라 구축된 암 모델은 또한 암적 상태 또는 과정의 특징적 측면을 모방하는 세포 배양 조건을 포함할 수 있다. 예를 들어, 암 세포의 서로 다른 성장 조건들을 분리해 냄으로써 세포 배양 조건을 종양 환경 생체 내 암 세포의 조건을 매우 가깝게 근사하거나, 암 성장의 여러 측면을 모방하도록 선택할 수 있다. 일부 경우에 상기 세포 배양 조건은 스트레스 조건일 수 있다.
이러한 암 “환경”, 또는 스트레스 조건 중 하나는 저산소 상태로서, 고형 종양에서 일반적으로 발견되는 조건이다. 저산소 상태는 세포 내에서 해당 분야에 알려진 방법을 사용하여 유도될 수 있다. 예를 들어, 저산소 상태는 세포 시스템을 5% CO2, 2% O2 및 93% 질소를 포함하는 산업용 기체로 흘러 넘치게 할 수 있는 모듈라 배양기 챔버(MIC-101, Billups-Rothenberg Inc. Del Mar, CA)내에 위치시킴으로써 유도될 수 있다. 효과는 소정의 시간 이후, 예를 들어, 저산소 상태 치료 후 24시간 이후에, 추가적인 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 부존재 하에서 측정될 수 있다.
마찬가지로, 세포의 젖산 치료는 종양 환경 생체 내에 존재하는 높은 활성의 해당 과정을 가지는 세포 환경을 모방한다. 젖산 유도 스트레스는 약 12.5 mM의 최종 젖산 농도에서 소정의 시간, 예를 들어, 24시간에 추가적인 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 부존재 하에서 검사될 수 있다.
고혈당증은 보통 당뇨에서 발견되는 조건이다; 그러나, 많은 암 세포들이 자신들의 주요 에너지 원으로서 글루코스에 의존하기 때문에 고혈당증은 또한 어느 정도 암 성장의 한 측면을 모방한다. 대상 세포를 일반적인 고혈당 조건에 노출시키는 것은 매체 내 글루코스의 최종 농도가 약 22 mM가 되도록 10% 배양 등급 글루코스를 적절한 매체에 추가하는 것을 포함할 수 있다.
암 성장의 다른 측면을 반영하는 개별적 조건들이 필요에 따라 구축된 암 모델에서 별도로 조사되고, 또한/또는 함께 조합되어 조사될 수 있다. 일 실시예에서, 서로 다른 측면의 암 성장 / 조건을 반영하거나 모의하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 암 모델에서 조사된다. 일 실시예에서, 서로 다른 측면의 암 성장 / 조건을 반영하거나 모의하는 개별적 조건들 및, 이에 추가하여, 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는그 이상의 조건들의 조합이 필요에 따라 구축된 암 모델에서 조사된다. 앞의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이, 또는 10와 50 사이의 서로 다른 조건일 수 있다.
일단 필요에 따라 구축된 세포 모델이 구축되면, 하나 또는 그 이상의 환자에서 환자로의 유전학적 변이, 또는 특정 약제 또는 사전 약제에 의한 치료 또는 비치료와 같은 “교란” 이 상기 시스템에 적용될 수 있다. 도 15D를 참조한다. 이러한 교란이 세포 모델 시스템에 미치는 영향은 해당 분야에서 인식되거나 특정적으로 수행되는 여러 수단을 사용하여 측정될 수 있으며, 이러한 수단들은 아래 제 III.B절에서 설명된다.
예시적 실험에서, 환경적 교란, 특히 코엔자임 Q10에 의한 치료가 존재하거나 존재하지 않는 상황에서, 암 라인 PaCa2, HepG2, PC3과 MCF7, 및 정상 세포 라인 THLE2과 HDFa는 각 고혈당증, 저산소 상태, 및 젖산 풍부 조건 및, 세 조건 중 둘 또는 셋의 조합의 조건을 겪게 된다. 본 명세서의 이하에서는 교란, 코엔자임 Q10 치료가 존재하거나 존재하지 않는 상황에서의 이러한 조건들의 예시적 조합이 열거되며, 이들은 암 세포 모델의 암 세포 및/또는 제어(예를 들어, 정상) 세포를 치료하는데 사용될 수 있다. 수행되는 특정한 조사적 생물학적 평가에 따라 다른 조합이 쉽게 형성될 수 있다.
1. 매체만 존재
2. 50 μM CTL 코엔자임 Q10
3. 100 μM CTL 코엔자임 Q10
4. 12.5 mM 젖산
5. 12.5 mM 젖산 + 50 μM CTL 코엔자임 Q10
6. 12.5 mM 젖산 + 100 μM CTL 코엔자임 Q10
7. 저산소 상태
8. 저산소 상태 + 50 μM CTL 코엔자임 Q10
9. 저산소 상태 + 100 μM CTL 코엔자임 Q10
10. 저산소 상태 + 12.5 mM 젖산
11. 저산소 상태 + 12.5 mM 젖산 + 50 μM CTL 코엔자임 Q10
12. 저산소 상태 + 12.5 mM 젖산 + 100 μM CTL 코엔자임 Q10
13. 매체 + 22 mM 글루코스
14. 50 μM CTL 코엔자임 Q10 + 22 mM 글루코스
15. 100 μM CTL 코엔자임 Q10 + 22 mM 글루코스
16. 12.5 mM 젖산 + 22 mM 글루코스
17. 12.5 mM 젖산 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10
18. 12.5 mM 젖산 + 22 mM 글루코스 +100 μM CTL 코엔자임 Q10
19. 저산소 상태 + 22 mM 글루코스
20. 저산소 상태 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10
21. 저산소 상태 + 22 mM 글루코스 + 100 μM CTL 코엔자임 Q10
22. 저산소 상태 +12.5 mM 젖산 + 22 mM 글루코스
23. 저산소 상태 +12.5 mM 젖산 + 22 mM 글루코스 + 50 μM CTL 코엔자임 Q10
24. 저산소 상태 + 12.5 mM 젖산 + 22 mM 글루코스 +100 μM CTL 코엔자임 Q10
특정한 상황에서, 서로 다른 암 세포들(예를 들어, HepG2 및 PaCa2) 사이의 상호 대화 또는 ECS 실험은 다양한 상호 연관된 목적을 위해 수행될 수 있다. 상호 대화를 포함하는 일부 실시예에서, 세포 모델에 대해 수행된 실험들은 특정 세포 시스템 또는 군집(예를 들어, 간암종 세포 HepG2)의 세포의 상태 또는 기능에 대한 정의된 치료 조건(예를 들어, 고혈당증, 저산소 상태(국소 빈혈)) 하의 또 다른 세포 시스템 또는 군집 (예를 들어, 췌장 관련 암 PaCa2)에 의한 조절을 결정하도록 설계되었다. 일반적인 설정에 따르면, 제 1 세포 시스템 / 군집은 후보 분자 (예를 들어, 소형 약 분자, 단백질) 또는 후보 조건 (예를 들어, 저산소 상태, 고 글루코스 환경)과 같은 외부 자극 성분과 접촉된다. 반응에서, 제 1 세포 시스템 / 군집은그 전사체, 단백질체, 대사체, 및/또는 상호작용체를 변화시키며, 세포의 내부와 외부 모두에서 쉽게 탐지될 수 있는 변화에 이르게 된다. 예를 들어, 전사체에서의 변화는 다수의 타겟 mRNAs의 전사 수준에 의해 측정될 수 있고, 단백질체에서의 변화 다수의 타겟 단백질들의 발현 수준에 의해 측정될 수 있으며, 대사체에서의 변화는 특히 주어진 대사 물질에 대해 설계된 분석에 의해 다수의 타겟 대사 물질의 수준에 의해 측정될 수 있다. 대체적 방법으로, 대사체 및/또는 단백질체에서 최소한 특정한 분비 대사 물질 또는 단백질에 대한 위의 기준적 변화 또한 전사체, 단백질체, 대사체, 및 제 2 세포 시스템 / 군집의 상호 작용체의 조절을 포함하여 이들이 제 2 세포 시스템 / 군집에 미치는 영향에 의해 측정될 수 있다. 따라서, 상기 실험은 제 1 세포 시스템 / 군집에 의해 분비된 관심 있는 분자(들)가 서로 다른 치료 조건 하의 제 2 세포 시스템 / 군집에 미치는 영향을 식별하기 위해 사용될 수 있다. 상기 실험은 또한 제 1 세포 시스템(외부 자극 성분 치료에 대한 반응으로)으로부터 또 다른 세포 시스템으로의, 예를 들어, 단백질체학의 분별 선별에 의한 신호 전달의 결과로 조절되는 어느 하나의 단백질을 식별하기 위해 사용될 수 있다. 동일한 실험적 설정이 반대의 설정에 적응되어, 두 세포 시스템 사이의 상호 효과 또한 분석되도록 할 수도 있다. 이러한 유형의 실험에 있어서, 일반적으로 세포 라인의 쌍은 근원, 질병 상태 및 세포의 기능과 같은 요소에 크게 좌우된다.
2-세포 시스템이 이러한 유형의 실험 설정에 일반적으로 포함되기는 하지만, 둘 이상의 세포 시스템에 대해서도, 예를 들어, 각각의 분리된 세포 시스템을 별도의 고체 지지체에 고정시킴으로써 유사한 실험을 설계할 수 있다.
상기 필요에 따라 구축된 암 모델은 본 명세서에서 기술된 단계들을 수행함으로써 본 발명의 플랫폼 기술의 전 단계에 걸쳐 생물학적 시스템에 고유한 인과 관계를 궁극적으로 식별하기 위해 수립되거나 사용될 수 있다. 그러나, 해당 분야의 통상의 기술자라면, 초기의 “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 사용된 암 모델이, 예를 들어, 추가적인 암 또는 정상 세포 라인 및/또는 추가적인 암 조건의 도입에 의해 시간이 지남에 따라 “지속적으로 진화 또는 확장할 수 있다”는 것을 인식할 수 있을 것이다. 진화한 암 모델로부터의 추가적인 데이터, 즉, 암 모델의 새롭게 추가된 부분(들)으로부터의 데이터가 수집될 수 있다. 확장되거나 진화된 암 모델, 즉, 암 모델의 새롭게 추가된 부분(들)으로부터 수집된 이러한 새로운 데이터는 보다 견고한 “제 2 세대” 합치 인과 관계 네트워크를 생성하기 위해 다시 이전에 “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 생성된 데이터 집합에 도입될 수 있다. 암 상태(또는 암 상태의 교란에 대한 반응에 고유한)에 고유한 새로운 인과 관계는 이 후 “제 2 세대” 합치 인과 관계 네트워크로부터 식별될 수 있다. 이러한 방식으로, 암 모델의 진화가 합치 인과 관계 네트워크의 진화를 제공하며, 이에 의해 암 상태의 결정론적 추진 인자 (또는 조절 인자)로의 새로운 통찰 및/또는 보다 신뢰성 있는 통찰을 제공한다.
(iii) 당뇨/비만/심장병 세포 모델
생물학적 시스템 또는 과정의 다른 예는 당뇨, 비만 및 심장병이다. 암과 마찬가지로, 당뇨, 비만 및 심장병과 관련된 질병 상태는 다중의 특이한 측면으로 특징지워지는 복잡한 병리학적 조건을 가진다. 당뇨/비만/ 심장병의 발병을 추진하는 단백질/경로가 관심사일 수 있다. 정상 세포의 반응과 비교하여 당뇨/비만/심장병의 약제 치료와 관련된 세포의 고유한 반응을 판독하는 것이 관심사일 수도 있다. 이러한 목적을 위해, 적절한 세포 라인을 선택하고 및 질병 상태 또는 과정의 특징적 측면을 모방하는 세포 배양 조건을 생성함으로써 질병 관련 세포가 경험하는 환경을 모의하기 위한 필요에 따라 구축된 당뇨/비만/심장혈관 모델이 수립될 수 있다. 예를 들어, 고혈당증, 고지혈증, 고인슐린증, 저산소 상태 또는 젖산이 풍부한 조건을 매우 가까이 근사하는 세포 배양 조건이 선택될 수 있다.
당뇨/비만/심장병과 관련된 어떠한 세포도 당뇨/비만/심장병 모델에 포함될 수 있다. 당뇨/비만/심장병과 관련된 세포의 예는, 예를 들어, 지방 세포, 근관 세포, 간 세포, 대동맥의 평활근 세포(HASMC) 및 기부 관상 세포(예를 들어, HK2)를 포함한다. 단일 세포 유형과는 달리, 같거나 다른 근원의 다중 세포 유형이 당뇨/비만/심장병 모델에 포함될 수 있다. 일 실시예에서, 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 또는 그 이상의 서로 다른 세포 유형들이 상기 당뇨/비만/심장병 모델에 포함된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 세포의 세포 유형일 수 있다. 일 실시예에서, 상기 세포들은 모두 동일한 유형, 예를 들어, 모두 지방 세포이지만, 세포 라인들은 예를 들어, 다르게 수립된 지방 세포의 세포 라인과 같이, 다르게 수립된 지방 세포의 세포 라인이다. 당뇨/비만/심장병 상태와 관련되는 다수의 다른 세포 유형이 해당 분야에서 알려져 있으며, 이러한 어떠한 세포도 본 발명의 당뇨/비만/심장병 모델에 포함될 수 있다.
본 발명의 당뇨/비만/심장병 세포 모델은 하나 또는 그 이상의 “제어 세포”를 포함할 수 있다. 일 실시예에서, 제어 세포는 처리되지 않거나 또는 교란되지 않은 질병 관련 세포, 예를 들어, 고지질증 또는 고인슐린증 조건에 노출된 세포이다. 또 다른 실시예에서, “제어 세포”는 상피 세포와 같은 질병과 관련되지 않은 세포일 수 있다. 다수의 질병과 관련되지 않은 세포 중 어느 하나가 상기 세포 모델에 포함될 수 있다. 일 실시예에서, 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 또는 그 이상의 질병에 관련되지 않은 세포 유형이 세포 모델에 포함된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 또는 5와 15 사이의 서로 다른 질병에 관련되지 않은 세포 라인 또는 세포 유형일 수 있다. 일 실시예에서, 상기 질병에 관련되지 않은 세포는, 예를 들어, 모두 건강한 상피의 또는 유방 세포와 같이 모두 같은 유형이지만, 다르게 수립된 세포 라인, 예를 들어, 다르게 수립된 상피의 또는 유방 세포의 세포 라인일 수 있다. 일 실시예에서, 당뇨/비만/심장병에 고유한 단백질 또는 경로를 식별하기 위해 하나 또는 그 이상의 질병과 관련되지 않은 세포 라인들이 제어로서 유사한 조건 하에서 배양되고, 또한/또는 세포 모델의 질병과 관련된 세포와 동일한 교란에 노출된다.
필요에 따라 구축된 당뇨/비만/심장병 모델은 또한 당뇨/비만/심장병의 상태 또는 과정의 (이의 생리병리학을 나타내는) 특징적 측면을 모방하는 세포 배양 조건을 포함할 수 있다. 예를 들어, 세포 배양 조건을 환경 생체 내 당뇨/비만/심장병과 관련된 세포의 조건을 매우 가깝게 근사하거나, 당뇨/비만/심장병의 여러 측면을 모방하도록 선택할 수 있다. 일부 경우에 상기 세포 배양 조건은 스트레스 조건일 수 있다.
당뇨/ 비만/ 심장병의 생리병리학을 나타내는 예시적 조건은, 예를 들어, 어느 하나 또는 그 이상의 저산소 상태, 젖산 풍부 조건, 고혈당증, 고 리미드 증세 및 고인슐린증을 포함한다. 저산소 상태는 세포 내에서 해당 분야에 알려진 방법을 사용하여 유도될 수 있다. 예를 들어, 저산소 상태는 세포 시스템을 5% CO2, 2% O2 및 93% 질소를 포함하는 산업용 기체로 흘러 넘치게 할 수 있는 모듈라 배양기 챔버(MIC-101, Billups-Rothenberg Inc. Del Mar, CA)내에 위치시킴으로써 유도될 수 있다. 효과는 소정의 시간 이후, 예를 들어, 저산소 상태 치료 후 24시간 이후에, 추가적인 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 부존재 하에서 측정될 수 있다.
마찬가지로, 세포의 젖산 치료는 종양 환경 생체 내에 존재하는 방식의 해당 과정 활성이 높은 세포 환경을 모방한다. 젖산 유도 스트레스는 소정의 시간, 예를 들어, 24 시간에서 외부 자극 성분(예를 들어, 0, 50, 또는 100 μM에서의 CoQ10)의 존재 또는 비 존재 하에서 약 12.5 mM의 최종 젖산 농도로 조사될 수 있다. 고혈당증은 당뇨에서 발견되는 조건이다. 대상 세포를 일반적인 고혈당 조건에 노출시키는 것은 매체 내 글루코스의 최종 농도가 약 22 mM가 되도록 10% 배양 급 글루코스를 적절한 매체에 추가하는 것을 포함할 수 있다. 고지혈증은 비만 및 심장병에서 발견되는 조건이다. 이러한 고지질증 조건은 세포를 0.15 mM 나트륨 팔미테이트를 함유하는 매체 내에서 배양함으로써 제공될 수 있다. 고인슐린증은 당뇨에서 발견되는 조건이다. 이러한 고인슐린증 조건 세포를 1000 nM 인슐린을 함유하는 매체에서 배양함으로써 유도될 수 있다.
당뇨/ 비만/ 심장병의 생리병리학을 나타내는 추가적 조건은, 예를 들어, 하나 또는 그 이상의 감염, 소포체 스트레스, 미토콘드리아의 스트레스 및 퍼옥시즘 스트레스이다. 세포 내의 감염과 유사한 조건을 생성하는 방법은 해당 분야에서 알려져 있다. 예를 들어, 감염 조건은 세포를 TNF알파 및/또는 IL-6의 존재 하에서 배양함으로써 모의될 수 있다. 소포체 스트레스를 모의하는 조건을 생성하는 방법 또한 해당 분야에서 알려져 있다. 예를 들어, 소포체 스트레스를 모의하는 조건은 세포를 탭시가긴 및/또는 트니카미신의 존재 하에서 배양함으로써 생성될 수 있다. 미토콘드리아의 스트레스를 모의하는 조건을 생성하는 방법 또한 해당 분야에서 알려져 있다. 예를 들어, 미토콘드리아의 스트레스를 모의하는 조건은 세포를 라파미신 및/또는 갈락토제의 존재 하에 배양함으로써 생성될 수 있다. 퍼옥시즘 스트레스를 모의하는 조건을 생성하는 방법 또한 해당 분야에서 알려져 있다. 예를 들어, 퍼옥시즘 스트레스를 모의하는 조건은 세포를 낙엽산의 존재 하에 배양함으로써 생성될 수 있다.
당뇨/비만/심장병의 다른 측면을 반영하는 개별적 조건들이 필요에 따라 구축된 당뇨/비만/심장병 모델에서 별도로 조사되고, 또한/또는 함께 조합되어 조사될 수 있다. 일 실시예에서, 서로 다른 측면의 당뇨/비만/심장병을 반영하거나 모의하는 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 당뇨/비만/심장병 모델에서 조사된다. 일 실시예에서, 서로 다른 측면의 당뇨/비만/심장병을 반영하거나 모의하는 개별적 조건들 및, 이에 추가하여, 최소한 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 40, 50 또는 그 이상의 조건들의 조합이 필요에 따라 구축된 당뇨/비만/심장병 모델에서 조사된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이, 또는 10와 50 사이의 서로 다른 조건일 수 있다.
일단 필요에 따라 구축된 세포 모델이 구축되면, 하나 또는 그 이상의 환자에서 환자로의 유전학적 변이, 또는 특정 약제 또는 사전 약제에 의한 치료 또는 비치료와 같은 “교란” 이 상기 시스템에 적용될 수 있다. 이에 대해 도 15D를 참조한다. 이러한 교란이 당뇨/비만/심장병 관련 세포를 포함하여 세포 모델 시스템에 미치는 영향은 해당 분야에서 인식되거나 특정적으로 수행되는 여러 수단을 사용하여 측정될 수 있으며, 이러한 수단들은 아래 제 III.B절에서 설명된다.
예시적 실험에서, 각각의 지방 세포, 근관 세포, 간 세포, 대동맥의 평활근 세포(HASMC) 및 기부 관상 세포(HK2)는 각각의 고혈당증, 저산소 상태, 고지혈증, 고인슐린증, 및 젖산 풍부 조건과 함께 이들 각 조건의 둘, 셋, 넷 및 다섯 개의 조합의 조건을 겪게 되며, 추가적으로, 환경적 교란의 존재 또는 비 존재 하에서, 코엔자임 Q10로서 특별하게 치료된다. 암 모델과 관련하여 위에서 설명한 조건들의 예시적 조합과 더불어, 본 명세서의 이하 기술에서 일부 추가적인 조건들의 교란의 존재 또는 부존재 하에서의 예시적 조합이 열거되며, 이들은, 예를 들어, 당뇨/비만/심장병 세포 모델의 당뇨/비만/심장병 관련 세포(및/또는 제어 세포)를 치료하기 위해 사용될 수 있는 코엔자임 Q10 치료이다. 이는 단순히 예시적인 목적으로 제시된 것이며, 해당 분야의 통상의 기술자라면 당뇨/ 비만/ 심장병의 생리병리학을 나타내는 상기 언급한 조건들의 개별적 및/또는 조합이 세포 모델에서 출력 데이터 집합을 생성하기 위해 채택될 수 있다는 것을 인식할 수 있을 것이다. 수행되는 특정한 조사적 생물학적 평가에 따라 다른 조합들이 쉽게 형성될 수 있다.
1. 매체만 존재
2. 50 μM CTL 코엔자임 Q10
3. 100 μM CTL 코엔자임 Q10
4. 0.15 mM 나트륨 팔미테이트
5. 0.15 mM 나트륨 팔미테이트 + 50 μM CTL 코엔자임 Q10
6. 0.15 mM 나트륨 팔미테이트 + 100 μM CTL 코엔자임 Q10
7. 1000 nM 인슐린
8. 1000 nM 인슐린 + 50 μM CTL 코엔자임 Q10
9. 1000 nM 인슐린 + 100 μM CTL 코엔자임 Q10
10. 1000 nM 인슐린 + 0.15 mM 나트륨 팔미테이트
11. 1000 nM 인슐린 + 0.15 mM 나트륨 팔미테이트 + 50 μM CTL 코엔자임 Q10
12. 1000 nM 인슐린 + 0.15 mM 나트륨 팔미테이트 + 100 μM CTL 코엔자임 Q10
특정한 상황에서, 서로 다른 질병 관련 세포들(예를 들어, HASMC 및 HK2 세포, 또는 간 세포 및 지방 세포) 사이의 상호 대화 또는 ECS 실험은 다양한 상호 연관된 목적을 위해 수행될 수 있다. 상호 대화를 포함하는 일부 실시예에서, 세포 모델에 대해 수행된 실험들은 특정 세포 시스템 또는 군집(예를 들어, 간 세포)의 세포의 상태 또는 기능에 대한 정의된 치료 조건(예를 들어, 고혈당증, 저산소 상태, 고지혈증, 고인슐린증) 하의 또 다른 세포 시스템 또는 군집 (예를 들어, 지방 세포)에 의한 조절을 결정하도록 설계되었다. 일반적인 설정에 따르면, 제 1 세포 시스템 / 군집은 후보 분자 (예를 들어, 소형 약 분자, 단백질) 또는 후보 조건 (예를 들어, 저산소 상태, 고 글루코스 환경)과 같은 외부 자극 성분과 접촉된다. 반응에서, 제 1 세포 시스템 / 군집은 그 전사체, 단백질체, 대사체, 및/또는 상호작용체를 변화시키며, 세포의 내부와 외부 모두에서 쉽게 탐지될 수 있는 변화에 이르게 된다. 예를 들어, 전사체에서의 변화는 다수의 타겟 mRNAs의 전사 수준에 의해 측정될 수 있고, 단백질체에서의 변화 다수의 타겟 단백질들의 발현 수준에 의해 측정될 수 있으며, 대사체에서의 변화는 특히 주어진 대사 물질에 대해 설계된 분석에 의해 다수의 타겟 대사 물질의 수준에 의해 측정될 수 있다. 대체적 방법으로, 대사체 및/또는 단백질체에서 최소한 특정한 분비 대사 물질 또는 단백질에 대한 위의 기준적 변화 또한 전사체, 단백질체, 대사체, 및 제 2 세포 시스템 / 군집의 상호 작용체의 조절을 포함하여 이들이 제 2 세포 시스템 / 군집에 미치는 영향에 의해 측정될 수 있다. 따라서, 상기 실험은 제 1 세포 시스템 / 군집에 의해 분비된 관심있는 분자(들)가 서로 다른 치료 조건 하의 제 2 세포 시스템 / 군집에 미치는 영향을 식별하기 위해 사용될 수 있다. 상기 실험은 또한 제 1 세포 시스템(외부 자극 성분 치료에 대한 반응으로)으로부터 또 다른 세포 시스템으로의, 예를 들어, 단백질체학의분별 선별에 의한 신호 전달의 결과로 조절되는 어느 하나의 단백질을 식별하기 위해 사용될 수 있다. 동일한 실험적 설정이 반대의 설정에 적응되어, 두 세포 시스템 사이의 상호 효과 또한 분석되도록 할 수도 있다. 이러한 유형의 실험에 있어서, 일반적으로 세포 라인의 쌍은 근원, 질병 상태 및 세포의 기능과 같은 요소에 크게 좌우된다.
2-세포 시스템이 이러한 유형의 실험 설정에 일반적으로 포함되기는 하지만, 둘 이상의 세포 시스템에 대해서도, 예를 들어, 각각의 분리된 세포 시스템을 별도의 고체 지지체에 고정시킴으로써 유사한 실험을 설계할 수 있다.
상기 필요에 따라 구축된 당뇨/비만/심장병 모델은 본 명세서에서 기술된 단계들을 수행함으로써 본 발명의 플랫폼 기술의 전 단계에 걸쳐 당뇨/비만/심장병 상태에 고유한 인과 관계를 궁극적으로 식별하기 위해 수립되거나 사용될 수 있다. 그러나, 해당 분야의 통상의 기술자라면, 암 모델과 마찬가지로, 초기의 “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 사용된 당뇨/비만/심장병 모델이, 예를 들어, 추가적인 질병 관련 세포 라인 및/또는 추가적인 질병 관련 조건의 도입에 의해 시간이 지남에 따라 “지속적으로 진화 또는 확장할 수 있다”는 것을 인식할 수 있을 것이다. 진화한당뇨/비만/심장병 모델로부터의 추가적인 데이터, 즉, 암 모델의 새롭게 추가된 부분(들)으로부터의 데이터가 수집될 수 있다. 확장되거나 진화된 암 모델, 즉, 암 모델의 새롭게 추가된 부분(들)으로부터 수집된 이러한 새로운 데이터는 보다 견고한 “제 2 세대” 합치 인과 관계 네트워크를 생성하기 위해 다시 이전에 “제 1 세대” 합치 인과 관계 네트워크를 생성하기 위해 생성된 데이터 집합에 도입될 수 있다. 당뇨/비만/심장병 상태(또는 당뇨/비만/심장병 상태의 교란에 대한 반응에 고유한)에 고유한 새로운 인과 관계는 이후 “제 2 세대” 합치 인과 관계 네트워크로부터 식별될 수 있다. 이러한 방식으로, 당뇨/비만/심장병 모델의 진화가 합치 인과 관계 네트워크의 진화를 제공하며, 이에 의해 당뇨/비만/심장병 상태의 결정론적 추진 인자(또는 조절 인자)로의 새로운 통찰 및/또는 보다 신뢰성 있는 통찰을 제공한다.
B.
조사적 생물학적 평가를 위한 세포 모델의 사용
본 발명에서 제공되는 방법 및 세포 모델은 임의의 개수의 “조사적 생물학적 평가”를 위해 사용되거나 이에 적용될 수 있다. 조사적 생물학적 평가를 의한 본 발명의 방법의 사용은 생물학적 시스템의 “조절 인자” 또는 결정론적 세포 과정 “추진 인자”의 식별을 빠르게 수행하도록 해 준다.
본 명세서에서 사용되는, “조사적 생물학적 평가”는 생물학적 시스템의 하나 또는 그 이상의 조절 인자, 예를 들어, 환경적 교란 또는 외부 자극 성분과 연관된 결정론적 세포 과정 “추진 인자”(예를 들어, 생물학적 경로, 또는 경로의 핵심 멤버, 또는 경로의 멤버의 핵심 조절자의 활성에 있어서의 증가 또는 감소), 또는 생물학적 시스템 또는 과정에 고유한 특유 인과 관계의 식별을 포함한다. 이는 상기 식별된 결정론적 세포 과정 추진 인자가 생체 내 동물 모델 및/또는 생체 외 조직 배양 실험을 포함하는 환경적 교란 또는 외부 자극 성분과 연관된 하향 이벤트에 필요하고, 또한/또는 충분한 지를 검사하거나 증명하기 위해 설계된 추가적 단계를 더 포함할 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 질병 상태의 진단 또는 단계 파악이며, 이때 상기 식별된 생물학적 시스템의 조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 치료적 시술을 받을 수 있는 질병 표지 인자 또는 치료적 타겟을 나타낸다. 상기 대상의 조사적 생물학적 평가는 이론적으로는 어떠한 질병 조건에도 적절하지만, 종양학 / 암 생물학, 당뇨, 비만, 심장병, 및 신경학적 조건(특히 한정됨이 없이 알츠하이머 질병, 파킨슨 씨 병, 헌팅턴 질병, 루게릭 병(ALS), 및 노화 관련 신경 퇴행성 질환과 같은 퇴행성 신경 질병)과 같은 영역에서 특히 유용한 것으로 밝혀질 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 약의 효능의 결정이며, 이때 상기 식별된 생물학적 시스템의 조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자 (예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 성공적인 약제의 전형적 특징이며, 다시 MIM 또는 에피시프터(epishifter)와 같은 동일한 질병 조건을 치료하기 위한 추가적 제제를 식별하기 위해 사용될 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 감염(예를 들어, 박테리아 또는 바이러스 감염)을 예방하고 치료하기 위한 약제 타겟의 식별이며, 이때 상기 식별된 생물학적 시스템의 조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 감염 상태를 야기하는 표지 인자/지표 또는 핵심 생물학적 분자일 수 있으며, 다시 항 감염 제제를 식별하기 위해 사용될 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 주어진 질병 프로필에서 제제, 예를 들어, 약제의 분자에 대한 효과에 대한 평가이며, 이때 상기 식별된 생물학적 시스템의조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 하나 또는 그 이상의 생물학적 경로, 또는 경로(들)의 핵심 멤버, 또는 경로(들)의 멤버의 핵심 조절자의 활성에 있어서의 증가 또는 감소일 수 있으며, 또한, 예를 들어, 주어진 질병에 대한 제제의 치료적 효능을 예측하기 위해 사용될 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 제제, 예를 들어, 약제의 세포, 조직, 기관 또는 기관계에 대한 독성의 프로필의 평가이며, 이때 상기 식별된 생물학적 시스템의 조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 독성, 예를 들어, 세포 독성의 지표이며, 다시 제제의 독성의 프로필을 예측하거나 식별하기 위해 사용될 수 있다. 일 실시예에서, 상기 식별된 생물학적 시스템의 조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 약제 또는 약제 후보의 심장 독성의 지표일 수 있으며, 이는 다시 약제 또는 약제 후보의 심장 독성 프로필을 예측하거나 식별하기 위해 사용될 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 질병 야기 원생동물, 균류, 박테리아, 대항체, 바이러스, 또는 독소와 같은 생물학적 무기에 의해 야기되는 질병 또는 질환을 예방하거나 치료하기 이한 제약 타겟의 식별이며, 이때 상기 식별된 생물학적 시스템의조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 상기 질병 또는 질환을 야기하는 표지 인자/지표 또는 핵심 생물학적 분자일 수 있으며, 이는 다시 생물학적 방어 제제를 식별하기 위해 사용될 수 있다.
특정 실시예에서, 상기 조사적 생물학적 평가는 노화 방지 화장품과 같은 노화 방지 제제의 타겟의 식별이며, 이때 상기 식별된 생물학적 시스템의조절 인자, 예를 들어, 결정론적 세포 과정 추진 인자(예를 들어, 세포 간 상호 대화 분별 또는 생물학적 시스템 또는 과정에 고유한 인과 관계)는 상기 노화 과정, 특히 피부에서의 노화 과정의 표지 인자 또는 지표일 수 있으며, 이는 다시 노화 방지 제제의 식별을 위해 사용될 수 있다.
노화 방지 화장품에 대한 타겟을 식별하기 위한 본 발명의 방법에서 사용된 하나의 예시적 세포 모델에서, 상기 세포 모델은 노화하는 상피의 세포, 즉, 예를 들어, 자외선 (환경적 교란 또는 외부 자극 성분)으로 처리된 세포, 및/또는 역시 선택적으로 자외선으로 처리된 신생아의 세포를 포함한다. 일 실시예에서, 노화에 대한 세포 모델은 세포 간 상호 대화 시스템을 포함한단. 노화 방지 화장품에 대한 타겟을 식별하기 위해 수립된 한 예시적 2-세포 상호 대화 시스템, 노화하는 상피 세포(제 1 세포 시스템)는 자외선(외부 자극 성분)으로 처리될 수 있으며, 신생아의 세포(제 2 세포 시스템)에서의 변화, 예를 들어, 신생아의 세포를 상기 처리된 노화하는 상피의 세포의 조건이 가해진 매체에 접촉시킨 결과로 발생하는 단백질체의 변화 및/또는 기능적 변화가 측정될 수 있으며, 이때, 예를 들어, 단백질체 변화는 통상의 정량적 질량 분광학을 사용하여 측정될 수 있거나, 노화에 고유한 인과 관계는 데이터로부터 생성된 인과 관계 네트워크로부터 식별될 수 있다.
V.
단백체
표본 분석
특정 실시예에서, 본 발명의 방법은 유사한 성격의 수 백개의 표본의 대규모의 고 성능 출력 정량적 단백질체의 분석을 채택하며, 세포의 출력 분별을 식별하기 위해 필요한 데이터를 제공한다.
이러한 목적으로 사용하기에 적절한 기술들이 해당 분야에서 다수 인식되고 있다. 예시적 기술로서, 질량 분광학을 사용한 조합에서의 iTRAQ 분석이 이하에서 간단히 설명된다.
iTRAQ 기술을 사용한 상대적 정량화의 기준 표본을 제공하기 위해, 다중 QC 풀이 생성된다. 각 표본의 부분 표본으로 구성되는 두 개의 분리된 QC 풀이, 각각 QCS1 및 QCS2로 표기되는 세포 #1 및 세포 #2 표본 및 상층액 및 펠릿에 대한 각각의 QCP1 및 QCP2 으로부터 생성된다. 두 세포 라인에 걸친 단백질 농도 비교를 가능하게 하기 위해, 상기 기술된 QC 풀로부터의 세포 펠릿 부분 표본이 동일한 부피로 결합되어 기준 표본(QCP)을 생성한다.
정량적 단백체 접근 방법은 8-plex iTRAQ 반응 제제를 사용하는 안정된 동위원소 라벨링 및 펩티드 식별 및 정량화를 위한 2D-LC MALDI MS/MS에 기반한다. 이러한 기술을 사용한 정량화는 상대적이다: 펩티드 및 단백질은 기준 표본에 상대적인 존재 비율이 지정된다. 다중 iTRAQ 실험에서의 공통된 기준 표본이 다중 iTRAQ 실험에 걸쳐 표본의 비교를 쉽게 수행할 수 있도록 해준다.
이러한 분석 방법 체제를 구현하기 위해, 여섯 개의 주요 표본 및 두 개의 제어 풀 표본이 하나의 8-plex iTRAQ 혼합물로 결합되며, 이때 상기 제어 풀 표본은 제조사의 제시에 따라 113 및 117 반응 제제로 라벨링된다. 이러한 여덟 개 표본의 혼합물은 이후 다음과 같은 이차원 액체 크로마토그래피에 의해 분별된다; 제 1 차원에서의 강한 양이온 교환 (SCX), 및 제 2 차원에서의 역위상 HPLC. 상기 HPLC 용해 분리물은 MALDI 플레이트 상에서 직접적으로 구분되며, 상기 플레이트는 MDS SCIEX/AB 4800 MALDI TOF/TOF 질량 분광계 상에서 분석된다.
추가적인 정보가 부재한 상황에서, 단백질 발현에서 가장 중요한 변화는 다른 치료 조건 하에서 동일한 세포 유형의 변화인 것으로 가정한다. 이러한 이유로, 세포#1 및 세포#2로부터의 주요 표본들은 별도의 iTRAQ 혼합물에서 분석된다. 세포#1 대 세포#2 표본 내에서의 단백질 발현의 비교를 보다 쉽게 하기 위해, 보편적 QCP 표본이 주요 표본 또는 세포 라인 특정 QC 표본(QC1 및 QC2)에 의해 점유되지 않는 가용한 “iTRAQ 슬롯”에서 분석된다.
채택된 실험실 절차가 아래에서 간단히 검토된다.
A.
세포
상층액
표본으로부터의 단백질 추출
세포 상층액 표본(CSN)에 대해, 배양 매체로부터의 단백질이 매우 과량으로 배양된 세포에서 분비된 단백질 상에 존재한다. 이러한 배경을 감소시키기 위한 시도로서, 전면에 존재하는 단백질의 고갈이 구현된다. 특정한 친화성 기둥이 소과 또는 말의 혈청 단백질에 대해서는 사용할 수 없기 때문에, 항인간 IgY14 기둥이 사용되었다. 항체가 인간 단백질에 대해 가해지는 동안, 항체의 다중 복제성 특성에 의해 제공되는 광범위한 특정성이 사용된 세포 배양 매체 내에 존재하는 소 및 말의 단백질의 고갈을 성취할 것으로 예상된다.
CSN QC 물질의 200-μl 부분 표본이 뒤따르는 물질에서의 전체 단백질 농도를 결정하기 위한 연구(바이신코닉 산(BCA) 분석)를 시작하기 전에 10-mL IgY14 고갈 기둥 상에 적재된다. 이후 적절한 양의 40 μg 전체 단백질을 함유하는 고갈 부분을 성취하기 위해 적재 부피가 선택된다.
B
.
세포 펠릿으로부터의 단백질 추출
세포 #1 및 세포 #2의 부분 표본이 BGM에서의 조직 표본의 분석에 사용되는 “표준” 용균 버퍼 내에 용해되고, 전체 단백질 내용물이 BCA 분석에 의해 결정된다. 이들 대표적인 세포 용해물의 단백질 내용들이 확립되면, 모든 세포 펠릿 표본(제 1.1절에서 기술된 QC 표본을 포함)들이 세포 용해물로 처리된다. 약 40 μg의 전체 단백질 양의 용해물이 과정의 작업 절차에서 흐르게 된다.
C
.
질량 분광학을 위한 표본 준비
표본 준비는 표준 작업 절차를 따르며 다음과 같이 구성된다:
단백질의 환원 및 알킬화
역 위상 컬럼에서의 단백질 세척(세포 펠릿에만 적용)
트립신에 의한 소화
iTRAQ 라벨링
강한 양이온 교환 크로마토그래피 - 여섯 부분의 수집(아질란트(Agilent) 1200 시스템)
HPLC 분별 및 MALDI 플레이트의 위치 식별(Dionex Ultimate3000/Probot 시스템)
D.
MALDI
MS
및
MS
/
MS
HPLC-MS는 일반적으로 온라인 ESI MS/MS 전략을 채택한다. BG 의약품은 동일한 표본을 여러 번 주입할 필요가 없이 결과적으로 주 표본에 걸쳐 관측된 단백질 집합의 보다 나은 일치를 가져올 수 있는 오프라인 LC-MALDI MS/MS 플랫폼을 사용한다. 모든 iTRAQ 혼합물에 걸친 첫 번째 데이터 수집 절차에 이어, 펩티드 부분이 MALDI 타겟 플레이트에 계속 남아 있기 때문에, 상기 표본은 타겟이 맞추어진 제 1 획득에서 얻은 지식으로부터 도출된 MS/MS 획득 패턴을 사용하여 두 번째로 분석될 수 있다. 이러한 방식으로, 식별된 모든 단백질에 대한 최대 관찰 빈도를 성취할 수 있다(이상적으로, 모든 단백질은 모든 iTRAQ 혼합에서 측정되어야 한다).
E.
데이터 처리
BGM 단백질체학 작업 흐름 내에서의 데이터 처리 과정은 각각의 iTRAQ 혼합에 대해 개별적으로 완수되는 예비 펩티드 식별 및 정량화와 같은 절차(제 1.5.1절) 및 프로젝트를 위한 데이터 획득이 완료될 때까지는 완수되지 않는 단백질에 대한 펩티드의 최종 지정 및 단백질의 최종 정량화와 같은 과정(제 1.5.2절)으로 나누어질 수 있다.
BGM 단백질체학 내에서의 주요 데이터 처리 단계는 다음과 같다:
마스코트(매트릭스 과학) 데이터베이스 탐색 엔진을 사용한 펩티드 식별
자동화된 실험실 내 마스코트 ID 증명
펩티드의 정량화 및 단백질의 사전 정량화
최종 데이터 집합의 전문가 큐레이션
자동화된 PVT 도구를 사용한 각 혼합물로부터 공통된 집합의 단백질로의 펩티드의 최종 지정
극단치 제거 및 단백질의 최종 정량화
(i) 개별적 iTRAQ혼합물의 데이터 처리
각각의 iTRAQ 혼합물이 작업 흐름을 통해 처리됨에 따라 MS/MS 스펙트럼이 정량화 정보의 초기 평가와 함께 펩티드 및 단백질 식별을 위한 특정회사의 BGM 소프트웨어 도구를 사용하여 분석된다. 이러한 사전 분석 결과를 바탕으로, 혼합물 내 각 주요 표본에 대한 작업 흐름의 질이 BGM 성능 척도에 대해 결정된다. 주어진 표본 (또는 혼합물)이 특정한 최소 척도를 통과하지 못하고 추가적인 물질을 사용할 수 있는 경우, 해당 표본은 전체적으로 반복 수행되며 이러한 작업 흐름의 2차적 수행에서 얻은 데이터가 최종 데이터 집합에 통합된다.
(ii) 펩티드 식별
MS/MS 스펙트럼이 돼지의 트립신과 같은 통상의 오염 염기서열을 사옹하여 증폭된 인간, 소과 동물 및 말의 염기서열을 포함하는 유니프롯(Uniprot) 단백질 염기서열 데이터베이스에 대해 탐색된다. 마스코트 탐색 매개변수의 상세 사항은, 수정의 완전한 목록을 포함하여, 표 3에서 주어진다.
표 3 : 마스코트 검색 매개변수
전구체 질량 허용치 | 100 ppm |
파편 질량 허용치 | 0.4 Da |
변수 수정 | N-항 iTRAQ8 라이신 iTRAQ8 시스 카르바미도메틸 파이로-글루 (N-항) 파이로-카르바미도 메틸 시스(N-항) 탈아미드화(N에 한함) 산화(M) |
효소 특정성 | 완전한 트립신 |
허용되는 소실된 트립신 부위의 개수 | 2 |
고려되는 펩티드 순위 | 1 |
마스코트 탐색이 완료된 이후, 자동 증명 절차가 특정한 마스코트 펩티드 합치를 촉진(즉, 증명)하기 위해 사용된다. 타당한 합치와 타당하지 않은 합치 사이의 구분은 예상된 마스코트 스코어에 상대적인 성취한 마스코트 스코어 및 랭크 1 펩티드와 랭크 2 펩티드 마스코트 스코어 사이의 차이에 기반한다. 펩티드가 iTRAQ 혼합물 내에서 단일 단백질에 합치되는 여러 팹티드 중 하나이거나 상기 펩티드가 이전에 증명된 펩티드의 카탈로그 내에 존재하는 경우, 증명에 필요한 기준은 다소 완화된다.
(iii) 펩티드 및 단백질 정량화
각 혼합물에 대한 증명된 펩티드들의 집합은 각 혼합물에 대해 사전 단백질 정량화 척도를 계산하기 위해 활용된다. 펩티드 비율은 증명된 각 펩티드에 대한 iTRAQ 라벨(즉, m/z 114, 115, 116, 118, 119, 또는 121)로부터의 피크 영역을 기준 풀(QC1 또는 QC2)의 피크 영역의 최선의 표현으로 나눔으로써 계산된다. 이러한 피크 영역은 양 표본 과정 QC 허용 기준에 의해 제공되는 113 및 117 피크의 평균이다. 사전 단백질 비율은 해당 단백질에 합치하는 모든 “유용한” 증명된 펩티드의 중간 비율을 계산함으로써 결정된다. “유용한” 펩티드는 완전하게 iTRAQ 라벨링되며(모든 N-단말이 라이신 또는 파이로글루(PyroGlu)로 라벨링됨) 완전하게 시스테인 라벨링된다(즉, 모든 Cys 잔여부가 카바미도 메틸 또는 N-단말 Pyro-cmc로써 알킬화된다).
(iv) 획득 후 처리
MS/MS 데이터 획득의 모든 일단의 절차가 프로젝트 내의 각 혼합물에 대해 완료되면, 상기 데이터는 각각의 주 표본으로부터의 결과들이 서로 간단하고 의미있게 비교되도록 하기 위한 목적을 가지는 하기 논의되는 세 단계를 사용하여 수집, 분석된다.
(v) 펩티드 염기 서열의 단백질로의 전역 지정
펩티드 염기서열을 단백질 접근 번호에 최종적으로 지정하는 것은 특정 회사의 단백질 증명 도구(PVT)로써 수행된다. 상기 PVT 절차는 프로젝트에서 식별된 펩티드의 전체 집합을 기술하기 위한 최소한으로 반복되는 최선의 단백질 집합을 결정한다. 이는 균일한 분류 체계로부터의 데이터를 다루기 위한 자동화된 절차이다.
상층액 실험을 위한 단백질 지정은 데이터베이스 내 혼합된 독성의 복잡함을 처리하기 위해 수동으로 조절된다. 자동화된 패러다임이 소와 말의 혈청 대체 매체에서 성장한 세포 배양에 대해서는 타당하지 않기 때문에, 주어진 단백질의 소스의 애매함을 최소화하기 위해 보다 광범위한 수동 조절이 필요하다.
(vi) 펩티드 비율의 정규화
각 표본에 대한 펩티드 비율은 반데좀펠(Vandesompele) 외, 게놈 생물학, 2002, 3(7), 연구 0034.1-11의 방법을 기반으로 정규화된다. 이 절차는 세포 펠릿 측정에만 적용된다. 상층액 표본에 대해서는, 매체로부터 유래하는 펩티드 식별에 대한 가장 큰 기여를 고려하여 정량적 데이터가 정규화되지 않는다.
(vii) 단백질 비율의 최종 계산
표준 통계적 극단치 제거 절차가 로그 변환 데이터 집합에서 1.96 σ 수준을 초과하는 각 단백질 매체 비율 근처로부터의 극단치를 제거하기 위해 사용된다. 이러한 제거 과정에 이어, 단백질 비율의 최종 집합이 (재)계산된다.
VI
.
본 발명의 표지 인자 및 그 이용
본 발명은, 최소한 부분적으로는, 질병 과정과 같은 생물학적 시스템, 또는 치료용 제제와 같은 교란에 대한 생물학적 시스템의 반응과 관련된 신규의 생물학적 표지 인자의 식별에 기반한 것이다.
특히, 본 발명은 예에서 설명된 표지 인자(이하, “표지 인자” 또는 “본 발명의 표지 인자”라 한다)에 관한 것이다. 본 발명은 상기 표지 인자에 의해 부호화되거나 이에 해당하는 핵산 및 단백질(이하, 각각 “표지 인자 핵산” 및 “표지 인자 단백질”이라 한다)을 제공한다. 이러한 표지 인자들은 질병 상태를 진단하고, 질병 상태를 예단하며, 다양한 질병 상태에 대한 약제 타겟을 개발하고, 독성, 바람직하게는 약제로 유도되는 독성, 예를 들어, 심장 독성의 존재를 선별하며, 독성을 야기하거나 독성을 야기할 위험이 있는 제제를 식별하고, 약제로 유도되는 독성을 경감하고 예방할 수 있는 제제를 식별하며, 약제로 유도되는 심장 독성을 완화, 경감 또는 예방하고, 약제로 유도되는 심장 독성을 예측하는 표지 인자를 식별하는데 특히 유용하다.
"표지 인자"는 정상 또는 건강한 조직 또는 세포 내의 발현 수준으로부터 변경된 조직 또는 세포 내의 발현 수준이 암, 당뇨, 비만, 심장 혈관계 질병, 또는 약제로 유도되는 독성, 예를 들어, 심장 독성과 같은 독성 상태와 같은 질병 상태에 연관되는 유전자이다. “표지 인자 핵산”은 본 발명의 표지 인자에 의해 부호화되거나 해당 표지 인자인 핵산(예를 들어, mRNA, cDNA)이다. 이러한 표지 인자 핵산은 본 발명의 표지 인자인 특정 유전자의 전체 또는 일부의 염기서열, 또는 이러한 염기서열의 보완체를 포함하는 DNA(예를 들어, cDNA)를 포함한다. 이러한 염기서열은 해당 분야의 통상의 기술자에게 알려져 있으며, 예를 들어, NIH 정부 퍼브메드(pubmed) 웹사이트에서 찾아 볼 수 있다. 상기 표지 인자 핵산은 또한 본 발명의 유전자 표지 인자의 전체 또는 일부의 염기서열 또는 이러한 염기서열의 보완체를 포함하는 RNA를 포함하며, 이때 모든 티미딘 잔여부는 우리딘 잔여부로 대체된다. “표지 인자 단백질”은 본 발명의 표지 인자에 의해 부호화된 단백질 또는 이에 해당하는 단백질이다. 표지 인자 단백질은 본 발명의 단백질의 표지 인자의 전체 또는 일부의 염기서열을 포함한다. 이러한 염기서열은 해당 분야의 통상의 기술자에게 알려져 있으며, 예를 들어, NIH 정부 퍼브메드(pubmed) 웹사이트에서 찾아 볼 수 있다. 용어 “단백질” 및 “폴리펩티드"는 교차적으로 사용된다.
“질병 상태 또는 독성 상태 연관" 신체 체액은 환자의 신체 내에 있을 때 육종 세포를 접촉하거나 지나가는 액체, 또는 육종 세포로부터 나온 세포 또는 단백질를 지나갈 수 있는 액체이다. 예시적 질병 상태 또는 독성 상태 연관 신체 체액은 혈액(예를 들어 전체혈액, 혈청, 혈소판이 제거된 혈액)을 포함하며, 아래에서 보다 상세히 설명된다. 질병 상태 또는 독성 상태 연관 신체 체액은 전체혈액, 혈청, 혈소판이 제거된 혈액, 림프, 전립선 액, 소변 및 정액에 한정되지 않는다.
표지 인자의 "정상" 발현 수준은 인간 대상 또는 질병 상태 또는 독성 상태를 겪지 않는 환자의 세포의 표지 인자의 발현 수준이다.
표지 인자의 “과도 발현” 또는 “보다 높은 수준의 발현”은 제어 표본(예를 들어, 질병 상태 또는 독성 상태, 예를 들어, 암, 당뇨, 비만, 심장 혈관 질병, 및 심장 독성과 연관된 표지 인자를 가지지 않는 건강한 대상으로부터의 표본)내에서 발현 수준, 바람직하게는 여러 제어 표본의 표지 인자들의 평균 발현 수준과 비교하여, 발현을 분석하기 위해 채택된 분석의 표준 오류보다 큰 검사 표본에서의 발현 수준을 말하며, 바람직하게는 최소한 두 배, 보다 바람직하게는 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉 또는 열 배의 발현 수준을 말한다.
표지 인자의 “발현의 저수준”은 제어 표본(예를 들어, 질병 상태 또는 독성 상태, 예를 들어, 암, 당뇨, 비만, 심장 혈관 질병, 및 심장 독성과 연관된 표지 인자를 가지지 않는 건강한 대상으로부터의 표본)내에서 발현 수준, 바람직하게는 여러 제어 표본의 표지 인자들의 평균 발현 수준과 비교하여, 최소한 두 배, 보다 바람직하게는 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉 또는 열 배 낮은 검사 표본 내 발현 수준을 말한다.
"전사된 폴리뉴클레오타이드" 또는 “뉴클레오타이드 전사체”는 본 발명의 표지 인자 및 정상적 전사 후 처리(예를 들어 이어 맞추기)의 전사, 존재하는 경우, RNA 전사체의 전사, 및 RNA 전사체의 역 전사에 의해 만들어 지는 전부 또는 일부의 성숙한 mRNA와 보완 또는 상동인 폴리뉴클레오타이드 (예를 들어 mRNA, hnRNA, cDNA, 또는 이러한 RNA 또는 cDNA의 유사체)이다.
"보완"은 두 핵산 가닥의 영역 또는 동일한 핵산 가닥의 두 영역 사이의 넓은 개념의 염기서열 보완성을 말한다. 제 1 핵산 영역의 아데닌 잔여부가 제 1 영역과 역으로 평행한 제 2 핵산 영역의 잔여부와, 상기 잔여부가 티민 또는 우라실인 경우, 특정한 수소 결합("기반 페어링")을 형성할 수 있는 것으로 알려져 있다. 마찬가지로, 제 1 핵산 가닥의 사이토신 잔여부가 제 1 가닥과 역으로 평행한 제 2 핵산 가닥의 잔여부와, 상기 잔여부가 구아닌인 경우, 기반 페어링을 할 수 있는 것으로 알려져 있다. 핵산의 제 1 영역은 동일 핵산이나 다른 핵산의 제 2 영역에 대해, 두 영역이 역 평행한 방식으로 배열되었을 때, 제 1 영역의 최소한 하나의 뉴클레오타이드 잔여부가 제 2 영역의 잔여부와 기반 페어링을 할 수 있는 경우, 보완적이다. 바람직하게는, 제 1 영역은 제 1 부분을 포함하고 제 2 영역은 제 2 부분을 포함하며, 이에 의해 제 1 및 제 2 부분이 역으로 평행하게 배열되었을 때, 제 1 부분의 뉴클레오타이드 잔여부의 최소한 약 50%, 바람직하게는 최소한 약 75%, 최소한 약 90%, 또는 최소한 약 95%가 제 2 부분의 뉴클레오타이드 잔여부와 기반 페어링을 할 수 있다. 보다 바람직하게는, 제 1 부분의 모든 뉴클레오타이드 잔여부가 제 2 부분의 뉴클레오타이드 잔여부와 기반 페어링을 할 수 있다.
본 명세서에서 사용되는 "상동"은 동일한 핵산 가닥의 두 영역 사이 또는 두 개의 서로 다른 핵산 가닥의 영역 사이의 뉴클레오타이드 염기서열의 유사성을 말한다. 두 영역 모두에서의 뉴클레오타이드 잔여부 위치가 동일한 뉴클레오타이드 잔여부에 의해 점유되면, 이 영역들은 이 위치에서 상동으로 된다. 두 영역에서 각 위치의 최소한 하나의 뉴클레오타이드 잔여부 위치가 동일한 잔여부에 의해 점유되는 경우, 제 1 영역은 제 2 영역에 상동이다. 두 영역 사이의 상동은 동일한 잔여부에 의해 점유되는 두 영역의 뉴클레오타이드 잔여부 위치의 전반부에 대해 표현된다. 예를 들어 설명하면, 뉴클레오타이드 염기서열 5'-ATTGCC-3'을 가지는 영역과 뉴클레오타이드 염기서열 5'-TATGGC-3'을 가지는 영역은 50%의 상동을 공유한다. 바람직하게는, 제 1 영역은 제 1 부분을 포함하고 제 2 영역의 제 2 부분을 포함하며, 이에 의해 각 부분의 최소한 약 50%, 바람직하게는 최소한 약 75%, 최소한 약 90%, 또는 최소한 약 95%의 뉴클레오타이드 잔여부 위치가 동일한 잔여부에 의해 점유된다. 보다 바람직하게는, 각 부분에서 모든 뉴클레오타이드 잔여부 위치는 동일한 뉴클레오타이드 잔여부에 의해 점유된다.
“본 발명의 단백질”은 표지 인자 단백질 및 이들의 파편; 이형 표지 인자 단백질 및 이들의 파편; 최소한 15 아미노산 세그먼트의 표지 인자 또는 이형 표지 인자 단백질을 포함하는 펩티드 및 폴리펩티드; 및 표지 인자 또는 이형 표지 인자 단백질, 또는 최소한 15 아미노산 세그먼트의 표지 인자 또는 이형 표지 인자 단백질을 포함하는 융합 단백질을 포괄한다.
본 발명은 특히 본 발명의 표지 인자 단백질의 표지 인자 단백질 및 파편에 결합하는 항체, 항체 파생체 및 항체 파편을 더 제공한다. 본 명세서에서 다르게 특정되지 않는 한, 용어 “항체” 및 “항체”는 상기 기술한 모든 파편 및 파생체뿐만 아니라 넓은 범위로 자연적으로 발생하는 형태의 항체(예를 들어, IgG, IgA, IgM, IgE)와 단일 체인 항체와 같은 재조합 항체, 키메릭 및 인간화된 항체 및 다중-특정 항체를 포함하며, 이들 파편 및 파생체는 최소한 하나의 항원적 결합 부위를 가진다. 항체 파생체는 항체와 켤레인 단백질 또는 화학적 성분을 포함할 수 있다.
특정 실시예에서, 본 발명의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, CANX, GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택된 하나 또는 그 이상의 유전자(또는 단백질)을 포함한다. 일부 실시예에서, 상기 표지 인자는 최소한 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열, 열하나, 열둘, 열셋, 열넷, 열다섯, 열여섯, 열일곱, 열여덟, 열아홉, 스물, 스물다섯, 설흔 또는 그 이상의 이전 유전자들(또는 단백질)의 조합이다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이의 상기 기술된 유전자 (또는 단백질)일 수 있다.
일 실시예에서, 본 발명의 표지 인자는 암과 연관되거나 이에 포함된 유전자 또는 단백질이다. 이러한 암에 포함된 유전자 또는 단백질은, 예를 들어, HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및/또는 CANX를 포함한다. 일부 실시예에서, 본 발명의 표지 인자는 최소한 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열, 열하나, 열둘, 열셋, 열넷, 열다섯, 열여섯, 열일곱, 열여덟, 열아홉, 스물 또는 그 이상의 이전에 언급한 유전자(또는 단백질)의 조합이다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이의 상기 기술된 유전자(또는 단백질)일 수 있다.
일 실시예에서, 본 발명의 표지 인자는 약제로 유도되는 독성에 연관되거나 이에 포함된 유전자 또는 단백질을 포함한다. 약제로 유도되는 독성에 포함되는 이러한 유전자 또는 단백질은, 예를 들어, GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및/또는 TAZ를 포함한다. 일부 실시예에서, 본 발명의 표지 인자는 최소한 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열 개의 상기 언급한 유전자(또는 단백질)의 조합이다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 1 과 20 사이, 1 과 30 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이, 1 과 20 사이, 5와 20 사이, 10과 20 사이, 10과 25 사이, 10과 30 사이의 상기 기술한 유전자(또는 단백질)일 수 있다.
A.
표지 인자와 관련된 심장 독성
본 발명은, 최소한 부분적으로는, 약제로 유도되는 심장 독성과 연관된 신규의 생물학적 표지 인자의 식별에 기반한다. 본 발명은, 최소한 부분적으로는, 코엔자임 Q10가 약제로 유도되는 심장 독성을 경감하거나 예방할 수 있 발견에 더 기반한다.
이에 따라, 본 발명은 독성을 야기하거나 이를 야기할 위험성이 있는 제제를 파악하기 위한 방법을 제공한다. 일 실시예에서, 상기 제제는 약제 또는 약제 후보이다. 일 실시예에서, 상기 독성은 약제로 유도되는 독성, 예를 들어, 심장 독성이다. 일 실시예에서, 상기 제제는 당뇨, 비만 또는 심장혈관 질환을 치료하기 위한 제약 또는 제약 후보이다. 이들 방법에서는, 한 쌍의 표본(약제 치료를 겪지 않은 제 1 표본 및 약제 치료를 겪은 제2 표본) 내에서 하나 또는 그 이상의 생물학적 표지 인자/단백질의 양이 분석된다. 일 실시예에서, 제 1 표본과 비교할 때, 제 2 표본 내의 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준에서의 조절은 상기 약제가 약제로 유도되는 독성, 예를 들어, 심장 독성을 야기하거나 야기할 위험이 있음을 나타낸다. 일 실시예에서, 상기 하나 또는 그 이상의 생물학적 표지 인자는 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ으로 이루어지는 군에서 선택된다. 본 발명의 방법은 해당 분야의 통상의 기술자들이 약제로 유도되는 심장 독성을 야기할 위험성이 있는 약제를 식별하기 위해 사용하는 다른 방법과 함께 실시될 수 있다.
이에 따라, 한 측면에서, 본 발명은 약제로 유도되는 독성 (예를 들어, 심장 독성)을 야기하거나 야기할 위험이 있는 약제를 식별하기 위한 방법을 제공하며, 상기 방법은 (i) 약제로 치료하기 이전의 세포 표본에 존재하는 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준을 (ii) 약제로 치료한 이후 얻어진 제 2 세포 표본에 존재하는 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준과 비교하는 것을 포함하며; 이때 상기 하나 또는 그 이상의 생물학적 표지 인자는 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군으로부터 선택되고; 제 1 표본과 비교하여 제 2 표본 내 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준에서의 조절은 상기 약제가 약제로 유도되는 독성(예를 들어, 심장 독성)을 야기하거나 야기할 위험이 있음을 나타낸다.
일 실시예에서, 상기 약제로 유도되는 독성은 약제로 유도되는 심장 독성이다. 일 실시예에서, 상기 세포는 심장혈관 시스템의 세포, 예를 들어, 심장근세포이다. 일 실시예에서, 상기 세포는 당뇨성 심장근 세포이다. 일 실시예에서, 상기 약제는 당뇨, 비만 또는 심장병 치료를 위한 약제 또는 후보 약제이다.
일 실시예에서, 제 1 표본과 비교할 때, 제 2 표본 내의 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택되는 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉 또는 열 개 모두의 생물학적 표지 인자의 발현 수준에서의 조절(예를 들어, 증가 또는 감소)은 상기 약제가 약제로 유도되는 독성을 야기하거나 야기할 위험이 있음을 나타낸다.
약제로 유도되는 독성을 감소시키거나 예방할 수 있는 제제를 식별하기 위한 방법 또한 본 발명에 의해 제공된다. 일 실시예에서, 상기 약제로 유도되는 독성은 심장 독성이다. 일 실시예에서, 상기 약제는 당뇨, 비만 또는 심장혈관 질환을 치료하기 위한 약제 또는 약제 후보이다. 이들 방법에서, 세 표본(약제 치료를 겪지 않은 제 1 표본, 약제 치료를 겪은 제2 표본, 및 약제 치료 및 제제 처리를 모두 겪은 제 3 표본) 내의 하나 또는 그 이상의 생물학적 표지 인자의 양이 분석된다. 제 1 표본과 비교할 때 제 3 표본 내의 하나 또는 그 이상의 생물학적 표지 인자와 거의 같은 발현 수준은 상기 제제가 약제로 유도되는 독성, 예를 들어, 약제로 유도되는 심장 독성을 감소시키거나 예방할 수 있음을 나타낸다. 일 실시예에서, 상기 하나 또는 그 이상의 생물학적 표지 인자는 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택된다.
본 명세서에서 기술된 상기 방법들을 사용하여, 다양한 분자들, 특히 세포막을 통과하기에 충분히 작은 분자들을 포함하는 분자들이 예를 들어, 본 발명의 표지 인자의 발현 및/또는 활성을 증가 또는 감소시키는 등의 조절을 하는 분자들을 식별하기 위해 선별될 수 있다. 이렇게 식별된 화합물은 대상에서의 약제로 유도되는 독성을 감소시키거나, 완화시키거나 예방하기 위해 대상에 제공될 수 있다.
이에 따라, 또 다른 측면에서, 본 발명은 약제로 유도되는 독성을 감소시키거나 예방할 수 있는 제제를 식별하는 방법을 제공하며, 상기 방법은 (i) 독성 유도 약제에 의한 치료 이전에 획득된 제 1 세포 표본 내에 존재하는 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준을 결정하는 단계; (ii) 독성 유도 약제에 의한 치료 이후에 획득된 제 2 세포 표본 내에 존재하는 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준을 결정하는 단계; (iii) 독성 유도 약제 및 제제에 의한 치료 이후에 획득된 제 3 세포 표본 내에 존재하는 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준을 결정하는 단계; 및 (iv) 상기 제 3 표본 내의 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준을 제 1 표본과 비교하는 단계로서; 상기 하나 또는 그 이상의 생물학적 표지 인자는 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택되는 단계를 포함하며; 제 1 표본과 비교하여 제 3 표본 내의 하나 또는 그 이상의 생물학적 표지 인자의 거의 동일한 발현 수준은 상기 제제가 약제로 유도되는 독성을 감소시키거나 예방할 수 있음을 나타낸다.
일 실시예에서, 상기 약제로 유도되는 독성은 약제로 유도되는 심장 독성이다. 일 실시예에서, 상기 세포는 심장혈관 시스템의 세포, 예를 들어, 심장근 세포이다. 일 실시예에서, 상기 세포는 당뇨성 심장근 세포이다. 일 실시예에서, 상기 약제는 당뇨, 비만 또는 심장병 치료를 위한 약제 또는 후보 약제이다.
일 실시예에서, 제 1 표본과 비교할 때, 제 3 표본 내의 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택되는 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉 또는 열 개 모두의 생물학적 표지 인자와 거의 동일한 발현 수준은 상기 약제가 약제로 유도되는 독성을 감소시키거나 예방할 수 있음을 나타낸다.
본 발명은 본 발명의 방법을 필요로 하는 대상에서 약제로 유도되는 심장 독성을 완화, 경감 또는 예방하는 방법을 더 제공하며, 상기 방법은 대상(예를 들어, 포유류, 인간, 또는 인간이 아닌 동물)에 본 명세서에서 제공된 선별 방법에 의해 식별된 제제를 투여하는 단계를 포함하며, 이에 의해 대상에서 약제로 유도되는 심장 독성을 완화하거나 예방한다. 일 실시예에서, 상기 제제는 이미 심장 독성 유도 약제로 치료를 받은 대상에 투여된다. 일 실시예에서, 상기 제제는 심장 독성 유도 약제에 의한 대상의 치료와 동시에 대상에 투여된다. 일 실시예에서, 상기 제제는 심장 독성 유도 약제에 의한 대상의 치료 이전에 대상에게 투여된다.
본 발명은 본 발명의 방법을 필요로 하는 대상에서 약제로 유도되는 심장 독성을 완화, 경감 또는 예방하는 방법을 더 제공하며, 상기 방법은 대상(예를 들어, 포유류, 인간, 또는 인간이 아닌 동물)에 코엔자임 Q10을 투여하는 단계를 포함하며, 이에 의해 대상에서 약제로 유도되는 심장 독성을 완화하거나 예방한다. 일 실시예에서, 상기 코엔자임 Q10은 이미 심장 독성 유도 약제로 치료를 받은 대상에 투여된다. 일 실시예에서, 상기 코엔자임 Q10은 심장 독성 유도 약제에 의한 대상의 치료와 동시에 대상에 투여된다. 일 실시예에서, 상기 코엔자임 Q10은 심장 독성 유도 약제에 의한 대상의 치료 이전에 대상에게 투여된다. 일 실시예에서, 상기 약제로 유도되는 심장 독성은 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어진 군에서 선택되는 하나, 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉 또는 열 개 모두의 생물학적 표지 인자의 발현의 조절과 연관된다. 앞서의 목록에서 제시된 모든 값들은 또한 본 발명의 일부로서 의도된 범위의 상한 또는 하한일 수 있으며, 예를 들어, 1과 5 사이, 1 과 10 사이, 2와 5 사이, 2와 10 사이, 5와 10 사이의 상기 기술한 유전자(또는 단백질)일 수 있다.
본 발명은 예를 들어, 약제로 유도되는 심장 독성과 같은 심장 독성에 대한 예측적 표지 인자로서 유용한 생물학적 표지 인자(예를 들어, 유전자 및/또는 단백질)를 더 제공한다. 이들 생물학적 표지 인자들은 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ를 포함한다. 그러나, 해당 분야의 통상의 기술자라면 본 명세서에 제공된 방법을 채택하여, 예를 들어, 예 3에 기술된 방법을 사용하되 심장 독성을 유도하는 것으로 알려진 다른 약제를 사용하여 약제로 유도되는 심장 독성을 예측할 수 있는 추가적인 생물학적 표지 인자를 인식할 수 있을 것이다. 본 발명의 예시적 약제로 유도되는 심장 독성 생물학적 표지 인자는 아래에서 기술된다.
GRP78 및 GRP75는 글루코스 반응 단백질로도 불린다. 이들 단백질은 심장근세포의 내형질/근소포체 스트레스(ER 스트레스)와 연관되어 있다. SERCA, 또는 내형질근소포체 칼슘 ATP 분해 효소는 심장 세포 내의 Ca2+ 항상성을 조절한다. 이들 ATP 분해 효소에서 교란이 일어나면 심장 기능 이상 및 심장 질환을 일으킬 수 있다. 본 명세서에서 제공된 데이터를 기반으로, GRP75 와 GRP78 및 이들을 둘러싸는 간선들은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자들이다.
TIMP1은 TIMP 금속단백질 분해효소 금지 인자 1로도 불리며, MMP와 연관되어 세포 외 기질의 리모델링과 관련된다. TIMP1 발현은 심장의 섬유 형성과 상호 관련되어 있으며, 혈관 내피의 세포의 저산소 상태 또한 TIMP1 발현을 유도한다. 본 명세서에서 제공된 데이터를 기반으로, TIMP1은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자이다.
PTX3는 펜트락신 3로도 불리며, C군의 반응성 단백질(CRP)에 속하고, 심장의 감염 조건의 좋은 표지 인자이다. 그러나, 플라스마 PTX3 또한 패혈증 또는 기타 의학적 조건으로 인한 대표적인 체계적 감염 반응을 나타낸다. 본 명세서에서 제공된 데이터를 기반으로, PTX3 심장 기능 또는 심장 독성의 신규의 표지 인자일 수 있다. 또한, 네트워크 내의 PTX 3와 연관된 간선들 또한 생물학적 표지 인자의 신규의 패널을 형성할 수 있다.
HSP76는 HSPA6로도 불리며, 내피의 세포 및 B 림포사이트 내에서 유일하게 발현되는 것으로 알려져 있다. 이 단백질이 심장 기능과 관련하여 하는 역할을 알려져 있지 않다. 본 명세서에서 제공된 데이터를 기반으로, HSP76은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자일 수 있다.
PDIA4, PDIA1은 단백질 이황화 이성질화 효소 A 군 단백질로도 불리며, GRP와 마찬가지로 ER 스트레스 반응과 관련되어 있다. 이 단백질이 심장 기능과 관련하여 하는 역할을 알려져 있지 않다. 본 명세서에서 제공된 데이터를 기반으로, 이들 단백질들은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자들일 수 있다.
CA2D1는 또한 칼슘 채널, 전압 의존, 알파 2/델타 하위 단위로 불린다. 이 알파-2/델타 소단위의 전위-의존 칼슘 채널은 칼슘 흐름 밀도 및 칼슘 채널의 활성/비활성 동역학을 조절한다. CA2D1은 심장에서의 여기-수축 결합에서 중요한 역할을 한다. 이 단백질이 심장 기능과 관련하여 하는 역할을 알려져 있지 않다. 본 명세서에서 제공된 데이터를 기반으로, CA2D1은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자일 수 있다.
GPAT1은 네 개의 알려진 글리세롤-3-인산염 아실전달 효소 동형 단백질 중 햐나이며, 미토콘드리아의 외막에 위치하여, 카르니틴 팔미토일 전달 효소-1과의 상호 조절을 가능하게 해 준다. GPAT1은 인슐린 및 SREBP-1c에 의해 전사와 관련하여 상방으로 조절되며 AMP-활성 단백질 키나아제에 의해 급격하게 하방으로 조절되어, 트리실글리세롤 합성에서의 역할과 일관성을 유지하게 된다. 본 명세서에서 제공된 데이터를 기반으로, GPAT1은 약제로 유도되는 심장 독성에 대한 신규의 예측 인자들이다.
TAZ는 타파진으로도 불리며, 심장 및 골격 근육에서 고도로 발현한다. TAZ는 심장 리핀의 대사에 관련되어 있으며 인산지질-라이소인산지질 아실 전달 효소로서 기능한다. 타파진 인산지질 심장리핀(CL)의 리모델링 및 미토콘드리아 내부 막의 신호 지질에 책임이 있다. 본 명세서에서 제공된 데이터를 기반으로, TAZ는 약제로 유도되는 심장 독성의 신규의 예측 인자이다.
B.
표지 인자와 관련된 암
본 발명의 최소한 부분적으로는 암과 관련된 신규의 생물학적 표지 인자의 식별에 기반한다. 이러한 암과 관련된 표지 인자는, 예를 들어, HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및/또는 CANX를 포함한다. 일부 실시예에서, 본 발명의 표지 인자는 상기 표지 인자들 중 최소한 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열, 열하나, 열둘, 열셋, 열넷, 열다섯, 열여섯, 열일곱, 열여덟, 열아홉, 스물 또는 그 이상의 조합이다.
이에 따라, 본 발명은 암을 유발하거나 암을 유발할 위험이 있는 제제를 식별하기 위한 방법을 제공한다. 일 실시예에서, 상기 제제는 약제 또는 약제 후보이다. 이들 방법에서는, 한 쌍의 표본(약제 치료를 겪지 않은 제 1 표본 및 약제 치료를 겪은 제2 표본) 내에서 하나 또는 그 이상의 생물학적 표지 인자/단백질의 양이 분석된다. 제 1 표본과 비교하여 제 2 표본 내 하나 또는 그 이상의 생물학적 표지 인자의 발현 수준에서의 조절은 약제가 암을 야기하거나 암을 야기할 위험이 있음을 나타낸다. 일 실시예에서, 상기 하나 또는 그 이상의 생물학적 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX로 이루어지는 군에서 선택된다. 본 발명의 방법은 해당 분야의 통상의 기술자들이 암을 야기할 위험성이 있는 약제를 식별하기 위해 사용하는 다른 방법과 함께 실시될 수 있다.
한 측면에서, 본 발명은 대상에서 암을 치료하기 위한 치료의 효능을 분석하는 방법을 제공하며, 상기 방법은 최소한 치료 식이 요법의 일부를 대상에게 시행하기 이전에 얻어진 제 1 표본 내에 존재하며 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX로 이루어지는 군에서 선택되는 하나 또는 그 이상의 표지 인자의 발현 수준을 최소한 치료 식이 요법의 일부를 대상에게 시행한 이후 얻어진 제 2 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 단계를 포함하며, 이때 제 1 표본과 비교하여 제 2 표본에서의 하나 또는 그 이상의 표지 인자의 발현 수준에서의 조절은 상기 치료가 대상에 대한 암을 치료하는데 효과적임을 나타낸다.
일 실시예에서, 상기 표본은 대상으로부터 획득한 액체를 포함한다. 일 실시예에서, 상기 액체는 혈액, 구토물, 침, 림프, 담낭액, 오줌, 기관지 세척에 의해 얻은 액체, 복막 헹굼에 의해 수집된 액체, 및 부인과 관련 액체로 이루어지는 군으로부터 선택된다. 일 실시예에서, 상기 표본은 혈액 표본 또는 이의 성분이다.
또 다른 실시예에서, 상기 표본은 대상으로부터 얻어진 조직 또는 성분을 포함한다. 일 실시예에서, 상기 조직은 뼈, 연결 조직, 연골, 폐, 간, 신장, 근육 조직, 심장, 췌장, 및 피부로 이루어지는 군으로부터 선택된다.
일 실시예에서, 상기 대상은 인간이다.
일 실시예에서, 생물학적 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 표본 내 전사된 폴리뉴클레오타이드 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 전사된 폴리뉴클레오타이드의 분석은 전사된 폴리뉴클레오타이드를 증폭하는 것을 포함한다.
일 실시예에서, 대상 표본 내에서 상기 표지 인자의 발현 수준은 표본 내의 단백질 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 상기 단백질은 특히 단백질과 결합하는 반응 제제를 사용하여 분석된다.
일 실시예에서, 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 상기 표본의 중합효소 연쇄 반응(PCR) 증폭 반응, 역 전사 효소 PCR 분석, 단일 가닥 형태 다형성 분석 (SSCP), 비합치 분열 탐지, 이형 이중가닥 분석, 남부 블로트(블롯) 분석, 북부 블로트 분석, 서부 블로트 분석, 현장 교배, 배열 분석, 디옥시리보핵산 염기서열 결정, 제한 파편 길이 다형성 분석, 및 이들의 조합 또는 하부 조합으로 이루어지는 군으로부터 선택되는 기술을 사용하여 결정된다.
일 실시예에서, 표본 내에서 상기 표지 인자의 발현 수준은 면역조직화학, 면역세포화학, 유동 세포 계수법, ELISA 및 질량 분광학으로 이루어지는 군으로부터 선택된 기술을 사용하여 결정된다.
일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.
일 실시예에서, 상기 대상은 환경적 영향제 화합물, 수술, 방사선 치료, 호르몬 치료, 항체 치료, 성장 요소에 의한 치료, 사이토카인, 화학치료, 타생의 줄기 세포 치료로 구성되는 군으로부터 선택되는 치료에 의해 치료된다. 일 실시예에서, 상기 환경적 영향제 화합물은 코엔자임 Q10 분자이다.
본 발명은 대상이 암에 걸려 있는지를 분석하는 방법을 제공하며, 상기 방법은 대상으로부터 얻은 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하는 것을 포함하고, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX로 이루어진 군으로부터 선택되며; 또한 상기 방법은 대상으로부터 얻은 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 제어 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 것을 포함하고, 이때 제어 표본 내의 하나 또는 그 이상의 표지 인자에 상대적인 상기 대상으로부터 얻은 생물학적 표본의 하나 또는 그 이상의 표지 인자의 발현 수준에서의 조절은 상기 대상이 암에 걸렸는지를 나타내며, 이에 의해 상기 대상이 암에 걸렸는지를 분석한다.
일 실시예에서, 상기 표본은 대상으로부터 획득한 액체를 포함한다. 일 실시예에서, 상기 액체는 혈액, 구토물, 침, 림프, 담낭액, 오줌, 기관지 세척에 의해 얻은 액체, 복막 헹굼에 의해 수집된 액체, 및 부인과 관련 액체로 이루어지는 군으로부터 선택된다.
일 실시예에서, 상기 표본은 혈액 표본 또는 이의 성분이다.
또 다른 실시예에서, 상기 표본은 대상으로부터 얻어진 조직 또는 성분을 포함한다. 일 실시예에서, 상기 조직은 뼈, 연결 조직, 연골, 폐, 간, 신장, 근육 조직, 심장, 췌장, 및 피부로 이루어지는 군으로부터 선택된다.
일 실시예에서, 상기 대상은 인간이다.
일 실시예에서, 생물학적 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 표본 내 전사된 폴리뉴클레오타이드 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 전사된 폴리뉴클레오타이드의 분석은 전사된 폴리뉴클레오타이드를 증폭하는 것을 포함한다.
일 실시예에서, 대상 표본 내에서 상기 표지 인자의 발현 수준은 표본 내의 단백질 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 상기 단백질은 특히 단백질과 결합하는 반응 제제를 사용하여 분석된다.
일 실시예에서, 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 상기 표본의 중합효소 연쇄 반응(PCR) 증폭 반응, 역 전사 효소 PCR 분석, 단일 가닥 형태 다형성 분석 (SSCP), 비합치 분열 탐지, 이형이중가닥 분석, 남부 블로트(블롯) 분석, 북부 블로트 분석, 서부 블로트 분석, 현장 교배, 배열 분석, 디옥시리보핵산 염기서열 결정, 제한 파편 길이 다형성 분석, 및 이들의 조합 또는 하부 조합으로 이루어지는 군으로부터 선택되는 기술을 사용하여 결정된다.
일 실시예에서, 표본 내에서 상기 표지 인자의 발현 수준은 면역조직화학, 면역세포화학, 유동 세포 계수법, ELISA 및 질량 분광학으로 이루어지는 군으로부터 선택된 기술을 사용하여 결정된다.
일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.
일 실시예에서, 상기 대상은 환경적 영향제 화합물, 수술, 방사선 치료, 호르몬 치료, 항체 치료, 성장 요소에 의한 치료, 사이토카인, 화학치료, 타생의 줄기 세포 치료로 구성되는 군으로부터 선택되는 치료에 의해 치료된다. 일 실시예에서, 상기 환경적 영향제 화합물은 코엔자임 Q10 분자이다.
본 발명은 대상에서 암이 발병할 지를 예단하는 방법을 더 제공하며, 상기 방법은 대상으로부터 얻어진 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하는 것을 포함하며, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX으로 이루어진 군으로부터 선택되고; 또한 상기 방법은 대상으로부터 얻은 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 제어 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 것을 포함하고, 이때 제어 표본 내의 하나 또는 그 이상의 표지 인자에 상대적인 상기 대상으로부터 얻은 생물학적 표본의 하나 또는 그 이상의 표지 인자의 발현 수준에서의 조절은 상기 대상에서 암이 발병할 것으로 예단되는 것을 나타내며, 이에 의해 상기 대상에서 암이 발병할 것으로 추정되는지를 예단한다.
일 실시예에서, 상기 표본은 대상으로부터 획득한 액체를 포함한다. 일 실시예에서, 상기 액체는 혈액, 구토물, 침, 림프, 담낭액, 오줌, 기관지 세척에 의해 얻은 액체, 복막 헹굼에 의해 수집된 액체, 및 부인과 관련 액체로 이루어지는 군으로부터 선택된다. 일 실시예에서, 상기 표본은 혈액 표본 또는 이의 성분이다.
또 다른 실시예에서, 상기 표본은 대상으로부터 얻어진 조직 또는 성분을 포함한다. 일 실시예에서, 상기 조직은 뼈, 연결 조직, 연골, 폐, 간, 신장, 근육 조직, 심장, 췌장, 및 피부로 이루어지는 군으로부터 선택된다.
일 실시예에서, 상기 대상은 인간이다.
일 실시예에서, 생물학적 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 표본 내 전사된 폴리뉴클레오타이드 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 전사된 폴리뉴클레오타이드의 분석은 전사된 폴리뉴클레오타이드를 증폭하는 것을 포함한다.
일 실시예에서, 대상 표본 내에서 상기 표지 인자의 발현 수준은 표본 내의 단백질 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 상기 단백질은 특히 단백질과 결합하는 반응 제제를 사용하여 분석된다.
일 실시예에서, 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 상기 표본의 중합효소 연쇄 반응(PCR) 증폭 반응, 역 전사 효소 PCR 분석, 단일 가닥 형태 다형성 분석 (SSCP), 비합치 분열 탐지, 이형이중가닥 분석, 남부 블로트(블롯) 분석, 북부 블로트 분석, 서부 블로트 분석, 현장 교배, 배열 분석, 디옥시리보핵산 염기서열 결정, 제한 파편 길이 다형성 분석, 및 이들의 조합 또는 하부 조합으로 이루어지는 군으로부터 선택되는 기술을 사용하여 결정된다.
일 실시예에서, 표본 내에서 상기 표지 인자의 발현 수준은 면역조직화학, 면역세포화학, 유동 세포 계수법, ELISA 및 질량 분광학으로 이루어지는 군으로부터 선택된 기술을 사용하여 결정된다.
일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.
일 실시예에서, 상기 대상은 환경적 영향제 화합물, 수술, 방사선 치료, 호르몬 치료, 항체 치료, 성장 요소에 의한 치료, 사이토카인, 화학치료, 타생의 줄기 세포 치료로 구성되는 군으로부터 선택되는 치료에 의해 치료된다. 일 실시예에서, 상기 환경적 영향제 화합물은 코엔자임 Q10 분자이다.
본 발명은 대상에서 암이 재발할지를 예단하는 방법을 더 제공하며, 상기 방법은 대상으로부터 얻어진 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하는 것을 포함하며, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX으로 이루어진 군으로부터 선택되고; 또한 상기 방법은 대상으로부터 얻은 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 제어 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 것을 포함하고, 이때 제어 표본 내의 하나 또는 그 이상의 표지 인자에 상대적인 상기 대상으로부터 얻은 생물학적 표본의 하나 또는 그 이상의 표지 인자의 발현 수준에서의 조절은 상기 대상에서 암이 재발할 것임을 나타내며, 이에 의해 상기 대상에서 암이 재발할 것을 예단한다.
일 실시예에서, 상기 표본은 대상으로부터 획득한 액체를 포함한다. 일 실시예에서, 상기 액체는 혈액, 구토물, 침, 림프, 담낭액, 오줌, 기관지 세척에 의해 얻은 액체, 복막 헹굼에 의해 수집된 액체, 및 부인과 관련 액체로 이루어지는 군으로부터 선택된다. 일 실시예에서, 상기 표본은 혈액 표본 또는 이의 성분이다.
또 다른 실시예에서, 상기 표본은 대상으로부터 얻어진 조직 또는 성분을 포함한다. 일 실시예에서, 상기 조직은 뼈, 연결 조직, 연골, 폐, 간, 신장, 근육 조직, 심장, 췌장, 및 피부로 이루어지는 군으로부터 선택된다.
일 실시예에서, 상기 대상은 인간이다.
일 실시예에서, 생물학적 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 표본 내 전사된 폴리뉴클레오타이드 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 전사된 폴리뉴클레오타이드의 분석은 전사된 폴리뉴클레오타이드를 증폭하는 것을 포함한다.
일 실시예에서, 대상 표본 내에서 상기 표지 인자의 발현 수준은 표본 내의 단백질 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 상기 단백질은 특히 단백질과 결합하는 반응 제제를 사용하여 분석된다.
일 실시예에서, 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 상기 표본의 중합효소 연쇄 반응(PCR) 증폭 반응, 역 전사 효소 PCR 분석, 단일 가닥 형태 다형성 분석 (SSCP), 비합치 분열 탐지, 이형이중가닥 분석, 남부 블로트(블롯) 분석, 북부 블로트 분석, 서부 블로트 분석, 현장 교배, 배열 분석, 디옥시리보핵산 염기서열 결정, 제한 파편 길이 다형성 분석, 및 이들의 조합 또는 하부 조합으로 이루어지는 군으로부터 선택되는 기술을 사용하여 결정된다.
일 실시예에서, 표본 내에서 상기 표지 인자의 발현 수준은 면역조직화학, 면역세포화학, 유동 세포 계수법, ELISA 및 질량 분광학으로 이루어지는 군으로부터 선택된 기술을 사용하여 결정된다.
일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.
일 실시예에서, 상기 대상은 환경적 영향제 화합물, 수술, 방사선 치료, 호르몬 치료, 항체 치료, 성장 요소에 의한 치료, 사이토카인, 화학치료, 타생의 줄기 세포 치료로 구성되는 군으로부터 선택되는 치료에 의해 치료된다. 일 실시예에서, 상기 환경적 영향제 화합물은 코엔자임 Q10 분자이다.
본 발명은 암이 걸린 대상의 생존을 예단하는 방법을 더 제공하며, 상기 방법은 대상으로부터 얻어진 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하는 것을 포함하며, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX으로 이루어진 군으로부터 선택되고; 또한 상기 방법은 대상으로부터 얻은 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 제어 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 것을 포함하고, 이때 제어 표본 내의 하나 또는 그 이상의 표지 인자에 상대적인 상기 대상으로부터 얻은 생물학적 표본의 하나 또는 그 이상의 표지 인자의 발현 수준에서의 조절은 상기 대상의 생존을 나타내며, 이에 의해 상기 암에 걸린 대상이 생존할 것으로 예단한다..
일 실시예에서, 상기 표본은 대상으로부터 획득한 액체를 포함한다. 일 실시예에서, 상기 액체는 혈액, 구토물, 침, 림프, 담낭액, 오줌, 기관지 세척에 의해 얻은 액체, 복막 헹굼에 의해 수집된 액체, 및 부인과 관련 액체로 이루어지는 군으로부터 선택된다. 일 실시예에서, 상기 표본은 혈액 표본 또는 이의 성분이다.
또 다른 실시예에서, 상기 표본은 대상으로부터 얻어진 조직 또는 성분을 포함한다. 일 실시예에서, 상기 조직은 뼈, 연결 조직, 연골, 폐, 간, 신장, 근육 조직, 심장, 췌장, 및 피부로 이루어지는 군으로부터 선택된다.
일 실시예에서, 상기 대상은 인간이다.
일 실시예에서, 생물학적 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 표본 내 전사된 폴리뉴클레오타이드 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 전사된 폴리뉴클레오타이드의 분석은 전사된 폴리뉴클레오타이드를 증폭하는 것을 포함한다.
일 실시예에서, 대상 표본 내에서 상기 표지 인자의 발현 수준은 표본 내의 단백질 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 상기 단백질은 특히 단백질과 결합하는 반응 제제를 사용하여 분석된다.
일 실시예에서, 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 상기 표본의 중합효소 연쇄 반응(PCR) 증폭 반응, 역 전사 효소 PCR 분석, 단일 가닥 형태 다형성 분석 (SSCP), 비합치 분열 탐지, 이형이중가닥 분석, 남부 블로트(블롯) 분석, 북부 블로트 분석, 서부 블로트 분석, 현장 교배, 배열 분석, 디옥시리보핵산 염기서열 결정, 제한 파편 길이 다형성 분석, 및 이들의 조합 또는 하부 조합으로 이루어지는 군으로부터 선택되는 기술을 사용하여 결정된다.
일 실시예에서, 표본 내에서 상기 표지 인자의 발현 수준은 면역조직화학, 면역세포화학, 유동 세포 계수법, ELISA 및 질량 분광학으로 이루어지는 군으로부터 선택된 기술을 사용하여 결정된다.
일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.
일 실시예에서, 상기 대상은 환경적 영향제 화합물, 수술, 방사선 치료, 호르몬 치료, 항체 치료, 성장 요소에 의한 치료, 사이토카인, 화학치료, 타생의 줄기 세포 치료로 구성되는 군으로부터 선택되는 치료에 의해 치료된다. 일 실시예에서, 상기 환경적 영향제 화합물은 코엔자임 Q10 분자이다.
본 발명은 대상에서 암의 진전을 모니터링하기 위한 방법을 더 제공하며, 상기 방법은 최소한 치료 식이 요법의 일부를 대상에게 시행하기 이전에 얻어진 제 1 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 최소한 치료 식이 요법의 일부를 대상에게 시행한 이후 얻어진 제 2 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준과 비교하는 단계를 포함하며, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX로 이루어지는 군으로부터 선택되며, 이에 의해 대상에서의 암의 진전을 모니터링한다.
일 실시예에서, 상기 표본은 대상으로부터 획득한 액체를 포함한다. 일 실시예에서, 상기 액체는 혈액, 구토물, 침, 림프, 담낭액, 오줌, 기관지 세척에 의해 얻은 액체, 복막 헹굼에 의해 수집된 액체, 및 부인과 관련 액체로 이루어지는 군으로부터 선택된다. 일 실시예에서, 상기 표본은 혈액 표본 또는 이의 성분이다.
또 다른 실시예에서, 상기 표본은 대상으로부터 얻어진 조직 또는 성분을 포함한다. 일 실시예에서, 상기 조직은 뼈, 연결 조직, 연골, 폐, 간, 신장, 근육 조직, 심장, 췌장, 및 피부로 이루어지는 군으로부터 선택된다.
일 실시예에서, 상기 대상은 인간이다.
일 실시예에서, 생물학적 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 표본 내 전사된 폴리뉴클레오타이드 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 전사된 폴리뉴클레오타이드의 분석은 전사된 폴리뉴클레오타이드를 증폭하는 것을 포함한다.
일 실시예에서, 대상 표본 내에서 상기 표지 인자의 발현 수준은 표본 내의 단백질 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 상기 단백질은 특히 단백질과 결합하는 반응 제제를 사용하여 분석된다.
일 실시예에서, 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 상기 표본의 중합효소 연쇄 반응(PCR) 증폭 반응, 역 전사 효소 PCR 분석, 단일 가닥 형태 다형성 분석 (SSCP), 비합치 분열 탐지, 이형이중가닥 분석, 남부 블로트(블롯) 분석, 북부 블로트 분석, 서부 블로트 분석, 현장 교배, 배열 분석, 디옥시리보핵산 염기서열 결정, 제한 파편 길이 다형성 분석, 및 이들의 조합 또는 하부 조합으로 이루어지는 군으로부터 선택되는 기술을 사용하여 결정된다.
일 실시예에서, 표본 내에서 상기 표지 인자의 발현 수준은 면역조직화학, 면역세포화학, 유동 세포 계수법, ELISA 및 질량 분광학으로 이루어지는 군으로부터 선택된 기술을 사용하여 결정된다.
일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.
일 실시예에서, 상기 대상은 환경적 영향제 화합물, 수술, 방사선 치료, 호르몬 치료, 항체 치료, 성장 요소에 의한 치료, 사이토카인, 화학치료, 타생의 줄기 세포 치료로 구성되는 군으로부터 선택되는 치료에 의해 치료된다. 일 실시예에서, 상기 환경적 영향제 화합물은 코엔자임 Q10 분자이다.
본 발명은 대상에서 암을 치료하기 위한 화합물을 식별하기 위한 방법을더 제공하며, 상기 방법은 대상으로부터 생물학적 표본을 획득하는 단계; 상기 생물학적 표본을 검사 화합물과 접촉시키는 단계; 및 대상으로부터 획득한 생물학적 표본 내에 존재하는 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하는 단계로서, 이때 상기 하나 또는 그 이상의 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX로 이루어진 군으로부터 긍정적 배수 변화 및/또는 부정적 배수 변화로서 선택되는 단계; 상기 생물학적 표본 내의 하나 또는 그 이상의 표지 인자의 발현 수준을 적절한 제어 표본과 비교하는 단계; 및 상기 생물학적 표본 내의 하나 또는 그 이상의 표지 인자의 발현 수준을 부정적 배수 변화로서 감소시키는 검사 화합물 및/또는 상기 생물학적 표본 내의 하나 또는 그 이상의 표지 인자의 발현 수준을 긍정적 배수 변화로서 증가시키는 검사 화합물을 선택하는 단계를 포함하며, 이에 의해 대상에서 암을 치료하기 위한 화합물을 식별할 수 있다.
일 실시예에서, 상기 표본은 대상으로부터 획득한 액체를 포함한다. 일 실시예에서, 상기 액체는 혈액, 구토물, 침, 림프, 담낭액, 오줌, 기관지 세척에 의해 얻은 액체, 복막 헹굼에 의해 수집된 액체, 및 부인과 관련 액체로 이루어지는 군으로부터 선택된다. 일 실시예에서, 상기 표본은 혈액 표본 또는 이의 성분이다.
또 다른 실시예에서, 상기 표본은 대상으로부터 얻어진 조직 또는 성분을 포함한다. 일 실시예에서, 상기 조직은 뼈, 연결 조직, 연골, 폐, 간, 신장, 근육 조직, 심장, 췌장, 및 피부로 이루어지는 군으로부터 선택된다.
일 실시예에서, 상기 대상은 인간이다.
일 실시예에서, 생물학적 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 표본 내 전사된 폴리뉴클레오타이드 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 전사된 폴리뉴클레오타이드의 분석은 전사된 폴리뉴클레오타이드를 증폭하는 것을 포함한다.
일 실시예에서, 대상 표본 내에서 상기 표지 인자의 발현 수준은 표본 내의 단백질 또는 그 부분을 분석함으로써 결정된다. 일 실시예에서, 상기 단백질은 특히 단백질과 결합하는 반응 제제를 사용하여 분석된다.
일 실시예에서, 표본 내 상기 하나 또는 그 이상의 표지 인자의 발현 수준은 상기 표본의 중합효소 연쇄 반응(PCR) 증폭 반응, 역 전사 효소 PCR 분석, 단일 가닥 형태 다형성 분석 (SSCP), 비합치 분열 탐지, 이형 이중가닥 분석, 남부 블로트(블롯) 분석, 북부 블로트 분석, 서부 블로트 분석, 현장 교배, 배열 분석, 디옥시리보핵산 염기서열 결정, 제한 파편 길이 다형성 분석, 및 이들의 조합 또는 하부 조합으로 이루어지는 군으로부터 선택되는 기술을 사용하여 결정된다.
일 실시예에서, 표본 내에서 상기 표지 인자의 발현 수준은 면역조직화학, 면역세포화학, 유동 세포 계수법, ELISA 및 질량 분광학으로 이루어지는 군으로부터 선택된 기술을 사용하여 결정된다.
일 실시예에서, 다수의 표지 인자의 발현 수준이 결정된다.
일 실시예에서, 상기 대상은 환경적 영향제 화합물, 수술, 방사선 치료, 호르몬 치료, 항체 치료, 성장 요소에 의한 치료, 사이토카인, 화학치료, 타생의 줄기 세포 치료로 구성되는 군으로부터 선택되는 치료에 의해 치료된다. 일 실시예에서, 상기 환경적 영향제 화합물은 코엔자임 Q10 분자이다.
본 발명은 암을 치료하기 위한 치료의 효능을 분석하는 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 암을 치료하기 위한 치료의 효능을 분석하는 키트의 사용 지침을 포함한다.
본 발명은 대상이 암에 걸렸는지를 분석하는 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 대상이 암에 걸렸는지를 분석하는 키트의 사용 지침을 포함한다.
본 발명은 대상에서 암이 진전될 것인지를 예단하기 위한 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 대상에서 암이 진전될 것인지를 예단하기 위한 키트의 사용 지침을 포함한다.
본 발명은 대상에서 암이 재발할 것인지를 예단하기 위한 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 대상에서 암이 재발할 것인지를 예단하기 위한 키트의 사용 지침을 포함한다.
본 발명은 암의 재발을 예단하기 위한 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 암의 재발을 예단하기 위한 키트의 사용 지침을 포함한다.
본 발명은 암에 걸린 대상이 생존할 것인지를 예단하기 위한 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 암에 걸린 대상이 생존할 것인지를 예단하기 위한 키트의 사용 지침을 포함한다.
본 발명은 대상에서의 암의 진전을 모니터링하기 위한 키트를 더 제공하며, 상기 키트는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, 및 CANX 로 이루어지는 군에서 선택되는 최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 반응 제제와 대상에서의 암의 진전을 모니터링하기 위한 키트의 사용 지침을 포함한다.
본 발명의 키트는 대상으로부터의 생물학적 표본, 제어 표본, 및/또는 환경적 영향을 미치는 화합물을 획득하는 수단을 더 포함한다.
최소한 하나의 표지 인자의 발현 수준을 결정하기 위한 수단은 표본 내의 전사된 폴리뉴클레오타이드 또는 이의 부분을 분석하기 위한 수단 및/또는 표본 내의 단백질 또는 이의 부분을 분석하기 위한 수단을 포함할 수 있다.
일 실시예에서, 상기 키트는 다수의 표지 인자의 발현 수준을 결정하기 위한 반응 제제를 포함한다.
본 발명의 여러 측면은 이하의 하부 절에서 보다 상세히 설명된다.
C.
분리된 핵산 분자
본 발명의 일 측면은 분리된 핵산 분자에 관한 것으로서, 여기에는 표지 인자 단백질 또는 그 일부를 부호화하는 핵산이 포함된다. 본 발명의 분리된 핵은 또한 표지 인자 핵산 분자, 및 표지 인자 핵산 분자의 파편를 식별하기 위한 잡종 형성 탐침으로 사용하기에 충분한 핵산 분자, 예를 들어, 표지 인자 핵산 분자의 증폭 또는 변이를 위한 PCR 프라이머로 사용하기에 적절한 핵산 분자를 포함한다. 본 명세서에서 사용되는, 용어 "핵산 분자" 는 DNA 분자(예를 들어, cDNA 또는 게놈 DNA) 및 RNA 분자(예를 들어, mRNA) 및 DNA 유사체, 또는 뉴클레오타이드 유사체를 사용하여 생성된RNA를 포함하는 것으로 의도된 것이다. 상기 핵산 분자는 단일 가닥 또는 이중 가닥일 수 있으나, 바람직하게는 이중 가닥 DNA이다.
"분리된" 핵산 분자는 핵산 분자의 자연적 소스 내에 존재하는 다른 핵산 분자로부터 분리된 분자이다. 일 실시예에서, "분리된" 핵산 분자에는 핵산이 도출되는 기관계의 게놈 DNA 내의 핵산의 측면에 자연적으로 부착되는(즉, 핵산의 5' 및 3' 단에 위치하는 염기서열) 염기서열(바람직하게는 단백질-부호화 염기서열)이 존재하지 않는다. 예를 들어, 다양한 실시예에서, 상기 분리된 핵산 분자는 약 5 kB, 4 kB, 3 kB, 2 kB, 1 kB, 0.5 kB 또는 0.1 kB 미만의 핵산이 도출되는 세포의 게놈 DNA 내의 핵산 분자의 측면에 자연적으로 부착되는 뉴클레오타이드 염기서열을 포함할 수 있다. 또 다른 실시예에서, cDNA 분자와 갈은 "분리된" 핵산 분자는 세포 물질, 또는 재조합 기술로 생산된 경우 배양 매체가 실질적으로 존재하지 않을 수 있으며, 또는 실질적으로 화학적 전구체 또는 화학적으로 합성된 경우 다른 화학 물질이 실질적으로 존재하지 않을 수 있다. 세포 물질이 실질적으로 존재하지 않는 핵산 분자는 약 30%, 20%, 10%, 또는 5% 미만의 비상동 핵산을 가지는 핵산 분자(본 명세서에서 "오염 야기 핵산"으로도 불린다)의 생산을 포함한다.
본 발명의 핵산 분자는 표준 분자생물학 기술 및 본 명세서에서 기술된 데이터베이스 기록 내의 염기서열 정보를 사용하여 분리될 수 있다. 이러한 핵산 염기서열의 전부 또는 일부를 사용하여, 본 발명의 핵산 분자는 표준 잡종 형성 및 복제 기술 (예를 들어, 샘브룩(샘브룩(Sambrook)) 외, ed., 분자의 복제: 실험실 매뉴얼, 제 2판, 콜드 스프링 하버 출판사, 콜드 스프링 하버, NY, 1989, 에 설명된 기술)을 사용하여 분리될 수 있다.
본 발명의 핵산 분자는 cDNA, mRNA, 또는 템플릿 및 적절한 올리고뉴클레오타이드 프라이머로서의 게놈 DNA를 사용하여 표준 PCR 증폭 기술에 따라 증폭될 수 있다. 이렇게 증폭된 상기 핵산은 적절한 벡터로 복제되고 DNA 염기서열 분석에 의해 특성화될 수 있다. 또한, 본 발명의 핵산 분자의 전부 또는 일부에 해당하는 뉴클레오타이드가 표준적 합성 기술, 예를 들어, 자동화된 DNA 합성기를 사용하여 준비될 수 있다.
또 다른 바람직한 실시예에서, 본 발명의 분리된 핵산 분자는 표지 인자 핵산의 뉴클레오타이드 염기서열 또는 표지 인자 단백질을 부호화하는 핵산의 뉴클레오타이드 염기서열을 보완하는 뉴클레오타이드 염기서열을 가지는 핵산 분자를 포함한다. 주어진 뉴클레오타이드 염기서열에 보완적인 핵산 분자는 자신이 주어진 뉴클레오타이드 염기서열에 대해 잡종을 형성할 수 있는 주어진 뉴클레오타이드 염기서열에 충분히 보완적이며, 이에 의해 안정된 듀플렉스를 형성한다.
또한, 본 발명의 핵산 분자는 핵산 염기서열의 일부만을 포함할 수 있으며, 이때 전체 길이의 핵산 염기서열은 표지 인자 핵산을 포함하거나 표지 인자 단백질을 부호화한다. 이러한 핵산은, 예를 들어, 탐침 또는 프라이머로 사용될 수 있다. 상기 탐침/프라이머는 일반적으로 하나 또는 그 이상의 실질적으로 정제된 올리고뉴클레오타이드로서 사용된다. 상기 올리고뉴클레오타이드는 일반적으로 엄격한 조건 하에서 최소한 약 7개, 바람직하게는 약 15개, 보다 바람직하게는 약 25, 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 또는 400 또는 그 이상의 연속된 본 발명의 핵산의 뉴클레오타이드들의 잡종을 형성하는 뉴클레오타이드 염기서열의 영역을 포함한다.
본 발명의 핵산 분자의 염기서열에 기반한 탐침은 본 발명의 하나 또는 그 이상의 표지 인자에 해당하는 전사체 또는 게놈적 염기서열을 탐지하는데 사용될 수 있다. 상기 탐침은 여기에 부착된 라벨의 그룹, 예를 들어, 방사성 동위원소, 형광 화합물, 효소, 또는 효소 보조 요소를 포함한다. 이러한 탐침은, 예를 들어, mRNA 수준을 탐지하거나 또는 단백질을 부효하하는 유전자가 변이 또는 삭제되었는지를 결정하는 등의 방법으로 대상으로부터의 세포 표본 내의 단백질을 부호화하는 핵산 분자의 수준을 측정함으로써 단백질을 잘못 발현하는 세포 또는 조직을 식별하기 위한 진단적 검사 키트의 일부로서 사용될 수 있다.
본 발명은, 유전학적 코드의 퇴화로 인해, 표지 인자 단백질을 부호화하며 따라서 동일한 단백질을 부호화하는 핵산의 뉴클레오타이드 염기서열과 다른 핵산 분자를 더 포함한다.
해당 분야의 통상의 기술자라면 아미노산 염기서열에서의 변화에 이르게 하는 DNA 염기서열 다형성이 군집(예를 들어, 인간 군집) 내에 존재할 수 있음을 인식할 것이다. 이러한 유전학적 다형성은 대립 형질 변이로 인해 군집 내의 개별 객체에 존재할 수 있다. 대립 유전자는 주어진 유전학적 발생 장소에서 대체적 방법으로 발생하는 유전자 군 내의 한 유전자이다. RNA 발현 수준에 영향을 주는 DNA 다형성 또한 존재하여 해당 유전자의 전반적 발현 수준에 (예를 들어, 조절 또는 퇴화에 영향을 줌으로써) 영향을 줄 수 있다는 것 또한 인식될 수 있을 것이다.
본 명세서에서 사용되는, 표현 "대립 형질 이형"은 주어진 발생 위치에서 발생하는 뉴클레오타이드 염기서열 또는 상기 뉴클레오타이드 염기서열에 의해 부호화되는 폴리펩티드를 말한다.
본 명세서에서 사용되는, 용어 "유전자" 및 "재조합 유전자"는 본 발명의 표지 인자에 해당하는 폴리펩티드를 부호화하는 개방형 읽기 프레임을 포함하는 핵산 분자를 말한다. 이러한 자연적 대립 형질 변이는 일반적으로 주어진 유전자의 뉴클레오타이드 염기서열 내에서 1-5% 의 변이라는 결과를 가져 온다. 대체적인 대립 유전자는 관심의 대상인 유전자에 대한 다수의 다른 개별적 방법에 의한 염기서열 결정으로 식별될 수 있다. 이는 다양한 객체에서의 동일한 유전학적 발생 위치를 식별하기 위한 잡종 형성 탐침을 사용하여 쉽게 수행된다. 이러한 뉴클레오타이드 변이 및 결과적으로 나타나는 아미노산 다형성 또는 자연적 대립 형질 변이의 결과로서 기능적 활성을 변화시키지 않는 변이들의 어느 일부 또는 전부는 본 발명의 범위 내에 있는 것으로 의도된 것이다.
또 다른 실시예에서, 본 발명의 분리된 핵산 분자 는 최소한 7, 15, 20, 25, 30, 40, 60, 80, 100, 150, 200, 250, 300, 350, 400, 450, 550, 650, 700, 800, 900, 1000, 1200, 1400, 1600, 1800, 2000, 2200, 2400, 2600, 2800, 3000, 3500, 4000, 4500, 또는 그 이상의 길이를 가지는 뉴클레오타이드를 포함하며 엄격한 조건 하에서 표지 인자 핵산으로 또는 표지 인자 단백질을 부호화하는 핵산으로 잡종을 형성한다. 본 명세서에서 사용되는, 용어 "엄격한 조건 하에서의 잡종 형성"는 상호 간에 최소한 60%(65%, 70%, 바람직하게는 75%)가 동일한 뉴클레오타이드 염기서열들이 상호 간에 잡종화되어 존재하는 잡종 형성 및 세척을 위한 조건을 설명하는 것으로 의도된 것이다. 이러한 엄격한 조건들은 해당 분야의 통상의 기술자에게 알려져 있으며 분자생물학의 현재의 프로토콜, 존 와일리 앤 선스(John Wiley & Sons), N.Y. (1989)의 제 6.3.1-6.3.6 절에서 찾아볼 수 있다. 엄격한 잡종 형성 조건의 바람직한, 비 한정적인 예는 약 45oC의 6X 염화나트륨/구연산나트륨(SSC)에서의 잡종 형성 및 이후의 50-65oC에서의 0.2X SSC, 0.1% SDS에 의한 한 번 또는 그 이상의 세척이다.
군집 내에 존재할 수 있는 자연적으로 발생하는 본 발명의 핵산 분자의 대립 형질 변이와 더불어, 통상의 기술자는 염기서열 변화가 변이를 통해 도입되어 이에 의해 부호화된 단백질의 생물학적 활성을 변화시키지 않으면서 이로 인해 부호화된 단백질의 아미노산 염기서열에서의 변화를 야기될 수 있음을 또한 인식할 수 있을 것이다. 예를 들어, 아미노산 대체로 이르는 뉴클레오타이드 대체를 "비본질적" 아미노산 잔여부에서 수행할 수 있다. "비본질적" 아미노산 잔여부는 가공되지 않은 유형의 염기서열로부터 생물학적 활성을 변화시키지 않고 변경될 수 있는 잔여부이며, 반면에 "본질적" 아미노산 잔여부는 생물학적 활성을 필요로 한다. 예를 들어, 보존되지 않는 아미노산 잔여부 또는 여러 종들의 상동 중 부분 보존되는 아미노산 잔여부는 활성에 대해 비본질적일 수 있으며, 따라서 변경을 위한 타겟이 될 수 있을 것이다. 대체적인 방법으로, 여러 종들의 상동(예를 들어, 쥐과 동물 및 인간) 간에 보존되는 아미노산 잔여부는 활성에 대해 본질적이며 따라서 변경을 위한 타겟이 되지 않을 것이다.
이에 따라, 본 발명의 또 다른 측면은 활성에 대해 본질적이지 않은 아미노산 잔여부에서의 변화를 포함하는 이형 표지 인자 단백질을 부호화하는 핵산 분자에 관련된 것이다. 이러한 이형 표지 인자 단백질은 아미노산 염기서열에서 자연적으로 발생하는 표지 인자 단백질과 다르지만, 여전히 생물학적 활성을 보유한다. 일 실시예에서, 이러한 이형 표지 인자 단백질은 표지 인자 단백질의 아미노산 염기서열과 최소한 40%가 동일하고, 또한 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%가 동일한 아미노산 염기서열이다.
이형 표지 인자 단백질을 부호화하는 분리된 핵산 분자는 표지 인자 핵산의 뉴클레오타이드 염기서열에 하나 또는 그 이상의 뉴클레오타이드 대체, 추가 또는 삭제를 도입하여 하나 또는 그 이상의 아미노산 잔여부 대체, 추가, 또는 삭제가 부호화된 단백질에 도입되도록 함으로써 생성될 수 있다. 변이는 부위 방향성의 돌연변이 유발 및 PCR-중재 돌연변이 유발과 같은 표준 기술에 의해 도입될 수 있다. 바람직하게는, 보수적인 아미노산 대체는 하나 또는 그 이상의 예측된 비본질적 아미노산 잔여부에서 일어난다. "보존적인(conservative) 아미노산 대체"는 아미노산 잔여부가 유사한 사이드 체인을 가지는 아미노산 잔여부로 교체되는 대체이다. 유사한 사이드 체인을 가지는 아미노산 잔여부의 군들이 해당 분야에서 정의되어 있다. 이들 군들은 기본 사이드 체인(예를 들어, 라이신, 아르지닌, 히스티딘), 산성 사이드 체인(예를 들어, 아스파르트 산, 글루타민 산), 대전되지 않은 극섬 사이드 체인(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 타이로신, 시스테인), 비극성 사이드 체인(예를 들어, 알라닌, 발린, 루신, 이소루신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타 분지 사이드 체인(예를 들어, 트레오닌, 발린, 이소루신) 및 방향족 사이드 체인(예를 들어, 타이로신, 페닐알라닌, 트립토판, 히스티딘)을 가지는 아미노산을 포함한다. 대체적 방법으로, 변이는 포화 돌연변이 유발 등에 의해 부호화 염기서열의 전부 또는 일부를 따라 임의적으로 도입될 수 있으며, 그 결과로 나타나는 변이는 활성을 유지하는 변이를 식별하기 위해 생물학적 활성에 대해 선별될 수 있다. 돌연변이 유발에 이어, 부호화된 단백질은 재조합적으로 발현될 수 있으며 단백질의 활성이 결정될 수 있다.
본 발명은 안티센스 핵산 분자, 즉, 본 발명의 센스 핵산에 보완적인분자, 예를 들어, 이중 가닥 표지 인자 cDNA 분자의 부호화 가닥에 보완적이거나 표지 인자 mRNA 염기서열에 보완적인 분자를 포괄한다. 이에 따라, 본 발명의 안티센스는 본 발명의 센스 핵산에 수소 결합(즉, 아닐링)될 수 있다. 상기 안티센스 핵산은 전체 부호화 가닥, 또는 이의 일부에만, 예를 들어, 단백질 부호화 영역의 전부 또는 일부(또는 개방 판독 프레임)에 보완적일 수 있다. 안티센스 핵산 분자는 표지 인자 단백질을 부호화하는 뉴클레오타이드 염기서열의 부호화 가닥의 비부호화 영역의 전부 또는 일부에도 안티센스일 수 있다. 상기 비부호화 영역("5' 및 3' 비번역 영역")은 부호화 영역 측면에 부착되며 아미노산으로 번역되지 않는 5' 및 3' 염기서열이다.
안티센스 올리고뉴클레오타이드는, 예를 들어, 길이에서 약 5, 10, 15, 20, 25, 30, 35, 40, 45, 또는 50 또는 그 이상인 뉴클레오타이드일 수 있다. 본 발명의 안티센스 핵산은 해당 분야에서 알려진 화학적 합성 및 효소 결찰(ligation) 반응을 사용하여 구성될 수 있다. 예를 들어, 안티센스 핵산(예를 들어, 안티센스 올리고뉴클레오타이드)은 자연적으로 발생하는 뉴클레오타이드 또는 분자의 생물학적 안정성을 증가시키도록 또는 안티센스 및 센스 핵산 사이에 형성된 듀플렉스의 물리적 안정성을 증가시키도록 설계된 다양하게 수정된 뉴클레오타이드를 사용하여 화학적으로 합성될 수 있으며, 예를 들어, 포스페트로티오이트 파생체 및 아크리딘 대체 뉴클레오타이드가 사용될 수 있다. 안티센스 핵산을 생성하기 위해 사용될 수 있는 수정된 뉴클레오타이드의 예는5-불화우라실, 5-브롬화우라실, 5-염화우라실, 5-요오드화우라실, 하이포크산틴, 크산틴, 4-아세틸사이토신, 5-(카르복시하이드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 디하이드로우라실, 베타-D-갈락토실쿠에신, 이노신, N6-아이소펜텐이레이드나인, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2- 메틸라데닌, 2-메틸구아닌, 3-메틸사이토신, 5-메틸사이토신, N6-아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 베타-D-마노실퀘오신, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 2-메틸티오-N6-아이소펜텐이레이드나인, 우라실-5-옥시아세틱산(v), 와이부톡소신, 수도우라실, 퀘오신, 2-티오사이토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥시아세틱 한 메틸에스테르, 우라실-5-옥시아세틱 산(v), 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, (acp3)w, 및 2,6-디아미노퓨린을 포함한다. 대체적 방법으로, 상기 안티센스 핵산은 그 안에서 핵산이 안티센스 방향으로 하위 복제되는 발현 벡터를 사용하여 생물학적으로 생산될 수 있다(즉, 다음 절에서 더 설명되는 것 처럼 삽입된 핵산으로부터 전사된 RNA가 관심 대상 타겟 핵산으로 안티센스 방향이다).
본 명세서에서 사용되는, “핵산” 금지 인자는 타겟의 발현의 감소의 결과를 가져오는 타겟 유전자로부터의 최소한 일부의 RNA 전사체의 잡종을 형성함으로써 타겟의 발현에서의 감소를 야기하는 임의의 핵산 기반 금지 인자이다. 핵산 금지 인자는, 예를 들어, 단일 가닥 핵산 분자, 예를 들어, 안티센스 핵산, 및 siRNA, shRNA, dsiRNA와 같은 이중 가닥핵산(예를 들어, 미국 특허 공보 제 20070104688호 참조)을 포함한다. 본 명세서에서 사용되는, 이중 가닥 핵산 분자는 최소한 12 개, 바람직하게는 최소한 15개 이상의 뉴클레오타이드 이중 가닥으로 설계된다. 이중 가닥 핵산 분자는 자기 자신을 잡종화하기 위해 설계된 단일 핵산 가닥, 예를 들어, shRNA일 수 있다. 타겟의 핵산 금지 인자는 분리된 핵산으로 투여될 수 있는 것으로 이해되어야 한다. 대체적 방법으로, 상기 핵산 금지 인자는 세포 내에 금지 인자를 생산하기 위한 발현 구조체로서 투여될 수 있다. 특정 실시예에서, 상기 핵산 금지 인자는 활성 및/또는 핵산 금지 인자의 안정성을 개선하기 위한 하나 또는 그 이상의 화학적 수정을 포함한다. 이러한 수정은 해당 분야에서 잘 알려져 있다. 사용되는 상기 특정한 수정은, 예를 들어, 핵산 금지 인자의 유형에 따라 달라질 것이다.
안티센스 핵산 치료용 제제인 단일 가닥 핵산 치료제는 일반적으로 16 내지 30의 길이를 갖는 뉴클레오타이드를 포함하며, 배양 또는 기관계 내의 타겟 세포에서의 타겟 핵산 염기서열에 보완적이다.
안티센스 핵산, 화학적 수정, 및 치료적 사용에 대한 특허가 제공되며, 예를 들어, 화학적으로 수정된 RNA-포함 치료적 화합물에 대한 미국 특허 제 5,898,031호, 및 이들 화합물을 치료용 제제로 사용하는 방법에 대한 미국 특허 제 6,107,094호가 있다. 단일 가닥으로 화학적으로 수정된 RNA 유사 화합물을 투여하여 환자를 치료하는 방법에 대한 미국 특허 제 7,432,250호; 및 단일 가닥으로 화학적으로 수정된 RNA 유사 화합물을 포함하는 약학 성분에 대한 미국 특허 제 7,432,249호. 미국 특허 제 7,629,321호는 다수의 RNA 뉴클레오시드 및 최소한 하나의 화학적 수정을 가지는 단일 가닥 올리고뉴클레오타이드를 사용하여 타겟 mRNA를 쪼개는 방법에 대한 것이다. 본 단락에 기술된 이들 각 특허들은 참조에 의해 본 명세서에 통합된다.
많은 실시예에서, 상기 듀플렉스 영역은 길이가 15-30인 뉴클레오타이드 쌍이다. 일부 실시예에서, 상기 듀플렉스 영역은 길이가 17-23인 뉴클레오타이드 쌍, 길이가 17-25인 뉴클레오타이드 쌍, 길이가 23-27인 뉴클레오타이드 쌍, 길이가 19-21인 뉴클레오타이드 쌍, 또는 길이가 21-23인 뉴클레오타이드 쌍이다.
특정 실시예에서, 각 가닥은 15-30개의 뉴클레오타이드를 가진다.
본 발명의 방법에서 사용될 수 있는 RNAi 제제는 예를 들어, in 2011년 11월 18일에 출원된 미국 예비 출원 제 61/561,710호, 2010년 9월 15일에 출원된 국제 출원 제 PCT/US2011/051597호, 및 PCT 국제 공개 WO 2009/073809에 개시된 화학적 수정이 가해진 제제를 포함하며, 그 전체 내용은 참조에 의해 본 명세서에 통합된다.
“RNAi 제제,” “이중 가닥 RNAi 제제,” 이중-가닥 RNA(dsRNA) 분자는 “dsRNA 제제,” “dsRNA”, “siRNA”, “iRNA 제제”로도 불리고, 본 명세서에서 교차적으로 사용되며, 두 개의 반대로 평행하고 실질적으로 보완적인 하기에서 정의 되는 핵산 가닥을 포함하는 듀플렉스 구조를 가지는 리보핵산 분자 복합체를 말한다. 본 명세서에서 사용되는, RNAi 제제는 또한 dsiRNA(예를 들어, 본 명세서에 참조로써 통합된 US 특허 공고 20070104688 참조)를 포함한다. 일반적으로, 각 가닥의 대다수의 뉴클레오타이드는 리보뉴클레오타이드이지만, 본 명세서에서 기술된 각 가닥 또는 양 가닥은 또한 하나 또는 그 이상의 비 리보뉴클레오타이드, 예를 들어, 디옥시리보뉴클레오타이드 및/또는 수정된 뉴클레오타이드를 포함할 수 있다. 또한, 본 명세서에서 사용된 “RNAi 제제”는 화학적으로 수정된 리보뉴클레오타이드를 포함할 수 있으며; RNAi 제제는 다중 뉴클레오타이드에서의 실질적 수정을 포함할 수 있다. 이러한 수정은 본 명세서에서 개시되거나 해당 분야에서 알려진 모든 유형의 수정을 포함할 수 있다. siRNA 유형 분자에 사용되는 이러한 모든 수정이 본 명세서 및 청구항의 목적을 위한 “RNAi 제제”에 포괄적으로 포함된다.
듀플렉스 구조를 형성하는 두 가닥은 하나의 큰 RNA 분자의 서로 다른 부분이거나, 이들 각각이 분리된 RNA 분자일 수 있다. 이러한 두 가닥이 하나의 큰 분자의 일부인 경우, 따라서 한 가닥의 3' 종단과 듀플렉스 구조를 형성하는 각각의 다른 가닥의 5'종단 사이에서 끊기지 않는 뉴클레오타이드 체인으로 연결되어 있는 경우, 이러한 연결 RNA 체인은 “헤어핀 루프”라 불린다. 두 가닥이 3'종단의 한 가닥과 듀플렉스 구조를 형성하는 각각의 다른 가닥의 5'종단 사이의 끊기지 않는 뉴클레오타이드 체인이 아닌 다른 수단으로 공유결합적으로 연결되어 있는 경우, 이러한 연결 구조는 “링커”라 불린다. RNA 가닥들은 동일하거나 다른 개수의 뉴클레오타이드를 가질 수 있다. 기반 쌍의 최대 개수는 dsRNA의 가장 짧은 가닥 내의 뉴클레오타이드의 개수에서 듀플렉스 내에 존재하는 모든 오버행을 뺀 수이다. 듀플렉스 구조와 더불어, RNAi 제제는 하나 또는 그 이상의 뉴클레오타이드 오버행을 포함할 수 있다. 용어 “siRNA”는 또한 본 명세서에서 상기 기술한 RNAi 제제를 말하는 것으로 사용된다.
또 다른 측면에서, 상기 제제는 단일-가닥의 안티센스 RNA 분자이다. 안티센스 RNA 분자는 타겟 mRNA 내의 염기서열에 보완적이다. 안티센스 RNA는 mRNA에 염기 짝짓기를 함으로써 화학양론적 방식으로 번역을 억제하고 번역 체계를 물리적으로 차단할 수 있다. Dias, N. 외, (2002) Mol 암 Ther 1:347-355 참조. 상기 안티센스 RNA 분자는 약 15-30개의 타겟 mRNA에 보완적인 뉴클레오타이드를 가질 수 있다. 예를 들어, 상기 안티센스 RNA 분자는 표 1의 안티센스 염기서열 중 하나로부터의 최소한 15, 16, 17, 18, 19, 20 또는 그 이상의 인접한 뉴클레오타이드의 염기서열을 가질 수 있다.
용어 “안티센스 가닥”은 실질적으로 타겟 염기서열에 보완적인 영역을 포함하는 이중 가닥 RNAi 제제의 가닥을 말한다. 본 명세서에서 사용되는, 용어 관심 대상 단백질을 “부호화하는 mRNA 부분에 보완적인 영역”은 단백질을 부호화하는 타겟 mRNA 염기서열 부분에 실질적으로 보완적인 안티센스 가닥 상의 영역을 말한다. 보완성의 영역이 타겟 염기서열에 완전히 보완적이지 않은 경우, 이러한 비합치는 대부분 단말 영역에서 감수하게 되며, 이것이 존재하는 경우, 일반적으로 단말 영역 또는 영역들, 예를 들어, 5'및/또는 3'단말의 6, 5, 4, 3, 또는 2 뉴클레오타이드 내에 존재한다.
본 명세서에서 사용되는 용어 “센스 가닥”은 안티센스 가닥의 영역에 실질적으로 보완적인 영역을 포함하는 dsRNA의 가닥을 말한다.
다양한 실시예에서, 본 발명의 핵산 분자는, 예를 들어, 분자의 안정성, 잡종 형성, 또는 용해성을 개선하기 위해 염기 비결합 성분, 당 비결합 성분 또는 인산염 백본에서 수정될 수 있다. 예를 들어, 핵산의 데옥시리보스 인산염 백본이 펩티드 핵산을 생성하기 위해 수정될 수 있다(Hyrup 외, 1996, Bio 기관 ic & Medicinal Chemistry 4(1): 5-23 참조). 본 명세서에서 사용되는, 용어 "펩티드 핵산" 또는 "PNA"는 그 안에서 데옥시리보스 인산염 백본이 수도펩티드 백본으로 교체되고 네 개의 자연적 핵 염기만이 유지되는 핵산 모방체, 예를 들어, DNA 모방체를 말한다. PNA의 중성 백본은 낮은 이온 강도의 조건에서 DNA 및 RNA에 대한 특정한 잡종 형성을 허용하는 것으로 밝혀 졌다. PNA 올리고머의 합성은 Hyrup 외 (1996), 상기 설명과 같음; Perry-O'Keefe 외 (1996) Proc . Natl . Acad . Sci . USA 93:14670-675에 기술된 표준 고체 상태 펩티드 합성 프로토콜을 사용하여 수행될 수 있다.
PNA는 치료적 및 진단적 적용에 사용될 수 있다. 예를 들어, PNA는, 예를 들어, 전사 또는 번역 억제 또는 금지형 복제를 유도함으로써 유전자 발현의 염기서열-특정한 조절을 위한 항센스 또는 항유전자 제제로서 사용될 수 있다. PNA는 또한, 다른 효소들과 조합하여 사용되는 경우 인위적 제한 효소, 예를 들어, S1 뉴클레아제(Hyrup (1996), 상기 설명과 같음)로서 또는 DNA 염기서열 및 잡종 형성을 위한 탐침 또는 프라이머(하이럽(Hyrup), 1996, 상기 설명과 같음; 피에리오키페(Perry-O'Keefe) 외, 1996, Proc . Natl . Acad . Sci. USA 93:14670-675)로서, 예를 들어, 유전자 내에서 예를 들어, PNA 방향적 PCR 클램핑에 의한 단일 염기 쌍 변이를 분석하기 위해 사용될 수 있다.
또 다른 실시예에서, PNA는, 예를 들어, 이들의 안정성 또는 세포 흡수를 개선시키기 위해 친유성 또는 기타 도움이 되는 군을 PNA에 부착시킴으로써, PNA-DNA 키메라를 형성함으로써, 또는 리포솜 또는 해당 분야에서 알려진 약 전달에 관한 기타 기술을 사용함으로써 수정될 수 있다. 예를 들어, PNA 및 DNA의 유익한 특성을 결합시킬 수 있는 PNA-DNA 키메라가 생성될 수 있다. 이러한 키메라는 DNA 식별 효소, 예를 들어, PNA 부분이 고 결합 친화성 및 특정성을 제공하면서 리보뉴클레아제 H 및 DNA 중합효소가 DNA 부분과 반응할 수 있게 해 준다. PNA-DNA 키메라는 염기 스태킹, 핵염기 사이의 결합의 개수 및 방향의 관점에서 선택된 적절한 길이의 링커를 사용하여 결합될 수 있다(하이럽(Hyrup), 1996, 상기 설명과 같음). PNA-DNA 키메라의 합성은 하이럽(Hyrup)(1996), 상기 설명과 같음, 및 핀(Finn) 외 (1996) Nuclear Acids Res. 24(17):3357-63에 설명된 대로 수행될 수 있다. 예를 들어, DNA 체인이 고체 지지체 상에 표준 인산라미다이트 결합 화학 및 수정된 뉴클레오시드 유사체를 사용하여 합성될 수 있다. 5'-(4-메톡시트리틸)아미노-5'-데옥시-티미딘 인산라미다이트와 같은 화합물은 PNA와 DNA의 5' 단말 사이의 링크로 사용될 수 있다(마그(Mag) 외, 1989, Nuclear Acids Res. 17:5973-88). PNA 단량체는 5' PNA 세그먼트 및 3' DNA 세그먼트와 키메릭 분자를 생성하기 위해 다시 단계별로 결합될 수 있다(핀(Finn) 외, 1996, Nuclear Acids Res. 24(17):3357-63). 대체적 방법으로, 키메릭 분자는 5' DNA 세그먼트 및 3' PNA 세그먼트로 합성될 수 있다(피터세르(Peterser) 외, 1975, Bioorganic Med . Chem . Lett . 5:1119-11124).
다른 실시예에서, 상기 올리고뉴클레오타이드는 펩티드(예를 들어, 생체 내 숙주 세포 수용기 타겟팅을 위해)와 같은 다른 부착된 그룹 또는 세포 막 사이의 이동을 쉽게 해 주는 제제(예를 들어, 레스팅거(Letsinger) 외, 1989, Proc . Natl . Acad . Sci . USA 86:6553-6556; 라마이트리(Lemaitre) 외, 1987, Proc . Natl . Acad . Sci . USA 84:648-652; PCT 국제 공개 WO 88/09810 참조), 또는 혈액-뇌 장막(예를 들어, PCT 국제 공개 WO 89/10134 참조)을 포함할 수 있다. 또한, 올리고뉴클레오타이드는 잡종 형성-촉발 분리 제제(예를 들어, 크롤(Krol) 외, 1988, Bio /기술s 6:958-976 참조) 또는 삽입 제제(예를 들어, 존(Zon), 1988, Pharm . Res . 5:539-549 참조)로 수정될 수 있다. 이러한 목적으로, 상기 올리고뉴클레오타이드는 또 다른 분자, 예를 들어, 펩티드, 잡종 형성 촉발 교차 연결 제제, 이송 제제, 잡종 형성 촉발 분리 제제 등과 켤레를 이룰 수 있다.
본 발명은 또한 분자의 비컨이 표본 내 본 발명의 핵산의 존재를 정량 측정하기에 유용하도록 본 발명의 핵산에 보완적인 최소한 하나의 영역을 가지는 분자의 비컨 핵산을 포함한다. "분자의 비컨" 핵산은 한 쌍의 보완 영역을 포함하며 형광단 및 이와 연관된 형광 소광제를 가지는 핵산이다. 상기 형광단 및 소광제는 보완 영역이 서로 아닐링될 때 형광단의 형광이 소광제에 의해 소광되는 방향으로 핵산의 다른 부분과 연관되어 있다. 핵산의 보완 영역이 서로 아닐링되지 않을 때는, 형광단의 형광은 감소된 정도로 소광된다. 분자의 비컨 핵산은, 예를 들어, 미국 특허 5,876,930에 기술되어 있다.
D.
분리된 단백질 및 항체
본 발명의 일 측면은 표지 인자 단백질 또는 이의 파편에 대하여 항체를 높이기 위한 면역원으로 사용하기에 적절한 폴리펩티드 파편뿐만 아니라 분리된 표지 인자 단백질 및 이의 생물학적으로 활성화된 부분에 관한 것이다. 일 실시예에서, 상기 본래의 표지 인자 단백질은 표준 단백질 정제 기술을 사용하는 적절한 정제 방법을 사용하여 세포 또는 조직 소스로부터 분리될 수 있다. 또 다른 실시예에서, 표지 인자 단백질의 전체 또는 세그먼트를 포함하는 단백질 또는 펩티드는 재조합 DNA 기술에 의해 생산된다. 단백질 또는 펩티드와 같은 재조합 발현에 대한 대체적 방법이 표준 펩티드 합성 기술을 사용하여 화학적으로 합성될 수 있다.
"분리된" 또는 "정제된" 단백질 또는 이의 생물학적으로 활성화된 부분은 이로부터 단백질이 도출되는 세포 물질 또는 세포 또는 조직 소스로부터의 기타 오염 단백질이 실질적으로 존재하지 않거나, 화학적으로 합성되었을 때 화학적 전구체 또는 다른 화학 물질이 실질적으로 존재하지 않는다. "세포 물질이 실질적으로 존재하지 않는다"는 언어 표현은 단백질이 자신이 분리된 세포의 세포 성분으로부터 분리되거나 재조합적으로 생산되는 단백질의 준비를 포함한다. 따라서, 세포 물질이 실질적으로 존재하지 않는 단백질은 약 30%, 20%, 10%, 또는 5%(건조 중량 기준)의 비상동 단백질(본 명세서에서는 "오염 단백질"로도 불림)을 가지는 단백질의 준비를 포함한다. 단백질 또는 이의 생물학적으로 활성화된 부분이 재조합적으로 생산되는 경우, 배양 매체가 실질적으로 없는 것, 즉, 배양 매체가 준비된 단백질 부피의 약 20%, 10%, 또는 5% 미만을 나타내는 것이 또한 바람직하다. 단백질이 화학적으로 합성되는 경우, 화학적 전구체 또는 다른 화학 물질이 실질적으로 없는 것, 즉, 단백질이 단백질의 합성에 관련된 화학적 전구체 또는 다른 화학 물질로부터 분리되는 것이 바람직하다. 이에 따라 이러한 단백질의 준비는 화학적 전구체 또는 관심있는 폴리펩티드가 아닌 다른 화합물을 약 30%, 20%, 10%, 5% (건조 중량 기준) 미만으로 포함하도록 한다.
표지 인자 단백질의 생물학적으로 활성화된 부분은 표지 인자 단백질의 아미노산 염기서열에 충분히 동일하거나 이로부터 도출되는 아미노산 염기서열을 포함하는 폴리펩티드를 포함하며, 이는 완전한 길이의 단백질보다 적은 수의 아미노산을 포함하고 해당하는 완전한 길이의 단백질의 최소한 하나의 활성을 보인다. 일반적으로, 생물학적으로 활성화된 부분은 자신과 상응하는 완전한 길이의 단백질의 최소한 하나의 활성의 도메인 또는 모티프를 포함한다. 본 발명의 단백질의 표지 인자에서 생물학적으로 활성화된 부분은 예를 들어, 10, 25, 50, 100 또는 그 이상의 길이를 가지는 아미노산인 폴리펩티드일 수 있다. 또한, 표지 인자 단백질의 다른 영역이 삭제되는 다른 생물학적으로 활성화된 부분이 재조합 기술로 제조되고 표지 인자 단백질의 자연적 형태의 하나 또는 그 이상의 기능적 활성에 대해 평가될 수 있다.
바람직한 표지 인자 단백질은 상기 예들에서 기술된 임의의 유전자를 부호화하는 염기서열을 포함하는 뉴클레오타이드 염기서열에 의해 부호화된다. 다른 유용한 단백질들은 실질적으로 이러한 염기서열 중 하나와 동일하며(예를 들어, 최소한 약 40%, 바람직하게는 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%) 상응하는 자연적으로 발생하나 자연적 대립 형질 변이 또는 돌연변이 유발로 인해 다른 아미노산 염기서열을 가지는 표지 인자 단백질의 기능적 활성을 가진다.
두 아미노산 염기서열 또는 두 핵산의 백분율 유사성을 결정하기 위해, 상기 염기서열들은 최적의 비교를 위한 목적으로 정렬된다(예를 들어, 제 2 아미노산 또는 핵산 염기서열과의 최적의 정렬을 위해 제 1 아미노산 또는 핵산 염기서열의 염기서열에 간격이 도입될 수 있다). 상응하는 아미노산 위치 또는 뉴클레오타이드 위치의 아미노산 잔여부 또는 뉴클레오타이드가 이후 비교될 수 있다. 제 1 염기서열 내의 위치가 제 2 염기서열 내 상응하는 위치와 동일한 아미노산 잔여부 또는 뉴클레오타이드에 의해 점유되었을 때는, 상기 분자들은 해당 위치에서 동일하다. 바람직하게는, 두 염기서열 사이의 백분율 유사성은 전역 정렬을 이용하여 계산된다. 대체적 방법으로, 두 염기서열 사이의 백분율 유사성은 국지적 정렬을 이용하여 계산된다. 두 염기서열 사이의 백분율 유사성은 염기서열에 의해 공유되는 동일한 위치의 개수의 함수이다(즉, % 동일성 = 동일한 위치의 개수/전체 위치 개수(예를 들어, 중첩 위치) x100). 일 실시예에서 상기 두 염기서열은 동일한 길이를 가진다. 또 다른 실시예에서, 상기 두 염기서열은 동일한 길이를 갖지 않는다.
두 염기서열 사이의 백분율 유사성 결정은 수학적 알고리즘을 사용하여 성취될 수 있다. 두 염기서열의 비교를 위해 사용되는 바람직한, 비한정적인 수학적 알고리즘의 예는 다음과 같다: 칼린(Karlin)과 (Altschul)의 알고리즘(1990) Proc . Natl . Acad . Sci. USA 87:2264-2268, 칼린(Karlin)과 (Altschul)의 수정된 알고리즘(1993) Proc . Natl . Acad. Sci . USA 90:5873-5877. 이러한 알고리즘은 BLASTN 및 BLASTX 프로그램, 알스철(Altschul) 외 (1990) J. Mol . Biol . 215:403-410에 통합되었다. BLAST 뉴클레오타이드 탐색은 본 발명의 핵산 분자에 상동인 뉴클레오타이드 염기서열을 얻기 위해 BLASTN 프로그램, 점수 = 100, 단어 길이 = 12,을 사용하여 수행될 수 있다. BLAST 단백질 탐색은 본 발명의 단백질 분자에 상동인 아미노산 염기서열을 얻기 위해 BLASTP 프로그램, 점수 = 50, 단어 길이 = 3,으로 수행될 수 있다. 비교의 목적으로 간격을 가지는 정렬을 얻기 위해서는, Gapped BLAST라 불리는 새로운 버전의 BLAST 알고리즘을 알스철(Altschul) 외 (1997) Nuclear Acid Res . 25:3389-3402에 설명된 대로 활용할 수 있으며, 이 알고리즘은 프로그램 BLASTN, BLASTP 및 BLASTX에 대해 간격을 가지는 국지적 정렬을 수행할 수 있다. 대체적 방법으로, 분자들 사이의 먼 관계를 탐지하는 PSI-Blast가 반복적 탐색을 수행하기 위해 사용될 수 있다. BLAST Gapped BLAST, 및 PSI-Blast 프로그램을 활용할 때, 각 프로그램들의 기본 매개변수들(예를 들어, BLASTX 및 BLASTN)이 사용될 수 있다. http://www.ncbi.nlm.nih.gov 참조. 염기서열의 비교를 위해 활용되는 또 다른 바람직한 비 한정적인 수학적 알고리즘의 예는 마이어스(Myers)와 밀러(Miller)(1988) CABIOS 4:11-17의 알고리즘이다. 이러한 알고리즘은 GCG 염기서열 정렬 소프트웨어 패키지의 일부인 ALIGN 프로그램(버전 2.0)에 통합되었다. 아미노산 염기서열의 비교를 위해 ALIGN 프로그램을 사용할 때는, PAM120 중량 잔여부 테이블, 12의 간격 길이 벌칙, 및 4의 간격 벌칙이 사용될 수 있다. 국지적 염기서열 유사성 및 정렬의 영역을 식별하기 위한 또 다른 유용한 알고리즘으로 FASTA 알고리즘이 있으며, 피어슨(Pearson)과 (Lipman) (1988) Proc . Natl . Acad . Sci . USA 85:2444-2448에 설명되어 있다. 뉴클레오타이드 또는 아미노산 염기서열의 비교를 위해 FASTA 알고리즘을 사용할 때는, PAM120 중량 잔여부 테이블이, 예를 들어, k-tuple 값을 2로 하여 사용될 수 있다.
두 염기서열 사이의 백분율 유사성은 상기 설명한 것과 유사한 기술을 사용하여 또는 간격을 허용하거나 허용하지 않으면서 결정될 수 있다. 백분율 유사성을 계산함에 있어, 정확히 합치되는 것만 계수된다.
본 발명은 또한 표지 인자 단백질 또는 이의 세그먼트를 포함하는 키메릭 또는 융합 단백질을 제공한다. 본 명세서에서 사용되는, "키메릭 단백질" 또는 "융합 단백질"은 비상동 폴리펩티드(즉, 표지 인자 단백질이 아닌 폴리펩티드)에 서로 작용하도록 연결된 표지 인자 단백질의 전부 또는 일부(바람직하게는 생물학적으로 활성화된 부분)를 포함한다. 융합 단백질 내에서, 용어 "작용하도록 연결된"이란 표지 인자 단백질 또는 이의 세그먼트 및 비상동 폴리펩티드가 프레임 내에서 서로 융합되어 있음을 나타내기 위한 것이다. 상기 비상동 폴리펩티드는 표지 인자 단백질 또는 세그먼트의 아미노-단말 또는 카르복실-단말에 융합될 수 있다.
하나의 유용한 융합 단백질은 표지 인자 단백질 또는 세그먼트가 GST 염기서열의 카르복실 단말로 융합되는 GST 융합 단백질이다. 이러한 융합 단백질은 본 발명의 재조합 폴리펩티드의 정제를 쉽게 하도록 할 수 있다.
또 다른 실시예에서, 상기 융합 단백질은 자신의 아미노 단말에서 비상동 신호 염기서열을 포함한다. 예를 들어, 표지 인자 단백질의 자연적인 신호 염기서열은 제거되고 또 다른 단백질의 신호 염기서열로 교체될 수 있다. 예를 들어, 바큐로바이러스 덮개 단백질의 gp67 분비성 염기서열이 비상동 신호 염기서열(아우스벨(Ausubel) 외, ed., 분자생물학에서의 현재 프로토콜, 존 와일리 앤 선스(John Wiley & Sons), NY, 1992)로 사용될 수 있다. 진핵 세포 비상동 신호 염기서열의 다른 예는 멜리틴 및 인간 태반의 알칼리 포스타파아제(스트라타 유전자; 라 졸라(La Jolla), 캘리포니아)의 분비성 염기서열을 포함한다. 또 다른 예에서, 유용한 원핵 세포 비상동 신호 염기서열은 phoA 분비성 신호(샘브룩(Sambrook) 외, 상기 설명과 같음) 및 상기 단백질 A 분비성 신호(Pharmacia Biotech; 피카타웨이, 뉴저지)를 포함한다.
또 다른 실시예에서, 상기 융합 단백질은 표지 인자 단백질의 전부 또는 일부가 면역 글로불린 단백질 군의 소속 단백질로부터 도출된 염기서열로 융합되는 면역 글로불린 융합 단백질이다. 본 발명의 상기 면역 글로불린 융합단백질들은 약학적 성분으로 통합되어 세포(수용기)의 표면에서 리간드 (용해성 또는 막 부착성)와 단백질 사이의 상호 반응을 억제하기 위해 대상에게 투여될 수 있으며, 이로써생체 내 신호 형질 도입을 억제한다. 상기 면역 글로불린 융합 단백질은 표지 인자 단백질의 유사한 리간드의 생물학적 유용성에 영향을 주기 위해 사용될 수 있다. 리간드/수용기 상호 반응의 금지는 증식성 및 분할성 질환을 치료하고 세포 생존을 조절(예를 들어 촉진 또는 억제)하는데 모두 치료적으로 유용할 수 있다. 또한, 본 발명의 상기 면역 글로불린 융합 단백질들은 대상 내의 표지 인자 단백질 에 대한 항체를 생산하고 리간드를 정제하며 및 선별 분석에서 리간드에 의한 표지 인자 단백질의 상호 반응을 억제하는 분자를 식별하기 위해 면역원으로서 사용될 수 있다.
본 발명의 키메릭 및 융합단백질들은 표준 재조합 DNA 기술에 의해 생성될 수 있다. 또 다른 실시예에서, 상기 융합 유전자는 자동화된 DNA 합성기를 포함하는 통상적인 기술을 사용하여 합성될 수 있다. 대체적 방법으로, 유전자 파편의 PCR 증폭이 두 연속된 유전자 파편 간의 보완적 오버행을 일으키는 앵커 프라이머를 사용하여 수행될 수 있으며, 이들은 다시 아닐링되고 재증폭되어 키메릭 유전자 염기서열을 생성할 수 있다(예를 들어, Ausubel 외, 상기 설명과 같음 참조). 또한, 융합 비결합 성분(예를 들어, GST 폴리펩티드)을 부호화하는 많은 발현 벡터들이 이미 상용으로 사용 가능하다. 핵산을 부호화하는 본 발명의 폴리펩티드는 융합 비결합 성분이 프레임 내에서 본 발명의 폴리펩티드에 결합되도록 이러한 발현 벡터로 복제될 수 있다.
신호 염기서열이 표지 인자 단백질의 분비 및 분리를 촉진하기 위해 사용될 수 있다. 신호 염기서열은 일반적으로 하나 또는 그 이상의 쪼개지는 이벤트에서 분비되는 동안 일반적으로 성숙한 단백질로부터 쪼개지는 소수성 아미노산의 스코어에 의해 특징지워진다. 이러한 신호 펩티드는 성숙한 단백질로부터의 신호 염기서열이 분비성 경로를 통과하면서 쪼개지는 것을 허용하는 처리 부위를 포함한다. 따라서, 본 발명은 신호 염기서열이 이로부터 단백질 가수 분해적으로 쪼개진 단백질(즉, 분리 산물)뿐만 아니라 표지 인자 단백질, 융합 단백질 또는 이의 신호 염기서열을 가지는 세그먼트에 관한 것이다. 일 실시예에서, 신호 염기서열을 부호화하는 핵산 염기서열은 발현 벡터 내에서 표지 인자 단백질 또는 이의 세그먼트와 같은 관심 대상 단백질에 작용 가능하게 연결된다. 이러한 상기 신호 염기서열은 발현 벡터가 변환되어 가는 진핵 세포 숙주 등으로부터 단백질의 분비를 일으키며, 상기 신호 염기서열은 이후에 또는 동시에 쪼개진다. 이 단백질은 세포외 매체로부터 해당 분야에 알려진 방법으로 쉽게 정제될 수 있다. 대체적 방법으로, 상기 신호 염기서열은 GST 도메인과 같이 정제를 촉진하는 염기서열을 사용하여 관심 대상 단백질에 연결될 수 있다.
본 발명은 또한 표지 인자 단백질의 이형에 관한 것이다. 이러한 이형은 작용 물질(mimetics) 또는 억제 물질 중의 하나로서 작용하는 변경된 아미노산 염기서열을 가지고 있다. 이형은, 예를 들어, 비연속적 점 변이 또는 절단과 같은 돌연변이 유발에 의해 생성될 수 있다. 작용 물질은 자연적으로 발생하는 형태의 단백질의 생물학적 활성과 실질적으로 동일하거나 이의 부분 집합인 활성을 가진다. 단백질의 억제 물질은 자연적으로 발생하는 형태의 단백질의 하나 또는 그 이상의 활성, 예를 들어, 관심 대상 단백질을 포함하는 세포 신호 전달 캐스케이드의 하향 또는 상향 요소로의 완전한 결합을 억제할 수 있다. 따라서, 제한된 기능의 이형에 의한 치료를 통해 특정한 생물학적 효과를 이끌어 낼 수 있다. 이형에 의한 자연적으로 발생하는 형태의 단백질의 생물학적 활성의 부분 집합에 의한 대상의 치료는 자연적으로 발생하는 형태의 단백질에 의한 치료에 비해 대상에서 일어나는 부작용을 줄일 수 있다.
작용 물질(mimetics) 또는 억제 물질 중 하나로서 기능하는 표지 인자 단백질의 이형은 작용 물질 또는 억제 물질 활성에 대한 본 발명의 단백질의 변이, 예를 들어, 절단 변이의 조합적 라이브러리의 선별에 의해 식별될 수 있다. 일 실시예에서, 다양화된 이형의 라이브러리가 조합적 돌연변이 유발에 의해 핵산 수준에서 생성되며 다양화된 유전자 라이브러리에 의해 부호화된다. 이형의 다양화된 라이브러리는, 예를 들어, 합성 올리고뉴클레오타이드의 혼합물을 잠재적 단백질 염기서열의 디제너레이트 집합이 개별적 폴리펩티드, 또는, 대체적 방법으로, 보다 큰 융합 단백질(예를 들어, 파지 전시)의 집합으로 발현되도록 유전자 염기서열로 효소적으로 묶어냄으로써 생산될 수 있다. 디제너레이트 올리고뉴클레오타이드 염기서열로부터 표지 인자 단백질의 잠재적 이형의 라이브러리를 생산하기 위해 사용될 수 있는 다양한 방법이 존재한다. 디제너레이트 올리고뉴클레오타이드를 합성하기 위한 방법이 해당 분야에서 알려져 있다(예를 들어, 나랑(Narang), 1983, Tetrahedron 39:3; 이타쿠라(Itakura) 외, 1984, Annu . Rev . Biochem. 53:323; 이타쿠라(Itakura) 외, 1984, 사이언스 198:1056; 이케(Ike) 외, 1983 Nucliear Acid Res . 11:477 참조).
추가적으로, 표지 인자 단백질의 세그먼트의 라이브러리가 이형 표지 인자 단백질 또는 이의 세그먼트의 선별 및 이후의 선택을 위한 폴리펩티드의 다양화된 군집을 생성하기 위해 사용될 수 있다. 예를 들어, 부호화 염기서열 파편의 라이브러리가 상성이 분자 당 오직 한 번만 일어나는 조건에서 관심의 대상인 부호화 염기서열의 이중 가닥 PCR 파편을 뉴클레아제에 의해 처리함으로써 생성될 수 있으며, 이에 따라 이중 가닥 DNA를 변성시키고, 서로 다른 상성의 제품으로부터의 센스/안티센스 쌍을 포함할 수 있는 이중 가닥 DNA를 형성하기 위해 DNA를 재생하며, S1 뉴클레아제에 의한 치료에 의해 재형성된 듀플렉스로부터 단일 가닥 부분을 제거하고, 결과적으로 발생하는 파편 라이브러리를 발현 벡터로 묶어 준다. 이 방법에 의해, 여러 크기의 관심이 있는 단백질의 아미노 단말 및 내부 파편을 부호화하는 발현 라이브러리가 도출될 수 있다.
해당 분야에서 점 변이 또는 절단에 의해 만들어진 조합적 라이브러리의 유전자 산물을 선별하고, 선택된 특성을 가지는 유전자 산물을 위한 cDNA 라이브러리를 선별하기 위한 다양한 기술이 알려져 있다. 대형 유전자 라이브러리의 선별을 위해 가장 널리 사용되는 기술은 고성능 출력 분석에 알맞은 방법으로서, 일반적으로 유전자 라이브러리의 복제 가능 발현 벡터로의 복제, 결과적으로 벡터의 라이브러리를 생산하는 적절한 세포 변형, 및 조합적 유전자를 원하는 활성의 탐지가 이로부터의 산물이 탐지되는 유전자를 부호화하는 벡터의 분리를 촉진시키는 조건에서 발현시키는 것을 포함한다. 돌연변이 유발(REM)의 재귀적 모임은, 라이브러리 내의 기능적 변이의 빈도를 향상시키는 기술로서, 본 발명의 단백질의 이형을 식별하기 위해 선별 분석과 조합되어 사용할 수 있다(아킨(Arkin) 및 유르반(Yourvan), 1992, Proc . Natl . Acad . Sci . USA 89:7811-7815; 델그레이브(Delgrave) 외, 1993, 단백질 엔지니어링 6(3):327- 331).
본 발명의 또 다른 측면은 본 발명의 단백질에 대한 항체에 관한 것이다. 바람직한 실시예에서, 상기 항체는 특히 표지 인자 단백질 또는 이의 파편에 결합한다. 본 명세서에서 교차적으로 사용되는 용어 "항체" 및 "항체들"은 면역 글로불린 분자의 면역학적으로 활성화된 부분을 포함하는 파편 및 이의 파생체(즉, 이러한 부분은 특히 표지 인자 단백질, 예를 들어, 표지 인자 단백질의 항원 결정 부위와 같은 항원에 결합하는 항원 결합 부위를 포함한다)뿐만 아니라 면역 글로불린 분자를 말한다. 특히 본 발명의 단백질에 결합하는 항체는 단백질에 결합하는 항체이지만, 실질적으로 표본 내 다른 분자, 예를 들어, 자연적으로 단백질을 포함하는 생물학적 표본에는 결합하지 않는다. 면역 글로불린 분자의 면역학적으로 활성화된 부분의 예는 단일 체인 항체(scAb), F(ab) 및 F(ab')2 파편을 포함하나 이에 한정되지는 않는다.
본 발명의 분리된 단백질 또는 이의 파편은 항체를 생성하기 위한 면역원으로 사용될 수 있다. 완전한 길이의 단백질이 사용되거나, 대체적 방법으로, 본 발명은 면역원으로 사용할 수 있는 항원적 펩티드 파편을 제공한다. 본 발명의 단백질의 상기 항원적 펩티드는 본 발명의 단백질들 중 하나의 아미노산 염기서열의 최소한 8(바람직하게는 10, 15, 20, 또는 30 또는 그 이상)개의 아미노산 잔여부를 포함하며, 단백질의 최소한 하나의 항원 결정 부위를 포괄하여 펩티드에 대해 올라간 항체가 단백질과 특정한 면역 복합체를 형성하도록 한다. 항원적 펩티드가 포괄하는 바람직한 항원 결정 부위는 단백질의 표면상에 위치한 영역, 예를 들어, 친수성 영역이다. 소수성 염기서열 분석, 친수성 염기서열 분석, 또는 유사한 분석들이 친수성 영역을 식별하기 위해 사용될 수 있다. 바람직한 실시예에서, 분리된 표지 인자 단백질 또는 이의 파편이 면역원으로 사용된다.
면역원은 일반적으로 토끼, 염소, 생쥐 또는 기타 포유류 또는 척추 동물과 같이 적절한(즉, 면역 능력을 가진) 대상이 면역력을 가지게 함으로써 항체를 준비하는데 사용된다. 적절한 면역원의 준비는, 예를 들어, 재조합적으로 발현되거나 화학적으로 합성된 단백질 또는 펩티드를 포함한다. 상기 준비는 프로인드(Freund)의 완전하거나 불완전한 보조제와 같은 보조제, 또는 유사한 면역 자극 인자의 제제를 더 포함할 수 있다. 바람직한 면역원 성분은, 예를 들어, 본 발명의 단백질의 재조합 발현을 위한 비인간 숙주 세포를 사용하여 만들어진 면역원 성분과 같은 인간 단백질 외에는 포함하지 않는 성분이다. 이러한 방식에서, 결과적인 항체 성분이 감소하거나 본 발명의 단백질외의 다른 어떠한 인간 단백질의 결합도 가지지 않는다.
본 발명은 다중 복제 및 단일 복제 항체를 제공한다. 본 명세서에서 사용되는 용어 "단일 복제 항체" 또는 "단일 복제 항체 성분"은 특정한 항원 결정 부위와 면역적으로 반응할 수 있는 오직 한 종의 항원 결합 부위만을 포함하는 항체 분자의 군집을 말한다. 바람직한 다중 복제 및 단일 복제 항체 성분은 본 발명의 단백질에 대한 항체에 대해서 선택된 성분이다. 특히 바람직한 다중 복제 및 단일 복제 항체 준비는 표지 인자 단백질 또는 이의 파편에 대한 항체만을 포함하는 것이다.
다중 복제 항체는 적절한 대상을 면역원으로서의 본 발명의 단백질에 고정시킴으로써 제조될 수 있다. 면역화된 대상에서 상기 항체의 시간이 지남에 따른 역가는 고정화된 폴리펩티드를 사용하는 효소 결합 면역 흡수 분석(ELISA)과 같은 표준 기술에 의해 모니터링될 수 있다. 면역화 후 적절한 시간 후, 예를 들어, 상기 특정한 항체 역가가 최고일 때, 항체 생산 세포가 대상으로부터 획득되어, 콜러(Kohler) 및 밀스타인(Milstein) (1975) 네이처 256:495-497에 원래 기술된 하이브리도마 기술, 인간 B 세포 하이브리도마 기술(코즈보르(Kozbor) 외, 1983, Immunol . Today 4:72 참조), EBV-하이브리도마 기술 (콜(Cole) 외, pp. 77-96 In 단일 복제 항체 및 암 치료, Alan R. Liss, Inc., 1985 참조) 또는 트리오마 기술과 같은 표준 기술에 의해 단일 복제 항체(mAb)를 생산하기 위해 사용될 수 있다. 하이브리도마를 제조하기 위한 상기 기술은 잘 알려져 있다(일반적으로 면역학에서의 현재 프로토콜, 콜리건(Coligan) 외 ed., 존 와일리 앤 선스(John Wiley & Sons), 뉴욕, 1994 참조). 단일 복제 본 발명의 항체를 생산하는 하이브리도마 세포들이, 예를 들어, 표준 ELISA 분석을 사용하여, 관심있는 폴리펩티드에 결합하는 항체에 대한 하이브리도마 배양 상층액을 선별함으로써 탐지된다.
단일 복제 항체-분비 하이브리도마를 생산하는 것에 대한 대체적 방법으로, 본 발명의 단백질에 대항하는 단일 복제 항체가 식별될 수 있으며, 재조합으로 조합된 면역 글로불린 라이브러리(예를 들어, 항체 파지 전시 라이브러리)를 관심있는 폴리펩티드로 선별함으로써 분리될 수 있다. 파지 전시 라이브러리를 생성하고 선별하기 위한 키트가 상업적으로 사용 가능하다(예를 들어, 파마시아의 재조합 파지 항체 시스템, 카탈로그 제 27-9400-01호; 및 스트라타 유전자 SurfZAP 파지 디스플레이 키트, 카탈로그 제 240612호). 추가적으로, 방법 및 반응 제제의 예, 특히 항체 디스플레이 라이브러리의 생성과 선별에 사용할 수 있는 예는, 예를 들어, 미국 특허 제 5,223,409호; PCT 국제 공개 WO 92/18619; PCT 국제 공개 WO 91/17271; PCT 국제 공개 WO 92/20791; PCT 국제 공개 WO 92/15679; PCT 국제 공개 WO 93/01288; PCT 국제 공개 WO 92/01047; PCT 국제 공개 WO 92/09690; PCT 국제 공개 WO 90/02809; 푸쉬(Fuchs) 외(1991) Bio /기술 9:1370-1372; 헤이(Hay) 외(1992) Hum . Antibod . Hydromas 3:81-85; 휴즈(Huse) 외(1989) 사이언스 246:1275- 1281; 그리피스(Griffiths) 외(1993) EMBO J. 12:725-734에서 찾아 볼 수 있다.
본 발명은 또한 특히 본 발명의 단백질에 결합하는 재조합 항체를 제공한다. 바람직한 실시예에서, 상기 재조합 항체는 특히 표지 인자 단백질 또는 이의 파편에 결합한다. 재조합 항체는 인간 및 비인간 부분을 모두 포함하는 키메릭 및 인간화된 단일 복제 항체, 단일 체인 항체 및 다중 특정 항체를 포함하나 이에 한정되지는 않는다. 키메릭 항체는 쥐과 동물 mAb로부터 도출된 변수 영역과 인간 면역 글로불린 상수 영역과 같이 다른 부분들이 다른 동물 종으로부터 도출되는 분자이다. (예를 들어, 참조에 의해 전체적으로 본 명세서에 통합된 카빌리(Cabilly) 외, 미국 특허 제 4,816,567호; 및 보스(Boss) 외, 미국 특허 제 4,816,397호 참조). 단일 체인 항체는 하나의 항원 결합 부위를 가지며 단일 폴리펩티드를 포함한다. 이들은 해당 분야에 알려진 기술, 예를 들어 다음 문헌 기술된 방법을 사용하여 생성될 수 있다: 래드너(Ladner) 외, 미국 특허 제 4,946,778호(본 명세서에서 참조에 의해 전체적으로 통합된다); 버드(Bird) 외, (1988) 사이언스 242:423-426; 위트로우(Whitlow) 외, (1991) 효소학의 방법 2:1-9; Whitlow 외, (1991) 효소학의 방법 2:97-105; 및 허스튼(Huston) 외, (1991) 효소학의 방법 분자 설계 및 모델링 : 개념 및 적용 203:46-88. 다중 특정 항체는 특히 다른 항원에 결합하는 최소한 둘 항원-결합 부위를 가지는 항체 분자이다. 이러한 분자는 해당 분야에 알려진 기술, 예를 들어 다음 문헌 기술된 방법을 사용하여 생성될 수 있다: 세갈(Segal), 미국 특허 제 4,676,980호(문헌의 개시는 참조에 의해 전체적으로 본 명세서에 통합되었다); 홀링거(Holliger) 외, (1993) Proc . Natl . Acad . Sci . USA 90:6444-6448; 위트로우(Whitlow) 외, (1994) Protein Eng . 7:1017-1026 및 미국 특허 제 6,121,424호.
인간화된 항체는 하나 또는 그 이상의 비인간 종으로부터의 보완성 결정 영역(CDR) 및 인간 면역 글로불린 분자로부터의 프레임워크 영역을 가지는 비인간 종으로부터의 항체 분자이다. (예를 들어, 참조에 의해 전체적으로 본 명세서에 통합된 미국 특허 제 5,585,089호 참조.) 인간화된 단일 복제 항체는 해당 분야에 알려진 기술, 예를 들어 다음 문헌 기술된 방법을 사용하여 생성될 수 있다: PCT 국제 공개 WO 87/02671; 유럽 특허 출원 제 184,187호; 유럽 특허 출원 제 171,496호; 유럽 특허 출원 제 173,494호; PCT 국제 공개 WO 86/01533; 미국 특허 제 4,816,567호; 유럽 특허 출원 제 125,023호; 베터(Better) 외(1988) 사이언스 240:1041-1043; 리우(Liu)외 (1987) Proc . Natl . Acad . Sci . USA 84:3439-3443; 리우(Liu) 외(1987) J. Immunol . 139:3521- 3526; 선(Sun) 외(1987) Proc . Natl . Acad . Sci . USA 84:214-218; 니시무라(Nishimura) (1987) Cancer Res . 47:999-1005; 우드(Wood) 외 (1985) 네이처 314:446-449; 및 쇼(Shaw) 외(1988) J. Natl . Cancer Inst . 80:1553-1559); 모리슨(Morrison)(1985) 사이언스 229:1202-1207; 오이(Oi) 외 (1986) Bio /Technics 4:214; 미국 특허 제 5,225,539호; 존스(Jones) 외 (1986) 네이처 321:552-525; 베르호이언(Verhoeyan) 외 (1988) 사이언스 239:1534; 및 바이들러(Beidler) 외 (1988) J. Immunol . 141:4053-4060.
보다 특정적으로, 인간화된 항체는, 예를 들어, 내생 면역 글로불린의 무겁고 가벼운 체인 유전자를 발현할 능력을 가지지 않으나 인간의 무겁고 가벼운 체인 유전자를 발현할 수 있는 형질 전환 생쥐를 사용하여 제조할 수 있다. 이러한 형질 전환 생쥐는 정상적 방법으로 선택된 항원, 예를 들어, 본 발명의 표지 인자에 해당하는 전부 또는 일부의 폴리펩티드로 면역화된다. 항원에 대한 단일 복제 항체는 통상의 하이브리도마 기술을 사용하여 획득할 수 있다. 상기 인간 면역 글로불린 트랜스유전자는 B 세포 분화 동안 재정렬되는 상기 형질 전환 생귀에 의해 자리를 잡으며, 이후 종류 변환 및 신체적 변이를 겪는다. 따라서, 이러한 기술을 사용하여, 치료적으로 유용한 IgG, IgA 및 IgE 항체를 제조하는 것이 가능하다. 인간 항체 제조를 위한 이러한 기술에 대한 검토는 론버그(Lonberg)와 허스자르(Huszar) (1995) Int . Rev . Immunol . 13:65-93를 참조할 수 있다. 인간 항체와 인간 단일 복제 항체 및 이러한 항체를 제조하기 위한 프로토콜에 대한 이러한 기술의 상세한 설명은, 예를 들어, 미국 특허 5,625,126; 미국 특허 5,633,425; 미국 특허 5,569,825; 미국 특허 5,661,016; 및 미국 특허 5,545,806을 참조할 수 있다. 또한, 아브제닉스(Abgenix, Inc. (Freemont, CA)) 사와 같은 회사들이, 상기 기술된 것과 유사한 기술을 사용하여 선택된 항원에 대한 인간 항체를 제공하기 위해 협력을 맺을 수 있다.
선택된 항원 결정 부위를 인식하는 완전히 인간적인 항체는 "안내된 선택"으로 불리는 기술을 사용하여 생성될 수 있다. 이러한 접근 방식에서 선택된 비인간 단일 복제 항체, 예를 들어, 쥐과 동물 항체가 동일한 항원 결정 부위를 인식하는 완전히 인간적인 항체의 선택을 안내하기 위해 사용된다(제스퍼스(Jespers) 외, 1994, Bio /Technics 12:899-903).
본 발명의 항체는 생산 이후에 분리될 수 있으며(예를 들어, 대상의 혈액 또는 혈청으로부터) 또는 해당 분야에 잘 알려진 기술에 의해 합성 및 더 정제될 수 있다. 예를 들어, IgG 항체는 단백질 A 크로마토그래피를 사용하여 정제될 수 있다. 본 발명의 단백질에 특정한 항체는 선택되거나(예를 들어, 부분적인 정제), 예를 들어, 친화성 크로마토그래피에 의해 정제될 수 있다. 예를 들어, 재조합적으로 발현되고 정제된(또는 부분적으로 정제된) 본 발명의 단백질은 본 명세서에 설명된 대로, 또한, 예를 들어, 크로마토그래피 기둥과 같은 고체 지지체에 공유 결합적으로 또는 비공유 결합적으로 결합되어 생산된다. 상기 기둥은 많은 수의 서로 다른 항원 결정 부위에 대한 항체를 포함하는 표본으로부터의 본 발명의 단백질들에 특정한 항체를 정제하여 친화성을 가지게 하기 위해 사용될 수 있으며, 이에 의해 실질적으로 정제된 항체 성분, 즉, 실질적으로 오염 항체가 없는 항체 성분을 생성한다. 실질적으로 정제된 항체 성분은, 본 발명의 맥락에서, 항체 표본이 원하는 본 발명의 단백질이 아닌 항원 결정 부위에 대한 오염 항체를 최대 30%(건조 중량 기준) 이하로 포함하며, 바람직하게는 표본의 최대 20%, 보다 바람직하게는 최대 10%, 및 가장 바람직하게는 최대 5%(건조 중량 기준)가 오염 항체인 것을 의미한다. 정제된 항체 성분은 성분 내의 최소한 99%의 항체가 본 발명의 바람직한 단백질에 대한 것임을 의미한다.
바람직한 실시예에서, 본 발명의 상기 실질적으로 정제된 항체는 특히 본 발명의 단백질의 신호 펩티드, 분비된 염기서열, 외부세포 영역, 막 관통이나 세포질막 영역, 또는 세포질막에 결합될 수 있다. 특히 바람직한 실시예에서, 본 발명의 상기 실질적으로 정제된 항체는 특히 본 발명의 단백질의 아미노산 염기서열의 분비된 염기서열 또는 외부 세포 영역에 결합된다. 보다 바람직한 실시예에서, 상기 실질적으로 정제된 본 발명의 항체는 특히 표지 인자 단백질의 아미노산 염기서열의 분비된 염기서열 또는 외부 세포 영역에 결합된다.
본 발명의 단백질에 대항하는 항체는 친화성 크로마토그래피 또는 면역 침강법과 같은 표준 기술에 의해 단백질을 분리하기 위해 사용될 수 있다. 더구나, 이러한 항체는 표지 인자의 발현의 수준 및 패턴을 평가하기 위해, (예를 들어, 세포 용해물 또는 세포 상층액 내의) 표지 인자 단백질 또는 이의 파편을 탐지하는데 사용될 수 있다. 상기 항체는 예를 들어, 주어진 치료 식이 요법의 효능을 결정하기 위한 임상적 절차의 일부로서 조직 또는 체액 내의 단백질 수준(예를 들어 체액과 연관된 질병 상태 또는 독성 상태에서)을 진단적으로 모니터링하기 위해 사용될 수 있다. 탐지는 항표지 인자 항체를 탐지 가능물질에 결합하는 본 발명의 항체를 포함하는 항체 파생체를 사용하여 쉽게 수행될 수 있다. 탐지 가능물질의 예는 여러 효소, 보족기, 형광 물질, 발광성 물질, 생물발광 물질, 및 방사능 물질을 포함한다. 적절한 효소의 예는 호스래디시 퍼옥시다제, 알칼리 포스타파아제, β-갈락토시다제, 또는 아세틸촐린에스테라제를 포함하며; 적절한 보족기 복합체의 예는 스트렙타비딘/비오딘 및 아비딘/비오딘을 포함하며; 적절한 형광 물질의 예는 움벨리페론, 플루오레세인, 플루오레세인 이소티오시아네이트, 로다민, 디클로로트리아지닐라민 플루오레세인, 염화단실 또는 피코에리티린을 포함하며; 발광성 물질의 예는 루미놀을 포함하며; 생물 발광 물질의 예는 루시퍼라제, 루시퍼린, 및 아에쿼린을 포함하며; 적절한 방사능 물질의 예는 125I, 131I, 35S, 14C, 또는 3H를 포함한다.
본 발명의 항체는 암을 치료하기 위한 치료용 제제로 사용될 수 있다. 바람직한 실시예에서, 완전하게 인간적인 본 발명의 항체는 특히 암을 가지는 인간의 암 환자의 치료적 치료제로서 사용될 수 있다. 또 다른 바람직한 실시예에서, 항체, 특히 표지 인자 단백질 또는 이의 파편에 결합하는 항체는 치료적 처리를 위해 사용된다. 또한, 이러한 치료적 항체는 세포 독소와 같은 치료적 비결합 성분과 켤레를 이루는 항체를 포함하는 항체 파생체 또는 면역 독소, 치료용 제제 또는 방사성 금속 이온이다. 세포 독소 또는 세포 독성 제제는 세포에 해가 되는 모든 제제를 포함한다. 그 예는 탁솔, 산이토찰라신 B, 그라미시딘 D, 브롬화 에티듐, 에메틴, 미토마이신, 에토포사이드, 테노포시드, 빈크리스틴, 빈블라스틴, 콜치신, 독소루비신, 다우노루비신, 디하이드록시 안트라신 디온, 미톡산트론, 미트란마이신, 악티노마이신 D, 1-디하이드로테스토테론, 글루코코티코이드, 프로카인, 테트라카인, 리도카인, 프로파놀롤, 및 퓨로마이신 및 유사체 또는 이의 상동. 치료용 제제는 항대사 물질(예를 들어, 메토트렉세이트, 6-메르캅토퓨린, 6-티오구아닌, 사이타라빈, 5-불화우라실 데카바자인), 알킬화 제제(예를 들어, 메클로레타민, 티오에파 클로람부실, 메팔란, 카르머스틴(BSNU) 및 로무스틴(CCNU), 사이콘덴세호스파마이드, 부설판, 디브로모마니톨, 스트렙토조토신, 미토마이신 C, 및 시스-디클로로나아민 플라티늄(II) (DDP) 시스플라틴), 안트라사이클린 (예를 들어, 다우노루비신(이전의 다우노마이신) 및 독소루비신), 항생제 (예를 들어, 댁티노마이신(이전의 액티노마이신), 블레오마이신, 미트라마이신, 및 안트라마이신(AMC)), 및 항유사 분열 제제(예를 들어, 빈크리스틴 및 빈블라스틴)를 포함하나 이에 한정되지는 않는다.
본 발명의 켤레 항체는 주어진 생물학적 반응을 변화시키기 위해 사용될 수 있으며, 약제의 비결합 성분은 고전적 화학적 치료용 제제에 한정되지 않는 것으로 추정되어야 한다. 예를 들어, 약제 비결합 성분은 원하는 생물학적 활성을 보유하는 단백질 또는 폴리펩티드일 수 있다. 이러한 단백질은, 예를 들어, 리보좀 억제 단백질(베터(Better) 외, 미국 특허 제 6,146,631호 참조, 상기 문헌의 개시는 본 명세서에 전체적으로 통합된다), 아브린, 리신 A, 수도모나스 엑소독소, 또는 디프테리아 독소와 같은 독소; 종양 괴사 요소, 알파 인터페론, 베타 인터페론, 신경 성장 요소, 혈소판 도출 성장 요소, 조직 플라스미노겐 활성 인자와 같은 단백질; 또는, 예를 들어, 림포킨, 인터루킨-1 ("IL-1"), 인터루킨-2 ("IL-2"), 인터루킨-6 ("IL-6"), 그래뉼로사이트 마크로파제 군체 자극 요소("GM-CSF"), 그래뉼로사이트 군체 자극 요소("G-CSF")와 같은 생물학적 반응 변경 인자, 또는 기타 성장 요소를 포함할 수 있다.
이러한 치료적 비결합 성분을 항체에 켤레로 만드는 기술은 잘 알려져 있으며, 예를 들어, 다음 문헌을 참조할 수 있다: 아르논(Arnon) 외, "암 치료에서 약제의 면역 타게팅을 위한 단일 복제 항체", in 단일 복제 항체 및 암 치료, 라이스필드(Reisfeld) 외(eds.), pp. 243-56 (Alan R. Liss, Inc. 1985); 헬스트롬(Hellstrom) 외, " 약 전달을 위한 항체", 제어된 약 전달(제 2판), 로빈슨(Robinson) 외(eds.), pp. 623-53 (Marcel Dekker, Inc. 1987); 소르페(Thorpe), "암 치료에서 세포 독성 제제의 항체 담체: 리뷰", 단일 복제 항체 '84: 생물학적 및 임상적 적용, 핀체라(Pinchera[ 외(eds.), pp. 475-506 (1985); "암 치료에서 방사성 라벨링된 항체의 치료적 사용의 분석, 결과, 및 향후 전망", 암 탐지 및 치료를 위한 단일 복제 항체, 볼드윈(Baldwin) 외 (eds.), pp. 303-16 (Academic Press 1985), 및 소르페(Thorpe) 외, "항체-독소 켤례의 준비 및 세포 독성 특성", Immunol. Rev., 62:119-58 (1982).
이에 따라, 한 측면에서, 본 발명은 실질적으로 정제된 항체, 항체 파편 및 파생체를 제공하며, 이들 모두는 특히 본 발명의 단백질 및 바람직하게는, 표지 인자 단백질에 결합한다. 다양한 실시예에서, 상기 실질적으로 정제된 본 발명의 항체, 또는 파편 또는 이의 파생체는 인간, 비인간, 키메릭 및/또는 인간화된 항체일 수 있다. 또 다른 측면에서, 본 발명은 비인간 항체, 항체 파편 및 파생체를 제공하며, 이들 모두는 특히 본 발명의 단백질, 바람직하게는, 표지 인자 단백질에 결합한다. 이러한 비인간 항체는 염소, 생쥐, 양, 말, 닭, 쥐 또는 쥐의 항체일 수 있다. 대체적 방법으로, 본 발명의 상기 비인간 항체는 키메릭 및/또는 인간화된 항체일 수 있다. 또한, 상기 비인간 본 발명의 항체는 다중 복제 항체 또는 단일 복제 항체일 수 있다. 또 다른 부가적인 측면에서, 본 발명은 단일 복제 항체, 항체 파편 및 파생체를 제공하며, 이들 모두는 특히 본 발명의 단백질, 바람직하게는, 표지 인자 단백질에 결합한다. 상기 단일 복제 항체는 인간 및 인간화된 항체, 키메릭 및/또는 비인간 항체일 수 있다.
본 발명은 또한 탐지 가능 물질에 짝지어질 수 있는 본 발명의 항체를 포함하는 키트, 및 사용 지침을 포함한다. 본 발명의 또 다른 측면은 본 발명의 항체를 포함하는 약학적 성분을 포함한다. 일 실시예에서, 상기 약학적 성분은 본 발명의 항체 및 약학적으로 허용되는 담체를 포함한다.
E.
예측적
의약품
본 발명은 진단적 분석, 예후의 분석, 약물 유전체학, 및 검사 및 임상적 조사가 예후의(예측적) 목적으로 사용되어 이에 의해 개별적 예방적 활동을 수행하는 예측적 의약품의 분야에 관한 것이다. 이에 따라, 본 발명의 한 측면은 개체가 특정 질병 또는 약제로 유도되는 독성을 진전시킬 위험이 있는 지를 결정하기 위하여 단백질 또는 핵산의 하나 또는 그 이상의 표지 인자의 발현 수준을 결정하기 위한 진단적 분석에 관한 것이다. 이러한 분석은 예후의 또는 예측적 목적으로 사용될 수 있으며, 이에 의해 질환이 시작되기 이전에 개체를 예방적으로 치료할 수 있다.
본 발명의 또 다른 측면은 임상적 시도에서 제제(예를 들어, 질환 또는 약제로 유도되는 독성을 억제, 치료 또는 예방하기 위한 목적 중 하나로 투여되는 약제 또는 기타 화합물{즉 이러한 치료가 가지는 약제로 유도되는 독성 효과를 이해하기 위해})의 본 발명의 표지 인자의 발현 또는 활성에 대한 영향을 모니터링하는 것에 대한 것이다. 이들 및 기타 다른 제제들은 이후의 절에서 보다 상세히 설명된다.
F.
진단적 분석
생물학적 표본 내 표지 인자 단백질 또는 핵산의 존재 또는 부존재를 결정하기 위한 예시적 방법은 검사 대상으로부터 생물학적 표본(예를 들어 독성 관련 체액 또는 조직 표본)을 획득하는 단계 및 생물학적 표본을 폴리펩티드 또는 핵산(예를 들어, mRNA, 게놈 DNA, 또는 cDNA)를 탐지할 수 있는 화합물 또는 제제와 접촉시키는 단계를 포함한다. 따라서 본 발명의 탐지 방법은, 예를 들어, 생체 내 생물학적 표본뿐만 아니로 생체 외 생물학적 표본에 대해서 mRNA, 단백질, cDNA, 또는 게놈 DNA를 탐지하기 위해 사용될 수 있다. 예를 들어, mRNA의 탐지를 위한 생체 외 기술은 북부 잡종 형성 및 부위 내 잡종 형성을 포함한다. 표지 인자 단백질의 탐지를 위한 생체 외 기술은 효소 결합 면역 흡수 분석(ELISA), 서부 블롯, 면역 침강법 및 면역 형광법을 포함한다. 게놈 DNA 탐지를 위한 생체 외 기술은 남부 잡종 형성을 포함한다. mRNA 탐지를 위한 생체 내 기술은 중합효소 연쇄 반응(PCR), 북부 잡종 형성 및 부위 내 잡종 형성을 포함한다. 또한, 표지 인자 단백질의 탐지를 위한 생체 내 기술은 대상으로 단백질 또는 이의 파편에 대한 라벨링된 항체를 도입하는 것을 포함한다. 예를 들어, 상기 항체는 대상 내에서의 존재 및 위치가 표준 영상화 기술로 탐지될 수 있는 방사성 표지 인자로 라벨링될 수 있다.
이러한 진단적 및 예후의 분석의 일반적 원리는 표지 인자를 포함할 수 있는 표본 또는 반응 혼합물을 준비하고, 및 표지 인자 및 탐침이 반응하고 결합하기에 충분한 적절한 조건하에서 적절한 시간 동안 탐색하여, 반응 혼합물 내에서 제거되고, 또한/또는 탐지될 수 있는 복합체를 형성하는 것을 포함한다. 이러한 분석들은 여러 가지 방법으로 수행될 수 있다.
예를 들어, 이러한 분석을 수행하는 한 방법은 표지 인자 또는 탐침을 기질으로도 불리는 고체 상 지지체에 안착시키는 단계, 및 반응의 마지막에 상기 고체 상 지지체에 안착된 타겟 표지 인자/탐침 복합체를 탐지하는 단계를 포함할 수 있을 것이다. 이러한 방법의 일 실시예에서, 표지 인자의 존재 및/또는 농도에 대해 분석될 대상으로부터의 표본은 담체 또는 고체 상 지지체에 안착될 수 있다. 또 다른 실시예에서, 탐침이 고체 상에 안착될 수있고 대상으로부터의 표본이 분석에서 안착되지 않은 성분으로서 반응할 수 있는 반대의 상황도 가능하다.
분석 성분을 고체 상에 안착시키기 위한 많은 방법이 확립되어 있다. 이러한 방법은 한정되지 않으면서, 비오딘 및 스트렙타비딘의 켤레 결합을 통해 고정되는 표지 인자 또는 탐침 분자를 포함한다. 이러한 비오딘화딘 분석 성분은 해당 분야에 알려진 기술(예를 들어, 비오딘화 키트, 피어스(Pierce) 케미컬, 록포드, IL)을 사용하여 비오딘-NHS (N-하이드록시-석시니마이드)으로부터 제조될 수 있으며, 스트렙타비딘-코팅된 96 개의 웰 플레이트(Pierce 케미컬)의 웰에 고정될 수 있다. 특정 실시예에서, 고정된 분석 성분을 가지는 상기 표면은 미리 준비되어 저장될 수 있다.
이러한 분석을 위한 다른 적절한 담체 또는 고체 상태 지지체는 상기 표지 인자 또는 탐침이 속하는 분자의 계열을 결합할 능력이 있는 어떠한 물질도 포함한다. 잘 알려진 지지체 또는 담체는 유리, 폴리스티렌, 나일론, 폴리프로필렌, 나일론, 폴리에틸렌, 덱스트란, 아밀라아제, 자연적 및 수정된 셀룰로오즈, 폴리아크릴아미드, 가브로, 및 마그네타이트를 포함하나 이에 한정되지는 않는다.
상기 언급된 접근 방식으로 분석을 수행하기 위해, 고정되지 않은 성분이 제 2 성분이 그 위에 장착되는 고체 상태에 추가된다. 반응이 완료되고 난 후, 복합되지 않은 성분들은 형성된 모든 복합물이 고체 상태 상에 고정되어 유지된다는 조건 하에 (예를 들어, 세척에 의해) 제거될 수 있다. 고체 상에 안착한 표지 인자/탐침 복합체의 탐지는 본 명세서에 개략적으로 설명된 다수의 방법에 의해 성취될 수 있다.
바람직한 실시예에서, 상기 탐침은, 안착되지 않은 분석 성분인 경우, 본 명세서에서 논의된 탐지 가능 라벨 및 해당 분야의 통상의 기술자에게 잘 알려진 라벨을 사용하여 직접적 또는 간접적으로 분석의 탐지 및 해독의 목적으로 라벨링될 수 있다.
표지 인자/탐침 복합체 형성을, 추가적으로 조작하거나 또는 양 성분(표지 인자 또는 탐침)을 라벨링하지 않고, 예를 들어 형광 에너지 이전(예를 들어, 라코윅즈(Lakowicz) 외, 미국 특허 제 5,631,169호; 스타브리아노포울로스(Stavrianopoulos) 외, 미국 특허 제 4,868,103호 참조) 방법을 활용하여 탐지하는 것도 가능하다. 제 1 '도너' 분자 상의 형광단 라벨은 적절한 파장 길이의 입사광이 여과될 때, 이로부터 방출된 형광 에너지가 제 2 '수용기' 분자의 형광 라벨에 흡수되도록 선택되며, 이는 다시 흡수된 에너지로 인해 형광을 발생시킬 수 있다. 대체적 방법으로, '도너' 단백질 분자는 단순히 트립토판 잔여부의 자연적 형광 에너지를 활용할 수 있다. 라벨은 '수용기' 분자 라벨이 '도너' 분자 라벨로부터 구분될 수 있게 하기 위해 다른 파장 길이의 빛을 방출하도록 선택된다. 라벨들 사이의 에너지 전달 효율이 분자를 분리시키는 거리에 관계되기 때문에, 분자들 사이의 공간적 관계가 평가된다. 결합이 분자들 간에 일어나는 상황에서는, 분석 내의 '수용기' 분자 라벨의 형광 방출이 최대로 되어야 한다. FET 결합 이벤트는 해당 분야에서 잘 알려져 있는 표준 형광 검출 탐지 수단을 통해 간편하게 측정될 수 있다(예를 들어, 형광 검출기를 사용).
또 다른 실시예에서, 표지 인자를 인식할 수 있는 탐침의 능력의 결정은 두 분석 성분(탐침 또는 표지 인자)을 라벨링하지 않고 실시간 바이오분자 상호 반응 분석(BIA)(예를 들어, 스졸랜더(Sjolander, S.) 및 우르바닉스키(Urbaniczky, C.), 1991, Anal . Chem . 63:2338-2345 및 스자보(Szabo) 외, 1995, Curr . Opin . Struct . Biol . 5:699-705 참조)과 같은 기술을 사용하여 수행될 수 있다. 본 명세서에서 사용되는, “BIA” 또는 “표면 플라스몬 공명”은 어떠한 반응물(예를 들어, BIA 코어)도 라벨링하지 않으면서 생물학적 특정 상호 반응을 실시간으로 연구하기 위한 기술이다. 결합 표면 (결합 이벤트를 나타냄)에서의 질량 변화는 결과적으로 표면 근처에서의 빛의 굴절률 변화로 나타나며(표면 플라스몬 공명(SPR)의 광학적 성질), 결과적으로 생물학적 분자 사이의 실시간 반응을 나타내는 것으로 사용될 수 있는 탐지 가능 신호로 나타난다.
대체적 방법으로, 또 다른 실시예에서, 유사한 진단적 및 예후의 분석이 액상에서 표지 인자 및 탐침을 용질로 하여 수행될 수 있다. 이러한 분석에서, 상기 복합화된 표지 인자 및 탐침은 복합화되지 않은 성분으로부터 다수의 표준 기술 중 하나로 분리되며, 이러한 기술은 분별 원심 분리, 크로마토그래피, 전기영동 및 면역 침강법을 포함하나 이에 한정되지는 않는다. 분별 원심 분리에서, 표지 인자/탐침 복합체는 복합되지 않은 분석 성분으로부터 자신들의 서로 다른 크기 및 밀도를 기반으로 침착의 평형이 다른 점을 이용하여 일련의 원심분리 단계를 통해 분리될 수 있다(예를 들어, 리바스(Rivas, G.) 및 민튼(Minton, A.P.), 1993, Trends Biochem Sci . 18(8): 284-7 참조). 복합된 분자를 복합되지 않은 분자로부터 분리하기 위해 표준 크로마토그래피 기술을 사용할 수 있다. 예를 들어, 겔 여과 크로마토그래피는 크기를 기반으로 분자를 분리하며, 예를 들어, 기둥 양식 내에서 적절한 겔 여과 수지를 활용함으로써, 상대적으로 큰 복합 분자가 상대적으로 작은 비복합 성분으로부터 분리될 수 있다. 마찬가지로, 표지 인자/탐침 복합체의 비복합 성분과 비교하여 상대적으로 다른 전하의 성질을 사용하여, 예를 들어, 이온 교환 크로마토그래피 수지의 활용을 통해 복합 성분을 비복합 성분으로부터 구분할 수 있다. 이러한 수지와 크로마토그래피 기술은 해당 분야의 통상의 기술자에게 잘 알려져 있다(예를 들어, 히가드(Heegaard, N.H.), 1998, J. Mol . Recognit . 윈터(Winter) 11(1-6):141-8; 하지(Hage, D.S.), 및 트위드(Tweed, S.A.) J Chromatogr B Biomed Sci Appl 1997 Oct 10;699(1-2):499-525 참조). 겔 전기영동 또한 복합환된 분석 성분을 결합되지 않은 성분과 분리하기 위해 채택될 수 있다(예를 들어, 아우수벨(Ausubel) 외, ed., 분자생물 학에서의 현 재 프로토콜, 존 와일리 앤 선스(John Wiley & Sons), 뉴욕, 1987-1999 참조). 이러한 기술에서, 단백질 또는 핵산 복합제는, 예를 들어, 크기 또는 전하를 기반으로 분리될 수 있다. 전기영동 과정 동안 결합 상호 반응을 유지하기 위해, 일반적으로 환원 제제가 없는 비 변성 겔 매트릭스 물질 및 조건들이 바람직하다. 특정한 분석 및 이의 성분에 적절한 조건들은 해당 분야의 통상의 기술자에게 잘 알려져 있다.
특정한 실시예에서, 상기 표지 인자 mRNA의 수준은 생물학적 표본 내의 부위 상 및 생체 외 양식에 의해 해당 분야에서 알려진 방법을 사용하여 결정할 수 있다. 용어 "생물학적 표본"은 조직, 세포, 생체액 및 대상 내에 존재하는 조직, 세포 및 액체뿐만 아니라 대상으로부터 분리된 이들의 분리물을 포함하도록 의도된 것다. 많은 발현 탐지 방법은 분리된 RNA를 사용한다. 생체 외 방법에 대해, mRNA의 분리와 반대로 선택하지 않는 어떠한 RNA 분리 기술도 세포로부터 RNA를 분리하기 위해 사용될 수 있다(예를 들어, 아우수벨(Ausubel) 외, ed., 분자생물학에서의 현재 프로토콜, 존 와일리 앤 선스(John Wiley & Sons), 뉴욕 1987-1999 참조). 또한, 많은 수의 조직 표본들이 해당 분야의 통상의 기술자에게 잘 알려진 기술, 예를 들어, 촘크진스키(Chomczynski)(1989, 미국 특허 제 4,843,155호)의 단일 단계 RNA 분리 과정을 사용하여 쉽게 처리될 수 있다.
상기 분리된 mRNA는 잡종 형성 또는 증폭 분석에서 사용될 수 있으며, 이는 남부(Southern) 또는 북부(Northern) 분석, 중합효소 연쇄 반응 분석 및 탐침 배열을 포함하나 이에 한정되지는 않는다. mRNA 수준의 탐지를 위한 바람직한 한 진단적 방법은 분리된 mRNA를 탐지되고 있는 유전자에 의해 부호화된 mRNA에 잡종을 형성할 수 있는 핵산 분자(탐침)와 접촉시키는 것을 포함한다. 상기 핵산 탐침은, 예를 들어, 엄격한 조건 하에서 본 발명의 표지 인자를 부호화하는 mRNA 또는 게놈적 DNA에 잡종을 형성할 수 있는 최소한 7, 15, 30, 50, 100, 250 또는 500 길이의 뉴클레오타이드의 올리고뉴클레오타이드와 같은 완전한 길이의 cDNA, 또는 이의 부분일 수 있다. 본 발명의 진단적 분석을 위해 사용할 수 있는 다른 적절한 탐침이 본 명세서에 기술되어 있다. 탐침에 의한 mRNA의 잡종 형성은 문제가 되는 표지 인자가 발현되고 있음을 나타낸다.
한 양식에서, 상기 mRNA는 고체 표면 상에 고정되고, 예를 들어, 분리된 mRNA를 아가로스 겔 상에서 작동하게 하고 mRNA를 겔로부터 니트로셀룰로오즈와 같은 막으로 이동시킴으로써 탐침에 접촉된다. 또 다른 양식에서는, 탐침(들)이 고체 표면 상에 고정되고 mRNA가, 예를 들어, 아피메트릭스(Affymetrix) 사의 유전자 칩 배열 내의 탐침(들)에 접촉된다. 해당 분야의 통상의 기술자라면 알려진 mRNA 탐지 방법을 본 발명의 표지 인자에 의해 부호화된 mRNA의 수준을 탐지하기 위해 적응시킬 수 있을 것이다.
표본 내 mRNA 표지 인자의 수준을 결정하기 위한 한 대체적 방법은 핵산 증폭 과정, 예를 들어, RT-PCR(멀리스(Mullis), 1987, 미국 특허 제 4,683,202호에 개시된 실험적 실시예), 리가아제 연쇄 반응(바라니(Barany), 1991, Proc . Natl . Acad . Sci . USA , 88:189-193), 자체 지지 염기서열 복제(구아텔리(Guatelli) 외, 1990, Proc . Natl . Acad . Sci. USA 87:1874-1878), 전사적 증폭 시스템(쿼(Kwoh) 외, 1989, Proc . Natl . Acad . Sci . USA 86:1173-1177), Q-베타 복제 효소(리자디(Lizardi) 외, 1988, Bio /Technics:1197), 구르는 원 복제(리자디(Lizardi) 외, 미국 특허 제 5,854,033호) 또는 기타 다른 핵산 증폭 방법에 의해 수행될 수 있고, 이후 해당 분야의 통상의 기술자에게 잘 알려진 기술을 사용하여 증폭된 분자의 탐지가 이어진다. 이러한 탐지 기술 체계는 핵산 분자가 매우 적은 개수로 존재하는 경우에 핵산 분자의 탐지에 특히 유용하다. 본 명세서에서 사용되는, 증폭 프라이머는 유전자의 5'또는 3'영역(각각 플러스 및 마이너스 가닥, 또는 그 반대)에 아닐링될 수 있으며 사이의 짧은 영역을 포함하는 핵산 분자의 쌍인 것으로 정의된다. 일반적으로, 증폭 프라이머는 약 10 내지 30의 길이를 가지는 뉴클레오타이드이며 영역 약 50 내지 20의 길이를 가지는 뉴클레오타이드로부터의 측면 영역을 포함한다. 적절한 조건 및 적절한 반응 제제 하에서, 이러한 프라이머는 프라이머에 의해 측면 부착된 뉴클레오타이드 염기서열을 포함하는 핵산 분자의 증폭을 가능케 한다.
부위 내(in situ) 방법을 위해, mRNA는 탐지 이전에 분리될 필요가 없다. 이러한 방법에서, 세포 또는 조직 표본이 알려진 조직학적 방법을 사용하여 준비/처리된다. 이 표본은 이후 지지체, 일반적으로 유리 슬라이드 상에 고정되고, 다시 표지 인자를 부호화하는 mRNA로 잡종을 형성할 수 있는 탐침에 접촉된다.
표지 인자의 절대적 발현 수준을 기반으로 결정을 내리는 방법에 대한 대안으로, 이러한 결정은 표지 인자의 정규화된 발현 수준을 기반으로 내릴 수 있다. 발현 수준은 표지 인자의 절대적 발현 수준을 표지 인자가 아닌 유전자, 예를 들어, 구성요소로서 발현되는 항존(housekeeping) 유전자의 발현과 비교하여 교정함으로써 정규화된다. 정규화를 위한 적절한 유전자는 액틴 유전자와 같은 항존 유전자 또는 상피 세포 특정 유전자를 포함한다. 이러한 정규화를 통해 하나의 표본, 예를 들어, 환자 표본에서 다른 표본, 예를 들어, 비 질병 또는 비독성 표본으로, 또는 다른 소스로부터의 표본들 사이에서의 발현 수준의 비교가 가능하다.
대체적인 방법으로, 상기 발현 수준은 상대적 발현 수준을 제공할 수 있다. 표지 인자의 상대적 발현 수준을 결정하기 위해, 문제가 되는 표본의 발현 수준을 결정하기 이전에, 상기 표지 인자의 발현 수준은 정상 대비 분리된 질병 또는 독성 세포의 10개 또는 그 이상의 표본, 바람직하게는 50 또는 그 이상의 표본에 대해 결정된다. 많은 개수의 표본 내에서 분석된 유전자의 평균 발현 수준이 결정되며 이는 표지 인자에 대한 기준치 발현 수준으로 사용된다. 검사 표본에 대해 결정된 표지 인자의 발현 수준(절대적 발현 수준)은 이후 해당 표지 인자로부터 획득한 평균 발현 값으로 나누어진다. 이는 상대적 발현 수준을 제공한다.
바람직하게는, 기준치 결정에 사용된 표본은 비질병 또는 비독성 세포로부터 유래된 것이어야 한다. 세포 소스의 선택은 상대적 발현 수준의 사용에 따라 달라진다. 정상 조직에서 발견되는 발현을 평균 발현 스코어로 사용하는 것은 분석된 표지 인자가 질병 또는 독성에 특정한지(정상 세포 대비)를 증명하는데 도움이 된다. 또한, 보다 많은 데이터가 축적됨에 따라, 평균 발현 값이 개정될 수 있으며, 축적된 데이터를 기반으로 보다 개선된 상대적 발현 값을 제공하게 된다. 질병 세포 또는 독성 세포로부터의 발현 데이터는 질병 또는 독성 상태의 심각성에 대한 단계를 판별하는 수단을 제공한다.
본 발명의 또 다른 실시예에서, 표지 인자 단백질이 탐지된다. 본 발명의 단백질의 표지 인자를 탐지하기 위한 바람직한 제제는 이러한 단백질 또는 이의 파편에 결합할 수 있는 항체, 바람직하게는 탐지 가능 라벨을 가진 항체이다. 항체는 다중 복제될 수 있으며, 또는 보다 바람직하게는, 단일 복제될 수 있다. 순수한 항체, 또는 파편 또는 이의 파생체(예를 들어, Fab 또는 F(ab')2)가 사용될 수 있다. 용어 탐침 또는 항체에 대해 "라벨링된"은, 직접적으로 라벨링된 반응 제제와 반응시킴으로써 탐침 또는 항체를 간접적으로 라벨링시키는 것뿐만 아니라, 탐지 가능물질을 탐침 또는 항체에 커플링(즉, 물리적 연결)시킴으로써 탐침 또는 항체의 직접적 라벨링을 포괄하도록 의도된 것이다. 간접적 라벨링의 예는 형광적으로 라벨링된 이차 항체를 사용한 일차 항체의 탐지 및 비오딘에 의한 DNA 탐침의 종단 라벨링하여 형광적으로 라벨링된 스트렙타비딘으로 탐지될 수 있도록 하는 것을 포함한다
세포로부터의 단백질은 해당 분야의 통상의 기술자에게 잘 알려진 방법을 사용하여 분리될 수 있다. 채택된 단백질 분리 방법으로는, 예를 들어, 할로우(Harlow)와 레인(Lane)(할로우(Harlow)와 레인(Lane), 1988, 항체: A Laboratory Manual, 콜드 스프링 하버 출판사, 콜드 스프링 하버, 뉴욕)에 기술된 방법이 채택될 수 있다.
다양한 양식들이 표본이 주어진 항체에 결합하는 단백질을 포함하는 지를 결정하기 위해 채택될 수 있다. 이러한 양식의 예는 효소 면역 분석 (EIA), 방사선 면역 분석 (RIA), 서부 블롯 분석 및 효소 연관 면역 흡수체 분석 (ELISA)을 포함하나 이에 한정되지는 않는다. 해당 분야의 통상의 기술자라면 알려진 단백질/항체 탐지 방법을 세포가 본 발명의 표지 인자를 발현하는지를 결정하기 위해 적응시킬 수 있을 것이다.
한 양식에서, 항체, 또는 항체 파편 또는 파생체가 서부 블롯 또는 면역 형광법 기술과 같은 방법에서 발현된 단백질을 탐지하기 위해 사용될 수 있다. 이러한 사용에 있어서, 일반적으로 항체 또는 단백질 중 하나를 고체 지지체 상에 고정시키는 것이 뱌람직하다. 적절한 고체 지지체 또는 담체는 항원 또는 항체를 결합시킬 수 있는 지지체를 포함한다. 잘 알려진 지지체 또는 담체는 유리, 폴리스티렌, 나일론, 폴리프로필렌, 나일론, 폴리에틸렌, 덱스트란, 아밀라아제, 자연적 및 수정된 셀룰로오즈, 폴리아크릴아미드, 가브로, 및 마그네타이트를 포함한다.
해당 분야의 통상의 기술자라면 결합 항체 또는 항원을 위한 적절한 담체를 알고 있을 것이며, 이러한 담체를 본 발명을 위해 사용할 수 있도록 적응시킬 수 있을 것이다. 예를 들어, 질병 또는 독성 세포로부터 분리되 단백질은 폴리아크릴아미드 겔 전기영동 상에서 구동될 수 있으며 니트로셀룰로오즈와 같은 고체 상태 지지체에 고정될 수 있다. 이 지지체는 이후 적절한 버퍼로 세척된 후 탐지 가능하도록 라벨링된 항체로 처리될 수 있다. 상기 고체 상태 지지체는 결합되지 않은 항체를 제거하기 위해 버퍼로 수회 세척될 수 있다. 이 후 고체 지지체 상의 결합 라벨의 양이 통상적인 수단에 의해 탐지될 수 있다.
본 발명은 또한 생물학적 표본 내 표지 인자 단백질 또는 핵산의 존재를 탐지할 수 있는 키트를 포괄한다. 이러한 키트는 대상이 특정한 질병 또는 약제로 유도되는 독성을 겪고 있거나 이를 개발할 위험성에 처해 있는지를 결정하기 위해 사용될 수 있다. 예를 들어, 상기 키트는 생물학적 표본 내의 표지 인자 단백질 또는 핵산을 탐지할 수 있는 라벨링된 화합물 또는 제제, 및 단백질 또는 표본 내 mRNA의 양을 결정하기 위한 수단(예를 들어, 단백질 또는 이의 파편에 결합하는 항체, 또는 단백질을 부호화하는 DNA 또는 mRNA 에 결합하는 올리고뉴클레오타이드 탐침)을 포함할 수 있다. 상기 키트는 또한 상기 키트를 사용하여 획득한 결과를 해석하기 위한 지침을 포함할 수 있다.
항체 기반 키트에 대해, 이러한 키트는, 예를 들어: (1) 표지 인자 단백질에 결합되는 제 1 항체 (예를 들어, 고체 지지체에 부착); 및, 선택적으로, (2) 상기 단백질 또는 제 1 항체에 결합되며 탐지 가능 라벨의 켤레가 되는 제 2의 다른 항체를 포함할 수 있다.
올리고뉴클레오타이드 기반 키트에 대해, 상기 키트는, 예를 들어: (1) 올리고뉴클레오타이드, 예를 들어, 표지 인자 단백질을 부호화하는 핵산 염기서열로 잡종을 형성하는 탐지 가능하게 라벨링된 올리고뉴클레오타이드, 또는 (2) 표지 인자 핵산 분자를 증폭하기에 유용한 프라이머의 쌍을 포함할 수 있다. 상기 키트는 또한, 예를 들어, 버퍼링 제제, 보존제, 또는 단백질 안정 제제를 포함할 수 있다. 상기 키트는 탐지 가능 라벨(예를 들어, 효소 또는 기질)을 탐지하기 위해 필요한 성분을 더 포함할 수 있다. 상기 키트는 또한 분석되어 검사 표본에 비교될 수 있는 제어 표본 또는 일련의 제어 표본들을 포함할 수 있다. 상기 키트의 각 성분은 개별적 컨테이너에 수용될 수 있으며, 다수의 컨테이너 모두가 키트를 사용하여 수행된 분석의 결과를 해석하기 위한 지침과 함께 단일 패키지 내에 있을 수 있다.
G.
약물 유전체학
본 발명의 표지 인자는 또한 약물 유전체학적 표지 인자로서 유용하다. 본 명세서에서 사용되는 “약물 유전체학적 표지 인자”는 그 발현 수준이 환자 내의 특정한 임상적 약 반응 또는 민감도와 상호 관련되는 객관적인 생화학적 표지 인자이다(예를 들어, 맥레오드(McLeod) 외 (1999) Eur . J. Cancer 35(12): 1650-1652 참조). 약물 유전체학적 표지 인자 발현의 존재 또는 양은 환자의 예측된 반응, 보다 특정적으로는 특정한 약제 또는 약제의 종류에 의한 치료에 대한 질병에 걸린 환자 또는 독성 세포의 반응과 관련된다. 환자 내에서 하나 또는 그 이상의 약물 유전체학적 표지 인자의 발현의 존재 또는 그 양을 분석함으로써, 환자에 대해 가장 적절한 약제 치료, 또는 성공의 정도가 가장 클 것으로 예상되는 치료가 선택될 수 있다. 예를 들어, 환자 내에서 특정한 종양 표지 인자에 의해 부호화된 RNA 또는 단백질의 존재 또는 양을 기반으로, 환자 내에 존재할 수 있는 특정한 종양의 치료에 최적화된 약제 또는 치료 과정이 선택될 수 있다. 따라서, 약물 유전체학적 표지 인자의 사용은 다른 약제나 치료 체계를 사용하지 않고도 각 암 환자에 대한 가장 적절한 치료를 선택하거나 설계할 수 있게 해 준다.
약물 유전체학의 또 다른 측면은 신체가 약제에 반응하는 양식을 변경시키는 유전학적 조건을 다루는 것이다. 이러한 약학적, 유전학적 조건은 희귀한 결함 또는 다형성으로서 발생할 수 있다. 예를 들어, 글루코스-6-인산염 디하이드로제나제(G6PD) 결핍은 흔한 유전적 효소 질환으로서 주요 임상적 합병증은 옥시던트 약제(항 말라리아 제, 설폰아마이드, 진통제, 니트로퓨란)의 섭취 또는 잠두(fava bean)의 소모 이후의 혈액 용균이다.
예시적 실시예로서, 대사 활동 효소의 약제 활성은 강도 및 약제의 작용 기간 모두를 결정하는 주요 요소이다. 약제 대사 효소(예를 들어, N-아세틸기 전이효소 2 (NAT 2) 및 시토크롬 P450 효소 CYP2D6 및 CYP2C19)의 유전학적 다형성의 발견은 왜 일부 환자들에게 기대되었던 약의 효과가 나타나지 않는지, 또는 왜 약제를 표준 양으로 안전하게 투여한 이후에 과도한 약제 반응 및 심각한 독성이 나타나는지에 대한 설명을 제공하였다. 이러한 다형성은 군집 내의 두 표현형인 확장된 대사 인자(EM) 및 빈약한 대사 인자(PM)로 표현된다. PM의 우열은 다른 군집들 사이에서 다르게 나타난다. 예를 들어, CYP2D6를 위한 유전자 부호화는 고도의 다형성을 보이며 다양한 변이가 PM에서 식별되었는데, 이는 모두 기능적 CYP2D6의 부재를 초래하였다. CYP2D6 및 CYP2C19의 빈약한 대사 인자는 이들이 표준 투여량을 수용할 때 매우 자주 과도한 약제 반응 및 부작용을 경험한다. 대사 물질이 능동적인 치료적 비결합 성분이라면, PM은 치료적 반응을 보이지 않을 것이며, 이는 이의 CYP2D6 형성 대사 물질 모르핀에 의한 코데인 중재의 진통제 효과에서 보여진다. 다른 극단적 상태는 소위 매우 빠른 대사 인자라 불리는 것으로 표준 투약에 반응하지 않는 것이다. 최근에, 매우 빠른 대사의 분자적 기반이 CYP2D6 유전자 증폭 덕분에 식별되었다.
따라서, 본 발명의 표지 인자의 발현 수준의 결정은 이에 의해 개인의 치료제 또는 예방적 치료제를 위한 적절한 제제(들)을 선택할 수 있도록 개별적으로 결정될 수 있다. 또한, 약제 대사 효소를 부호화하는 다형성 대립 유전자의 유전 형질 분석을 개별적 약제의 반응성 표현형의 식별에 적용하기 위해, 약제 유전학적 연구가 사용될 수 있다. 이러한 지식이 약제의 투여 또는 이의 선택에 적용되는 경우, 부작용이나 또는 치료에서의 실패를 피할 수 있으며, 따라서 대상을 본 발명의 표지 인자의 발현의 조절 인자로 치료할 때 치료제 또는 예방제의 효율을 향상시킬 수 있다.
H.
임상적 시도의
모니터링
제제(예를 들어, 약제 화합물)가 본 발명의 표지 인자의 발현 수준에 미치는 영향을 모니터링하는 것은 기본적인 약제 선별뿐만 아니라, 임상적 시도에도 적용할 수 있다. 예를 들어, 표지 인자 발현에 영향을 미치는 제제의 효율성은 암, 당뇨, 비만, 심장 혈관 질병, 및 심장 독성, 또는 약제로 유도되는 독성과 같은 특정 질병에 대한 치료를 받는 환자의 임상적 시도에서 모니터링될 수 있다. 바람직한 실시예에서, 본 발명은 제제(예를 들어, 작용 물질, 억제 물질, 펩티도미메트릭, 단백질, 펩티드, 핵산, 소형 분자, 또는 기타 약제 후보)를 사용한 대상의 치료의 효율성을 모니터링하는 방법을 제공하며, 상기 방법은 (i) 제제의 투여 이전에 대상으로부터을 획득하는 단계; (ii) 투여 전 표본 내의 본 발명의 하나 또는 그 이상의 선택된 표지 인자의 발현 수준을 탐지하는 단계; (iii) 대상으로부터 하나 또는 그 이상의 투여 후 표본을 획득하는 단계; (iv) 투여 후 표본 내의 표지 인자의 발현 수준(들)을 탐지하는 단계; (v) 상기 투여 전 표본 내의 표지 인자의 발현 수준(들)을 투여 후 표본 또는 표본 내의 표지 인자의 발현 수준(들)과 비교하는 단계; 및 (vi) 상기 결과에 따라 투여 대상에 대한 제제의 투여를 변경하는 단계를 포함한다. 예를 들어, 치료 과정 중의 표지 인자 유전자(들)의 증가된 발현은 효과적인 투여를 나타낼 수 있으며 투여량을 늘리는 것이 바람직함을 보일 수 있다. 반대로, 표지 인자 유전자(들)의 감소된 발현은 효과적인 치료를 나타낼 수 있으며 투여량을 변화시킬 필요가 없음을 보일 수 있다.
H.
배열
본 발명은 또한 본 발명의 표지 인자로 이루어진 배열을 포함한다. 상기 배열은 배열 내에서 하나 또는 그 이상의 유전자의 발현을 평가하기 위해 사용될 수 있다. 일 실시예에서, 상기 배열은 배열 내의 유전자의 조직 특정성을 확인하기 위해 조직 내의 유전자 발현을 분석하는데 사용될 수 있다. 이러한 방식에서, 약 760개까지의 유전자가 발현에 대해 동시에 분석될 수 있다. 이는 특히 하나 또는 그 이상의 조직들에서 발현된 유전자의 배터리를 보여 주는 프로필을 개발하게 해 준다.
이러한 정성적 결정과 더불어, 본 발명은 유전자 발현의 정량 측정을 가능케 한다. 따라서, 조직 특정성뿐만 아니라, 조직 내 유전자의 배터리의 발현 수준 또한 확인이 가능하다. 따라서, 유전자는 이들의 조직 발현 자체 및 해당 조직 내 발현 수준을 기반으로 군을 형성할 수 있다. 이는, 예를 들어, 조직 사이 또는 이들 중의 유전자 발현의 관계를 확인하는데 유용하다. 따라서, 하나의 조직이 교란되고 다른 조직에서의 유전자 발현에 대한 효과가 결정될 수 있다. 이러한 맥락에서, 생물학적 자극에 대한 반응으로서, 한 세포 유형의 또 다른 세포 유형에 대한 효과가 결정된다. 이러한 결정은, 예를 들어, 유전자 발현 수준에서 세포-세포 상호 반응을 알아 내는데 유용하다. 제제가 하나의 세포 유형을 치료하기 위해 치료적으로 투여되었으나 다른 세포 유형에서는 바람직하지 못한 효과를 보이는 경우, 본 발명은 상기 바람직하지 못한 효과에 대한 분자 기반의 분석을 제공하며, 따라서 이에 대처할 수 있는 제제를 보조적으로 투여하거나 상기 바람직하지 못한 효과를 다른 방법으로 치료할 수 있는 기회를 제공한다. 마찬가지로, 단일 세포 유형 내에서도, 바람직하지 않은 생물학적 효과가 분자 수준에서 결정될 수 있다. 따라서, 타겟 유전자 이외의 발현에 대한 제제의 효과가 확인되고 이에 대한 대책이 마련될 수 있다.
또 다른 실시예에서, 상기 배열은 배열 내 하나 또는 그 이상의 유전자의 발현의 시간적 전개를 모니터링하기 위해 사용될 수 있다. 이는 본 명세서에서 개시된 여러 생물학적 맥락에서 발생할 수 있으며, 예를 들어 약제로 유도되는 독성의 전개, 약제로 유도되는 독성의 진전 및 약제로 유도되는 독성과 관련된 세포 변형과 같은 과정을 포함한다.
상기 배열은 동일한 세포 내의 다른 유전자 또는 서로 다른 세포 내에서의 발현에 대한 유전자의 발현 효과를 확인하는데도 유용하다. 이는, 예를 들어, 최종적 또는 하향 타겟이 조절될 수 없는 경우에 치료적 시술을 위한 대안적 분자의 타겟의 식별을 제공한다.
상기 배열은 또한 정상 및 비정상 세포 내의 하나 또는 그 이상의 유전자의발현 패턴을 확인하는데 유용하다. 이는 진단 또는 치료적 시술을 위한 분자의 타겟으로 작용할 수 있는 유전자의 배터리를 제공한다.
VII
.
표본 획득을 위한 방법
본 발명의 방법에서 유용한 표본은 본 발명의 표지 인자를 표현하는 조직, 세포, 생체 검사, 또는 신체의 액체 표본을 포함한다. 일 실시예에서, 상기 표본은 조직, 세포, 전체 혈액, 혈청, 플라스마, 구강 내 표본, 침, 뇌척수액, 오줌, 기관, 또는 기관지 폐포 세척액이다. 바람직한 실시예에서, 상기 조직 표본은 질병 상태 또는 독성 상태 표본이다. 보다 바람직한 실시예에서, 상기 조직 표본은 암 표본, 당뇨 표본, 비만 표본, 심장혈관 표본 또는 약제로 유도되는 독성 표본이다.
신체 표본은 해당 분야에서 알려진 다양한 기술, 예를 들어, 생체 검사에 의해, 또는 부위를 긁거나 문지름으로써, 또는 바늘을 사용하여 체액을 추출하는 등의 기술을 사용하여 대상으로부터 획득할 수 있다. 여러 신체 표본을 수집하는 방법은 해당 분야에서 잘 알려져 있다.
본 발명의 표지 인자를 탐지하고 정량 측정하기에 적절한 조직 표본은 신선하거나, 냉동되거나, 해당 분야의 통상의 기술자에게 알려져 있는 방법에 따라 고정될 수 있다. 적절한 조직 표본은 바람직하게는 절개되고 추가 분석을 위해 현미경 슬라이드 상에 놓여진다. 대체적 방법으로, 고체 표본, 즉, 조직 표본이 용액화되고, 또한/또는 균일화되고 이후 용해성 추출물로서 분석된다.
일 실시예에서, 신선하게 획득되는 생체 검사 표본은, 예를 들어, 액체 질소 또는 디플로로디클로로메탄을 사용하여 냉동된다. 상기 냉동된 표본은, 예를 들어, OCT를 사용하여 구획하기 위해 장착되며, 저온 유지 장치 내에 일련 구획을 제공한다. 상기 일련의 구획들은 유리 현미경 슬라이드 상에 수집된다. 면역 조직화학 검사 염색을 위해 상기 슬라이드들은 구?牡? 슬라이드 상에 고정되어 유지되도록 하기 위해, 예를 들어, 크롬-알룸, 겔라틴 또는 폴리-L-라이신으로 코팅될 수 있다. 또 다른 실시예에서, 표본들은 고정되고 구획 전에 삽입된다. 예를 들어, 조직 표본은, 탈수되어, 예를 들어, 파라핀에 삽입된, 예를 들어, 포르말린으로 고정될 수 있다.
일단 표본이 획득되면 본 발명의 표지 인자를 탐지하고 정량 측정하기에 적절한 해당 분야에서 알려진 방법이 사용될 수 있다(핵산 또는 단백질 수준 중 하나에서). 이러한 방법은 해당 분야에서 잘 알려져 있으며, 서부 블롯, 북부 블롯, 남부 블롯, 면역조직화학, ELISA, 예를 들어, 증폭된 ELISA, 면역 침강법, 면역 형광법, 유동 세포 계수법, 면역세포화학, 질량 분광계 분석, 예를 들어, MALDI-TOF 및 SELDI-TOF, 핵산 잡종 형성 기술, 핵산 역 전사 방법, 및 핵산 증폭 방법을 포함하나 이에 한정되지는 않는다. 특정 실시예에서, 본 발명의 표지 인자의 발현은, 예를 들어, 특히 이들 단백질에 결합하는 항체를 사용하여 단백질 수준에서 탐지된다.
표본은 항체 결합에 접근할 수 있는 본 발명의 표지 인자를 만들기 위해 수정될 수 있다. 면역세포화학 또는 면역조직화학 방법의 특정한 측면에서, 슬라이드들은 치료 전 버퍼로 옮겨 지고, 항원 접근성을 높이기 위해 선택적으로 가열될 수 있다. 치료 전 버퍼 내에서의 표본의 가열은 세포의 지질 이중 레이어를 빠르게 교란시키며, 항원(신선한 표본의 경우에 해당할 수 있으나, 고정된 표본에서는 일반적으로 발생하지 않음)에 항체 결합을 위해 보다 쉽게 접근되도록 한다. 용어 "치료 전 버퍼" 및 "준비 버퍼"는 특히 항체 결합에 대한 본 발명의 표지 인자의 접근성을 증가시킴으로써 면역 염색을 위한 세포학 또는 조직학 표본을 준비하기 위해 본 명세서에서 사용되는 버퍼를 말하기 위해 교차적으로 사용되었다. 치료 전 버퍼는 pH-특정 염 용액, 중합체, 세제, 또는 비이온성 또는 음이온성 계면활성제, 예를 들어, 알카노염 또는 알콕시염 또는 이들 계면활성제들의 혼합물까지를 포함하는 에틸록시화 음이온 또는 비이온 계면활성제, 또는 담즙염의 사용까지도 포함할 수 있다. 치료 전 버퍼는, 예를 들어, 0.1% 내지 1%의 데옥시콜릭 산 용액, 나트륨 염, 또는 나트륨 라우레스-13-카르복실염(예를 들어, 산도판(Sandopan) LS) 용액 또는 및 에톡시화 음이온 복합체일 수 있다. 일부 실시예에서, 상기 사전 치료 버퍼는 슬라이드 저장 버퍼로도 사용될 수 있다.
표지 인자 본 발명의 단백질들을 항체 결합을 위해 보다 접근하기 쉽게 만드는 어떠한 방법도 발명을 실시하기 위해 사용될 수 있으며, 여기에는 항원 확보를 위해 해당 분야에서 알려진 방법들이 포함된다. 예를 들어, 비보(Bibbo) 외 (2002) Acta . Cytol. 46:25-29; Saqi, 외 (2003) Diagn . Cytopathol. 27:365-370; 비보(Bibbo) 외 (2003) Anal. Quant . Cytol . Histol. 25:8-11을 참조할 수 있으며, 그 전체 내용은 참조에 의해 본 명세서에 통합된다.
표지 인자 단백질 접근성을 증가시키기 위한 사전 치료에 뒤이어, 표본들을 적절한 차단 제제, 예를 들어, 수소 퍼옥사이드와 같은 퍼옥시다제 반응 차단 제제를 사용하여 차단할 수 있다. 일부 실시예에서, 상기 표본은 항체의 비특정 결합을 방지하기 위한 반응 제제를 차단하는 단백질을 사용하여 차단할 수 있다. 상기 단백질 차단 반응 제제는, 예를 들어, 정제된 카세인을 포함할 수 있다. 항체, 특히 본 발명의 표지 인자에 결합하는 단일 복제 또는 다중 복제 항체는 표본과 함께 배양된다. 해당 분야의 통상의 기술자는 일부 경우에 보다 정확한 예단 또는 진단이 환자 표본 내의 표지 인자 본 발명의 단백질 상의 다중 항원 결정 부위를 탐지함으로써 획득될 수 있다는 것을 인식할 것이다. 따라서, 특정 실시예에서, 본 발명의 표지 인자의 서로 다른 항원 결정 부위에 작용하는 최소한 두 항체가 사용된다. 하나를 초과하는 항체가 사용되는 경우, 이들 항체는 단일 표본에 개별적 항체 반응 제제로서 연속적으로, 또는 항체 칵테일로서 동시에 추가될 수 있다. 대체적 방법으로, 각각의 개별적 항체가 동일한 환자로부터 분리된 표본에 추가될 수 있으며, 그 결과가 데이터 풀 내에 보관된다.
항체 결합을 탐지하는 기술은 해당 분야에서 잘 알려져 있다. 본 발명의 표지 인자에 대한 항체 결합은 항체 결합의 수준에 해당하는 탐지 가능 신호를 생성하는 화학적 반응 제제의 사용을 통해 탐지될 수 있으며, 이에 따라, 표지 인자 단백질 발현의 수준을 탐지할 수 있다. 본 발명의 면역조직화학 또는 면역세포화학 방법 중 하나에서, 항체 결합은 라벨링된 중합체의 켤레가 되는 이차 항체의 사용을 통해 탐지된다. 라벨링된 중합체의 예는 중합체-효소 켤레를 포함하나 이에 한정되지는 않는다. 이러한 복합체 내의 상기 효소는 일반적으로 항원-항체 결합 부위에서의 발색체의 침착을 촉진시키기 위해 사용되며, 이에 의해 결과적으로 관심 대상 생물학적 표지 인자결과의 발현 수준에 해당하는 세포 염색을 가져 온다. 특별한 관심 대상 효소는 호스래디시 퍼옥시다제 (HRP) 및 알칼리 포스타파아제(AP)를 포함하나 이에 한정되지는 않는다.
본 발명의 특정한 면역조직화학 또는 면역세포화학 방법에서, 본 발명의 표지 인자에 대한 항체 결합은 제 2 항체의 켤레가 되는 HRP-라벨링된 중합체의 사용을 통해 탐지된다. 항체 결합은 또한 종에 특정한 탐침 반응 제제를 사용하여 탐지될 수 있으며, 이때 이 제제는 종에 특정한 탐침 반응 제제에 결합하는 HRP의 켤레인 단일 복제 또는 다중 복제 항체, 및 중합체에 결합한다. 슬라이드는 항체 결합을 위해 임의의 발색제, 예를 들어, 발색제 3,3-디아미노벤지딘(DAB)을 사용하여 착색되고, 이후 헤마톡실린으로 대응 착색되며, 선택적으로, 암모늄 하이드록사이드 또는 TBS/Tween-20과 같은 청색화 제제로 착색된다. 다른 적절한 발색체는, 예를 들어, 3-아미노-9-에틸카바졸(AEC)을 포함한다. 본 발명의 일부 측면에서, 슬라이드는 세포 염색 분석을 위해 세포화학자 및/또는 병리학자에 의해 현미경을 이용한 방법, 예를 들어, 형광 염색(즉, 표지 인자 발현)으로 검토된다. 대체적 방법으로는, 표본은 자동화된 현미경 관찰법을 통해 또는 긍정적 염색 세포의 식별을 빠르게 해 주는 컴퓨터 소프트웨어의 도움을 받는 요원에 의해 검토될 수 있다.
항체 결합의 탐지는 항표지 인자 항체를 탐지 가능물질에 결합함으로써 보다 쉽게 수행될 수 있다. 탐지 가능물질의 예는 여러 효소, 보족기, 형광 물질, 발광성 물질, 생물발광 물질, 및 방사능 물질을 포함한다. 적절한 효소의 예는 호스래디시 퍼옥시다제, 알칼리 포스타파아제, β-갈락토시다제, 또는 아세틸촐린에스테라제를 포함하며; 적절한 보족기 복합체의 예는 스트렙타비딘/비오딘 및 아비딘/비오딘을 포함하며; 적절한 형광 물질의 예는 움벨리페론, 플루오레세인, 플루오레세인 이소티오시아네이트, 로다민, 디클로로트리아지닐라민 플루오레세인, 염화단실 또는 피코에리티린을 포함하며; 발광성 물질의 예는 루미놀을 포함하며; 생물 발광 물질의 예는 루시퍼라제, 루시퍼린, 및 아에쿼린을 포함하며; 적절한 방사능 물질의 예는 125I, 131I, 35S, 14C, 또는 3H를 포함한다.
본 발명의 일 실시예에서, 냉동된 표본은 상기 기술된 방법으로 준비되어, 이후, 예를 들어, 삼중-버퍼링된 염분(TBS)를 사용하여 적절한 농도로 희석된 본 발명의 표지 인자에 대한 항체로 착색된다. 일차 항체는 슬라이드를 비오딘화 항면역 글로불린 내에서 배양함으로써 탐지될 수 있다. 이 신호는 선택적으로 증폭되고 항원의 디아미노벤지딘 침착을 사용하여 시각화될 수 있다. 또한, 슬라이드는 세포를 시각화하기 위해 선택적으로, 예를 들어 헤마톡실린으로 대응 착색될 수 있다.
또 다른 실시예에서, 고정되고 삽입된 표본이 본 발명의 표지 인자에 대한 항체로 착색되고 냉동 부분에서 상기 기술된대로 대응 착색된다. 또한, 표본은 항체 염색을 시각화를 위해 신호를 증폭하기 위해 선택적으로 제제로 처리될 수 있다. 예를 들어, 비오디닐(biotinyl)-티라미드의 퍼옥시다제-촉매 침착을 수행하고, 이후 퍼옥시다제-켤레 스트렙타비딘(효소화된 신호 증폭(CSA) 시스템, DAKO, 카핀테리아, CA)을 사용할 수 있다.
조직-기반 분석(즉, 면역조직화학)은 본 발명의 표지 인자를 탐지하고 정량화하기 위한 바람직한 방법이다. 일 실시예에서, 본 발명의 표지 인자의 존재 또는 부재는 면역조직화학에 의해 결정될 수 있다. 일 실시예에서, 상기 면역 조직화학 검사 분석은 표지 인자가 결여된 세포가 착색되지 않도록 저 농도의 항표지 인자 항체를 사용한다. 또 다른 실시예에서, 본 발명의 표지 인자의 존재 또는 부재가 표지 인자 단백질 착색이 심하게 결여된 세포와 같은 고농도의 항표지 인자 항체를 사용하는 면역 조직화학 검사 방법을 사용하여 결정된다. 착색하지 않는 세포는 변이된 표지 인자 및 항원적으로 인식 가능한 표지 인자 단백질을 생산할 수 없는 세포이거나, 또는 표지 인자 수준을 조절하는 경로에 조절 장애가 일어나, 결과적으로 무시할 수 있는 표지 인자 단백질의 안정 상태 발현이 발생하는 세포이다.
해당 분야의 통상의 기술자라면 본 발명의 방법을 실시하기 위해 사용되는 특정한 항체의 농도가 결합의 시간, 본 발명의 표지 인자에 대한 항체의 특정성의 수준, 및 표본의 준비 방법과 같은 요소에 따라 변화할 수 있다는 것을 인식할 것이다. 또한, 다중 항체가 사용될 때, 요구되는 농도는 항체가 표본에 적용되는 순서, 예를 들어, 칵테일로서 동시에 적용되는지 또는 개별적 항체 반응 제제로서 연속적으로 적용되는지에 따라 영향을 받을 수 있다. 또한, 본 발명의 표지 인자의 항체 결합을 시각화하기 위해 사용된 탐지 화학 방법은 또한 노이즈 비율에 대해 원하는 신호를 생성하기 위해 최적화되어야 한다.
본 발명의 일 실시예에서, 단백질체의 방법, 예를 들어, 질량 분광학이 표지 인자 본 발명의 단백질들을 탐지하고 정량화하기 위해 사용된다. 예를 들어, 단백질-결합 칩에 대해, 혈청과 같은 생물학적 표본의 적용을 포함하는 매트릭스-연관 레이저 탈착/이온화 비행 시간(time-of-flight) 질량 분광학 (MALDI-TOF MS) 또는 표면-개선 레이저 탈착/이온화 비행 시간(time-of-flight) 질량 분광학 (SELDI-TOF MS)(라이트 주니어(Wright, G.L., Jr.) 외(2002) Expert Rev Mol Diagn 2:549; 리(Li, J.), 외 (2002) Clin Chem 48:1296; 라롱가(Laronga, C.) 외(2003) Dis markers 19:229; 페트리코인(Petricoin, E.F.) 외(2002) 359:572; 아담(Adam, B.L.) 외(2002) 암 Res 62:3609; 톨슨(Tolson, J.) 외(2004) Lab Invest 84:845; 지아오(Xiao, Z.) 외(2001) Cancer Res 61:6029)을 사용하여 PY-Shc 및/또는 p66-여성 단백질을 탐지하고 정량화할 수 있다. 질량 분광학적 방법은, 예를 들어, 미국 특허 제 5,622,824호, 제5,605,798호 및 제 5,547,835호에 기술되어 있으며, 그 전체 내용은 참조에 의해 본 명세서에 각각 통합된다.
다른 실시예에서, 본 발명의 표지 인자의 발현은 핵산 수준에서 탐지된다. 발현을 분석하기 위한 핵산-기반 기술은 해당 분야에서 잘 알려져 있으며, 예를 들어, 대상으로부터의 표본 내의 표지 인자 mRNA의 수준을 결정하는 방법을 포함한다. 많은 발현 탐지 방법이 분리된 RNA를 사용한다. mRNA의 분리에 반해 선택을 하지 않는 모든 RNA 분리 기술이 본 발명의 표지 인자를 발현하는 세포로부터의 RNA 정제를 위해 사용할 수 있다(예를 들어, 오수벨(Ausubel) 외, ed., (1987-1999) 분자생물학에서의 현재 프로토콜(존 와일리 앤 선스(John Wiley & Sons), 뉴욕, 참조). 또한, 많은 수의 조직 표본들이, 예를 들어, 촘크진스키(Chomczynski) (1989, 미국 특허 제 4,843,155호)의 단일 단계 RNA 분리 과정과 같은 해당 기술 분야의 통상의 기술자에게 잘 알려진 기술을 사용하여 쉽게 처리될 수 있다.
용어 "탐침"은 본 발명의 표지 인자에 선택적으로 결합할 수 있는 모든 분자, 예를 들어, 뉴클레오타이드 전사체 및/또는 단백질을 말한다. 탐침은 해당 분야에서 알려진 방법 중 하나, 또는 적절한 생물학적 준비로부터 도출된 방법을 사용하여 합성될 수 있다. 탐침은 특히 라벨링되도록 설계될 수 있다. 탐침으로 사용될 수 있는 분자의 예는 RNA, DNA, 단백질, 항체, 및 기관계 분자를 포함하나 이에 한정되지는 않는다.
분리된 mRNA는 잡종 형성 또는 증폭 분석에서 사용될 수 있으며, 남부 또는 북부 분석, 중합효소 연쇄 반응 분석 및 탐침 배열을 포함하나 이에 한정되지는 않는다. mRNA 수준의 탐지를 위한 한 방법은 분리된 mRNA를 표지 인자 mRNA로 잡종을 형성할 수 있는 핵산 분자(탐침)와 접촉시키는 것을 포함한다. 상기 핵산 탐침은, 예를 들어 최소한 7, 15, 30, 50, 100, 250 또는 500의 길이를 가지는 뉴클레오타이드로서 특히 표지 인자 게놈적 DNA에 엄격한 조건에서 잡종을 형성하기에 충분한 올리고뉴클레오타이드와 같은 완전한 길이의 cDNA, 또는 이의 부분일 수 있다.
일 실시예에서, 상기 mRNA는 고체 표면 상에 고정되고, 예를 들어, 분리된 mRNA를 아가로세 겔 상에서 구동시켜 mRNA를 겔로부터 니트로셀룰로오즈와 같은 막으로 이전시킴으로써 탐침과 접촉되게 한다. 대체적인 실시예에서, 상기 탐침(들)은 고체 표면 상에 고정되고, 예를 들어, 아피메트릭스(Affymetrix) 유전자 칩 배열 내의 탐침(들)과 접촉되게 한다. 통상의 기술자라면 알려진 mRNA 탐지 방법을 표지 인자 mRNA의 수준을 탐지하기 위해 사용할 수 있도록 쉽게 적응시킬 수 있을 것이다.
표본 내의 표지 인자 mRNA의 수준을 결정하는 대체적 방법은, 예를 들어, RT-PCR(실험 실시예는 Mullis, 1987, 미국 특허 제 4,683,202호에 개시되어 있음), 리가아제 연쇄 반응(바라니(Barany)(1991) Proc . Natl . Acad . Sci . USA 88:189-193), 자체 지지 염기서열 복제(구아텔리(Guatelli) 외(1990) Proc . Natl . Acad . Sci . USA 87:1874-1878), 전사적 증폭 시스템(쿼(Kwoh) 외(1989) Proc . Natl . Acad . Sci . USA 86:1173-1177), Q-베타 복제 효소(리자디(Lizardi) 외 (1988) Bio /Technics 6:1197), 구르는 원(rolling circle) 복제(Lizardi 외, 미국 특허 제 5,854,033호) 또는 기타 핵산 증폭 방법에 의한 핵산 증폭의 과정, 및 여기에 이어지는 해당 분야의 통상의 기술자에게 잘 알려진 기술을 사용한 증폭된 분자의 탐지를 포함한다. 이러한 탐지 방법은 이들 분자가 매우 작은 수로 존재하는 경우 핵산 분자의 탐지에 특히 유용하다. 본 발명의 특별한 측면에 따르면, 표지 인자 발현은 정량적 형광 RT-PCR (즉, TaqManTM 시스템)에 의해 분석된다. 이러한 방법은 일반적으로 본 발명의 표지 인자에 특정한 올리고뉴클레오타이드 프라이머의 쌍을 활용한다. 알려진 염기서열에 특정한 올리고뉴클레오타이드 프라이머를 설계하는 방법은 기술 분야에서 잘 알려져 있다.
본 발명의 표지 인자의 발현 수준은 (북부, 남부, 도트 등에 사용된 것과 같은 및 잡종 형성 분석과 같은)막 블롯, 또는 마이크로웰, 표본 튜브, 겔, 구슬 또는 섬유질(또는 결합 핵산을 포함하는 기타 고체 지지체)을 사용하여 모니터링될 수 있다. 참조에 의해 본 명세서에 통합된 미국 특허 제 5,770,722, 5,874,219, 5,744,305, 5,677,195 및 5,445,934호 참조. 표지 인자 발현의 탐지는 용액 내에서 핵산 탐침을 사용하는 것을 포함할 수 있다.
본 발명의 일 실시예에서, 미세 배열은 본 발명의 표지 인자의 발현을 탐지하기 위해 사용된다. 미세 배열은 서로 다른 실험에서의 재생성 때문에 특히 이러한 목적에 적합하다. DNA 미세 배열은 많은 수의 유전자의 발현 수준을 동시에 측정하는 하나의 방법을 제공한다. 각 배열은 고체 지지체에 부착된 포획 탐침의 재생 가능 패턴으로 구성된다. 라벨링된 RNA 또는 DNA는 배열 상에서 보완 탐침에 대해 잡종을 형성하고 레이저 스캐닝에 의해 탐지된다. 배열 상의 각 탐침의 잡종 형성 강도가 결정되어 상대적 유전자 발현 수준을 나타내는 정량적 값으로 변환된다. 이에 대해서는, 참조에 의해 본 명세서에 통합된 미국 특허 제 6,040,138호, 제 5,800,992호와 제 6,020,135호, 제 6,033,860호, 및 제 6,344,316호를 참조한다. 고밀도 올리고뉴클레오타이드 배열은 표본 내 많은 개수의 RNA에 대한 유전자 발현 프로필을 결정하는데 특히 유용하다.
표지 인자의 양, 및/또는 본 발명의 표지 인자의 양의 수학적 관계는 질병 상태 또는 독성 상태에 대해 치료되고 있는 대상에서의 질병 상태, 예를 들어 암, 당뇨, 비만, 심장병, 또는 독성 상태, 예를 들어, 약제로 유도되는 독성 또는 심장 독성의 재발의 위험, 질병 상태 또는 독성 상태에 대해 치료되고 있는 대상의 생존 가능성, 질병 상태 또는 독성 상태가 악성인지의 여부, 질병 상태 또는 독성 상태를 치료하기 위한 치료 식이 요법의 효능 등을 해당 분야의 통상의 기술자에게 알려진 회귀 분석 방법을 포함하는 본 발명의 방법을 사용하여 계산하는데 사용될 수 있다. 예를 들어, 적절한 회귀 모델은 CART(예를 들어, 힐(Hill, T), 및 루위키(Lewicki, P.) (2006) “STATISTICS 방법 및 적용” StatSoft, Tulsa, OK), 콕스(Cox)(예를 들어, www.evidence-based-medicine.co.uk), 지수, 정규 및 로그 정규 (예를 들어, www.obgyn.cam.ac.uk/mrg/statsbook/stsurvan.html), 병참적(예를 들어, www.en.wikipedia.org/wiki/Logistic_regression), 매개 변수적, 비매개변수적, 반매개변수적(예를 들어, www.socserv.mcmaster.ca/jfox/Books/Companion), 선형(예를 들어, www.en.wikipedia.org/wiki/Linear_regression), 또는 첨가적(예를 들어, www.en.wikipedia.org/wiki/generalized_additive_model) 모델을 포함하나 이에 한정되지는 않는다.
일 실시예에서, 회귀 분석은 표지 인자의 양을 포함한다. 또 다른 실시예에서, 회귀 분석은 표지 인자의 수학적 관계를 포함한다. 또 다른 실시예에서, 표지 인자의 양 및/또는 표지 인자의 수학적 관계의 회귀 분석은 추가적인 임상적 및/또는 분자의 보조 변량을 포함할 수 있다. 이러한 임상적 보조 변량은 노드의 상태, 종양 단계, 종양 등급, 종양의 크기, 예를 들어, 화학 치료 및/또는 방사선 치료와 같은 치료 방법 체계, 임상적 결과(예를 들어, 재발, 질병에 특정한 생존, 치료 실패) 및/또는 진단 이후 시간, 초기 치료 이후의 시간 및/또는 치료의 완료 이후의 시간의 함수로서의 임상적 결과를 포함하나 이에 한정되지는 않는다.
VIII
.
키트
본 발명은 또한 질병 상태 또는 독성 상태에 대한 치료를 받는 대상의 질병 상태, 예를 들어 암, 당뇨, 비만, 심장병, 또는 독성 상태, 예를 들어, 약제로 유도되는 독성 또는 심장 독성, 질병 상태의 재발 또는 독성 상태, 또는 생존을 예단하기 위한 구성 요소 및 키트를 제공한다. 이들 키트들은 다음 중 하나 또는 그 이상을 포함한다: 특히 본 발명의 표지 인자에 결합하는 탐지 가능항체, 특히 염색에 사용하기 위한 대상의 조직 표본의 획득 및/또는 준비를 위한 본 발명의 표지 인자, 반응 제제에 결합하는 탐지 가능항체, 및 이의 사용을 위한 지침.
본 발명의 키트는 선택적으로 본 발명의 방법을 수행하기에 유용한 추가적 성분을 포함할 수 있다. 예로써 설명하면, 상기 키트는 보완 핵산을 아닐링하기에 적합하거나 항체를 상기 항체가 특히 결합되는 단백질에 결합하기에 적합한액체(예를 들어, SSC 버퍼), 하나 또는 그 이상의 표본 구획, 본 발 명의 방법 및 조직 특정한 제어/표준수행을 설명하는 지침 문서를 포함할 수 있다.
IX
.
선별 분석
본 발명의 타겟은 본 명세서에 열거된 유전자 및/또는 단백질을 포함하나 이에 한정되지는 않는다. 본 출원인들이 본 명세서에 기술한 실험의 결과를 기반으로, 질병 상태 또는 독성 상태에서 조절되는 핵심 단백질은 세포 골격 성분, 전사 요소, 세포 사멸제 반응, 오탄당 인산염 경로, 생체 합성 경로, 산소 첨가 스트레스(친 옥시던트), 막 변경, 및 산소 첨가 인산화 대사를 포함하는 서로 다른 경로 또는 분자의 군에 연관되거나 이들로 분류될 수 있다. 이에 따라, 본 발명의 일 실시예에서, 표지 인자는 HSPA8, FLNB, PARK7, HSPA1A/HSPA1B, ST13, TUBB3, MIF, KARS, NARS, LGALS1, DDX17, EIF5A, HSPA5, DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1, CANX, GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택되는 하나 또는 그 이상의 유전자(또는 단백질)를 포함한다. 일 실시예에서, 상기 표지 인자는 GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1, GPAT1 및 TAZ로 이루어지는 군에서 선택된 하나 또는 그 이상의 유전자(또는 단백질)을 포함할 수 있다. 일부 실시예에서, 상기 표지 인자는 상기 기술한 유전자(또는 단백질)들 중 최소한 둘, 셋, 넷, 다섯, 여섯, 일곱, 여덟, 아홉, 열, 열하나, 열둘, 열셋, 열넷, 열다섯, 열여섯, 열일곱, 열여덟, 열아홉, 스물, 스물-다섯, 서른, 또는 그 이상의 조합이다.
식별된 표지 인자의 조절 인자를 식별하기에 유용한 선별 분석은 아래에서 설명된다.
본 발명은 또한 조절 인자, 즉, 후보 또는 검사 화합물 또는 제제(예를 들어, 단백질, 펩티드, 펩티도미메트릭, 펩토이드, 소형 분자 또는 기타 약제)를 식별하는 방법(본 명세서에서 "선별 분석"으로도 불림)을 제공하며, 상기 방법은 본 발명의 표지 인자의 발현 및/또는 활성을 조절함으로써 질병 상태 또는 독성 상태를 치료하고 예방하는데 유용하다. 이러한 분석은 일반적으로 본 발명의 표지 인자 및 하나 또는 그 이상의 분석 성분 간의 반응을 포함한다. 상기 기타 성분은 검사 화합물 자체, 또는 검사 화합물의 조합 및 본 발명의 표지 인자의 자연적 결합 파트너 중 하나일 수 있다. 본 명세서에서 기술된 것과 같은 분석을 통해 식별된 화합물은, 예를 들어, 질병 상태 또는 독성 상태의 공격성을 억제, 완화, 치료 또는 예방하는데 유용할 수 있다.
본 발명의 선별 분석에서 사용된 상기 검사 화합물은 자연적 및/또는 합성 화합물의 체계적 라이브러리를 포함하는 어떠한 가용한 소스로부터도 획득할 수 있다. 검사 화합물 또한 다음을 포함하는 해당 분야에서 알려진 조합적 라이브러리방법 내의 다수의 접근 방식 중 어느 하나에 의해 획득될 수 있다: 생물학적 라이브러리; 펩토이드 라이브러리(펩티드의 기능성을 가지나, 효소 퇴화에 대해 저항성이 있으나 그럼에도 생체 활성을 유지하는 신규의 비 펩티드 백본을 가지는 분자들의 라이브러리; 예를 들어, 주커만(Zuckermann) 외, 1994, J. Med. Chem. 37:2678-85 참조); 공간적으로 배치될 수 있는 병렬 고체 상 또는 용액 상 라이브러리; 디콘볼루션(deconvolution)을 요하는 합성 라이브러리 방법; '일-구슬 일-화합물' 라이브러리 방법; 및 친화성 크로마토그래피 선택을 사용한 합성 라이브러리 방법. 상기 생물학적 라이브러리 및 펩토이드 라이브러리 접근 방식은 펩티드 라이브러리에 제한되며, 반면에 다른 네 개의 접근 방식은 펩티드, 비 펩티드 올리고머 또는 소형 분자 화합물의 라이브러리에 적용할 수 있다(램(Lam), 1997, AntiCancer Drug Des. 12:145).
분자 라이브러리의 합성을 위한 방법들의 예는, 예를 들어, 다음과 같은 해당 분야의 기술에서 찾아 볼 수 있다: 드위트(DeWitt) 외(1993) Proc. Natl. Acad. Sci. 미국. 90:6909; 어브(Erb) 외(1994) Proc. Natl. Acad. Sci. 미국 91:11422; 주커만(Zuckermann) 외(1994). J. Med. Chem. 37:2678; 조(Cho) 외(1993) 사이언스 261:1303; 카렐(Carrell) 외(1994) Angew. Chem. Int. Ed. Engl. 33:2059; 카렐(Carrell) 외(1994) Angew. Chem. Int. Ed. Engl. 33:2061; 및 갤럽(Gallop) 외(1994) J. Med. Chem. 37:1233.
화합물의 라이브러리는 용액으로 제공되거나(예를 들어, 후텐(Houghten), 1992, Biotechniques 13:412-421), 또는 구슬(램(Lam), 1991, 네이처 354:82-84), 칩(포더(Fodor), 1993, 네이처 364:555-556), 박테리아 및/또는 포자(라드너(Ladner), USP 5,223,409), 플라스미드(컬(Cull) 외, 1992, Proc Natl Acad Sci USA 89:1865-1869) 또는 파지(스코트(Scott) 및 스미스(Smith), 1990, 사이언스 249:386-390; 데블린(Devlin), 1990, 사이언스 249:404-406; 스월라(Cwirla) 외, 1990, Proc. Natl. Acad. Sci. 87:6378-6382; 펠리치(Felici), 1991, J. Mol. Biol. 222:301-310; 라드너(Ladner), 상기와 동일)로 제공된다.
본 발명의 선별 방법은 질병 상태 세포 또는 독성 상태 세포를 검사 화합물과 접촉시키는 단계, 및 검사 화합물이 세포 내 본 발명의 표지 인자의 발현 및/또는 활성을 조절할 수 있는 능력을 결정하는 단계를 포함한다. 본 발명의 표지 인자의 발현 및/또는 활성은 본 명세서에 기술된 바에 따라 결정될 수 있다.
또 다른 실시예에서, 본 발명은 본 발명의 표지 인자 또는 이의 생물학적으로 활성화된 부분의 기질인 후보 또는 검사 화합물의 선별을 위한 분석을 제공한다. 또 다른 실시예에서, 본 발명은 본 발명의 표지 인자 또는 이의 생물학적으로 활성화된 부분에 결합하는 후보 또는 검사 화합물의 선별을 위한 분석을 제공한다. 표지 인자에 직접 결합할 수 있는 검사 화합물의 능력을 결정하는 것은, 예를 들어, 화합물의 표지 인자로의 결합이 복합체 내 라벨링된 표지 인자 화합물을 탐지함으로써 결정될 수 있도록 화합물을 방사성 동위원소 또는 효소 라벨에 결합 시킴으로써 성취될 수 있다. 예를 들어, 화합물(예를 들어, 표지 인자 기질)은 131I, 125I, 35S, 14C, 또는 3H로, 직접적 또는 간접적으로 라벨링될 수 있으며, 상기 방사성 동위원소는 방사성 방출의 직접적 계수 또는 섬광을 계수함으로써 탐지될 수 있다. 대체적 방법으로, 분석 성분은, 예를 들어, 호스래디시 퍼옥시다제, 알칼리 포스타파아제, 또는 루시퍼라제, 및 적절한 기질에서 생산물로의 변환에 대한 결정에 의해 탐지된 효소 라벨로서 효소적으로 라벨링될 수 있다.
본 발명은 또한 상기 기술된 선별 분석에 의해 식별된 신규의 제제에 관한 것이다. 이에 따라, 상기 기술된 바에 따라 식별된 제제를 적절한 동물 모델에 대해 추가적으로 이용하는 것 또한 본 발명의 범위 내에 있는 것이다. 예를 들어, 본 명세서에서 기술된 바에 의해 식별된 본 발명의 표지 인자의 발현 및/또는 활성을 조절할 수 있는 제제는 동물 모델에서 이러한 제제를 통한 치료의 의 효능, 독성, 또는 부작용을 결정하기 위해 사용될 수 있다. 대체적 방법으로, 본 명세서에서 기술된 대로 식별된 제제는 동물 모델에서 이러한 제제의 활동의 메커니즘을 결정하기 위해 사용될 수 있다. 또한, 본 발명은 상기 기술된 대로의 치료를 위한 상기 기술된 선별 분석에 의해 식별된 신규의 제제의 사용에 관한 것이다.
예를 통한 발명의 설명
예 1:
암 합치 및 시뮬레이션 네트워크 구축을 위한 플랫폼 기술 채택
본 예에서는, 필요에 따라 구축된 생체 외 암 모델로부터 얻어진 데이터를 통합하고, 이에 의해 암의 발병을 추진시키는 신규의 단백질/경로를 식별하기 위해 위에서 상세히 설명한 플랫폼 기술이 채택되었다. 이러한 분석의 결과로 얻어지는 관계적 맵은 암과 관련된 진단적/예후의 표지 인자와 더불어 암 치료 타겟을 제공하였다.
연구 설계는 도 18에서 묘사된다. 간단히 설명하면, 두 개의 암 세포 라인(PaCa2, HepG2) 및 하나의 정상 세포 라인(THLE2)이 생체 내 암 세포가 경험하는 환경을 모의하는 일곱 조건 중 하나의 조건을 겪도록 하였다. 특히, 세포들은 고혈당 조건, 저산소 상태 조건, 젖산 조건, 고혈당 + 저산소 상태 조합 조건, 고혈당 + 젖산 조합 조건, 저산소 상태 + 젖산 조합 조건, 또는 고혈당 + 저산소 상태 + 젖산 조합 조건에 노출되었다. 이들 서로 다른 조건들은 다음과 같이 생성되었다:
--고혈당 조건은 세포를 22 mM 글루코스를 함유하는 매체에서 배양함으로써 생성되었다.
--저산소 상태 조건은 세포를 모듈라 인큐베이터 챔버(MIC-101, 빌럽-로덴버그 사(Billups-Rothenberg Inc). 델 마, 캘리포니아) 내에 위치시킴으로써 유도되었으며, 이때 5% CO2, 2% O2 및 93% 질소를 함유하는 산업용 기체 혼합물로 넘치게 했다.
--젖산 조건은 세포를 12.5 mM 젖산을 함유하는 매체에서 배양함으로써 생성되었다.
--고혈당 + 저산소 상태 조합 조건은 세포를 22 mM 글루코스를 포함하는 매체에서 배양하여 생성되었고, 상기 세포는 5% CO2, 2% O2 및 93% 질소를 함유하는 산업 기체 혼합물로 넘쳐나는 모듈라 배양기 챔버에 위치시켰다.
--고혈당 + 젖산 조합 조건이 세포를 22 mM 글루코스 및 12.5 mM 젖산을 함유하는 매체에서 배양함으로써 생성되었다.
--저산소 상태 + 젖산 조합 조건은 세포를 12.5 mM 젖산을 포함하는 매체에서 배양하여 생성되었고, 상기 세포는 5% CO2, 2% O2 및 93% 질소를 함유하는 산업 기체 혼합물로 넘쳐나는 모듈라 배양기 챔버에 위치시켰다.
--고혈당 + 저산소 상태 + 젖산 조합 조건은 세포를 22 mM 글루코스 및 12.5 mM 젖산을 포함하는 매체에서 배양하여 생성되었고, 상기 세포는 5% CO2, 2% O2 및 93% 질소를 함유하는 산업 기체 혼합물로 넘쳐나는 모듈라 배양기 챔버에 위치시켰다.
상기 언급한 세포들을 포함하는 세포 모델에서, 상기 세포들은 위에 언급한 각 조건에 노출되며, 세포를 코엔자임 Q10로 처리하여 환경적 교란에 노출시킴으로써 추가적으로 조사된다. 특히, 세포들은 0, 50μM, 또는 100μM에서 코엔자임 Q10로 처리된다.
각각의 조건을 가지며 각각의 코엔자임 Q10 로 처리된 세포 라인에 대해 매체 표본과 더불어 세포 표본이 처리 후 24시간 및 처리 후 48시간을 포함하여 처리 이후에 수 회 수집되었다.
또한, 두 개의 다른 암 세포인 PaCa2 및 HepG2 세포 사이의 상호 대화 실험이 수행되었으며, 이때 PaCa2 및 HepG2 세포는 공생 배양되었다. 이러?h 공생 배양 접근 방식은 세포 외 세크리톰(ECS) 실험이라 불린다. 제 1 세포 시스템(PaCa2)이 먼저 웰 내의 웰 간 유형 성장 챔버의 삽입기에 뿌려 졌다. 여섯 개의 웰 플레이트가 보다 나은 통계적 분석을 위해 사용되었다. 삽입기 내의 제 1 세포 시스템을 뿌리는 동안, 상기 삽입기는 별도의 6 개의 웰 플레이트 상에 위치한다. 제 2 세포 시스템(HepG2)은 주 트레이에 뿌려 졌다. 제 1 세포 시스템, 및 제 2 세포 시스템을 포함하는 주 트레이를 포함하는 삽입 트레이가 37˚C에서 하루 밤 동안 배양되었다. 각각의 세포 시스템은 각 세포에 특정한 매체 (이때 대체적인 방법으로, 각각의 세포 시스템이 두 세포 유형 모두의 성장을 지지하는 매체에서 성장될 수 있다)에서 성장되었다. 두 번째 날에, 매체 교환에 의한 소정의 처리를 하였다. 특히, 제 1 세포 시스템을 포함하는 삽입기는 제 2 세포 시스템을 포함하는 주 트레이 내에 위치하였다. 이 트레이는 이후 소정의 기간, 예를 들어, 24 시간 또는 48 시간 동안 배양되었다. 복사된 웰이 동일한 조건으로 설정되었으며 세포들을 저장하여 2D 분석을 위한 충분한 물질들이 생산되도록 하였다. 상기 매체(1 ml 부분 표본)와 삽입기로부터의 세포 및 주 트레이의 웰로부터의 세포들은 별도의 표본으로 수확되었다. 보다 나은 통계적 분석력을 제공하기 위해 상기 실험은 삼회 반복 수행되었다.
상호 대화(cross talk) 실험 또한 “매체 교환(swap)” 실험에 의해 수행되었다. 특히, 제 1 세포 시스템 (PaCa2)으로부터 배양된 매체 또는 “세크리톰”이 상기 기술한 교란 또는 조건을 겪은 후 24시간 또는 48시간 이후에 수집되었으며, 이후 제 2 세포 시스템 (HepG2)에 24-48시간 동안 추가되었다. 제 2 세포 시스템으로부터 최종 배양된 매체 또는 “세크리톰” 이 다시 수집되었다. 모든 최종 세크리톰은 단백질체의 분석을 거쳤다.
정량적 단백질체학에 의한 전체 세포 단백질 발현에서의 변화에 대한 아이프로파일링(iprofiling)이 각 세포 라인에 각 조건에서, 또 각 “환경적 교란”, 즉, 코엔자임 Q10을 사용한 치료에 대해 상기 상세한 설명에서 설명한 기술을 사용하여 수집된 세포 및 매체 표본에 대해 수행되었다. 정량적 단백질체학에 의한 전체 세포 단백질 발현에서의 변화에 대한 아이프로파일링은 마찬가지로 각 조건 및 치료에서 각각의 공생 배양된 세포 라인에 대하여 수집된 세포 및 매체 표본에 대해 수행되었다.
또한, 암, 정상 세포 및 상호 대화 실험 내에서 코엔자임 Q10 교란의 존재 또는 부존재 하에서 각 조건에 노출된 세포들의 생명 에너지론적 프로파일링이 Seahorse 분석기를 본질적으로 제조사가 권장한 대로 채택하여 생성되었다. OCR (산소 소모율) 및 ECAR(세포외 공간 산화율)이 상기 시호스(seahorse) 배양 플레이트에 대해 밀어 넣어지는 카트리지로서 생성된 7 μl 챔버 내의 전극에 의해 기록되었다.
각 세포 라인(상호 대화 실험 내의 세포를 포함)에 대해 각 조건(들) 및 각 교란의 존재 하에서 수집된 단백질체학 데이터, 및 각 세포 라인에 대해 각 조건(들) 및 각 교란의 존재 하에서 수집된 생명 에너지론 프로파일링 데이터가 이후 REFS™ 시스템에 의해 처리되었다. Paca2, HepG2, THLE2 및 상호 대화 실험에 대한 미가공 데이터가 다시 표준화된 명명법을 사용하여 조합되었다. 15% 이상의 단백질체학 데이터가 결여된 유전자는 필터링하여 제거되었다. 데이터 산입 적략이 개발되었다. 예를 들어, 복제 오류 내에서 모델이 복제를 가지는 실험적 조건으로부터의 데이터를 산입하기 위해 사용되었다. 10 개의 이웃에 기반한 K-NN 알고리즘이 복제를 가지지 않는 데이터를 산입하기 위해 사용되었다. 세 개의 생물학적 시스템 모두에 대해, Paca2 시스템에 대해서만, 또는 표현형 데이터에 링크된 HepG2 시스템만에 대해 서로 다른 REFS™ 모델들이 구축되었다.
곡선 아래의 넓이 및 시뮬레이션 네트워크 내에서 부모 노드를 자식 노드에 연결하는 각 간선에 대한 배수 변화가 R 프로그램밍 언어를 사용하는 필요에 따라 구축된 프로그램에 의해 추출되며, 이때 상기 R 프로그램밍 언어는 통계적 컴퓨팅 및 그래픽을 위한 오픈 소스 소프트웨어 환경이다.
R 프로그램으로부터의 출력은 합치된 네트워크의 시각적 표현을 생성하기 위한 오픈 소스 프로그램인 사이토스케이프(Cytoscape)로 입력된다.
구축된 모든 모델 중에서, 70% 파편 빈도에서 예시적 단백질 상호 반응의 REFS 합치된 네트워크가 도 21에 도시된다.
도 21에 도시된 합치된 네트워크 내의 각 노드는 상기 상세한 설명에서 상세히 설명한 대로 REFS™을 사용하여 시뮬레이션 네트워크를 생성하기 위해 LDHA의 발현을 4배 증가 또는 감소시킴으로써 모의된다.
도 21에 도시된 예시적 합치된 네트워크 내의 고 수준에서의 PARK7과 연관되어, PARK7 및 단백질에 대한 모의된 LDHA 발현 변화의 효과가 조사되었다. 두 개의 암 세포 라인, 즉, Paca2 및 HepG2에서 LDHA 시뮬레이션에 반응하는 단백질이 REFS™을 사용하여 식별되었다(도 22 참조). 이들 수들은 특정한 단백질 발현 수준의 배수 변화를 나타낸다.
상기 방법을 사용하여 식별된 단백질 연결을 증명하기 위해, 시뮬레이션 네트워크 내의 LDHA에 직접적 근접성을 가지는 식별될 표지 인자가 이전에 출간된 문헌들에 기반한 네트워크들 사이의 실험적 출력들 사이의 분자의 연관을 결정하기 위해 신경망 네트워크를 활용하는 소프트웨어 프로그램인 IPA에 입력되었다. IPA 프로그램의 출력은 도 23에 도시되었으며, 이때 회생 모양의 표지 인자는 플랫폼에 의해 생성된 시뮬레이션 네트워크 내 LDHA에 직접적 근접성을 가지는 것으로 식별되었으며 채워지지 않은 형태의 표지 인자는 이전에 출간된 문헌 내의 알려진 지식에 기반한 IPA에 의해 식별된 연결이다.
조사적 생물학 플랫폼 기술로부터의 출력에서 식별된 표지 인자들(도 21에 도시), 즉 DHX9, HNRNPC, CKAP4, HSPA9, PARP1, HADHA, PHB2, ATP5A1 및 CANX는 IPA로 생성된 네트워크 내에서 TP53 및 PARK7와 같은 잘 알려진 암 표지 인자와 연결되어 있는 것으로 관찰되었다(도 23에 도시). 본 발명의 조사적 생물학 플랫폼에 의해 식별된 요소들이 과학 문헌들에 발표된 알려진 요소들과 연결성을 공유한다는 사실은 본 발명의 조사적 생물학 플랫폼을 사용하여 생성된 네트워크의 정확성을 증명하는 것이다. 또한, 본 발명의 조사적 생물학 플랫폼 출력을 사용하여 생성된 LDHA 하위 네트워크 내의 이러한 네트워크 연관은, 분자 개체들 사이의 연결이 반응하는 노드들 사이의 기능적인 방향성을 제공하지 않는 IPA 네트워크와는 반대로, 각 요소에 대한 방향적 영향이 존재함을 입증한다. 따라서, 데이터 생성, 통합 및 역 엔지니어링에 대해 편향되지 않은 접근 방식을 채택하여 계산 모델을 생성하고, 이어서 시뮬레이션 및 분별 네트워크 분석을 수행함으로써, 상기 조사적 생물학의 발견 플랫폼은 아직까지 알려지지 않은 암 생리병리학에서의 메커니즘을 질병 생리병리학의 잘 확립된 과학적 이해와 조화를 이루어 이해할 수 있게 해 준다.
도 19는 아이프로파일링으로부터의 단백질 발현 데이터에 기반한 하향 노드(퍼브메드(pubmed) 단백질 접근 번호는 도 19에 열거된다)에 대한 CoQ10 치료의 효과를 도시한다. 단백질 접근 번호 P00338은 LDHA이다. 수중 실험에 의한 단백질체 데이터의 증명은 LDHA 발현에 대해 HepG2 세포 내에서 수행되었다(도 20 참조). 도 20에서 보인 바와 같이, LDHA 발현 수준은 HepG2 가 50 uM CoQ10 또는 100 uM CoQ10으로 24 또는 48 시간 동안 처리하였을 때 감소한다.
잘 알려진 암 표지 인자인 TP53, Bcl-2, Bax 및 카스파제3에 대해, SKMEL 28 세포 내의 이들 표지 인자의 발현 수준에 대한 CoQ10 치료 효과의 증명이 수중 실험을 통해 수행되었다 (도 24 및 도 25 참조).
예 2:
암 델타-델타 네트워크를 구축하기 위한 플랫폼 기술의 채택
본 예에서는, 필요에 따라 구축된 생체 외 암 모델로부터 얻어진 데이터를 통합하고, 이에 의해 암의 발병을 추진시키는 신규의 단백질/경로를 식별하기 위해 위에서 상세히 설명한 플랫폼 기술이 채택되었다. 이러한 분석의 결과로 얻어지는 관계적 맵은 암과 관련된 진단적/예후의 표지 인자와 더불어 암 치료 타겟을 제공하였다.
간단히 설명하면, 네 개의 암 라인(PaCa2, HepG2, PC3 및 MCF7) 및 두 개의 정상 세포 라인(THLE2 및 HDFa)이 생체 내 암 세포가 경험하는 환경을 모의하는 여러 조건들을 겪도록 하였다. 특히, 세포들은 고혈당 조건, 혈중 산소 감소 조건 및 젖산에 의한 처리 각각에 별도로 노출되었다. 예를 들어, 고혈당 조건은 세포를 22 mM 글루코스를 함유하는 매체에서 배양함으로써 생성되었다. 혈중 산소 감소 조건은 세포를 모듈라 인큐베이터 챔버(MIC-101, 빌럽-로덴버그 사(Billups-Rothenberg Inc). 델 마, 캘리포니아) 내에 위치시킴으로써 유도되었으며, 이때 5% CO2, 2% O2 및 93% 질소를 함유하는 산업용 기체 혼합물로 넘치게 했다. 젖산 처리를 위해, 각 세포 라인은 0 또는 12.5 mM 젖산에서 처리되었다. 세포들을 위의 셋 조건에 별도로 노출시키는 것과 더불어, 세포들은 또한 상기 조건들의 둘의 조합 또는 세 조건 모두(즉, 고혈당 및 혈중 산소 감소 조건; 고혈당 조건 및 젖산; 혈중 산소 감소 조건 및 젖산; 및 고혈당 및 혈중 산소 감소 조건 및 젖산)에 노출되었다.
상기 언급한 세포들을 포함하는 세포 모델에서, 상기 세포들은 위에 언급한 각 조건에 노출되며, 세포를 코엔자임 Q10로 처리하여 환경적 교란에 노출시킴으로써 추가적으로 조사된다. 특히, 세포들은 0, 50μM, 또는 100μM에서 코엔자임 Q10로 처리된다.
각각의 조건(또는 조건들의 조합)에 노출되고 코엔자임 Q10 로 처리되거나 처리되지 않은 세포 라인에 대해 세포로부터의 세크리톰을 함유하는 세포매체 표본과 더불어 세포 표본이 처리 후 24시간 및 처리 후 48시간를 포함하여 처리 이후에 수 회 수집되었다.
또한, 두 개의 다른 암 세포인 PaCa2 및 HepG2 세포 사이의 상호 대화 실험이 수행되었으며, 이때 PaCa2 및 HepG2 세포는 공생 배양되었다. 이러한 공생 배양 접근 방식은 세포 외 세크리톰(ECS) 실험이라 불린다. 제 1 세포 시스템(PaCa2)이 먼저 웰 내의 웰 간 유형 성장 챔버의 삽입기 에 뿌려 졌다. 여섯 개의 웰 플레이트가 보다 나은 통계적 분석을 위해 사용되었다. 삽입기 내의 제 1 세포 시스템을 뿌리는 동안, 상기 삽입기는 별도의 6 개의 웰 플레이트 상에 위치한다. 제 2 세포 시스템(HepG2)은 주 트레이에 뿌려 졌다. 제 1 세포 시스템, 및 제 2 세포 시스템을 포함하는 주 트레이를 포함하는 삽입기를 포함하는 6개의 웰 플레이드가 37˚C에서 하루 밤 동안 배양되었다. 각각의 세포 시스템은 각 세포에 특정한 매체 (이때 대체적인 방법으로, 각각의 세포 시스템이 두 세포 유형 모두의 성장을 지지하는 매체에서 성장될 수 있다)에서 성장되었다. 두 번째 날에, 매체 교환에 의한 소정의 처리를 하였다. 특히, 제 1 세포 시스템 및 제 1 세포 시스템의 각 매체를 포함하는 삽입기는 제 2 세포 시스템 및 제 2 세포 시스템의 각 매체를 포함하는 주 트레이 내에 위치하였다. 그러나, 모든 경우의 공생 배양에서 공생 배양된 세포는 공생 배양 전의 제 1일 중에 별도로이긴 하지만 동일한 “암 조건”(예를 들어, 고혈당증, 저산소 상태, 젖산, 또는 이들의 조합)에 노출된 바 있다. 다시 말해, 삽입부 내의 제 1 세포 시스템 및 트레이 내의 제 2 세포 시스템은 “공생배양” 설정으로 옮겨지기 전에 동일한 조건에 노출되었다. 이 트레이는 이후 소정의 기간, 예를 들어, 24 시간 또는 48 시간 동안 배양되었다. 복사된 웰이 동일한 조건으로 설정되었으며 세포들을 저장하여 이후의 단백질체의 분석을 위한 충분한 물질들이 생산되도록 하였다. 세크리톰(1 ml 부분 표본)을 함유하는 상기 매체, 삽입기로부터의 세포 및 주 트레이의 웰로부터의 세포들은 별도의 표본으로 수확되었다. 보다 나은 통계적 분석력을 제공하기 위해 상기 실험은 3회 반복 수행되었다.
상호 대화 실험 또한 “매체 교환(swap)” 실험에 의해 수행되었다. 특히, 제 1 세포 시스템 (PaCa2)으로부터 배양된 매체 또는 “세크리톰”이 상기 기술한 교란 또는 조건을 겪은 후 24시간 또는 48시간 이후에 수집되었으며, 이후 제 2 세포 시스템 (HepG2)에 24-48시간 동안 추가되었다. 제 2 세포 시스템으로부터 최종 배양된 매체 또는 “세크리톰”이 다시 수집되었다. 모든 최종 세크리톰은 단백질체의 분석을 거쳤다.
상기 세포 시스템을 상기 기술된 “암 조건”과 공생 배양 실험으로부터의 쌍을 이루는 세포의 세크리톰 내에서 생산된 교란(즉, 코엔자임 Q10 치료), 및/또는 조건에 노출시키고 나서, 세포의 반응이 세포 시스템으로부터의 여러 해독의 분석에 의해 분석되었다. 상기 해독은 세포 배양 매체로 분비된 단백질 및 특히 세포 생명 에너지론의 기능적 데이터뿐만 아니라, 단백질체의 데이터, 특히 세포 내 단백질 발현을 포함하였다.
정량적 단백질체학에 의한 전체 세포 단백질 발현에서의 변화에 대한 아이프로파일링(iprofiling)이 각 조건(또는 조건들의 조합)에 노출되고, 또 각 “환경적 교란”, 즉, 코엔자임 Q10을 사용한 치료가 존재하거나 존재하지 않는 각 세포 라인(정상 및 암 세포 라인)에 대하여 수집된 세포 및 매체 표본에 대해 상기 상세한 설명에서 설명한 기술을 사용하여 수행되었다.
또한, 암, 정상 세포 및 상호 대화 실험 내에서 “환경적 교란”, 즉, 코엔자임 Q10 치료의 존재 또는 부존재 하에서 각 조건(또는 조건들의 조합)이 노출된 각세포 라인들(정상 및 암 세포 라인들)의 생명 에너지론적 프로파일링이 시호스(seahorse) 분석기를 본질적으로 제조사가 권장한 대로 채택하여 생성되었다. OCR (산소 소모율) 및 ECAR(세포외 공간 산화율)이 상기 시호스(Seahorse) 배양 플레이트에 대해 밀어 넣어지는 카트리지로서 생성된 7 μl 챔버 내의 전극에 의해 기록되었다.
각 세포 라인에 대해 각 조건(들) 및 각 교란의 존재/부존재 하에서 수집된 단백질체학 데이터, 및 각 세포 라인에 대해 각 조건(들) 및 각 교란의 존재/부존재 하에서 수집된 생명 에너지론 프로파일링 데이터가 이후 REFS™ 시스템에 의해 처리되었다. “복합체 암 교란 네트워크”가 모든 암 세포 라인으로부터 획득한 각각의 특정한 조건 (및 조건들의 조합)에 노출된 후, 교란(CoQ10)에 더 노출된 데이터의 결합으로부터 생성되었다. “복합체 암 비교란 네트워크”가 모든 암 세포 라인으로부터 획득한 각각의 특정한 조건 (및 조건들의 조합)에 노출되고, 교란(CoQ10)에는 노출되지 않은 데이터의 결합으로부터 생성되었다. 마찬가지로, “복합체 정상 교란 네트워크” 가 모든 암 세포 라인으로부터 획득한 각각의 특정한 조건 (및 조건들의 조합)에 노출되고, 추가적으로 교란(CoQ10)에 더 노출된 데이터의 결합으로부터 생성되었다. “복합체 정상 비교란 네트워크”가 모든 암 세포 라인으로부터 획득한 각각의 특정한 조건 (및 조건들의 조합)에 노출되고, 교란(CoQ10)에는 노출되지 않은 데이터의 결합으로부터 생성되었다.
이후, “시뮬레이션 합성 네트워크”(본 명세서에서 “시뮬레이션 네트워크”로도 불림)가 상기 설명된 네 개의 복합체 네트워크 각각에 대해 REFS™을 사용하여 생성되었다. 이를 성취하기 위해, 상기 상세한 설명에서 상세히 설명한 대로, 주어진 합치된 복합체 네트워크 내의 각 노드가 시뮬레이션 네트워크를 생성하기 위해 REFS™을 사용하여 모의(10배 증가 또는 감소시킴으로써) 되었다.
곡선 아래의 넓이 및 시뮬레이션 네트워크 내에서 부모 노드를 자식 노드에 연결하는 각 간선에 대한 배수 변화가 R 프로그램밍 언어를 사용하는 필요에 따라 구축된 프로그램에 의해 추출되며, 이때 상기 R 프로그램밍 언어는 통계적 컴퓨팅 및 그래픽을 위한 오픈 소스 소프트웨어 환경이다.
최종적으로, 델타 네트워크가 생성되며, 이때 상기 델타 네트워크는 둘 시뮬레이션 합성 네트워크 사이의 분별을 나타낸다. 상기 델타 네트워크는 시뮬레이션 합성 네트워크로부터 생성된다. 코엔자임 Q10 에 반응하는 암 대 정상 분별 네트워크(델타-델타 네트워크)를 생성하기 위해, 도 26에 도시된 것과 같은 연속적인 비교 단계가 PERL 프로그래밍 언어를 사용하는 필요에 따라 구축된 프로그램에 의해 수행되었다.
먼저, 처리되지 않은 암 네트워크(T0)와 처리된 암 네트워크(T1)가 R 프로그램을 사용하여 비교되고, 고유의 처리된 암 T1 네트워크가 분리되었다(도 26의 진한 회색 부분의 초승달 모양 참조). 이는 암 T1 ∩ (교집합) 암 T0 “델타” 네트워크를 나타낸다. 이 델타 네트워크 내에서의 단백질 상호 반응 / 연관은 코엔자임 Q10 치료에 대한 고유한 암 반응을 나타내는 것으로 볼 수 있다.
마찬가지로, 처리되지 않은 정상 네트워크(T0)와 처리된 정상 네트워크(T1)가 R 프로그램을 사용하여 비교되었으며, 고유한 정상의 처리된 T1 네트워크가 분리되었다(도 26의 밝은 회색 부분의 초승달 모양 참조). 이는 정상 T1 ∩ 정상 T0 “델타” 네트워크를 나타낸다. 이 델타 네트워크 내에서의 단백질 상호 반응 / 연관은 코엔자임 Q10 치료에 대한 고유한 정상 세포 반응을 나타내는 것으로 볼 수 있다.
최종적으로, 고유한 암 T1 네트워크(도 26에서 진한 회색의 초승달 형 모양 참조) 및 고유한 정상 T1 네트워크(도 26에서 밝은 회색의 초승달 형 모양 참조)가 R 프로그램을 사용하여 비교되고, 코엔자임 Q10에 대한 반응으로 오직 암에만 고유하고 정상 세포에는 존재하지 않는 네트워크가 생성된다(도 26 참조). 이러한 단백질 상호 반응 / 연관의 수집은 코엔자임 Q10 치료에 대해 정상 세포에는 존재하지 않는 암 세포 내의 고유한 경로를 나타낸다. 이러한 단백질 상호 반응 / 연관의 수집은 암 세포로부터의 분별 맵과 정상 제어 세포로부터의 분별 맵 사이의 비교로부터 생성된 분별 맵이기 때문에 “델타-델타 네트워크”라 불린다.
PERL 및 R 프로그램으로부터의 출력은 델타-델타 네트워크의 시각적 표현을 위한 오픈 소스 프로그램인 사이토스케이프(Cytoscape)로 입력된다.
본 명세서에서 기술된 방법을 사용하여 식별된 이러한 델타-델타 네트워크는 암 치료를 위한 타겟을 식별하는데 매우 유용하다. 예를 들어, 도 27에 제시된 델타-델타 네트워크에 따르면, 단백질 A는 OCR3(산화적 인산화의 측정)을 억제하고 ECAR3(해당 과정에 대한 측정)을 향상시킨다. 이러한 상호 반응은 암 세포 내에서 고유하기 때문에(델타-델타 네트워크는 코엔자임 Q10 치료에서 정상 세포에 통상적으로 존재하는 상호 반응을 뺀 것이므로), 단백질 A 발현의 억제가 암 대사 경로의 전형적 특징인 해당 과정-기반의 에너지 대사를 감소시키고 세포를 정상 세포에 보다 밀접히 연관된 표현형인 산소 첨가 인산화-기반의 에너지 대사 쪽으로 이동시킬 것으로 기대된다. 따라서, 코엔자임 Q10 및 단백질 A 금지 인자를 사용하는 조합 치료가 암 세포의 에너지 대사 프로필을 정상 세포에 유사한 프로필로 이동시킴으로써, 암을 치료하는데 최소한 부분적으로는 효과적일 것으로 기대된다.
본 발명의 조사적 생물학 플랫폼 기술의 이점은 실제적 예를 사용하여 더 예시되며, 이 예에서는 인과 네트워크로 도출된 하위 네트워크가 이전에 발표된 문헌에 기반한 네트워크로의 실험적 출력들 사이의 분자의 연결을 결정하기 위해 신경 네트워크를 활용하는 소프트웨어 프로그램을 사용하여 IPA를 사용하는 분자의 네트워크와 비교된다. 조사적 생물학 플랫폼을 사용하여 생성된 PARK7을 포함하는 상기 인과적 하위 네트워크(도 29에 도시)가 실제적 예에서 사용된다. 조사적 생물학 플랫폼로부터의 PARK7 네트워크의 모든 분자 서명은 알려진/기존의 문헌 증거에 기반한 네트워크를 생성하기 위해 IPA로 통합된다. 이후 상기 조사적 생물학 출력과 IPA를 사용하여 생성된 출력 사이의 네트워크 출력이 비교된다.
조사적 생물학 플랫폼 기술의 출력으로부터 식별된 여섯 개의 표지 인자(도 29에 도시), 즉 도 27-29의 A, B, C, X, Y 및 Z는, IPA 생성 네트워크 내의 TP53에 연결된 것으로 관측되었다(도 28). 여섯 개의 표지 인자 가운데, A, B 및 C는 문헌에서 HSPA1A/HSPA1B뿐만 아니라 암과 연관된 것으로 보고되었다. X, Y 및 Z는 “허브” 또는 암 상태의 핵심 추진 인자로서 식별되며, 따라서 신규의 암 표지 인자로서 식별된다. 또한, MIF1 및 KARS 역시 “허브” 또는 암 상태의 핵심 추진 인자로서 식별되며, 따라서 신규의 암 표지 인자로서 식별된다. 조사적 생물학 플랫폼의 사용에 의해 식별된 요소가 과학 문헌에 발표된 알려진 요소와 연결성을 공유한다는 사실은 조사적 생물학 플랫폼에 의해 생성된 네트워크의 정확성을 증명하는 것이다. 추가적으로, 조사적 생물학 플랫폼 출력의 사용을 통해 생성된 PARK7 하위-네트워크 내에서의 상기 네트워크 연관(도 29에 도시)은, 분자 개체들 사이의 연결이 반응하는 노드들 사이의 기능적 방향성을 제공하지 않는 IPA 네트워크(도 28에 도시)와는 반대로, 각 요소의 방향적 영향을 예시한다. 또한, 조사적 생물학 플랫폼로부터의 출력(도 29에 점선으로 도시)은 이러한 성분들의 연관이 PARK7을 통한 잠재적 메카니즘으로 이어진다는 것을 예시한다. 단백질 C, 단백질 A 및 PARK7의 기타 노드들은 암 대사의 핵심 추진 인자인 것으로 관측되었다(도 27).
본 예에 의해 증명되는 것처럼, 데이터 생성, 통합 및 역 엔지니어링에 대해 편향되지 않은 접근 방식을 채택하여 계산 모델을 생성하고 뒤이어 시뮬레이션과 분별 네트워크 분석을 수행함으로써, 상기 조사적 생물학의 발견 플랫폼은 아직까지 알려지지 않은 암 생리병리학에서의 메커니즘을 질병 생리병리학의 잘 확립된 과학적 이해와 조화를 이루어 이해할 수 있게 해 준다.
예 3: 당뇨/비만/ 심장병 델타-델타 네트워크를 구축하기 위한 플랫폼 기술의 채택
본 예에서는, 필요에 따라 구축된 당뇨/비만/심장병 (CVD) 모델로부터 얻어진 데이터를 통합하고, 당뇨/비만/CVD의 발병을 추진시키는 신규의 단백질/경로를 식별하기 위해 상세한 설명에서 상세히 설명한 플랫폼 기술이 채택되었다. 이러한 분석의 결과로 얻어지는 관계적 맵은 당뇨/비만/CVD과 관련된 진단적/예후의 표지 인자와 더불어 당뇨/비만/CVD 치료 타겟을 제공하였다.
다섯 개의 인간 세포 라인, 즉 지방 세포, 근관 세포, 간 세포, 대동맥의 평활근 세포(HASMC), 및 기부 관상 세포(HK2)들이 이들 생체 내 질병 관련 세포가 경험하는 환경을 모의하는 다섯 조건 중 한 조건을 겪도록 하였다. 특히, 다섯 세포 라인이 다음과 갈은 조건들에 각각 별도로 노출되었다: 고혈당 조건, 고지질증 조건, 고인슐린증 조건, 혈중 산소 감소 조건 및 젖산에 대한 노출. 상기 고혈당 조건은 세포를 22 mM 글루코스를 함유하는 매체에서 배양함으로써 유도되었다. 상기 고지질증 조건은 세포를 0.15 mM 나트륨 팔미테이트를 함유하는 매체에서 배양함으로써 유도되었다. 상기 고인슐린 증 조건은 세포를 1000 nM 인슐린을 함유하는 매체에서 배양함으로써 유도되었다. 상기 혈중 산소 감소 조건은 세포를 5% CO2, 2% O2 및 93% 질소를 함유하는 산업용 기체로 흘러 넘치게 할 수 있는 모듈라 배양기 챔버(MIC-101, Billups-Rothenberg Inc. Del Mar, CA) 상에 위치시킴으로써 유도되었다. 각 세포 라인은 또한 0 또는 12.5 mM 젖산으로 처리되었다.
또한, 두 개의 다른 암 세포인 HASMC(세포 시스템 1) 및 HK2 세포(세포 시스템 2) 또는 간 세포(세포 시스템 1) 및 지방 세포(세포시스템 2)사이의 상호 대화 실험이 수행되었으며, 이때 상기 쌍의 세포들은 공생 배양되었다. 이러한 공생 배양 접근 방식은 세포 외 세크리톰(ECS) 실험이라 불린다. 제 1 세포 시스템(예를 들어, HASMC)이 먼저 웰 내의 웰 간 유형 성장 챔버의 삽입기 에 뿌려 졌다. 여섯 개의 웰 플레이트가 보다 나은 통계적 분석을 위해 사용되었다. 삽입기 내의 제 1 세포 시스템을 뿌리는 동안, 상기 삽입기는 별도의 6 개의 웰 플레이트 상에 위치한다. 제 2 세포 시스템(예를 들어, HK2)은 주 트레이에 뿌려 졌다. 제 1 세포 시스템, 및 제 2 세포 시스템을 포함하는 주 트레이를 포함하는 삽입기가 37˚C에서 하루 밤 동안 배양되었다. 각각의 세포 시스템은 각 세포에 특정한 매체 (이때 대체적인 방법으로, 각각의 세포 시스템이 두 세포 유형 모두의 성장을 지지하는 매체에서 성장될 수 있다)에서 성장되었다. 두 번째 날에, 매체 교환에 의한 소정의 처리를 하였다. 특히, 제 1 세포 시스템을 포함하는 삽입기는 제 2 세포 시스템을 포함하는 주 트레이 내에 위치하였다. 이 트레이는 이후 소정의 기간, 예를 들어, 24 시간 또는 48 시간 동안 배양되었다. 복사된 웰이 동일한 조건으로 설정되었으며 세포들을 저장하여 2D 분석을 위한 충분한 물질들이 생산되도록 하였다. 상기 매체(1 ml 부분 표본), 삽입기로부터의 세포 및 주 트레이의 웰로부터의 세포들은 별도의 표본으로 수확되었다. 보다 나은 통계적 분석력을 제공하기 위해 상기 실험은 3회 반복 수행되었다.
상호 대화 실험 또한 “매체 교환(swap)” 실험에 의해 수행되었다. 특히, 제 1 세포 시스템 (PaCa2)으로부터 배양된 매체 또는 “세크리톰”이 상기 기술한 교란 또는 조건을 겪은 후 24시간 또는 48시간 이후에 수집되었으며, 이후 제 2 세포 시스템 (HepG2)에 24-48시간 동안 추가되었다. 제 2 세포 시스템으로부터 최종 배양된 매체 또는 “세크리톰” 이 다시 수집되었다. 모든 최종 세크리톰은 단백질체의 분석을 거쳤다.
상기 언급한 세포들을 포함하는 세포 모델에서, 상기 세포들은 위에 언급한 각 조건에 노출되며, 세포를 코엔자임 Q10로 처리하여 “환경적 교란”에 노출시킴으로써 추가적으로 “조사”된다. 특히, 세포들은 0, 50μM, 또는 100μM에서 코엔자임 Q10로 처리된다.
각각의 조건을 가지며 각각의 코엔자임 Q10 로 처리된 세포 라인에 대해 매체 표본과 더불어 세포 표본이 처리 후 24시간 및 처리 후 48시간를 포함하여 처리 이후에 수 회 수집되었다. 특정한 세포 및 특정 조건하에서, 매체 표본이 또한 수집되고 분석되었다.
정량적 단백질체학에 의한 전체 세포 단백질 발현에서의 변화에 대한 아이프로파일링(iprofiling)이 각 조건, 또 각 “환경적 교란”, 즉, 코엔자임 Q10을 사용한 치료에 대해 각 세포 라인에 대하여 수집된 세포 및 매체 표본에 대해 상기 상세한 설명에서 설명한 기술을 사용하여 수행되었다.
상기 열거된 각 세포 라인에 대해 각 조건 및 각 교란의 존재 하에서 수집된 단백질체학 데이터, 및 각 세포 라인에 대해 각 조건 및 각 교란의 존재 하에서 수집된 생명 에너지론 프로파일링 데이터가 이후 REFS™ 시스템에 의해 처리되었다. Paca2, HepG2, THLE2 및 상호 대화 실험에 대한 미가공 데이터가 다시 표준화된 명명법을 사용하여 조합되었다. 교란된 합성 네트워크가 교란 (CoQ10)에 노출된 하나의 특정한 조건(예를 들어, 고혈당증)에 대해 모든 세포 라인으로부터 획득된 데이터의 결합으로부터 생성되었다. 교란되지 않은 합성 네트워크가 교란에 노출되지 않은(CoQ10가 없는) 동일한 하나의 특정한 조건(예를 들어, 고혈당증)에 대해 모든 세포 라인으로부터 획득된 데이터의 결합으로부터 생성되었다. 마찬가지로, 교란된 합성 네트워크가 교란 (CoQ10)에 노출된 제 2 제어 조건(예를 들어, 정상 혈당 상태)에 대해 모든 세포 라인으로부터 획득된 데이터의 결합으로부터 생성되었다. 교란되지 않은 합성 네트워크가 교란에 노출되지 않은(CoQ10가 없는) 제 2 제어 조건(예를 들어, 정상 혈당 상태)에 대해 모든 세포 라인으로부터 획득된 데이터의 결합으로부터 생성되었다.
시뮬레이션 네트워크를 생성하기 위해 상기 기술된 합치된 합성 네트워크에서의 각 노드들이 상기 상세한 설명에서 상세하게 설명된 REFS™를 사용하여 (10 배 증가시키거나 감소시킴으로써) 모의되었다.
곡선 아래의 넓이 및 시뮬레이션 네트워크 내에서 부모 노드를 자식 노드에 연결하는 각 간선에 대한 배수 변화가 R 프로그램밍 언어를 사용하는 필요에 따라 구축된 프로그램에 의해 추출되며, 이때 상기 R 프로그램밍 언어는 통계적 컴퓨팅 및 그래픽을 위한 오픈 소스 소프트웨어 환경이다.
델타 네트워크가 모의된 합성 네트워크로부터 생성되었다. 코엔자임 Q10 에 반응하는 당뇨/비만/심장병 조건 대 정상 조건의 분별 네트워크(델타-델타 네트워크)를 생성하기 위해, 비교의 단계들이 도 30에 도시된 대로, PERL 프로그램에 의해 작성된 필요에 따라 구축된 프로그램에 의해 수행되었다.
특히, 도 30에서 보인 바와 같이, 치료 T1 은 코엔자임 Q10 치료를 말하며 NG와 HG는 조건으로서 정상 및 고혈당증을 말한다. NG in the NG∩HG 델타 네트워크로부터의 고유한 간선들은 HG∩HGT1 델타 네트워크 내의 HGT1의 고유한 간선들과 비교되었다. NG와 HGT1의 교집합 내의 간선들은 T1에 의해 NG로 회복된 HG이다. T1에 의해 NG로 회복된 HG의 간선들은 NG∩HG 델타 네트워크 상에 중첩되었다(도 31에서 진한 색의 원으로 도시됨)
특히, 시뮬레이션된 정상 혈당(NG) 조건의 복합 맵과 시뮬레이션된 고혈당(HG) 조건의 복합 맵이 정상 혈당 조건의 고유한 간선들을 생성하기 위해 필요에 따라 제작된 Perl 프로그램을 사용하여 비교되었다. 코엔자임 Q10 치료(HG)가 없는 시뮬레이션된 고혈당(HG) 조건의 복합 맵과 코엔자임 Q10 치료(HG)가 있는 시뮬레이션된 고혈당 조건의 복합 맵이 코엔자임 Q10 치료(HGT1)에 의한 고혈당 조건의 고유한 간선들을 생성하기 위해 필요에 따라 제작된 Perl 프로그램을 사용하여 비교되었다. 정상 혈당 조건(NG)으로부터의 고유한 간선들과 코엔자임 Q10 치료가 행해진 고혈당증 조건으로부터의 고유한 간선들의 교집합 내의 간선들이 Perl 프로그램에 의해 식별되었다. 이 간선들은 코엔자임 Q10 치료에 의해 고혈당증 조건으로부터 정상 혈당 조건으로 회복된 요소/네트워크를 나타낸다. 코엔자임 Q10 치료에 의해 정상 혈당 조건으로 회복된 고혈당 간선들의 델타-델타 네트워크가 정상 혈당 ∩ 고혈당 델타 네트워크 상에 중첩되었다. 중첩된 네트워크의 표본이 도 31에 도시된다. 도 31은 코엔자임 Q10(델타-델타 네트워크)에 반응하는 예시적인 당뇨/비만/심장병 조건 대 정상 조건의 분별 네트워크이다. 도 31에서 진한 색의 원은 코엔자임 Q10 치료에 의해 고혈당증 조건으로부터 정상 혈당 조건으로 회복된 것으로 식별된 간선들이다. 도 31에서 옅은 색의 원은 고유한 정상 혈당으로 식별된 간선이다.
PERL 및 R 프로그램으로부터의 출력은 델타-델타 네트워크의 시각적 표현을 위한 오픈 소스 프로그램인 사이토스케이프(Cytoscape)로 입력된다.
고혈당증 대 정상 혈당 조건에 대해 상기 설명한 실험과 마찬가지로, 코엔자임 Q10에 의한 치료가 없는 치료고지혈증 조건의 시뮬레이션된 복합 네트워크(상기 기술된 당뇨/비만/심장혈관 관계 세포로부터의 데이터를 결합)와 코엔자임 Q10에 의한 치료가 행해진 고지혈증 조건의 시뮬레이션된 복합 네트워크(상기 기술된 당뇨/비만/심장혈관 관계 세포로부터의 데이터를 결합)가 코엔자임 Q10 치료에 의한 고지혈증 조건의 고유한 간선들을 생성하기 위해 Perl 프로그램을 사용하여 비교되었다. 정상 지질 조건으로부터의 고유한 간선들과 코엔자임 Q10 치료가 행해진 고지질 조건으로부터의 고유한 간선들의 교집합 내의 간선들이 Perl 프로그램에 의해 식별되었다. 이 간선들은 코엔자임 Q10 치료에 의해 고지혈증 조건으로부터 정상 지질 조건으로 회복된 요소/네트워크를 나타낸다. 코엔자임 Q10 치료에 의해 정상 지질 조건으로 회복된 고지혈증 간선들의 델타-델타 네트워크가 정상 지질 ∩ 고지혈증 델타 네트워크 상에 중첩되었다. 중첩된 네트워크의 표본이 도 32에 도시된다. 도 32에서 진한 색의 원은 코엔자임 Q10 치료에 의해 고지혈증 조건으로부터 정상 지질 조건으로 회복된 것으로 식별된 간선들이다. 도 32에서 옅은 색의 원은 고유한 정상 지질 로 식별된 간선이다. FASN이 고지혈증에서 정상 지질 조건으로의 회복에 대한 코엔자임 Q10의 효과를 조절하는 신호 전달 경로의 중요한 요소로서 식별되었다.
FASN과 같은 지방산 합성 효소는 비만, 인슐린 저항성 또는 지질 대사 장애와 같은 인간의 대사적 변이의 거의 모든 측면에 관계되어 왔다. FASN 금지 인자는 분자의 메커니즘은 알려져 있지 않지만, 비만의 치료를 위한 주요 분자로 제안되었다(몹스(Mobbs) 외, 2002). 세룰레닌 및 합성 화합물 C75- FASN 금지 인자가 음식 섭취를 줄이는 효과가 있고 체중 감소를 일으키는 것으로 밝혀 졌다(로퍼스(Loftus) 외, 2000).
도 32에서 보인 바와 같이, FASN이 본 명세서에서 기술된 플랫폼 기술에 의해 코엔자임 Q10의 당뇨 상태에서 정상적 상태로 회복시키는 효과를 조절하는 신호 경로 상에서의 중요한 요소로서 식별된다는 사실은 본 델타-델타 네트워크의 정확성을 증명하는 것이다. 따라서, 본 델타-델타 네트워크에서 식별된 다른 신규의 요소들이 잠재적 치료적 요소 또는 추가적인 조사를 위한 약제 타겟이 될 수 있을 것이다.
예 4: 약제로 유도되는 심장 독성의 모델을 구축하기 위한 플랫폼 기술의 채택
본 예에서는, 필요에 따라 구축된 심장 독성 모델로부터 얻어진 데이터를 통합하고, 약의 발병/ 독성을 추진시키는 신규의 단백질/경로를 식별하기 위해 상세한 설명에서 상세히 설명한 플랫폼 기술이 채택되었다. 이러한 분석의 결과로 얻어지는 관계적 맵은 독성 생물학적 표지 인자를 제공하였다.
건강한 심장에서 수축 기능은 지방산 및 탄수화물 산화의 균형에 따라 달라진다. 만성 섭취 불균형, 사용, 기관의 생물 발생 및 비지방질 조직(심장 및 간)에서의 분비가 미토콘드리아의 손상 및 기능 장애의 핵심에 있으며, 약제로 유도되는 심장 독성에 주요 역할을 하는 것으로 생각된다. 여기서 출원인들은 특히 세포 생명 에너지론 및 미토콘드리아의 막 기능을 살펴 보기 위해 단백질 및 지질 서명을 기능적 종단점 분석과 결합하는 시스템적 접근 방식을 기술한다. 과도 지방산 및 고혈당증에 의해 보완되는 당뇨성 및 정상 심장근 세포를 포함하는 생체 외 모델이 독성의 서명 및 잠재적 메커니즘을 생성하기 위해 일단의 약제들로 처리되었다. 출원인들은 다음 열거된 단계를 포함하여 여러 수준에서 에너지 대사 성분을 교란시킴으로써 미토콘드리아를 불안정하게 하는 약제의 다양한 효과를 예증하였다: (i) 미토콘드리아의 에너지 대사 유전자의 발현을 제어하는 전사적 네트워크의 조절의 장애; (ii) 당뇨성 심장근 세포 내 GPAT1 와 타파진의 유도 및 이에 의한 데노보 인산지질 합성 의 개시와 미토콘드리아 막에서의 리모델링; 및 (iii) 섭취, 지방산 산화 및 ATP 합성에 영향을 미치는 당뇨성 심장근 세포 내 지방산 운명의 변화. 또한, 출원인들은 수중 실험실 생물학 및 AI 기반 데이터 마이닝 플랫폼의 파워를 결합하여 베이지안(Bayesian) 모델에 기반한 인과 네트워크를 생성하였다. 정상 세포 기능의 손실과 인과적 관계를 가지는 단백질 및 지질의 네트워크가 세포보호 메커니즘으로부터 약제 유도 독성의 메커니즘을 알아내기 위해 사용되었다. 이러한 신규의 접근 방식은 변경된 표현형을 교정하는 보다 안전한 치료제의 개발을 가능케 하는 한편으로, 독성의 메커니즘을 이해하기 위한 강력한 새로운 도구로 작용할 것이다
인간 심장근 세포를 생체 내 질병 관련 세포가 경험하는 당뇨성 환경을 모의하는 조건을 겪게 하였다. 특히, 상기 세포는 고혈당 조건 및 고지혈증 조건에 노출되었다. 고혈당 조건은 세포를 22 mM 글루코스를 함유하는 매체에서 배양함으로써 유도되었다. 고지혈증 조건은 세포를 1mM L-카르니틴, 0.7mM 올레산 및 0.7mM 리놀레산을 함유하는 매체에서 배양함으로써 유도되었다.
상기 언급한 세포들을 포함하는 세포 모델에서, 상기 세포들은 위에 언급한 각 조건에 노출되며, 세포를 심장 독성을 야기하는 것으로 알려진 당뇨 치료제(T)와 구조 분자 (R). 또는 당뇨 치료제와 구조 분자 모두(T+R)로 처리하여 환경적 교란에 노출시킴으로써 추가적으로 “조사”된다. 특히, 상기 세포는 당뇨 치료제로 처리되거나; 구조 분자 코엔자임 Q10으로 0, 50μM 또는 100μM에서 처리되거나; 당뇨 치료제와 구조 분자 코엔자임 Q10 모두로 처리되었다.
각각의 조건에서 각각 교란 처리된 세포 라인에 대해 세포 표본이 처리 후 6시간를 포함하여 처리 이후에 수 회 수집되었다. 특정 조건을 위해 매체 표본이 또한 수집되고 분석되었다.
정량적 단백질체학에 의한 전체 세포 단백질 발현 에서의 변화에 대한 아이프로파일링이 각 조건에 대해 각 “환경적 교란”, 즉, 당뇨 치료제 치료, 코엔자임 Q10 치료 또는 두 치료 모두를 가하여 수집된 세포 및 매체 표본에 대해 상세한 설명에서 기술된 기술을 사용하여 수행된다. 전사적 프로파일링 실험이 바이오래드(Biorad) cfx-384 증폭 시스템을 사용하여 수행되었다. 데이터 수집(Ct)에 이어, 제어 표본에 대한 최종 배수 변화가 δCt 방법을 사용하여 제조사의 프로토콜에서 제시된 대로 수행되었다. 리피도믹스 실험이 질량 분광학을 사용하여 수행되었다. 산소 소모율(OCR)과 같은 기능적 분석이 시호스(Seahorse) 분석기를 ??택하여 기본적으로 제조사가 권장하는 방식으로 수행되었다. OCR은 전극에 의해 시호스(Seahorse) 배양 플레이트에 밀어 넣어지는 카트리지로 생성된 7 μl 챔버에 기록되었다.
도 35에서 보인 바와 같이, 당뇨성 심장근 세포(고혈당 및 고지혈증 조건을 겪은 심장근 세포) 내에서 인간 미토콘드리아의 에너지 대사 유전자의 전사 네트워크 및 발현이 교란된 치료와 교란되지 않은 치료 사이에서 비교되었다. 특히, 전사적 네트워크 및 인간 미토콘드리아의 에너지 대사 유전자의 발현 데이터가 당뇨 치료제로 처리된 당뇨성 심장근 세포(T) 및 처리되지 않은 당뇨성 심장근 세포 표본(UT) 사이에서 비교되었다. 전사적 네트워크 및 인간 미토콘드리아의 에너지 대사 유전자 발현 데이터가 당뇨 치료제와 구조 분자 코엔자임 Q10 모두로 처리된 당뇨성 심장근 세포(T+R)와 처리되지 않은 당뇨성 심장근 세포 표본(UT) 사이에서 비교되었다. 처리되지 않은 당뇨성 심장근 세포로부터의 데이터를 비교한 결과, 당뇨성 심장근 세포가 당뇨 치료제로 처리되었을 때 특정한 유전자 발현 및 전사가 변화되었다. 구조 분자 코엔자임 Q10은 당뇨 치료제의 독성 효과를 역전시키고 유전자 발현 및 전사를 정규화하는 것으로 예시되었다.
도 36A에서 보인 바와 같이, 심장근 세포가 정상 혈당(NG) 또는 고 혈당(HG) 조건 중 하나에서 배양되고 당뇨 치료제 단독으로(T) 또는 당뇨 치료제와 구조 분자 코엔자임 Q10 모두(T+R)로 처리되었다. 각 조건 및 각 치료에 대한 GPAT1과 TAZ의 단백질 발현 수준이 서부 블로팅으로 검사되었다. GPAT1 과 TAZ 모두 고혈당증 조건을 겪고 당뇨 치료제로 처리된 심장근 세포에서 상향 조절되었다. 고혈당증 조건을 겪은 심장근 세포가 당뇨 치료제와 구조 분자 코엔자임 Q10 모두로 처리되었을 때, GPAT1 과 TAZ의 상향 조절된 단백질 발현 수준이 정규화되었다.
도 37A에서 보인 바와 같이, 미토콘드리아의 산소 소모율(%) 실험이 고혈당증 조건을 겪은 심장근 세포 표본에 대해 수행되었다. 고혈당증 조건을 겪은 심장근 세포는 처리되지 않거나(UT), 심장 독성을 야기하는 것으로 알려진 당뇨 치료제 T1으로 처리되거나, 심장 독성을 야기하는 것으로 알려진 당뇨 치료제 T2로 처리되거나, 당뇨 치료제 T1 및 구조 분자 코엔자임 Q10 모두(T1+R)로 처리되거나, 당뇨 치료제 T2와 구조 분자 코엔자임 Q10 모두(T2+R)로 처리되었다. 처리되지 않은 제어 표본와 비교한 결과, 고혈당증 조건을 겪은 심장근 세포가 당뇨 치료제 T1 또는 T2로 처리되었을 때 미토콘드리아의 OCR이 감소하였다. 그러나, 고혈당증 조건을 겪은 심장근 세포가 당뇨 치료제 및 구조 분자 코엔자임 Q10 모두(T1 + R, 또는 T2 + R)로 처리되었을 때는 미토콘드리아의 OCR이 정상화되었다.
도 37B에서 보인 바와 같이, 미토콘드리아 ATP 합성 실험이 고혈당증 조건을 겪은 심장근 세포 표본에 대해 수행되었다. 고혈당증 조건을 겪은 심장근 세포가 처리되지 않거나(UT), 당뇨 치료제로 처리되거나(T), 또는 당뇨 치료제 및 구조 분자 코엔자임 Q10 모두(T+R)로 처리되었다. 처리되지 않은 제어 표본와 비교한 결과, 고혈당증 조건을 겪은 심장근 세포가 당뇨 치료제(T)로 처리되었을 때 미토콘드리아의 ATP 합성이 억제되었다.
도 38에서 보인 바와 같이, 수집된 단백질체 데이터를 기반으로, 약제 치료에 의해 하향 조절된 단백질이 GO 항으로 주석되었다. 고혈당증 조건을 겪은 심장근 세포가 심장 독성을 야기하는 것으로 알려진 당뇨 치료제로 처리되었을 때, 미토콘드리아의 에너지 대사에 관련된 단백질이 하향 조절되었다.
각 조건에서 각 교란을 가하여 수집된 단백질체학, 리피도믹스, 전사적 프로파일링, 기능적 분석, 및 서부 블로팅 데이터가 REFS™ 시스템에 의해 처리되었다. 복합 교란 네트워크가 각 교란 (예를 들어, 당뇨 치료제, CoQ10, 또는 둘 모두)에 노출된 특정한 조건 (예를 들어, 고혈당증, 또는 고지혈증)으로부터 획득된 데이터의 결합으로부터 생성되었다. 교란되지 않은 복합 네트워크가 동일한 하나의 특정 조건(예를 들어, 고혈당증, 또는 고지혈증)에서 교란없이(비교란) 획득된 데이터의 결합으로부터 생성되었다. 마찬가지로, 교란된 복합 네트워크가 제 2 제어 조건(예를 들어, 정상 혈당 상태)에서 각 교란(예를 들어, 당뇨 치료제, CoQ10, 또는 둘 모두)에 노출되어 획득된 데이터의 결합으로부터 생성되었다. 교란되지 않은 복합 네트워크가 동일한 제 2 제어 조건(예를 들어, 정상 혈당 상태)에서 교란없이(비교란) 획득된 데이터의 결합으로부터 생성되었다.
시뮬레이션 네트워크를 생성하기 위해 상기 기술된 합치된 합성 네트워크 내의 각 노드가 (10 배 증가 또는 감소시킴으로써) 상기 상세한 설명에서 상세히 설명된 대로 REFS™을 사용하여 모의되었다.
시뮬레이션 네트워크 내에서 부모 노드를 자식 노드에 연결하는 곡선 아래 면적과 배수 변화가 R 프로그래밍 언어를 사용하는 필요에 따라 구축된 프로그램에 의해 추출되었으며, 이때 상기 R 프로그래밍 언어는 통계적 계산과 그래픽을 위한 오픈 소스 소프트웨어 환경이다.
모의된 합성 네트워크로부터 델타 네트워크가 생성되었다. 당뇨 치료제에 대한 반응으로 약제 유도 독성 조건 대 정상 조건 분별 네트워크(델타 네트워크)를 생성하기 위해, 비교 단계들이 R 프로그래밍 언어를 사용하는 필요에 따라 구축된 프로그램에 의해 도 39에 도시된 대로 수행되었다.
특히, 도 39에서 보인 바와 같이, UT는 고혈당증 조건에서 처리되지 않은 제어 심장근 세포의 단백질 발현 네트워크를 말한다. 치료 T는 고혈당증 조건에서 처리된 심장근 세포의 당뇨 치료제의 단백질 발현 네트워크를 말한다. UT∩T 델타 네트워크에서 T로부터의 고유한 간선이 도 40에 제시된다.
특히, 고혈당증 조건 내 당뇨 치료제로 치료된 심장근 세포의 고유한 간선을 생성하기 위해, 고혈당증 조건 내 처리되지 않은 심장근 세포의 모의된 복합 맵과 고혈당증 조건 내 당뇨 치료제로 처리된 심장근 세포의 모의된 복합 맵이 필요에 따라 제작된 Perl 프로그램을 사용하여 비교되었다. 델타 네트워크의 시각적 표현을 생성하기 위해 PERL 및 R 프로그램으로부터의 출력이 오픈 소스 프로그램인 사이토스코프(Cytoscape)로 입력되었다. 도 40에서 보인 바와 같이, 상기 네트워크는 고혈당증 조건에서의 당뇨 치료제 대 처리되지 않은 심장근 세포/ 심장 독성 모델에 의해 추진된 델타 네트워크를 나타낸다.
도 40에 도시된 약제 유도 독성 조건 대. 정상 조건 분별 네트워크로부터, GRP78, GRP75, TIMP1, PTX3, HSP76, PDIA4, PDIA1, CA2D1와 같은 약제로 유도되는 심장 독성의 생리병리학을 추진하는 단백질이 식별되었다. 이러한 단백질들은 다른 심장 독성 유도 약제를 식별하기 위한 생물학적 표지 인자로서 작용할 수 있다. 이러한 단백질들은 또한 심장 독성을 완화시킬 수 있는 제제를 식별하기 위한 생물학적 표지 인자로서 작용할 수 있다.
본 예에서 설명한 실험은 교란된 막 생물학 및 약제 치료에 노출된 당뇨성 심장근 세포 내 자유 지방산의 운명의 변화가 약제 유도 독성의 핵심을 나타냄을 보여 준다. 데이터 통합 및 네트워크 생물학을 통해 심장 독성에 대한 이해를 증진할 수 있었으며, 심장 독성의 예후를 나타내는 신규의 생물학적 표지 인자를 식별할 수 있었다.
예 5: 효소 활성을 밝히기 위한 다중 단백질체학 모델의 구현을 위한 플랫폼 기술의 채택.
일반적으로, 위의 예 1-4에서 설명된 플랫폼 기술은 생물학적 시스템 또는 질병 과정의 조절 인자를 식별하기 위한 방법을 더 구현하기 위해 적응될 수 있다. 상기 방법은 생물학적 시스템의 특징적 측면을 나타내기 위해생물학적 시스템과 연관된 세포를 사용하여 생물학적 시스템에 대한 모델을 채택한다. 상기 모델은 최소한 세 개의 수준의 데이터, 즉 (i) 생물학적 시스템과 연관된 세포에서의 효소의 전역적 활성을 나타내는 제 1 데이터 집합, (ii) 생물학적 시스템과 연관된 세포에서의 효소 대사 물질 또는 기질 상의 효소의 전역적 활성을 나타내는 제 2 데이터 집합, 및 (iii) 생물학적 시스템과 연관된 세포에서의 단백질체의 전역적 변화를 나타내는 제 3 데이터 집합을 획득하기 위해 사용된다. 상기 데이터는 효소의 전역적 활성, 효소의 전역적 활성의 영향, 및 단백질체의 전역적 변화 사이의 합치 인과 관계 네트워크를 생성하기 위해 사용된다. 상기 합치 인과 관계 네트워크는 프로그래밍된 컴퓨터 장치를 사용하여(즉, 알려진 어떠한 생물학적 관계에도 기반하지 않고) 제 1, 제 2 및 제 3 데이터 집합에만 기반한다. 상기 합치 인과 관계 네트워크는 다시 생물학적 시스템에 고유한 인과 관계를 식별하기 위해 사용되며, 이때 상기 고유한 인과 관계와 연관된 최소한 하나의 유전자 또는 단백질이 생물학적 시스템 또는 질병 과정의 조절 인자로서 식별된다.
본 예에서, 상기 플랫폼 기술은 효소 활성 및 단백질체에 대한 이 활성의 직접적 효과를 측정하기 위한 다중 단백질체학 기술을 구현하기 위해 적응되었으며, 이에 의해, 세포 단백질체 내에서의 전역 변화의 맥락에서, 효소들과 이들의 대사 물질/기질 사이의 인과 관계를 이해하기 위해 사용될 수 있는 시스템을 제공한다. 본 예에서 예증되었듯이, 효소 활성이 효소 발현과 직교할 수 있기 때문에(예를 들어, 하향 조절된 활성과 조절되지 않은 발현), 이러한 기술은 귀중한 통찰을 제공할 수 있다. 이러한 분석의 결과로 얻어지는 관계적 맵은 질병과 연관된 진단적/예후의 표지 인자뿐만 아니라 질병 치료 타겟을 제공할 수 있다. 이러한 타겟 및 표지 인자는 치료적 성분 및 이를 위한 방법을 제공할 수 있다. 모델을 수립하고, 데이터 집합을 획득하며, 합치 인과 관계 네트워크를 생성하고, 생물학적 시스템에 고유한 인과 관계를 식별하기 위한 기술들이 발명의 요약, 상세한 설명, 및 상기 예에서 기술된다. 모델을 수립하고 효소의 전역적 활성 및 효소 대사 물질 또는 기질에 대한 효소의 전역적 활성의 효과를 나타내는 데이터 집합을 획득하기 위한 추가적인 기술들이 이하에서 제공된다.
도 41A는 효소(예를 들어, 키나아제) 활성을 밝히기 위한 다중 단백질체 기술을 채택하는 생물학적 시스템 또는 질병 과정의 조절 인자를 식별하기 위한 방법을 도시한다. 먼저, 본 플랫폼 기술에 따라 세포 라인이 질병을 모의하는 조건을 겪게 되는 모델이 수립되고 환경적 교란(예를 들어, 하기 제공된 간세포 암종들의 특정한 예에서 넥사바(Sorafenib)에 대한 노출)에 노출시킴으로써 조사된다. 제어 표본이 비교를 위해 제공된다. 두 번째로, 효소 활성 및 그 하향 효과가 (i) 효소의 전역적 활성, (ii) 단백질체(예를 들어, 효소 활성의 대사 물질/기질)에 대한 효소 활성의 특정 효과, 및 (iii) 세포 단백질체에 대한 전역 효과를 분석함으로써, 전역 단백질체 변화의 맥락에서 추적된다. 세 번째로, 관심있는 조절 인자를 식별하기 위해 상기 데이터 집합이 본 플랫폼 기술에 따라 분석된다. 예를 들어, 암 모델은 알려진 항암 약제 키나아제 금지 인자에 의해 조사될 수 있으며, 시스템에 대한 이러한 교란 전역 키나아제 활성에 미치는 효과가 인산 단백질체 및 전체 단백질체에 대한 결과적인 효과와 함께 분석될 수 있고, 데이터 집합이 AI 기반 REFS™ 시스템에 의해 분석될 수 있다.
본 예에서, 에파토세포 암종 (HCC)이 본 플랫폼 기술의 예시적 구현을 제공하기 위해 선택되었다. HCC는 전 세계적으로 암 관련 사망의 주요 원인 중 하나이며, 폐 및 위의 암종에 이어 세 번째로 가장 치명적인 암의 위치를 차지하고 있다. 다양한 원인론, 높은 질병률/사망률, 초기 진단을 위한 진단적 표지 인자의 부족 및 HCC의 변동성 높은 임상 과정으로 인해 이의 진단 및 치료가 부진하였다. HCC를 연구한 후 몇 년 뒤에도, HCC 내에서의 분자의 메카니즘 작동에 대한 이해는 불완전하였다. 게놈, 전사체, 및 비교적 단백질체의 프로필이 HCC 재탐구를 위한 어느 정도 중요한 통찰을 제공하였다. 그러나, 많은 연구들이 HCC와 연관된 세포 변화의 단일 측면에만 초점을 맞추고 있어서 생물학적 시스템의 진정한 복잡성과 동적 특성에 대한 이해가 완전히 이루어지지 못했다.
이러한 예시적 예는 (i) 세포 생물학, 및 (ii) 인과적 단백질 네트워크를 생성하는 통합된 단백질체학 플랫폼과 정보학 플랫폼의 파워를 결합하여, 예를 들어, 인산화, 및, 예를 들어, 키나아제와 같이 이러한 메커니즘에 참여하는 효소와 같은 HCC의 생리병리학에서 번역 후 수정의 역할을 구분한다. 특히, 이 접근 방식은 ATP 결합 도메인 농축 탐침 및 HCC 세포 모델 내 전체 단백질의 인산-단백질체 매핑을 채택하는 활성 기반 단백질체학을 통합한다.
병이 진전된 HCC 환자에 대한 첫 번째 라인의 화학 치료용 제제인 다중 키나아제 금지 인자 넥사바(Sorafenib)가 이 치료와 연관된 전역 키나아제 활성 및 단백질 인산화 변화의 역할을 탐침하기 위해 사용되었다. HepG2 (ATCC 접근 번호 HB-8065) 세포 라인이 HCC 세포를 모델링하기 위해 선택되었으며 THLE2 (ATCC 접근 번호 CRL-10149)세포 라인이 모델 정상 간 세포를 모델링하기 위해 선택되었다.
도 41B은 전역 효소(예를 들어, 키나아제) 농축 프로파일링을 위한 방법을 도시한다. 먼저, 타겟이된 효소(예를 들어, 키나아제)를 포함하는 세포 용해물이 준비된다. 제 2 단계는 탐침 결합(예를 들어, 키나아제의 경우에는 ATP 탐침)이다. 이후, 상기 효소는 소화되고 탐침에 결합된 파편들이 포획된다. 이들 파편들은 (예를 들어, LC-MS/MS에 의해) 분석될 수 있으며 이에 따라 해당하는 단백질이 (예를 들어, LC-Ms/MS 데이터의 데이터베이스 탐색을 통해) 식별된다.
THERMO SCIENTIFICⓒ PIERCE® 키나아제 농축 키트 및 ACTIVXⓒ 탐침(사용 지침은 다음 웹 사이트의 THERMO SCIENTIFICⓒ 및 PIERCE® Bio기술에서 볼 수 있다: www.thermoscientific.com/pierce)이 효소의 전역적 활성 분석을 위해 사용되었다. 간단히 말해, 이들 키트들 및 유사한 키트들은 키나아제, 셰프론 및 대사적 효소를 포함하는 ATP 분해 효소의 선택적 라벨링 및 농축을 가능하게 한다. ATP 및 ADP 탐침은 일반적으로 뉴클레오타이드 파생체이며, 이들은 효소의 활성 부위를 뉴클레오타이드-결합 부위 내의 보존된 라이신 잔여부로서 공유 결합적으로 수정한다. 예를 들어, 데스티오비오틴-ATP 및 ?ADP의 구조는 라빌 아크릴-인산염 결합에 의해 뉴클레오타이드에 부착된 수정된 바이오틴으로 구성된다. 효소 활성 부위 내 라이신의 위치에 따라, 데스티오비오틴-ATP 또는 -ADP 중 하나가 라벨링 특유의 ATP 분해 효소로서 뱌람직하다.
데스티오비오틴-ATP 및 -ADP 모두 표본 내 타겟 효소 클라스들을 선택적으로 농축, 식별 또는 프로파일링하거나, 효소 금지 인자의 특정성 및 친화성을 분석할 수있다. 많은 ATP 분해 효소 및 기타 뉴클레오타이드-결합 단백질은 이들이 효소적으로 비활성인 상태에서도 뉴클레오타이드 또는 금지 인자를 결합시킨다; 이러한 반응 제제들은 복잡한 표본 내에서 비활성 및 활성 효소들을 결합시킨다. 표본을 활성 부위 탐침을 위해 경쟁하는 작은 분자 금지 인자로 사전 배양함으로써 결합 친화성 및 타겟 특정성에 대한 금지 인자 결합의 결정에 사용할 수있다.
활성 부위 라벨링에 대한 평가는 서부 블롯 또는 질량 분광학(MS) 중 하나에 의해 성취될 수 있다. 서부 블롯 작업 흐름에 대해 설명하면, 데스티오비오틴으로 라벨링된 단백질이 SDS-PAGE 분석을 위해 농축되고 이어서 특정한 항체로 탐지된다. MS 작업 흐름에 대해 설명하면, 데스티오비오틴으로 라벨링된 단백질이 환원, 알킬화 및 효소전으로 펩티드로 소화된다. 데스티오비오틴으로 라벨링된 활성 부위 펩티드만이 LC-MS/MS에 의한 분석을 위해 농축된다. 두 작업 흐름 모두가 금지 인자 타겟 결합을 결정하기 위해 사용될 수 있으나, MS 작업 흐름만이 전역 금지 인자 타겟 및 비타겟을 식별할 수 있다.
인산 단백질체 분석을 위해 THERMO SCIENTIFICⓒ PIERCE® TiO2 인산펩티드 농축 및 정리키트(지침은THERMO SCIENTIFICⓒ 및 PIERCE® Bio기술 웹사이트에서 볼 수 있다. www.thermoscientific.com/pierce)가 사용되었다. 간단히 말해서, 이들 키트 및 이와 유사한 키트들은 질량 분광학(MS)에 의한 분석에 의해 복합체 및 분할된 단백질 소화물로부터 인산화된 펩티드를 효율적으로 분리할 수 있게 해 준다. 최적화된 버퍼와 결합된 구 형상의 다공성 이산화티타늄(TiO2)은 최소한의 비특정적 결합을 가지는 인산펩티드의 농축과 식별에 대한 개선을 제공한다. 스핀 기둥 양식은 빠르고 쉽게 사용할 수 있으며 300-1000μg의 소화된 단백질 표본으로부터 100μg까지의 인산펩티드를 농축할 수 있다. 상기 키트의 최적화된 프로토콜, 버퍼 성분 및 흑연 스핀 기둥은 결과적으로 MS 분석에 사용할 수 있는 고수율의 깨끗한 인산펩티드 표본을 생산한다.
인산화는 세포 신호 전달, 성장, 분화와 분리, 및 예정된 세포 사멸과 같은 생물학적 기능에 필수적인 단백질 수정 과정이다. 그러나, 인산펩티드는 높은 친수성을 가지고 있고 적은 양으로 존재하며, 결과적으로 크로마토그래피, 이온화 및 파편화가 빈약하다. 따라서, 인산펩티드 농축은 성공적인 MS 분석을 위해 필수적이다. 인산펩티드 농축 및 정리 키트는 인산펩티드 농축 및 식별을 위한 완전한 작업 흐름을 제공하기 위한 용균, 환원, 알킬화, 소화 및 흑연 스핀 기둥에 호환될 수 있다.
비교(comparative) 단백질체학, 인산 단백질체 및 효소 활성 데이터가 AI 기반 REFS™ 정보학 플랫폼으로 통합된다. 특히 기능적 관점에서의 단백질 상호 반응의 인과 네트워크, 즉 키나아제/효소 활성 및 이 키나아제의 잠재적 타겟이 인산화되고 생성될 수 있다. 또한, 세포의 기능적 판독을 사용하여, 타겟의 인산화를 조절하고 병리생리학적 세포 거동을 기계적으로 추진하는 효소/ 키나아제가 결정된다. 본 명세서에서 개략적으로 설명된 예시적 구현을 통해 세포 반응의 전역적 특성화, 화학적 반응도의 메커니즘에 대한 이해, 및 HCC의 임상적 운영을 위한 잠재적 타겟/생물학적 표지 인자를 쉽게 성취할 수 있다.
물질 및 방법
세포들은 다음 프로토콜에 따라 배양되었다. 제 1일: HepG2/Hep3B -3.2x106개의 세포를 T-75 배양 플라스크 내에; 7.4x106개의 세포를 T-175 배양 플라스크 내에; 또는 9.5x106개의 세포를 T-225 배양 플라스크 내에 뿌린다. THLE-2 - 1.3x106개의 세포를 T-75 배양플라스크 내에 뿌린다. 제 2일: 16-24시간 후에, 50-70% 융합에서 - 치료를 가한다. 제어: 0.01%의 최종 농도에서 DMSO. EGF: 10 mM 아세트 산 내 500 ng/mL. 넥사바(Sorafenib): DMSO 내 0.1% 부피에서 1 μM. 제 3일: 치료 후 24시간 이후, 세포들을 트립신화에 의해 수확한다. 펠릿을 동결 이전에 PBS로 2회 세척한다.
전반적 효소 활성 분석은 다음 프로토콜에 따라 수행되었다.
세포 용균:
신선하게 준비된 용균 버퍼 -5 M 요소, 50 mM 트리-HCL pH 8.4, 0.1% SDS, 1% 프로테아제 금지 인자 칵테일, 1% 포스타파아제 금지 인자 칵테일
1) 2000 g에서 5 분간 원심분리하고 상층액을 제거한 1.5-2 mL 에펜도르프 마이크로 튜브 내의 펠릿 세포.
2) 세포를 PBS 내의 재현탁 펠릿으로 세척한다. 세척을 한 번 더 반복한다.
3) 적절한 양의 용균 버퍼를 각 표본 및 보텍스에 첨가한다.
4) 주기적으로 혼합하면서 얼음 위에서 10분간 배양한다.
5) 용균이 완전해 질 때까지 각 표본을 초음파 처리한다.
6) 최고 속도로 15분 간 원심 분리한다
7) 용해물(상층액)을 새로운 튜브로 옮긴다.
용균 버퍼-교환:
피어스(Pierce) 사의 사전에 제작된 반응 버퍼를 사용.
반응 버퍼 - 20 mM HEPES pH 7.4, 150 mM NaCl, 0.1% TritonX-100
1) 제바(Zeba) 스핀 제염 기둥의 바닥 마감부를 비틀어 뚜껑을 느슨하게 한다.
2) 15 mL 콘 모양 튜브 내에 넣는다.
3) 기둥을 실온의 1000 g에서 2분 간 원심분리하여 저장 용액을 제거한다.
4) 3 mL의 반응 버퍼를 기둥에 추가한다. 1000 g에서 2분 간 원심분리하여 버퍼를 제거한다. 이 과정을 2회 더 반복하고, 버퍼를 제거한다.
a. 최종 세척 후에 과잉 버퍼가 있는 경우, 추가적으로 1000 g에서 2-3분간 원심분리한다.
5) 기둥을 새로운 콘 모양 튜브로 옮긴다.
6) 전체 표본을 수지 베드의 중앙에 천천히 가한다.
7) 1000 g에서 2분 간 원심분리하여 표본을 수집한다. 기둥을 제거한다.
8) 1:100 프로테아제/포스타파아제 금지 인자 칵테일을 표본에 추가하고 얼음 상에 위치시킨다.
a. 표본은 냉동고에서 -80 ℃로 냉동될 수 있다.
중단 포인트
탐침을 사용한 표본 라벨링:
사전 제작된 피어스(Pierce) 제 1 M MgCl2을 사용하였음.
신선한 1 M MnCl2를 제조.
1) 브래드포드(Bradford) 분석을 사용하여 단백질 농도를 결정한다.
2) 용해물을 물을 사용하여 가능하면 2 mg/mL(2 μg/μL)로 희석한다.
3) 2 mg을 새로운 마이크로 원심분리 튜브로 옮긴다.
4) 20 μL의 1 M MgCl2을 각 표본에 추가하고, 혼합한 후, 실온에서 1분 간 배양한다.
주: 최종 농도는 0.02 M MgCl2이다.
5) 10 μL의 1 M MgCl2을 각 표본에 추가하고, 혼합한 후, 실온에서 1분 간 배양한다.
주: 최종 농도는 10 mM MgCl2 이다.
6) ATP/ADP 반응 제제를 실온에서 건조제로 평형을 맞춘다. 나머지를 -80℃에서 보관한다.
7) 20 μM 반응에 대해 -10 μL의 초순수 물을 반응 제제에 추가하여 1 mM 재고 용액을 제조한다.
8) 20 μL의 ATP/ADP 스톡을 각 표본에 추가하고, 혼합한 후, 실온에서 1시간 동안 배양한다.
라벨링된 단백질 환원 및 알킬화:
신선한 10 M 요소/50 mM 트리-HCL pH 8.4를 준비한다.
1) 1 mL의 10 M 요소/50 mM 트리-HCL을 각 반응에 첨가한다.
2) 100 μL of 200 mM TCEP 을 각 반응에 첨가한다. 55 ℃에서 1시간 동안 배양한다.
3) 100 μL의 375 mM 이오도 아세타마이드를 각 표본에 첨가한다. 실온에서 30분 간 어둠 속에서 배양한다.
버퍼 교환:
신선한 소화 버퍼를 준비한다 - 2 M 요소, 200 mM 트리-HCL pH 8.4
1) 제바(Zeba) 스핀 제염 기둥의 바닥 밀폐부를 비틀어 뚜껑을 느슨하게 한다.
2) 15 mL 콘 모양 튜브를 삽입한다.
3) 기둥을 실온의 1000 g에서 2분간 원심분리하여 저장 용액을 제거한다.
4) 3 mL의 소화 버퍼를 기둥에 추가한다. 1000 g에서 2분간 원심분리하여 버퍼를 제거한다. 이 과정을 2회 더 반복하고, 버퍼를 제거한다.
a. 마지막 세척 후 과잉 버퍼가 있는 경우 추가적으로 1000 g에서 2-3분간 원심분리한다.
5) 기둥을 새로운 콘 형 튜브로 옮긴다.
6) 전체 표본을 수지 베드의 중앙에 천천히 가한다.
7) 1000 g에서 2분간 원심분리하여 표본을 수집한다. 기둥을 제거한다.
라벨링된 단백질 소화:
1) 트립신을 1:50 비율(트립신: 단백질)로 첨가한다.
2) 37℃에서 흔들면서 하루밤 배양한다.
라벨링된 펩티드 포획 및 용출:
신선한 용출 버퍼(50% ACN; 0.1% 포름산)를 준비한다.
1) 50 μL의 슬러리를 소화된 각 표본에 첨가한다. 실온에서 1.5시간 동안 일정한 혼합으로 배양한다.
2) 표본을 피어스(Pierce) 스핀 기둥으로 옮긴다. 1000 g에서 1분간 원심분리한다. 통과된 유량을 수집하고 저장한다.
3) 각 세척에 대해 1000 g에서 1분 간:
a. 수지를 500 μL의 4 M 요소/50 mM 트리-HCl pH 8.4로 3회 세척한다.
b. 수지를 500 μL의 PBS로 4회 세척한다.
c. 수지를 500 μL의 물로 4회 세척한다.
4) 펩티드를 75 μL의 용출 버퍼로 녹여 분리하고 3 분 간 배양한다. 이 과정을 2회 더 반복하여, 분리된 부분을 결합한다.
5) 표본을 진공 농축기 내에서 감압 하에 동결 건조한다.
LCMSMS 분석을 위한 무 라벨, 1-D 분리
1) 표본이 감압 동결 건조에 의해 건조되면, 각 표본을 25 μL의 0.1% 포름산에서 재현탁한다.
2) LCMSMS 을 위해 10 μL을 유리병으로 옮긴다.
iTRAQ 라벨링
1) 남아 있는 15 μL 표본이 완전히 건조되었다.
2) 표본을 30 μL의 200 mM TEAB 내에서 재현탁한다.
3) 15 μL의 표본이 30 μL의 iTRAQ 반응 제제로 라벨링되었고 실온에서 2시간 동안 배양되었다.
a. 표본 당 6 μL이 QCP를 위해 풀로 보관되었다.
4) 라벨링 이후, 8 μL의 5% 히드록사민이 냉각을 위해 4℃에서 15분 간 추가되었다.
5) 모든 MP가 풀에 함께 저장된 후, 건조, 제염되고20 μL의 0.1% 포름산 내에서 재현탁되었다.
엑시겐트(Eksigent)/LTQ 오비트랩(오비트랩) 기구가 문제를 일으켜서 MP가 건조되고 18 μL의 20 mM 암모늄 포름산염 내에서 재현탁되었다.
표본 당 왼쪽(leftvovers):
200 mM TEAB 내 9 μL의 분리물 -80℃
기구 상 20 mM암모늄 포름산염 내 MP
인산 단백질 분석이 다음 프로토콜에 따라 수행되었다.
표본 준비 프로토콜:
1. 세포 용균
a. 용균 버퍼 - 5 M 요소, 50 mM 트리-HCL, 0.1% SDS, 1% 프로테아제 금지 인자 칵테일, 1% 포스타파아제 금지 인자 칵테일
b. 펠릿을 적절한 양의 용균 버퍼에 현탁시킨다.
c. 얼음 상에서 와류시켜 10 분간 배양한다. 반복한다.
d. 얼음 상에서 초음파를 쪼이고 10 분간 배양한다.
e. 최고 속도로 15분간 원심분리한다.
f. 용해물이 여전히 점성이 있고 끈적거릴 때는 초음파를 다시 쪼여 준다.
g. 용해물을 새로운 튜브로 옮긴다.
2. 단백질 농도를 결정하기 위한 브래드포드(Bradford) 분석을 수행한다.
3. 700 μg의 단백질(THLE-2에 대한 400 μg)을 45 μL의 200 mM TEAB로 새로운 마이크로튜브로 옮긴다.
4. 5 μL TCEP 에서 200 mM TCEP로 환원되었다: 55℃ 에서 1시간, 100 μL 부피.
5. 5 μL 요오드에서 375 mM 요오드 아세타마이드로 알킬화한다: 실온에서 100 μL 부피, 어둠에서 30 분간.
6. 7배 부피 에서 아세톤 침착 -20℃에서 하루밤 동안.
7. 단백질을 50 μg/μL의 200 mM TEAB내에서 재현탁. 1:40 (트립신:단백질) 비율로 37℃에서 하루밤 동안 트립신으로 소화
기둥을 준비하는 동안, 펩티드 표본을 150 μL의 버퍼 B에 재현탁시킨다.
기둥 준비:
1. 원심분리 기둥 어댑터를 수집 튜브 내에 위치시키고 TiO2 스핀 팁을 어댑터에 삽입한다.
2. 20 μL의 버퍼 A를 추가한다. 3000 g에서 2분간 원심분리한다. FT를 제거한다.
3. 20 μL의 버퍼 B를 추가한다. 3000 g에서 2분간 원심분리한다. FT를 제거한다.
인산펩티드 결합:
1. 스핀 팁을 깨끗한 마이크로튜브로 옮긴다.
2. 현탁된 표본을 스핀 팁에 가한다. 1000 g에서 10분간 원심분리한다.
3. 표본을 스핀 팁에 다시 가하고 1000 g에서 10분간 원심분리한다. FT를 저장한다.
4. 스핀 팁을 새로운 마이크로튜브로 옮긴다.
5. 20 μL의 버퍼 B를 추가하여 기둥을 세척한다. 3000 g에서 2분간 원심분리한다.
6. 20 μL의 버퍼 A를 추가하여 기둥을 세척한다. 3000 g에서 2분간 원심분리한다. 이 과정을 한번 더 반복한다.
용출:
1. 스핀 팁을 새로운 수집 튜브에 위치시킨다. 50 μL의 용출 버퍼 1을 추가한다. 1000 g에서 5분간 원심분리한다.
2. 동일한 수집 튜브를 사용하여, 50 μL의 용출 버퍼 2를 스핀 팁에 추가한다. 1000 g에서 5분간 원심분리한다.
3. 100 μL의 2.5% 포름산을 첨가하여 용출 부분을 산화시킨다.
인산펩티드의 흑연에 의한 정리
**이는 LC/MS/MS 분석 이전의 최종 정리이므로 TFA를 포름산과 교체한다.
기둥 준비:
1. 흑연 스핀 기둥의 상단 및 하단 덮개를 제거한다. 기둥을 1.5 mL의 마이크로튜브 내에 놓는다. 2000 g에서 1분간 원심분리하여 저장 버퍼를 제거한다.
2. 100 μL의 1 M NH4OH를 첨가한다. 2000 g에서 1분간 원심분리한다. FT를 제거한다. 이 과정을 한번 더 반복한다.
3. 100 μL의 아세토니트릴을 첨가하여 흑연을 활성화시킨다. 2000 g에서 1분간 원심분리한다. FT를 제거한다.
4. 100 μL의 1% 포름산을 첨가한다. 2000 g에서 1분간 원심분리한다. FT를 제거한다. 이 과정을 한번 더 반복한다.
표본 결합 및 용출:
용출 = 0.1% FA + 50% ACN
1. 기둥을 새로운 수집 튜브에 넣는다. 표본 수지 베드의 상단에 가한다. 10분간 주기적으로 휘저어 혼합시키면서 결합이 되도록 한다.
2. 1000 g에서 3분간 원심분리한다. FT를 제거한다.
3. 기둥을 새로운 수집 튜브에 위치시킨다. 200 μL의 1% FA를 가하여 기둥을 세척한다. 2000 g에서 1분간 원심분리한다. FT를 제거한다. 이 과정을 한 번 더 반복한다.
4. 기둥을 새로운 수집 튜브에 위치시킨다. 100 μL의 0.1% FA/50% CAN을 가하여 표본을 녹여 분리한다. 2000 g에서 1분간 원심분리한다. 400 μL의 완전한 용출을 위해 이 과정을 3회 더 반복한다.
5. 표본을 진공 증발기(SpeedVac) 내에서 건조시킨다.
HepG2 및 Hep3B:
700 μg의 단백질로 시작한다
TiO2 농축 및 흑연 정리 후, 인산펩티드가 400 μL의 0.1% 포름산/50% CAN에서 용해되어 분리된다.
(400/700)* 비율의 400 μL 부분 표본이 용해 분리물로부터 취해져서 완전히 건조된다. 이는 20 μL의 200 mM TEAB에서 iTRAQ 라벨링을 위해 재현탁된다.
라벨링 이후, 표본은 제염, 건조, 및 20 μL의 0.1% 포름산에서 재현탁된다.
남아 있는 부분 표본은 완전히 건조되고 20 μL의 0.1% 포름산 내에서 재현탁된다.
10 μL가 라벨 없는 LCMSMS 분석을 위한 유리병으로 이송된다.
THLE-2:
400 μg의 단백질만이 수확된다.
모든 단백질이 TiO2 기둥으로 농축되며 흑연 기둥으로 세척된다.
용해 분리물이 건조되고, 20 μL의 200 mM TEAB에서 iTRAQ 라벨링을 위해 재현탁된다.
라벨링 이후, 표본은 제염, 건조, 및 20 μL의 0.1% 포름산에서 재현탁된다.
표본 상에서의 왼쪽:
iTRAQ 표본 - 20 mM 암모늄 포름산염 내 기구 상
라벨링 없는 HepG2/Hep3B - 0.1% 포름산 내 10 μL, -80℃; 기구 상의 0.1% 포름산 내 10 μL
결과
도 42는 ENO1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 ENO1 발현에 대해서는 그렇지 않다. 도 43은 PGK1 활성에서의 상당한 감소를 도시하지만 넥사바(Sorafenib)로 처리한 HepG2에서의 PGK1 단백질 발현에 대해서는 그렇지 않다. 도 44는 넥사바(Sorafenib)로 처리한 HepG2에서 LDHA 활성의 상당한 감소를 도시한다. 각 경우에 있어서, ENO1 발현은 QC 표본에 대해 상대적인 단위로 측정되며 ENO1 활성 변화는 제어된 비처리 표본에 대해 상대적인 단위로 측정된다.
도 42-44에서의 데이터는 HCC 질병 모델 내의 ENO1, LDHA, 및 PGK1에 대해 넥사바(Sorafenib)를 사용한 세포의 치료 결과, 단백질의 효소 활성의 하향 조절을 수반하면서 단백질 발현의 상향 조절이 일어남을 보여 준다. 따라서, 상기 인산 단백질체는 키나아제 활성 및 전체 세포 단백질에 대한 세포외 신호(예를 들어, 약 분자) 사이의 복잡한 관계를 밝히기 위해 사용될 수 있는 추가적인 레이어의 정보를 부여하며, 이를 통해 질병과 연관된 진단적/예후의 표지 인자뿐만 아니라 질병 치료 타겟의 식별을 용이하게 할 수 있다.
도 45는 AI 기반 REFS™ 시스템을 사용하여 결과적인 데이터 집합을 분석함으로써 생산될 수 있는 인과적 분자의 상호 반응 네트워크를 예시한다(왼쪽 프레임 참조). 상기 네트워크는, 예를 들어, 정상 및 암 세포(각각 중앙 및 오른 쪽 프레임 참조)에서 분별적으로 조절된 관심 대상 네트워크를 식별하기 위해 사용될 수 있다. 이러한 정보는 HCC와 연관된 진단적/예후의 표지 인자뿐만 아니라 HCC 치료 타겟을 제공하기 위해 사용될 수 있다.
도 46-51은 종양 형성 시스템의 이차원 화학적 조사 및 서명의 다중-체학적 통합이 어떻게 암의 생리병리학에 관련된 신규의 신호 전달 경로를 밝혀 주며, 이에 의해 어떻게 치료적 타겟, 관련된 생물학적 표지 인자, 및/또는 치료제를 식별하는지를 도시한다. 특히, 도 46-51은 도 41 및 본 명세서에서 기술된 여러 방법에 따라 보여진 일반적인 방법론의 구현을 예시한다. 도 41에서 보인 바와 같이, 상기 접근 방식은 생체 외 암 및 제어 모델이 일차원에서 키나아제 금지 인자 (넥사바(Sorafenib))에 의해 조사되는 “이차원적 화학적 조사”에 의해 보강된다. 키나아제 활성에서의 전체적 변화는 활성 기반 키나아제 농축 탐침을 채택하는 이차원 화학적 조사에 의해 포획되었다. 키나아제는 LC-MS에 의해 식별되었다. 또한, 키나아제 금지 인자에 대한 반응으로서의 인산 단백질체에서의 변화는 인산 단백질 농축 방법 및 뒤이은 단백질의 식별을 위한 LC-MS를 사용하여 식별되었다. 최종적으로, 전체 단백질 발현에서의 정량적 변화가 획득되었다. 결과적으로 얻어진 다중-체학 데이터는 AI 기반 정보학을 사용하여 통합되었으며, 데이터에 의해 추진되며 “정상” 모델에서는 작동하지 않으나 암 모델에서는 작동하는 단백질의 인산화를 추진하는 분별 키나아제 활성을 나타내는 인과 네트워크의 생성으로 귀결되었다. 이러한 보완 분석의 통합은 도 46 및 47의 추정된 경로에서 도시되었다. 상기 기술은 결과적으로 신규의 키나아제 및 암의 생리병리학에 기계적으로 관련된 관계에 대한 발견을 가져 온다(예를 들어, 도 48-50).
도 46은 베이지안(Bayesian) 네트워크 추정 알고리즘을 채택하는 다중체적 데이터의 통합이 어떻게 간세포 암종에서의 신호 전달 경로의 이해로 귀결되는지를 예시한다. 노란색 사각형은 전사후 수정(인산) 데이터를 나타내며, 파란색 삼각형은 활성 기반(키나아제) 데이터를, 녹색 원은 단백질체학 데이터를 나타낸다. 도 47은 간세포 암종에서의 신호 전달 경로에서의 자동 조절과 역 피드백 조절이 어떻게 플랫폼에 의해 추정될 수 있는지를 예시한다. 사각형은 PMT(인산) 데이터(회색/어두움 = 키나아제, 노란색/밝음 - 키나아제 활성 없음)를 나타내며, 사각형은 활성 기반(키나아제) + 단백질체학 데이터 (회색/어두움 = 키나아제, 노란색/밝음 - 키나아제 활성 없음)를 나타낸다. 이러한 분석들은 상기 설명되고 도 41에 예시된 세 개의 레이어된 다중-단백질체학 방법론을 사용하여 수행되었다. 이러한 분석들의 결과는 도 48-51에 도시되며 이하에서 자세히 설명된다.
도 48-50은 플랫폼에 의해 추정된 신호 전달 경로에서의 도출된 인과적 연관의 예를 예시한다. 키나아제 이름은 대표적인 사각형과 원으로 나타내어 졌으며, 연결기에 의해 나타나는 인과적 연관을 보여 준다. 도 48은 CLTCL1, MAPK1, NME1, HIST1H2BA, RPS5, TMED4, 및 MAP4 키나아제 동형 단백질의 식별을 보여 주며 이들 사이의 추정된 관계를 나타낸다. 도 49은 HNRPDL, HNRNPK, RAB7A, RPL28, HSPA9, MAP2K2, RPS6, FBL, TCOF1, PGK1, SLTM, TUBB, PGK2, CDK1, MARCKS, HDLBP, 및 GSK3B 키나아제 동형 단백질의식별을 보여 주며 이들 사이의 추정된 관계를 나타낸다. 도 50은 RPS5, TNRCBA, CLTCL1, NME1, MAPK1, RPL17, CAMK2A, NME2, UBE21, CLTCL1, HMGB2, 및 NME2 키나아제 동형 단백질의식별을 보여 주며 이들 사이의 추정된 관계를 나타낸다. 이들 키나아제 동형 단백질은 잠재적 치료적 타겟, 표지 인자, 및 치료제를 제시한다.
도 51은 플랫폼에 의해 도출된 인과적 연관의 예시도이다. 특히, 도 51은 EIF4G1, MAPK1, 및 TOP2A 키나아제 동형 단백질의 식별을 보여 주며 이들 사이의 추정된 관계를 나타낸다. 이 관계는 EIF, MAPK, 및 TOP 키나아제 사이의 공개된 관계에 부합하기 때문에 모델 및 방법에 대한 증명을 제공한다.
결론적으로, 효소(예를 들어, 키나아제)활성 다중체학 기반 분석은 세포 활동의 함수로서 대사 물질과 기질 사이의 하향 인과 관계를 결정하는데 있어 유용한 방법으로 나타난다. 마찬가지로, 치료적 치료에 대한 반응으로서 효소의 전역적 활성에서의 변화를 모니터링하는 활성 기반 단백질체는 단백질(예를 들어, 효소)의 전반적 세포 발현만을 모니터링하는 방법에 비해 세포 신호 전달의 동적 작용에 대한 핵심 통찰력을 제공할 수 있다. 또한, 상기 플랫폼은 신호 전달 경로를 견고하게 추정할 수 있고 종양 형성 대 정상 환경에서의 피드백 조절을 역전시킬 수 있으며, 따라서, 종양 형성 신호 전달 경로에서의 신규의 인과적 연관을 식별할 수 있음이 밝혀 졌다. 이에 따라, 본 기술은 신규의 키나아제 식별과 키나아제 금지 인자의 활동에 대한 메커니즘의 판독을 제공한다.
예 6:
CoQ10
에 의한 신생 혈관 생성 및 조절의 생체 외 모델
서론: 종양 크기가 2-5mm으로 진전되기 위해서는 종양에 산소 및 영양분을 공급하기 위한 신생 혈관 생성의 유도를 필요로 한다. 신생 혈관 생성은 저산소 상태 또는 유전학적 변이에 대한 반응으로 내피의 미토겐 요소의 종양 내 세포 분비로 인해 발생하며, 현재, 예를 들어 VEGF 및 PlGF와 같은 몇 개의 단백질이 치료적 항신생 혈관 생성 타겟으로서 임상적 개발 단계에 있다. 본 명세서에서, 우리는 현재 암 전개의 인간 연구에서 조사되고 있는생체 외 코엔자임 Q10(CoQ10)을 조사하였다.
방법: 혈관 형성 표현형을 조절하는 인간 배꼽의 정맥 내피의 세포(HUVEC) 운명 결정이 100 또는 1500μM CoQ10 또는 부형제의 존재 하에 조사되었으며 처리되지 않은 제어 세포와 비교되었다. 마트리겔(MATRIGEL®) 내의 세포 자살, 증식, 이주 및 3-D 관 형성에 대한 내피의 세포 운명 분석이 수행되었다.
결과: 아넥신 V/요오드화프로피디움 양성 세포에 대한 형태학적 혈구 흐름 계산 분석 결과 부형제 또는 제어 세포와 비교하여 1500μM CoQ10의 존재 하에 HUVEC 세포 자살이 증가함이 밝혀 졌다. CoQ10C로 인한 세포 사멸에 수반하여, HUVEC 세포의 개수가 1500μM CoQ10의 존재 하에서 상당히 감소하였다. 내피의 이주에 대한 CoQ10의 잠재적 효과를 분석하기 위해, HUVEC 이주가 세포 정리 후 5시간 후에 내피의 스크래치 분석에서 조사되었다. CoQ10와 부형제 모두 100 및 1500μM 농도에서 HUVEC 이주를 상당히 저해하였으며, 이는 부형제와 CoQ10 모두에서의 항 이주 활성을 보여 주는 것이다. CoQ10 항종양 활성이 내피의 분출 신생 혈관 생성에 대한 효과로 인한 것인지를 결정하기 위해, 우리는 3-D 마트리겔(MATRIGEL®) 배양에서 시간에 따른 내피의 관 형성을 조사하였다. 겔 및 그 위의 매체 모두에 부형제를 첨가하면 제어 표본에 비해 관 형성이 저해되었다. 또한, 1500μM CoQ10을 첨가하면 부형제 및 제어 표본의 처리되지 않은 세포 모두에 비해 HUVEC 관 형성이 더 저해되었다. 이러한 효과는 산포 후 24 시간 만에 관측되어 배양에서 96 시간까지 지속되었다. 종합적으로 말하면, 이들 연구를 통해 CoQ10의 효과는, 최소한 부분적으로는, 신생 혈관 형성을 위한 국지적 혈액 공급의 종양 모집이 금지된 때문일 가능성이 있다는 것이 밝혀 졌다.
내피의 형태에 대한 CoQ10 의 효과: 인간 배꼽의 정맥 내피 세포(HUVEC 세포)가 CoQ10 농도의 범위에서 24시간 동안 처리되었다. '정상' 세포에 매우 닮은 융합성 세포와 또한 증식 세포의 혈관 형성 표현형을 매우 유사하게 나타내는 하위-융합성 세포에 약제를 가하였다. 융합성 배양에서는, 점점 증가하는 첨가된 CoQ10의 농도로 인해 EC들에 대한 보다 가까운 연관, 길이 증가 및 정렬이 발생하였다. 5000μM의 첨가가 둘러싸는 세포들에 대한 미묘한 증가를 가져 왔다(도 52A). 하위-융합성 내피의 세포의 CoQ10에 대한 반응은 융합성 세포 반응에 대해 다양하게 나타났다(도 52B). 1000μM CoQ10 및 그 이상에서 내피는 외견 상 건강하지 않아 보였다. 증가한 세포 사멸은 CoQ10의 농도가 증가함에 따라 보다 가시화되었다.
CoQ10은 내피의 세포 생존에 분기(divergent) 효과가 있다: HUVEC 세포의 융합성 및 하위 융합성 배양이 100 또는 1500μM CoQ10으로 24시간 동안 처리되고 요오드화프로피디엄 양성 세포 사멸제 세포에 대해 분석되었다. 그 결과는 도 53A 및 53B에 각각 도시되었다. CoQ10 융합에서 처리된 EC를 보호하는 경향이 있으며, 반면에 하위 융합성 세포는 CoQ10에 민감하고 1500μM CoQ10에서 증가하는 세포 자살을 보여 주었다. CoQ10의 농도가 증가함에 따라 세포 자살 수준이 높아지는 것을 보여 주는 하위 융합성 제어 EC(왼쪽), 100μM CoQ10(중앙) 및 1500μM CoQ10(오른쪽)의 대표적인 히스토그램이 도 53C에서 도시된다.
CoQ10 이 내피의 세포의 개수 및 증식을 감소시킨다: HUVEC 세포의 하위 융합성 배양이 100 또는 1500μM CoQ10으로 72시간 동안 처리되고 요오드화프로피디엄 통합 분석(G2/M 위상 DNA를 탐지)을 사용하여 세포의 개수(도 54A) 및 증식(도 54B) 모두에 대해 분석되었다. 높은 농도의 CoQ10는 세포의 개수에서 상당한 감소를 가져 왔으며 EC 증식에 대한 투여량에 의존하는 효과를 보여 주었다. CoQ10의 농도가 증가함에 따라 세포 증식이 낮아지는 것을 보여 주는 세포 사이클의 G2/M 위상 내의 세포에 대한 대표적인 세포 증식 게이팅의 히스토그램이 도시되었다[도 54C, 제어 EC(왼쪽), 100μM CoQ10(중앙) 및 1500μM CoQ10(오른쪽)].
CoQ10 이 내피의 세포 이주를 감소시킴: HUVEC 세포가 "스크래치" 분석을 사용하여 이주에 대해 검사될 수 있도록 융합되어 성장하였다. 100 또는 1500μM CoQ10이 스크래치 시 가해졌으며 정리된 부분의 폐쇄가 48 시간에 걸쳐 모니터링되었다. 100μM CoQ10는 제어 표본에 비해 내피의 폐쇄를 지연시켰다. 0, 12, 24, 및 36 시간에서의 대표적인 영상들이 도 55에 제공된다. 1500μM CoQ10을 48시간까지도 폐쇄가 방지되었다(데이터 미도시).
CoQ10 이 내피의 관 형성을 저해함: 3-D 마트리겔에서 성장하는 내피 세포는 시간이 지남에 따라 관을 형성한다. 100μM 및 1500 μM CoQ10의 관 형성에 대한 분별 효과가 관찰되었다. 저해된 세포에서 세포로의 연관 및 초기 관 구조의 붕괴는 1500 μM CoQ10에서 상당 규모로 일어난다. 흥미롭게도, 1500μM CoQ10의 존재 하에서는 관 형성이 시작되지 않았으나, 이 과정은 48 시간에서 관 성장 및 형성을 저해하였다. 도 56에 도시된 영상은 72시간에 획득되었다.
결과 및 결론:
우리는 CoQ10의 잠재적 신생 혈관 생성 조절 효과를 조사하였다. CoQ10은 인간 고형 종양 연구에서 조사되고 있는 세포 에너지 대사를 조절하는 항암 제제이다.
CoQ10은 적은 양을 투여하면 융합성 내피의 세포를 보호하지만, 반면에 CoQ10를 하위-융합성 세포에 투여하면 세포 자살이 증가하고, 세포의 개수가 감소하며 내피의 증식에 대한 강력한 금지 인자가 된다. 우리는 '정상' 맥관 구조를 보호할 수 있는 융합성 및 하위융합성 세포에 대한 다변적 효과를 증명하였다.
2-D 스크래치 분석에서의 내피의 이주 능력에 대한 기능적 평가를 통해 내피의 이주에 대한 강력한 금지 인자가 밝혀졌다. 시간을 두고 촬영한 사진을 통해 2일의 배양/치료에 걸쳐 정리된 영역을 폐쇄하는데 실패하는 동적인 내피의 '전면'이 밝혀졌다.
내피의 세포를 3-D 마트리겔에서 현탁시킨 결과 시간에 지남에 따른 관 형성이 관찰되었다. 종양 신생 혈관 생성에서 역할을 하는 많은 요소들을 재확인해주는 이러한 양호하게 특성화된 분석을 사용함으로써, 우리는 내피의 관 형성에 대한 CoQ10의 효과를 조사하였다. 100μM CoQ10의 추가는 관 형성에 다소의 효과를 주었으나, 1500μM CoQ10의 추가는 내피의 관 형성이 극적으로 파괴되는 결과를 가져 왔다.
요약하면, 이들 결과들은 내피의 분출, 이주 및 증식에 대한 CoQ10의 영향을 보여 주며, 혈관 형성 내피의 세포 내 세포의 선택적 사멸을 유도하는 것을 나타낸다.
예 7:
융합성
및
하위융합성
HUVEC
세포에서 코엔자임 Q10의
분별적으로
조절된 기능적 반응
융합성 및 하위융합성 조건에서 성장한 HUVEC 세포 내의 세포 증식 및 이주에 대한 CoQ10의 분별적 효과를 예증한 후, HUVEC 세포 상의 생화학적 경로에 대한 CoQ10의 효과가 조사되었다.
CoQ10의 존재 또는 부재 하에서 정상 산소 상태 및 저산소 상태에 대한 HUVEC 세포의 반응이 분석되었다. 특히, HUVEC 세포가 본 명세서에서 기술된 노목식 또는 혈중 산소 감소 조건 하의 융합성 및 융합성 배양에서 성장되었다. 상기 세포는 또한 0, 100, 또는 1500 μM CoQ10에 노출되었다. 산화질소(NO) 및 반응성 산소 종(ROS) 수준이 본 명세서에서 제공된 방법을 사용하여 결정되었다. 도 57에서 보인 바와 같이, HUVEC 세포는 CoQ10 및 저산소 상태에 대한 반응으로서 산화질소(NO) 및 반응성 산소 종(ROS)의 생성에 따라 구분된 투여량을 예시한다.
HUVEC 세포의 생명 에너지론이 여러 농도의 CoQ10의 존재 하에 분석되었다. 특히, HUVEC 세포가 융합성 또는 융합성 조건에서 CoQ10(10, 100, 1500 μM)의 부재 또는 존재 하에 성장되었다. 산소 소모율(OCR), 전체 및 미토콘드리아 모두에서의 ATP 생산, 및 세포외 산화 비율(ECAR)이 시호스(Seahorse) 분석을 사용하여 분석되었다. 하위-융합성 배양에서 성장하는 HUVEC 세포는 도 58A-D에서 보인 바와 같이, 융합성 배양과 비교하여 미토콘드리아의 산소 소모를 제한한다((A) 전체 OCR; (B) 미토콘드리아의 OCR; (C) ATP; (D) ECAR_. 하위-융합성 배양에 CoQ10를 추가하면 융합성 수준 OCR 에 대한 미토콘드리아의 OCR을 역전시킨다(도 58B).
예 8:
항
CoQ10
의 혈관 형성 메커니즘을 밝히기 위한 기능적 단백질체학 및
리피도믹스의
적용
신생 혈관 생성은 종양 세포 성장에 필요한 산소 및 영양분을 제공하여 종양 발전을 가능케 하는 핵심 특징이다. 우리는 현재 조사되고 있는 인간에서의 암 전개에 대한 항종양 약제인 CoQ10의 항혈관 형성 특성을 조사하였다. CoQ10은 '스크래치' 분석에서의 내피의 이주 및 3-D 마트리겔(MATRIGEL®) 관 형성 분석에서의 관 형성을 저해하였다. CoQ10의 추가는 또한 내피의 증식을 저해하며, 이는 G2/M 상 세포 및 증식 세포 핵 항원 (pCNA) 단백질로서 알 수 있다. CoQ10은 카스파제 3의 활성을 유도하고 혈관 형성/증식 내피 세포의 세포 자살을 증가시키며, 반면에 비 증식 융합성 내피의 세포 배양의 세포 사멸은 제어에 비해 감소하였다.
I혈관 형성 증식 내피 세포 및 비증식 내피 세포의 세포 내 단백질체의 프로필을 결정하기 위해, 우리는 단백질체, 지질체, 및 기능적 단백질체의 접근 방식을 사용하였다. 단백질체 및 단발(shotgun) 지질체 분석이 LTQ-오비트랩-벨로스(Velos) 및 Vantage-QqQ 상에서 각각 수행되었다. 채택된 기능적 단백질체학 접근 방식은 비교적 단백질체학에 의한 조합 내의 활성-기반 탐침이다. 키나아제 및 기타 ATP 분해 요소가 특히 효소의 활성 부위와 이들의 자연적 형태에서 반응하는 ATP-결합 도메인 농축 탐침으로 라벨링되었다. 농축은 스트렙타비딘 수지를 사용하여 면역 침강법으로 수행되었다.
인과적 지질/ 단백질/ 기능적 단백질체학 네트워크를 생성하는 통합된 리피도믹스 및 단백질체의 플랫폼 및 AI 기반 베이지안(Bayesian) 정보학 플랫폼을 사용하여, 신생 혈관 생성을 조절하는 신규의 단백질, 지질 및 효소가 식별되었다. CoQ10로 처리된 세포와 정상 및 혈관 형성 내피의 세포와의 비교가 전역 키나아제 활성을 탐구하기 위해 사용되었다. 신생 혈관 생성의 복잡함과 동적 특성을 밝혀 내기 위해 비교학적 단백질체학 및 효소 활성 데이터가 AI 기반 베이지안(Bayesian) 정보학 플랫폼으로 통합되어 기능적 단백질-단백질 상호 반응의 인과 네트워크를 조사하였다. 인과적 상호 반응성 네트워크는 도 59A-C에 도시된다. 특히, 도 59A는 지질, 단백질 및 키나아제의 완전한 다중 체학적 인과적 상호 반응 네트워크이다. 도 59B 단백질 농축 네트워크의 허브를 도시하며, 도 59C는 키나아제, 지질체 및 기능적 종단점 네트워크의 허브를 도시한다. 네트워크 내의 단백질은 원으로 표시되며, 키나아제는 사각형으로, 지질은 다이아몬드로, 기능적 활성 또는 세포 반응은 8각형으로 표시된다. 일부 단백질 및 키나아제 이름이 제공된다. 이러한 플랫폼으로부터의 출력이 알려진 단백질 상호 반응을 확인하였다.
요약하면, 본 발명의 플랫폼 기술을 사용하여, CoQ10의 항혈관 형성 메카니즘 및 증식적 내피 세포의 고유한 특성이 통합된 기능적 단백질체의 분석을 적용하여 효소 활성에서의 전역 변화를 결정함으로써 조사되었다. 조사적 “체학(omic)” 기반 플랫폼은 세포적 지능을 견고히 추정한다. 인과성을 추정하기 위한 데이터 마이닝에 대한 이러한 AI 기반 네트워크 엔지니어링 접근 방식은 결과적으로 작용 가능한 생물학적 지능을 가져 온다. 또한, 상기 발견 플랫폼을 통해 환경적 도전, 대사적 상태의 변화, 및 병리학적 교란을 완화하기 위한 적응적 분자의 생산에 대한 반응으로서의 내피 세포의 생리병리학에 대한 이해를 향상시킬 수 있다.
예 9:
신생 혈관 생성의 모델을
구축하기위한
플랫폼 기술의 채택
본 예에서, 신생 혈관 생성 모델로부터 획득한 데이터를 통합하고, 신생 혈관 생성을 추진하는 신규의 단백질/경로를 식별하기 위해 상기 상세한 설명에서 상세히 설명된 플랫폼 기술이 채택되었다. 이러한 분석의 결과로 생성되는 관계적 맵은 신생 혈관 생성 생물학적 표지 인자를 제공한다.
신생 혈관 생성은 완전히 이해되지 않는 복잡한 일련의 신호 전달 경로들의 결과이다. 신생 혈관 생성은 다수의 병리학적 조건에서 역할을 하며, 이러한 조건은 암을 포함하나 이에 한정되지는 않는다. 특히 세포 생명 에너지론 및 미토콘드리아의 막 기능을 알아 보기 위해, 단백질 및 지질 신호를 기능적 종단점 분석과 결합하는 시스템 접근 방식이 본 명세서에서 제시되었다. 상기 예시한 바와 같이, 하위-융합성 HUVEC 세포가 신생 혈관 생성 상태를 모방하기 위해 사용될 수 있으며, 반면에 융합성 HUVEC 세포는 비혈관 형성, 즉, 정상 상태를 모방하기 위해 사용될 수 있다.
생체 외 모델에서, HUVEC 세포는 신생 혈관 생성의 잠재적 메커니즘의 신호를 창출하고 또 이를 밝히기 위해, 신생 혈관 생성 금지 인자, 예를 들어, CoQ10와 같은 환경적 영향 인자의 존재 또는 부재 하에서, 접촉 금지 조건(예를 들어, 융합성 배양) 또는 접촉 금지가 없는 조건(예를 들어, 하위-융합성 배양, 예를 들어, 약 60% 미만의 융합성, 약 70% 미만의 융합성, 약 80% 미만의 융합성, 약 90% 미만의 융합성; 삼차원적 배양; 또는 세포의 패치가 배양물을 “스크래치”하는 배양)을 겪도록 하였다. 단백질체 및 지질체의 신호는 본 명세서에서 제공된 플랫폼 방법을 사용하여 분석되었다. 신생 혈관 생성의 생물학적 표지 인자가 수중 실험실 방법을 사용하여 추가로 확인되었다. 이러한 접근 방식은 신생 혈관 생성의 메커니즘을 이해하기 위한 강력한 도구를 제공하며, 새로운 혈관 형성 생물학적 표지 인자를 식별하고 신생 혈관 생성을 조절하는 제제를 개발, 검사할 수 있게 해 준다.
인간 배꼽의 정맥 내피의 세포는 생체 내 질병 관련 세포가 경험하는 혈관 형성 환경을 모의하는 조건을 겪게 된다. 특히, 상기 세포는 접촉 금지로 인해 성장이 억제는 조건이나(즉, 정상 세포), 접촉 금지로 인해 배양, 성장이 최소한 부분적으로 억제되지 않는 조건(즉, 혈관 형성 세포) 하에서 성장한다. 설명을 간단하게 하기 위해, 배양, 성장이 최소한 부분적으로 억제되지 않는 조건하에서 성장한 세포를 비융합성 배양이라 부르기로 한다.
상기 언급된 세포를 포함하며 세포가 융합성 또는 비융합성 배양에서 성장하는 상기 세포 모델은 상기 세포를 “환경적 교란”에 노출시키고 신생 혈관 생성을 조절하는 제제, 예를 들어, 신생 혈관 생성을 억제하는 제제로 처리함으로써 추가적으로 “조사”된다. 예를 들어, 상기 세포는 여러 농도, 예를 들어, 하나 또는 그 이상의 0, 50μM, 100μM, 250μM, 500μM, 750μM, 1000μM, 1250μM, 또는 1500μM의 농도에서 코엔자임 Q10으로 처리된다. 본 명세서에서 제공되는 교란은, 예를 들어, 배양을 “스크래칭”하거나 세포를 낮은 밀도에서 하위 배양하는 등의 세포의 기계적 교란을 포함한다.
각각의 교란 치료를 겪은 조건으로부터의 세포 표본이 치료 후, 예를 들어, 치료 이후 6, 12, 18, 24, 36, 48, 60, 72, 84, 96, 108, 또는 120 시간 이후에, 또는 이들 사이의 시간에 수 회 수집되었다. 특정 조건에 대해서, 매체 표본이 수집되어 분석되었다. 표본은 이후 단백질 발현 또는 활성, 유전자 발현, 및 지질 수준의 하나 또는 그 이상의 수준에 대해 분석될 수 있다.
정량적 단백질체학에 의한 전체 세포 단백질 발현에서의 변화에 대한 아이프로파일링이 각 조건 및 각 “환경적 교란”, 즉, 코엔자임 Q10 치료에 대해 수집된 세포 및 매체 표본을 대상으로 상기 상세한 설명에서 설명된 기술을 사용하여 수행되었다. 전사 프로파일링 실험이, 예를 들어, Biorad® CFX-384 증폭 시스템을 사용하여 수행되었다. 데이터 수집(Ct)에 이어, 제어에 대한 최종 배수 변화가, 예를 들어, 제조사의 프로토콜에서 제시되는 δCt 방법을 사용하여 결정되었다. 리피도믹스 실험이 질량 분광학을 사용하여 수행되었다. 산소 소모율(OCR)과 같은 기능적 분석이, 예를 들어, 시호스(Seahorse) 분석기를 채택하여 기본적으로 제조사가 권장하는 방법에 따라 측정되었다. OCR은 시호스(seahorse) 배양 플레이트에 대해 밀어 넣어지는 카트리지에 의해 생성된 7 μl 챔버 내의 전극에 의해 기록될 수 있다.
요약하면, 형태학적, 효소 관련, 및 흐름 혈구 계산 분석을 통해 세포 자살, 이주, 산화질소 및 ROS 생성 및 CoQ10 치료에 대한 반응에서의 생체 에너지 용량에서의 극적인 변화가 밝혀 졌다. 지질체적 분석을 통해 미토콘드리아의 기능 및 세포 밀도를 변화시킴으로써 완화될 수 있는 지질 경로에서의 신규의 변화가 밝혀 졌다. 본 플랫폼 방법을 활용한 단백질체의 통합을 통해 미토콘드리아의 조절을 위한 특성화되지 않은 세포 내 적응 및 신호 전달이 밝혀 졌다. 모두 종합하면, 이들 연구들을 통해 CoQ10가 내피의 이주, 증식, 세포 자살, 산화질소, ROS, 및 단백질/지질 구조를 변화시킨다는 사실이 밝혀 졌다. 신규의 메커니즘이 본 명세서에서 제시되었으며, 여기에서 신생 혈관 형성을 위한 국지적 혈액 공급의 종양 발생을 억제하기 위해 CoQ10의 항종양 활성은 혈관 형성 및 세포 사멸제 요소의 대사적 상호 대화로 인한 것이다. 추가적으로, 단백질체 및 지질체적 적응은 환경적 자극에 반응하는 내피 세포의 생리학적 요건을 지지하는 상호 반응적 네트워크와 연관되었다. 이들 데이터는 조절 장애를 겪은 미토콘드리아의 대사적 제어 요소로 인한 종양 신생 혈관 생성의 선택적 적응에 대한 특징적 통찰을 제공한다.
예 10:
플랫폼 기술을 채택하여 효소 활성을 설명하기 위한 다중 단백질체학 모델의 구현.
일반적으로, 상기 예 5에서 설명된 효소 플랫폼 기술은 신생 혈관 생성과 같은 생물학적 시스템 또는 질병 과정의 조절 인자를 식별하기 위한 방법을 더 구현하기 위해 적응시킬 수 있다. 상기 방법은 신생 혈관 생성의 특징적 측면을 나타내기 위해 신생 혈관 생성과 연관된 세포를 포함하는 신생 혈관 생성을 위한 모델을 채택한다. 상기 모델은 다음과 같은 최소한 세 수준의 데이터를 획득하기 위해 사용된다: 즉 (i) 신생 혈관 생성과 연관된 세포 내에서의 효소의 전역적 활성을 나타내는 제 1 데이터 집합, (ii) 신생 혈관 생성과 연관된 세포 내의 효소 대사 물질 또는 기질에 대한 효소의 전역적 활성의 영향을 나타내는 제 2 데이터 집합, 및 (iii) 신생 혈관 생성과 연관된 세포 내에서의 단백질체의 전역적 변화를 나타내는 제 3 데이터 집합. 지질체, 전사체, 대사체, 및 SNP 데이터와 같은 부가적 데이터 집합. 상기 데이터는 효소의 전역적 활성, 효소의 전역적 활성의 효과, 및 단백질체의 전역적 변화 중에서 합치 인과 관계 네트워크를 생성하기 위해 사용된다. 상기 합치 인과 관계 네트워크는 프로그램된 컴퓨터 장치를 사용하여 제 1, 제 2, 및 제 3 데이터 집합에만 기반한다(즉, 알려진 다른 생물학적 관계에는 기반하지 않는다). 상기 합치 인과 관계 네트워크는 이후 고유한 인과 관계에 연관된 최소한 하나의 유전자 또는 단백질이 신생 혈관 생성의 조절 인자로서 식별되는 신생 혈관 생성에 고유한 인과 관계를 식별하기 위해 사용된다.
본 예에서, 상기 플랫폼 기술은 신생 혈관생성과 관련된 효소 활성 및 단백질체에 대한 이 활성의 직접적 영향을 측정하기 위한 다중 단백질체학 기술을 구현하기 위해 적응되며; 이에 의해, 효소들(예를 들어, 키나아제 및/또는 프로테아제) 및 이들의 대사 물질/기질 사이의 인과 관계를 신생 혈관 생성 중의 세포 단백질체의 전역 변화의 문맥에서 이해하기 위해 사용될 수 있는 시스템을 제공한다. 효소 활성이 효소 발현과 직교하기 때문에(예를 들어, 하향 조절된 활성 및 조절되지 않은 발현), 이러한 기술들은 귀중한 통찰을 제공할 수 있다. 이러한 분석의 결과로 만들어지는 관계적 맵은 신생 혈관 생성과 관련된 진단적/예후의 표지 인자뿐만 아니라 신생 혈관 생성을 조절함으로써 질병 치료 타겟을 제공할 수 있다. 이러한 타겟 및 표지 인자는 치료적 성분 및 방법을 제공할 수 있다. 모델을 수립하고, 데이터 집합을 획득하며, 합치 인과 관계 네트워크를 생성하고, 신생 혈관 생성에 고유한 인과 관계를 식별하기 위한 기술은 상기 발명의 요약, 상세한 설명 및 예에서 설명된다. 모델을 수립하고, 효소의 전역적 활성 및 효소 대사 물질 또는 기질에 대한 효소의 전역적 활성의 효과를 나타내는 데이터 집합을 획득하기 위한 추가적인 기술들은 이하에서 기술된다.
먼저, 본 플랫폼 기술에 따라 모델이 수립되며, 이때, 예를 들어, 세포 라인들이 질병을 모의하는 조건을 겪게 되며 환경적 교란(예를 들어, 신생 혈관 생성의 조절 인자, 예를 들어, CoQ10, 아바스틴, VEGF 금지 인자, 안지오스타틴, 베바씨주마브, HUVEC 세포의 융합도의 변화에 대한 노출)에 대한 노출에 이해 조사된다. 비교를 위한 제어가 제공된다. 두 번 째로, (i) 효소의 전역적 활성, (ii) 단백질체 (예를 들어, 효소 활성의 대사 물질/기질)에 대한 효소의 특별한 효과, 및 (iii) 세포 단백질체의 전역 효과를 분석함으로써 효소 활성 및 그의 하향적 효과가 단백질체의 전역적 변화의 문맥에서 추적된다. 세 번째로, 상기 데이터 집합이 관심 있는 조절 인자를 식별하기 위해 본 플랫폼 기술에 따라 분석된다. 예를 들어, 혈관 형성 모델 신생 혈관 생성의 알려진 조절 인자에 의해 조사되고; 시스템에서 전역 키나아제 활성에 대한 이 교란의 효과가 인산 단백질체 및 전체 단백질체에 대한 결과적인 효과와 더불어 분석되며; 또한 상기 데이터 집합이 AI 기반 REFS™ 시스템에 의해 분석될 수 있다.
예를 들어, 여러 조건 하에서 성장한 HUVEC 세포는 혈관 형성 및 정상(예를 들어, 신생 혈관 비생성) 상태를 모의하기 위해 사용될 수 있다. 신생 혈관 생성은 예를 들어, 임신, 부상 회복 등과 같은 특별한 환경을 제외하고는 성체에서 발생하지 않기 때문에, 이러한 접근 방식으로 식별한 혈관 형성 표지 인자의 존재는 질병 상태, 예를 들어, 암, 류머티스 관절염, 노화 관련 황반 변성, 또는 당뇨성 망막증을 나타내는 표지 인자로서 유용할 수 있다.
본 예시적 예는 (i) 세포 생물학, (ii) 예를 들어, 신생 혈관 생성에서 이러한 메커니즘에 참여하는 인산화 및 효소, 예를 들어, 키나아제와 같이 번역 이후 수정의 역할을 구분하기 위해 인과적 단백질 네트워크를 생성하는 통합된 단백질체학 플랫폼 및 정보학 플랫폼의 능력들을 결합한다. 특히, 이 접근 방식은 신생 혈관 생성 모델 내 ATP 결합 도메인 농축 탐침 및 전체 단백질의 인산-단백질체 매핑을 통합하는 활성 기반 단백질체학을 채택한다.
비교적 단백질체학, 인산 단백질체 및 효소 활성 데이터가 AI 기반 REFS™ 정보학 플랫폼에 통합된다. 기능적 지점 즉 키나아제가 인산화할 수 있는 키나아제/효소 활성 및 잠재적 타겟으로부터의 단백질 상호 반응의 인과 네트워크가 이후 생성된다. 추가적으로, 타겟의 인산화를 조절하고 병리생리학적 세포 거동을 기계적으로 구동하는 세포의 기능적 판독을 이용하여, 효소/ 키나아제가 결정된다. 본 명세서에 개략적으로 설명된 예시적 구현은 신생 혈관 생성의 임상적 관리를 위한 세포 반응, 신생 혈관 생성 메커니즘 및 잠재적 타겟/생물학적 표지 인자에 대한 통찰을 용이하게 한다.
예시적 예로서, 정상 세포 및 혈관 형성 세포를 나타내는 세포가 비교를 위해 선택된다. 본 명세서에서 예시된 바와 같이, HUVEC 세포가 하위-융합성 배양에서 성장하면 신생 혈관 생성의 특성을 보이며, 반면에 융합성 HUVEC 세포는 이를 보이지 않는다. 하위-융합성 배양에서 HUVEC 세포를 CoQ10로 처리하면 본 명세서에서 예시된 바와 같이 HUVEC 세포가 비-신생 혈관 생성 상태로 이동한다. 상기 단백질체학 방법이 제공하는 바와 같이, 효소 활성의 분석 방법은 임의의 조건에서 성장한 HUVEC 세포에 대한 쌍의 분석을 포함할 수 있으며, 선택적으로 제 3 데이터 집합으로부터의 결과를 쌍으로 비교한 결과에 대한 분석을 더 포함할 수 있다.
예시적 실시예로서, 동등한 개수의 HUVEC 세포들이 융합성으로 배양되고 비융합성 배양이 수확되며, 세포들이 예를 들어, 인산펩티드와 같은 관심있는 펩티드의 존재 하에서 농축된다. 신생 혈관 생성과 관련된 효소 활성을 탐지하기 위해 비교적 분석이 예 5와 같이 수행된다.
참조에 의한 통합
본 출원 전체에 걸쳐 인용될 수 있는 모든 인용 참조 문헌(문헌에 의한 참조, 특허, 특허 출원, 본 출원의 출원일에 사용할 수 있는 버전의 젠뱅크(GenBank) 번호, 및 웹사이트를 포함)의 내용은 본 명세서에서 그 전체로서 참조에 의해 그 안에 인용된 참조 문헌을 포함하여 명시적으로 통합된다. 본 발명의 실시는 다르게 기술되지 않는 한, 해당 분야에 잘 알려져 있는 통상적인 단백질 형성 기술을 채택한다.
균등 사항
본 발명은 본 발명의 사상 또는 본질적 특성을 벗어나지 않고 다른 특정 형태로 구현될 수 있다. 따라서 상기 실시예들은 모든 측면에서 본 명세서에서 기술된 발명을 제한하기보다는 예시하는 것으로 간주 되어야 한다. 따라서 본 발명의 범위는 상기 상세한 설명보다는 첨부된 청구항에 의해 이해되어야 하며, 이에 따라 청구항의 의미와 범위 내에서의 모든 변화는 본 명세서에 포함되어 있는 것으로 이해되어야 한다.
부록 A: 관련된 단백질에 대한 아미노산 및
cDNA
염기서열
SEQUENCE LISTING
<110> BERG PHARMA LLC
<120> INTERROGATORY CELL-BASED ASSAYS AND USES THEREOF
<130> 119992-06120
<140> PCT/US2012/054321
<141> 2012-09-07
<150> 61/678,590
<151> 2012-08-01
<150> 61/678,596
<151> 2012-08-01
<150> 61/668,617
<151> 2012-07-06
<150> 61/665,631
<151> 2012-06-28
<150> 61/620,305
<151> 2012-04-04
<150> 61/619,326
<151> 2012-04-02
<160> 156
<170> PatentIn version 3.5
<210> 1
<211> 1411
<212> PRT
<213> Homo sapiens
<400> 1
Met Ala Glu Ala Arg Lys Arg Arg Glu Leu Leu Pro Leu Ile Tyr His
1 5 10 15
His Leu Leu Arg Ala Gly Tyr Val Arg Ala Ala Arg Glu Val Lys Glu
20 25 30
Gln Ser Gly Gln Lys Cys Phe Leu Ala Gln Pro Val Thr Leu Leu Asp
35 40 45
Ile Tyr Thr His Trp Gln Gln Thr Ser Glu Leu Gly Arg Lys Arg Lys
50 55 60
Ala Glu Glu Asp Ala Ala Leu Gln Ala Lys Lys Thr Arg Val Ser Asp
65 70 75 80
Pro Ile Ser Thr Ser Glu Ser Ser Glu Glu Glu Glu Glu Ala Glu Ala
85 90 95
Glu Thr Ala Lys Ala Thr Pro Arg Leu Ala Ser Thr Asn Ser Ser Val
100 105 110
Leu Gly Ala Asp Leu Pro Ser Ser Met Lys Glu Lys Ala Lys Ala Glu
115 120 125
Thr Glu Lys Ala Gly Lys Thr Gly Asn Ser Met Pro His Pro Ala Thr
130 135 140
Gly Lys Thr Val Ala Asn Leu Leu Ser Gly Lys Ser Pro Arg Lys Ser
145 150 155 160
Ala Glu Pro Ser Ala Asn Thr Thr Leu Val Ser Glu Thr Glu Glu Glu
165 170 175
Gly Ser Val Pro Ala Phe Gly Ala Ala Ala Lys Pro Gly Met Val Ser
180 185 190
Ala Gly Gln Ala Asp Ser Ser Ser Glu Asp Thr Ser Ser Ser Ser Asp
195 200 205
Glu Thr Asp Val Glu Val Lys Ala Ser Glu Lys Ile Leu Gln Val Arg
210 215 220
Ala Ala Ser Ala Pro Ala Lys Gly Thr Pro Gly Lys Gly Ala Thr Pro
225 230 235 240
Ala Pro Pro Gly Lys Ala Gly Ala Val Ala Ser Gln Thr Lys Ala Gly
245 250 255
Lys Pro Glu Glu Asp Ser Glu Ser Ser Ser Glu Glu Ser Ser Asp Ser
260 265 270
Glu Glu Glu Thr Pro Ala Ala Lys Ala Leu Leu Gln Ala Lys Ala Ser
275 280 285
Gly Lys Thr Ser Gln Val Gly Ala Ala Ser Ala Pro Ala Lys Glu Ser
290 295 300
Pro Arg Lys Gly Ala Ala Pro Ala Pro Pro Gly Lys Thr Gly Pro Ala
305 310 315 320
Val Ala Lys Ala Gln Ala Gly Lys Arg Glu Glu Asp Ser Gln Ser Ser
325 330 335
Ser Glu Glu Ser Asp Ser Glu Glu Glu Ala Pro Ala Gln Ala Lys Pro
340 345 350
Ser Gly Lys Ala Pro Gln Val Arg Ala Ala Ser Ala Pro Ala Lys Glu
355 360 365
Ser Pro Arg Lys Gly Ala Ala Pro Ala Pro Pro Arg Lys Thr Gly Pro
370 375 380
Ala Ala Ala Gln Val Gln Val Gly Lys Gln Glu Glu Asp Ser Arg Ser
385 390 395 400
Ser Ser Glu Glu Ser Asp Ser Asp Arg Glu Ala Leu Ala Ala Met Asn
405 410 415
Ala Ala Gln Val Lys Pro Leu Gly Lys Ser Pro Gln Val Lys Pro Ala
420 425 430
Ser Thr Met Gly Met Gly Pro Leu Gly Lys Gly Ala Gly Pro Val Pro
435 440 445
Pro Gly Lys Val Gly Pro Ala Thr Pro Ser Ala Gln Val Gly Lys Trp
450 455 460
Glu Glu Asp Ser Glu Ser Ser Ser Glu Glu Ser Ser Asp Ser Ser Asp
465 470 475 480
Gly Glu Val Pro Thr Ala Val Ala Pro Ala Gln Glu Lys Ser Leu Gly
485 490 495
Asn Ile Leu Gln Ala Lys Pro Thr Ser Ser Pro Ala Lys Gly Pro Pro
500 505 510
Gln Lys Ala Gly Pro Val Ala Val Gln Val Lys Ala Glu Lys Pro Met
515 520 525
Asp Asn Ser Glu Ser Ser Glu Glu Ser Ser Asp Ser Ala Asp Ser Glu
530 535 540
Glu Ala Pro Ala Ala Met Thr Ala Ala Gln Ala Lys Pro Ala Leu Lys
545 550 555 560
Ile Pro Gln Thr Lys Ala Cys Pro Lys Lys Thr Asn Thr Thr Ala Ser
565 570 575
Ala Lys Val Ala Pro Val Arg Val Gly Thr Gln Ala Pro Arg Lys Ala
580 585 590
Gly Thr Ala Thr Ser Pro Ala Gly Ser Ser Pro Ala Val Ala Gly Gly
595 600 605
Thr Gln Arg Pro Ala Glu Asp Ser Ser Ser Ser Glu Glu Ser Asp Ser
610 615 620
Glu Glu Glu Lys Thr Gly Leu Ala Val Thr Val Gly Gln Ala Lys Ser
625 630 635 640
Val Gly Lys Gly Leu Gln Val Lys Ala Ala Ser Val Pro Val Lys Gly
645 650 655
Ser Leu Gly Gln Gly Thr Ala Pro Val Leu Pro Gly Lys Thr Gly Pro
660 665 670
Thr Val Thr Gln Val Lys Ala Glu Lys Gln Glu Asp Ser Glu Ser Ser
675 680 685
Glu Glu Glu Ser Asp Ser Glu Glu Ala Ala Ala Ser Pro Ala Gln Val
690 695 700
Lys Thr Ser Val Lys Lys Thr Gln Ala Lys Ala Asn Pro Ala Ala Ala
705 710 715 720
Arg Ala Pro Ser Ala Lys Gly Thr Ile Ser Ala Pro Gly Lys Val Val
725 730 735
Thr Ala Ala Ala Gln Ala Lys Gln Arg Ser Pro Ser Lys Val Lys Pro
740 745 750
Pro Val Arg Asn Pro Gln Asn Ser Thr Val Leu Ala Arg Gly Pro Ala
755 760 765
Ser Val Pro Ser Val Gly Lys Ala Val Ala Thr Ala Ala Gln Ala Gln
770 775 780
Thr Gly Pro Glu Glu Asp Ser Gly Ser Ser Glu Glu Glu Ser Asp Ser
785 790 795 800
Glu Glu Glu Ala Glu Thr Leu Ala Gln Val Lys Pro Ser Gly Lys Thr
805 810 815
His Gln Ile Arg Ala Ala Leu Ala Pro Ala Lys Glu Ser Pro Arg Lys
820 825 830
Gly Ala Ala Pro Thr Pro Pro Gly Lys Thr Gly Pro Ser Ala Ala Gln
835 840 845
Ala Gly Lys Gln Asp Asp Ser Gly Ser Ser Ser Glu Glu Ser Asp Ser
850 855 860
Asp Gly Glu Ala Pro Ala Ala Val Thr Ser Ala Gln Val Ile Lys Pro
865 870 875 880
Pro Leu Ile Phe Val Asp Pro Asn Arg Ser Pro Ala Gly Pro Ala Ala
885 890 895
Thr Pro Ala Gln Ala Gln Ala Ala Ser Thr Pro Arg Lys Ala Arg Ala
900 905 910
Ser Glu Ser Thr Ala Arg Ser Ser Ser Ser Glu Ser Glu Asp Glu Asp
915 920 925
Val Ile Pro Ala Thr Gln Cys Leu Thr Pro Gly Ile Arg Thr Asn Val
930 935 940
Val Thr Met Pro Thr Ala His Pro Arg Ile Ala Pro Lys Ala Ser Met
945 950 955 960
Ala Gly Ala Ser Ser Ser Lys Glu Ser Ser Arg Ile Ser Asp Gly Lys
965 970 975
Lys Gln Glu Gly Pro Ala Thr Gln Val Ser Lys Lys Asn Pro Ala Ser
980 985 990
Leu Pro Leu Thr Gln Ala Ala Leu Lys Val Leu Ala Gln Lys Ala Ser
995 1000 1005
Glu Ala Gln Pro Pro Val Ala Arg Thr Gln Pro Ser Ser Gly Val
1010 1015 1020
Asp Ser Ala Val Gly Thr Leu Pro Ala Thr Ser Pro Gln Ser Thr
1025 1030 1035
Ser Val Gln Ala Lys Gly Thr Asn Lys Leu Arg Lys Pro Lys Leu
1040 1045 1050
Pro Glu Val Gln Gln Ala Thr Lys Ala Pro Glu Ser Ser Asp Asp
1055 1060 1065
Ser Glu Asp Ser Ser Asp Ser Ser Ser Gly Ser Glu Glu Asp Gly
1070 1075 1080
Glu Gly Pro Gln Gly Ala Lys Ser Ala His Thr Leu Gly Pro Thr
1085 1090 1095
Pro Ser Arg Thr Glu Thr Leu Val Glu Glu Thr Ala Ala Glu Ser
1100 1105 1110
Ser Glu Asp Asp Val Val Ala Pro Ser Gln Ser Leu Leu Ser Gly
1115 1120 1125
Tyr Met Thr Pro Gly Leu Thr Pro Ala Asn Ser Gln Ala Ser Lys
1130 1135 1140
Ala Thr Pro Lys Leu Asp Ser Ser Pro Ser Val Ser Ser Thr Leu
1145 1150 1155
Ala Ala Lys Asp Asp Pro Asp Gly Lys Gln Glu Ala Lys Pro Gln
1160 1165 1170
Gln Ala Ala Gly Met Leu Ser Pro Lys Thr Gly Gly Lys Glu Ala
1175 1180 1185
Ala Ser Gly Thr Thr Pro Gln Lys Ser Arg Lys Pro Lys Lys Gly
1190 1195 1200
Ala Gly Asn Pro Gln Ala Ser Thr Leu Ala Leu Gln Ser Asn Ile
1205 1210 1215
Thr Gln Cys Leu Leu Gly Gln Pro Trp Pro Leu Asn Glu Ala Gln
1220 1225 1230
Val Gln Ala Ser Val Val Lys Val Leu Thr Glu Leu Leu Glu Gln
1235 1240 1245
Glu Arg Lys Lys Val Val Asp Thr Thr Lys Glu Ser Ser Arg Lys
1250 1255 1260
Gly Trp Glu Ser Arg Lys Arg Lys Leu Ser Gly Asp Gln Pro Ala
1265 1270 1275
Ala Arg Thr Pro Arg Ser Lys Lys Lys Lys Lys Leu Gly Ala Gly
1280 1285 1290
Glu Gly Gly Glu Ala Ser Val Ser Pro Glu Lys Thr Ser Thr Thr
1295 1300 1305
Ser Lys Gly Lys Ala Lys Arg Asp Lys Ala Ser Gly Asp Val Lys
1310 1315 1320
Glu Lys Lys Gly Lys Gly Ser Leu Gly Ser Gln Gly Ala Lys Asp
1325 1330 1335
Glu Pro Glu Glu Glu Leu Gln Lys Gly Met Gly Thr Val Glu Gly
1340 1345 1350
Gly Asp Gln Ser Asn Pro Lys Ser Lys Lys Glu Lys Lys Lys Ser
1355 1360 1365
Asp Lys Arg Lys Lys Asp Lys Glu Lys Lys Glu Lys Lys Lys Lys
1370 1375 1380
Ala Lys Lys Ala Ser Thr Lys Asp Ser Glu Ser Pro Ser Gln Lys
1385 1390 1395
Lys Lys Lys Lys Lys Lys Lys Thr Ala Glu Gln Thr Val
1400 1405 1410
<210> 2
<211> 4882
<212> DNA
<213> Homo sapiens
<400> 2
gaaagaggag ccggaagtgt ggcgcgcgag gtctaagggc gcgagggaag tggcgggcgg 60
ggactaaggc ggggcgtgca ggtagccggc cggccggggg tcgcgggtat ggccgaggcc 120
aggaagcggc gggagctact tcccctgatc taccaccatc tgctgcgggc tggctatgtg 180
cgtgcggcgc gggaagtgaa ggagcagagc ggccagaagt gtttcctggc tcagcccgta 240
acccttctgg acatctatac acactggcaa caaacctcag agcttggtcg gaagcggaag 300
gcagaggaag atgcggcact gcaagctaag aaaacccgtg tgtcagaccc catcagcacc 360
tcggagagct cggaagagga ggaagaagca gaagccgaaa ccgccaaagc caccccaaga 420
ctagcatcta ccaactcctc agtcctgggg gcggacttgc catcaagcat gaaagaaaaa 480
gccaaggcag agacagagaa agctggcaag actgggaatt ccatgccaca ccctgccact 540
gggaagacgg tggccaacct tctttctggg aagtctccca ggaagtcagc agagccctca 600
gcaaatacta cgttggtctc agaaactgag gaggagggca gcgtcccggc ctttggagct 660
gctgccaagc ctgggatggt gtcagcgggc caggccgaca gctccagcga ggacacctcc 720
agctccagtg atgagacaga cgtggaggta aaggcctctg aaaaaattct ccaggtcaga 780
gctgcctcag cccctgccaa ggggacccct gggaaagggg ctaccccagc accccctggg 840
aaggcagggg ctgtagcctc ccagaccaag gcagggaagc cagaggagga ctcagagagc 900
agcagcgagg agtcatctga cagtgaggag gagacgccag ctgccaaggc cctgcttcag 960
gcgaaggcct caggaaaaac ctctcaggtc ggagctgcct cagcccctgc caaggagtcc 1020
cccaggaaag gagctgcccc agcgccccct gggaagacag ggcctgcagt tgccaaggcc 1080
caggcgggga agcgggagga ggactcgcag agcagcagcg aggaatcgga cagtgaggag 1140
gaggcgcctg ctcaggcgaa gccttcaggg aaggcccccc aggtcagagc cgcctcggcc 1200
cctgccaagg agtcccccag gaaaggggct gccccagcac ctcctaggaa aacagggcct 1260
gcagccgccc aggtccaggt ggggaagcag gaggaggact caagaagcag cagcgaggag 1320
tcagacagtg acagagaggc actggcagcc atgaatgcag ctcaggtgaa gcccttgggg 1380
aaaagccccc aggtgaaacc tgcctctacc atgggcatgg ggcccttggg gaaaggcgcc 1440
ggcccagtgc cacccgggaa ggtggggcct gcaaccccct cagcccaggt ggggaagtgg 1500
gaggaggact cagagagcag tagtgaggag tcatcagaca gcagtgatgg agaggtgccc 1560
acagctgtgg ccccggctca ggaaaagtcc ttggggaaca tcctccaggc caaacccacc 1620
tccagtcctg ccaaggggcc ccctcagaag gcagggcctg tagccgtcca ggtcaaggct 1680
gaaaagccca tggacaactc ggagagcagc gaggagtcat cggacagtgc ggacagtgag 1740
gaggcaccag cagccatgac tgcagctcag gcaaaaccag ctctgaaaat tcctcagacc 1800
aaggcctgcc caaagaaaac caataccact gcatctgcca aggtcgcccc tgtgcgagtg 1860
ggcacccaag ccccccggaa agcaggaact gcgacttctc cagcaggctc atccccagct 1920
gtggctgggg gcacccagag accagcagag gattcttcaa gcagtgagga atcagatagt 1980
gaggaagaga agacaggtct tgcagtaacc gtgggacagg caaagtctgt ggggaaaggc 2040
ctccaggtga aagcagcctc agtgcctgtc aaggggtcct tggggcaagg gactgctcca 2100
gtactccctg ggaagacggg gcctacagtc acccaggtga aagctgaaaa gcaggaagac 2160
tctgagagca gtgaggagga atcagacagt gaggaagcag ctgcatctcc agcacaggtg 2220
aaaacctcag taaagaaaac ccaggccaaa gccaacccag ctgccgccag agcaccttca 2280
gcaaaaggga caatttcagc ccctggaaaa gttgtcactg cagctgctca agccaagcag 2340
aggtctccat ccaaggtgaa gccaccagtg agaaaccccc agaacagtac cgtcttggcg 2400
aggggcccag catctgtgcc atctgtgggg aaggccgtgg ctacagcagc tcaggcccag 2460
acagggccag aggaggactc agggagcagt gaggaggagt cagacagtga ggaggaggcg 2520
gagacgctgg ctcaggtgaa gccttcaggg aagacccacc agatcagagc tgccttggct 2580
cctgccaagg agtcccccag gaaaggggct gccccaacac ctcctgggaa gacagggcct 2640
tcggctgccc aggcagggaa gcaggatgac tcagggagca gcagcgagga atcagacagt 2700
gatggggagg caccggcagc tgtgacctct gcccaggtga ttaaaccccc tctgattttt 2760
gtcgacccta atcgtagtcc agctggccca gctgctacac ccgcacaagc ccaggctgca 2820
agcaccccga ggaaggcccg agcctcggag agcacagcca ggagctcctc ctccgagagc 2880
gaggatgagg acgtgatccc cgctacacag tgcttgactc ctggcatcag aaccaatgtg 2940
gtgaccatgc ccactgccca cccaagaata gcccccaaag ccagcatggc tggggccagc 3000
agcagcaagg agtccagtcg gatatcagat ggcaagaaac aggagggacc agccactcag 3060
gtgtcaaaga agaacccagc ttccctccca ctgacccagg ctgccctgaa ggtcctcgcc 3120
cagaaagcca gtgaggctca gcctcctgtt gccaggaccc agccttcaag tggggttgac 3180
agtgctgtgg gaacactccc tgcaacaagt ccccagagca cctccgtcca ggccaaaggg 3240
accaacaagc tcagaaaacc taagcttcct gaggtccagc aggccaccaa agcccctgag 3300
agctcagatg acagtgagga cagcagcgac agttcttcag ggagtgagga agatggtgaa 3360
gggccccagg gggccaagtc agcccacacg ctgggtccca ccccctccag gacagagacc 3420
ctggtggagg agaccgcagc agagtccagc gaggatgatg tggtggcgcc atcccagtct 3480
ctcctctcag gttatatgac ccctggacta accccagcca attcccaggc ctcaaaagcc 3540
actcccaagc tagactccag cccctcagtt tcctctactc tggccgccaa agatgaccca 3600
gatggcaagc aggaggcaaa gccccaacag gcagcaggca tgttgtcccc taaaacaggt 3660
ggaaaagagg ctgcttcagg caccacacct cagaagtccc ggaagcccaa gaaaggggct 3720
gggaaccccc aagcctcaac cctggcgctg caaagcaaca tcacccagtg cctcctgggc 3780
caaccctggc ccctgaatga ggcccaggtg caggcctcag tggtgaaggt cctgactgag 3840
ctgctggaac aggaaagaaa gaaggtggtg gacaccacca aggagagcag caggaagggc 3900
tgggagagcc gcaagcggaa gctatcggga gaccagccag ctgccaggac ccccaggagc 3960
aagaagaaga agaagctggg ggccggggaa ggtggggagg cctctgtttc cccagaaaag 4020
acctccacga cttccaaggg gaaagcaaag agagacaaag caagtggtga tgtcaaggag 4080
aagaaaggga aggggtctct tggctcccaa ggggccaagg acgagccaga agaggagctt 4140
cagaagggga tggggacggt tgaaggtgga gatcaaagca acccaaagag caagaaggag 4200
aagaagaaat ccgacaagag aaaaaaagac aaagaaaaaa aagaaaagaa gaagaaagca 4260
aaaaaggcct caaccaaaga ttctgagtca ccgtcccaga agaaaaagaa gaaaaagaag 4320
aagacagcag agcagactgt atgacgagca ccagcaccag gcacagggat ttcctagccg 4380
agcagtggcc atccccatgc ctctgacctc caccgacctc tgcccaccat gggttggaac 4440
taaactgtta ccttccctcg ctccacagaa gaagacagcc agcttcaggg gtccctgtgc 4500
tggccaagcc agtgagcctg cggggaggct ggtccaagga gaaagtggac cagctcccat 4560
gacctcaccc cactccccca acacaggacg cttcatatag atgtgtacag tatatgtatt 4620
tttttaagtg acctcctctc cttccacaga ccccacatgc ccaaaggcct cgggacttcc 4680
caccaccttg ctccacagat ccagctaggc ctgacctgtg cctcatcccg tgccgctcgg 4740
tctctggctg atcccgaggc tttgtcttcc tctcgtcagt tcttttggtt gtgttttttg 4800
tttttttttt aataactcaa aaaaaaaata aaagacttgg aggaagggtg caagctccca 4860
gtgcaaaaaa aaaaaaaaaa aa 4882
<210> 3
<211> 1531
<212> PRT
<213> Homo sapiens
<400> 3
Met Glu Val Ser Pro Leu Gln Pro Val Asn Glu Asn Met Gln Val Asn
1 5 10 15
Lys Ile Lys Lys Asn Glu Asp Ala Lys Lys Arg Leu Ser Val Glu Arg
20 25 30
Ile Tyr Gln Lys Lys Thr Gln Leu Glu His Ile Leu Leu Arg Pro Asp
35 40 45
Thr Tyr Ile Gly Ser Val Glu Leu Val Thr Gln Gln Met Trp Val Tyr
50 55 60
Asp Glu Asp Val Gly Ile Asn Tyr Arg Glu Val Thr Phe Val Pro Gly
65 70 75 80
Leu Tyr Lys Ile Phe Asp Glu Ile Leu Val Asn Ala Ala Asp Asn Lys
85 90 95
Gln Arg Asp Pro Lys Met Ser Cys Ile Arg Val Thr Ile Asp Pro Glu
100 105 110
Asn Asn Leu Ile Ser Ile Trp Asn Asn Gly Lys Gly Ile Pro Val Val
115 120 125
Glu His Lys Val Glu Lys Met Tyr Val Pro Ala Leu Ile Phe Gly Gln
130 135 140
Leu Leu Thr Ser Ser Asn Tyr Asp Asp Asp Glu Lys Lys Val Thr Gly
145 150 155 160
Gly Arg Asn Gly Tyr Gly Ala Lys Leu Cys Asn Ile Phe Ser Thr Lys
165 170 175
Phe Thr Val Glu Thr Ala Ser Arg Glu Tyr Lys Lys Met Phe Lys Gln
180 185 190
Thr Trp Met Asp Asn Met Gly Arg Ala Gly Glu Met Glu Leu Lys Pro
195 200 205
Phe Asn Gly Glu Asp Tyr Thr Cys Ile Thr Phe Gln Pro Asp Leu Ser
210 215 220
Lys Phe Lys Met Gln Ser Leu Asp Lys Asp Ile Val Ala Leu Met Val
225 230 235 240
Arg Arg Ala Tyr Asp Ile Ala Gly Ser Thr Lys Asp Val Lys Val Phe
245 250 255
Leu Asn Gly Asn Lys Leu Pro Val Lys Gly Phe Arg Ser Tyr Val Asp
260 265 270
Met Tyr Leu Lys Asp Lys Leu Asp Glu Thr Gly Asn Ser Leu Lys Val
275 280 285
Ile His Glu Gln Val Asn His Arg Trp Glu Val Cys Leu Thr Met Ser
290 295 300
Glu Lys Gly Phe Gln Gln Ile Ser Phe Val Asn Ser Ile Ala Thr Ser
305 310 315 320
Lys Gly Gly Arg His Val Asp Tyr Val Ala Asp Gln Ile Val Thr Lys
325 330 335
Leu Val Asp Val Val Lys Lys Lys Asn Lys Gly Gly Val Ala Val Lys
340 345 350
Ala His Gln Val Lys Asn His Met Trp Ile Phe Val Asn Ala Leu Ile
355 360 365
Glu Asn Pro Thr Phe Asp Ser Gln Thr Lys Glu Asn Met Thr Leu Gln
370 375 380
Pro Lys Ser Phe Gly Ser Thr Cys Gln Leu Ser Glu Lys Phe Ile Lys
385 390 395 400
Ala Ala Ile Gly Cys Gly Ile Val Glu Ser Ile Leu Asn Trp Val Lys
405 410 415
Phe Lys Ala Gln Val Gln Leu Asn Lys Lys Cys Ser Ala Val Lys His
420 425 430
Asn Arg Ile Lys Gly Ile Pro Lys Leu Asp Asp Ala Asn Asp Ala Gly
435 440 445
Gly Arg Asn Ser Thr Glu Cys Thr Leu Ile Leu Thr Glu Gly Asp Ser
450 455 460
Ala Lys Thr Leu Ala Val Ser Gly Leu Gly Val Val Gly Arg Asp Lys
465 470 475 480
Tyr Gly Val Phe Pro Leu Arg Gly Lys Ile Leu Asn Val Arg Glu Ala
485 490 495
Ser His Lys Gln Ile Met Glu Asn Ala Glu Ile Asn Asn Ile Ile Lys
500 505 510
Ile Val Gly Leu Gln Tyr Lys Lys Asn Tyr Glu Asp Glu Asp Ser Leu
515 520 525
Lys Thr Leu Arg Tyr Gly Lys Ile Met Ile Met Thr Asp Gln Asp Gln
530 535 540
Asp Gly Ser His Ile Lys Gly Leu Leu Ile Asn Phe Ile His His Asn
545 550 555 560
Trp Pro Ser Leu Leu Arg His Arg Phe Leu Glu Glu Phe Ile Thr Pro
565 570 575
Ile Val Lys Val Ser Lys Asn Lys Gln Glu Met Ala Phe Tyr Ser Leu
580 585 590
Pro Glu Phe Glu Glu Trp Lys Ser Ser Thr Pro Asn His Lys Lys Trp
595 600 605
Lys Val Lys Tyr Tyr Lys Gly Leu Gly Thr Ser Thr Ser Lys Glu Ala
610 615 620
Lys Glu Tyr Phe Ala Asp Met Lys Arg His Arg Ile Gln Phe Lys Tyr
625 630 635 640
Ser Gly Pro Glu Asp Asp Ala Ala Ile Ser Leu Ala Phe Ser Lys Lys
645 650 655
Gln Ile Asp Asp Arg Lys Glu Trp Leu Thr Asn Phe Met Glu Asp Arg
660 665 670
Arg Gln Arg Lys Leu Leu Gly Leu Pro Glu Asp Tyr Leu Tyr Gly Gln
675 680 685
Thr Thr Thr Tyr Leu Thr Tyr Asn Asp Phe Ile Asn Lys Glu Leu Ile
690 695 700
Leu Phe Ser Asn Ser Asp Asn Glu Arg Ser Ile Pro Ser Met Val Asp
705 710 715 720
Gly Leu Lys Pro Gly Gln Arg Lys Val Leu Phe Thr Cys Phe Lys Arg
725 730 735
Asn Asp Lys Arg Glu Val Lys Val Ala Gln Leu Ala Gly Ser Val Ala
740 745 750
Glu Met Ser Ser Tyr His His Gly Glu Met Ser Leu Met Met Thr Ile
755 760 765
Ile Asn Leu Ala Gln Asn Phe Val Gly Ser Asn Asn Leu Asn Leu Leu
770 775 780
Gln Pro Ile Gly Gln Phe Gly Thr Arg Leu His Gly Gly Lys Asp Ser
785 790 795 800
Ala Ser Pro Arg Tyr Ile Phe Thr Met Leu Ser Ser Leu Ala Arg Leu
805 810 815
Leu Phe Pro Pro Lys Asp Asp His Thr Leu Lys Phe Leu Tyr Asp Asp
820 825 830
Asn Gln Arg Val Glu Pro Glu Trp Tyr Ile Pro Ile Ile Pro Met Val
835 840 845
Leu Ile Asn Gly Ala Glu Gly Ile Gly Thr Gly Trp Ser Cys Lys Ile
850 855 860
Pro Asn Phe Asp Val Arg Glu Ile Val Asn Asn Ile Arg Arg Leu Met
865 870 875 880
Asp Gly Glu Glu Pro Leu Pro Met Leu Pro Ser Tyr Lys Asn Phe Lys
885 890 895
Gly Thr Ile Glu Glu Leu Ala Pro Asn Gln Tyr Val Ile Ser Gly Glu
900 905 910
Val Ala Ile Leu Asn Ser Thr Thr Ile Glu Ile Ser Glu Leu Pro Val
915 920 925
Arg Thr Trp Thr Gln Thr Tyr Lys Glu Gln Val Leu Glu Pro Met Leu
930 935 940
Asn Gly Thr Glu Lys Thr Pro Pro Leu Ile Thr Asp Tyr Arg Glu Tyr
945 950 955 960
His Thr Asp Thr Thr Val Lys Phe Val Val Lys Met Thr Glu Glu Lys
965 970 975
Leu Ala Glu Ala Glu Arg Val Gly Leu His Lys Val Phe Lys Leu Gln
980 985 990
Thr Ser Leu Thr Cys Asn Ser Met Val Leu Phe Asp His Val Gly Cys
995 1000 1005
Leu Lys Lys Tyr Asp Thr Val Leu Asp Ile Leu Arg Asp Phe Phe
1010 1015 1020
Glu Leu Arg Leu Lys Tyr Tyr Gly Leu Arg Lys Glu Trp Leu Leu
1025 1030 1035
Gly Met Leu Gly Ala Glu Ser Ala Lys Leu Asn Asn Gln Ala Arg
1040 1045 1050
Phe Ile Leu Glu Lys Ile Asp Gly Lys Ile Ile Ile Glu Asn Lys
1055 1060 1065
Pro Lys Lys Glu Leu Ile Lys Val Leu Ile Gln Arg Gly Tyr Asp
1070 1075 1080
Ser Asp Pro Val Lys Ala Trp Lys Glu Ala Gln Gln Lys Val Pro
1085 1090 1095
Asp Glu Glu Glu Asn Glu Glu Ser Asp Asn Glu Lys Glu Thr Glu
1100 1105 1110
Lys Ser Asp Ser Val Thr Asp Ser Gly Pro Thr Phe Asn Tyr Leu
1115 1120 1125
Leu Asp Met Pro Leu Trp Tyr Leu Thr Lys Glu Lys Lys Asp Glu
1130 1135 1140
Leu Cys Arg Leu Arg Asn Glu Lys Glu Gln Glu Leu Asp Thr Leu
1145 1150 1155
Lys Arg Lys Ser Pro Ser Asp Leu Trp Lys Glu Asp Leu Ala Thr
1160 1165 1170
Phe Ile Glu Glu Leu Glu Ala Val Glu Ala Lys Glu Lys Gln Asp
1175 1180 1185
Glu Gln Val Gly Leu Pro Gly Lys Gly Gly Lys Ala Lys Gly Lys
1190 1195 1200
Lys Thr Gln Met Ala Glu Val Leu Pro Ser Pro Arg Gly Gln Arg
1205 1210 1215
Val Ile Pro Arg Ile Thr Ile Glu Met Lys Ala Glu Ala Glu Lys
1220 1225 1230
Lys Asn Lys Lys Lys Ile Lys Asn Glu Asn Thr Glu Gly Ser Pro
1235 1240 1245
Gln Glu Asp Gly Val Glu Leu Glu Gly Leu Lys Gln Arg Leu Glu
1250 1255 1260
Lys Lys Gln Lys Arg Glu Pro Gly Thr Lys Thr Lys Lys Gln Thr
1265 1270 1275
Thr Leu Ala Phe Lys Pro Ile Lys Lys Gly Lys Lys Arg Asn Pro
1280 1285 1290
Trp Ser Asp Ser Glu Ser Asp Arg Ser Ser Asp Glu Ser Asn Phe
1295 1300 1305
Asp Val Pro Pro Arg Glu Thr Glu Pro Arg Arg Ala Ala Thr Lys
1310 1315 1320
Thr Lys Phe Thr Met Asp Leu Asp Ser Asp Glu Asp Phe Ser Asp
1325 1330 1335
Phe Asp Glu Lys Thr Asp Asp Glu Asp Phe Val Pro Ser Asp Ala
1340 1345 1350
Ser Pro Pro Lys Thr Lys Thr Ser Pro Lys Leu Ser Asn Lys Glu
1355 1360 1365
Leu Lys Pro Gln Lys Ser Val Val Ser Asp Leu Glu Ala Asp Asp
1370 1375 1380
Val Lys Gly Ser Val Pro Leu Ser Ser Ser Pro Pro Ala Thr His
1385 1390 1395
Phe Pro Asp Glu Thr Glu Ile Thr Asn Pro Val Pro Lys Lys Asn
1400 1405 1410
Val Thr Val Lys Lys Thr Ala Ala Lys Ser Gln Ser Ser Thr Ser
1415 1420 1425
Thr Thr Gly Ala Lys Lys Arg Ala Ala Pro Lys Gly Thr Lys Arg
1430 1435 1440
Asp Pro Ala Leu Asn Ser Gly Val Ser Gln Lys Pro Asp Pro Ala
1445 1450 1455
Lys Thr Lys Asn Arg Arg Lys Arg Lys Pro Ser Thr Ser Asp Asp
1460 1465 1470
Ser Asp Ser Asn Phe Glu Lys Ile Val Ser Lys Ala Val Thr Ser
1475 1480 1485
Lys Lys Ser Lys Gly Glu Ser Asp Asp Phe His Met Asp Phe Asp
1490 1495 1500
Ser Ala Val Ala Pro Arg Ala Lys Ser Val Arg Ala Lys Lys Pro
1505 1510 1515
Ile Lys Tyr Leu Glu Glu Ser Asp Glu Asp Asp Leu Phe
1520 1525 1530
<210> 4
<211> 5753
<212> DNA
<213> Homo sapiens
<400> 4
gattggctgg tctgcttcgg gcgggctaaa ggaaggttca agtggagctc tcctaaccga 60
cgcgcgtctg tggagaagcg gcttggtcgg gggtggtctc gtggggtcct gcctgtttag 120
tcgctttcag ggttcttgag ccccttcacg accgtcacca tggaagtgtc accattgcag 180
cctgtaaatg aaaatatgca agtcaacaaa ataaagaaaa atgaagatgc taagaaaaga 240
ctgtctgttg aaagaatcta tcaaaagaaa acacaattgg aacatatttt gctccgccca 300
gacacctaca ttggttctgt ggaattagtg acccagcaaa tgtgggttta cgatgaagat 360
gttggcatta actataggga agtcactttt gttcctggtt tgtacaaaat ctttgatgag 420
attctagtta atgctgcgga caacaaacaa agggacccaa aaatgtcttg tattagagtc 480
acaattgatc cggaaaacaa tttaattagt atatggaata atggaaaagg tattcctgtt 540
gttgaacaca aagttgaaaa gatgtatgtc ccagctctca tatttggaca gctcctaact 600
tctagtaact atgatgatga tgaaaagaaa gtgacaggtg gtcgaaatgg ctatggagcc 660
aaattgtgta acatattcag taccaaattt actgtggaaa cagccagtag agaatacaag 720
aaaatgttca aacagacatg gatggataat atgggaagag ctggtgagat ggaactcaag 780
cccttcaatg gagaagatta tacatgtatc acctttcagc ctgatttgtc taagtttaaa 840
atgcaaagcc tggacaaaga tattgttgca ctaatggtca gaagagcata tgatattgct 900
ggatccacca aagatgtcaa agtctttctt aatggaaata aactgccagt aaaaggattt 960
cgtagttatg tggacatgta tttgaaggac aagttggatg aaactggtaa ctccttgaaa 1020
gtaatacatg aacaagtaaa ccacaggtgg gaagtgtgtt taactatgag tgaaaaaggc 1080
tttcagcaaa ttagctttgt caacagcatt gctacatcca agggtggcag acatgttgat 1140
tatgtagctg atcagattgt gactaaactt gttgatgttg tgaagaagaa gaacaagggt 1200
ggtgttgcag taaaagcaca tcaggtgaaa aatcacatgt ggatttttgt aaatgcctta 1260
attgaaaacc caacctttga ctctcagaca aaagaaaaca tgactttaca acccaagagc 1320
tttggatcaa catgccaatt gagtgaaaaa tttatcaaag ctgccattgg ctgtggtatt 1380
gtagaaagca tactaaactg ggtgaagttt aaggcccaag tccagttaaa caagaagtgt 1440
tcagctgtaa aacataatag aatcaaggga attcccaaac tcgatgatgc caatgatgca 1500
gggggccgaa actccactga gtgtacgctt atcctgactg agggagattc agccaaaact 1560
ttggctgttt caggccttgg tgtggttggg agagacaaat atggggtttt ccctcttaga 1620
ggaaaaatac tcaatgttcg agaagcttct cataagcaga tcatggaaaa tgctgagatt 1680
aacaatatca tcaagattgt gggtcttcag tacaagaaaa actatgaaga tgaagattca 1740
ttgaagacgc ttcgttatgg gaagataatg attatgacag atcaggacca agatggttcc 1800
cacatcaaag gcttgctgat taattttatc catcacaact ggccctctct tctgcgacat 1860
cgttttctgg aggaatttat cactcccatt gtaaaggtat ctaaaaacaa gcaagaaatg 1920
gcattttaca gccttcctga atttgaagag tggaagagtt ctactccaaa tcataaaaaa 1980
tggaaagtca aatattacaa aggtttgggc accagcacat caaaggaagc taaagaatac 2040
tttgcagata tgaaaagaca tcgtatccag ttcaaatatt ctggtcctga agatgatgct 2100
gctatcagcc tggcctttag caaaaaacag atagatgatc gaaaggaatg gttaactaat 2160
ttcatggagg atagaagaca acgaaagtta cttgggcttc ctgaggatta cttgtatgga 2220
caaactacca catatctgac atataatgac ttcatcaaca aggaacttat cttgttctca 2280
aattctgata acgagagatc tatcccttct atggtggatg gtttgaaacc aggtcagaga 2340
aaggttttgt ttacttgctt caaacggaat gacaagcgag aagtaaaggt tgcccaatta 2400
gctggatcag tggctgaaat gtcttcttat catcatggtg agatgtcact aatgatgacc 2460
attatcaatt tggctcagaa ttttgtgggt agcaataatc taaacctctt gcagcccatt 2520
ggtcagtttg gtaccaggct acatggtggc aaggattctg ctagtccacg atacatcttt 2580
acaatgctca gctctttggc tcgattgtta tttccaccaa aagatgatca cacgttgaag 2640
tttttatatg atgacaacca gcgtgttgag cctgaatggt acattcctat tattcccatg 2700
gtgctgataa atggtgctga aggaatcggt actgggtggt cctgcaaaat ccccaacttt 2760
gatgtgcgtg aaattgtaaa taacatcagg cgtttgatgg atggagaaga acctttgcca 2820
atgcttccaa gttacaagaa cttcaagggt actattgaag aactggctcc aaatcaatat 2880
gtgattagtg gtgaagtagc tattcttaat tctacaacca ttgaaatctc agagcttccc 2940
gtcagaacat ggacccagac atacaaagaa caagttctag aacccatgtt gaatggcacc 3000
gagaagacac ctcctctcat aacagactat agggaatacc atacagatac cactgtgaaa 3060
tttgttgtga agatgactga agaaaaactg gcagaggcag agagagttgg actacacaaa 3120
gtcttcaaac tccaaactag tctcacatgc aactctatgg tgctttttga ccacgtaggc 3180
tgtttaaaga aatatgacac ggtgttggat attctaagag acttttttga actcagactt 3240
aaatattatg gattaagaaa agaatggctc ctaggaatgc ttggtgctga atctgctaaa 3300
ctgaataatc aggctcgctt tatcttagag aaaatagatg gcaaaataat cattgaaaat 3360
aagcctaaga aagaattaat taaagttctg attcagaggg gatatgattc ggatcctgtg 3420
aaggcctgga aagaagccca gcaaaaggtt ccagatgaag aagaaaatga agagagtgac 3480
aacgaaaagg aaactgaaaa gagtgactcc gtaacagatt ctggaccaac cttcaactat 3540
cttcttgata tgcccctttg gtatttaacc aaggaaaaga aagatgaact ctgcaggcta 3600
agaaatgaaa aagaacaaga gctggacaca ttaaaaagaa agagtccatc agatttgtgg 3660
aaagaagact tggctacatt tattgaagaa ttggaggctg ttgaagccaa ggaaaaacaa 3720
gatgaacaag tcggacttcc tgggaaaggg gggaaggcca aggggaaaaa aacacaaatg 3780
gctgaagttt tgccttctcc gcgtggtcaa agagtcattc cacgaataac catagaaatg 3840
aaagcagagg cagaaaagaa aaataaaaag aaaattaaga atgaaaatac tgaaggaagc 3900
cctcaagaag atggtgtgga actagaaggc ctaaaacaaa gattagaaaa gaaacagaaa 3960
agagaaccag gtacaaagac aaagaaacaa actacattgg catttaagcc aatcaaaaaa 4020
ggaaagaaga gaaatccctg gtctgattca gaatcagata ggagcagtga cgaaagtaat 4080
tttgatgtcc ctccacgaga aacagagcca cggagagcag caacaaaaac aaaattcaca 4140
atggatttgg attcagatga agatttctca gattttgatg aaaaaactga tgatgaagat 4200
tttgtcccat cagatgctag tccacctaag accaaaactt ccccaaaact tagtaacaaa 4260
gaactgaaac cacagaaaag tgtcgtgtca gaccttgaag ctgatgatgt taagggcagt 4320
gtaccactgt cttcaagccc tcctgctaca catttcccag atgaaactga aattacaaac 4380
ccagttccta aaaagaatgt gacagtgaag aagacagcag caaaaagtca gtcttccacc 4440
tccactaccg gtgccaaaaa aagggctgcc ccaaaaggaa ctaaaaggga tccagctttg 4500
aattctggtg tctctcaaaa gcctgatcct gccaaaacca agaatcgccg caaaaggaag 4560
ccatccactt ctgatgattc tgactctaat tttgagaaaa ttgtttcgaa agcagtcaca 4620
agcaagaaat ccaaggggga gagtgatgac ttccatatgg actttgactc agctgtggct 4680
cctcgggcaa aatctgtacg ggcaaagaaa cctataaagt acctggaaga gtcagatgaa 4740
gatgatctgt tttaaaatgt gaggcgatta ttttaagtaa ttatcttacc aagcccaaga 4800
ctggttttaa agttacctga agctcttaac ttcctcccct ctgaatttag tttggggaag 4860
gtgtttttag tacaagacat caaagtgaag taaagcccaa gtgttcttta gctttttata 4920
atactgtcta aatagtgacc atctcatggg cattgttttc ttctctgctt tgtctgtgtt 4980
ttgagtctgc tttcttttgt ctttaaaacc tgatttttaa gttcttctga actgtagaaa 5040
tagctatctg atcacttcag cgtaaagcag tgtgtttatt aaccatccac taagctaaaa 5100
ctagagcagt ttgatttaaa agtgtcactc ttcctccttt tctactttca gtagatatga 5160
gatagagcat aattatctgt tttatcttag ttttatacat aatttaccat cagatagaac 5220
tttatggttc tagtacagat actctactac actcagcctc ttatgtgcca agtttttctt 5280
taagcaatga gaaattgctc atgttcttca tcttctcaaa tcatcagagg ccgaagaaaa 5340
acactttggc tgtgtctata acttgacaca gtcaatagaa tgaagaaaat tagagtagtt 5400
atgtgattat ttcagctctt gacctgtccc ctctggctgc ctctgagtct gaatctccca 5460
aagagagaaa ccaatttcta agaggactgg attgcagaag actcggggac aacatttgat 5520
ccaagatctt aaatgttata ttgataacca tgctcagcaa tgagctatta gattcatttt 5580
gggaaatctc cataatttca atttgtaaac tttgttaaga cctgtctaca ttgttatatg 5640
tgtgtgactt gagtaatgtt atcaacgttt ttgtaaatat ttactatgtt tttctattag 5700
ctaaattcca acaattttgt actttaataa aatgttctaa acattgcaac cca 5753
<210> 5
<211> 489
<212> PRT
<213> Homo sapiens
<400> 5
Met Ala Thr Ile Thr Cys Thr Arg Phe Thr Glu Glu Tyr Gln Leu Phe
1 5 10 15
Glu Glu Leu Gly Lys Gly Ala Phe Ser Val Val Arg Arg Cys Val Lys
20 25 30
Val Leu Ala Gly Gln Glu Tyr Ala Ala Lys Ile Ile Asn Thr Lys Lys
35 40 45
Leu Ser Ala Arg Asp His Gln Lys Leu Glu Arg Glu Ala Arg Ile Cys
50 55 60
Arg Leu Leu Lys His Pro Asn Ile Val Arg Leu His Asp Ser Ile Ser
65 70 75 80
Glu Glu Gly His His Tyr Leu Ile Phe Asp Leu Val Thr Gly Gly Glu
85 90 95
Leu Phe Glu Asp Ile Val Ala Arg Glu Tyr Tyr Ser Glu Ala Asp Ala
100 105 110
Ser His Cys Ile Gln Gln Ile Leu Glu Ala Val Leu His Cys His Gln
115 120 125
Met Gly Val Val His Arg Asp Leu Lys Pro Glu Asn Leu Leu Leu Ala
130 135 140
Ser Lys Leu Lys Gly Ala Ala Val Lys Leu Ala Asp Phe Gly Leu Ala
145 150 155 160
Ile Glu Val Glu Gly Glu Gln Gln Ala Trp Phe Gly Phe Ala Gly Thr
165 170 175
Pro Gly Tyr Leu Ser Pro Glu Val Leu Arg Lys Asp Pro Tyr Gly Lys
180 185 190
Pro Val Asp Leu Trp Ala Cys Gly Val Ile Leu Tyr Ile Leu Leu Val
195 200 205
Gly Tyr Pro Pro Phe Trp Asp Glu Asp Gln His Arg Leu Tyr Gln Gln
210 215 220
Ile Lys Ala Gly Ala Tyr Asp Phe Pro Ser Pro Glu Trp Asp Thr Val
225 230 235 240
Thr Pro Glu Ala Lys Asp Leu Ile Asn Lys Met Leu Thr Ile Asn Pro
245 250 255
Ser Lys Arg Ile Thr Ala Ala Glu Ala Leu Lys His Pro Trp Ile Ser
260 265 270
His Arg Ser Thr Val Ala Ser Cys Met His Arg Gln Glu Thr Val Asp
275 280 285
Cys Leu Lys Lys Phe Asn Ala Arg Arg Lys Leu Lys Gly Ala Ile Leu
290 295 300
Thr Thr Met Leu Ala Thr Arg Asn Phe Ser Gly Gly Lys Ser Gly Gly
305 310 315 320
Asn Lys Lys Ser Asp Gly Val Lys Lys Arg Lys Ser Ser Ser Ser Val
325 330 335
Gln Leu Met Glu Ser Ser Glu Ser Thr Asn Thr Thr Ile Glu Asp Glu
340 345 350
Asp Thr Lys Val Arg Lys Gln Glu Ile Ile Lys Val Thr Glu Gln Leu
355 360 365
Ile Glu Ala Ile Ser Asn Gly Asp Phe Glu Ser Tyr Thr Lys Met Cys
370 375 380
Asp Pro Gly Met Thr Ala Phe Glu Pro Glu Ala Leu Gly Asn Leu Val
385 390 395 400
Glu Gly Leu Asp Phe His Arg Phe Tyr Phe Glu Asn Leu Trp Ser Arg
405 410 415
Asn Ser Lys Pro Val His Thr Thr Ile Leu Asn Pro His Ile His Leu
420 425 430
Met Gly Asp Glu Ser Ala Cys Ile Ala Tyr Ile Arg Ile Thr Gln Tyr
435 440 445
Leu Asp Ala Gly Gly Ile Pro Arg Thr Ala Gln Ser Glu Glu Thr Arg
450 455 460
Val Trp His Arg Arg Asp Gly Lys Trp Gln Ile Val His Phe His Arg
465 470 475 480
Ser Gly Ala Pro Ser Val Leu Pro His
485
<210> 6
<211> 4918
<212> DNA
<213> Homo sapiens
<400> 6
ggttgccatg gggacctgga tgctgacgaa ggctcgcgag gctgtgagca gccacagtgc 60
cctgctcaga agccccgggc tcgtcagtca aaccggttct ctgtttgcac tcggcagcac 120
gggcaggcaa gtggtcccta ggttcgggag cagagcagca gcgcctcagt cctggtcccc 180
cagtcccaag cctcacctgc ctgcccagcg ccaggatggc caccatcacc tgcacccgct 240
tcacggaaga gtaccagctc ttcgaggaat tgggcaaggg agccttctcg gtggtgcgaa 300
ggtgtgtgaa ggtgctggct ggccaggagt atgctgccaa gatcatcaac acaaagaagc 360
tgtcagccag agaccatcag aagctggagc gtgaagcccg catctgccgc ctgctgaagc 420
accccaacat cgtccgacta catgacagca tctcagagga gggacaccac tacctgatct 480
tcgacctggt cactggtggg gaactgtttg aagatatcgt ggcccgggag tattacagtg 540
aggcggatgc cagtcactgt atccagcaga tcctggaggc tgtgctgcac tgccaccaga 600
tgggggtggt gcaccgggac ctgaagcctg agaatctgtt gctggcctcc aagctcaagg 660
gtgccgcagt gaagctggca gactttggcc tggccataga ggtggagggg gagcagcagg 720
catggtttgg gtttgcaggg actcctggat atctctcccc agaagtgctg cggaaggacc 780
cgtacgggaa gcctgtggac ctgtgggctt gtggggtcat cctgtacatc ctgctggttg 840
ggtacccccc gttctgggat gaggaccagc accgcctgta ccagcagatc aaagccggcg 900
cctatgattt cccatcgccg gaatgggaca ctgtcacccc ggaagccaag gatctgatca 960
ataagatgct gaccattaac ccatccaaac gcatcacagc tgccgaagcc cttaagcacc 1020
cctggatctc gcaccgctcc accgtggcat cctgcatgca cagacaggag accgtggact 1080
gcctgaagaa gttcaatgcc aggaggaaac tgaagggagc cattctcacc acgatgctgg 1140
ccaccaggaa cttctccgga gggaagagtg ggggaaacaa gaagagcgat ggtgtgaaga 1200
aaagaaagtc cagttccagc gttcagttaa tggaatcctc agagagcacc aacaccacca 1260
tcgaggatga agacaccaaa gtgcggaaac aggaaattat aaaagtgaca gagcagctga 1320
ttgaagccat aagcaatgga gattttgagt cctacacgaa gatgtgcgac cctggcatga 1380
cagccttcga acctgaggcc ctggggaacc tggttgaggg cctggacttc catcgattct 1440
attttgaaaa cctgtggtcc cggaacagca agcccgtgca caccaccatc ctgaatcccc 1500
acatccacct gatgggcgac gagtcagcct gcatcgccta catccgcatc acgcagtacc 1560
tggacgctgg cggcatccca cgcaccgccc agtcggagga gacccgtgtc tggcaccgcc 1620
gggatggcaa atggcagatc gtccacttcc acagatctgg ggcgccctcc gtcctgcccc 1680
actgagggac caggctgggg tcgctgcgtt gctgtgccgc agagatccac tctgtccgtg 1740
gagtggagct gctggttctc ccaggtggat tttgctggaa ttctcccatg tcatcacccc 1800
accaccgtca cttctgtacc tgcatcaaga aaacctgctt gttcacaaaa gtcatcgcaa 1860
cttcagagcg aacggccaca tctccccacc tctcaccccc accctctccc ctgccaggct 1920
ggggcttcct caggcatggg tgtccacagc actggccccc tctccccagc ctcagctgct 1980
gtccgcctga tctgtcttgg gctgtaggct agaatgcccg ggctggtgcc caccaggggc 2040
tggggagaag gaggggtggc atgatgagga aggcagcatc cgtccgtccc tctcccagac 2100
ctctcctctt ccagtgtccc cggggaaggg cagatgacac tcccttcccc ctaagccaac 2160
cgcactgaag gagtggggag aagagcatac gccaggagcc tcctgcctca aagtgctccc 2220
ctaagtcttc ttcctcctgt gctgacctca gggtggtctg acccttccct cggtgtgggg 2280
gatgtggccc tctcaggtgc ccctacttgc tttctgcttc cttctggtga agtccacctc 2340
caacattaac ctgcccaccc cacccccgtc atccctggag aattccagct ttgtcgtatc 2400
tcagagaggg aatctaattg tttttggggg gcaaaagaaa gcaacgttta ggtatcactt 2460
ctacttggac cgcatgcctt tttatagcca aatttctgtg tatttcgtaa atggatttcg 2520
cgttaatgga tatttatgta ataactagac ttctcagatt attgtgagaa gggtcaggtt 2580
ggaaggggtg taggaagagg ggtgaggggt agtttttttc tgttctagtt tttttttttt 2640
tttttgtcat ctctgaggtg gaccttgtca cctgtggtta ttggggccaa ggtggactca 2700
gctccgggga gaagggcctc tctgccattt cggtcccaag gtgagctgac acaggcgttc 2760
cttttgggac tgtggaagca tcagatgcca gcactgactc aggaacagca agtcagggca 2820
gagaggagga gggaggctgt caggatggaa atacctggac ttttctttgc ttccctcgca 2880
aactggggtc ttctctaccg aacttcccag gatttcatct caccatatct gtgtgccgcc 2940
cccagcaccc cccacccacc tctggggggc ccgtgagcgt gtgtcttcat tgcctctctc 3000
cccttggcgt ctgatgacca cagcaaagca ctgggaattt ctactcttca tgcctcatcc 3060
tgcagcctcg ggttcgcatt ctctctttct tttcctcttt ccctctttcc ctgggattga 3120
ctctgagtgg aataccttgg cacatccact aggatctact gtctgcactg ttttctttgc 3180
atgactttat acgcagtaag tatgttgaaa acaaacaaaa agaagaaaac actcaacaaa 3240
accaatctac atgttttgga ctaaaaaaaa aaatagaggt tgtattctca gtgtccgact 3300
cggaattatg ttgctgcctc tctgtgcttt tggcctctgt gtggccgtgt tttgccagca 3360
tgagatactg tcccctctgg aggattttag gggaggaaga gccacgtccc cagggattgg 3420
aggaggctcc ggtaccctcg accctcctgg gtgttggttg gagcagaact ggtgaggatg 3480
tttgatccga gattttctga gctctcccca atcaccagct gtctgctggg ttcttttctc 3540
aagtcctgct gcccaggccc aggtgagaca ggcaacgcca ggtctgcagg ccaggagaga 3600
tgctgcccag gcctcctggt ttccaagctg gtccatcact ggcctctgtc cttggcagag 3660
accttgctgc ccaggcccag gggcaggctc ttggcctgcc ccaggcccag agggcttccc 3720
agtaaggccc agtgatccca ttatcccagg ggcaaaacca cctgtcccct tttgagctgc 3780
cagttcccta cagccatccc cagtcaaggg tgagggtgtg gccttcacca ggggctgctg 3840
taattaccga gcaaggtctg agctcttctt cagcctcagt tccctcattg gttaaaaggg 3900
ttctttgttc ccatccagcc gatgaaggag caaacgtctg gctatgtgaa gcctaattta 3960
cctgcaggaa ctggcaggga tagtcactgg ctggactcct gtttacttct agacctggtc 4020
aggctccatc ccctccccca cctgcccctg attcccctcg tcggtgcctg tcaactgctt 4080
ttcagcagtg gactgcaggg gaaagagcag tgatttgggg tgagtaggct tcaattccca 4140
gctctgacca gacttgctgt gtgaccttgg gcaagttcct ttccctcttt ggagcttggt 4200
ttccctgcca gaggaaactg agctggagga gcctgaggtc ctgcctttca ttggctgaca 4260
cacctcctgt ccactgtgtc actctccaag tgccagagaa gtggaggcag atcgctaccc 4320
caggctgaga tggcccccac tgtgaaggcc acgcctgtgg gtgggcagcc acctggtgcc 4380
accacagggc accagggatg atcctgatgt ggcaggcagg ggagactcac agaaaaatct 4440
gcccagagcc taccctcacc agacaaactc tgtgctcctc caaaacatcc tttagatgca 4500
aaataataat aataataata ataaataaat aaataaaaat ccaaacccaa gtcaaaacct 4560
tggctccagc atgaaaacac gtttacagga aagtgttctc ctgggtttgt gcccaccatg 4620
gtgcgaatcc tgacccaagg cctcctgtct cccttcaaag ggagaccctt ttgggggatg 4680
agtttgccag actccccgtg ctggtttctt tgttactatt tgtttggggt tttgttttag 4740
ttcttttttt ttttcttttc ttttttaaaa atatgtggct gtgaacttga atgaacactg 4800
ctcaaacttt ctgctattgg ggggggcggg tgggatggga agaaggggcg tttgttttat 4860
tcttggtgtt ttcagtgcaa taaatagcta caaacttctg tgcaaaaaaa aaaaaaaa 4918
<210> 7
<211> 478
<212> PRT
<213> Homo sapiens
<400> 7
Met Ala Thr Ile Thr Cys Thr Arg Phe Thr Glu Glu Tyr Gln Leu Phe
1 5 10 15
Glu Glu Leu Gly Lys Gly Ala Phe Ser Val Val Arg Arg Cys Val Lys
20 25 30
Val Leu Ala Gly Gln Glu Tyr Ala Ala Lys Ile Ile Asn Thr Lys Lys
35 40 45
Leu Ser Ala Arg Asp His Gln Lys Leu Glu Arg Glu Ala Arg Ile Cys
50 55 60
Arg Leu Leu Lys His Pro Asn Ile Val Arg Leu His Asp Ser Ile Ser
65 70 75 80
Glu Glu Gly His His Tyr Leu Ile Phe Asp Leu Val Thr Gly Gly Glu
85 90 95
Leu Phe Glu Asp Ile Val Ala Arg Glu Tyr Tyr Ser Glu Ala Asp Ala
100 105 110
Ser His Cys Ile Gln Gln Ile Leu Glu Ala Val Leu His Cys His Gln
115 120 125
Met Gly Val Val His Arg Asp Leu Lys Pro Glu Asn Leu Leu Leu Ala
130 135 140
Ser Lys Leu Lys Gly Ala Ala Val Lys Leu Ala Asp Phe Gly Leu Ala
145 150 155 160
Ile Glu Val Glu Gly Glu Gln Gln Ala Trp Phe Gly Phe Ala Gly Thr
165 170 175
Pro Gly Tyr Leu Ser Pro Glu Val Leu Arg Lys Asp Pro Tyr Gly Lys
180 185 190
Pro Val Asp Leu Trp Ala Cys Gly Val Ile Leu Tyr Ile Leu Leu Val
195 200 205
Gly Tyr Pro Pro Phe Trp Asp Glu Asp Gln His Arg Leu Tyr Gln Gln
210 215 220
Ile Lys Ala Gly Ala Tyr Asp Phe Pro Ser Pro Glu Trp Asp Thr Val
225 230 235 240
Thr Pro Glu Ala Lys Asp Leu Ile Asn Lys Met Leu Thr Ile Asn Pro
245 250 255
Ser Lys Arg Ile Thr Ala Ala Glu Ala Leu Lys His Pro Trp Ile Ser
260 265 270
His Arg Ser Thr Val Ala Ser Cys Met His Arg Gln Glu Thr Val Asp
275 280 285
Cys Leu Lys Lys Phe Asn Ala Arg Arg Lys Leu Lys Gly Ala Ile Leu
290 295 300
Thr Thr Met Leu Ala Thr Arg Asn Phe Ser Gly Gly Lys Ser Gly Gly
305 310 315 320
Asn Lys Lys Ser Asp Gly Val Lys Glu Ser Ser Glu Ser Thr Asn Thr
325 330 335
Thr Ile Glu Asp Glu Asp Thr Lys Val Arg Lys Gln Glu Ile Ile Lys
340 345 350
Val Thr Glu Gln Leu Ile Glu Ala Ile Ser Asn Gly Asp Phe Glu Ser
355 360 365
Tyr Thr Lys Met Cys Asp Pro Gly Met Thr Ala Phe Glu Pro Glu Ala
370 375 380
Leu Gly Asn Leu Val Glu Gly Leu Asp Phe His Arg Phe Tyr Phe Glu
385 390 395 400
Asn Leu Trp Ser Arg Asn Ser Lys Pro Val His Thr Thr Ile Leu Asn
405 410 415
Pro His Ile His Leu Met Gly Asp Glu Ser Ala Cys Ile Ala Tyr Ile
420 425 430
Arg Ile Thr Gln Tyr Leu Asp Ala Gly Gly Ile Pro Arg Thr Ala Gln
435 440 445
Ser Glu Glu Thr Arg Val Trp His Arg Arg Asp Gly Lys Trp Gln Ile
450 455 460
Val His Phe His Arg Ser Gly Ala Pro Ser Val Leu Pro His
465 470 475
<210> 8
<211> 4885
<212> DNA
<213> Homo sapiens
<400> 8
ggttgccatg gggacctgga tgctgacgaa ggctcgcgag gctgtgagca gccacagtgc 60
cctgctcaga agccccgggc tcgtcagtca aaccggttct ctgtttgcac tcggcagcac 120
gggcaggcaa gtggtcccta ggttcgggag cagagcagca gcgcctcagt cctggtcccc 180
cagtcccaag cctcacctgc ctgcccagcg ccaggatggc caccatcacc tgcacccgct 240
tcacggaaga gtaccagctc ttcgaggaat tgggcaaggg agccttctcg gtggtgcgaa 300
ggtgtgtgaa ggtgctggct ggccaggagt atgctgccaa gatcatcaac acaaagaagc 360
tgtcagccag agaccatcag aagctggagc gtgaagcccg catctgccgc ctgctgaagc 420
accccaacat cgtccgacta catgacagca tctcagagga gggacaccac tacctgatct 480
tcgacctggt cactggtggg gaactgtttg aagatatcgt ggcccgggag tattacagtg 540
aggcggatgc cagtcactgt atccagcaga tcctggaggc tgtgctgcac tgccaccaga 600
tgggggtggt gcaccgggac ctgaagcctg agaatctgtt gctggcctcc aagctcaagg 660
gtgccgcagt gaagctggca gactttggcc tggccataga ggtggagggg gagcagcagg 720
catggtttgg gtttgcaggg actcctggat atctctcccc agaagtgctg cggaaggacc 780
cgtacgggaa gcctgtggac ctgtgggctt gtggggtcat cctgtacatc ctgctggttg 840
ggtacccccc gttctgggat gaggaccagc accgcctgta ccagcagatc aaagccggcg 900
cctatgattt cccatcgccg gaatgggaca ctgtcacccc ggaagccaag gatctgatca 960
ataagatgct gaccattaac ccatccaaac gcatcacagc tgccgaagcc cttaagcacc 1020
cctggatctc gcaccgctcc accgtggcat cctgcatgca cagacaggag accgtggact 1080
gcctgaagaa gttcaatgcc aggaggaaac tgaagggagc cattctcacc acgatgctgg 1140
ccaccaggaa cttctccgga gggaagagtg ggggaaacaa gaagagcgat ggtgtgaagg 1200
aatcctcaga gagcaccaac accaccatcg aggatgaaga caccaaagtg cggaaacagg 1260
aaattataaa agtgacagag cagctgattg aagccataag caatggagat tttgagtcct 1320
acacgaagat gtgcgaccct ggcatgacag ccttcgaacc tgaggccctg gggaacctgg 1380
ttgagggcct ggacttccat cgattctatt ttgaaaacct gtggtcccgg aacagcaagc 1440
ccgtgcacac caccatcctg aatccccaca tccacctgat gggcgacgag tcagcctgca 1500
tcgcctacat ccgcatcacg cagtacctgg acgctggcgg catcccacgc accgcccagt 1560
cggaggagac ccgtgtctgg caccgccggg atggcaaatg gcagatcgtc cacttccaca 1620
gatctggggc gccctccgtc ctgccccact gagggaccag gctggggtcg ctgcgttgct 1680
gtgccgcaga gatccactct gtccgtggag tggagctgct ggttctccca ggtggatttt 1740
gctggaattc tcccatgtca tcaccccacc accgtcactt ctgtacctgc atcaagaaaa 1800
cctgcttgtt cacaaaagtc atcgcaactt cagagcgaac ggccacatct ccccacctct 1860
cacccccacc ctctcccctg ccaggctggg gcttcctcag gcatgggtgt ccacagcact 1920
ggccccctct ccccagcctc agctgctgtc cgcctgatct gtcttgggct gtaggctaga 1980
atgcccgggc tggtgcccac caggggctgg ggagaaggag gggtggcatg atgaggaagg 2040
cagcatccgt ccgtccctct cccagacctc tcctcttcca gtgtccccgg ggaagggcag 2100
atgacactcc cttcccccta agccaaccgc actgaaggag tggggagaag agcatacgcc 2160
aggagcctcc tgcctcaaag tgctccccta agtcttcttc ctcctgtgct gacctcaggg 2220
tggtctgacc cttccctcgg tgtgggggat gtggccctct caggtgcccc tacttgcttt 2280
ctgcttcctt ctggtgaagt ccacctccaa cattaacctg cccaccccac ccccgtcatc 2340
cctggagaat tccagctttg tcgtatctca gagagggaat ctaattgttt ttggggggca 2400
aaagaaagca acgtttaggt atcacttcta cttggaccgc atgccttttt atagccaaat 2460
ttctgtgtat ttcgtaaatg gatttcgcgt taatggatat ttatgtaata actagacttc 2520
tcagattatt gtgagaaggg tcaggttgga aggggtgtag gaagaggggt gaggggtagt 2580
ttttttctgt tctagttttt tttttttttt ttgtcatctc tgaggtggac cttgtcacct 2640
gtggttattg gggccaaggt ggactcagct ccggggagaa gggcctctct gccatttcgg 2700
tcccaaggtg agctgacaca ggcgttcctt ttgggactgt ggaagcatca gatgccagca 2760
ctgactcagg aacagcaagt cagggcagag aggaggaggg aggctgtcag gatggaaata 2820
cctggacttt tctttgcttc cctcgcaaac tggggtcttc tctaccgaac ttcccaggat 2880
ttcatctcac catatctgtg tgccgccccc agcacccccc acccacctct ggggggcccg 2940
tgagcgtgtg tcttcattgc ctctctcccc ttggcgtctg atgaccacag caaagcactg 3000
ggaatttcta ctcttcatgc ctcatcctgc agcctcgggt tcgcattctc tctttctttt 3060
cctctttccc tctttccctg ggattgactc tgagtggaat accttggcac atccactagg 3120
atctactgtc tgcactgttt tctttgcatg actttatacg cagtaagtat gttgaaaaca 3180
aacaaaaaga agaaaacact caacaaaacc aatctacatg ttttggacta aaaaaaaaaa 3240
tagaggttgt attctcagtg tccgactcgg aattatgttg ctgcctctct gtgcttttgg 3300
cctctgtgtg gccgtgtttt gccagcatga gatactgtcc cctctggagg attttagggg 3360
aggaagagcc acgtccccag ggattggagg aggctccggt accctcgacc ctcctgggtg 3420
ttggttggag cagaactggt gaggatgttt gatccgagat tttctgagct ctccccaatc 3480
accagctgtc tgctgggttc ttttctcaag tcctgctgcc caggcccagg tgagacaggc 3540
aacgccaggt ctgcaggcca ggagagatgc tgcccaggcc tcctggtttc caagctggtc 3600
catcactggc ctctgtcctt ggcagagacc ttgctgccca ggcccagggg caggctcttg 3660
gcctgcccca ggcccagagg gcttcccagt aaggcccagt gatcccatta tcccaggggc 3720
aaaaccacct gtcccctttt gagctgccag ttccctacag ccatccccag tcaagggtga 3780
gggtgtggcc ttcaccaggg gctgctgtaa ttaccgagca aggtctgagc tcttcttcag 3840
cctcagttcc ctcattggtt aaaagggttc tttgttccca tccagccgat gaaggagcaa 3900
acgtctggct atgtgaagcc taatttacct gcaggaactg gcagggatag tcactggctg 3960
gactcctgtt tacttctaga cctggtcagg ctccatcccc tcccccacct gcccctgatt 4020
cccctcgtcg gtgcctgtca actgcttttc agcagtggac tgcaggggaa agagcagtga 4080
tttggggtga gtaggcttca attcccagct ctgaccagac ttgctgtgtg accttgggca 4140
agttcctttc cctctttgga gcttggtttc cctgccagag gaaactgagc tggaggagcc 4200
tgaggtcctg cctttcattg gctgacacac ctcctgtcca ctgtgtcact ctccaagtgc 4260
cagagaagtg gaggcagatc gctaccccag gctgagatgg cccccactgt gaaggccacg 4320
cctgtgggtg ggcagccacc tggtgccacc acagggcacc agggatgatc ctgatgtggc 4380
aggcagggga gactcacaga aaaatctgcc cagagcctac cctcaccaga caaactctgt 4440
gctcctccaa aacatccttt agatgcaaaa taataataat aataataata aataaataaa 4500
taaaaatcca aacccaagtc aaaaccttgg ctccagcatg aaaacacgtt tacaggaaag 4560
tgttctcctg ggtttgtgcc caccatggtg cgaatcctga cccaaggcct cctgtctccc 4620
ttcaaaggga gacccttttg ggggatgagt ttgccagact ccccgtgctg gtttctttgt 4680
tactatttgt ttggggtttt gttttagttc tttttttttt tcttttcttt tttaaaaata 4740
tgtggctgtg aacttgaatg aacactgctc aaactttctg ctattggggg gggcgggtgg 4800
gatgggaaga aggggcgttt gttttattct tggtgttttc agtgcaataa atagctacaa 4860
acttctgtgc aaaaaaaaaa aaaaa 4885
<210> 9
<211> 109
<212> PRT
<213> Homo sapiens
<400> 9
Met Glu Asp Tyr Thr Lys Ile Glu Lys Ile Gly Glu Gly Thr Tyr Gly
1 5 10 15
Val Val Tyr Lys Gly Arg His Lys Thr Thr Gly Gln Val Val Ala Met
20 25 30
Lys Lys Ile Arg Leu Glu Ser Glu Glu Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Leu Arg His Pro Asn Ile Val
50 55 60
Ser Leu Gln Asp Val Leu Met Gln Asp Ser Arg Leu Tyr Leu Ile Phe
65 70 75 80
Glu Phe Leu Ser Met Asp Leu Lys Lys Tyr Leu Asp Ser Ile Pro Pro
85 90 95
Gly Gln Tyr Met Asp Ser Ser Leu Val Lys Val Lys Ala
100 105
<210> 10
<211> 1754
<212> DNA
<213> Homo sapiens
<400> 10
agccgccctt tcctctttct ttcgcgctct agccacccgg gaaggcctgc ccagcgtagc 60
tgggctctga ttggctgctt tgaaagtcta cgggctaccc gattggtgaa tccggggccc 120
tttagcgcgg atctaccata cccattgact aactatggaa gattatacca aaatagagaa 180
aattggagaa ggtacctatg gagttgtgta taagggtaga cacaaaacta caggtcaagt 240
ggtagccatg aaaaaaatca gactagaaag tgaagaggaa ggggttccta gtactgcaat 300
tcgggaaatt tctctattaa aggaacttcg tcatccaaat atagtcagtc ttcaggatgt 360
gcttatgcag gattccaggt tatatctcat ctttgagttt ctttccatgg atctgaagaa 420
atacttggat tctatccctc ctggtcagta catggattct tcacttgtta aggtaaaagc 480
ttaactaatt ttattaatat ttatgcactg tggatataaa gggactatat atagaagtcc 540
ctgcattttg tgggaatatg cttggaaaaa gtgttagaat aagaaaaagt atttcatttt 600
tctccctcat ggttagttta tacaggttag agatacccat gttattacca gatagtgttt 660
ctagtaagta aaaattagtg cctgagataa catagaactg gtaggtattg ttggaagcta 720
gggtagtctg gtctttcttt ggctgtcaga tacatgtaaa acaaagtaat gaaagcctag 780
ggcagagtgg tggttgtagg tgttttattc cagttttgaa catgttttgg tcaatttatt 840
gtagacattt attatatttc aggtaaatta taaaattgta tagttttaag tactgaagta 900
tataaaagtg tcttattctt gcaccagttc taccaaacca ctctgcagag gtagcgctgt 960
tagttttatt tgtaatctta cacttgtatg tatgttcact ttgtatgtat ataaagattt 1020
ttttttttac acaaggtgga cttatttgca tatgtatata tacatatttt cccttttttg 1080
tgtaaaacat tatcaagacg tagatctacc tatgtctatt tacatttttg atataattaa 1140
accacttcca tattgatgaa catttaaatt attttccaac ttggttattg ttgctcttat 1200
taacagtact gcactgaatg tccttataga tatttatctt cgtatgcaac tttataggat 1260
aaatttttag aatgggaatg atggattgaa gatgtttatt tacattttga tagatattgc 1320
cggttgcccc ctaaaaaact tgtagcaatt tactcttaaa tactcatggt gtgtaatact 1380
tattgtttta gtacatcatt gccaaaactt ggttttatca atctgttaac tatgtgaaaa 1440
aggcatatta agattgtttt aattttatat ttcatgacaa tttaacactt catatttagc 1500
tattataaac cgcctatatt ttcgttagga tacgttcttt aacaatcttg catgactttt 1560
ggactttctg cttttatgtc ttgcttaagt cttcctcact caaagatcga atgtattaga 1620
ataatacatg tcagtatttt tctggtagtt ttagtaagtc ctgtcttcca cacatacttt 1680
ttttgtctta aattctgtat taagatttat tttgacttaa aaactgggat acagattctg 1740
ctttatcttt ttcc 1754
<210> 11
<211> 297
<212> PRT
<213> Homo sapiens
<400> 11
Met Glu Asp Tyr Thr Lys Ile Glu Lys Ile Gly Glu Gly Thr Tyr Gly
1 5 10 15
Val Val Tyr Lys Gly Arg His Lys Thr Thr Gly Gln Val Val Ala Met
20 25 30
Lys Lys Ile Arg Leu Glu Ser Glu Glu Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Leu Arg His Pro Asn Ile Val
50 55 60
Ser Leu Gln Asp Val Leu Met Gln Asp Ser Arg Leu Tyr Leu Ile Phe
65 70 75 80
Glu Phe Leu Ser Met Asp Leu Lys Lys Tyr Leu Asp Ser Ile Pro Pro
85 90 95
Gly Gln Tyr Met Asp Ser Ser Leu Val Lys Ser Tyr Leu Tyr Gln Ile
100 105 110
Leu Gln Gly Ile Val Phe Cys His Ser Arg Arg Val Leu His Arg Asp
115 120 125
Leu Lys Pro Gln Asn Leu Leu Ile Asp Asp Lys Gly Thr Ile Lys Leu
130 135 140
Ala Asp Phe Gly Leu Ala Arg Ala Phe Gly Ile Pro Ile Arg Val Tyr
145 150 155 160
Thr His Glu Val Val Thr Leu Trp Tyr Arg Ser Pro Glu Val Leu Leu
165 170 175
Gly Ser Ala Arg Tyr Ser Thr Pro Val Asp Ile Trp Ser Ile Gly Thr
180 185 190
Ile Phe Ala Glu Leu Ala Thr Lys Lys Pro Leu Phe His Gly Asp Ser
195 200 205
Glu Ile Asp Gln Leu Phe Arg Ile Phe Arg Ala Leu Gly Thr Pro Asn
210 215 220
Asn Glu Val Trp Pro Glu Val Glu Ser Leu Gln Asp Tyr Lys Asn Thr
225 230 235 240
Phe Pro Lys Trp Lys Pro Gly Ser Leu Ala Ser His Val Lys Asn Leu
245 250 255
Asp Glu Asn Gly Leu Asp Leu Leu Ser Lys Met Leu Ile Tyr Asp Pro
260 265 270
Ala Lys Arg Ile Ser Gly Lys Met Ala Leu Asn His Pro Tyr Phe Asn
275 280 285
Asp Leu Asp Asn Gln Ile Lys Lys Met
290 295
<210> 12
<211> 1923
<212> DNA
<213> Homo sapiens
<400> 12
agcgcggtga gtttgaaact gctcgcactt ggcttcaaag ctggctcttg gaaattgagc 60
ggagagcgac gcggttgttg tagctgccgc tgcggccgcc gcggaataat aagccgggat 120
ctaccatacc cattgactaa ctatggaaga ttataccaaa atagagaaaa ttggagaagg 180
tacctatgga gttgtgtata agggtagaca caaaactaca ggtcaagtgg tagccatgaa 240
aaaaatcaga ctagaaagtg aagaggaagg ggttcctagt actgcaattc gggaaatttc 300
tctattaaag gaacttcgtc atccaaatat agtcagtctt caggatgtgc ttatgcagga 360
ttccaggtta tatctcatct ttgagtttct ttccatggat ctgaagaaat acttggattc 420
tatccctcct ggtcagtaca tggattcttc acttgttaag agttatttat accaaatcct 480
acaggggatt gtgttttgtc actctagaag agttcttcac agagacttaa aacctcaaaa 540
tctcttgatt gatgacaaag gaacaattaa actggctgat tttggccttg ccagagcttt 600
tggaatacct atcagagtat atacacatga ggtagtaaca ctctggtaca gatctccaga 660
agtattgctg gggtcagctc gttactcaac tccagttgac atttggagta taggcaccat 720
atttgctgaa ctagcaacta agaaaccact tttccatggg gattcagaaa ttgatcaact 780
cttcaggatt ttcagagctt tgggcactcc caataatgaa gtgtggccag aagtggaatc 840
tttacaggac tataagaata catttcccaa atggaaacca ggaagcctag catcccatgt 900
caaaaacttg gatgaaaatg gcttggattt gctctcgaaa atgttaatct atgatccagc 960
caaacgaatt tctggcaaaa tggcactgaa tcatccatat tttaatgatt tggacaatca 1020
gattaagaag atgtagcttt ctgacaaaaa gtttccatat gttatatcaa cagatagttg 1080
tgtttttatt gttaactctt gtctattttt gtcttatata tatttctttg ttatcaaact 1140
tcagctgtac ttcgtcttct aatttcaaaa atataactta aaaatgtaaa tattctatat 1200
gaatttaaat ataattctgt aaatgtgtgt aggtctcact gtaacaacta tttgttacta 1260
taataaaact ataatattga tgtcaggaat caggaaaaaa tttgagttgg cttaaatcat 1320
ctcagtcctt atggcagttt tattttcctg tagttggaac tactaaaatt taggaaaatg 1380
ctaagttcaa gtttcgtaat gctttgaagt atttttatgc tctgaatgtt taaatgttct 1440
catcagtttc ttgccatgtt gttaactata caacctggct aaagatgaat atttttctac 1500
tggtatttta atttttgacc taaatgttta agcattcgga atgagaaaac tatacagatt 1560
tgagaaatga tgctaaattt ataggagttt tcagtaactt aaaaagctaa catgagagca 1620
tgccaaaatt tgctaagtct tacaaagatc aagggctgtc cgcaacaggg aagaacagtt 1680
ttgaaaattt atgaactatc ttatttttag gtaggttttg aaagcttttt gtctaagtga 1740
attcttatgc cttggtcaga gtaataactg aaggagttgc ttatcttggc tttcgagtct 1800
gagtttaaaa ctacacattt tgacatagtg tttattagca gccatctaaa aaggctctaa 1860
tgtatattta actaaaatta ctagctttgg gaattaaact gtttaacaaa taaaaaaaaa 1920
aaa 1923
<210> 13
<211> 240
<212> PRT
<213> Homo sapiens
<400> 13
Met Glu Asp Tyr Thr Lys Ile Glu Lys Ile Gly Glu Gly Thr Tyr Gly
1 5 10 15
Val Val Tyr Lys Gly Arg His Lys Thr Thr Gly Gln Val Val Ala Met
20 25 30
Lys Lys Ile Arg Leu Glu Ser Glu Glu Glu Gly Val Pro Ser Thr Ala
35 40 45
Ile Arg Glu Ile Ser Leu Leu Lys Glu Leu Arg His Pro Asn Ile Val
50 55 60
Ser Leu Gln Asp Val Leu Met Gln Asp Ser Arg Leu Tyr Leu Ile Phe
65 70 75 80
Glu Phe Leu Ser Met Asp Leu Lys Lys Tyr Leu Asp Ser Ile Pro Pro
85 90 95
Gly Gln Tyr Met Asp Ser Ser Leu Val Lys Val Val Thr Leu Trp Tyr
100 105 110
Arg Ser Pro Glu Val Leu Leu Gly Ser Ala Arg Tyr Ser Thr Pro Val
115 120 125
Asp Ile Trp Ser Ile Gly Thr Ile Phe Ala Glu Leu Ala Thr Lys Lys
130 135 140
Pro Leu Phe His Gly Asp Ser Glu Ile Asp Gln Leu Phe Arg Ile Phe
145 150 155 160
Arg Ala Leu Gly Thr Pro Asn Asn Glu Val Trp Pro Glu Val Glu Ser
165 170 175
Leu Gln Asp Tyr Lys Asn Thr Phe Pro Lys Trp Lys Pro Gly Ser Leu
180 185 190
Ala Ser His Val Lys Asn Leu Asp Glu Asn Gly Leu Asp Leu Leu Ser
195 200 205
Lys Met Leu Ile Tyr Asp Pro Ala Lys Arg Ile Ser Gly Lys Met Ala
210 215 220
Leu Asn His Pro Tyr Phe Asn Asp Leu Asp Asn Gln Ile Lys Lys Met
225 230 235 240
<210> 14
<211> 1752
<212> DNA
<213> Homo sapiens
<400> 14
agcgcggtga gtttgaaact gctcgcactt ggcttcaaag ctggctcttg gaaattgagc 60
ggagagcgac gcggttgttg tagctgccgc tgcggccgcc gcggaataat aagccgggat 120
ctaccatacc cattgactaa ctatggaaga ttataccaaa atagagaaaa ttggagaagg 180
tacctatgga gttgtgtata agggtagaca caaaactaca ggtcaagtgg tagccatgaa 240
aaaaatcaga ctagaaagtg aagaggaagg ggttcctagt actgcaattc gggaaatttc 300
tctattaaag gaacttcgtc atccaaatat agtcagtctt caggatgtgc ttatgcagga 360
ttccaggtta tatctcatct ttgagtttct ttccatggat ctgaagaaat acttggattc 420
tatccctcct ggtcagtaca tggattcttc acttgttaag gtagtaacac tctggtacag 480
atctccagaa gtattgctgg ggtcagctcg ttactcaact ccagttgaca tttggagtat 540
aggcaccata tttgctgaac tagcaactaa gaaaccactt ttccatgggg attcagaaat 600
tgatcaactc ttcaggattt tcagagcttt gggcactccc aataatgaag tgtggccaga 660
agtggaatct ttacaggact ataagaatac atttcccaaa tggaaaccag gaagcctagc 720
atcccatgtc aaaaacttgg atgaaaatgg cttggatttg ctctcgaaaa tgttaatcta 780
tgatccagcc aaacgaattt ctggcaaaat ggcactgaat catccatatt ttaatgattt 840
ggacaatcag attaagaaga tgtagctttc tgacaaaaag tttccatatg ttatatcaac 900
agatagttgt gtttttattg ttaactcttg tctatttttg tcttatatat atttctttgt 960
tatcaaactt cagctgtact tcgtcttcta atttcaaaaa tataacttaa aaatgtaaat 1020
attctatatg aatttaaata taattctgta aatgtgtgta ggtctcactg taacaactat 1080
ttgttactat aataaaacta taatattgat gtcaggaatc aggaaaaaat ttgagttggc 1140
ttaaatcatc tcagtcctta tggcagtttt attttcctgt agttggaact actaaaattt 1200
aggaaaatgc taagttcaag tttcgtaatg ctttgaagta tttttatgct ctgaatgttt 1260
aaatgttctc atcagtttct tgccatgttg ttaactatac aacctggcta aagatgaata 1320
tttttctact ggtattttaa tttttgacct aaatgtttaa gcattcggaa tgagaaaact 1380
atacagattt gagaaatgat gctaaattta taggagtttt cagtaactta aaaagctaac 1440
atgagagcat gccaaaattt gctaagtctt acaaagatca agggctgtcc gcaacaggga 1500
agaacagttt tgaaaattta tgaactatct tatttttagg taggttttga aagctttttg 1560
tctaagtgaa ttcttatgcc ttggtcagag taataactga aggagttgct tatcttggct 1620
ttcgagtctg agtttaaaac tacacatttt gacatagtgt ttattagcag ccatctaaaa 1680
aggctctaat gtatatttaa ctaaaattac tagctttggg aattaaactg tttaacaaat 1740
aaaaaaaaaa aa 1752
<210> 15
<211> 1583
<212> PRT
<213> Homo sapiens
<400> 15
Met Ala Gln Ile Leu Pro Val Arg Phe Gln Glu His Phe Gln Leu Gln
1 5 10 15
Asn Leu Gly Ile Asn Pro Ala Asn Ile Gly Phe Ser Thr Leu Thr Met
20 25 30
Glu Ser Asp Lys Phe Ile Cys Ile Arg Glu Lys Val Gly Glu Gln Ala
35 40 45
Gln Val Thr Ile Ile Asp Met Ser Asp Pro Met Ala Pro Ile Arg Arg
50 55 60
Pro Ile Ser Ala Glu Ser Ala Ile Met Asn Pro Ala Ser Lys Val Ile
65 70 75 80
Ala Leu Lys Ala Gly Lys Thr Leu Gln Ile Phe Asn Ile Glu Met Lys
85 90 95
Ser Lys Met Lys Ala His Thr Met Ala Glu Glu Val Ile Phe Trp Lys
100 105 110
Trp Val Ser Val Asn Thr Val Ala Leu Val Thr Glu Thr Ala Val Tyr
115 120 125
His Trp Ser Met Glu Gly Asp Ser Gln Pro Met Lys Met Phe Asp Arg
130 135 140
His Thr Ser Leu Val Gly Cys Gln Val Ile His Tyr Arg Thr Asp Glu
145 150 155 160
Tyr Gln Lys Trp Leu Leu Leu Val Gly Ile Ser Ala Gln Gln Asn Arg
165 170 175
Val Val Gly Ala Met Gln Leu Tyr Ser Val Asp Arg Lys Val Ser Gln
180 185 190
Pro Ile Glu Gly His Ala Ala Ala Phe Ala Glu Phe Lys Met Glu Gly
195 200 205
Asn Ala Lys Pro Ala Thr Leu Phe Cys Phe Ala Val Arg Asn Pro Thr
210 215 220
Gly Gly Lys Leu His Ile Ile Glu Val Gly Gln Pro Ala Ala Gly Asn
225 230 235 240
Gln Pro Phe Val Lys Lys Ala Val Asp Val Phe Phe Pro Pro Glu Ala
245 250 255
Gln Asn Asp Phe Pro Val Ala Met Gln Ile Gly Ala Lys His Gly Val
260 265 270
Ile Tyr Leu Ile Thr Lys Tyr Gly Tyr Leu His Leu Tyr Asp Leu Glu
275 280 285
Ser Gly Val Cys Ile Cys Met Asn Arg Ile Ser Ala Asp Thr Ile Phe
290 295 300
Val Thr Ala Pro His Lys Pro Thr Ser Gly Ile Ile Gly Val Asn Lys
305 310 315 320
Lys Gly Gln Val Leu Ser Val Cys Val Glu Glu Asp Asn Ile Val Asn
325 330 335
Tyr Ala Thr Asn Val Leu Gln Asn Pro Asp Leu Gly Leu Arg Leu Ala
340 345 350
Val Arg Ser Asn Leu Ala Gly Ala Glu Lys Leu Phe Val Arg Lys Phe
355 360 365
Asn Thr Leu Phe Ala Gln Gly Ser Tyr Ala Glu Ala Ala Lys Val Ala
370 375 380
Ala Ser Ala Pro Lys Gly Ile Leu Arg Thr Arg Glu Thr Val Gln Lys
385 390 395 400
Phe Gln Ser Ile Pro Ala Gln Ser Gly Gln Ala Ser Pro Leu Leu Gln
405 410 415
Tyr Phe Gly Ile Leu Leu Asp Gln Gly Gln Leu Asn Lys Leu Glu Ser
420 425 430
Leu Glu Leu Cys His Leu Val Leu Gln Gln Gly Arg Lys Gln Leu Leu
435 440 445
Glu Lys Trp Leu Lys Glu Asp Lys Leu Glu Cys Ser Glu Glu Leu Gly
450 455 460
Asp Leu Val Lys Thr Thr Asp Pro Met Leu Ala Leu Ser Val Tyr Leu
465 470 475 480
Arg Ala Asn Val Pro Ser Lys Val Ile Gln Cys Phe Ala Glu Thr Gly
485 490 495
Gln Phe Gln Lys Ile Val Leu Tyr Ala Lys Lys Val Gly Tyr Thr Pro
500 505 510
Asp Trp Ile Phe Leu Leu Arg Gly Val Met Lys Ile Ser Pro Glu Gln
515 520 525
Gly Leu Gln Phe Ser Arg Met Leu Val Gln Asp Glu Glu Pro Leu Ala
530 535 540
Asn Ile Ser Gln Ile Val Asp Ile Phe Met Glu Asn Ser Leu Ile Gln
545 550 555 560
Gln Cys Thr Ser Phe Leu Leu Asp Ala Leu Lys Asn Asn Arg Pro Ala
565 570 575
Glu Gly Leu Leu Gln Thr Trp Leu Leu Glu Met Asn Leu Val His Ala
580 585 590
Pro Gln Val Ala Asp Ala Ile Leu Gly Asn Lys Met Phe Thr His Tyr
595 600 605
Asp Arg Ala His Ile Ala Gln Leu Cys Glu Lys Ala Gly Leu Leu Gln
610 615 620
Gln Ala Leu Glu His Tyr Thr Asp Leu Tyr Asp Ile Lys Arg Ala Val
625 630 635 640
Val His Thr His Leu Leu Asn Pro Glu Trp Leu Val Asn Phe Phe Gly
645 650 655
Ser Leu Ser Val Glu Asp Ser Val Glu Cys Leu His Ala Met Leu Ser
660 665 670
Ala Asn Ile Arg Gln Asn Leu Gln Leu Cys Val Gln Val Ala Ser Lys
675 680 685
Tyr His Glu Gln Leu Gly Thr Gln Ala Leu Val Glu Leu Phe Glu Ser
690 695 700
Phe Lys Ser Tyr Lys Gly Leu Phe Tyr Phe Leu Gly Ser Ile Val Asn
705 710 715 720
Phe Ser Gln Asp Pro Asp Val His Leu Lys Tyr Ile Gln Ala Ala Cys
725 730 735
Lys Thr Gly Gln Ile Lys Glu Val Glu Arg Ile Cys Arg Glu Ser Ser
740 745 750
Cys Tyr Asn Pro Glu Arg Val Lys Asn Phe Leu Lys Glu Ala Lys Leu
755 760 765
Thr Asp Gln Leu Pro Leu Ile Ile Val Cys Asp Arg Phe Gly Phe Val
770 775 780
His Asp Leu Val Leu Tyr Leu Tyr Arg Asn Asn Leu Gln Arg Tyr Ile
785 790 795 800
Glu Ile Tyr Val Gln Lys Val Asn Pro Ser Arg Thr Pro Ala Val Ile
805 810 815
Gly Gly Leu Leu Asp Val Asp Cys Ser Glu Glu Val Ile Lys His Leu
820 825 830
Ile Met Ala Val Arg Gly Gln Phe Ser Thr Asp Glu Leu Val Ala Glu
835 840 845
Val Glu Lys Arg Asn Arg Leu Lys Leu Leu Leu Pro Trp Leu Glu Ser
850 855 860
Gln Ile Gln Glu Gly Cys Glu Glu Pro Ala Thr His Asn Ala Leu Ala
865 870 875 880
Lys Ile Tyr Ile Asp Ser Asn Asn Ser Pro Glu Cys Phe Leu Arg Glu
885 890 895
Asn Ala Tyr Tyr Asp Ser Ser Val Val Gly Arg Tyr Cys Glu Lys Arg
900 905 910
Asp Pro His Leu Ala Cys Val Ala Tyr Glu Arg Gly Gln Cys Asp Leu
915 920 925
Glu Leu Ile Lys Val Cys Asn Glu Asn Ser Leu Phe Lys Ser Glu Ala
930 935 940
Arg Tyr Leu Val Cys Arg Lys Asp Pro Glu Leu Trp Ala His Val Leu
945 950 955 960
Glu Glu Thr Asn Pro Ser Arg Arg Gln Leu Ile Asp Gln Val Val Gln
965 970 975
Thr Ala Leu Ser Glu Thr Arg Asp Pro Glu Glu Ile Ser Val Thr Val
980 985 990
Lys Ala Phe Met Thr Ala Asp Leu Pro Asn Glu Leu Ile Glu Leu Leu
995 1000 1005
Glu Lys Ile Val Leu Asp Asn Ser Val Phe Ser Glu His Arg Asn
1010 1015 1020
Leu Gln Asn Leu Leu Ile Leu Thr Ala Ile Lys Ala Asp Arg Thr
1025 1030 1035
Arg Val Met Glu Tyr Ile Ser Arg Leu Asp Asn Tyr Asp Ala Leu
1040 1045 1050
Asp Ile Ala Ser Ile Ala Val Ser Ser Ala Leu Tyr Glu Glu Ala
1055 1060 1065
Phe Thr Val Phe His Lys Phe Asp Met Asn Ala Ser Ala Ile Gln
1070 1075 1080
Val Leu Ile Glu His Ile Gly Asn Leu Asp Arg Ala Tyr Glu Phe
1085 1090 1095
Ala Glu Arg Cys Asn Glu Pro Ala Val Trp Ser Gln Leu Ala Gln
1100 1105 1110
Ala Gln Leu Gln Lys Asp Leu Val Lys Glu Ala Ile Asn Ser Tyr
1115 1120 1125
Ile Arg Gly Asp Asp Pro Ser Ser Tyr Leu Glu Val Val Gln Ser
1130 1135 1140
Ala Ser Arg Ser Asn Asn Trp Glu Asp Leu Val Lys Phe Leu Gln
1145 1150 1155
Met Ala Arg Lys Lys Gly Arg Glu Ser Tyr Ile Glu Thr Glu Leu
1160 1165 1170
Ile Phe Ala Leu Ala Lys Thr Ser Arg Val Ser Glu Leu Glu Asp
1175 1180 1185
Phe Ile Asn Gly Pro Asn Asn Ala His Ile Gln Gln Val Gly Asp
1190 1195 1200
Arg Cys Tyr Glu Glu Gly Met Tyr Glu Ala Ala Lys Leu Leu Tyr
1205 1210 1215
Ser Asn Val Ser Asn Phe Ala Arg Leu Ala Ser Thr Leu Val His
1220 1225 1230
Leu Gly Glu Tyr Gln Ala Ala Val Asp Asn Ser Arg Lys Ala Ser
1235 1240 1245
Ser Thr Arg Thr Trp Lys Glu Val Cys Phe Ala Cys Met Asp Gly
1250 1255 1260
Gln Glu Phe Arg Phe Ala Gln Leu Cys Gly Leu His Ile Val Ile
1265 1270 1275
His Ala Asp Glu Leu Glu Glu Leu Met Cys Tyr Tyr Gln Asp Arg
1280 1285 1290
Gly Tyr Phe Glu Glu Leu Ile Leu Leu Leu Glu Ala Ala Leu Gly
1295 1300 1305
Leu Glu Arg Ala His Met Gly Met Phe Thr Glu Leu Ala Ile Leu
1310 1315 1320
Tyr Ser Lys Phe Lys Pro Gln Lys Met Leu Glu His Leu Glu Leu
1325 1330 1335
Phe Trp Ser Arg Val Asn Ile Pro Lys Val Leu Arg Ala Ala Glu
1340 1345 1350
Gln Ala His Leu Trp Ala Glu Leu Val Phe Leu Tyr Asp Lys Tyr
1355 1360 1365
Glu Glu Tyr Asp Asn Ala Val Leu Thr Met Met Ser His Pro Thr
1370 1375 1380
Glu Ala Trp Lys Glu Gly Gln Phe Lys Asp Ile Ile Thr Lys Val
1385 1390 1395
Ala Asn Val Glu Leu Cys Tyr Arg Ala Leu Gln Phe Tyr Leu Asp
1400 1405 1410
Tyr Lys Pro Leu Leu Ile Asn Asp Leu Leu Leu Val Leu Ser Pro
1415 1420 1425
Arg Leu Asp His Thr Trp Thr Val Ser Phe Phe Ser Lys Ala Gly
1430 1435 1440
Gln Leu Pro Leu Val Lys Pro Tyr Leu Arg Ser Val Gln Ser His
1445 1450 1455
Asn Asn Lys Ser Val Asn Glu Ala Leu Asn His Leu Leu Thr Glu
1460 1465 1470
Glu Glu Asp Tyr Gln Asp Ala Met Gln His Ala Ala Glu Ser Arg
1475 1480 1485
Asp Ala Glu Leu Ala Gln Lys Leu Leu Gln Trp Phe Leu Glu Glu
1490 1495 1500
Gly Lys Arg Glu Cys Phe Ala Ala Cys Leu Phe Thr Cys Tyr Asp
1505 1510 1515
Leu Leu Arg Pro Asp Met Val Leu Glu Leu Ala Trp Arg His Asn
1520 1525 1530
Leu Val Asp Leu Ala Met Pro Tyr Phe Ile Gln Val Met Arg Glu
1535 1540 1545
Tyr Leu Ser Lys Val Asp Lys Leu Asp Ala Leu Glu Ser Leu Arg
1550 1555 1560
Lys Gln Glu Glu His Val Thr Glu Pro Ala Pro Leu Val Phe Asp
1565 1570 1575
Phe Asp Gly His Glu
1580
<210> 16
<211> 5371
<212> DNA
<213> Homo sapiens
<400> 16
accggtcagc ccgcgcgagg ggtcggcgtt cattcctgcc gctgccgccg ccgccgccga 60
ggtcccgcac cagccatggc gcagatcctc cctgttcgct ttcaggagca cttccagctc 120
caaaaccttg gaattaatcc agctaacatt ggattcagca cactgaccat ggaatctgac 180
aagttcatat gtatccgaga gaaagttggt gagcaggcac aggtcacgat cattgacatg 240
agtgacccaa tggctccgat ccgacggcct atctctgcag agagtgccat catgaatcca 300
gcctctaagg tgatagctct gaaagctggg aagacacttc agatctttaa tattgagatg 360
aagagtaaaa tgaaggctca tactatggca gaagaagtga ttttctggaa atgggtttct 420
gtgaacactg ttgccttggt gaccgagacc gcggtctacc actggagcat ggaaggtgac 480
tcccagccca tgaagatgtt tgatagacat accagtctgg tgggctgcca ggtgattcac 540
taccggactg atgagtacca gaagtggctg ctgctcgtag gcatctcggc tcagcaaaac 600
cgtgtggttg gagcaatgca gctctactct gtggatagga aggtttcaca acccatagaa 660
ggccatgctg cggcttttgc agagttcaag atggagggga atgccaagcc tgccaccctt 720
ttctgctttg ctgtacgtaa tcccacagga ggcaagttgc acatcattga agttggacag 780
cctgcagcgg gaaaccaacc ttttgtaaag aaagcagtag atgtgttttt tcctccagag 840
gcacagaatg attttccagt ggctatgcag attggagcta aacatggtgt tatttacttg 900
atcacaaagt atggctatct tcatctgtac gacctagagt ctggcgtgtg catctgcatg 960
aaccgtatta gtgctgacac aatatttgtc actgctccac acaaaccaac ctctggaatt 1020
attggtgtca acaaaaaggg acaggtactg tcagtttgtg ttgaggaaga taacattgtg 1080
aattatgcaa ccaacgtgct tcagaatcca gaccttggtc tgcgtttggc cgttcgtagt 1140
aacctggctg gggcagagaa gttgtttgtg agaaaattca ataccctctt tgcacagggc 1200
agctatgctg aagccgccaa agttgcagcg tctgcaccaa agggaatcct gcgtaccaga 1260
gagacggtcc agaaattcca gagtataccc gctcagtctg gccaggcttc tccattgctg 1320
cagtacttcg gaatcctgct cgaccagggt cagctcaata aacttgaatc cttagaactt 1380
tgccatctgg ttcttcagca ggggcgtaag caactcctag agaagtggct gaaagaagat 1440
aagctggagt gctcagagga gctcggagac ttggtcaaaa ccactgaccc catgctcgct 1500
ctgagtgtgt accttcgggc aaatgtgcca agcaaagtga tccagtgttt tgcagaaaca 1560
ggccaattcc agaaaattgt gctctatgcc aaaaaggttg ggtacacccc agactggatc 1620
tttctgctga ggggtgtaat gaagatcagt ccggaacagg gcctgcagtt ttctcgaatg 1680
ctagtgcagg acgaggagcc gctggccaac attagccaga ttgtggacat tttcatggaa 1740
aacagtttaa ttcagcagtg tacttccttc ttattggatg ccttgaagaa taatcgccca 1800
gctgagggac tcctgcagac atggctgttg gagatgaacc ttgttcatgc accccaggtt 1860
gcagatgcca tccttggaaa taaaatgttt actcattacg accgggccca cattgcccag 1920
ctctgtgaga aggcaggcct cctgcagcaa gcactggagc actacaccga cctctatgac 1980
atcaagaggg ctgtggtcca cactcacctc ctcaatcccg agtggcttgt caatttcttt 2040
ggctccttat cggtggagga ttctgtggag tgtctgcatg ccatgctgtc tgctaacatc 2100
agacagaacc ttcagctgtg tgtgcaggtg gcctctaagt accacgagca gctgggcacg 2160
caggccctgg tggagctctt tgaatccttc aagagttaca aaggcctctt ctacttcctg 2220
ggctcaatcg tgaacttcag ccaagaccca gatgtgcatc tgaaatacat tcaggctgcc 2280
tgtaagacag ggcagatcaa ggaggtggag aggatatgcc gagagagcag ctgctacaac 2340
ccagagcgtg tgaagaactt cctgaaggag gccaagctca cagaccagct tcccctcatc 2400
atcgtgtgtg atcgttttgg ctttgtccat gaccttgtcc tatatttata ccgcaacaac 2460
ctgcagaggt acattgagat ctacgtgcag aaggtcaacc ctagccggac cccagctgtg 2520
attggagggc tgcttgatgt ggattgttct gaggaagtga ttaaacactt aatcatggca 2580
gtgagaggac agttctctac tgatgagttg gtggctgaag tagaaaaaag aaataggctc 2640
aagctgctgc ttccctggct ggagtcccag attcaggaag gctgtgagga gcctgccact 2700
cacaatgcac tggctaaaat ctacatcgac agcaacaaca gccccgagtg cttcctgaga 2760
gagaatgcct actatgacag cagcgtggtg ggccgctact gtgagaagcg agacccccat 2820
ctggcctgtg ttgcctatga gcgggggcag tgtgaccttg agctcatcaa ggtgtgcaat 2880
gagaattctc tgttcaaaag cgaggcccgc tacctggtat gcagaaagga tccggagctc 2940
tgggctcacg tccttgagga gaccaaccca tccaggagac agctaattga ccaggtggta 3000
cagacagcat tgtcagaaac acgggatcct gaagagattt cggtcactgt caaagccttt 3060
atgacagccg acctgcctaa tgaactgatt gaactgctgg agaagatagt tctggataac 3120
tctgtcttca gcgagcacag gaatctacag aatctgttga tcctgactgc catcaaggca 3180
gaccgcacac gggtcatgga gtacatcagc cgcctggaca actatgacgc actggacatc 3240
gcgagcatcg ctgtcagcag cgcactgtat gaggaggcct tcaccgtttt ccacaagttt 3300
gatatgaatg cctcagcaat ccaggtcctg atcgagcaca ttggaaacct ggaccgggca 3360
tatgagtttg cggagagatg caatgagcct gctgtgtgga gtcagctggc ccaagcccag 3420
ctccagaaag atttggtgaa ggaagccatc aactcctata tcagagggga cgacccttcc 3480
tcttacctgg aagttgttca gtcagccagc aggagcaaca actgggagga tctagttaaa 3540
tttctgcaga tggccaggaa aaagggccgt gagtcctata tagagactga acttattttt 3600
gccttggcta aaaccagccg tgtttctgag ctagaagatt ttattaatgg acccaacaat 3660
gcccacatcc agcaggttgg agaccgctgt tacgaggagg gaatgtacga ggctgccaag 3720
ctgctctata gcaatgtttc taactttgcc cgcctggctt ccaccttggt tcacctcggt 3780
gagtatcagg cagcagtgga caacagccgc aaggccagca gcacccggac gtggaaggag 3840
gtgtgctttg cctgcatgga tggacaagag ttccgcttcg cacagctgtg tggtcttcac 3900
atcgtcattc atgcagatga gctggaggag ctgatgtgct attaccagga tcgtggctac 3960
tttgaggagc tgatcttgct gttggaagcg gccctgggcc tggagcgggc ccacatgggc 4020
atgttcactg agctggccat cctctactcc aaattcaagc cacagaagat gctggagcat 4080
ctggagcttt tctggtcccg tgtcaacatc ccaaaggtgc tgagggctgc agagcaggca 4140
cacctgtggg ctgagctggt gttcctctat gacaagtacg aggagtatga caatgctgtg 4200
ctcaccatga tgagccaccc cactgaggcc tggaaggagg gtcagttcaa ggacatcatt 4260
accaaggttg ccaacgtcga gctctgttac agagccctgc agttctattt ggattacaaa 4320
ccactgctca tcaatgacct gctgctggtg ctttcacccc ggctggacca cacctggaca 4380
gtcagtttct tttcaaaggc aggtcagctg cccctggtga agccttacct gcggtcagtc 4440
cagagccaca acaacaagag tgtgaatgag gcactcaacc acctgctgac agaggaggag 4500
gactatcagg atgccatgca gcatgctgca gagtcgcggg atgctgagct ggcccagaag 4560
ttgctgcagt ggttcctgga ggaaggcaag agggagtgct tcgcagcttg tctcttcacc 4620
tgctatgacc tgcttcgccc agacatggtg cttgagctgg cctggaggca caacctcgtg 4680
gacttggcca tgccctactt catccaggtg atgagggagt acctgagcaa ggtggacaaa 4740
ctggatgcct tggagagtct gcgcaagcaa gaggagcatg tgacagagcc tgcccctctc 4800
gtgtttgatt ttgatgggca tgaatgagac ccagctgatt gcactaagcc ctgccgtggg 4860
cccagcccct gccagcttcc cctatggata tgcctctgct cccaacttcg ccagcctcca 4920
atgtacaact tccgcgtgta gtgggcgttg tcaccaccca ccctacctgc agagttacta 4980
acttctccaa ggagcatgtc actccagcag cacaggggac gcaatgggag gcagggacac 5040
ctggacaata tttatttttg ctgaaaccca atgacggcaa cctctgagcc atcccagagc 5100
ctggggaggc cagggtagag gctgacggcg caagaccagc tttagccgac aacagagact 5160
ggactgtggg ccctcctgct ggagccaggc cttcctcctg ggcgcctccg actggctgga 5220
gctgccccct ccaggccagt ttgaagacta catgaacacg tcttgtttgg aggtaccgga 5280
cctcataaaa ggactctcag cctcttggca atcataaata ttaaagtcgg tttatccagg 5340
caaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 5371
<210> 17
<211> 1640
<212> PRT
<213> Homo sapiens
<400> 17
Met Ala Gln Ile Leu Pro Val Arg Phe Gln Glu His Phe Gln Leu Gln
1 5 10 15
Asn Leu Gly Ile Asn Pro Ala Asn Ile Gly Phe Ser Thr Leu Thr Met
20 25 30
Glu Ser Asp Lys Phe Ile Cys Ile Arg Glu Lys Val Gly Glu Gln Ala
35 40 45
Gln Val Thr Ile Ile Asp Met Ser Asp Pro Met Ala Pro Ile Arg Arg
50 55 60
Pro Ile Ser Ala Glu Ser Ala Ile Met Asn Pro Ala Ser Lys Val Ile
65 70 75 80
Ala Leu Lys Ala Gly Lys Thr Leu Gln Ile Phe Asn Ile Glu Met Lys
85 90 95
Ser Lys Met Lys Ala His Thr Met Ala Glu Glu Val Ile Phe Trp Lys
100 105 110
Trp Val Ser Val Asn Thr Val Ala Leu Val Thr Glu Thr Ala Val Tyr
115 120 125
His Trp Ser Met Glu Gly Asp Ser Gln Pro Met Lys Met Phe Asp Arg
130 135 140
His Thr Ser Leu Val Gly Cys Gln Val Ile His Tyr Arg Thr Asp Glu
145 150 155 160
Tyr Gln Lys Trp Leu Leu Leu Val Gly Ile Ser Ala Gln Gln Asn Arg
165 170 175
Val Val Gly Ala Met Gln Leu Tyr Ser Val Asp Arg Lys Val Ser Gln
180 185 190
Pro Ile Glu Gly His Ala Ala Ala Phe Ala Glu Phe Lys Met Glu Gly
195 200 205
Asn Ala Lys Pro Ala Thr Leu Phe Cys Phe Ala Val Arg Asn Pro Thr
210 215 220
Gly Gly Lys Leu His Ile Ile Glu Val Gly Gln Pro Ala Ala Gly Asn
225 230 235 240
Gln Pro Phe Val Lys Lys Ala Val Asp Val Phe Phe Pro Pro Glu Ala
245 250 255
Gln Asn Asp Phe Pro Val Ala Met Gln Ile Gly Ala Lys His Gly Val
260 265 270
Ile Tyr Leu Ile Thr Lys Tyr Gly Tyr Leu His Leu Tyr Asp Leu Glu
275 280 285
Ser Gly Val Cys Ile Cys Met Asn Arg Ile Ser Ala Asp Thr Ile Phe
290 295 300
Val Thr Ala Pro His Lys Pro Thr Ser Gly Ile Ile Gly Val Asn Lys
305 310 315 320
Lys Gly Gln Val Leu Ser Val Cys Val Glu Glu Asp Asn Ile Val Asn
325 330 335
Tyr Ala Thr Asn Val Leu Gln Asn Pro Asp Leu Gly Leu Arg Leu Ala
340 345 350
Val Arg Ser Asn Leu Ala Gly Ala Glu Lys Leu Phe Val Arg Lys Phe
355 360 365
Asn Thr Leu Phe Ala Gln Gly Ser Tyr Ala Glu Ala Ala Lys Val Ala
370 375 380
Ala Ser Ala Pro Lys Gly Ile Leu Arg Thr Arg Glu Thr Val Gln Lys
385 390 395 400
Phe Gln Ser Ile Pro Ala Gln Ser Gly Gln Ala Ser Pro Leu Leu Gln
405 410 415
Tyr Phe Gly Ile Leu Leu Asp Gln Gly Gln Leu Asn Lys Leu Glu Ser
420 425 430
Leu Glu Leu Cys His Leu Val Leu Gln Gln Gly Arg Lys Gln Leu Leu
435 440 445
Glu Lys Trp Leu Lys Glu Asp Lys Leu Glu Cys Ser Glu Glu Leu Gly
450 455 460
Asp Leu Val Lys Thr Thr Asp Pro Met Leu Ala Leu Ser Val Tyr Leu
465 470 475 480
Arg Ala Asn Val Pro Ser Lys Val Ile Gln Cys Phe Ala Glu Thr Gly
485 490 495
Gln Phe Gln Lys Ile Val Leu Tyr Ala Lys Lys Val Gly Tyr Thr Pro
500 505 510
Asp Trp Ile Phe Leu Leu Arg Gly Val Met Lys Ile Ser Pro Glu Gln
515 520 525
Gly Leu Gln Phe Ser Arg Met Leu Val Gln Asp Glu Glu Pro Leu Ala
530 535 540
Asn Ile Ser Gln Ile Val Asp Ile Phe Met Glu Asn Ser Leu Ile Gln
545 550 555 560
Gln Cys Thr Ser Phe Leu Leu Asp Ala Leu Lys Asn Asn Arg Pro Ala
565 570 575
Glu Gly Leu Leu Gln Thr Trp Leu Leu Glu Met Asn Leu Val His Ala
580 585 590
Pro Gln Val Ala Asp Ala Ile Leu Gly Asn Lys Met Phe Thr His Tyr
595 600 605
Asp Arg Ala His Ile Ala Gln Leu Cys Glu Lys Ala Gly Leu Leu Gln
610 615 620
Gln Ala Leu Glu His Tyr Thr Asp Leu Tyr Asp Ile Lys Arg Ala Val
625 630 635 640
Val His Thr His Leu Leu Asn Pro Glu Trp Leu Val Asn Phe Phe Gly
645 650 655
Ser Leu Ser Val Glu Asp Ser Val Glu Cys Leu His Ala Met Leu Ser
660 665 670
Ala Asn Ile Arg Gln Asn Leu Gln Leu Cys Val Gln Val Ala Ser Lys
675 680 685
Tyr His Glu Gln Leu Gly Thr Gln Ala Leu Val Glu Leu Phe Glu Ser
690 695 700
Phe Lys Ser Tyr Lys Gly Leu Phe Tyr Phe Leu Gly Ser Ile Val Asn
705 710 715 720
Phe Ser Gln Asp Pro Asp Val His Leu Lys Tyr Ile Gln Ala Ala Cys
725 730 735
Lys Thr Gly Gln Ile Lys Glu Val Glu Arg Ile Cys Arg Glu Ser Ser
740 745 750
Cys Tyr Asn Pro Glu Arg Val Lys Asn Phe Leu Lys Glu Ala Lys Leu
755 760 765
Thr Asp Gln Leu Pro Leu Ile Ile Val Cys Asp Arg Phe Gly Phe Val
770 775 780
His Asp Leu Val Leu Tyr Leu Tyr Arg Asn Asn Leu Gln Arg Tyr Ile
785 790 795 800
Glu Ile Tyr Val Gln Lys Val Asn Pro Ser Arg Thr Pro Ala Val Ile
805 810 815
Gly Gly Leu Leu Asp Val Asp Cys Ser Glu Glu Val Ile Lys His Leu
820 825 830
Ile Met Ala Val Arg Gly Gln Phe Ser Thr Asp Glu Leu Val Ala Glu
835 840 845
Val Glu Lys Arg Asn Arg Leu Lys Leu Leu Leu Pro Trp Leu Glu Ser
850 855 860
Gln Ile Gln Glu Gly Cys Glu Glu Pro Ala Thr His Asn Ala Leu Ala
865 870 875 880
Lys Ile Tyr Ile Asp Ser Asn Asn Ser Pro Glu Cys Phe Leu Arg Glu
885 890 895
Asn Ala Tyr Tyr Asp Ser Ser Val Val Gly Arg Tyr Cys Glu Lys Arg
900 905 910
Asp Pro His Leu Ala Cys Val Ala Tyr Glu Arg Gly Gln Cys Asp Leu
915 920 925
Glu Leu Ile Lys Val Cys Asn Glu Asn Ser Leu Phe Lys Ser Glu Ala
930 935 940
Arg Tyr Leu Val Cys Arg Lys Asp Pro Glu Leu Trp Ala His Val Leu
945 950 955 960
Glu Glu Thr Asn Pro Ser Arg Arg Gln Leu Ile Asp Gln Val Val Gln
965 970 975
Thr Ala Leu Ser Glu Thr Arg Asp Pro Glu Glu Ile Ser Val Thr Val
980 985 990
Lys Ala Phe Met Thr Ala Asp Leu Pro Asn Glu Leu Ile Glu Leu Leu
995 1000 1005
Glu Lys Ile Val Leu Asp Asn Ser Val Phe Ser Glu His Arg Asn
1010 1015 1020
Leu Gln Asn Leu Leu Ile Leu Thr Ala Ile Lys Ala Asp Arg Thr
1025 1030 1035
Arg Val Met Glu Tyr Ile Ser Arg Leu Asp Asn Tyr Asp Ala Leu
1040 1045 1050
Asp Ile Ala Ser Ile Ala Val Ser Ser Ala Leu Tyr Glu Glu Ala
1055 1060 1065
Phe Thr Val Phe His Lys Phe Asp Met Asn Ala Ser Ala Ile Gln
1070 1075 1080
Val Leu Ile Glu His Ile Gly Asn Leu Asp Arg Ala Tyr Glu Phe
1085 1090 1095
Ala Glu Arg Cys Asn Glu Pro Ala Val Trp Ser Gln Leu Ala Gln
1100 1105 1110
Ala Gln Leu Gln Lys Asp Leu Val Lys Glu Ala Ile Asn Ser Tyr
1115 1120 1125
Ile Arg Gly Asp Asp Pro Ser Ser Tyr Leu Glu Val Val Gln Ser
1130 1135 1140
Ala Ser Arg Ser Asn Asn Trp Glu Asp Leu Val Lys Phe Leu Gln
1145 1150 1155
Met Ala Arg Lys Lys Gly Arg Glu Ser Tyr Ile Glu Thr Glu Leu
1160 1165 1170
Ile Phe Ala Leu Ala Lys Thr Ser Arg Val Ser Glu Leu Glu Asp
1175 1180 1185
Phe Ile Asn Gly Pro Asn Asn Ala His Ile Gln Gln Val Gly Asp
1190 1195 1200
Arg Cys Tyr Glu Glu Gly Met Tyr Glu Ala Ala Lys Leu Leu Tyr
1205 1210 1215
Ser Asn Val Ser Asn Phe Ala Arg Leu Ala Ser Thr Leu Val His
1220 1225 1230
Leu Gly Glu Tyr Gln Ala Ala Val Asp Asn Ser Arg Lys Ala Ser
1235 1240 1245
Ser Thr Arg Thr Trp Lys Glu Val Cys Phe Ala Cys Met Asp Gly
1250 1255 1260
Gln Glu Phe Arg Phe Ala Gln Leu Cys Gly Leu His Ile Val Ile
1265 1270 1275
His Ala Asp Glu Leu Glu Glu Leu Met Cys Tyr Tyr Gln Asp Arg
1280 1285 1290
Gly Tyr Phe Glu Glu Leu Ile Leu Leu Leu Glu Ala Ala Leu Gly
1295 1300 1305
Leu Glu Arg Ala His Met Gly Met Phe Thr Glu Leu Ala Ile Leu
1310 1315 1320
Tyr Ser Lys Phe Lys Pro Gln Lys Met Leu Glu His Leu Glu Leu
1325 1330 1335
Phe Trp Ser Arg Val Asn Ile Pro Lys Val Leu Arg Ala Ala Glu
1340 1345 1350
Gln Ala His Leu Trp Ala Glu Leu Val Phe Leu Tyr Asp Lys Tyr
1355 1360 1365
Glu Glu Tyr Asp Asn Ala Val Leu Thr Met Met Ser His Pro Thr
1370 1375 1380
Glu Ala Trp Lys Glu Gly Gln Phe Lys Asp Ile Ile Thr Lys Val
1385 1390 1395
Ala Asn Val Glu Leu Cys Tyr Arg Ala Leu Gln Phe Tyr Leu Asp
1400 1405 1410
Tyr Lys Pro Leu Leu Ile Asn Asp Leu Leu Leu Val Leu Ser Pro
1415 1420 1425
Arg Leu Asp His Thr Trp Thr Val Ser Phe Phe Ser Lys Ala Gly
1430 1435 1440
Gln Leu Pro Leu Val Lys Pro Tyr Leu Arg Ser Val Gln Ser His
1445 1450 1455
Asn Asn Lys Ser Val Asn Glu Ala Leu Asn His Leu Leu Thr Glu
1460 1465 1470
Glu Glu Asp Tyr Gln Gly Leu Arg Ala Ser Ile Asp Ala Tyr Asp
1475 1480 1485
Asn Phe Asp Asn Ile Ser Leu Ala Gln Gln Leu Glu Lys His Gln
1490 1495 1500
Leu Met Glu Phe Arg Cys Ile Ala Ala Tyr Leu Tyr Lys Gly Asn
1505 1510 1515
Asn Trp Trp Ala Gln Ser Val Glu Leu Cys Lys Lys Asp His Leu
1520 1525 1530
Tyr Lys Asp Ala Met Gln His Ala Ala Glu Ser Arg Asp Ala Glu
1535 1540 1545
Leu Ala Gln Lys Leu Leu Gln Trp Phe Leu Glu Glu Gly Lys Arg
1550 1555 1560
Glu Cys Phe Ala Ala Cys Leu Phe Thr Cys Tyr Asp Leu Leu Arg
1565 1570 1575
Pro Asp Met Val Leu Glu Leu Ala Trp Arg His Asn Leu Val Asp
1580 1585 1590
Leu Ala Met Pro Tyr Phe Ile Gln Val Met Arg Glu Tyr Leu Ser
1595 1600 1605
Lys Val Asp Lys Leu Asp Ala Leu Glu Ser Leu Arg Lys Gln Glu
1610 1615 1620
Glu His Val Thr Glu Pro Ala Pro Leu Val Phe Asp Phe Asp Gly
1625 1630 1635
His Glu
1640
<210> 18
<211> 5542
<212> DNA
<213> Homo sapiens
<400> 18
accggtcagc ccgcgcgagg ggtcggcgtt cattcctgcc gctgccgccg ccgccgccga 60
ggtcccgcac cagccatggc gcagatcctc cctgttcgct ttcaggagca cttccagctc 120
caaaaccttg gaattaatcc agctaacatt ggattcagca cactgaccat ggaatctgac 180
aagttcatat gtatccgaga gaaagttggt gagcaggcac aggtcacgat cattgacatg 240
agtgacccaa tggctccgat ccgacggcct atctctgcag agagtgccat catgaatcca 300
gcctctaagg tgatagctct gaaagctggg aagacacttc agatctttaa tattgagatg 360
aagagtaaaa tgaaggctca tactatggca gaagaagtga ttttctggaa atgggtttct 420
gtgaacactg ttgccttggt gaccgagacc gcggtctacc actggagcat ggaaggtgac 480
tcccagccca tgaagatgtt tgatagacat accagtctgg tgggctgcca ggtgattcac 540
taccggactg atgagtacca gaagtggctg ctgctcgtag gcatctcggc tcagcaaaac 600
cgtgtggttg gagcaatgca gctctactct gtggatagga aggtttcaca acccatagaa 660
ggccatgctg cggcttttgc agagttcaag atggagggga atgccaagcc tgccaccctt 720
ttctgctttg ctgtacgtaa tcccacagga ggcaagttgc acatcattga agttggacag 780
cctgcagcgg gaaaccaacc ttttgtaaag aaagcagtag atgtgttttt tcctccagag 840
gcacagaatg attttccagt ggctatgcag attggagcta aacatggtgt tatttacttg 900
atcacaaagt atggctatct tcatctgtac gacctagagt ctggcgtgtg catctgcatg 960
aaccgtatta gtgctgacac aatatttgtc actgctccac acaaaccaac ctctggaatt 1020
attggtgtca acaaaaaggg acaggtactg tcagtttgtg ttgaggaaga taacattgtg 1080
aattatgcaa ccaacgtgct tcagaatcca gaccttggtc tgcgtttggc cgttcgtagt 1140
aacctggctg gggcagagaa gttgtttgtg agaaaattca ataccctctt tgcacagggc 1200
agctatgctg aagccgccaa agttgcagcg tctgcaccaa agggaatcct gcgtaccaga 1260
gagacggtcc agaaattcca gagtataccc gctcagtctg gccaggcttc tccattgctg 1320
cagtacttcg gaatcctgct cgaccagggt cagctcaata aacttgaatc cttagaactt 1380
tgccatctgg ttcttcagca ggggcgtaag caactcctag agaagtggct gaaagaagat 1440
aagctggagt gctcagagga gctcggagac ttggtcaaaa ccactgaccc catgctcgct 1500
ctgagtgtgt accttcgggc aaatgtgcca agcaaagtga tccagtgttt tgcagaaaca 1560
ggccaattcc agaaaattgt gctctatgcc aaaaaggttg ggtacacccc agactggatc 1620
tttctgctga ggggtgtaat gaagatcagt ccggaacagg gcctgcagtt ttctcgaatg 1680
ctagtgcagg acgaggagcc gctggccaac attagccaga ttgtggacat tttcatggaa 1740
aacagtttaa ttcagcagtg tacttccttc ttattggatg ccttgaagaa taatcgccca 1800
gctgagggac tcctgcagac atggctgttg gagatgaacc ttgttcatgc accccaggtt 1860
gcagatgcca tccttggaaa taaaatgttt actcattacg accgggccca cattgcccag 1920
ctctgtgaga aggcaggcct cctgcagcaa gcactggagc actacaccga cctctatgac 1980
atcaagaggg ctgtggtcca cactcacctc ctcaatcccg agtggcttgt caatttcttt 2040
ggctccttat cggtggagga ttctgtggag tgtctgcatg ccatgctgtc tgctaacatc 2100
agacagaacc ttcagctgtg tgtgcaggtg gcctctaagt accacgagca gctgggcacg 2160
caggccctgg tggagctctt tgaatccttc aagagttaca aaggcctctt ctacttcctg 2220
ggctcaatcg tgaacttcag ccaagaccca gatgtgcatc tgaaatacat tcaggctgcc 2280
tgtaagacag ggcagatcaa ggaggtggag aggatatgcc gagagagcag ctgctacaac 2340
ccagagcgtg tgaagaactt cctgaaggag gccaagctca cagaccagct tcccctcatc 2400
atcgtgtgtg atcgttttgg ctttgtccat gaccttgtcc tatatttata ccgcaacaac 2460
ctgcagaggt acattgagat ctacgtgcag aaggtcaacc ctagccggac cccagctgtg 2520
attggagggc tgcttgatgt ggattgttct gaggaagtga ttaaacactt aatcatggca 2580
gtgagaggac agttctctac tgatgagttg gtggctgaag tagaaaaaag aaataggctc 2640
aagctgctgc ttccctggct ggagtcccag attcaggaag gctgtgagga gcctgccact 2700
cacaatgcac tggctaaaat ctacatcgac agcaacaaca gccccgagtg cttcctgaga 2760
gagaatgcct actatgacag cagcgtggtg ggccgctact gtgagaagcg agacccccat 2820
ctggcctgtg ttgcctatga gcgggggcag tgtgaccttg agctcatcaa ggtgtgcaat 2880
gagaattctc tgttcaaaag cgaggcccgc tacctggtat gcagaaagga tccggagctc 2940
tgggctcacg tccttgagga gaccaaccca tccaggagac agctaattga ccaggtggta 3000
cagacagcat tgtcagaaac acgggatcct gaagagattt cggtcactgt caaagccttt 3060
atgacagccg acctgcctaa tgaactgatt gaactgctgg agaagatagt tctggataac 3120
tctgtcttca gcgagcacag gaatctacag aatctgttga tcctgactgc catcaaggca 3180
gaccgcacac gggtcatgga gtacatcagc cgcctggaca actatgacgc actggacatc 3240
gcgagcatcg ctgtcagcag cgcactgtat gaggaggcct tcaccgtttt ccacaagttt 3300
gatatgaatg cctcagcaat ccaggtcctg atcgagcaca ttggaaacct ggaccgggca 3360
tatgagtttg cggagagatg caatgagcct gctgtgtgga gtcagctggc ccaagcccag 3420
ctccagaaag atttggtgaa ggaagccatc aactcctata tcagagggga cgacccttcc 3480
tcttacctgg aagttgttca gtcagccagc aggagcaaca actgggagga tctagttaaa 3540
tttctgcaga tggccaggaa aaagggccgt gagtcctata tagagactga acttattttt 3600
gccttggcta aaaccagccg tgtttctgag ctagaagatt ttattaatgg acccaacaat 3660
gcccacatcc agcaggttgg agaccgctgt tacgaggagg gaatgtacga ggctgccaag 3720
ctgctctata gcaatgtttc taactttgcc cgcctggctt ccaccttggt tcacctcggt 3780
gagtatcagg cagcagtgga caacagccgc aaggccagca gcacccggac gtggaaggag 3840
gtgtgctttg cctgcatgga tggacaagag ttccgcttcg cacagctgtg tggtcttcac 3900
atcgtcattc atgcagatga gctggaggag ctgatgtgct attaccagga tcgtggctac 3960
tttgaggagc tgatcttgct gttggaagcg gccctgggcc tggagcgggc ccacatgggc 4020
atgttcactg agctggccat cctctactcc aaattcaagc cacagaagat gctggagcat 4080
ctggagcttt tctggtcccg tgtcaacatc ccaaaggtgc tgagggctgc agagcaggca 4140
cacctgtggg ctgagctggt gttcctctat gacaagtacg aggagtatga caatgctgtg 4200
ctcaccatga tgagccaccc cactgaggcc tggaaggagg gtcagttcaa ggacatcatt 4260
accaaggttg ccaacgtcga gctctgttac agagccctgc agttctattt ggattacaaa 4320
ccactgctca tcaatgacct gctgctggtg ctttcacccc ggctggacca cacctggaca 4380
gtcagtttct tttcaaaggc aggtcagctg cccctggtga agccttacct gcggtcagtc 4440
cagagccaca acaacaagag tgtgaatgag gcactcaacc acctgctgac agaggaggag 4500
gactatcagg gcttaagggc atctatcgat gcctatgaca actttgacaa catcagcctg 4560
gctcagcagc tggagaagca tcagctgatg gagttcaggt gcattgcggc ctatctgtac 4620
aagggcaata actggtgggc ccagagcgtg gagctctgca agaaggatca tctctacaag 4680
gatgccatgc agcatgctgc agagtcgcgg gatgctgagc tggcccagaa gttgctgcag 4740
tggttcctgg aggaaggcaa gagggagtgc ttcgcagctt gtctcttcac ctgctatgac 4800
ctgcttcgcc cagacatggt gcttgagctg gcctggaggc acaacctcgt ggacttggcc 4860
atgccctact tcatccaggt gatgagggag tacctgagca aggtggacaa actggatgcc 4920
ttggagagtc tgcgcaagca agaggagcat gtgacagagc ctgcccctct cgtgtttgat 4980
tttgatgggc atgaatgaga cccagctgat tgcactaagc cctgccgtgg gcccagcccc 5040
tgccagcttc ccctatggat atgcctctgc tcccaacttc gccagcctcc aatgtacaac 5100
ttccgcgtgt agtgggcgtt gtcaccaccc accctacctg cagagttact aacttctcca 5160
aggagcatgt cactccagca gcacagggga cgcaatggga ggcagggaca cctggacaat 5220
atttattttt gctgaaaccc aatgacggca acctctgagc catcccagag cctggggagg 5280
ccagggtaga ggctgacggc gcaagaccag ctttagccga caacagagac tggactgtgg 5340
gccctcctgc tggagccagg ccttcctcct gggcgcctcc gactggctgg agctgccccc 5400
tccaggccag tttgaagact acatgaacac gtcttgtttg gaggtaccgg acctcataaa 5460
aggactctca gcctcttggc aatcataaat attaaagtcg gtttatccag gcaaaaaaaa 5520
aaaaaaaaaa aaaaaaaaaa aa 5542
<210> 19
<211> 1606
<212> PRT
<213> Homo sapiens
<400> 19
Met Asn Lys Ala Pro Gln Ser Thr Gly Pro Pro Pro Ala Pro Ser Pro
1 5 10 15
Gly Leu Pro Gln Pro Ala Phe Pro Pro Gly Gln Thr Ala Pro Val Val
20 25 30
Phe Ser Thr Pro Gln Ala Thr Gln Met Asn Thr Pro Ser Gln Pro Arg
35 40 45
Gln Gly Gly Phe Arg Ser Leu Gln His Phe Tyr Pro Ser Arg Ala Gln
50 55 60
Pro Pro Ser Ser Ala Ala Ser Arg Val Gln Ser Ala Ala Pro Ala Arg
65 70 75 80
Pro Gly Pro Ala Ala His Val Tyr Pro Ala Gly Ser Gln Val Met Met
85 90 95
Ile Pro Ser Gln Ile Ser Tyr Pro Ala Ser Gln Gly Ala Tyr Tyr Ile
100 105 110
Pro Gly Gln Gly Arg Ser Thr Tyr Val Val Pro Thr Gln Gln Tyr Pro
115 120 125
Val Gln Pro Gly Ala Pro Gly Phe Tyr Pro Gly Ala Ser Pro Thr Glu
130 135 140
Phe Gly Thr Tyr Ala Gly Ala Tyr Tyr Pro Ala Gln Gly Val Gln Gln
145 150 155 160
Phe Pro Thr Gly Val Ala Pro Ala Pro Val Leu Met Asn Gln Pro Pro
165 170 175
Gln Ile Ala Pro Lys Arg Glu Arg Lys Thr Ile Arg Ile Arg Asp Pro
180 185 190
Asn Gln Gly Gly Lys Asp Ile Thr Glu Glu Ile Met Ser Gly Ala Arg
195 200 205
Thr Ala Ser Thr Pro Thr Pro Pro Gln Thr Gly Gly Gly Leu Glu Pro
210 215 220
Gln Ala Asn Gly Glu Thr Pro Gln Val Ala Val Ile Val Arg Pro Asp
225 230 235 240
Asp Arg Ser Gln Gly Ala Ile Ile Ala Asp Arg Pro Gly Leu Pro Gly
245 250 255
Pro Glu His Ser Pro Ser Glu Ser Gln Pro Ser Ser Pro Ser Pro Thr
260 265 270
Pro Ser Pro Ser Pro Val Leu Glu Pro Gly Ser Glu Pro Asn Leu Ala
275 280 285
Val Leu Ser Ile Pro Gly Asp Thr Met Thr Thr Ile Gln Met Ser Val
290 295 300
Glu Glu Ser Thr Pro Ile Ser Arg Glu Thr Gly Glu Pro Tyr Arg Leu
305 310 315 320
Ser Pro Glu Pro Thr Pro Leu Ala Glu Pro Ile Leu Glu Val Glu Val
325 330 335
Thr Leu Ser Lys Pro Val Pro Glu Ser Glu Phe Ser Ser Ser Pro Leu
340 345 350
Gln Ala Pro Thr Pro Leu Ala Ser His Thr Val Glu Ile His Glu Pro
355 360 365
Asn Gly Met Val Pro Ser Glu Asp Leu Glu Pro Glu Val Glu Ser Ser
370 375 380
Pro Glu Leu Ala Pro Pro Pro Ala Cys Pro Ser Glu Ser Pro Val Pro
385 390 395 400
Ile Ala Pro Thr Ala Gln Pro Glu Glu Leu Leu Asn Gly Ala Pro Ser
405 410 415
Pro Pro Ala Val Asp Leu Ser Pro Val Ser Glu Pro Glu Glu Gln Ala
420 425 430
Lys Glu Val Thr Ala Ser Met Ala Pro Pro Thr Ile Pro Ser Ala Thr
435 440 445
Pro Ala Thr Ala Pro Ser Ala Thr Ser Pro Ala Gln Glu Glu Glu Met
450 455 460
Glu Glu Glu Glu Glu Glu Glu Glu Gly Glu Ala Gly Glu Ala Gly Glu
465 470 475 480
Ala Glu Ser Glu Lys Gly Gly Glu Glu Leu Leu Pro Pro Glu Ser Thr
485 490 495
Pro Ile Pro Ala Asn Leu Ser Gln Asn Leu Glu Ala Ala Ala Ala Thr
500 505 510
Gln Val Ala Val Ser Val Pro Lys Arg Arg Arg Lys Ile Lys Glu Leu
515 520 525
Asn Lys Lys Glu Ala Val Gly Asp Leu Leu Asp Ala Phe Lys Glu Ala
530 535 540
Asn Pro Ala Val Pro Glu Val Glu Asn Gln Pro Pro Ala Gly Ser Asn
545 550 555 560
Pro Gly Pro Glu Ser Glu Gly Ser Gly Val Pro Pro Arg Pro Glu Glu
565 570 575
Ala Asp Glu Thr Trp Asp Ser Lys Glu Asp Lys Ile His Asn Ala Glu
580 585 590
Asn Ile Gln Pro Gly Glu Gln Lys Tyr Glu Tyr Lys Ser Asp Gln Trp
595 600 605
Lys Pro Leu Asn Leu Glu Glu Lys Lys Arg Tyr Asp Arg Glu Phe Leu
610 615 620
Leu Gly Phe Gln Phe Ile Phe Ala Ser Met Gln Lys Pro Glu Gly Leu
625 630 635 640
Pro His Ile Ser Asp Val Val Leu Asp Lys Ala Asn Lys Thr Pro Leu
645 650 655
Arg Pro Leu Asp Pro Thr Arg Leu Gln Gly Ile Asn Cys Gly Pro Asp
660 665 670
Phe Thr Pro Ser Phe Ala Asn Leu Gly Arg Thr Thr Leu Ser Thr Arg
675 680 685
Gly Pro Pro Arg Gly Gly Pro Gly Gly Glu Leu Pro Arg Gly Pro Ala
690 695 700
Gly Leu Gly Pro Arg Arg Ser Gln Gln Gly Pro Arg Lys Glu Pro Arg
705 710 715 720
Lys Ile Ile Ala Thr Val Leu Met Thr Glu Asp Ile Lys Leu Asn Lys
725 730 735
Ala Glu Lys Ala Trp Lys Pro Ser Ser Lys Arg Thr Ala Ala Asp Lys
740 745 750
Asp Arg Gly Glu Glu Asp Ala Asp Gly Ser Lys Thr Gln Asp Leu Phe
755 760 765
Arg Arg Val Arg Ser Ile Leu Asn Lys Leu Thr Pro Gln Met Phe Gln
770 775 780
Gln Leu Met Lys Gln Val Thr Gln Leu Ala Ile Asp Thr Glu Glu Arg
785 790 795 800
Leu Lys Gly Val Ile Asp Leu Ile Phe Glu Lys Ala Ile Ser Glu Pro
805 810 815
Asn Phe Ser Val Ala Tyr Ala Asn Met Cys Arg Cys Leu Met Ala Leu
820 825 830
Lys Val Pro Thr Thr Glu Lys Pro Thr Val Thr Val Asn Phe Arg Lys
835 840 845
Leu Leu Leu Asn Arg Cys Gln Lys Glu Phe Glu Lys Asp Lys Asp Asp
850 855 860
Asp Glu Val Phe Glu Lys Lys Gln Lys Glu Met Asp Glu Ala Ala Thr
865 870 875 880
Ala Glu Glu Arg Gly Arg Leu Lys Glu Glu Leu Glu Glu Ala Arg Asp
885 890 895
Ile Ala Arg Arg Arg Ser Leu Gly Asn Ile Lys Phe Ile Gly Glu Leu
900 905 910
Phe Lys Leu Lys Met Leu Thr Glu Ala Ile Met His Asp Cys Val Val
915 920 925
Lys Leu Leu Lys Asn His Asp Glu Glu Ser Leu Glu Cys Leu Cys Arg
930 935 940
Leu Leu Thr Thr Ile Gly Lys Asp Leu Asp Phe Glu Lys Ala Lys Pro
945 950 955 960
Arg Met Asp Gln Tyr Phe Asn Gln Met Glu Lys Ile Ile Lys Glu Lys
965 970 975
Lys Thr Ser Ser Arg Ile Arg Phe Met Leu Gln Asp Val Leu Asp Leu
980 985 990
Arg Gly Ser Asn Trp Val Pro Arg Arg Gly Asp Gln Gly Pro Lys Thr
995 1000 1005
Ile Asp Gln Ile His Lys Glu Ala Glu Met Glu Glu His Arg Glu
1010 1015 1020
His Ile Lys Val Gln Gln Leu Met Ala Lys Gly Ser Asp Lys Arg
1025 1030 1035
Arg Gly Gly Pro Pro Gly Pro Pro Ile Ser Arg Gly Leu Pro Leu
1040 1045 1050
Val Asp Asp Gly Gly Trp Asn Thr Val Pro Ile Ser Lys Gly Ser
1055 1060 1065
Arg Pro Ile Asp Thr Ser Arg Leu Thr Lys Ile Thr Lys Pro Gly
1070 1075 1080
Ser Ile Asp Ser Asn Asn Gln Leu Phe Ala Pro Gly Gly Arg Leu
1085 1090 1095
Ser Trp Gly Lys Gly Ser Ser Gly Gly Ser Gly Ala Lys Pro Ser
1100 1105 1110
Asp Ala Ala Ser Glu Ala Ala Arg Pro Ala Thr Ser Thr Leu Asn
1115 1120 1125
Arg Phe Ser Ala Leu Gln Gln Ala Val Pro Thr Glu Ser Thr Asp
1130 1135 1140
Asn Arg Arg Val Val Gln Arg Ser Ser Leu Ser Arg Glu Arg Gly
1145 1150 1155
Glu Lys Ala Gly Asp Arg Gly Asp Arg Leu Glu Arg Ser Glu Arg
1160 1165 1170
Gly Gly Asp Arg Gly Asp Arg Leu Asp Arg Ala Arg Thr Pro Ala
1175 1180 1185
Thr Lys Arg Ser Phe Ser Lys Glu Val Glu Glu Arg Ser Arg Glu
1190 1195 1200
Arg Pro Ser Gln Pro Glu Gly Leu Arg Lys Ala Ala Ser Leu Thr
1205 1210 1215
Glu Asp Arg Asp Arg Gly Arg Asp Ala Val Lys Arg Glu Ala Ala
1220 1225 1230
Leu Pro Pro Val Ser Pro Leu Lys Ala Ala Leu Ser Glu Glu Glu
1235 1240 1245
Leu Glu Lys Lys Ser Lys Ala Ile Ile Glu Glu Tyr Leu His Leu
1250 1255 1260
Asn Asp Met Lys Glu Ala Val Gln Cys Val Gln Glu Leu Ala Ser
1265 1270 1275
Pro Ser Leu Leu Phe Ile Phe Val Arg His Gly Val Glu Ser Thr
1280 1285 1290
Leu Glu Arg Ser Ala Ile Ala Arg Glu His Met Gly Gln Leu Leu
1295 1300 1305
His Gln Leu Leu Cys Ala Gly His Leu Ser Thr Ala Gln Tyr Tyr
1310 1315 1320
Gln Gly Leu Tyr Glu Ile Leu Glu Leu Ala Glu Asp Met Glu Ile
1325 1330 1335
Asp Ile Pro His Val Trp Leu Tyr Leu Ala Glu Leu Val Thr Pro
1340 1345 1350
Ile Leu Gln Glu Gly Gly Val Pro Met Gly Glu Leu Phe Arg Glu
1355 1360 1365
Ile Thr Lys Pro Leu Arg Pro Leu Gly Lys Ala Ala Ser Leu Leu
1370 1375 1380
Leu Glu Ile Leu Gly Leu Leu Cys Lys Ser Met Gly Pro Lys Lys
1385 1390 1395
Val Gly Thr Leu Trp Arg Glu Ala Gly Leu Ser Trp Lys Glu Phe
1400 1405 1410
Leu Pro Glu Gly Gln Asp Ile Gly Ala Phe Val Ala Glu Gln Lys
1415 1420 1425
Val Glu Tyr Thr Leu Gly Glu Glu Ser Glu Ala Pro Gly Gln Arg
1430 1435 1440
Ala Leu Pro Ser Glu Glu Leu Asn Arg Gln Leu Glu Lys Leu Leu
1445 1450 1455
Lys Glu Gly Ser Ser Asn Gln Arg Val Phe Asp Trp Ile Glu Ala
1460 1465 1470
Asn Leu Ser Glu Gln Gln Ile Val Ser Asn Thr Leu Val Arg Ala
1475 1480 1485
Leu Met Thr Ala Val Cys Tyr Ser Ala Ile Ile Phe Glu Thr Pro
1490 1495 1500
Leu Arg Val Asp Val Ala Val Leu Lys Ala Arg Ala Lys Leu Leu
1505 1510 1515
Gln Lys Tyr Leu Cys Asp Glu Gln Lys Glu Leu Gln Ala Leu Tyr
1520 1525 1530
Ala Leu Gln Ala Leu Val Val Thr Leu Glu Gln Pro Pro Asn Leu
1535 1540 1545
Leu Arg Met Phe Phe Asp Ala Leu Tyr Asp Glu Asp Val Val Lys
1550 1555 1560
Glu Asp Ala Phe Tyr Ser Trp Glu Ser Ser Lys Asp Pro Ala Glu
1565 1570 1575
Gln Gln Gly Lys Gly Val Ala Leu Lys Ser Val Thr Ala Phe Phe
1580 1585 1590
Lys Trp Leu Arg Glu Ala Glu Glu Glu Ser Asp His Asn
1595 1600 1605
<210> 20
<211> 5559
<212> DNA
<213> Homo sapiens
<400> 20
cggcggcgca gatcgcccgg cgcggctccg ccccctgcgc cggtcacgtg ggggcgccgg 60
ctgcgcctgc ggagaagcgg tggccgccga gcgggatctg tgcggggagc cggaaatggt 120
tgtggactac gtctgtgcgg ctgcgtgggg ctcggccgcg cggactgaag gagactgaag 180
gccctcggat gcccagaacc tgtaggccgc accgtggact tgttcttaat cgagggggtg 240
ctggggggac cctgatgtgg caccaaatga aatgaacaaa gctccacagt ccacaggccc 300
cccacccgcc ccatcccccg gactcccaca gccagcgttt cccccggggc agacagcgcc 360
ggtggtgttc agtacgccac aagcgacaca aatgaacacg ccttctcagc cccgccaggg 420
aggattcagg tctctgcagc acttctaccc tagccgggcc cagcccccga gcagtgcagc 480
ctcccgagtg cagagtgcag cccctgcccg ccctggccca gctgcccatg tctaccctgc 540
tggatcccaa gtaatgatga tcccttccca gatctcctac ccagcctccc agggggccta 600
ctacatccct ggacaggggc gttccacata cgttgtcccg acacagcagt accctgtgca 660
gccaggagcc ccaggcttct atccaggtgc aagccctaca gaatttggga cctacgctgg 720
cgcctactat ccagcccaag gggtgcagca gtttcccact ggcgtggccc ccgccccagt 780
tttgatgaac cagccacccc agattgctcc caagagggag cgtaagacga tccgaattcg 840
agatccaaac caaggaggaa aggatatcac agaggagatc atgtctgggg cccgcactgc 900
ctccacaccc acccctcccc agacgggagg cggtctggag cctcaagcta atggggagac 960
gccccaggtt gctgtcattg tccggccaga tgaccggtca cagggagcaa tcattgctga 1020
ccggccaggg ctgcctggcc cagagcatag cccttcagaa tcccagcctt cgtcgccttc 1080
tccgacccca tcaccatccc cagtcttgga accggggtct gagcctaatc tcgcagtcct 1140
ctctattcct ggggacacta tgacaactat acaaatgtct gtagaagaat caacccccat 1200
ctcccgtgaa actggggagc catatcgcct ctctccagaa cccactcctc tcgccgaacc 1260
catactggaa gtagaagtga cacttagcaa accggttcca gaatctgagt tttcttccag 1320
tcctctccag gctcccaccc ctttggcatc tcacacagtg gaaattcatg agcctaatgg 1380
catggtccca tctgaagatc tggaaccaga ggtggagtca agcccagagc ttgctcctcc 1440
cccagcttgc ccctccgaat cccctgtgcc cattgctcca actgcccaac ctgaggaact 1500
gctcaacgga gccccctcgc caccagctgt ggacttaagc ccagtcagtg agccagagga 1560
gcaggccaag gaggtgacag catcaatggc gccccccacc atcccctctg ctactccagc 1620
tacggctcct tcagctactt ccccagctca ggaggaggaa atggaagaag aagaagaaga 1680
ggaagaagga gaagcaggag aagcaggaga agctgagagt gagaaaggag gagaggaact 1740
gctcccccca gagagtaccc ctattccagc caacttgtct cagaatttgg aggcagcagc 1800
agccactcaa gtggcagtat ctgtgccaaa gaggagacgg aaaattaagg agctaaataa 1860
gaaggaggct gttggagacc ttctggatgc cttcaaggag gcgaacccgg cagtaccaga 1920
ggtggaaaat cagcctcctg caggcagcaa tccaggccca gagtctgagg gcagtggtgt 1980
gcccccacgt cctgaggaag cagatgagac ctgggactca aaggaagaca aaattcacaa 2040
tgctgagaac atccagcccg gggaacagaa gtatgaatat aagtcagatc agtggaagcc 2100
tctaaaccta gaggagaaaa aacgttacga ccgtgagttc ctgcttggtt ttcagttcat 2160
ctttgccagt atgcagaagc cagagggatt gccacatatc agtgacgtgg tgctggacaa 2220
ggccaataaa acaccactgc ggccactgga tcccactaga ctacaaggca taaattgtgg 2280
cccagacttc actccatcct ttgccaacct tggccggaca acccttagca cccgtgggcc 2340
cccaaggggt gggccaggtg gggagctgcc ccgtgggccg gctggcctgg gaccccggcg 2400
ctctcagcag ggaccccgaa aagaaccacg caagatcatt gccacagtgt taatgaccga 2460
agatataaaa ctgaacaaag cagagaaagc ctggaaaccc agcagcaagc ggacggcggc 2520
tgataaggat cgaggggaag aagatgctga tggcagcaaa acccaggacc tattccgcag 2580
ggtgcgctcc atcctgaata aactgacacc ccagatgttc cagcagctga tgaagcaagt 2640
gacgcagctg gccatcgaca ccgaggaacg cctcaaaggg gtcattgacc tcatttttga 2700
gaaggccatt tcagagccca acttctctgt ggcctatgcc aacatgtgcc gctgcctcat 2760
ggcgctgaaa gtgcccacta cggaaaagcc aacagtgact gtgaacttcc gaaagctgtt 2820
gttgaatcga tgtcagaagg agtttgagaa agacaaagat gatgatgagg tttttgagaa 2880
gaagcaaaaa gagatggatg aagctgctac ggcagaggaa cgaggacgcc tgaaggaaga 2940
gctggaagag gctcgggaca tagcccggcg gcgctcttta gggaatatca agtttattgg 3000
agagttgttc aaactgaaga tgttaacaga ggcaataatg catgactgtg tggtcaaact 3060
gcttaagaac catgatgaag agtcccttga gtgcctttgt cgtctgctca ccaccattgg 3120
caaagacctg gactttgaaa aagccaagcc ccgaatggat cagtatttca accagatgga 3180
aaaaatcatt aaagaaaaga agacgtcatc ccgcatccgc tttatgctgc aggacgtgct 3240
ggatctgcga gggagcaatt gggtgccacg ccgaggggat cagggtccca agaccattga 3300
ccagatccat aaggaggctg agatggaaga acatcgagag cacatcaaag tgcagcagct 3360
catggccaag ggcagtgaca agcgtcgggg cggtcctcca ggccctccca tcagccgtgg 3420
acttcccctt gtggatgatg gtggctggaa cacagttccc atcagcaaag gtagccgccc 3480
cattgacacc tcacgactca ccaagatcac caagcctggc tccatcgatt ctaacaacca 3540
gctctttgca cctggagggc gactgagctg gggcaagggc agcagcggag gctcaggagc 3600
caagccctca gacgcagcat cagaagctgc tcgcccagct actagtactt tgaatcgctt 3660
ctcagccctt caacaagcgg tacccacaga aagcacagat aatagacgtg tggtgcagag 3720
gagtagcttg agccgagaac gaggcgagaa agctggagac cgaggagacc gcctagagcg 3780
gagtgaacgg ggaggggacc gtggggaccg gcttgatcgt gcgcggacac ctgctaccaa 3840
gcggagcttc agcaaggaag tggaggagcg gagtagagaa cggccctccc agcctgaggg 3900
gctgcgcaag gcagctagcc tcacggagga tcgggaccgt gggcgggatg ccgtgaagcg 3960
agaagctgcc ctacccccag tgagccccct gaaggcggct ctctctgagg aggagttaga 4020
gaagaaatcc aaggctatca ttgaggaata tctccatctc aatgacatga aagaggcagt 4080
ccagtgcgtg caggagctgg cctcaccctc cttgctcttc atctttgtac ggcatggtgt 4140
cgagtctacg ctggagcgca gtgccattgc tcgtgagcat atggggcagc tgctgcacca 4200
gctgctctgt gctgggcatc tgtctactgc tcagtactac caagggttgt atgaaatctt 4260
ggaattggct gaggacatgg aaattgacat cccccacgtg tggctctacc tagcggaact 4320
ggtaacaccc attctgcagg aaggtggggt gcccatgggg gagctgttca gggagattac 4380
aaagcctctg agaccgttgg gcaaagctgc ttccctgttg ctggagatcc tgggcctcct 4440
gtgcaaaagc atgggtccta aaaaggtggg gacgctgtgg cgagaagccg ggcttagctg 4500
gaaggaattt ctacctgaag gccaggacat tggtgcattc gtcgctgaac agaaggtgga 4560
gtataccctg ggagaggagt cggaagcccc tggccagagg gcactcccct ccgaggagct 4620
gaacaggcag ctggagaagc tgctgaagga gggcagcagt aaccagcggg tgttcgactg 4680
gatagaggcc aacctgagtg agcagcagat agtatccaac acgttagttc gagccctcat 4740
gacggctgtc tgctattctg caattatttt tgagactccc ctccgagtgg acgttgcagt 4800
gctgaaagcg cgagcgaagc tgctgcagaa atacctgtgt gacgagcaga aggagctaca 4860
ggcgctctac gccctccagg cccttgtagt gaccttagaa cagcctccca acctgctgcg 4920
gatgttcttt gacgcactgt atgacgagga cgtggtgaag gaggatgcct tctacagttg 4980
ggagagtagc aaggaccccg ctgagcagca gggcaagggt gtggccctta aatctgtcac 5040
agccttcttc aagtggctcc gtgaagcaga ggaggagtct gaccacaact gagggctggt 5100
ggggccgggg acctggagcc ccatggacac acagatggcc cggctagccg cctggactgc 5160
aggggggcgg cagcagcggc ggtggcagtg ggtgcctgta gtgtgatgtg tctgaactaa 5220
taaagtggct gaagaggcag gatggcttgg ggctgcctgg gcccccctcc aggatgccgc 5280
caggtgtccc tctcctcccc ctggggcaca gagatatatt atatataaag tcttgaaatt 5340
tggtgtgtct tggggtgggg aggggcacca acgcctgccc ctggggtcct tttttttatt 5400
ttctgaaaat cactctcggg actgccgtcc tcgctgctgg gggcatatgc cccagcccct 5460
gtaccacccc tgctgttgcc tgggcagggg gaaggggggg cacggtgcct gtaattatta 5520
aacatgaatt caattaagct caaaaaaaaa aaaaaaaaa 5559
<210> 21
<211> 1404
<212> PRT
<213> Homo sapiens
<400> 21
Met Ser Gly Ala Arg Thr Ala Ser Thr Pro Thr Pro Pro Gln Thr Gly
1 5 10 15
Gly Gly Leu Glu Pro Gln Ala Asn Gly Glu Thr Pro Gln Val Ala Val
20 25 30
Ile Val Arg Pro Asp Asp Arg Ser Gln Gly Ala Ile Ile Ala Asp Arg
35 40 45
Pro Gly Leu Pro Gly Pro Glu His Ser Pro Ser Glu Ser Gln Pro Ser
50 55 60
Ser Pro Ser Pro Thr Pro Ser Pro Ser Pro Val Leu Glu Pro Gly Ser
65 70 75 80
Glu Pro Asn Leu Ala Val Leu Ser Ile Pro Gly Asp Thr Met Thr Thr
85 90 95
Ile Gln Met Ser Val Glu Glu Ser Thr Pro Ile Ser Arg Glu Thr Gly
100 105 110
Glu Pro Tyr Arg Leu Ser Pro Glu Pro Thr Pro Leu Ala Glu Pro Ile
115 120 125
Leu Glu Val Glu Val Thr Leu Ser Lys Pro Val Pro Glu Ser Glu Phe
130 135 140
Ser Ser Ser Pro Leu Gln Ala Pro Thr Pro Leu Ala Ser His Thr Val
145 150 155 160
Glu Ile His Glu Pro Asn Gly Met Val Pro Ser Glu Asp Leu Glu Pro
165 170 175
Glu Val Glu Ser Ser Pro Glu Leu Ala Pro Pro Pro Ala Cys Pro Ser
180 185 190
Glu Ser Pro Val Pro Ile Ala Pro Thr Ala Gln Pro Glu Glu Leu Leu
195 200 205
Asn Gly Ala Pro Ser Pro Pro Ala Val Asp Leu Ser Pro Val Ser Glu
210 215 220
Pro Glu Glu Gln Ala Lys Glu Val Thr Ala Ser Met Ala Pro Pro Thr
225 230 235 240
Ile Pro Ser Ala Thr Pro Ala Thr Ala Pro Ser Ala Thr Ser Pro Ala
245 250 255
Gln Glu Glu Glu Met Glu Glu Glu Glu Glu Glu Glu Glu Gly Glu Ala
260 265 270
Gly Glu Ala Gly Glu Ala Glu Ser Glu Lys Gly Gly Glu Glu Leu Leu
275 280 285
Pro Pro Glu Ser Thr Pro Ile Pro Ala Asn Leu Ser Gln Asn Leu Glu
290 295 300
Ala Ala Ala Ala Thr Gln Val Ala Val Ser Val Pro Lys Arg Arg Arg
305 310 315 320
Lys Ile Lys Glu Leu Asn Lys Lys Glu Ala Val Gly Asp Leu Leu Asp
325 330 335
Ala Phe Lys Glu Ala Asn Pro Ala Val Pro Glu Val Glu Asn Gln Pro
340 345 350
Pro Ala Gly Ser Asn Pro Gly Pro Glu Ser Glu Gly Ser Gly Val Pro
355 360 365
Pro Arg Pro Glu Glu Ala Asp Glu Thr Trp Asp Ser Lys Glu Asp Lys
370 375 380
Ile His Asn Ala Glu Asn Ile Gln Pro Gly Glu Gln Lys Tyr Glu Tyr
385 390 395 400
Lys Ser Asp Gln Trp Lys Pro Leu Asn Leu Glu Glu Lys Lys Arg Tyr
405 410 415
Asp Arg Glu Phe Leu Leu Gly Phe Gln Phe Ile Phe Ala Ser Met Gln
420 425 430
Lys Pro Glu Gly Leu Pro His Ile Ser Asp Val Val Leu Asp Lys Ala
435 440 445
Asn Lys Thr Pro Leu Arg Pro Leu Asp Pro Thr Arg Leu Gln Gly Ile
450 455 460
Asn Cys Gly Pro Asp Phe Thr Pro Ser Phe Ala Asn Leu Gly Arg Thr
465 470 475 480
Thr Leu Ser Thr Arg Gly Pro Pro Arg Gly Gly Pro Gly Gly Glu Leu
485 490 495
Pro Arg Gly Pro Gln Ala Gly Leu Gly Pro Arg Arg Ser Gln Gln Gly
500 505 510
Pro Arg Lys Glu Pro Arg Lys Ile Ile Ala Thr Val Leu Met Thr Glu
515 520 525
Asp Ile Lys Leu Asn Lys Ala Glu Lys Ala Trp Lys Pro Ser Ser Lys
530 535 540
Arg Thr Ala Ala Asp Lys Asp Arg Gly Glu Glu Asp Ala Asp Gly Ser
545 550 555 560
Lys Thr Gln Asp Leu Phe Arg Arg Val Arg Ser Ile Leu Asn Lys Leu
565 570 575
Thr Pro Gln Met Phe Gln Gln Leu Met Lys Gln Val Thr Gln Leu Ala
580 585 590
Ile Asp Thr Glu Glu Arg Leu Lys Gly Val Ile Asp Leu Ile Phe Glu
595 600 605
Lys Ala Ile Ser Glu Pro Asn Phe Ser Val Ala Tyr Ala Asn Met Cys
610 615 620
Arg Cys Leu Met Ala Leu Lys Val Pro Thr Thr Glu Lys Pro Thr Val
625 630 635 640
Thr Val Asn Phe Arg Lys Leu Leu Leu Asn Arg Cys Gln Lys Glu Phe
645 650 655
Glu Lys Asp Lys Asp Asp Asp Glu Val Phe Glu Lys Lys Gln Lys Glu
660 665 670
Met Asp Glu Ala Ala Thr Ala Glu Glu Arg Gly Arg Leu Lys Glu Glu
675 680 685
Leu Glu Glu Ala Arg Asp Ile Ala Arg Arg Arg Ser Leu Gly Asn Ile
690 695 700
Lys Phe Ile Gly Glu Leu Phe Lys Leu Lys Met Leu Thr Glu Ala Ile
705 710 715 720
Met His Asp Cys Val Val Lys Leu Leu Lys Asn His Asp Glu Glu Ser
725 730 735
Leu Glu Cys Leu Cys Arg Leu Leu Thr Thr Ile Gly Lys Asp Leu Asp
740 745 750
Phe Glu Lys Ala Lys Pro Arg Met Asp Gln Tyr Phe Asn Gln Met Glu
755 760 765
Lys Ile Ile Lys Glu Lys Lys Thr Ser Ser Arg Ile Arg Phe Met Leu
770 775 780
Gln Asp Val Leu Asp Leu Arg Gly Ser Asn Trp Val Pro Arg Arg Gly
785 790 795 800
Asp Gln Gly Pro Lys Thr Ile Asp Gln Ile His Lys Glu Ala Glu Met
805 810 815
Glu Glu His Arg Glu His Ile Lys Val Gln Gln Leu Met Ala Lys Gly
820 825 830
Ser Asp Lys Arg Arg Gly Gly Pro Pro Gly Pro Pro Ile Ser Arg Gly
835 840 845
Leu Pro Leu Val Asp Asp Gly Gly Trp Asn Thr Val Pro Ile Ser Lys
850 855 860
Gly Ser Arg Pro Ile Asp Thr Ser Arg Leu Thr Lys Ile Thr Lys Pro
865 870 875 880
Gly Ser Ile Asp Ser Asn Asn Gln Leu Phe Ala Pro Gly Gly Arg Leu
885 890 895
Ser Trp Gly Lys Gly Ser Ser Gly Gly Ser Gly Ala Lys Pro Ser Asp
900 905 910
Ala Ala Ser Glu Ala Ala Arg Pro Ala Thr Ser Thr Leu Asn Arg Phe
915 920 925
Ser Ala Leu Gln Gln Ala Val Pro Thr Glu Ser Thr Asp Asn Arg Arg
930 935 940
Val Val Gln Arg Ser Ser Leu Ser Arg Glu Arg Gly Glu Lys Ala Gly
945 950 955 960
Asp Arg Gly Asp Arg Leu Glu Arg Ser Glu Arg Gly Gly Asp Arg Gly
965 970 975
Asp Arg Leu Asp Arg Ala Arg Thr Pro Ala Thr Lys Arg Ser Phe Ser
980 985 990
Lys Glu Val Glu Glu Arg Ser Arg Glu Arg Pro Ser Gln Pro Glu Gly
995 1000 1005
Leu Arg Lys Ala Ala Ser Leu Thr Glu Asp Arg Asp Arg Gly Arg
1010 1015 1020
Asp Ala Val Lys Arg Glu Ala Ala Leu Pro Pro Val Ser Pro Leu
1025 1030 1035
Lys Ala Ala Leu Ser Glu Glu Glu Leu Glu Lys Lys Ser Lys Ala
1040 1045 1050
Ile Ile Glu Glu Tyr Leu His Leu Asn Asp Met Lys Glu Ala Val
1055 1060 1065
Gln Cys Val Gln Glu Leu Ala Ser Pro Ser Leu Leu Phe Ile Phe
1070 1075 1080
Val Arg His Gly Val Glu Ser Thr Leu Glu Arg Ser Ala Ile Ala
1085 1090 1095
Arg Glu His Met Gly Gln Leu Leu His Gln Leu Leu Cys Ala Gly
1100 1105 1110
His Leu Ser Thr Ala Gln Tyr Tyr Gln Gly Leu Tyr Glu Ile Leu
1115 1120 1125
Glu Leu Ala Glu Asp Met Glu Ile Asp Ile Pro His Val Trp Leu
1130 1135 1140
Tyr Leu Ala Glu Leu Val Thr Pro Ile Leu Gln Glu Gly Gly Val
1145 1150 1155
Pro Met Gly Glu Leu Phe Arg Glu Ile Thr Lys Pro Leu Arg Pro
1160 1165 1170
Leu Gly Lys Ala Ala Ser Leu Leu Leu Glu Ile Leu Gly Leu Leu
1175 1180 1185
Cys Lys Ser Met Gly Pro Lys Lys Val Gly Thr Leu Trp Arg Glu
1190 1195 1200
Ala Gly Leu Ser Trp Lys Glu Phe Leu Pro Glu Gly Gln Asp Ile
1205 1210 1215
Gly Ala Phe Val Ala Glu Gln Lys Val Glu Tyr Thr Leu Gly Glu
1220 1225 1230
Glu Ser Glu Ala Pro Gly Gln Arg Ala Leu Pro Ser Glu Glu Leu
1235 1240 1245
Asn Arg Gln Leu Glu Lys Leu Leu Lys Glu Gly Ser Ser Asn Gln
1250 1255 1260
Arg Val Phe Asp Trp Ile Glu Ala Asn Leu Ser Glu Gln Gln Ile
1265 1270 1275
Val Ser Asn Thr Leu Val Arg Ala Leu Met Thr Ala Val Cys Tyr
1280 1285 1290
Ser Ala Ile Ile Phe Glu Thr Pro Leu Arg Val Asp Val Ala Val
1295 1300 1305
Leu Lys Ala Arg Ala Lys Leu Leu Gln Lys Tyr Leu Cys Asp Glu
1310 1315 1320
Gln Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala Leu Val Val
1325 1330 1335
Thr Leu Glu Gln Pro Pro Asn Leu Leu Arg Met Phe Phe Asp Ala
1340 1345 1350
Leu Tyr Asp Glu Asp Val Val Lys Glu Asp Ala Phe Tyr Ser Trp
1355 1360 1365
Glu Ser Ser Lys Asp Pro Ala Glu Gln Gln Gly Lys Gly Val Ala
1370 1375 1380
Leu Lys Ser Val Thr Ala Phe Phe Lys Trp Leu Arg Glu Ala Glu
1385 1390 1395
Glu Glu Ser Asp His Asn
1400
<210> 22
<211> 5050
<212> DNA
<213> Homo sapiens
<400> 22
tctagatggg ggtcctgggc cccagggtgt gcagccactg acttggggac tgctggtggg 60
gtagggatga gggagggagg ggcattgtga tgtacagggc tgctctgtga gatcaagggt 120
ctcttaaggg tgggagctgg ggcagggact acgagagcag ccagatgggc tgaaagtgga 180
actcaagggg tttctggcac ctacctacct gcttcccgct ggggggtggg gagttggccc 240
agagtcttaa gattggggca gggtggagag gtgggctctt cctgcttccc actcatctta 300
tagctttctt tccccagatc cgaattcgag atccaaacca aggaggaaag gatatcacag 360
aggagatcat gtctggggcc cgcactgcct ccacacccac ccctccccag acgggaggcg 420
gtctggagcc tcaagctaat ggggagacgc cccaggttgc tgtcattgtc cggccagatg 480
accggtcaca gggagcaatc attgctgacc ggccagggct gcctggccca gagcatagcc 540
cttcagaatc ccagccttcg tcgccttctc cgaccccatc accatcccca gtcttggaac 600
cggggtctga gcctaatctc gcagtcctct ctattcctgg ggacactatg acaactatac 660
aaatgtctgt agaagaatca acccccatct cccgtgaaac tggggagcca tatcgcctct 720
ctccagaacc cactcctctc gccgaaccca tactggaagt agaagtgaca cttagcaaac 780
cggttccaga atctgagttt tcttccagtc ctctccaggc tcccacccct ttggcatctc 840
acacagtgga aattcatgag cctaatggca tggtcccatc tgaagatctg gaaccagagg 900
tggagtcaag cccagagctt gctcctcccc cagcttgccc ctccgaatcc cctgtgccca 960
ttgctccaac tgcccaacct gaggaactgc tcaacggagc cccctcgcca ccagctgtgg 1020
acttaagccc agtcagtgag ccagaggagc aggccaagga ggtgacagca tcaatggcgc 1080
cccccaccat cccctctgct actccagcta cggctccttc agctacttcc ccagctcagg 1140
aggaggaaat ggaagaagaa gaagaagagg aagaaggaga agcaggagaa gcaggagaag 1200
ctgagagtga gaaaggagga gaggaactgc tccccccaga gagtacccct attccagcca 1260
acttgtctca gaatttggag gcagcagcag ccactcaagt ggcagtatct gtgccaaaga 1320
ggagacggaa aattaaggag ctaaataaga aggaggctgt tggagacctt ctggatgcct 1380
tcaaggaggc gaacccggca gtaccagagg tggaaaatca gcctcctgca ggcagcaatc 1440
caggcccaga gtctgagggc agtggtgtgc ccccacgtcc tgaggaagca gatgagacct 1500
gggactcaaa ggaagacaaa attcacaatg ctgagaacat ccagcccggg gaacagaagt 1560
atgaatataa gtcagatcag tggaagcctc taaacctaga ggagaaaaaa cgttacgacc 1620
gtgagttcct gcttggtttt cagttcatct ttgccagtat gcagaagcca gagggattgc 1680
cacatatcag tgacgtggtg ctggacaagg ccaataaaac accactgcgg ccactggatc 1740
ccactagact acaaggcata aattgtggcc cagacttcac tccatccttt gccaaccttg 1800
gccggacaac ccttagcacc cgtgggcccc caaggggtgg gccaggtggg gagctgcccc 1860
gtgggccgca ggctggcctg ggaccccggc gctctcagca gggaccccga aaagaaccac 1920
gcaagatcat tgccacagtg ttaatgaccg aagatataaa actgaacaaa gcagagaaag 1980
cctggaaacc cagcagcaag cggacggcgg ctgataagga tcgaggggaa gaagatgctg 2040
atggcagcaa aacccaggac ctattccgca gggtgcgctc catcctgaat aaactgacac 2100
cccagatgtt ccagcagctg atgaagcaag tgacgcagct ggccatcgac accgaggaac 2160
gcctcaaagg ggtcattgac ctcatttttg agaaggccat ttcagagccc aacttctctg 2220
tggcctatgc caacatgtgc cgctgcctca tggcgctgaa agtgcccact acggaaaagc 2280
caacagtgac tgtgaacttc cgaaagctgt tgttgaatcg atgtcagaag gagtttgaga 2340
aagacaaaga tgatgatgag gtttttgaga agaagcaaaa agagatggat gaagctgcta 2400
cggcagagga acgaggacgc ctgaaggaag agctggaaga ggctcgggac atagcccggc 2460
ggcgctcttt agggaatatc aagtttattg gagagttgtt caaactgaag atgttaacag 2520
aggcaataat gcatgactgt gtggtcaaac tgcttaagaa ccatgatgaa gagtcccttg 2580
agtgcctttg tcgtctgctc accaccattg gcaaagacct ggactttgaa aaagccaagc 2640
cccgaatgga tcagtatttc aaccagatgg aaaaaatcat taaagaaaag aagacgtcat 2700
cccgcatccg ctttatgctg caggacgtgc tggatctgcg agggagcaat tgggtgccac 2760
gccgagggga tcagggtccc aagaccattg accagatcca taaggaggct gagatggaag 2820
aacatcgaga gcacatcaaa gtgcagcagc tcatggccaa gggcagtgac aagcgtcggg 2880
gcggtcctcc aggccctccc atcagccgtg gacttcccct tgtggatgat ggtggctgga 2940
acacagttcc catcagcaaa ggtagccgcc ccattgacac ctcacgactc accaagatca 3000
ccaagcctgg ctccatcgat tctaacaacc agctctttgc acctggaggg cgactgagct 3060
ggggcaaggg cagcagcgga ggctcaggag ccaagccctc agacgcagca tcagaagctg 3120
ctcgcccagc tactagtact ttgaatcgct tctcagccct tcaacaagcg gtacccacag 3180
aaagcacaga taatagacgt gtggtgcaga ggagtagctt gagccgagaa cgaggcgaga 3240
aagctggaga ccgaggagac cgcctagagc ggagtgaacg gggaggggac cgtggggacc 3300
ggcttgatcg tgcgcggaca cctgctacca agcggagctt cagcaaggaa gtggaggagc 3360
ggagtagaga acggccctcc cagcctgagg ggctgcgcaa ggcagctagc ctcacggagg 3420
atcgggaccg tgggcgggat gccgtgaagc gagaagctgc cctaccccca gtgagccccc 3480
tgaaggcggc tctctctgag gaggagttag agaagaaatc caaggctatc attgaggaat 3540
atctccatct caatgacatg aaagaggcag tccagtgcgt gcaggagctg gcctcaccct 3600
ccttgctctt catctttgta cggcatggtg tcgagtctac gctggagcgc agtgccattg 3660
ctcgtgagca tatggggcag ctgctgcacc agctgctctg tgctgggcat ctgtctactg 3720
ctcagtacta ccaagggttg tatgaaatct tggaattggc tgaggacatg gaaattgaca 3780
tcccccacgt gtggctctac ctagcggaac tggtaacacc cattctgcag gaaggtgggg 3840
tgcccatggg ggagctgttc agggagatta caaagcctct gagaccgttg ggcaaagctg 3900
cttccctgtt gctggagatc ctgggcctcc tgtgcaaaag catgggtcct aaaaaggtgg 3960
ggacgctgtg gcgagaagcc gggcttagct ggaaggaatt tctacctgaa ggccaggaca 4020
ttggtgcatt cgtcgctgaa cagaaggtgg agtataccct gggagaggag tcggaagccc 4080
ctggccagag ggcactcccc tccgaggagc tgaacaggca gctggagaag ctgctgaagg 4140
agggcagcag taaccagcgg gtgttcgact ggatagaggc caacctgagt gagcagcaga 4200
tagtatccaa cacgttagtt cgagccctca tgacggctgt ctgctattct gcaattattt 4260
ttgagactcc cctccgagtg gacgttgcag tgctgaaagc gcgagcgaag ctgctgcaga 4320
aatacctgtg tgacgagcag aaggagctac aggcgctcta cgccctccag gcccttgtag 4380
tgaccttaga acagcctccc aacctgctgc ggatgttctt tgacgcactg tatgacgagg 4440
acgtggtgaa ggaggatgcc ttctacagtt gggagagtag caaggacccc gctgagcagc 4500
agggcaaggg tgtggccctt aaatctgtca cagccttctt caagtggctc cgtgaagcag 4560
aggaggagtc tgaccacaac tgagggctgg tggggccggg gacctggagc cccatggaca 4620
cacagatggc ccggctagcc gcctggactg caggggggcg gcagcagcgg cggtggcagt 4680
gggtgcctgt agtgtgatgt gtctgaacta ataaagtggc tgaagaggca ggatggcttg 4740
gggctgcctg ggcccccctc caggatgccg ccaggtgtcc ctctcctccc cctggggcac 4800
agagatatat tatatataaa gtcttgaaat ttggtgtgtc ttggggtggg gaggggcacc 4860
aacgcctgcc cctggggtcc ttttttttat tttctgaaaa tcactctcgg gactgccgtc 4920
ctcgctgctg ggggcatatg ccccagcccc tgtaccaccc ctgctgttgc ctgggcaggg 4980
ggaagggggg gcacggtgcc tgtaattatt aaacatgaat tcaattaagc tcaaaaaaaa 5040
aaaaaaaaaa 5050
<210> 23
<211> 1600
<212> PRT
<213> Homo sapiens
<400> 23
Met Asn Lys Ala Pro Gln Ser Thr Gly Pro Pro Pro Ala Pro Ser Pro
1 5 10 15
Gly Leu Pro Gln Pro Ala Phe Pro Pro Gly Gln Thr Ala Pro Val Val
20 25 30
Phe Ser Thr Pro Gln Ala Thr Gln Met Asn Thr Pro Ser Gln Pro Arg
35 40 45
Gln His Phe Tyr Pro Ser Arg Ala Gln Pro Pro Ser Ser Ala Ala Ser
50 55 60
Arg Val Gln Ser Ala Ala Pro Ala Arg Pro Gly Pro Ala Ala His Val
65 70 75 80
Tyr Pro Ala Gly Ser Gln Val Met Met Ile Pro Ser Gln Ile Ser Tyr
85 90 95
Pro Ala Ser Gln Gly Ala Tyr Tyr Ile Pro Gly Gln Gly Arg Ser Thr
100 105 110
Tyr Val Val Pro Thr Gln Gln Tyr Pro Val Gln Pro Gly Ala Pro Gly
115 120 125
Phe Tyr Pro Gly Ala Ser Pro Thr Glu Phe Gly Thr Tyr Ala Gly Ala
130 135 140
Tyr Tyr Pro Ala Gln Gly Val Gln Gln Phe Pro Thr Gly Val Ala Pro
145 150 155 160
Ala Pro Val Leu Met Asn Gln Pro Pro Gln Ile Ala Pro Lys Arg Glu
165 170 175
Arg Lys Thr Ile Arg Ile Arg Asp Pro Asn Gln Gly Gly Lys Asp Ile
180 185 190
Thr Glu Glu Ile Met Ser Gly Ala Arg Thr Ala Ser Thr Pro Thr Pro
195 200 205
Pro Gln Thr Gly Gly Gly Leu Glu Pro Gln Ala Asn Gly Glu Thr Pro
210 215 220
Gln Val Ala Val Ile Val Arg Pro Asp Asp Arg Ser Gln Gly Ala Ile
225 230 235 240
Ile Ala Asp Arg Pro Gly Leu Pro Gly Pro Glu His Ser Pro Ser Glu
245 250 255
Ser Gln Pro Ser Ser Pro Ser Pro Thr Pro Ser Pro Ser Pro Val Leu
260 265 270
Glu Pro Gly Ser Glu Pro Asn Leu Ala Val Leu Ser Ile Pro Gly Asp
275 280 285
Thr Met Thr Thr Ile Gln Met Ser Val Glu Glu Ser Thr Pro Ile Ser
290 295 300
Arg Glu Thr Gly Glu Pro Tyr Arg Leu Ser Pro Glu Pro Thr Pro Leu
305 310 315 320
Ala Glu Pro Ile Leu Glu Val Glu Val Thr Leu Ser Lys Pro Val Pro
325 330 335
Glu Ser Glu Phe Ser Ser Ser Pro Leu Gln Ala Pro Thr Pro Leu Ala
340 345 350
Ser His Thr Val Glu Ile His Glu Pro Asn Gly Met Val Pro Ser Glu
355 360 365
Asp Leu Glu Pro Glu Val Glu Ser Ser Pro Glu Leu Ala Pro Pro Pro
370 375 380
Ala Cys Pro Ser Glu Ser Pro Val Pro Ile Ala Pro Thr Ala Gln Pro
385 390 395 400
Glu Glu Leu Leu Asn Gly Ala Pro Ser Pro Pro Ala Val Asp Leu Ser
405 410 415
Pro Val Ser Glu Pro Glu Glu Gln Ala Lys Glu Val Thr Ala Ser Met
420 425 430
Ala Pro Pro Thr Ile Pro Ser Ala Thr Pro Ala Thr Ala Pro Ser Ala
435 440 445
Thr Ser Pro Ala Gln Glu Glu Glu Met Glu Glu Glu Glu Glu Glu Glu
450 455 460
Glu Gly Glu Ala Gly Glu Ala Gly Glu Ala Glu Ser Glu Lys Gly Gly
465 470 475 480
Glu Glu Leu Leu Pro Pro Glu Ser Thr Pro Ile Pro Ala Asn Leu Ser
485 490 495
Gln Asn Leu Glu Ala Ala Ala Ala Thr Gln Val Ala Val Ser Val Pro
500 505 510
Lys Arg Arg Arg Lys Ile Lys Glu Leu Asn Lys Lys Glu Ala Val Gly
515 520 525
Asp Leu Leu Asp Ala Phe Lys Glu Ala Asn Pro Ala Val Pro Glu Val
530 535 540
Glu Asn Gln Pro Pro Ala Gly Ser Asn Pro Gly Pro Glu Ser Glu Gly
545 550 555 560
Ser Gly Val Pro Pro Arg Pro Glu Glu Ala Asp Glu Thr Trp Asp Ser
565 570 575
Lys Glu Asp Lys Ile His Asn Ala Glu Asn Ile Gln Pro Gly Glu Gln
580 585 590
Lys Tyr Glu Tyr Lys Ser Asp Gln Trp Lys Pro Leu Asn Leu Glu Glu
595 600 605
Lys Lys Arg Tyr Asp Arg Glu Phe Leu Leu Gly Phe Gln Phe Ile Phe
610 615 620
Ala Ser Met Gln Lys Pro Glu Gly Leu Pro His Ile Ser Asp Val Val
625 630 635 640
Leu Asp Lys Ala Asn Lys Thr Pro Leu Arg Pro Leu Asp Pro Thr Arg
645 650 655
Leu Gln Gly Ile Asn Cys Gly Pro Asp Phe Thr Pro Ser Phe Ala Asn
660 665 670
Leu Gly Arg Thr Thr Leu Ser Thr Arg Gly Pro Pro Arg Gly Gly Pro
675 680 685
Gly Gly Glu Leu Pro Arg Gly Pro Gln Ala Gly Leu Gly Pro Arg Arg
690 695 700
Ser Gln Gln Gly Pro Arg Lys Glu Pro Arg Lys Ile Ile Ala Thr Val
705 710 715 720
Leu Met Thr Glu Asp Ile Lys Leu Asn Lys Ala Glu Lys Ala Trp Lys
725 730 735
Pro Ser Ser Lys Arg Thr Ala Ala Asp Lys Asp Arg Gly Glu Glu Asp
740 745 750
Ala Asp Gly Ser Lys Thr Gln Asp Leu Phe Arg Arg Val Arg Ser Ile
755 760 765
Leu Asn Lys Leu Thr Pro Gln Met Phe Gln Gln Leu Met Lys Gln Val
770 775 780
Thr Gln Leu Ala Ile Asp Thr Glu Glu Arg Leu Lys Gly Val Ile Asp
785 790 795 800
Leu Ile Phe Glu Lys Ala Ile Ser Glu Pro Asn Phe Ser Val Ala Tyr
805 810 815
Ala Asn Met Cys Arg Cys Leu Met Ala Leu Lys Val Pro Thr Thr Glu
820 825 830
Lys Pro Thr Val Thr Val Asn Phe Arg Lys Leu Leu Leu Asn Arg Cys
835 840 845
Gln Lys Glu Phe Glu Lys Asp Lys Asp Asp Asp Glu Val Phe Glu Lys
850 855 860
Lys Gln Lys Glu Met Asp Glu Ala Ala Thr Ala Glu Glu Arg Gly Arg
865 870 875 880
Leu Lys Glu Glu Leu Glu Glu Ala Arg Asp Ile Ala Arg Arg Arg Ser
885 890 895
Leu Gly Asn Ile Lys Phe Ile Gly Glu Leu Phe Lys Leu Lys Met Leu
900 905 910
Thr Glu Ala Ile Met His Asp Cys Val Val Lys Leu Leu Lys Asn His
915 920 925
Asp Glu Glu Ser Leu Glu Cys Leu Cys Arg Leu Leu Thr Thr Ile Gly
930 935 940
Lys Asp Leu Asp Phe Glu Lys Ala Lys Pro Arg Met Asp Gln Tyr Phe
945 950 955 960
Asn Gln Met Glu Lys Ile Ile Lys Glu Lys Lys Thr Ser Ser Arg Ile
965 970 975
Arg Phe Met Leu Gln Asp Val Leu Asp Leu Arg Gly Ser Asn Trp Val
980 985 990
Pro Arg Arg Gly Asp Gln Gly Pro Lys Thr Ile Asp Gln Ile His Lys
995 1000 1005
Glu Ala Glu Met Glu Glu His Arg Glu His Ile Lys Val Gln Gln
1010 1015 1020
Leu Met Ala Lys Gly Ser Asp Lys Arg Arg Gly Gly Pro Pro Gly
1025 1030 1035
Pro Pro Ile Ser Arg Gly Leu Pro Leu Val Asp Asp Gly Gly Trp
1040 1045 1050
Asn Thr Val Pro Ile Ser Lys Gly Ser Arg Pro Ile Asp Thr Ser
1055 1060 1065
Arg Leu Thr Lys Ile Thr Lys Pro Gly Ser Ile Asp Ser Asn Asn
1070 1075 1080
Gln Leu Phe Ala Pro Gly Gly Arg Leu Ser Trp Gly Lys Gly Ser
1085 1090 1095
Ser Gly Gly Ser Gly Ala Lys Pro Ser Asp Ala Ala Ser Glu Ala
1100 1105 1110
Ala Arg Pro Ala Thr Ser Thr Leu Asn Arg Phe Ser Ala Leu Gln
1115 1120 1125
Gln Ala Val Pro Thr Glu Ser Thr Asp Asn Arg Arg Val Val Gln
1130 1135 1140
Arg Ser Ser Leu Ser Arg Glu Arg Gly Glu Lys Ala Gly Asp Arg
1145 1150 1155
Gly Asp Arg Leu Glu Arg Ser Glu Arg Gly Gly Asp Arg Gly Asp
1160 1165 1170
Arg Leu Asp Arg Ala Arg Thr Pro Ala Thr Lys Arg Ser Phe Ser
1175 1180 1185
Lys Glu Val Glu Glu Arg Ser Arg Glu Arg Pro Ser Gln Pro Glu
1190 1195 1200
Gly Leu Arg Lys Ala Ala Ser Leu Thr Glu Asp Arg Asp Arg Gly
1205 1210 1215
Arg Asp Ala Val Lys Arg Glu Ala Ala Leu Pro Pro Val Ser Pro
1220 1225 1230
Leu Lys Ala Ala Leu Ser Glu Glu Glu Leu Glu Lys Lys Ser Lys
1235 1240 1245
Ala Ile Ile Glu Glu Tyr Leu His Leu Asn Asp Met Lys Glu Ala
1250 1255 1260
Val Gln Cys Val Gln Glu Leu Ala Ser Pro Ser Leu Leu Phe Ile
1265 1270 1275
Phe Val Arg His Gly Val Glu Ser Thr Leu Glu Arg Ser Ala Ile
1280 1285 1290
Ala Arg Glu His Met Gly Gln Leu Leu His Gln Leu Leu Cys Ala
1295 1300 1305
Gly His Leu Ser Thr Ala Gln Tyr Tyr Gln Gly Leu Tyr Glu Ile
1310 1315 1320
Leu Glu Leu Ala Glu Asp Met Glu Ile Asp Ile Pro His Val Trp
1325 1330 1335
Leu Tyr Leu Ala Glu Leu Val Thr Pro Ile Leu Gln Glu Gly Gly
1340 1345 1350
Val Pro Met Gly Glu Leu Phe Arg Glu Ile Thr Lys Pro Leu Arg
1355 1360 1365
Pro Leu Gly Lys Ala Ala Ser Leu Leu Leu Glu Ile Leu Gly Leu
1370 1375 1380
Leu Cys Lys Ser Met Gly Pro Lys Lys Val Gly Thr Leu Trp Arg
1385 1390 1395
Glu Ala Gly Leu Ser Trp Lys Glu Phe Leu Pro Glu Gly Gln Asp
1400 1405 1410
Ile Gly Ala Phe Val Ala Glu Gln Lys Val Glu Tyr Thr Leu Gly
1415 1420 1425
Glu Glu Ser Glu Ala Pro Gly Gln Arg Ala Leu Pro Ser Glu Glu
1430 1435 1440
Leu Asn Arg Gln Leu Glu Lys Leu Leu Lys Glu Gly Ser Ser Asn
1445 1450 1455
Gln Arg Val Phe Asp Trp Ile Glu Ala Asn Leu Ser Glu Gln Gln
1460 1465 1470
Ile Val Ser Asn Thr Leu Val Arg Ala Leu Met Thr Ala Val Cys
1475 1480 1485
Tyr Ser Ala Ile Ile Phe Glu Thr Pro Leu Arg Val Asp Val Ala
1490 1495 1500
Val Leu Lys Ala Arg Ala Lys Leu Leu Gln Lys Tyr Leu Cys Asp
1505 1510 1515
Glu Gln Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala Leu Val
1520 1525 1530
Val Thr Leu Glu Gln Pro Pro Asn Leu Leu Arg Met Phe Phe Asp
1535 1540 1545
Ala Leu Tyr Asp Glu Asp Val Val Lys Glu Asp Ala Phe Tyr Ser
1550 1555 1560
Trp Glu Ser Ser Lys Asp Pro Ala Glu Gln Gln Gly Lys Gly Val
1565 1570 1575
Ala Leu Lys Ser Val Thr Ala Phe Phe Lys Trp Leu Arg Glu Ala
1580 1585 1590
Glu Glu Glu Ser Asp His Asn
1595 1600
<210> 24
<211> 5686
<212> DNA
<213> Homo sapiens
<400> 24
tcacttgcct gaaaccggct cctcgacggc cgccgcccgc ctggcctttt agggcctgac 60
tcccgccctt cctggcctac actcctgggc ggcggcaggc ctagcttctg gcccagtgcg 120
ggttccccgg cggcaggcgt atcctgtgtg cccctgggcc aggcccgaac ccggtgtccc 180
cgggtggggg gtggggacgc cacggccgaa gcagctagct ccgttcgtga tccgggagcc 240
tggtgccagc gagacctgga atttccggtc tggttggtct ggggccccgc ggagccaggt 300
tgataccctc acctcccaac cccaggccct cggatgccca gaacctgtag gccgcaccgt 360
ggacttgttc ttaatcgagg gggtgctggg gggaccctga tgtggcacca aatgaaatga 420
acaaagctcc acagtccaca ggccccccac ccgccccatc ccccggactc ccacagccag 480
cgtttccccc ggggcagaca gcgccggtgg tgttcagtac gccacaagcg acacaaatga 540
acacgccttc tcagccccgc cagcacttct accctagccg ggcccagccc ccgagcagtg 600
cagcctcccg agtgcagagt gcagcccctg cccgccctgg cccagctgcc catgtctacc 660
ctgctggatc ccaagtaatg atgatccctt cccagatctc ctacccagcc tcccaggggg 720
cctactacat ccctggacag gggcgttcca catacgttgt cccgacacag cagtaccctg 780
tgcagccagg agccccaggc ttctatccag gtgcaagccc tacagaattt gggacctacg 840
ctggcgccta ctatccagcc caaggggtgc agcagtttcc cactggcgtg gcccccgccc 900
cagttttgat gaaccagcca ccccagattg ctcccaagag ggagcgtaag acgatccgaa 960
ttcgagatcc aaaccaagga ggaaaggata tcacagagga gatcatgtct ggggcccgca 1020
ctgcctccac acccacccct ccccagacgg gaggcggtct ggagcctcaa gctaatgggg 1080
agacgcccca ggttgctgtc attgtccggc cagatgaccg gtcacaggga gcaatcattg 1140
ctgaccggcc agggctgcct ggcccagagc atagcccttc agaatcccag ccttcgtcgc 1200
cttctccgac cccatcacca tccccagtct tggaaccggg gtctgagcct aatctcgcag 1260
tcctctctat tcctggggac actatgacaa ctatacaaat gtctgtagaa gaatcaaccc 1320
ccatctcccg tgaaactggg gagccatatc gcctctctcc agaacccact cctctcgccg 1380
aacccatact ggaagtagaa gtgacactta gcaaaccggt tccagaatct gagttttctt 1440
ccagtcctct ccaggctccc acccctttgg catctcacac agtggaaatt catgagccta 1500
atggcatggt cccatctgaa gatctggaac cagaggtgga gtcaagccca gagcttgctc 1560
ctcccccagc ttgcccctcc gaatcccctg tgcccattgc tccaactgcc caacctgagg 1620
aactgctcaa cggagccccc tcgccaccag ctgtggactt aagcccagtc agtgagccag 1680
aggagcaggc caaggaggtg acagcatcaa tggcgccccc caccatcccc tctgctactc 1740
cagctacggc tccttcagct acttccccag ctcaggagga ggaaatggaa gaagaagaag 1800
aagaggaaga aggagaagca ggagaagcag gagaagctga gagtgagaaa ggaggagagg 1860
aactgctccc cccagagagt acccctattc cagccaactt gtctcagaat ttggaggcag 1920
cagcagccac tcaagtggca gtatctgtgc caaagaggag acggaaaatt aaggagctaa 1980
ataagaagga ggctgttgga gaccttctgg atgccttcaa ggaggcgaac ccggcagtac 2040
cagaggtgga aaatcagcct cctgcaggca gcaatccagg cccagagtct gagggcagtg 2100
gtgtgccccc acgtcctgag gaagcagatg agacctggga ctcaaaggaa gacaaaattc 2160
acaatgctga gaacatccag cccggggaac agaagtatga atataagtca gatcagtgga 2220
agcctctaaa cctagaggag aaaaaacgtt acgaccgtga gttcctgctt ggttttcagt 2280
tcatctttgc cagtatgcag aagccagagg gattgccaca tatcagtgac gtggtgctgg 2340
acaaggccaa taaaacacca ctgcggccac tggatcccac tagactacaa ggcataaatt 2400
gtggcccaga cttcactcca tcctttgcca accttggccg gacaaccctt agcacccgtg 2460
ggcccccaag gggtgggcca ggtggggagc tgccccgtgg gccgcaggct ggcctgggac 2520
cccggcgctc tcagcaggga ccccgaaaag aaccacgcaa gatcattgcc acagtgttaa 2580
tgaccgaaga tataaaactg aacaaagcag agaaagcctg gaaacccagc agcaagcgga 2640
cggcggctga taaggatcga ggggaagaag atgctgatgg cagcaaaacc caggacctat 2700
tccgcagggt gcgctccatc ctgaataaac tgacacccca gatgttccag cagctgatga 2760
agcaagtgac gcagctggcc atcgacaccg aggaacgcct caaaggggtc attgacctca 2820
tttttgagaa ggccatttca gagcccaact tctctgtggc ctatgccaac atgtgccgct 2880
gcctcatggc gctgaaagtg cccactacgg aaaagccaac agtgactgtg aacttccgaa 2940
agctgttgtt gaatcgatgt cagaaggagt ttgagaaaga caaagatgat gatgaggttt 3000
ttgagaagaa gcaaaaagag atggatgaag ctgctacggc agaggaacga ggacgcctga 3060
aggaagagct ggaagaggct cgggacatag cccggcggcg ctctttaggg aatatcaagt 3120
ttattggaga gttgttcaaa ctgaagatgt taacagaggc aataatgcat gactgtgtgg 3180
tcaaactgct taagaaccat gatgaagagt cccttgagtg cctttgtcgt ctgctcacca 3240
ccattggcaa agacctggac tttgaaaaag ccaagccccg aatggatcag tatttcaacc 3300
agatggaaaa aatcattaaa gaaaagaaga cgtcatcccg catccgcttt atgctgcagg 3360
acgtgctgga tctgcgaggg agcaattggg tgccacgccg aggggatcag ggtcccaaga 3420
ccattgacca gatccataag gaggctgaga tggaagaaca tcgagagcac atcaaagtgc 3480
agcagctcat ggccaagggc agtgacaagc gtcggggcgg tcctccaggc cctcccatca 3540
gccgtggact tccccttgtg gatgatggtg gctggaacac agttcccatc agcaaaggta 3600
gccgccccat tgacacctca cgactcacca agatcaccaa gcctggctcc atcgattcta 3660
acaaccagct ctttgcacct ggagggcgac tgagctgggg caagggcagc agcggaggct 3720
caggagccaa gccctcagac gcagcatcag aagctgctcg cccagctact agtactttga 3780
atcgcttctc agcccttcaa caagcggtac ccacagaaag cacagataat agacgtgtgg 3840
tgcagaggag tagcttgagc cgagaacgag gcgagaaagc tggagaccga ggagaccgcc 3900
tagagcggag tgaacgggga ggggaccgtg gggaccggct tgatcgtgcg cggacacctg 3960
ctaccaagcg gagcttcagc aaggaagtgg aggagcggag tagagaacgg ccctcccagc 4020
ctgaggggct gcgcaaggca gctagcctca cggaggatcg ggaccgtggg cgggatgccg 4080
tgaagcgaga agctgcccta cccccagtga gccccctgaa ggcggctctc tctgaggagg 4140
agttagagaa gaaatccaag gctatcattg aggaatatct ccatctcaat gacatgaaag 4200
aggcagtcca gtgcgtgcag gagctggcct caccctcctt gctcttcatc tttgtacggc 4260
atggtgtcga gtctacgctg gagcgcagtg ccattgctcg tgagcatatg gggcagctgc 4320
tgcaccagct gctctgtgct gggcatctgt ctactgctca gtactaccaa gggttgtatg 4380
aaatcttgga attggctgag gacatggaaa ttgacatccc ccacgtgtgg ctctacctag 4440
cggaactggt aacacccatt ctgcaggaag gtggggtgcc catgggggag ctgttcaggg 4500
agattacaaa gcctctgaga ccgttgggca aagctgcttc cctgttgctg gagatcctgg 4560
gcctcctgtg caaaagcatg ggtcctaaaa aggtggggac gctgtggcga gaagccgggc 4620
ttagctggaa ggaatttcta cctgaaggcc aggacattgg tgcattcgtc gctgaacaga 4680
aggtggagta taccctggga gaggagtcgg aagcccctgg ccagagggca ctcccctccg 4740
aggagctgaa caggcagctg gagaagctgc tgaaggaggg cagcagtaac cagcgggtgt 4800
tcgactggat agaggccaac ctgagtgagc agcagatagt atccaacacg ttagttcgag 4860
ccctcatgac ggctgtctgc tattctgcaa ttatttttga gactcccctc cgagtggacg 4920
ttgcagtgct gaaagcgcga gcgaagctgc tgcagaaata cctgtgtgac gagcagaagg 4980
agctacaggc gctctacgcc ctccaggccc ttgtagtgac cttagaacag cctcccaacc 5040
tgctgcggat gttctttgac gcactgtatg acgaggacgt ggtgaaggag gatgccttct 5100
acagttggga gagtagcaag gaccccgctg agcagcaggg caagggtgtg gcccttaaat 5160
ctgtcacagc cttcttcaag tggctccgtg aagcagagga ggagtctgac cacaactgag 5220
ggctggtggg gccggggacc tggagcccca tggacacaca gatggcccgg ctagccgcct 5280
ggactgcagg ggggcggcag cagcggcggt ggcagtgggt gcctgtagtg tgatgtgtct 5340
gaactaataa agtggctgaa gaggcaggat ggcttggggc tgcctgggcc cccctccagg 5400
atgccgccag gtgtccctct cctccccctg gggcacagag atatattata tataaagtct 5460
tgaaatttgg tgtgtcttgg ggtggggagg ggcaccaacg cctgcccctg gggtcctttt 5520
ttttattttc tgaaaatcac tctcgggact gccgtcctcg ctgctggggg catatgcccc 5580
agcccctgta ccacccctgc tgttgcctgg gcagggggaa gggggggcac ggtgcctgta 5640
attattaaac atgaattcaa ttaagctcaa aaaaaaaaaa aaaaaa 5686
<210> 25
<211> 1599
<212> PRT
<213> Homo sapiens
<400> 25
Met Asn Lys Ala Pro Gln Ser Thr Gly Pro Pro Pro Ala Pro Ser Pro
1 5 10 15
Gly Leu Pro Gln Pro Ala Phe Pro Pro Gly Gln Thr Ala Pro Val Val
20 25 30
Phe Ser Thr Pro Gln Ala Thr Gln Met Asn Thr Pro Ser Gln Pro Arg
35 40 45
Gln His Phe Tyr Pro Ser Arg Ala Gln Pro Pro Ser Ser Ala Ala Ser
50 55 60
Arg Val Gln Ser Ala Ala Pro Ala Arg Pro Gly Pro Ala Ala His Val
65 70 75 80
Tyr Pro Ala Gly Ser Gln Val Met Met Ile Pro Ser Gln Ile Ser Tyr
85 90 95
Pro Ala Ser Gln Gly Ala Tyr Tyr Ile Pro Gly Gln Gly Arg Ser Thr
100 105 110
Tyr Val Val Pro Thr Gln Gln Tyr Pro Val Gln Pro Gly Ala Pro Gly
115 120 125
Phe Tyr Pro Gly Ala Ser Pro Thr Glu Phe Gly Thr Tyr Ala Gly Ala
130 135 140
Tyr Tyr Pro Ala Gln Gly Val Gln Gln Phe Pro Thr Gly Val Ala Pro
145 150 155 160
Ala Pro Val Leu Met Asn Gln Pro Pro Gln Ile Ala Pro Lys Arg Glu
165 170 175
Arg Lys Thr Ile Arg Ile Arg Asp Pro Asn Gln Gly Gly Lys Asp Ile
180 185 190
Thr Glu Glu Ile Met Ser Gly Ala Arg Thr Ala Ser Thr Pro Thr Pro
195 200 205
Pro Gln Thr Gly Gly Gly Leu Glu Pro Gln Ala Asn Gly Glu Thr Pro
210 215 220
Gln Val Ala Val Ile Val Arg Pro Asp Asp Arg Ser Gln Gly Ala Ile
225 230 235 240
Ile Ala Asp Arg Pro Gly Leu Pro Gly Pro Glu His Ser Pro Ser Glu
245 250 255
Ser Gln Pro Ser Ser Pro Ser Pro Thr Pro Ser Pro Ser Pro Val Leu
260 265 270
Glu Pro Gly Ser Glu Pro Asn Leu Ala Val Leu Ser Ile Pro Gly Asp
275 280 285
Thr Met Thr Thr Ile Gln Met Ser Val Glu Glu Ser Thr Pro Ile Ser
290 295 300
Arg Glu Thr Gly Glu Pro Tyr Arg Leu Ser Pro Glu Pro Thr Pro Leu
305 310 315 320
Ala Glu Pro Ile Leu Glu Val Glu Val Thr Leu Ser Lys Pro Val Pro
325 330 335
Glu Ser Glu Phe Ser Ser Ser Pro Leu Gln Ala Pro Thr Pro Leu Ala
340 345 350
Ser His Thr Val Glu Ile His Glu Pro Asn Gly Met Val Pro Ser Glu
355 360 365
Asp Leu Glu Pro Glu Val Glu Ser Ser Pro Glu Leu Ala Pro Pro Pro
370 375 380
Ala Cys Pro Ser Glu Ser Pro Val Pro Ile Ala Pro Thr Ala Gln Pro
385 390 395 400
Glu Glu Leu Leu Asn Gly Ala Pro Ser Pro Pro Ala Val Asp Leu Ser
405 410 415
Pro Val Ser Glu Pro Glu Glu Gln Ala Lys Glu Val Thr Ala Ser Met
420 425 430
Ala Pro Pro Thr Ile Pro Ser Ala Thr Pro Ala Thr Ala Pro Ser Ala
435 440 445
Thr Ser Pro Ala Gln Glu Glu Glu Met Glu Glu Glu Glu Glu Glu Glu
450 455 460
Glu Gly Glu Ala Gly Glu Ala Gly Glu Ala Glu Ser Glu Lys Gly Gly
465 470 475 480
Glu Glu Leu Leu Pro Pro Glu Ser Thr Pro Ile Pro Ala Asn Leu Ser
485 490 495
Gln Asn Leu Glu Ala Ala Ala Ala Thr Gln Val Ala Val Ser Val Pro
500 505 510
Lys Arg Arg Arg Lys Ile Lys Glu Leu Asn Lys Lys Glu Ala Val Gly
515 520 525
Asp Leu Leu Asp Ala Phe Lys Glu Ala Asn Pro Ala Val Pro Glu Val
530 535 540
Glu Asn Gln Pro Pro Ala Gly Ser Asn Pro Gly Pro Glu Ser Glu Gly
545 550 555 560
Ser Gly Val Pro Pro Arg Pro Glu Glu Ala Asp Glu Thr Trp Asp Ser
565 570 575
Lys Glu Asp Lys Ile His Asn Ala Glu Asn Ile Gln Pro Gly Glu Gln
580 585 590
Lys Tyr Glu Tyr Lys Ser Asp Gln Trp Lys Pro Leu Asn Leu Glu Glu
595 600 605
Lys Lys Arg Tyr Asp Arg Glu Phe Leu Leu Gly Phe Gln Phe Ile Phe
610 615 620
Ala Ser Met Gln Lys Pro Glu Gly Leu Pro His Ile Ser Asp Val Val
625 630 635 640
Leu Asp Lys Ala Asn Lys Thr Pro Leu Arg Pro Leu Asp Pro Thr Arg
645 650 655
Leu Gln Gly Ile Asn Cys Gly Pro Asp Phe Thr Pro Ser Phe Ala Asn
660 665 670
Leu Gly Arg Thr Thr Leu Ser Thr Arg Gly Pro Pro Arg Gly Gly Pro
675 680 685
Gly Gly Glu Leu Pro Arg Gly Pro Ala Gly Leu Gly Pro Arg Arg Ser
690 695 700
Gln Gln Gly Pro Arg Lys Glu Pro Arg Lys Ile Ile Ala Thr Val Leu
705 710 715 720
Met Thr Glu Asp Ile Lys Leu Asn Lys Ala Glu Lys Ala Trp Lys Pro
725 730 735
Ser Ser Lys Arg Thr Ala Ala Asp Lys Asp Arg Gly Glu Glu Asp Ala
740 745 750
Asp Gly Ser Lys Thr Gln Asp Leu Phe Arg Arg Val Arg Ser Ile Leu
755 760 765
Asn Lys Leu Thr Pro Gln Met Phe Gln Gln Leu Met Lys Gln Val Thr
770 775 780
Gln Leu Ala Ile Asp Thr Glu Glu Arg Leu Lys Gly Val Ile Asp Leu
785 790 795 800
Ile Phe Glu Lys Ala Ile Ser Glu Pro Asn Phe Ser Val Ala Tyr Ala
805 810 815
Asn Met Cys Arg Cys Leu Met Ala Leu Lys Val Pro Thr Thr Glu Lys
820 825 830
Pro Thr Val Thr Val Asn Phe Arg Lys Leu Leu Leu Asn Arg Cys Gln
835 840 845
Lys Glu Phe Glu Lys Asp Lys Asp Asp Asp Glu Val Phe Glu Lys Lys
850 855 860
Gln Lys Glu Met Asp Glu Ala Ala Thr Ala Glu Glu Arg Gly Arg Leu
865 870 875 880
Lys Glu Glu Leu Glu Glu Ala Arg Asp Ile Ala Arg Arg Arg Ser Leu
885 890 895
Gly Asn Ile Lys Phe Ile Gly Glu Leu Phe Lys Leu Lys Met Leu Thr
900 905 910
Glu Ala Ile Met His Asp Cys Val Val Lys Leu Leu Lys Asn His Asp
915 920 925
Glu Glu Ser Leu Glu Cys Leu Cys Arg Leu Leu Thr Thr Ile Gly Lys
930 935 940
Asp Leu Asp Phe Glu Lys Ala Lys Pro Arg Met Asp Gln Tyr Phe Asn
945 950 955 960
Gln Met Glu Lys Ile Ile Lys Glu Lys Lys Thr Ser Ser Arg Ile Arg
965 970 975
Phe Met Leu Gln Asp Val Leu Asp Leu Arg Gly Ser Asn Trp Val Pro
980 985 990
Arg Arg Gly Asp Gln Gly Pro Lys Thr Ile Asp Gln Ile His Lys Glu
995 1000 1005
Ala Glu Met Glu Glu His Arg Glu His Ile Lys Val Gln Gln Leu
1010 1015 1020
Met Ala Lys Gly Ser Asp Lys Arg Arg Gly Gly Pro Pro Gly Pro
1025 1030 1035
Pro Ile Ser Arg Gly Leu Pro Leu Val Asp Asp Gly Gly Trp Asn
1040 1045 1050
Thr Val Pro Ile Ser Lys Gly Ser Arg Pro Ile Asp Thr Ser Arg
1055 1060 1065
Leu Thr Lys Ile Thr Lys Pro Gly Ser Ile Asp Ser Asn Asn Gln
1070 1075 1080
Leu Phe Ala Pro Gly Gly Arg Leu Ser Trp Gly Lys Gly Ser Ser
1085 1090 1095
Gly Gly Ser Gly Ala Lys Pro Ser Asp Ala Ala Ser Glu Ala Ala
1100 1105 1110
Arg Pro Ala Thr Ser Thr Leu Asn Arg Phe Ser Ala Leu Gln Gln
1115 1120 1125
Ala Val Pro Thr Glu Ser Thr Asp Asn Arg Arg Val Val Gln Arg
1130 1135 1140
Ser Ser Leu Ser Arg Glu Arg Gly Glu Lys Ala Gly Asp Arg Gly
1145 1150 1155
Asp Arg Leu Glu Arg Ser Glu Arg Gly Gly Asp Arg Gly Asp Arg
1160 1165 1170
Leu Asp Arg Ala Arg Thr Pro Ala Thr Lys Arg Ser Phe Ser Lys
1175 1180 1185
Glu Val Glu Glu Arg Ser Arg Glu Arg Pro Ser Gln Pro Glu Gly
1190 1195 1200
Leu Arg Lys Ala Ala Ser Leu Thr Glu Asp Arg Asp Arg Gly Arg
1205 1210 1215
Asp Ala Val Lys Arg Glu Ala Ala Leu Pro Pro Val Ser Pro Leu
1220 1225 1230
Lys Ala Ala Leu Ser Glu Glu Glu Leu Glu Lys Lys Ser Lys Ala
1235 1240 1245
Ile Ile Glu Glu Tyr Leu His Leu Asn Asp Met Lys Glu Ala Val
1250 1255 1260
Gln Cys Val Gln Glu Leu Ala Ser Pro Ser Leu Leu Phe Ile Phe
1265 1270 1275
Val Arg His Gly Val Glu Ser Thr Leu Glu Arg Ser Ala Ile Ala
1280 1285 1290
Arg Glu His Met Gly Gln Leu Leu His Gln Leu Leu Cys Ala Gly
1295 1300 1305
His Leu Ser Thr Ala Gln Tyr Tyr Gln Gly Leu Tyr Glu Ile Leu
1310 1315 1320
Glu Leu Ala Glu Asp Met Glu Ile Asp Ile Pro His Val Trp Leu
1325 1330 1335
Tyr Leu Ala Glu Leu Val Thr Pro Ile Leu Gln Glu Gly Gly Val
1340 1345 1350
Pro Met Gly Glu Leu Phe Arg Glu Ile Thr Lys Pro Leu Arg Pro
1355 1360 1365
Leu Gly Lys Ala Ala Ser Leu Leu Leu Glu Ile Leu Gly Leu Leu
1370 1375 1380
Cys Lys Ser Met Gly Pro Lys Lys Val Gly Thr Leu Trp Arg Glu
1385 1390 1395
Ala Gly Leu Ser Trp Lys Glu Phe Leu Pro Glu Gly Gln Asp Ile
1400 1405 1410
Gly Ala Phe Val Ala Glu Gln Lys Val Glu Tyr Thr Leu Gly Glu
1415 1420 1425
Glu Ser Glu Ala Pro Gly Gln Arg Ala Leu Pro Ser Glu Glu Leu
1430 1435 1440
Asn Arg Gln Leu Glu Lys Leu Leu Lys Glu Gly Ser Ser Asn Gln
1445 1450 1455
Arg Val Phe Asp Trp Ile Glu Ala Asn Leu Ser Glu Gln Gln Ile
1460 1465 1470
Val Ser Asn Thr Leu Val Arg Ala Leu Met Thr Ala Val Cys Tyr
1475 1480 1485
Ser Ala Ile Ile Phe Glu Thr Pro Leu Arg Val Asp Val Ala Val
1490 1495 1500
Leu Lys Ala Arg Ala Lys Leu Leu Gln Lys Tyr Leu Cys Asp Glu
1505 1510 1515
Gln Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala Leu Val Val
1520 1525 1530
Thr Leu Glu Gln Pro Pro Asn Leu Leu Arg Met Phe Phe Asp Ala
1535 1540 1545
Leu Tyr Asp Glu Asp Val Val Lys Glu Asp Ala Phe Tyr Ser Trp
1550 1555 1560
Glu Ser Ser Lys Asp Pro Ala Glu Gln Gln Gly Lys Gly Val Ala
1565 1570 1575
Leu Lys Ser Val Thr Ala Phe Phe Lys Trp Leu Arg Glu Ala Glu
1580 1585 1590
Glu Glu Ser Asp His Asn
1595
<210> 26
<211> 5538
<212> DNA
<213> Homo sapiens
<400> 26
cggcggcgca gatcgcccgg cgcggctccg ccccctgcgc cggtcacgtg ggggcgccgg 60
ctgcgcctgc ggagaagcgg tggccgccga gcgggatctg tgcggggagc cggaaatggt 120
tgtggactac gtctgtgcgg ctgcgtgggg ctcggccgcg cggactgaag gagactgaag 180
gccctcggat gcccagaacc tgtaggccgc accgtggact tgttcttaat cgagggggtg 240
ctggggggac cctgatgtgg caccaaatga aatgaacaaa gctccacagt ccacaggccc 300
cccacccgcc ccatcccccg gactcccaca gccagcgttt cccccggggc agacagcgcc 360
ggtggtgttc agtacgccac aagcgacaca aatgaacacg ccttctcagc cccgccagca 420
cttctaccct agccgggccc agcccccgag cagtgcagcc tcccgagtgc agagtgcagc 480
ccctgcccgc cctggcccag ctgcccatgt ctaccctgct ggatcccaag taatgatgat 540
cccttcccag atctcctacc cagcctccca gggggcctac tacatccctg gacaggggcg 600
ttccacatac gttgtcccga cacagcagta ccctgtgcag ccaggagccc caggcttcta 660
tccaggtgca agccctacag aatttgggac ctacgctggc gcctactatc cagcccaagg 720
ggtgcagcag tttcccactg gcgtggcccc cgccccagtt ttgatgaacc agccacccca 780
gattgctccc aagagggagc gtaagacgat ccgaattcga gatccaaacc aaggaggaaa 840
ggatatcaca gaggagatca tgtctggggc ccgcactgcc tccacaccca cccctcccca 900
gacgggaggc ggtctggagc ctcaagctaa tggggagacg ccccaggttg ctgtcattgt 960
ccggccagat gaccggtcac agggagcaat cattgctgac cggccagggc tgcctggccc 1020
agagcatagc ccttcagaat cccagccttc gtcgccttct ccgaccccat caccatcccc 1080
agtcttggaa ccggggtctg agcctaatct cgcagtcctc tctattcctg gggacactat 1140
gacaactata caaatgtctg tagaagaatc aacccccatc tcccgtgaaa ctggggagcc 1200
atatcgcctc tctccagaac ccactcctct cgccgaaccc atactggaag tagaagtgac 1260
acttagcaaa ccggttccag aatctgagtt ttcttccagt cctctccagg ctcccacccc 1320
tttggcatct cacacagtgg aaattcatga gcctaatggc atggtcccat ctgaagatct 1380
ggaaccagag gtggagtcaa gcccagagct tgctcctccc ccagcttgcc cctccgaatc 1440
ccctgtgccc attgctccaa ctgcccaacc tgaggaactg ctcaacggag ccccctcgcc 1500
accagctgtg gacttaagcc cagtcagtga gccagaggag caggccaagg aggtgacagc 1560
atcaatggcg ccccccacca tcccctctgc tactccagct acggctcctt cagctacttc 1620
cccagctcag gaggaggaaa tggaagaaga agaagaagag gaagaaggag aagcaggaga 1680
agcaggagaa gctgagagtg agaaaggagg agaggaactg ctccccccag agagtacccc 1740
tattccagcc aacttgtctc agaatttgga ggcagcagca gccactcaag tggcagtatc 1800
tgtgccaaag aggagacgga aaattaagga gctaaataag aaggaggctg ttggagacct 1860
tctggatgcc ttcaaggagg cgaacccggc agtaccagag gtggaaaatc agcctcctgc 1920
aggcagcaat ccaggcccag agtctgaggg cagtggtgtg cccccacgtc ctgaggaagc 1980
agatgagacc tgggactcaa aggaagacaa aattcacaat gctgagaaca tccagcccgg 2040
ggaacagaag tatgaatata agtcagatca gtggaagcct ctaaacctag aggagaaaaa 2100
acgttacgac cgtgagttcc tgcttggttt tcagttcatc tttgccagta tgcagaagcc 2160
agagggattg ccacatatca gtgacgtggt gctggacaag gccaataaaa caccactgcg 2220
gccactggat cccactagac tacaaggcat aaattgtggc ccagacttca ctccatcctt 2280
tgccaacctt ggccggacaa cccttagcac ccgtgggccc ccaaggggtg ggccaggtgg 2340
ggagctgccc cgtgggccgg ctggcctggg accccggcgc tctcagcagg gaccccgaaa 2400
agaaccacgc aagatcattg ccacagtgtt aatgaccgaa gatataaaac tgaacaaagc 2460
agagaaagcc tggaaaccca gcagcaagcg gacggcggct gataaggatc gaggggaaga 2520
agatgctgat ggcagcaaaa cccaggacct attccgcagg gtgcgctcca tcctgaataa 2580
actgacaccc cagatgttcc agcagctgat gaagcaagtg acgcagctgg ccatcgacac 2640
cgaggaacgc ctcaaagggg tcattgacct catttttgag aaggccattt cagagcccaa 2700
cttctctgtg gcctatgcca acatgtgccg ctgcctcatg gcgctgaaag tgcccactac 2760
ggaaaagcca acagtgactg tgaacttccg aaagctgttg ttgaatcgat gtcagaagga 2820
gtttgagaaa gacaaagatg atgatgaggt ttttgagaag aagcaaaaag agatggatga 2880
agctgctacg gcagaggaac gaggacgcct gaaggaagag ctggaagagg ctcgggacat 2940
agcccggcgg cgctctttag ggaatatcaa gtttattgga gagttgttca aactgaagat 3000
gttaacagag gcaataatgc atgactgtgt ggtcaaactg cttaagaacc atgatgaaga 3060
gtcccttgag tgcctttgtc gtctgctcac caccattggc aaagacctgg actttgaaaa 3120
agccaagccc cgaatggatc agtatttcaa ccagatggaa aaaatcatta aagaaaagaa 3180
gacgtcatcc cgcatccgct ttatgctgca ggacgtgctg gatctgcgag ggagcaattg 3240
ggtgccacgc cgaggggatc agggtcccaa gaccattgac cagatccata aggaggctga 3300
gatggaagaa catcgagagc acatcaaagt gcagcagctc atggccaagg gcagtgacaa 3360
gcgtcggggc ggtcctccag gccctcccat cagccgtgga cttccccttg tggatgatgg 3420
tggctggaac acagttccca tcagcaaagg tagccgcccc attgacacct cacgactcac 3480
caagatcacc aagcctggct ccatcgattc taacaaccag ctctttgcac ctggagggcg 3540
actgagctgg ggcaagggca gcagcggagg ctcaggagcc aagccctcag acgcagcatc 3600
agaagctgct cgcccagcta ctagtacttt gaatcgcttc tcagcccttc aacaagcggt 3660
acccacagaa agcacagata atagacgtgt ggtgcagagg agtagcttga gccgagaacg 3720
aggcgagaaa gctggagacc gaggagaccg cctagagcgg agtgaacggg gaggggaccg 3780
tggggaccgg cttgatcgtg cgcggacacc tgctaccaag cggagcttca gcaaggaagt 3840
ggaggagcgg agtagagaac ggccctccca gcctgagggg ctgcgcaagg cagctagcct 3900
cacggaggat cgggaccgtg ggcgggatgc cgtgaagcga gaagctgccc tacccccagt 3960
gagccccctg aaggcggctc tctctgagga ggagttagag aagaaatcca aggctatcat 4020
tgaggaatat ctccatctca atgacatgaa agaggcagtc cagtgcgtgc aggagctggc 4080
ctcaccctcc ttgctcttca tctttgtacg gcatggtgtc gagtctacgc tggagcgcag 4140
tgccattgct cgtgagcata tggggcagct gctgcaccag ctgctctgtg ctgggcatct 4200
gtctactgct cagtactacc aagggttgta tgaaatcttg gaattggctg aggacatgga 4260
aattgacatc ccccacgtgt ggctctacct agcggaactg gtaacaccca ttctgcagga 4320
aggtggggtg cccatggggg agctgttcag ggagattaca aagcctctga gaccgttggg 4380
caaagctgct tccctgttgc tggagatcct gggcctcctg tgcaaaagca tgggtcctaa 4440
aaaggtgggg acgctgtggc gagaagccgg gcttagctgg aaggaatttc tacctgaagg 4500
ccaggacatt ggtgcattcg tcgctgaaca gaaggtggag tataccctgg gagaggagtc 4560
ggaagcccct ggccagaggg cactcccctc cgaggagctg aacaggcagc tggagaagct 4620
gctgaaggag ggcagcagta accagcgggt gttcgactgg atagaggcca acctgagtga 4680
gcagcagata gtatccaaca cgttagttcg agccctcatg acggctgtct gctattctgc 4740
aattattttt gagactcccc tccgagtgga cgttgcagtg ctgaaagcgc gagcgaagct 4800
gctgcagaaa tacctgtgtg acgagcagaa ggagctacag gcgctctacg ccctccaggc 4860
ccttgtagtg accttagaac agcctcccaa cctgctgcgg atgttctttg acgcactgta 4920
tgacgaggac gtggtgaagg aggatgcctt ctacagttgg gagagtagca aggaccccgc 4980
tgagcagcag ggcaagggtg tggcccttaa atctgtcaca gccttcttca agtggctccg 5040
tgaagcagag gaggagtctg accacaactg agggctggtg gggccgggga cctggagccc 5100
catggacaca cagatggccc ggctagccgc ctggactgca ggggggcggc agcagcggcg 5160
gtggcagtgg gtgcctgtag tgtgatgtgt ctgaactaat aaagtggctg aagaggcagg 5220
atggcttggg gctgcctggg cccccctcca ggatgccgcc aggtgtccct ctcctccccc 5280
tggggcacag agatatatta tatataaagt cttgaaattt ggtgtgtctt ggggtgggga 5340
ggggcaccaa cgcctgcccc tggggtcctt ttttttattt tctgaaaatc actctcggga 5400
ctgccgtcct cgctgctggg ggcatatgcc ccagcccctg taccacccct gctgttgcct 5460
gggcaggggg aagggggggc acggtgcctg taattattaa acatgaattc aattaagctc 5520
aaaaaaaaaa aaaaaaaa 5538
<210> 27
<211> 1435
<212> PRT
<213> Homo sapiens
<400> 27
Met Asn Gln Pro Pro Gln Ile Ala Pro Lys Arg Glu Arg Lys Thr Ile
1 5 10 15
Arg Ile Arg Asp Pro Asn Gln Gly Gly Lys Asp Ile Thr Glu Glu Ile
20 25 30
Met Ser Gly Ala Arg Thr Ala Ser Thr Pro Thr Pro Pro Gln Thr Gly
35 40 45
Gly Gly Leu Glu Pro Gln Ala Asn Gly Glu Thr Pro Gln Val Ala Val
50 55 60
Ile Val Arg Pro Asp Asp Arg Ser Gln Gly Ala Ile Ile Ala Asp Arg
65 70 75 80
Pro Gly Leu Pro Gly Pro Glu His Ser Pro Ser Glu Ser Gln Pro Ser
85 90 95
Ser Pro Ser Pro Thr Pro Ser Pro Ser Pro Val Leu Glu Pro Gly Ser
100 105 110
Glu Pro Asn Leu Ala Val Leu Ser Ile Pro Gly Asp Thr Met Thr Thr
115 120 125
Ile Gln Met Ser Val Glu Glu Ser Thr Pro Ile Ser Arg Glu Thr Gly
130 135 140
Glu Pro Tyr Arg Leu Ser Pro Glu Pro Thr Pro Leu Ala Glu Pro Ile
145 150 155 160
Leu Glu Val Glu Val Thr Leu Ser Lys Pro Val Pro Glu Ser Glu Phe
165 170 175
Ser Ser Ser Pro Leu Gln Ala Pro Thr Pro Leu Ala Ser His Thr Val
180 185 190
Glu Ile His Glu Pro Asn Gly Met Val Pro Ser Glu Asp Leu Glu Pro
195 200 205
Glu Val Glu Ser Ser Pro Glu Leu Ala Pro Pro Pro Ala Cys Pro Ser
210 215 220
Glu Ser Pro Val Pro Ile Ala Pro Thr Ala Gln Pro Glu Glu Leu Leu
225 230 235 240
Asn Gly Ala Pro Ser Pro Pro Ala Val Asp Leu Ser Pro Val Ser Glu
245 250 255
Pro Glu Glu Gln Ala Lys Glu Val Thr Ala Ser Met Ala Pro Pro Thr
260 265 270
Ile Pro Ser Ala Thr Pro Ala Thr Ala Pro Ser Ala Thr Ser Pro Ala
275 280 285
Gln Glu Glu Glu Met Glu Glu Glu Glu Glu Glu Glu Glu Gly Glu Ala
290 295 300
Gly Glu Ala Gly Glu Ala Glu Ser Glu Lys Gly Gly Glu Glu Leu Leu
305 310 315 320
Pro Pro Glu Ser Thr Pro Ile Pro Ala Asn Leu Ser Gln Asn Leu Glu
325 330 335
Ala Ala Ala Ala Thr Gln Val Ala Val Ser Val Pro Lys Arg Arg Arg
340 345 350
Lys Ile Lys Glu Leu Asn Lys Lys Glu Ala Val Gly Asp Leu Leu Asp
355 360 365
Ala Phe Lys Glu Ala Asn Pro Ala Val Pro Glu Val Glu Asn Gln Pro
370 375 380
Pro Ala Gly Ser Asn Pro Gly Pro Glu Ser Glu Gly Ser Gly Val Pro
385 390 395 400
Pro Arg Pro Glu Glu Ala Asp Glu Thr Trp Asp Ser Lys Glu Asp Lys
405 410 415
Ile His Asn Ala Glu Asn Ile Gln Pro Gly Glu Gln Lys Tyr Glu Tyr
420 425 430
Lys Ser Asp Gln Trp Lys Pro Leu Asn Leu Glu Glu Lys Lys Arg Tyr
435 440 445
Asp Arg Glu Phe Leu Leu Gly Phe Gln Phe Ile Phe Ala Ser Met Gln
450 455 460
Lys Pro Glu Gly Leu Pro His Ile Ser Asp Val Val Leu Asp Lys Ala
465 470 475 480
Asn Lys Thr Pro Leu Arg Pro Leu Asp Pro Thr Arg Leu Gln Gly Ile
485 490 495
Asn Cys Gly Pro Asp Phe Thr Pro Ser Phe Ala Asn Leu Gly Arg Thr
500 505 510
Thr Leu Ser Thr Arg Gly Pro Pro Arg Gly Gly Pro Gly Gly Glu Leu
515 520 525
Pro Arg Gly Pro Ala Gly Leu Gly Pro Arg Arg Ser Gln Gln Gly Pro
530 535 540
Arg Lys Glu Pro Arg Lys Ile Ile Ala Thr Val Leu Met Thr Glu Asp
545 550 555 560
Ile Lys Leu Asn Lys Ala Glu Lys Ala Trp Lys Pro Ser Ser Lys Arg
565 570 575
Thr Ala Ala Asp Lys Asp Arg Gly Glu Glu Asp Ala Asp Gly Ser Lys
580 585 590
Thr Gln Asp Leu Phe Arg Arg Val Arg Ser Ile Leu Asn Lys Leu Thr
595 600 605
Pro Gln Met Phe Gln Gln Leu Met Lys Gln Val Thr Gln Leu Ala Ile
610 615 620
Asp Thr Glu Glu Arg Leu Lys Gly Val Ile Asp Leu Ile Phe Glu Lys
625 630 635 640
Ala Ile Ser Glu Pro Asn Phe Ser Val Ala Tyr Ala Asn Met Cys Arg
645 650 655
Cys Leu Met Ala Leu Lys Val Pro Thr Thr Glu Lys Pro Thr Val Thr
660 665 670
Val Asn Phe Arg Lys Leu Leu Leu Asn Arg Cys Gln Lys Glu Phe Glu
675 680 685
Lys Asp Lys Asp Asp Asp Glu Val Phe Glu Lys Lys Gln Lys Glu Met
690 695 700
Asp Glu Ala Ala Thr Ala Glu Glu Arg Gly Arg Leu Lys Glu Glu Leu
705 710 715 720
Glu Glu Ala Arg Asp Ile Ala Arg Arg Arg Ser Leu Gly Asn Ile Lys
725 730 735
Phe Ile Gly Glu Leu Phe Lys Leu Lys Met Leu Thr Glu Ala Ile Met
740 745 750
His Asp Cys Val Val Lys Leu Leu Lys Asn His Asp Glu Glu Ser Leu
755 760 765
Glu Cys Leu Cys Arg Leu Leu Thr Thr Ile Gly Lys Asp Leu Asp Phe
770 775 780
Glu Lys Ala Lys Pro Arg Met Asp Gln Tyr Phe Asn Gln Met Glu Lys
785 790 795 800
Ile Ile Lys Glu Lys Lys Thr Ser Ser Arg Ile Arg Phe Met Leu Gln
805 810 815
Asp Val Leu Asp Leu Arg Gly Ser Asn Trp Val Pro Arg Arg Gly Asp
820 825 830
Gln Gly Pro Lys Thr Ile Asp Gln Ile His Lys Glu Ala Glu Met Glu
835 840 845
Glu His Arg Glu His Ile Lys Val Gln Gln Leu Met Ala Lys Gly Ser
850 855 860
Asp Lys Arg Arg Gly Gly Pro Pro Gly Pro Pro Ile Ser Arg Gly Leu
865 870 875 880
Pro Leu Val Asp Asp Gly Gly Trp Asn Thr Val Pro Ile Ser Lys Gly
885 890 895
Ser Arg Pro Ile Asp Thr Ser Arg Leu Thr Lys Ile Thr Lys Pro Gly
900 905 910
Ser Ile Asp Ser Asn Asn Gln Leu Phe Ala Pro Gly Gly Arg Leu Ser
915 920 925
Trp Gly Lys Gly Ser Ser Gly Gly Ser Gly Ala Lys Pro Ser Asp Ala
930 935 940
Ala Ser Glu Ala Ala Arg Pro Ala Thr Ser Thr Leu Asn Arg Phe Ser
945 950 955 960
Ala Leu Gln Gln Ala Val Pro Thr Glu Ser Thr Asp Asn Arg Arg Val
965 970 975
Val Gln Arg Ser Ser Leu Ser Arg Glu Arg Gly Glu Lys Ala Gly Asp
980 985 990
Arg Gly Asp Arg Leu Glu Arg Ser Glu Arg Gly Gly Asp Arg Gly Asp
995 1000 1005
Arg Leu Asp Arg Ala Arg Thr Pro Ala Thr Lys Arg Ser Phe Ser
1010 1015 1020
Lys Glu Val Glu Glu Arg Ser Arg Glu Arg Pro Ser Gln Pro Glu
1025 1030 1035
Gly Leu Arg Lys Ala Ala Ser Leu Thr Glu Asp Arg Asp Arg Gly
1040 1045 1050
Arg Asp Ala Val Lys Arg Glu Ala Ala Leu Pro Pro Val Ser Pro
1055 1060 1065
Leu Lys Ala Ala Leu Ser Glu Glu Glu Leu Glu Lys Lys Ser Lys
1070 1075 1080
Ala Ile Ile Glu Glu Tyr Leu His Leu Asn Asp Met Lys Glu Ala
1085 1090 1095
Val Gln Cys Val Gln Glu Leu Ala Ser Pro Ser Leu Leu Phe Ile
1100 1105 1110
Phe Val Arg His Gly Val Glu Ser Thr Leu Glu Arg Ser Ala Ile
1115 1120 1125
Ala Arg Glu His Met Gly Gln Leu Leu His Gln Leu Leu Cys Ala
1130 1135 1140
Gly His Leu Ser Thr Ala Gln Tyr Tyr Gln Gly Leu Tyr Glu Ile
1145 1150 1155
Leu Glu Leu Ala Glu Asp Met Glu Ile Asp Ile Pro His Val Trp
1160 1165 1170
Leu Tyr Leu Ala Glu Leu Val Thr Pro Ile Leu Gln Glu Gly Gly
1175 1180 1185
Val Pro Met Gly Glu Leu Phe Arg Glu Ile Thr Lys Pro Leu Arg
1190 1195 1200
Pro Leu Gly Lys Ala Ala Ser Leu Leu Leu Glu Ile Leu Gly Leu
1205 1210 1215
Leu Cys Lys Ser Met Gly Pro Lys Lys Val Gly Thr Leu Trp Arg
1220 1225 1230
Glu Ala Gly Leu Ser Trp Lys Glu Phe Leu Pro Glu Gly Gln Asp
1235 1240 1245
Ile Gly Ala Phe Val Ala Glu Gln Lys Val Glu Tyr Thr Leu Gly
1250 1255 1260
Glu Glu Ser Glu Ala Pro Gly Gln Arg Ala Leu Pro Ser Glu Glu
1265 1270 1275
Leu Asn Arg Gln Leu Glu Lys Leu Leu Lys Glu Gly Ser Ser Asn
1280 1285 1290
Gln Arg Val Phe Asp Trp Ile Glu Ala Asn Leu Ser Glu Gln Gln
1295 1300 1305
Ile Val Ser Asn Thr Leu Val Arg Ala Leu Met Thr Ala Val Cys
1310 1315 1320
Tyr Ser Ala Ile Ile Phe Glu Thr Pro Leu Arg Val Asp Val Ala
1325 1330 1335
Val Leu Lys Ala Arg Ala Lys Leu Leu Gln Lys Tyr Leu Cys Asp
1340 1345 1350
Glu Gln Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala Leu Val
1355 1360 1365
Val Thr Leu Glu Gln Pro Pro Asn Leu Leu Arg Met Phe Phe Asp
1370 1375 1380
Ala Leu Tyr Asp Glu Asp Val Val Lys Glu Asp Ala Phe Tyr Ser
1385 1390 1395
Trp Glu Ser Ser Lys Asp Pro Ala Glu Gln Gln Gly Lys Gly Val
1400 1405 1410
Ala Leu Lys Ser Val Thr Ala Phe Phe Lys Trp Leu Arg Glu Ala
1415 1420 1425
Glu Glu Glu Ser Asp His Asn
1430 1435
<210> 28
<211> 5123
<212> DNA
<213> Homo sapiens
<400> 28
cggcggcgca gatcgcccgg cgcggctccg ccccctgcgc cggtcacgtg ggggcgccgg 60
ctgcgcctgc ggagaagcgg tggccgccga gcgggatctg tgcggggagc cggaaatggt 120
tgtggactac gtctgtgcgg ctgcgtgggg ctcggccgcg cggactgaag gagactgaag 180
gggcgttcca catacgttgt cccgacacag cagtaccctg tgcagccagg agccccaggc 240
ttctatccag gtgcaagccc tacagaattt gggacctacg ctggcgccta ctatccagcc 300
caaggggtgc agcagtttcc cactggcgtg gcccccgccc cagttttgat gaaccagcca 360
ccccagattg ctcccaagag ggagcgtaag acgatccgaa ttcgagatcc aaaccaagga 420
ggaaaggata tcacagagga gatcatgtct ggggcccgca ctgcctccac acccacccct 480
ccccagacgg gaggcggtct ggagcctcaa gctaatgggg agacgcccca ggttgctgtc 540
attgtccggc cagatgaccg gtcacaggga gcaatcattg ctgaccggcc agggctgcct 600
ggcccagagc atagcccttc agaatcccag ccttcgtcgc cttctccgac cccatcacca 660
tccccagtct tggaaccggg gtctgagcct aatctcgcag tcctctctat tcctggggac 720
actatgacaa ctatacaaat gtctgtagaa gaatcaaccc ccatctcccg tgaaactggg 780
gagccatatc gcctctctcc agaacccact cctctcgccg aacccatact ggaagtagaa 840
gtgacactta gcaaaccggt tccagaatct gagttttctt ccagtcctct ccaggctccc 900
acccctttgg catctcacac agtggaaatt catgagccta atggcatggt cccatctgaa 960
gatctggaac cagaggtgga gtcaagccca gagcttgctc ctcccccagc ttgcccctcc 1020
gaatcccctg tgcccattgc tccaactgcc caacctgagg aactgctcaa cggagccccc 1080
tcgccaccag ctgtggactt aagcccagtc agtgagccag aggagcaggc caaggaggtg 1140
acagcatcaa tggcgccccc caccatcccc tctgctactc cagctacggc tccttcagct 1200
acttccccag ctcaggagga ggaaatggaa gaagaagaag aagaggaaga aggagaagca 1260
ggagaagcag gagaagctga gagtgagaaa ggaggagagg aactgctccc cccagagagt 1320
acccctattc cagccaactt gtctcagaat ttggaggcag cagcagccac tcaagtggca 1380
gtatctgtgc caaagaggag acggaaaatt aaggagctaa ataagaagga ggctgttgga 1440
gaccttctgg atgccttcaa ggaggcgaac ccggcagtac cagaggtgga aaatcagcct 1500
cctgcaggca gcaatccagg cccagagtct gagggcagtg gtgtgccccc acgtcctgag 1560
gaagcagatg agacctggga ctcaaaggaa gacaaaattc acaatgctga gaacatccag 1620
cccggggaac agaagtatga atataagtca gatcagtgga agcctctaaa cctagaggag 1680
aaaaaacgtt acgaccgtga gttcctgctt ggttttcagt tcatctttgc cagtatgcag 1740
aagccagagg gattgccaca tatcagtgac gtggtgctgg acaaggccaa taaaacacca 1800
ctgcggccac tggatcccac tagactacaa ggcataaatt gtggcccaga cttcactcca 1860
tcctttgcca accttggccg gacaaccctt agcacccgtg ggcccccaag gggtgggcca 1920
ggtggggagc tgccccgtgg gccggctggc ctgggacccc ggcgctctca gcagggaccc 1980
cgaaaagaac cacgcaagat cattgccaca gtgttaatga ccgaagatat aaaactgaac 2040
aaagcagaga aagcctggaa acccagcagc aagcggacgg cggctgataa ggatcgaggg 2100
gaagaagatg ctgatggcag caaaacccag gacctattcc gcagggtgcg ctccatcctg 2160
aataaactga caccccagat gttccagcag ctgatgaagc aagtgacgca gctggccatc 2220
gacaccgagg aacgcctcaa aggggtcatt gacctcattt ttgagaaggc catttcagag 2280
cccaacttct ctgtggccta tgccaacatg tgccgctgcc tcatggcgct gaaagtgccc 2340
actacggaaa agccaacagt gactgtgaac ttccgaaagc tgttgttgaa tcgatgtcag 2400
aaggagtttg agaaagacaa agatgatgat gaggtttttg agaagaagca aaaagagatg 2460
gatgaagctg ctacggcaga ggaacgagga cgcctgaagg aagagctgga agaggctcgg 2520
gacatagccc ggcggcgctc tttagggaat atcaagttta ttggagagtt gttcaaactg 2580
aagatgttaa cagaggcaat aatgcatgac tgtgtggtca aactgcttaa gaaccatgat 2640
gaagagtccc ttgagtgcct ttgtcgtctg ctcaccacca ttggcaaaga cctggacttt 2700
gaaaaagcca agccccgaat ggatcagtat ttcaaccaga tggaaaaaat cattaaagaa 2760
aagaagacgt catcccgcat ccgctttatg ctgcaggacg tgctggatct gcgagggagc 2820
aattgggtgc cacgccgagg ggatcagggt cccaagacca ttgaccagat ccataaggag 2880
gctgagatgg aagaacatcg agagcacatc aaagtgcagc agctcatggc caagggcagt 2940
gacaagcgtc ggggcggtcc tccaggccct cccatcagcc gtggacttcc ccttgtggat 3000
gatggtggct ggaacacagt tcccatcagc aaaggtagcc gccccattga cacctcacga 3060
ctcaccaaga tcaccaagcc tggctccatc gattctaaca accagctctt tgcacctgga 3120
gggcgactga gctggggcaa gggcagcagc ggaggctcag gagccaagcc ctcagacgca 3180
gcatcagaag ctgctcgccc agctactagt actttgaatc gcttctcagc ccttcaacaa 3240
gcggtaccca cagaaagcac agataataga cgtgtggtgc agaggagtag cttgagccga 3300
gaacgaggcg agaaagctgg agaccgagga gaccgcctag agcggagtga acggggaggg 3360
gaccgtgggg accggcttga tcgtgcgcgg acacctgcta ccaagcggag cttcagcaag 3420
gaagtggagg agcggagtag agaacggccc tcccagcctg aggggctgcg caaggcagct 3480
agcctcacgg aggatcggga ccgtgggcgg gatgccgtga agcgagaagc tgccctaccc 3540
ccagtgagcc ccctgaaggc ggctctctct gaggaggagt tagagaagaa atccaaggct 3600
atcattgagg aatatctcca tctcaatgac atgaaagagg cagtccagtg cgtgcaggag 3660
ctggcctcac cctccttgct cttcatcttt gtacggcatg gtgtcgagtc tacgctggag 3720
cgcagtgcca ttgctcgtga gcatatgggg cagctgctgc accagctgct ctgtgctggg 3780
catctgtcta ctgctcagta ctaccaaggg ttgtatgaaa tcttggaatt ggctgaggac 3840
atggaaattg acatccccca cgtgtggctc tacctagcgg aactggtaac acccattctg 3900
caggaaggtg gggtgcccat gggggagctg ttcagggaga ttacaaagcc tctgagaccg 3960
ttgggcaaag ctgcttccct gttgctggag atcctgggcc tcctgtgcaa aagcatgggt 4020
cctaaaaagg tggggacgct gtggcgagaa gccgggctta gctggaagga atttctacct 4080
gaaggccagg acattggtgc attcgtcgct gaacagaagg tggagtatac cctgggagag 4140
gagtcggaag cccctggcca gagggcactc ccctccgagg agctgaacag gcagctggag 4200
aagctgctga aggagggcag cagtaaccag cgggtgttcg actggataga ggccaacctg 4260
agtgagcagc agatagtatc caacacgtta gttcgagccc tcatgacggc tgtctgctat 4320
tctgcaatta tttttgagac tcccctccga gtggacgttg cagtgctgaa agcgcgagcg 4380
aagctgctgc agaaatacct gtgtgacgag cagaaggagc tacaggcgct ctacgccctc 4440
caggcccttg tagtgacctt agaacagcct cccaacctgc tgcggatgtt ctttgacgca 4500
ctgtatgacg aggacgtggt gaaggaggat gccttctaca gttgggagag tagcaaggac 4560
cccgctgagc agcagggcaa gggtgtggcc cttaaatctg tcacagcctt cttcaagtgg 4620
ctccgtgaag cagaggagga gtctgaccac aactgagggc tggtggggcc ggggacctgg 4680
agccccatgg acacacagat ggcccggcta gccgcctgga ctgcaggggg gcggcagcag 4740
cggcggtggc agtgggtgcc tgtagtgtga tgtgtctgaa ctaataaagt ggctgaagag 4800
gcaggatggc ttggggctgc ctgggccccc ctccaggatg ccgccaggtg tccctctcct 4860
ccccctgggg cacagagata tattatatat aaagtcttga aatttggtgt gtcttggggt 4920
ggggaggggc accaacgcct gcccctgggg tccttttttt tattttctga aaatcactct 4980
cgggactgcc gtcctcgctg ctgggggcat atgccccagc ccctgtacca cccctgctgt 5040
tgcctgggca gggggaaggg ggggcacggt gcctgtaatt attaaacatg aattcaatta 5100
agctcaaaaa aaaaaaaaaa aaa 5123
<210> 29
<211> 1512
<212> PRT
<213> Homo sapiens
<400> 29
Met Met Ile Pro Ser Gln Ile Ser Tyr Pro Ala Ser Gln Gly Ala Tyr
1 5 10 15
Tyr Ile Pro Gly Gln Gly Arg Ser Thr Tyr Val Val Pro Thr Gln Gln
20 25 30
Tyr Pro Val Gln Pro Gly Ala Pro Gly Phe Tyr Pro Gly Ala Ser Pro
35 40 45
Thr Glu Phe Gly Thr Tyr Ala Gly Ala Tyr Tyr Pro Ala Gln Gly Val
50 55 60
Gln Gln Phe Pro Thr Gly Val Ala Pro Ala Pro Val Leu Met Asn Gln
65 70 75 80
Pro Pro Gln Ile Ala Pro Lys Arg Glu Arg Lys Thr Ile Arg Ile Arg
85 90 95
Asp Pro Asn Gln Gly Gly Lys Asp Ile Thr Glu Glu Ile Met Ser Gly
100 105 110
Ala Arg Thr Ala Ser Thr Pro Thr Pro Pro Gln Thr Gly Gly Gly Leu
115 120 125
Glu Pro Gln Ala Asn Gly Glu Thr Pro Gln Val Ala Val Ile Val Arg
130 135 140
Pro Asp Asp Arg Ser Gln Gly Ala Ile Ile Ala Asp Arg Pro Gly Leu
145 150 155 160
Pro Gly Pro Glu His Ser Pro Ser Glu Ser Gln Pro Ser Ser Pro Ser
165 170 175
Pro Thr Pro Ser Pro Ser Pro Val Leu Glu Pro Gly Ser Glu Pro Asn
180 185 190
Leu Ala Val Leu Ser Ile Pro Gly Asp Thr Met Thr Thr Ile Gln Met
195 200 205
Ser Val Glu Glu Ser Thr Pro Ile Ser Arg Glu Thr Gly Glu Pro Tyr
210 215 220
Arg Leu Ser Pro Glu Pro Thr Pro Leu Ala Glu Pro Ile Leu Glu Val
225 230 235 240
Glu Val Thr Leu Ser Lys Pro Val Pro Glu Ser Glu Phe Ser Ser Ser
245 250 255
Pro Leu Gln Ala Pro Thr Pro Leu Ala Ser His Thr Val Glu Ile His
260 265 270
Glu Pro Asn Gly Met Val Pro Ser Glu Asp Leu Glu Pro Glu Val Glu
275 280 285
Ser Ser Pro Glu Leu Ala Pro Pro Pro Ala Cys Pro Ser Glu Ser Pro
290 295 300
Val Pro Ile Ala Pro Thr Ala Gln Pro Glu Glu Leu Leu Asn Gly Ala
305 310 315 320
Pro Ser Pro Pro Ala Val Asp Leu Ser Pro Val Ser Glu Pro Glu Glu
325 330 335
Gln Ala Lys Glu Val Thr Ala Ser Met Ala Pro Pro Thr Ile Pro Ser
340 345 350
Ala Thr Pro Ala Thr Ala Pro Ser Ala Thr Ser Pro Ala Gln Glu Glu
355 360 365
Glu Met Glu Glu Glu Glu Glu Glu Glu Glu Gly Glu Ala Gly Glu Ala
370 375 380
Gly Glu Ala Glu Ser Glu Lys Gly Gly Glu Glu Leu Leu Pro Pro Glu
385 390 395 400
Ser Thr Pro Ile Pro Ala Asn Leu Ser Gln Asn Leu Glu Ala Ala Ala
405 410 415
Ala Thr Gln Val Ala Val Ser Val Pro Lys Arg Arg Arg Lys Ile Lys
420 425 430
Glu Leu Asn Lys Lys Glu Ala Val Gly Asp Leu Leu Asp Ala Phe Lys
435 440 445
Glu Ala Asn Pro Ala Val Pro Glu Val Glu Asn Gln Pro Pro Ala Gly
450 455 460
Ser Asn Pro Gly Pro Glu Ser Glu Gly Ser Gly Val Pro Pro Arg Pro
465 470 475 480
Glu Glu Ala Asp Glu Thr Trp Asp Ser Lys Glu Asp Lys Ile His Asn
485 490 495
Ala Glu Asn Ile Gln Pro Gly Glu Gln Lys Tyr Glu Tyr Lys Ser Asp
500 505 510
Gln Trp Lys Pro Leu Asn Leu Glu Glu Lys Lys Arg Tyr Asp Arg Glu
515 520 525
Phe Leu Leu Gly Phe Gln Phe Ile Phe Ala Ser Met Gln Lys Pro Glu
530 535 540
Gly Leu Pro His Ile Ser Asp Val Val Leu Asp Lys Ala Asn Lys Thr
545 550 555 560
Pro Leu Arg Pro Leu Asp Pro Thr Arg Leu Gln Gly Ile Asn Cys Gly
565 570 575
Pro Asp Phe Thr Pro Ser Phe Ala Asn Leu Gly Arg Thr Thr Leu Ser
580 585 590
Thr Arg Gly Pro Pro Arg Gly Gly Pro Gly Gly Glu Leu Pro Arg Gly
595 600 605
Pro Ala Gly Leu Gly Pro Arg Arg Ser Gln Gln Gly Pro Arg Lys Glu
610 615 620
Pro Arg Lys Ile Ile Ala Thr Val Leu Met Thr Glu Asp Ile Lys Leu
625 630 635 640
Asn Lys Ala Glu Lys Ala Trp Lys Pro Ser Ser Lys Arg Thr Ala Ala
645 650 655
Asp Lys Asp Arg Gly Glu Glu Asp Ala Asp Gly Ser Lys Thr Gln Asp
660 665 670
Leu Phe Arg Arg Val Arg Ser Ile Leu Asn Lys Leu Thr Pro Gln Met
675 680 685
Phe Gln Gln Leu Met Lys Gln Val Thr Gln Leu Ala Ile Asp Thr Glu
690 695 700
Glu Arg Leu Lys Gly Val Ile Asp Leu Ile Phe Glu Lys Ala Ile Ser
705 710 715 720
Glu Pro Asn Phe Ser Val Ala Tyr Ala Asn Met Cys Arg Cys Leu Met
725 730 735
Ala Leu Lys Val Pro Thr Thr Glu Lys Pro Thr Val Thr Val Asn Phe
740 745 750
Arg Lys Leu Leu Leu Asn Arg Cys Gln Lys Glu Phe Glu Lys Asp Lys
755 760 765
Asp Asp Asp Glu Val Phe Glu Lys Lys Gln Lys Glu Met Asp Glu Ala
770 775 780
Ala Thr Ala Glu Glu Arg Gly Arg Leu Lys Glu Glu Leu Glu Glu Ala
785 790 795 800
Arg Asp Ile Ala Arg Arg Arg Ser Leu Gly Asn Ile Lys Phe Ile Gly
805 810 815
Glu Leu Phe Lys Leu Lys Met Leu Thr Glu Ala Ile Met His Asp Cys
820 825 830
Val Val Lys Leu Leu Lys Asn His Asp Glu Glu Ser Leu Glu Cys Leu
835 840 845
Cys Arg Leu Leu Thr Thr Ile Gly Lys Asp Leu Asp Phe Glu Lys Ala
850 855 860
Lys Pro Arg Met Asp Gln Tyr Phe Asn Gln Met Glu Lys Ile Ile Lys
865 870 875 880
Glu Lys Lys Thr Ser Ser Arg Ile Arg Phe Met Leu Gln Asp Val Leu
885 890 895
Asp Leu Arg Gly Ser Asn Trp Val Pro Arg Arg Gly Asp Gln Gly Pro
900 905 910
Lys Thr Ile Asp Gln Ile His Lys Glu Ala Glu Met Glu Glu His Arg
915 920 925
Glu His Ile Lys Val Gln Gln Leu Met Ala Lys Gly Ser Asp Lys Arg
930 935 940
Arg Gly Gly Pro Pro Gly Pro Pro Ile Ser Arg Gly Leu Pro Leu Val
945 950 955 960
Asp Asp Gly Gly Trp Asn Thr Val Pro Ile Ser Lys Gly Ser Arg Pro
965 970 975
Ile Asp Thr Ser Arg Leu Thr Lys Ile Thr Lys Pro Gly Ser Ile Asp
980 985 990
Ser Asn Asn Gln Leu Phe Ala Pro Gly Gly Arg Leu Ser Trp Gly Lys
995 1000 1005
Gly Ser Ser Gly Gly Ser Gly Ala Lys Pro Ser Asp Ala Ala Ser
1010 1015 1020
Glu Ala Ala Arg Pro Ala Thr Ser Thr Leu Asn Arg Phe Ser Ala
1025 1030 1035
Leu Gln Gln Ala Val Pro Thr Glu Ser Thr Asp Asn Arg Arg Val
1040 1045 1050
Val Gln Arg Ser Ser Leu Ser Arg Glu Arg Gly Glu Lys Ala Gly
1055 1060 1065
Asp Arg Gly Asp Arg Leu Glu Arg Ser Glu Arg Gly Gly Asp Arg
1070 1075 1080
Gly Asp Arg Leu Asp Arg Ala Arg Thr Pro Ala Thr Lys Arg Ser
1085 1090 1095
Phe Ser Lys Glu Val Glu Glu Arg Ser Arg Glu Arg Pro Ser Gln
1100 1105 1110
Pro Glu Gly Leu Arg Lys Ala Ala Ser Leu Thr Glu Asp Arg Asp
1115 1120 1125
Arg Gly Arg Asp Ala Val Lys Arg Glu Ala Ala Leu Pro Pro Val
1130 1135 1140
Ser Pro Leu Lys Ala Ala Leu Ser Glu Glu Glu Leu Glu Lys Lys
1145 1150 1155
Ser Lys Ala Ile Ile Glu Glu Tyr Leu His Leu Asn Asp Met Lys
1160 1165 1170
Glu Ala Val Gln Cys Val Gln Glu Leu Ala Ser Pro Ser Leu Leu
1175 1180 1185
Phe Ile Phe Val Arg His Gly Val Glu Ser Thr Leu Glu Arg Ser
1190 1195 1200
Ala Ile Ala Arg Glu His Met Gly Gln Leu Leu His Gln Leu Leu
1205 1210 1215
Cys Ala Gly His Leu Ser Thr Ala Gln Tyr Tyr Gln Gly Leu Tyr
1220 1225 1230
Glu Ile Leu Glu Leu Ala Glu Asp Met Glu Ile Asp Ile Pro His
1235 1240 1245
Val Trp Leu Tyr Leu Ala Glu Leu Val Thr Pro Ile Leu Gln Glu
1250 1255 1260
Gly Gly Val Pro Met Gly Glu Leu Phe Arg Glu Ile Thr Lys Pro
1265 1270 1275
Leu Arg Pro Leu Gly Lys Ala Ala Ser Leu Leu Leu Glu Ile Leu
1280 1285 1290
Gly Leu Leu Cys Lys Ser Met Gly Pro Lys Lys Val Gly Thr Leu
1295 1300 1305
Trp Arg Glu Ala Gly Leu Ser Trp Lys Glu Phe Leu Pro Glu Gly
1310 1315 1320
Gln Asp Ile Gly Ala Phe Val Ala Glu Gln Lys Val Glu Tyr Thr
1325 1330 1335
Leu Gly Glu Glu Ser Glu Ala Pro Gly Gln Arg Ala Leu Pro Ser
1340 1345 1350
Glu Glu Leu Asn Arg Gln Leu Glu Lys Leu Leu Lys Glu Gly Ser
1355 1360 1365
Ser Asn Gln Arg Val Phe Asp Trp Ile Glu Ala Asn Leu Ser Glu
1370 1375 1380
Gln Gln Ile Val Ser Asn Thr Leu Val Arg Ala Leu Met Thr Ala
1385 1390 1395
Val Cys Tyr Ser Ala Ile Ile Phe Glu Thr Pro Leu Arg Val Asp
1400 1405 1410
Val Ala Val Leu Lys Ala Arg Ala Lys Leu Leu Gln Lys Tyr Leu
1415 1420 1425
Cys Asp Glu Gln Lys Glu Leu Gln Ala Leu Tyr Ala Leu Gln Ala
1430 1435 1440
Leu Val Val Thr Leu Glu Gln Pro Pro Asn Leu Leu Arg Met Phe
1445 1450 1455
Phe Asp Ala Leu Tyr Asp Glu Asp Val Val Lys Glu Asp Ala Phe
1460 1465 1470
Tyr Ser Trp Glu Ser Ser Lys Asp Pro Ala Glu Gln Gln Gly Lys
1475 1480 1485
Gly Val Ala Leu Lys Ser Val Thr Ala Phe Phe Lys Trp Leu Arg
1490 1495 1500
Glu Ala Glu Glu Glu Ser Asp His Asn
1505 1510
<210> 30
<211> 5300
<212> DNA
<213> Homo sapiens
<400> 30
cggcggcgca gatcgcccgg cgcggctccg ccccctgcgc cggtcacgtg ggggcgccgg 60
ctgcgcctgc ggagaagcgg tggccgccga gcgggatctg tgcggggagc cggaaatggt 120
tgtggactac gtctgtgcgg ctgcgtgggg ctcggccgcg cggactgaag gagactgaag 180
cacttctacc ctagccgggc ccagcccccg agcagtgcag cctcccgagt gcagagtgca 240
gcccctgccc gccctggccc agctgcccat gtctaccctg ctggatccca agtaatgatg 300
atcccttccc agatctccta cccagcctcc cagggggcct actacatccc tggacagggg 360
cgttccacat acgttgtccc gacacagcag taccctgtgc agccaggagc cccaggcttc 420
tatccaggtg caagccctac agaatttggg acctacgctg gcgcctacta tccagcccaa 480
ggggtgcagc agtttcccac tggcgtggcc cccgccccag ttttgatgaa ccagccaccc 540
cagattgctc ccaagaggga gcgtaagacg atccgaattc gagatccaaa ccaaggagga 600
aaggatatca cagaggagat catgtctggg gcccgcactg cctccacacc cacccctccc 660
cagacgggag gcggtctgga gcctcaagct aatggggaga cgccccaggt tgctgtcatt 720
gtccggccag atgaccggtc acagggagca atcattgctg accggccagg gctgcctggc 780
ccagagcata gcccttcaga atcccagcct tcgtcgcctt ctccgacccc atcaccatcc 840
ccagtcttgg aaccggggtc tgagcctaat ctcgcagtcc tctctattcc tggggacact 900
atgacaacta tacaaatgtc tgtagaagaa tcaaccccca tctcccgtga aactggggag 960
ccatatcgcc tctctccaga acccactcct ctcgccgaac ccatactgga agtagaagtg 1020
acacttagca aaccggttcc agaatctgag ttttcttcca gtcctctcca ggctcccacc 1080
cctttggcat ctcacacagt ggaaattcat gagcctaatg gcatggtccc atctgaagat 1140
ctggaaccag aggtggagtc aagcccagag cttgctcctc ccccagcttg cccctccgaa 1200
tcccctgtgc ccattgctcc aactgcccaa cctgaggaac tgctcaacgg agccccctcg 1260
ccaccagctg tggacttaag cccagtcagt gagccagagg agcaggccaa ggaggtgaca 1320
gcatcaatgg cgccccccac catcccctct gctactccag ctacggctcc ttcagctact 1380
tccccagctc aggaggagga aatggaagaa gaagaagaag aggaagaagg agaagcagga 1440
gaagcaggag aagctgagag tgagaaagga ggagaggaac tgctcccccc agagagtacc 1500
cctattccag ccaacttgtc tcagaatttg gaggcagcag cagccactca agtggcagta 1560
tctgtgccaa agaggagacg gaaaattaag gagctaaata agaaggaggc tgttggagac 1620
cttctggatg ccttcaagga ggcgaacccg gcagtaccag aggtggaaaa tcagcctcct 1680
gcaggcagca atccaggccc agagtctgag ggcagtggtg tgcccccacg tcctgaggaa 1740
gcagatgaga cctgggactc aaaggaagac aaaattcaca atgctgagaa catccagccc 1800
ggggaacaga agtatgaata taagtcagat cagtggaagc ctctaaacct agaggagaaa 1860
aaacgttacg accgtgagtt cctgcttggt tttcagttca tctttgccag tatgcagaag 1920
ccagagggat tgccacatat cagtgacgtg gtgctggaca aggccaataa aacaccactg 1980
cggccactgg atcccactag actacaaggc ataaattgtg gcccagactt cactccatcc 2040
tttgccaacc ttggccggac aacccttagc acccgtgggc ccccaagggg tgggccaggt 2100
ggggagctgc cccgtgggcc ggctggcctg ggaccccggc gctctcagca gggaccccga 2160
aaagaaccac gcaagatcat tgccacagtg ttaatgaccg aagatataaa actgaacaaa 2220
gcagagaaag cctggaaacc cagcagcaag cggacggcgg ctgataagga tcgaggggaa 2280
gaagatgctg atggcagcaa aacccaggac ctattccgca gggtgcgctc catcctgaat 2340
aaactgacac cccagatgtt ccagcagctg atgaagcaag tgacgcagct ggccatcgac 2400
accgaggaac gcctcaaagg ggtcattgac ctcatttttg agaaggccat ttcagagccc 2460
aacttctctg tggcctatgc caacatgtgc cgctgcctca tggcgctgaa agtgcccact 2520
acggaaaagc caacagtgac tgtgaacttc cgaaagctgt tgttgaatcg atgtcagaag 2580
gagtttgaga aagacaaaga tgatgatgag gtttttgaga agaagcaaaa agagatggat 2640
gaagctgcta cggcagagga acgaggacgc ctgaaggaag agctggaaga ggctcgggac 2700
atagcccggc ggcgctcttt agggaatatc aagtttattg gagagttgtt caaactgaag 2760
atgttaacag aggcaataat gcatgactgt gtggtcaaac tgcttaagaa ccatgatgaa 2820
gagtcccttg agtgcctttg tcgtctgctc accaccattg gcaaagacct ggactttgaa 2880
aaagccaagc cccgaatgga tcagtatttc aaccagatgg aaaaaatcat taaagaaaag 2940
aagacgtcat cccgcatccg ctttatgctg caggacgtgc tggatctgcg agggagcaat 3000
tgggtgccac gccgagggga tcagggtccc aagaccattg accagatcca taaggaggct 3060
gagatggaag aacatcgaga gcacatcaaa gtgcagcagc tcatggccaa gggcagtgac 3120
aagcgtcggg gcggtcctcc aggccctccc atcagccgtg gacttcccct tgtggatgat 3180
ggtggctgga acacagttcc catcagcaaa ggtagccgcc ccattgacac ctcacgactc 3240
accaagatca ccaagcctgg ctccatcgat tctaacaacc agctctttgc acctggaggg 3300
cgactgagct ggggcaaggg cagcagcgga ggctcaggag ccaagccctc agacgcagca 3360
tcagaagctg ctcgcccagc tactagtact ttgaatcgct tctcagccct tcaacaagcg 3420
gtacccacag aaagcacaga taatagacgt gtggtgcaga ggagtagctt gagccgagaa 3480
cgaggcgaga aagctggaga ccgaggagac cgcctagagc ggagtgaacg gggaggggac 3540
cgtggggacc ggcttgatcg tgcgcggaca cctgctacca agcggagctt cagcaaggaa 3600
gtggaggagc ggagtagaga acggccctcc cagcctgagg ggctgcgcaa ggcagctagc 3660
ctcacggagg atcgggaccg tgggcgggat gccgtgaagc gagaagctgc cctaccccca 3720
gtgagccccc tgaaggcggc tctctctgag gaggagttag agaagaaatc caaggctatc 3780
attgaggaat atctccatct caatgacatg aaagaggcag tccagtgcgt gcaggagctg 3840
gcctcaccct ccttgctctt catctttgta cggcatggtg tcgagtctac gctggagcgc 3900
agtgccattg ctcgtgagca tatggggcag ctgctgcacc agctgctctg tgctgggcat 3960
ctgtctactg ctcagtacta ccaagggttg tatgaaatct tggaattggc tgaggacatg 4020
gaaattgaca tcccccacgt gtggctctac ctagcggaac tggtaacacc cattctgcag 4080
gaaggtgggg tgcccatggg ggagctgttc agggagatta caaagcctct gagaccgttg 4140
ggcaaagctg cttccctgtt gctggagatc ctgggcctcc tgtgcaaaag catgggtcct 4200
aaaaaggtgg ggacgctgtg gcgagaagcc gggcttagct ggaaggaatt tctacctgaa 4260
ggccaggaca ttggtgcatt cgtcgctgaa cagaaggtgg agtataccct gggagaggag 4320
tcggaagccc ctggccagag ggcactcccc tccgaggagc tgaacaggca gctggagaag 4380
ctgctgaagg agggcagcag taaccagcgg gtgttcgact ggatagaggc caacctgagt 4440
gagcagcaga tagtatccaa cacgttagtt cgagccctca tgacggctgt ctgctattct 4500
gcaattattt ttgagactcc cctccgagtg gacgttgcag tgctgaaagc gcgagcgaag 4560
ctgctgcaga aatacctgtg tgacgagcag aaggagctac aggcgctcta cgccctccag 4620
gcccttgtag tgaccttaga acagcctccc aacctgctgc ggatgttctt tgacgcactg 4680
tatgacgagg acgtggtgaa ggaggatgcc ttctacagtt gggagagtag caaggacccc 4740
gctgagcagc agggcaaggg tgtggccctt aaatctgtca cagccttctt caagtggctc 4800
cgtgaagcag aggaggagtc tgaccacaac tgagggctgg tggggccggg gacctggagc 4860
cccatggaca cacagatggc ccggctagcc gcctggactg caggggggcg gcagcagcgg 4920
cggtggcagt gggtgcctgt agtgtgatgt gtctgaacta ataaagtggc tgaagaggca 4980
ggatggcttg gggctgcctg ggcccccctc caggatgccg ccaggtgtcc ctctcctccc 5040
cctggggcac agagatatat tatatataaa gtcttgaaat ttggtgtgtc ttggggtggg 5100
gaggggcacc aacgcctgcc cctggggtcc ttttttttat tttctgaaaa tcactctcgg 5160
gactgccgtc ctcgctgctg ggggcatatg ccccagcccc tgtaccaccc ctgctgttgc 5220
ctgggcaggg ggaagggggg gcacggtgcc tgtaattatt aaacatgaat tcaattaagc 5280
tcaaaaaaaa aaaaaaaaaa 5300
<210> 31
<211> 434
<212> PRT
<213> Homo sapiens
<400> 31
Met Ser Ile Leu Lys Ile His Ala Arg Glu Ile Phe Asp Ser Arg Gly
1 5 10 15
Asn Pro Thr Val Glu Val Asp Leu Phe Thr Ser Lys Gly Leu Phe Arg
20 25 30
Ala Ala Val Pro Ser Gly Ala Ser Thr Gly Ile Tyr Glu Ala Leu Glu
35 40 45
Leu Arg Asp Asn Asp Lys Thr Arg Tyr Met Gly Lys Gly Val Ser Lys
50 55 60
Ala Val Glu His Ile Asn Lys Thr Ile Ala Pro Ala Leu Val Ser Lys
65 70 75 80
Lys Leu Asn Val Thr Glu Gln Glu Lys Ile Asp Lys Leu Met Ile Glu
85 90 95
Met Asp Gly Thr Glu Asn Lys Ser Lys Phe Gly Ala Asn Ala Ile Leu
100 105 110
Gly Val Ser Leu Ala Val Cys Lys Ala Gly Ala Val Glu Lys Gly Val
115 120 125
Pro Leu Tyr Arg His Ile Ala Asp Leu Ala Gly Asn Ser Glu Val Ile
130 135 140
Leu Pro Val Pro Ala Phe Asn Val Ile Asn Gly Gly Ser His Ala Gly
145 150 155 160
Asn Lys Leu Ala Met Gln Glu Phe Met Ile Leu Pro Val Gly Ala Ala
165 170 175
Asn Phe Arg Glu Ala Met Arg Ile Gly Ala Glu Val Tyr His Asn Leu
180 185 190
Lys Asn Val Ile Lys Glu Lys Tyr Gly Lys Asp Ala Thr Asn Val Gly
195 200 205
Asp Glu Gly Gly Phe Ala Pro Asn Ile Leu Glu Asn Lys Glu Gly Leu
210 215 220
Glu Leu Leu Lys Thr Ala Ile Gly Lys Ala Gly Tyr Thr Asp Lys Val
225 230 235 240
Val Ile Gly Met Asp Val Ala Ala Ser Glu Phe Phe Arg Ser Gly Lys
245 250 255
Tyr Asp Leu Asp Phe Lys Ser Pro Asp Asp Pro Ser Arg Tyr Ile Ser
260 265 270
Pro Asp Gln Leu Ala Asp Leu Tyr Lys Ser Phe Ile Lys Asp Tyr Pro
275 280 285
Val Val Ser Ile Glu Asp Pro Phe Asp Gln Asp Asp Trp Gly Ala Trp
290 295 300
Gln Lys Phe Thr Ala Ser Ala Gly Ile Gln Val Val Gly Asp Asp Leu
305 310 315 320
Thr Val Thr Asn Pro Lys Arg Ile Ala Lys Ala Val Asn Glu Lys Ser
325 330 335
Cys Asn Cys Leu Leu Leu Lys Val Asn Gln Ile Gly Ser Val Thr Glu
340 345 350
Ser Leu Gln Ala Cys Lys Leu Ala Gln Ala Asn Gly Trp Gly Val Met
355 360 365
Val Ser His Arg Ser Gly Glu Thr Glu Asp Thr Phe Ile Ala Asp Leu
370 375 380
Val Val Gly Leu Cys Thr Gly Gln Ile Lys Thr Gly Ala Pro Cys Arg
385 390 395 400
Ser Glu Arg Leu Ala Lys Tyr Asn Gln Leu Leu Arg Ile Glu Glu Glu
405 410 415
Leu Gly Ser Lys Ala Lys Phe Ala Gly Arg Asn Phe Arg Asn Pro Leu
420 425 430
Ala Lys
<210> 32
<211> 2204
<212> DNA
<213> Homo sapiens
<400> 32
gtggggcccc agagcgacgc tgagtgcgtg cgggactcgg agtacgtgac ggagccccga 60
gctctcatgc ccgccacgcc gccccgggcc atcccccgga gccccggctc cgcacacccc 120
agttcggctc accggtccta tctggggcca gagtttcgcc cgcaccacta cagggccgct 180
ggggagtcgg ggccccccag atctgcccgc ctcaagtccg cgggacgtca cccccctttc 240
cacgctactg cagccgtcgc agtcccaccc ctttccggga ggtgagggaa tgagtgacgg 300
ctctcccgac gaatggcgag gcggagctga gggggcgtgc cccggaggcg ggaagtgggt 360
ggggctcgcc ttagctaggc aggaagtcgg cgcgggcggc gcggacagta tctgtgggta 420
cccggagcac ggagatctcg ccggctttac gttcacctcg gtgtctgcag caccctccgc 480
ttcctctcct aggcgacgag acccagtggc tagaagttca ccatgtctat tctcaagatc 540
catgccaggg agatctttga ctctcgcggg aatcccactg ttgaggttga tctcttcacc 600
tcaaaaggtc tcttcagagc tgctgtgccc agtggtgctt caactggtat ctatgaggcc 660
ctagagctcc gggacaatga taagactcgc tatatgggga agggtgtctc aaaggctgtt 720
gagcacatca ataaaactat tgcgcctgcc ctggttagca agaaactgaa cgtcacagaa 780
caagagaaga ttgacaaact gatgatcgag atggatggaa cagaaaataa atctaagttt 840
ggtgcgaacg ccattctggg ggtgtccctt gccgtctgca aagctggtgc cgttgagaag 900
ggggtccccc tgtaccgcca catcgctgac ttggctggca actctgaagt catcctgcca 960
gtcccggcgt tcaatgtcat caatggcggt tctcatgctg gcaacaagct ggccatgcag 1020
gagttcatga tcctcccagt cggtgcagca aacttcaggg aagccatgcg cattggagca 1080
gaggtttacc acaacctgaa gaatgtcatc aaggagaaat atgggaaaga tgccaccaat 1140
gtgggggatg aaggcgggtt tgctcccaac atcctggaga ataaagaagg cctggagctg 1200
ctgaagactg ctattgggaa agctggctac actgataagg tggtcatcgg catggacgta 1260
gcggcctccg agttcttcag gtctgggaag tatgacctgg acttcaagtc tcccgatgac 1320
cccagcaggt acatctcgcc tgaccagctg gctgacctgt acaagtcctt catcaaggac 1380
tacccagtgg tgtctatcga agatcccttt gaccaggatg actggggagc ttggcagaag 1440
ttcacagcca gtgcaggaat ccaggtagtg ggggatgatc tcacagtgac caacccaaag 1500
aggatcgcca aggccgtgaa cgagaagtcc tgcaactgcc tcctgctcaa agtcaaccag 1560
attggctccg tgaccgagtc tcttcaggcg tgcaagctgg cccaggccaa tggttggggc 1620
gtcatggtgt ctcatcgttc gggggagact gaagatacct tcatcgctga cctggttgtg 1680
gggctgtgca ctgggcagat caagactggt gccccttgcc gatctgagcg cttggccaag 1740
tacaaccagc tcctcagaat tgaagaggag ctgggcagca aggctaagtt tgccggcagg 1800
aacttcagaa accccttggc caagtaagct gtgggcaggc aagcccttcg gtcacctgtt 1860
ggctacacag acccctcccc tcgtgtcagc tcaggcagct cgaggccccc gaccaacact 1920
tgcaggggtc cctgctagtt agcgccccac cgccgtggag ttcgtaccgc ttccttagaa 1980
cttctacaga agccaagctc cctggagccc tgttggcagc tctagctttg cagtcgtgta 2040
attggcccaa gtcattgttt ttctcgcctc actttccacc aagtgtctag agtcatgtga 2100
gcctcgtgtc atctccgggg tggccacagg ctagatcccc ggtggttttg tgctcaaaat 2160
aaaaagcctc agtgacccat gagaataaaa aaaaaaaaaa aaaa 2204
<210> 33
<211> 321
<212> PRT
<213> Homo sapiens
<400> 33
Met Lys Pro Gly Phe Ser Pro Arg Gly Gly Gly Phe Gly Gly Arg Gly
1 5 10 15
Gly Phe Gly Asp Arg Gly Gly Arg Gly Gly Arg Gly Gly Phe Gly Gly
20 25 30
Gly Arg Gly Arg Gly Gly Gly Phe Arg Gly Arg Gly Arg Gly Gly Gly
35 40 45
Gly Gly Gly Gly Gly Gly Gly Gly Gly Gly Arg Gly Gly Gly Gly Phe
50 55 60
His Ser Gly Gly Asn Arg Gly Arg Gly Arg Gly Gly Lys Arg Gly Asn
65 70 75 80
Gln Ser Gly Lys Asn Val Met Val Glu Pro His Arg His Glu Gly Val
85 90 95
Phe Ile Cys Arg Gly Lys Glu Asp Ala Leu Val Thr Lys Asn Leu Val
100 105 110
Pro Gly Glu Ser Val Tyr Gly Glu Lys Arg Val Ser Ile Ser Glu Gly
115 120 125
Asp Asp Lys Ile Glu Tyr Arg Ala Trp Asn Pro Phe Arg Ser Lys Leu
130 135 140
Ala Ala Ala Ile Leu Gly Gly Val Asp Gln Ile His Ile Lys Pro Gly
145 150 155 160
Ala Lys Val Leu Tyr Leu Gly Ala Ala Ser Gly Thr Thr Val Ser His
165 170 175
Val Ser Asp Ile Val Gly Pro Asp Gly Leu Val Tyr Ala Val Glu Phe
180 185 190
Ser His Arg Ser Gly Arg Asp Leu Ile Asn Leu Ala Lys Lys Arg Thr
195 200 205
Asn Ile Ile Pro Val Ile Glu Asp Ala Arg His Pro His Lys Tyr Arg
210 215 220
Met Leu Ile Ala Met Val Asp Val Ile Phe Ala Asp Val Ala Gln Pro
225 230 235 240
Asp Gln Thr Arg Ile Val Ala Leu Asn Ala His Thr Phe Leu Arg Asn
245 250 255
Gly Gly His Phe Val Ile Ser Ile Lys Ala Asn Cys Ile Asp Ser Thr
260 265 270
Ala Ser Ala Glu Ala Val Phe Ala Ser Glu Val Lys Lys Met Gln Gln
275 280 285
Glu Asn Met Lys Pro Gln Glu Gln Leu Thr Leu Glu Pro Tyr Glu Arg
290 295 300
Asp His Ala Val Val Val Gly Val Tyr Arg Pro Pro Pro Lys Val Lys
305 310 315 320
Asn
<210> 34
<211> 1171
<212> DNA
<213> Homo sapiens
<400> 34
gcgtcacgca gcgcacgtcg ccgcgcgcct gcgctctttt ccacgtgcga aagccccgga 60
ctcgtggagt tgtgaacgcc gcggactccg gagccgcaca aaccagggct cgccatgaag 120
ccaggattca gtccccgtgg gggtggcttt ggcggccgag ggggctttgg tgaccgtggt 180
ggtcgtggag gccgaggggg ctttggcggg ggccgaggtc gaggcggagg ctttagaggt 240
cgtggacgag gaggaggtgg aggcggcggc ggcggtggag gaggaggaag aggtggtgga 300
ggcttccatt ctggtggcaa ccggggtcgt ggtcggggag gaaaaagagg aaaccagtcg 360
gggaagaatg tgatggtgga gccgcatcgg catgagggtg tcttcatttg tcgaggaaag 420
gaagatgcac tggtcaccaa gaacctggtc cctggggaat cagtttatgg agagaagaga 480
gtctcgattt cggaaggaga tgacaaaatt gagtaccgag cctggaaccc cttccgctcc 540
aagctagcag cagcaatcct gggtggtgtg gaccagatcc acatcaaacc gggggctaag 600
gttctctacc tcggggctgc ctcgggcacc acggtctccc atgtctctga catcgttggt 660
ccggatggtc tagtctatgc agtcgagttc tcccaccgct ctggccgtga cctcattaac 720
ttggccaaga agaggaccaa catcattcct gtgatcgagg atgctcgaca cccacacaaa 780
taccgcatgc tcatcgcaat ggtggatgtg atctttgctg atgtggccca gccagaccag 840
acccggattg tggccctgaa tgcccacacc ttcctgcgta atggaggaca ctttgtgatt 900
tccattaagg ccaactgcat tgactccaca gcctcagccg aggccgtgtt tgcctccgaa 960
gtgaaaaaga tgcaacagga gaacatgaag ccgcaggagc agttgaccct tgagccatat 1020
gaaagagacc atgccgtggt cgtgggagtg tacaggccac cccccaaggt gaagaactga 1080
agttcagcgc tgtcaggatt gcgagagatg tgtgttgata ctgttgcacg tgtgtttttc 1140
tattaaaaga ctcatccgtc tcccaaaaaa a 1171
<210> 35
<211> 420
<212> PRT
<213> Homo sapiens
<400> 35
Met Ser Gly Arg Pro Arg Thr Thr Ser Phe Ala Glu Ser Cys Lys Pro
1 5 10 15
Val Gln Gln Pro Ser Ala Phe Gly Ser Met Lys Val Ser Arg Asp Lys
20 25 30
Asp Gly Ser Lys Val Thr Thr Val Val Ala Thr Pro Gly Gln Gly Pro
35 40 45
Asp Arg Pro Gln Glu Val Ser Tyr Thr Asp Thr Lys Val Ile Gly Asn
50 55 60
Gly Ser Phe Gly Val Val Tyr Gln Ala Lys Leu Cys Asp Ser Gly Glu
65 70 75 80
Leu Val Ala Ile Lys Lys Val Leu Gln Asp Lys Arg Phe Lys Asn Arg
85 90 95
Glu Leu Gln Ile Met Arg Lys Leu Asp His Cys Asn Ile Val Arg Leu
100 105 110
Arg Tyr Phe Phe Tyr Ser Ser Gly Glu Lys Lys Asp Glu Val Tyr Leu
115 120 125
Asn Leu Val Leu Asp Tyr Val Pro Glu Thr Val Tyr Arg Val Ala Arg
130 135 140
His Tyr Ser Arg Ala Lys Gln Thr Leu Pro Val Ile Tyr Val Lys Leu
145 150 155 160
Tyr Met Tyr Gln Leu Phe Arg Ser Leu Ala Tyr Ile His Ser Phe Gly
165 170 175
Ile Cys His Arg Asp Ile Lys Pro Gln Asn Leu Leu Leu Asp Pro Asp
180 185 190
Thr Ala Val Leu Lys Leu Cys Asp Phe Gly Ser Ala Lys Gln Leu Val
195 200 205
Arg Gly Glu Pro Asn Val Ser Tyr Ile Cys Ser Arg Tyr Tyr Arg Ala
210 215 220
Pro Glu Leu Ile Phe Gly Ala Thr Asp Tyr Thr Ser Ser Ile Asp Val
225 230 235 240
Trp Ser Ala Gly Cys Val Leu Ala Glu Leu Leu Leu Gly Gln Pro Ile
245 250 255
Phe Pro Gly Asp Ser Gly Val Asp Gln Leu Val Glu Ile Ile Lys Val
260 265 270
Leu Gly Thr Pro Thr Arg Glu Gln Ile Arg Glu Met Asn Pro Asn Tyr
275 280 285
Thr Glu Phe Lys Phe Pro Gln Ile Lys Ala His Pro Trp Thr Lys Val
290 295 300
Phe Arg Pro Arg Thr Pro Pro Glu Ala Ile Ala Leu Cys Ser Arg Leu
305 310 315 320
Leu Glu Tyr Thr Pro Thr Ala Arg Leu Thr Pro Leu Glu Ala Cys Ala
325 330 335
His Ser Phe Phe Asp Glu Leu Arg Asp Pro Asn Val Lys Leu Pro Asn
340 345 350
Gly Arg Asp Thr Pro Ala Leu Phe Asn Phe Thr Thr Gln Glu Leu Ser
355 360 365
Ser Asn Pro Pro Leu Ala Thr Ile Leu Ile Pro Pro His Ala Arg Ile
370 375 380
Gln Ala Ala Ala Ser Thr Pro Thr Asn Ala Thr Ala Ala Ser Asp Ala
385 390 395 400
Asn Thr Gly Asp Arg Gly Gln Thr Asn Asn Ala Ala Ser Ala Ser Ala
405 410 415
Ser Asn Ser Thr
420
<210> 36
<211> 7095
<212> DNA
<213> Homo sapiens
<400> 36
cgggcttgtg ccgccgccgc cgccgccgcc gcccgggcca agtgacaaag gaaggaagga 60
agcgaggagg agccggcccc gcagccgctg acagggctct gggctggggc aaagcgcgga 120
cacttcctga gcgggcaccg agcagagccg aggggcggga gggcggccga gctgttgccg 180
cggacggggg agggggcccc gagggacgga agcggttgcc gggttcccat gtccccggcg 240
aatggggaac agtcgaggag ccgctgcctg gggtctgaag ggagctgcct ccgccaccgc 300
catggccgct ggatccagcc gccgcctgca gctgctcctg gcgcaatgag gagaggagcc 360
gccgccaccg ccaccgcccg cctctgactg actcgcgact ccgccgccct ctagttcgcc 420
gggcccctgc cgtcagcccg ccggatcccg cggcttgccg gagctgcagc gtttcccgtc 480
gcatctccga gccaccccct ccctccctct ccctccctcc tacccatccc cctttctctt 540
caagcgtgag actcgtgatc cttccgccgc ttcccttctt cattgactcg gaaaaaaaat 600
ccccgaggaa aatataatat tcgaagtact cattttcaat caagtatttg cccccgtttc 660
acgtgataca tattttttta ggatttgccc tctcttttct ctcctcccag gaaagggagg 720
ggaaagaatt gtattttttc ccaagtccta aatcatctat atgttaaata tccgtgccga 780
tctgtcttga aggagaaata tatcgcttgt tttgtttttt atagtataca aaaggagtga 840
aaagccaaga ggacgaagtc tttttctttt tcttctgtgg gagaacttaa tgctgcattt 900
atcgttaacc taacacccca acataaagac aaaaggaaga aaaggaggaa ggaaggaaaa 960
ggtgattcgc gaagagagtg atcatgtcag ggcggcccag aaccacctcc tttgcggaga 1020
gctgcaagcc ggtgcagcag ccttcagctt ttggcagcat gaaagttagc agagacaagg 1080
acggcagcaa ggtgacaaca gtggtggcaa ctcctgggca gggtccagac aggccacaag 1140
aagtcagcta tacagacact aaagtgattg gaaatggatc atttggtgtg gtatatcaag 1200
ccaaactttg tgattcagga gaactggtcg ccatcaagaa agtattgcag gacaagagat 1260
ttaagaatcg agagctccag atcatgagaa agctagatca ctgtaacata gtccgattgc 1320
gttatttctt ctactccagt ggtgagaaga aagatgaggt ctatcttaat ctggtgctgg 1380
actatgttcc ggaaacagta tacagagttg ccagacacta tagtcgagcc aaacagacgc 1440
tccctgtgat ttatgtcaag ttgtatatgt atcagctgtt ccgaagttta gcctatatcc 1500
attcctttgg aatctgccat cgggatatta aaccgcagaa cctcttgttg gatcctgata 1560
ctgctgtatt aaaactctgt gactttggaa gtgcaaagca gctggtccga ggagaaccca 1620
atgtttcgta tatctgttct cggtactata gggcaccaga gttgatcttt ggagccactg 1680
attatacctc tagtatagat gtatggtctg ctggctgtgt gttggctgag ctgttactag 1740
gacaaccaat atttccaggg gatagtggtg tggatcagtt ggtagaaata atcaaggtcc 1800
tgggaactcc aacaagggag caaatcagag aaatgaaccc aaactacaca gaatttaaat 1860
tccctcaaat taaggcacat ccttggacta aggtcttccg accccgaact ccaccggagg 1920
caattgcact gtgtagccgt ctgctggagt atacaccaac tgcccgacta acaccactgg 1980
aagcttgtgc acattcattt tttgatgaat tacgggaccc aaatgtcaaa ctaccaaatg 2040
ggcgagacac acctgcactc ttcaacttca ccactcaaga actgtcaagt aatccacctc 2100
tggctaccat ccttattcct cctcatgctc ggattcaagc agctgcttca acccccacaa 2160
atgccacagc agcgtcagat gctaatactg gagaccgtgg acagaccaat aatgctgctt 2220
ctgcatcagc ttccaactcc acctgaacag tcccgagcag ccagctgcac aggaaaaacc 2280
accagttact tgagtgtcac tcagcaacac tggtcacgtt tggaaagaat attaaaaaga 2340
gaaaaaaatc ctgttcattt tagtgttcaa tttttttatt attattgttg ttcttattta 2400
accttgtaaa atatctataa atacaaacca atttcattgt attctcactt tgagggagat 2460
ccagggggtg ggaggggttg tggggagggg gaaagcggag cactagaaca tacaatctct 2520
ctcccacgac aatctttttt tattaaaagt ctgctgttgt atactttaaa aacaggactc 2580
ctgcctcatg ccccttccac aaaagaagaa aacctttttc tgtgctgatg ggtttttttg 2640
aactttgttt tcttttaaag tctagtgtga gactttggta tagtgcacag cttgaaattg 2700
gttgggagct tagcaggtat aactcaacgg ggacttaaat gtcacttgta aaattaatcc 2760
atatcttcgg gtatttatag acttgccttt ggcatgttgg tggcaggtgt ggcagacaaa 2820
gaaatgtgta tcattcgtaa cccagggagg tcaataaagt ttggaactct acagggaaga 2880
ttcttagtag atttgttaag gttttgtttt gctctcagtt agtgctagtg atgtagaggc 2940
ttgtacagga ggctgccaga ggggaagcag caagcaagac tcaggcacac atgctctaca 3000
ggtggctctt tgtttgcctg accaaagttc tttgcaaatc ttagcacagt ttcaaactag 3060
tgacctggga ggagatggaa ggggtgttga gcaggctgag ctagctgctg aggtcaaagg 3120
ctgatgagcc cagaggaagg ggacaggtca gggatacatc tcaccactgt gaataagttt 3180
gtccagattt ttttctaaag ttacttccct tggaaagata cacttgagag gacattgtag 3240
ttaaataatg tgaactgtaa cagtcatcta ctggtttatt tttcatattt tttaattgaa 3300
aattgagctt gcagaaatag ccacattcta cacatagttc taattttaaa tccaaatcta 3360
gaatctgtat ttaatttgtt ttttaacctc atgcttttta catttattta ttgatgcatg 3420
tcagatggta gaaatattaa aaactacaca tcagaatgat acagtcactt atacctgctg 3480
actttatagg aaagctgatg atataaatgt gtgtatatat gttatatata catatattca 3540
atactgcctt tttttttgtc tacagtatca aaattgactg gttgaagcat gagaagaatg 3600
tttcccccac acccagttaa gagtttttgt gtctgttttc tttgtgtatc agtgaacgat 3660
gttaagaatc agtctctctt tttgaagaaa aagcaatatt ccttggaaag caaggagaat 3720
tgaaggacta tgtttgccgt gaggaaatag attttcatga ctagtttgtt ttatactttt 3780
aaggttggca tctatgtggg ccttatatac tctaaaatga actttagtca ccttggtgct 3840
tatgggccat tacttgacct atgaatcttt aaggcacaat cagttgtact ttacatttaa 3900
agatcacttg agtgatggcc gcctttccct cctacccgct ccttccccac atgccttcca 3960
aggttagctg gtaactgtag ggctgcagag ctgagcccat ggttgtgtgt aacttgccct 4020
caccctcctc attgccacct taggtcactt tatgggtctc gtcctccaga gggttcggaa 4080
gtggagtctg ttggcagccc tcctgcaggc cctagcaccc tgtcctgctc cttaactgtg 4140
tgtgtgactc tccaagagag ttgtcctgcc tgctgaagtg aaccagtacc cagaaagaca 4200
actgtgagcc atcttggttt tcactcgctg tttagctgag gtcttgggcc acaaaagggg 4260
tttcacaaac ctctggatat atcagagttt atgagaaagg aaacatgctc agtcaaacca 4320
aatcaaacaa attgaatttt atgttttata aagtgcttct gaaagctaag atttgaaaga 4380
agtctgaaat caaagtattt ggcagcataa ctccttaaag gtagtggcgt tgatagacca 4440
ttttcagaca gaatttataa agaatctgaa aaggcaggtc tgtgatagag aaatggacct 4500
gcattcagat ccaactgccc agcaagcgtt tggatgcaga cactgctctg gacgtggtat 4560
actccccaga gtccataaaa atcagtgctt attttaggaa acaggttgcc ccccacaact 4620
ggggtaaaag aagagagaaa agtcacgctt ttctctcatt tcattgtgtg tgcatgtgtg 4680
cgtgtgtgtg tgtgtgtgtg tgtgctgaga tgtgtgattt ttctttctca aggatcatgg 4740
tgggatcaca gaactctttt atacaagtga gatccaggtc tctgaatatc tttttgtata 4800
taataataat aaaaagctcc tcaccaaatt caagcttgta cattatattt tctttctgtg 4860
tttttaaatt taagttttat tgttttgtat gtaaatatgt ggacccagga actgttatta 4920
atgagcaaaa agttactgtt cagggcagtg attctgttta ataatcagac aaaatgtaga 4980
cgagcttttt aaagccatat agttttaact ctgtacagta ggtaccggcc tgtattattg 5040
taacaataac tctagcaatg tatagtgtat ctatatagtt tggagtgcct tcgcttccat 5100
gtgttttttt ttttaatttg ttctttttta aattttaatt ggtttccttt atccatgtct 5160
ccctgtccac cccctttccc tttgaaataa taactcactc ataacagtat ctttgcccct 5220
tccacagtta agtttcagtg ataccatact caggagtggg aagaggaaat catattcgta 5280
atttcatttc gttgaagccc tgcctttgtt ttggttctga atgtctttcc tcctcggtag 5340
cagtgagacc ggtttcattt catacttagt ccattcaggg acttagtgta gcaccaggga 5400
gccctagagc tggaggatat cgaatagatt aaattttgct cgtctcttcc acaagcccta 5460
accatgggtc ttaaaaacag cagattctgg gagccttcca tgctctctct ctctcctctt 5520
ttatctactt ccctcccaaa tgagagagtg acagagaatt gtttttttat aaatcgaagt 5580
ttcttaatag tatcaggttt tgatacgtca gtggtctaaa atgctatagt gcaattacta 5640
gcagttactg cacggagtgc caccgtgcca atagaggact gttgttttaa caagggaact 5700
cttagcccat ttcctccctc ccgccatctc tacccttgct caatgaaata tcattttaat 5760
ttcttttaaa aaaaatcagt ttaattctta ctgtgtgccc aacacgaagg ccttttttga 5820
aagaaaaata gaatgttttg cctcaaagta gtccatataa aatgtcttga atagaagaaa 5880
aaactaccaa accaaaggtt actatttttg aaacatcgtg tgttcattcc agcaaggcag 5940
aagactgcac cttctttcca gtgacatgct gtgtcatttt ttttaagtcc tcttaatttt 6000
tagacacatt tttggtttat gttttaacaa tgtatgccta accagtcatc ttgtctgcac 6060
caatgcaaag gtttctgaga ggagtattct ctatccctgt ggatatgaag acactggcat 6120
ttcatctatt tttccctttc ctttttaaag gatttaactt tggaatcttc caaaggaagt 6180
ttggccaatg ccagatcccc aggaatttgg ggggttttct ttcttttcaa ctgaaattgt 6240
atctgattcc tactgttcat gttagtgatc atctaatcac agagccaaac acttttctcc 6300
cctgtgtgga aaagtaggta tgctttacaa taaaatctgt cttttctggt agaaacctga 6360
gccactgaaa ataaaagaga caactagaag cacagtagag tcccagactg agatctacct 6420
ttgagaggct ttgaaagtaa tccctggggt ttggattatt ttcacaaggg ttatgccgtt 6480
ttattcaagt ttgttgctcc gttttgcacc tctgcaataa aagcaaaatg acaaccagta 6540
cataaggggt tagcttgaca aagtagactt ccttgtgtta atttttaagt ttttttttcc 6600
ttaactatat ctgtctacag gcagatacag atagttgtat gaaaatctgc ttgcctgtaa 6660
aatttgcatt tataaatgtg ttgccgatgg atcacttggg cctgtacaca taccaattag 6720
cgtgaccact tccatcttaa aaacaaacct aaaaaacaaa atttattata tatatatata 6780
tatatatata aaggactgtg ggttgtatac aaactattgc aaacacttgt gcaaatctgt 6840
cttgatataa aggaaaagca aaatctgtat aacattatta ctacttgaat gcctctgtga 6900
ctgatttttt tttcatttta aatataaact tttttgtgaa aagtatgctc aatgtttttt 6960
ttccctttcc ccattccctt gtaaatacat tttgttctat gtgacttggt ttggaaatag 7020
ttaactggta ctgtaatttg cattaaataa aaagtaggtt agcctggaaa tgaaattaaa 7080
aaaaaaaaaa aaaaa 7095
<210> 37
<211> 433
<212> PRT
<213> Homo sapiens
<400> 37
Met Ser Gly Arg Pro Arg Thr Thr Ser Phe Ala Glu Ser Cys Lys Pro
1 5 10 15
Val Gln Gln Pro Ser Ala Phe Gly Ser Met Lys Val Ser Arg Asp Lys
20 25 30
Asp Gly Ser Lys Val Thr Thr Val Val Ala Thr Pro Gly Gln Gly Pro
35 40 45
Asp Arg Pro Gln Glu Val Ser Tyr Thr Asp Thr Lys Val Ile Gly Asn
50 55 60
Gly Ser Phe Gly Val Val Tyr Gln Ala Lys Leu Cys Asp Ser Gly Glu
65 70 75 80
Leu Val Ala Ile Lys Lys Val Leu Gln Asp Lys Arg Phe Lys Asn Arg
85 90 95
Glu Leu Gln Ile Met Arg Lys Leu Asp His Cys Asn Ile Val Arg Leu
100 105 110
Arg Tyr Phe Phe Tyr Ser Ser Gly Glu Lys Lys Asp Glu Val Tyr Leu
115 120 125
Asn Leu Val Leu Asp Tyr Val Pro Glu Thr Val Tyr Arg Val Ala Arg
130 135 140
His Tyr Ser Arg Ala Lys Gln Thr Leu Pro Val Ile Tyr Val Lys Leu
145 150 155 160
Tyr Met Tyr Gln Leu Phe Arg Ser Leu Ala Tyr Ile His Ser Phe Gly
165 170 175
Ile Cys His Arg Asp Ile Lys Pro Gln Asn Leu Leu Leu Asp Pro Asp
180 185 190
Thr Ala Val Leu Lys Leu Cys Asp Phe Gly Ser Ala Lys Gln Leu Val
195 200 205
Arg Gly Glu Pro Asn Val Ser Tyr Ile Cys Ser Arg Tyr Tyr Arg Ala
210 215 220
Pro Glu Leu Ile Phe Gly Ala Thr Asp Tyr Thr Ser Ser Ile Asp Val
225 230 235 240
Trp Ser Ala Gly Cys Val Leu Ala Glu Leu Leu Leu Gly Gln Pro Ile
245 250 255
Phe Pro Gly Asp Ser Gly Val Asp Gln Leu Val Glu Ile Ile Lys Val
260 265 270
Leu Gly Thr Pro Thr Arg Glu Gln Ile Arg Glu Met Asn Pro Asn Tyr
275 280 285
Thr Glu Phe Lys Phe Pro Gln Ile Lys Ala His Pro Trp Thr Lys Asp
290 295 300
Ser Ser Gly Thr Gly His Phe Thr Ser Gly Val Arg Val Phe Arg Pro
305 310 315 320
Arg Thr Pro Pro Glu Ala Ile Ala Leu Cys Ser Arg Leu Leu Glu Tyr
325 330 335
Thr Pro Thr Ala Arg Leu Thr Pro Leu Glu Ala Cys Ala His Ser Phe
340 345 350
Phe Asp Glu Leu Arg Asp Pro Asn Val Lys Leu Pro Asn Gly Arg Asp
355 360 365
Thr Pro Ala Leu Phe Asn Phe Thr Thr Gln Glu Leu Ser Ser Asn Pro
370 375 380
Pro Leu Ala Thr Ile Leu Ile Pro Pro His Ala Arg Ile Gln Ala Ala
385 390 395 400
Ala Ser Thr Pro Thr Asn Ala Thr Ala Ala Ser Asp Ala Asn Thr Gly
405 410 415
Asp Arg Gly Gln Thr Asn Asn Ala Ala Ser Ala Ser Ala Ser Asn Ser
420 425 430
Thr
<210> 38
<211> 7134
<212> DNA
<213> Homo sapiens
<400> 38
cgggcttgtg ccgccgccgc cgccgccgcc gcccgggcca agtgacaaag gaaggaagga 60
agcgaggagg agccggcccc gcagccgctg acagggctct gggctggggc aaagcgcgga 120
cacttcctga gcgggcaccg agcagagccg aggggcggga gggcggccga gctgttgccg 180
cggacggggg agggggcccc gagggacgga agcggttgcc gggttcccat gtccccggcg 240
aatggggaac agtcgaggag ccgctgcctg gggtctgaag ggagctgcct ccgccaccgc 300
catggccgct ggatccagcc gccgcctgca gctgctcctg gcgcaatgag gagaggagcc 360
gccgccaccg ccaccgcccg cctctgactg actcgcgact ccgccgccct ctagttcgcc 420
gggcccctgc cgtcagcccg ccggatcccg cggcttgccg gagctgcagc gtttcccgtc 480
gcatctccga gccaccccct ccctccctct ccctccctcc tacccatccc cctttctctt 540
caagcgtgag actcgtgatc cttccgccgc ttcccttctt cattgactcg gaaaaaaaat 600
ccccgaggaa aatataatat tcgaagtact cattttcaat caagtatttg cccccgtttc 660
acgtgataca tattttttta ggatttgccc tctcttttct ctcctcccag gaaagggagg 720
ggaaagaatt gtattttttc ccaagtccta aatcatctat atgttaaata tccgtgccga 780
tctgtcttga aggagaaata tatcgcttgt tttgtttttt atagtataca aaaggagtga 840
aaagccaaga ggacgaagtc tttttctttt tcttctgtgg gagaacttaa tgctgcattt 900
atcgttaacc taacacccca acataaagac aaaaggaaga aaaggaggaa ggaaggaaaa 960
ggtgattcgc gaagagagtg atcatgtcag ggcggcccag aaccacctcc tttgcggaga 1020
gctgcaagcc ggtgcagcag ccttcagctt ttggcagcat gaaagttagc agagacaagg 1080
acggcagcaa ggtgacaaca gtggtggcaa ctcctgggca gggtccagac aggccacaag 1140
aagtcagcta tacagacact aaagtgattg gaaatggatc atttggtgtg gtatatcaag 1200
ccaaactttg tgattcagga gaactggtcg ccatcaagaa agtattgcag gacaagagat 1260
ttaagaatcg agagctccag atcatgagaa agctagatca ctgtaacata gtccgattgc 1320
gttatttctt ctactccagt ggtgagaaga aagatgaggt ctatcttaat ctggtgctgg 1380
actatgttcc ggaaacagta tacagagttg ccagacacta tagtcgagcc aaacagacgc 1440
tccctgtgat ttatgtcaag ttgtatatgt atcagctgtt ccgaagttta gcctatatcc 1500
attcctttgg aatctgccat cgggatatta aaccgcagaa cctcttgttg gatcctgata 1560
ctgctgtatt aaaactctgt gactttggaa gtgcaaagca gctggtccga ggagaaccca 1620
atgtttcgta tatctgttct cggtactata gggcaccaga gttgatcttt ggagccactg 1680
attatacctc tagtatagat gtatggtctg ctggctgtgt gttggctgag ctgttactag 1740
gacaaccaat atttccaggg gatagtggtg tggatcagtt ggtagaaata atcaaggtcc 1800
tgggaactcc aacaagggag caaatcagag aaatgaaccc aaactacaca gaatttaaat 1860
tccctcaaat taaggcacat ccttggacta aggattcgtc aggaacagga catttcacct 1920
caggagtgcg ggtcttccga ccccgaactc caccggaggc aattgcactg tgtagccgtc 1980
tgctggagta tacaccaact gcccgactaa caccactgga agcttgtgca cattcatttt 2040
ttgatgaatt acgggaccca aatgtcaaac taccaaatgg gcgagacaca cctgcactct 2100
tcaacttcac cactcaagaa ctgtcaagta atccacctct ggctaccatc cttattcctc 2160
ctcatgctcg gattcaagca gctgcttcaa cccccacaaa tgccacagca gcgtcagatg 2220
ctaatactgg agaccgtgga cagaccaata atgctgcttc tgcatcagct tccaactcca 2280
cctgaacagt cccgagcagc cagctgcaca ggaaaaacca ccagttactt gagtgtcact 2340
cagcaacact ggtcacgttt ggaaagaata ttaaaaagag aaaaaaatcc tgttcatttt 2400
agtgttcaat ttttttatta ttattgttgt tcttatttaa ccttgtaaaa tatctataaa 2460
tacaaaccaa tttcattgta ttctcacttt gagggagatc cagggggtgg gaggggttgt 2520
ggggaggggg aaagcggagc actagaacat acaatctctc tcccacgaca atcttttttt 2580
attaaaagtc tgctgttgta tactttaaaa acaggactcc tgcctcatgc cccttccaca 2640
aaagaagaaa acctttttct gtgctgatgg gtttttttga actttgtttt cttttaaagt 2700
ctagtgtgag actttggtat agtgcacagc ttgaaattgg ttgggagctt agcaggtata 2760
actcaacggg gacttaaatg tcacttgtaa aattaatcca tatcttcggg tatttataga 2820
cttgcctttg gcatgttggt ggcaggtgtg gcagacaaag aaatgtgtat cattcgtaac 2880
ccagggaggt caataaagtt tggaactcta cagggaagat tcttagtaga tttgttaagg 2940
ttttgttttg ctctcagtta gtgctagtga tgtagaggct tgtacaggag gctgccagag 3000
gggaagcagc aagcaagact caggcacaca tgctctacag gtggctcttt gtttgcctga 3060
ccaaagttct ttgcaaatct tagcacagtt tcaaactagt gacctgggag gagatggaag 3120
gggtgttgag caggctgagc tagctgctga ggtcaaaggc tgatgagccc agaggaaggg 3180
gacaggtcag ggatacatct caccactgtg aataagtttg tccagatttt tttctaaagt 3240
tacttccctt ggaaagatac acttgagagg acattgtagt taaataatgt gaactgtaac 3300
agtcatctac tggtttattt ttcatatttt ttaattgaaa attgagcttg cagaaatagc 3360
cacattctac acatagttct aattttaaat ccaaatctag aatctgtatt taatttgttt 3420
tttaacctca tgctttttac atttatttat tgatgcatgt cagatggtag aaatattaaa 3480
aactacacat cagaatgata cagtcactta tacctgctga ctttatagga aagctgatga 3540
tataaatgtg tgtatatatg ttatatatac atatattcaa tactgccttt ttttttgtct 3600
acagtatcaa aattgactgg ttgaagcatg agaagaatgt ttcccccaca cccagttaag 3660
agtttttgtg tctgttttct ttgtgtatca gtgaacgatg ttaagaatca gtctctcttt 3720
ttgaagaaaa agcaatattc cttggaaagc aaggagaatt gaaggactat gtttgccgtg 3780
aggaaataga ttttcatgac tagtttgttt tatactttta aggttggcat ctatgtgggc 3840
cttatatact ctaaaatgaa ctttagtcac cttggtgctt atgggccatt acttgaccta 3900
tgaatcttta aggcacaatc agttgtactt tacatttaaa gatcacttga gtgatggccg 3960
cctttccctc ctacccgctc cttccccaca tgccttccaa ggttagctgg taactgtagg 4020
gctgcagagc tgagcccatg gttgtgtgta acttgccctc accctcctca ttgccacctt 4080
aggtcacttt atgggtctcg tcctccagag ggttcggaag tggagtctgt tggcagccct 4140
cctgcaggcc ctagcaccct gtcctgctcc ttaactgtgt gtgtgactct ccaagagagt 4200
tgtcctgcct gctgaagtga accagtaccc agaaagacaa ctgtgagcca tcttggtttt 4260
cactcgctgt ttagctgagg tcttgggcca caaaaggggt ttcacaaacc tctggatata 4320
tcagagttta tgagaaagga aacatgctca gtcaaaccaa atcaaacaaa ttgaatttta 4380
tgttttataa agtgcttctg aaagctaaga tttgaaagaa gtctgaaatc aaagtatttg 4440
gcagcataac tccttaaagg tagtggcgtt gatagaccat tttcagacag aatttataaa 4500
gaatctgaaa aggcaggtct gtgatagaga aatggacctg cattcagatc caactgccca 4560
gcaagcgttt ggatgcagac actgctctgg acgtggtata ctccccagag tccataaaaa 4620
tcagtgctta ttttaggaaa caggttgccc cccacaactg gggtaaaaga agagagaaaa 4680
gtcacgcttt tctctcattt cattgtgtgt gcatgtgtgc gtgtgtgtgt gtgtgtgtgt 4740
gtgctgagat gtgtgatttt tctttctcaa ggatcatggt gggatcacag aactctttta 4800
tacaagtgag atccaggtct ctgaatatct ttttgtatat aataataata aaaagctcct 4860
caccaaattc aagcttgtac attatatttt ctttctgtgt ttttaaattt aagttttatt 4920
gttttgtatg taaatatgtg gacccaggaa ctgttattaa tgagcaaaaa gttactgttc 4980
agggcagtga ttctgtttaa taatcagaca aaatgtagac gagcttttta aagccatata 5040
gttttaactc tgtacagtag gtaccggcct gtattattgt aacaataact ctagcaatgt 5100
atagtgtatc tatatagttt ggagtgcctt cgcttccatg tgtttttttt tttaatttgt 5160
tcttttttaa attttaattg gtttccttta tccatgtctc cctgtccacc ccctttccct 5220
ttgaaataat aactcactca taacagtatc tttgcccctt ccacagttaa gtttcagtga 5280
taccatactc aggagtggga agaggaaatc atattcgtaa tttcatttcg ttgaagccct 5340
gcctttgttt tggttctgaa tgtctttcct cctcggtagc agtgagaccg gtttcatttc 5400
atacttagtc cattcaggga cttagtgtag caccagggag ccctagagct ggaggatatc 5460
gaatagatta aattttgctc gtctcttcca caagccctaa ccatgggtct taaaaacagc 5520
agattctggg agccttccat gctctctctc tctcctcttt tatctacttc cctcccaaat 5580
gagagagtga cagagaattg tttttttata aatcgaagtt tcttaatagt atcaggtttt 5640
gatacgtcag tggtctaaaa tgctatagtg caattactag cagttactgc acggagtgcc 5700
accgtgccaa tagaggactg ttgttttaac aagggaactc ttagcccatt tcctccctcc 5760
cgccatctct acccttgctc aatgaaatat cattttaatt tcttttaaaa aaaatcagtt 5820
taattcttac tgtgtgccca acacgaaggc cttttttgaa agaaaaatag aatgttttgc 5880
ctcaaagtag tccatataaa atgtcttgaa tagaagaaaa aactaccaaa ccaaaggtta 5940
ctatttttga aacatcgtgt gttcattcca gcaaggcaga agactgcacc ttctttccag 6000
tgacatgctg tgtcattttt tttaagtcct cttaattttt agacacattt ttggtttatg 6060
ttttaacaat gtatgcctaa ccagtcatct tgtctgcacc aatgcaaagg tttctgagag 6120
gagtattctc tatccctgtg gatatgaaga cactggcatt tcatctattt ttccctttcc 6180
tttttaaagg atttaacttt ggaatcttcc aaaggaagtt tggccaatgc cagatcccca 6240
ggaatttggg gggttttctt tcttttcaac tgaaattgta tctgattcct actgttcatg 6300
ttagtgatca tctaatcaca gagccaaaca cttttctccc ctgtgtggaa aagtaggtat 6360
gctttacaat aaaatctgtc ttttctggta gaaacctgag ccactgaaaa taaaagagac 6420
aactagaagc acagtagagt cccagactga gatctacctt tgagaggctt tgaaagtaat 6480
ccctggggtt tggattattt tcacaagggt tatgccgttt tattcaagtt tgttgctccg 6540
ttttgcacct ctgcaataaa agcaaaatga caaccagtac ataaggggtt agcttgacaa 6600
agtagacttc cttgtgttaa tttttaagtt tttttttcct taactatatc tgtctacagg 6660
cagatacaga tagttgtatg aaaatctgct tgcctgtaaa atttgcattt ataaatgtgt 6720
tgccgatgga tcacttgggc ctgtacacat accaattagc gtgaccactt ccatcttaaa 6780
aacaaaccta aaaaacaaaa tttattatat atatatatat atatatataa aggactgtgg 6840
gttgtataca aactattgca aacacttgtg caaatctgtc ttgatataaa ggaaaagcaa 6900
aatctgtata acattattac tacttgaatg cctctgtgac tgattttttt ttcattttaa 6960
atataaactt ttttgtgaaa agtatgctca atgttttttt tccctttccc cattcccttg 7020
taaatacatt ttgttctatg tgacttggtt tggaaatagt taactggtac tgtaatttgc 7080
attaaataaa aagtaggtta gcctggaaat gaaattaaaa aaaaaaaaaa aaaa 7134
<210> 39
<211> 1235
<212> PRT
<213> Homo sapiens
<400> 39
Met His Leu Ala Glu Arg Asp Arg Trp Leu Phe Val Ala Thr Val Met
1 5 10 15
Met His Phe Val Ser Ile Lys Ser Gly Phe Pro Gly Leu Cys Val Gly
20 25 30
Val Arg Ser Thr Met Ser Ser Val Ala Val Leu Thr Gln Glu Ser Phe
35 40 45
Ala Glu His Arg Ser Gly Leu Val Pro Gln Gln Ile Lys Val Ala Thr
50 55 60
Leu Asn Ser Glu Glu Glu Ser Asp Pro Pro Thr Tyr Lys Asp Ala Phe
65 70 75 80
Pro Pro Leu Pro Glu Lys Ala Ala Cys Leu Glu Ser Ala Gln Glu Pro
85 90 95
Ala Gly Ala Trp Gly Asn Lys Ile Arg Pro Ile Lys Ala Ser Val Ile
100 105 110
Thr Gln Val Phe His Val Pro Leu Glu Glu Arg Lys Tyr Lys Asp Met
115 120 125
Asn Gln Phe Gly Glu Gly Glu Gln Ala Lys Ile Cys Leu Glu Ile Met
130 135 140
Gln Arg Thr Gly Ala His Leu Glu Leu Ser Leu Ala Lys Asp Gln Gly
145 150 155 160
Leu Ser Ile Met Val Ser Gly Lys Leu Asp Ala Val Met Lys Ala Arg
165 170 175
Lys Asp Ile Val Ala Arg Leu Gln Thr Gln Ala Ser Ala Thr Val Ala
180 185 190
Ile Pro Lys Glu His His Arg Phe Val Ile Gly Lys Asn Gly Glu Lys
195 200 205
Leu Gln Asp Leu Glu Leu Lys Thr Ala Thr Lys Ile Gln Ile Pro Arg
210 215 220
Pro Asp Asp Pro Ser Asn Gln Ile Lys Ile Thr Gly Thr Lys Glu Gly
225 230 235 240
Ile Glu Lys Ala Arg His Glu Val Leu Leu Ile Ser Ala Glu Gln Asp
245 250 255
Lys Arg Ala Val Glu Arg Leu Glu Val Glu Lys Ala Phe His Pro Phe
260 265 270
Ile Ala Gly Pro Tyr Asn Arg Leu Val Gly Glu Ile Met Gln Glu Thr
275 280 285
Gly Thr Arg Ile Asn Ile Pro Pro Pro Ser Val Asn Arg Thr Glu Ile
290 295 300
Val Phe Thr Gly Glu Lys Glu Gln Leu Ala Gln Ala Val Ala Arg Ile
305 310 315 320
Lys Lys Ile Tyr Glu Glu Lys Ala Asn Ser Phe Thr Val Ser Ser Val
325 330 335
Ala Ala Pro Ser Trp Leu His Arg Phe Ile Ile Gly Lys Lys Gly Gln
340 345 350
Asn Leu Ala Lys Ile Thr Gln Gln Met Pro Lys Val His Ile Glu Phe
355 360 365
Thr Glu Gly Glu Asp Lys Ile Thr Leu Glu Gly Pro Thr Glu Asp Val
370 375 380
Asn Val Ala Gln Glu Gln Ile Glu Gly Met Val Lys Asp Leu Ile Asn
385 390 395 400
Arg Met Asp Tyr Val Glu Ile Asn Ile Asp His Lys Phe His Arg His
405 410 415
Leu Ile Gly Lys Ser Gly Ala Asn Ile Asn Arg Ile Lys Asp Gln Tyr
420 425 430
Lys Val Ser Val Arg Ile Pro Pro Asp Ser Glu Lys Ser Asn Leu Ile
435 440 445
Arg Ile Glu Gly Asp Pro Gln Gly Val Gln Gln Ala Lys Arg Glu Leu
450 455 460
Leu Glu Leu Ala Ser Arg Met Glu Asn Glu Arg Thr Lys Asp Leu Ile
465 470 475 480
Ile Glu Gln Arg Phe His Arg Thr Ile Ile Gly Gln Lys Gly Glu Arg
485 490 495
Ile Arg Glu Ile Arg Asp Lys Phe Pro Glu Val Ile Ile Asn Phe Pro
500 505 510
Asp Pro Ala Gln Lys Ser Asp Ile Val Gln Leu Arg Gly Pro Lys Asn
515 520 525
Glu Val Glu Lys Cys Thr Lys Tyr Met Gln Lys Met Val Ala Asp Leu
530 535 540
Val Glu Asn Ser Tyr Ser Ile Ser Val Pro Ile Phe Lys Gln Phe His
545 550 555 560
Lys Asn Ile Ile Gly Lys Gly Gly Ala Asn Ile Lys Lys Ile Arg Glu
565 570 575
Glu Ser Asn Thr Lys Ile Asp Leu Pro Ala Glu Asn Ser Asn Ser Glu
580 585 590
Thr Ile Ile Ile Thr Gly Lys Arg Ala Asn Cys Glu Ala Ala Arg Ser
595 600 605
Arg Ile Leu Ser Ile Gln Lys Asp Leu Ala Asn Ile Ala Glu Val Glu
610 615 620
Val Ser Ile Pro Ala Lys Leu His Asn Ser Leu Ile Gly Thr Lys Gly
625 630 635 640
Arg Leu Ile Arg Ser Ile Met Glu Glu Cys Gly Gly Val His Ile His
645 650 655
Phe Pro Val Glu Gly Ser Gly Ser Asp Thr Val Val Ile Arg Gly Pro
660 665 670
Ser Ser Asp Val Glu Lys Ala Lys Lys Gln Leu Leu His Leu Ala Glu
675 680 685
Glu Lys Gln Thr Lys Ser Phe Thr Val Asp Ile Arg Ala Lys Pro Glu
690 695 700
Tyr His Lys Phe Leu Ile Gly Lys Gly Gly Gly Lys Ile Arg Lys Val
705 710 715 720
Arg Asp Ser Thr Gly Ala Arg Val Ile Phe Pro Ala Ala Glu Asp Lys
725 730 735
Asp Gln Asp Leu Ile Thr Ile Ile Gly Lys Glu Asp Ala Val Arg Glu
740 745 750
Ala Gln Lys Glu Leu Glu Ala Leu Ile Gln Asn Leu Asp Asn Val Val
755 760 765
Glu Asp Ser Met Leu Val Asp Pro Lys His His Arg His Phe Val Ile
770 775 780
Arg Arg Gly Gln Val Leu Arg Glu Ile Ala Glu Glu Tyr Gly Gly Val
785 790 795 800
Met Val Ser Phe Pro Arg Ser Gly Thr Gln Ser Asp Lys Val Thr Leu
805 810 815
Lys Gly Ala Lys Asp Cys Val Glu Ala Ala Lys Lys Arg Ile Gln Glu
820 825 830
Ile Ile Glu Asp Leu Glu Ala Gln Val Thr Leu Glu Cys Ala Ile Pro
835 840 845
Gln Lys Phe His Arg Ser Val Met Gly Pro Lys Gly Ser Arg Ile Gln
850 855 860
Gln Ile Thr Arg Asp Phe Ser Val Gln Ile Lys Phe Pro Asp Arg Glu
865 870 875 880
Glu Asn Ala Val His Ser Thr Glu Pro Val Val Gln Glu Asn Gly Asp
885 890 895
Glu Ala Gly Glu Gly Arg Glu Ala Lys Asp Cys Asp Pro Gly Ser Pro
900 905 910
Arg Arg Cys Asp Ile Ile Ile Ile Ser Gly Arg Lys Glu Lys Cys Glu
915 920 925
Ala Ala Lys Glu Ala Leu Glu Ala Leu Val Pro Val Thr Ile Glu Val
930 935 940
Glu Val Pro Phe Asp Leu His Arg Tyr Val Ile Gly Gln Lys Gly Ser
945 950 955 960
Gly Ile Arg Lys Met Met Asp Glu Phe Glu Val Asn Ile His Val Pro
965 970 975
Ala Pro Glu Leu Gln Ser Asp Ile Ile Ala Ile Thr Gly Leu Ala Ala
980 985 990
Asn Leu Asp Arg Ala Lys Ala Gly Leu Leu Glu Arg Val Lys Glu Leu
995 1000 1005
Gln Ala Glu Gln Glu Asp Arg Ala Leu Arg Ser Phe Lys Leu Ser
1010 1015 1020
Val Thr Val Asp Pro Lys Tyr His Pro Lys Ile Ile Gly Arg Lys
1025 1030 1035
Gly Ala Val Ile Thr Gln Ile Arg Leu Glu His Asp Val Asn Ile
1040 1045 1050
Gln Phe Pro Asp Lys Asp Asp Gly Asn Gln Pro Gln Asp Gln Ile
1055 1060 1065
Thr Ile Thr Gly Tyr Glu Lys Asn Thr Glu Ala Ala Arg Asp Ala
1070 1075 1080
Ile Leu Arg Ile Val Gly Glu Leu Glu Gln Met Val Ser Glu Asp
1085 1090 1095
Val Pro Leu Asp His Arg Val His Ala Arg Ile Ile Gly Ala Arg
1100 1105 1110
Gly Lys Ala Ile Arg Lys Ile Met Asp Glu Phe Lys Val Asp Ile
1115 1120 1125
Arg Phe Pro Gln Ser Gly Ala Pro Asp Pro Asn Cys Val Thr Val
1130 1135 1140
Thr Gly Leu Pro Glu Asn Val Glu Glu Ala Ile Asp His Ile Leu
1145 1150 1155
Asn Leu Glu Glu Glu Tyr Leu Ala Asp Val Val Asp Ser Glu Ala
1160 1165 1170
Leu Gln Val Tyr Met Lys Pro Pro Ala His Glu Glu Ala Lys Ala
1175 1180 1185
Pro Ser Arg Gly Phe Val Val Arg Asp Ala Pro Trp Thr Ala Ser
1190 1195 1200
Ser Ser Glu Lys Ala Pro Asp Met Ser Ser Ser Glu Glu Phe Pro
1205 1210 1215
Ser Phe Gly Ala Gln Val Ala Pro Lys Thr Leu Pro Trp Gly Pro
1220 1225 1230
Lys Arg
1235
<210> 40
<211> 6291
<212> DNA
<213> Homo sapiens
<400> 40
ggagcgtccc ggcttctccc gcgcgggggg cgagtaagcc agcggcagga ccagcgggcg 60
ggggcccacg acaaaagctg gcaggctgac agaggcggcc tcaggacgga ccttctggct 120
actgaccgtt ttgctgctac cacttataac cacctggtta agtcgagatt tggaggtggt 180
ttagtttggg gcctggatgc accttgcaga gagagaccgc tggctttttg tagcaactgt 240
catgatgcat tttgtaagca ttaagagtgg ttttcccgga ttgtgtgtag gtgtgagatc 300
aaccatgagt tccgttgcag ttttgaccca agagagtttt gctgaacacc gaagtgggct 360
ggttccgcaa caaatcaaag ttgccactct aaattcagaa gaggagagcg accctccaac 420
ctacaaggat gccttccctc cacttcctga gaaagctgct tgcctggaaa gtgcccagga 480
acccgctgga gcctggggga acaagatccg acccatcaag gcttctgtca tcactcaggt 540
gttccatgta cccctggagg agagaaaata caaggatatg aaccagtttg gagaaggtga 600
acaagcaaaa atctgccttg agatcatgca gagaactggt gctcacttgg agctgtcttt 660
ggccaaagac caaggcctct ccatcatggt gtcaggaaag ctggatgctg tcatgaaagc 720
tcggaaggac attgttgcta gactgcagac tcaggcctca gcaactgttg ccattcccaa 780
agaacaccat cgctttgtta ttggcaaaaa tggagagaaa ctgcaagact tggagctaaa 840
aactgcaacc aaaatccaga tcccacgccc agatgacccc agcaatcaga tcaagatcac 900
tggcaccaaa gagggcatcg agaaagctcg ccatgaagtc ttactcatct ctgccgagca 960
ggacaaacgt gctgtggaga ggctagaagt agaaaaggca ttccacccct tcatcgctgg 1020
gccgtataat agactggttg gcgagatcat gcaggagaca ggcacgcgca tcaacatccc 1080
cccacccagc gtgaaccgga cagagattgt cttcactgga gagaaggaac agttggctca 1140
ggctgtggct cgcatcaaga agatttatga ggagaaggcc aatagcttca ccgtctcctc 1200
tgtcgccgcc ccttcctggc ttcaccgttt catcattggc aagaaagggc agaacctggc 1260
caaaatcact cagcagatgc caaaggttca catcgagttc acagagggcg aagacaagat 1320
caccctggag ggccctacag aggatgtcaa tgtggcccag gaacagatag aaggcatggt 1380
caaagatttg attaaccgga tggactatgt ggagatcaac atcgaccaca agttccacag 1440
gcacctcatt gggaagagcg gtgccaacat aaacagaatc aaagaccagt acaaggtgtc 1500
cgtgcgcatc cctcctgaca gtgagaagag caatttgatc cgcatcgagg gggacccaca 1560
gggcgtgcag caggccaagc gagagctgct ggagcttgca tctcgcatgg aaaatgagcg 1620
taccaaggat ctaatcattg agcaaagatt tcatcgcaca atcattgggc agaagggtga 1680
acggatccgt gaaattcgtg acaaattccc agaggtcatc attaactttc cagacccagc 1740
acaaaaaagt gacattgtcc agctcagagg acctaagaat gaggtggaaa aatgcacaaa 1800
atacatgcag aagatggtgg cagatctggt ggaaaatagc tattcaattt ctgttccgat 1860
cttcaaacag tttcacaaga atatcattgg gaaaggaggc gcaaacatta aaaagattcg 1920
tgaagaaagc aacaccaaaa tcgaccttcc agcagagaat agcaattcag agaccattat 1980
catcacaggc aagcgagcca actgcgaagc tgcccggagc aggattctgt ctattcagaa 2040
agacctggcc aacatagccg aggtagaggt ctccatccct gccaagctgc acaactccct 2100
cattggcacc aagggccgtc tgatccgctc catcatggag gagtgcggcg gggtccacat 2160
tcactttccc gtggaaggtt caggaagcga caccgttgtt atcaggggcc cttcctcgga 2220
tgtggagaag gccaagaagc agctcctgca tctggcggag gagaagcaaa ccaagagttt 2280
cactgttgac atccgcgcca agccagaata ccacaaattc ctcatcggca aggggggcgg 2340
caaaattcgc aaggtgcgcg acagcactgg agcacgtgtc atcttccctg cggctgagga 2400
caaggaccag gacctgatca ccatcattgg aaaggaggac gccgtccgag aggcacagaa 2460
ggagctggag gccttgatcc aaaacctgga taatgtggtg gaagactcca tgctggtgga 2520
ccccaagcac caccgccact tcgtcatccg cagaggccag gtcttgcggg agattgctga 2580
agagtatggc ggggtgatgg tcagcttccc acgctctggc acacagagcg acaaagtcac 2640
cctcaagggc gccaaggact gtgtggaggc agccaagaaa cgcattcagg agatcattga 2700
ggacctggaa gctcaggtga cattagaatg tgctataccc cagaaattcc atcgatctgt 2760
catgggcccc aaaggttcca gaatccagca gattactcgg gatttcagtg ttcaaattaa 2820
attcccagac agagaggaga acgcagttca cagtacagag ccagttgtcc aggagaatgg 2880
ggacgaagct ggggagggga gagaggctaa agattgtgac cccggctctc caaggaggtg 2940
tgacatcatc atcatctctg gccggaaaga aaagtgtgag gctgccaagg aagctctgga 3000
ggcattggtt cctgtcacca ttgaagtaga ggtgcccttt gaccttcacc gttacgttat 3060
tgggcagaaa ggaagtggga tccgcaagat gatggatgag tttgaggtga acatacatgt 3120
cccggcacct gagctgcagt ctgacatcat cgccatcacg ggcctcgctg caaatttgga 3180
ccgggccaag gctggactgc tggagcgtgt gaaggagcta caggccgagc aggaggaccg 3240
ggctttaagg agttttaagc tgagtgtcac tgtagacccc aaataccatc ccaagattat 3300
cgggagaaag ggggcagtaa ttacccaaat ccggttggag catgacgtga acatccagtt 3360
tcctgataag gacgatggga accagcccca ggaccaaatt accatcacag ggtacgaaaa 3420
gaacacagaa gctgccaggg atgctatact gagaattgtg ggtgaacttg agcagatggt 3480
ttctgaggac gtcccgctgg accaccgcgt tcacgcccgc atcattggtg cccgcggcaa 3540
agccattcgc aaaatcatgg acgaattcaa ggtggacatt cgcttcccac agagcggagc 3600
cccagacccc aactgcgtca ctgtgacggg gctcccagag aatgtggagg aagccatcga 3660
ccacatcctc aatctggagg aggaatacct agctgacgtg gtggacagtg aggcgctgca 3720
ggtatacatg aaacccccag cacacgaaga ggccaaggca ccttccagag gctttgtggt 3780
gcgggacgca ccctggaccg ccagcagcag tgagaaggct cctgacatga gcagctctga 3840
ggaatttccc agctttgggg ctcaggtggc tcccaagacc ctcccttggg gccccaaacg 3900
ataatgatca aaaagaacag aaccctctcc agcctgctga cccaaaccca accacacaat 3960
ggtttgtctc aatctgaccc agcggctgga ccctccgtaa attgttgacg ctcttccccc 4020
ttcccgaggt cccgcaggga gcctagcgcc tggctgtgtg tgcggccgct cctccaggcc 4080
tggccgtgcc cgctcaggac ctgctccact gtttaacact aaaccaaggt catgagcatt 4140
cgtgctaaga taacagactc cagctcctgg tccacccggc atgtcagtca gcactctggc 4200
cttcatcacg agagctccgc agccgtggct aggattccac ttcctgtgtc atgacctcag 4260
gaaataaacg tccttgactt tataaaagcc aaacgtttgc cctcttcctt tcccacctcc 4320
ctcctgccag tttcccttgg tccagacagt cctgtttgtg gagtgcaatc agcctcctcc 4380
agctgccaga gcgcctcagc acaggtgtca gggtgcaagg aagacctggc aatggacagc 4440
aggaggcagg ttcctggagc tggggggtga cctgagaggc agagggtgac gggttctcag 4500
gcagtcctga ttttacctgc cgtggggtct gaaagcacca agggtccctg cccctacctc 4560
cactgccaga ccctcagcct gaggtctggt gagtggagcc tggaggcaag gtggtaggca 4620
ccatctgggt cccctgtggc cgtcacagtg tctgctgtga ttgagatgcg cacaggttgg 4680
gggaggtagg gccttacgct tgtcctcagt gggggcagtt tgccttagat gacagctggg 4740
ctcttcttca caccacctgc agcccctccc tgcccctgcc ctagctgctg tgtgttcagt 4800
tgccttcttt ctacctcagc cggcgtggag tggtctctgt gcagttagtg ccaccccaca 4860
cacccgtctc ttgattgaga tgtttctggt ggttatgggt ttcccgtgga gctgggggtg 4920
ggcgccgtgt acctaagctg gaggctggcg ctctccctca gcacaggtgg gtcagtggcc 4980
agcaggccca tctggagtgg gagtgggcac ttccaccccg cccacaggcc atccggctgt 5040
gcaggccagc ccctaggagc aggtcccggg tgactggcag ttttcacggt ctagggccga 5100
gacgatggca tggggcctag agcatgaggt agagcagaat gcagaccacg ccgctggatg 5160
ccgagagacc ctgctctccg agggaggcat ctgtgtcatg ctgtgagggc tgaggacggg 5220
gccctagtct ctggttttct ggtcttaaca tccttatctg tgtccgccac ggaggtgact 5280
gagctgctag cgagttgtcc tgtcccaggt acttgagttt tggaaaagct gactcacgcc 5340
catccatctc acagcccttc cctggggaca gtcgcttccg ccttgacacc tcactctcag 5400
ttgaataact caagcttggt catcttcaga ctcgaattct tgagtagacc cagacggctt 5460
agcccaagtc tagttgcagc tgcctcggca agtccccatt tgctcaggca gccctgaatg 5520
ggcctgttta caggaatggt aaattgggat tggaaggaat atagcttcca gcttcatagg 5580
ctagggtgac cacggcttag gaaacaggga aagaaagcaa ggcccttttc ctgcctttcc 5640
cgggatctgt ctactccacc tccacggggg aggccagtgg ggaagggctg tcacctcttc 5700
cccatctgca tgagttctgg aactctgtcc tgttggctgc ttgcttccag ctccccccaa 5760
tctccatcgc agcgggttcc tcctgtcttt tctacagtgt cataaaacat cctgccccta 5820
ccctctccca aaggtcaatt ttaattctca ccaagttttg cacatctctg tatgtcgctt 5880
gatgtcttag acgcgagccc tttcctaaac tgttcagcgc tctcttttcc tttgggtggt 5940
tgttgcaagg gtgatgacat gactgtcccc aggcctgtct ccctgaagcg tctgtgctgt 6000
caggacagcc ctgggcagag atgaggcagg ggtgaggcgt gcgtgtgctt ttcctccttg 6060
ttggatgtct tccatatcat ctgtttccat agctacaatc catcccttgg ccttaacttt 6120
ggaatttgga gattatatgc aaacatgtgt aaaggctcat gaatatggat gacactggaa 6180
ttttataaat tctaaaataa aacccgaaac cagatgtagc atgctgggac tcattttgaa 6240
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 6291
<210> 41
<211> 1268
<212> PRT
<213> Homo sapiens
<400> 41
Met Ser Ser Val Ala Val Leu Thr Gln Glu Ser Phe Ala Glu His Arg
1 5 10 15
Ser Gly Leu Val Pro Gln Gln Ile Lys Val Ala Thr Leu Asn Ser Glu
20 25 30
Glu Glu Ser Asp Pro Pro Thr Tyr Lys Asp Ala Phe Pro Pro Leu Pro
35 40 45
Glu Lys Ala Ala Cys Leu Glu Ser Ala Gln Glu Pro Ala Gly Ala Trp
50 55 60
Gly Asn Lys Ile Arg Pro Ile Lys Ala Ser Val Ile Thr Gln Val Phe
65 70 75 80
His Val Pro Leu Glu Glu Arg Lys Tyr Lys Asp Met Asn Gln Phe Gly
85 90 95
Glu Gly Glu Gln Ala Lys Ile Cys Leu Glu Ile Met Gln Arg Thr Gly
100 105 110
Ala His Leu Glu Leu Ser Leu Ala Lys Asp Gln Gly Leu Ser Ile Met
115 120 125
Val Ser Gly Lys Leu Asp Ala Val Met Lys Ala Arg Lys Asp Ile Val
130 135 140
Ala Arg Leu Gln Thr Gln Ala Ser Ala Thr Val Ala Ile Pro Lys Glu
145 150 155 160
His His Arg Phe Val Ile Gly Lys Asn Gly Glu Lys Leu Gln Asp Leu
165 170 175
Glu Leu Lys Thr Ala Thr Lys Ile Gln Ile Pro Arg Pro Asp Asp Pro
180 185 190
Ser Asn Gln Ile Lys Ile Thr Gly Thr Lys Glu Gly Ile Glu Lys Ala
195 200 205
Arg His Glu Val Leu Leu Ile Ser Ala Glu Gln Asp Lys Arg Ala Val
210 215 220
Glu Arg Leu Glu Val Glu Lys Ala Phe His Pro Phe Ile Ala Gly Pro
225 230 235 240
Tyr Asn Arg Leu Val Gly Glu Ile Met Gln Glu Thr Gly Thr Arg Ile
245 250 255
Asn Ile Pro Pro Pro Ser Val Asn Arg Thr Glu Ile Val Phe Thr Gly
260 265 270
Glu Lys Glu Gln Leu Ala Gln Ala Val Ala Arg Ile Lys Lys Ile Tyr
275 280 285
Glu Glu Lys Lys Lys Lys Thr Thr Thr Ile Ala Val Glu Val Lys Lys
290 295 300
Ser Gln His Lys Tyr Val Ile Gly Pro Lys Gly Asn Ser Leu Gln Glu
305 310 315 320
Ile Leu Glu Arg Thr Gly Val Ser Val Glu Ile Pro Pro Ser Asp Ser
325 330 335
Ile Ser Glu Thr Val Ile Leu Arg Gly Glu Pro Glu Lys Leu Gly Gln
340 345 350
Ala Leu Thr Glu Val Tyr Ala Lys Ala Asn Ser Phe Thr Val Ser Ser
355 360 365
Val Ala Ala Pro Ser Trp Leu His Arg Phe Ile Ile Gly Lys Lys Gly
370 375 380
Gln Asn Leu Ala Lys Ile Thr Gln Gln Met Pro Lys Val His Ile Glu
385 390 395 400
Phe Thr Glu Gly Glu Asp Lys Ile Thr Leu Glu Gly Pro Thr Glu Asp
405 410 415
Val Asn Val Ala Gln Glu Gln Ile Glu Gly Met Val Lys Asp Leu Ile
420 425 430
Asn Arg Met Asp Tyr Val Glu Ile Asn Ile Asp His Lys Phe His Arg
435 440 445
His Leu Ile Gly Lys Ser Gly Ala Asn Ile Asn Arg Ile Lys Asp Gln
450 455 460
Tyr Lys Val Ser Val Arg Ile Pro Pro Asp Ser Glu Lys Ser Asn Leu
465 470 475 480
Ile Arg Ile Glu Gly Asp Pro Gln Gly Val Gln Gln Ala Lys Arg Glu
485 490 495
Leu Leu Glu Leu Ala Ser Arg Met Glu Asn Glu Arg Thr Lys Asp Leu
500 505 510
Ile Ile Glu Gln Arg Phe His Arg Thr Ile Ile Gly Gln Lys Gly Glu
515 520 525
Arg Ile Arg Glu Ile Arg Asp Lys Phe Pro Glu Val Ile Ile Asn Phe
530 535 540
Pro Asp Pro Ala Gln Lys Ser Asp Ile Val Gln Leu Arg Gly Pro Lys
545 550 555 560
Asn Glu Val Glu Lys Cys Thr Lys Tyr Met Gln Lys Met Val Ala Asp
565 570 575
Leu Val Glu Asn Ser Tyr Ser Ile Ser Val Pro Ile Phe Lys Gln Phe
580 585 590
His Lys Asn Ile Ile Gly Lys Gly Gly Ala Asn Ile Lys Lys Ile Arg
595 600 605
Glu Glu Ser Asn Thr Lys Ile Asp Leu Pro Ala Glu Asn Ser Asn Ser
610 615 620
Glu Thr Ile Ile Ile Thr Gly Lys Arg Ala Asn Cys Glu Ala Ala Arg
625 630 635 640
Ser Arg Ile Leu Ser Ile Gln Lys Asp Leu Ala Asn Ile Ala Glu Val
645 650 655
Glu Val Ser Ile Pro Ala Lys Leu His Asn Ser Leu Ile Gly Thr Lys
660 665 670
Gly Arg Leu Ile Arg Ser Ile Met Glu Glu Cys Gly Gly Val His Ile
675 680 685
His Phe Pro Val Glu Gly Ser Gly Ser Asp Thr Val Val Ile Arg Gly
690 695 700
Pro Ser Ser Asp Val Glu Lys Ala Lys Lys Gln Leu Leu His Leu Ala
705 710 715 720
Glu Glu Lys Gln Thr Lys Ser Phe Thr Val Asp Ile Arg Ala Lys Pro
725 730 735
Glu Tyr His Lys Phe Leu Ile Gly Lys Gly Gly Gly Lys Ile Arg Lys
740 745 750
Val Arg Asp Ser Thr Gly Ala Arg Val Ile Phe Pro Ala Ala Glu Asp
755 760 765
Lys Asp Gln Asp Leu Ile Thr Ile Ile Gly Lys Glu Asp Ala Val Arg
770 775 780
Glu Ala Gln Lys Glu Leu Glu Ala Leu Ile Gln Asn Leu Asp Asn Val
785 790 795 800
Val Glu Asp Ser Met Leu Val Asp Pro Lys His His Arg His Phe Val
805 810 815
Ile Arg Arg Gly Gln Val Leu Arg Glu Ile Ala Glu Glu Tyr Gly Gly
820 825 830
Val Met Val Ser Phe Pro Arg Ser Gly Thr Gln Ser Asp Lys Val Thr
835 840 845
Leu Lys Gly Ala Lys Asp Cys Val Glu Ala Ala Lys Lys Arg Ile Gln
850 855 860
Glu Ile Ile Glu Asp Leu Glu Ala Gln Val Thr Leu Glu Cys Ala Ile
865 870 875 880
Pro Gln Lys Phe His Arg Ser Val Met Gly Pro Lys Gly Ser Arg Ile
885 890 895
Gln Gln Ile Thr Arg Asp Phe Ser Val Gln Ile Lys Phe Pro Asp Arg
900 905 910
Glu Glu Asn Ala Val His Ser Thr Glu Pro Val Val Gln Glu Asn Gly
915 920 925
Asp Glu Ala Gly Glu Gly Arg Glu Ala Lys Asp Cys Asp Pro Gly Ser
930 935 940
Pro Arg Arg Cys Asp Ile Ile Ile Ile Ser Gly Arg Lys Glu Lys Cys
945 950 955 960
Glu Ala Ala Lys Glu Ala Leu Glu Ala Leu Val Pro Val Thr Ile Glu
965 970 975
Val Glu Val Pro Phe Asp Leu His Arg Tyr Val Ile Gly Gln Lys Gly
980 985 990
Ser Gly Ile Arg Lys Met Met Asp Glu Phe Glu Val Asn Ile His Val
995 1000 1005
Pro Ala Pro Glu Leu Gln Ser Asp Ile Ile Ala Ile Thr Gly Leu
1010 1015 1020
Ala Ala Asn Leu Asp Arg Ala Lys Ala Gly Leu Leu Glu Arg Val
1025 1030 1035
Lys Glu Leu Gln Ala Glu Gln Glu Asp Arg Ala Leu Arg Ser Phe
1040 1045 1050
Lys Leu Ser Val Thr Val Asp Pro Lys Tyr His Pro Lys Ile Ile
1055 1060 1065
Gly Arg Lys Gly Ala Val Ile Thr Gln Ile Arg Leu Glu His Asp
1070 1075 1080
Val Asn Ile Gln Phe Pro Asp Lys Asp Asp Gly Asn Gln Pro Gln
1085 1090 1095
Asp Gln Ile Thr Ile Thr Gly Tyr Glu Lys Asn Thr Glu Ala Ala
1100 1105 1110
Arg Asp Ala Ile Leu Arg Ile Val Gly Glu Leu Glu Gln Met Val
1115 1120 1125
Ser Glu Asp Val Pro Leu Asp His Arg Val His Ala Arg Ile Ile
1130 1135 1140
Gly Ala Arg Gly Lys Ala Ile Arg Lys Ile Met Asp Glu Phe Lys
1145 1150 1155
Val Asp Ile Arg Phe Pro Gln Ser Gly Ala Pro Asp Pro Asn Cys
1160 1165 1170
Val Thr Val Thr Gly Leu Pro Glu Asn Val Glu Glu Ala Ile Asp
1175 1180 1185
His Ile Leu Asn Leu Glu Glu Glu Tyr Leu Ala Asp Val Val Asp
1190 1195 1200
Ser Glu Ala Leu Gln Val Tyr Met Lys Pro Pro Ala His Glu Glu
1205 1210 1215
Ala Lys Ala Pro Ser Arg Gly Phe Val Val Arg Asp Ala Pro Trp
1220 1225 1230
Thr Ala Ser Ser Ser Glu Lys Ala Pro Asp Met Ser Ser Ser Glu
1235 1240 1245
Glu Phe Pro Ser Phe Gly Ala Gln Val Ala Pro Lys Thr Leu Pro
1250 1255 1260
Trp Gly Pro Lys Arg
1265
<210> 42
<211> 6427
<212> DNA
<213> Homo sapiens
<400> 42
atagaggctg ggggtggggg gggaggtcaa gcgtagcctc ttctccttta ccaagatggc 60
ggcttgtccc tgtttcgcca cagttcctac cttatgagct cggttttctt atgcttataa 120
gagtggaaca gcaaaagctg gcaggctgac agaggcggcc tcaggacgga ccttctggct 180
actgaccgtt ttgctgtggt tttcccggat tgtgtgtagg tgtgagatca accatgagtt 240
ccgttgcagt tttgacccaa gagagttttg ctgaacaccg aagtgggctg gttccgcaac 300
aaatcaaagt tgccactcta aattcagaag aggagagcga ccctccaacc tacaaggatg 360
ccttccctcc acttcctgag aaagctgctt gcctggaaag tgcccaggaa cccgctggag 420
cctgggggaa caagatccga cccatcaagg cttctgtcat cactcaggtg ttccatgtac 480
ccctggagga gagaaaatac aaggatatga accagtttgg agaaggtgaa caagcaaaaa 540
tctgccttga gatcatgcag agaactggtg ctcacttgga gctgtctttg gccaaagacc 600
aaggcctctc catcatggtg tcaggaaagc tggatgctgt catgaaagct cggaaggaca 660
ttgttgctag actgcagact caggcctcag caactgttgc cattcccaaa gaacaccatc 720
gctttgttat tggcaaaaat ggagagaaac tgcaagactt ggagctaaaa actgcaacca 780
aaatccagat cccacgccca gatgacccca gcaatcagat caagatcact ggcaccaaag 840
agggcatcga gaaagctcgc catgaagtct tactcatctc tgccgagcag gacaaacgtg 900
ctgtggagag gctagaagta gaaaaggcat tccacccctt catcgctggg ccgtataata 960
gactggttgg cgagatcatg caggagacag gcacgcgcat caacatcccc ccacccagcg 1020
tgaaccggac agagattgtc ttcactggag agaaggaaca gttggctcag gctgtggctc 1080
gcatcaagaa gatttatgag gagaagaaaa agaagactac aaccattgca gtggaagtga 1140
agaaatccca acacaagtat gtcattgggc ccaagggcaa ttcattgcag gagatccttg 1200
agagaactgg agtttccgtt gagatcccac cctcagacag catctctgag actgtaatac 1260
ttcgaggcga acctgaaaag ttaggtcagg cgttgactga agtctatgcc aaggccaata 1320
gcttcaccgt ctcctctgtc gccgcccctt cctggcttca ccgtttcatc attggcaaga 1380
aagggcagaa cctggccaaa atcactcagc agatgccaaa ggttcacatc gagttcacag 1440
agggcgaaga caagatcacc ctggagggcc ctacagagga tgtcaatgtg gcccaggaac 1500
agatagaagg catggtcaaa gatttgatta accggatgga ctatgtggag atcaacatcg 1560
accacaagtt ccacaggcac ctcattggga agagcggtgc caacataaac agaatcaaag 1620
accagtacaa ggtgtccgtg cgcatccctc ctgacagtga gaagagcaat ttgatccgca 1680
tcgaggggga cccacagggc gtgcagcagg ccaagcgaga gctgctggag cttgcatctc 1740
gcatggaaaa tgagcgtacc aaggatctaa tcattgagca aagatttcat cgcacaatca 1800
ttgggcagaa gggtgaacgg atccgtgaaa ttcgtgacaa attcccagag gtcatcatta 1860
actttccaga cccagcacaa aaaagtgaca ttgtccagct cagaggacct aagaatgagg 1920
tggaaaaatg cacaaaatac atgcagaaga tggtggcaga tctggtggaa aatagctatt 1980
caatttctgt tccgatcttc aaacagtttc acaagaatat cattgggaaa ggaggcgcaa 2040
acattaaaaa gattcgtgaa gaaagcaaca ccaaaatcga ccttccagca gagaatagca 2100
attcagagac cattatcatc acaggcaagc gagccaactg cgaagctgcc cggagcagga 2160
ttctgtctat tcagaaagac ctggccaaca tagccgaggt agaggtctcc atccctgcca 2220
agctgcacaa ctccctcatt ggcaccaagg gccgtctgat ccgctccatc atggaggagt 2280
gcggcggggt ccacattcac tttcccgtgg aaggttcagg aagcgacacc gttgttatca 2340
ggggcccttc ctcggatgtg gagaaggcca agaagcagct cctgcatctg gcggaggaga 2400
agcaaaccaa gagtttcact gttgacatcc gcgccaagcc agaataccac aaattcctca 2460
tcggcaaggg gggcggcaaa attcgcaagg tgcgcgacag cactggagca cgtgtcatct 2520
tccctgcggc tgaggacaag gaccaggacc tgatcaccat cattggaaag gaggacgccg 2580
tccgagaggc acagaaggag ctggaggcct tgatccaaaa cctggataat gtggtggaag 2640
actccatgct ggtggacccc aagcaccacc gccacttcgt catccgcaga ggccaggtct 2700
tgcgggagat tgctgaagag tatggcgggg tgatggtcag cttcccacgc tctggcacac 2760
agagcgacaa agtcaccctc aagggcgcca aggactgtgt ggaggcagcc aagaaacgca 2820
ttcaggagat cattgaggac ctggaagctc aggtgacatt agaatgtgct ataccccaga 2880
aattccatcg atctgtcatg ggccccaaag gttccagaat ccagcagatt actcgggatt 2940
tcagtgttca aattaaattc ccagacagag aggagaacgc agttcacagt acagagccag 3000
ttgtccagga gaatggggac gaagctgggg aggggagaga ggctaaagat tgtgaccccg 3060
gctctccaag gaggtgtgac atcatcatca tctctggccg gaaagaaaag tgtgaggctg 3120
ccaaggaagc tctggaggca ttggttcctg tcaccattga agtagaggtg ccctttgacc 3180
ttcaccgtta cgttattggg cagaaaggaa gtgggatccg caagatgatg gatgagtttg 3240
aggtgaacat acatgtcccg gcacctgagc tgcagtctga catcatcgcc atcacgggcc 3300
tcgctgcaaa tttggaccgg gccaaggctg gactgctgga gcgtgtgaag gagctacagg 3360
ccgagcagga ggaccgggct ttaaggagtt ttaagctgag tgtcactgta gaccccaaat 3420
accatcccaa gattatcggg agaaaggggg cagtaattac ccaaatccgg ttggagcatg 3480
acgtgaacat ccagtttcct gataaggacg atgggaacca gccccaggac caaattacca 3540
tcacagggta cgaaaagaac acagaagctg ccagggatgc tatactgaga attgtgggtg 3600
aacttgagca gatggtttct gaggacgtcc cgctggacca ccgcgttcac gcccgcatca 3660
ttggtgcccg cggcaaagcc attcgcaaaa tcatggacga attcaaggtg gacattcgct 3720
tcccacagag cggagcccca gaccccaact gcgtcactgt gacggggctc ccagagaatg 3780
tggaggaagc catcgaccac atcctcaatc tggaggagga atacctagct gacgtggtgg 3840
acagtgaggc gctgcaggta tacatgaaac ccccagcaca cgaagaggcc aaggcacctt 3900
ccagaggctt tgtggtgcgg gacgcaccct ggaccgccag cagcagtgag aaggctcctg 3960
acatgagcag ctctgaggaa tttcccagct ttggggctca ggtggctccc aagaccctcc 4020
cttggggccc caaacgataa tgatcaaaaa gaacagaacc ctctccagcc tgctgaccca 4080
aacccaacca cacaatggtt tgtctcaatc tgacccagcg gctggaccct ccgtaaattg 4140
ttgacgctct tcccccttcc cgaggtcccg cagggagcct agcgcctggc tgtgtgtgcg 4200
gccgctcctc caggcctggc cgtgcccgct caggacctgc tccactgttt aacactaaac 4260
caaggtcatg agcattcgtg ctaagataac agactccagc tcctggtcca cccggcatgt 4320
cagtcagcac tctggccttc atcacgagag ctccgcagcc gtggctagga ttccacttcc 4380
tgtgtcatga cctcaggaaa taaacgtcct tgactttata aaagccaaac gtttgccctc 4440
ttcctttccc acctccctcc tgccagtttc ccttggtcca gacagtcctg tttgtggagt 4500
gcaatcagcc tcctccagct gccagagcgc ctcagcacag gtgtcagggt gcaaggaaga 4560
cctggcaatg gacagcagga ggcaggttcc tggagctggg gggtgacctg agaggcagag 4620
ggtgacgggt tctcaggcag tcctgatttt acctgccgtg gggtctgaaa gcaccaaggg 4680
tccctgcccc tacctccact gccagaccct cagcctgagg tctggtgagt ggagcctgga 4740
ggcaaggtgg taggcaccat ctgggtcccc tgtggccgtc acagtgtctg ctgtgattga 4800
gatgcgcaca ggttggggga ggtagggcct tacgcttgtc ctcagtgggg gcagtttgcc 4860
ttagatgaca gctgggctct tcttcacacc acctgcagcc cctccctgcc cctgccctag 4920
ctgctgtgtg ttcagttgcc ttctttctac ctcagccggc gtggagtggt ctctgtgcag 4980
ttagtgccac cccacacacc cgtctcttga ttgagatgtt tctggtggtt atgggtttcc 5040
cgtggagctg ggggtgggcg ccgtgtacct aagctggagg ctggcgctct ccctcagcac 5100
aggtgggtca gtggccagca ggcccatctg gagtgggagt gggcacttcc accccgccca 5160
caggccatcc ggctgtgcag gccagcccct aggagcaggt cccgggtgac tggcagtttt 5220
cacggtctag ggccgagacg atggcatggg gcctagagca tgaggtagag cagaatgcag 5280
accacgccgc tggatgccga gagaccctgc tctccgaggg aggcatctgt gtcatgctgt 5340
gagggctgag gacggggccc tagtctctgg ttttctggtc ttaacatcct tatctgtgtc 5400
cgccacggag gtgactgagc tgctagcgag ttgtcctgtc ccaggtactt gagttttgga 5460
aaagctgact cacgcccatc catctcacag cccttccctg gggacagtcg cttccgcctt 5520
gacacctcac tctcagttga ataactcaag cttggtcatc ttcagactcg aattcttgag 5580
tagacccaga cggcttagcc caagtctagt tgcagctgcc tcggcaagtc cccatttgct 5640
caggcagccc tgaatgggcc tgtttacagg aatggtaaat tgggattgga aggaatatag 5700
cttccagctt cataggctag ggtgaccacg gcttaggaaa cagggaaaga aagcaaggcc 5760
cttttcctgc ctttcccggg atctgtctac tccacctcca cgggggaggc cagtggggaa 5820
gggctgtcac ctcttcccca tctgcatgag ttctggaact ctgtcctgtt ggctgcttgc 5880
ttccagctcc ccccaatctc catcgcagcg ggttcctcct gtcttttcta cagtgtcata 5940
aaacatcctg cccctaccct ctcccaaagg tcaattttaa ttctcaccaa gttttgcaca 6000
tctctgtatg tcgcttgatg tcttagacgc gagccctttc ctaaactgtt cagcgctctc 6060
ttttcctttg ggtggttgtt gcaagggtga tgacatgact gtccccaggc ctgtctccct 6120
gaagcgtctg tgctgtcagg acagccctgg gcagagatga ggcaggggtg aggcgtgcgt 6180
gtgcttttcc tccttgttgg atgtcttcca tatcatctgt ttccatagct acaatccatc 6240
ccttggcctt aactttggaa tttggagatt atatgcaaac atgtgtaaag gctcatgaat 6300
atggatgaca ctggaatttt ataaattcta aaataaaacc cgaaaccaga tgtagcatgc 6360
tgggactcat tttgaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6420
aaaaaaa 6427
<210> 43
<211> 1268
<212> PRT
<213> Homo sapiens
<400> 43
Met Ser Ser Val Ala Val Leu Thr Gln Glu Ser Phe Ala Glu His Arg
1 5 10 15
Ser Gly Leu Val Pro Gln Gln Ile Lys Val Ala Thr Leu Asn Ser Glu
20 25 30
Glu Glu Ser Asp Pro Pro Thr Tyr Lys Asp Ala Phe Pro Pro Leu Pro
35 40 45
Glu Lys Ala Ala Cys Leu Glu Ser Ala Gln Glu Pro Ala Gly Ala Trp
50 55 60
Gly Asn Lys Ile Arg Pro Ile Lys Ala Ser Val Ile Thr Gln Val Phe
65 70 75 80
His Val Pro Leu Glu Glu Arg Lys Tyr Lys Asp Met Asn Gln Phe Gly
85 90 95
Glu Gly Glu Gln Ala Lys Ile Cys Leu Glu Ile Met Gln Arg Thr Gly
100 105 110
Ala His Leu Glu Leu Ser Leu Ala Lys Asp Gln Gly Leu Ser Ile Met
115 120 125
Val Ser Gly Lys Leu Asp Ala Val Met Lys Ala Arg Lys Asp Ile Val
130 135 140
Ala Arg Leu Gln Thr Gln Ala Ser Ala Thr Val Ala Ile Pro Lys Glu
145 150 155 160
His His Arg Phe Val Ile Gly Lys Asn Gly Glu Lys Leu Gln Asp Leu
165 170 175
Glu Leu Lys Thr Ala Thr Lys Ile Gln Ile Pro Arg Pro Asp Asp Pro
180 185 190
Ser Asn Gln Ile Lys Ile Thr Gly Thr Lys Glu Gly Ile Glu Lys Ala
195 200 205
Arg His Glu Val Leu Leu Ile Ser Ala Glu Gln Asp Lys Arg Ala Val
210 215 220
Glu Arg Leu Glu Val Glu Lys Ala Phe His Pro Phe Ile Ala Gly Pro
225 230 235 240
Tyr Asn Arg Leu Val Gly Glu Ile Met Gln Glu Thr Gly Thr Arg Ile
245 250 255
Asn Ile Pro Pro Pro Ser Val Asn Arg Thr Glu Ile Val Phe Thr Gly
260 265 270
Glu Lys Glu Gln Leu Ala Gln Ala Val Ala Arg Ile Lys Lys Ile Tyr
275 280 285
Glu Glu Lys Lys Lys Lys Thr Thr Thr Ile Ala Val Glu Val Lys Lys
290 295 300
Ser Gln His Lys Tyr Val Ile Gly Pro Lys Gly Asn Ser Leu Gln Glu
305 310 315 320
Ile Leu Glu Arg Thr Gly Val Ser Val Glu Ile Pro Pro Ser Asp Ser
325 330 335
Ile Ser Glu Thr Val Ile Leu Arg Gly Glu Pro Glu Lys Leu Gly Gln
340 345 350
Ala Leu Thr Glu Val Tyr Ala Lys Ala Asn Ser Phe Thr Val Ser Ser
355 360 365
Val Ala Ala Pro Ser Trp Leu His Arg Phe Ile Ile Gly Lys Lys Gly
370 375 380
Gln Asn Leu Ala Lys Ile Thr Gln Gln Met Pro Lys Val His Ile Glu
385 390 395 400
Phe Thr Glu Gly Glu Asp Lys Ile Thr Leu Glu Gly Pro Thr Glu Asp
405 410 415
Val Asn Val Ala Gln Glu Gln Ile Glu Gly Met Val Lys Asp Leu Ile
420 425 430
Asn Arg Met Asp Tyr Val Glu Ile Asn Ile Asp His Lys Phe His Arg
435 440 445
His Leu Ile Gly Lys Ser Gly Ala Asn Ile Asn Arg Ile Lys Asp Gln
450 455 460
Tyr Lys Val Ser Val Arg Ile Pro Pro Asp Ser Glu Lys Ser Asn Leu
465 470 475 480
Ile Arg Ile Glu Gly Asp Pro Gln Gly Val Gln Gln Ala Lys Arg Glu
485 490 495
Leu Leu Glu Leu Ala Ser Arg Met Glu Asn Glu Arg Thr Lys Asp Leu
500 505 510
Ile Ile Glu Gln Arg Phe His Arg Thr Ile Ile Gly Gln Lys Gly Glu
515 520 525
Arg Ile Arg Glu Ile Arg Asp Lys Phe Pro Glu Val Ile Ile Asn Phe
530 535 540
Pro Asp Pro Ala Gln Lys Ser Asp Ile Val Gln Leu Arg Gly Pro Lys
545 550 555 560
Asn Glu Val Glu Lys Cys Thr Lys Tyr Met Gln Lys Met Val Ala Asp
565 570 575
Leu Val Glu Asn Ser Tyr Ser Ile Ser Val Pro Ile Phe Lys Gln Phe
580 585 590
His Lys Asn Ile Ile Gly Lys Gly Gly Ala Asn Ile Lys Lys Ile Arg
595 600 605
Glu Glu Ser Asn Thr Lys Ile Asp Leu Pro Ala Glu Asn Ser Asn Ser
610 615 620
Glu Thr Ile Ile Ile Thr Gly Lys Arg Ala Asn Cys Glu Ala Ala Arg
625 630 635 640
Ser Arg Ile Leu Ser Ile Gln Lys Asp Leu Ala Asn Ile Ala Glu Val
645 650 655
Glu Val Ser Ile Pro Ala Lys Leu His Asn Ser Leu Ile Gly Thr Lys
660 665 670
Gly Arg Leu Ile Arg Ser Ile Met Glu Glu Cys Gly Gly Val His Ile
675 680 685
His Phe Pro Val Glu Gly Ser Gly Ser Asp Thr Val Val Ile Arg Gly
690 695 700
Pro Ser Ser Asp Val Glu Lys Ala Lys Lys Gln Leu Leu His Leu Ala
705 710 715 720
Glu Glu Lys Gln Thr Lys Ser Phe Thr Val Asp Ile Arg Ala Lys Pro
725 730 735
Glu Tyr His Lys Phe Leu Ile Gly Lys Gly Gly Gly Lys Ile Arg Lys
740 745 750
Val Arg Asp Ser Thr Gly Ala Arg Val Ile Phe Pro Ala Ala Glu Asp
755 760 765
Lys Asp Gln Asp Leu Ile Thr Ile Ile Gly Lys Glu Asp Ala Val Arg
770 775 780
Glu Ala Gln Lys Glu Leu Glu Ala Leu Ile Gln Asn Leu Asp Asn Val
785 790 795 800
Val Glu Asp Ser Met Leu Val Asp Pro Lys His His Arg His Phe Val
805 810 815
Ile Arg Arg Gly Gln Val Leu Arg Glu Ile Ala Glu Glu Tyr Gly Gly
820 825 830
Val Met Val Ser Phe Pro Arg Ser Gly Thr Gln Ser Asp Lys Val Thr
835 840 845
Leu Lys Gly Ala Lys Asp Cys Val Glu Ala Ala Lys Lys Arg Ile Gln
850 855 860
Glu Ile Ile Glu Asp Leu Glu Ala Gln Val Thr Leu Glu Cys Ala Ile
865 870 875 880
Pro Gln Lys Phe His Arg Ser Val Met Gly Pro Lys Gly Ser Arg Ile
885 890 895
Gln Gln Ile Thr Arg Asp Phe Ser Val Gln Ile Lys Phe Pro Asp Arg
900 905 910
Glu Glu Asn Ala Val His Ser Thr Glu Pro Val Val Gln Glu Asn Gly
915 920 925
Asp Glu Ala Gly Glu Gly Arg Glu Ala Lys Asp Cys Asp Pro Gly Ser
930 935 940
Pro Arg Arg Cys Asp Ile Ile Ile Ile Ser Gly Arg Lys Glu Lys Cys
945 950 955 960
Glu Ala Ala Lys Glu Ala Leu Glu Ala Leu Val Pro Val Thr Ile Glu
965 970 975
Val Glu Val Pro Phe Asp Leu His Arg Tyr Val Ile Gly Gln Lys Gly
980 985 990
Ser Gly Ile Arg Lys Met Met Asp Glu Phe Glu Val Asn Ile His Val
995 1000 1005
Pro Ala Pro Glu Leu Gln Ser Asp Ile Ile Ala Ile Thr Gly Leu
1010 1015 1020
Ala Ala Asn Leu Asp Arg Ala Lys Ala Gly Leu Leu Glu Arg Val
1025 1030 1035
Lys Glu Leu Gln Ala Glu Gln Glu Asp Arg Ala Leu Arg Ser Phe
1040 1045 1050
Lys Leu Ser Val Thr Val Asp Pro Lys Tyr His Pro Lys Ile Ile
1055 1060 1065
Gly Arg Lys Gly Ala Val Ile Thr Gln Ile Arg Leu Glu His Asp
1070 1075 1080
Val Asn Ile Gln Phe Pro Asp Lys Asp Asp Gly Asn Gln Pro Gln
1085 1090 1095
Asp Gln Ile Thr Ile Thr Gly Tyr Glu Lys Asn Thr Glu Ala Ala
1100 1105 1110
Arg Asp Ala Ile Leu Arg Ile Val Gly Glu Leu Glu Gln Met Val
1115 1120 1125
Ser Glu Asp Val Pro Leu Asp His Arg Val His Ala Arg Ile Ile
1130 1135 1140
Gly Ala Arg Gly Lys Ala Ile Arg Lys Ile Met Asp Glu Phe Lys
1145 1150 1155
Val Asp Ile Arg Phe Pro Gln Ser Gly Ala Pro Asp Pro Asn Cys
1160 1165 1170
Val Thr Val Thr Gly Leu Pro Glu Asn Val Glu Glu Ala Ile Asp
1175 1180 1185
His Ile Leu Asn Leu Glu Glu Glu Tyr Leu Ala Asp Val Val Asp
1190 1195 1200
Ser Glu Ala Leu Gln Val Tyr Met Lys Pro Pro Ala His Glu Glu
1205 1210 1215
Ala Lys Ala Pro Ser Arg Gly Phe Val Val Arg Asp Ala Pro Trp
1220 1225 1230
Thr Ala Ser Ser Ser Glu Lys Ala Pro Asp Met Ser Ser Ser Glu
1235 1240 1245
Glu Phe Pro Ser Phe Gly Ala Gln Val Ala Pro Lys Thr Leu Pro
1250 1255 1260
Trp Gly Pro Lys Arg
1265
<210> 44
<211> 6367
<212> DNA
<213> Homo sapiens
<400> 44
ggagcgtccc ggcttctccc gcgcgggggg cgagtaagcc agcggcagga ccagcgggcg 60
ggggcccacg acaaaagctg gcaggctgac agaggcggcc tcaggacgga ccttctggct 120
actgaccgtt ttgctgtggt tttcccggat tgtgtgtagg tgtgagatca accatgagtt 180
ccgttgcagt tttgacccaa gagagttttg ctgaacaccg aagtgggctg gttccgcaac 240
aaatcaaagt tgccactcta aattcagaag aggagagcga ccctccaacc tacaaggatg 300
ccttccctcc acttcctgag aaagctgctt gcctggaaag tgcccaggaa cccgctggag 360
cctgggggaa caagatccga cccatcaagg cttctgtcat cactcaggtg ttccatgtac 420
ccctggagga gagaaaatac aaggatatga accagtttgg agaaggtgaa caagcaaaaa 480
tctgccttga gatcatgcag agaactggtg ctcacttgga gctgtctttg gccaaagacc 540
aaggcctctc catcatggtg tcaggaaagc tggatgctgt catgaaagct cggaaggaca 600
ttgttgctag actgcagact caggcctcag caactgttgc cattcccaaa gaacaccatc 660
gctttgttat tggcaaaaat ggagagaaac tgcaagactt ggagctaaaa actgcaacca 720
aaatccagat cccacgccca gatgacccca gcaatcagat caagatcact ggcaccaaag 780
agggcatcga gaaagctcgc catgaagtct tactcatctc tgccgagcag gacaaacgtg 840
ctgtggagag gctagaagta gaaaaggcat tccacccctt catcgctggg ccgtataata 900
gactggttgg cgagatcatg caggagacag gcacgcgcat caacatcccc ccacccagcg 960
tgaaccggac agagattgtc ttcactggag agaaggaaca gttggctcag gctgtggctc 1020
gcatcaagaa gatttatgag gagaagaaaa agaagactac aaccattgca gtggaagtga 1080
agaaatccca acacaagtat gtcattgggc ccaagggcaa ttcattgcag gagatccttg 1140
agagaactgg agtttccgtt gagatcccac cctcagacag catctctgag actgtaatac 1200
ttcgaggcga acctgaaaag ttaggtcagg cgttgactga agtctatgcc aaggccaata 1260
gcttcaccgt ctcctctgtc gccgcccctt cctggcttca ccgtttcatc attggcaaga 1320
aagggcagaa cctggccaaa atcactcagc agatgccaaa ggttcacatc gagttcacag 1380
agggcgaaga caagatcacc ctggagggcc ctacagagga tgtcaatgtg gcccaggaac 1440
agatagaagg catggtcaaa gatttgatta accggatgga ctatgtggag atcaacatcg 1500
accacaagtt ccacaggcac ctcattggga agagcggtgc caacataaac agaatcaaag 1560
accagtacaa ggtgtccgtg cgcatccctc ctgacagtga gaagagcaat ttgatccgca 1620
tcgaggggga cccacagggc gtgcagcagg ccaagcgaga gctgctggag cttgcatctc 1680
gcatggaaaa tgagcgtacc aaggatctaa tcattgagca aagatttcat cgcacaatca 1740
ttgggcagaa gggtgaacgg atccgtgaaa ttcgtgacaa attcccagag gtcatcatta 1800
actttccaga cccagcacaa aaaagtgaca ttgtccagct cagaggacct aagaatgagg 1860
tggaaaaatg cacaaaatac atgcagaaga tggtggcaga tctggtggaa aatagctatt 1920
caatttctgt tccgatcttc aaacagtttc acaagaatat cattgggaaa ggaggcgcaa 1980
acattaaaaa gattcgtgaa gaaagcaaca ccaaaatcga ccttccagca gagaatagca 2040
attcagagac cattatcatc acaggcaagc gagccaactg cgaagctgcc cggagcagga 2100
ttctgtctat tcagaaagac ctggccaaca tagccgaggt agaggtctcc atccctgcca 2160
agctgcacaa ctccctcatt ggcaccaagg gccgtctgat ccgctccatc atggaggagt 2220
gcggcggggt ccacattcac tttcccgtgg aaggttcagg aagcgacacc gttgttatca 2280
ggggcccttc ctcggatgtg gagaaggcca agaagcagct cctgcatctg gcggaggaga 2340
agcaaaccaa gagtttcact gttgacatcc gcgccaagcc agaataccac aaattcctca 2400
tcggcaaggg gggcggcaaa attcgcaagg tgcgcgacag cactggagca cgtgtcatct 2460
tccctgcggc tgaggacaag gaccaggacc tgatcaccat cattggaaag gaggacgccg 2520
tccgagaggc acagaaggag ctggaggcct tgatccaaaa cctggataat gtggtggaag 2580
actccatgct ggtggacccc aagcaccacc gccacttcgt catccgcaga ggccaggtct 2640
tgcgggagat tgctgaagag tatggcgggg tgatggtcag cttcccacgc tctggcacac 2700
agagcgacaa agtcaccctc aagggcgcca aggactgtgt ggaggcagcc aagaaacgca 2760
ttcaggagat cattgaggac ctggaagctc aggtgacatt agaatgtgct ataccccaga 2820
aattccatcg atctgtcatg ggccccaaag gttccagaat ccagcagatt actcgggatt 2880
tcagtgttca aattaaattc ccagacagag aggagaacgc agttcacagt acagagccag 2940
ttgtccagga gaatggggac gaagctgggg aggggagaga ggctaaagat tgtgaccccg 3000
gctctccaag gaggtgtgac atcatcatca tctctggccg gaaagaaaag tgtgaggctg 3060
ccaaggaagc tctggaggca ttggttcctg tcaccattga agtagaggtg ccctttgacc 3120
ttcaccgtta cgttattggg cagaaaggaa gtgggatccg caagatgatg gatgagtttg 3180
aggtgaacat acatgtcccg gcacctgagc tgcagtctga catcatcgcc atcacgggcc 3240
tcgctgcaaa tttggaccgg gccaaggctg gactgctgga gcgtgtgaag gagctacagg 3300
ccgagcagga ggaccgggct ttaaggagtt ttaagctgag tgtcactgta gaccccaaat 3360
accatcccaa gattatcggg agaaaggggg cagtaattac ccaaatccgg ttggagcatg 3420
acgtgaacat ccagtttcct gataaggacg atgggaacca gccccaggac caaattacca 3480
tcacagggta cgaaaagaac acagaagctg ccagggatgc tatactgaga attgtgggtg 3540
aacttgagca gatggtttct gaggacgtcc cgctggacca ccgcgttcac gcccgcatca 3600
ttggtgcccg cggcaaagcc attcgcaaaa tcatggacga attcaaggtg gacattcgct 3660
tcccacagag cggagcccca gaccccaact gcgtcactgt gacggggctc ccagagaatg 3720
tggaggaagc catcgaccac atcctcaatc tggaggagga atacctagct gacgtggtgg 3780
acagtgaggc gctgcaggta tacatgaaac ccccagcaca cgaagaggcc aaggcacctt 3840
ccagaggctt tgtggtgcgg gacgcaccct ggaccgccag cagcagtgag aaggctcctg 3900
acatgagcag ctctgaggaa tttcccagct ttggggctca ggtggctccc aagaccctcc 3960
cttggggccc caaacgataa tgatcaaaaa gaacagaacc ctctccagcc tgctgaccca 4020
aacccaacca cacaatggtt tgtctcaatc tgacccagcg gctggaccct ccgtaaattg 4080
ttgacgctct tcccccttcc cgaggtcccg cagggagcct agcgcctggc tgtgtgtgcg 4140
gccgctcctc caggcctggc cgtgcccgct caggacctgc tccactgttt aacactaaac 4200
caaggtcatg agcattcgtg ctaagataac agactccagc tcctggtcca cccggcatgt 4260
cagtcagcac tctggccttc atcacgagag ctccgcagcc gtggctagga ttccacttcc 4320
tgtgtcatga cctcaggaaa taaacgtcct tgactttata aaagccaaac gtttgccctc 4380
ttcctttccc acctccctcc tgccagtttc ccttggtcca gacagtcctg tttgtggagt 4440
gcaatcagcc tcctccagct gccagagcgc ctcagcacag gtgtcagggt gcaaggaaga 4500
cctggcaatg gacagcagga ggcaggttcc tggagctggg gggtgacctg agaggcagag 4560
ggtgacgggt tctcaggcag tcctgatttt acctgccgtg gggtctgaaa gcaccaaggg 4620
tccctgcccc tacctccact gccagaccct cagcctgagg tctggtgagt ggagcctgga 4680
ggcaaggtgg taggcaccat ctgggtcccc tgtggccgtc acagtgtctg ctgtgattga 4740
gatgcgcaca ggttggggga ggtagggcct tacgcttgtc ctcagtgggg gcagtttgcc 4800
ttagatgaca gctgggctct tcttcacacc acctgcagcc cctccctgcc cctgccctag 4860
ctgctgtgtg ttcagttgcc ttctttctac ctcagccggc gtggagtggt ctctgtgcag 4920
ttagtgccac cccacacacc cgtctcttga ttgagatgtt tctggtggtt atgggtttcc 4980
cgtggagctg ggggtgggcg ccgtgtacct aagctggagg ctggcgctct ccctcagcac 5040
aggtgggtca gtggccagca ggcccatctg gagtgggagt gggcacttcc accccgccca 5100
caggccatcc ggctgtgcag gccagcccct aggagcaggt cccgggtgac tggcagtttt 5160
cacggtctag ggccgagacg atggcatggg gcctagagca tgaggtagag cagaatgcag 5220
accacgccgc tggatgccga gagaccctgc tctccgaggg aggcatctgt gtcatgctgt 5280
gagggctgag gacggggccc tagtctctgg ttttctggtc ttaacatcct tatctgtgtc 5340
cgccacggag gtgactgagc tgctagcgag ttgtcctgtc ccaggtactt gagttttgga 5400
aaagctgact cacgcccatc catctcacag cccttccctg gggacagtcg cttccgcctt 5460
gacacctcac tctcagttga ataactcaag cttggtcatc ttcagactcg aattcttgag 5520
tagacccaga cggcttagcc caagtctagt tgcagctgcc tcggcaagtc cccatttgct 5580
caggcagccc tgaatgggcc tgtttacagg aatggtaaat tgggattgga aggaatatag 5640
cttccagctt cataggctag ggtgaccacg gcttaggaaa cagggaaaga aagcaaggcc 5700
cttttcctgc ctttcccggg atctgtctac tccacctcca cgggggaggc cagtggggaa 5760
gggctgtcac ctcttcccca tctgcatgag ttctggaact ctgtcctgtt ggctgcttgc 5820
ttccagctcc ccccaatctc catcgcagcg ggttcctcct gtcttttcta cagtgtcata 5880
aaacatcctg cccctaccct ctcccaaagg tcaattttaa ttctcaccaa gttttgcaca 5940
tctctgtatg tcgcttgatg tcttagacgc gagccctttc ctaaactgtt cagcgctctc 6000
ttttcctttg ggtggttgtt gcaagggtga tgacatgact gtccccaggc ctgtctccct 6060
gaagcgtctg tgctgtcagg acagccctgg gcagagatga ggcaggggtg aggcgtgcgt 6120
gtgcttttcc tccttgttgg atgtcttcca tatcatctgt ttccatagct acaatccatc 6180
ccttggcctt aactttggaa tttggagatt atatgcaaac atgtgtaaag gctcatgaat 6240
atggatgaca ctggaatttt ataaattcta aaataaaacc cgaaaccaga tgtagcatgc 6300
tgggactcat tttgaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6360
aaaaaaa 6367
<210> 45
<211> 127
<212> PRT
<213> Homo sapiens
<400> 45
Met Pro Glu Val Ser Ser Lys Gly Ala Thr Ile Ser Lys Lys Gly Phe
1 5 10 15
Lys Lys Ala Val Val Lys Thr Gln Lys Lys Glu Gly Lys Lys Arg Lys
20 25 30
Arg Thr Arg Lys Glu Ser Tyr Ser Ile Tyr Ile Tyr Lys Val Leu Lys
35 40 45
Gln Val His Pro Asp Thr Gly Ile Ser Ser Lys Ala Met Ser Ile Met
50 55 60
Asn Ser Phe Val Thr Asp Ile Phe Glu Arg Ile Ala Ser Glu Ala Ser
65 70 75 80
Arg Leu Ala His Tyr Ser Lys Arg Ser Thr Ile Ser Ser Arg Glu Ile
85 90 95
Gln Thr Ala Val Arg Leu Leu Leu Pro Gly Glu Leu Ala Lys His Ala
100 105 110
Val Ser Glu Gly Thr Lys Ala Val Thr Lys Tyr Thr Ser Ser Lys
115 120 125
<210> 46
<211> 437
<212> DNA
<213> Homo sapiens
<400> 46
atgccggagg tgtcatctaa aggtgctacc atttccaaga agggctttaa gaaagctgtc 60
gttaagaccc agaaaaagga aggcaaaaag cgcaagagga cccgtaagga gagttattct 120
atttacatct acaaagtgct aaagcaggtc catccggaca ctggcatctc ttcgaaagct 180
atgagcatta tgaattcctt cgtcactgat atctttgagc gtatagcgag cgaggcatca 240
cgtttggctc actacagcaa gcgctccacc atttcttcca gagagattca gacagcagtg 300
cgcttgctac tgccgggaga gctggctaaa catgctgtgt ctgagggcac caaggctgtc 360
actaagtaca ccagctccaa gtaagcctgc taagtaaacg tcatttctaa cccaaaggct 420
cttttcagag ccactta 437
<210> 47
<211> 209
<212> PRT
<213> Homo sapiens
<400> 47
Met Gly Lys Gly Asp Pro Asn Lys Pro Arg Gly Lys Met Ser Ser Tyr
1 5 10 15
Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro
20 25 30
Asp Ser Ser Val Asn Phe Ala Glu Phe Ser Lys Lys Cys Ser Glu Arg
35 40 45
Trp Lys Thr Met Ser Ala Lys Glu Lys Ser Lys Phe Glu Asp Met Ala
50 55 60
Lys Ser Asp Lys Ala Arg Tyr Asp Arg Glu Met Lys Asn Tyr Val Pro
65 70 75 80
Pro Lys Gly Asp Lys Lys Gly Lys Lys Lys Asp Pro Asn Ala Pro Lys
85 90 95
Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu His Arg Pro Lys
100 105 110
Ile Lys Ser Glu His Pro Gly Leu Ser Ile Gly Asp Thr Ala Lys Lys
115 120 125
Leu Gly Glu Met Trp Ser Glu Gln Ser Ala Lys Asp Lys Gln Pro Tyr
130 135 140
Glu Gln Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala
145 150 155 160
Ala Tyr Arg Ala Lys Gly Lys Ser Glu Ala Gly Lys Lys Gly Pro Gly
165 170 175
Arg Pro Thr Gly Ser Lys Lys Lys Asn Glu Pro Glu Asp Glu Glu Glu
180 185 190
Glu Glu Glu Glu Glu Asp Glu Asp Glu Glu Glu Glu Asp Glu Asp Glu
195 200 205
Glu
<210> 48
<211> 1467
<212> DNA
<213> Homo sapiens
<400> 48
aaaccagttc acgccggagc cccgtgaggg aagcgtctcc gttgggtccg gccgctctgc 60
gggactctga ggaaaagctc gcaccaggca agaataccct ccaataccct cgggtggacg 120
cggatctgtc aacatgggta aaggagaccc caacaagccg cggggcaaaa tgtcctcgta 180
cgccttcttc gtgcagacct gccgggaaga gcacaagaag aaacacccgg actcttccgt 240
caatttcgcg gaattctcca agaagtgttc ggagagatgg aagaccatgt ctgcaaagga 300
gaagtcgaag tttgaagata tggcaaaaag tgacaaagct cgctatgaca gggagatgaa 360
aaattacgtt cctcccaaag gtgataagaa ggggaagaaa aaggacccca atgctcctaa 420
aaggccacca tctgccttct tcctgttttg ctctgaacat cgcccaaaga tcaaaagtga 480
acaccctggc ctatccattg gggatactgc aaagaaattg ggtgaaatgt ggtctgagca 540
gtcagccaaa gataaacaac catatgaaca gaaagcagct aagctaaagg agaaatatga 600
aaaggatatt gctgcatatc gtgccaaggg caaaagtgaa gcaggaaaga agggccctgg 660
caggccaaca ggctcaaaga agaagaacga accagaagat gaggaggagg aggaggaaga 720
agaagatgaa gatgaggagg aagaggatga agatgaagaa taaatggcta tcctttaatg 780
atgcgtgtgg aatgtgtgtg tgtgctcagg caattatttt gctaagaatg tgaattcaag 840
tgcagctcaa tactagcttc agtataaaaa ctgtacagat ttttgtatag ctgataagat 900
tctctgtaga gaaaatactt ttaaaaaatg caggttgtag ctttttgatg ggctactcat 960
acagttagat tttacagctt ctgatgttga atgttcctaa atatttaatg gtttttttaa 1020
tttcttgtgt atggtagcac agcaaacttg taggaattag tatcaatagt aaattttggg 1080
ttttttagga tgttgcattt cgttttttta aaaaaaattt tgtaataaaa ttatgtatat 1140
tatttctatt gtctttgtct taatatgcta agttaatttt cactttaaaa aagccatttg 1200
aagaccagag ctatgttgat ttttttcggt atttctgcct agtagttctt agacacagtt 1260
gacctagtaa aatgtttgag aattaaaacc aaacatgctc atatttgcaa aatgttcttt 1320
aaaagttaca tgttgaactc agtgaacttt ataagaattt atgcagtttt acagaacgtt 1380
aagttttgta cttgacgttt ctgtttatta gctaaattgt tcctcaggtg tgtgtatata 1440
tatatacata tatatatata tatatat 1467
<210> 49
<211> 209
<212> PRT
<213> Homo sapiens
<400> 49
Met Gly Lys Gly Asp Pro Asn Lys Pro Arg Gly Lys Met Ser Ser Tyr
1 5 10 15
Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro
20 25 30
Asp Ser Ser Val Asn Phe Ala Glu Phe Ser Lys Lys Cys Ser Glu Arg
35 40 45
Trp Lys Thr Met Ser Ala Lys Glu Lys Ser Lys Phe Glu Asp Met Ala
50 55 60
Lys Ser Asp Lys Ala Arg Tyr Asp Arg Glu Met Lys Asn Tyr Val Pro
65 70 75 80
Pro Lys Gly Asp Lys Lys Gly Lys Lys Lys Asp Pro Asn Ala Pro Lys
85 90 95
Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu His Arg Pro Lys
100 105 110
Ile Lys Ser Glu His Pro Gly Leu Ser Ile Gly Asp Thr Ala Lys Lys
115 120 125
Leu Gly Glu Met Trp Ser Glu Gln Ser Ala Lys Asp Lys Gln Pro Tyr
130 135 140
Glu Gln Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala
145 150 155 160
Ala Tyr Arg Ala Lys Gly Lys Ser Glu Ala Gly Lys Lys Gly Pro Gly
165 170 175
Arg Pro Thr Gly Ser Lys Lys Lys Asn Glu Pro Glu Asp Glu Glu Glu
180 185 190
Glu Glu Glu Glu Glu Asp Glu Asp Glu Glu Glu Glu Asp Glu Asp Glu
195 200 205
Glu
<210> 50
<211> 1454
<212> DNA
<213> Homo sapiens
<400> 50
ggatttgggc gggaagcgga gccccgccag cgcccgccct ggcagctgcg ggctccgcgc 60
cgaccctccg gcttcccctc tcccccctcg gccccgtcag gtggacgcgg atctgtcaac 120
atgggtaaag gagaccccaa caagccgcgg ggcaaaatgt cctcgtacgc cttcttcgtg 180
cagacctgcc gggaagagca caagaagaaa cacccggact cttccgtcaa tttcgcggaa 240
ttctccaaga agtgttcgga gagatggaag accatgtctg caaaggagaa gtcgaagttt 300
gaagatatgg caaaaagtga caaagctcgc tatgacaggg agatgaaaaa ttacgttcct 360
cccaaaggtg ataagaaggg gaagaaaaag gaccccaatg ctcctaaaag gccaccatct 420
gccttcttcc tgttttgctc tgaacatcgc ccaaagatca aaagtgaaca ccctggccta 480
tccattgggg atactgcaaa gaaattgggt gaaatgtggt ctgagcagtc agccaaagat 540
aaacaaccat atgaacagaa agcagctaag ctaaaggaga aatatgaaaa ggatattgct 600
gcatatcgtg ccaagggcaa aagtgaagca ggaaagaagg gccctggcag gccaacaggc 660
tcaaagaaga agaacgaacc agaagatgag gaggaggagg aggaagaaga agatgaagat 720
gaggaggaag aggatgaaga tgaagaataa atggctatcc tttaatgatg cgtgtggaat 780
gtgtgtgtgt gctcaggcaa ttattttgct aagaatgtga attcaagtgc agctcaatac 840
tagcttcagt ataaaaactg tacagatttt tgtatagctg ataagattct ctgtagagaa 900
aatactttta aaaaatgcag gttgtagctt tttgatgggc tactcataca gttagatttt 960
acagcttctg atgttgaatg ttcctaaata tttaatggtt tttttaattt cttgtgtatg 1020
gtagcacagc aaacttgtag gaattagtat caatagtaaa ttttgggttt tttaggatgt 1080
tgcatttcgt ttttttaaaa aaaattttgt aataaaatta tgtatattat ttctattgtc 1140
tttgtcttaa tatgctaagt taattttcac tttaaaaaag ccatttgaag accagagcta 1200
tgttgatttt tttcggtatt tctgcctagt agttcttaga cacagttgac ctagtaaaat 1260
gtttgagaat taaaaccaaa catgctcata tttgcaaaat gttctttaaa agttacatgt 1320
tgaactcagt gaactttata agaatttatg cagttttaca gaacgttaag ttttgtactt 1380
gacgtttctg tttattagct aaattgttcc tcaggtgtgt gtatatatat atacatatat 1440
atatatatat atat 1454
<210> 51
<211> 209
<212> PRT
<213> Homo sapiens
<400> 51
Met Gly Lys Gly Asp Pro Asn Lys Pro Arg Gly Lys Met Ser Ser Tyr
1 5 10 15
Ala Phe Phe Val Gln Thr Cys Arg Glu Glu His Lys Lys Lys His Pro
20 25 30
Asp Ser Ser Val Asn Phe Ala Glu Phe Ser Lys Lys Cys Ser Glu Arg
35 40 45
Trp Lys Thr Met Ser Ala Lys Glu Lys Ser Lys Phe Glu Asp Met Ala
50 55 60
Lys Ser Asp Lys Ala Arg Tyr Asp Arg Glu Met Lys Asn Tyr Val Pro
65 70 75 80
Pro Lys Gly Asp Lys Lys Gly Lys Lys Lys Asp Pro Asn Ala Pro Lys
85 90 95
Arg Pro Pro Ser Ala Phe Phe Leu Phe Cys Ser Glu His Arg Pro Lys
100 105 110
Ile Lys Ser Glu His Pro Gly Leu Ser Ile Gly Asp Thr Ala Lys Lys
115 120 125
Leu Gly Glu Met Trp Ser Glu Gln Ser Ala Lys Asp Lys Gln Pro Tyr
130 135 140
Glu Gln Lys Ala Ala Lys Leu Lys Glu Lys Tyr Glu Lys Asp Ile Ala
145 150 155 160
Ala Tyr Arg Ala Lys Gly Lys Ser Glu Ala Gly Lys Lys Gly Pro Gly
165 170 175
Arg Pro Thr Gly Ser Lys Lys Lys Asn Glu Pro Glu Asp Glu Glu Glu
180 185 190
Glu Glu Glu Glu Glu Asp Glu Asp Glu Glu Glu Glu Asp Glu Asp Glu
195 200 205
Glu
<210> 52
<211> 1527
<212> DNA
<213> Homo sapiens
<400> 52
ggggatgtgg cccgtggcct agctcgtcaa gttgccgtgg cgcggagaac tctgcaaaac 60
aagaggctga ggattgcgtt agagataaac cagttcacgc cggagccccg tgagggaagc 120
gtctccgttg ggtccggccg ctctgcggga ctctgaggaa aagctcgcac caggtggacg 180
cggatctgtc aacatgggta aaggagaccc caacaagccg cggggcaaaa tgtcctcgta 240
cgccttcttc gtgcagacct gccgggaaga gcacaagaag aaacacccgg actcttccgt 300
caatttcgcg gaattctcca agaagtgttc ggagagatgg aagaccatgt ctgcaaagga 360
gaagtcgaag tttgaagata tggcaaaaag tgacaaagct cgctatgaca gggagatgaa 420
aaattacgtt cctcccaaag gtgataagaa ggggaagaaa aaggacccca atgctcctaa 480
aaggccacca tctgccttct tcctgttttg ctctgaacat cgcccaaaga tcaaaagtga 540
acaccctggc ctatccattg gggatactgc aaagaaattg ggtgaaatgt ggtctgagca 600
gtcagccaaa gataaacaac catatgaaca gaaagcagct aagctaaagg agaaatatga 660
aaaggatatt gctgcatatc gtgccaaggg caaaagtgaa gcaggaaaga agggccctgg 720
caggccaaca ggctcaaaga agaagaacga accagaagat gaggaggagg aggaggaaga 780
agaagatgaa gatgaggagg aagaggatga agatgaagaa taaatggcta tcctttaatg 840
atgcgtgtgg aatgtgtgtg tgtgctcagg caattatttt gctaagaatg tgaattcaag 900
tgcagctcaa tactagcttc agtataaaaa ctgtacagat ttttgtatag ctgataagat 960
tctctgtaga gaaaatactt ttaaaaaatg caggttgtag ctttttgatg ggctactcat 1020
acagttagat tttacagctt ctgatgttga atgttcctaa atatttaatg gtttttttaa 1080
tttcttgtgt atggtagcac agcaaacttg taggaattag tatcaatagt aaattttggg 1140
ttttttagga tgttgcattt cgttttttta aaaaaaattt tgtaataaaa ttatgtatat 1200
tatttctatt gtctttgtct taatatgcta agttaatttt cactttaaaa aagccatttg 1260
aagaccagag ctatgttgat ttttttcggt atttctgcct agtagttctt agacacagtt 1320
gacctagtaa aatgtttgag aattaaaacc aaacatgctc atatttgcaa aatgttcttt 1380
aaaagttaca tgttgaactc agtgaacttt ataagaattt atgcagtttt acagaacgtt 1440
aagttttgta cttgacgttt ctgtttatta gctaaattgt tcctcaggtg tgtgtatata 1500
tatatacata tatatatata tatatat 1527
<210> 53
<211> 464
<212> PRT
<213> Homo sapiens
<400> 53
Met Glu Thr Glu Gln Pro Glu Glu Thr Phe Pro Asn Thr Glu Thr Asn
1 5 10 15
Gly Glu Phe Gly Lys Arg Pro Ala Glu Asp Met Glu Glu Glu Gln Ala
20 25 30
Phe Lys Arg Ser Arg Asn Thr Asp Glu Met Val Glu Leu Arg Ile Leu
35 40 45
Leu Gln Ser Lys Asn Ala Gly Ala Val Ile Gly Lys Gly Gly Lys Asn
50 55 60
Ile Lys Ala Leu Arg Thr Asp Tyr Asn Ala Ser Val Ser Val Pro Asp
65 70 75 80
Ser Ser Gly Pro Glu Arg Ile Leu Ser Ile Ser Ala Asp Ile Glu Thr
85 90 95
Ile Gly Glu Ile Leu Lys Lys Ile Ile Pro Thr Leu Glu Glu Gly Leu
100 105 110
Gln Leu Pro Ser Pro Thr Ala Thr Ser Gln Leu Pro Leu Glu Ser Asp
115 120 125
Ala Val Glu Cys Leu Asn Tyr Gln His Tyr Lys Gly Ser Asp Phe Asp
130 135 140
Cys Glu Leu Arg Leu Leu Ile His Gln Ser Leu Ala Gly Gly Ile Ile
145 150 155 160
Gly Val Lys Gly Ala Lys Ile Lys Glu Leu Arg Glu Asn Thr Gln Thr
165 170 175
Thr Ile Lys Leu Phe Gln Glu Cys Cys Pro His Ser Thr Asp Arg Val
180 185 190
Val Leu Ile Gly Gly Lys Pro Asp Arg Val Val Glu Cys Ile Lys Ile
195 200 205
Ile Leu Asp Leu Ile Ser Glu Ser Pro Ile Lys Gly Arg Ala Gln Pro
210 215 220
Tyr Asp Pro Asn Phe Tyr Asp Glu Thr Tyr Asp Tyr Gly Gly Phe Thr
225 230 235 240
Met Met Phe Asp Asp Arg Arg Gly Arg Pro Val Gly Phe Pro Met Arg
245 250 255
Gly Arg Gly Gly Phe Asp Arg Met Pro Pro Gly Arg Gly Gly Arg Pro
260 265 270
Met Pro Pro Ser Arg Arg Asp Tyr Asp Asp Met Ser Pro Arg Arg Gly
275 280 285
Pro Pro Pro Pro Pro Pro Gly Arg Gly Gly Arg Gly Gly Ser Arg Ala
290 295 300
Arg Asn Leu Pro Leu Pro Pro Pro Pro Pro Pro Arg Gly Gly Asp Leu
305 310 315 320
Met Ala Tyr Asp Arg Arg Gly Arg Pro Gly Asp Arg Tyr Asp Gly Met
325 330 335
Val Gly Phe Ser Ala Asp Glu Thr Trp Asp Ser Ala Ile Asp Thr Trp
340 345 350
Ser Pro Ser Glu Trp Gln Met Ala Tyr Glu Pro Gln Gly Gly Ser Gly
355 360 365
Tyr Asp Tyr Ser Tyr Ala Gly Gly Arg Gly Ser Tyr Gly Asp Leu Gly
370 375 380
Gly Pro Ile Ile Thr Thr Gln Val Thr Ile Pro Lys Asp Leu Ala Gly
385 390 395 400
Ser Ile Ile Gly Lys Gly Gly Gln Arg Ile Lys Gln Ile Arg His Glu
405 410 415
Ser Gly Ala Ser Ile Lys Ile Asp Glu Pro Leu Glu Gly Ser Glu Asp
420 425 430
Arg Ile Ile Thr Ile Thr Gly Thr Gln Asp Gln Ile Gln Asn Ala Gln
435 440 445
Tyr Leu Leu Gln Asn Ser Val Lys Gln Tyr Ala Asp Val Glu Gly Phe
450 455 460
<210> 54
<211> 2995
<212> DNA
<213> Homo sapiens
<400> 54
ccctagccgc ccctcccccc agctagtgag tgcgcgaacg agaaaggagg agggcgctcc 60
aggcgacagc actgcagacg ccattatcct ctgtttctct gctgcaccga cctcgacgtc 120
ttgcctgtgt cccacttgtt cgcggcctat aggctactgc agcactgggg tgtcagttgt 180
tggtccgacc cagaacgctt cagttctgct ctgcaaggat atataataac tgattggtgt 240
gcccgtttaa taaaagaata tggaaactga acagccagaa gaaaccttcc ctaacactga 300
aaccaatggt gaatttggta aacgccctgc agaagatatg gaagaggaac aagcatttaa 360
aagatctaga aacactgatg agatggttga attacgcatt ctgcttcaga gcaagaatgc 420
tggggcagtg attggaaaag gaggcaagaa tattaaggct ctccgtacag actacaatgc 480
cagtgtttca gtcccagaca gcagtggccc cgagcgcata ttgagtatca gtgctgatat 540
tgaaacaatt ggagaaattc tgaagaaaat catccctacc ttggaagagg gcctgcagtt 600
gccatcaccc actgcaacca gccagctccc gctcgaatct gatgctgtgg aatgcttaaa 660
ttaccaacac tataaaggaa gtgactttga ctgcgagttg aggctgttga ttcatcagag 720
tctagcagga ggaattattg gggtcaaagg tgctaaaatc aaagaacttc gagagaacac 780
tcaaaccacc atcaagcttt tccaggaatg ctgtcctcat tccactgaca gagttgttct 840
tattggagga aaacccgata gggttgtaga gtgcataaag atcatccttg atcttatatc 900
tgagtctccc atcaaaggac gtgcacagcc ttatgatccc aatttttacg atgaaaccta 960
tgattatggt ggttttacaa tgatgtttga tgaccgtcgc ggacgcccag tgggatttcc 1020
catgcgggga agaggtggtt ttgacagaat gcctcctggt cggggtgggc gtcccatgcc 1080
tccatctaga agagattatg atgatatgag ccctcgtcga ggaccacctc cccctcctcc 1140
cggacgaggc ggccggggtg gtagcagagc tcggaatctt cctcttcctc caccaccacc 1200
acctagaggg ggagacctca tggcctatga cagaagaggg agacctggag accgttacga 1260
cggcatggtt ggtttcagtg ctgatgaaac ttgggactct gcaatagata catggagccc 1320
atcagaatgg cagatggctt atgaaccaca gggtggctcc ggatatgatt attcctatgc 1380
agggggtcgt ggctcatatg gtgatcttgg tggacctatt attactacac aagtaactat 1440
tcccaaagat ttggctggat ctattattgg caaaggtggt cagcggatta aacaaatccg 1500
tcatgagtcg ggagcttcga tcaaaattga tgagccttta gaaggatccg aagatcggat 1560
cattaccatt acaggaacac aggaccagat acagaatgca cagtatttgc tgcagaacag 1620
tgtgaagcag tatgcagatg ttgaaggatt ctaatgcaag atattttttc ttttttatag 1680
tgtgaagcag tattctggaa agtttttcta agactagtga agaactgaag gagtcctgca 1740
tctttttttt tttatctgct tctgtttaaa aagccaacat tcctctgctt cataggtgtt 1800
ctgcatttga ggtgtagtga aatctttgct gttcaccaga tgtaatgttt tagttcctta 1860
caaacagggt tggggggggg aagggcgtgc aaaaactaac attgaaattt tgaaacagca 1920
gcagagtgag tggattttat ttttcgttat tgttggtggt ttaaaaaatt ccccccatgt 1980
aattattgtg aacaccttgc tttgtggtca ctgtaacatt tggggggtgg gacagggagg 2040
aaaagtaaca atagtccaca tgtccctggc atctgttcag agcagtgtgc agaatgtaat 2100
gctcttttgt aagaaacgtt ttatgatttt taaaataaat ttagtgaacc tatttttggt 2160
ggtcattttt tttttaagac agtcatttta aaatggtggc tgaatttccc aacccacccc 2220
caaactaaac actaagttta attttcagct cctctgttgg acatataagt gcatctcttg 2280
ttggacatag gcaaaataac ttggcaaact tagttctggt gatttcttga tggtttggaa 2340
gtctattgct gggaagaaat tccatcatac atattcatgc ttataataag ctggggattt 2400
tttgtttgtt tttgcaaatg cttgccccta cttttcaaca attttctatg ttagttgtga 2460
agaactaagg tggggagcag tactacaagt tgagtaatgg tatgagtata taccagaatt 2520
ctgattggca gcaagtttta ttaatcagaa taacacttgg ttatggaagt gactaatgct 2580
gaaaaaattg attattttta ttagataatt tctcacctat agacttaaac tgtcaatttg 2640
ctctagtgtc ttattagtta aactttgtaa aatatatata tacttgtttt tccattgtat 2700
gcaaattgaa agaaaaagat gtaccatttc tctgttgtat gttggattat gtaggaaatg 2760
tttgtgtaca attcaaaaaa aaaaaagatg aaaaaagttc ctgtggatgt tttgtgtagt 2820
atcttggcat ttgtattgat agttaaaatt cacttccaaa taaataaaac acccatgatg 2880
ctagatttga tgtgtgcccg atttgaacaa gggttgattg acacctgtaa aatttgttga 2940
aacgttcctc ttaaaaggaa atatagtaat cttatgtaaa aaaaaaaaaa aaaaa 2995
<210> 55
<211> 463
<212> PRT
<213> Homo sapiens
<400> 55
Met Glu Thr Glu Gln Pro Glu Glu Thr Phe Pro Asn Thr Glu Thr Asn
1 5 10 15
Gly Glu Phe Gly Lys Arg Pro Ala Glu Asp Met Glu Glu Glu Gln Ala
20 25 30
Phe Lys Arg Ser Arg Asn Thr Asp Glu Met Val Glu Leu Arg Ile Leu
35 40 45
Leu Gln Ser Lys Asn Ala Gly Ala Val Ile Gly Lys Gly Gly Lys Asn
50 55 60
Ile Lys Ala Leu Arg Thr Asp Tyr Asn Ala Ser Val Ser Val Pro Asp
65 70 75 80
Ser Ser Gly Pro Glu Arg Ile Leu Ser Ile Ser Ala Asp Ile Glu Thr
85 90 95
Ile Gly Glu Ile Leu Lys Lys Ile Ile Pro Thr Leu Glu Glu Gly Leu
100 105 110
Gln Leu Pro Ser Pro Thr Ala Thr Ser Gln Leu Pro Leu Glu Ser Asp
115 120 125
Ala Val Glu Cys Leu Asn Tyr Gln His Tyr Lys Gly Ser Asp Phe Asp
130 135 140
Cys Glu Leu Arg Leu Leu Ile His Gln Ser Leu Ala Gly Gly Ile Ile
145 150 155 160
Gly Val Lys Gly Ala Lys Ile Lys Glu Leu Arg Glu Asn Thr Gln Thr
165 170 175
Thr Ile Lys Leu Phe Gln Glu Cys Cys Pro His Ser Thr Asp Arg Val
180 185 190
Val Leu Ile Gly Gly Lys Pro Asp Arg Val Val Glu Cys Ile Lys Ile
195 200 205
Ile Leu Asp Leu Ile Ser Glu Ser Pro Ile Lys Gly Arg Ala Gln Pro
210 215 220
Tyr Asp Pro Asn Phe Tyr Asp Glu Thr Tyr Asp Tyr Gly Gly Phe Thr
225 230 235 240
Met Met Phe Asp Asp Arg Arg Gly Arg Pro Val Gly Phe Pro Met Arg
245 250 255
Gly Arg Gly Gly Phe Asp Arg Met Pro Pro Gly Arg Gly Gly Arg Pro
260 265 270
Met Pro Pro Ser Arg Arg Asp Tyr Asp Asp Met Ser Pro Arg Arg Gly
275 280 285
Pro Pro Pro Pro Pro Pro Gly Arg Gly Gly Arg Gly Gly Ser Arg Ala
290 295 300
Arg Asn Leu Pro Leu Pro Pro Pro Pro Pro Pro Arg Gly Gly Asp Leu
305 310 315 320
Met Ala Tyr Asp Arg Arg Gly Arg Pro Gly Asp Arg Tyr Asp Gly Met
325 330 335
Val Gly Phe Ser Ala Asp Glu Thr Trp Asp Ser Ala Ile Asp Thr Trp
340 345 350
Ser Pro Ser Glu Trp Gln Met Ala Tyr Glu Pro Gln Gly Gly Ser Gly
355 360 365
Tyr Asp Tyr Ser Tyr Ala Gly Gly Arg Gly Ser Tyr Gly Asp Leu Gly
370 375 380
Gly Pro Ile Ile Thr Thr Gln Val Thr Ile Pro Lys Asp Leu Ala Gly
385 390 395 400
Ser Ile Ile Gly Lys Gly Gly Gln Arg Ile Lys Gln Ile Arg His Glu
405 410 415
Ser Gly Ala Ser Ile Lys Ile Asp Glu Pro Leu Glu Gly Ser Glu Asp
420 425 430
Arg Ile Ile Thr Ile Thr Gly Thr Gln Asp Gln Ile Gln Asn Ala Gln
435 440 445
Tyr Leu Leu Gln Asn Ser Val Lys Gln Tyr Ser Gly Lys Phe Phe
450 455 460
<210> 56
<211> 2935
<212> DNA
<213> Homo sapiens
<400> 56
ccctagccgc ccctcccccc agctagtgag tgcgcgaacg agaaaggagg agggcgctcc 60
aggcgacagc actgcagacg ccattatcct ctgtttctct gctgcaccga cctcgacgtc 120
ttgcctgtgt cccacttgtt cgcggcctat aggctactgc agcactgggg tgtcagttgt 180
tggtccgacc cagaacgctt cagttctgct ctgcaaggat atataataac tgattggtgt 240
gcccgtttaa taaaagaata tggaaactga acagccagaa gaaaccttcc ctaacactga 300
aaccaatggt gaatttggta aacgccctgc agaagatatg gaagaggaac aagcatttaa 360
aagatctaga aacactgatg agatggttga attacgcatt ctgcttcaga gcaagaatgc 420
tggggcagtg attggaaaag gaggcaagaa tattaaggct ctccgtacag actacaatgc 480
cagtgtttca gtcccagaca gcagtggccc cgagcgcata ttgagtatca gtgctgatat 540
tgaaacaatt ggagaaattc tgaagaaaat catccctacc ttggaagagg gcctgcagtt 600
gccatcaccc actgcaacca gccagctccc gctcgaatct gatgctgtgg aatgcttaaa 660
ttaccaacac tataaaggaa gtgactttga ctgcgagttg aggctgttga ttcatcagag 720
tctagcagga ggaattattg gggtcaaagg tgctaaaatc aaagaacttc gagagaacac 780
tcaaaccacc atcaagcttt tccaggaatg ctgtcctcat tccactgaca gagttgttct 840
tattggagga aaacccgata gggttgtaga gtgcataaag atcatccttg atcttatatc 900
tgagtctccc atcaaaggac gtgcacagcc ttatgatccc aatttttacg atgaaaccta 960
tgattatggt ggttttacaa tgatgtttga tgaccgtcgc ggacgcccag tgggatttcc 1020
catgcgggga agaggtggtt ttgacagaat gcctcctggt cggggtgggc gtcccatgcc 1080
tccatctaga agagattatg atgatatgag ccctcgtcga ggaccacctc cccctcctcc 1140
cggacgaggc ggccggggtg gtagcagagc tcggaatctt cctcttcctc caccaccacc 1200
acctagaggg ggagacctca tggcctatga cagaagaggg agacctggag accgttacga 1260
cggcatggtt ggtttcagtg ctgatgaaac ttgggactct gcaatagata catggagccc 1320
atcagaatgg cagatggctt atgaaccaca gggtggctcc ggatatgatt attcctatgc 1380
agggggtcgt ggctcatatg gtgatcttgg tggacctatt attactacac aagtaactat 1440
tcccaaagat ttggctggat ctattattgg caaaggtggt cagcggatta aacaaatccg 1500
tcatgagtcg ggagcttcga tcaaaattga tgagccttta gaaggatccg aagatcggat 1560
cattaccatt acaggaacac aggaccagat acagaatgca cagtatttgc tgcagaacag 1620
tgtgaagcag tattctggaa agtttttcta agactagtga agaactgaag gagtcctgca 1680
tctttttttt tttatctgct tctgtttaaa aagccaacat tcctctgctt cataggtgtt 1740
ctgcatttga ggtgtagtga aatctttgct gttcaccaga tgtaatgttt tagttcctta 1800
caaacagggt tggggggggg aagggcgtgc aaaaactaac attgaaattt tgaaacagca 1860
gcagagtgag tggattttat ttttcgttat tgttggtggt ttaaaaaatt ccccccatgt 1920
aattattgtg aacaccttgc tttgtggtca ctgtaacatt tggggggtgg gacagggagg 1980
aaaagtaaca atagtccaca tgtccctggc atctgttcag agcagtgtgc agaatgtaat 2040
gctcttttgt aagaaacgtt ttatgatttt taaaataaat ttagtgaacc tatttttggt 2100
ggtcattttt tttttaagac agtcatttta aaatggtggc tgaatttccc aacccacccc 2160
caaactaaac actaagttta attttcagct cctctgttgg acatataagt gcatctcttg 2220
ttggacatag gcaaaataac ttggcaaact tagttctggt gatttcttga tggtttggaa 2280
gtctattgct gggaagaaat tccatcatac atattcatgc ttataataag ctggggattt 2340
tttgtttgtt tttgcaaatg cttgccccta cttttcaaca attttctatg ttagttgtga 2400
agaactaagg tggggagcag tactacaagt tgagtaatgg tatgagtata taccagaatt 2460
ctgattggca gcaagtttta ttaatcagaa taacacttgg ttatggaagt gactaatgct 2520
gaaaaaattg attattttta ttagataatt tctcacctat agacttaaac tgtcaatttg 2580
ctctagtgtc ttattagtta aactttgtaa aatatatata tacttgtttt tccattgtat 2640
gcaaattgaa agaaaaagat gtaccatttc tctgttgtat gttggattat gtaggaaatg 2700
tttgtgtaca attcaaaaaa aaaaaagatg aaaaaagttc ctgtggatgt tttgtgtagt 2760
atcttggcat ttgtattgat agttaaaatt cacttccaaa taaataaaac acccatgatg 2820
ctagatttga tgtgtgcccg atttgaacaa gggttgattg acacctgtaa aatttgttga 2880
aacgttcctc ttaaaaggaa atatagtaat cttatgtaaa aaaaaaaaaa aaaaa 2935
<210> 57
<211> 464
<212> PRT
<213> Homo sapiens
<400> 57
Met Glu Thr Glu Gln Pro Glu Glu Thr Phe Pro Asn Thr Glu Thr Asn
1 5 10 15
Gly Glu Phe Gly Lys Arg Pro Ala Glu Asp Met Glu Glu Glu Gln Ala
20 25 30
Phe Lys Arg Ser Arg Asn Thr Asp Glu Met Val Glu Leu Arg Ile Leu
35 40 45
Leu Gln Ser Lys Asn Ala Gly Ala Val Ile Gly Lys Gly Gly Lys Asn
50 55 60
Ile Lys Ala Leu Arg Thr Asp Tyr Asn Ala Ser Val Ser Val Pro Asp
65 70 75 80
Ser Ser Gly Pro Glu Arg Ile Leu Ser Ile Ser Ala Asp Ile Glu Thr
85 90 95
Ile Gly Glu Ile Leu Lys Lys Ile Ile Pro Thr Leu Glu Glu Gly Leu
100 105 110
Gln Leu Pro Ser Pro Thr Ala Thr Ser Gln Leu Pro Leu Glu Ser Asp
115 120 125
Ala Val Glu Cys Leu Asn Tyr Gln His Tyr Lys Gly Ser Asp Phe Asp
130 135 140
Cys Glu Leu Arg Leu Leu Ile His Gln Ser Leu Ala Gly Gly Ile Ile
145 150 155 160
Gly Val Lys Gly Ala Lys Ile Lys Glu Leu Arg Glu Asn Thr Gln Thr
165 170 175
Thr Ile Lys Leu Phe Gln Glu Cys Cys Pro His Ser Thr Asp Arg Val
180 185 190
Val Leu Ile Gly Gly Lys Pro Asp Arg Val Val Glu Cys Ile Lys Ile
195 200 205
Ile Leu Asp Leu Ile Ser Glu Ser Pro Ile Lys Gly Arg Ala Gln Pro
210 215 220
Tyr Asp Pro Asn Phe Tyr Asp Glu Thr Tyr Asp Tyr Gly Gly Phe Thr
225 230 235 240
Met Met Phe Asp Asp Arg Arg Gly Arg Pro Val Gly Phe Pro Met Arg
245 250 255
Gly Arg Gly Gly Phe Asp Arg Met Pro Pro Gly Arg Gly Gly Arg Pro
260 265 270
Met Pro Pro Ser Arg Arg Asp Tyr Asp Asp Met Ser Pro Arg Arg Gly
275 280 285
Pro Pro Pro Pro Pro Pro Gly Arg Gly Gly Arg Gly Gly Ser Arg Ala
290 295 300
Arg Asn Leu Pro Leu Pro Pro Pro Pro Pro Pro Arg Gly Gly Asp Leu
305 310 315 320
Met Ala Tyr Asp Arg Arg Gly Arg Pro Gly Asp Arg Tyr Asp Gly Met
325 330 335
Val Gly Phe Ser Ala Asp Glu Thr Trp Asp Ser Ala Ile Asp Thr Trp
340 345 350
Ser Pro Ser Glu Trp Gln Met Ala Tyr Glu Pro Gln Gly Gly Ser Gly
355 360 365
Tyr Asp Tyr Ser Tyr Ala Gly Gly Arg Gly Ser Tyr Gly Asp Leu Gly
370 375 380
Gly Pro Ile Ile Thr Thr Gln Val Thr Ile Pro Lys Asp Leu Ala Gly
385 390 395 400
Ser Ile Ile Gly Lys Gly Gly Gln Arg Ile Lys Gln Ile Arg His Glu
405 410 415
Ser Gly Ala Ser Ile Lys Ile Asp Glu Pro Leu Glu Gly Ser Glu Asp
420 425 430
Arg Ile Ile Thr Ile Thr Gly Thr Gln Asp Gln Ile Gln Asn Ala Gln
435 440 445
Tyr Leu Leu Gln Asn Ser Val Lys Gln Tyr Ala Asp Val Glu Gly Phe
450 455 460
<210> 58
<211> 2960
<212> DNA
<213> Homo sapiens
<400> 58
tagggcgcga cggcggggag gacgcgagaa ggcgggggag gggagcctgc gctcgttttc 60
tgtctagctc cgaccggctg aggcggcgcg gcagcggagg gacggcagtc tcgcgcggct 120
actgcagcac tggggtgtca gttgttggtc cgacccagaa cgcttcagtt ctgctctgca 180
aggatatata ataactgatt ggtgtgcccg tttaataaaa gaatatggaa actgaacagc 240
cagaagaaac cttccctaac actgaaacca atggtgaatt tggtaaacgc cctgcagaag 300
atatggaaga ggaacaagca tttaaaagat ctagaaacac tgatgagatg gttgaattac 360
gcattctgct tcagagcaag aatgctgggg cagtgattgg aaaaggaggc aagaatatta 420
aggctctccg tacagactac aatgccagtg tttcagtccc agacagcagt ggccccgagc 480
gcatattgag tatcagtgct gatattgaaa caattggaga aattctgaag aaaatcatcc 540
ctaccttgga agagggcctg cagttgccat cacccactgc aaccagccag ctcccgctcg 600
aatctgatgc tgtggaatgc ttaaattacc aacactataa aggaagtgac tttgactgcg 660
agttgaggct gttgattcat cagagtctag caggaggaat tattggggtc aaaggtgcta 720
aaatcaaaga acttcgagag aacactcaaa ccaccatcaa gcttttccag gaatgctgtc 780
ctcattccac tgacagagtt gttcttattg gaggaaaacc cgatagggtt gtagagtgca 840
taaagatcat ccttgatctt atatctgagt ctcccatcaa aggacgtgca cagccttatg 900
atcccaattt ttacgatgaa acctatgatt atggtggttt tacaatgatg tttgatgacc 960
gtcgcggacg cccagtggga tttcccatgc ggggaagagg tggttttgac agaatgcctc 1020
ctggtcgggg tgggcgtccc atgcctccat ctagaagaga ttatgatgat atgagccctc 1080
gtcgaggacc acctccccct cctcccggac gaggcggccg gggtggtagc agagctcgga 1140
atcttcctct tcctccacca ccaccaccta gagggggaga cctcatggcc tatgacagaa 1200
gagggagacc tggagaccgt tacgacggca tggttggttt cagtgctgat gaaacttggg 1260
actctgcaat agatacatgg agcccatcag aatggcagat ggcttatgaa ccacagggtg 1320
gctccggata tgattattcc tatgcagggg gtcgtggctc atatggtgat cttggtggac 1380
ctattattac tacacaagta actattccca aagatttggc tggatctatt attggcaaag 1440
gtggtcagcg gattaaacaa atccgtcatg agtcgggagc ttcgatcaaa attgatgagc 1500
ctttagaagg atccgaagat cggatcatta ccattacagg aacacaggac cagatacaga 1560
atgcacagta tttgctgcag aacagtgtga agcagtatgc agatgttgaa ggattctaat 1620
gcaagatatt ttttcttttt tatagtgtga agcagtattc tggaaagttt ttctaagact 1680
agtgaagaac tgaaggagtc ctgcatcttt ttttttttat ctgcttctgt ttaaaaagcc 1740
aacattcctc tgcttcatag gtgttctgca tttgaggtgt agtgaaatct ttgctgttca 1800
ccagatgtaa tgttttagtt ccttacaaac agggttgggg gggggaaggg cgtgcaaaaa 1860
ctaacattga aattttgaaa cagcagcaga gtgagtggat tttatttttc gttattgttg 1920
gtggtttaaa aaattccccc catgtaatta ttgtgaacac cttgctttgt ggtcactgta 1980
acatttgggg ggtgggacag ggaggaaaag taacaatagt ccacatgtcc ctggcatctg 2040
ttcagagcag tgtgcagaat gtaatgctct tttgtaagaa acgttttatg atttttaaaa 2100
taaatttagt gaacctattt ttggtggtca tttttttttt aagacagtca ttttaaaatg 2160
gtggctgaat ttcccaaccc acccccaaac taaacactaa gtttaatttt cagctcctct 2220
gttggacata taagtgcatc tcttgttgga cataggcaaa ataacttggc aaacttagtt 2280
ctggtgattt cttgatggtt tggaagtcta ttgctgggaa gaaattccat catacatatt 2340
catgcttata ataagctggg gattttttgt ttgtttttgc aaatgcttgc ccctactttt 2400
caacaatttt ctatgttagt tgtgaagaac taaggtgggg agcagtacta caagttgagt 2460
aatggtatga gtatatacca gaattctgat tggcagcaag ttttattaat cagaataaca 2520
cttggttatg gaagtgacta atgctgaaaa aattgattat ttttattaga taatttctca 2580
cctatagact taaactgtca atttgctcta gtgtcttatt agttaaactt tgtaaaatat 2640
atatatactt gtttttccat tgtatgcaaa ttgaaagaaa aagatgtacc atttctctgt 2700
tgtatgttgg attatgtagg aaatgtttgt gtacaattca aaaaaaaaaa agatgaaaaa 2760
agttcctgtg gatgttttgt gtagtatctt ggcatttgta ttgatagtta aaattcactt 2820
ccaaataaat aaaacaccca tgatgctaga tttgatgtgt gcccgatttg aacaagggtt 2880
gattgacacc tgtaaaattt gttgaaacgt tcctcttaaa aggaaatata gtaatcttat 2940
gtaaaaaaaa aaaaaaaaaa 2960
<210> 59
<211> 363
<212> PRT
<213> Homo sapiens
<400> 59
Met Glu Val Pro Pro Arg Leu Ser His Val Pro Pro Pro Leu Phe Pro
1 5 10 15
Ser Ala Pro Ala Thr Leu Ala Ser Arg Ser Leu Ser His Trp Arg Pro
20 25 30
Arg Pro Pro Arg Gln Leu Ala Pro Leu Leu Pro Ser Leu Ala Pro Ser
35 40 45
Ser Ala Arg Gln Gly Ala Arg Arg Ala Gln Arg His Val Thr Ala Gln
50 55 60
Gln Pro Ser Arg Leu Ala Gly Gly Ala Ala Ile Lys Gly Gly Arg Arg
65 70 75 80
Arg Arg Pro Asp Leu Phe Arg Arg His Phe Lys Ser Ser Ser Ile Gln
85 90 95
Arg Ser Ala Ala Ala Ala Ala Ala Thr Arg Thr Ala Arg Gln His Pro
100 105 110
Pro Ala Asp Ser Ser Val Thr Met Glu Asp Met Asn Glu Tyr Ser Asn
115 120 125
Ile Glu Glu Phe Ala Glu Gly Ser Lys Ile Asn Ala Ser Lys Asn Gln
130 135 140
Gln Asp Asp Gly Lys Met Phe Ile Gly Gly Leu Ser Trp Asp Thr Ser
145 150 155 160
Lys Lys Asp Leu Thr Glu Tyr Leu Ser Arg Phe Gly Glu Val Val Asp
165 170 175
Cys Thr Ile Lys Thr Asp Pro Val Thr Gly Arg Ser Arg Gly Phe Gly
180 185 190
Phe Val Leu Phe Lys Asp Ala Ala Ser Val Asp Lys Val Leu Glu Leu
195 200 205
Lys Glu His Lys Leu Asp Gly Lys Leu Ile Asp Pro Lys Arg Ala Lys
210 215 220
Ala Leu Lys Gly Lys Glu Pro Pro Lys Lys Val Phe Val Gly Gly Leu
225 230 235 240
Ser Pro Asp Thr Ser Glu Glu Gln Ile Lys Glu Tyr Phe Gly Ala Phe
245 250 255
Gly Glu Ile Glu Asn Ile Glu Leu Pro Met Asp Thr Lys Thr Asn Glu
260 265 270
Arg Arg Gly Phe Cys Phe Ile Thr Tyr Thr Asp Glu Glu Pro Val Lys
275 280 285
Lys Leu Leu Glu Ser Arg Tyr His Gln Ile Gly Ser Gly Lys Cys Glu
290 295 300
Ile Lys Val Ala Gln Pro Lys Glu Val Tyr Arg Gln Gln Gln Gln Gln
305 310 315 320
Gln Lys Gly Gly Arg Gly Ala Ala Ala Gly Gly Arg Gly Gly Thr Arg
325 330 335
Gly Arg Gly Arg Gly Gln Gln Ser Thr Tyr Gly Lys Ala Ser Arg Gly
340 345 350
Gly Gly Asn His Gln Asn Asn Tyr Gln Pro Tyr
355 360
<210> 60
<211> 3986
<212> DNA
<213> Homo sapiens
<400> 60
gaggccgcgc ggggcccggg cttcggccga tcagcccggg aggccccgcc gcgccccctt 60
ggcccgcgcg cccgtggtca cagtggaaga ggcgcccgcg ctgcgctgcc cggaggagcc 120
gtcgcgcgcc cgcttcctgt tcggctggtt cctgccagct cgaggacaaa acacgcgtgc 180
gcgcggcggg cgagcgcgct cgccgcctca gtcgccagcg ccgggcgcag tccgcctttt 240
tccggagcag actggccgcg gtgctagtcg gtagcagcgg ccgccgcagc ggctccgcac 300
tggcgaaccg agggcagaaa aaggcggggt tgacggcttt ttggtaggag tgggctggac 360
cggacgccag agacaaaggc tcccaaggca agagggactg tggccctgcg tcggctctgc 420
tcgggactgc tgaccccagg aatttacgcc ccttcgtttt tctcttctga ttcttctctt 480
ctcccaagcc cgcgtcccct cacgcgtggc ctctctcctt gccgggaggg ccgcgatgga 540
ggtcccgccc aggctttccc atgtgccgcc gccattgttc ccctccgctc ccgctacttt 600
agcctcccgc agcctctccc attggcggcc gcggccgccg cggcagctag ccccgctcct 660
cccttcgctc gctcccagct ccgcccggca gggggcgcgc cgggcccagc gccacgtcac 720
cgcccagcag ccctcccgat tggcgggcgg ggcggctata aagggagggc gcaggcggcg 780
cccggatctc ttccgccgcc attttaaatc cagctccata caacgctccg ccgccgctgc 840
tgccgcgacc cggactgcgc gccagcaccc ccctgccgac agctccgtca ctatggagga 900
tatgaacgag tacagcaata tagaggaatt cgcagaggga tccaagatca acgcgagcaa 960
gaatcagcag gatgacggta aaatgtttat tggaggcttg agctgggata caagcaaaaa 1020
agatctgaca gagtacttgt ctcgatttgg ggaagttgta gactgcacaa ttaaaacaga 1080
tccagtcact gggagatcaa gaggatttgg atttgtgctt ttcaaagatg ctgctagtgt 1140
tgataaggtt ttggaactga aagaacacaa actggatggc aaattgatag atcccaaaag 1200
ggccaaagct ttaaaaggga aagaacctcc caaaaaggtt tttgtgggtg gattgagccc 1260
ggatacttct gaagaacaaa ttaaagaata ttttggagcc tttggagaga ttgaaaatat 1320
tgaacttccc atggatacaa aaacaaatga aagaagagga ttttgtttta tcacatatac 1380
tgatgaagag ccagtaaaaa aattgttaga aagcagatac catcaaattg gttctgggaa 1440
gtgtgaaatc aaagttgcac aacccaaaga ggtatatagg cagcaacagc aacaacaaaa 1500
aggtggaaga ggtgctgcag ctggtggacg aggtggtacg aggggtcgtg gccgaggcca 1560
acagagcact tatggcaagg catctcgagg gggtggcaat caccaaaaca attaccagcc 1620
atactaaagg agaacattgg agaaaacagg aggagatgtt aaagtaaccc atcttgcagg 1680
acgacattga agattggtct tctgttgatc taagatgatt attttgtaaa agactttcta 1740
gtgtacaaga caccattgtg tccaactgta tatagctgcc aattagtttt ctttgttttt 1800
actttgtcct ttgctatctg tgttatgact caatgtggat ttgtttatac acattttatt 1860
tgtatcattt catgttaaac ctcaaataaa tgcttcctta tgtgattgct tttctgcgtc 1920
aggtactaca tagctctgta aaaaatgtaa tttaaaataa gcaataatta aggcacagtt 1980
gattttgtag agtattggtc catacagaga aactgtggtc ctttataaat agccagccag 2040
cgtcaccctc ttctccaatt tgtaggtgta ttttatgctc ttaaggcttc atcttctccc 2100
tgtaactgag atttctacca cacctttgaa caatgttctt tcccttctgg ttatctgaag 2160
actgtcctga aaggaagaca taagtgttgt gattagtaga agctttctag tagaccatat 2220
ttcttctgga ttgtaataaa attgttagta gctcctttta ctttgttcct gtctctggaa 2280
agccattttt gaattgctga ttactttggc tttaatcagt ggtcacctag aaaaagcttt 2340
gtaatcataa cacaatgagt aattcttgat aaaagttcag atacaaaagg agcactgtaa 2400
aactggtagg agctatggtt taagagcatt ggaagtagtt acaactcaag gattttggta 2460
gaaaggtatg agtttggtcg aaaaattaaa atagtggcaa aataagattt agttgtgttt 2520
tctcagagcc gccacaagat tgaacaaaat gttttctgtt tgggcatcct gaggaagttg 2580
tattagctgt taatgctctg tgagtttaga aaaagtcttg atagtaaatc tagtttttga 2640
cacagtgcat gaactaagta gttaaatatt tacatattca gaaaggaata gtggaaaagg 2700
tatcttggtt atgacaaagt cattacaaat gtgactaagt cattacaaat gtgactgagt 2760
cattacagtg gaccctctgg gtgcattgaa aagaatccgt tttatatcca ggtttcagag 2820
gacctggaat aataaaaagc tttggatttt gcattcagtg tagttggatt ttgggacctt 2880
ggcctcagtg ttatttactg ggattggcat acgtgttcac aggcagagta gttgatctca 2940
cacaacgggt gatctcacaa aactggtaag tttcttatgc tcatgagccc tccctttttt 3000
tttttaattt ggtgcctgca actttcttaa caatgattct acttcctggg ctatcacatt 3060
ataatgctct tggcctcttt tttgctgctg ttttgctatt cttaaactta ggccaagtac 3120
caatgttggc tgttagaagg gattctgttc attcaacatg caactttagg gaatggaagt 3180
aagttcattt ttaagttgtg ttgtcagtag gtgcggtgtc tagggtagtg aatcctgtaa 3240
gttcaaattt atgattaggt gacgagttga cattgagatt gtccttttcc ctgatcaaaa 3300
aatgaataaa gcctttttaa acaaaatcca aacttttaat caagtcttga tatgtatgac 3360
tgagaaaaaa tacactacat ctagagatga ttgagatgtt ttgcaaagaa ttgaaggggg 3420
agtgagaatt ggtttttctt gcaggggctt tgaactctag atttgggctt tgaactctag 3480
atttaattca gatttcaggg tctatcagtt caccaactga tgcaaatttg aacagatact 3540
ctaaggctaa gtgtcctagg ttggatgaac tgaagctact atcaagatct cgttcccaag 3600
gattaattta gaacaaagta attggacaag tttattgggg aggggataga aatgaattct 3660
aaagtaccta taacaaatac tctgtgtatg ttttttacat cgtatttgcc ttttacattg 3720
tttagaccaa attctgtgtg atgttatcct cgggaagagg atagaaatta attctaaagt 3780
acctataaca aatgctcggt ttgtatatgt ttttatacat cgtatttgcc ttttgcattg 3840
ttcagaccaa attctgtgtg atgttatcct aacaaaacac cttagtaatt tctttggtta 3900
acatgttaat ctgtaatctc acttttataa gatgaggact attaaaatga gatgtctgtt 3960
gggatgctaa aaaaaaaaaa aaaaaa 3986
<210> 61
<211> 420
<212> PRT
<213> Homo sapiens
<400> 61
Met Glu Val Pro Pro Arg Leu Ser His Val Pro Pro Pro Leu Phe Pro
1 5 10 15
Ser Ala Pro Ala Thr Leu Ala Ser Arg Ser Leu Ser His Trp Arg Pro
20 25 30
Arg Pro Pro Arg Gln Leu Ala Pro Leu Leu Pro Ser Leu Ala Pro Ser
35 40 45
Ser Ala Arg Gln Gly Ala Arg Arg Ala Gln Arg His Val Thr Ala Gln
50 55 60
Gln Pro Ser Arg Leu Ala Gly Gly Ala Ala Ile Lys Gly Gly Arg Arg
65 70 75 80
Arg Arg Pro Asp Leu Phe Arg Arg His Phe Lys Ser Ser Ser Ile Gln
85 90 95
Arg Ser Ala Ala Ala Ala Ala Ala Thr Arg Thr Ala Arg Gln His Pro
100 105 110
Pro Ala Asp Ser Ser Val Thr Met Glu Asp Met Asn Glu Tyr Ser Asn
115 120 125
Ile Glu Glu Phe Ala Glu Gly Ser Lys Ile Asn Ala Ser Lys Asn Gln
130 135 140
Gln Asp Asp Gly Lys Met Phe Ile Gly Gly Leu Ser Trp Asp Thr Ser
145 150 155 160
Lys Lys Asp Leu Thr Glu Tyr Leu Ser Arg Phe Gly Glu Val Val Asp
165 170 175
Cys Thr Ile Lys Thr Asp Pro Val Thr Gly Arg Ser Arg Gly Phe Gly
180 185 190
Phe Val Leu Phe Lys Asp Ala Ala Ser Val Asp Lys Val Leu Glu Leu
195 200 205
Lys Glu His Lys Leu Asp Gly Lys Leu Ile Asp Pro Lys Arg Ala Lys
210 215 220
Ala Leu Lys Gly Lys Glu Pro Pro Lys Lys Val Phe Val Gly Gly Leu
225 230 235 240
Ser Pro Asp Thr Ser Glu Glu Gln Ile Lys Glu Tyr Phe Gly Ala Phe
245 250 255
Gly Glu Ile Glu Asn Ile Glu Leu Pro Met Asp Thr Lys Thr Asn Glu
260 265 270
Arg Arg Gly Phe Cys Phe Ile Thr Tyr Thr Asp Glu Glu Pro Val Lys
275 280 285
Lys Leu Leu Glu Ser Arg Tyr His Gln Ile Gly Ser Gly Lys Cys Glu
290 295 300
Ile Lys Val Ala Gln Pro Lys Glu Val Tyr Arg Gln Gln Gln Gln Gln
305 310 315 320
Gln Lys Gly Gly Arg Gly Ala Ala Ala Gly Gly Arg Gly Gly Thr Arg
325 330 335
Gly Arg Gly Arg Gly Gln Gly Gln Asn Trp Asn Gln Gly Phe Asn Asn
340 345 350
Tyr Tyr Asp Gln Gly Tyr Gly Asn Tyr Asn Ser Ala Tyr Gly Gly Asp
355 360 365
Gln Asn Tyr Ser Gly Tyr Gly Gly Tyr Asp Tyr Thr Gly Tyr Asn Tyr
370 375 380
Gly Asn Tyr Gly Tyr Gly Gln Gly Tyr Ala Asp Tyr Ser Gly Gln Gln
385 390 395 400
Ser Thr Tyr Gly Lys Ala Ser Arg Gly Gly Gly Asn His Gln Asn Asn
405 410 415
Tyr Gln Pro Tyr
420
<210> 62
<211> 4157
<212> DNA
<213> Homo sapiens
<400> 62
gaggccgcgc ggggcccggg cttcggccga tcagcccggg aggccccgcc gcgccccctt 60
ggcccgcgcg cccgtggtca cagtggaaga ggcgcccgcg ctgcgctgcc cggaggagcc 120
gtcgcgcgcc cgcttcctgt tcggctggtt cctgccagct cgaggacaaa acacgcgtgc 180
gcgcggcggg cgagcgcgct cgccgcctca gtcgccagcg ccgggcgcag tccgcctttt 240
tccggagcag actggccgcg gtgctagtcg gtagcagcgg ccgccgcagc ggctccgcac 300
tggcgaaccg agggcagaaa aaggcggggt tgacggcttt ttggtaggag tgggctggac 360
cggacgccag agacaaaggc tcccaaggca agagggactg tggccctgcg tcggctctgc 420
tcgggactgc tgaccccagg aatttacgcc ccttcgtttt tctcttctga ttcttctctt 480
ctcccaagcc cgcgtcccct cacgcgtggc ctctctcctt gccgggaggg ccgcgatgga 540
ggtcccgccc aggctttccc atgtgccgcc gccattgttc ccctccgctc ccgctacttt 600
agcctcccgc agcctctccc attggcggcc gcggccgccg cggcagctag ccccgctcct 660
cccttcgctc gctcccagct ccgcccggca gggggcgcgc cgggcccagc gccacgtcac 720
cgcccagcag ccctcccgat tggcgggcgg ggcggctata aagggagggc gcaggcggcg 780
cccggatctc ttccgccgcc attttaaatc cagctccata caacgctccg ccgccgctgc 840
tgccgcgacc cggactgcgc gccagcaccc ccctgccgac agctccgtca ctatggagga 900
tatgaacgag tacagcaata tagaggaatt cgcagaggga tccaagatca acgcgagcaa 960
gaatcagcag gatgacggta aaatgtttat tggaggcttg agctgggata caagcaaaaa 1020
agatctgaca gagtacttgt ctcgatttgg ggaagttgta gactgcacaa ttaaaacaga 1080
tccagtcact gggagatcaa gaggatttgg atttgtgctt ttcaaagatg ctgctagtgt 1140
tgataaggtt ttggaactga aagaacacaa actggatggc aaattgatag atcccaaaag 1200
ggccaaagct ttaaaaggga aagaacctcc caaaaaggtt tttgtgggtg gattgagccc 1260
ggatacttct gaagaacaaa ttaaagaata ttttggagcc tttggagaga ttgaaaatat 1320
tgaacttccc atggatacaa aaacaaatga aagaagagga ttttgtttta tcacatatac 1380
tgatgaagag ccagtaaaaa aattgttaga aagcagatac catcaaattg gttctgggaa 1440
gtgtgaaatc aaagttgcac aacccaaaga ggtatatagg cagcaacagc aacaacaaaa 1500
aggtggaaga ggtgctgcag ctggtggacg aggtggtacg aggggtcgtg gccgaggtca 1560
gggccaaaac tggaaccaag gatttaataa ctattatgat caaggatatg gaaattacaa 1620
tagtgcctat ggtggtgatc aaaactatag tggctatggc ggatatgatt atactgggta 1680
taactatggg aactatggat atggacaggg atatgcagac tacagtggcc aacagagcac 1740
ttatggcaag gcatctcgag ggggtggcaa tcaccaaaac aattaccagc catactaaag 1800
gagaacattg gagaaaacag gaggagatgt taaagtaacc catcttgcag gacgacattg 1860
aagattggtc ttctgttgat ctaagatgat tattttgtaa aagactttct agtgtacaag 1920
acaccattgt gtccaactgt atatagctgc caattagttt tctttgtttt tactttgtcc 1980
tttgctatct gtgttatgac tcaatgtgga tttgtttata cacattttat ttgtatcatt 2040
tcatgttaaa cctcaaataa atgcttcctt atgtgattgc ttttctgcgt caggtactac 2100
atagctctgt aaaaaatgta atttaaaata agcaataatt aaggcacagt tgattttgta 2160
gagtattggt ccatacagag aaactgtggt cctttataaa tagccagcca gcgtcaccct 2220
cttctccaat ttgtaggtgt attttatgct cttaaggctt catcttctcc ctgtaactga 2280
gatttctacc acacctttga acaatgttct ttcccttctg gttatctgaa gactgtcctg 2340
aaaggaagac ataagtgttg tgattagtag aagctttcta gtagaccata tttcttctgg 2400
attgtaataa aattgttagt agctcctttt actttgttcc tgtctctgga aagccatttt 2460
tgaattgctg attactttgg ctttaatcag tggtcaccta gaaaaagctt tgtaatcata 2520
acacaatgag taattcttga taaaagttca gatacaaaag gagcactgta aaactggtag 2580
gagctatggt ttaagagcat tggaagtagt tacaactcaa ggattttggt agaaaggtat 2640
gagtttggtc gaaaaattaa aatagtggca aaataagatt tagttgtgtt ttctcagagc 2700
cgccacaaga ttgaacaaaa tgttttctgt ttgggcatcc tgaggaagtt gtattagctg 2760
ttaatgctct gtgagtttag aaaaagtctt gatagtaaat ctagtttttg acacagtgca 2820
tgaactaagt agttaaatat ttacatattc agaaaggaat agtggaaaag gtatcttggt 2880
tatgacaaag tcattacaaa tgtgactaag tcattacaaa tgtgactgag tcattacagt 2940
ggaccctctg ggtgcattga aaagaatccg ttttatatcc aggtttcaga ggacctggaa 3000
taataaaaag ctttggattt tgcattcagt gtagttggat tttgggacct tggcctcagt 3060
gttatttact gggattggca tacgtgttca caggcagagt agttgatctc acacaacggg 3120
tgatctcaca aaactggtaa gtttcttatg ctcatgagcc ctcccttttt ttttttaatt 3180
tggtgcctgc aactttctta acaatgattc tacttcctgg gctatcacat tataatgctc 3240
ttggcctctt ttttgctgct gttttgctat tcttaaactt aggccaagta ccaatgttgg 3300
ctgttagaag ggattctgtt cattcaacat gcaactttag ggaatggaag taagttcatt 3360
tttaagttgt gttgtcagta ggtgcggtgt ctagggtagt gaatcctgta agttcaaatt 3420
tatgattagg tgacgagttg acattgagat tgtccttttc cctgatcaaa aaatgaataa 3480
agccttttta aacaaaatcc aaacttttaa tcaagtcttg atatgtatga ctgagaaaaa 3540
atacactaca tctagagatg attgagatgt tttgcaaaga attgaagggg gagtgagaat 3600
tggtttttct tgcaggggct ttgaactcta gatttgggct ttgaactcta gatttaattc 3660
agatttcagg gtctatcagt tcaccaactg atgcaaattt gaacagatac tctaaggcta 3720
agtgtcctag gttggatgaa ctgaagctac tatcaagatc tcgttcccaa ggattaattt 3780
agaacaaagt aattggacaa gtttattggg gaggggatag aaatgaattc taaagtacct 3840
ataacaaata ctctgtgtat gttttttaca tcgtatttgc cttttacatt gtttagacca 3900
aattctgtgt gatgttatcc tcgggaagag gatagaaatt aattctaaag tacctataac 3960
aaatgctcgg tttgtatatg tttttataca tcgtatttgc cttttgcatt gttcagacca 4020
aattctgtgt gatgttatcc taacaaaaca ccttagtaat ttctttggtt aacatgttaa 4080
tctgtaatct cacttttata agatgaggac tattaaaatg agatgtctgt tgggatgcta 4140
aaaaaaaaaa aaaaaaa 4157
<210> 63
<211> 679
<212> PRT
<213> Homo sapiens
<400> 63
Met Ile Ser Ala Ser Arg Ala Ala Ala Ala Arg Leu Val Gly Ala Ala
1 5 10 15
Ala Ser Arg Gly Pro Thr Ala Ala Arg His Gln Asp Ser Trp Asn Gly
20 25 30
Leu Ser His Glu Ala Phe Arg Leu Val Ser Arg Arg Asp Tyr Ala Ser
35 40 45
Glu Ala Ile Lys Gly Ala Val Val Gly Ile Asp Leu Gly Thr Thr Asn
50 55 60
Ser Cys Val Ala Val Met Glu Gly Lys Gln Ala Lys Val Leu Glu Asn
65 70 75 80
Ala Glu Gly Ala Arg Thr Thr Pro Ser Val Val Ala Phe Thr Ala Asp
85 90 95
Gly Glu Arg Leu Val Gly Met Pro Ala Lys Arg Gln Ala Val Thr Asn
100 105 110
Pro Asn Asn Thr Phe Tyr Ala Thr Lys Arg Leu Ile Gly Arg Arg Tyr
115 120 125
Asp Asp Pro Glu Val Gln Lys Asp Ile Lys Asn Val Pro Phe Lys Ile
130 135 140
Val Arg Ala Ser Asn Gly Asp Ala Trp Val Glu Ala His Gly Lys Leu
145 150 155 160
Tyr Ser Pro Ser Gln Ile Gly Ala Phe Val Leu Met Lys Met Lys Glu
165 170 175
Thr Ala Glu Asn Tyr Leu Gly His Thr Ala Lys Asn Ala Val Ile Thr
180 185 190
Val Pro Ala Tyr Phe Asn Asp Ser Gln Arg Gln Ala Thr Lys Asp Ala
195 200 205
Gly Gln Ile Ser Gly Leu Asn Val Leu Arg Val Ile Asn Glu Pro Thr
210 215 220
Ala Ala Ala Leu Ala Tyr Gly Leu Asp Lys Ser Glu Asp Lys Val Ile
225 230 235 240
Ala Val Tyr Asp Leu Gly Gly Gly Thr Phe Asp Ile Ser Ile Leu Glu
245 250 255
Ile Gln Lys Gly Val Phe Glu Val Lys Ser Thr Asn Gly Asp Thr Phe
260 265 270
Leu Gly Gly Glu Asp Phe Asp Gln Ala Leu Leu Arg His Ile Val Lys
275 280 285
Glu Phe Lys Arg Glu Thr Gly Val Asp Leu Thr Lys Asp Asn Met Ala
290 295 300
Leu Gln Arg Val Arg Glu Ala Ala Glu Lys Ala Lys Cys Glu Leu Ser
305 310 315 320
Ser Ser Val Gln Thr Asp Ile Asn Leu Pro Tyr Leu Thr Met Asp Ser
325 330 335
Ser Gly Pro Lys His Leu Asn Met Lys Leu Thr Arg Ala Gln Phe Glu
340 345 350
Gly Ile Val Thr Asp Leu Ile Arg Arg Thr Ile Ala Pro Cys Gln Lys
355 360 365
Ala Met Gln Asp Ala Glu Val Ser Lys Ser Asp Ile Gly Glu Val Ile
370 375 380
Leu Val Gly Gly Met Thr Arg Met Pro Lys Val Gln Gln Thr Val Gln
385 390 395 400
Asp Leu Phe Gly Arg Ala Pro Ser Lys Ala Val Asn Pro Asp Glu Ala
405 410 415
Val Ala Ile Gly Ala Ala Ile Gln Gly Gly Val Leu Ala Gly Asp Val
420 425 430
Thr Asp Val Leu Leu Leu Asp Val Thr Pro Leu Ser Leu Gly Ile Glu
435 440 445
Thr Leu Gly Gly Val Phe Thr Lys Leu Ile Asn Arg Asn Thr Thr Ile
450 455 460
Pro Thr Lys Lys Ser Gln Val Phe Ser Thr Ala Ala Asp Gly Gln Thr
465 470 475 480
Gln Val Glu Ile Lys Val Cys Gln Gly Glu Arg Glu Met Ala Gly Asp
485 490 495
Asn Lys Leu Leu Gly Gln Phe Thr Leu Ile Gly Ile Pro Pro Ala Pro
500 505 510
Arg Gly Val Pro Gln Ile Glu Val Thr Phe Asp Ile Asp Ala Asn Gly
515 520 525
Ile Val His Val Ser Ala Lys Asp Lys Gly Thr Gly Arg Glu Gln Gln
530 535 540
Ile Val Ile Gln Ser Ser Gly Gly Leu Ser Lys Asp Asp Ile Glu Asn
545 550 555 560
Met Val Lys Asn Ala Glu Lys Tyr Ala Glu Glu Asp Arg Arg Lys Lys
565 570 575
Glu Arg Val Glu Ala Val Asn Met Ala Glu Gly Ile Ile His Asp Thr
580 585 590
Glu Thr Lys Met Glu Glu Phe Lys Asp Gln Leu Pro Ala Asp Glu Cys
595 600 605
Asn Lys Leu Lys Glu Glu Ile Ser Lys Met Arg Glu Leu Leu Ala Arg
610 615 620
Lys Asp Ser Glu Thr Gly Glu Asn Ile Arg Gln Ala Ala Ser Ser Leu
625 630 635 640
Gln Gln Ala Ser Leu Lys Leu Phe Glu Met Ala Tyr Lys Lys Met Ala
645 650 655
Ser Glu Arg Glu Gly Ser Gly Ser Ser Gly Thr Gly Glu Gln Lys Glu
660 665 670
Asp Gln Lys Glu Glu Lys Gln
675
<210> 64
<211> 3506
<212> DNA
<213> Homo sapiens
<400> 64
ttcctcccct ggactctttc tgagctcaga gccgccgcag ccgggacagg agggcaggct 60
ttctccaacc atcatgctgc ggagcatatt acctgtacgc cctggctccg ggagcggcag 120
tcgagtatcc tctggtcagg cggcgcgggc ggcgcctcag cggaagagcg ggcctctggg 180
ccgcagtgac caacccccgc ccctcacccc acgtggttgg aggtttccag aagcgctgcc 240
gccaccgcat cgcgcagctc tttgccgtcg gagcgcttgt ttgctgcctc gtactcctcc 300
atttatccgc catgataagt gccagccgag ctgcagcagc ccgtctcgtg ggcgccgcag 360
cctcccgggg ccctacggcc gcccgccacc aggatagctg gaatggcctt agtcatgagg 420
cttttagact tgtttcaagg cgggattatg catcagaagc aatcaaggga gcagttgttg 480
gtattgattt gggtactacc aactcctgcg tggcagttat ggaaggtaaa caagcaaagg 540
tgctggagaa tgccgaaggt gccagaacca ccccttcagt tgtggccttt acagcagatg 600
gtgagcgact tgttggaatg ccggccaagc gacaggctgt caccaaccca aacaatacat 660
tttatgctac caagcgtctc attggccggc gatatgatga tcctgaagta cagaaagaca 720
ttaaaaatgt tccctttaaa attgtccgtg cctccaatgg tgatgcctgg gttgaggctc 780
atgggaaatt gtattctccg agtcagattg gagcatttgt gttgatgaag atgaaagaga 840
ctgcagaaaa ttacttgggg cacacagcaa aaaatgctgt gatcacagtc ccagcttatt 900
tcaatgactc gcagagacag gccactaaag atgctggcca gatatctgga ctgaatgtgc 960
ttcgggtgat taatgagccc acagctgctg ctcttgccta tggtctagac aaatcagaag 1020
acaaagtcat tgctgtatat gatttaggtg gtggaacttt tgatatttct atcctggaaa 1080
ttcagaaagg agtatttgag gtgaaatcca caaatgggga taccttctta ggtggggaag 1140
actttgacca ggccttgcta cggcacattg tgaaggagtt caagagagag acaggggttg 1200
atttgactaa agacaacatg gcacttcaga gggtacggga agctgctgaa aaggctaaat 1260
gtgaactctc ctcatctgtg cagactgaca tcaatttgcc ctatcttaca atggattctt 1320
ctggacccaa gcatttgaat atgaagttga cccgtgctca atttgaaggg attgtcactg 1380
atctaatcag aaggactatc gctccatgcc aaaaagctat gcaagatgca gaagtcagca 1440
agagtgacat aggagaagtg attcttgtgg gtggcatgac taggatgccc aaggttcagc 1500
agactgtaca ggatcttttt ggcagagccc caagtaaagc tgtcaatcct gatgaggctg 1560
tggccattgg agctgccatt cagggaggtg tgttggccgg cgatgtcacg gatgtgctgc 1620
tccttgatgt cactcccctg tctctgggta ttgaaactct aggaggtgtc tttaccaaac 1680
ttattaatag gaataccact attccaacca agaagagcca ggtattctct actgccgctg 1740
atggtcaaac gcaagtggaa attaaagtgt gtcagggtga aagagagatg gctggagaca 1800
acaaactcct tggacagttt actttgattg gaattccacc agcccctcgt ggagttcctc 1860
agattgaagt tacatttgac attgatgcca atgggatagt acatgtttct gctaaagata 1920
aaggcacagg acgtgagcag cagattgtaa tccagtcttc tggtggatta agcaaagatg 1980
atattgaaaa tatggttaaa aatgcagaga aatatgctga agaagaccgg cgaaagaagg 2040
aacgagttga agcagttaat atggctgaag gaatcattca cgacacagaa accaagatgg 2100
aagaattcaa ggaccaatta cctgctgatg agtgcaacaa gctgaaagaa gagatttcca 2160
aaatgaggga gctcctggct agaaaagaca gcgaaacagg agaaaatatt agacaggcag 2220
catcctctct tcagcaggca tcactgaagc tgttcgaaat ggcatacaaa aagatggcat 2280
ctgagcgaga aggctctgga agttctggca ctggggaaca aaaggaagat caaaaggagg 2340
aaaaacagta ataatagcag aaattttgaa gccagaagga caacatatga agcttaggag 2400
tgaagagact tcctgagcag aaatgggcga acttcagtct ttttactgtg tttttgcagt 2460
attctatata taatttcctt aatttgtaaa tttagtgacc attagctagt gatcatttaa 2520
tggacagtga ttctaacagt ataaagttca caatattcta tgtccctagc ctgtcatttt 2580
tcagctgcat gtaaaaggag gtaggatgaa ttgatcatta taaagattta actattttat 2640
gctgaagtga ccatattttc aaggggtgaa accatctcgc acacagcaat gaaggtagtc 2700
atccatagac ttgaaatgag accacatatg gggatgagat ccttctagtt agcctagtac 2760
tgctgtactg gcctgtatgt acatggggtc cttcaactga ggccttgcaa gtcaagctgg 2820
ctgtgccatg tttgtagatg gggcagagga atctagaaca atgggaaact tagctattta 2880
tattaggtac agctattaaa acaaggtagg aatgaggcta gacctttaac ttccctaagg 2940
catacttttc tagctacctt ctgccctgtg tctggcacct acatccttga tgattgttct 3000
cttacccatt ctggaatttt ttttttttta aataaataca gaaagcatct tgatctcttg 3060
tttgtgaggg gtgatgccct gagatttagc ttcaagaata tgccatggct catgcttccc 3120
atatttccca aagagggaaa tacaggattt gctaacactg gttaaaaatg caaattcaag 3180
atttggaagg gctgttataa tgaaataatg agcagtatca gcatgtgcaa atcttgtttg 3240
aaggatttta ttttctcccc ttagaccttt ggtacattta gaatcttgaa agtttctaga 3300
tctctaacat gaaagtttct agatctctaa catgaaagtt tttagatctc taacatgaaa 3360
accaaggtgg ctattttcag gttgctttca gctccaagta gaaataacca gaattggctt 3420
acattaaaga aactgcatct agaaataagt cctaagatac tatttctatg gctcaaaaat 3480
aaaaggaacc cagatttctt tcccta 3506
<210> 65
<211> 400
<212> PRT
<213> Homo sapiens
<400> 65
Met Leu Ala Arg Arg Lys Pro Val Leu Pro Ala Leu Thr Ile Asn Pro
1 5 10 15
Thr Ile Ala Glu Gly Pro Ser Pro Thr Ser Glu Gly Ala Ser Glu Ala
20 25 30
Asn Leu Val Asp Leu Gln Lys Lys Leu Glu Glu Leu Glu Leu Asp Glu
35 40 45
Gln Gln Lys Lys Arg Leu Glu Ala Phe Leu Thr Gln Lys Ala Lys Val
50 55 60
Gly Glu Leu Lys Asp Asp Asp Phe Glu Arg Ile Ser Glu Leu Gly Ala
65 70 75 80
Gly Asn Gly Gly Val Val Thr Lys Val Gln His Arg Pro Ser Gly Leu
85 90 95
Ile Met Ala Arg Lys Leu Ile His Leu Glu Ile Lys Pro Ala Ile Arg
100 105 110
Asn Gln Ile Ile Arg Glu Leu Gln Val Leu His Glu Cys Asn Ser Pro
115 120 125
Tyr Ile Val Gly Phe Tyr Gly Ala Phe Tyr Ser Asp Gly Glu Ile Ser
130 135 140
Ile Cys Met Glu His Met Asp Gly Gly Ser Leu Asp Gln Val Leu Lys
145 150 155 160
Glu Ala Lys Arg Ile Pro Glu Glu Ile Leu Gly Lys Val Ser Ile Ala
165 170 175
Val Leu Arg Gly Leu Ala Tyr Leu Arg Glu Lys His Gln Ile Met His
180 185 190
Arg Asp Val Lys Pro Ser Asn Ile Leu Val Asn Ser Arg Gly Glu Ile
195 200 205
Lys Leu Cys Asp Phe Gly Val Ser Gly Gln Leu Ile Asp Ser Met Ala
210 215 220
Asn Ser Phe Val Gly Thr Arg Ser Tyr Met Ala Pro Glu Arg Leu Gln
225 230 235 240
Gly Thr His Tyr Ser Val Gln Ser Asp Ile Trp Ser Met Gly Leu Ser
245 250 255
Leu Val Glu Leu Ala Val Gly Arg Tyr Pro Ile Pro Pro Pro Asp Ala
260 265 270
Lys Glu Leu Glu Ala Ile Phe Gly Arg Pro Val Val Asp Gly Glu Glu
275 280 285
Gly Glu Pro His Ser Ile Ser Pro Arg Pro Arg Pro Pro Gly Arg Pro
290 295 300
Val Ser Gly His Gly Met Asp Ser Arg Pro Ala Met Ala Ile Phe Glu
305 310 315 320
Leu Leu Asp Tyr Ile Val Asn Glu Pro Pro Pro Lys Leu Pro Asn Gly
325 330 335
Val Phe Thr Pro Asp Phe Gln Glu Phe Val Asn Lys Cys Leu Ile Lys
340 345 350
Asn Pro Ala Glu Arg Ala Asp Leu Lys Met Leu Thr Asn His Thr Phe
355 360 365
Ile Lys Arg Ser Glu Val Glu Glu Val Asp Phe Ala Gly Trp Leu Cys
370 375 380
Lys Thr Leu Arg Leu Asn Gln Pro Gly Thr Pro Thr Arg Thr Ala Val
385 390 395 400
<210> 66
<211> 1759
<212> DNA
<213> Homo sapiens
<400> 66
cccctgcctc tcggactcgg gctgcggcgt cagccttctt cgggcctcgg cagcggtagc 60
ggctcgctcg cctcagcccc agcgcccctc ggctaccctc ggcccaggcc cgcagcgccg 120
cccgccctcg gccgccccga cgccggcctg ggccgcggcc gcagccccgg gctcgcgtag 180
gcgccgaccg ctcccggccc gccccctatg ggccccggct agaggcgccg ccgccgccgg 240
cccgcggagc cccgatgctg gcccggagga agccggtgct gccggcgctc accatcaacc 300
ctaccatcgc cgagggccca tcccctacca gcgagggcgc ctccgaggca aacctggtgg 360
acctgcagaa gaagctggag gagctggaac ttgacgagca gcagaagaag cggctggaag 420
cctttctcac ccagaaagcc aaggtcggcg aactcaaaga cgatgacttc gaaaggatct 480
cagagctggg cgcgggcaac ggcggggtgg tcaccaaagt ccagcacaga ccctcgggcc 540
tcatcatggc caggaagctg atccaccttg agatcaagcc ggccatccgg aaccagatca 600
tccgcgagct gcaggtcctg cacgaatgca actcgccgta catcgtgggc ttctacgggg 660
ccttctacag tgacggggag atcagcattt gcatggaaca catggacggc ggctccctgg 720
accaggtgct gaaagaggcc aagaggattc ccgaggagat cctggggaaa gtcagcatcg 780
cggttctccg gggcttggcg tacctccgag agaagcacca gatcatgcac cgagatgtga 840
agccctccaa catcctcgtg aactctagag gggagatcaa gctgtgtgac ttcggggtga 900
gcggccagct catcgactcc atggccaact ccttcgtggg cacgcgctcc tacatggctc 960
cggagcggtt gcagggcaca cattactcgg tgcagtcgga catctggagc atgggcctgt 1020
ccctggtgga gctggccgtc ggaaggtacc ccatcccccc gcccgacgcc aaagagctgg 1080
aggccatctt tggccggccc gtggtcgacg gggaagaagg agagcctcac agcatctcgc 1140
ctcggccgag gccccccggg cgccccgtca gcggtcacgg gatggatagc cggcctgcca 1200
tggccatctt tgaactcctg gactatattg tgaacgagcc acctcctaag ctgcccaacg 1260
gtgtgttcac ccccgacttc caggagtttg tcaataaatg cctcatcaag aacccagcgg 1320
agcgggcgga cctgaagatg ctcacaaacc acaccttcat caagcggtcc gaggtggaag 1380
aagtggattt tgccggctgg ttgtgtaaaa ccctgcggct gaaccagccc ggcacaccca 1440
cgcgcaccgc cgtgtgacag tggccgggct ccctgcgtcc cgctggtgac ctgcccaccg 1500
tccctgtcca tgccccgccc ttccagctga ggacaggctg gcgcctccac ccaccctcct 1560
gcctcacccc tgcggagagc accgtggcgg ggcgacagcg catgcaggaa cgggggtctc 1620
ctctcctgcc cgtcctggcc ggggtgcctc tggggacggg cgacgctgct gtgtgtggtc 1680
tcagaggctc tgcttcctta ggttacaaaa caaaacaggg agagaaaaag caaaaaaaaa 1740
aaaaaaaaaa aaaaaaaaa 1759
<210> 67
<211> 274
<212> PRT
<213> Homo sapiens
<400> 67
Met Ala Thr Leu Lys Asp Gln Leu Ile Tyr Asn Leu Leu Lys Glu Glu
1 5 10 15
Gln Thr Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly
20 25 30
Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu
35 40 45
Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp
50 55 60
Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly
65 70 75 80
Lys Val Asp Ile Leu Thr Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro
85 90 95
Lys Asn Arg Val Ile Gly Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe
100 105 110
Arg Tyr Leu Met Gly Glu Arg Leu Gly Val His Pro Leu Ser Cys His
115 120 125
Gly Trp Val Leu Gly Glu His Gly Asp Ser Ser Val Pro Val Trp Ser
130 135 140
Gly Met Asn Val Ala Gly Val Ser Leu Lys Thr Leu His Pro Asp Leu
145 150 155 160
Gly Thr Asp Lys Asp Lys Glu Gln Trp Lys Glu Val His Lys Gln Val
165 170 175
Val Glu Ser Ala Tyr Glu Val Ile Lys Leu Lys Gly Tyr Thr Ser Trp
180 185 190
Ala Ile Gly Leu Ser Val Ala Asp Leu Ala Glu Ser Ile Met Lys Asn
195 200 205
Leu Arg Arg Val His Pro Val Ser Thr Met Ile Lys Gly Leu Tyr Gly
210 215 220
Ile Lys Asp Asp Val Phe Leu Ser Val Pro Cys Ile Leu Gly Gln Asn
225 230 235 240
Gly Ile Ser Asp Leu Val Lys Val Thr Leu Thr Ser Glu Glu Glu Ala
245 250 255
Arg Leu Lys Lys Ser Ala Asp Thr Leu Trp Gly Ile Gln Lys Glu Leu
260 265 270
Gln Phe
<210> 68
<211> 2052
<212> DNA
<213> Homo sapiens
<400> 68
gtctgccggt cggttgtctg gctgcgcgcg ccacccgggc ctctccagtg ccccgcctgg 60
ctcggcatcc acccccagcc cgactcacac gtgggttccc gcacgtccgc cggccccccc 120
cgctgacgtc agcatagctg ttccacttaa ggcccctccc gcgcccagct cagagtgctg 180
cagccgctgc cgccgattcc ggatctcatt gccacgcgcc cccgacgacc gcccgacgtg 240
cattcccgat tccttttggt tccaagtcca atatggcaac tctaaaggat cagctgattt 300
ataatcttct aaaggaagaa cagacccccc agaataagat tacagttgtt ggggttggtg 360
ctgttggcat ggcctgtgcc atcagtatct taatgaagga cttggcagat gaacttgctc 420
ttgttgatgt catcgaagac aaattgaagg gagagatgat ggatctccaa catggcagcc 480
ttttccttag aacaccaaag attgtctctg gcaaagtgga tatcttgacc tacgtggctt 540
ggaagataag tggttttccc aaaaaccgtg ttattggaag cggttgcaat ctggattcag 600
cccgattccg ttacctaatg ggggaaaggc tgggagttca cccattaagc tgtcatgggt 660
gggtccttgg ggaacatgga gattccagtg tgcctgtatg gagtggaatg aatgttgctg 720
gtgtctctct gaagactctg cacccagatt tagggactga taaagataag gaacagtgga 780
aagaggttca caagcaggtg gttgagagtg cttatgaggt gatcaaactc aaaggctaca 840
catcctgggc tattggactc tctgtagcag atttggcaga gagtataatg aagaatctta 900
ggcgggtgca cccagtttcc accatgatta agggtcttta cggaataaag gatgatgtct 960
tccttagtgt tccttgcatt ttgggacaga atggaatctc agaccttgtg aaggtgactc 1020
tgacttctga ggaagaggcc cgtttgaaga agagtgcaga tacactttgg gggatccaaa 1080
aggagctgca attttaaagt cttctgatgt catatcattt cactgtctag gctacaacag 1140
gattctaggt ggaggttgtg catgttgtcc tttttatctg atctgtgatt aaagcagtaa 1200
tattttaaga tggactggga aaaacatcaa ctcctgaagt tagaaataag aatggtttgt 1260
aaaatccaca gctatatcct gatgctggat ggtattaatc ttgtgtagtc ttcaactggt 1320
tagtgtgaaa tagttctgcc acctctgacg caccactgcc aatgctgtac gtactgcatt 1380
tgccccttga gccaggtgga tgtttaccgt gtgttatata acttcctggc tccttcactg 1440
aacatgccta gtccaacatt ttttcccagt gagtcacatc ctgggatcca gtgtataaat 1500
ccaatatcat gtcttgtgca taattcttcc aaaggatctt attttgtgaa ctatatcagt 1560
agtgtacatt accatataat gtaaaaagat ctacatacaa acaatgcaac caactatcca 1620
agtgttatac caactaaaac ccccaataaa ccttgaacag tgactacttt ggttaattca 1680
ttatattaag atataaagtc ataaagctgc tagttattat attaatttgg aaatattagg 1740
ctattcttgg gcaaccctgc aacgattttt tctaacaggg atattattga ctaatagcag 1800
aggatgtaat agtcaactga gttgtattgg taccacttcc attgtaagtc ccaaagtatt 1860
atatatttga taataatgct aatcataatt ggaaagtaac attctatatg taaatgtaaa 1920
atttatttgc caactgaata taggcaatga tagtgtgtca ctatagggaa cacagatttt 1980
tgagatcttg tcctctggaa gctggtaaca attaaaaaca atcttaaggc agggaaaaaa 2040
aaaaaaaaaa aa 2052
<210> 69
<211> 361
<212> PRT
<213> Homo sapiens
<400> 69
Met Gly Glu Pro Ser Gly Gly Tyr Thr Tyr Thr Gln Thr Ser Ile Phe
1 5 10 15
Leu Phe His Ala Lys Ile Pro Phe Gly Ser Lys Ser Asn Met Ala Thr
20 25 30
Leu Lys Asp Gln Leu Ile Tyr Asn Leu Leu Lys Glu Glu Gln Thr Pro
35 40 45
Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly Met Ala Cys
50 55 60
Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu Ala Leu Val
65 70 75 80
Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp Leu Gln His
85 90 95
Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly Lys Asp Tyr
100 105 110
Asn Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala Gly Ala Arg
115 120 125
Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg Asn Val Asn
130 135 140
Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser Pro Asn Cys
145 150 155 160
Lys Leu Leu Ile Val Ser Asn Pro Val Asp Ile Leu Thr Tyr Val Ala
165 170 175
Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly Ser Gly Cys
180 185 190
Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu Arg Leu Gly
195 200 205
Val His Pro Leu Ser Cys His Gly Trp Val Leu Gly Glu His Gly Asp
210 215 220
Ser Ser Val Pro Val Trp Ser Gly Met Asn Val Ala Gly Val Ser Leu
225 230 235 240
Lys Thr Leu His Pro Asp Leu Gly Thr Asp Lys Asp Lys Glu Gln Trp
245 250 255
Lys Glu Val His Lys Gln Val Val Glu Ser Ala Tyr Glu Val Ile Lys
260 265 270
Leu Lys Gly Tyr Thr Ser Trp Ala Ile Gly Leu Ser Val Ala Asp Leu
275 280 285
Ala Glu Ser Ile Met Lys Asn Leu Arg Arg Val His Pro Val Ser Thr
290 295 300
Met Ile Lys Gly Leu Tyr Gly Ile Lys Asp Asp Val Phe Leu Ser Val
305 310 315 320
Pro Cys Ile Leu Gly Gln Asn Gly Ile Ser Asp Leu Val Lys Val Thr
325 330 335
Leu Thr Ser Glu Glu Glu Ala Arg Leu Lys Lys Ser Ala Asp Thr Leu
340 345 350
Trp Gly Ile Gln Lys Glu Leu Gln Phe
355 360
<210> 70
<211> 2323
<212> DNA
<213> Homo sapiens
<400> 70
ttgggcgggg cgtaaaagcc gggcgttcgg aggacccagc aattagtctg atttccgccc 60
acctttccga gcgggaagga gagccacaaa gcgcgcatgc gcgcggatca ccgcaggctc 120
ctgtgccttg ggcttgagct ttgtggcagt taatggcttt tctgcacgta tctctggtgt 180
ttacttgaga agcctggctg tgtccttgct gtaggagccg gagtagctca gagtgatctt 240
gtctgaggaa aggccagccc cacttggggt taataaaccg cgatgggtga accctcagga 300
ggctatactt acacccaaac gtcgatattc cttttccacg ctaagattcc ttttggttcc 360
aagtccaata tggcaactct aaaggatcag ctgatttata atcttctaaa ggaagaacag 420
accccccaga ataagattac agttgttggg gttggtgctg ttggcatggc ctgtgccatc 480
agtatcttaa tgaaggactt ggcagatgaa cttgctcttg ttgatgtcat cgaagacaaa 540
ttgaagggag agatgatgga tctccaacat ggcagccttt tccttagaac accaaagatt 600
gtctctggca aagactataa tgtaactgca aactccaagc tggtcattat cacggctggg 660
gcacgtcagc aagagggaga aagccgtctt aatttggtcc agcgtaacgt gaacatcttt 720
aaattcatca ttcctaatgt tgtaaaatac agcccgaact gcaagttgct tattgtttca 780
aatccagtgg atatcttgac ctacgtggct tggaagataa gtggttttcc caaaaaccgt 840
gttattggaa gcggttgcaa tctggattca gcccgattcc gttacctaat gggggaaagg 900
ctgggagttc acccattaag ctgtcatggg tgggtccttg gggaacatgg agattccagt 960
gtgcctgtat ggagtggaat gaatgttgct ggtgtctctc tgaagactct gcacccagat 1020
ttagggactg ataaagataa ggaacagtgg aaagaggttc acaagcaggt ggttgagagt 1080
gcttatgagg tgatcaaact caaaggctac acatcctggg ctattggact ctctgtagca 1140
gatttggcag agagtataat gaagaatctt aggcgggtgc acccagtttc caccatgatt 1200
aagggtcttt acggaataaa ggatgatgtc ttccttagtg ttccttgcat tttgggacag 1260
aatggaatct cagaccttgt gaaggtgact ctgacttctg aggaagaggc ccgtttgaag 1320
aagagtgcag atacactttg ggggatccaa aaggagctgc aattttaaag tcttctgatg 1380
tcatatcatt tcactgtcta ggctacaaca ggattctagg tggaggttgt gcatgttgtc 1440
ctttttatct gatctgtgat taaagcagta atattttaag atggactggg aaaaacatca 1500
actcctgaag ttagaaataa gaatggtttg taaaatccac agctatatcc tgatgctgga 1560
tggtattaat cttgtgtagt cttcaactgg ttagtgtgaa atagttctgc cacctctgac 1620
gcaccactgc caatgctgta cgtactgcat ttgccccttg agccaggtgg atgtttaccg 1680
tgtgttatat aacttcctgg ctccttcact gaacatgcct agtccaacat tttttcccag 1740
tgagtcacat cctgggatcc agtgtataaa tccaatatca tgtcttgtgc ataattcttc 1800
caaaggatct tattttgtga actatatcag tagtgtacat taccatataa tgtaaaaaga 1860
tctacataca aacaatgcaa ccaactatcc aagtgttata ccaactaaaa cccccaataa 1920
accttgaaca gtgactactt tggttaattc attatattaa gatataaagt cataaagctg 1980
ctagttatta tattaatttg gaaatattag gctattcttg ggcaaccctg caacgatttt 2040
ttctaacagg gatattattg actaatagca gaggatgtaa tagtcaactg agttgtattg 2100
gtaccacttc cattgtaagt cccaaagtat tatatatttg ataataatgc taatcataat 2160
tggaaagtaa cattctatat gtaaatgtaa aatttatttg ccaactgaat ataggcaatg 2220
atagtgtgtc actataggga acacagattt ttgagatctt gtcctctgga agctggtaac 2280
aattaaaaac aatcttaagg cagggaaaaa aaaaaaaaaa aaa 2323
<210> 71
<211> 274
<212> PRT
<213> Homo sapiens
<400> 71
Met Ala Thr Leu Lys Asp Gln Leu Ile Tyr Asn Leu Leu Lys Glu Glu
1 5 10 15
Gln Thr Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly
20 25 30
Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu
35 40 45
Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp
50 55 60
Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly
65 70 75 80
Lys Asp Tyr Asn Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala
85 90 95
Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg
100 105 110
Asn Val Asn Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser
115 120 125
Pro Asn Cys Lys Leu Leu Ile Val Ser Asn Pro Val Asp Ile Leu Thr
130 135 140
Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly
145 150 155 160
Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu
165 170 175
Arg Leu Gly Val His Pro Leu Ser Cys His Gly Trp Val Leu Gly Glu
180 185 190
His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Met Asn Val Ala Gly
195 200 205
Val Ser Leu Lys Thr Leu His Pro Asp Leu Gly Thr Asp Lys Asp Lys
210 215 220
Glu Gln Trp Lys Glu Cys Arg Tyr Thr Leu Gly Asp Pro Lys Gly Ala
225 230 235 240
Ala Ile Leu Lys Ser Ser Asp Val Ile Ser Phe His Cys Leu Gly Tyr
245 250 255
Asn Arg Ile Leu Gly Gly Gly Cys Ala Cys Cys Pro Phe Tyr Leu Ile
260 265 270
Cys Asp
<210> 72
<211> 1957
<212> DNA
<213> Homo sapiens
<400> 72
gtctgccggt cggttgtctg gctgcgcgcg ccacccgggc ctctccagtg ccccgcctgg 60
ctcggcatcc acccccagcc cgactcacac gtgggttccc gcacgtccgc cggccccccc 120
cgctgacgtc agcatagctg ttccacttaa ggcccctccc gcgcccagct cagagtgctg 180
cagccgctgc cgccgattcc ggatctcatt gccacgcgcc cccgacgacc gcccgacgtg 240
cattcccgat tccttttggt tccaagtcca atatggcaac tctaaaggat cagctgattt 300
ataatcttct aaaggaagaa cagacccccc agaataagat tacagttgtt ggggttggtg 360
ctgttggcat ggcctgtgcc atcagtatct taatgaagga cttggcagat gaacttgctc 420
ttgttgatgt catcgaagac aaattgaagg gagagatgat ggatctccaa catggcagcc 480
ttttccttag aacaccaaag attgtctctg gcaaagacta taatgtaact gcaaactcca 540
agctggtcat tatcacggct ggggcacgtc agcaagaggg agaaagccgt cttaatttgg 600
tccagcgtaa cgtgaacatc tttaaattca tcattcctaa tgttgtaaaa tacagcccga 660
actgcaagtt gcttattgtt tcaaatccag tggatatctt gacctacgtg gcttggaaga 720
taagtggttt tcccaaaaac cgtgttattg gaagcggttg caatctggat tcagcccgat 780
tccgttacct aatgggggaa aggctgggag ttcacccatt aagctgtcat gggtgggtcc 840
ttggggaaca tggagattcc agtgtgcctg tatggagtgg aatgaatgtt gctggtgtct 900
ctctgaagac tctgcaccca gatttaggga ctgataaaga taaggaacag tggaaagagt 960
gcagatacac tttgggggat ccaaaaggag ctgcaatttt aaagtcttct gatgtcatat 1020
catttcactg tctaggctac aacaggattc taggtggagg ttgtgcatgt tgtccttttt 1080
atctgatctg tgattaaagc agtaatattt taagatggac tgggaaaaac atcaactcct 1140
gaagttagaa ataagaatgg tttgtaaaat ccacagctat atcctgatgc tggatggtat 1200
taatcttgtg tagtcttcaa ctggttagtg tgaaatagtt ctgccacctc tgacgcacca 1260
ctgccaatgc tgtacgtact gcatttgccc cttgagccag gtggatgttt accgtgtgtt 1320
atataacttc ctggctcctt cactgaacat gcctagtcca acattttttc ccagtgagtc 1380
acatcctggg atccagtgta taaatccaat atcatgtctt gtgcataatt cttccaaagg 1440
atcttatttt gtgaactata tcagtagtgt acattaccat ataatgtaaa aagatctaca 1500
tacaaacaat gcaaccaact atccaagtgt tataccaact aaaaccccca ataaaccttg 1560
aacagtgact actttggtta attcattata ttaagatata aagtcataaa gctgctagtt 1620
attatattaa tttggaaata ttaggctatt cttgggcaac cctgcaacga ttttttctaa 1680
cagggatatt attgactaat agcagaggat gtaatagtca actgagttgt attggtacca 1740
cttccattgt aagtcccaaa gtattatata tttgataata atgctaatca taattggaaa 1800
gtaacattct atatgtaaat gtaaaattta tttgccaact gaatataggc aatgatagtg 1860
tgtcactata gggaacacag atttttgaga tcttgtcctc tggaagctgg taacaattaa 1920
aaacaatctt aaggcaggga aaaaaaaaaa aaaaaaa 1957
<210> 73
<211> 241
<212> PRT
<213> Homo sapiens
<400> 73
Met Ala Thr Leu Lys Asp Gln Leu Ile Tyr Asn Leu Leu Lys Glu Glu
1 5 10 15
Gln Thr Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly
20 25 30
Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu
35 40 45
Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp
50 55 60
Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly
65 70 75 80
Lys Asp Tyr Asn Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala
85 90 95
Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg
100 105 110
Asn Val Asn Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser
115 120 125
Pro Asn Cys Lys Leu Leu Ile Val Ser Asn Pro Val Asp Ile Leu Thr
130 135 140
Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly
145 150 155 160
Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu
165 170 175
Arg Leu Gly Val His Pro Leu Ser Cys His Gly Trp Val Leu Gly Glu
180 185 190
His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Met Asn Val Ala Gly
195 200 205
Val Ser Leu Lys Thr Leu His Pro Asp Leu Gly Thr Asp Lys Asp Lys
210 215 220
Glu Gln Trp Lys Glu Val His Lys Gln Val Val Glu Arg Val Phe Thr
225 230 235 240
Glu
<210> 74
<211> 2102
<212> DNA
<213> Homo sapiens
<400> 74
gtctgccggt cggttgtctg gctgcgcgcg ccacccgggc ctctccagtg ccccgcctgg 60
ctcggcatcc acccccagcc cgactcacac gtgggttccc gcacgtccgc cggccccccc 120
cgctgacgtc agcatagctg ttccacttaa ggcccctccc gcgcccagct cagagtgctg 180
cagccgctgc cgccgattcc ggatctcatt gccacgcgcc cccgacgacc gcccgacgtg 240
cattcccgat tccttttggt tccaagtcca atatggcaac tctaaaggat cagctgattt 300
ataatcttct aaaggaagaa cagacccccc agaataagat tacagttgtt ggggttggtg 360
ctgttggcat ggcctgtgcc atcagtatct taatgaagga cttggcagat gaacttgctc 420
ttgttgatgt catcgaagac aaattgaagg gagagatgat ggatctccaa catggcagcc 480
ttttccttag aacaccaaag attgtctctg gcaaagacta taatgtaact gcaaactcca 540
agctggtcat tatcacggct ggggcacgtc agcaagaggg agaaagccgt cttaatttgg 600
tccagcgtaa cgtgaacatc tttaaattca tcattcctaa tgttgtaaaa tacagcccga 660
actgcaagtt gcttattgtt tcaaatccag tggatatctt gacctacgtg gcttggaaga 720
taagtggttt tcccaaaaac cgtgttattg gaagcggttg caatctggat tcagcccgat 780
tccgttacct aatgggggaa aggctgggag ttcacccatt aagctgtcat gggtgggtcc 840
ttggggaaca tggagattcc agtgtgcctg tatggagtgg aatgaatgtt gctggtgtct 900
ctctgaagac tctgcaccca gatttaggga ctgataaaga taaggaacag tggaaagagg 960
ttcacaagca ggtggttgag agggtcttta cggaataaag gatgatgtct tccttagtgt 1020
tccttgcatt ttgggacaga atggaatctc agaccttgtg aaggtgactc tgacttctga 1080
ggaagaggcc cgtttgaaga agagtgcaga tacactttgg gggatccaaa aggagctgca 1140
attttaaagt cttctgatgt catatcattt cactgtctag gctacaacag gattctaggt 1200
ggaggttgtg catgttgtcc tttttatctg atctgtgatt aaagcagtaa tattttaaga 1260
tggactggga aaaacatcaa ctcctgaagt tagaaataag aatggtttgt aaaatccaca 1320
gctatatcct gatgctggat ggtattaatc ttgtgtagtc ttcaactggt tagtgtgaaa 1380
tagttctgcc acctctgacg caccactgcc aatgctgtac gtactgcatt tgccccttga 1440
gccaggtgga tgtttaccgt gtgttatata acttcctggc tccttcactg aacatgccta 1500
gtccaacatt ttttcccagt gagtcacatc ctgggatcca gtgtataaat ccaatatcat 1560
gtcttgtgca taattcttcc aaaggatctt attttgtgaa ctatatcagt agtgtacatt 1620
accatataat gtaaaaagat ctacatacaa acaatgcaac caactatcca agtgttatac 1680
caactaaaac ccccaataaa ccttgaacag tgactacttt ggttaattca ttatattaag 1740
atataaagtc ataaagctgc tagttattat attaatttgg aaatattagg ctattcttgg 1800
gcaaccctgc aacgattttt tctaacaggg atattattga ctaatagcag aggatgtaat 1860
agtcaactga gttgtattgg taccacttcc attgtaagtc ccaaagtatt atatatttga 1920
taataatgct aatcataatt ggaaagtaac attctatatg taaatgtaaa atttatttgc 1980
caactgaata taggcaatga tagtgtgtca ctatagggaa cacagatttt tgagatcttg 2040
tcctctggaa gctggtaaca attaaaaaca atcttaaggc agggaaaaaa aaaaaaaaaa 2100
aa 2102
<210> 75
<211> 332
<212> PRT
<213> Homo sapiens
<400> 75
Met Ala Thr Leu Lys Asp Gln Leu Ile Tyr Asn Leu Leu Lys Glu Glu
1 5 10 15
Gln Thr Pro Gln Asn Lys Ile Thr Val Val Gly Val Gly Ala Val Gly
20 25 30
Met Ala Cys Ala Ile Ser Ile Leu Met Lys Asp Leu Ala Asp Glu Leu
35 40 45
Ala Leu Val Asp Val Ile Glu Asp Lys Leu Lys Gly Glu Met Met Asp
50 55 60
Leu Gln His Gly Ser Leu Phe Leu Arg Thr Pro Lys Ile Val Ser Gly
65 70 75 80
Lys Asp Tyr Asn Val Thr Ala Asn Ser Lys Leu Val Ile Ile Thr Ala
85 90 95
Gly Ala Arg Gln Gln Glu Gly Glu Ser Arg Leu Asn Leu Val Gln Arg
100 105 110
Asn Val Asn Ile Phe Lys Phe Ile Ile Pro Asn Val Val Lys Tyr Ser
115 120 125
Pro Asn Cys Lys Leu Leu Ile Val Ser Asn Pro Val Asp Ile Leu Thr
130 135 140
Tyr Val Ala Trp Lys Ile Ser Gly Phe Pro Lys Asn Arg Val Ile Gly
145 150 155 160
Ser Gly Cys Asn Leu Asp Ser Ala Arg Phe Arg Tyr Leu Met Gly Glu
165 170 175
Arg Leu Gly Val His Pro Leu Ser Cys His Gly Trp Val Leu Gly Glu
180 185 190
His Gly Asp Ser Ser Val Pro Val Trp Ser Gly Met Asn Val Ala Gly
195 200 205
Val Ser Leu Lys Thr Leu His Pro Asp Leu Gly Thr Asp Lys Asp Lys
210 215 220
Glu Gln Trp Lys Glu Val His Lys Gln Val Val Glu Ser Ala Tyr Glu
225 230 235 240
Val Ile Lys Leu Lys Gly Tyr Thr Ser Trp Ala Ile Gly Leu Ser Val
245 250 255
Ala Asp Leu Ala Glu Ser Ile Met Lys Asn Leu Arg Arg Val His Pro
260 265 270
Val Ser Thr Met Ile Lys Gly Leu Tyr Gly Ile Lys Asp Asp Val Phe
275 280 285
Leu Ser Val Pro Cys Ile Leu Gly Gln Asn Gly Ile Ser Asp Leu Val
290 295 300
Lys Val Thr Leu Thr Ser Glu Glu Glu Ala Arg Leu Lys Lys Ser Ala
305 310 315 320
Asp Thr Leu Trp Gly Ile Gln Lys Glu Leu Gln Phe
325 330
<210> 76
<211> 2226
<212> DNA
<213> Homo sapiens
<400> 76
gtctgccggt cggttgtctg gctgcgcgcg ccacccgggc ctctccagtg ccccgcctgg 60
ctcggcatcc acccccagcc cgactcacac gtgggttccc gcacgtccgc cggccccccc 120
cgctgacgtc agcatagctg ttccacttaa ggcccctccc gcgcccagct cagagtgctg 180
cagccgctgc cgccgattcc ggatctcatt gccacgcgcc cccgacgacc gcccgacgtg 240
cattcccgat tccttttggt tccaagtcca atatggcaac tctaaaggat cagctgattt 300
ataatcttct aaaggaagaa cagacccccc agaataagat tacagttgtt ggggttggtg 360
ctgttggcat ggcctgtgcc atcagtatct taatgaagga cttggcagat gaacttgctc 420
ttgttgatgt catcgaagac aaattgaagg gagagatgat ggatctccaa catggcagcc 480
ttttccttag aacaccaaag attgtctctg gcaaagacta taatgtaact gcaaactcca 540
agctggtcat tatcacggct ggggcacgtc agcaagaggg agaaagccgt cttaatttgg 600
tccagcgtaa cgtgaacatc tttaaattca tcattcctaa tgttgtaaaa tacagcccga 660
actgcaagtt gcttattgtt tcaaatccag tggatatctt gacctacgtg gcttggaaga 720
taagtggttt tcccaaaaac cgtgttattg gaagcggttg caatctggat tcagcccgat 780
tccgttacct aatgggggaa aggctgggag ttcacccatt aagctgtcat gggtgggtcc 840
ttggggaaca tggagattcc agtgtgcctg tatggagtgg aatgaatgtt gctggtgtct 900
ctctgaagac tctgcaccca gatttaggga ctgataaaga taaggaacag tggaaagagg 960
ttcacaagca ggtggttgag agtgcttatg aggtgatcaa actcaaaggc tacacatcct 1020
gggctattgg actctctgta gcagatttgg cagagagtat aatgaagaat cttaggcggg 1080
tgcacccagt ttccaccatg attaagggtc tttacggaat aaaggatgat gtcttcctta 1140
gtgttccttg cattttggga cagaatggaa tctcagacct tgtgaaggtg actctgactt 1200
ctgaggaaga ggcccgtttg aagaagagtg cagatacact ttgggggatc caaaaggagc 1260
tgcaatttta aagtcttctg atgtcatatc atttcactgt ctaggctaca acaggattct 1320
aggtggaggt tgtgcatgtt gtccttttta tctgatctgt gattaaagca gtaatatttt 1380
aagatggact gggaaaaaca tcaactcctg aagttagaaa taagaatggt ttgtaaaatc 1440
cacagctata tcctgatgct ggatggtatt aatcttgtgt agtcttcaac tggttagtgt 1500
gaaatagttc tgccacctct gacgcaccac tgccaatgct gtacgtactg catttgcccc 1560
ttgagccagg tggatgttta ccgtgtgtta tataacttcc tggctccttc actgaacatg 1620
cctagtccaa cattttttcc cagtgagtca catcctggga tccagtgtat aaatccaata 1680
tcatgtcttg tgcataattc ttccaaagga tcttattttg tgaactatat cagtagtgta 1740
cattaccata taatgtaaaa agatctacat acaaacaatg caaccaacta tccaagtgtt 1800
ataccaacta aaacccccaa taaaccttga acagtgacta ctttggttaa ttcattatat 1860
taagatataa agtcataaag ctgctagtta ttatattaat ttggaaatat taggctattc 1920
ttgggcaacc ctgcaacgat tttttctaac agggatatta ttgactaata gcagaggatg 1980
taatagtcaa ctgagttgta ttggtaccac ttccattgta agtcccaaag tattatatat 2040
ttgataataa tgctaatcat aattggaaag taacattcta tatgtaaatg taaaatttat 2100
ttgccaactg aatataggca atgatagtgt gtcactatag ggaacacaga tttttgagat 2160
cttgtcctct ggaagctggt aacaattaaa aacaatctta aggcagggaa aaaaaaaaaa 2220
aaaaaa 2226
<210> 77
<211> 1135
<212> PRT
<213> Homo sapiens
<400> 77
Met Ala Asp Leu Ser Leu Ala Asp Ala Leu Thr Glu Pro Ser Pro Asp
1 5 10 15
Ile Glu Gly Glu Ile Lys Arg Asp Phe Ile Ala Thr Leu Glu Ala Glu
20 25 30
Ala Phe Asp Asp Val Val Gly Glu Thr Val Gly Lys Thr Asp Tyr Ile
35 40 45
Pro Leu Leu Asp Val Asp Glu Lys Thr Gly Asn Ser Glu Ser Lys Lys
50 55 60
Lys Pro Cys Ser Glu Thr Ser Gln Ile Glu Asp Thr Pro Ser Ser Lys
65 70 75 80
Pro Thr Leu Leu Ala Asn Gly Gly His Gly Val Glu Gly Ser Asp Thr
85 90 95
Thr Gly Ser Pro Thr Glu Phe Leu Glu Glu Lys Met Ala Tyr Gln Glu
100 105 110
Tyr Pro Asn Ser Gln Asn Trp Pro Glu Asp Thr Asn Phe Cys Phe Gln
115 120 125
Pro Glu Gln Val Val Asp Pro Ile Gln Thr Asp Pro Phe Lys Met Tyr
130 135 140
His Asp Asp Asp Leu Ala Asp Leu Val Phe Pro Ser Ser Ala Thr Ala
145 150 155 160
Asp Thr Ser Ile Phe Ala Gly Gln Asn Asp Pro Leu Lys Asp Ser Tyr
165 170 175
Gly Met Ser Pro Cys Asn Thr Ala Val Val Pro Gln Gly Trp Ser Val
180 185 190
Glu Ala Leu Asn Ser Pro His Ser Glu Ser Phe Val Ser Pro Glu Ala
195 200 205
Val Ala Glu Pro Pro Gln Pro Thr Ala Val Pro Leu Glu Leu Ala Lys
210 215 220
Glu Ile Glu Met Ala Ser Glu Glu Arg Pro Pro Ala Gln Ala Leu Glu
225 230 235 240
Ile Met Met Gly Leu Lys Thr Thr Asp Met Ala Pro Ser Lys Glu Thr
245 250 255
Glu Met Ala Leu Ala Lys Asp Met Ala Leu Ala Thr Lys Thr Glu Val
260 265 270
Ala Leu Ala Lys Asp Met Glu Ser Pro Thr Lys Leu Asp Val Thr Leu
275 280 285
Ala Lys Asp Met Gln Pro Ser Met Glu Ser Asp Met Ala Leu Val Lys
290 295 300
Asp Met Glu Leu Pro Thr Glu Lys Glu Val Ala Leu Val Lys Asp Val
305 310 315 320
Arg Trp Pro Thr Glu Thr Asp Val Ser Ser Ala Lys Asn Val Val Leu
325 330 335
Pro Thr Glu Thr Glu Val Ala Pro Ala Lys Asp Val Thr Leu Leu Lys
340 345 350
Glu Thr Glu Arg Ala Ser Pro Ile Lys Met Asp Leu Ala Pro Ser Lys
355 360 365
Asp Met Gly Pro Pro Lys Glu Asn Lys Lys Glu Thr Glu Arg Ala Ser
370 375 380
Pro Ile Lys Met Asp Leu Ala Pro Ser Lys Asp Met Gly Pro Pro Lys
385 390 395 400
Glu Asn Lys Ile Val Pro Ala Lys Asp Leu Val Leu Leu Ser Glu Ile
405 410 415
Glu Val Ala Gln Ala Asn Asp Ile Ile Ser Ser Thr Glu Ile Ser Ser
420 425 430
Ala Glu Lys Val Ala Leu Ser Ser Glu Thr Glu Val Ala Leu Ala Arg
435 440 445
Asp Met Thr Leu Pro Pro Glu Thr Asn Val Ile Leu Thr Lys Asp Lys
450 455 460
Ala Leu Pro Leu Glu Ala Glu Val Ala Pro Val Lys Asp Met Ala Gln
465 470 475 480
Leu Pro Glu Thr Glu Ile Ala Pro Ala Lys Asp Val Ala Pro Ser Thr
485 490 495
Val Lys Glu Val Gly Leu Leu Lys Asp Met Ser Pro Leu Ser Glu Thr
500 505 510
Glu Met Ala Leu Gly Lys Asp Val Thr Pro Pro Pro Glu Thr Glu Val
515 520 525
Val Leu Ile Lys Asn Val Cys Leu Pro Pro Glu Met Glu Val Ala Leu
530 535 540
Thr Glu Asp Gln Val Pro Ala Leu Lys Thr Glu Ala Pro Leu Ala Lys
545 550 555 560
Asp Gly Val Leu Thr Leu Ala Asn Asn Val Thr Pro Ala Lys Asp Val
565 570 575
Pro Pro Leu Ser Glu Thr Glu Ala Thr Pro Val Pro Ile Lys Asp Met
580 585 590
Glu Ile Ala Gln Thr Gln Lys Gly Ile Ser Glu Asp Ser His Leu Glu
595 600 605
Ser Leu Gln Asp Val Gly Gln Ser Ala Ala Pro Thr Phe Met Ile Ser
610 615 620
Pro Glu Thr Val Thr Gly Thr Gly Lys Lys Cys Ser Leu Pro Ala Glu
625 630 635 640
Glu Asp Ser Val Leu Glu Lys Leu Gly Glu Arg Lys Pro Cys Asn Ser
645 650 655
Gln Pro Ser Glu Leu Ser Ser Glu Thr Ser Gly Ile Ala Arg Pro Glu
660 665 670
Glu Gly Arg Pro Val Val Ser Gly Thr Gly Asn Asp Ile Thr Thr Pro
675 680 685
Pro Asn Lys Glu Leu Pro Pro Ser Pro Glu Lys Lys Thr Lys Pro Leu
690 695 700
Ala Thr Thr Gln Pro Ala Lys Thr Ser Thr Ser Lys Ala Lys Thr Gln
705 710 715 720
Pro Thr Ser Leu Pro Lys Gln Pro Ala Pro Thr Thr Ile Gly Gly Leu
725 730 735
Asn Lys Lys Pro Met Ser Leu Ala Ser Gly Leu Val Pro Ala Ala Pro
740 745 750
Pro Lys Arg Pro Ala Val Ala Ser Ala Arg Pro Ser Ile Leu Pro Ser
755 760 765
Lys Asp Val Lys Pro Lys Pro Ile Ala Asp Ala Lys Ala Pro Glu Lys
770 775 780
Arg Ala Ser Pro Ser Lys Pro Ala Ser Ala Pro Ala Ser Arg Ser Gly
785 790 795 800
Ser Lys Ser Thr Gln Thr Val Ala Lys Thr Thr Thr Ala Ala Ala Val
805 810 815
Ala Ser Thr Gly Pro Ser Ser Arg Ser Pro Ser Thr Leu Leu Pro Lys
820 825 830
Lys Pro Thr Ala Ile Lys Thr Glu Gly Lys Pro Ala Glu Val Lys Lys
835 840 845
Met Thr Ala Lys Ser Val Pro Ala Asp Leu Ser Arg Pro Lys Ser Thr
850 855 860
Ser Thr Ser Ser Met Lys Lys Thr Thr Thr Leu Ser Gly Thr Ala Pro
865 870 875 880
Ala Ala Gly Val Val Pro Ser Arg Val Lys Ala Thr Pro Met Pro Ser
885 890 895
Arg Pro Ser Thr Thr Pro Phe Ile Asp Lys Lys Pro Thr Ser Ala Lys
900 905 910
Pro Ser Ser Thr Thr Pro Arg Leu Ser Arg Leu Ala Thr Asn Thr Ser
915 920 925
Ala Pro Asp Leu Lys Asn Val Arg Ser Lys Val Gly Ser Thr Glu Asn
930 935 940
Ile Lys His Gln Pro Gly Gly Gly Arg Ala Lys Val Glu Lys Lys Thr
945 950 955 960
Glu Ala Ala Ala Thr Thr Arg Lys Pro Glu Ser Asn Ala Val Thr Lys
965 970 975
Thr Ala Gly Pro Ile Ala Ser Ala Gln Lys Gln Pro Ala Gly Lys Val
980 985 990
Gln Ile Val Ser Lys Lys Val Ser Tyr Ser His Ile Gln Ser Lys Cys
995 1000 1005
Gly Ser Lys Asp Asn Ile Lys His Val Pro Gly Gly Gly Asn Val
1010 1015 1020
Gln Ile Gln Asn Lys Lys Val Asp Ile Ser Lys Val Ser Ser Lys
1025 1030 1035
Cys Gly Ser Lys Ala Asn Ile Lys His Lys Pro Gly Gly Gly Asp
1040 1045 1050
Val Lys Ile Glu Ser Gln Lys Leu Asn Phe Lys Glu Lys Ala Gln
1055 1060 1065
Ala Lys Val Gly Ser Leu Asp Asn Val Gly His Leu Pro Ala Gly
1070 1075 1080
Gly Ala Val Lys Ile Glu Thr Tyr Arg Leu Thr Phe Arg Ala Asn
1085 1090 1095
Ala Arg Ala Arg Thr Asp His Gly Ala Asp Ile Val Ser Arg Pro
1100 1105 1110
Pro His Phe Pro Gly Gly Pro Asn Ser Gly Ser Arg Val Leu Gly
1115 1120 1125
Pro Leu Ser Arg Ala Val His
1130 1135
<210> 78
<211> 6046
<212> DNA
<213> Homo sapiens
<400> 78
aggccccacc cgctggtggc ccggtccgcg tgtgcgccga ctctcgcact ctcctcgctc 60
cgggcgccca gactctgaga gagagcgacg gccatcatag aacagcgaag gcagtcgatc 120
ggcctgcggt ccgcttcggc attcgcaggc cgcaggcggg aggctagagc ccccaggcgc 180
acctcgcccc aaccgcccgc ggctcgggca gctctgcaga gacgtcgtgg cggcagggcc 240
agcacccatt ggtccgccac agccctccgc cctccccctc gccacgctta ttggccggag 300
cggcggcgct cgccgggtag gcggtggcgg cgtccctccc ttgcgccggc cctcaagagg 360
cgacgaggaa gcggccgcct ccctgcgccc cgcccctccg gctagctcgc tggctcccgg 420
ctcctcccga cgtctcctac ctcctcacgg ctcttcccgg cgctctcctg gctcccttct 480
gccccagctc cgtctcggcg gcggcgggca gttgcagtgg tgcagaatgg ctgacctcag 540
tcttgcagat gcattaacag aaccatctcc agacattgag ggagagataa agcgggactt 600
cattgccaca ctagaggcag aggcctttga tgatgttgtg ggagaaactg ttggaaaaac 660
agactatatt cctctcctgg atgttgatga gaaaaccggg aactcagagt caaagaagaa 720
accgtgctca gaaactagcc agattgaaga tactccatct tctaaaccaa cactcctagc 780
caatggtggt catggagtag aagggagcga tactacaggg tctccaactg aattccttga 840
agagaaaatg gcctaccagg aatacccaaa tagccagaac tggccagaag ataccaactt 900
ttgtttccaa cctgagcaag tggtcgatcc tatccagact gatcccttta agatgtacca 960
tgatgatgac ctggcagatt tggtctttcc ctccagtgcg acagctgata cttcaatatt 1020
tgcaggacaa aatgatccct tgaaagacag ttacggtatg tctccctgca acacagctgt 1080
tgtacctcag gggtggtctg tggaagcctt aaactctcca cactcagagt cctttgtttc 1140
cccagaggct gttgcagaac ctcctcagcc aacggcagtt cccttagagc tagccaagga 1200
gatagaaatg gcatcagaag agaggccacc agcacaagca ttggaaataa tgatgggact 1260
gaagactact gacatggcac catctaaaga aacagagatg gccctcgcca aggacatggc 1320
actagctaca aaaaccgagg tggcattggc taaagatatg gaatcaccca ccaaattaga 1380
tgtgacactg gccaaggaca tgcagccatc catggaatca gatatggccc tagtcaagga 1440
catggaacta cccacagaaa aagaagtggc cctggttaag gatgtcagat ggcccacaga 1500
aacagatgta tcttcagcca agaatgtggt actgcccaca gaaacagagg tagccccagc 1560
caaggatgtg acactgttga aagaaacaga gagggcatct cctataaaaa tggacttagc 1620
cccttccaag gacatgggac cacccaaaga aaacaagaaa gaaacagaga gggcatctcc 1680
tataaaaatg gacttggctc cttccaagga catgggacca cccaaagaaa acaagatagt 1740
cccagccaag gatttggtat tactctcaga aatagaggtg gcacaggcta atgacattat 1800
atcatccaca gaaatatcct ctgctgagaa ggtggctttg tcctcagaaa cagaggtagc 1860
cctggccagg gacatgacac tgcccccgga aaccaacgtg atcttgacca aggataaagc 1920
actaccttta gaagcagagg tggccccagt caaggacatg gctcaactcc cagaaacaga 1980
aatagccccg gccaaggatg tggctccgtc cacagtaaaa gaagtgggct tgttgaagga 2040
catgtctcca ctatcagaaa cagaaatggc tctgggcaag gatgtgactc cacctccaga 2100
aacagaagta gttctcatca agaacgtatg tctgcctcca gaaatggagg tggccctgac 2160
tgaggatcag gtcccagccc tcaaaacaga agcacccctg gctaaggatg gggttctgac 2220
cctggccaac aatgtgactc cagccaaaga tgttccacca ctctcagaaa cagaggcaac 2280
accagttcca attaaagaca tggaaattgc acaaacacaa aaaggaataa gtgaggattc 2340
ccatttagaa tctctgcagg atgtggggca gtcagctgca cctactttca tgatttcacc 2400
agaaaccgtc acaggaacgg ggaaaaagtg cagcttgccg gccgaggagg attctgtgtt 2460
agaaaaacta ggggaaagga aaccatgcaa cagtcaacct tctgagcttt cttcagagac 2520
ctcaggaata gccaggccag aagaaggaag gcctgtggtg agtgggacag gaaatgacat 2580
caccacccca ccgaacaagg agctcccacc aagcccagag aagaaaacaa agcctttggc 2640
caccactcaa cctgcaaaga cttcaacatc gaaagccaaa acacagccca cttctctccc 2700
taagcagcca gctcccacca ccattggtgg gttgaataaa aaacccatga gccttgcttc 2760
aggcttagtg ccagctgccc cacccaaacg ccctgccgtc gcctctgcca ggccttccat 2820
cttaccttca aaagacgtga agccaaagcc cattgcagat gcaaaggctc ctgagaagcg 2880
ggcctcacca tccaagccag cttctgcccc agcctccaga tctgggtcca agagcactca 2940
gactgttgca aaaaccacaa cagctgctgc tgttgcctca actggcccaa gcagtaggag 3000
cccctccacg ctcctgccca agaagcccac tgccattaag actgagggaa aacctgcaga 3060
agtcaagaag atgactgcaa agtctgtacc agctgacttg agtcgcccaa agagcacctc 3120
caccagttcc atgaagaaaa ccaccactct cagtgggaca gcccccgctg caggggtggt 3180
tcccagccga gtcaaggcca cacccatgcc ctcccggccc tccacaactc ctttcataga 3240
caagaagccc acctcggcca aacccagctc caccaccccc cggctcagcc gcctggccac 3300
caatacttct gctcctgatc tgaagaatgt ccgctccaag gttggctcca cggaaaacat 3360
caagcatcag cctggaggag gccgggccaa agtagagaaa aaaacagagg cagctgctac 3420
aacccgaaag cctgaatcta atgcagtcac taaaacagcc ggcccaattg caagtgcaca 3480
gaaacaacct gcggggaaag tccagatagt ctccaaaaaa gtgagctaca gccatattca 3540
gtccaagtgt ggttccaagg acaatattaa gcatgtccct ggaggtggta atgttcagat 3600
tcagaacaag aaagtggaca tctctaaggt ctcctccaag tgtgggtcta aggctaacat 3660
caagcacaag cctggtggag gagatgtcaa gattgaaagt cagaagttga acttcaagga 3720
gaaggcccag gccaaggtgg gatccctcga taatgtgggc cacctacctg caggaggtgc 3780
tgtgaagatt gagacctaca ggctgacgtt ccgggcaaat gccagggccc gcaccgacca 3840
cggggccgac attgtctccc gccccccaca cttccctggc ggccccaact cgggctcccg 3900
ggtccttggc cccctttccc gggctgtcca ctagaccagt gagcgcttgg gcgccgtgct 3960
gggcagcccg ctaggctcgc cttccctcct gctttgcgtg cccggggcag cagcagccct 4020
gccccacacc tcctctcact ccccagcctg ggcccatctc cctgctttgg tcttgcccca 4080
tcactgcgcc actgctccgt ggaggaggtt gggagggggt tggggtggtt gaggctaagt 4140
tgggatctag gagaggagaa ccagattcta tcctcatctt tttttggttc tttggtccaa 4200
acccaaaaga aactgacatg ccctcccttc tccctggatc tacctggagg gaagagtgga 4260
ggtggattcc gagtggtgac aggacgctga ccgtggagct taagccactg cctctccctc 4320
tggtcccaca aatgggcgcc cccccctccc catgcaggtg gtgtcgggcc cttcttgctg 4380
ccctgcccca agttgggggt cagtgctgcc tgtccccatg cttaacatac ccgcctagct 4440
gctgtcacat ttttcttgtt ttgtcctttt atttttttct aataacctaa aaactggcaa 4500
aatagttctg caggttgaag ccatgtctac atgaaagtcc tcagtaagtg ttagagggaa 4560
cagggcggag atatccttat gccacccccg ctggaggatg tgggcagctt agggccctgg 4620
aggcggtgcg gcagggaaga ggggtgcaga ggctgtggct ggtgagccgg tcaggcacac 4680
aaggggccct tggagcgtgg actggttggt tttgccattt tgttgtgtgt atgctgcttt 4740
tcttttctaa ccaagaggct ggttttggca tctctgtccc attccctggg atctggtggt 4800
cagccctagg ataaaaagcc agggctggag aacaagaaag ggccaggaga tggaattcct 4860
tcaggccggc acccacaccc taggacatgt aagccctcat gtccaaggga gcctcatgca 4920
gatagtagga aatcaggtct ggaaatttaa aaataaaagg catgagacta aggctatctg 4980
cttcccttat gccctgactg gagaggggag ggaggagagg caaggcccac agagggcatc 5040
ccagctaggc cttgggatgg ctgcagtgag gagaaatccc gggaactgta ttgacacaaa 5100
gattcttatt gcacttgtat tttttgtatt aaagtttgca tggtttctaa taaaggattc 5160
aaacataagt ttgtagtgaa atggcctggg agattccaag ggcttctctg gagggggatt 5220
ggctgcagtg tagatttgcc tctgaggagg ctgccccaga cttggcctcc tcatgccccc 5280
tcctgacctc tgcccttctc tggtcctggc atccctggag aaggtagggg tcttgaccta 5340
agtttagatt tgatctccat gtgcagggag gctgtcctgg gcctgacagg tcctccccct 5400
ttctgaggta gcagtgcctt gtggaggttt gacaccatgt ccctagctcc ccaagcacac 5460
accaggaaac tgcaggggct cacggaggaa gtgctgcctg ggccaggggg accagctttc 5520
ctccgtagag accatgtgca gaacacttct gctgtgccaa gaacatgagg gagccagtgt 5580
tttgtcagca ggaagaaagg gcctgctggg atgaaagtgg gaaggaaaca gggttgcgta 5640
gtcaggagac acctcagggg caacagcaca ggcccagagt acctgctgcc tccactgcgt 5700
ctgtcctggg gtcatgagga tgctgaggtt gacgacaggt tccaggtcct ttcactcctt 5760
tggccaaagg ttgggggtag gtggcccaag tggcgtgctc tctaggtaga caacaggagt 5820
ggtcagagtt ccctcaaagg atcctccact ccagagcacc tgagaaggcc gggaccagag 5880
gccctgtgtg atgtgtactc cgcagctgtt tggggtggga catttctgta cttctcgatt 5940
tgcttatggc tcagccatta cctgtgtcag tccatgattc tgttgtaaca gttttaagag 6000
taaataaata aagctgcctg atgtcccatc acgcagaaaa aaaaaa 6046
<210> 79
<211> 1152
<212> PRT
<213> Homo sapiens
<400> 79
Met Ala Asp Leu Ser Leu Ala Asp Ala Leu Thr Glu Pro Ser Pro Asp
1 5 10 15
Ile Glu Gly Glu Ile Lys Arg Asp Phe Ile Ala Thr Leu Glu Ala Glu
20 25 30
Ala Phe Asp Asp Val Val Gly Glu Thr Val Gly Lys Thr Asp Tyr Ile
35 40 45
Pro Leu Leu Asp Val Asp Glu Lys Thr Gly Asn Ser Glu Ser Lys Lys
50 55 60
Lys Pro Cys Ser Glu Thr Ser Gln Ile Glu Asp Thr Pro Ser Ser Lys
65 70 75 80
Pro Thr Leu Leu Ala Asn Gly Gly His Gly Val Glu Gly Ser Asp Thr
85 90 95
Thr Gly Ser Pro Thr Glu Phe Leu Glu Glu Lys Met Ala Tyr Gln Glu
100 105 110
Tyr Pro Asn Ser Gln Asn Trp Pro Glu Asp Thr Asn Phe Cys Phe Gln
115 120 125
Pro Glu Gln Val Val Asp Pro Ile Gln Thr Asp Pro Phe Lys Met Tyr
130 135 140
His Asp Asp Asp Leu Ala Asp Leu Val Phe Pro Ser Ser Ala Thr Ala
145 150 155 160
Asp Thr Ser Ile Phe Ala Gly Gln Asn Asp Pro Leu Lys Asp Ser Tyr
165 170 175
Gly Met Ser Pro Cys Asn Thr Ala Val Val Pro Gln Gly Trp Ser Val
180 185 190
Glu Ala Leu Asn Ser Pro His Ser Glu Ser Phe Val Ser Pro Glu Ala
195 200 205
Val Ala Glu Pro Pro Gln Pro Thr Ala Val Pro Leu Glu Leu Ala Lys
210 215 220
Glu Ile Glu Met Ala Ser Glu Glu Arg Pro Pro Ala Gln Ala Leu Glu
225 230 235 240
Ile Met Met Gly Leu Lys Thr Thr Asp Met Ala Pro Ser Lys Glu Thr
245 250 255
Glu Met Ala Leu Ala Lys Asp Met Ala Leu Ala Thr Lys Thr Glu Val
260 265 270
Ala Leu Ala Lys Asp Met Glu Ser Pro Thr Lys Leu Asp Val Thr Leu
275 280 285
Ala Lys Asp Met Gln Pro Ser Met Glu Ser Asp Met Ala Leu Val Lys
290 295 300
Asp Met Glu Leu Pro Thr Glu Lys Glu Val Ala Leu Val Lys Asp Val
305 310 315 320
Arg Trp Pro Thr Glu Thr Asp Val Ser Ser Ala Lys Asn Val Val Leu
325 330 335
Pro Thr Glu Thr Glu Val Ala Pro Ala Lys Asp Val Thr Leu Leu Lys
340 345 350
Glu Thr Glu Arg Ala Ser Pro Ile Lys Met Asp Leu Ala Pro Ser Lys
355 360 365
Asp Met Gly Pro Pro Lys Glu Asn Lys Lys Glu Thr Glu Arg Ala Ser
370 375 380
Pro Ile Lys Met Asp Leu Ala Pro Ser Lys Asp Met Gly Pro Pro Lys
385 390 395 400
Glu Asn Lys Ile Val Pro Ala Lys Asp Leu Val Leu Leu Ser Glu Ile
405 410 415
Glu Val Ala Gln Ala Asn Asp Ile Ile Ser Ser Thr Glu Ile Ser Ser
420 425 430
Ala Glu Lys Val Ala Leu Ser Ser Glu Thr Glu Val Ala Leu Ala Arg
435 440 445
Asp Met Thr Leu Pro Pro Glu Thr Asn Val Ile Leu Thr Lys Asp Lys
450 455 460
Ala Leu Pro Leu Glu Ala Glu Val Ala Pro Val Lys Asp Met Ala Gln
465 470 475 480
Leu Pro Glu Thr Glu Ile Ala Pro Ala Lys Asp Val Ala Pro Ser Thr
485 490 495
Val Lys Glu Val Gly Leu Leu Lys Asp Met Ser Pro Leu Ser Glu Thr
500 505 510
Glu Met Ala Leu Gly Lys Asp Val Thr Pro Pro Pro Glu Thr Glu Val
515 520 525
Val Leu Ile Lys Asn Val Cys Leu Pro Pro Glu Met Glu Val Ala Leu
530 535 540
Thr Glu Asp Gln Val Pro Ala Leu Lys Thr Glu Ala Pro Leu Ala Lys
545 550 555 560
Asp Gly Val Leu Thr Leu Ala Asn Asn Val Thr Pro Ala Lys Asp Val
565 570 575
Pro Pro Leu Ser Glu Thr Glu Ala Thr Pro Val Pro Ile Lys Asp Met
580 585 590
Glu Ile Ala Gln Thr Gln Lys Gly Ile Ser Glu Asp Ser His Leu Glu
595 600 605
Ser Leu Gln Asp Val Gly Gln Ser Ala Ala Pro Thr Phe Met Ile Ser
610 615 620
Pro Glu Thr Val Thr Gly Thr Gly Lys Lys Cys Ser Leu Pro Ala Glu
625 630 635 640
Glu Asp Ser Val Leu Glu Lys Leu Gly Glu Arg Lys Pro Cys Asn Ser
645 650 655
Gln Pro Ser Glu Leu Ser Ser Glu Thr Ser Gly Ile Ala Arg Pro Glu
660 665 670
Glu Gly Arg Pro Val Val Ser Gly Thr Gly Asn Asp Ile Thr Thr Pro
675 680 685
Pro Asn Lys Glu Leu Pro Pro Ser Pro Glu Lys Lys Thr Lys Pro Leu
690 695 700
Ala Thr Thr Gln Pro Ala Lys Thr Ser Thr Ser Lys Ala Lys Thr Gln
705 710 715 720
Pro Thr Ser Leu Pro Lys Gln Pro Ala Pro Thr Thr Ile Gly Gly Leu
725 730 735
Asn Lys Lys Pro Met Ser Leu Ala Ser Gly Leu Val Pro Ala Ala Pro
740 745 750
Pro Lys Arg Pro Ala Val Ala Ser Ala Arg Pro Ser Ile Leu Pro Ser
755 760 765
Lys Asp Val Lys Pro Lys Pro Ile Ala Asp Ala Lys Ala Pro Glu Lys
770 775 780
Arg Ala Ser Pro Ser Lys Pro Ala Ser Ala Pro Ala Ser Arg Ser Gly
785 790 795 800
Ser Lys Ser Thr Gln Thr Val Ala Lys Thr Thr Thr Ala Ala Ala Val
805 810 815
Ala Ser Thr Gly Pro Ser Ser Arg Ser Pro Ser Thr Leu Leu Pro Lys
820 825 830
Lys Pro Thr Ala Ile Lys Thr Glu Gly Lys Pro Ala Glu Val Lys Lys
835 840 845
Met Thr Ala Lys Ser Val Pro Ala Asp Leu Ser Arg Pro Lys Ser Thr
850 855 860
Ser Thr Ser Ser Met Lys Lys Thr Thr Thr Leu Ser Gly Thr Ala Pro
865 870 875 880
Ala Ala Gly Val Val Pro Ser Arg Val Lys Ala Thr Pro Met Pro Ser
885 890 895
Arg Pro Ser Thr Thr Pro Phe Ile Asp Lys Lys Pro Thr Ser Ala Lys
900 905 910
Pro Ser Ser Thr Thr Pro Arg Leu Ser Arg Leu Ala Thr Asn Thr Ser
915 920 925
Ala Pro Asp Leu Lys Asn Val Arg Ser Lys Val Gly Ser Thr Glu Asn
930 935 940
Ile Lys His Gln Pro Gly Gly Gly Arg Ala Lys Val Glu Lys Lys Thr
945 950 955 960
Glu Ala Ala Ala Thr Thr Arg Lys Pro Glu Ser Asn Ala Val Thr Lys
965 970 975
Thr Ala Gly Pro Ile Ala Ser Ala Gln Lys Gln Pro Ala Gly Lys Val
980 985 990
Gln Ile Val Ser Lys Lys Val Ser Tyr Ser His Ile Gln Ser Lys Cys
995 1000 1005
Gly Ser Lys Asp Asn Ile Lys His Val Pro Gly Gly Gly Asn Val
1010 1015 1020
Gln Ile Gln Asn Lys Lys Val Asp Ile Ser Lys Val Ser Ser Lys
1025 1030 1035
Cys Gly Ser Lys Ala Asn Ile Lys His Lys Pro Gly Gly Gly Asp
1040 1045 1050
Val Lys Ile Glu Ser Gln Lys Leu Asn Phe Lys Glu Lys Ala Gln
1055 1060 1065
Ala Lys Val Gly Ser Leu Asp Asn Val Gly His Leu Pro Ala Gly
1070 1075 1080
Gly Ala Val Lys Thr Glu Gly Gly Gly Ser Glu Ala Pro Leu Cys
1085 1090 1095
Pro Gly Pro Pro Ala Gly Glu Glu Pro Ala Ile Ser Glu Ala Ala
1100 1105 1110
Pro Glu Ala Gly Ala Pro Thr Ser Ala Ser Gly Leu Asn Gly His
1115 1120 1125
Pro Thr Leu Ser Gly Gly Gly Asp Gln Arg Glu Ala Gln Thr Leu
1130 1135 1140
Asp Ser Gln Ile Gln Glu Thr Ser Ile
1145 1150
<210> 80
<211> 6337
<212> DNA
<213> Homo sapiens
<400> 80
aggccccacc cgctggtggc ccggtccgcg tgtgcgccga ctctcgcact ctcctcgctc 60
cgggcgccca gactctgaga gagagcgacg gccatcatag aacagcgaag gcagtcgatc 120
ggcctgcggt ccgcttcggc attcgcaggc cgcaggcggg aggctagagc ccccaggcgc 180
acctcgcccc aaccgcccgc ggctcgggca gctctgcaga gacgtcgtgg cggcagggcc 240
agcacccatt ggtccgccac agccctccgc cctccccctc gccacgctta ttggccggag 300
cggcggcgct cgccgggtag gcggtggcgg cgtccctccc ttgcgccggc cctcaagagg 360
cgacgaggaa gcggccgcct ccctgcgccc cgcccctccg gctagctcgc tggctcccgg 420
ctcctcccga cgtctcctac ctcctcacgg ctcttcccgg cgctctcctg gctcccttct 480
gccccagctc cgtctcggcg gcggcgggca gttgcagtgg tgcagaatgg ctgacctcag 540
tcttgcagat gcattaacag aaccatctcc agacattgag ggagagataa agcgggactt 600
cattgccaca ctagaggcag aggcctttga tgatgttgtg ggagaaactg ttggaaaaac 660
agactatatt cctctcctgg atgttgatga gaaaaccggg aactcagagt caaagaagaa 720
accgtgctca gaaactagcc agattgaaga tactccatct tctaaaccaa cactcctagc 780
caatggtggt catggagtag aagggagcga tactacaggg tctccaactg aattccttga 840
agagaaaatg gcctaccagg aatacccaaa tagccagaac tggccagaag ataccaactt 900
ttgtttccaa cctgagcaag tggtcgatcc tatccagact gatcccttta agatgtacca 960
tgatgatgac ctggcagatt tggtctttcc ctccagtgcg acagctgata cttcaatatt 1020
tgcaggacaa aatgatccct tgaaagacag ttacggtatg tctccctgca acacagctgt 1080
tgtacctcag gggtggtctg tggaagcctt aaactctcca cactcagagt cctttgtttc 1140
cccagaggct gttgcagaac ctcctcagcc aacggcagtt cccttagagc tagccaagga 1200
gatagaaatg gcatcagaag agaggccacc agcacaagca ttggaaataa tgatgggact 1260
gaagactact gacatggcac catctaaaga aacagagatg gccctcgcca aggacatggc 1320
actagctaca aaaaccgagg tggcattggc taaagatatg gaatcaccca ccaaattaga 1380
tgtgacactg gccaaggaca tgcagccatc catggaatca gatatggccc tagtcaagga 1440
catggaacta cccacagaaa aagaagtggc cctggttaag gatgtcagat ggcccacaga 1500
aacagatgta tcttcagcca agaatgtggt actgcccaca gaaacagagg tagccccagc 1560
caaggatgtg acactgttga aagaaacaga gagggcatct cctataaaaa tggacttagc 1620
cccttccaag gacatgggac cacccaaaga aaacaagaaa gaaacagaga gggcatctcc 1680
tataaaaatg gacttggctc cttccaagga catgggacca cccaaagaaa acaagatagt 1740
cccagccaag gatttggtat tactctcaga aatagaggtg gcacaggcta atgacattat 1800
atcatccaca gaaatatcct ctgctgagaa ggtggctttg tcctcagaaa cagaggtagc 1860
cctggccagg gacatgacac tgcccccgga aaccaacgtg atcttgacca aggataaagc 1920
actaccttta gaagcagagg tggccccagt caaggacatg gctcaactcc cagaaacaga 1980
aatagccccg gccaaggatg tggctccgtc cacagtaaaa gaagtgggct tgttgaagga 2040
catgtctcca ctatcagaaa cagaaatggc tctgggcaag gatgtgactc cacctccaga 2100
aacagaagta gttctcatca agaacgtatg tctgcctcca gaaatggagg tggccctgac 2160
tgaggatcag gtcccagccc tcaaaacaga agcacccctg gctaaggatg gggttctgac 2220
cctggccaac aatgtgactc cagccaaaga tgttccacca ctctcagaaa cagaggcaac 2280
accagttcca attaaagaca tggaaattgc acaaacacaa aaaggaataa gtgaggattc 2340
ccatttagaa tctctgcagg atgtggggca gtcagctgca cctactttca tgatttcacc 2400
agaaaccgtc acaggaacgg ggaaaaagtg cagcttgccg gccgaggagg attctgtgtt 2460
agaaaaacta ggggaaagga aaccatgcaa cagtcaacct tctgagcttt cttcagagac 2520
ctcaggaata gccaggccag aagaaggaag gcctgtggtg agtgggacag gaaatgacat 2580
caccacccca ccgaacaagg agctcccacc aagcccagag aagaaaacaa agcctttggc 2640
caccactcaa cctgcaaaga cttcaacatc gaaagccaaa acacagccca cttctctccc 2700
taagcagcca gctcccacca ccattggtgg gttgaataaa aaacccatga gccttgcttc 2760
aggcttagtg ccagctgccc cacccaaacg ccctgccgtc gcctctgcca ggccttccat 2820
cttaccttca aaagacgtga agccaaagcc cattgcagat gcaaaggctc ctgagaagcg 2880
ggcctcacca tccaagccag cttctgcccc agcctccaga tctgggtcca agagcactca 2940
gactgttgca aaaaccacaa cagctgctgc tgttgcctca actggcccaa gcagtaggag 3000
cccctccacg ctcctgccca agaagcccac tgccattaag actgagggaa aacctgcaga 3060
agtcaagaag atgactgcaa agtctgtacc agctgacttg agtcgcccaa agagcacctc 3120
caccagttcc atgaagaaaa ccaccactct cagtgggaca gcccccgctg caggggtggt 3180
tcccagccga gtcaaggcca cacccatgcc ctcccggccc tccacaactc ctttcataga 3240
caagaagccc acctcggcca aacccagctc caccaccccc cggctcagcc gcctggccac 3300
caatacttct gctcctgatc tgaagaatgt ccgctccaag gttggctcca cggaaaacat 3360
caagcatcag cctggaggag gccgggccaa agtagagaaa aaaacagagg cagctgctac 3420
aacccgaaag cctgaatcta atgcagtcac taaaacagcc ggcccaattg caagtgcaca 3480
gaaacaacct gcggggaaag tccagatagt ctccaaaaaa gtgagctaca gccatattca 3540
gtccaagtgt ggttccaagg acaatattaa gcatgtccct ggaggtggta atgttcagat 3600
tcagaacaag aaagtggaca tctctaaggt ctcctccaag tgtgggtcta aggctaacat 3660
caagcacaag cctggtggag gagatgtcaa gattgaaagt cagaagttga acttcaagga 3720
gaaggcccag gccaaggtgg gatccctcga taatgtgggc cacctacctg caggaggtgc 3780
tgtgaagact gagggcggtg gcagcgaggc tcctctgtgt ccgggtcccc ctgctgggga 3840
ggagccggcc atctctgagg cagcgcctga agctggcgcc cccacttcag ccagtggcct 3900
caatggccac cccaccctgt cagggggtgg tgaccaaagg gaggcccaga ccttggacag 3960
ccagatccag gagacaagca tctaatgatg acattctggt ctcgtcttcc gtctcccccg 4020
tgttcccctc ttgtctcccc tgttcccctc tcccttccct cctcccatgt cactgcagat 4080
tgagacctac aggctgacgt tccgggcaaa tgccagggcc cgcaccgacc acggggccga 4140
cattgtctcc cgccccccac acttccctgg cggccccaac tcgggctccc gggtccttgg 4200
ccccctttcc cgggctgtcc actagaccag tgagcgcttg ggcgccgtgc tgggcagccc 4260
gctaggctcg ccttccctcc tgctttgcgt gcccggggca gcagcagccc tgccccacac 4320
ctcctctcac tccccagcct gggcccatct ccctgctttg gtcttgcccc atcactgcgc 4380
cactgctccg tggaggaggt tgggaggggg ttggggtggt tgaggctaag ttgggatcta 4440
ggagaggaga accagattct atcctcatct ttttttggtt ctttggtcca aacccaaaag 4500
aaactgacat gccctccctt ctccctggat ctacctggag ggaagagtgg aggtggattc 4560
cgagtggtga caggacgctg accgtggagc ttaagccact gcctctccct ctggtcccac 4620
aaatgggcgc ccccccctcc ccatgcaggt ggtgtcgggc ccttcttgct gccctgcccc 4680
aagttggggg tcagtgctgc ctgtccccat gcttaacata cccgcctagc tgctgtcaca 4740
tttttcttgt tttgtccttt tatttttttc taataaccta aaaactggca aaatagttct 4800
gcaggttgaa gccatgtcta catgaaagtc ctcagtaagt gttagaggga acagggcgga 4860
gatatcctta tgccaccccc gctggaggat gtgggcagct tagggccctg gaggcggtgc 4920
ggcagggaag aggggtgcag aggctgtggc tggtgagccg gtcaggcaca caaggggccc 4980
ttggagcgtg gactggttgg ttttgccatt ttgttgtgtg tatgctgctt ttcttttcta 5040
accaagaggc tggttttggc atctctgtcc cattccctgg gatctggtgg tcagccctag 5100
gataaaaagc cagggctgga gaacaagaaa gggccaggag atggaattcc ttcaggccgg 5160
cacccacacc ctaggacatg taagccctca tgtccaaggg agcctcatgc agatagtagg 5220
aaatcaggtc tggaaattta aaaataaaag gcatgagact aaggctatct gcttccctta 5280
tgccctgact ggagagggga gggaggagag gcaaggccca cagagggcat cccagctagg 5340
ccttgggatg gctgcagtga ggagaaatcc cgggaactgt attgacacaa agattcttat 5400
tgcacttgta ttttttgtat taaagtttgc atggtttcta ataaaggatt caaacataag 5460
tttgtagtga aatggcctgg gagattccaa gggcttctct ggagggggat tggctgcagt 5520
gtagatttgc ctctgaggag gctgccccag acttggcctc ctcatgcccc ctcctgacct 5580
ctgcccttct ctggtcctgg catccctgga gaaggtaggg gtcttgacct aagtttagat 5640
ttgatctcca tgtgcaggga ggctgtcctg ggcctgacag gtcctccccc tttctgaggt 5700
agcagtgcct tgtggaggtt tgacaccatg tccctagctc cccaagcaca caccaggaaa 5760
ctgcaggggc tcacggagga agtgctgcct gggccagggg gaccagcttt cctccgtaga 5820
gaccatgtgc agaacacttc tgctgtgcca agaacatgag ggagccagtg ttttgtcagc 5880
aggaagaaag ggcctgctgg gatgaaagtg ggaaggaaac agggttgcgt agtcaggaga 5940
cacctcaggg gcaacagcac aggcccagag tacctgctgc ctccactgcg tctgtcctgg 6000
ggtcatgagg atgctgaggt tgacgacagg ttccaggtcc tttcactcct ttggccaaag 6060
gttgggggta ggtggcccaa gtggcgtgct ctctaggtag acaacaggag tggtcagagt 6120
tccctcaaag gatcctccac tccagagcac ctgagaaggc cgggaccaga ggccctgtgt 6180
gatgtgtact ccgcagctgt ttggggtggg acatttctgt acttctcgat ttgcttatgg 6240
ctcagccatt acctgtgtca gtccatgatt ctgttgtaac agttttaaga gtaaataaat 6300
aaagctgcct gatgtcccat cacgcagaaa aaaaaaa 6337
<210> 81
<211> 99
<212> PRT
<213> Homo sapiens
<400> 81
Met Ala Asp Leu Ser Leu Ala Asp Ala Leu Thr Glu Pro Ser Pro Asp
1 5 10 15
Ile Glu Gly Glu Ile Lys Arg Asp Phe Ile Ala Thr Leu Glu Ala Glu
20 25 30
Ala Phe Asp Asp Val Val Gly Glu Thr Val Gly Lys Thr Asp Tyr Ile
35 40 45
Pro Leu Leu Asp Val Asp Glu Lys Thr Gly Asn Ser Glu Ser Lys Lys
50 55 60
Lys Pro Cys Ser Glu Thr Ser Gln Ile Glu Asp Thr Pro Ser Ser Lys
65 70 75 80
Pro Thr Leu Leu Ala Asn Gly Gly His Gly Val Glu Gly Ser Asp Thr
85 90 95
Thr Glu Ala
<210> 82
<211> 3224
<212> DNA
<213> Homo sapiens
<400> 82
aggccccacc cgctggtggc ccggtccgcg tgtgcgccga ctctcgcact ctcctcgctc 60
cgggcgccca gactctgaga gagagcgacg gccatcatag aacagcgaag gcagtcgatc 120
ggcctgcggt ccgcttcggc attcgcaggc cgcaggcggg aggctagagc ccccaggcgc 180
acctcgcccc aaccgcccgc ggctcgggca gctctgcaga gacgtcgtgg cggcagggcc 240
agcacccatt ggtccgccac agccctccgc cctccccctc gccacgctta ttggccggag 300
cggcggcgct cgccgggtag gcggtggcgg cgtccctccc ttgcgccggc cctcaagagg 360
cgacgaggaa gcggccgcct ccctgcgccc cgcccctccg gctagctcgc tggctcccgg 420
ctcctcccga cgtctcctac ctcctcacgg ctcttcccgg cgctctcctg gctcccttct 480
gccccagctc cgtctcggcg gcggcgggca gttgcagtgg tgcagaatgg ctgacctcag 540
tcttgcagat gcattaacag aaccatctcc agacattgag ggagagataa agcgggactt 600
cattgccaca ctagaggcag aggcctttga tgatgttgtg ggagaaactg ttggaaaaac 660
agactatatt cctctcctgg atgttgatga gaaaaccggg aactcagagt caaagaagaa 720
accgtgctca gaaactagcc agattgaaga tactccatct tctaaaccaa cactcctagc 780
caatggtggt catggagtag aagggagcga tactacagaa gcctagcgtg tctctcaaca 840
ctggggctgc tgcaacacca gaccagtgat ctttcctaag catcgttata cttctaaaac 900
cttcagcatt ttgcagagct ttgcttttca ttcctggaca tgatgtagaa gaaactgagg 960
gtagttcttc ggggcctatt tctgctgatg cctgagcaaa caacctgctt cctcttgtgc 1020
tctgcagggt ttgatggagc ctcatttccc tttgtgaaca caaagtgcaa aatgaattct 1080
ttttaatttt agtaattttt acaaaggtta tctaatgtct tttatttctt gttttcttta 1140
tgattttatc atttgattca ttctcacatt tttttccttt aaatattttt agttgacctt 1200
tttcctttgg ttttcaaatg ttcaacatga atcagaatag tgtaacacca aatgagaaca 1260
tgtgttttca taaaggggtt gaggccacca gtactgcagc gaatttcctt ttcttctccc 1320
tcctccttcc ttctctgagc ttgcttttag ggaaggttaa tcttacaggc tacctatgtt 1380
tctctccacc ttactaaaat ctaaataatg atagatattt taagttttta aattgagtag 1440
ttctgagtaa tcctagaata tttttccaaa ttaaataatc ctttattatt tgcaagttgg 1500
gccaaatttt tttttttttg gagacggact cttaacaatc taagattgtt tcaacaggac 1560
tttcttattc ccattcctaa ttttttcaaa ctaattgctt aaatctagaa ccagttgaga 1620
ttagtactgt acaatggtat gctttgattg tatttataga aatataacat aaaacatgga 1680
ccatgttttg aaatcttaga ggaattctgg tttaaaatct gaaatacttt aaagttttct 1740
atccttttac tgattatgca gcttcttata acccccaagg tacagattat ttcagcttaa 1800
aagaaataat tggcaccatg ttctgagaaa gattttgaga tatacattgt tttttgtttt 1860
tgagacaggg tctcactctt gcctaggctg gagtgcggtg gcgcgatctt ggcttactgc 1920
accctctgcc tcccaggttc aagtggttct cctgcctcag cctcccaagt agctgggatt 1980
ataggtgtgc gccaccacac cagctaattt ttgtattttt agtagagacg gggttttact 2040
ttgttggcca ggctggtctc gaactcctga tctcaagtga tccacccgcc ttggccaccc 2100
aaagtgctgg gattacaggt gtgagacact gtgcctggcc agatatacat tgttttagat 2160
cccctgatac agaactactt ttgagatggt aagattagaa tatcatgaaa gtttaaactg 2220
aatccttgca gcgacttccg gaatttagga agcattccct cttctacagg ggtctggtca 2280
caagggctgg attctctgac aaaaatttct tctatggatt ctggacagaa gacacttgag 2340
ggtgatatgt tttaaaggaa agaggttatg cttatcttct tagcagttga taaaatatta 2400
aaactctctt gccatagaga atacaccatc aaagaaaaca caaccctttc cctttggtgt 2460
acagttattt attaagttga ttttggggtt tctttcgcca gggatctttt caaaactggt 2520
agtagttatt tttaaaaatc atgtttgaca tctttctatt gctcgtaacc agtccctgta 2580
gctgtctaag ttatgggtgg agaagcctgg gtatgacttt ccgttgtgta cactcacact 2640
tcatgattga catttattta ttcttttatt tccatttggt tatgcttatt tttgtttgaa 2700
atttgttttt ttcaaatatg tttccttttt gaacttacag aattgttgaa attttctact 2760
aacagccagc taaaatttgg tatatgttag ctctatctgt ttcacttgga cgtttcattt 2820
tgaaagaaag aaattttatg tttcacatat agttttatac aaagtagcca gtcccataat 2880
gaaatgctgt attgccatag tggtcacacc caagtggtcc agtatctcaa tggtgaggca 2940
gccagactgg tcagggctgc tttgttgaaa tgtgatgatt ttcatatgcc ttctttctct 3000
ttctctctct cttttttttt ccttttttgg cccaatgttg aagatgtaga actttgtttt 3060
taaataatgt ttttataatt tcattcgtat acctaagttt gtattttttg tgactttgga 3120
cttcaacagt ttgtatattg ggacttctaa tgtgattact gtactaaata aattccacta 3180
ataaacatct tacattaaca ccttaaaaaa aaaaaaaaaa aaaa 3224
<210> 83
<211> 360
<212> PRT
<213> Homo sapiens
<400> 83
Met Ala Ala Ala Ala Ala Ala Gly Ala Gly Pro Glu Met Val Arg Gly
1 5 10 15
Gln Val Phe Asp Val Gly Pro Arg Tyr Thr Asn Leu Ser Tyr Ile Gly
20 25 30
Glu Gly Ala Tyr Gly Met Val Cys Ser Ala Tyr Asp Asn Val Asn Lys
35 40 45
Val Arg Val Ala Ile Lys Lys Ile Ser Pro Phe Glu His Gln Thr Tyr
50 55 60
Cys Gln Arg Thr Leu Arg Glu Ile Lys Ile Leu Leu Arg Phe Arg His
65 70 75 80
Glu Asn Ile Ile Gly Ile Asn Asp Ile Ile Arg Ala Pro Thr Ile Glu
85 90 95
Gln Met Lys Asp Val Tyr Ile Val Gln Asp Leu Met Glu Thr Asp Leu
100 105 110
Tyr Lys Leu Leu Lys Thr Gln His Leu Ser Asn Asp His Ile Cys Tyr
115 120 125
Phe Leu Tyr Gln Ile Leu Arg Gly Leu Lys Tyr Ile His Ser Ala Asn
130 135 140
Val Leu His Arg Asp Leu Lys Pro Ser Asn Leu Leu Leu Asn Thr Thr
145 150 155 160
Cys Asp Leu Lys Ile Cys Asp Phe Gly Leu Ala Arg Val Ala Asp Pro
165 170 175
Asp His Asp His Thr Gly Phe Leu Thr Glu Tyr Val Ala Thr Arg Trp
180 185 190
Tyr Arg Ala Pro Glu Ile Met Leu Asn Ser Lys Gly Tyr Thr Lys Ser
195 200 205
Ile Asp Ile Trp Ser Val Gly Cys Ile Leu Ala Glu Met Leu Ser Asn
210 215 220
Arg Pro Ile Phe Pro Gly Lys His Tyr Leu Asp Gln Leu Asn His Ile
225 230 235 240
Leu Gly Ile Leu Gly Ser Pro Ser Gln Glu Asp Leu Asn Cys Ile Ile
245 250 255
Asn Leu Lys Ala Arg Asn Tyr Leu Leu Ser Leu Pro His Lys Asn Lys
260 265 270
Val Pro Trp Asn Arg Leu Phe Pro Asn Ala Asp Ser Lys Ala Leu Asp
275 280 285
Leu Leu Asp Lys Met Leu Thr Phe Asn Pro His Lys Arg Ile Glu Val
290 295 300
Glu Gln Ala Leu Ala His Pro Tyr Leu Glu Gln Tyr Tyr Asp Pro Ser
305 310 315 320
Asp Glu Pro Ile Ala Glu Ala Pro Phe Lys Phe Asp Met Glu Leu Asp
325 330 335
Asp Leu Pro Lys Glu Lys Leu Lys Glu Leu Ile Phe Glu Glu Thr Ala
340 345 350
Arg Phe Gln Pro Gly Tyr Arg Ser
355 360
<210> 84
<211> 5916
<212> DNA
<213> Homo sapiens
<400> 84
gcccctccct ccgcccgccc gccggcccgc ccgtcagtct ggcaggcagg caggcaatcg 60
gtccgagtgg ctgtcggctc ttcagctctc ccgctcggcg tcttccttcc tcctcccggt 120
cagcgtcggc ggctgcaccg gcggcggcgc agtccctgcg ggaggggcga caagagctga 180
gcggcggccg ccgagcgtcg agctcagcgc ggcggaggcg gcggcggccc ggcagccaac 240
atggcggcgg cggcggcggc gggcgcgggc ccggagatgg tccgcgggca ggtgttcgac 300
gtggggccgc gctacaccaa cctctcgtac atcggcgagg gcgcctacgg catggtgtgc 360
tctgcttatg ataatgtcaa caaagttcga gtagctatca agaaaatcag cccctttgag 420
caccagacct actgccagag aaccctgagg gagataaaaa tcttactgcg cttcagacat 480
gagaacatca ttggaatcaa tgacattatt cgagcaccaa ccatcgagca aatgaaagat 540
gtatatatag tacaggacct catggaaaca gatctttaca agctcttgaa gacacaacac 600
ctcagcaatg accatatctg ctattttctc taccagatcc tcagagggtt aaaatatatc 660
cattcagcta acgttctgca ccgtgacctc aagccttcca acctgctgct caacaccacc 720
tgtgatctca agatctgtga ctttggcctg gcccgtgttg cagatccaga ccatgatcac 780
acagggttcc tgacagaata tgtggccaca cgttggtaca gggctccaga aattatgttg 840
aattccaagg gctacaccaa gtccattgat atttggtctg taggctgcat tctggcagaa 900
atgctttcta acaggcccat ctttccaggg aagcattatc ttgaccagct gaaccacatt 960
ttgggtattc ttggatcccc atcacaagaa gacctgaatt gtataataaa tttaaaagct 1020
aggaactatt tgctttctct tccacacaaa aataaggtgc catggaacag gctgttccca 1080
aatgctgact ccaaagctct ggacttattg gacaaaatgt tgacattcaa cccacacaag 1140
aggattgaag tagaacaggc tctggcccac ccatatctgg agcagtatta cgacccgagt 1200
gacgagccca tcgccgaagc accattcaag ttcgacatgg aattggatga cttgcctaag 1260
gaaaagctca aagaactaat ttttgaagag actgctagat tccagccagg atacagatct 1320
taaatttgtc aggacaaggg ctcagaggac tggacgtgct cagacatcgg tgttcttctt 1380
cccagttctt gacccctggt cctgtctcca gcccgtcttg gcttatccac tttgactcct 1440
ttgagccgtt tggaggggcg gtttctggta gttgtggctt ttatgctttc aaagaatttc 1500
ttcagtccag agaattcctc ctggcagccc tgtgtgtgtc acccattggt gacctgcggc 1560
agtatgtact tcagtgcacc tactgcttac tgttgcttta gtcactaatt gctttctggt 1620
ttgaaagatg cagtggttcc tccctctcct gaatcctttt ctacatgatg ccctgctgac 1680
catgcagccg caccagagag agattcttcc ccaattggct ctagtcactg gcatctcact 1740
ttatgatagg gaaggctact acctagggca ctttaagtca gtgacagccc cttatttgca 1800
cttcaccttt tgaccataac tgtttcccca gagcaggagc ttgtggaaat accttggctg 1860
atgttgcagc ctgcagcaag tgcttccgtc tccggaatcc ttggggagca cttgtccacg 1920
tcttttctca tatcatggta gtcactaaca tatataaggt atgtgctatt ggcccagctt 1980
ttagaaaatg cagtcatttt tctaaataaa aaggaagtac tgcacccagc agtgtcactc 2040
tgtagttact gtggtcactt gtaccatata gaggtgtaac acttgtcaag aagcgttatg 2100
tgcagtactt aatgtttgta agacttacaa aaaaagattt aaagtggcag cttcactcga 2160
catttggtga gagaagtaca aaggttgcag tgctgagctg tgggcggttt ctggggatgt 2220
cccagggtgg aactccacat gctggtgcat atacgccctt gagctacttc aaatgtgggt 2280
gtttcagtaa ccacgttcca tgcctgagga tttagcagag aggaacactg cgtctttaaa 2340
tgagaaagta tacaattctt tttccttcta cagcatgtca gcatctcaag ttcatttttc 2400
aacctacagt ataacaattt gtaataaagc ctccaggagc tcatgacgtg aagcactgtt 2460
ctgtcctcaa gtactcaaat atttctgata ctgctgagtc agactgtcag aaaaagctag 2520
cactaactcg tgtttggagc tctatccata ttttactgat ctctttaagt atttgttcct 2580
gccactgtgt actgtggagt tgactcggtg ttctgtccca gtgcggtgcc tcctcttgac 2640
ttccccactg ctctctgtgg tgagaaattt gccttgttca ataattactg taccctcgca 2700
tgactgttac agctttctgt gcagagatga ctgtccaagt gccacatgcc tacgattgaa 2760
atgaaaactc tattgttacc tctgagttgt gttccacgga aaatgctatc cagcagatca 2820
tttaggaaaa ataattctat ttttagcttt tcatttctca gctgtccttt tttcttgttt 2880
gatttttgac agcaatggag aatgggttat ataaagactg cctgctaata tgaacagaaa 2940
tgcatttgta attcatgaaa ataaatgtac atcttctatc ttcacattca tgttaagatt 3000
cagtgttgct ttcctctgga tcagcgtgtc tgaatggaca gtcaggttca ggttgtgctg 3060
aacacagaaa tgctcacagg cctcactttg ccgcccaggc actggcccag cacttggatt 3120
tacataagat gagttagaaa ggtacttctg tagggtcctt tttacctctg ctcggcagag 3180
aatcgatgct gtcatgttcc tttattcaca atcttaggtc tcaaatattc tgtcaaaccc 3240
taacaaagaa gccccgacat ctcaggttgg attccctggt tctctctaaa gagggcctgc 3300
ccttgtgccc cagaggtgct gctgggcaca gccaagagtt gggaagggcc gccccacagt 3360
acgcagtcct caccacccag cccagggtgc tcacgctcac cactcctgtg gctgaggaag 3420
gatagctggc tcatcctcgg aaaacagacc cacatctcta ttcttgccct gaaatacgcg 3480
cttttcactt gcgtgctcag agctgccgtc tgaaggtcca cacagcattg acgggacaca 3540
gaaatgtgac tgttaccgga taacactgat tagtcagttt tcatttataa aaaagcattg 3600
acagttttat tactcttgtt tctttttaaa tggaaagtta ctattataag gttaatttgg 3660
agtcctcttc taaatagaaa accatatcct tggctactaa catctggaga ctgtgagctc 3720
cttcccattc cccttcctgg tactgtggag tcagattggc atgaaaccac taacttcatt 3780
ctagaatcat tgtagccata agttgtgtgc tttttattaa tcatgccaaa cataatgtaa 3840
ctgggcagag aatggtccta accaaggtac ctatgaaaag cgctagctat catgtgtagt 3900
agatgcatca ttttggctct tcttacattt gtaaaaatgt acagattagg tcatcttaat 3960
tcatattagt gacacggaac agcacctcca ctatttgtat gttcaaataa gctttcagac 4020
taatagcttt tttggtgtct aaaatgtaag caaaaaattc ctgctgaaac attccagtcc 4080
tttcatttag tataaaagaa atactgaaca agccagtggg atggaattga aagaactaat 4140
catgaggact ctgtcctgac acaggtcctc aaagctagca gagatacgca gacattgtgg 4200
catctgggta gaagaatact gtattgtgtg tgcagtgcac agtgtgtggt gtgtgcacac 4260
tcattccttc tgctcttggg cacaggcagt gggtgtagag gtaaccagta gctttgagaa 4320
gctacatgta gctcaccagt ggttttctct aaggaatcac aaaagtaaac tacccaacca 4380
catgccacgt aatatttcag ccattcagag gaaactgttt tctctttatt tgcttatatg 4440
ttaatatggt ttttaaattg gtaactttta tatagtatgg taacagtatg ttaatacaca 4500
catacatacg cacacatgct ttgggtcctt ccataatact tttatatttg taaatcaatg 4560
ttttggagca atcccaagtt taagggaaat atttttgtaa atgtaatggt tttgaaaatc 4620
tgagcaatcc ttttgcttat acatttttaa agcatttgtg ctttaaaatt gttatgctgg 4680
tgtttgaaac atgatactcc tgtggtgcag atgagaagct ataacagtga atatgtggtt 4740
tctcttacgt catccacctt gacatgatgg gtcagaaaca aatggaaatc cagagcaagt 4800
cctccagggt tgcaccaggt ttacctaaag cttgttgcct tttcttgtgc tgtttatgcg 4860
tgtagagcac tcaagaaagt tctgaaactg ctttgtatct gctttgtact gttggtgcct 4920
tcttggtatt gtaccccaaa attctgcata gattatttag tataatggta agttaaaaaa 4980
tgttaaagga agattttatt aagaatctga atgtttattc attatattgt tacaatttaa 5040
cattaacatt tatttgtggt atttgtgatt tggttaatct gtataaaaat tgtaagtaga 5100
aaggtttata tttcatctta attcttttga tgttgtaaac gtacttttta aaagatggat 5160
tatttgaatg tttatggcac ctgacttgta aaaaaaaaaa actacaaaaa aatccttaga 5220
atcattaaat tgtgtccctg tattaccaaa ataacacagc accgtgcatg tatagtttaa 5280
ttgcagtttc atctgtgaaa acgtgaaatt gtctagtcct tcgttatgtt ccccagatgt 5340
cttccagatt tgctctgcat gtggtaactt gtgttagggc tgtgagctgt tcctcgagtt 5400
gaatggggat gtcagtgctc ctagggttct ccaggtggtt cttcagacct tcacctgtgg 5460
gggggggggt aggcggtgcc cacgcccatc tcctcatcct cctgaacttc tgcaacccca 5520
ctgctgggca gacatcctgg gcaacccctt ttttcagagc aagaagtcat aaagatagga 5580
tttcttggac atttggttct tatcaatatt gggcattatg taatgactta tttacaaaac 5640
aaagatactg gaaaatgttt tggatgtggt gttatggaaa gagcacaggc cttggaccca 5700
tccagctggg ttcagaacta ccccctgctt ataactgcgg ctggctgtgg gccagtcatt 5760
ctgcgtctct gctttcttcc tctgcttcag actgtcagct gtaaagtgga agcaatatta 5820
cttgccttgt atatggtaaa gattataaaa atacatttca actgttcagc atagtacttc 5880
aaagcaagta ctcagtaaat agcaagtctt tttaaa 5916
<210> 85
<211> 360
<212> PRT
<213> Homo sapiens
<400> 85
Met Ala Ala Ala Ala Ala Ala Gly Ala Gly Pro Glu Met Val Arg Gly
1 5 10 15
Gln Val Phe Asp Val Gly Pro Arg Tyr Thr Asn Leu Ser Tyr Ile Gly
20 25 30
Glu Gly Ala Tyr Gly Met Val Cys Ser Ala Tyr Asp Asn Val Asn Lys
35 40 45
Val Arg Val Ala Ile Lys Lys Ile Ser Pro Phe Glu His Gln Thr Tyr
50 55 60
Cys Gln Arg Thr Leu Arg Glu Ile Lys Ile Leu Leu Arg Phe Arg His
65 70 75 80
Glu Asn Ile Ile Gly Ile Asn Asp Ile Ile Arg Ala Pro Thr Ile Glu
85 90 95
Gln Met Lys Asp Val Tyr Ile Val Gln Asp Leu Met Glu Thr Asp Leu
100 105 110
Tyr Lys Leu Leu Lys Thr Gln His Leu Ser Asn Asp His Ile Cys Tyr
115 120 125
Phe Leu Tyr Gln Ile Leu Arg Gly Leu Lys Tyr Ile His Ser Ala Asn
130 135 140
Val Leu His Arg Asp Leu Lys Pro Ser Asn Leu Leu Leu Asn Thr Thr
145 150 155 160
Cys Asp Leu Lys Ile Cys Asp Phe Gly Leu Ala Arg Val Ala Asp Pro
165 170 175
Asp His Asp His Thr Gly Phe Leu Thr Glu Tyr Val Ala Thr Arg Trp
180 185 190
Tyr Arg Ala Pro Glu Ile Met Leu Asn Ser Lys Gly Tyr Thr Lys Ser
195 200 205
Ile Asp Ile Trp Ser Val Gly Cys Ile Leu Ala Glu Met Leu Ser Asn
210 215 220
Arg Pro Ile Phe Pro Gly Lys His Tyr Leu Asp Gln Leu Asn His Ile
225 230 235 240
Leu Gly Ile Leu Gly Ser Pro Ser Gln Glu Asp Leu Asn Cys Ile Ile
245 250 255
Asn Leu Lys Ala Arg Asn Tyr Leu Leu Ser Leu Pro His Lys Asn Lys
260 265 270
Val Pro Trp Asn Arg Leu Phe Pro Asn Ala Asp Ser Lys Ala Leu Asp
275 280 285
Leu Leu Asp Lys Met Leu Thr Phe Asn Pro His Lys Arg Ile Glu Val
290 295 300
Glu Gln Ala Leu Ala His Pro Tyr Leu Glu Gln Tyr Tyr Asp Pro Ser
305 310 315 320
Asp Glu Pro Ile Ala Glu Ala Pro Phe Lys Phe Asp Met Glu Leu Asp
325 330 335
Asp Leu Pro Lys Glu Lys Leu Lys Glu Leu Ile Phe Glu Glu Thr Ala
340 345 350
Arg Phe Gln Pro Gly Tyr Arg Ser
355 360
<210> 86
<211> 1499
<212> DNA
<213> Homo sapiens
<400> 86
gcccctccct ccgcccgccc gccggcccgc ccgtcagtct ggcaggcagg caggcaatcg 60
gtccgagtgg ctgtcggctc ttcagctctc ccgctcggcg tcttccttcc tcctcccggt 120
cagcgtcggc ggctgcaccg gcggcggcgc agtccctgcg ggaggggcga caagagctga 180
gcggcggccg ccgagcgtcg agctcagcgc ggcggaggcg gcggcggccc ggcagccaac 240
atggcggcgg cggcggcggc gggcgcgggc ccggagatgg tccgcgggca ggtgttcgac 300
gtggggccgc gctacaccaa cctctcgtac atcggcgagg gcgcctacgg catggtgtgc 360
tctgcttatg ataatgtcaa caaagttcga gtagctatca agaaaatcag cccctttgag 420
caccagacct actgccagag aaccctgagg gagataaaaa tcttactgcg cttcagacat 480
gagaacatca ttggaatcaa tgacattatt cgagcaccaa ccatcgagca aatgaaagat 540
gtatatatag tacaggacct catggaaaca gatctttaca agctcttgaa gacacaacac 600
ctcagcaatg accatatctg ctattttctc taccagatcc tcagagggtt aaaatatatc 660
cattcagcta acgttctgca ccgtgacctc aagccttcca acctgctgct caacaccacc 720
tgtgatctca agatctgtga ctttggcctg gcccgtgttg cagatccaga ccatgatcac 780
acagggttcc tgacagaata tgtggccaca cgttggtaca gggctccaga aattatgttg 840
aattccaagg gctacaccaa gtccattgat atttggtctg taggctgcat tctggcagaa 900
atgctttcta acaggcccat ctttccaggg aagcattatc ttgaccagct gaaccacatt 960
ttgggtattc ttggatcccc atcacaagaa gacctgaatt gtataataaa tttaaaagct 1020
aggaactatt tgctttctct tccacacaaa aataaggtgc catggaacag gctgttccca 1080
aatgctgact ccaaagctct ggacttattg gacaaaatgt tgacattcaa cccacacaag 1140
aggattgaag tagaacaggc tctggcccac ccatatctgg agcagtatta cgacccgagt 1200
gacgagccca tcgccgaagc accattcaag ttcgacatgg aattggatga cttgcctaag 1260
gaaaagctca aagaactaat ttttgaagag actgctagat tccagccagg atacagatct 1320
taaatttgtc aggtacctgg agtttaatac agtgagctct agcaagggag gcgctgcctt 1380
ttgtttctag aatattatgt tcctcaaggt ccattatttt gtattctttt ccaagctcct 1440
tattggaagg tattttttta aatttagaat taaaaattat ttagaaagtt acatataaa 1499
<210> 87
<211> 332
<212> PRT
<213> Homo sapiens
<400> 87
Met Gly Ala Gln Phe Ser Lys Thr Ala Ala Lys Gly Glu Ala Ala Ala
1 5 10 15
Glu Arg Pro Gly Glu Ala Ala Val Ala Ser Ser Pro Ser Lys Ala Asn
20 25 30
Gly Gln Glu Asn Gly His Val Lys Val Asn Gly Asp Ala Ser Pro Ala
35 40 45
Ala Ala Glu Ser Gly Ala Lys Glu Glu Leu Gln Ala Asn Gly Ser Ala
50 55 60
Pro Ala Ala Asp Lys Glu Glu Pro Ala Ala Ala Gly Ser Gly Ala Ala
65 70 75 80
Ser Pro Ser Ala Ala Glu Lys Gly Glu Pro Ala Ala Ala Ala Ala Pro
85 90 95
Glu Ala Gly Ala Ser Pro Val Glu Lys Glu Ala Pro Ala Glu Gly Glu
100 105 110
Ala Ala Glu Pro Gly Ser Pro Thr Ala Ala Glu Gly Glu Ala Ala Ser
115 120 125
Ala Ala Ser Ser Thr Ser Ser Pro Lys Ala Glu Asp Gly Ala Thr Pro
130 135 140
Ser Pro Ser Asn Glu Thr Pro Lys Lys Lys Lys Lys Arg Phe Ser Phe
145 150 155 160
Lys Lys Ser Phe Lys Leu Ser Gly Phe Ser Phe Lys Lys Asn Lys Lys
165 170 175
Glu Ala Gly Glu Gly Gly Glu Ala Glu Ala Pro Ala Ala Glu Gly Gly
180 185 190
Lys Asp Glu Ala Ala Gly Gly Ala Ala Ala Ala Ala Ala Glu Ala Gly
195 200 205
Ala Ala Ser Gly Glu Gln Ala Ala Ala Pro Gly Glu Glu Ala Ala Ala
210 215 220
Gly Glu Glu Gly Ala Ala Gly Gly Asp Pro Gln Glu Ala Lys Pro Gln
225 230 235 240
Glu Ala Ala Val Ala Pro Glu Lys Pro Pro Ala Ser Asp Glu Thr Lys
245 250 255
Ala Ala Glu Glu Pro Ser Lys Val Glu Glu Lys Lys Ala Glu Glu Ala
260 265 270
Gly Ala Ser Ala Ala Ala Cys Glu Ala Pro Ser Ala Ala Gly Pro Gly
275 280 285
Ala Pro Pro Glu Gln Glu Ala Ala Pro Ala Glu Glu Pro Ala Ala Ala
290 295 300
Ala Ala Ser Ser Ala Cys Ala Ala Pro Ser Gln Glu Ala Gln Pro Glu
305 310 315 320
Cys Ser Pro Glu Ala Pro Pro Ala Glu Ala Ala Glu
325 330
<210> 88
<211> 4304
<212> DNA
<213> Homo sapiens
<400> 88
cttgggcgtt ggaccccgca tcttattagc aaccagggag atttctccat tttcctcttg 60
tctacagtgc ggctacaaat ctgggatttt tttattactt cttttttttt cgaactacac 120
ttgggctcct ttttttgtgc tcgacttttc cacccttttt ccctccctcc tgtgctgctg 180
ctttttgatc tcttcgacta aaattttttt atccggagtg tatttaatcg gttctgttct 240
gtcctctcca ccacccccac ccccctccct ccggtgtgtg tgccgctgcc gctgttgccg 300
ccgccgctgc tgctgctcgc cccgtcgtta caccaacccg aggctctttg tttcccctct 360
tggatctgtt gagtttcttt gttgaagaag ccagcatggg tgcccagttc tccaagaccg 420
cagcgaaggg agaagccgcc gcggagaggc ctggggaggc ggctgtggcc tcgtcgcctt 480
ccaaagcgaa cggacaggag aatggccacg tgaaggtaaa cggcgacgct tcgcccgcgg 540
ccgccgagtc gggcgccaag gaggagctgc aggccaacgg cagcgccccg gccgccgaca 600
aggaggagcc cgcggccgcc gggagcgggg cggcgtcgcc ctccgcggcc gagaaaggtg 660
agccggccgc cgccgctgcc cccgaggccg gggccagccc ggtagagaag gaggcccccg 720
cggaaggcga ggctgccgag cccggctcgc ccacggccgc ggagggagag gccgcgtcgg 780
ccgcctcctc gacttcttcg cccaaggccg aggacggggc cacgccctcg cccagcaacg 840
agaccccgaa aaaaaaaaag aagcgctttt ccttcaagaa gtctttcaag ctgagcggct 900
tctccttcaa gaagaacaag aaggaggctg gagaaggcgg tgaggctgag gcgcccgctg 960
ccgaaggcgg caaggacgag gccgccgggg gcgcagctgc ggccgccgcc gaggcgggcg 1020
cggcctccgg ggagcaggca gcggcgccgg gcgaggaggc ggcagcgggc gaggaggggg 1080
cggcgggtgg cgacccgcag gaggccaagc cccaggaggc cgctgtcgcg ccagagaagc 1140
cgcccgccag cgacgagacc aaggccgccg aggagcccag caaggtggag gagaaaaagg 1200
ccgaggaggc cggggccagc gccgccgcct gcgaggcccc ctccgccgcc gggcccggcg 1260
cgcccccgga gcaggaggca gcccccgcgg aggagcccgc ggccgccgca gcctcgtcag 1320
cctgcgcagc cccctcacag gaggcccagc ccgagtgcag tccagaagcc cccccagcgg 1380
aggcggcaga gtaaaagagc aagcttttgt gagataatcg aagaactttt ctcccccgtt 1440
tgtttgttgg agtggtgcca ggtactggtt ttggagaact tgtctacaac cagggattga 1500
ttttaaagat gtcttttttt attttacttt tttttaagca ccaaattttg ttgttttttt 1560
tttttctccc ctccccacag atcccatctc aaatcattct gttaaccacc attccaacag 1620
gtcgaggaga gcttaaacac cttcttcctc tgccttgttt ctcttttatt ttttattttt 1680
tcgcatcagt attaatgttt ttgcatactt tgcatcttta ttcaaaagtg taaactttct 1740
ttgtcaatct atggacatgc ccatatatga aggagatggg tgggtcaaaa agggatatca 1800
aatgaagtga taggggtcac aatggggaaa ttgaagtggt gcataacatt gccaaaatag 1860
tgtgccacta gaaatggtgt aaaggctgtc tttttttttt ttttttaaag aaaagttatt 1920
accatgtatt ttgtgaggca ggtttacaac actacaagtc ttgagttaag aaggaaagag 1980
gaaaaaagaa aaaacaccaa tacccagatt taaaaaaaaa aaaacgatca tagtcttagg 2040
agttcattta aaccatagga acttttcact tatctcatgt tagctgtacc agtcagtgat 2100
taagtagaac tacaagttgt ataggcttta ttgtttattg ctggtttatg accttaataa 2160
agtgtaatta tgtattacca gcagggtgtt tttaactgtg actattgtat aaaaacaaat 2220
cttgatatcc agaagcacat gaagtttgca actttccacc ctgcccattt ttgtaaaact 2280
gcagtcatct tggacctttt aaaacacaaa ttttaaactc aaccaagctg tgataagtgg 2340
aatggttact gtttatactg tggtatgttt ttgattacag cagataatgc tttcttttcc 2400
agtcgtcttt gagaataaag gaaaaaaaaa tcttcagatg caatggtttt gtgtagcatc 2460
ttgtctatca tgttttgtaa atactggaga agctttgacc aatttgactt agagatggaa 2520
tgtaactttg cttacaaaaa ttgctattaa actcctgctt aaggtgttct aattttctgt 2580
gagcacacta aaagcgaaaa ataaatgtga ataaaatgta caaatttgtt gtgttttttt 2640
atgttctaat aatactgaga cttctaggtc ttaggttaat ttttaggaag atcttgcatg 2700
ccatcaggag taaattttat tgtggttctt aatctgaagt tttcaagctc tgaaattcat 2760
aatccgcagt gtcagattac gtagaggaag atcttacaac attccatgtc aaatctgtta 2820
ccatttattg gcatttagtt ttcatttaag aattgaacat aattattttt attgtagcta 2880
tatagcatgt cagattaaat catttacaac aaaaggggtg tgaacctaag actatttaaa 2940
tgtcttatga gaaaatttca taaagccatt ctcttgtcat tcaggtccag aaacaaattt 3000
taaactgagt gagagtctat agaatccata ctgcagatgg gtcatgaaat gtgaccaaat 3060
gtgtttcaaa aattgatggt gtattacctg ctattgtaat tgcttagtgc ttggctaatt 3120
tccaaattat tgcataatat gttctacctt aagaaaacag gtttatgtaa caaagtaatg 3180
gtgttgaatg gatgatgtca gttcatgggc ctttagcata gttttaagca tcattttttt 3240
tttttttttt gaaagtgtgt tagcatcttg ttactcaaag gataagacag acaataatac 3300
ttcactgaat attaataatc tttactagtt tacctcctct gctctttgcc acccgataac 3360
tggatatctt ttccttcaaa ggaccctaaa ctgattgaaa tttaagatat gtatcaaaaa 3420
cattatttca tttaatgcac atctgttttg ctgtttttga gcagtgtgca gtttagggtt 3480
catgataaat cattgaacca catgtgtaac aactgaatgc caaatcttaa actcattaga 3540
aaaataacaa attaggtttt gacacgcatt cttaattgga ataatggatc aaaaatagtg 3600
gttcatgacc ttaccaaaca cccttgctac taataaaatc aaataacact tagaagggta 3660
tgtattttta gttagggttt cttgatcttg gaggatgttt gaaagttaaa aattgaattt 3720
ggtaaccaaa ggactgattt atgggtcttt cctatcttaa ccaacgtttt cttagttacc 3780
tagatggcca agtacagtgc ctggtatgta gtaagactca gtaaaaaagt ggatttttaa 3840
aaataactcc caaagtgaat agtcaaaaat cctgttagca aactgttata tattgctaag 3900
tttgttcttt taacagctgg aatttattaa gatgcattat tttgatttta ttcactgcct 3960
aaaacacttt gggtggtatt gatggagttg gtggattttc ctccaagtga ttaaatgaaa 4020
tttgacgtat cttttcatcc aaagttttgt acatcatgtt ttctaacgga aaaaaatgtt 4080
aatatggctt ttttgtatta ctaaaaatag ctttgagatt aaggaaaaat aaataactct 4140
tgtacagttc agtattgtct attaaatctg tattggcagt atgtataatg gcatttgctg 4200
tggttacaaa atacttcctc tgggttataa taatcatttg atccaattcc tattgcttgt 4260
aaaataaagt tttaccagtt gatataatca aaaaaaaaaa aaaa 4304
<210> 89
<211> 152
<212> PRT
<213> Homo sapiens
<400> 89
Met Ala Asn Cys Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val
1 5 10 15
Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly
20 25 30
Phe Arg Leu Val Gly Leu Lys Phe Met Gln Ala Ser Glu Asp Leu Leu
35 40 45
Lys Glu His Tyr Val Asp Leu Lys Asp Arg Pro Phe Phe Ala Gly Leu
50 55 60
Val Lys Tyr Met His Ser Gly Pro Val Val Ala Met Val Trp Glu Gly
65 70 75 80
Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro
85 90 95
Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val
100 105 110
Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Glu Ser Ala Glu Lys
115 120 125
Glu Ile Gly Leu Trp Phe His Pro Glu Glu Leu Val Asp Tyr Thr Ser
130 135 140
Cys Ala Gln Asn Trp Ile Tyr Glu
145 150
<210> 90
<211> 811
<212> DNA
<213> Homo sapiens
<400> 90
gcagaagcgt tccgtgcgtg caagtgctgc gaaccacgtg ggtcccgggc gcgtttcggg 60
tgctggcggc tgcagccgga gttcaaacct aagcagctgg aaggaaccat ggccaactgt 120
gagcgtacct tcattgcgat caaaccagat ggggtccagc ggggtcttgt gggagagatt 180
atcaagcgtt ttgagcagaa aggattccgc cttgttggtc tgaaattcat gcaagcttcc 240
gaagatcttc tcaaggaaca ctacgttgac ctgaaggacc gtccattctt tgccggcctg 300
gtgaaataca tgcactcagg gccggtagtt gccatggtct gggaggggct gaatgtggtg 360
aagacgggcc gagtcatgct cggggagacc aaccctgcag actccaagcc tgggaccatc 420
cgtggagact tctgcataca agttggcagg aacattatac atggcagtga ttctgtggag 480
agtgcagaga aggagatcgg cttgtggttt caccctgagg aactggtaga ttacacgagc 540
tgtgctcaga actggatcta tgaatgacag gagggcagac cacattgctt ttcacatcca 600
tttcccctcc ttcccatggg cagaggacca ggctgtagga aatctagtta tttacaggaa 660
cttcatcata atttggaggg aagctcttgg agctgtgagt tctccctgta cagtgttacc 720
atccccgacc atctgattaa aatgcttcct cccagcatag gattcattga gttggttact 780
tcatattgtt gcattgcttt tttttccttc t 811
<210> 91
<211> 177
<212> PRT
<213> Homo sapiens
<400> 91
Met Val Leu Leu Ser Thr Leu Gly Ile Val Phe Gln Gly Glu Gly Pro
1 5 10 15
Pro Ile Ser Ser Cys Asp Thr Gly Thr Met Ala Asn Cys Glu Arg Thr
20 25 30
Phe Ile Ala Ile Lys Pro Asp Gly Val Gln Arg Gly Leu Val Gly Glu
35 40 45
Ile Ile Lys Arg Phe Glu Gln Lys Gly Phe Arg Leu Val Gly Leu Lys
50 55 60
Phe Met Gln Ala Ser Glu Asp Leu Leu Lys Glu His Tyr Val Asp Leu
65 70 75 80
Lys Asp Arg Pro Phe Phe Ala Gly Leu Val Lys Tyr Met His Ser Gly
85 90 95
Pro Val Val Ala Met Val Trp Glu Gly Leu Asn Val Val Lys Thr Gly
100 105 110
Arg Val Met Leu Gly Glu Thr Asn Pro Ala Asp Ser Lys Pro Gly Thr
115 120 125
Ile Arg Gly Asp Phe Cys Ile Gln Val Gly Arg Asn Ile Ile His Gly
130 135 140
Ser Asp Ser Val Glu Ser Ala Glu Lys Glu Ile Gly Leu Trp Phe His
145 150 155 160
Pro Glu Glu Leu Val Asp Tyr Thr Ser Cys Ala Gln Asn Trp Ile Tyr
165 170 175
Glu
<210> 92
<211> 1031
<212> DNA
<213> Homo sapiens
<400> 92
gcagaagcgt tccgtgcgtg caagtgctgc gaaccacgtg ggtcccgggc gcgtttcggg 60
tgctggcggc tgcagccgga gttcaaacct aagcagctgg aagggccctg tggctaggta 120
ccatagagtc tctacacagg actaagtcag cctggtgtgc aggggaggca gacacacaaa 180
cagaaaattg gactacagtg ctaagatgct gtaagaagag gttaactaaa ggacaggaag 240
atggggccaa gagatggtgc tactgtctac tttagggatc gtctttcaag gcgaggggcc 300
tcctatctca agctgtgata caggaaccat ggccaactgt gagcgtacct tcattgcgat 360
caaaccagat ggggtccagc ggggtcttgt gggagagatt atcaagcgtt ttgagcagaa 420
aggattccgc cttgttggtc tgaaattcat gcaagcttcc gaagatcttc tcaaggaaca 480
ctacgttgac ctgaaggacc gtccattctt tgccggcctg gtgaaataca tgcactcagg 540
gccggtagtt gccatggtct gggaggggct gaatgtggtg aagacgggcc gagtcatgct 600
cggggagacc aaccctgcag actccaagcc tgggaccatc cgtggagact tctgcataca 660
agttggcagg aacattatac atggcagtga ttctgtggag agtgcagaga aggagatcgg 720
cttgtggttt caccctgagg aactggtaga ttacacgagc tgtgctcaga actggatcta 780
tgaatgacag gagggcagac cacattgctt ttcacatcca tttcccctcc ttcccatggg 840
cagaggacca ggctgtagga aatctagtta tttacaggaa cttcatcata atttggaggg 900
aagctcttgg agctgtgagt tctccctgta cagtgttacc atccccgacc atctgattaa 960
aatgcttcct cccagcatag gattcattga gttggttact tcatattgtt gcattgcttt 1020
tttttccttc t 1031
<210> 93
<211> 152
<212> PRT
<213> Homo sapiens
<400> 93
Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val
1 5 10 15
Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly
20 25 30
Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu
35 40 45
Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu
50 55 60
Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Val Trp Glu Gly
65 70 75 80
Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro
85 90 95
Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val
100 105 110
Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Lys Ser Ala Glu Lys
115 120 125
Glu Ile Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Asp Tyr Lys Ser
130 135 140
Cys Ala His Asp Trp Val Tyr Glu
145 150
<210> 94
<211> 867
<212> DNA
<213> Homo sapiens
<400> 94
atctcagggc agtaccactg ctgtgcggct gtcagtcagt gctgcaggcg ccgagaggag 60
gggcttgtga ccgccccagg gaagctgggc atcaccaaag ggagcttgtt tgccagggac 120
actgcaagta ggaagtgtct acaggtcgat gacaggccta atctctatga cagggtctag 180
actttcctca gggtccaggg gcgcacctca gggtgaactg gaaaactcga ccgcacttta 240
gtgccaggac catggccaac ctggagcgca ccttcatcgc catcaagccg gacggcgtgc 300
agcgcggcct ggtgggcgag atcatcaagc gcttcgagca gaagggattc cgcctcgtgg 360
ccatgaagtt cctccgggcc tctgaagaac acctgaagca gcactacatt gacctgaaag 420
accgaccatt cttccctggg ctggtgaagt acatgaactc agggccggtt gtggccatgg 480
tctgggaggg gctgaacgtg gtgaagacag gccgagtgat gcttggggag accaatccag 540
cagattcaaa gccaggcacc attcgtgggg acttctgcat tcaggttggc aggaacatca 600
ttcatggcag tgattcagta aaaagtgctg aaaaagaaat cagcctatgg tttaagcctg 660
aagaactggt tgactacaag tcttgtgctc atgactgggt ctatgaataa gaggtggaca 720
caacagcagt ctccttcagc acggcgtggt gtgtccctgg acacagctct tcattccatt 780
gacttagagg caacaggatt gatcattctt ttatagagca tatttgccaa taaagctttt 840
ggaagccgga aaaaaaaaaa aaaaaaa 867
<210> 95
<211> 152
<212> PRT
<213> Homo sapiens
<400> 95
Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val
1 5 10 15
Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly
20 25 30
Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu
35 40 45
Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu
50 55 60
Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Val Trp Glu Gly
65 70 75 80
Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro
85 90 95
Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val
100 105 110
Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Lys Ser Ala Glu Lys
115 120 125
Glu Ile Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Asp Tyr Lys Ser
130 135 140
Cys Ala His Asp Trp Val Tyr Glu
145 150
<210> 96
<211> 763
<212> DNA
<213> Homo sapiens
<400> 96
gcggccgcgc gtggtggggg aggagggacc ggcggcgccc acgtggcctc cgcgggcccc 60
gccagagcct gcgcccgggc cctgaccgca cctctcgccc cgcaggacca tggccaacct 120
ggagcgcacc ttcatcgcca tcaagccgga cggcgtgcag cgcggcctgg tgggcgagat 180
catcaagcgc ttcgagcaga agggattccg cctcgtggcc atgaagttcc tccgggcctc 240
tgaagaacac ctgaagcagc actacattga cctgaaagac cgaccattct tccctgggct 300
ggtgaagtac atgaactcag ggccggttgt ggccatggtc tgggaggggc tgaacgtggt 360
gaagacaggc cgagtgatgc ttggggagac caatccagca gattcaaagc caggcaccat 420
tcgtggggac ttctgcattc aggttggcag gaacatcatt catggcagtg attcagtaaa 480
aagtgctgaa aaagaaatca gcctatggtt taagcctgaa gaactggttg actacaagtc 540
ttgtgctcat gactgggtct atgaataaga ggtggacaca acagcagtct ccttcagcac 600
ggcgtggtgt gtccctggac acagctcttc attccattga cttagaggca acaggattga 660
tcattctttt atagagcata tttgccaata aagcttttgg aagccggaaa aaaaaaaaaa 720
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 763
<210> 97
<211> 152
<212> PRT
<213> Homo sapiens
<400> 97
Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val
1 5 10 15
Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly
20 25 30
Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu
35 40 45
Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu
50 55 60
Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Val Trp Glu Gly
65 70 75 80
Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro
85 90 95
Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val
100 105 110
Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Lys Ser Ala Glu Lys
115 120 125
Glu Ile Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Asp Tyr Lys Ser
130 135 140
Cys Ala His Asp Trp Val Tyr Glu
145 150
<210> 98
<211> 682
<212> DNA
<213> Homo sapiens
<400> 98
aggcggtggg ggcgcatccc ctggcgactc ctcccgttcc ctcttccgct tgcgctgccg 60
caggaccatg gccaacctgg agcgcacctt catcgccatc aagccggacg gcgtgcagcg 120
cggcctggtg ggcgagatca tcaagcgctt cgagcagaag ggattccgcc tcgtggccat 180
gaagttcctc cgggcctctg aagaacacct gaagcagcac tacattgacc tgaaagaccg 240
accattcttc cctgggctgg tgaagtacat gaactcaggg ccggttgtgg ccatggtctg 300
ggaggggctg aacgtggtga agacaggccg agtgatgctt ggggagacca atccagcaga 360
ttcaaagcca ggcaccattc gtggggactt ctgcattcag gttggcagga acatcattca 420
tggcagtgat tcagtaaaaa gtgctgaaaa agaaatcagc ctatggttta agcctgaaga 480
actggttgac tacaagtctt gtgctcatga ctgggtctat gaataagagg tggacacaac 540
agcagtctcc ttcagcacgg cgtggtgtgt ccctggacac agctcttcat tccattgact 600
tagaggcaac aggattgatc attcttttat agagcatatt tgccaataaa gcttttggaa 660
gccggaaaaa aaaaaaaaaa aa 682
<210> 99
<211> 82
<212> PRT
<213> Homo sapiens
<400> 99
Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val
1 5 10 15
Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly
20 25 30
Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu
35 40 45
Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu
50 55 60
Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Glu His His Ser
65 70 75 80
Trp Gln
<210> 100
<211> 733
<212> DNA
<213> Homo sapiens
<400> 100
tgcctggcga gggcgcgccc cggctgggcg tggacactgt tctccggccg cgtcgggccg 60
ggcgggtggg gcgttcctgc gggttgggcg gctgggccct ccggggtgtg gccaccccgc 120
gctccgccct gcgcccctcc tccgccgccg gctcccgggt gtggtggtcg caccagctct 180
ctgctctccc agcgcagcgc cgccgcccgg cccctccagc ttcccggacc atggccaacc 240
tggagcgcac cttcatcgcc atcaagccgg acggcgtgca gcgcggcctg gtgggcgaga 300
tcatcaagcg cttcgagcag aagggattcc gcctcgtggc catgaagttc ctccgggcct 360
ctgaagaaca cctgaagcag cactacattg acctgaaaga ccgaccattc ttccctgggc 420
tggtgaagta catgaactca gggccggttg tggccatgga acatcattca tggcagtgat 480
tcagtaaaaa gtgctgaaaa agaaatcagc ctatggttta agcctgaaga actggttgac 540
tacaagtctt gtgctcatga ctgggtctat gaataagagg tggacacaac agcagtctcc 600
ttcagcacgg cgtggtgtgt ccctggacac agctcttcat tccattgact tagaggcaac 660
aggattgatc attcttttat agagcatatt tgccaataaa gcttttggaa gccggaaaaa 720
aaaaaaaaaa aaa 733
<210> 101
<211> 152
<212> PRT
<213> Homo sapiens
<400> 101
Met Ala Asn Leu Glu Arg Thr Phe Ile Ala Ile Lys Pro Asp Gly Val
1 5 10 15
Gln Arg Gly Leu Val Gly Glu Ile Ile Lys Arg Phe Glu Gln Lys Gly
20 25 30
Phe Arg Leu Val Ala Met Lys Phe Leu Arg Ala Ser Glu Glu His Leu
35 40 45
Lys Gln His Tyr Ile Asp Leu Lys Asp Arg Pro Phe Phe Pro Gly Leu
50 55 60
Val Lys Tyr Met Asn Ser Gly Pro Val Val Ala Met Val Trp Glu Gly
65 70 75 80
Leu Asn Val Val Lys Thr Gly Arg Val Met Leu Gly Glu Thr Asn Pro
85 90 95
Ala Asp Ser Lys Pro Gly Thr Ile Arg Gly Asp Phe Cys Ile Gln Val
100 105 110
Gly Arg Asn Ile Ile His Gly Ser Asp Ser Val Lys Ser Ala Glu Lys
115 120 125
Glu Ile Ser Leu Trp Phe Lys Pro Glu Glu Leu Val Asp Tyr Lys Ser
130 135 140
Cys Ala His Asp Trp Val Tyr Glu
145 150
<210> 102
<211> 846
<212> DNA
<213> Homo sapiens
<400> 102
tgcctggcga gggcgcgccc cggctgggcg tggacactgt tctccggccg cgtcgggccg 60
ggcgggtggg gcgttcctgc gggttgggcg gctgggccct ccggggtgtg gccaccccgc 120
gctccgccct gcgcccctcc tccgccgccg gctcccgggt gtggtggtcg caccagctct 180
ctgctctccc agcgcagcgc cgccgcccgg cccctccagc ttcccggacc atggccaacc 240
tggagcgcac cttcatcgcc atcaagccgg acggcgtgca gcgcggcctg gtgggcgaga 300
tcatcaagcg cttcgagcag aagggattcc gcctcgtggc catgaagttc ctccgggcct 360
ctgaagaaca cctgaagcag cactacattg acctgaaaga ccgaccattc ttccctgggc 420
tggtgaagta catgaactca gggccggttg tggccatggt ctgggagggg ctgaacgtgg 480
tgaagacagg ccgagtgatg cttggggaga ccaatccagc agattcaaag ccaggcacca 540
ttcgtgggga cttctgcatt caggttggca ggaacatcat tcatggcagt gattcagtaa 600
aaagtgctga aaaagaaatc agcctatggt ttaagcctga agaactggtt gactacaagt 660
cttgtgctca tgactgggtc tatgaataag aggtggacac aacagcagtc tccttcagca 720
cggcgtggtg tgtccctgga cacagctctt cattccattg acttagaggc aacaggattg 780
atcattcttt tatagagcat atttgccaat aaagcttttg gaagccggaa aaaaaaaaaa 840
aaaaaa 846
<210> 103
<211> 417
<212> PRT
<213> Homo sapiens
<400> 103
Met Ser Leu Ser Asn Lys Leu Thr Leu Asp Lys Leu Asp Val Lys Gly
1 5 10 15
Lys Arg Val Val Met Arg Val Asp Phe Asn Val Pro Met Lys Asn Asn
20 25 30
Gln Ile Thr Asn Asn Gln Arg Ile Lys Ala Ala Val Pro Ser Ile Lys
35 40 45
Phe Cys Leu Asp Asn Gly Ala Lys Ser Val Val Leu Met Ser His Leu
50 55 60
Gly Arg Pro Asp Gly Val Pro Met Pro Asp Lys Tyr Ser Leu Glu Pro
65 70 75 80
Val Ala Val Glu Leu Lys Ser Leu Leu Gly Lys Asp Val Leu Phe Leu
85 90 95
Lys Asp Cys Val Gly Pro Glu Val Glu Lys Ala Cys Ala Asn Pro Ala
100 105 110
Ala Gly Ser Val Ile Leu Leu Glu Asn Leu Arg Phe His Val Glu Glu
115 120 125
Glu Gly Lys Gly Lys Asp Ala Ser Gly Asn Lys Val Lys Ala Glu Pro
130 135 140
Ala Lys Ile Glu Ala Phe Arg Ala Ser Leu Ser Lys Leu Gly Asp Val
145 150 155 160
Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met
165 170 175
Val Gly Val Asn Leu Pro Gln Lys Ala Gly Gly Phe Leu Met Lys Lys
180 185 190
Glu Leu Asn Tyr Phe Ala Lys Ala Leu Glu Ser Pro Glu Arg Pro Phe
195 200 205
Leu Ala Ile Leu Gly Gly Ala Lys Val Ala Asp Lys Ile Gln Leu Ile
210 215 220
Asn Asn Met Leu Asp Lys Val Asn Glu Met Ile Ile Gly Gly Gly Met
225 230 235 240
Ala Phe Thr Phe Leu Lys Val Leu Asn Asn Met Glu Ile Gly Thr Ser
245 250 255
Leu Phe Asp Glu Glu Gly Ala Lys Ile Val Lys Asp Leu Met Ser Lys
260 265 270
Ala Glu Lys Asn Gly Val Lys Ile Thr Leu Pro Val Asp Phe Val Thr
275 280 285
Ala Asp Lys Phe Asp Glu Asn Ala Lys Thr Gly Gln Ala Thr Val Ala
290 295 300
Ser Gly Ile Pro Ala Gly Trp Met Gly Leu Asp Cys Gly Pro Glu Ser
305 310 315 320
Ser Lys Lys Tyr Ala Glu Ala Val Thr Arg Ala Lys Gln Ile Val Trp
325 330 335
Asn Gly Pro Val Gly Val Phe Glu Trp Glu Ala Phe Ala Arg Gly Thr
340 345 350
Lys Ala Leu Met Asp Glu Val Val Lys Ala Thr Ser Arg Gly Cys Ile
355 360 365
Thr Ile Ile Gly Gly Gly Asp Thr Ala Thr Cys Cys Ala Lys Trp Asn
370 375 380
Thr Glu Asp Lys Val Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu
385 390 395 400
Glu Leu Leu Glu Gly Lys Val Leu Pro Gly Val Asp Ala Leu Ser Asn
405 410 415
Ile
<210> 104
<211> 2439
<212> DNA
<213> Homo sapiens
<400> 104
gagagcagcg gccgggaagg ggcggtgcgg gaggcggggt gtggggcggt agtgtgggcc 60
ctgttcctgc ccgcgcggtg ttccgcattc tgcaagcctc cggagcgcac gtcggcagtc 120
ggctccctcg ttgaccgaat caccgacctc tctccccagc tgtatttcca aaatgtcgct 180
ttctaacaag ctgacgctgg acaagctgga cgttaaaggg aagcgggtcg ttatgagagt 240
cgacttcaat gttcctatga agaacaacca gataacaaac aaccagagga ttaaggctgc 300
tgtcccaagc atcaaattct gcttggacaa tggagccaag tcggtagtcc ttatgagcca 360
cctaggccgg cctgatggtg tgcccatgcc tgacaagtac tccttagagc cagttgctgt 420
agaactcaaa tctctgctgg gcaaggatgt tctgttcttg aaggactgtg taggcccaga 480
agtggagaaa gcctgtgcca acccagctgc tgggtctgtc atcctgctgg agaacctccg 540
ctttcatgtg gaggaagaag ggaagggaaa agatgcttct gggaacaagg ttaaagccga 600
gccagccaaa atagaagctt tccgagcttc actttccaag ctaggggatg tctatgtcaa 660
tgatgctttt ggcactgctc acagagccca cagctccatg gtaggagtca atctgccaca 720
gaaggctggt gggtttttga tgaagaagga gctgaactac tttgcaaagg ccttggagag 780
cccagagcga cccttcctgg ccatcctggg cggagctaaa gttgcagaca agatccagct 840
catcaataat atgctggaca aagtcaatga gatgattatt ggtggtggaa tggcttttac 900
cttccttaag gtgctcaaca acatggagat tggcacttct ctgtttgatg aagagggagc 960
caagattgtc aaagacctaa tgtccaaagc tgagaagaat ggtgtgaaga ttaccttgcc 1020
tgttgacttt gtcactgctg acaagtttga tgagaatgcc aagactggcc aagccactgt 1080
ggcttctggc atacctgctg gctggatggg cttggactgt ggtcctgaaa gcagcaagaa 1140
gtatgctgag gctgtcactc gggctaagca gattgtgtgg aatggtcctg tgggggtatt 1200
tgaatgggaa gcttttgccc ggggaaccaa agctctcatg gatgaggtgg tgaaagccac 1260
ttctaggggc tgcatcacca tcataggtgg tggagacact gccacttgct gtgccaaatg 1320
gaacacggag gataaagtca gccatgtgag cactgggggt ggtgccagtt tggagctcct 1380
ggaaggtaaa gtccttcctg gggtggatgc tctcagcaat atttagtact ttcctgcctt 1440
ttagttcctg tgcacagccc ctaagtcaac ttagcatttt ctgcatctcc acttggcatt 1500
agctaaaacc ttccatgtca agattcagct agtggccaag agatgcagtg ccaggaaccc 1560
ttaaacagtt gcacagcatc tcagctcatc ttcactgcac cctggatttg catacattct 1620
tcaagatccc atttgaattt tttagtgact aaaccattgt gcattctaga gtgcatatat 1680
ttatattttg cctgttaaaa agaaagtgag cagtgttagc ttagttctct tttgatgtag 1740
gttattatga ttagctttgt cactgtttca ctactcagca tggaaacaag atgaaattcc 1800
atttgtaggt agtgagacaa aattgatgat ccattaagta aacaataaaa gtgtccattg 1860
aaaccgtgat tttttttttt ttcctgtcat actttgttag gaagggtgag aatagaatct 1920
tgaggaacgg atcagatgtc tatattgctg aatgcaagaa gtggggcagc agcagtggag 1980
agatgggaca attagataaa tgtccattct ttatcaaggg cctactttat ggcagacatt 2040
gtgctagtgc ttttattcta acttttattt ttatcagtta cacatgatca taatttaaaa 2100
agtcaaggct tataacaaaa aagccccagc ccattcctcc cattcaagat tcccactccc 2160
cagaggtgac cactttcaac tcttgagttt ttcaggtata tacctccatg tttctaagta 2220
atatgcttat attgttcact tctttttttt ttatttttta aagaaatcta tttcatacca 2280
tggaggaagg ctctgttcca catatatttc cacttcttca ttctctcggt atagttttgt 2340
cacaattata gattagatca aaagtctaca taactaatac agctgagcta tgtagtatgc 2400
tatgattaaa tttacttatg taaaaaaaaa aaaaaaaaa 2439
<210> 105
<211> 417
<212> PRT
<213> Homo sapiens
<400> 105
Met Ser Leu Ser Lys Lys Leu Thr Leu Asp Lys Leu Asp Val Arg Gly
1 5 10 15
Lys Arg Val Ile Met Arg Val Asp Phe Asn Val Pro Met Lys Lys Asn
20 25 30
Gln Ile Thr Asn Asn Gln Arg Ile Lys Ala Ser Ile Pro Ser Ile Lys
35 40 45
Tyr Cys Leu Asp Asn Gly Ala Lys Ala Val Val Leu Met Ser His Leu
50 55 60
Gly Arg Pro Asp Gly Val Pro Met Pro Asp Lys Tyr Ser Leu Ala Pro
65 70 75 80
Val Ala Val Glu Leu Lys Ser Leu Leu Gly Lys Asp Val Leu Phe Leu
85 90 95
Lys Asp Cys Val Gly Ala Glu Val Glu Lys Ala Cys Ala Asn Pro Ala
100 105 110
Pro Gly Ser Val Ile Leu Leu Glu Asn Leu Arg Phe His Val Glu Glu
115 120 125
Glu Gly Lys Gly Gln Asp Pro Ser Gly Lys Lys Ile Lys Ala Glu Pro
130 135 140
Asp Lys Ile Glu Ala Phe Arg Ala Ser Leu Ser Lys Leu Gly Asp Val
145 150 155 160
Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met
165 170 175
Val Gly Val Asn Leu Pro His Lys Ala Ser Gly Phe Leu Met Lys Lys
180 185 190
Glu Leu Asp Tyr Phe Ala Lys Ala Leu Glu Asn Pro Val Arg Pro Phe
195 200 205
Leu Ala Ile Leu Gly Gly Ala Lys Val Ala Asp Lys Ile Gln Leu Ile
210 215 220
Lys Asn Met Leu Asp Lys Val Asn Glu Met Ile Ile Gly Gly Gly Met
225 230 235 240
Ala Tyr Thr Phe Leu Lys Val Leu Asn Asn Met Glu Ile Gly Ala Ser
245 250 255
Leu Phe Asp Glu Glu Gly Ala Lys Ile Val Lys Asp Ile Met Ala Lys
260 265 270
Ala Gln Lys Asn Gly Val Arg Ile Thr Phe Pro Val Asp Phe Val Thr
275 280 285
Gly Asp Lys Phe Asp Glu Asn Ala Gln Val Gly Lys Ala Thr Val Ala
290 295 300
Ser Gly Ile Ser Pro Gly Trp Met Gly Leu Asp Cys Gly Pro Glu Ser
305 310 315 320
Asn Lys Asn His Ala Gln Val Val Ala Gln Ala Arg Leu Ile Val Trp
325 330 335
Asn Gly Pro Leu Gly Val Phe Glu Trp Asp Ala Phe Ala Lys Gly Thr
340 345 350
Lys Ala Leu Met Asp Glu Ile Val Lys Ala Thr Ser Lys Gly Cys Ile
355 360 365
Thr Val Ile Gly Gly Gly Asp Thr Ala Thr Cys Cys Ala Lys Trp Asn
370 375 380
Thr Glu Asp Lys Val Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu
385 390 395 400
Glu Leu Leu Glu Gly Lys Ile Leu Pro Gly Val Glu Ala Leu Ser Asn
405 410 415
Met
<210> 106
<211> 1721
<212> DNA
<213> Homo sapiens
<400> 106
aacagtggcc gttgtgctgg agacagtgag gagaagaaag gggcgggaca agggcaaagg 60
cgttagaagt caccaccgac ccagcccctc aacagcaagt tggttcttca gcattaagat 120
ccaggtgtca gcctatgtct ttatattgtc aagatgtctc tttctaagaa gttgacttta 180
gacaaactgg atgttagagg gaagcgagtc atcatgagag tagacttcaa tgttcccatg 240
aagaagaacc agattacaaa caaccagagg atcaaggctt ccatcccaag catcaagtac 300
tgcctggaca atggagccaa ggcagtagtt cttatgagtc atctaggtcg gcctgatggt 360
gttcccatgc ctgacaaata ttccttagca cctgttgctg ttgagctcaa atccttgctg 420
ggcaaggatg ttctgttcct gaaggactgt gtaggcgcag aagtggagaa agcctgtgcc 480
aacccagctc ctggttcagt catcctgctg gagaacctgc gctttcatgt ggaggaagaa 540
gggaagggcc aagatccctc tggaaagaag attaaagctg agccagataa aatagaagcc 600
ttccgagcat cactttccaa gctaggggac gtctatgtca atgatgcttt tggcactgca 660
caccgcgctc atagttccat ggtgggagtg aatctgcccc ataaagcatc cggattcttg 720
atgaagaagg aactagatta ctttgctaaa gccttggaaa acccagtgag accctttctg 780
gctatacttg gtggagccaa agtggcagac aagatccaac ttatcaaaaa tatgctggac 840
aaagtcaatg agatgattat tggtggtgga atggcttata ccttccttaa ggtactcaac 900
aacatggaga ttggtgcttc cctgtttgat gaagagggag ccaagatcgt taaagatatc 960
atggccaaag cacaaaagaa tggtgtaagg attacttttc ctgttgattt tgttactggg 1020
gacaagtttg acgagaacgc tcaggttgga aaagccactg tagcatctgg catatctcct 1080
ggctggatgg gtttggactg tggtcctgag agcaacaaga atcatgctca agttgtggct 1140
caagcaaggc taattgtttg gaatgggccg ttaggagtat ttgaatggga tgcctttgct 1200
aagggaacca aagccctcat ggatgaaatt gtgaaagcca cttccaaggg ctgcatcact 1260
gttatagggg gtggagacac tgctacttgc tgtgccaaat ggaacactga agataaagtc 1320
agccatgtca gcactggagg cggtgccagt ctagagcttc tggaaggtaa aatccttcct 1380
ggagtagagg ccctcagcaa catgtagtta atatagtgtt acttccttct gttttctgtc 1440
catggccctt aagtcagctt aatgctttta catctcgatg tgacttttgt taaaatctac 1500
tcctagatca agacctatgt aatggacaag cagcaggcca tcaggaactc ttaatatcag 1560
cacagcaatt cattttagtt tggtcacgca tttgcctgtt caagttctca tttgaacttc 1620
accattgtgc tatctaggga ggacatattc ttaagttgcc tattaaagaa agtgagctga 1680
agaaactgaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 1721
<210> 107
<211> 207
<212> PRT
<213> Homo sapiens
<400> 107
Met Thr Ser Arg Lys Lys Val Leu Leu Lys Val Ile Ile Leu Gly Asp
1 5 10 15
Ser Gly Val Gly Lys Thr Ser Leu Met Asn Gln Tyr Val Asn Lys Lys
20 25 30
Phe Ser Asn Gln Tyr Lys Ala Thr Ile Gly Ala Asp Phe Leu Thr Lys
35 40 45
Glu Val Met Val Asp Asp Arg Leu Val Thr Met Gln Ile Trp Asp Thr
50 55 60
Ala Gly Gln Glu Arg Phe Gln Ser Leu Gly Val Ala Phe Tyr Arg Gly
65 70 75 80
Ala Asp Cys Cys Val Leu Val Phe Asp Val Thr Ala Pro Asn Thr Phe
85 90 95
Lys Thr Leu Asp Ser Trp Arg Asp Glu Phe Leu Ile Gln Ala Ser Pro
100 105 110
Arg Asp Pro Glu Asn Phe Pro Phe Val Val Leu Gly Asn Lys Ile Asp
115 120 125
Leu Glu Asn Arg Gln Val Ala Thr Lys Arg Ala Gln Ala Trp Cys Tyr
130 135 140
Ser Lys Asn Asn Ile Pro Tyr Phe Glu Thr Ser Ala Lys Glu Ala Ile
145 150 155 160
Asn Val Glu Gln Ala Phe Gln Thr Ile Ala Arg Asn Ala Leu Lys Gln
165 170 175
Glu Thr Glu Val Glu Leu Tyr Asn Glu Phe Pro Glu Pro Ile Lys Leu
180 185 190
Asp Lys Asn Asp Arg Ala Lys Ala Ser Ala Glu Ser Cys Ser Cys
195 200 205
<210> 108
<211> 2240
<212> DNA
<213> Homo sapiens
<400> 108
acttccgctc ggggcggcgg cggtggcgga agtgggagcg ggcctggagt cttggccata 60
aagcctgagg cggcggcagc ggcggagttg gcggcttgga gagctcggga gagttccctg 120
gaaccagaac ttggaccttc tcgcttctgt cctccgttta gtctcctcct cggcgggagc 180
cctcgcgacg cgcccggccc ggagccccca gcgcagcggc cgcgtttgaa ggatgacctc 240
taggaagaaa gtgttgctga aggttatcat cctgggagat tctggagtcg ggaagacatc 300
actcatgaac cagtatgtga ataagaaatt cagcaatcag tacaaagcca caataggagc 360
tgactttctg accaaggagg tgatggtgga tgacaggcta gtcacaatgc agatatggga 420
cacagcagga caggaacggt tccagtctct cggtgtggcc ttctacagag gtgcagactg 480
ctgcgttctg gtatttgatg tgactgcccc caacacattc aaaaccctag atagctggag 540
agatgagttt ctcatccagg ccagtccccg agatcctgaa aacttcccat ttgttgtgtt 600
gggaaacaag attgacctcg aaaacagaca agtggccaca aagcgggcac aggcctggtg 660
ctacagcaaa aacaacattc cctactttga gaccagtgcc aaggaggcca tcaacgtgga 720
gcaggcgttc cagacgattg cacggaatgc acttaagcag gaaacggagg tggagctgta 780
caacgaattt cctgaaccta tcaaactgga caagaatgac cgggccaagg cctcggcaga 840
aagctgcagt tgctgagggg gcagtgagag ttgagcacag agtccttcac aaaccaagaa 900
cacacgtagg ccttcaacac aattcccctc tcctcttcca aacaaaacat acattgatct 960
ctcacatcca gctgccaaaa gaaaacccca tcaaacacag ttacacccca catatctctc 1020
acacacacac acacacgcac acacacacac acagatctga cgtaatcaaa ctccagccct 1080
tgcccgtgat ggctccttgg ggtctgcctg cccacccaca tgagcccgcg agtatggcag 1140
caggacaagc cagcggtgga agtcattctg atatggagtt ggcattggaa gcttattctt 1200
tttgttcact ggagagagag agaactgttt acagttaatc tgtgtctaat tatctgattt 1260
tttttattgg tcttgtggtc tttttacccc ccctttcccc tccctccttg aaggctaccc 1320
cttgggaagg ctggtgcccc atgccccatt acaggctcac acccagtctg atcaggctga 1380
gttttgtatg tatctatctg ttaatgcttg ttacttttaa ctaatcagat ctttttacag 1440
tatccattta ttatgtaatg cttcttagaa aagaatctta tagtacatgt taatatatgc 1500
aaccaattaa aatgtataaa ttagtgtaag aaattcttgg attatgtgtt taagtcctgt 1560
aatgcaggcc tgtaaggtgg agggttgaac cctgtttgga ttgcagagtg ttactcagaa 1620
ttgggaaatc cagctagcgg cagtattctg tacagtagac acaagaatta tgtacgcctt 1680
ttatcaaaga cttaagagcc aaaaagcttt tcatctctcc agggggaaaa ctgtctagtt 1740
cccttctgtg tctaaatttt ccaaaacgtt gatttgcata atacagtggt atgtgcaatg 1800
gataaattgc cgttatttca aaaattaaaa ttctcatttt ctttcttttt tttcccccct 1860
gctccacact tcaaaactcc cgttagatca gcattctact acaagagtga aaggaaaacc 1920
ctaacagatc tgtcctagtg attttacctt tgttctagaa ggcgctcctt tcagggttgt 1980
ggtattctta ggttagcgga gctttttcct cttttcccca cccatctccc caatattgcc 2040
cattattaat taacctcttt ctttggttgg aaccctggca gttctgctcc cttcctagga 2100
tctgcccctg cattgtagct tgcttaacgg agcacttctc ctttttccaa aggtctacat 2160
tctagggtgt gggctgagtt cttctgtaaa gagatgaacg caatgccaat aaaattgaac 2220
aagaacaatg ataaaaaaaa 2240
<210> 109
<211> 184
<212> PRT
<213> Homo sapiens
<400> 109
Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys
1 5 10 15
Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr
20 25 30
Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu
35 40 45
Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn
50 55 60
Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln
65 70 75 80
Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys
85 90 95
Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu
100 105 110
Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg
115 120 125
Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys
130 135 140
His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro
145 150 155 160
Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys
165 170 175
Lys Gln Lys Leu Met Ala Arg Glu
180
<210> 110
<211> 985
<212> DNA
<213> Homo sapiens
<400> 110
cctgcctcct cagatctcgt ttcttcggct acgaatctcg cgagaagtca agttctcatg 60
agttctccca aaatccaccg ctcttcctct ttccctaagc agcctgaggg ttgactggat 120
tggtgaggcc cgtgtggcta cttctgtgga agcagtgctg tagttactgg aagataaaag 180
ggaaagcaag cccttggtgg gggaaagtat ggctgcgatg atggcatttc ttaggacacc 240
tttggattaa taatgaaaac aactactctc tgagcagctg ttcgaatcat ctgatattta 300
tactgaatga gttactgtaa gtacgtattg acagaattac actgtacttt cctctaggtg 360
atctgtgaaa atggttcgct attcacttga cccggagaac cccacgaaat catgcaaatc 420
aagaggttcc aatcttcgtg ttcactttaa gaacactcgt gaaactgctc aggccatcaa 480
gggtatgcat atacgaaaag ccacgaagta tctgaaagat gtcactttac agaaacagtg 540
tgtaccattc cgacgttaca atggtggagt tggcaggtgt gcgcaggcca agcaatgggg 600
ctggacacaa ggtcggtggc ccaaaaagag tgctgaattt ttgctgcaca tgcttaaaaa 660
cgcagagagt aatgctgaac ttaagggttt agatgtagat tctctggtca ttgagcatat 720
ccaagtgaac aaagcaccta agatgcgccg ccggacctac agagctcatg gtcggattaa 780
cccatacatg agctctccct gccacattga gatgatcctt acggaaaagg aacagattgt 840
tcctaaacca gaagaggagg ttgcccagaa gaaaaagata tcccagaaga aactgaagaa 900
acaaaaactt atggcacggg agtaaattca gcattaaaat aaatgtaatt aaaaggaaaa 960
gaaaaaaaaa aaaaaaaaaa aaaaa 985
<210> 111
<211> 184
<212> PRT
<213> Homo sapiens
<400> 111
Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys
1 5 10 15
Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr
20 25 30
Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu
35 40 45
Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn
50 55 60
Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln
65 70 75 80
Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys
85 90 95
Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu
100 105 110
Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg
115 120 125
Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys
130 135 140
His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro
145 150 155 160
Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys
165 170 175
Lys Gln Lys Leu Met Ala Arg Glu
180
<210> 112
<211> 736
<212> DNA
<213> Homo sapiens
<400> 112
cctgcctcct cagatctcgt ttcttcggct acgaatctcg cgagaagtca agttctcatg 60
agttctccca aaatccaccg ctcttcctct ttccctaagc agcctgaggt gatctgtgaa 120
aatggttcgc tattcacttg acccggagaa ccccacgaaa tcatgcaaat caagaggttc 180
caatcttcgt gttcacttta agaacactcg tgaaactgct caggccatca agggtatgca 240
tatacgaaaa gccacgaagt atctgaaaga tgtcacttta cagaaacagt gtgtaccatt 300
ccgacgttac aatggtggag ttggcaggtg tgcgcaggcc aagcaatggg gctggacaca 360
aggtcggtgg cccaaaaaga gtgctgaatt tttgctgcac atgcttaaaa acgcagagag 420
taatgctgaa cttaagggtt tagatgtaga ttctctggtc attgagcata tccaagtgaa 480
caaagcacct aagatgcgcc gccggaccta cagagctcat ggtcggatta acccatacat 540
gagctctccc tgccacattg agatgatcct tacggaaaag gaacagattg ttcctaaacc 600
agaagaggag gttgcccaga agaaaaagat atcccagaag aaactgaaga aacaaaaact 660
tatggcacgg gagtaaattc agcattaaaa taaatgtaat taaaaggaaa agaaaaaaaa 720
aaaaaaaaaa aaaaaa 736
<210> 113
<211> 184
<212> PRT
<213> Homo sapiens
<400> 113
Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys
1 5 10 15
Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr
20 25 30
Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu
35 40 45
Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn
50 55 60
Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln
65 70 75 80
Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys
85 90 95
Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu
100 105 110
Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg
115 120 125
Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys
130 135 140
His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro
145 150 155 160
Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys
165 170 175
Lys Gln Lys Leu Met Ala Arg Glu
180
<210> 114
<211> 834
<212> DNA
<213> Homo sapiens
<400> 114
cctgcctcct cagatctcgt ttcttcggct acgaatctcg cgagaagtca agttctcatg 60
agttctccca aaatccaccg ctcttcctct ttccctaagc agcctgaggg ttgactggat 120
tggtgaggcc cgtgtggcta cttctgtgga agcagtgctg tagttactgg aagataaaag 180
ggaaagcaag cccttggtgg gggaaagtga tctgtgaaaa tggttcgcta ttcacttgac 240
ccggagaacc ccacgaaatc atgcaaatca agaggttcca atcttcgtgt tcactttaag 300
aacactcgtg aaactgctca ggccatcaag ggtatgcata tacgaaaagc cacgaagtat 360
ctgaaagatg tcactttaca gaaacagtgt gtaccattcc gacgttacaa tggtggagtt 420
ggcaggtgtg cgcaggccaa gcaatggggc tggacacaag gtcggtggcc caaaaagagt 480
gctgaatttt tgctgcacat gcttaaaaac gcagagagta atgctgaact taagggttta 540
gatgtagatt ctctggtcat tgagcatatc caagtgaaca aagcacctaa gatgcgccgc 600
cggacctaca gagctcatgg tcggattaac ccatacatga gctctccctg ccacattgag 660
atgatcctta cggaaaagga acagattgtt cctaaaccag aagaggaggt tgcccagaag 720
aaaaagatat cccagaagaa actgaagaaa caaaaactta tggcacggga gtaaattcag 780
cattaaaata aatgtaatta aaaggaaaag aaaaaaaaaa aaaaaaaaaa aaaa 834
<210> 115
<211> 184
<212> PRT
<213> Homo sapiens
<400> 115
Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys
1 5 10 15
Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr
20 25 30
Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu
35 40 45
Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn
50 55 60
Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln
65 70 75 80
Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys
85 90 95
Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu
100 105 110
Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg
115 120 125
Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys
130 135 140
His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro
145 150 155 160
Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys
165 170 175
Lys Gln Lys Leu Met Ala Arg Glu
180
<210> 116
<211> 835
<212> DNA
<213> Homo sapiens
<400> 116
gcctgaggtg agtgtttctc ctgcgttgct ccgagggccc aatcctcctg ccatcgccgc 60
catcctggct tcgggggcgc cggcctccag gcccccggga ggagaactcc tagggctact 120
aaatcctcgc tggaggcggt ggcttcttat gcgggaggac gtggcggagg gcctgacttt 180
gggagccggg gtcagtcggc ctctgaggtg atctgtgaaa atggttcgct attcacttga 240
cccggagaac cccacgaaat catgcaaatc aagaggttcc aatcttcgtg ttcactttaa 300
gaacactcgt gaaactgctc aggccatcaa gggtatgcat atacgaaaag ccacgaagta 360
tctgaaagat gtcactttac agaaacagtg tgtaccattc cgacgttaca atggtggagt 420
tggcaggtgt gcgcaggcca agcaatgggg ctggacacaa ggtcggtggc ccaaaaagag 480
tgctgaattt ttgctgcaca tgcttaaaaa cgcagagagt aatgctgaac ttaagggttt 540
agatgtagat tctctggtca ttgagcatat ccaagtgaac aaagcaccta agatgcgccg 600
ccggacctac agagctcatg gtcggattaa cccatacatg agctctccct gccacattga 660
gatgatcctt acggaaaagg aacagattgt tcctaaacca gaagaggagg ttgcccagaa 720
gaaaaagata tcccagaaga aactgaagaa acaaaaactt atggcacggg agtaaattca 780
gcattaaaat aaatgtaatt aaaaggaaaa gaaaaaaaaa aaaaaaaaaa aaaaa 835
<210> 117
<211> 184
<212> PRT
<213> Homo sapiens
<400> 117
Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys
1 5 10 15
Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr
20 25 30
Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu
35 40 45
Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn
50 55 60
Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln
65 70 75 80
Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys
85 90 95
Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu
100 105 110
Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg
115 120 125
Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys
130 135 140
His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro
145 150 155 160
Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys
165 170 175
Lys Gln Lys Leu Met Ala Arg Glu
180
<210> 118
<211> 933
<212> DNA
<213> Homo sapiens
<400> 118
gcctgaggtg agtgtttctc ctgcgttgct ccgagggccc aatcctcctg ccatcgccgc 60
catcctggct tcgggggcgc cggcctccag gcccccggga ggagaactcc tagggctact 120
aaatcctcgc tggaggcggt ggcttcttat gcgggaggac gtggcggagg gcctgacttt 180
gggagccggg gtcagtcggc ctctgagggt tgactggatt ggtgaggccc gtgtggctac 240
ttctgtggaa gcagtgctgt agttactgga agataaaagg gaaagcaagc ccttggtggg 300
ggaaagtgat ctgtgaaaat ggttcgctat tcacttgacc cggagaaccc cacgaaatca 360
tgcaaatcaa gaggttccaa tcttcgtgtt cactttaaga acactcgtga aactgctcag 420
gccatcaagg gtatgcatat acgaaaagcc acgaagtatc tgaaagatgt cactttacag 480
aaacagtgtg taccattccg acgttacaat ggtggagttg gcaggtgtgc gcaggccaag 540
caatggggct ggacacaagg tcggtggccc aaaaagagtg ctgaattttt gctgcacatg 600
cttaaaaacg cagagagtaa tgctgaactt aagggtttag atgtagattc tctggtcatt 660
gagcatatcc aagtgaacaa agcacctaag atgcgccgcc ggacctacag agctcatggt 720
cggattaacc catacatgag ctctccctgc cacattgaga tgatccttac ggaaaaggaa 780
cagattgttc ctaaaccaga agaggaggtt gcccagaaga aaaagatatc ccagaagaaa 840
ctgaagaaac aaaaacttat ggcacgggag taaattcagc attaaaataa atgtaattaa 900
aaggaaaaga aaaaaaaaaa aaaaaaaaaa aaa 933
<210> 119
<211> 184
<212> PRT
<213> Homo sapiens
<400> 119
Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys
1 5 10 15
Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr
20 25 30
Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu
35 40 45
Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn
50 55 60
Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln
65 70 75 80
Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys
85 90 95
Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu
100 105 110
Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg
115 120 125
Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys
130 135 140
His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro
145 150 155 160
Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys
165 170 175
Lys Gln Lys Leu Met Ala Arg Glu
180
<210> 120
<211> 916
<212> DNA
<213> Homo sapiens
<400> 120
gcctgaggtg agtgtttctc ctgcgttgct ccgagggccc aatcctcctg ccatcgccgc 60
catcctggct tcgggggcgc cggcctccag gcccccggga ggagaactcc tagggctact 120
aaatcctcgc tggaggcggt ggcttcttat gcgggaggac gtggcggagg gcctgacttt 180
gggagccggg ggttgactgg attggtgagg cccgtgtggc tacttctgtg gaagcagtgc 240
tgtagttact ggaagataaa agggaaagca agcccttggt gggggaaagt gatctgtgaa 300
aatggttcgc tattcacttg acccggagaa ccccacgaaa tcatgcaaat caagaggttc 360
caatcttcgt gttcacttta agaacactcg tgaaactgct caggccatca agggtatgca 420
tatacgaaaa gccacgaagt atctgaaaga tgtcacttta cagaaacagt gtgtaccatt 480
ccgacgttac aatggtggag ttggcaggtg tgcgcaggcc aagcaatggg gctggacaca 540
aggtcggtgg cccaaaaaga gtgctgaatt tttgctgcac atgcttaaaa acgcagagag 600
taatgctgaa cttaagggtt tagatgtaga ttctctggtc attgagcata tccaagtgaa 660
caaagcacct aagatgcgcc gccggaccta cagagctcat ggtcggatta acccatacat 720
gagctctccc tgccacattg agatgatcct tacggaaaag gaacagattg ttcctaaacc 780
agaagaggag gttgcccaga agaaaaagat atcccagaag aaactgaaga aacaaaaact 840
tatggcacgg gagtaaattc agcattaaaa taaatgtaat taaaaggaaa agaaaaaaaa 900
aaaaaaaaaa aaaaaa 916
<210> 121
<211> 184
<212> PRT
<213> Homo sapiens
<400> 121
Met Val Arg Tyr Ser Leu Asp Pro Glu Asn Pro Thr Lys Ser Cys Lys
1 5 10 15
Ser Arg Gly Ser Asn Leu Arg Val His Phe Lys Asn Thr Arg Glu Thr
20 25 30
Ala Gln Ala Ile Lys Gly Met His Ile Arg Lys Ala Thr Lys Tyr Leu
35 40 45
Lys Asp Val Thr Leu Gln Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn
50 55 60
Gly Gly Val Gly Arg Cys Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln
65 70 75 80
Gly Arg Trp Pro Lys Lys Ser Ala Glu Phe Leu Leu His Met Leu Lys
85 90 95
Asn Ala Glu Ser Asn Ala Glu Leu Lys Gly Leu Asp Val Asp Ser Leu
100 105 110
Val Ile Glu His Ile Gln Val Asn Lys Ala Pro Lys Met Arg Arg Arg
115 120 125
Thr Tyr Arg Ala His Gly Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys
130 135 140
His Ile Glu Met Ile Leu Thr Glu Lys Glu Gln Ile Val Pro Lys Pro
145 150 155 160
Glu Glu Glu Val Ala Gln Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys
165 170 175
Lys Gln Lys Leu Met Ala Arg Glu
180
<210> 122
<211> 818
<212> DNA
<213> Homo sapiens
<400> 122
gcctgaggtg agtgtttctc ctgcgttgct ccgagggccc aatcctcctg ccatcgccgc 60
catcctggct tcgggggcgc cggcctccag gcccccggga ggagaactcc tagggctact 120
aaatcctcgc tggaggcggt ggcttcttat gcgggaggac gtggcggagg gcctgacttt 180
gggagccggg gtgatctgtg aaaatggttc gctattcact tgacccggag aaccccacga 240
aatcatgcaa atcaagaggt tccaatcttc gtgttcactt taagaacact cgtgaaactg 300
ctcaggccat caagggtatg catatacgaa aagccacgaa gtatctgaaa gatgtcactt 360
tacagaaaca gtgtgtacca ttccgacgtt acaatggtgg agttggcagg tgtgcgcagg 420
ccaagcaatg gggctggaca caaggtcggt ggcccaaaaa gagtgctgaa tttttgctgc 480
acatgcttaa aaacgcagag agtaatgctg aacttaaggg tttagatgta gattctctgg 540
tcattgagca tatccaagtg aacaaagcac ctaagatgcg ccgccggacc tacagagctc 600
atggtcggat taacccatac atgagctctc cctgccacat tgagatgatc cttacggaaa 660
aggaacagat tgttcctaaa ccagaagagg aggttgccca gaagaaaaag atatcccaga 720
agaaactgaa gaaacaaaaa cttatggcac gggagtaaat tcagcattaa aataaatgta 780
attaaaagga aaagaaaaaa aaaaaaaaaa aaaaaaaa 818
<210> 123
<211> 146
<212> PRT
<213> Homo sapiens
<400> 123
Met His Ile Arg Lys Ala Thr Lys Tyr Leu Lys Asp Val Thr Leu Gln
1 5 10 15
Lys Gln Cys Val Pro Phe Arg Arg Tyr Asn Gly Gly Val Gly Arg Cys
20 25 30
Ala Gln Ala Lys Gln Trp Gly Trp Thr Gln Gly Arg Trp Pro Lys Lys
35 40 45
Ser Ala Glu Phe Leu Leu His Met Leu Lys Asn Ala Glu Ser Asn Ala
50 55 60
Glu Leu Lys Gly Leu Asp Val Asp Ser Leu Val Ile Glu His Ile Gln
65 70 75 80
Val Asn Lys Ala Pro Lys Met Arg Arg Arg Thr Tyr Arg Ala His Gly
85 90 95
Arg Ile Asn Pro Tyr Met Ser Ser Pro Cys His Ile Glu Met Ile Leu
100 105 110
Thr Glu Lys Glu Gln Ile Val Pro Lys Pro Glu Glu Glu Val Ala Gln
115 120 125
Lys Lys Lys Ile Ser Gln Lys Lys Leu Lys Lys Gln Lys Leu Met Ala
130 135 140
Arg Glu
145
<210> 124
<211> 695
<212> DNA
<213> Homo sapiens
<400> 124
cctgcctcct cagatctcgt ttcttcggct acgaatctcg cgagaagtca agttctcatg 60
agttctccca aaatccaccg ctcttcctct ttccctaagc agcctgaggt gatctgtgaa 120
aatggttcgc tattcacttg acccggagaa ccccacgaaa taacactcgt gaaactgctc 180
aggccatcaa gggtatgcat atacgaaaag ccacgaagta tctgaaagat gtcactttac 240
agaaacagtg tgtaccattc cgacgttaca atggtggagt tggcaggtgt gcgcaggcca 300
agcaatgggg ctggacacaa ggtcggtggc ccaaaaagag tgctgaattt ttgctgcaca 360
tgcttaaaaa cgcagagagt aatgctgaac ttaagggttt agatgtagat tctctggtca 420
ttgagcatat ccaagtgaac aaagcaccta agatgcgccg ccggacctac agagctcatg 480
gtcggattaa cccatacatg agctctccct gccacattga gatgatcctt acggaaaagg 540
aacagattgt tcctaaacca gaagaggagg ttgcccagaa gaaaaagata tcccagaaga 600
aactgaagaa acaaaaactt atggcacggg agtaaattca gcattaaaat aaatgtaatt 660
aaaaggaaaa gaaaaaaaaa aaaaaaaaaa aaaaa 695
<210> 125
<211> 137
<212> PRT
<213> Homo sapiens
<400> 125
Met Ser Ala His Leu Gln Trp Met Val Val Arg Asn Cys Ser Ser Phe
1 5 10 15
Leu Ile Lys Arg Asn Lys Gln Thr Tyr Ser Thr Glu Pro Asn Asn Leu
20 25 30
Lys Ala Arg Asn Ser Phe Arg Tyr Asn Gly Leu Ile His Arg Lys Thr
35 40 45
Val Gly Val Glu Pro Ala Ala Asp Gly Lys Gly Val Val Val Val Ile
50 55 60
Lys Arg Arg Ser Gly Gln Arg Lys Pro Ala Thr Ser Tyr Val Arg Thr
65 70 75 80
Thr Ile Asn Lys Asn Ala Arg Ala Thr Leu Ser Ser Ile Arg His Met
85 90 95
Ile Arg Lys Asn Lys Tyr Arg Pro Asp Leu Arg Met Ala Ala Ile Arg
100 105 110
Arg Ala Ser Ala Ile Leu Arg Ser Gln Lys Pro Val Met Val Lys Arg
115 120 125
Lys Arg Thr Arg Pro Thr Lys Ser Ser
130 135
<210> 126
<211> 4245
<212> DNA
<213> Homo sapiens
<400> 126
ctctttccgt ctcaggtcgc cgctgcgaag ggagccgccg ccatgtctgc gcatctgcaa 60
tggatggtcg tgcggaactg ctccagtttc ctgatcaaga ggaataagca gacctacagc 120
actgagccca ataacttgaa ggcccgcaat tccttccgct acaacggact gattcaccgc 180
aagactgtgg gcgtggagcc ggcagccgac ggcaaaggtg tcgtggtggt cattaagcgg 240
agatccggcc agcggaagcc tgccacctcc tatgtgcgga ccaccatcaa caagaatgct 300
cgcgccacgc tcagcagcat cagacacatg atccgcaaga acaagtaccg ccccgacctg 360
cgcatggcag ccatccgcag ggccagcgcc atcctgcgca gccagaagcc tgtgatggtg 420
aagaggaagc ggacccgccc caccaagagc tcctgagccc cctgccccca gagcaataaa 480
gtcagctggc tttctcacct gcctcgactg ggcctccctt tttgaaacgc tctggggagc 540
tctggccctg tgtgttgtca ttcaggccat gtcatcaaaa ctctgcatgt caccttgtcc 600
atctggaggt gatgtcaatg gctggccatg caggaggggt ggggtagctg ccttgtccct 660
ggtgagggca agggtcactg tcttcacaga aaaagtttgc tgacttgtga ttgagaccta 720
ctgtcccatt gtgaggtggc ctgaagaatc ccagctgggg cagtggcttc cattcagaag 780
aagaaaggcc ttttctagcc cagaagggtg caggctgagg gctgggccct gggccctggt 840
gctgtagcac ggtttgggga cttggggtgt tcccaagacc tgggggacga cagacatcac 900
gggaggaaga tgagatgact tttgcatcca gggagtgggt gcagccacat ttggagggga 960
tgggctttac ttgatgcaac ctcatctctg agatgggcaa cttggtgggt ggtggcttat 1020
aactgtaagg gagatggcag ccccagggta cagccagcag gcattgagca gccttagcat 1080
tgtcccccta ctcccgtcct ccaggtgtcc ccatccctcc cctgtctctt tgagctggct 1140
cttgtcactt aggtctcatc tcagtggccg ctcctgggcc accctgtcac ccaagctttc 1200
ctgattgccc agccctcttg tttcctttgg cctgtttgct ccctagtgtt tattacagct 1260
tgtgaggcca ggagtttgag accatcctag gcaacataat gagacaccgt ctctaaaata 1320
aaattagctg ggtgtggtgg tgcaccgcct gtggtcccag ctcctcagag gttgagtaga 1380
ggctgaggtg agcggagcac ttgagccaag agtatgaggc tgcagtgagc ccatgagccc 1440
caccactaca ctccagcctg gaagacacca tgacacacag tgaggcctgg atggggaaag 1500
agtcctgctg ttgatcctca catgtttcct gggcacctaa ctctgtcagc cactgccagg 1560
gaccaaggat ccagcatcca tggcacccct ggttcctgcc atcctggggt acccgattca 1620
aagaaggact ctgctccctg tctgagacca cccccggctc tgactgagag taaggggact 1680
gtcagggcct cgacttgcca ttggttgggg tcgtacgggg ctgggagccc tgcgttttga 1740
ggcagaccac tgcccttccg acctcagtcc tgtctgctcc agtcttgccc agctcgaagg 1800
agagcagatc tgaccacttg ccagcccctg tctgctgtga attaccattt cctttgtcct 1860
tcccttagtt gggtctatta gctcagattg agaggtgttg ccttaaaact gagttgggtg 1920
acttggtacc tgctcaggac cccccgcact gtcccaatcc cactcaggcc cacctccagc 1980
tggcctcact ccgctggtga cttcgtacct gctcaggagc ccccactgtc ccagtcccac 2040
tcaggcccat ctctggctgg cctcactgcg ctgggactcc gccttcataa ggagagctca 2100
ctgctcacgt tagtagatgg ccccttctcg tgaggcctct cccctggcac ctgcttcagt 2160
tgtcctccac agcactgatt tgcagcccac aagctggcag gtttatctgt ctcatgtttg 2220
tcttgtgctg gtgggcaagg ggtttgtcta gcacaccagc atataatgag atgcttgatg 2280
aatggtgcat attgaatgta taaagcccac cggtcctgag agtttgctca ctggagactt 2340
tctggagatg gagtctcgct ctgttgccca ggctggcgag tgcaatggcg cgatcttggc 2400
tcactgcagc ctccacctcc tgggttcaag cgattctcct gcctcagcct cccgagtagc 2460
tgggattaca ggtgggtgtc accacaccca gctcagtatt gtatttttag cagagatggg 2520
gtttcaccat tttgcccagg ctggtttgga actcctgact tcaaattacc cacctgcctc 2580
agcctcccaa agtgctggca ttacaggcgc tcgaggcttt ctgatgtggc tgctgctgct 2640
cagaaggcct tgtccttaac cacctccttg cctgccctgg aggcttgtgc ctctaggccc 2700
caccccctgt ggagtcctgc tggctttctc catccctatc tgaatcctcc ctgctgtgtg 2760
gcctcccctg gtctcatccg taacacagcc cagcttagtg ggcctctgtt cctgcgggtg 2820
gccagcctgt ctgtgtggct gggctgggga ggccacgtct ggtatctgaa tgctatcggt 2880
gggttggggt ggaggaacca ggagagggct ggagggaggg agatggtctc agccccacag 2940
agtttggagt cctcagtgtg ctgagcaaac gtggagacac catttccctc ctctagacct 3000
catcttggag agagagatgt tggatggggc catctattcc agctttattc acacaaatca 3060
tgtctgttgg cctggaaatt ggaaaaccag ttaaaccaaa aacatgatat taagaaaaca 3120
ggcaggctca ccatagtaaa aatgctgaaa gccaaagaca aaattgggag aacaaaagaa 3180
aagcgtcttg tcacatacag aaggtccctg ataaagttag tagctgccct catcagaaac 3240
caggcccagg cagtggggac acatccagag tgctgaaaga acctccccca ggtcatccta 3300
tccccaagag tgatgcccgg cagcattccc agctcagggc taatggttca cggaagccag 3360
gaatcaaact gcctgggttc cagtcccagc tctgccagtt atgcccagct gtggggactt 3420
gggcagctcg tttagtagca ccgtgcctca gtttcccata tgtaaaaggc cattttgagt 3480
gcctttcaca gccctgcata aggcaggtgt ctcagtgttc actgctgtct ctccagctct 3540
tagtccagta gctgcatggt gagtgagcgt agggcgcacc ctggaaggct gccaagccca 3600
aagttgtgca gagcgctggg gactccagac tccccacagc agcagagact cgggactgag 3660
gcatcctctg ttcacaggac atgctggcat ctactgggtc agggctctgc tgctcggtgg 3720
ctgtgcaacc ttgggcaagt tcctcaacct ctctgtgtct tcgtaccctc atctgtaaca 3780
tgcgtgtcga tagaccctac tactcagggt tgatgagaag attaaatgtg caaaacctgc 3840
ttgactgtgc ccacaaatcc tgattgtagg aataaattaa tgacttttta taaatatttt 3900
gatcagatgg actcatgatc acagatgtct tcacatgcct atgactaatt tgtacacaaa 3960
ctaatgctcg tgtttcccaa gcacctggaa gacatgccag atccatgtgc agtaatgcct 4020
ggtggctcca ggtctgcccc gccgtcctgt ggggctgtga gctttcccag cctcctgccc 4080
gtgtttgtga atatcattct gtcctcagct gcatttccag cccaggctgt ttggcgctgc 4140
ccaggaatgg tatcaattcc cctgtttctc ttgtagccag ttactagaat aaaatcatct 4200
actttaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 4245
<210> 127
<211> 163
<212> PRT
<213> Homo sapiens
<400> 127
Met Ser Ala His Leu Gln Trp Met Val Val Arg Asn Cys Ser Ser Phe
1 5 10 15
Leu Ile Lys Arg Asn Lys Gln Thr Tyr Ser Thr Glu Pro Asn Asn Leu
20 25 30
Lys Ala Arg Asn Ser Phe Arg Tyr Asn Gly Leu Ile His Arg Lys Thr
35 40 45
Val Gly Val Glu Pro Ala Ala Asp Gly Lys Gly Val Val Val Val Ile
50 55 60
Lys Arg Arg Ser Gly Gln Arg Lys Pro Ala Thr Ser Tyr Val Arg Thr
65 70 75 80
Thr Ile Asn Lys Asn Ala Arg Ala Thr Leu Ser Ser Ile Arg His Met
85 90 95
Ile Arg Lys Asn Lys Tyr Arg Pro Asp Leu Arg Met Val Ser Trp Gly
100 105 110
Leu Gly Ile Arg Leu Gly Glu Thr Gly Gln Cys Cys Gly Glu Gly Pro
115 120 125
Pro Thr Thr Gly Cys Asn Met Gly Trp Arg Gly Met Asp Ser Cys Phe
130 135 140
Gln Pro Thr Pro His Thr Gln His Trp Pro Arg Gly Arg Leu Val Glu
145 150 155 160
Cys Met Gly
<210> 128
<211> 4439
<212> DNA
<213> Homo sapiens
<400> 128
ctctttccgt ctcaggtcgc cgctgcgaag ggagccgccg ccatgtctgc gcatctgcaa 60
tggatggtcg tgcggaactg ctccagtttc ctgatcaaga ggaataagca gacctacagc 120
actgagccca ataacttgaa ggcccgcaat tccttccgct acaacggact gattcaccgc 180
aagactgtgg gcgtggagcc ggcagccgac ggcaaaggtg tcgtggtggt cattaagcgg 240
agatccggcc agcggaagcc tgccacctcc tatgtgcgga ccaccatcaa caagaatgct 300
cgcgccacgc tcagcagcat cagacacatg atccgcaaga acaagtaccg ccccgacctg 360
cgcatggtga gctggggttt ggggatcagg cttggggaga ctggccagtg ctgtggggaa 420
gggcctccca ctactggttg caatatgggc tggagaggga tggattcttg ctttcagcct 480
actccccaca cccagcattg gcctaggggg cggcttgtgg agtgtatggg ctgagccttg 540
ctctgctccc ccgcccccag gcagccatcc gcagggccag cgccatcctg cgcagccaga 600
agcctgtgat ggtgaagagg aagcggaccc gccccaccaa gagctcctga gccccctgcc 660
cccagagcaa taaagtcagc tggctttctc acctgcctcg actgggcctc cctttttgaa 720
acgctctggg gagctctggc cctgtgtgtt gtcattcagg ccatgtcatc aaaactctgc 780
atgtcacctt gtccatctgg aggtgatgtc aatggctggc catgcaggag gggtggggta 840
gctgccttgt ccctggtgag ggcaagggtc actgtcttca cagaaaaagt ttgctgactt 900
gtgattgaga cctactgtcc cattgtgagg tggcctgaag aatcccagct ggggcagtgg 960
cttccattca gaagaagaaa ggccttttct agcccagaag ggtgcaggct gagggctggg 1020
ccctgggccc tggtgctgta gcacggtttg gggacttggg gtgttcccaa gacctggggg 1080
acgacagaca tcacgggagg aagatgagat gacttttgca tccagggagt gggtgcagcc 1140
acatttggag gggatgggct ttacttgatg caacctcatc tctgagatgg gcaacttggt 1200
gggtggtggc ttataactgt aagggagatg gcagccccag ggtacagcca gcaggcattg 1260
agcagcctta gcattgtccc cctactcccg tcctccaggt gtccccatcc ctcccctgtc 1320
tctttgagct ggctcttgtc acttaggtct catctcagtg gccgctcctg ggccaccctg 1380
tcacccaagc tttcctgatt gcccagccct cttgtttcct ttggcctgtt tgctccctag 1440
tgtttattac agcttgtgag gccaggagtt tgagaccatc ctaggcaaca taatgagaca 1500
ccgtctctaa aataaaatta gctgggtgtg gtggtgcacc gcctgtggtc ccagctcctc 1560
agaggttgag tagaggctga ggtgagcgga gcacttgagc caagagtatg aggctgcagt 1620
gagcccatga gccccaccac tacactccag cctggaagac accatgacac acagtgaggc 1680
ctggatgggg aaagagtcct gctgttgatc ctcacatgtt tcctgggcac ctaactctgt 1740
cagccactgc cagggaccaa ggatccagca tccatggcac ccctggttcc tgccatcctg 1800
gggtacccga ttcaaagaag gactctgctc cctgtctgag accacccccg gctctgactg 1860
agagtaaggg gactgtcagg gcctcgactt gccattggtt ggggtcgtac ggggctggga 1920
gccctgcgtt ttgaggcaga ccactgccct tccgacctca gtcctgtctg ctccagtctt 1980
gcccagctcg aaggagagca gatctgacca cttgccagcc cctgtctgct gtgaattacc 2040
atttcctttg tccttccctt agttgggtct attagctcag attgagaggt gttgccttaa 2100
aactgagttg ggtgacttgg tacctgctca ggaccccccg cactgtccca atcccactca 2160
ggcccacctc cagctggcct cactccgctg gtgacttcgt acctgctcag gagcccccac 2220
tgtcccagtc ccactcaggc ccatctctgg ctggcctcac tgcgctggga ctccgccttc 2280
ataaggagag ctcactgctc acgttagtag atggcccctt ctcgtgaggc ctctcccctg 2340
gcacctgctt cagttgtcct ccacagcact gatttgcagc ccacaagctg gcaggtttat 2400
ctgtctcatg tttgtcttgt gctggtgggc aaggggtttg tctagcacac cagcatataa 2460
tgagatgctt gatgaatggt gcatattgaa tgtataaagc ccaccggtcc tgagagtttg 2520
ctcactggag actttctgga gatggagtct cgctctgttg cccaggctgg cgagtgcaat 2580
ggcgcgatct tggctcactg cagcctccac ctcctgggtt caagcgattc tcctgcctca 2640
gcctcccgag tagctgggat tacaggtggg tgtcaccaca cccagctcag tattgtattt 2700
ttagcagaga tggggtttca ccattttgcc caggctggtt tggaactcct gacttcaaat 2760
tacccacctg cctcagcctc ccaaagtgct ggcattacag gcgctcgagg ctttctgatg 2820
tggctgctgc tgctcagaag gccttgtcct taaccacctc cttgcctgcc ctggaggctt 2880
gtgcctctag gccccacccc ctgtggagtc ctgctggctt tctccatccc tatctgaatc 2940
ctccctgctg tgtggcctcc cctggtctca tccgtaacac agcccagctt agtgggcctc 3000
tgttcctgcg ggtggccagc ctgtctgtgt ggctgggctg gggaggccac gtctggtatc 3060
tgaatgctat cggtgggttg gggtggagga accaggagag ggctggaggg agggagatgg 3120
tctcagcccc acagagtttg gagtcctcag tgtgctgagc aaacgtggag acaccatttc 3180
cctcctctag acctcatctt ggagagagag atgttggatg gggccatcta ttccagcttt 3240
attcacacaa atcatgtctg ttggcctgga aattggaaaa ccagttaaac caaaaacatg 3300
atattaagaa aacaggcagg ctcaccatag taaaaatgct gaaagccaaa gacaaaattg 3360
ggagaacaaa agaaaagcgt cttgtcacat acagaaggtc cctgataaag ttagtagctg 3420
ccctcatcag aaaccaggcc caggcagtgg ggacacatcc agagtgctga aagaacctcc 3480
cccaggtcat cctatcccca agagtgatgc ccggcagcat tcccagctca gggctaatgg 3540
ttcacggaag ccaggaatca aactgcctgg gttccagtcc cagctctgcc agttatgccc 3600
agctgtgggg acttgggcag ctcgtttagt agcaccgtgc ctcagtttcc catatgtaaa 3660
aggccatttt gagtgccttt cacagccctg cataaggcag gtgtctcagt gttcactgct 3720
gtctctccag ctcttagtcc agtagctgca tggtgagtga gcgtagggcg caccctggaa 3780
ggctgccaag cccaaagttg tgcagagcgc tggggactcc agactcccca cagcagcaga 3840
gactcgggac tgaggcatcc tctgttcaca ggacatgctg gcatctactg ggtcagggct 3900
ctgctgctcg gtggctgtgc aaccttgggc aagttcctca acctctctgt gtcttcgtac 3960
cctcatctgt aacatgcgtg tcgatagacc ctactactca gggttgatga gaagattaaa 4020
tgtgcaaaac ctgcttgact gtgcccacaa atcctgattg taggaataaa ttaatgactt 4080
tttataaata ttttgatcag atggactcat gatcacagat gtcttcacat gcctatgact 4140
aatttgtaca caaactaatg ctcgtgtttc ccaagcacct ggaagacatg ccagatccat 4200
gtgcagtaat gcctggtggc tccaggtctg ccccgccgtc ctgtggggct gtgagctttc 4260
ccagcctcct gcccgtgttt gtgaatatca ttctgtcctc agctgcattt ccagcccagg 4320
ctgtttggcg ctgcccagga atggtatcaa ttcccctgtt tctcttgtag ccagttacta 4380
gaataaaatc atctacttta aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4439
<210> 129
<211> 169
<212> PRT
<213> Homo sapiens
<400> 129
Met Ser Ala His Leu Gln Trp Met Val Val Arg Asn Cys Ser Ser Phe
1 5 10 15
Leu Ile Lys Arg Asn Lys Gln Thr Tyr Ser Thr Glu Pro Asn Asn Leu
20 25 30
Lys Ala Arg Asn Ser Phe Arg Tyr Asn Gly Leu Ile His Arg Lys Thr
35 40 45
Val Gly Val Glu Pro Ala Ala Asp Gly Lys Gly Val Val Val Val Ile
50 55 60
Lys Arg Arg Ser Gly Gln Arg Lys Pro Ala Thr Ser Tyr Val Arg Thr
65 70 75 80
Thr Ile Asn Lys Asn Ala Arg Ala Thr Leu Ser Ser Ile Arg His Met
85 90 95
Ile Arg Lys Asn Lys Tyr Arg Pro Asp Leu Arg Met Asp Met Leu Ala
100 105 110
Ser Thr Gly Ser Gly Leu Cys Cys Ser Val Ala Val Gln Pro Trp Ala
115 120 125
Ser Ser Ser Thr Ser Leu Cys Leu Arg Thr Leu Ile Cys Asn Met Arg
130 135 140
Val Asp Arg Pro Tyr Tyr Ser Gly Leu Met Arg Arg Leu Asn Val Gln
145 150 155 160
Asn Leu Leu Asp Cys Ala His Lys Ser
165
<210> 130
<211> 934
<212> DNA
<213> Homo sapiens
<400> 130
ctctttccgt ctcaggtcgc cgctgcgaag ggagccgccg ccatgtctgc gcatctgcaa 60
tggatggtcg tgcggaactg ctccagtttc ctgatcaaga ggaataagca gacctacagc 120
actgagccca ataacttgaa ggcccgcaat tccttccgct acaacggact gattcaccgc 180
aagactgtgg gcgtggagcc ggcagccgac ggcaaaggtg tcgtggtggt cattaagcgg 240
agatccggcc agcggaagcc tgccacctcc tatgtgcgga ccaccatcaa caagaatgct 300
cgcgccacgc tcagcagcat cagacacatg atccgcaaga acaagtaccg ccccgacctg 360
cgcatggaca tgctggcatc tactgggtca gggctctgct gctcggtggc tgtgcaacct 420
tgggcaagtt cctcaacctc tctgtgtctt cgtaccctca tctgtaacat gcgtgtcgat 480
agaccctact actcagggtt gatgagaaga ttaaatgtgc aaaacctgct tgactgtgcc 540
cacaaatcct gattgtagga ataaattaat gactttttat aaatattttg atcagatgga 600
ctcatgatca cagatgtctt cacatgccta tgactaattt gtacacaaac taatgctcgt 660
gtttcccaag cacctggaag acatgccaga tccatgtgca gtaatgcctg gtggctccag 720
gtctgccccg ccgtcctgtg gggctgtgag ctttcccagc ctcctgcccg tgtttgtgaa 780
tatcattctg tcctcagctg catttccagc ccaggctgtt tggcgctgcc caggaatggt 840
atcaattccc ctgtttctct tgtagccagt tactagaata aaatcatcta ctttaaaaaa 900
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 934
<210> 131
<211> 87
<212> PRT
<213> Homo sapiens
<400> 131
Met Ser Ala His Leu Gln Trp Met Val Val Arg Asn Cys Ser Ser Phe
1 5 10 15
Leu Ile Lys Arg Asn Lys Gln Thr Tyr Ser Thr Glu Pro Asn Asn Leu
20 25 30
Lys Ala Arg Asn Ser Phe Arg Tyr Asn Gly Leu Ile His Arg Lys Thr
35 40 45
Val Gly Val Glu Pro Ala Ala Asp Gly Lys Gly Val Val Val Val Ile
50 55 60
Lys Arg Arg Ser Gly Glu Phe Cys Leu Val Trp Ala Arg Glu Arg Pro
65 70 75 80
Leu Ser Arg Val Trp Glu Leu
85
<210> 132
<211> 594
<212> DNA
<213> Homo sapiens
<400> 132
ctctttccgt ctcaggtcgc cgctgcgaag ggagccgccg ccatgtctgc gcatctgcaa 60
tggatggtcg tgcggaactg ctccagtttc ctgatcaaga ggaataagca gacctacagc 120
actgagccca ataacttgaa ggcccgcaat tccttccgct acaacggact gattcaccgc 180
aagactgtgg gcgtggagcc ggcagccgac ggcaaaggtg tcgtggtggt cattaagcgg 240
agatccggtg agttttgtct ggtttgggcc agagagcggc ccctttcccg ggtctgggag 300
ctgtgatttt ttactgtcag gcaggaagag cggtaactgc catcgcggcg ggcatccctg 360
gcgccagggt gttggtctgg gtaccggctt ccctctcggc cgacttgtca gctctgtgag 420
ccgcgcgcgt ctgagcccgt gtcctcacct gtaaagtgga gaaatgaaaa aggacctgaa 480
cttcctcggt ggttgttgag agttaaggca cggggttgat gttttcagat gaaattctca 540
aagcaagtca gggtggggat ggatggtttc atcccacagg tgggaagatt gagg 594
<210> 133
<211> 69
<212> PRT
<213> Homo sapiens
<400> 133
Met Ser Ala His Leu Gln Trp Met Val Val Arg Asn Cys Ser Ser Phe
1 5 10 15
Leu Ile Lys Arg Asn Lys Gln Thr Tyr Ser Thr Glu Pro Asn Asn Leu
20 25 30
Lys Ala Arg Asn Ser Phe Arg Tyr Asn Gly Leu Ile His Arg Lys Thr
35 40 45
Val Gly Val Glu Pro Ala Ala Asp Gly Lys Gly Val Val Val Val Ile
50 55 60
Lys Arg Arg Ser Glu
65
<210> 134
<211> 682
<212> DNA
<213> Homo sapiens
<400> 134
ctctttccgt ctcaggtcgc cgctgcgaag ggagccgccg ccatgtctgc gcatctgcaa 60
tggatggtcg tgcggaactg ctccagtttc ctgatcaaga ggaataagca gacctacagc 120
actgagccca ataacttgaa ggcccgcaat tccttccgct acaacggact gattcaccgc 180
aagactgtgg gcgtggagcc ggcagccgac ggcaaaggtg tcgtggtggt cattaagcgg 240
agatccgagt gagtttttct caggtccttg attggaactg cctcagagcc aagggtcctt 300
ttactcagtg gcagcaacaa acgcagtctg ttggctagtg atcctcctgt ctcagggaca 360
cgtagtccag ggagcagcca attgcttggc acttggggac cccgttctgg ggagtcctga 420
aagctttcac ctcttggatt gccgaataca tgggtggccc ttcctagact aagggactgg 480
cctgagtgag gctgggcctc tcagccaagc tgatgttgaa ccactgctgt ggggatgggc 540
ctggggttcc tgggaagctg ttcataccca ttgccaggag cgtgggctct ggctggacct 600
ggatcagatc ctaactgaag cggcagcttt ctggcatgag aaaggagtgt tttcatggtg 660
gacagaattg ggctatgagt gt 682
<210> 135
<211> 204
<212> PRT
<213> Homo sapiens
<400> 135
Met Thr Glu Trp Glu Thr Ala Ala Pro Ala Val Ala Glu Thr Pro Asp
1 5 10 15
Ile Lys Leu Phe Gly Lys Trp Ser Thr Asp Asp Val Gln Ile Asn Asp
20 25 30
Ile Ser Leu Gln Asp Tyr Ile Ala Val Lys Glu Lys Tyr Ala Lys Tyr
35 40 45
Leu Pro His Ser Ala Gly Arg Tyr Ala Ala Lys Arg Phe Arg Lys Ala
50 55 60
Gln Cys Pro Ile Val Glu Arg Leu Thr Asn Ser Met Met Met His Gly
65 70 75 80
Arg Asn Asn Gly Lys Lys Leu Met Thr Val Arg Ile Val Lys His Ala
85 90 95
Phe Glu Ile Ile His Leu Leu Thr Gly Glu Asn Pro Leu Gln Val Leu
100 105 110
Val Asn Ala Ile Ile Asn Ser Gly Pro Arg Glu Asp Ser Thr Arg Ile
115 120 125
Gly Arg Ala Gly Thr Val Arg Arg Gln Ala Val Asp Val Ser Pro Leu
130 135 140
Arg Arg Val Asn Gln Ala Ile Trp Leu Leu Cys Thr Gly Ala Arg Glu
145 150 155 160
Ala Ala Phe Arg Asn Ile Lys Thr Ile Ala Glu Cys Leu Ala Asp Glu
165 170 175
Leu Ile Asn Ala Ala Lys Gly Ser Ser Asn Ser Tyr Ala Ile Lys Lys
180 185 190
Lys Asp Glu Leu Glu Arg Val Ala Lys Ser Asn Arg
195 200
<210> 136
<211> 755
<212> DNA
<213> Homo sapiens
<400> 136
ctcttcctgt ctgtaccagg gcggcgcgtg gtctacgccg agtgacagag acgctcaggc 60
tgtgttctca ggatgaccga gtgggagaca gcagcaccag cggtggcaga gaccccagac 120
atcaagctct ttgggaagtg gagcaccgat gatgtgcaga tcaatgacat ttccctgcag 180
gattacattg cagtgaagga gaagtatgcc aagtacctgc ctcacagtgc agggcggtat 240
gccgccaaac gcttccgcaa agctcagtgt cccattgtgg agcgcctcac taactccatg 300
atgatgcacg gccgcaacaa cggcaagaag ctcatgactg tgcgcatcgt caagcatgcc 360
ttcgagatca tacacctgct cacaggcgag aaccctctgc aggtcctggt gaacgccatc 420
atcaacagtg gtccccggga ggactccaca cgcattgggc gcgccgggac tgtgagacga 480
caggctgtgg atgtgtcccc cctgcgccgt gtgaaccagg ccatctggct gctgtgcaca 540
ggcgctcgtg aggctgcctt ccggaacatt aagaccattg ctgagtgcct ggcagatgag 600
ctcatcaatg ctgccaaggg ctcctcgaac tcctatgcca ttaagaagaa ggacgagctg 660
gagcgtgtgg ccaagtccaa ccgctgattt tcccagctgc tgcccaataa acctgtctgc 720
cctttggggc agtcccagcc aaaaaaaaaa aaaaa 755
<210> 137
<211> 249
<212> PRT
<213> Homo sapiens
<400> 137
Met Lys Leu Asn Ile Ser Phe Pro Ala Thr Gly Cys Gln Lys Leu Ile
1 5 10 15
Glu Val Asp Asp Glu Arg Lys Leu Arg Thr Phe Tyr Glu Lys Arg Met
20 25 30
Ala Thr Glu Val Ala Ala Asp Ala Leu Gly Glu Glu Trp Lys Gly Tyr
35 40 45
Val Val Arg Ile Ser Gly Gly Asn Asp Lys Gln Gly Phe Pro Met Lys
50 55 60
Gln Gly Val Leu Thr His Gly Arg Val Arg Leu Leu Leu Ser Lys Gly
65 70 75 80
His Ser Cys Tyr Arg Pro Arg Arg Thr Gly Glu Arg Lys Arg Lys Ser
85 90 95
Val Arg Gly Cys Ile Val Asp Ala Asn Leu Ser Val Leu Asn Leu Val
100 105 110
Ile Val Lys Lys Gly Glu Lys Asp Ile Pro Gly Leu Thr Asp Thr Thr
115 120 125
Val Pro Arg Arg Leu Gly Pro Lys Arg Ala Ser Arg Ile Arg Lys Leu
130 135 140
Phe Asn Leu Ser Lys Glu Asp Asp Val Arg Gln Tyr Val Val Arg Lys
145 150 155 160
Pro Leu Asn Lys Glu Gly Lys Lys Pro Arg Thr Lys Ala Pro Lys Ile
165 170 175
Gln Arg Leu Val Thr Pro Arg Val Leu Gln His Lys Arg Arg Arg Ile
180 185 190
Ala Leu Lys Lys Gln Arg Thr Lys Lys Asn Lys Glu Glu Ala Ala Glu
195 200 205
Tyr Ala Lys Leu Leu Ala Lys Arg Met Lys Glu Ala Lys Glu Lys Arg
210 215 220
Gln Glu Gln Ile Ala Lys Arg Arg Arg Leu Ser Ser Leu Arg Ala Ser
225 230 235 240
Thr Ser Lys Ser Glu Ser Ser Gln Lys
245
<210> 138
<211> 829
<212> DNA
<213> Homo sapiens
<400> 138
cctcttttcc gtggcgcctc ggaggcgttc agctgcttca agatgaagct gaacatctcc 60
ttcccagcca ctggctgcca gaaactcatt gaagtggacg atgaacgcaa acttcgtact 120
ttctatgaga agcgtatggc cacagaagtt gctgctgacg ctctgggtga agaatggaag 180
ggttatgtgg tccgaatcag tggtgggaac gacaaacaag gtttccccat gaagcagggt 240
gtcttgaccc atggccgtgt ccgcctgcta ctgagtaagg ggcattcctg ttacagacca 300
aggagaactg gagaaagaaa gagaaaatca gttcgtggtt gcattgtgga tgcaaatctg 360
agcgttctca acttggttat tgtaaaaaaa ggagagaagg atattcctgg actgactgat 420
actacagtgc ctcgccgcct gggccccaaa agagctagca gaatccgcaa acttttcaat 480
ctctctaaag aagatgatgt ccgccagtat gttgtaagaa agcccttaaa taaagaaggt 540
aagaaaccta ggaccaaagc acccaagatt cagcgtcttg ttactccacg tgtcctgcag 600
cacaaacggc ggcgtattgc tctgaagaag cagcgtacca agaaaaataa agaagaggct 660
gcagaatatg ctaaactttt ggccaagaga atgaaggagg ctaaggagaa gcgccaggaa 720
caaattgcga agagacgcag actttcctct ctgcgagctt ctacttctaa gtctgaatcc 780
agtcagaaat aagatttttt gagtaacaaa taaataagat cagactctg 829
<210> 139
<211> 1016
<212> PRT
<213> Homo sapiens
<400> 139
Met Ala Ala Ala Thr Gly Ala Val Ala Ala Ser Ala Ala Ser Gly Gln
1 5 10 15
Ala Glu Gly Lys Lys Ile Thr Asp Leu Arg Val Ile Asp Leu Lys Ser
20 25 30
Glu Leu Lys Arg Arg Asn Leu Asp Ile Thr Gly Val Lys Thr Val Leu
35 40 45
Ile Ser Arg Leu Lys Gln Ala Ile Glu Glu Glu Gly Gly Asp Pro Asp
50 55 60
Asn Ile Glu Leu Thr Val Ser Thr Asp Thr Pro Asn Lys Lys Pro Thr
65 70 75 80
Lys Gly Lys Gly Lys Lys His Glu Ala Asp Glu Leu Ser Gly Asp Ala
85 90 95
Ser Val Glu Asp Asp Ala Phe Ile Lys Asp Cys Glu Leu Glu Asn Gln
100 105 110
Glu Ala His Glu Gln Asp Gly Asn Asp Glu Leu Lys Asp Ser Glu Glu
115 120 125
Phe Gly Glu Asn Glu Glu Glu Asn Val His Ser Lys Glu Leu Leu Ser
130 135 140
Ala Glu Glu Asn Lys Arg Ala His Glu Leu Ile Glu Ala Glu Gly Ile
145 150 155 160
Glu Asp Ile Glu Lys Glu Asp Ile Glu Ser Gln Glu Ile Glu Ala Gln
165 170 175
Glu Gly Glu Asp Asp Thr Phe Leu Thr Ala Gln Asp Gly Glu Glu Glu
180 185 190
Glu Asn Glu Lys Glu Gly Ser Leu Ala Glu Ala Asp His Thr Ala His
195 200 205
Glu Glu Met Glu Ala His Thr Thr Val Lys Glu Ala Glu Asp Asp Asn
210 215 220
Ile Ser Val Thr Ile Gln Ala Glu Asp Ala Ile Thr Leu Asp Phe Asp
225 230 235 240
Gly Asp Asp Leu Leu Glu Thr Gly Lys Asn Val Lys Ile Thr Asp Ser
245 250 255
Glu Ala Ser Lys Pro Lys Asp Gly Gln Asp Ala Ile Ala Gln Ser Pro
260 265 270
Glu Lys Glu Ser Lys Asp Tyr Glu Met Asn Ala Asn His Lys Asp Gly
275 280 285
Lys Lys Glu Asp Cys Val Lys Gly Asp Pro Val Glu Lys Glu Ala Arg
290 295 300
Glu Ser Ser Lys Lys Ala Glu Ser Gly Asp Lys Glu Lys Asp Thr Leu
305 310 315 320
Lys Lys Gly Pro Ser Ser Thr Gly Ala Ser Gly Gln Ala Lys Ser Ser
325 330 335
Ser Lys Glu Ser Lys Asp Ser Lys Thr Ser Ser Lys Asp Asp Lys Gly
340 345 350
Ser Thr Ser Ser Thr Ser Gly Ser Ser Gly Ser Ser Thr Lys Asn Ile
355 360 365
Trp Val Ser Gly Leu Ser Ser Asn Thr Lys Ala Ala Asp Leu Lys Asn
370 375 380
Leu Phe Gly Lys Tyr Gly Lys Val Leu Ser Ala Lys Val Val Thr Asn
385 390 395 400
Ala Arg Ser Pro Gly Ala Lys Cys Tyr Gly Ile Val Thr Met Ser Ser
405 410 415
Ser Thr Glu Val Ser Arg Cys Ile Ala His Leu His Arg Thr Glu Leu
420 425 430
His Gly Gln Leu Ile Ser Val Glu Lys Val Lys Gly Asp Pro Ser Lys
435 440 445
Lys Glu Met Lys Lys Glu Asn Asp Glu Lys Ser Ser Ser Arg Ser Ser
450 455 460
Gly Asp Lys Lys Asn Thr Ser Asp Arg Ser Ser Lys Thr Gln Ala Ser
465 470 475 480
Val Lys Lys Glu Glu Lys Arg Ser Ser Glu Lys Ser Glu Lys Lys Glu
485 490 495
Ser Lys Asp Thr Lys Lys Ile Glu Gly Lys Asp Glu Lys Asn Asp Asn
500 505 510
Gly Ala Ser Gly Gln Thr Ser Glu Ser Ile Lys Lys Ser Glu Glu Lys
515 520 525
Lys Arg Ile Ser Ser Lys Ser Pro Gly His Met Val Ile Leu Asp Gln
530 535 540
Thr Lys Gly Asp His Cys Arg Pro Ser Arg Arg Gly Arg Tyr Glu Lys
545 550 555 560
Ile His Gly Arg Ser Lys Glu Lys Glu Arg Ala Ser Leu Asp Lys Lys
565 570 575
Arg Asp Lys Asp Tyr Arg Arg Lys Glu Ile Leu Pro Phe Glu Lys Met
580 585 590
Lys Glu Gln Arg Leu Arg Glu His Leu Val Arg Phe Glu Arg Leu Arg
595 600 605
Arg Ala Met Glu Leu Arg Arg Arg Arg Glu Ile Ala Glu Arg Glu Arg
610 615 620
Arg Glu Arg Glu Arg Ile Arg Ile Ile Arg Glu Arg Glu Glu Arg Glu
625 630 635 640
Arg Leu Gln Arg Glu Arg Glu Arg Leu Glu Ile Glu Arg Gln Lys Leu
645 650 655
Glu Arg Glu Arg Met Glu Arg Glu Arg Leu Glu Arg Glu Arg Ile Arg
660 665 670
Ile Glu Gln Glu Arg Arg Lys Glu Ala Glu Arg Ile Ala Arg Glu Arg
675 680 685
Glu Glu Leu Arg Arg Gln Gln Gln Gln Leu Arg Tyr Glu Gln Glu Lys
690 695 700
Arg Asn Ser Leu Lys Arg Pro Arg Asp Val Asp His Arg Arg Asp Asp
705 710 715 720
Pro Tyr Trp Ser Glu Asn Lys Lys Leu Ser Leu Asp Thr Asp Ala Arg
725 730 735
Phe Gly His Gly Ser Asp Tyr Ser Arg Gln Gln Asn Arg Phe Asn Asp
740 745 750
Phe Asp His Arg Glu Arg Gly Arg Phe Pro Glu Ser Ser Ala Val Gln
755 760 765
Ser Ser Ser Phe Glu Arg Arg Asp Arg Phe Val Gly Gln Ser Glu Gly
770 775 780
Lys Lys Ala Arg Pro Thr Ala Arg Arg Glu Asp Pro Ser Phe Glu Arg
785 790 795 800
Tyr Pro Lys Asn Phe Ser Asp Ser Arg Arg Asn Glu Pro Pro Pro Pro
805 810 815
Arg Asn Glu Leu Arg Glu Ser Asp Arg Arg Glu Val Arg Gly Glu Arg
820 825 830
Asp Glu Arg Arg Thr Val Ile Ile His Asp Arg Pro Asp Ile Thr His
835 840 845
Pro Arg His Pro Arg Glu Ala Gly Pro Asn Pro Ser Arg Pro Thr Ser
850 855 860
Trp Lys Ser Glu Gly Ser Met Ser Thr Asp Lys Arg Glu Thr Arg Val
865 870 875 880
Glu Arg Pro Glu Arg Ser Gly Arg Glu Val Ser Gly His Ser Val Arg
885 890 895
Gly Ala Pro Pro Gly Asn Arg Ser Ser Ala Ser Gly Tyr Gly Ser Arg
900 905 910
Glu Gly Asp Arg Gly Val Ile Thr Asp Arg Gly Gly Gly Ser Gln His
915 920 925
Tyr Pro Glu Glu Arg His Val Val Glu Arg His Gly Arg Asp Thr Ser
930 935 940
Gly Pro Arg Lys Glu Trp His Gly Pro Pro Ser Gln Gly Pro Ser Tyr
945 950 955 960
His Asp Thr Arg Arg Met Gly Asp Gly Arg Ala Gly Ala Gly Met Ile
965 970 975
Thr Gln His Ser Ser Asn Ala Ser Pro Ile Asn Arg Ile Val Gln Ile
980 985 990
Ser Gly Asn Ser Met Pro Arg Gly Ser Gly Ser Gly Phe Lys Pro Phe
995 1000 1005
Lys Gly Gly Pro Pro Arg Arg Phe
1010 1015
<210> 140
<211> 4110
<212> DNA
<213> Homo sapiens
<400> 140
gcggccgccg aggcctgggt ggaagttggc gctgctgccg ccgccctgca gcccactcgc 60
tgcctcggca gcgcgctgct cttctaagat ggctgccgct accggtgcgg tggcagcctc 120
ggccgcctcg ggtcaggcgg aaggtaaaaa gatcaccgat ctgcgggtca tcgatctgaa 180
gtccgagctg aagcggcgga acttagacat caccggagtc aagaccgtgc tcatctcccg 240
actcaagcag gctattgaag aggaaggagg cgatccagat aatattgaat taactgtttc 300
aactgatact ccaaacaaga aaccaactaa aggcaaaggt aaaaaacatg aagcagatga 360
gttgagtgga gatgcttctg tggaagatga tgcttttatc aaggactgtg aattggagaa 420
tcaagaggca catgagcaag atggaaatga tgaactaaag gactctgaag aatttggtga 480
aaatgaagaa gaaaatgtgc attccaagga gttactctct gcagaagaaa acaagagagc 540
tcatgaatta atagaggcag aaggaataga agatatagaa aaagaggaca tcgaaagtca 600
ggaaattgaa gctcaagaag gtgaagatga tacctttcta acagcccaag atggtgagga 660
agaagaaaat gagaaagaag ggagcctagc tgaggctgat cacacagctc atgaagagat 720
ggaagctcat acgactgtga aagaagctga ggatgacaac atctcggtca caatccaggc 780
tgaagatgcc atcactctgg attttgatgg tgatgacctc ctagaaacag gtaaaaatgt 840
gaaaattaca gattctgaag caagtaagcc aaaagatggg caggacgcca ttgcacagag 900
cccggagaag gaaagcaagg attatgagat gaatgcgaac cataaagatg gtaagaagga 960
agactgcgtg aagggtgacc ctgtcgagaa ggaagccaga gaaagttcta agaaagcaga 1020
atctggagac aaagaaaagg atactttgaa gaaagggccc tcgtctactg gggcctctgg 1080
tcaagcaaag agctcttcaa aggaatctaa agacagcaag acatcatcta aagatgacaa 1140
aggaagtaca agtagtacta gtggtagcag tggaagctca actaaaaata tctgggttag 1200
tggactttca tctaatacca aagctgctga tttgaagaac ctctttggca aatatggaaa 1260
ggttctgagt gcaaaagtag ttacaaatgc tcgaagtcct ggggcaaaat gctatggcat 1320
tgtaactatg tcttcaagca cagaggtgtc caggtgtatt gcacatcttc atcgcactga 1380
gctgcatgga cagctgattt ctgttgaaaa agtaaaaggt gatccctcta agaaagaaat 1440
gaagaaagaa aatgatgaaa agagtagttc aagaagttct ggagataaaa aaaatacgag 1500
tgatagaagt agcaagacac aagcctctgt caaaaaagaa gagaaaagat cgtctgagaa 1560
atctgaaaaa aaagaaagca aggatactaa gaaaatagaa ggtaaagatg agaagaatga 1620
taatggagca agtggccaaa catcagaatc gattaaaaaa agtgaagaaa agaagcgaat 1680
aagttccaag agtccaggac atatggtaat actagaccaa actaaaggag atcattgtag 1740
accatcaaga agaggaagat atgagaaaat tcatggaaga agtaaggaaa aggagagagc 1800
tagtctagat aaaaaaagag ataaagacta cagaaggaaa gagatcttgc cttttgaaaa 1860
gatgaaggaa caaaggttga gagaacattt agttcgtttt gaaaggctgc gacgagcaat 1920
ggaacttcga agacgaagag agattgcaga gagagagcgt cgagagcgag aacgcattag 1980
aataattcgt gaacgggaag aacgggaacg cttacagaga gagagagagc gcctagaaat 2040
tgaaaggcaa aaactagaga gagagagaat ggaacgcgaa cgcttggaaa gggaacgcat 2100
tcgtattgaa caggaacgtc gtaaggaagc tgaacggatt gctcgagaaa gagaggaact 2160
cagaaggcaa caacagcagc ttcgttatga acaagaaaaa aggaattcct tgaaacgccc 2220
acgtgatgta gatcataggc gagatgatcc ttactggagc gagaataaaa agttgtctct 2280
agatacagat gcacgatttg gccatggatc cgactactct cgccaacaga acagatttaa 2340
tgactttgat caccgagaga ggggcaggtt tcctgagagt tcagcagtac agtcttcatc 2400
ttttgaaagg cgggatcgct ttgttggtca aagtgagggg aaaaaagcac gacctactgc 2460
acgaagggaa gatccaagct tcgaaagata tcccaaaaat ttcagtgact ccagaagaaa 2520
tgagcctcca ccaccaagaa atgaacttag agaatcagac aggcgagaag tacgagggga 2580
gcgagacgaa aggagaacgg tgattattca tgacaggcct gatatcactc atcctagaca 2640
tcctcgagag gcagggccca atccttccag acccaccagc tggaaaagtg aaggaagcat 2700
gtccactgac aaacgggaaa caagagttga aaggccagaa cgatctggga gagaagtatc 2760
agggcacagt gtgagaggcg ctccccctgg gaatcgtagc agcgcttcgg ggtacgggag 2820
cagagaggga gacagaggag tcatcacaga ccgaggaggt ggatcacagc actatcctga 2880
ggagcgacat gtggttgaac gccatggacg ggacacaagc ggaccaagga aagagtggca 2940
tggtccaccc tctcaagggc ctagctatca tgatacgagg cgaatgggtg acggccgggc 3000
aggagcaggc atgataaccc aacattcaag taacgcatcc ccaattaata gaattgtaca 3060
aatcagtggc aattccatgc caagaggaag tggctccgga tttaagccat ttaagggtgg 3120
acctccgcga cgattctgaa aatgagctct ctgccaaggt tttaagataa tttattgaaa 3180
tctcctgtaa actttacttg actacttatg aagaggacct ctgacttgct tgagagttct 3240
gtcagacttt tctttttaaa aatttaacat gattgctttt ctcaattttg gagaagatgt 3300
ttaaatagtt ctgttgtaac ttttaatagt tttgtgtatc attcaacttt ttttcttgca 3360
gcaccgaggc acatttgaaa agatggaatt gaagtcgttt tgtttaacgc tgtgtgaata 3420
taaagagtag tttgcagctg tgtggtagtg gtttaatttg cagccttagc tctgtggtgt 3480
ctggctctag agttacttct ttttaccaag cattttcagc ctccattttg aaggctgtct 3540
acacttaaga agtcttagct gtctaatttt tagagaataa gattgttcat tgcatttctg 3600
agtattatgt aacctatttt tgcagaaggt actgttacat taagtgcatc tgtgtatcct 3660
ggtttaaaaa aatgtaatct tttttgaaat aaaccttcat attctgtata gttgctaaag 3720
tgttgagaac ctttttaatt gtaaaatgag aaccgatttt cagtttagtg tagcagcaca 3780
cttgttcagg tttgcatggt atgaaaccaa atagattcat gaaaccttgg ccatgaggtt 3840
tgtttcacaa ggttcttaga ccgagttgtg caggtaagtg cacttttagg taatctgcac 3900
tgtttgtttg atggataaat tccatctctg ggaattgtgt gggtattaat gtttccatgt 3960
tcccaactat gttgagaagt ggaaaaaaac ccaggttcta gatgggtgaa tcagttgggt 4020
tttgtaaata cttgtatgtg gggaagacat tgttgtcttt ttgtgaaaat aaaaatccac 4080
acctggaagt gtaaaaaaaa aaaaaaaaaa 4110
<210> 141
<211> 1034
<212> PRT
<213> Homo sapiens
<400> 141
Met Ala Ala Ala Thr Gly Ala Val Ala Ala Ser Ala Ala Ser Gly Gln
1 5 10 15
Ala Glu Gly Lys Lys Ile Thr Asp Leu Arg Val Ile Asp Leu Lys Ser
20 25 30
Glu Leu Lys Arg Arg Asn Leu Asp Ile Thr Gly Val Lys Thr Val Leu
35 40 45
Ile Ser Arg Leu Lys Gln Ala Ile Glu Glu Glu Gly Gly Asp Pro Asp
50 55 60
Asn Ile Glu Leu Thr Val Ser Thr Asp Thr Pro Asn Lys Lys Pro Thr
65 70 75 80
Lys Gly Lys Gly Lys Lys His Glu Ala Asp Glu Leu Ser Gly Asp Ala
85 90 95
Ser Val Glu Asp Asp Ala Phe Ile Lys Asp Cys Glu Leu Glu Asn Gln
100 105 110
Glu Ala His Glu Gln Asp Gly Asn Asp Glu Leu Lys Asp Ser Glu Glu
115 120 125
Phe Gly Glu Asn Glu Glu Glu Asn Val His Ser Lys Glu Leu Leu Ser
130 135 140
Ala Glu Glu Asn Lys Arg Ala His Glu Leu Ile Glu Ala Glu Gly Ile
145 150 155 160
Glu Asp Ile Glu Lys Glu Asp Ile Glu Ser Gln Glu Ile Glu Ala Gln
165 170 175
Glu Gly Glu Asp Asp Thr Phe Leu Thr Ala Gln Asp Gly Glu Glu Glu
180 185 190
Glu Asn Glu Lys Asp Ile Ala Gly Ser Gly Asp Gly Thr Gln Glu Val
195 200 205
Ser Lys Pro Leu Pro Ser Glu Gly Ser Leu Ala Glu Ala Asp His Thr
210 215 220
Ala His Glu Glu Met Glu Ala His Thr Thr Val Lys Glu Ala Glu Asp
225 230 235 240
Asp Asn Ile Ser Val Thr Ile Gln Ala Glu Asp Ala Ile Thr Leu Asp
245 250 255
Phe Asp Gly Asp Asp Leu Leu Glu Thr Gly Lys Asn Val Lys Ile Thr
260 265 270
Asp Ser Glu Ala Ser Lys Pro Lys Asp Gly Gln Asp Ala Ile Ala Gln
275 280 285
Ser Pro Glu Lys Glu Ser Lys Asp Tyr Glu Met Asn Ala Asn His Lys
290 295 300
Asp Gly Lys Lys Glu Asp Cys Val Lys Gly Asp Pro Val Glu Lys Glu
305 310 315 320
Ala Arg Glu Ser Ser Lys Lys Ala Glu Ser Gly Asp Lys Glu Lys Asp
325 330 335
Thr Leu Lys Lys Gly Pro Ser Ser Thr Gly Ala Ser Gly Gln Ala Lys
340 345 350
Ser Ser Ser Lys Glu Ser Lys Asp Ser Lys Thr Ser Ser Lys Asp Asp
355 360 365
Lys Gly Ser Thr Ser Ser Thr Ser Gly Ser Ser Gly Ser Ser Thr Lys
370 375 380
Asn Ile Trp Val Ser Gly Leu Ser Ser Asn Thr Lys Ala Ala Asp Leu
385 390 395 400
Lys Asn Leu Phe Gly Lys Tyr Gly Lys Val Leu Ser Ala Lys Val Val
405 410 415
Thr Asn Ala Arg Ser Pro Gly Ala Lys Cys Tyr Gly Ile Val Thr Met
420 425 430
Ser Ser Ser Thr Glu Val Ser Arg Cys Ile Ala His Leu His Arg Thr
435 440 445
Glu Leu His Gly Gln Leu Ile Ser Val Glu Lys Val Lys Gly Asp Pro
450 455 460
Ser Lys Lys Glu Met Lys Lys Glu Asn Asp Glu Lys Ser Ser Ser Arg
465 470 475 480
Ser Ser Gly Asp Lys Lys Asn Thr Ser Asp Arg Ser Ser Lys Thr Gln
485 490 495
Ala Ser Val Lys Lys Glu Glu Lys Arg Ser Ser Glu Lys Ser Glu Lys
500 505 510
Lys Glu Ser Lys Asp Thr Lys Lys Ile Glu Gly Lys Asp Glu Lys Asn
515 520 525
Asp Asn Gly Ala Ser Gly Gln Thr Ser Glu Ser Ile Lys Lys Ser Glu
530 535 540
Glu Lys Lys Arg Ile Ser Ser Lys Ser Pro Gly His Met Val Ile Leu
545 550 555 560
Asp Gln Thr Lys Gly Asp His Cys Arg Pro Ser Arg Arg Gly Arg Tyr
565 570 575
Glu Lys Ile His Gly Arg Ser Lys Glu Lys Glu Arg Ala Ser Leu Asp
580 585 590
Lys Lys Arg Asp Lys Asp Tyr Arg Arg Lys Glu Ile Leu Pro Phe Glu
595 600 605
Lys Met Lys Glu Gln Arg Leu Arg Glu His Leu Val Arg Phe Glu Arg
610 615 620
Leu Arg Arg Ala Met Glu Leu Arg Arg Arg Arg Glu Ile Ala Glu Arg
625 630 635 640
Glu Arg Arg Glu Arg Glu Arg Ile Arg Ile Ile Arg Glu Arg Glu Glu
645 650 655
Arg Glu Arg Leu Gln Arg Glu Arg Glu Arg Leu Glu Ile Glu Arg Gln
660 665 670
Lys Leu Glu Arg Glu Arg Met Glu Arg Glu Arg Leu Glu Arg Glu Arg
675 680 685
Ile Arg Ile Glu Gln Glu Arg Arg Lys Glu Ala Glu Arg Ile Ala Arg
690 695 700
Glu Arg Glu Glu Leu Arg Arg Gln Gln Gln Gln Leu Arg Tyr Glu Gln
705 710 715 720
Glu Lys Arg Asn Ser Leu Lys Arg Pro Arg Asp Val Asp His Arg Arg
725 730 735
Asp Asp Pro Tyr Trp Ser Glu Asn Lys Lys Leu Ser Leu Asp Thr Asp
740 745 750
Ala Arg Phe Gly His Gly Ser Asp Tyr Ser Arg Gln Gln Asn Arg Phe
755 760 765
Asn Asp Phe Asp His Arg Glu Arg Gly Arg Phe Pro Glu Ser Ser Ala
770 775 780
Val Gln Ser Ser Ser Phe Glu Arg Arg Asp Arg Phe Val Gly Gln Ser
785 790 795 800
Glu Gly Lys Lys Ala Arg Pro Thr Ala Arg Arg Glu Asp Pro Ser Phe
805 810 815
Glu Arg Tyr Pro Lys Asn Phe Ser Asp Ser Arg Arg Asn Glu Pro Pro
820 825 830
Pro Pro Arg Asn Glu Leu Arg Glu Ser Asp Arg Arg Glu Val Arg Gly
835 840 845
Glu Arg Asp Glu Arg Arg Thr Val Ile Ile His Asp Arg Pro Asp Ile
850 855 860
Thr His Pro Arg His Pro Arg Glu Ala Gly Pro Asn Pro Ser Arg Pro
865 870 875 880
Thr Ser Trp Lys Ser Glu Gly Ser Met Ser Thr Asp Lys Arg Glu Thr
885 890 895
Arg Val Glu Arg Pro Glu Arg Ser Gly Arg Glu Val Ser Gly His Ser
900 905 910
Val Arg Gly Ala Pro Pro Gly Asn Arg Ser Ser Ala Ser Gly Tyr Gly
915 920 925
Ser Arg Glu Gly Asp Arg Gly Val Ile Thr Asp Arg Gly Gly Gly Ser
930 935 940
Gln His Tyr Pro Glu Glu Arg His Val Val Glu Arg His Gly Arg Asp
945 950 955 960
Thr Ser Gly Pro Arg Lys Glu Trp His Gly Pro Pro Ser Gln Gly Pro
965 970 975
Ser Tyr His Asp Thr Arg Arg Met Gly Asp Gly Arg Ala Gly Ala Gly
980 985 990
Met Ile Thr Gln His Ser Ser Asn Ala Ser Pro Ile Asn Arg Ile Val
995 1000 1005
Gln Ile Ser Gly Asn Ser Met Pro Arg Gly Ser Gly Ser Gly Phe
1010 1015 1020
Lys Pro Phe Lys Gly Gly Pro Pro Arg Arg Phe
1025 1030
<210> 142
<211> 4164
<212> DNA
<213> Homo sapiens
<400> 142
gcggccgccg aggcctgggt ggaagttggc gctgctgccg ccgccctgca gcccactcgc 60
tgcctcggca gcgcgctgct cttctaagat ggctgccgct accggtgcgg tggcagcctc 120
ggccgcctcg ggtcaggcgg aaggtaaaaa gatcaccgat ctgcgggtca tcgatctgaa 180
gtccgagctg aagcggcgga acttagacat caccggagtc aagaccgtgc tcatctcccg 240
actcaagcag gctattgaag aggaaggagg cgatccagat aatattgaat taactgtttc 300
aactgatact ccaaacaaga aaccaactaa aggcaaaggt aaaaaacatg aagcagatga 360
gttgagtgga gatgcttctg tggaagatga tgcttttatc aaggactgtg aattggagaa 420
tcaagaggca catgagcaag atggaaatga tgaactaaag gactctgaag aatttggtga 480
aaatgaagaa gaaaatgtgc attccaagga gttactctct gcagaagaaa acaagagagc 540
tcatgaatta atagaggcag aaggaataga agatatagaa aaagaggaca tcgaaagtca 600
ggaaattgaa gctcaagaag gtgaagatga tacctttcta acagcccaag atggtgagga 660
agaagaaaat gagaaagata tagcaggttc tggtgatggt acacaagaag tatctaaacc 720
tcttccttca gaagggagcc tagctgaggc tgatcacaca gctcatgaag agatggaagc 780
tcatacgact gtgaaagaag ctgaggatga caacatctcg gtcacaatcc aggctgaaga 840
tgccatcact ctggattttg atggtgatga cctcctagaa acaggtaaaa atgtgaaaat 900
tacagattct gaagcaagta agccaaaaga tgggcaggac gccattgcac agagcccgga 960
gaaggaaagc aaggattatg agatgaatgc gaaccataaa gatggtaaga aggaagactg 1020
cgtgaagggt gaccctgtcg agaaggaagc cagagaaagt tctaagaaag cagaatctgg 1080
agacaaagaa aaggatactt tgaagaaagg gccctcgtct actggggcct ctggtcaagc 1140
aaagagctct tcaaaggaat ctaaagacag caagacatca tctaaagatg acaaaggaag 1200
tacaagtagt actagtggta gcagtggaag ctcaactaaa aatatctggg ttagtggact 1260
ttcatctaat accaaagctg ctgatttgaa gaacctcttt ggcaaatatg gaaaggttct 1320
gagtgcaaaa gtagttacaa atgctcgaag tcctggggca aaatgctatg gcattgtaac 1380
tatgtcttca agcacagagg tgtccaggtg tattgcacat cttcatcgca ctgagctgca 1440
tggacagctg atttctgttg aaaaagtaaa aggtgatccc tctaagaaag aaatgaagaa 1500
agaaaatgat gaaaagagta gttcaagaag ttctggagat aaaaaaaata cgagtgatag 1560
aagtagcaag acacaagcct ctgtcaaaaa agaagagaaa agatcgtctg agaaatctga 1620
aaaaaaagaa agcaaggata ctaagaaaat agaaggtaaa gatgagaaga atgataatgg 1680
agcaagtggc caaacatcag aatcgattaa aaaaagtgaa gaaaagaagc gaataagttc 1740
caagagtcca ggacatatgg taatactaga ccaaactaaa ggagatcatt gtagaccatc 1800
aagaagagga agatatgaga aaattcatgg aagaagtaag gaaaaggaga gagctagtct 1860
agataaaaaa agagataaag actacagaag gaaagagatc ttgccttttg aaaagatgaa 1920
ggaacaaagg ttgagagaac atttagttcg ttttgaaagg ctgcgacgag caatggaact 1980
tcgaagacga agagagattg cagagagaga gcgtcgagag cgagaacgca ttagaataat 2040
tcgtgaacgg gaagaacggg aacgcttaca gagagagaga gagcgcctag aaattgaaag 2100
gcaaaaacta gagagagaga gaatggaacg cgaacgcttg gaaagggaac gcattcgtat 2160
tgaacaggaa cgtcgtaagg aagctgaacg gattgctcga gaaagagagg aactcagaag 2220
gcaacaacag cagcttcgtt atgaacaaga aaaaaggaat tccttgaaac gcccacgtga 2280
tgtagatcat aggcgagatg atccttactg gagcgagaat aaaaagttgt ctctagatac 2340
agatgcacga tttggccatg gatccgacta ctctcgccaa cagaacagat ttaatgactt 2400
tgatcaccga gagaggggca ggtttcctga gagttcagca gtacagtctt catcttttga 2460
aaggcgggat cgctttgttg gtcaaagtga ggggaaaaaa gcacgaccta ctgcacgaag 2520
ggaagatcca agcttcgaaa gatatcccaa aaatttcagt gactccagaa gaaatgagcc 2580
tccaccacca agaaatgaac ttagagaatc agacaggcga gaagtacgag gggagcgaga 2640
cgaaaggaga acggtgatta ttcatgacag gcctgatatc actcatccta gacatcctcg 2700
agaggcaggg cccaatcctt ccagacccac cagctggaaa agtgaaggaa gcatgtccac 2760
tgacaaacgg gaaacaagag ttgaaaggcc agaacgatct gggagagaag tatcagggca 2820
cagtgtgaga ggcgctcccc ctgggaatcg tagcagcgct tcggggtacg ggagcagaga 2880
gggagacaga ggagtcatca cagaccgagg aggtggatca cagcactatc ctgaggagcg 2940
acatgtggtt gaacgccatg gacgggacac aagcggacca aggaaagagt ggcatggtcc 3000
accctctcaa gggcctagct atcatgatac gaggcgaatg ggtgacggcc gggcaggagc 3060
aggcatgata acccaacatt caagtaacgc atccccaatt aatagaattg tacaaatcag 3120
tggcaattcc atgccaagag gaagtggctc cggatttaag ccatttaagg gtggacctcc 3180
gcgacgattc tgaaaatgag ctctctgcca aggttttaag ataatttatt gaaatctcct 3240
gtaaacttta cttgactact tatgaagagg acctctgact tgcttgagag ttctgtcaga 3300
cttttctttt taaaaattta acatgattgc ttttctcaat tttggagaag atgtttaaat 3360
agttctgttg taacttttaa tagttttgtg tatcattcaa ctttttttct tgcagcaccg 3420
aggcacattt gaaaagatgg aattgaagtc gttttgttta acgctgtgtg aatataaaga 3480
gtagtttgca gctgtgtggt agtggtttaa tttgcagcct tagctctgtg gtgtctggct 3540
ctagagttac ttctttttac caagcatttt cagcctccat tttgaaggct gtctacactt 3600
aagaagtctt agctgtctaa tttttagaga ataagattgt tcattgcatt tctgagtatt 3660
atgtaaccta tttttgcaga aggtactgtt acattaagtg catctgtgta tcctggttta 3720
aaaaaatgta atcttttttg aaataaacct tcatattctg tatagttgct aaagtgttga 3780
gaaccttttt aattgtaaaa tgagaaccga ttttcagttt agtgtagcag cacacttgtt 3840
caggtttgca tggtatgaaa ccaaatagat tcatgaaacc ttggccatga ggtttgtttc 3900
acaaggttct tagaccgagt tgtgcaggta agtgcacttt taggtaatct gcactgtttg 3960
tttgatggat aaattccatc tctgggaatt gtgtgggtat taatgtttcc atgttcccaa 4020
ctatgttgag aagtggaaaa aaacccaggt tctagatggg tgaatcagtt gggttttgta 4080
aatacttgta tgtggggaag acattgttgt ctttttgtga aaataaaaat ccacacctgg 4140
aagtgtaaaa aaaaaaaaaa aaaa 4164
<210> 143
<211> 227
<212> PRT
<213> Homo sapiens
<400> 143
Met Ala Gly Val Gly Ala Gly Pro Leu Arg Ala Met Gly Arg Gln Ala
1 5 10 15
Leu Leu Leu Leu Ala Leu Cys Ala Thr Gly Ala Gln Gly Leu Tyr Phe
20 25 30
His Ile Gly Glu Thr Glu Lys Arg Cys Phe Ile Glu Glu Ile Pro Asp
35 40 45
Glu Thr Met Val Ile Gly Asn Tyr Arg Thr Gln Met Trp Asp Lys Gln
50 55 60
Lys Glu Val Phe Leu Pro Ser Thr Pro Gly Leu Gly Met His Val Glu
65 70 75 80
Val Lys Asp Pro Asp Gly Lys Val Val Leu Ser Arg Gln Tyr Gly Ser
85 90 95
Glu Gly Arg Phe Thr Phe Thr Ser His Thr Pro Gly Asp His Gln Ile
100 105 110
Cys Leu His Ser Asn Ser Thr Arg Met Ala Leu Phe Ala Gly Gly Lys
115 120 125
Leu Arg Val His Leu Asp Ile Gln Val Gly Glu His Ala Asn Asn Tyr
130 135 140
Pro Glu Ile Ala Ala Lys Asp Lys Leu Thr Glu Leu Gln Leu Arg Ala
145 150 155 160
Arg Gln Leu Leu Asp Gln Val Glu Gln Ile Gln Lys Glu Gln Asp Tyr
165 170 175
Gln Arg Tyr Arg Glu Glu Arg Phe Arg Leu Thr Ser Glu Ser Thr Asn
180 185 190
Gln Arg Val Leu Trp Trp Ser Ile Ala Gln Thr Val Ile Leu Ile Leu
195 200 205
Thr Gly Ile Trp Gln Met Arg His Leu Lys Ser Phe Phe Glu Ala Lys
210 215 220
Lys Leu Val
225
<210> 144
<211> 1048
<212> DNA
<213> Homo sapiens
<400> 144
ggcgcttagg ggctgaggcg cgatggcagg tgtcggggct gggcctctgc gggcgatggg 60
gcggcaggcc ctgctgcttc tcgcgctgtg cgccacaggc gcccaggggc tctacttcca 120
catcggcgag accgagaagc gctgtttcat cgaggaaatc cccgacgaga ccatggtcat 180
cggcaactat cgtacccaga tgtgggataa gcagaaggag gtcttcctgc cctcgacccc 240
tggcctgggc atgcacgtgg aagtgaagga ccccgacggc aaggtggtgc tgtcccggca 300
gtacggctcg gagggccgct tcacgttcac ctcccacacg cccggtgacc atcaaatctg 360
tctgcactcc aattctacca ggatggctct cttcgctggt ggcaaactgc gtgtgcatct 420
cgacatccag gttggggagc atgccaacaa ctaccctgag attgctgcaa aagataagct 480
gacggagcta cagctccgcg cccgccagtt gcttgatcag gtggaacaga ttcagaagga 540
gcaggattac caaaggtatc gtgaagagcg cttccgactg acgagcgaga gcaccaacca 600
gagggtccta tggtggtcca ttgctcagac tgtcatcctc atcctcactg gcatctggca 660
gatgcgtcac ctcaagagct tctttgaggc caagaagctg gtgtagtgcc ctctttgtat 720
gacccttcct ttttacctca tttatttggt actttcccca cacagtcctt tatccgcctg 780
gatttttagg gaaaaaaatg aaaaagaata agtcacattg gttccatggc cacaaaccat 840
tcagatcagc cacttgctga ccctggttct taaggacaca tgacattagt ccaatctttc 900
aaaatcttgt cttagggctt gtgaggaatc agaactaacc caggactcag tcctgcttct 960
tttgcctcga gtgattttcc tctgtttttc actaaataag caaatgaaaa ctctctccat 1020
taaaaaaaaa aaaaaaaaaa aaaaaaaa 1048
<210> 145
<211> 689
<212> PRT
<213> Homo sapiens
<400> 145
Met Ala Asp Leu Glu Ala Val Leu Ala Asp Val Ser Tyr Leu Met Ala
1 5 10 15
Met Glu Lys Ser Lys Ala Thr Pro Ala Ala Arg Ala Ser Lys Lys Ile
20 25 30
Leu Leu Pro Glu Pro Ser Ile Arg Ser Val Met Gln Lys Tyr Leu Glu
35 40 45
Asp Arg Gly Glu Val Thr Phe Glu Lys Ile Phe Ser Gln Lys Leu Gly
50 55 60
Tyr Leu Leu Phe Arg Asp Phe Cys Leu Asn His Leu Glu Glu Ala Arg
65 70 75 80
Pro Leu Val Glu Phe Tyr Glu Glu Ile Lys Lys Tyr Glu Lys Leu Glu
85 90 95
Thr Glu Glu Glu Arg Val Ala Arg Ser Arg Glu Ile Phe Asp Ser Tyr
100 105 110
Ile Met Lys Glu Leu Leu Ala Cys Ser His Pro Phe Ser Lys Ser Ala
115 120 125
Thr Glu His Val Gln Gly His Leu Gly Lys Lys Gln Val Pro Pro Asp
130 135 140
Leu Phe Gln Pro Tyr Ile Glu Glu Ile Cys Gln Asn Leu Arg Gly Asp
145 150 155 160
Val Phe Gln Lys Phe Ile Glu Ser Asp Lys Phe Thr Arg Phe Cys Gln
165 170 175
Trp Lys Asn Val Glu Leu Asn Ile His Leu Thr Met Asn Asp Phe Ser
180 185 190
Val His Arg Ile Ile Gly Arg Gly Gly Phe Gly Glu Val Tyr Gly Cys
195 200 205
Arg Lys Ala Asp Thr Gly Lys Met Tyr Ala Met Lys Cys Leu Asp Lys
210 215 220
Lys Arg Ile Lys Met Lys Gln Gly Glu Thr Leu Ala Leu Asn Glu Arg
225 230 235 240
Ile Met Leu Ser Leu Val Ser Thr Gly Asp Cys Pro Phe Ile Val Cys
245 250 255
Met Ser Tyr Ala Phe His Thr Pro Asp Lys Leu Ser Phe Ile Leu Asp
260 265 270
Leu Met Asn Gly Gly Asp Leu His Tyr His Leu Ser Gln His Gly Val
275 280 285
Phe Ser Glu Ala Asp Met Arg Phe Tyr Ala Ala Glu Ile Ile Leu Gly
290 295 300
Leu Glu His Met His Asn Arg Phe Val Val Tyr Arg Asp Leu Lys Pro
305 310 315 320
Ala Asn Ile Leu Leu Asp Glu His Gly His Val Arg Ile Ser Asp Leu
325 330 335
Gly Leu Ala Cys Asp Phe Ser Lys Lys Lys Pro His Ala Ser Val Gly
340 345 350
Thr His Gly Tyr Met Ala Pro Glu Val Leu Gln Lys Gly Val Ala Tyr
355 360 365
Asp Ser Ser Ala Asp Trp Phe Ser Leu Gly Cys Met Leu Phe Lys Leu
370 375 380
Leu Arg Gly His Ser Pro Phe Arg Gln His Lys Thr Lys Asp Lys His
385 390 395 400
Glu Ile Asp Arg Met Thr Leu Thr Met Ala Val Glu Leu Pro Asp Ser
405 410 415
Phe Ser Pro Glu Leu Arg Ser Leu Leu Glu Gly Leu Leu Gln Arg Asp
420 425 430
Val Asn Arg Arg Leu Gly Cys Leu Gly Arg Gly Ala Gln Glu Val Lys
435 440 445
Glu Ser Pro Phe Phe Arg Ser Leu Asp Trp Gln Met Val Phe Leu Gln
450 455 460
Lys Tyr Pro Pro Pro Leu Ile Pro Pro Arg Gly Glu Val Asn Ala Ala
465 470 475 480
Asp Ala Phe Asp Ile Gly Ser Phe Asp Glu Glu Asp Thr Lys Gly Ile
485 490 495
Lys Leu Leu Asp Ser Asp Gln Glu Leu Tyr Arg Asn Phe Pro Leu Thr
500 505 510
Ile Ser Glu Arg Trp Gln Gln Glu Val Ala Glu Thr Val Phe Asp Thr
515 520 525
Ile Asn Ala Glu Thr Asp Arg Leu Glu Ala Arg Lys Lys Ala Lys Asn
530 535 540
Lys Gln Leu Gly His Glu Glu Asp Tyr Ala Leu Gly Lys Asp Cys Ile
545 550 555 560
Met His Gly Tyr Met Ser Lys Met Gly Asn Pro Phe Leu Thr Gln Trp
565 570 575
Gln Arg Arg Tyr Phe Tyr Leu Phe Pro Asn Arg Leu Glu Trp Arg Gly
580 585 590
Glu Gly Glu Ala Pro Gln Ser Leu Leu Thr Met Glu Glu Ile Gln Ser
595 600 605
Val Glu Glu Thr Gln Ile Lys Glu Arg Lys Cys Leu Leu Leu Lys Ile
610 615 620
Arg Gly Gly Lys Gln Phe Ile Leu Gln Cys Asp Ser Asp Pro Glu Leu
625 630 635 640
Val Gln Trp Lys Lys Glu Leu Arg Asp Ala Tyr Arg Glu Ala Gln Gln
645 650 655
Leu Val Gln Arg Val Pro Lys Met Lys Asn Lys Pro Arg Ser Pro Val
660 665 670
Val Glu Leu Ser Lys Val Pro Leu Val Gln Arg Gly Ser Ala Asn Gly
675 680 685
Leu
<210> 146
<211> 3478
<212> DNA
<213> Homo sapiens
<400> 146
cgggcgcgcg ggcggcggcg gcggcggcgc cccgactgca gtcccggcgg gagcggagcg 60
cgagccgggg ccgggcccga gccggcgcca tggggcggcg ccgcctgtga gcggcggcga 120
gcggagccgc gggcgccgag cagggccagg cgggaggcgt cggcgcccga ggccgagcga 180
gccgcggccg ggccgggccg agcgccgagc gagcaggagc ggcggcggcg gcggcggcgg 240
cgggaggagg cagcgccgcc gccaagatgg cggacctgga ggcggtgctg gccgacgtga 300
gctacctgat ggccatggag aagagcaagg ccacgccggc cgcgcgcgcc agcaagaaga 360
tcctgctgcc cgagcccagc atccgcagtg tcatgcagaa gtacctggag gaccggggcg 420
aggtgacctt tgagaagatc ttttcccaga agctggggta cctgctcttc cgagacttct 480
gcctgaacca cctggaggag gccaggccct tggtggaatt ctatgaggag atcaagaagt 540
acgagaagct ggagacggag gaggagcgtg tggcccgcag ccgggagatc ttcgactcat 600
acatcatgaa ggagctgctg gcctgctcgc atcccttctc gaagagtgcc actgagcatg 660
tccaaggcca cctggggaag aagcaggtgc ctccggatct cttccagcca tacatcgaag 720
agatttgtca aaacctccga ggggacgtgt tccagaaatt cattgagagc gataagttca 780
cacggttttg ccagtggaag aatgtggagc tcaacatcca cctgaccatg aatgacttca 840
gcgtgcatcg catcattggg cgcgggggct ttggcgaggt ctatgggtgc cggaaggctg 900
acacaggcaa gatgtacgcc atgaagtgcc tggacaaaaa gcgcatcaag atgaagcagg 960
gggagaccct ggccctgaac gagcgcatca tgctctcgct cgtcagcact ggggactgcc 1020
cattcattgt ctgcatgtca tacgcgttcc acacgccaga caagctcagc ttcatcctgg 1080
acctcatgaa cggtggggac ctgcactacc acctctccca gcacggggtc ttctcagagg 1140
ctgacatgcg cttctatgcg gccgagatca tcctgggcct ggagcacatg cacaaccgct 1200
tcgtggtcta ccgggacctg aagccagcca acatccttct ggacgagcat ggccacgtgc 1260
ggatctcgga cctgggcctg gcctgtgact tctccaagaa gaagccccat gccagcgtgg 1320
gcacccacgg gtacatggct ccggaggtcc tgcagaaggg cgtggcctac gacagcagtg 1380
ccgactggtt ctctctgggg tgcatgctct tcaagttgct gcgggggcac agccccttcc 1440
ggcagcacaa gaccaaagac aagcatgaga tcgaccgcat gacgctgacg atggccgtgg 1500
agctgcccga ctccttctcc cctgaactac gctccctgct ggaggggttg ctgcagaggg 1560
atgtcaaccg gagattgggc tgcctgggcc gaggggctca ggaggtgaaa gagagcccct 1620
ttttccgctc cctggactgg cagatggtct tcttgcagaa gtaccctccc ccgctgatcc 1680
ccccacgagg ggaggtgaac gcggccgacg ccttcgacat tggctccttc gatgaggagg 1740
acacaaaagg aatcaagtta ctggacagtg atcaggagct ctaccgcaac ttccccctca 1800
ccatctcgga gcggtggcag caggaggtgg cagagactgt cttcgacacc atcaacgctg 1860
agacagaccg gctggaggct cgcaagaaag ccaagaacaa gcagctgggc catgaggaag 1920
actacgccct gggcaaggac tgcatcatgc atggctacat gtccaagatg ggcaacccct 1980
tcctgaccca gtggcagcgg cggtacttct acctgttccc caaccgcctc gagtggcggg 2040
gcgagggcga ggccccgcag agcctgctga ccatggagga gatccagtcg gtggaggaga 2100
cgcagatcaa ggagcgcaag tgcctgctcc tcaagatccg cggtgggaaa cagttcattt 2160
tgcagtgcga tagcgaccct gagctggtgc agtggaagaa ggagctgcgc gacgcctacc 2220
gcgaggccca gcagctggtg cagcgggtgc ccaagatgaa gaacaagccg cgctcgcccg 2280
tggtggagct gagcaaggtg ccgctggtcc agcgcggcag tgccaacggc ctctgacccg 2340
cccacccgcc ttttataaac ctctaattta ttttgtcgaa tttttattat ttgttttccc 2400
gccaagcgga aaaggtttta ttttgtaatt attgtgattt cccgtggccc cagcctggcc 2460
cagctccccc gggaggggcc cgcttgcctc ggctcctgct gcaccaaccc agccgctgcc 2520
cggcgccctc tgtcctgact tcaggggctg cccgctccca gtgtcttcct gtgggggaag 2580
agcacagccc tcccgcccct tccccgaggg atgatgccac accaagctgt gccaccctgg 2640
gctctgtggg ctgcactctg tgcccatggg cactgctggg tggcccatcc cccctcacca 2700
ggggcaggca cagcacaggg atccgacttg aattttccca ctgcaccccc tcctgctgca 2760
gaggggcagg ccctgcactg tcctgctcca cagtgttggc gagaggaggg gcccgttgtc 2820
tccctggccc tcaaggcctc ccacagtgac tcgggctcct gtgcccttat tcaggaaaag 2880
cctctgtgtc actggctgcc tccactccca cttccctgac actgcggggc ttggctgaga 2940
gagtggcatt ggcagcaggt gctgctaccc tccctgctgt cccctcttgc cccaaccccc 3000
agcacccggg ctcagggacc acagcaaggc acctgcaggt tgggccatac tggcctcgcc 3060
tggcctgagg tctcgctgat gctgggctgg gtgcgacccc atctgcccag gacggggccg 3120
gccaggtggg cgggcagcac agcaaggagg ctggctgggg cctatcagtg tgccccccat 3180
cctggcccat cagtgtaccc ccgcccaggc tggccagccc cacagcccac gtcctgtcag 3240
tgccgccgcc tcgcccaccg catgccccct cgtgccagtc gcgctgcctg tgtggtgtcg 3300
cgccttctcc cccccggggc tgggttggcg caccctcccc tcccgtctac tcattccccg 3360
gggcgtttct ttgccgattt ttgaatgtga ttttaaagag tgaaaaatga gactatgcgt 3420
ttttataaaa aatggtgcct gattaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaa 3478
<210> 147
<211> 444
<212> PRT
<213> Homo sapiens
<400> 147
Met Arg Glu Ile Val His Ile Gln Ala Gly Gln Cys Gly Asn Gln Ile
1 5 10 15
Gly Ala Lys Phe Trp Glu Val Ile Ser Asp Glu His Gly Ile Asp Pro
20 25 30
Thr Gly Thr Tyr His Gly Asp Ser Asp Leu Gln Leu Asp Arg Ile Ser
35 40 45
Val Tyr Tyr Asn Glu Ala Thr Gly Gly Lys Tyr Val Pro Arg Ala Ile
50 55 60
Leu Val Asp Leu Glu Pro Gly Thr Met Asp Ser Val Arg Ser Gly Pro
65 70 75 80
Phe Gly Gln Ile Phe Arg Pro Asp Asn Phe Val Phe Gly Gln Ser Gly
85 90 95
Ala Gly Asn Asn Trp Ala Lys Gly His Tyr Thr Glu Gly Ala Glu Leu
100 105 110
Val Asp Ser Val Leu Asp Val Val Arg Lys Glu Ala Glu Ser Cys Asp
115 120 125
Cys Leu Gln Gly Phe Gln Leu Thr His Ser Leu Gly Gly Gly Thr Gly
130 135 140
Ser Gly Met Gly Thr Leu Leu Ile Ser Lys Ile Arg Glu Glu Tyr Pro
145 150 155 160
Asp Arg Ile Met Asn Thr Phe Ser Val Val Pro Ser Pro Lys Val Ser
165 170 175
Asp Thr Val Val Glu Pro Tyr Asn Ala Thr Leu Ser Val His Gln Leu
180 185 190
Val Glu Asn Thr Asp Glu Thr Tyr Cys Ile Asp Asn Glu Ala Leu Tyr
195 200 205
Asp Ile Cys Phe Arg Thr Leu Lys Leu Thr Thr Pro Thr Tyr Gly Asp
210 215 220
Leu Asn His Leu Val Ser Ala Thr Met Ser Gly Val Thr Thr Cys Leu
225 230 235 240
Arg Phe Pro Gly Gln Leu Asn Ala Asp Leu Arg Lys Leu Ala Val Asn
245 250 255
Met Val Pro Phe Pro Arg Leu His Phe Phe Met Pro Gly Phe Ala Pro
260 265 270
Leu Thr Ser Arg Gly Ser Gln Gln Tyr Arg Ala Leu Thr Val Pro Glu
275 280 285
Leu Thr Gln Gln Val Phe Asp Ala Lys Asn Met Met Ala Ala Cys Asp
290 295 300
Pro Arg His Gly Arg Tyr Leu Thr Val Ala Ala Val Phe Arg Gly Arg
305 310 315 320
Met Ser Met Lys Glu Val Asp Glu Gln Met Leu Asn Val Gln Asn Lys
325 330 335
Asn Ser Ser Tyr Phe Val Glu Trp Ile Pro Asn Asn Val Lys Thr Ala
340 345 350
Val Cys Asp Ile Pro Pro Arg Gly Leu Lys Met Ala Val Thr Phe Ile
355 360 365
Gly Asn Ser Thr Ala Ile Gln Glu Leu Phe Lys Arg Ile Ser Glu Gln
370 375 380
Phe Thr Ala Met Phe Arg Arg Lys Ala Phe Leu His Trp Tyr Thr Gly
385 390 395 400
Glu Gly Met Asp Glu Met Glu Phe Thr Glu Ala Glu Ser Asn Met Asn
405 410 415
Asp Leu Val Ser Glu Tyr Gln Gln Tyr Gln Asp Ala Thr Ala Glu Glu
420 425 430
Glu Glu Asp Phe Gly Glu Glu Ala Glu Glu Glu Ala
435 440
<210> 148
<211> 2510
<212> DNA
<213> Homo sapiens
<400> 148
gcacctcgct gctccagcct ctggggcgca ttccaacctt ccagcctgcg acctgcggag 60
aaaaaaaatt acttattttc ttgccccata cataccttga ggcgagcaaa aaaattaaat 120
tttaaccatg agggaaatcg tgcacatcca ggctggtcag tgtggcaacc agatcggtgc 180
caagttctgg gaggtgatca gtgatgaaca tggcatcgac cccaccggca cctaccacgg 240
ggacagcgac ctgcagctgg accgcatctc tgtgtactac aatgaagcca caggtggcaa 300
atatgttcct cgtgccatcc tggtggatct agaacctggg accatggact ctgttcgctc 360
aggtcctttt ggccagatct ttagaccaga caactttgta tttggtcagt ctggggcagg 420
taacaactgg gccaaaggcc actacacaga gggcgccgag ctggttgatt ctgtcctgga 480
tgtggtacgg aaggaggcag agagctgtga ctgcctgcag ggcttccagc tgacccactc 540
actgggcggg ggcacaggct ctggaatggg cactctcctt atcagcaaga tccgagaaga 600
ataccctgat cgcatcatga ataccttcag tgtggtgcct tcacccaaag tgtctgacac 660
cgtggtcgag ccctacaatg ccaccctctc cgtccatcag ttggtagaga atactgatga 720
gacctattgc attgacaacg aggccctcta tgatatctgc ttccgcactc tgaagctgac 780
cacaccaacc tacggggatc tgaaccacct tgtctcagcc accatgagtg gtgtcaccac 840
ctgcctccgt ttccctggcc agctcaatgc tgacctccgc aagttggcag tcaacatggt 900
ccccttccca cgtctccatt tctttatgcc tggctttgcc cctctcacca gccgtggaag 960
ccagcagtat cgagctctca cagtgccgga actcacccag caggtcttcg atgccaagaa 1020
catgatggct gcctgtgacc cccgccacgg ccgatacctc accgtggctg ctgtcttccg 1080
tggtcggatg tccatgaagg aggtcgatga gcagatgctt aacgtgcaga acaagaacag 1140
cagctacttt gtggaatgga tccccaacaa tgtcaagaca gccgtctgtg acatcccacc 1200
tcgtggcctc aagatggcag tcaccttcat tggcaatagc acagccatcc aggagctctt 1260
caagcgcatc tcggagcagt tcactgccat gttccgccgg aaggccttcc tccactggta 1320
cacaggcgag ggcatggacg agatggagtt caccgaggct gagagcaaca tgaacgacct 1380
cgtctctgag tatcagcagt accaggatgc caccgcagaa gaggaggagg atttcggtga 1440
ggaggccgaa gaggaggcct aaggcagagc ccccatcacc tcaggcttct cagttccctt 1500
agccgtctta ctcaactgcc cctttcctct ccctcagaat ttgtgtttgc tgcctctatc 1560
ttgttttttg ttttttcttc tggggggggt ctagaacagt gcctggcaca tagtaggcgc 1620
tcaataaata cttgtttgtt gaatgtctcc tctctctttc cactctggga aacctaggtt 1680
tctgccattc tgggtgaccc tgtatttctt tctggtgccc attccatttg tccagttaat 1740
acttcctctt aaaaatctcc aagaagctgg gtctccagat cccatttaga accaaccagg 1800
tgctgaaaac acatgtagat aatggccatc atcctaagcc caaagtagaa aatggtagaa 1860
ggtagtgggt agaagtcact atataaggaa ggggatggga ttttccattc taaaagtttt 1920
ggagagggaa atccaggcta ttaaagtcac taaatttcta agtatgtcca tttcccatct 1980
cagcttcaag ggaggtgtca gcagtattat ctccactttc aatctccctc caagctctac 2040
tctggaggag tctgtcccac tctgtcaagt ggaatccttc cctttccaac tctacctccc 2100
tcactcagct cctttcccct gatcagagaa agggatcaag ggggttggga ggggggaaag 2160
agaccagcct tggtccctaa gcctccagaa acgtcttctt aatccccacc ttttcttact 2220
cccaaaaaag aatgaacacc cctgactctg gagtggtgta tactgccaca tcagtgtttg 2280
agtcagtccc cagaggagag gggaaccctc ctccatcttt tttgcaacat ctcatttctt 2340
ccttttgctg ttgcttcccc cctcacacac ttggttttgt tctatcctac atttgagatt 2400
tctattttat gttgaacttg ctgctttttt tcatattgaa aagatgacat cgccccaaga 2460
gccaaaaata aatgggaatt gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2510
<210> 149
<211> 158
<212> PRT
<213> Homo sapiens
<400> 149
Met Ser Gly Ile Ala Leu Ser Arg Leu Ala Gln Glu Arg Lys Ala Trp
1 5 10 15
Arg Lys Asp His Pro Phe Gly Phe Val Ala Val Pro Thr Lys Asn Pro
20 25 30
Asp Gly Thr Met Asn Leu Met Asn Trp Glu Cys Ala Ile Pro Gly Lys
35 40 45
Lys Gly Thr Pro Trp Glu Gly Gly Leu Phe Lys Leu Arg Met Leu Phe
50 55 60
Lys Asp Asp Tyr Pro Ser Ser Pro Pro Lys Cys Lys Phe Glu Pro Pro
65 70 75 80
Leu Phe His Pro Asn Val Tyr Pro Ser Gly Thr Val Cys Leu Ser Ile
85 90 95
Leu Glu Glu Asp Lys Asp Trp Arg Pro Ala Ile Thr Ile Lys Gln Ile
100 105 110
Leu Leu Gly Ile Gln Glu Leu Leu Asn Glu Pro Asn Ile Gln Asp Pro
115 120 125
Ala Gln Ala Glu Ala Tyr Thr Ile Tyr Cys Gln Asn Arg Val Glu Tyr
130 135 140
Glu Lys Arg Val Arg Ala Gln Ala Lys Lys Phe Ala Pro Ser
145 150 155
<210> 150
<211> 2871
<212> DNA
<213> Homo sapiens
<400> 150
gcccgcgcca gggtcctcgg agctgctctg gctgcgcgcg gagcgggctc cggagggaag 60
tcccgagaca aagggaagcg ccgccgccgc cgccccgctc ggtcctccac ctgtccgcta 120
cgctcgccgg ggctgcggcc gcccgaggga ctttgaacat gtcggggatc gccctcagca 180
gactcgccca ggagaggaaa gcatggagga aagaccaccc atttggtttc gtggctgtcc 240
caacaaaaaa tcccgatggc acgatgaacc tcatgaactg ggagtgcgcc attccaggaa 300
agaaagggac tccgtgggaa ggaggcttgt ttaaactacg gatgcttttc aaagatgatt 360
atccatcttc gccaccaaaa tgtaaattcg aaccaccatt atttcacccg aatgtgtacc 420
cttcggggac agtgtgcctg tccatcttag aggaggacaa ggactggagg ccagccatca 480
caatcaaaca gatcctatta ggaatacagg aacttctaaa tgaaccaaat atccaagacc 540
cagctcaagc agaggcctac acgatttact gccaaaacag agtggagtac gagaaaaggg 600
tccgagcaca agccaagaag tttgcgccct cataagcagc gaccttgtgg catcgtcaaa 660
aggaagggat tggtttggca agaacttgtt tacaacattt ttgcaaatct aaagttgctc 720
catacaatga ctagtcacct gggggggttg ggcgggcgcc atcttccatt gccgccgcgg 780
gtgtgcggtc tcgattcgct gaattgcccg tttccataca gggtctcttc cttcggtctt 840
ttgtattttt gattgttatg taaaactcgc ttttatttta atattgatgt cagtatttca 900
actgctgtaa aattataaac ttttatactt gggtaagtcc cccaggggcg agttcctcgc 960
tctgggatgc aggcatgctt ctcaccgtgc agagctgcac ttggcctcag ctggctgtat 1020
ggaaatgcac cctccctcct gccgctcctc tctagaacct tctagaacct gggctgtgct 1080
gcttttgagc ctcagacccc aggtcagcat ctcggttctg cgccacttcc tttgtgttta 1140
tatggcgttt tgtctgtgtt gctgtttaga gtaaataaac tgtttatata aaggttttgg 1200
ttgcattatt atcattgaaa gtgagaggag gcggcctccc agtgcccggc cctccccacc 1260
cacctgcagc cccaccgcgg gccaggacca ggctctccat ctgcttcgga tgcacgcagg 1320
ctgtgaggct ctgtcttgcc ctggatcttt gtaaacaggg ctgtgtacaa agtgctgctg 1380
aggtttctgt gctccccgca tctgcgggct gtagagcgct gggcagctaa gatctgcata 1440
ggtcgggatt ggcatcgaga ccctggcaac tgcaccggtg ccagctgtct tgggggccac 1500
aaggccaggt ccagaccagg gctgggggct gcctgaggac tcctatccgg gcagcctgct 1560
ggcgggggtt cccctcttca gtggccaggt cacagggatg gagctgcgct gtgcataggg 1620
tgccacctca ggtgtctgtc ccttgtgtcc tcaggaggca gccttgctac cacccgtggc 1680
aaacgccagg tgctttttct gggagagccc acagccgtgg ccctccaggg cttccccgac 1740
ccttagcgcc aggtagaggg ccctgggcag cctgtgtctg gaattcttcg tcctgaggcc 1800
acctgagtgt ggtctgtcct ggggaggctg tgcgcctcag cagccgtcct gacgctgagc 1860
cctctgcaaa ggttgggccg gccaggcctc ttggggctgc ctgagccact gcaggaagtg 1920
gcctggctgg gaagttgggt gccggtcacc tcccagcagg aaggcacagt ggacagagat 1980
gggaagccct gggggacaca gcccggtgct cccagccctc caacctctgg ctcccaaccc 2040
agtctcccca tcctagcgag cttggccctc ctcagtttcg tttcaagcct tggggctgga 2100
gctggccctg ctgccctggc accccccggt ggctggagct gggtccccgt ggcccaagtg 2160
cagggtccca agagggcagg gcggggctcc ccaaaggagc aaagaatgca gggagggcgg 2220
tccagggccc tgggaagggg agctcggcac cctccaggtc cgtgtgggac tccagccgct 2280
gttggctggg aatcgaagtt agaggtgact tccaaaggcc ccccgagccg gcagtgcccc 2340
ccaccacccc tccagcgact ctgcggtgcc agtgccttgt tggcttttcc ggctacgcac 2400
cctgcagtca ctgagctctc ggtctgacgt ctgatgtttg tggtttgttt ataacacggg 2460
gccttacctg gggaattcag ctggtttgaa tatttgtagc ccgctcccag aatgtcttat 2520
tttgtaatga ctgaactaca tttagtaata gttacacatg tatatggtta atacatatgg 2580
aaattcaata tattttgtag ttaacgtatt ctgaagtaac ggatgtttct cgccaatcgt 2640
agtgacttca gctaacgaaa tgttcttttg tagtaccacg gtcctcggcc taacgaagga 2700
cgtgaacctt gtaagaggag agctctgaaa cgcggtcacc tttgtttagt ggaagggaaa 2760
gtgtgttccc ggcatgaggt gcctcggaat tagtaaagaa ttgtgggcaa tggattaacc 2820
actgtatcta agaatccacc attaaagcat ttgcacagac aaaaaaaaaa a 2871
<210> 151
<211> 158
<212> PRT
<213> Homo sapiens
<400> 151
Met Ser Gly Ile Ala Leu Ser Arg Leu Ala Gln Glu Arg Lys Ala Trp
1 5 10 15
Arg Lys Asp His Pro Phe Gly Phe Val Ala Val Pro Thr Lys Asn Pro
20 25 30
Asp Gly Thr Met Asn Leu Met Asn Trp Glu Cys Ala Ile Pro Gly Lys
35 40 45
Lys Gly Thr Pro Trp Glu Gly Gly Leu Phe Lys Leu Arg Met Leu Phe
50 55 60
Lys Asp Asp Tyr Pro Ser Ser Pro Pro Lys Cys Lys Phe Glu Pro Pro
65 70 75 80
Leu Phe His Pro Asn Val Tyr Pro Ser Gly Thr Val Cys Leu Ser Ile
85 90 95
Leu Glu Glu Asp Lys Asp Trp Arg Pro Ala Ile Thr Ile Lys Gln Ile
100 105 110
Leu Leu Gly Ile Gln Glu Leu Leu Asn Glu Pro Asn Ile Gln Asp Pro
115 120 125
Ala Gln Ala Glu Ala Tyr Thr Ile Tyr Cys Gln Asn Arg Val Glu Tyr
130 135 140
Glu Lys Arg Val Arg Ala Gln Ala Lys Lys Phe Ala Pro Ser
145 150 155
<210> 152
<211> 3128
<212> DNA
<213> Homo sapiens
<400> 152
gcccgcgcca gggtcctcgg agctgctctg gctgcgcgcg gagcgggctc cggagggaag 60
tcccgagaca aagggaagcg ccgccgccgc cgccccgctc ggtcctccac ctgtccgcta 120
cgctcgccgg ggctgcggcc gcccgaggct gccctgagga tctgtgtttg gtgaaaagga 180
gccaaattca cctgcagggc aggcggctct agcagcttca gaagcctggt gccctggcga 240
cactggacct gccttggctt ctttgatccc aaccccaccc ccgatttctg ctctgctgac 300
tggggaagtc atcgtgccac ccagaacctg agtgcgggcc tctcagagct ccttcgtccg 360
tgggtctgcc ggggactggg ccttgtctcc ctaacgagtg ccagggactt tgaacatgtc 420
ggggatcgcc ctcagcagac tcgcccagga gaggaaagca tggaggaaag accacccatt 480
tggtttcgtg gctgtcccaa caaaaaatcc cgatggcacg atgaacctca tgaactggga 540
gtgcgccatt ccaggaaaga aagggactcc gtgggaagga ggcttgttta aactacggat 600
gcttttcaaa gatgattatc catcttcgcc accaaaatgt aaattcgaac caccattatt 660
tcacccgaat gtgtaccctt cggggacagt gtgcctgtcc atcttagagg aggacaagga 720
ctggaggcca gccatcacaa tcaaacagat cctattagga atacaggaac ttctaaatga 780
accaaatatc caagacccag ctcaagcaga ggcctacacg atttactgcc aaaacagagt 840
ggagtacgag aaaagggtcc gagcacaagc caagaagttt gcgccctcat aagcagcgac 900
cttgtggcat cgtcaaaagg aagggattgg tttggcaaga acttgtttac aacatttttg 960
caaatctaaa gttgctccat acaatgacta gtcacctggg ggggttgggc gggcgccatc 1020
ttccattgcc gccgcgggtg tgcggtctcg attcgctgaa ttgcccgttt ccatacaggg 1080
tctcttcctt cggtcttttg tatttttgat tgttatgtaa aactcgcttt tattttaata 1140
ttgatgtcag tatttcaact gctgtaaaat tataaacttt tatacttggg taagtccccc 1200
aggggcgagt tcctcgctct gggatgcagg catgcttctc accgtgcaga gctgcacttg 1260
gcctcagctg gctgtatgga aatgcaccct ccctcctgcc gctcctctct agaaccttct 1320
agaacctggg ctgtgctgct tttgagcctc agaccccagg tcagcatctc ggttctgcgc 1380
cacttccttt gtgtttatat ggcgttttgt ctgtgttgct gtttagagta aataaactgt 1440
ttatataaag gttttggttg cattattatc attgaaagtg agaggaggcg gcctcccagt 1500
gcccggccct ccccacccac ctgcagcccc accgcgggcc aggaccaggc tctccatctg 1560
cttcggatgc acgcaggctg tgaggctctg tcttgccctg gatctttgta aacagggctg 1620
tgtacaaagt gctgctgagg tttctgtgct ccccgcatct gcgggctgta gagcgctggg 1680
cagctaagat ctgcataggt cgggattggc atcgagaccc tggcaactgc accggtgcca 1740
gctgtcttgg gggccacaag gccaggtcca gaccagggct gggggctgcc tgaggactcc 1800
tatccgggca gcctgctggc gggggttccc ctcttcagtg gccaggtcac agggatggag 1860
ctgcgctgtg catagggtgc cacctcaggt gtctgtccct tgtgtcctca ggaggcagcc 1920
ttgctaccac ccgtggcaaa cgccaggtgc tttttctggg agagcccaca gccgtggccc 1980
tccagggctt ccccgaccct tagcgccagg tagagggccc tgggcagcct gtgtctggaa 2040
ttcttcgtcc tgaggccacc tgagtgtggt ctgtcctggg gaggctgtgc gcctcagcag 2100
ccgtcctgac gctgagccct ctgcaaaggt tgggccggcc aggcctcttg gggctgcctg 2160
agccactgca ggaagtggcc tggctgggaa gttgggtgcc ggtcacctcc cagcaggaag 2220
gcacagtgga cagagatggg aagccctggg ggacacagcc cggtgctccc agccctccaa 2280
cctctggctc ccaacccagt ctccccatcc tagcgagctt ggccctcctc agtttcgttt 2340
caagccttgg ggctggagct ggccctgctg ccctggcacc ccccggtggc tggagctggg 2400
tccccgtggc ccaagtgcag ggtcccaaga gggcagggcg gggctcccca aaggagcaaa 2460
gaatgcaggg agggcggtcc agggccctgg gaaggggagc tcggcaccct ccaggtccgt 2520
gtgggactcc agccgctgtt ggctgggaat cgaagttaga ggtgacttcc aaaggccccc 2580
cgagccggca gtgcccccca ccacccctcc agcgactctg cggtgccagt gccttgttgg 2640
cttttccggc tacgcaccct gcagtcactg agctctcggt ctgacgtctg atgtttgtgg 2700
tttgtttata acacggggcc ttacctgggg aattcagctg gtttgaatat ttgtagcccg 2760
ctcccagaat gtcttatttt gtaatgactg aactacattt agtaatagtt acacatgtat 2820
atggttaata catatggaaa ttcaatatat tttgtagtta acgtattctg aagtaacgga 2880
tgtttctcgc caatcgtagt gacttcagct aacgaaatgt tcttttgtag taccacggtc 2940
ctcggcctaa cgaaggacgt gaaccttgta agaggagagc tctgaaacgc ggtcaccttt 3000
gtttagtgga agggaaagtg tgttcccggc atgaggtgcc tcggaattag taaagaattg 3060
tgggcaatgg attaaccact gtatctaaga atccaccatt aaagcatttg cacagacaaa 3120
aaaaaaaa 3128
<210> 153
<211> 158
<212> PRT
<213> Homo sapiens
<400> 153
Met Ser Gly Ile Ala Leu Ser Arg Leu Ala Gln Glu Arg Lys Ala Trp
1 5 10 15
Arg Lys Asp His Pro Phe Gly Phe Val Ala Val Pro Thr Lys Asn Pro
20 25 30
Asp Gly Thr Met Asn Leu Met Asn Trp Glu Cys Ala Ile Pro Gly Lys
35 40 45
Lys Gly Thr Pro Trp Glu Gly Gly Leu Phe Lys Leu Arg Met Leu Phe
50 55 60
Lys Asp Asp Tyr Pro Ser Ser Pro Pro Lys Cys Lys Phe Glu Pro Pro
65 70 75 80
Leu Phe His Pro Asn Val Tyr Pro Ser Gly Thr Val Cys Leu Ser Ile
85 90 95
Leu Glu Glu Asp Lys Asp Trp Arg Pro Ala Ile Thr Ile Lys Gln Ile
100 105 110
Leu Leu Gly Ile Gln Glu Leu Leu Asn Glu Pro Asn Ile Gln Asp Pro
115 120 125
Ala Gln Ala Glu Ala Tyr Thr Ile Tyr Cys Gln Asn Arg Val Glu Tyr
130 135 140
Glu Lys Arg Val Arg Ala Gln Ala Lys Lys Phe Ala Pro Ser
145 150 155
<210> 154
<211> 2991
<212> DNA
<213> Homo sapiens
<400> 154
aactcgcggg agcgtcaccg tcctgcgacg cttcagagga tccttaggcc tcagtggtct 60
ttgacccccg gccccaggac ctgaccccaa ggaaacctcc gggacctgtg gctggagagg 120
tgaccgccag gcatccgggg agcctttgga gatctcggct tcctttttcc cccgctgctt 180
gccggcgtgt cctcgggtgg acgcgggcag cccgaagggg agtttacaga cgctccctca 240
catcggggac gcggctcctt taagggcgga ctttgaacat gtcggggatc gccctcagca 300
gactcgccca ggagaggaaa gcatggagga aagaccaccc atttggtttc gtggctgtcc 360
caacaaaaaa tcccgatggc acgatgaacc tcatgaactg ggagtgcgcc attccaggaa 420
agaaagggac tccgtgggaa ggaggcttgt ttaaactacg gatgcttttc aaagatgatt 480
atccatcttc gccaccaaaa tgtaaattcg aaccaccatt atttcacccg aatgtgtacc 540
cttcggggac agtgtgcctg tccatcttag aggaggacaa ggactggagg ccagccatca 600
caatcaaaca gatcctatta ggaatacagg aacttctaaa tgaaccaaat atccaagacc 660
cagctcaagc agaggcctac acgatttact gccaaaacag agtggagtac gagaaaaggg 720
tccgagcaca agccaagaag tttgcgccct cataagcagc gaccttgtgg catcgtcaaa 780
aggaagggat tggtttggca agaacttgtt tacaacattt ttgcaaatct aaagttgctc 840
catacaatga ctagtcacct gggggggttg ggcgggcgcc atcttccatt gccgccgcgg 900
gtgtgcggtc tcgattcgct gaattgcccg tttccataca gggtctcttc cttcggtctt 960
ttgtattttt gattgttatg taaaactcgc ttttatttta atattgatgt cagtatttca 1020
actgctgtaa aattataaac ttttatactt gggtaagtcc cccaggggcg agttcctcgc 1080
tctgggatgc aggcatgctt ctcaccgtgc agagctgcac ttggcctcag ctggctgtat 1140
ggaaatgcac cctccctcct gccgctcctc tctagaacct tctagaacct gggctgtgct 1200
gcttttgagc ctcagacccc aggtcagcat ctcggttctg cgccacttcc tttgtgttta 1260
tatggcgttt tgtctgtgtt gctgtttaga gtaaataaac tgtttatata aaggttttgg 1320
ttgcattatt atcattgaaa gtgagaggag gcggcctccc agtgcccggc cctccccacc 1380
cacctgcagc cccaccgcgg gccaggacca ggctctccat ctgcttcgga tgcacgcagg 1440
ctgtgaggct ctgtcttgcc ctggatcttt gtaaacaggg ctgtgtacaa agtgctgctg 1500
aggtttctgt gctccccgca tctgcgggct gtagagcgct gggcagctaa gatctgcata 1560
ggtcgggatt ggcatcgaga ccctggcaac tgcaccggtg ccagctgtct tgggggccac 1620
aaggccaggt ccagaccagg gctgggggct gcctgaggac tcctatccgg gcagcctgct 1680
ggcgggggtt cccctcttca gtggccaggt cacagggatg gagctgcgct gtgcataggg 1740
tgccacctca ggtgtctgtc ccttgtgtcc tcaggaggca gccttgctac cacccgtggc 1800
aaacgccagg tgctttttct gggagagccc acagccgtgg ccctccaggg cttccccgac 1860
ccttagcgcc aggtagaggg ccctgggcag cctgtgtctg gaattcttcg tcctgaggcc 1920
acctgagtgt ggtctgtcct ggggaggctg tgcgcctcag cagccgtcct gacgctgagc 1980
cctctgcaaa ggttgggccg gccaggcctc ttggggctgc ctgagccact gcaggaagtg 2040
gcctggctgg gaagttgggt gccggtcacc tcccagcagg aaggcacagt ggacagagat 2100
gggaagccct gggggacaca gcccggtgct cccagccctc caacctctgg ctcccaaccc 2160
agtctcccca tcctagcgag cttggccctc ctcagtttcg tttcaagcct tggggctgga 2220
gctggccctg ctgccctggc accccccggt ggctggagct gggtccccgt ggcccaagtg 2280
cagggtccca agagggcagg gcggggctcc ccaaaggagc aaagaatgca gggagggcgg 2340
tccagggccc tgggaagggg agctcggcac cctccaggtc cgtgtgggac tccagccgct 2400
gttggctggg aatcgaagtt agaggtgact tccaaaggcc ccccgagccg gcagtgcccc 2460
ccaccacccc tccagcgact ctgcggtgcc agtgccttgt tggcttttcc ggctacgcac 2520
cctgcagtca ctgagctctc ggtctgacgt ctgatgtttg tggtttgttt ataacacggg 2580
gccttacctg gggaattcag ctggtttgaa tatttgtagc ccgctcccag aatgtcttat 2640
tttgtaatga ctgaactaca tttagtaata gttacacatg tatatggtta atacatatgg 2700
aaattcaata tattttgtag ttaacgtatt ctgaagtaac ggatgtttct cgccaatcgt 2760
agtgacttca gctaacgaaa tgttcttttg tagtaccacg gtcctcggcc taacgaagga 2820
cgtgaacctt gtaagaggag agctctgaaa cgcggtcacc tttgtttagt ggaagggaaa 2880
gtgtgttccc ggcatgaggt gcctcggaat tagtaaagaa ttgtgggcaa tggattaacc 2940
actgtatcta agaatccacc attaaagcat ttgcacagac aaaaaaaaaa a 2991
<210> 155
<211> 158
<212> PRT
<213> Homo sapiens
<400> 155
Met Ser Gly Ile Ala Leu Ser Arg Leu Ala Gln Glu Arg Lys Ala Trp
1 5 10 15
Arg Lys Asp His Pro Phe Gly Phe Val Ala Val Pro Thr Lys Asn Pro
20 25 30
Asp Gly Thr Met Asn Leu Met Asn Trp Glu Cys Ala Ile Pro Gly Lys
35 40 45
Lys Gly Thr Pro Trp Glu Gly Gly Leu Phe Lys Leu Arg Met Leu Phe
50 55 60
Lys Asp Asp Tyr Pro Ser Ser Pro Pro Lys Cys Lys Phe Glu Pro Pro
65 70 75 80
Leu Phe His Pro Asn Val Tyr Pro Ser Gly Thr Val Cys Leu Ser Ile
85 90 95
Leu Glu Glu Asp Lys Asp Trp Arg Pro Ala Ile Thr Ile Lys Gln Ile
100 105 110
Leu Leu Gly Ile Gln Glu Leu Leu Asn Glu Pro Asn Ile Gln Asp Pro
115 120 125
Ala Gln Ala Glu Ala Tyr Thr Ile Tyr Cys Gln Asn Arg Val Glu Tyr
130 135 140
Glu Lys Arg Val Arg Ala Gln Ala Lys Lys Phe Ala Pro Ser
145 150 155
<210> 156
<211> 2843
<212> DNA
<213> Homo sapiens
<400> 156
aactcgcggg agcgtcaccg tcctgcgacg cttcagagga tccttaggcc tcagtggtct 60
ttgacccccg gccccaggac ctgaccccaa ggaaacctcc gggacctgtg gctggagagg 120
gactttgaac atgtcgggga tcgccctcag cagactcgcc caggagagga aagcatggag 180
gaaagaccac ccatttggtt tcgtggctgt cccaacaaaa aatcccgatg gcacgatgaa 240
cctcatgaac tgggagtgcg ccattccagg aaagaaaggg actccgtggg aaggaggctt 300
gtttaaacta cggatgcttt tcaaagatga ttatccatct tcgccaccaa aatgtaaatt 360
cgaaccacca ttatttcacc cgaatgtgta cccttcgggg acagtgtgcc tgtccatctt 420
agaggaggac aaggactgga ggccagccat cacaatcaaa cagatcctat taggaataca 480
ggaacttcta aatgaaccaa atatccaaga cccagctcaa gcagaggcct acacgattta 540
ctgccaaaac agagtggagt acgagaaaag ggtccgagca caagccaaga agtttgcgcc 600
ctcataagca gcgaccttgt ggcatcgtca aaaggaaggg attggtttgg caagaacttg 660
tttacaacat ttttgcaaat ctaaagttgc tccatacaat gactagtcac ctgggggggt 720
tgggcgggcg ccatcttcca ttgccgccgc gggtgtgcgg tctcgattcg ctgaattgcc 780
cgtttccata cagggtctct tccttcggtc ttttgtattt ttgattgtta tgtaaaactc 840
gcttttattt taatattgat gtcagtattt caactgctgt aaaattataa acttttatac 900
ttgggtaagt cccccagggg cgagttcctc gctctgggat gcaggcatgc ttctcaccgt 960
gcagagctgc acttggcctc agctggctgt atggaaatgc accctccctc ctgccgctcc 1020
tctctagaac cttctagaac ctgggctgtg ctgcttttga gcctcagacc ccaggtcagc 1080
atctcggttc tgcgccactt cctttgtgtt tatatggcgt tttgtctgtg ttgctgttta 1140
gagtaaataa actgtttata taaaggtttt ggttgcatta ttatcattga aagtgagagg 1200
aggcggcctc ccagtgcccg gccctcccca cccacctgca gccccaccgc gggccaggac 1260
caggctctcc atctgcttcg gatgcacgca ggctgtgagg ctctgtcttg ccctggatct 1320
ttgtaaacag ggctgtgtac aaagtgctgc tgaggtttct gtgctccccg catctgcggg 1380
ctgtagagcg ctgggcagct aagatctgca taggtcggga ttggcatcga gaccctggca 1440
actgcaccgg tgccagctgt cttgggggcc acaaggccag gtccagacca gggctggggg 1500
ctgcctgagg actcctatcc gggcagcctg ctggcggggg ttcccctctt cagtggccag 1560
gtcacaggga tggagctgcg ctgtgcatag ggtgccacct caggtgtctg tcccttgtgt 1620
cctcaggagg cagccttgct accacccgtg gcaaacgcca ggtgcttttt ctgggagagc 1680
ccacagccgt ggccctccag ggcttccccg acccttagcg ccaggtagag ggccctgggc 1740
agcctgtgtc tggaattctt cgtcctgagg ccacctgagt gtggtctgtc ctggggaggc 1800
tgtgcgcctc agcagccgtc ctgacgctga gccctctgca aaggttgggc cggccaggcc 1860
tcttggggct gcctgagcca ctgcaggaag tggcctggct gggaagttgg gtgccggtca 1920
cctcccagca ggaaggcaca gtggacagag atgggaagcc ctgggggaca cagcccggtg 1980
ctcccagccc tccaacctct ggctcccaac ccagtctccc catcctagcg agcttggccc 2040
tcctcagttt cgtttcaagc cttggggctg gagctggccc tgctgccctg gcaccccccg 2100
gtggctggag ctgggtcccc gtggcccaag tgcagggtcc caagagggca gggcggggct 2160
ccccaaagga gcaaagaatg cagggagggc ggtccagggc cctgggaagg ggagctcggc 2220
accctccagg tccgtgtggg actccagccg ctgttggctg ggaatcgaag ttagaggtga 2280
cttccaaagg ccccccgagc cggcagtgcc ccccaccacc cctccagcga ctctgcggtg 2340
ccagtgcctt gttggctttt ccggctacgc accctgcagt cactgagctc tcggtctgac 2400
gtctgatgtt tgtggtttgt ttataacacg gggccttacc tggggaattc agctggtttg 2460
aatatttgta gcccgctccc agaatgtctt attttgtaat gactgaacta catttagtaa 2520
tagttacaca tgtatatggt taatacatat ggaaattcaa tatattttgt agttaacgta 2580
ttctgaagta acggatgttt ctcgccaatc gtagtgactt cagctaacga aatgttcttt 2640
tgtagtacca cggtcctcgg cctaacgaag gacgtgaacc ttgtaagagg agagctctga 2700
aacgcggtca cctttgttta gtggaaggga aagtgtgttc ccggcatgag gtgcctcgga 2760
attagtaaag aattgtgggc aatggattaa ccactgtatc taagaatcca ccattaaagc 2820
atttgcacag acaaaaaaaa aaa 2843
Claims (111)
- 생물학적 시스템의 조절 인자 식별 방법에 있어서,
(1) 상기 생물학적 시스템을 위한 모델로부터 제1데이터 집합을 얻는 단계, 여기서 상기 모델은 상기 생물학적 시스템과 연관된 세포를 포함하고, 여기서 상기 제1데이터 집합은 상기 생물학적 시스템과 연관된 세포 내의 단백질체의 전역적 변화를 나타낸다;
(2) 상기 생물학적 시스템을 위한 모델로부터 제 2 데이터 집합을 획득하는 단계, 여기서 상기 제 2 데이터 집합은 상기 생물학적 시스템과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내며, 여기서, 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및 상기 생물학적 시스템에 연관된 세포 내의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과 중 적어도 어느 하나를 포함한다;
(3) 상기 단백질체의 전역적 변화 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 프로그래밍된 컴퓨터 시스템을 사용하여 상기 제 1 및 제 2 데이터 집합만을 기반으로 하나 이상의 인과 관계의 베이지안 네트워크에 기반한 제1인과 관계 네트워크 모델을 생성하는 단계, 여기서 상기 제1인과 관계 네트워크 모델의 생성은 상기 제1 및 제2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는다;
(4) 상기 제1인과 관계 네트워크 모델로부터 분별 인과 관계 네트워크를 생성하고 제어 세포 데이터에 기반한 제2인과 관계 네트워크 모델을 생성하는 단계; 및
(5) 상기 인과 관계 네트워크로부터 상기 생물학적 시스템에 고유한 분별 인과 관계를 식별하는 단계, 여기서 상기 고유한 인과 관계에 연관된 적어도 하나의 효소는 상기 생물학적 시스템의 조절 인자로서 식별되는 방법. - 질병 과정의 조절 인자 식별 방법에 있어서,
(1) 상기 질병 과정을 위한 모델로부터 제1데이터 집합을 얻는 단계, 여기서 상기 모델은 상기 질병 관련 세포를 포함하고, 여기서 상기 제1데이터 집합은 상기 질병 관련 세포 내의 단백질체의 전역적 변화를 나타낸다;
(2) 상기 질병 과정을 위한 모델로부터 제 2 데이터 집합을 획득하는 단계, 여기서 상기 제 2 데이터 집합은 상기 질병 과정과 연관된 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내며, 여기서, 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및 상기 질병 관련 세포 내의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과 중 적어도 어느 하나를 포함한다;
(3) 상기 세포의 단백질체의 전역적 변화 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 프로그래밍된 컴퓨터 시스템을 사용하여 상기 제 1 및 제 2 데이터 집합만을 기반으로 하나 이상의 인과 관계의 베이지안 네트워크에 기반한 제1인과 관계 네트워크 모델을 생성하는 단계, 여기서 상기 제1인과 관계 네트워크 모델의 생성은 상기 제1 및 제2 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는다; 및
(4) 상기 제1인과 관계 네트워크 모델로부터 분별 인과 관계 네트워크를 생성하고 제어 세포 데이터에 기반한 제2인과 관계 네트워크 모델을 생성하는 단계; 및
(5) 상기 인과 관계 네트워크로부터 상기 질병 과정에 고유한 분별 인과 관계를 식별하는 단계, 여기서, 상기 고유한 인과 관계에 연관된 적어도 하나의 효소는 상기 질병 과정의 조절 인자로서 식별되는 방법. - 삭제
- 제1항 및 제2항 중 어느 한 항에 있어서,
상기 제 1 데이터 집합은 상기 생물학적 시스템 또는 상기 질병 과정과 연관된 세포를 특징 지우는 지질체 데이터를 더 포함하는 것을 특징으로 하는 방법. - 제4항에 있어서,
상기 제1인과 관계 네트워크 모델은 상기 단백질체의 전역적 변화, 지질체 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 이때 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및 적어도 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 방법. - 제1항 및 제2항 중 어느 한 항에 있어서,
상기 제1 데이터 집합은 상기 생물학적 시스템 또는 상기 질병 과정과 연관된 세포를 특징지우는 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터를 더 포함하며,
선택적으로, 여기서 상기 제1 데이터 집합은 상기 생물학적 시스템 또는 상기 질병 과정과 연관된 세포를 특징지우는 둘 또는 그 이상의 지질체, 대사체, 전사체, 게놈 및 SNP 데이터를 포함하는 방법. - 제6항에 있어서,
상기 제1인과 관계 네트워크 모델은 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈, 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며, 여기서 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및 적어도 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 영향 중 적어도 어느 하나를 포함하는 것을 특징으로 하는 방법. - 제1항 및 제2항 중 어느 한 항에 있어서,
상기 효소의 전역적 활성은 전역 키나아제 활성을 포함하며;
선택적으로 여기서 상기 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 효과는 세포의 인산 단백질체를 포함하며;
선택적으로 여기서 상기 고유 인과 관계와 연관된 상기 적어도 하나의 키나아제는 상기 생물학적 시스템 또는 상기 질병 과정의 조절 인자로 식별되는 것을 특징으로 하는 방법. - 제1항 및 제2항 중 어느 한 항에 있어서,
상기 제 2 데이터 집합은 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포외 기질 퇴화, 분출, 및 ATP, ROS, OXPHOS 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 포함하는 것을 특징으로 하는 방법. - 제6항에 있어서,
상기 제1인과 관계 네트워크 모델은 상기 단백질체의 전역적 변화, 상기 하나 또는 그 이상의 지질체, 대사체, 전사체, 게놈, 및 SNP 데이터, 및 상기 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응 중에서 생성되며,
상기 세포의 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응은 효소의 전역적 활성 및 최소한 하나의 효소 대사 물질 또는 기질에 대한 상기 효소의 전역적 활성의 영향 중 적어도 어느 하나를 포함하며, 하나 또는 그 이상의 생명 에너지론, 세포 증식, 세포 자살, 기관적 기능, 세포 이주, 관 형성, 주화성, 세포 외 기질 퇴화, 분출, ATP, ROS, OXPHOS, 및 시호스(Seahorse) 분석으로부터 선택되는 기능적 모델에 의해 실현되는 유전자형-표현형 연관을 더 포함하는 것을 특징으로 하는 방법. - 제2항에 있어서,
상기 질병 과정은 암, 당뇨, 비만, 심장병, 노화 관련 황반 변성, 당뇨성 망막증, 또는 감염성 질병; 또는
여기서 상기 질병 과정은 신생 혈관 생성을 포함; 또는
여기서 상기 질병 과정은 간세포 암종, 폐암, 유방암, 전립선암, 흑색종, 암종, 육종, 림프종, 백혈병, 비늘형의 세포암종, 결장암, 췌장암, 갑상선암, 자궁 내막암, 방광암, 신장암, 고형 종양, 백혈병, 비 호지킨(non-Hodgkin) 림프종, 또는 약제 저항형 암; 또는
여기서 상기 질병 과정의 특징적 측면은 저산소 상태 조건, 고혈당 조건, 젖산 풍부 배양 조건, 또는 이들의 조합을 포함하는 것을 특징으로 하는 방법. - 제1항 및 제2항 중 어느 한 항에 있어서,
상기 생물학적 시스템 또는 상기 질병 과정의 모델은 상기 생물학적 시스템 또는 상기 질병 관련 세포의 생체 외 배양을 포함하며, 선택적으로 제어 세포 또는 정상 세포의 합치되는 생체 외 배양을 더 포함하는 것을 특징으로 하는 방법. - 제12항에 있어서,
상기 생물학적 시스템 또는 상기 질병 관련 세포의 생체 외 배양은 환경적 교란을 겪으며, 합치되는 상기 제어 세포의 상기 생체 외 배양은 환경적 교란을 겪지 않은 동일한 세포를 포함하는 것을 특징으로 하는 방법. - 제13항에 있어서,
상기 환경적 교란은 생체 작용 제제와의 한 번 또는 그 이상의 접촉, 배양 조건에서의 변화, 유전학적 수정 / 변이의 도입, 및 유전학적 수정 / 변이를 야기하는 매개 수단의 도입을 포함; 또는
여기서 상기 환경적 교란은 세포와 효소 활성 억제 인자와의 접촉을 포함, 선택적으로, 상기 환경적 교란은 상기 세포와 CoQ10과의 접촉을 더 포함; 또는
여기서 상기 상기 효소 활성 억제 인자는 키나아제 억제 인자; 또는
여기서 상기 환경적 교란은 상기 세포와 CoQ10과의 접촉을 포함하는 것을 특징으로 하는 방법. - 제1항 및 제2항 중 어느 한 항에 있어서,
상기 단계 (3)은,
베이지안 파편 목록 처리를 통해 상기 제1데이터 집합 및 제2데이터 집합에 기반한 네트워크 파편의 라이브러리를 생성;
시도 네트워크의 앙상블을 생성, 각 시도 네트워크는 상기 라이브러리 내의 상기 네트워크 파편의 다른 부분 집합으로부터 만들어진다; 및
국지적 변환을 통해 상기 각 시도 네트워크를 진화시켜 상기 시도 네트워크의 앙상블을 최적화;를 포함하는 것을 특징으로 하는 방법. - 제1항 및 제2항 중 어느 한 항에 있어서,
상기 생성 단계에서 수립된 상기 제1인과 관계 네트워크 모델은 상기 제1인과 관계 네트워크 모델 내의 하나 또는 그 이상의 인과 관계의 예측에 대한 신뢰 수준을 제공하기 위해, 상기 식별 단계 이전에, 입력 데이터에 기반한 컴퓨터 모의 시뮬레이션에 의해 시뮬레이션 인과 관계 네트워크로 더 개량되는 것을 특징으로 하는 방법. - 제12항에 있어서,
상기 고유한 인과 관계는 상기 생물학적 시스템 또는 상기 질병 관련 세포에 고유하게 존재하고 상기 합치된 제어 세포에 존재하지 않는 상기 분별 인과 관계 네트워크의 일부로서 식별되고; 또는
상기 고유한 인과 관계는 환경적 교란을 겪은 세포에 고유하게 존재하고 상기 합치된 제어 세포에 존재하지 않는 상기 분별 인과 관계 네트워크의 일부로서 식별되는 것을 특징으로 하는 방법. - 삭제
- 제1항 및 제2항 중 어느 한 항에 있어서,
상기 제어 세포 데이터는 상기 제어 세포의 단백질체의 전역적 변화를 나타내는 제1제어 데이터 집합과 상기 제어 세포의 하나 또는 그 이상의 기능적 활성 또는 세포 반응을 나타내는 제2제어 데이터 집합을 포함하며, 여기서 상기 하나 또는 그 이상의 제어 세포의 기능적 활성 또는 세포 반응은 전역적 효소 활성 및 상기 제어 세포 내의 효소 대사 물질 또는 기질에 미치는 영향 중 적어도 어느 하나를 포함한다; 및
여기서 상기 단계 (3) 이후에 프로그램된 컴퓨터 장치를 이용하여 상기 제1제어 데이터 집합 및 상기 제2제어 데이터 집합에만 기반하여 상기 단백질체의 전역적 변화 및 상기 하나 또는 그 이상의 기능적 활성 또는 세포 반응과 관련된 상기 제2인과 관계 네트워크 모델을 생성하는 단계를 더 포함하며, 여기서 상기 제2인과 관계 네트워크 모델의 생성은 상기 제1 및 제2 제어 데이터 집합을 제외한 다른 어떠한 알려진 생물학적 관계에도 기반하지 않는 것을 특징으로 하는 방법. - 제1항 및 제2항 중 어느 한 항에 있어서,
상기 고유한 인과 관계는 유전자의 발현 및 지질의 수준; 유전자의 발현 및 전사체의 수준; 유전자의 발현 및 대사 물질의 수준; 제 1 유전자의 발현 및 제 2 유전자의 발현; 유전자의 발현 및 SNP의 존재; 유전자의 발현 및 기능적 활성; 지질의 수준 및 전사체의 수준; 지질의 수준 및 대사 물질의 수준; 제 1 지질의 수준 및 제 2 지질의 수준; 지질의 수준 및 SNP의 존재; 지질의 수준 및 기능적 활성; 제 1 전사체의 수준 및 제 2 전사체의 수준; 전사체의 수준 및 대사 물질의 수준; 전사체의 수준 및 SNP의 존재; 제 1 전사체의 수준 및 기능적 활성의 수준; 제 1 대사 물질의 수준 및 제 2 대사 물질의 수준; 대사 물질의 수준 및 SNP의 존재; 대사 물질의 수준 및 기능적 활성; 제 1 SNP의 존재 및 제 2 SNP의 존재; 및 SNP의 존재 및 기능적 활성으로 이루어지는 군으로부터 선택되는 최소한 한 쌍 사이의 관계로 식별; 또는
여기서 상기 고유한 인과 관계는 지질의 수준, 유전자의 발현 및 하나 또는 그 이상의 기능성 활성으로 이루어지는 군으로부터 선택되는 2개 사이의 관계로 식별되며, 여기서 상기 기능적 활성은 전역 키나아제 활성인 것을 특징으로 하는 방법. - 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 제1항 및 제2항 중 어느 한 항에 있어서,
상기 제1인과 관계 네트워크 모델은 시도 네트워크의 앙상블을 진화시켜 생성된 합치 인과 관계 네트워크에 기반한 방법 - 제1항 및 제2항 중 어느 한 항에 있어서,
상기 제1인과 관계 네트워크 모델은 인과관계의 베이지안 앙상블에 기반한 방법. - 제1항 및 제2항 중 어느 한 항에 있어서,
상기 제1인과 관계 네트워크 모델은 상기 관계에 대한 정량적 확률적 방향 정보를 포함하는 인과 관계의 베이지안 네트워크를 포함하는 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (13)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261619326P | 2012-04-02 | 2012-04-02 | |
US61/619,326 | 2012-04-02 | ||
US201261620305P | 2012-04-04 | 2012-04-04 | |
US61/620,305 | 2012-04-04 | ||
US201261665631P | 2012-06-28 | 2012-06-28 | |
US61/665,631 | 2012-06-28 | ||
US201261668617P | 2012-07-06 | 2012-07-06 | |
US61/668,617 | 2012-07-06 | ||
US201261678596P | 2012-08-01 | 2012-08-01 | |
US201261678590P | 2012-08-01 | 2012-08-01 | |
US61/678,596 | 2012-08-01 | ||
US61/678,590 | 2012-08-01 | ||
PCT/US2012/054321 WO2013151577A1 (en) | 2012-04-02 | 2012-09-07 | Interrogatory cell-based assays and uses thereof |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207023974A Division KR20200105524A (ko) | 2012-04-02 | 2012-09-07 | 조사적 세포 기반 분석 및 이의 사용 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140142357A KR20140142357A (ko) | 2014-12-11 |
KR102149070B1 true KR102149070B1 (ko) | 2020-10-15 |
Family
ID=49235335
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020147030700A KR102149070B1 (ko) | 2012-04-02 | 2012-09-07 | 조사적 세포 기반 분석 및 이의 사용 |
KR1020207023974A KR20200105524A (ko) | 2012-04-02 | 2012-09-07 | 조사적 세포 기반 분석 및 이의 사용 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020207023974A KR20200105524A (ko) | 2012-04-02 | 2012-09-07 | 조사적 세포 기반 분석 및 이의 사용 |
Country Status (14)
Country | Link |
---|---|
US (2) | US10061887B2 (ko) |
EP (1) | EP2834366B1 (ko) |
JP (3) | JP6189926B2 (ko) |
KR (2) | KR102149070B1 (ko) |
CN (3) | CN110456035A (ko) |
AU (2) | AU2012376214B2 (ko) |
BR (1) | BR112014024537A2 (ko) |
CA (1) | CA2869296A1 (ko) |
EA (1) | EA038600B1 (ko) |
HK (1) | HK1209161A1 (ko) |
IL (1) | IL234920B (ko) |
MX (1) | MX357392B (ko) |
SG (2) | SG11201406201YA (ko) |
WO (1) | WO2013151577A1 (ko) |
Families Citing this family (39)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG193006A1 (en) * | 2011-03-02 | 2013-10-30 | Berg Llc | Interrogatory cell-based assays and uses thereof |
EP2668945A1 (de) * | 2012-06-01 | 2013-12-04 | Bayer Technology Services GmbH | Genotyp- bzw. Phänotyp-basierte Arzeimittelformulierungen |
US9449284B2 (en) * | 2012-10-04 | 2016-09-20 | Nec Corporation | Methods and systems for dependency network analysis using a multitask learning graphical lasso objective function |
CN103558354B (zh) * | 2013-11-15 | 2015-07-15 | 南京大学 | 一种基于生物组学整合技术的水体毒性分析方法 |
CN106471508A (zh) * | 2014-06-20 | 2017-03-01 | 康涅狄格儿童医疗中心 | 自动化细胞培养系统及对应的方法 |
NZ730197A (en) | 2014-09-11 | 2022-07-01 | Berg Llc | Bayesian causal relationship network models for healthcare diagnosis and treatment based on patient data |
CN105624275B (zh) * | 2014-11-06 | 2020-03-27 | 上海市东方医院 | Eif4g1在鳞癌诊断和治疗中的应用 |
JP6270221B2 (ja) * | 2015-02-13 | 2018-01-31 | 国立研究開発法人産業技術総合研究所 | バイオマーカー探索方法、バイオマーカー探索装置、及びプログラム |
KR101786859B1 (ko) * | 2015-04-30 | 2017-10-17 | 서울대학교산학협력단 | 혈장 내 아밀로이드베타의 농도를 통해 알츠하이머병을 임상학적 및 병리학적으로 모니터링하는 방법 |
US10395759B2 (en) | 2015-05-18 | 2019-08-27 | Regeneron Pharmaceuticals, Inc. | Methods and systems for copy number variant detection |
EP3892724A1 (en) * | 2015-05-28 | 2021-10-13 | Stichting Het Nederlands Kanker Instituut- Antoni van Leeuwenhoek Ziekenhuis | Assays to identify genetic elements affecting phenotype |
CN106250717B (zh) * | 2015-06-04 | 2019-03-12 | 徐勇 | 急性髓性白血病的miRNA与转录因子的系统及其构建方法和应用 |
US20160363567A1 (en) * | 2015-06-15 | 2016-12-15 | Lunatech, Llc | Vapor Device For Stressing And Analyzing Compounds |
EP3364188B1 (en) | 2015-10-14 | 2021-12-01 | Public University Corporation Yokohama City University | Blood biomarker for use in evaluation of effect of drug therapy on kidney cancer |
NZ745249A (en) | 2016-02-12 | 2021-07-30 | Regeneron Pharma | Methods and systems for detection of abnormal karyotypes |
US11016017B2 (en) | 2016-06-10 | 2021-05-25 | The Regents Of The University Of California | Image-based cell sorting systems and methods |
EP3538095A4 (en) | 2016-11-14 | 2020-06-17 | Berg LLC | METHOD FOR TREATING MORBUS PARKINSON |
CN106834105A (zh) * | 2017-02-21 | 2017-06-13 | 齐齐哈尔医学院 | 一种用于表观遗传分析的设备和方法 |
US11636917B2 (en) * | 2017-06-28 | 2023-04-25 | The Regents Of The University Of California | Simulating the metabolic pathway dynamics of an organism |
CN107475346B (zh) * | 2017-08-11 | 2021-08-06 | 北京汉典制药有限公司 | 一种体外筛选糖尿病肾病药物的方法 |
JP6902977B2 (ja) * | 2017-09-22 | 2021-07-14 | 新日本無線株式会社 | 起動回路の故障検出方法 |
JP2021500539A (ja) * | 2017-10-18 | 2021-01-07 | ヴェン バイオサイエンシズ コーポレーション | 診断及び治療モニタリングのための生体パラメータの同定及び使用 |
JP2021073432A (ja) * | 2018-03-02 | 2021-05-13 | 国立研究開発法人医薬基盤・健康・栄養研究所 | 治療標的である活性化キナーゼのスクリーニング方法 |
JP7176381B2 (ja) * | 2018-12-03 | 2022-11-22 | 富士通株式会社 | 環状分子の構造探索方法、及び構造探索装置、並びにプログラム |
CN109536473A (zh) * | 2018-12-19 | 2019-03-29 | 华中科技大学鄂州工业技术研究院 | 整合多组学数据推测细胞转分化中关键蛋白质激酶的方法 |
CA3128973A1 (en) | 2019-03-04 | 2020-09-10 | Bhaskar Bhattacharyya | Data compression and communication using machine learning |
US20210080466A1 (en) * | 2019-06-26 | 2021-03-18 | Berg Llc | Markers for the diagnosis of prostate cancer |
AU2021236148A1 (en) * | 2020-03-10 | 2022-10-13 | AI:ON Innovations, Inc. | System and methods for mammalian transfer learning |
US11227690B1 (en) * | 2020-09-14 | 2022-01-18 | Opendna Ltd. | Machine learning prediction of therapy response |
CN113035298B (zh) * | 2021-04-02 | 2023-06-20 | 南京信息工程大学 | 递归生成大阶数行限制覆盖阵列的药物临床试验设计方法 |
CN113138249B (zh) * | 2021-04-12 | 2021-11-23 | 北京蛋白质组研究中心 | 基于微孔阵列芯片的微量样本代谢组、蛋白质组和磷酸化蛋白质组多组学分析方法 |
EP4338163A4 (en) * | 2021-05-13 | 2024-11-06 | Scipher Medicine Corp | EVALUATION OF RESPONSIVENESS TO TREATMENT |
CN113943720A (zh) * | 2021-11-03 | 2022-01-18 | 江苏省农业科学院 | 一种绿盲蝽GRK基因、其dsRNA及其合成方法和应用 |
WO2023230268A1 (en) * | 2022-05-27 | 2023-11-30 | Memorial Sloan-Kettering Cancer Center | Systems and methods for metabolite imputation |
CN117417914A (zh) * | 2022-07-18 | 2024-01-19 | 华东师范大学 | 预防和保护脑缺血疾病的标志物及阿司匹林衍生物在预防和保护脑缺血疾病中的应用 |
WO2024081570A1 (en) * | 2022-10-10 | 2024-04-18 | Eli Lilly And Company | Methods and systems for using causal networks to develop models for evaluating biological processes |
WO2024081740A1 (en) * | 2022-10-13 | 2024-04-18 | Somalogic Operating Co., Inc. | Systems and methods for validation of proteomic models |
WO2024211805A1 (en) * | 2023-04-07 | 2024-10-10 | The Medical College Of Wisconsin, Inc. | Compositions and methods for treatment or preventative treatment of cancer including triple negative breast cancer and/or lung cancer |
CN118607082A (zh) * | 2024-08-09 | 2024-09-06 | 成都理工大学 | 一种基于深度学习的压裂过程中套管变形的预测方法 |
Family Cites Families (75)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8308235D0 (en) | 1983-03-25 | 1983-05-05 | Celltech Ltd | Polypeptides |
US4816567A (en) | 1983-04-08 | 1989-03-28 | Genentech, Inc. | Recombinant immunoglobin preparations |
JPS6147500A (ja) | 1984-08-15 | 1986-03-07 | Res Dev Corp Of Japan | キメラモノクロ−ナル抗体及びその製造法 |
EP0173494A3 (en) | 1984-08-27 | 1987-11-25 | The Board Of Trustees Of The Leland Stanford Junior University | Chimeric receptors by dna splicing and expression |
GB8422238D0 (en) | 1984-09-03 | 1984-10-10 | Neuberger M S | Chimeric proteins |
JPS61134325A (ja) | 1984-12-04 | 1986-06-21 | Teijin Ltd | ハイブリツド抗体遺伝子の発現方法 |
US4683202A (en) | 1985-03-28 | 1987-07-28 | Cetus Corporation | Process for amplifying nucleic acid sequences |
US4676980A (en) | 1985-09-23 | 1987-06-30 | The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services | Target specific cross-linked heteroantibodies |
WO1987002671A1 (en) | 1985-11-01 | 1987-05-07 | International Genetic Engineering, Inc. | Modular assembly of antibody genes, antibodies prepared thereby and use |
US4868103A (en) | 1986-02-19 | 1989-09-19 | Enzo Biochem, Inc. | Analyte detection by means of energy transfer |
US5225539A (en) | 1986-03-27 | 1993-07-06 | Medical Research Council | Recombinant altered antibodies and methods of making altered antibodies |
US4902505A (en) | 1986-07-30 | 1990-02-20 | Alkermes | Chimeric peptides for neuropeptide delivery through the blood-brain barrier |
US4946778A (en) | 1987-09-21 | 1990-08-07 | Genex Corporation | Single polypeptide chain binding molecules |
US6121424A (en) | 1991-11-25 | 2000-09-19 | Enzon, Inc. | Multivalent antigen-binding proteins |
US4904582A (en) | 1987-06-11 | 1990-02-27 | Synthetic Genetics | Novel amphiphilic nucleic acid conjugates |
US4843155A (en) | 1987-11-19 | 1989-06-27 | Piotr Chomczynski | Product and process for isolating RNA |
US5223409A (en) | 1988-09-02 | 1993-06-29 | Protein Engineering Corp. | Directed evolution of novel binding proteins |
EP0436597B1 (en) | 1988-09-02 | 1997-04-02 | Protein Engineering Corporation | Generation and selection of recombinant varied binding proteins |
US5530101A (en) | 1988-12-28 | 1996-06-25 | Protein Design Labs, Inc. | Humanized immunoglobulins |
US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
US6040138A (en) | 1995-09-15 | 2000-03-21 | Affymetrix, Inc. | Expression monitoring by hybridization to high density oligonucleotide arrays |
US5744101A (en) | 1989-06-07 | 1998-04-28 | Affymax Technologies N.V. | Photolabile nucleoside protecting groups |
US5143854A (en) | 1989-06-07 | 1992-09-01 | Affymax Technologies N.V. | Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof |
US5427908A (en) | 1990-05-01 | 1995-06-27 | Affymax Technologies N.V. | Recombinant library screening methods |
AU665190B2 (en) | 1990-07-10 | 1995-12-21 | Cambridge Antibody Technology Limited | Methods for producing members of specific binding pairs |
GB9015198D0 (en) | 1990-07-10 | 1990-08-29 | Brien Caroline J O | Binding substance |
US5545806A (en) | 1990-08-29 | 1996-08-13 | Genpharm International, Inc. | Ransgenic non-human animals for producing heterologous antibodies |
US5661016A (en) | 1990-08-29 | 1997-08-26 | Genpharm International Inc. | Transgenic non-human animals capable of producing heterologous antibodies of various isotypes |
CA2089661C (en) | 1990-08-29 | 2007-04-03 | Nils Lonberg | Transgenic non-human animals capable of producing heterologous antibodies |
US5633425A (en) | 1990-08-29 | 1997-05-27 | Genpharm International, Inc. | Transgenic non-human animals capable of producing heterologous antibodies |
US5625126A (en) | 1990-08-29 | 1997-04-29 | Genpharm International, Inc. | Transgenic non-human animals for producing heterologous antibodies |
DE69129154T2 (de) | 1990-12-03 | 1998-08-20 | Genentech, Inc., South San Francisco, Calif. | Verfahren zur anreicherung von proteinvarianten mit geänderten bindungseigenschaften |
ATE439435T1 (de) | 1991-03-01 | 2009-08-15 | Dyax Corp | Chimäres protein mit mikroprotein mit zwei oder mehr disulfidbindungen und ausgestaltungen davon |
DE69233367T2 (de) | 1991-04-10 | 2005-05-25 | The Scripps Research Institute, La Jolla | Bibliotheken heterodimerer rezeptoren mittels phagemiden |
DE4122599C2 (de) | 1991-07-08 | 1993-11-11 | Deutsches Krebsforsch | Phagemid zum Screenen von Antikörpern |
US5621083A (en) | 1991-11-04 | 1997-04-15 | Xoma Corporation | Immunotoxins comprising ribosome-inactivating proteins |
US5677195A (en) | 1991-11-22 | 1997-10-14 | Affymax Technologies N.V. | Combinatorial strategies for polymer synthesis |
CA2087413A1 (en) | 1992-01-17 | 1993-07-18 | Joseph R. Lakowicz | Fluorescent energy transfer immunoassay |
US5605798A (en) | 1993-01-07 | 1997-02-25 | Sequenom, Inc. | DNA diagnostic based on mass spectrometry |
WO1994016101A2 (en) | 1993-01-07 | 1994-07-21 | Koester Hubert | Dna sequencing by mass spectrometry |
EP0689610B1 (en) | 1993-03-19 | 2002-07-03 | Sequenom, Inc. | Dna sequencing by mass spectrometry via exonuclease degradation |
US5538848A (en) | 1994-11-16 | 1996-07-23 | Applied Biosystems Division, Perkin-Elmer Corp. | Method for detecting nucleic acid amplification using self-quenching fluorescence probe |
US5556752A (en) | 1994-10-24 | 1996-09-17 | Affymetrix, Inc. | Surface-bound, unimolecular, double-stranded DNA |
US5545531A (en) | 1995-06-07 | 1996-08-13 | Affymax Technologies N.V. | Methods for making a device for concurrently processing multiple biological chip assays |
US5854033A (en) | 1995-11-21 | 1998-12-29 | Yale University | Rolling circle replication reporter systems |
EP0880598A4 (en) | 1996-01-23 | 2005-02-23 | Affymetrix Inc | RAPID EVALUATION OF NUCLEIC ACID ABUNDANCE DIFFERENCE, WITH A HIGH-DENSITY OLIGONUCLEOTIDE SYSTEM |
US5898031A (en) | 1996-06-06 | 1999-04-27 | Isis Pharmaceuticals, Inc. | Oligoribonucleotides for cleaving RNA |
JP2001521753A (ja) | 1997-10-31 | 2001-11-13 | アフィメトリックス インコーポレイテッド | 成人臓器及び胎児臓器中の発現プロフィール |
US6020135A (en) | 1998-03-27 | 2000-02-01 | Affymetrix, Inc. | P53-regulated genes |
US6763307B2 (en) * | 2000-03-06 | 2004-07-13 | Bioseek, Inc. | Patient classification |
WO2002072871A2 (en) | 2001-03-13 | 2002-09-19 | Ashni Naturaceuticals, Inc. | Method for association of genomic and proteomic pathways associated with physiological or pathophysiological processes |
US8000949B2 (en) | 2001-06-18 | 2011-08-16 | Genego, Inc. | Methods for identification of novel protein drug targets and biomarkers utilizing functional networks |
US7393656B2 (en) | 2001-07-10 | 2008-07-01 | The Board Of Trustees Of The Leland Stanford Junior University | Methods and compositions for risk stratification |
AU2002304965A1 (en) | 2002-05-24 | 2003-12-12 | Zensun (Shanghai) Sci-Tech.Ltd | Neuregulin based methods and compositions for treating viral myocarditis and dilated cardiomyopathy |
DE60321689D1 (de) | 2002-08-29 | 2008-07-31 | Gene Network Sciences Inc | Systeme und verfahren zum schliessen auf biologische netzwerke |
US20070104688A1 (en) | 2003-02-13 | 2007-05-10 | City Of Hope | Small interfering RNA mediated transcriptional gene silencing in mammalian cells |
JP4288345B2 (ja) | 2003-06-19 | 2009-07-01 | 独立行政法人産業技術総合研究所 | 新規てんかんモデル動物 |
EP1512970A1 (en) | 2003-09-05 | 2005-03-09 | Nederlandse Organisatie voor toegepast-natuurwetenschappelijk Onderzoek TNO | Method for determining the impact of a multicomponent mixture on the biological profile of a disease |
US20070134734A1 (en) | 2003-10-14 | 2007-06-14 | Cellfree Sciences Co., Ltd. | Novel screening method of indicator substance |
WO2005107412A2 (en) | 2004-04-30 | 2005-11-17 | Rosetta Inpharmatics Llc | Systems and methods for reconstruction gene networks in segregating populations |
EP1607898A3 (en) * | 2004-05-18 | 2006-03-29 | Neal E. Solomon | A bioinformatics system for functional proteomics modelling |
US20100316629A1 (en) | 2004-09-01 | 2010-12-16 | Shaughnessy Jr John D | Use of gene expression profiling to predict survival in cancer patient |
CA2587765A1 (en) * | 2004-11-17 | 2006-05-26 | Immunivest Corporation | Magnetic enrichment of circulating cells, fragments and debris for enabling hts proteomics and genomics in disease detection |
EP1842147A2 (en) | 2005-01-24 | 2007-10-10 | The Board of Trustees of The Leland Stanford Junior University | Method for modeling cell signaling systems by means of bayesian networks |
JP4051400B2 (ja) * | 2005-05-31 | 2008-02-20 | 株式会社Jclバイオアッセイ | プロテオーム網羅的解析における特異的蛋白質のスクリーニング方法 |
US7906116B2 (en) * | 2005-09-01 | 2011-03-15 | Parkash Gill | Methods for using and identifying modulators of Delta-like 4 |
EP1928909A1 (en) | 2005-09-30 | 2008-06-11 | Universiteit Maastricht | Tumor angiogenesis associated genes and a method for their identification |
US8571803B2 (en) | 2006-11-15 | 2013-10-29 | Gene Network Sciences, Inc. | Systems and methods for modeling and analyzing networks |
JP2009050171A (ja) * | 2007-08-23 | 2009-03-12 | Toyobo Co Ltd | 表面プラズモン共鳴による基板上におけるリン酸化の検出方法 |
CA2708173C (en) | 2007-12-04 | 2016-02-02 | Alnylam Pharmaceuticals, Inc. | Targeting lipids |
PE20120015A1 (es) | 2008-08-15 | 2012-01-26 | Merrimack Pharmaceuticals Inc | Metodos y sistemas para predecir la respuesta de las celulas tumorales a un agente terapeutico |
EP2356258A4 (en) * | 2008-11-17 | 2012-12-26 | Veracyte Inc | METHOD AND COMPOSITIONS FOR MOLECULAR PROFILE FOR THE DIAGNOSIS OF ILLNESSES |
SG10201402288RA (en) | 2009-05-11 | 2014-07-30 | Berg Llc | Methods for the diagnosis of oncological disorders using epimetabolic shifters, multidimensional intracellular molecules, or environmental influencers |
JP5822309B2 (ja) | 2010-03-31 | 2015-11-24 | 国立大学法人 熊本大学 | 統合プロテオーム解析用データ群の生成方法ならびに同生成方法にて生成した統合プロテオーム解析用データ群を用いる統合プロテオーム解析方法、およびそれを用いた原因物質同定方法 |
SG193006A1 (en) | 2011-03-02 | 2013-10-30 | Berg Llc | Interrogatory cell-based assays and uses thereof |
-
2012
- 2012-09-07 AU AU2012376214A patent/AU2012376214B2/en active Active
- 2012-09-07 SG SG11201406201YA patent/SG11201406201YA/en unknown
- 2012-09-07 KR KR1020147030700A patent/KR102149070B1/ko active IP Right Grant
- 2012-09-07 CN CN201910734226.7A patent/CN110456035A/zh active Pending
- 2012-09-07 SG SG10201608234UA patent/SG10201608234UA/en unknown
- 2012-09-07 EP EP12873625.3A patent/EP2834366B1/en active Active
- 2012-09-07 US US13/607,587 patent/US10061887B2/en active Active
- 2012-09-07 MX MX2014011797A patent/MX357392B/es active IP Right Grant
- 2012-09-07 CN CN201280073683.2A patent/CN104520435A/zh active Pending
- 2012-09-07 KR KR1020207023974A patent/KR20200105524A/ko active IP Right Grant
- 2012-09-07 CN CN201711192165.3A patent/CN108048521B/zh active Active
- 2012-09-07 CA CA2869296A patent/CA2869296A1/en active Pending
- 2012-09-07 WO PCT/US2012/054321 patent/WO2013151577A1/en active Application Filing
- 2012-09-07 JP JP2015503185A patent/JP6189926B2/ja active Active
- 2012-09-07 BR BR112014024537A patent/BR112014024537A2/pt not_active IP Right Cessation
- 2012-09-07 EA EA201491833A patent/EA038600B1/ru unknown
-
2014
- 2014-10-01 IL IL234920A patent/IL234920B/en active IP Right Grant
-
2015
- 2015-10-07 HK HK15109778.2A patent/HK1209161A1/xx unknown
-
2017
- 2017-08-03 JP JP2017150309A patent/JP6767320B2/ja active Active
-
2018
- 2018-08-07 US US16/056,830 patent/US20190279736A1/en active Pending
-
2019
- 2019-01-31 AU AU2019200670A patent/AU2019200670B2/en active Active
-
2020
- 2020-09-17 JP JP2020156318A patent/JP2021003121A/ja active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2019200670B2 (en) | Interrogatory cell-based assays and uses thereof | |
AU2017202977B2 (en) | Interrogatory cell-based assays and uses thereof | |
AU2012381038B2 (en) | Interrogatory cell-based assays for identifying drug-induced toxicity markers | |
CN110382521A (zh) | 从氧化应激区分肿瘤抑制性foxo活性的方法 | |
US20030175736A1 (en) | Expression profile of prostate cancer | |
KR20140140069A (ko) | 전반적 발달장애의 진단 및 치료용 조성물 및 그 진단 및 치료 방법 | |
US20030152923A1 (en) | Classifying cancers | |
CN107743524A (zh) | 前列腺癌预后的方法 | |
CN113383085A (zh) | 用于分析核酸分子的方法和系统 | |
US20040219579A1 (en) | Methods of diagnosis of cancer, compositions and methods of screening for modulators of cancer | |
Ou et al. | Novel breast cancer biomarkers identified by integrative proteomic and gene expression mapping | |
CN101111768A (zh) | 肺癌预后 | |
WO2018132369A1 (en) | Biomarkers predictive of anti-immune checkpoint response | |
CN106460054A (zh) | 癌症中的融合基因 | |
NZ700647B2 (en) | Interrogatory cell-based assays and uses thereof | |
NZ718138B2 (en) | Interrogatory cell-based assays and uses thereof | |
CN117580963A (zh) | 用于分析核酸分子的方法和系统 | |
NZ614891B2 (en) | Interrogatory cell-based assays and uses thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right |