KR20230120138A - Myc 발현을 조절하기 위한 조성물 및 방법 - Google Patents

Myc 발현을 조절하기 위한 조성물 및 방법 Download PDF

Info

Publication number
KR20230120138A
KR20230120138A KR1020237024060A KR20237024060A KR20230120138A KR 20230120138 A KR20230120138 A KR 20230120138A KR 1020237024060 A KR1020237024060 A KR 1020237024060A KR 20237024060 A KR20237024060 A KR 20237024060A KR 20230120138 A KR20230120138 A KR 20230120138A
Authority
KR
South Korea
Prior art keywords
expression
repressor
sequence
seq
nucleic acid
Prior art date
Application number
KR1020237024060A
Other languages
English (en)
Inventor
아비가일 엘리자베스 위트
제레미아 데일 파렐리
아담 월터 샤이데거
주니어 윌리엄 토마스 세나페디스
조디 미셸 케네디
호우다 벨라그잘
데프네 야라르
유진 리
Original Assignee
플래그쉽 파이어니어링 이노베이션스 브이, 인크.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 플래그쉽 파이어니어링 이노베이션스 브이, 인크. filed Critical 플래그쉽 파이어니어링 이노베이션스 브이, 인크.
Publication of KR20230120138A publication Critical patent/KR20230120138A/ko

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • C07K14/4703Inhibitors; Suppressors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/635Externally inducible repressor mediated regulation of gene expression, e.g. tetR inducible by tetracyline
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • A61K45/06Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1003Transferases (2.) transferring one-carbon groups (2.1)
    • C12N9/1007Methyltransferases (general) (2.1.1.)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/80Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor
    • C07K2319/81Fusion polypeptide containing a DNA binding domain, e.g. Lacl or Tet-repressor containing a Zn-finger domain for DNA binding

Abstract

본 개시내용은 세포에서 MYC 유전자의 발현을 감소시키는 조성물 및 방법에 관한 것이다. 일부 구현예에서, 발현 리프레서는 MYC 프로모터, 앵커 서열, 또는 슈퍼-인핸서에 결합하는 표적화 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 전사를 억제하거나 DNA를 메틸화하는 이펙터 모이어티를 포함한다. 2개 발현 리프레서를 포함하는 시스템이 또한 개시되어 있다. 조성물은, 예를 들어 암, 예컨대 HCC 또는 NSCLC를 치료하는 데 사용될 수 있다.

Description

MYC 발현을 조절하기 위한 조성물 및 방법
관련 출원에 대한 상호 참조
본 출원은 2020년 12월 15일에 출원된 미국 가출원 63/125,833, 2021년 1월 13일에 출원된 미국 가출원 63/137,097, 2021년 6월 21일에 출원된 미국 가출원 63/212,991, 및 2021년 11월 18일에 출원된 미국 가출원 63/281,022에 대한 우선권을 주장하며, 이들 전체 내용은 본 명세서에 참조로 포함된다.
서열 목록
본 출원은 ASCII 서식으로 전자적으로 제출된 서열 목록을 포함하며, 이는 본 명세서에 전문이 참조로 포함된다. 2021년 12월 6일에 생성된 상기 ASCII 사본은 파일명이 O2057-7029WO_SL.txt이며, 크기가 624,274 바이트이다.
유전자 발현의 오조절(mis-regulation)은 (예를 들어, 포유동물, 예를 들어 인간에서) 많은 질환, 예를 들어 신생물, 신경 장애, 대사 장애 및 비만의 기저 원인이다. 전사 인자인 MYC의 오조절은 다양한 인간 종양 및 만성 간 질환에서 중요한 역할을 한다. MYC 단백질은 다양한 요인, 예를 들어 한정된 리간드 결합 부위, 정상 조직의 유지에 필수적인 생리학적 기능의 결여로 인해 "약물 치료 불가능(undruggable)"인 것으로 고려된다. MYC 유전자 발현을 조절하기 위해 적합화된 기법은 이들 질환을 치료하는 데 실행 가능한 대안적인 접근법을 제공한다. 질환 연관 유전자, 예컨대 MYC의 발현을 안정적으로 변경시키는, 예를 들어 감소시키는 신규 도구, 시스템, 및 방법에 대한 필요성이 있다.
본 개시내용은 특히 표적 유전자, 예를 들어 MYC의 발현을 조정하는, 예를 들어 감소시키는 데 사용될 수 있는 발현 리프레서 및 발현 리프레서 시스템을 제공한다.
일부 양태에서, 본 개시내용은 표적 유전자 프로모터, 예를 들어 MYC 프로모터에 결합하는 표적화 모이어티, 및 선택적으로 이펙터 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 구현예에서, 본 개시내용은 표적 유전자 유전자좌, 예를 들어 MYC에 결합하는 표적화 모이어티, 및 MQ1 또는 이의 단편 또는 변이체를 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 MYC의 슈퍼 인핸서 영역에 위치하는 조절 요소에 결합하는 표적화 모이어티, 및 선택적으로 이펙터 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 조절 요소에 결합하는 표적화 모이어티, 및 이펙터 모이어티(예를 들어, KRAB, 또는 MQ1, 또는 이의 단편 또는 변이체)를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 조절 요소에 결합하는 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 징크 핑거 도메인을 포함하고, 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 MYC의 슈퍼 인핸서 영역에 위치하는 조절 요소에 결합하는 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 징크 핑거 도메인 또는 TAL 이펙터 도메인, 및 이펙터 모이어티를 포함하고, 이펙터 모이어티는 전사 리프레서(예를 들어, KRAB 또는 이의 단편 또는 변이체) 또는 DNA 메틸트랜스퍼라제(예를 들어, MQ1 또는 이의 단편 또는 변이체)를 포함하며; 발현 리프레서는 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 표적 유전자 유전자좌, 예를 들어 MYC에 결합하는 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 징크 핑거 도메인을 포함하고, 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 서열번호 1, 3, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 109, 110, 또는 75, 76, 78, 79, 80, 81, 84, 85, 86의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 서열번호 2 또는 77, 82, 83의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다. 일부 구현예에서, 발현 발현자(expressor)는 이펙터 모이어티를 포함한다.
일부 양태에서, 본 개시내용은 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 서열번호 4의 1400 nt 상류 또는 하류 내에 있는 게놈 유전자좌에 결합한다.
일부 양태에서, 본 개시내용은 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 서열번호 4, 77, 82, 또는 83의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합한다.
일부 양태에서, 본 개시내용은 표적화 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 표적화 모이어티는 서열번호 83, 96, 또는 108의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합한다.
일부 양태에서, 본 개시내용은 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)) 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서(여기서 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합함)를 포함하는 시스템을 제공한다.
일부 양태에서, 본 개시내용은 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합함)를 포함하는 시스템을 제공한다.
일부 구현예에서, 제1 표적화 모이어티는 제1 DNA 서열에 특이적으로 결합하고 제2 표적화 모이어티는 제1 DNA 서열과 상이한 제2 DNA 서열에 특이적으로 결합한다. 일부 구현예에서, 제1 이펙터 모이어티는 제2 이펙터 모이어티와 상이하다.
일부 양태에서, 본 개시내용은, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 CRISPR/Cas 분자를 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및 MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합하는 CRISPR/Cas 분자를 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티, 및 KRAB, MQ1, 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공하며, 여기서 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킬 수 있다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는 CRISPR/Cas 분자를 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및 KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다.
일부 양태에서, 본 개시내용은, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 징크 핑거 분자를 포함하는 표적화 모이어티; 및 MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는 징크 핑거 분자를 포함하는 표적화 모이어티; 및 KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다.
일부 양태에서, 본 개시내용은 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합하는 징크 핑거 분자를 포함하는 표적화 모이어티, 및 KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다.
일부 양태에서, 본 개시내용은 제1 발현 리프레서, 제2 발현 리프레서, 이들 둘 다, 또는 이들의 성분(예를 들어, gRNA, mRNA)을 인코딩하는 핵산에 관한 것이다. 일부 구현예에서, 발현 리프레서 시스템을 인코딩하는 핵산은 다중-시스트론(multi-cistronic) 서열이다. 일부 구현예에서, 다중-시스트론 서열은 이중-시스트론(bi-cistronic) 서열이다.
일부 양태에서, 본 개시내용은 본 명세서에 기재된 핵산, 시스템, 또는 발현 리프레서를 포함하는 벡터에 관한 것이다. 또 다른 양태에서, 본 개시내용은 본 명세서에 기재된 벡터, 핵산, 시스템, 또는 발현 리프레서를 포함하는 지질 나노입자에 관한 것이다. 또 다른 양태에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서, 시스템, 핵산, 벡터, 또는 지질 나노입자를 포함하는 반응 혼합물에 관한 것이다. 또 다른 양태에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 반응 혼합물을 포함하는 약제학적 조성물에 관한 것이다.
일부 양태에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템을 제공하는 단계, 및 표적 유전자 및/또는 하나 이상의 작동가능하게 연결된 전사 제어 요소를 발현 리프레서 또는 발현 억제 시스템과 접촉시키는 단계를 포함하며, 이에 의해 표적 유전자의 발현을 감소시키는, 표적 유전자의 발현을 감소시키는 방법에 관한 것이다.
일부 양태에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서, 또는 시스템, 핵산, 또는 벡터를 대상체에게 투여하는 단계를 포함하며, 이에 의해 병태를 치료하는, 대상체에서 표적 유전자, 예를 들어 MYC의 과발현과 연관된 병태를 치료하는 방법에 관한 것이다.
일부 양태에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서, 시스템, 핵산, 또는 벡터를 대상체에게 투여하는 단계를 포함하며, 이에 의해 병태를 치료하는, 대상체에서 표적 유전자, 예를 들어 MYC의 오조절과 연관된 병태를 치료하는 방법에 관한 것이다.
일부 양태에서, 본 개시내용은 세포에서 표적 유전자, 예를 들어 MYC의 발현을 감소시키는 방법을 제공하며, 상기 방법은 세포를, 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS))에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합함)를 포함하는 시스템과 접촉시키는 단계를 포함하며, 이에 의해 세포에서 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다.
일부 양태에서, 본 개시내용은 세포에서 표적 유전자, 예를 들어 MYC의 발현을 감소시키는 방법을 제공하며, 세포를, 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS))에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합함)를 포함하는 시스템과 접촉시키는 단계를 포함하며, 이에 의해 세포에서 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다.
본 개시내용은 부분적으로, a) 표적 유전자, 프로모터, 예를 들어 MYC에 결합하는 표적화 모이어티, 및 표적 유전자, 예를 들어 MYC의 발현을 조절할 수 있는, 예를 들어 감소시킬 수 있는 이펙터 모이어티를 포함하는 발현 리프레서를 포함하는 조성물을 포함하는 용기, 및 b) 상기 조성물을 이용하여 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한 적어도 하나의 방법을 포함하는 한 세트의 설명서를 포함하는 키트를 추가로 제공한다.
본 개시내용은 부분적으로, a) 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 유전자좌에 결합하는 표적화 모이어티, 및 표적 유전자, 예를 들어 MYC의 발현을 조절할 수 있는, 예를 들어 감소시킬 수 있는 이펙터 모이어티를 포함하는 발현 리프레서를 포함하는 조성물을 포함하는 용기, 및 b) 상기 조성물을 이용하여 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한 적어도 하나의 방법을 포함하는 한 세트의 설명서를 포함하는 키트를 추가로 제공한다.
일부 양태에서, 키트는 a) 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합함)를 포함하는, 2개의 발현 리프레서를 포함하는 시스템을 포함하는 조성물을 포함하는 용기를 포함한다.
일부 양태에서, 키트는 a) 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합함)를 포함하는, 2개의 발현 리프레서를 포함하는 시스템을 포함하는 조성물을 포함하는 용기를 포함한다.
일부 구현예에서, 키트는 b) 상기 조성물을 이용하여 질환을 치료하거나 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한, 예를 들어 감소시키기 위한 적어도 하나의 방법을 포함하는 한 세트의 설명서을 추가로 포함한다. 일 구현예에서, 키트는 선택적으로 상기 조성물을 위한 전달 비히클(예를 들어, 지질 나노입자)을 포함할 수 있다. 시약은 부형제 및/또는 전달 비히클 중에 현탁된 상태로 제공될 수 있거나, 별개의 성분으로서 제공될 수 있는데, 이는 나중에 부형제 및/또는 전달 비히클과 배합될 수 있다. 일부 구현예에서, 키트는 조성물과 공동투여되는 추가의 치료제를 선택적으로 함유하여 원하는 표적 유전자 발현, 예를 들어 MYC 유전자 발현 조절에 영향을 미칠 수 있다. 설명 자료는 통상적으로 서면 자료 또는 인쇄 자료를 포함하지만, 이들은 그러한 것으로 제한되지 않는다. 그러한 설명서를 저장하고 이를 최종 사용자에게 전달할 수 있는 임의의 매체가 본 발명에 의해 상정된다. 그러한 매체는 전자 저장 매체(예를 들어, 자기 디스크, 테이프, 카트리지, 칩), 광학 매체(예를 들어, CD ROM) 등을 포함하지만 이에 제한되지 않는다. 그러한 매체는 그러한 설명 자료를 제공하는 인터넷 사이트에 대한 주소를 포함할 수 있다.
상기 방법 또는 조성물 중 임의의 것의 추가의 특징은 하기 열거된 구현예 중 하나 이상을 포함한다.
당업자는 단지 일상적인 실험을 사용하여, 본 명세서에서 기재된 본 개시내용의 구체적인 구현예에 대한 많은 균등물을 인식하거나 확인할 수 있을 것이다. 그러한 균등물은 하기 열거된 구현예에 의해 포함되는 것으로 의도된다.
본 명세서에서 언급된 모든 간행물, 특허 출원, 특허 및 기타 참고 문헌(예를 들어, 서열 데이터베이스 참조 번호)은 전체적으로 참조로 포함된다. 예를 들어, 본 명세서에 언급된, 예를 들어 본 명세서의 임의의 표에 있는 모든 GenBank, Unigene, 및 Entrez 서열은 참조로 포함된다. 달리 명시되지 않는 한, 본 명세서의 임의의 표에 있는 것을 포함한 본 명세서에 명시된 서열 수탁 번호는 2020년 12월 15일 현재 시점에서 최신의 데이터베이스 등록물을 지칭한다. 하나의 유전자 또는 단백질이 복수의 서열 수탁 번호를 참조할 때, 모든 서열 변이체가 포함된다.
열거된 구현예
1. 발현 리프레서로서,
MYC 프로모터에 결합하는 표적화 모이어티, 및
선택적으로, 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
2. 구현예 1에 있어서, 상기 표적화 모이어티는 서열번호 4, 199, 또는 201의 1400, 1200, 1000, 800, 600, 400, 또는 200 nt 상류 또는 하류 내에 있는 게놈 유전자좌에 결합하는, 발현 리프레서.
3. 구현예 1에 있어서, 상기 표적화 모이어티는 서열번호 4, 77, 82, 83, 85, 199, 또는 201의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는, 발현 리프레서.
4. 발현 리프레서로서,
서열번호 3, 97, 98, 99, 100, 101, 102, 103, 104, 105, 106, 107, 109, 110, 75, 76, 78, 79, 80, 81, 84, 85, 86, 190, 191, 192, 200, 또는 202의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티 및
선택적으로, 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
5. 발현 리프레서로서,
서열번호 2, 77, 82, 83, 199, 또는 201의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티 및
선택적으로, 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
6. 발현 리프레서로서,
MYC 유전자좌에 결합하는 표적화 모이어티, 및
MQ1 또는 이의 단편 또는 변이체를 포함하는 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
7. 발현 리프레서로서,
MYC 슈퍼 인핸서 영역에서 유전자좌에 결합하는 표적화 모이어티,
선택적으로 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제를 포함하는 이펙터 모이어티이되, 선택적으로 MQ1 또는 이의 단편 또는 변이체를 포함하는, 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
8. 발현 리프레서로서,
MYC 슈퍼 인핸서 영역에서 유전자좌에 결합하는 표적화 모이어티,
전사 리프레서를 포함하는 이펙터 모이어티이되, 선택적으로 KRAB 또는 이의 단편 또는 변이체를 포함하는, 이펙터 모이어티
를 포함하며,
상기 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
9. 구현예 7 또는 8에 있어서, 상기 표적화 모이어티는 서열번호 96 내지 110, 83, 199, 201 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는, 발현 리프레서.
10. 구현예 7 내지 9 중 어느 하나에 있어서, 상기 표적화 모이어티는 hg19 참조 게놈을 사용하여, GRCh37: chr8:129162465-129212140의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는, 발현 리프레서.
11. 구현예 7 내지 10 중 어느 하나에 있어서, 상기 표적화 모이어티는 서열번호 96 또는 108의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는, 발현 리프레서.
12. 구현예 7 내지 11 중 어느 하나에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인 또는 TAL 이펙터 도메인을 포함하는, 발현 리프레서.
13. 발현 리프레서로서,
유전자좌, 예를 들어 MYC 유전자좌에 결합하는 표적화 모이어티,
EZH2 또는 이의 단편 또는 변이체를 포함하는 제1 이펙터 모이어티, 및
KRAB 또는 이의 단편 또는 변이체를 포함하는 제2 이펙터 모이어티를 포함하며,
상기 유전자좌에서 발현을 감소시킬 수 있는, 예를 들어 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
14. 구현예 13에 있어서, 상기 표적화 모이어티는 MYC 프로모터, 슈퍼 인핸서 영역, 또는 앵커 서열에 결합하는, 발현 리프레서.
15. 구현예 13 또는 14에 있어서, 상기 표적화 모이어티는 TAL 이펙터 도메인, CRISPR/Cas 도메인, 또는 징크 핑거 도메인을 포함하는, 발현 리프레서.
16. 구현예 13 내지 15 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 제2 이펙터의 N-말단에 있거나, 제1 이펙터는 제2 이펙터 모이어티의 C-말단에 있는, 발현 리프레서.
17. 발현 리프레서로서,
MYC 유전자좌에 결합하되, 징크 핑거 도메인을 포함하는, 표적화 모이어티, 및
선택적으로, 이펙터 모이어티
를 포함하며,
상기 발현 리프레서는 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
18. 발현 리프레서로서,
MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 슈퍼 인핸서, 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 CRISPR/Cas 도메인을 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및
MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
19. 발현 리프레서로서,
MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 CRISPR/Cas 도메인을 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및
MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
20. 발현 리프레서로서,
MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 CRISPR/Cas 도메인을 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및
KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
21. 발현 리프레서로서,
MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는 CRISPR/Cas 도메인을 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티; 및
KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
22. 발현 리프레서로서,
MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 징크 핑거 도메인을 포함하는 표적화 모이어티; 및
MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
23. 발현 리프레서로서,
MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 또는 전사 개시 부위(TSS)) 또는 상기 전사 조절 요소에 근접한 서열에 결합하는 징크 핑거 도메인을 포함하는 표적화 모이어티; 및
KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
24. 발현 리프레서로서,
서열번호 190 내지 192 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 마우스 게놈 유전자좌에 결합하는 표적화 모이어티 및
선택적으로, 이펙터 모이어티
를 포함하며,
상기 발현 리프레서는 MYC의 발현을 감소시킬 수 있는, 발현 리프레서.
25. 제24항에 있어서, 상기 이펙터 모이어티는 DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
26. 구현예 24 또는 25에 있어서, 상기 표적화 모이어티는 TAL 이펙터 도메인, CRISPR/Cas 도메인, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제 도메인, 또는 올리고뉴클레오타이드를 포함하는, 발현 리프레서.
27. 구현예 24 내지 26 중 어느 하나에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인 또는 TAL 이펙터 도메인을 포함하는, 발현 리프레서.
28. 구현예 24 내지 27 중 어느 하나에 있어서, 상기 발현 리프레서는 서열번호 160 내지 165 중 임의의 것으로부터 선택되는 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
29. 구현예 24 내지 28 중 어느 하나에 있어서, 상기 발현 리프레서는 서열번호 166 내지 168 중 임의의 것으로부터 선택되는 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열에 의해 인코딩되는, 발현 리프레서.
30. 구현예 24 내지 29 중 어느 하나에 있어서, 상기 표적화 모이어티는 서열번호 154 내지 156 중 임의의 것에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
31. 구현예 24 내지 30 중 어느 하나에 있어서, 상기 표적화 모이어티는 서열번호 157 내지 159 중 임의의 것에 따른 핵산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
32. 구현예 24 내지 31 중 어느 하나에 있어서, 상기 이펙터 모이어티는 지속 가능한 이펙터 모이어티인, 발현 리프레서.
33. 구현예 24 내지 32 중 어느 하나에 있어서, 상기 이펙터 모이어티는 일시적인 이펙터 모이어티인, 발현 리프레서.
34. 구현예 24 내지 33 중 어느 하나에 있어서, 상기 발현 리프레서는 융합 분자인, 발현 리프레서.
35. 구현예 24 내지 34 중 어느 하나에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인을 포함하고, 이펙터 모이어티는 후성유전학적 변형 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
36. 구현예 18 내지 20, 22, 또는 23 중 어느 하나에 있어서, 상기 조절 요소는 조절 요소 클러스터의 일부인, 발현 리프레서.
37. 구현예 18 내지 20, 22, 또는 23 중 어느 하나에 있어서, 상기 조절 요소는 비-코딩 영역에 위치하는, 발현 리프레서.
38. 구현예 18 내지 20, 22, 또는 23 중 어느 하나에 있어서, 상기 조절 요소는, 예를 들어 표적 유전자 프로모터, 예를 들어 MYC로부터 적어도 1,000 nt 떨어져 위치한 원위 인핸서인, 발현 리프레서.
39. 구현예 18 내지 20, 22, 23 또는 36 내지 38 중 어느 하나에 있어서, 상기 조절 요소는 표적 유전자, 예를 들어 MYC의 발현을 증가시키는, 발현 리프레서.
40. 구현예 18 내지 20, 22, 23, 또는 36 내지 39 중 어느 하나에 있어서, 상기 조절 요소는 하나 이상의 돌연변이를 포함하는, 발현 리프레서.
41. 구현예 18 내지 20, 22, 23, 또는 36 내지 40 중 어느 하나에 있어서, 상기 조절 요소는 적어도 하나의 질환-연관 단일 뉴클레오타이드 다형성(SNP)을 포함하는, 발현 리프레서.
42. 구현예 18 내지 20, 22, 23, 또는 36 내지 41 중 어느 하나에 있어서, 상기 전사 조절 요소는 인핸서 도킹(docking) 부위를 통해 표적 유전자, 예를 들어 MYC의 프로모터와 상호작용하는, 발현 리프레서.
43. 구현예 42에 있어서, 상기 인핸서 도킹 부위는 서열번호 71 내지 74 중 임의의 것에 따른 뉴클레오타이드 서열을 포함하는, 발현 리프레서.
44. 발현 리프레서로서,
MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는 징크 핑거 도메인을 포함하는 표적화 모이어티; 및
KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티
를 포함하는, 발현 리프레서.
45. 구현예 1 내지 23 또는 36 내지 43 중 어느 하나에 있어서, 상기 발현 리프레서는 서열번호 22 내지 37, 129, 133, 134, 139 내지 149, 또는 177 내지 186 중 임의의 것으로부터 선택되는 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
46. 구현예 1 내지 23 또는 36 내지 45 중 어느 하나에 있어서, 상기 발현 리프레서는 서열번호 55 내지 70, 130, 189, 또는 193 내지 197 중 임의의 것으로부터 선택되는 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열에 의해 인코딩되는, 발현 리프레서.
47. 구현예 1 내지 23 또는 36 내지 46 중 어느 하나에 있어서, 상기 표적화 모이어티는 서열번호 5 내지 16, 또는 169 내지 172 중 임의의 것에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
48. 선행하는 구현예 중 어느 하나에 있어서, 상기 이펙터 모이어티는 서열번호 18 19, 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
49. 구현예 1 내지 12, 17 내지 19, 22, 36 내지 42, 또는 44 내지 47 중 어느 하나에 있어서, 상기 이펙터 모이어티는 지속 가능한 이펙터 모이어티인, 발현 리프레서.
50. 구현예 1 내지 23, 또는 36 내지 48 중 어느 하나에 있어서, 상기 이펙터 모이어티는 일시적인 이펙터 모이어티인, 발현 리프레서.
51. 구현예 1 내지 12, 17 내지 19, 22, 36 내지 42, 또는 44 내지 48에 있어서, 상기 이펙터 모이어티는 DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
52. 구현예 1 내지 23, 36 내지 47 또는 49에 있어서, 상기 이펙터 모이어티는 전사 리프레서를 포함하고, 예를 들어 KRAB 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
53. 선행하는 구현예 중 어느 하나에 있어서, 상기 표적화 모이어티는 TAL 이펙터 도메인, CRISPR/Cas 도메인, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제 도메인, 또는 올리고뉴클레오타이드를 포함하는, 발현 리프레서.
54. 구현예 53에 있어서, 상기 CRISPR/Cas 도메인은 gRNA, 예를 들어 서열번호 1 내지 4 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 gRNA에 결합하며, gRNA는 서열번호 1 내지 4 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 서열을 포함하는, 발현 리프레서.
55. 구현예 53에 있어서, 상기 CRISPR/Cas 도메인은 gRNA, 예를 들어 서열번호 96 내지 110 중 어느 하나의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 gRNA에 결합하며, gRNA는 서열번호 96 내지 110 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 서열을 포함하는, 발현 리프레서.
56. 구현예 53 내지 55에 있어서, 상기 CRISPR/Cas 도메인은 표 1로부터 선택되는 Cas 단백질 또는 Cpf1 단백질 또는 이들 중 임의의 변이체(예를 들어, 돌연변이체)를 포함하는, 발현 리프레서.
57. 구현예 53 내지 56 중 어느 하나에 있어서, 상기 CRISPR/Cas 도메인은 촉매적으로 비활성인 CRISPR/Cas 단백질, 예를 들어 dCas9를 포함하는, 발현 리프레서.
58. 구현예 53에 있어서, 상기 징크 핑거 도메인은 서열번호 96 내지 110 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하며, 예를 들어 gRNA는 서열번호 96 내지 110 중 임의의 것의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 서열을 포함하는, 발현 리프레서.
59. 구현예 17, 22, 26 내지 53, 또는 57 중 어느 하나에 있어서, 상기 징크 핑거 도메인은 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 징크 핑거(및 선택적으로 11, 10, 9, 8, 7, 6, 또는 5개 이하의 징크 핑거)를 포함하는, 발현 리프레서.
60. 구현예 17, 22, 26 내지 53, 57, 또는 58 중 어느 하나에 있어서, 상기 징크 핑거 도메인은 1 내지 10, 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 1 내지 2, 2 내지 10, 2 내지 9, 2 내지 8, 2 내지 7, 2 내지 6, 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 10, 3 내지 9, 3 내지 8, 3 내지 7, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 10, 4 내지 9, 4 내지 8, 4 내지 7, 4 내지 6, 4 내지 5, 5 내지 10, 5 내지 9, 5 내지 8, 5 내지 7, 5 내지 6, 6 내지 10, 6 내지 9, 6 내지 8, 6 내지 7, 7 내지 10, 7 내지 9, 7 내지 8, 8 내지 10, 8 내지 9, 또는 9 내지 10개의 징크 핑거를 포함하는, 발현 리프레서.
61. 구현예 17, 22, 26 내지 53, 또는 57 내지 59에 있어서, 상기 징크 핑거 도메인은 3 또는 9개의 징크 핑거를 포함하는, 발현 리프레서.
62. 선행하는 구현예 중 어느 하나에 있어서, 융합 분자인, 발현 리프레서.
63. 선행하는 구현예 중 어느 하나에 있어서, 표적화 도메인과 이펙터 도메인 사이에 위치하는 링커를 포함하며, 선택적으로 링커는 서열번호 137 또는 서열번호 138에 따른 아미노산 서열을 포함하는, 발현 리프레서.
64. 구현예 1 내지 17, 20, 21, 23, 44 내지 48, 50, 또는 52 내지 57에 있어서, 상기 표적화 모이어티는 촉매적으로 비활성인 CRISPR/Cas 도메인(예를 들어, dCas9)을 포함하고, 이펙터 모이어티는 전사 리프레서, 예를 들어 KRAB 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
65. 구현예 1 내지 17, 20, 21, 23, 44 내지 48, 50, 52, 또는 53 내지 64에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인을 포함하고, 이펙터 모이어티는 전사 리프레서, 예를 들어 KRAB 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
66. 구현예 17, 36 내지 43, 45 내지 47, 53, 또는 58 내지 63에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인을 포함하고, 발현 리프레서는 이펙터 모이어티를 포함하지 않는, 발현 리프레서.
67. 구현예 1 내지 12, 18 내지 19, 22, 36 내지 43, 45 내지 49, 51, 또는 53 내지 57에 있어서, 상기 표적화 모이어티는 촉매적으로 비활성인 CRISPR/Cas 도메인(예를 들어, dCas9)을 포함하고 이펙터 모이어티는 후성유전학적 변형 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
68. 구현예 1 내지 12, 17 내지 19, 22, 36 내지 43, 45 내지 49, 51, 53, 또는 58 내지 63에 있어서, 상기 표적화 모이어티는 징크 핑거 도메인을 포함하고, 이펙터 모이어티는 후성유전학적 변형 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 단편 또는 변이체를 포함하는, 발현 리프레서.
69. 선행하는 구현예 중 어느 하나에 있어서, 서열번호 22 내지 37, 129, 133, 134, 139 내지 149, 또는 177 내지 186 중 임의의 것의 아미노산 서열, 또는 이와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 동일성을 갖는 서열을 포함하는, 발현 리프레서.
70. 선행하는 구현예 중 어느 하나에 있어서, (i) 하나 이상의 핵 국재화 신호 서열(NLS)을 포함하거나, (ii) NLS를 포함하지 않는, 발현 리프레서.
71. 선행하는 구현예 중 어느 하나에 있어서, N 말단에 제1 NLS를 포함하며, 예를 들어 제1 NLS는 서열번호 88의 서열을 갖는, 발현 리프레서.
72. 선행하는 구현예 중 어느 하나에 있어서, C-말단에 NLS, 예를 들어 제2 NLS를 포함하며, 예를 들어 서열번호 89의 서열을 갖는, 발현 리프레서.
73. 선행하는 구현예 중 어느 하나에 있어서, 제1 및 제2 NLS는 동일한 서열을 갖는, 발현 리프레서.
74. 구현예 71 내지 73 중 어느 하나에 있어서, 제1 및 제2 NLS는 상이한 서열을 갖는, 발현 리프레서.
75. 선행하는 구현예 중 어느 하나에 있어서, 에피토프 태그를 포함하는, 발현 리프레서.
76. 구현예 75에 있어서, 상기 에피토프 태그는 HA 태그인, 발현 리프레서.
77. 선행하는 구현예 중 어느 하나에 있어서, 상기 앵커 서열은 서열번호 71 또는 72의 서열, 또는 이에 대해 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 변경을 갖는 서열을 포함하는, 발현 리프레서.
78. 구현예 1 내지 77 중 어느 하나에 있어서, 상기 앵커 서열은 서열번호 73 또는 74에 따른 서열, 또는 이에 대해 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 변경을 갖는 서열을 포함하는, 발현 리프레서.
79. 선행하는 구현예 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자와 동일한 염색체 상에 있는, 발현 리프레서.
80. 선행하는 구현예 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자의 상류(예를 들어, TSS의 상류 또는 프로모터의 상류)에 있는, 발현 리프레서.
81. 선행하는 구현예 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자로부터(예를 들어, MYC 유전자의 TSS 또는 프로모터로부터) 적어도 1, 5, 10, 50, 100, 또는 1000 킬로베이스 떨어져 있는, 발현 리프레서.
82. 선행하는 구현예 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자로부터(예를 들어, TSS 또는 MYC 유전자의 프로모터로부터) 0.1 내지 0.5, 0.1 내지 1, 0.1 내지 5, 0.1 내지 10, 0.1 내지 50, 0.1 내지 100, 0.1 내지 500, 0.1 내지 1000, 0.5 내지 1, 0.5 내지 5, 0.5 내지 10, 0.5 내지 50, 0.5 내지 100, 0.5 내지 500, 0.5 내지 1000, 1 내지 5, 1 내지 10, 1 내지 50, 1 내지 100, 1 내지 500, 1 내지 1000, 5 내지 10, 5 내지 50, 5 내지 100, 5 내지 500, 5 내지 1000, 10 내지 50, 10 내지 100, 10 내지 500, 10 내지 1000, 50 내지 100, 50 내지 500, 50 내지 1000, 100 내지 500, 100 내지 1000, 또는 500 내지 1000 킬로베이스 떨어져 있는, 발현 리프레서.
83. 구현예 1 내지 79 또는 81 내지 82 중 어느 하나에 있어서, 상기 표적 서열은 MYC 유전자의 하류(예를 들어, TSS의 하류 또는 프로모터의 상류)에 있는, 발현 리프레서.
84. 선행하는 구현예 중 어느 하나에 있어서, 상기 표적화 모이어티는 염색체 좌표 128746342-128746364, 128746321-128746343, 128746525-128746547, 128748014-128748036, 129188878-129188900, 129188958-129188980, 129188960-129188982, 129189067-129189089, 129189457-129189479, 129189554-129189576, 129189679-129189701, 129209511-129209533, 129209643-129209665, 129209658-129209680, 129209856-129209878, 129189452-129189474, 129189190-129189212, 129189274-129189296, 129189421-129189443, 128746405-128746425, 128748069-128748089, 129188825-129188845, 또는 129188822-129188842에서의 서열, 또는 이에 근접한 서열에 결합하는, 발현 리프레서.
85. 선행하는 구현예 중 어느 하나에 있어서, 표적 유전자 유전자좌, 예를 들어 MYC에 대한 발현 리프레서의 결합은, 예를 들어 ELISA에 의해 측정 시 또는 실시예 7 또는 28 중 임의의 것에 기재된 바와 같이, 발현 리프레서의 부재 시 메틸화와 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 표적 유전자 유전자좌, 예를 들어 MYC에서의 부위에서 메틸화를 증가시키며, 선택적으로 메틸화에 대해 분석되는 부위는 hg19 참조 게놈에 따른 chr8:129188693-129189048이고, 예를 들어 서열번호 123에 따른 서열을 포함하는, 발현 리프레서.
86. 선행하는 구현예 중 어느 하나에 있어서, 상기 표적 유전자 유전자좌, 예를 들어 MYC에 대한 발현 리프레서의 결합은, 실시예 28에 기재된 바와 같이 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 표적 유전자 유전자좌, 예를 들어 MYC의 부위에서 메틸화를 증가시키는, 발현 리프레서.
87. 선행하는 구현예 중 어느 하나에 있어서, MYC 유전자좌에 대한 발현 리프레서의 결합은, 예를 들어 ELISA에 의해 측정 시 또는 실시예 2 내지 7 또는 9 중 임의의 것에 기재된 바와 같이, 발현 리프레서의 부재 시 발현과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 세포에서 MYC의 발현을 감소시키는, 발현 리프레서.
88. 선행하는 구현예 중 어느 하나에 있어서, 상기 MYC 유전자좌에 대한 발현 리프레서의 결합은, ELISA에 의해 측정 시 또는 실시예 2 내지 7 또는 9 중 임의의 것에 기재된 바와 같이, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 발현 리프레서.
89. 선행하는 구현예 중 어느 하나에 있어서, 상기 MYC 유전자좌에 대한 발현 리프레서의 결합은 형질감염 후 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 80, 또는 96시간 후에 MYC의 발현을 상당히 감소시키는, 발현 리프레서.
90. 구현예 1 내지 23 또는 36 내지 89 중 어느 하나에 있어서, 상기 표적화 모이어티는 인간 게놈 유전자좌에 결합하는, 발현 리프레서.
91. 구현예 24 내지 43 49, 51, 53, 56 내지 57, 59 내지 62, 66 내지 68, 70 내지 89 중 어느 하나에 있어서, 상기 표적화 모이어티는 마우스 게놈 유전자좌에 결합하는, 발현 리프레서.
92. 선행하는 구현예 중 어느 하나에 있어서, 상기 MYC 유전자좌에 대한 발현 리프레서의 결합은 MYC 유전자좌를 포함하는 세포(예를 들어, 암 세포)의 생존능을 감소시키는, 발현 리프레서.
93. 선행하는 구현예 중 어느 하나에 있어서, 복수의 세포를 발현 리프레서 또는 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것은 복수의 세포의 생존능을 감소시키는, 발현 리프레서.
94. 선행하는 구현예 중 어느 하나에 있어서, 생존능은, 예를 들어 CellTiter Glo에 의해 측정 시 또는 실시예 2 내지 7 중 임의의 것에 기재된 바와 같은, 제1 발현 리프레서의 부재 시 생존능과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 발현 리프레서.
95. 선행하는 구현예 중 어느 하나에 있어서, 상기 발현 리프레서의 투여는 적어도 5%, 6%, 7%, 8%, 9% 10%, 12%, 15%, 17%, 20%, 25% 30%, 40%, 45%, 50%, 55%, 60%, 65%, 75%의 표적 세포(예를 들어, 암 세포)의 아폽토시스를 초래하는, 발현 리프레서.
96. 선행하는 구현예 중 어느 하나에 있어서, 상기 복수의 세포는 복수의 암 세포 및 복수의 비-암 세포 및/또는 복수의 감염 세포 및 복수의 비감염 세포를 포함하는, 발현 리프레서.
97. 선행하는 구현예 중 어느 하나에 있어서, 상기 복수의 세포를 발현 리프레서 또는 발현 리프레서를 인코딩하는 핵산을 접촉시키는 것은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 더 많이 감소시키는, 발현 리프레서.
98. 선행하는 구현예 중 어느 하나에 있어서, 상기 복수의 세포를 발현 리프레서 또는 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 많이 감소시키는, 발현 리프레서.
99. 구현예 92 내지 97 중 어느 하나에 있어서, 상기 암 세포는 폐암 세포, 위암 세포, 위장관암 세포, 결장직장암 세포, 췌장암 세포, 또는 간암 세포인, 발현 리프레서.
100. 구현예 92 내지 99 중 어느 하나에 있어서, 상기 암은 간세포 암종 (HCC), 섬유층판 간세포 암종(FHCC), 담관암종, 혈관육종, 2차 간암, 비소세포 폐암(NSCLC), 선암종, 소세포 폐암(SCLC), 대세포 (미분화) 암종, 삼중 음성 유방암, 위 선암종, 자궁내막 암종, 또는 췌 암종인, 발현 리프레서.
101. 선행하는 구현예 중 어느 하나에 있어서, 복수의 감염 세포 및 복수의 비감염 세포와 접촉될 때, 복수의 비감염 세포의 생존능을 감소시키는 것보다 복수의 감염 세포의 생존능을 더 많이 감소시키는, 발현 리프레서.
102. 선행하는 구현예 중 어느 하나에 있어서, 상기 감염은 바이러스성인, 발현 리프레서.
103. 구현예 102에 있어서, 상기 바이러스 감염은 간염, 예를 들어 B형 간염인, 발현 리프레서.
104. 구현예 92 내지 103 중 어느 하나에 있어서, 상기 감염 세포는 인간 간세포인, 발현 리프레서.
105. 선행하는 구현예 중 어느 하나에 있어서, 발현 리프레서를 인코딩하는 mRNA의 LNP 전달을 사용하여 암 세포(예를 들어, HCC 세포)의 생존력에 대한 분석에서, 예를 들어 실시예 12에 따른 분석에서 테스트될 때 EC50이 0.04 내지 0.4, 0.04 내지 0.1, 0.1 내지 0.2, 0.2 내지 0.3, 또는 0.3 내지 0.4 μg/mL인, 발현 리프레서.
106. 구현예 1 내지 104 중 어느 하나에 있어서, 발현 리프레서를 인코딩하는 mRNA의 LNP 전달을 사용하여 암 세포(예를 들어, 폐암 세포)의 생존력에 대한 분석에서, 예를 들어 실시예 18에 따른 분석에서 테스트될 때 EC50이 0.1 내지 2.5, 0.5 내지 2.2, 1.0 내지 1.5, 1.2 내지 2 μg/mL인, 발현 리프레서.
107. 선행하는 구현예 중 어느 하나에 있어서, 발현 리프레서를 인코딩하는 mRNA의 LNP 전달을 사용하여 암 세포(예를 들어, HCC 세포)에서 MYC mRNA 수준을 감소시키는 것에 대한 분석에서, 예를 들어 실시예 12에 따른 분석에서 테스트될 때 EC50이 0.004 내지 0.08, 0.004 내지 0.01, 0.01 내지 0.02, 0.02 내지 0.04, 또는 0.04 내지 0.08 μg/mL인, 발현 리프레서.
108. 선행하는 구현예 중 어느 하나에 있어서, 발현 리프레서를 인코딩하는 mRNA의 LNP 전달을 사용하여 암 세포(예를 들어, 폐암 세포)에서 MYC mRNA 수준을 감소시키는 것에 대한 분석에서, 예를 들어 실시예 18에 따른 분석에서 테스트될 때 EC50이 0.04 내지 0.1, 0.04 내지 0.09, 0.05 내지 0.09, 또는 0.06 내지 0.8 μg/mL인, 발현 리프레서.
109. 선행하는 구현예 중 어느 하나에 있어서, 세포에서 표적 유전자, 예를 들어 MYC에 의해 인코딩되는 단백질의 수준을 비처리 세포에서 단백질 수준과 비교하여 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50%, 적어도 60%, 적어도 70%, 적어도 80%, 또는 적어도 90%만큼 감소시키는, 발현 리프레서.
110. 선행하는 구현예 중 어느 하나에 있어서, 예를 들어 인간 대상체 또는 포유동물 모델에서, 종양 부피를 감소시킬 수 있는, 발현 리프레서.
111. 선행하는 구현예 중 어느 하나에 있어서, 상기 발현 리프레서는, 예를 들어 치료 개시 후 20일째에 측정될 때, 예를 들어 포유동물 모델에서 화학요법제와 비교하여 유사하거나 더 큰 정도로 종양 부피를 감소시킬 수 있으며, 예를 들어 발현 리프레서는 3 mg/kg의 용량으로 5일마다 투여되는, 발현 리프레서.
112. 선행하는 구현예 중 어느 하나에 있어서, 상기 발현 리프레서는, 예를 들어 치료 개시 후 20일째에 측정될 때, 예를 들어 포유동물 모델에서 PBS 대조군과 비교하여 종양 부피를 감소시킬 수 있으며, 예를 들어 발현 리프레서는 4회 용량으로 5일마다 투여한 후 1 mg/kg, 1.5 mg/kg, 또는 3 mg/kg의 3회 용량으로 3일마다 투여되는, 발현 리프레서.
113. 선행하는 구현예 중 어느 하나에 있어서, 상기 종양 부피는, 예를 들어 치료 시작 후 20일째에, PBS로 처리된 대조군과 비교하여 적어도 약 10%, 20%, 30%, 또는 40%만큼 감소되는, 발현 리프레서.
114. 구현예 111 내지 113 중 어느 하나에 있어서, 상기 화학요법제는 소라페닙 또는 시스플라틴인, 발현 리프레서.
115. 선행하는 구현예 중 어느 하나에 있어서, 상기 시스템은 소분자 MYC 억제제와 비교하여 유사하거나 더 큰 정도로 종양 부피를 감소시킬 수 있는, 발현 리프레서.
116. 구현예 115에 있어서, 상기 소분자 MYC 억제제는 MYCi975이며, 선택적으로 종양 부피는, 예를 들어 치료 시작 후 20일째에, MYCi975로 처리된 대조군과 비교하여 적어도 약 10%, 20%, 30%, 또는 40%만큼 감소되는, 발현 리프레서.
117. 선행하는 구현예 중 어느 하나에 있어서, 치료 시작 시와 비교하여 체중의 감소를 유발하지 않거나, 3%, 2%, 또는 1% 미만의 체중 감소를 유발하는, 발현 리프레서.
118. 시스템으로서,
선행하는 구현예 중 어느 하나에 있어서의 제1 발현 리프레서, 및
제2 발현 리프레서, 예를 들어 본 명세서에 기재된 제2 발현 리프레서, 예를 들어 선행하는 구현예 중 어느 하나의 제2 발현 리프레서
를 포함하는 시스템.
119. 시스템으로서,
제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하되, MYC 유전자에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터, 인핸서, 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합하는, 제1 발현 리프레서, 및
제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하되, MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는 제2 발현 리프레서
를 포함하는, 시스템.
120. 구현예 118 또는 119에 있어서,
상기 전사 조절 요소는 프로모터를 포함하고,
상기 앵커 서열은 CTCF 결합 모티프를 포함하는, 시스템.
121. 구현예 118 내지 120 중 어느 하나에 있어서, 제2 발현 리프레서는 CTCF 결합 모티프에 인접한 하류 영역에 결합하는, 시스템.
122. 구현예 118 내지 120 중 어느 하나에 있어서, 제2 발현 리프레서는 CTCF 결합 모티프에 인접한 상류 영역에 결합하는, 시스템.
123. 구현예 118 내지 122 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 서열번호 2, 3, 4, 71 내지 86, 또는 200 내지 206의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하고;
상기 제2 발현 리프레서는 서열번호 2, 3, 4, 71 내지 86, 또는 200 내지 206의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는, 시스템.
124. 구현예 118 내지 123 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 서열번호 96 내지 110 중 임의의 것의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는, 시스템.
125. 구현예 118 내지 124 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 서열번호 71, 서열번호 72, 또는 서열번호 83의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하고;
상기 제2 발현 리프레서는 서열번호 77의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는, 시스템.
126. 시스템으로서,
제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하며, MYC 유전자에 작동가능하게 연결된 프로모터 또는 프로모터에 근접한 서열에 결합하는 제1 발현 리프레서, 및
제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하며, MYC 유전자의 인핸서(예를 들어, 슈퍼-인핸서)에 결합하는, 제2 발현 리프레서
를 포함하는 시스템.
127. 구현예 126에 있어서,
제1 발현 리프레서는 서열번호 204의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하고,
제2 발현 리프레서는 서열번호 199 또는 201 중 임의의 것의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티를 포함하는, 시스템.
128. MYC 발현을 감소시키는 시스템으로서,
a) i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는 제1 발현 리프레서: 및
b) i) 서열번호 7, 169, 또는 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는 제2 발현 리프레서
를 포함하는, 시스템.
129. 구현예 128에 있어서, 제1 발현 리프레서는, 예를 들어 제1 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
130. 구현예 128 또는 129에 있어서, 상기 제1 발현 리프레서는, 예를 들어 제1 이펙터 모이어티의 C-말단에 위치하는, 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
131. 구현예 128 내지 130 중 어느 하나에 있어서, 상기 제2 발현 리프레서는, 예를 들어 제2 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
132. 구현예 128 내지 131 중 어느 하나에 있어서, 상기 제2 발현 리프레서는, 예를 들어 제2 이펙터 모이어티의 C-말단에 위치하는, 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
133. 구현예 128 내지 132 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 제1 표적화 모이어티와 제1 이펙터 모이어티 사이에 위치하는 제1 링커를 추가로 포함하되, 선택적으로 제1 링커는 서열번호 137에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
134. 구현예 128 내지 133 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 제2 표적화 모이어티와 제2 이펙터 모이어티 사이에 위치하는 제2 링커를 추가로 포함하되, 선택적으로 제2 링커는 서열번호 138에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
135. 구현예 128 내지 134 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 제1 이펙터 모이어티의 C-말단에 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 126에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
136. 구현예 128 내지 132 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 제2 표적화 모이어티의 N-말단에 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 128에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 시스템.
137. 구현예 128 내지 136 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
138. 구현예 128 내지 137 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 24에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
139. 구현예 128 내지 137 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 서열번호 169에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
140. 구현예 128 내지 137 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 서열번호 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
141. 구현예 128 내지 140 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 177 또는 183에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
142. 구현예 128 내지 140 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 179, 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 시스템.
143. 구현예 128 내지 142 중 어느 하나의 시스템의 제1 발현 리프레서 및 제2 리프레서를 인코딩하는 핵산.
144. MYC 발현을 감소시키는 시스템을 인코딩하는 핵산으로서,
a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서, 상기 제1 발현 리프레서는
i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는, 제1 영역, 및
b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서, 제2 발현 리프레서는
i) 서열번호 7에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는, 제2 영역
을 포함하는, 핵산.
145. 구현예 144에 있어서, 상기 제1 영역은 제2 영역의 5'인, 핵산.
146. 구현예 144에 있어서, 상기 제1 영역은 제2 영역의 3'인, 핵산.
147. 구현예 145 또는 146에 있어서, 상기 제1 영역은, 예를 들어 제1 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
148. 구현예 145 내지 147 중 어느 하나에 있어서, 상기 제1 영역은, 예를 들어 제1 이펙터 모이어티의 C-말단에 위치하는, 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
149. 구현예 145 내지 148 중 어느 하나에 있어서, 상기 제2 영역은, 예를 들어 제2 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
150. 구현예 145 내지 149 중 어느 하나에 있어서, 상기 제2 영역은, 예를 들어 제2 이펙터 모이어티의 C-말단에 위치하는, 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
151. 구현예 145 내지 150 중 어느 하나에 있어서, 상기 제1 영역은 제1 표적화 모이어티와 제1 이펙터 모이어티 사이에 위치하는 제1 링커를 인코딩하는 뉴클레오타이드 서열을 추가로 포함하며, 선택적으로 제1 링커는 서열번호 137에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
152. 구현예 145 내지 151 중 어느 하나에 있어서, 상기 제2 영역은 제2 표적화 모이어티와 제2 이펙터 모이어티 사이에 위치하는 제2 링커를 인코딩하는 뉴클레오타이드 서열을 추가로 포함하며, 선택적으로 제2 링커는 서열번호 138에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
153. 구현예 145 내지 152 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티의 C-말단의 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 126에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 인코딩하는 뉴클레오타이드 서열을 추가로 포함하는, 핵산.
154. 구현예 145 내지 153에 있어서, 상기 제2 영역은 제2 표적화 모이어티의 N-말단의 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 128에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 인코딩하는 뉴클레오타이드 서열을 추가로 포함하는, 핵산.
155. 구현예 145 내지 154 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
156. 구현예 145 내지 155 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 24에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
157. 구현예 145 내지 156 중 어느 하나에 있어서, 상기 제1 영역은 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 46 또는 131에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
158. 구현예 145 내지 157 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 52 또는 132에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
159. 구현예 145 내지 158 중 어느 하나에 있어서, 상기 제2 영역은 제2 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제2 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 40에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
160. 구현예 145 내지 159 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 51에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
161. 구현예 145 내지 160 중 어느 하나에 있어서, 상기 제1 영역은 서열번호 63 또는 130에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
162. 구현예 145 내지 161 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 57에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
163. MYC 발현을 감소시키는 시스템을 인코딩하는 핵산으로서,
a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서, 상기 제1 발현 리프레서는
i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는, 제1 영역, 및
b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서, 제2 발현 리프레서는
i) 서열번호 169에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는, 제2 영역
을 포함하는, 핵산.
164. MYC 발현을 감소시키는 시스템을 인코딩하는 핵산으로서,
a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서, 상기 제1 발현 리프레서는
i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
를 포함하는, 제1 영역:, 및
b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서, 상기 제2 발현 리프레서는
i) 서열번호 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
를 포함하는, 제2 영역
을 포함하는, 핵산.
165. 구현예 163 또는 164에 있어서, 상기 제1 영역은 제2 영역의 5'인, 핵산.
166. 구현예 163 또는 164에 있어서, 상기 제1 영역은 제2 영역의 3'인, 핵산.
167. 구현예 163 내지 166 중 어느 하나에 있어서, 상기 제1 영역은, 예를 들어 제1 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
168. 구현예 163 내지 167 중 어느 하나에 있어서, 상기 제1 영역은, 예를 들어 제1 이펙터 모이어티의 C-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
169. 구현예 163 내지 168 중 어느 하나에 있어서, 상기 제2 영역은, 예를 들어 제2 표적화 모이어티의 N-말단에 위치하는, 제1 핵 국재화 신호, 예를 들어 SV40 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 135에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
170. 구현예 163 내지 169 중 어느 하나에 있어서, 상기 제2 영역은, 예를 들어 제2 이펙터 모이어티의 C-말단에 위치하는, 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS를 인코딩하는 뉴클레오타이드 서열, 예를 들어 서열번호 136에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 추가로 포함하는, 핵산.
171. 구현예 163 내지 170 중 어느 하나에 있어서, 상기 제1 영역은 제1 표적화 모이어티와 제1 이펙터 모이어티 사이에 위치하는 제1 링커를 인코딩하는 뉴클레오타이드 서열을 추가로 포함하며, 선택적으로 제1 링커는 서열번호 137에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
172. 구현예 163 내지 171 중 어느 하나에 있어서, 상기 제2 영역은 제2 표적화 모이어티와 제2 이펙터 모이어티 사이에 위치하는 제2 링커를 인코딩하는 뉴클레오타이드 서열을 추가로 포함하며, 선택적으로 제2 링커는 서열번호 138에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
173. 구현예 163 내지 171 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티의 C-말단의 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 126에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 인코딩하는 뉴클레오타이드 서열을 추가로 포함하는, 핵산.
174. 구현예 163 내지 173에 있어서, 상기 제2 영역은 제2 표적화 모이어티의 N-말단의 아미노산 서열, 예를 들어 최대 30, 25, 20, 또는 18개 아미노산의 서열, 예를 들어 서열번호 128에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 인코딩하는 뉴클레오타이드 서열을 추가로 포함하는, 핵산.
175. 구현예 163 내지 174 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
176. 구현예 144 내지 175 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 177, 또는 183에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
177. 구현예 144 내지 176 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 179, 또는 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
178. 구현예 144 내지 177 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하고, 제2 발현 리프레서는 서열번호 24, 141, 177, 179, 183, 또는 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 갖는, 핵산.
179. 구현예 144 내지 178 중 어느 하나에 있어서, 상기 제1 영역은 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 46 또는 131에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
180. 구현예 144 내지 179 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 52 또는 132에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
181. 구현예 144 내지 180 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 173에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
182. 구현예 144 내지 181 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 175에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
183. 구현예 144 내지 182 중 어느 하나에 있어서, 상기 제2 영역은 제2 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제2 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 51에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
184. 구현예 144 내지 183 중 어느 하나에 있어서, 상기 제1 영역은 서열번호 63 또는 130에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
185. 구현예 144 내지 184 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 189에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
186. 구현예 144 내지 185 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 194에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
187. 구현예 144 내지 186 중 어느 하나에 있어서, 상기 제1 영역은 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 52 또는 132에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
188. 구현예 144 내지 187 중 어느 하나에 있어서, 상기 제1 영역은 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 46 또는 131에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
189. 구현예 144 내지 188 중 어느 하나에 있어서, 상기 제2 영역은 제2 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제2 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 51에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
190. 구현예 144 내지 189 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 189에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
191. 구현예 144 내지 190 중 어느 하나에 있어서, 상기 제2 영역은 서열번호 194에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
192. 구현예 144 내지 191 중 어느 하나에 있어서, 서열번호 93, 112에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는 서열을 갖는, 핵산.
193. 구현예 144 내지 192 중 어느 하나에 있어서, 서열번호 196 또는 197에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 핵산.
194. 구현예 118 내지 193 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 제1 이펙터 모이어티를 포함하는, 시스템 또는 핵산.
195. 구현예 118 내지 194 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 제2 이펙터 모이어티를 포함하는, 시스템 또는 핵산.
196. 구현예 118 내지 195 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 제2 이펙터 모이어티와 상이한 아미노산 서열을 갖는, 시스템 또는 핵산.
197. 구현예 118 내지 196 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 지속 가능한 이펙터 모이어티인, 시스템 또는 핵산.
198. 구현예 118 내지 125 또는 144 내지 197 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 일시적인 이펙터 모이어티인, 시스템 또는 핵산.
199. 구현예 118 내지 198 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 후성유전학적 변형 모이어티인, 시스템 또는 핵산.
200. 구현예 118 내지 143, 163 내지 197 또는 199 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 히스톤 메틸트랜스퍼라제를 포함하는, 시스템 또는 핵산.
201. 구현예 200에 있어서, 상기 제1 이펙터 모이어티는 SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편, 예를 들어 이들 중 임의의 것의 SET 도메인으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
202. 구현예 118 내지 143, 163 내지 197 또는 199 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 히스톤 데메틸라제(예를 들어, 리신 데메틸라제)를 포함하는, 시스템 또는 핵산.
203. 구현예 202에 있어서, 상기 제1 이펙터 모이어티는 KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66(또는 이들 중 임의의 것의 기능성 변이체 또는 단편)으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
204. 구현예 118 내지 143, 163 내지 197 또는 199 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 히스톤 데아세틸라제를 포함하는, 시스템 또는 핵산.
205. 구현예 204에 있어서, 상기 제1 이펙터 모이어티는 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
206. 구현예 118 내지 197 또는 200 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제를 포함하는, 시스템 또는 핵산.
207. 구현예 206에 있어서, 상기 제1 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
208. 구현예 118 내지 143, 160 내지 196, 또는 198 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는, 예를 들어 전사 리프레서를 포함하는, 전사 리프레서 모이어티인, 시스템 또는 핵산.
209. 구현예 198 또는 199에 있어서, 상기 제1 이펙터 모이어티는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
210. 구현예 118 내지 209 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 전사 조절 요소 또는 이에 근접한 서열의 후성유전학적 변형을 촉진시키는, 시스템 또는 핵산.
211. 구현예 118 내지 210 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 전사 조절 요소 또는 이에 근접한 서열의 후성유전학적 변형을 촉매하는, 시스템 또는 핵산.
212. 구현예 118 내지 125, 194, 또는 197 내지 211 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 이펙터 모이어티를 포함하지 않는, 시스템 또는 핵산.
213. 구현예 118 내지 212 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 일시적인 이펙터 모이어티인, 시스템 또는 핵산.
214. 구현예 118 내지 125 또는 194 내지 211 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 지속 가능한 이펙터 모이어티인, 시스템 또는 핵산.
215. 구현예 118 내지 211 또는 214 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 후성유전학적 변형 모이어티인, 시스템 또는 핵산.
216. 구현예 118 내지 125, 194 내지 211, 또는 214 내지 215 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 히스톤 메틸트랜스퍼라제를 포함하는, 시스템 또는 핵산.
217. 구현예 216에 있어서, 상기 제2 이펙터 모이어티는 SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편, 예를 들어 이들 중 임의의 것의 SET 도메인으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
218. 구현예 118 내지 125, 194 내지 211, 또는 214 내지 215 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 히스톤 데메틸라제(예를 들어, 리신 데메틸라제)를 포함하는, 시스템 또는 핵산.
219. 구현예 218에 있어서, 상기 제2 이펙터 모이어티는 KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66(또는 이들 중 임의의 것의 기능성 변이체 또는 단편)으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
220. 구현예 118 내지 125, 194 내지 211, 또는 214 내지 215 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 히스톤 데아세틸라제를 포함하는, 시스템 또는 핵산.
221. 구현예 220에 있어서, 상기 제2 이펙터 모이어티는 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
222. 구현예 118 내지 125, 194 내지 211, 또는 214 내지 215 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제를 포함하는, 시스템 또는 핵산.
223. 구현예 222에 있어서, 상기 제2 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
224. 구현예 118 내지 211 또는 213 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 전사 리프레서 모이어티인, 시스템 또는 핵산.
225. 구현예 224에 있어서, 상기 제2 이펙터 모이어티는 앵커 서열 또는 이에 근접한 서열의 후성유전학적 변형을 촉진시키는, 시스템 또는 핵산.
226. 구현예 223 또는 224에 있어서, 상기 제2 이펙터 모이어티는 하나 이상의 내인성 후성유전학적 변형 단백질 또는 하나 이상의 내인성 전사 변형 단백질에 결합하는, 시스템 또는 핵산.
227. 구현예 223 내지 226 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 시스템 또는 핵산.
228. 구현예 118 내지 197, 199 내지 207, 210 내지 211, 213, 또는 224 내지 227 중 어느 하나에 있어서,
상기 제1 이펙터 모이어티는 지속 가능한 이펙터 모이어티이고,
제2 이펙터 모이어티는 일시적인 이펙터 모이어티인, 시스템 또는 핵산.
229. 구현예 228에 있어서, 상기 제1 이펙터 모이어티는 후성유전학적 변형 모이어티인, 시스템 또는 핵산.
230. 구현예 227 또는 228에 있어서, 상기 제2 이펙터 모이어티는 전사 리프레서 모이어티인, 시스템 또는 핵산.
231. 구현예 227 내지 230 중 어느 하나에 있어서,
상기 제1 이펙터 모이어티는 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 히스톤 데아세틸라제, DNA 메틸트랜스퍼라제, 이들 중 임의의 것의 기능성 변이체 또는 단편, 또는 이들 중 임의의 것의 조합을 포함하고,
제2 이펙터 모이어티는 전사 리프레서 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 시스템 또는 핵산.
232. 구현예 118 내지 125, 194, 197, 199 내지 207, 210 또는 212, 또는 190 중 어느 하나에 있어서,
상기 제1 이펙터 모이어티는 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 히스톤 데아세틸라제, DNA 메틸트랜스퍼라제, 이들 중 임의의 것의 기능성 변이체 또는 단편, 또는 이들 중 임의의 것의 조합을 포함하고,
제2 발현 리프레서는 제2 이펙터 모이어티를 포함하지 않는, 시스템 또는 핵산.
233. 구현예 118 내지 125, 199 내지 207, 210 내지 211, 213, 214, 또는 224 내지 231 중 어느 하나에 있어서,
제1 이펙터 모이어티는 SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 이들 중 임의의 것의 기능성 변이체 또는 단편, 또는 이들 중 임의의 것의 조합을 포함하고,
제2 이펙터 모이어티는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 이들 중 임의의 것의 기능성 변이체 또는 단편, 또는 이들 중 임의의 것의 조합을 포함하는, 시스템 또는 핵산.
234. 구현예 118 내지 197, 199, 206 내지 207, 210 내지 211, 213, 215, 224 내지 231, 또는 233 중 어느 하나에 있어서,
상기 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제를 포함하고,
제2 이펙터 모이어티는 전사 리프레서를 포함하는, 시스템 또는 핵산.
235. 구현예 118 내지 125, 194, 197, 200, 206 내지 207, 210 내지 212, 또는 232에 있어서,
상기 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제를 포함하고,
제2 발현 리프레서는 제2 이펙터 모이어티를 포함하지 않는, 시스템 또는 핵산.
236. 구현예 118 내지 125, 200, 206 내지 207, 210 내지 235 중 어느 하나에 있어서, 상기 제1 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하는, 시스템 또는 핵산.
237. 구현예 118 내지 211, 214, 224 내지 234, 또는 236 중 어느 하나에 있어서, 상기 제2 이펙터 모이어티는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 시스템 또는 핵산.
238. 구현예 118 내지 211, 199, 206 내지 207, 210 내지 211, 213, 224 내지 234, 또는 236 내지 237 중 어느 하나에 있어서,
제1 이펙터 모이어티는 MQ1 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하고,
제2 이펙터는 KRAB 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하는, 시스템 또는 핵산.
239. 구현예 118 내지 125, 194, 197, 199 내지 207, 또는 210 내지 212, 229, 232, 235, 또는 236 중 어느 하나에 있어서,
제1 이펙터 모이어티는 MQ1 또는 이들 중 임의의 것의 기능성 변이체 또는 단편을 포함하고,
제2 발현 리프레서는 제2 이펙터 모이어티를 포함하지 않는, 시스템 또는 핵산.
240. 구현예 118 내지 200 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 22 내지 37, 129, 133, 134, 139 내지 149, 177 내지 180, 또는 183 내지 186 중 임의의 것으로부터 선택되는 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템 또는 핵산.
241. 구현예 118 내지 198, 200, 206 내지 211, 213 내지 216, 222 내지 223, 236 내지 237, 또는 240 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 22 내지 37, 129, 133, 134, 139 내지 149, 177 내지 180, 또는 183 내지 186 중 임의의 것으로부터 선택되는 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템 또는 핵산.
242. 구현예 118 내지 198, 200, 206 내지 211, 213 내지 216, 222 내지 223, 236 내지 237, 또는 240 내지 241 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 30, 129, 133의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하고, 제2 발현 리프레서는 서열번호 24, 134, 141, 177, 179, 183, 또는 185의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템 또는 핵산.
243. 구현예 118 내지 198, 200, 206 내지 211, 213 내지 216, 222 내지 223, 236 내지 237, 또는 240 내지 242 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 63 또는 130의 제1 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열에 의해 인코딩되고, 제2 발현 리프레서는 서열번호 57, 189, 또는 194의 제2 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열에 의해 인코딩되는, 시스템 또는 핵산.
244. 구현예 118 내지 198, 200, 206 내지 211, 213 내지 216, 222 내지 223, 236 내지 237, 또는 240 내지 243 중 어느 하나에 있어서, 상기 제1 및 제2 리프레서는 서열번호 93, 94, 112, 113, 196, 또는 197 의 핵산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열에 의해 인코딩되는, 시스템 또는 핵산.
245. 구현예 244에 있어서, 서열번호 91, 92, 121, 122, 181, 182, 187, 또는 188의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템 또는 핵산.
246. 구현예 118 내지 197, 199, 206 내지 207, 210 내지 211, 213, 215, 224 내지 231, 233 내지 234, 236 내지 237, 또는 240 내지 244 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 N-말단에서 C-말단으로
(i) 제1 핵 국재화 신호, 예를 들어 SV40 NLS; 예를 들어 서열번호 135에 따른 서열;
(ii) 제1 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF9; 예를 들어 서열번호 13에 따른 서열;
(iii) 제1 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1; 예를 들어, 서열번호 19 또는 87에 따른 서열;
(iv) 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하고;
상기 제2 발현 리프레서는 N-말단에서 C-말단으로
(v) 제3 핵 국재화 신호, 예를 들어 SV40NLS; 예를 들어 서열번호 135에 따른 서열;
(vi) 제2 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF3; 예를 들어, 서열번호 7에 따른 서열;
(vii) 제2 이펙터 모이어티, 예를 들어 KRAB, 예를 들어 서열번호 18에 따른 서열; 및
(viii) 제4 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하는, 시스템 또는 핵산.
247. 구현예 118 내지 197, 199, 206 내지 207, 210 내지 211, 213, 215, 224 내지 231, 233 내지 234, 236 내지 237, 또는 240 내지 244 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 N-말단에서 C-말단으로
(i) 제1 핵 국재화 신호, 예를 들어 SV40 NLS; 예를 들어 서열번호 135에 따른 서열;
(ii) 제1 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF9; 예를 들어 서열번호 13에 따른 서열;
(iii) 제1 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1; 예를 들어, 서열번호 19 또는 87에 따른 서열;
(iv) 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하고;
상기 제2 발현 리프레서는 N-말단에서 C-말단으로
(v) 제3 핵 국재화 신호, 예를 들어 SV40NLS; 예를 들어 서열번호 135에 따른 서열;
(vi) 제2 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF54; 예를 들어, 서열번호 169에 따른 서열;
(vii) 제2 이펙터 모이어티, 예를 들어 KRAB, 예를 들어 서열번호 18에 따른 서열; 및
(viii) 제4 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하는, 시스템 또는 핵산.
248. 구현예 118 내지 197, 199, 206 내지 207, 210 내지 211, 213, 215, 224 내지 231, 233 내지 234, 236 내지 237, 또는 240 내지 244 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 N-말단에서 C-말단으로
(i) 제1 핵 국재화 신호, 예를 들어 SV40 NLS; 예를 들어 서열번호 135에 따른 서열;
(ii) 제1 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF9; 예를 들어 서열번호 13에 따른 서열;
(iii) 제1 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1; 예를 들어, 서열번호 19 또는 87에 따른 서열;
(iv) 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하고;
상기 제2 발현 리프레서는 N-말단에서 C-말단으로
(v) 제3 핵 국재화 신호, 예를 들어 SV40NLS; 예를 들어 서열번호 135에 따른 서열;
(vi) 제2 표적화 모이어티, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF67; 예를 들어, 서열번호 171에 따른 서열;
(vii) 제2 이펙터 모이어티, 예를 들어 KRAB, 예를 들어 서열번호 18에 따른 서열; 및
(viii) 제4 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS; 예를 들어 서열번호 136에 따른 서열
을 포함하는, 시스템 또는 핵산.
249. 구현예 118 내지 248 중 어느 하나에 있어서, 상기 시스템은 제1 발현 리프레서 단독 또는 제2 발현 리프레서 단독과 비교하여 더 큰 정도로 MYC의 발현을 감소시킬 수 있는, 시스템.
250. 구현예 128 내지 194, 또는 242 내지 249에 있어서, 상기 시스템은 서열번호 22, 23, 25 내지 29, 31 내지 37 단독 또는 조합의 발현 리프레서 중 임의의 것과 비교하여 더 큰 정도로 MYC의 발현을 감소시킬 수 있는, 시스템.
251. 구현예 118 내지 250 중 어느 하나에 있어서, 예를 들어 인간 대상체 또는 포유동물 모델에서, 종양 부피를 감소시킬 수 있는, 시스템.
252. 구현예 128 내지 193 또는 242 내지 209 중 어느 하나에 있어서, 상기 시스템은, 예를 들어 치료 개시 후 20일째에 측정될 때, 예를 들어 포유동물 모델에서 화학요법제와 비교하여 유사하거나 더 큰 정도로 종양 부피를 감소시킬 수 있으며, 예를 들어 발현 리프레서는, 예를 들어 실시예 15에 기재된 바와 같은 모델 시스템에서, 3 mg/kg의 용량으로 5일마다 투여되는, 시스템.
253. 구현예 128 내지 193 또는 242 내지 252 중 어느 하나에 있어서, 상기 시스템은, 예를 들어 치료 개시 후 15일째에 측정될 때, 예를 들어 포유동물 모델에서 화학요법제와 비교하여 더 큰 정도로 종양 부피를 감소시킬 수 있으며, 예를 들어 발현 리프레서는, 예를 들어 실시예 14에 기재된 바와 같은 모델 시스템에서, 6 mg/kg의 용량으로 5일마다 투여되는, 시스템.
254. 구현예 128 내지 193 또는 242 내지 253 중 어느 하나에 있어서, 상기 종양 부피는, 예를 들어 치료 시작 후 20일째에, PBS로 처리된 대조군과 비교하여 적어도 약 10%, 20%, 30%, 40%, 50%, 또는 60%만큼 감소되는, 시스템.
255. 구현예 254에 있어서, 상기 화학요법제는 소라페닙 또는 시스플라틴인, 시스템.
256. 구현예 128 내지 193 또는 242 내지 253 중 어느 하나에 있어서, 상기 시스템은 소분자 MYC 억제제와 비교하여 유사하거나 더 큰 정도로 종양 부피를 감소시킬 수 있는, 시스템.
257. 구현예 256에 있어서, 상기 소분자 MYC 억제제는 MYCi975이며, 선택적으로 종양 부피는, 예를 들어 치료 시작 후 20일째에, MYCi975로 처리된 대조군과 비교하여 적어도 약 10%, 20%, 30%, 또는 40%만큼 감소되는, 시스템.
258. 구현예 118 내지 257 중 어느 하나에 있어서, 치료 시작 시와 비교하여 체중의 감소를 유발하지 않거나, 3%, 2%, 또는 1% 미만의 체중 감소를 유발하는, 시스템.
259. 구현예 118 내지 258 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 TAL 이펙터 도메인, CRISPR/Cas 도메인, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제, 또는 올리고뉴클레오타이드로부터 선택되는, 시스템 또는 핵산.
260. 구현예 118 내지 260 어느 하나에 있어서, 상기 제2표적화 모이어티는 TAL 이펙터 도메인, CRISPR/Cas 도메인, 징크 핑거 도메인, tetR 도메인, 메가뉴클레아제, 또는 올리고뉴클레오타이드로부터 선택되는, 시스템 또는 핵산.
261. 구현예 118 내지 260 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 CRISPR/Cas 도메인(예를 들어, 제1 CRISPR/Cas 도메인)을 포함하는, 시스템 또는 핵산.
262. 구현예 118 내지 261중 어느 하나에 있어서, 상기 제2표적화 모이어티는 제2 CRISPR/Cas 도메인(예를 들어, 제2 CRISPR/Cas 도메인)을 포함하는, 시스템 또는 핵산.
263. 구현예 262에 있어서, i) 제1 CRISPR/Cas 도메인은 제1 가이드 RNA에 결합하거나, ii) 제2 CRISPR/Cas 도메인은 제2 가이드 RNA에 결합하거나, iii) (i) 및 (ii) 둘 다인, 시스템 또는 핵산.
264. 구현예 262 또는 263에 있어서, 상기 제1 CRISPR/Cas 도메인은 제2 가이드 RNA에 결합하지 않거나 적어도 10, 20, 50, 100, 1000, 또는 10,000 nM의 KD로 결합하고, 제2 CRISPR/Cas 도메인은 제1 가이드 RNA에 결합하지 않거나 적어도 10, 20, 50, 100, 1000, 또는 10,000 nM의 KD로 결합하는, 시스템 또는 핵산.
265. 구현예 260 내지 264 중 어느 하나에 있어서, 상기 제1 CRISPR/Cas 도메인은 제2 CRISPR/Cas 도메인과 상이한 아미노산 서열을 포함하는, 시스템 또는 핵산.
266. 구현예 260 내지 265 중 어느 하나에 있어서, 상기 제1 또는 제2 CRISPR/Cas 도메인은 표 1로부터 선택되는 Cas 단백질 또는 Cpf1 단백질 또는 이들 중 임의의 것의 변이체(예를 들어, 돌연변이체)의 아미노산 서열을 포함하는, 시스템 또는 핵산.
267. 구현예 260 내지 266 중 어느 하나에 있어서, 상기 제1 CRISPR/Cas 도메인은 표 1로부터 선택되는 Cas 단백질 또는 Cpf1 단백질 또는 이들 중 임의의 것의 변이체(예를 들어, 돌연변이체)의 아미노산 서열을 포함하고, 상기 제2 CRISPR/Cas 도메인은 표 1로부터 선택되는 상이한 Cas 단백질 또는 Cpf1 단백질 또는 이들 중 임의의 것의 변이체(예를 들어, 돌연변이체)의 아미노산 서열을 포함하는, 시스템 또는 핵산.
268. 구현예 118 내지 260 중 어느 하나에 있어서, 제1 표적화 모이어티는 징크 핑거 도메인(예를 들어, 제1 징크 핑거 도메인)을 포함하는, 시스템 또는 핵산.
269. 구현예 118 내지 260 또는 268 중 어느 하나에 있어서, 제2 표적화 모이어티는 징크 핑거 도메인(예를 들어, 제2 징크 핑거 도메인)을 포함하는, 시스템 또는 핵산.
270. 구현예 118 내지 261 또는 268 내지 269 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 제1 징크 핑거 도메인을 포함하고 제2 표적화 모이어티는 제2 징크 핑거 도메인을 포함하는, 시스템 또는 핵산.
271. 구현예 268 내지 270 중 어느 하나에 있어서, 상기 제1 징크 핑거 도메인 및 제2 징크 핑거 도메인은 동일한 게놈 유전자좌에 결합하고, 예를 들어 동일한 아미노산 서열을 갖는, 시스템 또는 핵산.
272. 구현예 268 내지 271 중 어느 하나에 있어서, 상기 제1 징크 핑거 도메인 및 제2 징크 핑거 도메인은 상이한 아미노산 서열을 갖거나 상이한 게놈 유전자좌에 결합하는, 시스템 또는 핵산.
273. 구현예 118 내지 261 또는 267 내지 272 중 어느 하나에 있어서, 상기 제1 징크 핑거 분자는 적어도 1, 2, 3, 4, 5, 7, 8, 9, 또는 10개의 징크 핑거(및 선택적으로 11, 10, 9, 8, 7, 6, 또는 5개 이하의 징크 핑거)를 포함하는, 시스템 또는 핵산.
274. 구현예 267 내지 273 중 어느 하나에 있어서, 상기 제1 징크 핑거 분자는 1 내지 10, 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 1 내지 2, 2 내지 10, 2 내지 9, 2 내지 8, 2 내지 7, 2 내지 6, 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 10, 3 내지 9, 3 내지 8, 3 내지 7, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 10, 4 내지 9, 4 내지 8, 4 내지 7, 4 내지 6, 4 내지 5, 5 내지 10, 5 내지 9, 5 내지 8, 5 내지 7, 5 내지 6, 6 내지 10, 6 내지 9, 6 내지 8, 6 내지 7, 7 내지 10, 7 내지 9, 7 내지 8, 8 내지 10, 8 내지 9, 또는 9 내지 10개의 징크 핑거를 포함하는, 시스템 또는 핵산.
275. 구현예 268 내지 274 중 어느 하나에 있어서, 상기 제1 징크 핑거 도메인은 3 또는 9개의 징크 핑거를 포함하는, 시스템 또는 핵산.
276. 구현예 268 내지 275 중 어느 하나에 있어서, 상기 제2 징크 핑거 도메인은 적어도 1, 2, 3, 4, 5, 7, 8, 9, 또는 10개의 징크 핑거(및 선택적으로 11, 10, 9, 8, 7, 6, 또는 5개 이하의 징크 핑거)를 포함하는, 시스템 또는 핵산.
277. 구현예 268 내지 276 중 어느 하나에 있어서, 상기 제2 징크 핑거 도메인은 1 내지 10, 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 1 내지 2, 2 내지 10, 2 내지 9, 2 내지 8, 2 내지 7, 2 내지 6, 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 10, 3 내지 9, 3 내지 8, 3 내지 7, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 10, 4 내지 9, 4 내지 8, 4 내지 7, 4 내지 6, 4 내지 5, 5 내지 10, 5 내지 9, 5 내지 8, 5 내지 7, 5 내지 6, 6 내지 10, 6 내지 9, 6 내지 8, 6 내지 7, 7 내지 10, 7 내지 9, 7 내지 8, 8 내지 10, 8 내지 9, 또는 9 내지 10개의 징크 핑거를 포함하는, 시스템 또는 핵산.
278. 구현예 268 내지 277 중 어느 하나에 있어서, 상기 제2 징크 핑거 도메인은 3 또는 9개의 징크 핑거를 포함하는, 시스템 또는 핵산.
279. 구현예 118 내지 278 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 TAL 이펙터 도메인(예를 들어, 제1 TAL 이펙터 도메인)을 포함하는, 시스템 또는 핵산.
280. 구현예 118 내지 260 또는 279 중 어느 하나에 있어서, 제2 표적화 모이어티는 TAL 이펙터 도메인(예를 들어, 제2 TAL 이펙터 도메인)을 포함하는, 시스템 또는 핵산.
281. 구현예 279 또는 280 중 어느 하나에 있어서, 상기 제1 TAL 이펙터 도메인은 적어도 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 40개의 중심 반복부(및 선택적으로, 45, 40, 35, 30, 25, 20, 15, 또는 10개 이하의 중심 반복부)를 포함하는, 시스템 또는 핵산.
282. 구현예 279 내지 281 중 어느 하나에 있어서, 상기 제1 TAL 이펙터 도메인은 2 내지 40, 5 내지 40, 10 내지 40, 15 내지 40, 20 내지 40, 25 내지 40, 30 내지 40, 35 내지 40, 2 내지 35, 5 내지 35, 10 내지 35, 15 내지 35, 20 내지 35, 25 내지 35, 30 내지 35, 2 내지 30, 5 내지 30, 10 내지 30, 15 내지 30, 20 내지 30, 25 내지 30, 2 내지 25, 5 내지 25, 10 내지 25, 15 내지 25, 20 내지 25, 2 내지 20, 5 내지 20, 10 내지 20, 15 내지 20, 2 내지 15, 5 내지 15, 10 내지 15, 2 내지 10, 5 내지 10, 또는 2 내지 5개의 중심 반복부를 포함하는, 시스템 또는 핵산.
283. 구현예 279 또는 282 중 어느 하나에 있어서, 상기 제2 TAL 이펙터 도메인은 적어도 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 또는 40개의 중심 반복부(및 선택적으로, 45, 40, 35, 30, 25, 20, 15, 또는 10개 이하의 중심 반복부)를 포함하는, 시스템 또는 핵산.
284. 구현예 279 내지 283 중 어느 하나에 있어서, 상기 제2 TAL 이펙터 도메인은 2 내지 40, 5 내지 40, 10 내지 40, 15 내지 40, 20 내지 40, 25 내지 40, 30 내지 40, 35 내지 40, 2 내지 35, 5 내지 35, 10 내지 35, 15 내지 35, 20 내지 35, 25 내지 35, 30 내지 35, 2 내지 30, 5 내지 30, 10 내지 30, 15 내지 30, 20 내지 30, 25 내지 30, 2 내지 25, 5 내지 25, 10 내지 25, 15 내지 25, 20 내지 25, 2 내지 20, 5 내지 20, 10 내지 20, 15 내지 20, 2 내지 15, 5 내지 15, 10 내지 15, 2 내지 10, 5 내지 10, 또는 2 내지 5개의 중심 반복부를 포함하는, 시스템 또는 핵산.
285. 구현예 118 내지 284 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 핵산(예를 들어, 제1 핵산)을 포함하는, 시스템 또는 핵산.
286. 구현예 129 내지 285 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 핵산(예를 들어, 제2 핵산)을 포함하는, 시스템 또는 핵산.
287. 구현예 129 내지 286 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 폴리펩타이드(예를 들어, 제1 폴리펩타이드)를 포함하는, 시스템 또는 핵산.
288. 구현예 129 내지 287 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 폴리펩타이드(예를 들어, 제2 폴리펩타이드)를 포함하는, 시스템 또는 핵산.
289. 구현예 287 또는 288에 있어서, 상기 핵산은 폴리펩타이드에 공유 부착된, 시스템.
290. 구현예 288 또는 289에 있어서, 상기 핵산은 폴리펩타이드와 비-공유 회합된, 시스템.
291. 구현예 275 내지 290 중 어느 하나에 있어서, 상기 핵산은 전사 조절 요소에 상보적인 서열 또는 이에 근접한 서열을 포함하거나, 전사 조절 요소 또는 이에 근접한 서열에 비해 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 불일치를 포함하는, 시스템 또는 핵산.
292. 구현예 275 내지 291 중 어느 하나에 있어서, 상기 핵산은 앵커 서열에 상보적인 서열 또는 이에 근접한 서열을 포함하거나, 앵커 서열 또는 이에 근접한 서열에 비해 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 불일치를 포함하는, 시스템 또는 핵산.
293. 구현예 275 내지 292 중 어느 하나에 있어서, 상기 핵산은 DNA, 펩타이드 핵산(PNA), 펩타이드-올리고뉴클레오타이드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체-형성 올리고뉴클레오타이드, 안티센스 올리고뉴클레오타이드, tRNA, mRNA, rRNA, miRNA, gRNA, siRNA, 또는 다른 RNAi 분자를 포함하는, 시스템.
294. 구현예 275 내지 293 중 어느 하나에 있어서, 상기 핵산은 gRNA를 포함하는, 시스템.
295. 구현예 275 내지 294 중 어느 하나에 있어서, 상기 핵산은 서열번호 1 내지 4 중 임의의 것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하거나, 이와 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 위치에서 상이한, 시스템.
296. 구현예 275 내지 295 중 어느 하나에 있어서, 상기 제1 핵산은 서열번호 1 내지 4 중 임의의 것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하거나 이와 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 위치에서 상이하고, 상기 제2 핵산은 서열번호 1 내지 4 중 임의의 것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하거나 이와 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 위치에서 상이한, 시스템.
297. 구현예 275 내지 295 중 어느 하나에 있어서, 상기 제1 핵산은 서열번호 96 내지 110 중 임의의 것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하거나 이와 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 위치에서 상이하고, 상기 제2 핵산은 서열번호 96 내지 110 중 임의의 것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함하거나 이와 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개 이하의 위치에서 상이한, 시스템.
298. 구현예 118 내지 297 중 어느 하나에 있어서, 상기 전사 조절 요소는 프로모터를 포함하는, 시스템.
299. 구현예 118 내지 298 중 어느 하나에 있어서, 상기 전사 조절 요소는 인핸서, 예를 들어 슈퍼 인핸서를 포함하는, 시스템.
300. 구현예 118 내지 299 중 어느 하나에 있어서, 상기 앵커 서열은 CTCF 결합 모티프를 포함하는, 시스템.
301. 구현예 118 내지 300 중 어느 하나에 있어서, 상기 앵커 서열은 YY1 결합 모티프를 포함하는, 시스템.
302. 구현예 118 내지 301 중 어느 하나에 있어서, 상기 앵커 서열은 서열번호 71 또는 72의 서열, 또는 이에 대해 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 변경을 갖는 서열을 포함하는, 시스템.
303. 구현예 118 내지 302 중 어느 하나에 있어서, 상기 앵커 서열은 서열번호 73 또는 74에 따른 서열, 또는 이에 대해 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 변경을 갖는 서열을 포함하는, 시스템.
304. 구현예 118 내지 303 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자와 동일한 염색체 상에 있는, 시스템.
305. 구현예 118 내지 303 중 어느 하나에 있어서, 상기 앵커 서열은 MYC의 상류(예를 들어, TSS의 상류 또는 프로모터의 상류)에 있는, 시스템.
306. 구현예 118 내지 305 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자로부터(예를 들어, MYC 유전자의 TSS 또는 프로모터로부터) 적어도 1, 5, 10, 50, 100, 또는 1000 킬로베이스 떨어져 있는, 시스템.
307. 구현예 118 내지 306 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자로부터(예를 들어, TSS 또는 MYC 유전자의 프로모터로부터) 0.1 내지 0.5, 0.1 내지 1, 0.1 내지 5, 0.1 내지 10, 0.1 내지 50, 0.1 내지 100, 0.1 내지 500, 0.1 내지 1000, 0.5 내지 1, 0.5 내지 5, 0.5 내지 10, 0.5 내지 50, 0.5 내지 100, 0.5 내지 500, 0.5 내지 1000, 1 내지 5, 1 내지 10, 1 내지 50, 1 내지 100, 1 내지 500, 1 내지 1000, 5 내지 10, 5 내지 50, 5 내지 100, 5 내지 500, 5 내지 1000, 10 내지 50, 10 내지 100, 10 내지 500, 10 내지 1000, 50 내지 100, 50 내지 500, 50 내지 1000, 100 내지 500, 100 내지 1000, 또는 500 내지 1000 킬로베이스 떨어져 있는, 시스템.
308. 구현예 118 내지 303 또는 305 내지 307 중 어느 하나에 있어서, 상기 앵커 서열은 MYC 유전자와 상이한 염색체 상에 있는, 시스템.
309. 구현예 118 내지 308 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 결합에 대해 내인성 폴리펩타이드(예를 들어, CTCF 또는 YY1)와 경쟁하기에 충분한 친화도로 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는, 시스템.
310. 구현예 118 내지 309 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 염색체 좌표 128746342-128746364, 128746321-128746343, 또는 128746525-128746547에서의 서열, 또는 이에 근접한 서열에 결합하는, 시스템.
311. 구현예 118 내지 309 중 어느 하나에 있어서, 상기 제1 표적화 모이어티는 염색체 좌표 128746405-128746425, 128748069-128748089, 129188825-129188845, 또는 129188822-129188842에서의 서열, 또는 이에 근접한 서열에 결합하는, 시스템.
312. 구현예 118 내지 311 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 염색체 좌표 128748014-128748036에서의 서열, 또는 이에 근접한 서열에 결합하는, 시스템.
313. 구현예 118 내지 311 중 어느 하나에 있어서, 상기 제2 표적화 모이어티는 염색체 좌표 128746405-128746425, 128748069-128748089, 129188825-129188845, 또는 129188822-129188842에서의 서열, 또는 이에 근접한 서열에 결합하는, 시스템.
314. 구현예 118 내지 314 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 융합 분자인, 시스템.
315. 구현예 118 내지 314 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 융합 분자인, 시스템.
316. 구현예 118 내지 315 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 링커를 포함하는, 시스템.
317. 구현예 118 내지 316 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 링커를 포함하는, 시스템.
318. 구현예 118 내지 267 또는 285 내지 317 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 제1 CRISPR/Cas 분자를 포함하는, 예를 들어 제1 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티, 및 후성유전학적 변형 모이어티를 포함하는 이펙터 모이어티를 포함하고;
상기 제2 발현 리프레서는 제2 CRISPR/Cas 분자를 포함하는, 예를 들어 제2 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티, 및 선택적으로 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 시스템.
319. 구현예 118 내지 260, 268 내지 278, 또는 285 내지 317 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 제1 징크 핑거 도메인을 포함하는 표적화 모이어티, 및 후성유전학적 변형 모이어티를 포함하는 이펙터 모이어티를 포함하고,
상기 제2 발현 리프레서는 제2 징크 핑거 도메인을 포함하는 표적화 모이어티, 및 선택적으로 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 시스템.
320. 구현예 118 내지 120, 262, 268, 또는 275 내지 318 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 CRISPR/Cas 분자를 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티, 및 후성유전학적 변형 모이어티를 포함하는 이펙터 모이어티를 포함하고;
상기 제2 발현 리프레서는 징크 핑거 도메인을 포함하는 표적화 모이어티, 및 선택적으로 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 시스템.
321. 구현예 118 내지 260, 268, 또는 275 내지 318 중 어느 하나에 있어서,
상기 제1 발현 리프레서는 징크 핑거 도메인을 포함하는 표적화 모이어티, 및 후성유전학적 변형 모이어티를 포함하는 이펙터 모이어티를 포함하고;
상기 제2 발현 리프레서는 CRISPR/Cas 도메인을 포함하는, 예를 들어 촉매적으로 비활성인 CRISPR/Cas 단백질을 포함하는 표적화 모이어티, 및 선택적으로 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 시스템.
322. 구현예 260, 268 내지 278, 또는 275 내지 318 중 어느 하나에 있어서, 상기 징크 핑거 도메인(예를 들어, 제1 또는 제2 징크 핑거 도메인)은 1 내지 10, 1 내지 9, 1 내지 8, 1 내지 7, 1 내지 6, 1 내지 5, 1 내지 4, 1 내지 3, 1 내지 2, 2 내지 10, 2 내지 9, 2 내지 8, 2 내지 7, 2 내지 6, 2 내지 5, 2 내지 4, 2 내지 3, 3 내지 10, 3 내지 9, 3 내지 8, 3 내지 7, 3 내지 6, 3 내지 5, 3 내지 4, 4 내지 10, 4 내지 9, 4 내지 8, 4 내지 7, 4 내지 6, 4 내지 5, 5 내지 10, 5 내지 9, 5 내지 8, 5 내지 7, 5 내지 6, 6 내지 10, 6 내지 9, 6 내지 8, 6 내지 7, 7 내지 10, 7 내지 9, 7 내지 8, 8 내지 10, 8 내지 9, 또는 9 내지 10개의 징크 핑거, 예를 들어 3 또는 9개의 징크 핑거를 포함하는, 시스템.
323. 구현예 322에 있어서, 상기 후성유전학적 변형 모이어티는 DNA 메틸트랜스퍼라제를 포함하는, 시스템.
324. 구현예 118 내지 323 중 어느 하나에 있어서, 상기 후성유전학적 변형 모이어티는 MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는, 시스템.
325. 구현예 118 내지 324 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 전사 리프레서를 포함하는 이펙터 모이어티를 포함하는, 시스템.
326. 구현예 118 내지 323 중 어느 하나에 있어서, 상기 전사 리프레서는 KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는, 시스템.
327. 구현예 118 내지 326 중 어느 하나에 있어서, 상기 제1 발현 리프레서는 서열번호 28 내지 33 또는 35 내지 37, 145 내지 149, 151, 152 중 임의의 것의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템.
328. 구현예 118 내지 327 중 어느 하나에 있어서, 상기 제2 발현 리프레서는 서열번호 22 내지 27, 34, 139 내지 144, 150, 177 내지 180, 183 내지 186 중 임의의 것의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템.
329. 구현예 118 내지 328 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합은 세포에서 MYC의 발현을 감소시키는, 시스템.
330. 구현예 327에 있어서, 발현은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 제1 발현 리프레서의 부재 시 발현과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
331. 구현예 326 또는 327에 있어서, 상기 전사 조절 요소에 대한 제1 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 시스템.
332. 구현예 329 내지 331 중 어느 하나에 있어서, 상기 전사 조절 요소에 대한 제1 발현 리프레서의 결합은 형질감염 후 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 80, 또는 96 시간 후에 MYC의 발현을 상당히 감소시키는, 시스템.
333. 구현예 328 내지 332 중 어느 하나에 있어서, 상기 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 세포에서 MYC의 발현을 감소시키는, 시스템.
334. 구현예 333에 있어서, 발현은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 제2 발현 리프레서의 부재 시 발현과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
335. 구현예 333 또는 334에 있어서, 상기 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 시스템.
336. 구현예 334 내지 335 중 어느 하나에 있어서, 상기 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 형질감염 후 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 80, 또는 96시간 후에 MYC의 발현을 상당히 감소시키는, 시스템.
337. 구현예 329 내지 336 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서는 세포에서 MYC의 발현을 감소시키는, 시스템.
338. 구현예 392 내지 337 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 형질감염 후 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 80, 또는 96시간 후에 MYC의 발현을 상당히 감소시키는, 시스템.
339. 구현예 337 또는 338에 있어서, 발현은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 제1 및 제2 발현 리프레서의 부재 시 발현과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
340. 구현예 329 내지 339 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 시스템.
341. 구현예 329 내지 340 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소는 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소보다 더 큰, 시스템.
342. 구현예 341에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 발현을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 크게 감소시키는, 시스템.
343. 구현예 329 내지 342 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소는 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소보다 더 오랜 시간(예를 들어, 더 많은 시간, 일, 또는 세포 분열) 동안 지속되는, 시스템.
344. 구현예 343에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 (예를 들어, 시간, 일, 또는 세포 분열로 측정 시) 발현을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 오래 감소시키는, 시스템.
345. 구현예 329 내지 344 중 어느 하나에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 시스템.
346. 구현예 329 내지 345 중 어느 하나에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소는 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소보다 더 큰, 시스템.
347. 구현예 346에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 발현을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 크게 감소시키는, 시스템.
348. 구현예 329 내지 347 중 어느 하나에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소는 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 발현 감소보다 더 오랜 시간(예를 들어, 더 많은 시간, 일, 또는 세포 분열) 동안 지속되는, 시스템.
349. 구현예 348에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 QPCR 또는 ELISA에 의해 측정 시, 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 발현을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 오랜 시간(예를 들어, 더 많은 시간, 일, 또는 세포 분열) 동안 지속되는, 시스템.
350. 구현예 329 내지 349 중 어느 하나에 있어서, 발현은 (예를 들어, 실험적으로 측정될 수 있는 것보다 더 긴 기간 동안) 무기한으로 상당히 감소되는, 시스템.
351. 구현예 329 내지 350 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합은 전사 조절 요소 또는 이에 근접한 서열을 포함하는 서열의 생존능을 감소시키는, 시스템.
352. 구현예 329 내지 351 중 어느 하나에 있어서, 복수의 세포를 제1 발현 리프레서 또는 제1 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것은 복수의 세포의 생존능을 감소시키며, 선택적으로 복수의 세포는 암성 및 비-암성 세포 및/또는 감염 세포 및 비감염 세포를 포함하는, 시스템.
353. 구현예 352에 있어서, 생존능은, 예를 들어 CellTiter Glo에 의해 측정 시, 제1 발현 리프레서의 부재 시 생존능과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
354. 구현예 329 내지 353 중 어느 하나에 있어서, 상기 제1 발현 리프레서의 투여는 적어도 5%, 6%, 7%, 8%, 9% 10%, 12%, 15%, 17%, 20%, 25% 30%, 40%, 45%, 50%, 55%, 60%, 65%, 75%의 표적 세포(예를 들어, 암 세포)의 아폽토시스를 초래하는, 발현 리프레서.
355. 구현예 329 내지 354 중 어느 하나에 있어서, 상기 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 앵커 서열 또는 이에 근접한 서열을 포함하는 서열의 생존능을 감소시키는, 시스템.
356. 구현예 329 내지 355 중 어느 하나에 있어서, 복수의 세포를 제2 발현 리프레서 또는 제2 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것은 복수의 세포의 생존능을 감소시키는, 시스템.
357. 구현예 329 내지 356 중 어느 하나에 있어서, 상기 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 전사 조절 요소 또는 이에 근접한 서열을 포함하는 서열의 생존능을 감소시키는, 시스템.
358. 구현예 329 내지 357 중 어느 하나에 있어서, 복수의 세포를 제2 발현 리프레서 또는 제1 발현 리프레서를 인코딩하는 핵산을 접촉시키는 것은 복수의 세포의 생존능을 감소시키며, 선택적으로 복수의 세포는 암성 및 비-암성 세포 및/또는 감염 세포 및 비감염 세포를 포함하는, 시스템.
359. 구현예 358에 있어서, 생존능은, 예를 들어 CellTiter Glo에 의해 측정 시, 제2 발현 리프레서의 부재 시 생존능과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
360. 구현예 329 내지 359 중 어느 하나에 있어서, 상기 제2 발현 리프레서의 투여는 적어도 5%, 6%, 7%, 8%, 9% 10%, 12%, 15%, 17%, 20%, 25% 30%, 40%, 45%, 50%, 55%, 60%, 65%, 75%의 표적 세포(예를 들어, 암 세포)의 아폽토시스를 초래하는, 발현 리프레서.
361. 구현예 329 내지 360 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 앵커 서열 또는 이에 근접한 서열을 포함하는 서열의 생존능을 감소시키는, 시스템.
362. 구현예 329 내지 361 중 어느 하나에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은 세포의 생존능을 감소시키는, 시스템.
363. 구현예 329 내지 362 중 어느 하나에 있어서, 복수의 세포를 시스템 또는 시스템을 인코딩하는 핵산과 접촉시키는 것은 복수의 세포의 생존능을 감소시키는, 시스템.
364. 구현예 329 내지 363에 있어서, 생존능은, 예를 들어 CellTiter Glo에 의해 측정 시, 시스템의 부재 시 생존능과 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 감소되는, 시스템.
365. 구현예 329 내지 364 중 어느 하나에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 생존능 감소는 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 생존능 감소보다 더 큰, 시스템.
366. 구현예 329 내지 365 중 어느 하나에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 생존능 감소는 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합으로 인한 생존능 감소보다 더 큰, 시스템.
367. 구현예 366에 있어서, 상기 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 CellTiter Glo에 의해 측정 시, 개별적으로 전사 조절 요소 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 앵커 서열 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 크게 감소시키는, 시스템.
368. 구현예 366 또는 367에 있어서, 상기 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서 및 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합은, 예를 들어 CellTiter Glo에 의해 측정 시, 개별적으로 프로모터 또는 이에 근접한 서열에 대한 제1 발현 리프레서의 결합 또는 슈퍼-인핸서 또는 이에 근접한 서열에 대한 제2 발현 리프레서의 결합보다 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 크게 감소시키는, 시스템.
369. 구현예 329 내지 368 중 어느 하나에 있어서, 상기 제1 발현 리프레서 및 제2 발현 리프레서의 투여는 적어도 5%, 6%, 7%, 8%, 9% 10%, 12%, 15%, 17%, 20%, 25% 30%, 40%, 45%, 50%, 55%, 60%, 65%, 75%의 표적 세포(예를 들어, 암 세포)의 아폽토시스를 초래하는, 발현 리프레서.
370. 구현예 329 내지 369에 있어서, 상기 복수의 세포는 복수의 암 세포 및 복수의 비-암 세포를 포함하는, 시스템.
371. 구현예 370에 있어서, 상기 복수의 세포를 시스템 또는 시스템을 인코딩하는 핵산과 접촉시키는 것은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 더 많이 감소시키는, 시스템.
372. 구현예 370 또는 371에 있어서, 상기 복수의 세포를 시스템 또는 시스템을 인코딩하는 핵산과 접촉시키는 것은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 많이 감소시키는, 발현 리프레서.
373. 임의의 선행하는 구현예에 있어서, 예를 들어 실시예 29에 따라 분석될 때, 비-암 세포(예를 들어, 1차 간세포)의 생존능을 5, 10, 15, 또는 20% 초과만큼 감소시키지 않는, 발현 리프레서 또는 시스템.
374. 구현예 320에 있어서, 생존능은 세포를 발현 리프레서 또는 시스템과 접촉시킨 후 72시간 후에 분석되는, 발현 리프레서 또는 시스템.
375. 구현예 374에 있어서, 상기 분석은 비-암 세포를 2.5, 2, 1.25, 1, 0.6, 또는 0.5 ug/ml의 발현 리프레서 또는 시스템과 접촉시키는 것을 포함하는, 발현 리프레서 또는 시스템.
376. 구현예 352 내지 375 중 어느 하나에 있어서, 복수의 감염 세포 및 복수의 비감염 세포와 접촉될 때, 복수의 비감염 세포의 생존능을 감소시키는 것보다 복수의 감염 세포의 생존능을 더 많이 감소시키고/시키거나 복수의 비-암성 세포의 생존능을 감소시키는 것보다 복수의 암성 세포의 생존능을 더 많이 감소시키는, 시스템.
377. 구현예 352 내지 376 중 어느 하나에 있어서, 상기 암은 간세포 암종(HCC), 섬유층판 간세포 암종(FHCC), 담관암종, 혈관육종, 2차 간암, 비소세포 폐암(NSCLC), 선암종, 소세포 폐암(SCLC), 대세포 (미분화) 암종, 삼중 음성 유방암, 위 선암종, 자궁내막 암종, 또는 췌 암종인, 시스템.
378. 구현예 352 내지 377 중 어느 하나에 있어서, 상기 암 세포는 폐암 세포, 위암 세포, 위장관암 세포, 결장직장암 세포, 췌장암 세포, 또는 간암 세포인, 시스템.
379. 구현예 352 내지 378 중 어느 하나에 있어서, 상기 세포는 인간 폐 상피 세포 또는 인간 폐 섬유아세포 세포인, 시스템.
380. 구현예 352 내지 379 중 어느 하나에 있어서, 상기 감염은 바이러스성인, 시스템.
381. 구현예 380에 있어서, 상기 바이러스 감염은 간염, 예를 들어 B형 간염인, 발현 리프레서.
382. 구현예 378 내지 381 중 어느 하나에 있어서, 상기 감염 세포는 인간 간세포인, 시스템.
383. 구현예 352 내지 382 중 어느 하나에 있어서, 상기 바이러스 감염은 만성 감염인, 시스템.
384. 융합 단백질로서,
구현예 118 내지 383 중 어느 하나의 시스템의 제1 발현 리프레서를 인코딩하는 서열을 포함하는 제1 아미노산 영역; 및
구현예 118 내지 383 중 어느 하나의 시스템의 제2 발현 리프레서를 인코딩하는 서열을 포함하는 제2 아미노산 영역
을 포함하는, 융합 단백질.
385. 구현예 384에 있어서, 제3 아미노산 영역을 포함하며, 상기 제3 아미노산 영역은 제1 아미노산 영역과 제2 아미노산 영역 사이에 위치하는, 융합 단백질.
386. 구현예 385에 있어서, 상기 제3 아미노산 영역은 프로테아제 절단 펩타이드 서열, 예를 들어 자가-절단 펩타이드 서열, 예를 들어 T2A 자가-절단 펩타이드 서열, 예를 들어 서열번호 120에 따른 서열을 포함하는, 융합 단백질.
387. 구현예 386에 있어서, 상기 제3 아미노산 영역은 프로테아제 절단 펩타이드 서열, 예를 들어 자가-절단 펩타이드 서열, 예를 들어 탠덤(tandem) 2A 펩타이드 서열, 예를 들어 tPT2A 서열, 예를 들어 서열번호 124에 따른 서열을 포함하는, 융합 단백질.
388. 구현예 385에 있어서, 상기 펩타이드 서열은 T2A 펩타이드 서열 및 P2A 펩타이드 서열을 포함하는, 융합 단백질.
389. 구현예 384 내지 388 중 어느 하나에 있어서,
제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하고,
제2 발현 리프레서는 서열번호 24 또는 142에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하는, 융합 단백질.
390. 구현예 384 내지 388 중 어느 하나에 있어서,
제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하고,
제2 발현 리프레서는 서열번호 177 또는 183에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하는, 융합 단백질.
391. 구현예 384 내지 388 중 어느 하나에 있어서,
제1 발현 리프레서는 서열번호 30 또는 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하고,
2 발현 리프레서는 서열번호 179 또는 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하는, 융합 단백질.
392. 구현예 384 내지 391 중 어느 하나에 있어서, 서열번호 91, 92, 121, 또는 122의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 융합 단백질.
393. 구현예 384 내지 392 중 어느 하나에 있어서, 서열번호 181, 182, 187, 또는 188의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 융합 단백질.
394. 구현예 118 내지 393 중 어느 하나의 시스템을 인코딩하는 서열을 포함하는 핵산.
395. 구현예 394의 시스템을 인코딩하는 서열을 포함하는 핵산.
396. 구현예 394 또는 395의 핵산으로서,
구현예 118 내지 393 중 어느 하나의 시스템의 제1 발현 리프레서를 인코딩하는 서열을 포함하는 제1 영역; 및
구현예 118 내지 393 중 어느 하나의 시스템의 제2 발현 리프레서를 인코딩하는 서열을 포함하는 제2 영역
을 포함하는, 핵산.
397. 구현예 394 내지 396 중 어느 하나에 있어서, 제3 영역을 포함하며, 제3 영역은 제1 영역과 제2 영역 사이에 위치하는, 핵산.
398. 구현예 394 내지 397 중 어느 하나에 있어서, 제3 영역은 리보솜-스킵핑(ribosome-skipping) 서열을 인코딩하는, 핵산.
399. 구현예 397 또는 398에 있어서, 상기 제3 영역은 tPT2A 펩타이드 서열, 예를 들어 서열번호 124에 따른 서열을 인코딩하는, 핵산.
400. 구현예 397 내지 399 중 어느 하나에 있어서, 상기 제3 영역은 프로테아제 절단 펩타이드 서열, 예를 들어 자가-절단 펩타이드 서열, 예를 들어 T2A 자가-절단 펩타이드 서열, 예를 들어 서열번호 95에 따른 서열을 인코딩하는, 핵산.
401. 구현예 397 내지 400 중 어느 하나에 있어서, 상기 제3 영역은 프로테아제 절단 펩타이드 서열, 예를 들어 자가-절단 펩타이드 서열, 예를 들어 탠덤 2A 펩타이드 서열, 예를 들어 tPT2A 펩타이드 서열, 예를 들어 서열번호 124에 따른 서열을 인코딩하는, 핵산.
402. 구현예 394 내지 401 중 어느 하나에 있어서,
제1 발현 리프레서는 서열번호 30, 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하고;
제2 발현 리프레서는 서열번호 24, 142에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하는, 핵산.
403. 구현예 394 내지 401 중 어느 하나에 있어서,
제1 발현 리프레서는 서열번호 30, 129에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하고;
제2 발현 리프레서는 서열번호 177, 179, 183, 또는 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열을 포함하는, 핵산.
404. 구현예 394 내지 403 중 어느 하나에 있어서, 서열번호 91, 92, 121, 122의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 인코딩하는, 핵산.
405. 구현예 394 내지 404 중 어느 하나에 있어서, 서열번호 181, 182, 187, 188의 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 인코딩하는, 핵산.
406. 구현예 394 내지 405 중 어느 하나에 있어서, 서열번호 93, 94, 112, 또는 113의 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
407. 구현예 394 내지 406 중 어느 하나에 있어서, 서열번호 196, 197의 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
408. 구현예 1 내지 407 중 어느 하나의 발현 리프레서 또는 발현 리프레서 시스템을 인코딩하는 서열을 포함하는 핵산.
409. 구현예 394 내지 408 중 어느 하나에 있어서, RNA, 예를 들어 mRNA인, 핵산.
410. 구현예 394 내지 409 중 어느 하나에 있어서, 예를 들어 역 5' 대 5' 트리포스페이트 연결을 통해, RNA의 5' 말단에 연결되는, N7-메틸화 구아노신을 포함하는, 핵산.
411. 구현예 394 내지 410 중 어느 하나에 있어서, 5' UTR을 포함하는, 핵산.
412. 구현예 394 내지 411 중 어느 하나에 있어서, 예를 들어 5' UTR과 발현 리프레서를 인코딩하는 서열 사이에, 코작(Kozak) 서열을 포함하는, 핵산.
413. 시스템으로서,
구현예 118 내지 393 중 어느 하나의 시스템의 제1 발현 리프레서를 인코딩하는 서열을 포함하는 제1 핵산; 및
제2 발현 리프레서, 예를 들어 구현예 118 내지 393 중 어느 하나의 시스템의 제2 발현 리프레서를 인코딩하는 서열을 포함하는 제2 핵산
을 포함하는, 시스템.
414. 구현예 413에 있어서, 상기 제1 핵산은 서열번호 63, 130의 제1 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖고, 제2 핵산은 서열번호 57의 제2 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 시스템.
415. 구현예 414에 있어서, 상기 제1 핵산은 서열번호 63, 130의 제1 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖고, 제2 핵산은 서열번호 189, 또는 194의 제2 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 시스템.
416. 구현예 415에 있어서, 상기 제1 핵산은 서열번호 189, 194의 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖고, 제2 핵산은 서열번호 63, 130의 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 시스템.
417. 구현예 394 내지 416 중 어느 하나에 있어서, 상기 핵산은 mRNA를 포함하는, 핵산 또는 시스템.
418. 선행하는 구현예 중 어느 하나의 시스템, 또는 발현 리프레서를 인코딩하는 핵산을 포함하는 벡터.
419. 선행하는 구현예 중 어느 하나의 시스템, 핵산, mRNA, 또는 벡터를 포함하는 지질 나노입자.
420. 구현예 419에 있어서, 이온화 가능한 지질, 예를 들어 양이온성 지질, 예를 들어 MC3, SSOP를 포함하는, 지질 나노입자.
421. 구현예 419 또는 420에 있어서, 중성 지질, 이온화 가능한 아민-함유 지질, 생분해성 알킨 지질, 스테로이드, 인지질, 다가불포화 지질, 구조 지질(예를 들어, 스테롤), PEG, 콜레스테롤, 또는 중합체 접합된 지질 중 하나 이상을 추가로 포함하는, 지질 나노입자.
422. 선행하는 구현예 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 또는 지질 나노입자를 포함하는 반응 혼합물.
423. 구현예 422에 있어서, 세포를 추가로 포함하는, 반응 혼합물.
424. 임의의 선행하는 구현예의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자 또는 반응 혼합물을 포함하는 약제학적 조성물.
425. 세포에서 MYC 유전자의 발현을 감소시키는 방법으로서, 상기 방법은
세포(예를 들어, 암 세포)를 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 상기 시스템 또는 발현 리프레서를 인코딩하는 하나 이상의 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물과 접촉시키는 단계
를 포함하여,
이에 의해 세포에서 MYC 유전자의 발현을 감소시키는, 방법.
426. 필요로 하는 대상체에서 암을 치료하는 방법으로서, 상기 방법은
구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물을 대상체에게 투여하는 단계
를 포함하며,
이에 의해 대상체에서 암을 치료하는, 방법.
427. 필요로 하는 대상체에서 종양 성장을 감소시키는 방법으로서, 상기 방법은
구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물을 대상체에게 투여하는 단계
를 포함하며,
이에 의해 대상체에서 종양 크기를 감소시키는, 방법.
428. 구현예 427에서, 상기 종양 성장의 감소는 치료 시작 시 종양 부피와 비교하여 종양 부피의 감소를 포함하는, 방법.
429. 구현예 428에 있어서, 상기 대상체에서 종양 성장의 감소는 비치료 대상체와 비교하여 더 큰, 방법.
430. 키나제 억제제, 예를 들어 소라페님에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 본 명세서에 기재된 발현 리프레서 또는 시스템을 암을 앓는 대상체에게 투여하는 단계를 포함하는, 방법.
431. 구현예 430에 있어서, 상기 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석, 예를 들어 실시예 38에 따른 분석에서 키나제 억제제의 IC50을 10%, 20%, 30%, 또는 40%만큼 낮추는, 방법.
432. 구현예 430 또는 431에 있어서, 상기 키나제 억제제는 VEGFR, PDGFR, RAF 키나제 중 하나 이상(예를 들어, 이의 전부)을 억제하는, 방법.
433. 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 본 명세서에 기재된(예를 들어, 구현예 1 내지 423 중 어느 하나의) 발현 리프레서, 시스템, 또는 핵산을 암을 앓는 대상체에게 투여하는 단계를 포함하며, 선택적으로 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석, 예를 들어 실시예 39에 따른 분석에서 브로모도메인 억제제의 IC50를 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%만큼 낮추는, 방법.
434. 구현예 433에 있어서, 상기 브로모도메인 억제제는 JQ1, BET672, 또는 비라브레십이거나 이를 포함하는, 방법.
435. MEK 억제제, 예를 들어 트라베티닙에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 본 명세서에 기재된(예를 들어, 구현예 1 내지 423 중 어느 하나의) 발현 리프레서, 시스템, 또는 핵산을 암을 앓는 대상체에게 투여하는 단계를 포함하며, 선택적으로 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석, 예를 들어 실시예 51에 따른 분석에서 MEK 억제제의 IC50를 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%만큼 낮추는, 방법.
436. 구현예 427 내지 435 중 어느 하나에 있어서, 상기 대상체에서 종양 성장의 감소는 대상체가 화학요법제 또는 소분자 MYC 억제제로 치료될 때 종양 크기 감소보다 크거나 이와 유사한, 방법.
437. 구현예 436에 있어서, 상기 화학요법제는 소라페닙 또는 시스플라틴인, 방법.
438. 구현예 437에 있어서, 상기 소분자 MYC 억제제는 MYCi975인, 방법.
439. 필요로 하는 대상체에서 종양 크기를 감소시키는 방법으로서, 상기 방법은
1 내지 424의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물을 대상체에게 투여하는 단계를 포함하며, 종양 크기의 감소는 대상체가 화학요법제로 치료될 때 종양 크기 감소보다 크거나 이와 유사한, 방법.
440. 구현예 439에 있어서, 상기 화학요법제는 소라페닙 또는 시스플라틴인, 방법.
441. 선행하는 구현예 중 어느 하나에 있어서, 상기 대상체는 화학요법제 또는 소분자 MYC 억제제로 치료될 때와 비교하여 임의의 유의한 부작용을 경함하지 않는, 방법.
442. 구현예 436 내지 441 중 어느 하나에 있어서, 상기 화학요법제는 소라페닙 또는 시스플라틴인, 방법.
443. 구현예 442에 있어서, 상기 소분자 MYC 억제제는 MYCi975인, 방법.
444. 구현예 426 내지 443 중 어느 하나에 있어서, 상기 암은 I기, II기, III기, 또는 IV기 암인, 방법.
445. 선행하는 구현예 중 어느 하나에 있어서, 상기 대상체의 체중은 치료 전 및 치료 후 거의 동일하게 유지되는, 방법.
446. 선행하는 구현예 중 어느 하나에 있어서, 상기 대상체는 체중의 감소를 경험하지 않거나, 대상체는 치료 시작 시와 비교하여 3%, 2%, 또는 1% 미만의 체중 감소를 경험하는, 방법.
447. 선행하는 구현예 중 어느 하나에 있어서, 상기 대상체는 대상체의 치료 전 체중과 비교하여 치료 후 체중의 감소 또는 증가를 경험하지 않는, 방법.
448. 필요로 하는 대상체에서 간 질환을 치료하는 방법으로서, 상기 방법은
발현 리프레서를 대상체에게 투여하되, 발현 리프레서는 MYC 유전자좌(예를 들어, MYC의 전사된 영역, MYC 프로모터, 또는 MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열)에 결합하는 표적화 모이어티, 및 선택적으로 이펙터 모이어티, 예를 들어 본 명세서에 기재된 이펙터 모이어티를 포함하는 단계
를 포함하며;
이에 의해 대상체에서 간 질환을 치료하는, 방법.
449. 구현예 447에 있어서, 대상체에게 제2 발현 리프레서를 투여하되, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열에 결합하는 표적화 모이어티, 및 선택적으로 제2 이펙터 모이어티, 예를 들어 본 명세서에 기재된 이펙터 모이어티; 예를 들어 KRAB를 포함하는 단계를 추가로 포함하며,
이에 의해 대상체에서 간 질환을 치료하는, 방법.
450. 필요로 하는 대상체에서 간 질환을 치료하는 방법으로서, 상기 방법은
구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물을 대상체에게 투여하는 단계
를 포함하며,
이에 의해 대상체에서 간 질환을 치료하는, 방법.
451. 구현예 450에 있어서, 상기 간 질환은 만성 간 질환인, 방법.
452. 구현예 450 또는 451에 있어서, 상기 간 질환은 바이러스성 또는 알코올 관련인, 방법.
453. 구현예 450 내지 452 중 어느 하나에 있어서, 상기 간 질환은 간염 또는 간세포 암종인, 방법.
454. 구현예 453에 있어서, 상기 간세포 암종은 HCC 하위유형 S1, HCC 하위유형 S2, 또는 HCC 하위유형 S3으로부터 선택되는, 방법.
455. 구현예 453 또는 454에 있어서, 상기 간세포 암종은 HCC S1인, 방법.
456. 구현예 453 또는 454에 있어서, 상기 간세포 암종은 HCC S2인, 방법.
457. 구현예 450 내지 456 중 어느 하나에 있어서, 상기 간 질환은 B형 간염 바이러스 또는 C형 간염 바이러스에 의해 유발되는, 방법.
458. 필요로 하는 대상체에서 폐 질환을 치료하는 방법으로서, 상기 방법은
발현 리프레서를 대상체에게 투여하되, 발현 리프레서는 MYC 유전자좌(예를 들어, MYC의 전사된 영역, MYC 프로모터, 또는 MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열)에 결합하는 표적화 모이어티, 및 선택적으로 이펙터 모이어티, 예를 들어 본 명세서에 기재된 이펙터 모이어티를 포함하는 단계
를 포함하며;
이에 의해 대상체에서 폐 질환을 치료하는, 방법.
459. 구현예 458에 있어서, 대상체에게 제2 발현 리프레서를 투여하되, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 앵커 영역에 위치하는 게놈 유전자좌에 결합하는 표적화 모이어티, 및 선택적으로 제2 이펙터 모이어티, 예를 들어 본 명세서에 기재된 이펙터 모이어티; 예를 들어 KRAB를 포함하는 단계를 추가로 포함하며;
이에 의해 대상체에서 폐 질환을 치료하는, 방법.
460. 필요로 하는 대상체에서 폐 질환을 치료하는 방법으로서, 상기 방법은
구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물을 대상체에게 투여하는 단계
를 포함하며,
이에 의해 대상체에서 폐 질환을 치료하는, 방법.
461. 구현예 459 또는 460에 있어서, 상기 폐 질환은 암, 예를 들어 폐암, 예를 들어 폐 암종, 예를 들어 비소세포 폐 암종 또는 소세포 폐 암종인, 방법.
462. 구현예 425 또는 461 중 어느 하나에 있어서, 접촉 또는 투여는 대상체에의 정맥내 투여를 포함하는, 방법.
463. 구현예 425 내지 462 중 어느 하나에 있어서, 접촉 또는 투여는 종양내 전달(예를 들어, 주사)을 포함하는, 방법.
464. 구현예 425 내지 463 중 어느 하나에 있어서, 상기 암은 참조 수준에 비해(예를 들어, 참조 세포의 MYC 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 증가된 MYC 발현을 특징으로 하는, 방법.
465. 구현예 426 내지 464 중 어느 하나에 있어서, 상기 암은 MYC 유전자의 일부 또는 전부의 복제를 특징으로 하는, 방법.
466. 구현예 426 내지 465 중 어느 하나에 있어서, 상기 암은 결장직장암, 유방암, AML, 전립선암, 신경모세포종, 폐암, 자궁내막암, 간암, 림프종(예를 들어, 버킷 림프종), 자궁경부 암종, 또는 또는 위암으로부터 선택되는, 방법.
467. 구현예 426 내지 466 중 어느 하나에 있어서, 상기 암은 인간 융모성 생식선 자극호르몬(hCG) 분비 암인, 방법.
468. 구현예 426 내지 467 중 어느 하나에 있어서, 상기 암은 간암종인, 방법.
469. 구현예 426 내지 468 중 어느 하나에 있어서, 상기 암은 비-반응성 암, 예를 들어 비-반응성 간암종인, 방법.
470. 구현예 426 내지 469 중 어느 하나에 있어서, 상기 암은 비소세포 폐 암종 또는 소세포 폐 암종인, 방법.
471. 구현예 426 내지 470 중 어느 하나에 있어서, 상기 암은 (예를 들어, 참조 세포의 AFP 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 알파-태아단백질(AFP)을 과발현하는, 방법.
472. 구현예 431 내지 471 중 어느 하나에 있어서, 상기 암의 세포는, 예를 들어 MYC 유전자를 포함하거나 MYC 유전자를 포함하는 앵커-서열 매개 연접부를 포함하는 슈퍼 인핸서의 존재를 특징으로 하고, 선택적으로 상기 암은 간암, 직장결장암, 유방암, AML, 전립선암, 신경모세포종, 폐암, 또는 자궁내막암으로부터 선택되는, 방법.
472. 구현예 471에 있어서, 상기 발현 리프레서(예를 들어, 제2 발현 리프레서)는 MYC 유전자를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합하는, 방법.
473. 구현예 426 내지 472 중 어느 하나에 있어서, 상기 암의 세포는 MYC 유전자를 포함하거나 MYC 유전자를 포함하는 앵커-서열 매개 연접부를 포함하는 슈퍼 인핸서의 부재를 특징으로 하는, 방법.
474. 구현예 473에 있어서, 상기 발현 리프레서(예를 들어, 제1 발현 리프레서)는 MYC 프로모터에 결합하는, 방법.
475. 구현예 426 내지 474 중 어느 하나에 있어서, 상기 암은 MYC 유전자를 포함하거나 MYC 유전자를 포함하는 앵커-서열 매개 연접부를 포함하는 슈퍼 인핸서를 포함하는 세포, 및 MYC 유전자를 포함하거나 MYC 유전자를 포함하는 앵커-서열 매개 연접부를 포함하는 슈퍼 인핸서를 포함하지 않는 세포를 포함하는, 방법.
476. 구현예 426 내지 475 중 어느 하나에 있어서, 상기 암은 참조 수준에 비해(예를 들어, 참조 서열의 MYC 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 증가된 MYC 발현을 특징으로 하는 세포, 및 참조 수준에 비해(예를 들어, 참조 세포의 MYC 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 증가된 MYC 발현을 특징으로 하지 않는, 예를 들어 정상적인 MYC 발현을 갖는 세포를 포함하는, 방법.
477. 구현예 426 내지 476 중 어느 하나에 있어서, 상기 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물은 단일요법으로 투여되는, 방법.
478. 구현예 426 내지 477 중 어느 하나에 있어서, 대상체에게 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물의 복수 용량, 예를 들어 적어도 2, 3, 4, 5, 또는 6회 용량을 투여하는 단계를 포함하는, 방법.
479. 구현예 426 내지 479 중 어느 하나에 있어서, 대상체에게 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 또는 약제학적 조성물의 복수 용량을 5일 간격으로 투여하는 단계를 포함하는, 방법.
480. 구현예 426 내지 479 중 어느 하나에 있어서,
a) 첫째, 대상체에게 본 명세서에 기재된(예를 들어, 구현예 1 내지 424 중 어느 하나의) 발현 리프레서 또는 시스템의 제1 복수의 용량을 투여하되, 선택적으로 제1 복수의 용량의 각각의 후속 용량은 제1 복수의 용량의 이전 용량으로부터 5일 후에 투여되는, 단계;
b) 둘째, 일정 기간(예를 들어, "약물 휴지기") 동안, 예를 들어 약 2주 동안 발현 리프레서 또는 시스템을 중단시키는 단계, 및
c) 셋째, 대상체에게 발현 리프레서 또는 시스템의 제2 복수의 용량을 투여하되, 선택적으로 제2 복수의 용량의 후속 용량은 제2 복수의 용량의 이전 용량으로부터 5일 후에 투여되는, 단계
를 포함하는, 방법.
481. 구현예 480에 있어서, 상기 제1 복수의 용량은 4회 용량을 포함하는, 방법.
482. 구현예 479 또는 480에 있어서, 상기 제2 복수의 용량은 2회 용량을 포함하는, 방법.
483. 구현예 480 내지 482 중 어느 하나에 있어서, 상기 대상체는 약물 휴지기 동안 전혀 치료제를 받지 않는, 방법.
484. 구현예 480 내지 483 중 어느 하나에 있어서, 상기 대상체는 약물 휴지기 동안 제2 치료제를 받는, 방법.
485. 구현예 480 내지 484 중 어느 하나에 있어서, 상기 약물 휴지기는 제1 복수의 용량의 용량 투여 사이의 시간의 적어도 2배인, 방법.
486. 구현예 480 내지 486 중 어느 하나에 있어서, 상기 약물 휴지기는 제2 복수의 용량의 용량 투여 사이의 시간의 적어도 2배인, 방법.
487. 구현예 426 내지 486 중 어느 하나에 있어서, 상기 종양의 부피는 발현 리프레서 또는 시스템으로 치료 후 검출 가능하지 않은 수준으로 감소되는, 방법.
488. 구현예 426 내지 487 중 어느 하나에 있어서, 종양 부피는 발현 리프레서 또는 시스템으로의 치료 중단 후 (예를 들어, 검출 가능하지 않은 수준으로) 감소되는, 방법.
489. 구현예 425 내지 488 중 어느 하나에 있어서, 상기 암은 발현 리프레서 또는 시스템에 대해 내성이 되지 않거나, 10, 20, 30, 40, 50, 또는 60일 내에 발현 리프레서 또는 시스템에 대해 내성이 되지 않는, 방법.
490. 구현예 425 내지 489 중 어느 하나에 있어서, 상기 암 세포는 기능성 아폽토시스 경로를 갖는, 방법.
491. 구현예 425 내지 490 중 어느 하나에 있어서, 상기 암 세포는 기능성 카스파제 3을 갖는, 방법.
492. 구현예 491에 있어서, 카스파제 3은 대상체에의 발현 리프레서 또는 시스템의 투여 시 암 세포에서 상향조절되는, 방법.
493. 구현예 425 내지 492 중 어느 하나에 있어서, Ki67은 대상체에의 발현 리프레서 또는 시스템의 투여 시 암 세포에서 하향조절되는, 방법.
494. 구현예 425 내지 493 중 어느 하나에 있어서, 암 세포 증식은 대상체에의 발현 리프레서 또는 시스템의 투여 시 감소되는, 방법.
495. 구현예 425 내지 494 중 어느 하나에 있어서, 상기 방법은
a. 세포를 제2 치료제와 접촉시키는 단계, 또는
b. 대상체에게 제2 치료제를 투여하는 단
계를 추가로 포함하는, 방법.
496. 구현예 495에 있어서, 상기 제2 치료제는 MYC 프로모터에 대해 결합하는 발현 리프레서가 아닌, 방법.
497. 구현예 495 또는 496에 있어서, 상기 제2 치료제는 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 융합 단백질, 핵산, 벡터, 반응 혼합물, 약제학적 조성물, 또는 지질 나노입자가 아닌, 방법.
498. 구현예 494 내지 496 중 어느 하나에 있어서, 상기 제2 치료제는 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 융합 단백질, 핵산, 벡터, 반응 혼합물, 약제학적 조성물, 또는 지질 나노입자인, 방법.
499. 구현예 495 내지 497 중 어느 하나에 있어서, 상기 제2 치료제는 면역요법, 면역 관문 및 항-혈관-내피-성장 인자 요법 중 하나 또는 둘 다, 전신 화학요법, 타이로신 키나제 억제제, 예를 들어 소라페닙, 미토겐-활성화 단백질 키나제 키나제 억제제(MEK 억제제), 예를 들어 트라메티닙, 또는 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1 또는 비라브레십인, 방법.
500. 구현예 495 내지 499 중 어느 하나에 있어서, 상기 제2 치료제는 타이로신 키나제 억제제, 예를 들어 소라페닙인, 방법.
501. 구현예 495 내지 499 중 어느 하나에 있어서, 상기 제2 치료제는 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1, 비라브레십, 또는 BET 672인, 방법.
502. 구현예 495 내지 499 중 어느 하나에 있어서, 상기 제2 치료제는 미토겐-활성화 단백질 키나제 키나제 억제제(MEK 억제제), 예를 들어 트라메티닙인, 방법.
503. 구현예 495 내지 502 중 어느 하나에 있어서, 상기 방법은 대상체에게 추가 요법을 투여하는 단계를 추가로 포함하는, 방법.
504. 구현예 504에 있어서, 상기 추가 요법은 외과적 절제 동소(orthotopic) 간 이식, 고주파 절제, 광역동 치료(PDT), 레이저 치료, 근접치료, 방사선 치료, 경-카테터 동맥 화학- 또는 방사선-색전술, 또는 정위 방사선 치료를 포함하는, 방법.
505. 구현예 495 내지 504 중 어느 하나에 있어서, 상기 제2 치료제는 관문 억제제 또는 소분자로부터 선택되는, 방법.
506. 구현예 495 내지 505 중 어느 하나에 있어서, 상기 제2 치료제는 화학요법제, 예를 들어 키나제 억제제 또는 브로모도메인 억제제, 예를 들어 BET 억제제인, 방법.
507. 구현예 505 또는 506에 있어서, 상기 제2 치료제는 소라페닙, JQ1, BET672, 비라브레십, 또는 트라메티닙으로부터 선택되는, 방법.
508. 구현예 495 내지 506 중 어느 하나에 있어서, 상기 발현 리프레서, 시스템, 또는 핵산 및 제2 치료제는 동시에 투여되는, 방법.
509. 구현예 495 내지 508 중 어느 하나에 있어서, 상기 발현 리프레서, 시스템, 또는 핵산 및 제2 치료제는 순차적으로 투여되는, 방법.
509. 구현예 503 내지 509 중 어느 하나에 있어서, 상기 추가 요법은 동시에 투여되는, 방법.
511. 구현예 503 내지 510 중 어느 하나에 있어서, 상기 추가 요법은 순차적으로 투여되는, 방법.
512. 구현예 495 내지 511 중 어느 하나에 있어서, 상기 제2 치료제는 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 약제학적 조성물, 또는 반응 혼합물과 동시에 투여되는, 방법.
513. 구현예 495 내지 512 중 어느 하나에 있어서, 상기 제2 치료제는 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 핵산, 벡터, 지질 나노입자, 약제학적 조성물, 또는 반응 혼합물과 연속적으로 투여되는, 방법.
514. 구현예 495 내지 513 중 어느 하나에 있어서, 상기 발현 리프레서, 시스템, 또는 핵산은 정맥내로 투여되고, 제2 요법은 경구로 투여되는, 방법.
515. 선행하는 구현예 중 어느 하나에 있어서, 상기 암은 저항성 또는 불응성 암인, 방법.
516. 선행하는 구현예 중 어느 하나에 있어서, 상기 암은 키나제 억제제, 예를 들어 VEGFR, PDGFR, 또는 RAF 키나제, 예를 들어 소라페닙 중 하나 이상을 억제하는 키나제 억제제인, 방법.
517. 선행하는 구현예 중 어느 하나에 있어서, 상기 대상체는 MYC 슈퍼-인핸서의 증폭을 갖는, 방법.
518. 구현예 1 내지 424 중 어느 하나의 발현 리프레서, 시스템, 상기 시스템 또는 발현 리프레서를 인코딩하는 하나 이상의 핵산, 벡터, 지질 나노입자, 반응 혼합물, 또는 약제학적 조성물을 포함하는 조성물을 포함하는 용기, 및 상기 조성물을 이용하여 세포 내의 MYC 유전자의 발현을 조절하는, 예를 들어 감소시키는 적어도 하나의 방법을 포함하는 한 세트의 설명서를 포함하는 키트.
정의
하나 : 본 명세서에 사용되는 바와 같이, 단수 형태("a", "an", 및 "the")는 문맥이 명백하게 달리 지시하지 않는 한 복수 지시대상을 포함한다.
작용제(agent) : 본 명세서에 사용되는 바와 같이, 용어 "작용제"는, 예를 들어 폴리펩타이드, 핵산, 당류, 지질, 소분자, 금속, 또는 이들의 조합 또는 복합체를 포함하는 임의의 화학 부류의 화합물 또는 실체(entity)를 지칭하는 데 사용될 수 있다. 문맥으로부터 당업자에게 명백할 바와 같이, 일부 구현예에서, 상기 용어는 세포 또는 유기체, 또는 이의 분획, 추출물, 또는 성분이거나 이를 포함하는 실체를 지칭하는 데 이용될 수 있다. 대안적으로, 또는 추가적으로, 문맥에 비추어 당업자가 이해할 바와 같이, 일부 구현예에서, 상기 용어는 자연에서 발견되고/되거나 자연으로부터 얻어진다는 점에서 천연 제품을 지칭하는 데 사용될 수 있다. 일부 구현예에서, 다시 문맥에 비추어 당업자가 이해할 바와 같이, 상기 용어는 사람의 손의 작용을 통해 설계, 조작, 및/또는 생산되고/되거나 자연에서 발견되지 않는다는 점에서 인공적인 하나 이상의 실체를 지칭하는 데 사용될 수 있다. 일부 구현예에서, 작용제는 단리되거나 순수한 형태로 이용될 수 있고; 일부 구현예에서, 작용제는 미정제 형태로 이용될 수 있다. 일부 구현예에서, 잠재적인 작용제는, 예를 들어 이들 내의 활성제를 식별하거나 특성화하기 위해 스크리닝될 수 있는, 컬렉션 또는 라이브러리로 제공될 수 있다. 일부 구현예에서, 용어 "작용제"는 중합체이거나 이를 포함하는 화합물 또는 실체를 지칭할 수 있고; 일부 구현예에서, 상기 용어는 하나 이상의 중합체 모이어티를 포함하는 화합물 또는 실체를 지칭할 수 있다. 일부 구현예에서, 용어 "작용제"는 중합체가 아니고/아니거나 임의의 중합체 및/또는 하나 이상의 특정 중합체 모이어티가 실질적으로 없는 화합물 또는 실체를 지칭할 수 있다. 일부 구현예에서, 상기 용어는 임의의 중합체 모이어티가 결여되어 있거나 실질적으로 없는 화합물 또는 실체를 지칭할 수 있다.
앵커 서열: 본 명세서에 사용되는 바와 같이, 용어 "앵커 서열"은 앵커 서열-매개 연접부, 예를 들어 복합체를 형성하도록 충분히 결합하는 핵형성제(nucleating agent)에 의해 인식되는 핵산 서열을 지칭한다. 일부 구현예에서, 앵커 서열은 하나 이상의 CTCF 결합 모티프를 포함한다. 일부 구현예에서, 앵커 서열은 유전자 코딩 영역 내에 위치되어 있지 않다. 일부 구현예에서, 앵커 서열은 유전자간 영역 내에 위치되어 있다. 일부 구현예에서, 앵커 서열은 인핸서 또는 프로모터 중 어느 것에도 위치되어 있지 않다. 일부 구현예에서, 앵커 서열은 임의의 전사 개시 부위로부터 적어도 400 bp, 적어도 450 bp, 적어도 500 bp, 적어도 550 bp, 적어도 600 bp, 적어도 650 bp, 적어도 700 bp, 적어도 750 bp, 적어도 800 bp, 적어도 850 bp, 적어도 900 bp, 적어도 950 bp, 또는 적어도 1kb 떨어져 위치되어 있다. 일부 구현예에서, 앵커 서열은 게놈 각인, 단일대립유전자 발현, 및/또는 단일대립유전자 후성유전학적 마크와 연관되어 있지 않은 영역 내에 위치되어 있다. 일부 구현예에서, 앵커 서열은 내인성 핵형성 폴리펩타이드(예를 들어, CTCF)에 결합하는 기능, 제2 앵커 서열과 상호작용하여 앵커 서열-매개 연접부를 형성하는 기능, 또는 앵커 서열-매개 연접부 외부에 있는 인핸서에 대해 절연하는 기능으로부터 선택되는 하나 이상의 기능을 갖는다. 본 개시내용의 일부 구현예에서, 기타 다른 앵커 서열(예를 들어, 상이한 상황에서 핵형성제(예를 들어, CTCF) 결합 모티프를 함유할 수 있는 서열)을 표적화하지 않고서, 특정 앵커 서열 또는 앵커 서열들을 특이적으로 표적화할 수 있는 기술이 제공되며; 그러한 표적화된 앵커 서열은 "표적 앵커 서열"로 지칭될 수 있다. 일부 구현예에서, 표적 앵커 서열의 서열 및/또는 활성은 조절되는 반면, 표적화된 앵커 서열과 동일한 시스템 내에(예를 들어, 동일한 세포 내에 그리고/또는 일부 구현예에서는 동일한 핵산 분자(예를 들어, 동일한 염색체) 상에) 존재할 수 있는 하나 이상의 다른 앵커 서열의 서열 및/또는 활성은 조절되지 않는다. 일부 구현예에서, 앵커 서열은 핵형성 폴리펩타이드 결합 모티프이거나 이를 포함한다. 일부 구현예에서, 앵커 서열은 핵형성 폴리펩타이드 결합 모티프에 인접한다.
앵커 서열-매개 연접부: 본 명세서에 사용되는 바와 같이, 용어 "앵커 서열-매개 연접부"는 DNA 내의 적어도 2개의 앵커 서열이, 이들 앵커 서열에 결합하여 앵커 서열들 사이의 공간적 근접 및 기능성 결합을 가능하게 하는 하나 이상의 폴리펩타이드, 예컨대 핵형성 폴리펩타이드, 또는 하나 이상의 단백질 및/또는 핵산 실체(entity)(예컨대, RNA 또는 DNA)에 의한, 이들 적어도 2개의 앵커 서열의 물리적 상호작용 또는 결합을 통해 일어나고/나거나 유지되는 DNA 구조, 일부 경우에는 복합체를 지칭한다(예를 들어, 도 1 참조).
~와 연관된: 2개의 사건 또는 실체는, 그 용어가 본 명세서에 사용되는 바와 같이, 하나의 존재, 수준, 형태 및/또는 기능이 나머지 다른 하나의 것과 상관 관계가 있다면, 서로 "연관되어" 있다. 예를 들어, 일부 구현예에서, 특정 실체(예를 들어, 폴리펩타이드, 유전자적 시그니처, 대사물, 미생물 등)는 그의 존재, 수준, 형태 및/또는 기능이 (예를 들어, 관련 집단에 걸쳐) 특정 질환, 장애, 또는 병태의 발병률 및/또는 감수성과 상관 관계가 있다면, 그러한 질환, 장애, 또는 병태과 연관되어 있는 것으로 여겨진다. 일부 구현예에서, 2개 이상의 실체는, 그들이 직접적으로 또는 간접적으로 상호작용하여 서로 물리적 근접 상태에 있거나 이 상태를 유지한다면, 서로 물리적으로 "연관되어" 있다. 일부 구현예에서, 서로 물리적으로 연관된 2개 이상의 실체는 서로 공유적으로 연결되어 있으며; 일부 구현예에서, 서로 물리적으로 관련된 2개 이상의 실체는 서로 공유적으로 연결되어 있지 않고, 예를 들어 수소 결합, 반데르발스 상호작용, 소수성 상호작용, 자기력(magnetism), 및 이들의 조합에 의해 비공유적으로 회합되어 있다. 일부 구현예에서, DNA 서열은, 핵산이 적어도 부분적으로 표적 게놈 또는 전사 복합체 내에 있고, DNA 서열 내의 유전자의 발현이 표적 게놈 또는 전사 복합체의 형성 또는 파괴에 의해 영향을 받을 때, 표적 게놈 또는 전사 복합체"와 연관되어" 있다.
도메인: 본 명세서에 사용되는 바와 같이, 용어 "도메인"은 실체의 섹션 또는 일부분을 지칭한다. 일부 구현예에서, "도메인"은 실체의 특정 구조적 및/또는 기능적 특징과 관련되어 있으며, 이로써 도메인이 그의 모 실체의 나머지로부터 물리적으로 분리되어 있을 때, 그것은 특정 구조적 및/또는 기능적 특징을 실질적으로 또는 전체적으로 유지한다. 대안적으로 또는 추가적으로, 일부 구현예에서, 도메인은, 그러한 (모) 실체로부터 분리되고 상이한 (수용자) 실체와 연결될 때, 모 실체에서 특징이 되게 한 하나 이상의 구조적 및/또는 기능적 특징을 수용자 실체 상에 실질적으로 유지하고/하거나 부여하는 실체의 일부분일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 도메인은 분자(예를 들어, 소분자, 탄수화물, 지질, 핵산, 폴리펩타이드 등)의 섹션 또는 일부분이거나 이를 포함한다. 일부 구현예에서, 도메인은 폴리펩타이드의 섹션이거나 이를 포함한다. 일부 그러한 구현예에서, 도메인은 특정 구조 요소(예를 들어, 특정 아미노산 서열 또는 서열 모티프, 알파-나선 특성, 베타-시트 특성, 코일드-코일(coiled-coil) 특성, 랜덤 코일 특성 등)에 의해, 그리고/또는 특정 기능적 특징(예를 들어, 결합 활성, 효소 활성, 접힘 활성, 신호전달 활성 등)에 의해 특성화된다.
이펙터 모이어티: 본 명세서에 사용되는 바와 같이, 용어 "이펙터 모이어티"는 세포의 핵 내에 적절하게 국재화될 때 표적 유전자의 발현을 변경시킬 수 있는 도메인을 지칭한다. 일부 구현예에서, 이펙터 모이어티는 전사 기구(transcription machinery)의 성분을 동원한다. 일부 구현예에서, 이펙터 모이어티는 전사 인자 또는 발현 억제 인자의 성분의 동원을 억제한다. 일부 구현예에서, 이펙터 모이어티는 후성유전학적 변형 모이어티를 포함한다(예를 들어, 표적 DNA 서열을 후성유전학적으로 변형시킴).
후성유전학적 변형 모이어티: 본 명세서에 사용되는 바와 같이, "후성유전학적 변형 모이어티"는 i) 염색질의 구조, 예를 들어 2차원 구조; 및/또는 ii) 후성유전학적 변형 모이어티가 (예를 들어, 표적화 모이어티에 의해) 핵산에 적절하게 국재화될 때, 후성유전학적 마커(예를 들어, DNA 메틸화, 히스톤 메틸화, 히스톤 아세틸화, 히스톤 수모화(sumoylation), 히스톤 인산화, 및 RNA-연관 침묵 중 하나 이상)를 변경시키는 도메인을 지칭한다. 일부 구현예에서, 후성유전학적 변형 모이어티는 하나 이상의 후성유전학적 마커에 영향을 미치는(예를 들어, 이의 수준을 증가시키거나 감소시키는) 효소, 또는 이의 기능성 단편 또는 변이체를 포함한다. 일부 구현예에서, 후성유전학적 변형 모이어티는 DNA 메틸트랜스퍼라제, 히스톤 메틸트랜스퍼라제, CREB-결합 단백질(CBP), 또는 이들 중 임의의 것의 기능성 단편을 포함한다.
발현 제어 서열: 본 명세서에 사용되는 바와 같이, 용어 "발현 제어 서열"은 유전자의 전사를 증가시키거나 감소시키는 핵산 서열을 지칭하며 프로모터 및 인핸서를 포함한다(그러나 이에 제한되지 않음). "인핸싱 서열"은 발현 제어 서열의 하위유형을 지칭하며 유전자 전사의 가능성을 증가시킨다. "침묵 또는 리프레서 서열"은 발현 제어 서열의 하위유형을 지칭하며 유전자 전사의 가능성을 감소시킨다.
발현 리프레서: 본 명세서에 사용되는 바와 같이, 용어 "발현 리프레서"는, 세포 내의 표적 유전자의 발현을 감소시키고, DNA 서열(예를 들어, 표적 유전자, 또는 표적 유전자에 작동가능하게 연결된 전사 제어 요소와 연관된 DNA 서열)에 특이적으로 결합하는 하나 이상의 기능성을 갖는 작용제 또는 실체를 지칭한다. 발현 리프레서는 적어도 하나의 표적화 모이어티 및 선택적으로 하나의 이펙터 모이어티를 포함한다.
발현 억제 시스템: 본 명세서에 사용되는 바와 같이, 용어 "발현 억제 시스템"은 세포 내의 표적 유전자의 발현을 감소시키는 복수의 발현 리프레서를 지칭한다. 일부 구현예에서, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함하며, 제1 발현 리프레서 및 제2 발현 리프레서(또는 제1 발현 리프레서 및 제2 발현 리프레서를 인코딩하는 핵산)는 단일 조성물, 혼합물, 또는 약제학적 조성물 내에 함께 존재한다. 일부 구현예에서, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함하며, 제1 발현 리프레서 및 제2 발현 리프레서(또는 제1 발현 리프레서 및 제2 발현 리프레서를 인코딩하는 핵산)는 별개의 조성물 또는 약제학적 조성물 내에 존재한다. 일부 구현예에서, 제1 발현 리프레서와 제2 발현 리프레서는 동일한 세포 내에 동시에 존재한다. 일부 구현예에서, 제1 발현 리프레서와 제2 발현 리프레서는 동일한 세포 내에 동시에 존재하지 않으며, 예를 들어 이들은 순차적으로 존재한다. 예를 들어, 제1 발현 리프레서가 제1 기간 동안 세포 내에 존재할 수 있고, 이어서 제2 발현 리프레서가 제2 기간 동안 세포 내에 존재할 수 있으며, 여기서 제1 기간 및 제2 기간은 중첩 또는 비중첩될 수 있다.
융합 분자 : 본 명세서에 사용되는 바와 같이, 용어 "융합 분자"는 공유 결합된 2개 이상의 모이어티, 예를 들어 표적화 모이어티 및 이펙터 모이어티를 포함하는 화합물을 지칭한다. 융합 분자 및 이의 모이어티는 폴리펩타이드, 핵산, 글리칸, 소분자, 또는 본 명세서에 기재된 다른 성분의 임의의 조합을 포함할 수 있다(예를 들어, 표적화 모이어티는 핵산을 포함할 수 있고 이펙터 모이어티는 폴리펩타이드를 포함할 수 있다). 일부 구현예에서, 융합 분자는, 예를 들어 펩타이드 결합을 통해 공유 연결되는 하나 이상의 폴리펩타이드 도메인을 포함하는 융합 단백질이다. 일부 구현예에서, 융합 단백질은 펩타이드 결합 또는 포스포디에스테르 결합 이외의 공유 결합에 의해 연결되는 표적화 모이어티 및 이펙터 모이어티(예를 들어, 핵산을 포함하는 표적화 모이어티 및 펩타이드 결합 또는 포스포디에스테르 결합 이외의 공유 결합에 의해 연결되는 폴리펩타이드를 포함하는 이펙터 모이어티)를 포함하는 접합체 분자이다. 일부 구현예에서, 발현 리프레서는 융합 분자이거나 이를 포함한다.
게놈 복합체 : 본 명세서에 사용되는 바와 같이, 용어 "게놈 복합체"는 복수의 단백질 및/또는 기타 다른 성분(잠재적으로, 게놈 서열 요소를 포함함) 사이의 상호작용을 통해, 하나 이상의 염색체 상의 서로 이격된 2개의 게놈 서열 요소를 합친 복합체이다. 일부 구현예에서, 게놈 서열 요소는 복합체의 하나 이상의 단백질 성분이 결합하는 앵커 서열이다. 일부 구현예에서, 게놈 복합체는 앵커 서열-매개 연접부를 포함할 수 있다. 일부 구현예에서, 게놈 서열 요소는 CTCF 결합 모티프, 프로모터 및/또는 인핸서일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 게놈 서열 요소는 프로모터 및/또는 조절 부위(예를 들어, 인핸서) 중 적어도 하나 또는 둘 다를 포함한다. 일부 구현예에서, 복합체 형성은 게놈 서열 요소(들)에서 그리고/또는 게놈 서열 요소(들)에 대한 단백질 성분(들) 중 하나 이상의 결합에 의해 핵형성된다. 당업자에 의해 이해되는 바와 같이, 일부 구현예에서 복합체의 형성을 통한 게놈 부위들의 공국재화(예를 들어, 연접)는 게놈 서열 요소(들)에서 또는 그 부근에서(일부 구현예에서는, 이들 사이를 포함함), DNA 토폴로지를 변경시킨다. 일부 구현예에서, 게놈 복합체는 하나 이상의 루프를 포함하는 앵커 서열-매개 연접부를 포함한다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체는 핵형성 폴리펩타이드, 예컨대 CTCF 및/또는 코헤신(Cohesin)에 의해 핵형성된다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체는, 예를 들어 CTCF, 코헤신, 비-코딩 RNA(예를 들어, eRNA), 전사 기구 단백질(예를 들어, RNA 폴리머라제, 하나 이상의 전사 인자, 예를 들어 TFIIA, TFIIB, TFIID, TFIIE, TFIIF, TFIIH 등으로 구성되는 군으로부터 선택된 것), 전사 조절인자(예를 들어, 메디에이터(Mediator), P300, 인핸서-결합 단백질, 리프레서-결합 단백질, 히스톤 변형제 등) 등 중 하나 이상을 포함할 수 있다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 게놈 복합체는 하나 이상의 폴리펩타이드 성분 및/또는 하나 이상의 핵산 성분(예를 들어, 하나 이상의 RNA 성분)을 포함하며, 이들은, 일부 구현예에서, 복합체가 형성되지 않을 때 채택하지 않는 토폴로지 형상(예를 들어, 루프) 내로의 게놈 DNA의 신장(stretch)을 구속하도록 서로 그리고/또는 하나 이상의 게놈 서열 요소(예를 들어, 앵커 서열, 프로모터 서열, 조절 서열(예를 들어, 인핸서 서열))과 상호작용할 수 있다.
모이어티 : 본 명세서에 사용되는 바와 같이, 용어 "모이어티"는 본 명세서에 기재된 바와 같은 특정 구조 및/또는 활성을 갖는 정의된 화학 기 또는 실체를 지칭한다.
조절제: 본 명세서에 사용되는 바와 같이, 용어 "조절제"는 표적 유전자, 예를 들어 MYC의 발현을 변경(예를 들어, 증가 또는 감소)시킬 수 있는 하나 이상의 이펙터 모이어티 및 하나 이상의 표적화 모이어티를 포함하는 작용제를 지칭한다.
MYC: 본 명세서에 사용되는 바와 같이, 용어 "MYC 유전자좌"는 MYC 폴리펩타이드(예를 들어, NCBI 수탁 번호 NP002458.2에 개시된 폴리펩타이드, 또는 이의 돌연변이체), MYC에 작동가능하게 연결된 프로모터("MYC 프로모터"), 및 MYC 유전자를 포함하는 ASMC를 형성하는 앵커 서열을 인코딩하는 인간 게놈의 일부를 지칭한다. 일부 구현예에서, MYC 유전자좌는 NCBI 수탁 번호 NM―002467을 갖는 핵산을 인코딩한다. 일부 구현예에서, MYC 유전자는 원종양유전자이고, 일부 구현예에서 MYC 유전자는 종양유전자이다. 특정 경우에, MYC 유전자는 8번 염색체의 8q24.21에서 발견된다. 특정 경우에, MYC 유전자는 pter의 128,816,862 bp에서 시작하고 pter의 128,822,856 bp에서 끝난다. 특정 경우에, MYC 유전자는 약 6 kb이다. 특정 경우에, MYC 유전자는 적어도 8개의 분리된 mRNA 서열(5개의 선택적 스플라이싱된 변이체 및 3개의 스플라이싱되지 않은 변이체)을 인코딩한다.
핵산 : 본 명세서에 사용되는 바와 같이, 용어 "핵산"은, 그의 가장 넓은 의미에서, 올리고뉴클레오타이드 사슬 내로 도입되거나 도입될 수 있는 임의의 화합물 및/또는 물질을 지칭한다. 일부 구현예에서, 핵산은 포스포디에스테르 결합을 통해 올리고뉴클레오타이드 사슬 내로 도입되거나 도입될 수 있는 화합물 및/또는 물질이다. 맥락으로부터 명백한 바와 같이, 일부 구현예에서 "핵산"은 개별 핵산 잔기(예를 들어, 뉴클레오타이드 및/또는 뉴클레오시드)를 지칭하고; 일부 구현예에서, "핵산"은 개별 핵산 잔기들을 포함하는 올리고뉴클레오타이드 사슬을 지칭한다. 일부 구현예에서, "핵산"은 RNA이거나 이를 포함하고; 일부 구현예에서, "핵산"은 DNA이거나 이를 포함한다. 일부 구현예에서, 핵산은 하나 이상의 천연 핵산 잔기이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 하나 이상의 핵산 유사체이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산 유사체는 포스포디에스테르 백본을 이용하지 않는다는 점에서 핵산과 상이하다. 예를 들어, 일부 구현예에서, 핵산은 하나 이상의 "펩타이드 핵산"이거나, 이를 포함하거나, 이로 구성되는데, 펩타이드 핵산은 당업계에 알려져 있고, 백본 내에 포스포디에스테르 결합 대신에 펩타이드 결합을 가지며, 본 개시내용의 범주 내에 있는 것으로 여겨진다. 대안적으로 또는 추가적으로, 일부 구현예에서, 핵산은 포스포디에스테르 결합 대신에 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포르아미다이트 결합을 갖는다. 일부 구현예에서, 핵산은 하나 이상의 천연 뉴클레오시드(예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시 구아노신, 및 데옥시시티딘)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 하나 이상의 뉴클레오시드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, C-5 프로피닐-시티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, 0(6)-메틸구아닌, 2-티오시티딘, 메틸화 염기, 삽입된 염기, 및 이들의 조합)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 천연 핵산 내의 것들과 비교할 때 하나 이상의 변형된 당(예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스)을 포함한다. 일부 구현예에서, 핵산은 기능성 유전자 산물, 예컨대 RNA 또는 단백질을 인코딩하는 뉴클레오타이드 서열을 갖는다. 일부 구현예에서, 핵산은 하나 이상의 인트론을 포함한다. 일부 구현예에서, 핵산은 천연 공급원로부터의 단리, 상보적 주형을 기반으로 한 중합에 의한 효소적 합성(생체내 또는 시험관내), 재조합 세포 또는 시스템에서의 재생산, 및 화학적 합성 중 하나 이상에 의해 제조된다. 일부 구현예에서, 핵산은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 20, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000개 또는 그 이상의 잔기 길이이다. 일부 구현예에서, 핵산은 부분적으로 또는 전적으로 단일 가닥이고; 일부 구현예에서, 핵산은 부분적으로 또는 전체적으로 이중 가닥이다. 일부 구현예에서, 핵산은, 폴리펩타이드를 인코딩하는 서열의 상보체이거나 폴리펩타이드를 인코딩하는 적어도 하나의 요소를 포함하는 뉴클레오타이드 서열을 갖는다. 일부 구현예에서, 핵산은 효소 활성을 갖는다.
핵형성 폴리펩타이드 : 본 명세서에 사용되는 바와 같이, 용어 "핵형성 폴리펩타이드" 또는 "연접부 핵형성 폴리펩타이드"는 본 명세서에 사용되는 바와 같이 앵커 서열과 직접적으로 또는 간접적으로 회합하는 단백질을 지칭하며 (앵커 서열 또는 다른 핵산과 상호작용할 수 있는) 하나 이상의 연접부 핵형성 폴리펩타이드와 상호작용하여, 서로 동일하거나 동일하지 않을 수 있는 2개 이상의 그러한 연접부 핵형성 폴리펩타이드로 구성된 이량체(또는 고차 구조)를 형성할 수 있다. 상이한 앵커 서열과 회합된 연접부 핵형성 폴리펩타이드가 서로 회합하여 상이한 앵커 서열이 서로 물리적으로 근접하게 유지될 때, 이에 의해 생성된 구조는 앵커-서열-매개 연접부이다. 즉, 또 다른 핵형성 폴리펩타이드-앵커 서열과 상호작용하는 핵형성 폴리펩타이드-앵커 서열의 가까운 물리적 근접성은 앵커 서열에서 시작하고 끝나는 앵커 서열-매개 연접부(예를 들어, 일부 경우에는 DNA 루프)를 생성한다. 본 명세서를 읽으면 당업자는 "핵형성 폴리펩타이드", "핵형성 분자", "핵형성 단백질", "연접부 핵형성 단백질"과 같은 용어가 때때로 연접부 핵형성 폴리펩타이드를 지칭하는 데 사용될 수 있음을 즉시 이해할 것이다. 유사하게 본 명세서를 읽는 당업자에 의해 즉시 이해될 바와 같이, 2개 이상의 연접부 핵형성 폴리펩타이드의 집합체(일부 구현예에서, 동일한 작용제의 여러 카피 및/또는 일부 구현예에서 복수의 상이한 작용물질 각각 중 하나 이상을 포함할 수 있음)는 "복합체", "이량체", "다량체" 등으로 지칭될 수 있다.
작동가능하게 연결된 : 본 명세서에 사용되는 바와 같이, 어구 "작동가능하게 연결된"은 기재된 성분들이 그들의 의도된 방식으로 기능할 수 있게 하는 관계에 있게 하는 병치(juxtaposition)를 지칭한다. 기능성 요소, 예를 들어 유전자에 "작동가능하게 연결된" 전사 제어 요소는 기능성 요소, 예를 들어 유전자의 발현 및/또는 활성이 전사 제어 요소와 양립가능한 조건 하에서 달성되도록 하는 방식으로 연관되어 있다. 일부 구현예에서, "작동가능하게 연결된" 전사 제어 요소는 관심 코딩 요소, 예를 들어 유전자와 연속적이며(예를 들어, 공유적으로 연결되어 있으며); 일부 구현예에서, 작동가능하게 연결된 전사 제어 요소는 관심 기능성 요소, 예를 들어 유전자에 대해 트랜스(trans)로 작용하거나 아니면 이로부터 떨어진 거리에서 작용한다. 일부 구현예에서, '작동가능하게 연결된'은 2개의 핵산 서열이 동일한 핵산 분자 상에 포함되어 있음을 의미한다. 추가의 구현예에서, '작동가능하게 연결된'은 2개의 핵산 서열이 동일한 핵산 분자 상에서, 예를 들어 1000, 500, 100, 50, 또는 10개의 서로의 염기쌍 이내에 서로 근접해 있거나 서로 직접 인접해 있음을 추가로 의미할 수 있다.
펩타이드, 폴리펩타이드, 단백질 : 본 명세서에 사용되는 바와 같이, 용어 "펩타이드", "폴리펩타이드", 및 "단백질"은 펩타이드 결합에 의해, 또는 펩타이드 결합 이외의 수단에 의해 공유적으로 연결된 아미노산 잔기들로 구성된 화합물을 지칭한다. 단백질 또는 펩타이드는 적어도 2개의 아미노산을 함유해야 하며, 단백질 또는 펩타이드의 서열을 구성할 수 있는 아미노산의 최대수에 대한 제한은 없다. 폴리펩타이드는 펩타이드 결합에 의해 또는 펩타이드 결합 이외의 수단에 의해 서로 결합된 2개 이상의 아미노산을 포함하는 임의의 펩타이드 또는 단백질을 포함한다. 본 명세서에 사용되는 바와 같이, 이 용어는 당업계에서, 예를 들어 펩타이드, 올리고펩타이드 및 올리고머로 일반적으로 지칭되는 짧은 사슬, 및 당업계에서 단백질(이에는 많은 유형이 있음)로 일반적으로 지칭되는 더 긴 사슬 둘 다를 지칭한다.
약제학적 조성물: 본 명세서에 사용되는 바와 같이, 용어 "약제학적 조성물"은 하나 이상의 약제학적으로 허용되는 담체와 함께 제형화된 활성제(예를 들어, 조절제, 예를 들어 파괴제)를 지칭한다. 일부 구현예에서, 활성제는 관련 집단에 투여될 때 사전결정된 치료적 효과를 달성할 통계학적으로 유의한 확률을 나타내는 치료 투약계획에서 투여하기에 적절한 단위 용량으로 존재한다. 일부 구현예에서, 약제학적 조성물은 고체 또는 액체 형태로의 투여를 위해 특수하게 제형화될 수 있으며, 이에는 하기에 맞게 구성된 것들이 포함된다: 경구 투여, 예를 들어 드렌치(drench)(수성 또는 비수성 용액 또는 현탁액), 정제, 예를 들어 협측, 설하, 및 전신 흡수를 목표로 한 것들, 볼루스, 분말, 과립, 혀에 적용하기 위한 페이스트; 비경구 투여, 예를 들어 피하, 근육내, 정맥내 또는 경막외 주사에 의한 투여, 예를 들어 멸균 용액 또는 현탁액, 또는 지속-방출 제형으로서의 주사; 국소 적용, 예를 들어 피부, 폐, 또는 구강에 적용되는 크림, 연고, 또는 제어-방출 패치 또는 스프레이로서의 적용; 질내 또는 직장내 투여, 예를 들어 페서리(pessary), 크림, 또는 폼(foam)으로서의 투여; 설하 투여; 안내 투여(ocularly); 경피 투여; 또는 비강, 폐, 및/또는 기타 다른 점막 표면 투여.
근접한 : 본 명세서에 사용되는 바와 같이, 용어 "근접"은 제1 부위에서 발현 리프레서의 결합 및/또는 발현 리프레서에 의한 제1 부위의 변형이 다른 한쪽 부위의 결합 및/또는 변형과 동일하거나 실질적으로 동일한 효과를 생성하도록 할 2개의 부위, 예를 들어 핵산 부위의 접근성을 지칭한다. 예를 들어, 표적화 모이어티는 인핸서(제2 부위)에 근접한 제1 부위에 결합할 수 있고, 상기 표적화 모이어티와 연관된 이펙터 모이어티는, 표적 유전자의 발현에 대한 인핸서의 효과가 마치 제2 부위(인핸서 서열)가 결합되고/되거나 변형된 것처럼 실질적으로 동일하게 변형되도록 제1 부위를 후성유전학적으로 변형시킬 수 있다. 일부 구현예에서, 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위)에 근접한 부위, 표적 유전자에 작동가능하게 연결된 전사 제어 요소에 근접한 부위, 또는 앵커 서열에 근접한 부위는 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위), 전사 제어 요소, 또는 앵커 서열로부터 5000, 5000, 4000, 3000, 2000, 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 50, 또는 25개의 염기쌍(그리고 선택적으로, 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위), 전사 제어 요소, 또는 앵커 서열)로부터 적어도 적어도 20, 25, 50, 100, 200, 또는 300개의 염기쌍) 미만에 있다.
특이적 : 본 명세서에 사용되는 바와 같이, 활성을 갖는 작용제를 지칭하는 용어 "특이적"은 작용제가 잠제적인 표적 실체 또는 상태를 구별하는 것을 의미하는 것으로 당업자에 의해 이해된다. 예를 들어, 일부 구현예에서, 작용제는 하나 이상의 경쟁하는 대안적인 표적의 존재 하에 작용제의 표적과 우선적으로 결합하는 경우 상기 표적에 "특이적으로" 결합한다고 한다. 일부 구현예에서, 특이적 상호작용은 표적 실체(예를 들어, 에피토프, 갈라진 틈(cleft), 결합 부위)의 특정한 구조적 특징의 존재에 따라 다르다. 특이성이 절대적일 필요가 없다는 것을 이해하여야 한다. 일부 구현예에서, 특이성은 하나 이상의 잠재적인 표적 실체(예를 들어, 경쟁자)에 대한 결합제의 특이성에 비해 평가될 수 있다. 일부 구현예에서, 특이성은 참조 특이적 결합제의 특이성에 비해 평가된다. 일부 구현예에서, 특이성은 참조 비-특이적 결합제의 특이성에 비해 평가된다. 일부 구현예에서, 작용제 또는 실체는 표적 실체에 대한 결합의 조건 하에 경쟁하는 대안적인 표적에 검출 가능하게 결합하지 않는다. 일부 구현예에서, 결합제는 경쟁하는 대안적인 표적(들)과 비교하여, 표적 실체에 대해 더 높은 온-레이트(on-rate), 더 낮은 오프-레이트(off-rate), 증가된 친화도, 감소된 해리, 및/또는 증가된 안정성으로 결합한다.
특이적 결합: 본 명세서에 사용되는 바와 같이, 용어 "특이적 결합"은 결합이 일어나게 될 환경에서, 가능한 결합 파트너들 사이를 구별하는 능력을 지칭한다. 일부 구현예에서, 다른 잠재적인 표적들이 존재할 때 하나의 특정 표적과 상호작용하는 결합제는 그것이 상호작용하는 표적에 "특이적으로 결합한다"라고 한다. 일부 구현예에서, 특이적 결합은 결합제와 이의 파트너 사이의 회합도(degree of association)를 검출하거나 결정함으로써 평가되고; 일부 구현예에서, 특이적 결합은 결합제-파트너 복합체의 해리도(degree of dissociation)를 검출하거나 결정함으로써 평가된다. 일부 구현예에서, 특이적 결합은 이의 파트너와 또 다른 실체 사이의 대체 상호작용과 경쟁할 수 있는 결합제의 능력을 검출하거나 결정함으로써 평가된다. 일부 구현예에서, 특이적 결합은 일정 범위의 농도에 걸쳐 그러한 검출 또는 결정을 수행함으로써 평가된다.
실질적으로 : 본 명세서에 사용되는 바와 같이, 용어 "실질적으로"는 관심 특징 또는 특성의 전체적인 또는 거의 전체적인 범위 또는 정도를 나타내는 정성적인 조건을 지칭한다. 당업자는 생물학적 및 화학적 현상이, 설사 가능하다 하더라도, 거의 완료되지 않고/않거나 완료로 진행되지 않거나 절대적인 결과를 달성하거나 피하지 못한다는 것을 이해할 것이다. 따라서, 용어 "실질적으로"는, 일부 구현예에서, 많은 생물학적 및 화학적 현상에 내재되어 있는 완료의 잠재적인 결여를 포착하는 데 사용될 수 있다.
증상이 감소된다 : 본 명세서에 사용되는 바와 같이, 어구 "증상이 감소된다"는 특정 질환, 장애 또는 병태의 하나 이상의 증상이 크기(예를 들어, 강도, 중증도 등) 및/또는 빈도가 감소될 때 사용될 수 있다. 일부 구현예에서, 특정 증상의 개시의 지연은 그러한 증상의 빈도를 감소시키는 한 가지 형태인 것으로 여겨진다.
표적화 : 작용제 또는 실체는, 서로 접촉되게 한 조건 하에서 또 다른 표적화된 작용제 또는 실체에 특이적으로 결합한다면, 본 개시내용에 따라 그러한 또 다른 작용제 또는 실체를 "표적화"하는 것으로 여겨진다. 일부 구현예에서, 예를 들어, 항체(또는 이의 항원-결합 단편)는 그의 동종 에피토프 또는 항원을 표적화한다. 일부 구현예에서, 특정 서열을 갖는 핵산은 실질적으로 상보적인 서열의 핵산을 표적화한다.
표적 유전자: 본 명세서에 사용되는 바와 같이, 용어 "표적 유전자"는, 예를 들어 발현의 조절을 위해 표적화된 유전자를 의미한다. 일부 구현예에서, 표적 유전자는 표적화된 게놈 복합체의 일부(예를 들어, 표적 게놈 복합체, 예를 들어 앵커 서열-매개 연접부 내부에 있는 것의 일부로서 게놈 서열의 적어도 일부를 갖는 유전자)이며, 이러한 게놈 복합체는 본 명세서에 기재된 바와 같은 하나 이상의 조절제에 의해 표적화된다. 일부 구현예에서, 조절은 표적 유전자의 발현의 억제를 포함한다. 일부 구현예에서, 표적 유전자는, 표적 유전자, 또는 표적 유전자에 작동가능하게 연결된 전사 제어 요소를 본 명세서에 기재된 발현 억제 시스템, 예를 들어 발현 리프레서(들)와 접촉시킴으로써 조절된다. 일부 구현예에서, 표적 유전자는 세포, 예를 들어 대상체(예를 들어, 환자) 내의 세포에서 비정상적으로 발현된다(예를 들어, 과발현된다).
표적화 모이어티 : 본 명세서에 사용되는 바와 같이, 용어 "표적화 모이어티"는 게놈 서열 요소(예를 들어, 발현 제어 서열 또는 앵커 서열)를 특이적으로 표적화하는, 예를 들어 이에 결합하는 작용제 또는 실체를 의미한다. 일부 구현예에서, 게놈 서열 요소는 표적 유전자(예를 들어, MYC)에 근접하고/하거나 이에 작동가능하게 연결된다.
치료제: 본 명세서에 사용되는 바와 같이, 어구 "치료제"는 대상체에게 투여될 때, 치료적 효과를 갖고/갖거나 원하는 생물학적 및/또는 약리학적 효과를 이끌어내는 작용제를 지칭한다. 일부 구현예에서, 치료제는 질환, 장애, 및/또는 병태를 경감시키고/시키거나, 호전시키고/시키거나, 완화하고/하거나, 억제하고/하거나, 예방하고/하거나, 이의 발병을 지연시키고/시키거나, 이의 중증도를 감소시키고/시키거나, 이의 하나 이상의 증상 또는 특징의 발생률을 감소시키는 데 사용될 수 있는 임의의 물질이다. 일부 구현예에서, 치료제는 본 명세서에 기재된 발현 억제 시스템, 예를 들어 발현 리프레서를 포함한다. 일부 구현예에서, 치료제는 본 명세서에 기재된 발현 억제 시스템, 예를 들어 발현 리프레서를 인코딩하는 핵산을 포함한다. 일부 구현예에서, 치료제는 본 명세서에 기재된 약제학적 조성물을 포함한다.
치료적 유효량: 본 명세서에 사용되는 바와 같이, 용어 "치료적 유효량"은 치료 투약계획(therapeutic regimen)의 일부로서 투여될 때 원하는 생물학적 반응을 이끌어내는 물질(예를 들어, 치료제, 조성물, 및/또는 제형)의 양을 의미한다. 일부 구현예에서, 물질의 치료적 유효량은 질환, 장애, 및/또는 병태를 앓거나 이에 취약한 대상체에게 투여될 때 그러한 질환, 장애, 및/또는 병태를 치료하고/하거나, 진단하고/하거나, 예방하고/하거나, 그의 발병을 지연시키기에 충분한 양이다. 당업자에 의해 이해되는 바와 같이, 물질의 유효량은 원하는 생물학적 종점(들), 전달하려는 물질, 표적 세포(들) 또는 조직(들) 등과 같은 인자들에 따라 달라질 수 있다. 예를 들어, 일부 구현예에서, 질환, 장애, 및/또는 병태를 치료하기 위한 제형 내의 화합물의 유효량은 그러한 질환, 장애, 및/또는 병태를 경감시키고/시키거나, 호전시키고/시키거나, 완화하고/하거나, 억제하고/하거나, 예방하고/하거나, 이의 발병을 지연시키고/시키거나, 이의 중증도를 감소시키고/시키거나, 이의 하나 이상의 증상 또는 특징의 발생률을 감소시키는 양이다. 일부 구현예에서, 치료적 유효량은 단회 용량으로 투여되고; 일부 구현예에서는, 치료적 유효량을 전달하기 위해 다회 단위 용량이 요구된다.
본 개시내용의 구현예에 대한 하기의 상세한 설명은 첨부 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 개시내용을 설명할 목적으로, 도면에 현재 예시된 구현예가 나타나 있다. 그러나, 본 개시내용은 도면에 나타낸 구현예의 정밀한 배열 및 수단으로 한정되지 않음이 이해되어야 한다.
도 1a는 DNA 메틸트랜스퍼라제에 융합된 DBD를 사용하는 MYC 프로모터의 지속 가능한 블록, 및 DBD 또는 단기 이펙터에 융합된 DBD를 사용하는 CTCF/TF 부위의 일시적인(48/72시간) 블록에 기반한 이중 표적 접근법의 개략적인 표현을 도시한다.
도 1b는 MYC 유전자에 대한 표적 부위(CTCF 및 프로모터)의 가이드 RNA 국재화 및 염색질 맥락을 도시한다. 상부에서 하부로, 그래프는 HepG2 세포의 MYC 유전자좌에 대해, H3K4me3(히스톤 H3 Ky 트리메틸화) 수준; H3K9me3(히스톤 H3 K9 트리메틸화) 수준(복제물 1); H3K9me3(히스톤 H3 K9 트리메틸화) 수준(복제물 2); H3K27me3(히스톤 H3 K27 트리메틸화) 수준; H3K27ac(히스톤 H3 K27 아세틸화) 수준; GROseq_fwdStrand 수준(정방향 가닥에서 전사적으로 활성인 RNA pol II의 결합); GROseq_revStrand 수준(역방향 가닥에서 전사적으로 활성인 RNA pol II의 결합); RNAseq_rep2 수준(RNAseq를 사용하여 측정된 MYC 전사체 수준, 복제물 2); WGBS(whole-genome bisulfite sequencing; 전체-게놈 중아황산염 서열분석)에 의해 측정된 DNA 메틸화, 및 CTCF 결합 수준을 나타낸다. 4개의 gRNA의 위치는 화살표로 표시되어 있다. gRNAs GD-28859, GD-28616, GD-28862는 MYC의 상류에 있는 앵커 부위에서 또는 그 근처를 표적화하고, gRNA GD-28617은 MYC 프로모터를 표적화한다. 본 개시내용에서, GD-28859는 또한 GD-59로 지칭되고; GD-28616은 또한 GD-16으로 지칭되며; GD-28862는 또한 GD-62로 지칭되고; GD-28617은 또한 GD-17로 지칭된다.
도 1c는 예시적인 이중-시스트론 작제물의 개략도를 나타낸다. 작제물의 5' 말단은 역 5' 대 5' 트리포스페이트 연결을 통해 mRNA의 제1 뉴클레오타이드에 연결되는 N7-메틸화 구아노신에 의해 한정된 캡(cap) 구조를 가진다. 일부 구현예에서, 캡 구조는 단백질 번역 및 안정성을 촉진시킨다. 캡 구조의 하류에는 높은 수준의 단백질 번역을 촉진시키도록 설계된 비-번역 영역(5' UTR)이 있고, 이어서 단백질의 번역을 시작하기 위해 리보솜에 의해 인식되는 표준 "코작" 서열이 있다. "코작" 서열 다음에는 제1 표적화 모이어티와 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 tPT2A "리보솜 스킵핑" 서열(링커)로 분리되는 제2 표적화 모이어티와 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하는 단일 연속 서열인 CDS이다. 이론에 의해 구애되고자 함이 없이, 리보솜이 tPT2A 링커에 도달하면, 리보솜은 링커를 아미노산으로 번역하기 시작한다. P2A 링커로부터 생산된 처음 18개 아미노산은 제1 발현 리프레서(예를 들어, ZF DBD 및 MQ1을 포함함)의 C-말단 끝에 남아 있으며, 그 다음 리보솜은 이를 방출한다. 그 다음 리보솜은 T2A 링커에 도달할 때까지 계속 이동하고, T2A 링커의 처음 17개 잔기는 번역되어 방출된다. 다음으로, 단일 아미노산 및 그 다음 제2 발현 리프레서(예를 들어, 제2 ZF DBD 및 KRAB를 포함함)의 시작부를 포함하는 제2 폴리펩타이드가 번역된다. CDS 다음에는 높은 수준의 번역을 돕고 또한 mRNA를 안정화시키도록 설계된 3' UTR이 있다. 마지막으로, mRNA의 3' 최말단에는 폴리A 테일이 있다. 일부 구현예에서, 폴리A 테일은 단백질 번역 및 mRNA 안정성을 촉진시킨다.
도 2a는 CTCF 모티프의 Cas9-뉴클레아제 편집이 MYC 발현의 하향조절을 초래함을 나타낸다. (GD-28616과 함께) Cas9로 CTCF 모티프를 파괴하면 3가지 HCC 세포주(HepG2, Hep3B 및 SKHEP1) 모두에서 MYC 발현의 32 내지 39% 하향조절을 초래한다. CTCF 모티프(GD-28859)에 인접한 영역의 파괴는 3가지 세포주 중 2가지(HepG2 및 Hep3B)에서 MYC 발현을 35 내지 45% 조절하였다.
도 2b는 모든 세포주의 편집에서 AmpSeq에 의해 평가된 편집 효율이 77 내지 100%임을 확인했음을 나타낸다.
도 3은 dCas9-KRAB가 프로모터 또는 연관 CTCF 모티프로 유도될 때 MYC 발현을 하향조절함을 나타낸다. dCas9-KRAB/GD-28616의 LNP-매개 형질감염은 Hep3B 및 SKHEP1에서의 48/72시간 시점에서 11 내지 34%만큼 MYC 발현을 하향조절하였다. dCas9-KRAB/GD-28859의 LNP-매개 형질감염은 3가지 HCC 모델 모두에서의 48/72시간 시점에서 18 내지 44%만큼 MYC 발현을 하향조절하였다. dCas9-KRAB/GD-28617을 통해 dCas9-KRAB를 MYC 프로모터로 유도하면 3가지 HCC 모델 모두에서의 48/72시간 시점에서 24 내지 58%만큼 MYC 발현을 하향조절하였다.
도 4a는 프로모터 연관 CTCF 모티프에서 sgRNA 국재화 및 징크 핑거 디자인을 도시한다. 도면은 서열번호 208을 개시한다.
도 4b는 프로모터 연관 CTCF로 유도된 ZF-KRAB 작제물은 Hep3B에서 MYC 하향조절을 초래하였음을 나타낸다. ZF2-KRAB, ZF3-KRAB 및 ZF4-KRAB는 Hep3B 세포에서 dCas9-KRAB/GD-28859와 동등하거나 더 큰 정도로 MYC를 하향조절하며, 이 때 ZF3-KRAB는 가장 강한 하향조절 효과를 나타내었다.
도 4c는 ZF3-이펙터 없음(No-Effector) 및 ZF3-KRAB가 다수의 인간 HCC 모델(HepG2, Hep3B, 및 SKHEP1)에서 MYC 발현을 하향조절함을 나타낸다. ZF3-KRAB는 또한 다른 2가지 HCC 모델, 즉 HepG2 및 SKHEP1에서 ZF3-이펙터 없음 및 ZF5-이펙터 없음과 동등하거나 더 큰 정도로 MYC를 하향조절하는 것으로 나타났다.
도 4d는 ZF3-이펙터 없음 및 ZF3-KRAB가 상이한 시점(24시간, 72시간, 및 120시간)에서 Hep3B 세포의 MYC 발현 및 생존능에 대해 동등한 효과를 나타냄을 보여준다.
도 5는 dCas9-MQ1이 다수의 HCC 모델(HepG2, Hep3B, 및 SKHEP1)의 MYC 프로모터에서 유도될 때 MYC 발현을 하향조절함을 나타낸다.
도 6a는 MYC 프로모터에서 sgRNA 국재화 및 징크 핑거 디자인을 도시한다. 도면은 서열번호 209를 개시한다.
도 6b는 6개의 ZF-MQ1 작제물이 Hep3B에서 MYC 하향조절에 대한 효과에 대해 스크리닝된 MYC 프로모터에 대해 지시됨을 도시한다. ZF8-MQ1, ZF9-MQ1 및 ZF11-MQ1은 Hep3B 세포에서 가장 큰 정도로 MYC를 하향 조절하였으며, 이 때 ZF9-KRAB MQ1은 가장 강력한 하향조절 효과를 나타내었다.
도 7a는 ZF9-MQ1이 ZF12-MQ1과 비교하여 Hep3B에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7b는 ZF9-MQ1이 ZF12-MQ1과 비교하여 HepG2에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7c는 ZF9-MQ1이 ZF12-MQ1과 비교하여 SKHEP1에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7d는 ZF9-MQ1이 ZF8-MQ1과 비교하여 Hep3B에서 MYC 발현을 하향조절하고 생존능을 감소시키는 데 더 효율적임을 나타낸다.
도 7e는 ZF9-MQ1이 ZF8-MQ1과 비교하여 HepG2에서 MYC 발현을 하향조절하고 생존능을 감소시키는 데 더 효율적임을 나타낸다.
도 7f는 ZF9-MQ1이 ZF8-MQ1과 비교하여 SKHEP1에서 MYC 발현을 하향조절하고 생존능을 감소시키는 데 더 효율적임을 나타낸다.
도 7g는 ZF9-MQ1이 dCas9-MQ1/GD17과 비교하여 Hep3B에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7h는 ZF9-MQ1이 dCas9-MQ1/GD17과 비교하여 HepG2에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 7i는 ZF9-MQ1이 dCas9-MQ1/GD17과 비교하여 SKHEP1에서 MYC 발현을 상당히 하향조절하고 생존능을 감소시킴을 나타낸다.
도 8a는 dCas9-MQ1이 3가지 세포주(Hep3B, HepG2, 및 SKHEP1) 전체에 걸쳐 72시간에 mRNA의 50 내지 90% 감소를 초래하였음을 나타낸다.
도 8b는 SK-HEP-1 생존능이 MYC 하향조절에 의해 최소로 영향을 받았지만, HepG2 및 Hep3B에서 72 및 168시간에 생존능을 극적으로 감소시켰음을 나타낸다.
도 8c는 7일 및 11일에 MYC mRNA가 각각 약 70% 및 약 55% 감소되었음을 나타낸다. 15일까지, 전사체에서 약 40% 하향 조절이 유지되었다.
도 8d는 dCas9-MQ1/GD-28617에 의한 처리가 표적화된 영역으로의 새로운(de novo) 메틸화를 지시하고 이러한 전사 변화가 표적 영역에서 CpG 메틸화의 백분율과 밀접한 상관관계가 있으며 확인된 메틸화가 15일까지 지속된다는 것을 나타낸다.
도 9는 dCas9-MQ1/GD-17에 의한 처리가 생체내에서 종양 성장을 억제함을 나타낸다.
도 10은 dCas9-MQ1/GD-17이 인간 간세포에서 B형 간염과 관련하여 MYC를 하향조절함을 나타낸다.
도 11은 CTCF 모티프(ZF3-NE 또는 ZF3-KRAB)에 직접 인접한 상류 영역에 대해 징크-핑거 도메인에 융합된 KRAB 이펙터(또는 이펙터 없음 또는 NE)를 표적화 하는 것 및 MYC 프로모터에 대해 징크-핑거 도메인에 융합된 MQ1 이펙터를 표적화하는 것이 MYC1 mRNA 발현을 하향조절함을 나타낸다.
도 12는 ZF3-KRAB와 ZF9-MQ1이 ZF9-MQ1 단독 또는 ZF3-NE와 ZF9-MQ1 조합보다 더 큰 정도로 MYC를 하향조절함을 나타낸다.
도 13a는 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1이 5가지 HCC 세포주, 즉 Hep3B, HepG2, SKHEP1, SNU-182 및 SNU-449에서 다수 농도로 투약되었음을 나타낸다.
도 13b 내지 f는 ZF9-MQ1이 테스트된 5가지 HCC 세포주 모두에서 MYC 발현을 하향조절하고 생존능을 감소시키며 ZF9-MQ1이 0.028 ug/ml LNP/mRNA의 중간 EC50으로 MYC 발현을 하향조절함을 나타내고, 이 때 HepG2 세포주에서 72시간째에 시험관내에서 생존능에 대해 약 10배 더 높은 중간 EC50(0.13 ug/ml)을 나타낸다.
도 14는 ZF9-MQ1이 PBS 대조군 처리 마우스와 비교할 때 (6일째부터 앞으로) 종양 성장을 상당히 감소시킬 수 있었고 ZF9-MQ1은 소분자 비교자(MYCi975)보다 종양 성장을 더 많이 감소시켰음을 나타낸다(A). ZF9-MQ1은 PBS 또는 MYCi975와 비교하여 전체 동물 체중에 대해 최소한의 영향을 미쳤다(B).
도 15a는 ZF9-MQ1과 ZF3-KRAB의 조합이 2회 용량 동안 5일마다 1.5 mg/kg, 3회 용량 동안 5일마다 3 mg/kg, 1회 용량 동안 3일마다 3 mg/kg으로 소라페닙과 비슷한 수준으로 종양 성장을 감소시켰음을 나타낸다.
도 15b는 소라페닙으로 처리될 때 전체 동물 체중에 대한 영향과 비교하여 ZF9-MQ1과 ZF3-KRAB의 조합이 전체 동물 체중에 대해 최소한의 영향을 미쳤음을 나타낸다.
도 16a는 1 mg/kg의 ZF9-MQ1(13일째부터 앞으로) 및 ZF9-MQ1과 ZF3-KRAB의 공제형(co-formulation)(6일째부터 앞으로)이 음성 대조군 처리 마우스와 비교할 때 종양 성장을 상당히 감소시킬 수 있었음을 나타낸다.
도 16b는 3 mg/kg의 ZF9-MQ1과 ZF3-KRAB의 개별 및 공제형이 음성 대조군 처리 마우스와 비교하여 종양 성장을 감소시킬 수 있었음을 나타낸다.
도 16c는 ZF9-MQ1과 ZF3-KRAB의 공제형이 1mg/kg 및 3 mg/kg 투약량 둘 다에서 시스플라틴 또는 소분자 비교자(MYCi975)보다 유사하거나 더 높은 수준으로 종양 성장을 감소시킬 수 있었음을 나타낸다.
도 16d는 시스플라틴 또는 MYCi975 중 어느 하나로 처리될 때 전체 동물 체중에 대한 영향과 비교하여 1 mg/kg 및 3 mg/kg 투약량 둘 다에서 ZF9-MQ1과 ZF3-KRAB의 공제형으로의 처리가 전체 동물 체중에 대해 최소한의 영향을 미쳤음을 나타낸다.
도 17a는 ZF9-MQ1이 처리 120시간 후 A549 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17b는 ZF9-MQ1이 처리 120시간 후 NCI-H2009 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17c는 ZF9-MQ1이 처리 120시간 후 NCI-H358 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17d는 ZF9-MQ1이 처리 72시간 후 HCC95 세포주에서 MYC mRNA 수준을 80% 초과로 감소시켰음을 나타낸다.
도 17e는 ZF9-MQ1이 처리 120시간 후 A549 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 17f는 ZF9-MQ1이 처리 120시간 후 NCI-H2009 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 17g는 ZF9-MQ1이 처리 120시간 후 NCI-H358 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 17h는 ZF9-MQ1이 처리 72시간 후 HCC95 세포주에서 세포 생존능의 손실을 유발하였음을 나타낸다.
도 18a는 처리 96시간 후, 약 17.5%의 세포가 비처리 세포 집단에서 아폽토시스되었음을 나타낸다.
도 18b는 처리 96시간 후, 약 18%의 세포가 ZF9-NE로 처리된 세포 집단에서 아폽토시스되었음을 나타낸다.
도 18c는 처리 96시간 후, 약 38.9%의 세포가 ZF9-MQ1로 처리된 세포 집단에서 아폽토시스되었음을 나타낸다.
도 18d는 처리 96시간 후, 약 38.9%의 세포가 ZF9-MQ1로 처리된 세포 집단에서 아폽토시스된 반면, 비처리 세포 및 ZF9-NE로 처리된 세포 집단에서 약 18%의 아폽토시스 세포가 있음을 나타내며, 이는 ZF9-MQ1이 폐암 세포의 세포 아폽토시스를 유도할 수 있음을 나타낸다.
도 19a 및 b는 ZF9-MQ1이 0.08 ug/ml LNP/mRNA의 EC50로 MYC를 하향조절하며, 이들 A549(도 19a) 및 HCC95(도 19b) 세포주에서 72시간째에 시험관내 생존능(2 ug/ml)에 대해 약 25배 더 높은 EC50 효과를 갖는다는 것을 나타낸다.
도 20a 및 b는 ZF9-MQ1 처리가 폐암 세포주에서 처리 96시간 후 MYC 단백질 수준을 80% 초과로 감소시킴을 나타낸다.
도 21은 ZF9-MQ1이 PBS 대조군 처리 마우스와 비교할 때 (8일째부터 앞으로) 종양 성장을 상당히 감소시킬 수 있었음을 나타낸다. 또한 ZF9-MQ1이 전체 동물 체중에 대해 최소한의 영향을 미치는 것으로 관찰되었다.
도 22는 SSOP를 이용한 LNP 전달을 사용하여 dCAS9-KRAB 이펙터 mRNA와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타내며, 이는 이러한 원위 조절 요소를 사용하여 종양발생 MYC를 감소시키는 능력을 강조한다.
도 23은 MC3을 이용한 LNP 전달을 사용하여 dCAS9-KRAB 이펙터 mRNA와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타내며, 이는 이러한 원위 조절 요소를 사용하여 종양발생 MYC를 감소시키는 능력을 강조한다.
도 24a는 A549 세포주에서 3가지 이펙터 단백질(EZH2, EZH2-KRAB, 및 MQ1) 모두와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타낸다.
도 24b는 NCI-H2009 세포주에서 3가지 이펙터 단백질(EZH2, EZH2-KRAB, 및 MQ1) 모두와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타낸다.
도 25a는 KRAB 또는 MQ1과 함께 전달되는 가이드 RNA GD-29833 및 29914가 처리 120시간 후 A549 세포주에서 MYC mRNA 수준을 상당히 하향조절할 수 있었음을 나타낸다.
도 25b는 KRAB 또는 MQ1과 함께 전달되는 가이드 RNA GD-29833 및 29914가 처리 120시간 후 NCI-H2009 세포주에서 MYC mRNA 수준을 상당히 하향조절할 수 있었고 하향조절이 ZF9-MQ1 처리 후에 관찰되는 하향조절과 비슷하다는 것을 나타낸다.
도 26a는 dCas9-MQ1이 NSCLC에서 표적 부위 메틸화를 약 60%까지 증가시켰음을 나타낸다.
도 26b는 dCas9-MQ1이 원위 프로모터 영역으로 메틸화를 유도하였음을 나타낸다(약 50%까지 증가함).
도 27a 내지 b는 전사 리프레서를 갖는 MYC 폐 슈퍼-인핸서로 가이드를 유도하는 것은 NCI-H2009 폐암 세포주에서 96시간째에 MYC 단백질 수준을 감소시킨다는 것을 나타낸다.
도 28a는 전체 세포 용해물에서 ZF9-MQ1 단백질 존재가 Hep3B를 ZF9-MQ1로 처리한 후 점진적으로 감소됨을 나타낸다.
도 28b는 전체 세포 용해물에서 MYC 단백질 발현이 Hep3B를 ZF9-MQ1로 처리한 후 점진적으로 하향조절됨을 나타낸다.
도 28c는 전체 세포 용해물에서 ZF9-MQ1 단백질 존재가 Hep3B를 ZF9-MQ1로 처리한 후 MYC 단백질의 하향조절과 상관관계가 있음을 나타낸다.
도 29a는 ZF9-MQ1로 처리한 후 SK-HEP 세포주에서 15일까지 여러 시점에서 MYC 전사체에서 45% 하향조절과 함께 mRNA 발현의 하향조절을 나타낸다.
도 29b는 MYC 전사 변화가 15일째까지의 메틸화 백분율과 상관관계가 있음을 나타낸다.
도 30a는 GFP, ZF-NE, 또는 ZF3-KRAB 단독과 비교할 때 0.6 μg/ml, 1.25 μg/ml, 및 2.5 μg/ml의 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로 처리된 1차 간세포가 MYC mRNA 발현의 감소를 보였음을 나타낸다.
도 30b는 0.6 μg/ml, 1.25 μg/ml, 및 2.5 μg/ml 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로의 처리가 1차 간세포의 생존능에 대해 최소한의 영향을 미쳤으며, 이는 HCC 세포주와 비교할 때 MYC 발현의 감소가 정상 세포에 덜 중요하다는 것을 나타낸다.
도 30c는 GFP, ZF-NE, 또는 ZF3-KRAB 단독과 비교할 때 0.5 μg/ml, 1.0 μg/ml, 및 2.0 μg/ml의 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리된 1차 간세포가 MYC mRNA 발현의 감소를 모임을 나타낸다.
도 30d는 0.5 μg/ml, 1.0 μg/ml, 및 2.0 μg/ml 농도에서 ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로의 처리가 1차 간세포의 생존능에 대해 최소한의 영향을 미쳤으며, 이는 HCC 세포주와 비교할 때 MYC 발현의 감소가 정상 세포에 덜 중요하다는 것을 나타낸다.
도 31a는 ZF9-MQ1+ZF3-KRAB로의 처리가 3회 투여 후 종양 크기의 통계적으로 유의한 감소를 나타내었으며, 대조군과 비교하여 25일째에 종양 부피를 63% 감소를 초래하고, ZF9-MQ1+ZF3-KRAB 처리는 종양 부피에 대하여 시스플라틴으로의 처리에 대해 동등한 효과와 연관이 있었음을 나타낸다.
도 31b는 ZF9-MQ1+ZF3-KRAB로 처리된 마우스가 체중의 상당한 감소를 경험하지 않았음을 나타내었다.
도 32a는 1.5 mg/kg에서 ZF9-MQ1+ZF3-KRAB로의 처리가 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되었으며, 음성 대조군과 비교하여 23일째에 종양 성장의 63% 억제를 초래하였음을 나타낸다. 3 mg/kg의 ZF9-MQ1 + ZF3-KRAB는 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되었으며, 음성 대조군과 비교하여 23일째까지 종양 성장의 54% 억제를 초래하고, 6 mg/kg 용량의 ZF9-MQ1 + ZF3-KRAB로의 처리는 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되며, 음성 대조군과 비교하여 23일째에 종양 부피의 63% 감소를 초래한다.
도 32b는 ZF9-MQ1 + ZF3-KRAB로 처리된 마우스가 체중의 상당한 감소를 경험하지 않았음을 나타낸다. 소라페닙으로 처리된 마우스는 처음에 체중 감소를 경험하였고 이후에 종양 덩어리의 증가로 인해 잠재적으로 전체 체중이 증가하였다.
도 33a는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 단일 작제물(ZF3-KRAB 또는 ZF9-MQ1) 단독보다 더 큰 정도로 Hep 3B 세포에서 0.6 μg/ml 및 2.0 μg/ml의 농도에서 MYC mRNA 발현을 하향조절하였음을 나타낸다. 이중-시스트론 ZF9-MQ1_ ZF3-KRAB는 0.6 μg/ml 및 2 μg/ml 농도 둘 다에서 48시간째에 총 MYC mRNA 수준을 99%만큼 감소시켰다.
도 33b는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 단일 작제물(ZF3-KRAB 또는 ZF9-MQ1) 단독보다 더 큰 정도로 Hep 3B 세포에서 세포 생존능을 하향조절하였음을 나타낸다. 이중-시스트론 ZF9-MQ1_ ZF3-KRAB는 0.6 μg/ml 및 2 μg/ml 농도 둘 다에서 Hep3B 세포의 생존능을 각각 약 80% 및 27%만큼 감소시켰다.
도 34a는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 용량-의존적 방식으로 Hep3B 세포에서 MYC mRNA 및 세포 생존능을 하향조절하였음을 나타낸다.
도 34b는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 용량-의존적 방식으로 HepG2 세포에서 MYC mRNA 및 세포 생존능을 하향조절하였음을 나타낸다.
도 34c는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 용량-의존적 방식으로 SKHEP1 세포에서 MYC mRNA 및 세포 생존능을 하향조절하였음을 나타낸다.
도 34d는 이중-시스트론 ZF9-MQ1_ZF3-KRAB 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 HCC S1 및 S2 하위유형 둘 다에 대해 효과적이었음을 나타낸다.
도 35는 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리한 후 48시간째에 75% 초과의 아폽토시스 세포가 Hep 3B 및 Hep G2 세포주에서 검출되었고 약 15% 아폽토시스 세포가 SK-HEP-1 세포주에서 검출되었음을 나타낸다. 세포는 비처리 세포(5 내지 20% 배경 아폽토시스)와 비교하여 비-코딩 mRNA 대조군에 의해 영향을 받지 않았다.
도 36은 SKHEP1 세포에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB 작제물로 1회 처리한 후, MYC mRNA 수준이 1일째에 감소되었고 처리 후 최대 15일까지 억제된 상태를 유지하였음을 나타낸다.
도 37은 이중-시스트론 ZF9-MQ1_ZF3-KRAB 처리가 Hep3B 및 SKHEP1 세포주 둘 다에서 짧은 비-코딩 mRNA 또는 비처리 세포와 비교할 때 6시간째에 MYC mRNA 및 단백질 발현을 감소시켰으며, 96시간 후에 감소된 상태를 유지하였음을 나타낸다.
도 38은 형질감염 후 6 및 24시간 시점 둘 다에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB mRNA에 의해 인코딩된 OEC ZF3-KRAB 및 ZF9-MQ1 단백질 둘 다를 웨스턴 블롯 상의 HA 태그에 의해 시각화하였음을 나타낸다.
도 39a는 SKHEP1에서 0.6 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 소라페닙을 투여하였을 때 소라페닙의 IC50이 12.3 μM에서 10.7 μM로 감소되었음을 나타낸다. 소라페닙이 0.1 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 투여될 때 소라페닙의 IC50은 SKHEP1에서 별로 변하지 않았다.
도 39b는 Hep 3B에서 0.6 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 소라페닙을 투여하였을 때 소라페닙의 IC50이 4.4 μM에서 2.9 μM로 감소되었음을 나타낸다. 소라페닙이 0.1 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 투여될 때 소라페닙의 IC50은 Hep 3B에서 별로 변하지 않았다.
도 40a는 0.6 μg/ml 및 0.1 μg/ml 농도에서 각각 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리될 때 SKHEP1 세포에서 JQ1의 IC50이 감소하였음을 나타낸다.
도 40b는 0.6 μg/ml 및 0.1 μg/ml 농도에서 각각 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리될 때 Hep 3B 세포에서 JQ1의 IC50이 감소하였음을 나타낸다.
도 41a는 0.6 및 1.2 μg/ml 농도 둘 다에서 비처리 세포와 비교하여 ZF17-MQ1이 Hepa1-6 세포에서 마우스 MYC mRNA 발현을 하향조절할 수 있었음을 나타낸다.
도 41b는 0.6 및 1.2 μg/ml 농도 둘 다에서 비처리 세포와 비교하여 ZF17-MQ1이 마우스 Hepa1-6 세포에서 세포 생존능을 감소시킬 수 있었음을 나타낸다.
도 42a는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 24 및 48시간째에 MYC 단백질의 상당한 하향조절을 보였음을 나타낸다.
도 42b는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 24 및 48시간째에 MYC 단백질의 상당한 하향조절을 보였음을 나타낸다.
도 42c는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 96시간째에 MYC mRNA의 상당한 하향조절을 보였음을 나타낸다.
도 42d는 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 96시간째에 세포 생존능의 상당한 손실을 보였음을 나타낸다.
도 43은 ZF17-MQ1이 4회 투약 후 동물 종양 부하를 현저하게 감소시켰고 2주의 약물 휴지기 후, ZF17-MQ1로 마우스를 재처리하여 약 4주 후에 전체 종양 고갈을 초래하였음을 나타낸다.
도 44a는 ZF17-MQ1로 처리된 세포가 비처리 세포 또는 GFP-처리된 세포와 비교하여 LL2 세포에서 MYC 단백질 수준 감소를 보였음을 나타낸다.
도 44b는 비처리 세포에서 관찰된 수준과 비교하여, ZF17-MQ1 및 ZF16-MQ1이 LL2 세포에서 MYC mRNA 수준을 각각 99.9% 초과 또는 74%만큼 감소시켰음을 나타낸다.
도 44c는 3가지 작제물 ZF15-MQ1, ZF16-MQ1, 및 ZF17-MQ1 모두 LL2 세포에서 비처리 세포 및 GFP-처리된 세포보다 더 큰 정도로 세포 생존능을 감소시킬 수 있었음을 나타낸다.
도 45a는 ZF17-MQ1이 1.25 μg/mL 및 2.5 μg/mL 농도 둘 다에서 MYC mRNA 수준을 감소시켰음을 나타낸다. 비처리 세포에서 관찰된 수준과 비교하여, 2.5 μg/mL에서 ZF17-MQ1은 LL2 및 CT26 세포에서 각각 93% 및 85%만큼 MYC mRNA 수준을 감소시켰다.
도 45b는 ZF17-MQ1이 2가지 농도 모두에서 세포 생존능을 감소시켰음을 나타낸다. 비처리 세포와 비교하여, 이러한 조건 하에, ZF17-MQ1은 LL2 및 CT26 세포에서 각각 87% 및 93%만큼 세포 생존능을 감소시켰다.
도 46은 ZF17-MQ1이 CMT167 및 LL2 세포에서 비처리 세포 및 GFP-처리된 세포(음성 대조군)보다 더 큰 정도로 MYC mRNA를 하향조절하였고 세포 생존능을 감소시킴을 나타낸다. 비처리 세포에서 관찰된 수준과 비교하여, ZF17-MQ1은 CMT167 및 LL2 세포에서 각각 62% 및 73%만큼 MYC mRNA 수준을 감소시켰다. 또한, 비처리 세포와 비교하여, 이러한 조건 하에, ZF17-MQ1은 CMT167 및 LL2 세포에서 각각 54% 및 57%만큼 세포 생존능을 감소시켰다.
도 47은 1차 소기도 상피 세포, 1차 엽 상피 세포, 및 1차 폐 섬유아세포 각각의 무처리 세포와 비교하여 MYC mRNA 수준을 94%, 96%, 96% 수준만큼 하향조절하였음을 나타낸다. 그러나, 대조군 세포와 비교하여 생존율이 단지 16%, 9%, 및 22%만큼 감소되었다.
도 48a는 ZF9-MQ1 및 JQ1이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 48b는 ZF9-MQ1(0.5 μg/ml) 및 JQ1(최대 6.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 48c는 ZF9-MQ1(1.0 μg/ml) 및 JQ1(최대 6.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 49a는 ZF9-MQ1 및 BET762가 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 49b는 ZF9-MQ1(0.5 μg/ml) 및 BET762(최대 1.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 49c는 ZF9-MQ1(1.0 μg/ml) 및 BET762(최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 50a는 ZF9-MQ1 및 비라브레십이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 50b는 ZF9-MQ1(0.5 μg/ml) 및 비라브레십(최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 50c는 ZF9-MQ1(1.0 μg/ml) 및 비라브레십(최대 313 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 51a는 ZF9-MQ1 및 트라메티닙이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타낸다.
도 51b는 ZF9-MQ1(0.5 μg/ml) 및 트라메티닙(최대 0.05 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 51c는 ZF9-MQ1(1.0 μg/ml) 및 트라메티닙(최대 0.05 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 보였음을 나타낸다.
도 52a는 모든 작제물 ZF9-MQ1, ZF54-KRAB, ZF67-KRAB, 및 ZF68-KRAB가 비처리 세포와 비교하여 처리 후 72시간째에 H2009 세포에서 NMYC mRNA 수준을 적어도 42%만큼 하향조절할 수 있었음을 나타낸다.
도 52b는 작제물 ZF9-MQ1, ZF67-KRAB, 및 ZF68-KRAB가 비처리 세포와 비교하여 처리 후 72시간째에 H226 세포에서 NMYC mRNA 수준을 적어도 27%만큼 하향조절할 수 있었음을 나타낸다.
도 52c는 작제물 ZF9-MQ1 및 ZF54-KRAB 둘 다가 비처리 세포와 비교하여 처리 후 72시간째에 H226 세포에서 NMYC mRNA 수준을 적어도 27%만큼 하향조절할 수 있었음을 나타낸다.
도 52d는 작제물 ZF9-MQ1, ZF61-KRAB, ZF67-KRAB, 및 ZF68-KRAB가 비처리 세포와 비교하여 처리 후 72시간째에 H460 세포에서 NMYC mRNA 수준을 적어도 26%만큼 하향조절할 수 있었음을 나타낸다.
도 53은 테스트한 가장 높은 농도에서, ZF9-MQ1 및 ZF54-KRAB가 각각 개별적으로 비처리된 대조군 세포에 비해, H2009 세포에서 MYC mRNA를 각각 99% 또는 62%만큼 하향조절하였음을 나타낸다. 0.313 μg/mL 미만의 ZF9-MQ1이 1 또는 2 μg/mL ZF54-KRAB와 조합될 때, MYC mRNA가 단독 처리에 대해 관찰된 것보다 더 큰 정도로 하향조절된다.
도 54는 ZF9-MQ1이 48시간까지 비처리된 대조군 세포에 비해 H1299 세포에서 MYC mRNA를 95%만큼 하향조절하였고 144시간째에 대조군 수준의 90%로 하향조절을 유지하였음을 나타낸다. ZF9-MQ1과 ZF54-KRAB의 조합은 48시간째에 MYC mRNA 수준을 98%까지 감소시켰고 144시간째에 대조군 수준의 93%로 하향조절을 유지하였다(도 54). 또한, 데이터는 ZF54-KRAB와 조합된 ZF9-MQ1 및 ZF9-MQ1이 H1299 세포에서 적어도 6일 동안 MYC mRNA 수준을 하향조절하였음을 나타내었다.
도 55는 H2009 세포로의 도입 24시간 후, ZF9-MQ1 및 ZF54-KRAB가 비처리 세포와 비교하여 MYC mRNA 수준을 각각 최대 83% 및 55%까지 하향조절하였음을 나타낸다. MYC mRNA 수준은 처리 48시간 후 비처리된 대조군의 96%에 대해 ZF9-MQ1-처리 세포에서 추가 13%만큼 추가로 감소된 반면, ZF54-KRAB는 MYC 수준을 추가로 하향조절하지 않는다. ZF9-MQ1_ZF54-KRAB 및 ZF54-KRAB_ZF9-MQ1로 처리된 세포에서 MYC mRNA 수준은 처리 후 24시간째에 대조군 세포의 각각 95% 및 96%로 감소되었다. 데이터는 이들 컨트롤러가 ZF9-MQ1보다 더 일찍 MYC mRNA 수준을 감소시켜 H2009 세포에서 24시간째에 ZF9-MQ1 처리된 세포와 비교하여 처리된 세포에서 더 높은 수준의 MYC 하향조절로 이어질 수 있었음을 나타내었다.
도 56은 ZF9-MQ1 처리가 H460 피하 종양 모델에서 소라페닙 유도 종양 성장 억제와 비교하여 유사하거나 더 높은 수준으로 종양 성장을 억제하였음을 나타낸다.
본 개시내용은 본 명세서에 기재된 발현 리프레서 또는 시스템의 사용을 통해 세포, 예를 들어 대상체 또는 환자의 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한, 예를 들어 감소시키기 위한 기술을 제공한다.
암, 자가면역, 심혈관 질환, 및 비만을 포함하여 많은 다양한 질환 및 증후군은 유전자 발현의 오조절에 의해 유발될 수 있다. 특히, 전사 인자의 과발현은 종양형성에 기여하는 것으로 오랫동안 알려져 왔으며, 최근 연구는 과발현된 종양발생 전사 인자가 세포의 핵심 자가조절 회로를 변경할 수 있음을 나타낸다.
전사 인자이며 마스터 세포 조절자인 MYC는 빈번하게 인간 암의 50% 초과에서 조절되지 않으며, 종양형성 과정의 거의 모든 측면에서 중심적인 역할을 한다. 초기 반응 유전자를 제외하고, MYC는 통상적으로 유전자 발현을 상향조절한다. MYC는 가장 빈번하게 증폭되는 종양유전자이며, 이의 유전자 산물의 발현 상승은 종양 공격성 및 불량한 임상 결과와 연관이 있다. 상승된 수준의 c-MYC는 광범위한 조직에서 종양형성을 촉진시킬 수 있다. 대부분의 종양 세포는 이의 성장 및 증식을 위해 전사 인자 c-MYC에 의존한다. MYC 과발현은 또한 만성 간 질환, 예를 들어 바이러스 및 알코올 관련 간 질환에서 연관이 있다. MYC 과발현 수준은 특정 암 하위유형에 따라 다르다. 이론에 의해 구애되고자 함이 없이, MYC 오조절 장애를 앓고 있는 대상체(예를 들어, 전체, 또는 특정 표적 조직 또는 조직들)에서 MYC의 수준을 조절하는 것, 예를 들어 감소시키는 것은 MYC 오조절 장애의 증상을 줄이거나 제거할 수 있다고 생각된다.
본 개시내용은 부분적으로 표적 유전자 프로모터, 예를 들어 MYC 프로모터에 결합하거나 표적 유전자, 예를 들어 MYC 유전자에 작동가능하게 연결된 표적화 모이어티, 및 표적화 모이어티에 의해 국재화될 때 표적 유전자, 예를 들어 MYC의 발현을 조절할 수 있는(예를 들어, 감소시킬 수 있는) 이펙터 모이어티를 포함하는 발현 리프레서를 제공한다. 일부 구현예에서, 본 명세서에 개시된 발현 리프레서는 표적화 모이어티를 통해 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 발현 제어 요소(예를 들어, 프로모터 또는 인핸서, 리프레서 또는 사일런서)에 특이적으로 결합하고 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 조절한다. 일부 구현예에서, 본 명세서에 개시된 발현 리프레서는 표적화 모이어티를 통해 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 특이적으로 결합하고, 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 조절한다. 일부 구현예에서, 본 명세서에 개시된 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 특이적으로 결합하고, 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 조절한다.
본 개시내용은 부분적으로 2개 이상의 발현 리프레서를 포함하는 발현 억제 시스템을 추가로 제공하며, 각각 발현 리프레서는 표적화 모이어티 및 선택적으로 이펙터 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티는 2개 이상의 상이한 서열을 표적화한다(예를 들어, 각 발현 리프레서는 상이한 서열을 표적화할 수 있다). 일부 구현예에서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS))에 결합하고 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열에 결합한다. 일부 구현예에서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS))에 결합하고 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 발현 제어 요소(예를 들어, 인핸서, 슈퍼-인핸서, 리프레서, 또는 사일런서)에 결합한다. 일부 구현예에서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열에 결합하고 제2 발현 리프레서는 표적 유전자에 작동가능하게 연결된 발현 제어 요소(예를 들어, 인핸서, 슈퍼-인핸서, 리프레서, 또는 사일런서)에 결합한다. 일반적으로, 발현 억제 시스템에 의한 표적 유전자, 예를 들어 MYC의 발현 조절은 제1 및 제2 DNA 서열 각각에 대한 제1 발현 리프레서 및 제2 발현 리프레서의 결합을 포함한다. 제1 및 제2 DNA 서열의 결합은 제1 및 제2 이펙터 모이어티를 이들 부위로 국재화한다. 이론에 의해 구애되고자 함이 없이, 일부 구현예에서 제1 및 제2 발현자 모이어티 둘 다의 기능성을 이용하는 것은 제1 및/또는 제2 DNA 서열과 연관되거나 이를 포함하는 표적 유전자의 발현을 안정적으로 억제하며, 예를 들어 여기서 제1 및/또는 제2 DNA 서열은 표적 유전자 또는 하나 이상의 작동가능하게 연결된 전사 제어 요소의 서열이거나 이를 포함한다. 일부 구현예에서, 발현 리프레서 시스템은 이중-시스트론 핵산 서열에 의해 인코딩된다.
본 개시내용은 상기 발현 리프레서 및/또는 발현 리프레서 시스템을 인코딩하는 핵산, 발현 리프레서 및/또는 발현 리프레서 시스템을 포함하는 조성물, 및 상기 핵산을 전달하는 방법을 추가로 제공한다. 본 명세서에 기재된 발현 리프레서 또는 발현 리프레서 시스템을 사용하여 세포에서 표적 유전자 발현, 예를 들어 MYC 유전자 발현을 증가시키는 방법이 추가로 제공된다.
발현 리프레서
본 명세서에 기재된 바와 같이, 본 개시내용은 부분적으로 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한, 예를 들어 감소시키기 위한 발현 리프레서를 제공한다. 일부 구현예에서, 발현 리프레서는 표적 유전자 프로모터, 예를 들어 MYC 프로모터에 결합하는 표적화 모이어티 및 선택적으로 이펙터 모이어티를 포함할 수 있다. 일부 구현예에서, 표적화 모이어티는 표적 DNA 서열, 예를 들어 MYC DNA 서열에 특이적으로 결합하며, 이에 의해 발현 리프레서의 기능성을 DNA 서열로 국재화한다. 일부 구현예에서, 발현 리프레서는 표적화 모이어티 및 하나의 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 표적화 모이어티 및 복수의 이펙터 모이어티(예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개, 또는 그 이상의 이펙터 도메인(및 선택적으로, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 또는 2개 미만의 이펙터 도메인))를 포함한다.
발현 리프레서는 복수의 이펙터 모이어티를 포함할 수 있으며, 각 이펙터 모이어티는 다른 이펙터 모이어티와 상이한 기능성을 포함한다. 예를 들어, 발현 리프레서는 2개의 이펙터 모이어티를 포함할 수 있으며, 제1 이펙터 모이어티는 DNA 메틸라제 기능성을 포함하고 제2 이펙터 모이어티는 전사 리프레서 기능성을 포함한다. 일부 구현예에서, 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현의 감소에 대해 서로 상보적인 기능성을 갖는 이펙터 모이어티를 포함하며, 이들 기능성은 함께, 발현을 억제할 수 있고, 선택적으로, 개별적으로 존재할 때에는 발현을 억제하지 않거나 무시할 만한 정도로 억제한다. 일부 구현예에서, 발현 리프레서는 복수의 이펙터 모이어티를 포함하며, 여기서 각 이펙터 모이어티는 기타 다른 이펙터 모이어티 각각과 상보적이고, 각 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다.
일부 구현예에서, 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현의 감소에 대해 서로 상승작용하는 기능성을 갖는 이펙터 모이어티의 조합을 포함한다. 이론에 의해 구애되고자 함이 없이, 일부 구현예에서, 다수의 전사 활성화 후성유전학적 마커(예를 들어, 다수의 상이한 유형의 후성유전학적 마커 및/또는 주어진 유형의 더 광범위한 마킹)가 개별적으로, 단독으로의 개별적인 변형보다 더 효과적으로 발현을 함께 억제한다는 점에서(예를 들어, 발현의 더 큰 감소 및/또는 발현의 더 오래 지속된 감소의 생성), 게놈 유전자좌에 대한 후성유전학적 변형은 누적된다. 일부 구현예에서, 발현 리프레서는 복수의 이펙터 모이어티를 포함하며, 여기서 각 이펙터 모이어티는 서로의 이펙터 모이어티와 상승작용하고, 예를 들어 각 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다. 일부 구현예에서, (서로 상승작용하는 복수의 이펙터 모이어티를 포함하는) 발현 리프레서는 개별 이펙터 모이어티를 포함하는 발현 리프레서보다 표적 유전자, 예를 들어 MYC의 발현을 억제하는 데 더 효과적이다. 일부 구현예에서, 상기 복수의 이펙터 모이어티를 포함하는 발현 리프레서는 개별 이펙터 모이어티를 포함하는 발현 리프레서보다 표적 유전자, 예를 들어 MYC의 발현을 감소시키는 데 적어도 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.55×, 1.6×, 1.65×, 1.7×, 1.75×, 1.8×, 1.85×, 1.9×, 1.95×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 30×, 40×, 50×, 60×, 70×, 80×, 90×, 또는 100×만큼 효과적이다.
일부 구현예에서, 발현 리프레서는 하나 이상의 표적화 모이어티, 예를 들어 Cas 도메인, TAL 이펙터 도메인, 또는 Zn 핑거 도메인을 포함한다. 일 구현예에서, 발현 리프레서 시스템이 동일한 유형의 2개 이상의 표적화 모이어티, 예를 들어 2개 이상의 Cas 도메인을 포함할 때, 표적화 모이어티는 2개 이상의 상이한 서열에 특이적으로 결합한다. 예를 들어, 2개 이상의 Cas 도메인을 포함하는 발현 리프레서 시스템에서, 2개 이상의 Cas 도메인은 이들 도메인이 단지 이들의 표적 서열에 상응하는 gRNA에만 상당히 결합하도록(예를 들어, 또 다른 Cas 도메인의 표적에 상응하는 gRNA에는 상당히 결합하지 않도록) 선택되거나 변경될 수 있다.
일부 구현예에서, 발현 리프레서는, 예를 들어 펩타이드 결합에 의해, 공유적으로 연결된 표적화 모이어티 및 이펙터 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티 및 이펙터 모이어티는, 예를 들어 하나 이상의 펩타이드 결합 및/또는 링커에 의해 연결되어, 동일한 폴리펩타이드 사슬 상에 위치한다. 일부 구현예에서, 발현 리프레서는, 예를 들어 펩타이드 결합 및/또는 링커에 의해 연결된 표적화 모이어티와 이펙터 모이어티를 포함하는, 융합 분자이거나 이를 포함한다. 일부 구현예에서, 발현 리프레서는 동일한 폴리펩타이드 사슬 상의 이펙터 모이어티의 N-말단에 배치된 표적화 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 동일한 폴리펩타이드 사슬 상의 이펙터 모이어티의 C-말단에 배치된 표적화 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 비-펩타이드 결합에 의해, 공유적으로 연결된 표적화 모이어티 및 이펙터 모이어티를 포함한다. 일부 구현예에서, 표적화 모이어티는 비-펩타이드 결합에 의해 이펙터 모이어티에 접합된다. 일부 구현예에서, 발현 리프레서는 표적화 모이어티 및 복수의 이펙터 모이어티를 포함하며, 표적화 모이어티와 복수의 이펙터 모이어티는, 예를 들어 펩타이드 결합에 의해, 공유적으로 연결된다(예를 들어, 표적화 모이어티와 복수의 이펙터 모이어티는 모두 일련의 공유 결합에 의해 연결되지만, 각 개별 모이어티는 기타 다른 모든 이펙터 모이어티와 공유 결합을 공유할 수 없다).
다른 구현예에서, 발현 리프레서는 공유적으로 연결되지 않은, 예를 들어 서로 비공유적으로 회합된 표적화 모이어티와 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 이펙터 모이어티에 비공유적으로 결합하는 표적화 모이어티를 포함하거나 그 반대로도 성립한다. 일부 구현예에서, 발현 리프레서는 표적화 모이어티 및 복수의 이펙터 모이어티를 포함하며, 표적화 모이어티와 적어도 하나의 이펙터 모이어티는 공유적으로 연결되지 않으며, 예를 들어 서로 비공유적으로 회합되고, 표적화 모이어티와 적어도 하나의 기타 다른 이펙터 모이어티는, 예를 들어 펩타이드 결합에 의해, 공유적으로 연결된다.
일반적으로, 본 명세서에 기재된 바와 같은 발현 리프레서는 (예를 들어, 표적화 모이어티를 통해) 표적 유전자, 예를 들어 MYC에 근접하고/하거나 이에 작동가능하게 연결된 게놈 서열 요소에 결합한다. 일부 구현예에서, 게놈 서열 요소에 대한 발현 리프레서의 결합은 표적 유전자, 예를 들어 MYC의 발현을 조절한다(예를 들어, 감소시킨다). 예를 들어, 게놈 서열 요소에 대한 전사 기구의 성분을 동원하거나 이의 동원을 억제하는 이펙터 모이어티를 포함하는 발현 리프레서의 결합은 표적 유전자, 예를 들어 MYC의 발현을 조절할(예를 들어, 감소시킬) 수 있다. 추가의 예로서, 효소 활성을 갖는 이펙터 모이어티(예를 들어, 후성유전학적 변형 모이어티)를 포함하는 발현 리프레서의 결합은 이펙터 모이어티의 국재화된 효소 활성을 통해 표적 유전자, 예를 들어 MYC의 발현을 조절할(예를 들어, 감소시킬) 수 있다. 추가의 예로서, 게놈 서열 요소에 대한 발현 리프레서의 결합 및 발현 리프레서의 국재화된 효소 활성 둘 다는 표적 유전자, 예를 들어 MYC의 발현에 있어서의 생성되는 조절(예를 들어, 감소)에 기여할 수 있다.
일부 구현예에서, 발현 리프레서는 이펙터 모이어티를 포함하며, 여기서 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KRAB(예를 들어, KRAB 도메인), MeCP2, HP1, RBBP4, REST, FOG1, SUZ12 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함한다.
일부 구현예에서, 발현 리프레서는 제1 이펙터 모이어티 및 제2 이펙터 모이어티를 포함하며, 여기서 제1 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KRAB(예를 들어, KRAB 도메인), MeCP2, HP1, RBBP4, REST, FOG1, SUZ12 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하고, 제2 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KRAB(예를 들어, KRAB 도메인), MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 상이한 단백질을 포함한다.
일부 구현예에서, 본 개시내용은 본 명세서에 기재된 바와 같은 발현 리프레서, 발현 리프레서 시스템, 표적화 모이어티 및/또는 이펙터 모이어티를 인코딩하는 핵산 서열을 제공한다. 당업자는 RNA의 핵산 서열은, 통상적으로 티민(T)이 우라실(U)로 대체된 것을 제외하고는, 상응하는 DNA 서열과 동일함을 인식하고 있다. 뉴클레오타이드 서열이 DNA 서열(예를 들어, A, T, G, C를 포함함)로 표현될 때, 본 개시내용은 또한 "U"가 "T"를 대체하는 상응하는 RNA 서열(예를 들어, A, U, G, C를 포함함)을 제공함이 이해될 것이다. 폴리뉴클레오타이드 서열을 기재하기 위해 본 명세서에서는 통상적인 표기가 사용된다: 단일 가닥 폴리뉴클레오타이드 서열의 좌측단은 5'-단부이고, 이중 가닥 폴리뉴클레오타이드 서열의 우측 방향은 5'-방향으로 지칭된다.
유전자 코드의 축퇴로 인해, 본 명세서에 기재된 바와 같은 표적화 모이어티 및/또는 이펙터 모이어티를 포함하는 발현 리프레서를 인코딩하는 다수의 뉴클레오타이드 서열이 생성될 수 있으며, 이들 중 일부는 본 명세서에 개시된 핵산 서열과 유사성, 예를 들어 90%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는다는 것이 당업자에 의해 이해될 것이다. 예를 들어, 코돈 AGA, AGG, CGA, CGC, CGG, 및 CGU 모두는 아미노산 아르기닌을 인코딩한다. 따라서, 아르기닌이 코돈에 의해 지정된 본 발명의 핵산 분자 내의 모든 위치에서, 그러한 코돈은 인코딩된 폴리펩타이드를 변경시키지 않고서 상기에 기재된 상응하는 코돈 중 임의의 것으로 변경될 수 있다.
일부 구현예에서, 표적화 모이어티 및/또는 이펙터 모이어티를 포함하는 발현 리프레서를 인코딩하는 핵산 응집물(cohesion)은 포유동물, 예를 들어 인간에서 코돈 사용빈도에 따라 최적화된, 코돈-최적화된 코딩 영역의 일부 또는 전부일 수 있다. 일부 구현예에서, 표적화 모이어티 및/또는 이펙터 모이어티를 인코딩하는 핵산 응집물은 단백질 발현을 증가시키고/시키거나 단백질 발현의 지속시간을 증가시키기 위해 코돈 최적화된다. 일부 구현예에서, 코돈 최적화된 핵산 서열에 의해 생성되는 단백질은 코돈 최적화되지 않은 핵산 서열에 의해 인코딩될 때의 단백질의 수준과 비교하여 적어도 1%, 적어도 2%, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 30%, 적어도 40%, 또는 적어도 50% 더 높다.
발현 억제 시스템
본 개시내용의 발현 억제 시스템은 2개 이상의 발현 리프레서를 포함할 수 있다. 일부 구현예에서, 발현 억제 시스템은 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12개, 또는 그 이상(그리고 선택적으로 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 또는 2개 이하)의 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 2개 이상의 상이한 서열(예를 들어, 1번째 및 2번째, 3번째, 4번째, 5번째, 6번째, 7번째, 8번째, 9번째, 10번째, 11번째, 12번째, 및/또는 그 이상의 DNA 서열, 및 선택적으로 20번째, 19번째, 18번째, 17번째, 16번째, 15번째, 14번째, 13번째, 12번째, 11번째, 10번째, 9번째, 8번째, 6번째, 5번째, 4번째, 3번째, 또는 2번째 이하의 DNA 서열)을 표적화한다. 일부 구현예에서, 발현 억제 시스템은 복수의 발현 리프레서를 포함하며, 여기서 복수의 발현 리프레서의 각 구성원은 복수의 발현 리프레서의 또 다른 구성원에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함하며, 여기서 제1 발현 리프레서는 제2 발현 리프레서에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다.
일부 구현예에서, 본 개시내용의 발현 억제 시스템은 2개 이상의 발현 리프레서를 포함하며, 여기서 발현 리프레서는 조성물, 약제학적 조성물, 또는 혼합물 형태로 함께 존재한다. 일부 구현예에서, 본 개시내용의 발현 억제 시스템은 2개 이상의 발현 리프레서를 포함하며, 여기서 하나 이상의 발현 리프레서는 적어도 하나의 기타 다른 발현 리프레서와 혼합되지 않는다. 예를 들어, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함할 수 있으며, 여기서 세포의 핵 내의 제1 발현 리프레서의 존재는 동일한 세포의 핵 내의 제2 발현 리프레서의 존재와 중첩되지 않고, 발현 억제 시스템은 제1 및 제2 발현 리프레서의 비중첩 존재를 통해 MYC 유전자의 발현의 감소를 달성한다. 일부 구현예에서, 발현 억제 시스템은 제1 또는 제2 발현 리프레서 단독에 의해 달성되는 MYC 유전자의 발현 감소와 비교하여 MYC 유전자의 더 큰 발현 감소를 달성한다.
일부 구현예에서, 발현 리프레서 시스템의 발현 리프레서는 각각 상이한 표적화 모이어티를 포함한다(예를 들어, 제1, 제2, 제3, 또는 추가의 발현 리프레서는 각각 서로 상이한 표적화 모이어티를 포함한다). 예를 들어, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함할 수 있으며, 여기서 제1 발현 리프레서는 제1 표적화 모이어티(예를 들어, Cas9 도메인, TAL 이펙터 도메인, 또는 Zn 핑거 도메인)를 포함하고, 제2 발현 리프레서는 제1 표적화 모이어티와 상이한 제2 표적화 모이어티(예를 들어, Cas9 도메인, TAL 이펙터 도메인, 또는 Zn 핑거 도메인)를 포함한다. 일부 구현예에서, '상이한'이란, 별개의 유형의 표적화 모이어티를 포함한다는 것을 의미할 수 있으며, 예를 들어 제1 표적화 모이어티는 Cas9 도메인을 포함하고, 제2 DNA-표적화 모이어티는 Zn 핑거 도메인을 포함한다. 다른 구현예에서, '상이한'이란, 동일한 유형의 표적화 모이어티의 별개의 변이체를 포함한다는 것을 의미할 수 있으며, 예를 들어 제1 표적화 모이어티는 (예를 들어, 제1 종으로부터의) 제1 Cas9 도메인을 포함하고, 제2 표적화 모이어티는 (예를 들어, 제2 종으로부터의) 제2 Cas9 도메인을 포함한다. 일 구현예에서, 발현 리프레서 시스템이 동일한 유형의 2개 이상의 표적화 모이어티, 예를 들어 2개 이상의 Cas9 또는 ZF 도메인을 포함할 때, 표적화 모이어티는 2개 이상의 상이한 서열에 특이적으로 결합한다. 예를 들어, 2개 이상의 Cas9 도메인을 포함하는 발현 리프레서 시스템에서, 2개 이상의 Cas9 도메인은 이들 도메인이 단지 이들의 표적 서열에 상응하는 gRNA에만 상당히 결합하도록(예를 들어, 또 다른 Cas9 도메인의 표적에 상응하는 gRNA에는 상당히 결합하지 않도록) 선택되거나 변경될 수 있다. 추가의 예에서, 2개 이상의 이펙터 모이어티를 포함하는 발현 리프레서 시스템에서, 2개 이상의 이펙터 모이어티는, 이들 모이어티가 단지 이들의 표적 서열에만 상당히 결합하도록(예를 들어, 또 다른 이펙터 모이어티의 표적 서열에는 상당히 결합하지 않도록) 선택되거나 변경될 수 있다.
일부 구현예에서, 발현 리프레서 시스템은 3개 이상의 발현 리프레서를 포함하며, 2개 이상의 발현 리프레서는 동일한 표적화 모이어티를 포함한다. 예를 들어, 발현 리프레서 시스템은 3개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 표적화 모이어티를 포함하고, 제3 발현 리프레서는 상이한 제2 표적화 모이어티를 포함한다. 추가의 예를 들어, 발현 리프레서 시스템은 4개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 표적화 모이어티를 포함하고, 제3 및 제4 발현 리프레서는 상이한 제2 표적화 모이어티를 포함한다. 추가의 예를 들어, 발현 리프레서 시스템은 5개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 표적화 모이어티를 포함하고, 제3 및 제4 발현 리프레서 둘 다는 상이한 제2 표적화 모이어티를 포함하고, 제5 발현 리프레서는 상이한 제3 표적화 모이어티를 포함한다. 상기에 기재된 바와 같이, '상이한'이란, 상이한 유형의 표적화 모이어티를 포함한다는 것, 또는 동일한 유형의 표적화 모이어티의 별개의 변이체를 포함한다는 것을 의미할 수 있다.
일부 구현예에서, 발현 리프레서 시스템의 발현 리프레서는 각각 상이한 DNA 서열에 결합한다(예를 들어, 제1, 제2, 제3, 또는 추가의 발현 리프레서는 각각 서로 상이한 DNA 서열에 결합한다). 예를 들어, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함할 수 있으며, 여기서 제1 발현 리프레서는 제1 DNA 서열에 결합하고, 제2 발현 리프레서는 제2 DNA 서열에 결합한다. 일부 구현예에서, '상이한'이란, 하나의 발현 리프레서에 의해 결합된 DNA 서열과 또 다른 발현 리프레서에 의해 결합된 DNA 서열 사이에 동일하지 않은 적어도 하나의 위치가 존재한다는 것, 또는 하나의 발현 리프레서에 의해 결합된 DNA 서열에 존재하는 적어도 하나의 위치가 또 다른 발현 리프레서에 의해 결합된 DNA 서열에 존재하지 않는다는 것을 의미할 수 있다.
일부 구현예에서, 제1 DNA 서열은 제1 게놈 DNA 가닥 상에 위치할 수 있고, 제2 DNA 서열은 제2 게놈 DNA 가닥 상에 위치할 수 있다. 일부 구현예에서, 제1 DNA 서열은 제2 DNA 서열과 동일한 게놈 DNA 가닥 상에 위치할 수 있다.
일부 구현예에서, 발현 리프레서 시스템은 3개 이상의 발현 리프레서를 포함하며, 2개 이상의 발현 리프레서는 동일한 DNA 서열에 결합한다. 예를 들어, 발현 리프레서 시스템은 3개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 DNA 서열에 결합하고, 제3 발현 리프레서는 상이한 제2 DNA 서열에 결합한다. 추가의 예를 들어, 발현 리프레서 시스템은 4개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 DNA 서열에 결합하고, 제3 및 제4 발현 리프레서 둘 다는 상이한 제2 DNA 서열에 결합한다. 추가의 예를 들어, 발현 리프레서 시스템은 5개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 DNA 서열에 결합하고, 제3 및 제4 발현 리프레서 둘 다는 제2 DNA 서열에 결합하고, 제5 발현 리프레서는 제3 DNA 서열에 결합한다. 상기 기재된 바와 같이, '상이한'이란, 하나의 발현 리프레서에 의해 결합된 DNA 서열과 또 다른 발현 리프레서에 의해 결합된 DNA 서열 사이에 동일하지 않은 적어도 하나의 위치가 존재한다는 것, 또는 하나의 발현 리프레서에 의해 결합된 DNA 서열에 존재하는 적어도 하나의 위치가 또 다른 발현 리프레서에 의해 결합된 DNA 서열에 존재하지 않는다는 것을 의미할 수 있다.
일부 구현예에서, 발현 억제 시스템은 2개 이상(예를 들어, 2개)의 발현 리프레서를 포함하며, 이들 발현 리프레서 중 복수개(예를 들어, 2개)는 상이한 DNA 서열에 결합하는 표적화 모이어티를 포함한다. 그러한 구현예에서, 제1 표적화 모이어티는 제1 DNA 서열에 결합할 수 있고, 제2 DNA-표적화 모이어티는 제2 DNA 서열에 결합할 수 있으며, 제1 및 제2 DNA 서열은 상이하고 중첩되지 않는다. 일부 그러한 구현예에서, 제1 DNA 서열은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100개의 염기쌍(그리고 선택적으로, 500, 400, 300, 200, 100, 95, 90, 85, 80, 75, 70, 65, 60, 55, 또는 50개 이하의 염기쌍)만큼 제2 DNA 서열로부터 분리되어 있다. 일부 그러한 구현예에서, 제1 DNA 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 또는 100개 이하의 염기쌍(그리고 선택적으로, 0개의 염기쌍, 예를 들어 제1 서열과 제2 서열이 서로 직접 인접함)만큼 제2 DNA 서열로부터 분리되어 있다.
일부 구현예에서, 발현 리프레서 시스템의 발현 리프레서는 각각 상이한 이펙터 모이어티를 포함한다(예를 들어, 제1, 제2, 제3, 또는 추가의 발현 리프레서는 각각 서로 상이한 이펙터 모이어티를 포함한다). 예를 들어, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함할 수 있으며, 여기서 제1 발현 리프레서는 제1 이펙터 모이어티(예를 들어, DNA 메틸트랜스퍼라제 또는 이의 기능성 단편을 포함함)를 포함하고, 제2 발현 리프레서는 제1 이펙터 모이어티와 상이한 제2 이펙터 모이어티(예를 들어, 전사 리프레서(예를 들어, KRAB) 또는 이의 기능성 단편을 포함함)를 포함한다. 일부 구현예에서, '상이한'이란, 별개의 유형의 이펙터 모이어티를 포함한다는 것을 의미할 수 있다. 다른 구현예에서, '상이한'이란, 동일한 유형의 이펙터 모이어티의 별개의 변이체를 포함한다는 것을 의미할 수 있으며, 예를 들어 제1 이펙터 모이어티는 (예를 들어, 제1 부위 특이성 또는 아미노산 서열을 갖는) 제1 DNA 메틸트랜스퍼라제를 포함하고, 제2 이펙터 모이어티는 (예를 들어, 제2 부위 특이성 또는 아미노산 서열을 갖는) 제2 DNA 메틸트랜스퍼라제를 포함한다.
일부 구현예에서, 발현 리프레서 시스템은 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 단백질을 포함하고, 제2 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉,, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2, KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이의 기능성 변이체 또는 단편으로부터 선택되는 상이한 단백질을 포함한다.
일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성(예를 들어, MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편)을 포함하고, 다른 이펙터 모이어티는 전사 리프레서 활성(예를 들어, KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편)을 포함하며, 제1 또는 제2 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 히스톤 데아세틸라제 활성(예를 들어, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편)을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성(예를 들어, MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, 또는 이들 중 임의의 것의 기능성 변이체)을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서 제1 또는 제2 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성(예를 들어, KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편)을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 전사 리프레서 활성을 포함하고 다른 이펙터 모이어티는 상이한 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 동일한 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 상이한 히스톤 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 동일한 히스톤 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 다른 이펙터 모이어티는 상이한 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 히스톤 데아세틸라제 활성을 포함하고 다른 이펙터 모이어티는 동일한 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 상이한 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 포함하고 다른 이펙터 모이어티는 동일한 DNA 메틸트랜스퍼라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 상이한 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 DNA 데메틸라제 활성을 포함하고 다른 이펙터 모이어티는 동일한 DNA 데메틸라제 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 전사 리프레서 활성을 포함하고 다른 이펙터 모이어티는 상이한 전사 리프레서 활성을 포함한다. 일부 구현예에서, 제1 또는 제2 이펙터 모이어티는 전사 리프레서 활성을 포함하고 다른 이펙터 모이어티는 동일한 전사 리프레서 활성을 포함한다.
일부 구현예에서, 발현 리프레서 시스템은 3개 이상의 발현 리프레서를 포함하며, 2개 이상의 발현 리프레서는 동일한 DNA-표적화 모이어티를 포함한다. 예를 들어, 발현 리프레서 시스템은 3개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 이펙터 모이어티를 포함하고, 제3 발현 리프레서는 상이한 제2 이펙터 모이어티를 포함한다. 추가의 예를 들어, 발현 리프레서 시스템은 4개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 이펙터 모이어티를 포함하고, 제3 및 제4 발현 리프레서는 상이한 제2 이펙터 모이어티를 포함한다. 추가의 예를 들어, 발현 리프레서 시스템은 5개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 및 제2 발현 리프레서 둘 다는 제1 이펙터 모이어티를 포함하고, 제3 및 제4 발현 리프레서 둘 다는 상이한 제2 이펙터 모이어티를 포함하고, 제5 발현 리프레서는 상이한 제3 이펙터 모이어티를 포함한다. 상기에 기재된 바와 같이, '상이한'이란, 상이한 유형의 이펙터 모이어티를 포함한다는 것, 또는 동일한 유형의 이펙터 모이어티의 별개의 변이체를 포함한다는 것을 의미할 수 있다.
일부 구현예에서, 발현 리프레서 시스템의 2개 이상의(예를 들어, 모든) 발현 리프레서는 서로 공유적으로 회합되지 않으며, 예를 들어 각 발현 리프레서는 임의의 다른 발현 리프레서와 공유적으로 회합되지 않는다. 또 다른 구현예에서, 발현 리프레서 시스템의 2개 이상의 발현 리프레서는 서로 공유적으로 회합된다. 일 구현예에서, 발현 억제 시스템은, 예를 들어 융합 분자로서, 예를 들어 펩타이드 결합 및 선택적으로 링커에 의해 연결된 융합 분자로서, 동일한 폴리펩타이드 상에 배치된 제1 발현 리프레서 및 제2 발현 리프레서를 포함한다. 일부 구현예에서, 펩타이드는 자가-절단 펩타이드, 예를 들어 T2A 자가-절단 펩타이드이다. 일 구현예에서, 발현 억제 시스템은 비-펩타이드 결합에 의해 연결된, 예를 들어 서로 접합된 제1 발현 리프레서와 제2 발현 리프레서를 포함한다.
링커
본 명세서에 개시된 바와 같은 발현 리프레서 또는 발현 리프레서 시스템은 하나 이상의 링커를 포함할 수 있다. 링커는 표적화 모이어티를 이펙터 모이어티에, 이펙터 모이어티를 또 다른 이펙터 모이어티에, 또는 표적화 모이어티를 또 다른 표적화 모이어티에 연결할 수 있다. 링커는 화학 결합, 예를 들어 하나 이상의 공유 결합 또는 비공유 결합일 수 있다. 일부 구현예에서, 링커는 공유적이다. 일부 구현예에서, 링커는 비공유적이다. 일부 구현예에서, 링커는 펩타이드 링커이다. 그러한 링커는 2 내지 30개, 5 내지 30개, 10 내지 30개, 15 내지 30개, 20 내지 30개, 25 내지 30개, 2 내지 25개, 5 내지 25개, 10 내지 25개, 15 내지 25개, 20 내지 25개, 2 내지 20개, 5 내지 20개, 10 내지 20개, 15 내지 20개, 2 내지 15개, 5 내지 15개, 10 내지 15개, 2 내지 10개, 5 내지 10개, 또는 2 내지 5개의 아미노산 길이, 또는 2, 5, 10, 15, 20, 25, 또는 30개 이상의 아미노산 길이(및 선택적으로 최대 50, 40, 30, 25, 20, 15, 10, 또는 5개의 아미노산 길이)일 수 있다. 일부 구현예에서, 링커는 제1 도메인 또는 모이어티를 제2 도메인 또는 모이어티로부터, 예를 들어 DNA-표적화 모이어티를 이펙터 모이어티로부터 이격시키는 데 사용될 수 있다. 일부 구현예에서, 예를 들어, 링커는, 예를 들어 2차 및 3차 구조의 분자 가요성을 제공하기 위하여, DNA-표적화 모이어티와 이펙터 모이어티 사이에 위치될 수 있다. 링커는 본 명세서에 기재된 가요성, 강성, 및/또는 절단성 링커를 포함할 수 있다. 일부 구현예에서, 링커는 가요성을 제공하기 위하여 적어도 하나의 글리신, 알라닌, 및 세린 아미노산을 포함한다. 일부 구현예에서, 일부 구현예에서, 링커는 소수성 링커이며, 이에는, 예를 들어 음으로 하전된 설포네이트 기, 폴리에틸렌 글리콜(PEG) 기, 또는 피로포스페이트 디에스테르 기가 포함된다. 일부 구현예에서, 링커는 조절제로부터 모이어티(예를 들어, 폴리펩타이드)를 선택적으로 방출하도록 절단 가능하지만, 조기 절단을 방지하기에 충분히 안정적이어야 한다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서의 하나 이상의 모이어티 및/또는 도메인은 하나 이상의 링커와 연결된다. 일부 구현예에서, 발현 억제는 표적화 모이어티 및 이펙터 모이어티 사이에 위치된 링커를 포함할 수 있다. 일부 구현예에서, 링커는 ASGSGGGSGGARD(서열번호 137), 또는 ASGSGGGSGG(서열번호 138)의 서열을 가질 수 있다. 일부 구현예에서, 제1 및 제2 리프레서를 포함하는 시스템은 제1 표적화 모이어티와 제1 이펙터 모이어티 사이에 위치된 제1 링커, 및 제2 표적화 모이어티와 제2 이펙터 모이어티 사이에 위치된 제2 링커를 포함할 수 있다. 일부 구현예에서, 제1 및 제2 링커는 동일할 수 있다. 일부 구현예에서, 제1 및 제2 링커는 상이할 수 있다. 일부 구현예에서, 제1 링커는 서열번호 137에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함할 수 있고 제2 링커는 서열번호 138에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖는 서열을 포함할 수 있다.
당업자에 의해 알려진 바와 같이, 일반적으로 사용되는 가요성 링커는 Gly 및 Ser 잔기의 신장으로 주로 구성되는 서열을 갖는다("GS" 링커). 가요성 링커는 어느 정도의 이동 또는 상호작용을 필요로 하는 도메인/모이어티를 결합하는 데 유용할 수 있으며, 작은, 비극성(예를 들어, Gly) 또는 극성(예를 들어, Ser 또는 Thr) 아미노산을 포함할 수 있다. Ser 또는 Thr의 도입은 또한 물 분자와의 수소 결합을 형성함으로써 수용액 중에서의 링커의 안정성을 유지할 수 있으며, 이에 따라 링커와 모이어티/도메인 사이의 불리한 상호작용을 감소시킬 수 있다. 일부 구현예에서, 링커는 GS 링커 또는 이의 변이체, 예를 들어 G4S(서열번호 207)이다.
강성 링커는 도메인들/모이어티들 사이의 고정된 거리를 유지하는 데 그리고 그들의 독립적인 기능을 유지하는 데 유용하다. 강성 링커는 또한, 도메인들의 공간적 분리가 융합체 내의 하나 이상의 성분의 안정성 및 생물활성을 보존하는 데 중요할 때 유용할 수 있다. 강성 링커는 알파 나선-구조 또는 Pro-풍부 서열인 (XP)n을 가질 수 있으며, 여기서 X는 임의의 아미노산, 바람직하게는 Ala, Lys, 또는 Glu를 지정한다.
절단성 링커는 생체내에서 유리 기능성 도메인을 방출할 수 있다. 일부 구현예에서, 링커는 특정 조건 하에서, 예컨대 환원성 시약 또는 프로테아제의 존재 하에서 절단될 수 있다. 생체내 절단성 링커는 이황화물 결합의 가역적 성질을 이용할 수 있다. 한 예에는 2개의 Cys 잔기 사이의 트롬빈-감수성 서열(예를 들어, PRS)이 포함된다. CPRSC의 시험관내 트롬빈 처리는 트롬빈-감수성 서열의 절단을 초래하지만, 가역적 이황화물 결합은 온전하게 남아 있다. 그러한 링커는 알려져 있으며, 예를 들어 문헌[Chen et al. 2013. Fusion Protein Linkers: Property, Design and Functionality. Adv Drug Deliv Rev. 65(10): 1357-1369]에 기재되어 있다. 융합체 내의 링커의 생체내 절단은 또한, 특정 조건 하에 생체내에서, 특정 세포 또는 조직에서 발현되거나 특정 세포 구획 내에 구속된 프로테아제에 의해 수행될 수 있다. 많은 프로테아제의 특이성은 구속된 구획 내에서 링커의 더 느린 절단을 제공한다. 일부 구현예에서, 절단성 링커는 자가-절단성 링커, 예를 들어 T2A 펩타이드 링커일 수 있다. 일부 구현예에서, 링커는 "리보솜 스킵핑" 서열, 예를 들어 tPT2A 링커를 포함할 수 있다.
본 명세서에 기재된 링커에 사용하기에 적합한 분자의 예에는 음으로 하전된 설포네이트 기; 지질, 예컨대 폴리 (--CH2--) 탄화수소 사슬, 예컨대 폴리에틸렌 글리콜(PEG) 기, 이의 불포화 변이체, 이의 하이드록실화 변이체, 이의 아미드화 또는 다른 방식으로의 N-함유 변이체; 비탄소 링커; 탄수화물 링커; 포스포디에스테르 링커, 또는 발현 리프레서의 2개 이상의 성분을 공유적으로 연결할 수 있는 기타 다른 분자가 포함된다. 비공유성 링커가 또한 포함되며, 이에는, 예를 들어 폴리펩타이드가, 예를 들어, 류신, 이소류신, 발린, 또는 아마도 또한 알라닌, 페닐알라닌, 또는 심지어 티로신, 메티오닌, 글리신, 또는 기타 다른 소수성 잔기가 풍부한 일련의 잔기와 같은 폴리펩타이드의 소수성 영역 또는 폴리펩타이드의 소수성 확장을 통해 연결되는 소수성 지질 소구체가 포함된다. 발현 리프레서의 성분들은 전하-기반 화학을 사용하여 연결될 수 있으며, 이로써 발현 리프레서의 양으로 하전된 성분이 또 다른 성분의 음전하에 연결된다.
표적화 모이어티
본 개시내용은 표적 유전자에서, 이에 근접한, 및/또는 이에 작동가능하게 연결된 게놈 서열 요소(예를 들어, 프로모터, TSS, 또는 앵커 서열)를 특정으로 표적화하거나, 이에 결합하는 표적화 모이어티를 포함하는, 예를 들어 발현 리프레서를 제공한다. 표적화 모이어티는 DNA 서열, 예를 들어 표적 유전자, 예를 들어 MYC와 연관된 DNA 서열에 특이적으로 결합할 수 있다. DNA 서열에 특이적으로 결합하는 임의의 분자 또는 화합물이 표적화 모이어티로서 사용될 수 있다.
일부 구현예에서, 표적화 모이어티는 게놈 복합체(예를 들어, ASMC)의 성분을 표적화하고, 예를 들어 이에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자에 작동가능하게 연결된 발현 제어 서열(예를 들어, 프로모터 또는 인핸서)을 표적화하고, 예를 들어 이에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 또는 표적 유전자의 일부를 표적화하고, 예를 들어 이에 결합한다. 표적화 모이어티의 표적은 이의 표적화된 성분으로서 지칭될 수 있다. 표적화된 성분은 표적 유전자에 작동가능하게 연결된 임의의 게놈 서열 요소, 또는 표적 유전자 그 자체일 수 있으며, 이는 프로모터, 인핸서, 앵커 서열, 엑손, 인트론, UTR 인코딩 서열, 스플라이스 부위, 또는 전사 개시 부위를 포함하지만 이에 제한되지 않는다. 일부 구현예에서, 표적화 모이어티는 하나 이상의 표적 앵커 서열(예를 들어, 세포 내의 것)에 특이적으로 결합하고, 비표적화된 앵커 서열(예를 들어, 동일한 세포 내의 것)에는 특이적으로 결합하지 않는다.
일부 구현예에서, 표적화 모이어티는 CRISPR/Cas 도메인, TAL 이펙터 도메인, Zn 핑거 도메인, 펩타이드 핵산(PNA) 또는 핵산 분자일 수 있거나 이를 포함할 수 있다. 일부 구현예에서, 발현 리프레서는 하나의 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 복수의 표적화 모이어티를 포함하며, 여기서 각 표적화 모이어티는 또 다른 표적화 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 복수의 발현 리프레서를 포함하며, 여기서 복수의 발현 리프레서의 각 구성원은 표적화 모이어티를 포함하고, 각 표적화 모이어티는 또 다른 표적화 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 표적화 모이어티를 포함하는 제1 발현 리프레서 및 제2 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 표적화 모이어티는 제2 표적화 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 표적화 모이어티를 포함하는 제1 발현 리프레서 및 제2 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 제1 표적화 모이어티는 또 다른 제1 표적화 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않고, 제2 표적화 모이어티는 또 다른 제2 표적화 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다. 일부 구현예에서, 본 명세서에 기재된 조성물 및 방법에 사용하기 위한 표적화 모이어티는 단량체성 상태, 예를 들어 비이량체성 상태에서 기능성이다(예를 들어, DNA 서열에 결합한다).
일부 구현예에서, 표적화된 성분에 대한 표적화 모이어티의 결합은 또 다른 전사 인자, 게놈 복합체 성분, 또는 게놈 서열 요소에 대한 표적화된 성분의 결합 친화도를 감소시킨다. 일부 구현예에서, 표적화 모이어티는 500, 450, 400, 350, 300, 250, 200, 150, 100, 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1, 0.09, 0.08, 0.07, 0.06, 0.05, 0.04, 0.03, 0.02, 0.01, 0.005, 0.002, 또는 0.001 nM 이하의 KD(그리고 선택적으로, 적어도 50, 40, 30, 20, 10, 9, 8, 7, 6, 5, 4, 3, 2, 1, 0.9, 0.8, 0.7, 0.6, 0.5, 0.4, 0.3, 0.2, 0.1, 0.09, 0.08, 0.07, 0.06, 0.05, 0.04, 0.03, 0.02, 0.01, 0.005, 0.002, 또는 0.001 nM의 KD)로 그의 표적 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 0.001 nM 내지 500 nM, 예를 들어 0.1 nM 내지 5 nM, 예를 들어 약 0.5 nM의 KD로 그의 표적 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 적어도 500, 600, 700, 800, 900, 1000, 2000, 5000, 10,000, 또는 100,000 nM의 KD로 비표적 서열에 결합한다(그리고 선택적으로, 비표적 서열에 상당히 결합하지 않는다). 일부 구현예에서, 표적화 모이어티는 비표적 서열에 결합하지 않는다.
일부 구현예에서, 표적화 모이어티는 표적화된 성분, 예를 들어 표적 유전자, 예를 들어 MYC의 조절 요소(예를 들어, 프로모터 또는 인핸서)에 상보적인 핵산 서열을 포함한다. 일부 구현예에서, 표적화 모이어티는 표적화된 성분에 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 99%, 또는 100% 상보적인 핵산 서열을 포함한다.
일부 구현예에서, 표적화 모이어티는 CRISPR/Cas 도메인, TAL 이펙터 도메인, Zn 핑거 도메인, 또는 핵산 분자일 수 있거나 이를 포함할 수 있다.
일부 구현예에서, 발현 리프레서의 표적화 모이어티는 100, 90, 80, 70, 60, 50, 40, 30, 또는 20개 이하의 뉴클레오타이드(그리고 선택적으로, 적어도 10, 20, 30, 40, 50, 60, 70, 80, 또는 90개의 뉴클레오타이드)를 포함한다. 일부 구현예에서, 융합 분자의 발현 리프레서 또는 이펙터 모이어티는 2000, 1900, 1800, 1700, 1600, 1500, 1400, 1300, 1200, 1100, 1000, 900, 800, 700, 600, 500, 400, 300, 200, 또는 100개 이하의 아미노산(그리고 선택적으로, 적어도 50, 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 1600, 1700, 1800, 또는 1900개의 아미노산)을 포함한다. 일부 구현예에서, 융합 분자의 발현 리프레서 또는 이펙터 모이어티는 100 내지 2000개, 100 내지 1900개, 100 내지 1800개, 100 내지 1700개, 100 내지 1600개, 100 내지 1500개, 100 내지 1400개, 100 내지 1300개, 100 내지 1200개, 100 내지 1100개, 100 내지 1000개, 100 내지 900개, 100 내지 800개, 100 내지 700개, 100 내지 600개, 100 내지 500개, 100 내지 400개, 100 내지 300개, 100 내지 200개, 200 내지 2000개, 200 내지 1900개, 200 내지 1800개, 200 내지 1700개, 200 내지 1600개, 200 내지 1500개, 200 내지 1400개, 200 내지 1300개, 200 내지 1200개, 200 내지 1100개, 200 내지 1000개, 200 내지 900개, 200 내지 800개, 200 내지 700개, 200 내지 600개, 200 내지 500개, 200 내지 400개, 200 내지 300개, 300 내지 2000개, 300 내지 1900개, 300 내지 1800개, 300 내지 1700개, 300 내지 1600개, 300 내지 1500개, 300 내지 1400개, 300 내지 1300개, 300 내지 1200개, 300 내지 1100개, 300 내지 1000개, 300 내지 900개, 300 내지 800개, 300 내지 700개, 300 내지 600개, 300 내지 500개, 300 내지 400개, 400 내지 2000개, 400 내지 1900개, 400 내지 1800개, 400 내지 1700개, 400 내지 1600개, 400 내지 1500개, 400 내지 1400개, 400 내지 1300개, 400 내지 1200개, 400 내지 1100개, 400 내지 1000개, 400 내지 900개, 400 내지 800개, 400 내지 700개, 400 내지 600개, 400 내지 500개, 500 내지 2000개, 500 내지 1900개, 500 내지 1800개, 500 내지 1700개, 500 내지 1600개, 500 내지 1500개, 500 내지 1400개, 500 내지 1300개, 500 내지 1200개, 500 내지 1100개, 500 내지 1000개, 500 내지 900개, 500 내지 800개, 500 내지 700개, 500 내지 600개, 600 내지 2000개, 600 내지 1900개, 600 내지 1800개, 600 내지 1700개, 600 내지 1600개, 600 내지 1500개, 600 내지 1400개, 600 내지 1300개, 600 내지 1200개, 600 내지 1100개, 600 내지 1000개, 600 내지 900개, 600 내지 800개, 600 내지 700개, 700 내지 2000개, 700 내지 1900개, 700 내지 1800개, 700 내지 1700개, 700 내지 1600개, 700 내지 1500개, 700 내지 1400개, 700 내지 1300개, 700 내지 1200개, 700 내지 1100개, 700 내지 1000개, 700 내지 900개, 700 내지 800개, 800 내지 2000개, 800 내지 1900개, 800 내지 1800개, 800 내지 1700개, 800 내지 1600개, 800 내지 1500개, 800 내지 1400개, 800 내지 1300개, 800 내지 1200개, 800 내지 1100개, 800 내지 1000개, 800 내지 900개, 900 내지 2000개, 900 내지 1900개, 900 내지 1800개, 900 내지 1700개, 900 내지 1600개, 900 내지 1500개, 900 내지 1400개, 900 내지 1300개, 900 내지 1200개, 900 내지 1100개, 900 내지 1000개, 1000 내지 2000개, 1000 내지 1900개, 1000 내지 1800개, 1000 내지 1700개, 1000 내지 1600개, 1000 내지 1500개, 1000 내지 1400개, 1000 내지 1300개, 1000 내지 1200개, 1000 내지 1100개, 1100 내지 2000개, 1100 내지 1900개, 1100 내지 1800개, 1100 내지 1700개, 1100 내지 1600개, 1100 내지 1500개, 1100 내지 1400개, 1100 내지 1300개, 1100 내지 1200개, 1200 내지 2000개, 1200 내지 1900개, 1200 내지 1800개, 1200 내지 1700개, 1200 내지 1600개, 1200 내지 1500개, 1200 내지 1400개, 1200 내지 1300개, 1300 내지 2000개, 1300 내지 1900개, 1300 내지 1800개, 1300 내지 1700개, 1300 내지 1600개, 1300 내지 1500개, 1300 내지 1400개, 1400 내지 2000개, 1400 내지 1900개, 1400 내지 1800개, 1400 내지 1700개, 1400 내지 1600개, 1400 내지 1500개, 1500 내지 2000개, 1500 내지 1900개, 1500 내지 1800개, 1500 내지 1700개, 1500 내지 1600개, 1600 내지 2000개, 1600 내지 1900개, 1600 내지 1800개, 1600 내지 1700개, 1700 내지 2000개, 1700 내지 1900개, 1700 내지 1800개, 1800 내지 2000개, 1800 내지 1900개, 또는 1900 내지 2000개의 아미노산을 포함한다.
본 명세서에 개시된 바와 같은 발현 리프레서 또는 시스템은 핵산, 예를 들어 하나 이상의 핵산을 포함할 수 있다. 용어 "핵산"은 올리고뉴클레오타이드 사슬 내로 도입되거나 도입될 수 있는 임의의 화합물을 지칭한다. 일부 구현예에서, 핵산은 포스포디에스테르 결합을 통해 올리고뉴클레오타이드 사슬 내로 도입되거나 도입될 수 있는 화합물 및/또는 물질이다. 맥락으로부터 명백한 바와 같이, 일부 구현예에서 "핵산"은 개별 핵산 잔기(예를 들어, 뉴클레오타이드 및/또는 뉴클레오시드)를 지칭하고; 일부 구현예에서, "핵산"은 개별 핵산 잔기들을 포함하는 올리고뉴클레오타이드 사슬을 지칭한다. 일부 구현예에서, "핵산"은 RNA이거나 이를 포함하고; 일부 구현예에서, "핵산"은 DNA이거나 이를 포함한다. 일부 구현예에서, 핵산은 50% 초과의 리보뉴클레오타이드이거나 이를 포함하고 본 명세서에서 리보핵산(RNA)으로 지칭된다. 일부 구현예에서, 핵산은 하나 이상의 천연 핵산 잔기이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 하나 이상의 핵산 유사체이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산 유사체는 포스포디에스테르 백본을 이용하지 않는다는 점에서 핵산과 상이하다. 예를 들어, 일부 구현예에서, 핵산은 하나 이상의 "펩타이드 핵산"이거나, 이를 포함하거나, 이로 구성되는데, 펩타이드 핵산은 당업계에 알려져 있고, 백본 내에 포스포디에스테르 결합 대신에 펩타이드 결합을 가지며, 본 발명의 범주 내에 있는 것으로 여겨진다. 대안적으로 또는 추가적으로, 일부 구현예에서, 핵산은 포스포디에스테르 결합 대신에 하나 이상의 포스포로티오에이트 및/또는 5'-N-포스포르아미다이트 결합을 갖는다. 일부 구현예에서, 핵산은 하나 이상의 천연 뉴클레오시드(예를 들어, 아데노신, 티미딘, 구아노신, 시티딘, 우리딘, 데옥시아데노신, 데옥시티미딘, 데옥시 구아노신, 및 데옥시시티딘)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 하나 이상의 뉴클레오시드 유사체(예를 들어, 2-아미노아데노신, 2-티오티미딘, 이노신, 피롤로-피리미딘, 3-메틸 아데노신, 5-메틸시티딘, C-5 프로피닐-시티딘, C-5 프로피닐-우리딘, 2-아미노아데노신, C5-브로모우리딘, C5-플루오로우리딘, C5-요오도우리딘, C5-프로피닐-우리딘, C5-프로피닐-시티딘, C5-메틸시티딘, 2-아미노아데노신, 7-데아자아데노신, 7-데아자구아노신, 8-옥소아데노신, 8-옥소구아노신, 0(6)-메틸구아닌, 2-티오시티딘, 메틸화 염기, 삽입된 염기, 및 이들의 조합)이거나, 이를 포함하거나, 이로 구성된다. 일부 구현예에서, 핵산은 천연 핵산 내의 것들과 비교할 때 하나 이상의 변형된 당(예를 들어, 2'-플루오로리보스, 리보스, 2'-데옥시리보스, 아라비노스, 및 헥소스)을 포함한다. 일부 구현예에서, 핵산은 기능성 유전자 산물, 예컨대 RNA 또는 단백질을 인코딩하는 뉴클레오타이드 서열을 갖는다. 일부 구현예에서, 핵산은 하나 이상의 인트론을 포함한다. 일부 구현예에서, 핵산은 천연 공급원로부터의 단리, 상보적 주형을 기반으로 한 중합에 의한 효소적 합성(생체내 또는 시험관내), 재조합 세포 또는 시스템에서의 재생산, 및 화학적 합성 중 하나 이상에 의해 제조된다. 본 명세서에 사용되는 바와 같이, 핵산을 기재하는 데 사용될 때 "재조합"은 자연적으로 발생하지 않는 임의의 핵산을 지칭한다. 일부 구현예에서, 핵산은 적어도 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 20, 225, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500, 600, 700, 800, 900, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000개 또는 그 이상의 잔기 길이이다. 일부 구현예에서, 핵산은 약 2 내지 약 5000개의 뉴클레오타이드, 약 10 내지 약 100개의 뉴클레오타이드, 약 50 내지 약 150개의 뉴클레오타이드, 약 100 내지 약 200개의 뉴클레오타이드, 약 150 내지 약 250개의 뉴클레오타이드, 약 200 내지 약 300개의 뉴클레오타이드, 약 250 내지 약 350개의 뉴클레오타이드, 약 300 내지 약 500개의 뉴클레오타이드, 약 10 내지 약 1000개의 뉴클레오타이드, 약 50 내지 약 1000개의 뉴클레오타이드, 약 100 내지 약 1000개의 뉴클레오타이드, 약 1000 내지 약 2000개의 뉴클레오타이드, 약 2000 내지 약 3000개의 뉴클레오타이드, 약 3000 내지 약 4000개의 뉴클레오타이드, 약 4000 내지 약 5000개의 뉴클레오타이드 또는 그 사이의 임의의 범위의 길이를 가질 수 있다. 일부 구현예에서, 핵산은 부분적으로 또는 전적으로 단일 가닥이고; 일부 구현예에서, 핵산은 부분적으로 또는 전체적으로 이중 가닥이다. 일부 구현예에서, 핵산은, 폴리펩타이드를 인코딩하는 서열의 상보체이거나 폴리펩타이드를 인코딩하는 적어도 하나의 요소를 포함하는 뉴클레오타이드 서열을 갖는다. 일부 구현예에서, 핵산은 효소 활성을 갖는다.
일부 구현예에서, 표적화 모이어티는 핵산 서열, 단백질, 단백질 융합, 또는 막 전좌 폴리펩타이드이거나 이를 포함한다. 일부 구현예에서, 표적화 모이어티는 외인성 연접부 핵형성 분자, 연접부 핵형성 분자를 인코딩하는 핵산, 또는 폴리펩타이드를 표적화하는 서열의 융합체 및 연접부 핵형성 분자로부터 선택된다. 연접부 핵형성 분자는, 예를 들어 CTCF, 코헤신, USF1, YY1, TATA-박스 결합 단백질 연관 인자 3(TAF3), ZNF143 결합 모티프일 수 있다. 일부 구현예에서, 표적화 모이어티는 중합체 또는 중합체 모이어티, 예를 들어 뉴클레오타이드의 중합체(예컨대, 올리고뉴클레오타이드), 펩타이드 핵산, 펩타이드-핵산 믹스머(mixmer), 펩타이드 또는 폴리펩타이드, 폴리아미드, 탄수화물 등이거나 이를 포함한다.
일부 구현예에서, 표적화 모이어티는 핵산이거나 이를 포함한다. 일부 구현예에서, 이펙터 모이어티는 핵산이거나 이를 포함한다. 일부 구현예에서, 모이어티 내에 포함될 수 있는 핵산은 DNA, RNA, 및/또는 인공 또는 합성 핵산 또는 핵산 유사체 또는 모방체이거나 이를 포함할 수 있다. 예를 들어, 일부 구현예에서, 핵산은 게놈 DNA(gDNA), 상보적 DNA(cDNA), 펩타이드 핵산(PNA), 펩타이드-핵산 믹스머(mixmer), 펩타이드- 올리고뉴클레오타이드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체-형성 올리고뉴클레오타이드, 안티센스 올리고뉴클레오타이드, tRNA, mRNA, rRNA, miRNA, gRNA, siRNA 또는 기타 다른 RNAi 분자(예를 들어, 본 명세서에 기재된 바와 같은 비코딩 RNA를 표적화하고/하거나 본 명세서에 기재된 바와 같은 표적화된 게놈 복합체와 연관된 특정 유전자의 발현 산물을 표적화하는 것들) 등 중 하나 이상이거나 이를 포함할 수 있다. 조절제에서 사용하기에 적합한 핵산 서열은 변형된 올리고뉴클레오타이드(예를 들어, 화학적 변형, 예컨대 백본 결합, 당 분자, 및/또는 핵산 염기를 변경시키는 변형) 및/또는 인공 핵산을 포함할 수 있다. 일부 구현예에서, 핵산 서열은 게놈 DNA, cDNA, 펩타이드 핵산(PNA) 또는 펩타이드 올리고뉴클레오타이드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체 형성 올리고뉴클레오타이드, 변형된 DNA, 안티센스 DNA 올리고뉴클레오타이드, tRNA, mRNA, rRNA, 변형된 RNA, miRNA, gRNA, 및 siRNA 또는 기타 다른 RNA 또는 DNA 분자를 포함하지만 이로 한정되지 않는다. 일부 구현예에서, 핵산은 자연-발생 DNA 또는 RNA 잔기가 아닌 하나 이상의 잔기를 포함할 수 있고/있거나, 포스포디에스테르 결합이 아닌(예를 들어, 이를 테면 포스포로티오에이트 결합 등일 수 있는) 하나 이상의 결합을 포함할 수 있고/있거나, 예를 들어 2'O 변형, 예컨대 2'-OmeP와 같은 하나 이상의 변형을 포함할 수 있다. 합성 핵산을 제조하는 데 유용한 다양한 핵산 구조가 당업계에 알려져 있으며(예를 들어, WO2017/062862l 및 WO2014/012081 참조), 당업자는 이들이 본 개시내용에 따라 이용될 수 있음을 이해할 것이다.
핵산의 일부 예는 표적 유전자, 예를 들어 MYC에 혼성화하는 핵산(예를 들어, 본 명세서의 다른 곳에 기재된 바와 같은 gRNA 또는 안티센스 ssDNA), 외인성 핵산, 예컨대 바이러스 DNA 또는 RNA에 혼성화하는 핵산, RNA에 혼성화하는 핵산, 유전자 전사를 간섭하는 핵산, RNA 번역을 간섭하는 핵산, RNA를 안정화시키거나, 예컨대 분해에 대한 표적화를 통하여 RNA를 불안정화시키는 핵산, 및 발현 또는 기능의 간섭을 통한 DNA 또는 RNA 결합 인자를 간섭하는 핵산, 세포내 단백질 또는 단백질 복합체에 연결되어 기능을 조절하는 핵산 등을 포함할 수 있지만, 이에 제한되지 않는다.
일부 구현예에서, 발현 리프레서는 하나 이상의 뉴클레오사이드 유사체를 포함한다. 일부 구현예에서, 핵산 서열은 하나 이상의 천연 뉴클레오사이드, 뉴클레오사이드, 예를 들어 퓨린 또는 피리미딘, 예를 들어 아데닌, 시토신, 구아닌, 티민 및 우라실에 추가하여 또는 그에 대한 대안으로서 하나 이상의 뉴클레오시드 유사체를 포함할 수 있다. 일부 구현예에서, 핵산 서열은 하나 이상의 뉴클레오시드 유사체를 포함한다. 뉴클레오시드 유사체는 5-플루오로우라실; 5-브로모우라실, 5-클로로우라실, 5-요오도우라실, 하이포잔틴, 잔틴, 4-아세틸시토신, 4-메틸벤즈이미다졸, 5-(카르복시하이드록실메틸) 우라실, 5-카르복시메틸아미노메틸-2-티오우리딘, 5-카르복시메틸아미노메틸우라실, 디하이드로우라실, 디하이드로우리딘, 베타-D-갈락토실퀘오신, 이노신, N6-이소펜테닐아데닌, 1-메틸구아닌, 1-메틸이노신, 2,2-디메틸구아닌, 2-메틸아데닌, 2-메틸구아닌, 3-메틸시토신, 5-메틸시토신, N6-아데닌, 7-메틸구아닌, 5-메틸아미노메틸우라실, 5-메톡시아미노메틸-2-티오우라실, 베타-D-만노실퀘오신, 5'-메톡시카르복시메틸우라실, 5-메톡시우라실, 2-메틸티오-N6-이소펜테닐아데닌, 우라실-5-옥시아세트산(v), 위부톡소신(wybutoxosine), 슈도우라실, 퀘오신, 2-티오시토신, 5-메틸-2-티오우라실, 2-티오우라실, 4-티오우라실, 5-메틸우라실, 우라실-5-옥시아세트산 메틸에스테르, 우라실-5-옥시아세트산(v), 5-메틸-2-티오우라실, 3-(3-아미노-3-N-2-카르복시프로필) 우라실, (acp3)w, 2,6-디아미노퓨린, 3-니트로피롤, 이노신, 티오우리딘, 퀘우오신, 위오신, 디아미노퓨린, 이소구아닌, 이소시토신, 디아미노피리미딘, 2,4-디플루오로톨루엔, 이소퀴놀린, 피롤로[2,3-β]피리딘과 같은 뉴클레오시드 유사체, 및 퓨린 또는 피리미딘 측쇄와 염기쌍을 형성할 수 있는 임의의 기타 다른 물질을 포함할 수 있지만 이로 한정되지 않는다.
CRISPR/Cas 도메인
일부 구현예에서, 표적화 모이어티는 CRISPR/Cas 도메인이거나 이를 포함한다. CRISPR/Cas 단백질은 CRISPR/Cas 이펙터 및 선택적으로 하나 이상의 다른 도메인을 포함할 수 있다. CRISPR/Cas 도메인은 통상적으로 클러스터화된 규칙적으로 사이 공간을 둔 짧은 회문성 반복(clustered regulatory interspaced short palindromic repeat; CRISPR) 시스템에 관여하는 단백질, 예를 들어 Cas 단백질과 구조적 및/또는 기능적 유사성을 갖는다. CRISPR/Cas 도메인은 선택적으로 가이드 RNA, 예를 들어 단일 가이드 RNA(sgRNA)를 포함한다. 일부 구현예에서, CRISPR/Cas 도메인에 포함된 gRNA는 CRISPR/Cas 도메인에 의해 비공유적으로 결합된다.
CRISPR 시스템은 원래 박테리아 및 고세균에서 발견된 적응 방어 시스템이다. CRISPR 시스템은 CRISPR-연관 또는 "Cas" 엔도뉴클레아제(예를 들어, Cas9 또는 Cpf1)로 지칭되는 RNA-유도 뉴클레아제를 사용하여 외래 DNA를 절단한다. 예를 들어, 통상적인 CRISPR/Cas 시스템에서, 엔도뉴클레아제는 단일- 또는 이중-가닥 DNA 서열을 표적화하는 서열-특이적, 비-코딩 "가이드 RNA"에 의해 표적 뉴클레오타이드 서열(예를 들어, 서열-편집할 게놈 내의 부위)로 지시된다. CRISPR 시스템의 3가지 클래스(I 내지 III)가 확인되었다. 부류 II CRISPR 시스템은 (다수의 Cas 단백질이 아닌) 단일의 Cas 엔도뉴클레아제를 사용한다. 하나의 부류 II CRISPR 시스템은 II형 Cas 엔도뉴클레아제, 예컨대 Cas9, CRISPR RNA("crRNA"), 및 트랜스-활성화 crRNA("tracrRNA")를 포함한다. crRNA는 통상적으로 표적 DNA 서열에 상응하는 약 20개 뉴클레오타이드 RNA 서열인 "가이드 RNA"를 포함한다. crRNA는 또한 tracrRNA에 결합하여 Rnase III에 의해 절단되는 부분적으로 이중 가닥인 구조를 형성하여 crRNA/tracrRNA 하이브리드를 생성하는 영역을 포함한다. 그 다음 crRNA/tracrRNA 하이브리드는 Cas9 엔도뉴클레아제가 표적 DNA 서열을 인식하고 절단하도록 지시한다. 표적 DNA 서열은 일반적으로 주어진 Cas 엔도뉴클레아제에 특이적인 "프로토스페이서 인접 모티프"(protospacer adjacent motif; "PAM")에 인접하여야 하지만; PAM 서열은 주어진 게놈 전체에 걸쳐 나타난다. 다양한 원핵생물 종으로부터 확인된 CRISPR 엔도뉴클레아제는 고유한 PAM 서열 요건을 가지며; PAM 서열의 예로는 5'-NGG(스트렙토코커스 피오게네스(Streptococcus pyogenes)), 5'-NNAGAA(스트렙토코커스 써모필루스(Streptococcus thermophilus) CRISPR1), 5'-NGGNG(스트렙토코커스 써모필루스 CRISPR3), 및 5'-NNNGATT(네이세리아 메닝지디티스(Neisseria meningiditis))가 있다. 일부 엔도뉴클레아제, 예를 들어 Cas9 엔도뉴클레아제는 G-풍부 PAM 부위, 예를 들어 5'-NGG와 회합되며, PAM 부위(이로부터 5')로부터 3개 뉴클레오타이드 상류의 위치에서 표적 DNA의 평활-말단(blunt-end) 절단을 수행한다. 또 다른 부류 II CRISPR 시스템은 Cas9보다 더 작은 V형 엔도뉴클레아제 Cpf1을 포함하며; 예는 AsCpf1(아시드아미노코커스(Acidaminococcus) 종 유래) 및 LbCpf1(라크노스피라세아에(Lachnospiraceae) 종 유래)을 포함한다. Cpf1-연관 CRISPR 어레이는 tracrRNA의 필요 없이 성숙한 crRNA로 처리되며; 즉, Cpf1 시스템은 표적 DNA 서열을 절단하기 위해 Cpf1 뉴클레아제 및 crRNA만을 필요로 한다. Cpf1 엔도뉴클레아제는 T-풍부 PAM 부위, 예를 들어 5'-TTN과 회합된다. Cpf1은 또한 5'-CTA PAM 모티프를 인식할 수 있다. Cpf1은 4- 또는 5-뉴클레오타이드 5' 오버행(overhang)을 갖는 오프셋 또는 엇갈린 이중 가닥 파손을 도입함으로써, 예를 들어 코딩 가닥 상에서 PAM 부위로부터(이의 3'로부터) 18개 뉴클레오타이드 하류, 및 상보적 가닥 상에서 PAM 부위로부터 23개 뉴클레오타이드 하류에 위치한 5-뉴클레오타이드 오프셋 또는 엇갈린 절단물을 갖는 표적 DNA를 절단하며; 그러한 오프셋 절단으로 인한 5-뉴클레오타이드 오버행은 평활 말단 절단된 DNA에서의 삽입에 의한 것보다는, 상동성 재조합에 의한 DNA 삽입에 의해 더 정확한 유전체 편집을 가능하게 한다. 예를 들어 문헌[Zetsche et al. (2015) Cell, 163:759 - 771]을 참조한다.
다양한 CRISPR 연관(Cas) 유전자 또는 단백질이 본 개시내용에 의해 제공되는 기술에 사용될 수 있으며, Cas 단백질의 선택은 본 방법의 특정 조건에 따라 달라질 것이다. Cas 단백질의 특정 예는 Cas1, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9, Cas10, Cpf1, C2C1, 또는 C2C3을 포함하는 클래스 II 시스템을 포함한다. 일부 구현예에서, Cas 단백질, 예를 들어 Cas9 단백질은 다양한 원핵생물 종들 중 임의의 것으로부터 유래될 수 있다. 일부 구현예에서, 특정 Cas 단백질, 예를 들어 특정 Cas9 단백질은 특정 프로토스페이서-인접 모티프(PAM) 서열을 인식하도록 선택된다. 일부 구현예에서, DNA-표적화 도메인은 서열 표적화 폴리펩타이드, 예컨대 Cas 단백질, 예를 들어 Cas9를 포함한다. 특정 구현예에서, Cas 단백질, 예를 들어 Cas9 단백질은 박테리아 또는 고세균으로부터 수득되거나, 또는 알려진 방법을 사용하여 합성될 수 있다. 특정 구현예에서, Cas 단백질은 그람-양성 박테리아 또는 그람-음성 박테리아에서 유래할 수 있다. 특정 구현예에서, Cas 단백질은 스트렙토코커스(예를 들어, S. 피오게네스, 또는 S. 써모필루스), 프란시셀라(Francisella)(예를 들어, F. 노비시다(novicida)), 스타필로코커스(예를 들어, S. 아우레우스(aureus)), 아시다미노코커스(예를 들어, 아시다미노코커스 BV3L6), 네이세리아(예를 들어, N. 메닝지티디스), 크립토코커스, 코리네박테리움, 헤모필루스(Haemophilus), 유박테리움(Eubacterium), 파스퉤렐라(Pasteurella), 프레보텔라(Prevotella), 베일로넬라(Veillonella), 또는 마리노박터(Marinobacter)에서 유래할 수 있다.
일부 구현예에서, Cas 단백질은 Cas 단백질이 결합 및/또는 기능하기 위한 표적 DNA 서열에 존재하거나 이에 인접하기 위해 프로토스페이서 인접 모티프(PAM)를 필요로 한다. 일부 구현예에서, PAM은 5'에서 3'으로 NGG, YG, NNGRRT, NNNRRT, NGA, TYCV, TATV, NTTN, 또는 NNNGATT이거나, 이를 포함하며, 여기서 N은 임의의 뉴클레오타이드를 나타내고, Y는 C 또는 T를 나타내고, R은 A 또는 G를 나타내고, V는 A 또는 C 또는 G를 나타낸다. 일부 구현예에서, Cas 단백질은 표 1에 열거된 단백질이다, 일부 구현예에서, Cas 단백질은 그의 PAM을 변경하는 하나 이상의 돌연변이를 포함한다 일부 구현예에서, Cas 단백질은 E1369R, E1449H, 및 R1556A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 E782K, N968K, 및 R1015H 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 D1135V, R1335Q, 및 T1337R 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 S542R 및 K607R 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, Cas 단백질은 S542R, K548V, 및 N552R 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
명칭 효소 Aas의 수 PAM PAM 인식을 변경시키기 위한 돌연변이 촉매적으로 사멸되게(catalytically dead) 하기 위한 돌연변이
FnCas9 Cas9 프란시셀라 노비시다 1629 5'-NGG-3' Wt D11A/H969A/N995A
FnCas9 RHA Cas9 프란시셀라 노비시다 1629 5'-YG-3' E1369R/E1449H/R1556A D11A/H969A/N995A
SaCas9 Cas9 스타필로코커스 아우레우스 1053 5'-NNGRRT-3' Wt D10A/H557A
SaCas9 KKH Cas9 스타필로코커스 아우레우스 1053 5'-NNNRRT-3' E782K/N968K/R1015H D10A/H557A
SpCas9 Cas9 스트렙토코커스 피오게네스 1368 5'-NGG-3' Wt D10A/D839A/H840A/N863A
SpCas9 VQR Cas9 스트렙토코커스 피오게네스 1368 5'-NGA-3' D1135V/R1335Q/T1337R D10A/D839A/H840A/N863A
AsCpf1 RR Cpf1 아시다미노코커스 종 BV3L6 1307 5'-TYCV-3' S542R/K607R E993A
AsCpf1 RVR Cpf1 아시다미노코커스 종 BV3L6 1307 5'-TATV-3' S542R/K548V/N552R E993A
FnCpf1 Cpf1 프란시셀라 노비시다 1300 5'-NTTN-3' Wt D917A/E1006A/D1255A
NmCas9 Cas9 네이세리아 메닝지디티스 1082 5'-NNNGATT-3' Wt D16A/D587A/H588A/N611A
일부 구현예에서, Cas 단백질은 뉴클레아제, 예를 들어 뉴클레아제-결핍 Cas를 탈활성화하도록 변형된다. 일부 구현예에서, Cas 단백질은 Cas9 단백질이다. 야생형 Cas9는 gRNA에 의해 표적화된 특이적인 DNA 서열에서 이중 가닥 파손(DSB)을 생성하는 반면, 변형된 기능기를 갖는 다수의 CRISPR 엔도뉴클레아제가 이용가능하며, 예를 들어, Cas9의 "닉카제" 형태는 단일-가닥 파손만을 생성하고; 촉매적으로 비활성인 Cas9("dCas9")는 표적 DNA를 절단하지 않는다. 일부 구현예에서, DNA 서열에 결합하는 dCas는 입체 장애에 의해 그 부위에서 전사를 방해할 수 있다. 일부 구현예에서, DNA-표적화 모이어티는 촉매적으로 비활성인 Cas, 예를 들어 dCas이거나 이를 포함한다. 많은 촉매적으로 비활성인 Cas 단백질이 당업계에 알려져 있다. 일부 구현예에서, dCas9는 Cas 단백질의 각 엔도뉴클레아제 도메인 내의 돌연변이, 예를 들어 D10A 및 H840A 돌연변이를 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D11A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H969A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 N995A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D11A, H969A, 및 N995A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D10A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H557A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D10A 및 H557A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D839A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H840A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 N863A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D10A, D839A, H840A, 및 N863A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 E993A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D917A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 E1006A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D1255A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D917A, E1006A, 및 D1255A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D16A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D587A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 H588A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 N611A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다. 일부 구현예에서, 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9는 D16A, D587A, H588A, 및 N611A 돌연변이 또는 상기 위치에 상응하는 아미노산에 대한 유사한 치환을 포함한다.
또 다른 양태에서, 본 개시내용은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 발현 리프레서 또는 폴리펩타이드에 관한 것이며, 여기서 하나 이상의 표적화 모이어티는 Cas 단백질, 예를 들어 촉매적으로 비활성인 Cas9 단백질, 예를 들어 dCas9, 또는 이의 기능성 변이체 또는 단편을 포함하는 CRISPR/Cas 도메인이거나 이를 포함한다. 일부 구현예에서, dCas9는 서열번호 17의 아미노산 서열을 포함한다:
일부 구현예에서, dCas9는 서열번호 50의 핵산 서열에 의해 인코딩된다:
일부 구현예에서, 표적화 모이어티는 gRNA를 포함하거나 이에 (예를 들어, 공유적으로) 연결된 Cas 도메인을 포함할 수 있다. gRNA는 Cas-단백질 결합에 필요한 "스캐폴드" 서열, 및 게놈 표적을 위한 사용자-정의된 약 20개의 뉴클레오타이드 표적화 서열로 구성되는 짧은 합성 RNA이다. 실제로, 가이드 RNA 서열은 17 내지 24개의 뉴클레오타이드(예를 들어, 19, 20, 또는 21개의 뉴클레오타이드) 길이를 갖고 표적화된 핵산 서열에 상보적이 되도록 일반적으로 설계된다. 효과적인 가이드 RNA의 설계에 사용하기 위한 맞춤형 gRNA 생성기 및 알고리즘이 상업적으로 구매 가능하다. 유전자 편집은 또한, 자연 발생 crRNA-tracrRNA 복합체를 모방하고 tracrRNA(뉴클레아제에 결합하기 위함) 및 적어도 하나의 crRNA(뉴클레아제를 편집을 위해 표적화된 서열로 가이드함) 둘 다를 함유하는 엔지니어링된(합성) 단일 RNA 분자인, 키메라 "단일 가이드 RNA"("sgRNA")를 사용하여 달성되었다. 화학적으로 변형된 sgRNA가 또한 Cas 단백질과 함께 사용하기에 효과적인 것으로 입증되었으며; 예를 들어, 문헌[Hendel et al. (2015) Nature Biotechnol., 985 - 991]을 참조한다. 예시적인 가이드 RNA 서열은 표 2 및 표 13에 개시되어 있다.
일부 구현예에서, gRNA는 표적 유전자와 연관된 DNA 서열에 상보적인 핵산 서열을 포함한다. 일부 구현예에서, DNA 서열은 표적 유전자에 작동가능하게 연결된 발현 제어 요소이거나, 이를 포함하거나, 이와 중첩된다. 일부 구현예에서, gRNA는 표적 유전자와 연관된 DNA 서열에 적어도 90, 95, 99, 또는 100% 상보적인 핵산 서열을 포함한다. 일부 구현예에서, Cas 분자를 포함하는 DNA-표적화 모이어티와 함께 사용하기 위한 gRNA는 sgRNA이다.
일부 구현예에서, CRISPR/Cas 도메인과 함께 사용하기 위한 gRNA는 CTCF와 연관된 표적 서열에 특이적으로 결합한다. 일부 구현예에서, CRISPR/Cas 도메인과 함께 사용하기 위한 gRNA는 프로모터와 연관된 표적 서열에 특이적으로 결합한다. 일부 구현예에서, gRNA는 표 2 또는 표 13에 열거된 표적 서열에 결합한다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 표 2 또는 표 13에 열거된 표적 서열에 결합한다.
예시적인 gRNA 서열
가이드 명칭 표적 부위 표적 서열 게놈 좌표 가닥
GD-28616 CTCF ATGATCTCTGCTGCCAGTAG (서열번호 1) chr8:128746342-128746364 +
GD-28859 CTCF ATCGCGCCTGGATGTCAACG (서열번호 2) chr8:128746321-128746343 -
GD-28862 CTCF ATTGTGCAGTGCATCGGATT (서열번호 3) chr8:128746525-128746547 +
GD-28617 프로모터 GTCAAACAGTACTGCTACGG (서열번호 4) chr8:128748014-128748036 +
일부 구현예에서, 발현 억제 시스템은 제1 DNA-표적화 모이어티를 포함하는 제1 발현 리프레서 및 제2 DNA-표적화 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 DNA-표적화 모이어티는 제1 CRISPR/Cas 도메인이거나 이를 포함하고, 제2 DNA-표적화 모이어티는 제2 CRISPR/Cas 도메인이거나 이를 포함한다. 일부 구현예에서, 제1 CRISPR/Cas 도메인은 제1 CRISPR/Cas 단백질 및 제1 가이드 RNA를 포함하고, 제2 CRISPR/Cas 도메인은 제2 CRISPR/Cas 단백질 및 제2 가이드 RNA를 포함한다. 일부 구현예에서, 제1 CRISPR/Cas 단백질은 제2 가이드 RNA에 별로 결합하지 않으며(이것에 결합하지 않으며), 예를 들어 적어도 10, 20, 50, 100, 1000, 또는 10,000 nM의 KD로 결합하고, 제2 CRISPR/Cas 단백질은 제1 가이드 RNA에 별로 결합하지 않으며(예를 들어, 결합하지 않으며), 예를 들어 적어도 10, 20, 50, 100, 1000, 또는 10,000 nM의 KD로 결합한다.
TAL 이펙터 도메인
일부 구현예에서, DNA-표적화 모이어티는 TAL 이펙터 도메인이거나 이를 포함한다. TAL 이펙터 도메인, 예를 들어 DNA 서열에 특이적으로 결합하는 TAL 이펙터 도메인은 복수의 TAL 이펙터 반복부 또는 이의 단편들을 포함하고, 선택적으로 자연 발생 TAL 이펙터 반복부의 하나 이상의 추가의 부분(예를 들어, 복수의 TAL 이펙터 도메인들의 N- 및/또는 C-말단)을 포함하며, 여기서 각 TAL 이펙터 반복부는 뉴클레오타이드를 인식한다. TAL 이펙터 단백질은 TAL 이펙터 도메인 및 선택적으로 하나 이상의 다른 도메인을 포함할 수 있다. 많은 TAL 이펙터 도메인이 당업자에게 알려져 있으며, 예를 들어 Thermo Fisher Scientific으로부터 상업적으로 구매 가능하다.
TALE는 숙주 식물에서의 유전자 발현을 조절하고, 박테리아 콜로니화 및 생존을 용이하게 하는 식물 병원체 잔토모나스(Xanthomonas)를 포함하는 박테리아성 병원체의 다양한 종에 의해 분비된 천연 이펙터 단백질이다. TAL 이펙터의 특이적 결합은 통상적으로 33 또는 34개의 아미노산의 나란히 정렬된 거의 동일한 반복부들의 중심 반복 도메인을 기준으로 한다(반복부-가변 이(di)-잔기, RVD 도메인).
TAL 이펙터 패밀리의 구성원들은 그들의 반복부들의 수와 순서에서 주로 상이하다. 반복부들의 수는 1.5 내지 33.5개의 반복부 범위이며, C-말단 반복부는 보통 길이가 더 짧고(예를 들어, 약 20개 아미노산), 일반적으로 "절반-반복부"로서 지칭된다. TAL 이펙터의 각 반복부는 상이한 염기쌍 특이성을 나타내는 상이한 반복부 유형과 하나의 반복-대-하나의 염기쌍 상관관계를 특징으로 한다(하나의 반복부는 표적 유전자 서열 상에서 하나의 염기쌍을 인식함). 일반적으로, 반복부의 수가 더 적을수록, 단백질-DNA 상호작용은 더 약해진다. 다수의 6.5개 반복부는 리포터 유전자의 전사를 활성화하기에 충분한 것으로 나타났다(Scholze et al., 2010).
반복부 대 반복부 변이는 아미노산 위치 12 및 13에서 주로 발생하며, 따라서 이는 "초가변"으로 지칭되고, 표적 DNA 프로모터 서열과의 상호작용의 특이성을 담당하며, 이는 예시적인 반복부 가변 이-잔기(RVD) 및 이들의 핵산 염기 표적에 대한 상동성을 열거한 표 3에 나타낸 바와 같다.
RVD 및 핵산 염기 특이성
표적 가능한 RVD 아미노산 조합
A NI NN CI HI KI
G NN GN SN VN LN DN QN EN HN RH NK AN FN
C HD RD KD ND AD
T NG HG VG IG EG MG YG AA EP VA QG KG RG
이에 따라, TAL 이펙터의 반복부를 표적 특이적 DAN 서열로 변형하는 것이 가능하다. 추가의 연구는, RVD NK가 G를 표적화할 수 있음을 나타내었다. TAL 이펙터의 표적 부위는 또한 제1 반복부에 의해 표적화되는 5' 염기에 측접하는 T를 포함하는 경향도 있지만, 이러한 인식의 정확한 기작은 알려지지 않다. 113개가 넘는 TAL 이펙터 서열이 오늘날까지 알려져 있다. 잔토모나스로부터의 TAL 이펙터의 비제한적 예는 Hax2, Hax3, Hax4, AvrXa7, AvrXa10 및 AvrBs3를 포함한다.
이에 따라, 본 개시내용의 TAL 이펙터 도메인의 TAL 이펙터 반복부는 임의의 박테리아 종(예를 들어, 잔토모나스 종, 예컨대 아프리카 균주인, 잔토모나스 오리제 pv. 오리제(Xanthomonas oryzae pv. Oryzae)(Yu et al. 2011), 잔토모나스 캄페스트리스 pv. 라파니(Xanthomonas campestris pv. raphani) 균주 756C 및 잔토모나스오리제 pv. 오리지콜라(Xanthomonas oryzae pv. oryzicola) 균주 BLS256(Bogdanove et al. 2011)으로부터의 TAL 이펙터로부터 유래될 수 있다. 본 명세서에 사용되는 바와 같이, 본 개시내용에 따른 TAL 이펙터 도메인은 RVD 도메인뿐만 아니라 자연 발생 TAL 이펙터로부터의 측접 서열(들)(RVD 도메인의 N-말단 및/또는 C-말단 측부 상에서의 서열)도 포함한다. 이는 자연 발생 TAL 이펙터 도메인의 RVD보다 더 많거나 더 적은 반복부들을 포함할 수 있다. 본 개시내용의 TAL 이펙터 도메인은 상기 코드를 기반으로 한 소정의 DNA 서열 및 당업계에 알려진 다른 것들을 표적화하도록 설계된다. TAL 이펙터 반복부의 수(예를 들어, 단량체 또는 모듈) 및 그의 특이적 서열은 원하는 DNA 표적 서열을 기반으로 하여 선택된다. 예를 들어, TAL 이펙터 반복부는 특이적 표적 서열에 맞도록 제거 또는 부가될 수 있다. 일 구현예에서, 본 개시내용의 TAL 이펙터 도메인은 6.5 내지 33.5개의 TAL 이펙터 반복부를 포함한다. 일 구현예에서, 본 개시내용의 TAL 이펙터 도메인은 8 내지 33.5개의 TAL 이펙터 반복부, 예를 들어 10 내지 25개의 TAL 이펙터 반복부, 예를 들어 10 내지 14개의 TAL 이펙터 반복부를 포함한다.
일부 구현예에서, TAL 이펙터 도메인은 DNA 표적 서열에 대한 완전한 매치에 상응하는 TAL 이펙터 반복부를 포함한다. 일부 구현예에서, DNA 표적 서열 상에서 반복부와 표적 염기쌍 사이의 미스매치는 TAL 이펙터 도메인을 포함하는 발현 억제 시스템, 예를 들어 발현 리프레서의 기능을 가능하게 하는 한 허용된다. 일반적으로, TALE 결합은 미스매치의 수와 역의 상관관계를 갖는다. 일부 구현예에서, 본 개시내용의 발현 리프레서의 TAL 이펙터 도메인은 표적 DNA 서열과, 7개의 미스매치, 6개의 미스매치, 5개의 미스매치, 4개의 미스매치, 3개의 미스매치, 2개의 미스매치, 또는 1개의 미스매치 이하를 포함하고, 선택적으로는 미스매치가 없다. 이론에 의해 구애되고자 함이 없이, 일반적으로 TAL 이펙터 도메인 내 TAL 이펙터 반복부의 수가 더 적을수록, 더 적은 수의 미스매치가 용인될 것이고, TAL 이펙터 도메인을 포함하는 발현 억제 시스템, 예를 들어 발현 리프레서의 기능을 여전히 허용할 것이다. 결합 친화도는 매칭되는 반복부-DNA 조합의 합에 따라 달라지는 것으로 생각된다. 예를 들어, 25개 이상의 TAL 이펙터 반복부를 갖는 TAL 이펙터 도메인은 최대 7개의 미스매치를 용인할 수 있다.
TAL 이펙터 반복부에 더하여, 본 개시내용의 TAL 이펙터 도메인은 자연 발생 TAL 이펙터로부터 유래된 추가의 서열들을 포함할 수 있다. TAL 이펙터 도메인의 TAL 이펙터 반복부의 각각의 측면에 포함된 C-말단 및/또는 N-말단 서열(들)의 길이는 다양할 수 있으며, 예를 들어 문헌[Zhang et al. (2011)]의 연구를 기반으로 하여 당업자에 의해 선택될 수 있다. 상기 문헌[Zhang et al.]은 Hax3 유래된 TAL-이펙터를 기반으로 한 단백질에서 많은 C-말단 및 N-말단 절단 돌연변이체를 특성화하였으며, 표적 서열에 대한 최적 결합 및 이에 따라 전사 활성화에 기여하는, 주요 요소를 확인하였다. 일반적으로, 전사 활성은 N-말단의 길이와 역의 상관관계에 있는 것으로 밝혀졌다. C-말단에 대하여, Hax 3 서열의 최초 68개 아미노산 내 DNA 결합 잔기에 중요한 요소가 확인되었다. 이에 따라 일부 구현예에서, 자연 발생 TAL 이펙터의 TAL 이펙터 반복부의 C-말단부 상에서 최초 68개 아미노산은 본 개시내용의 발현 리프레서의 TAL 이펙터 도메인 내에 포함된다. 따라서, 일 구현예에서 본 개시내용의 TAL 이펙터 도메인은 1) 자연 발생 TAL 이펙터로부터 유래된 하나 이상의 TAL 이펙터 반복부; 2) TAL 이펙터 반복부의 N-말단부에 대한 자연 발생 TAL 이펙터로부터 적어도 70, 80, 90, 100, 110, 120, 130, 140, 150, 170, 180, 190, 200, 220, 230, 240, 250, 260, 270, 280개 이상의 아미노산; 및/또는 3) TAL 이펙터 반복부의 C-말단부 상에서 자연 발생 TAL 이펙터로부터의 적어도 68, 80, 90, 100, 110, 120, 130, 140, 150, 170, 180, 190, 200, 220, 230, 240, 250, 260개 이상의 아미노산을 포함한다.
일부 구현예에서, 조절제는 조작된 DNA 결합 도메인(DBD)을 포함하는 표적화 모이어티, 예를 들어 표적 서열, 예를 들어 표적 유전자(예를 들어, MYC)에 작동가능하게 연결된 프로모터 또는 전사 개시 부위(TSS) 서열, 전사 조절 요소에 근접한 서열, 예를 들어 표적 유전자(예를 들어, MYC)를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열, 예를 들어 앵커 서열에 근접한 서열에 결합하는 TAL 이펙터 반복부를 포함하는 TAL 이펙터를 포함한다. 일부 구현예에서, TAL 이펙터 도메인은 후성유전학적 이펙터 모이어티를 표적 부위로 운반하도록 조작될 수 있다.
Zn 핑거 도메인
일부 구현예에서, DNA-표적화 모이어티는 Zn 핑거 도메인이거나 이를 포함한다. Zn 핑거 도메인은 Zn 핑거, 예를 들어 자연 발생 Zn 핑거 또는 조작된 Zn 핑거, 또는 이의 단편을 포함한다. 많은 Zn 핑거가 당업자에게 알려져 있으며, 예를 들어 Sigma-Aldrich로부터 상업적으로 구매 가능하다. 일반적으로, Zn 핑거 도메인은 복수의 Zn 핑거를 포함하며, 여기서 각 Zn 핑거는 3개의 뉴클레오타이드를 인식한다. Zn 핑거 단백질은 Zn 핑거 도메인 및 선택적으로 하나 이상의 다른 도메인을 포함할 수 있다.
일부 구현예에서, Zn 핑거 도메인은, 선택된 표적 DNA 서열에 결합하도록 조작된, 비자연 발생 Zn 핑거 단백질을 포함한다. 예를 들어, 그 전체가 본 명세서에 참조로 포함된, 문헌[Beerli, et al. (2002) Nature Biotechnol. 20:135-141]; 문헌[Pabo, et al. (2001) Ann. Rev. Biochem. 70:313-340]; 문헌[Isalan, et al. (2001) Nature Biotechnol. 19:656-660]; 문헌[Segal, et al. (2001) Curr. Opin. Biotechnol. 12:632-637]; 문헌[Choo, et al. (2000) Curr. Opin. Struct. Biol. 10:411-416]; 미국 특허 6,453,242; 6,534,261; 6,599,692; 6,503,717; 6,689,558; 7,030,215; 6,794,136; 7,067,317; 7,262,054; 7,070,934; 7,361,635; 7,253,273; 및 미국 특허 공개 2005/0064474; 2007/0218528; 2005/0267061을 참조한다.
조작된 Zn 핑거는, 자연 발생 Zn 핑거와 비교하여, 새로운 결합 특이성을 가질 수 있다. 조작 방법은 합리적 설계(rational design) 및 다양한 유형의 선택을 포함하지만 이로 한정되지 않는다. 합리적 설계는, 예를 들어 삼중자(또는 사중자) 뉴클레오타이드 서열 및 개별적인 Zn 핑거 아미노산 서열을 포함하는 데이터베이스의 사용을 포함하며, 여기서 각각의 삼중자 또는 사중자 뉴클레오타이드 서열은, 특정 삼중자 또는 사중자 서열에 결합하는 징크 핑거의 아미노산 서열 하나 이상과 회합된다. 예를 들어, 그 전체가 본 명세서에 참조로 포함된, 미국 특허 6,453,242 및 6,534,261을 참조한다.
파지 디스플레이 및 2-하이브리드 시스템을 포함하여 예시적인 선택 방법이 미국 특허 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 및 6,242,568; 국제 특허 공개 WO 98/37186; WO 98/53057; WO 00/27878; 및 WO 01/88197 및 GB 2,338,237에 개시되어 있다. 추가의 징크 핑거 단백질에 대한 결합 특이성의 향상은, 예를 들어 국제 특허 공개 WO 02/077227에 기재되어 있다.
추가적으로, 이들 및 기타 참고 문헌에 개시된 바와 같이, 징크 핑거 및/또는 다중-핑거의 징크 핑거 도메인은 임의의 적합한 링커 서열을 함께 사용하여 연결될 수 있으며, 이는 예를 들어 길이가 5개 이상의 아미노산인 링커를 포함한다. 또한, 길이가 6개 이상의 아미노산인 예시적인 링커 서열에 대해 미국 특허 6,479,626; 6,903,185; 및 7,153,949를 참조한다. 본 명세서에 기재된 단백질은 단백질의 개별적인 징크 핑거들간에 적합한 링커의 임의의 조합을 포함할 수 있다. 추가적으로, 징크 핑거 결합 도메인에 대한 결합 특이성의 향상은, 예를 들어 공동 소유된 국제 특허 공개 WO 02/077227에 기재되어 있다.
Zn 핑거 및 융합 단백질의 설계 및 구축 방법(및 이를 인코딩하는 폴리뉴클레오타이드)는 당업자에게 알려져 있으며, 미국 특허 6,140,0815; 789,538; 6,453,242; 6,534,261; 5,925,523; 6,007,988; 6,013,453; 및 6,200,759; 국제 특허 공개 WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197; WO 02/099084; WO 98/53058; WO 98/53059; WO 98/53060; WO 02/016536; 및 WO 03/016496에 상세하게 기재되어 있다.
특정 구현예에서, DNA-표적화 모이어티는 표적 DNA 서열에 (서열-특이적 방식으로) 결합하는 조작된 징크 핑거를 포함하는 Zn 핑거 도메인을 포함한다. 일부 구현예에서, Zn 핑거 도메인은 하나의 Zn 핑거 또는 이의 단편을 포함한다. 일부 구현예에서, Zn 핑거 도메인은 복수의 Zn 핑거(또는 이의 단편), 예를 들어, 2, 3, 4, 5, 6개 이상의 Zn 핑거(및 선택적으로 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 또는 2 이하의 Zn 핑거)를 포함한다. 일부 구현예에서, Zn 핑거 도메인은 적어도 3개의 Zn 핑거를 포함한다. 일부 구현예에서, Zn 핑거 도메인은 4, 5, 또는 6개의 Zn 핑거를 포함한다. 일부 구현예에서, Zn 핑거 도메인은 8, 9, 10, 11 또는 12개의 Zn 핑거를 포함한다. 일부 구현예에서, 3개의 Zn 핑거를 포함하는 Zn 핑거 도메인은 9 또는 10개의 뉴클레오타이드를 포함하는 표적 DNA 서열을 인식한다. 일부 구현예에서, 4개의 Zn 핑거를 포함하는 Zn 핑거 도메인은 12 내지 14개의 뉴클레오타이드를 포함하는 표적 DNA 서열을 인식한다. 일부 구현예에서, 6개의 Zn 핑거를 포함하는 Zn 핑거 도메인은 18 내지 21개의 뉴클레오타이드를 포함하는 표적 DNA 서열을 인식한다.
일부 구현예에서, 표적화 도메인은 양손(two-handed) Zn 핑거 단백질을 포함한다. 양손 징크 핑거 단백질은, 징크 핑거의 2개의 클러스터가 개재하는 아미노산들에 의해 분리되어, 2개의 징크 핑거 도메인이 2개의 불연속적인 표적 DNA 서열에 결합되도록 하는 단백질들이다. 징크 핑거 결합 단백질의 양손 유형의 예는 SIP1며, 여기서 4개의 징크 핑거의 클러스터는 단백질의 아미노 말단에 위치되고, 3개의 Zn 핑거의 클러스터는 카르복실 말단에 위치한다(문헌[Remade, et al. (1999) EMBO Journal 18(18):5073-5084] 참조). 이들 도메인의 징크 핑거의 각 클러스터는 독특한 표적 서열에 결합할 수 있고, 2개의 표적 서열 사이의 간격은 많은 뉴클레오타이드를 포함할 수 있다.
일부 구현예에서, 발현 리프레서는 조작된 DNA 결합 도메인(DBD)을 포함하는 표적화 모이어티, 예를 들어 표적 서열, 예를 들어 표적 유전자(예를 들어, MYC)에 작동가능하게 연결된 프로모터 또는 전사 개시 부위(TSS) 서열, 전사 조절 요소에 근접한 서열, 예를 들어 표적 유전자(예를 들어, MYC)를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열, 예를 들어 앵커 서열에 근접한 서열에 결합하는 Zn 핑거(ZFN)를 포함하는 Zn 핑거 도메인을 포함한다. 일부 구현예에서, ZFN은 후성유전학적 이펙터 분자를 표적 부위로 운반하도록 조작될 수 있다. 일부 구현예에서, 표적화 모이어티는 2, 3, 4, 5, 6, 7, 또는 8개의 징크 핑거를 포함하는 Zn 핑거 도메인을 포함한다. 본 명세서에 개시된 예시적인 표적화 모이어티의 아미노산 서열은 표 4에 열거되어 있다. 본 명세서에 개시된 예시적인 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 표 5에 열거되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서 또는 시스템은 표 4에 제시된 서열, 또는 이와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일성을 갖는 서열을 갖는 표적화 모이어티를 포함한다. 일부 구현예에서, 본 명세서에 기재된 핵산은 표 5에 제시된 서열, 또는 이와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일성을 갖는 서열을 포함한다.
일부 구현예에서, 발현 억제는 조작된 DNA 결합 도메인(DBD)을 포함하는 표적화 모이어티, 예를 들어 표적 서열, 예를 들어 표적 유전자(예를 들어, MYC)에 작동가능하게 연결된 프로모터 또는 전사 개시 부위(TSS) 서열, 전사 조절 요소에 근접한 서열, 예를 들어 표적 유전자(예를 들어, MYC)를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열, 예를 들어 마우스 게놈에서 앵커 서열에 근접한 서열에 결합하는 Zn 핑거(ZFN)를 포함하는 Zn 핑거 도메인을 포함한다. 일부 구현예에서, ZFN은 후성유전학적 이펙터 분자를 표적 부위로 운반하도록 조작될 수 있다. 일부 구현예에서, 표적화 모이어티는 2, 3, 4, 5, 6, 7, 또는 8개의 징크 핑거를 포함하는 Zn 핑거 도메인을 포함한다. 본 명세서에 개시된 예시적인 표적화 모이어티의 아미노산 서열은 표 14에 열거되어 있다. 본 명세서에 개시된 예시적인 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 표 15에 열거되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서 또는 시스템은 표 14에 제시된 서열, 또는 이와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일성을 갖는 서열을 갖는 표적화 모이어티를 포함한다. 일부 구현예에서, 본 명세서에 기재된 핵산은 표 15에 제시된 서열, 또는 이와 적어도 70%, 75%, 80%, 85%, 90%, 95%, 98%, 또는 99% 동일성을 갖는 서열을 포함한다.
핵산 분자
일부 구현예에서, 표적화 모이어티는 뉴클레아제로부터의 DNA-결합 도메인이거나 이를 포함한다. 예를 들어, I-SceI, I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII과 같은 호밍 엔도뉴클레아제 및 메가뉴클레아제의 인식 서열이 알려져 있다. 또한, 미국 특허 5,420,032; 6,833,252; 문헌[Belfort, et al. (1997) Nucleic Acids Res. 25:3379-3388]; 문헌[Dujon, et al. (1989) Gene 82:115-118]; 문헌[Perler, et al. (1994) Nucleic Acids Res. 22:1125-1127]; 문헌[Jasin (1996) Trends Genet. 12:224-228]; 문헌[Gimble, et al. (1996) J. Mol. Biol. 263:163-180]; 문헌[Argast, et al. (1998) J. Mol. Biol. 280:345-353] 및 New England Biolabs 카탈로그를 참조한다. 추가적으로, 호밍 엔도뉴클레아제 및 메가뉴클레아제의 DNA-결합 특이성이 비천연 표적 부위에 결합하도록 조작될 수 있다. 예를 들어, 문헌[Chevalier, et al. (2002) Molec. Cell 10:895-905]; 문헌[Epinat, et al. (2003) Nucleic Acids Res. 31:2952-2962]; 문헌[Ashworth, et al. (2006) Nature 441:656-659]; 문헌[Paques, et al. (2007) Current Gene Therapy 7:49-66]; 미국 특허 공개 2007/0117128을 참조한다.
일부 구현예에서, DNA-표적화 모이어티는 핵산이거나 이를 포함한다. 일부 구현예에서, DNA-표적화 모이어티 내에 포함될 수 있는 핵산은 DNA, RNA, 및/또는 인공 또는 합성 핵산 또는 핵산 유사체 또는 모방체이거나 이를 포함할 수 있다. 예를 들어, 일부 구현예에서, 핵산은 게놈 DNA(gDNA), 상보적 DNA(cDNA), 펩타이드 핵산(PNA), 펩타이드- 올리고뉴클레오타이드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체-형성 올리고뉴클레오타이드, 안티센스 올리고뉴클레오타이드, tRNA, mRNA, rRNA, miRNA, gRNA, siRNA 또는 기타 다른 RNAi 분자(예를 들어, 본 명세서에 기재된 바와 같은 비코딩 RNA를 표적화하고/하거나 본 명세서에 기재된 바와 같은 표적화된 게놈 복합체와 연관된 특정 유전자의 발현 산물을 표적화하는 것들) 등 중 하나 이상이거나 이를 포함할 수 있다. 일부 구현예에서, 핵산은 자연-발생 DNA 또는 RNA 잔기가 아닌 하나 이상의 잔기를 포함할 수 있고/있거나, 포스포디에스테르 결합이 아닌(예를 들어, 이를 테면 포스포로티오에이트 결합 등일 수 있는) 하나 이상의 결합을 포함할 수 있고/있거나, 예를 들어 2'O 변형, 예컨대 2'-OmeP와 같은 하나 이상의 변형을 포함할 수 있다. 합성 핵산을 제조하는 데 유용한 다양한 핵산 구조가 당업계에 알려져 있으며(예를 들어, WO2017/062862l 및 WO2014/012081 참조), 당업자는 이들이 본 개시내용에 따라 이용될 수 있음을 이해할 것이다.
발현 리프레서에, 예를 들어 DNA-표적화 모이어티에 사용하기에 적합한 핵산은 DNA, RNA, 변형된 올리고뉴클레오타이드(예를 들어, 화학적 변형, 예컨대 백본 결합, 당 분자, 및/또는 핵산 염기를 변경시키는 변형), 및 인공 핵산을 포함할 수 있지만 이로 한정되지 않는다. 일부 구현예에서, 핵산은 게놈 DNA, cDNA, 펩타이드 핵산(PNA) 또는 펩타이드 올리고뉴클레오타이드 접합체, 고정된 핵산(LNA), 가교 핵산(BNA), 폴리아미드, 삼중체 형성 올리고뉴클레오타이드, 변형된 DNA, 안티센스 DNA 올리고뉴클레오타이드, tRNA, mRNA, rRNA, 변형된 RNA, miRNA, gRNA, 및 siRNA 또는 기타 다른 RNA 또는 DNA 분자를 포함하지만 이로 한정되지 않는다.
일부 구현예에서, DNA-표적화 모이어티는 약 15 내지 200개, 20 내지 200개, 30 내지 200개, 40 내지 200개, 50 내지 200개, 60 내지 200개, 70 내지 200개, 80 내지 200개, 90 내지 200개, 100 내지 200개, 110 내지 200개, 120 내지 200개, 130 내지 200개, 140 내지 200개, 150 내지 200개, 160 내지 200개, 170 내지 200개, 180 내지 200개, 190 내지 200개, 215 내지 190개, 20 내지 190개, 30 내지 190개, 40 내지 190개, 50 내지 190개, 60 내지 190개, 70 내지 190개, 80 내지 190개, 90 내지 190개, 100 내지 190개, 110 내지 190개, 120 내지 190개, 130 내지 190개, 140 내지 190개, 150 내지 190개, 160 내지 190개, 170 내지 190개, 180 내지 190개, 15 내지 180개, 20 내지 180개, 30 내지 180개, 40 내지 180개, 50 내지 180개, 60 내지 180개, 70 내지 180개, 80 내지 180개, 90 내지 180개, 100 내지 180개, 110 내지 180개, 120 내지 180개, 130 내지 180개, 140 내지 180개, 150 내지 180개, 160 내지 180개, 170 내지 180개, 15 내지 170개, 20 내지 170개, 30 내지 170개, 40 내지 170개, 50 내지 170개, 60 내지 170개, 70 내지 170개, 80 내지 170개, 90 내지 170개, 100 내지 170개, 110 내지 170개, 120 내지 170개, 130 내지 170개, 140 내지 170개, 150 내지 170개, 160 내지 170개, 15 내지 160개, 20 내지 160개, 30 내지 160개, 40 내지 160개, 50 내지 160개, 60 내지 160개, 70 내지 160개, 80 내지 160개, 90 내지 160개, 100 내지 160개, 110 내지 160개, 120 내지 160개, 130 내지 160개, 140 내지 160개, 150 내지 160개, 215 내지 150개, 20 내지 150개, 30 내지 150개, 40 내지 150개, 50 내지 150개, 60 내지 150개, 70 내지 150개, 80 내지 150개, 90 내지 150개, 100 내지 150개, 110 내지 150개, 120 내지 150개, 130 내지 150개, 140 내지 150개, 15 내지 140개, 20 내지 140개, 30 내지 140개, 40 내지 140개, 50 내지 140개, 60 내지 140개, 70 내지 140개, 80 내지 140개, 90 내지 140개, 100 내지 140개, 110 내지 140개, 120 내지 140개, 130 내지 140개, 15 내지 130개, 20 내지 130개, 30 내지 130개, 40 내지 130개, 50 내지 130개, 60 내지 130개, 70 내지 130개, 80 내지 130개, 90 내지 130개, 100 내지 130개, 110 내지 130개, 120 내지 130개, 215 내지 120개, 20 내지 120개, 30 내지 120개, 40 내지 120개, 50 내지 120개, 60 내지 120개, 70 내지 120개, 80 내지 120개, 90 내지 120개, 100 내지 120개, 110 내지 120개, 15 내지 110개, 20 내지 110개, 30 내지 110개, 40 내지 110개, 50 내지 110개, 60 내지 110개, 70 내지 110개, 80 내지 110개, 90 내지 110개, 100 내지 110개, 15 내지 100개, 20 내지 100개, 30 내지 100개, 40 내지 100개, 50 내지 100개, 60 내지 100개, 70 내지 100개, 80 내지 100개, 90 내지 100개, 15 내지 90개, 20 내지 90개, 30 내지 90개, 40 내지 90개, 50 내지 90개, 60 내지 90개, 70 내지 90개, 80 내지 90개, 15 내지 80개, 20 내지 80개, 30 내지 80개, 40 내지 80개, 50 내지 80개, 60 내지 80개, 70 내지 80개, 15 내지 70개, 20 내지 70개, 30 내지 70개, 40 내지 70개, 50 내지 70개, 60 내지 70개, 15 내지 60개, 20 내지 60개, 30 내지 60개, 40 내지 60개, 50 내지 60개, 15 내지 50개, 20 내지 50개, 30 내지 50개, 40 내지 50개, 15 내지 40개, 20 내지 40개, 30 내지 40개, 15 내지 30개, 20 내지 30개, 또는 15 내지 20개의 뉴클레오타이드 길이, 또는 이들 사이의 임의의 범위의 뉴클레오타이드 길이를 갖는 핵산을 포함한다.
이펙터 모이어티
일부 구현예에서, 본 개시내용의 발현 리프레서는 하나 이상의 이펙터 모이어티를 포함한다. 일부 구현예에서, 이펙터 모이어티는 본 명세서에 기재된 발현자 리프레서 또는 발현 억제 시스템의 일부로서 사용될 때 세포에서 표적 유전자의 발현을 감소시킨다.
이펙터 모이어티는 표적화 모이어티의 결합과 관련이 없는 기능성을 갖는다. 예를 들어, 이펙터 모이어티는 표적화 모이어티에 의해 표적화된 게놈 서열 요소 또는 게놈 서열 요소에 근접한 게놈 복합체 성분을 표적화, 예를 들어 결합하거나 전사 요소를 동원할 수 있다. 추가의 예로서, 이펙터 모이어티는 효소 활성, 예를 들어 유전자 변형 기능성을 포함할 수 있다.
일부 구현예에서, 이펙터 모이어티는 후성유전학적 변형 모이어티를 포함한다. 일부 구현예에서, 이펙터 모이어티는 DNA 변형 기능성, 예를 들어 DNA 메틸트랜스퍼라제를 포함한다. 일부 구현예에서, 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질이거나 이를 포함한다.
일부 구현예에서, 이펙터 모이어티는 전사 리프레서를 포함한다. 일부 구현예에서, 전사 리프레서는 전사, 예를 들어 표적 유전자의 전사를 자극하거나 촉진하는 인자의 동원을 차단한다. 일부 구현예에서, 전사 리프레서는 전사, 예를 들어 표적 유전자의 전사를 억제하는 인자를 동원한다. 일부 구현예에서, 이펙터 모이어티, 예를 들어 전사 리프레서는 KRAB, MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질이거나 이를 포함한다.
일부 구현예에서 이펙터 모이어티는 후성유전학적 변형을, 예를 들어 직접적으로 또는 간접적으로 촉진시킨다. 예를 들어, 이펙터 모이어티는 염색질을 후성유전학적으로 변형시키는 내인성 단백질을 동원함으로써 후성유전학적 변형을 간접적으로 촉진시킬 수 있다. 이펙터 모이어티는 후성유전학적 변형을 촉매함으로써 후성유전학적 변형을 직접적으로 촉진시킬 수 있으며, 여기서 이펙터 모이어티는 효소 활성을 포함하고, 후성유전학적 마크를 염색질 상에 직접 배치한다.
일부 구현예에서, 이펙터 모이어티는 히스톤 변형 기능성, 예를 들어 히스톤 메틸트랜스퍼라제, 히스톤 데메틸라제, 또는 히스톤 데아세틸라제 활성을 포함한다. 일부 구현예에서, 이펙터 모이어티는 KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질이거나 이를 포함한다. 일부 구현예에서, 이펙터 모이어티는 HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, 또는 이들 중 임의의 것의 기능성 변이체 또는 단편으로부터 선택되는 단백질이거나 이를 포함한다.
일부 구현예에서, 이펙터 모이어티는 본 명세서에 기재된 기능성을 갖는 단백질을 포함한다. 일부 구현예에서, 이펙터 모이어티는 하기로부터 선택되는 단백질이거나 이를 포함한다: KRAB(예를 들어, NP_056209.2에 따른 것 또는 NM_015394.5에 의해 인코딩된 단백질); SET 도메인(예를 들어, SETDB1(예를 들어, NP_001353347.1에 따른 것 또는 NM_001366418.1에 의해 인코딩된 단백질)의 SET 도메인); EZH2(예를 들어, NP-004447.2에 따른 것 또는 NM_004456.5에 의해 인코딩된 단백질); G9A(예를 들어, NP_001350618.1에 따른 것 또는 NM_001363689.1에 의해 인코딩된 단백질); 또는 SUV39H1(예를 들어, NP_003164.1에 따른 것 또는 NM_003173.4에 의해 인코딩된 단백질)); 히스톤 데메틸라제 LSD1(예를 들어, NP_055828.2에 따른 것 또는 NM_015013.4에 의해 인코딩된 단백질); FOG1(예를 들어, FOG1의 N-말단 잔기)(예를 들어, NP_722520.2에 따른 것 또는 NM_153813.3에 의해 인코딩된 단백질); 또는 KAP1(예를 들어, NP_005753.1에 따른 것 또는 NM_005762.3에 의해 인코딩된 단백질); 이들 중 임의의 것의 기능성 단편 또는 변이체, 또는 상기 언급된 임의의 서열과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 서열을 갖는 폴리펩타이드.
일부 구현예에서, 이펙터 모이어티는 하기로부터 선택되는 단백질이거나 이를 포함한다: DNMT3A(예를 들어, 인간 DNMT3A)(예를 들어, NP_072046.2에 따른 것 또는 NM_022552.4에 의해 인코딩된 단백질); DNMT3B(예를 들어, NP_008823.1에 따른 것 또는 NM_006892.4에 의해 인코딩된 단백질); DNMT3L(예를 들어, NP_787063.1에 따른 것 또는 NM_175867.3에 의해 인코딩된 단백질); DNMT3A/3L 복합체, 박테리아 MQ1(예를 들어, CAA35058.1 또는 P15840.3에 따른 것); 이들 중 임의의 것의 기능성 단편, 또는 상기 언급된 임의의 서열과 적어도 80, 85, 90, 91, 92, 93, 94, 95, 96, 97, 98, 또는 99% 동일성을 갖는 서열을 갖는 폴리펩타이드.
또 다른 양태에서, 본 개시내용은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 발현 리프레서 또는 폴리펩타이드에 관한 것이며, 여기서 하나 이상의 이펙터 모이어티는 크루펠-연관 박스(Krueppel-associated box; KRAB), 예를 들어 NP_056209.2에 따른 것, 또는 NM_015394.5에 의해 인코딩된 단백질 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, KRAB는 합성 KRAB 작제물이다. 일부 구현예에서, KRAB는 서열번호 18의 아미노산 서열을 포함한다:
일부 구현예에서, KRAB 이펙터 모이어티는 서열번호 51의 뉴클레오타이드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 뉴클레오타이드 서열은 서열번호 51의 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 51, 17, 16, 15, 18, 13, 12, 11, 14, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 본 명세서에 기재된 폴리펩타이드 또는 발현 리프레서에 사용하기 위한 KRAB는, 예를 들어 서열번호 18의 KRAB 서열과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, KRAB 변이체는 서열번호 18과 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다.
일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는, KRAB이거나 이를 포함하는 이펙터 모이어티 및 DNA-표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 표적화 모이어티는, 예를 들어 CRISPR/Cas 단백질, 예를 들어 dCas9 단백질을 포함하는 징크 핑거 도메인, TAL 도메인, 또는 CRISPR/Cas 도메인이거나 이를 포함한다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는 본 명세서에 기재된 추가의 모이어티를 포함한다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는, 예를 들어 발현 억제 시스템 대신에, 본 명세서에 기재된 유전자 발현을 조절하는, 예를 들어 감소시키는 방법, 병태를 치료하는 방법, 또는 표적 유전자, 예를 들어 MYC 또는 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용될 수 있다. 일부 구현예에서, 발현 억제 시스템은 2개 이상(예를 들어, 2, 3, 또는 4개)의 발현 리프레서를 포함하며, 여기서 제1 발현 리프레서는 서열번호 18의 KRAB 서열, 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함한다.
또 다른 양태에서, 본 개시내용은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 발현 리프레서 또는 폴리펩타이드에 관한 것이며, 여기서 하나 이상의 이펙터 모이어티는 MQ1, 예를 들어 박테리아 MQ1, 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, MQ1은 몰리쿠테스 스피로플라스마(Mollicutes spiroplasma) MQ1이다. 일부 구현예에서, MQ1은 스피로플라스마 모노비아이(Spiroplasma monobiae) MQ1이다. 일부 구현예에서, MQ1은 균주 ATCC 33825로부터 유래되고/되거나 Uniprot ID P15840에 상응하는 MQ1이다. 일부 구현예에서, MQ1은 서열번호 19의 아미노산 서열을 포함한다. 일부 구현예에서, MQ1은 서열번호 87의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터 도메인은 서열번호 19 또는 87, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, MQ1은 서열번호 52 또는 132의 뉴클레오타이드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 52, 132의 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 52, 15, 16, 13, 12, 11, 14, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 본 명세서에 기재된 폴리펩타이드 또는 발현 리프레서에 사용하기 위한 MQ1은, 예를 들어 야생형 MQ1(서열번호 19)과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, MQ1 변이체는 야생형 MQ1, 예를 들어 서열번호 19의 MQ1과 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, MQ1 변이체는 K297P 치환을 포함한다. 일부 구현예에서, MQ1 변이체는 N299C 치환을 포함한다. 일부 구현예에서, MQ1 변이체는 E301Y 치환을 포함한다. 일부 구현예에서, MQ1 변이체는 Q147L 치환을 포함한다(예를 들어, 그리고 야생형 MQ1과 대비하여 감소된 DNA 메틸트랜스퍼라제 활성을 갖는다). 일부 구현예에서, MQ1 변이체는 K297P, N299C, 및 E301Y 치환을 포함한다(예를 들어, 그리고 야생형 MQ1과 대비하여 감소된 DNA 결합 친화도를 갖는다). 일부 구현예에서, MQ1 변이체는 Q147L, K297P, N299C, 및 E301Y 치환을 포함한다(예를 들어, 그리고 야생형 MQ1과 대비하여 감소된 DNA 메틸트랜스퍼라제 활성 및 DNA 결합 친화도를 갖는다).
일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는 MQ1이거나 이를 포함하는 이펙터 모이어티 및 징크 핑거 도메인, TAL 도메인, 또는 CRISPR/Cas 도메인, dCas9 도메인이거나 이를 포함하는 표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는 본 명세서에 기재된 추가의 모이어티를 포함한다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는, 예를 들어 발현 억제 시스템 대신에, 본 명세서에 기재된 유전자 발현을 조절하는, 예를 들어 감소시키는 방법, 병태를 치료하는 방법, 또는 표적 유전자, 예를 들어 MYC 또는 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용될 수 있다. 일부 구현예에서, 발현 억제 시스템은 2개 이상(예를 들어, 2, 3, 또는 4개)의 발현 리프레서를 포함하며, 여기서 제1 발현 리프레서는 MQ1, 예를 들어 박테리아 MQ1, 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함한다.
또 다른 양태에서, 본 개시내용은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 발현 리프레서 또는 폴리펩타이드에 관한 것이며, 여기서 하나 이상의 이펙터 모이어티는 DNMT1, 예를 들어 인간 DNMT1, 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, DNMT1은 인간 DNMT1, 예를 들어 Gene ID 1786에 상응하는 것, 예를 들어 UniPort ID P26358.2에 상응하는 것이다. 일부 구현예에서, DNMT1은 서열번호 20의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 이펙터 도메인은 서열번호 20에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다:
일부 구현예에서, DNMT1은 서열번호 53의 뉴클레오타이드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 53의 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 53, 15, 16, 13, 12, 11, 14, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 본 명세서에 기재된 폴리펩타이드 또는 발현 리프레서에 사용하기 위한 DNMT1은, 예를 들어 서열번호 20의 DNMT 서열과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, 이펙터 도메인은 야생형 DNMT1과 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, 폴리펩타이드는, DNMT1이거나 이를 포함하는 리프레서 도메인 및 표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 표적화 모이어티는 징크 핑거 도메인, TAL 도메인, 또는 CRISPR/Cas 도메인, 예를 들어 dCas9 도메인이거나 이를 포함한다. 일부 구현예에서, 발현 억제 시스템은 2개 이상(예를 들어, 2, 3, 또는 4개)의 발현 리프레서를 포함하며, 여기서 제1 발현 리프레서는 DNMT1, 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함한다.
또 다른 양태에서, 본 개시내용은 하나 이상(예를 들어, 하나)의 표적화 모이어티 및 하나 이상의 이펙터 모이어티를 포함하는 발현 리프레서 또는 폴리펩타이드에 관한 것이며, 여기서 하나 이상의 이펙터 모이어티는 DNMT3a/3L 복합체, 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다. 일부 구현예에서, DNMT3a/3L 복합체는 융합 작제물이다. 일부 구현예에서, DNMT3a/3L 복합체는 DNMT3A(예를 들어, 인간 DNMT3A)(예를 들어, NP_072046.2에 따른 것 또는 NM_022552.4에 의해 인코딩된 단백질)를 포함한다. 일부 구현예에서, DNMT3a/3L 복합체는 DNMT3L(예를 들어, NP_787063.1에 따른 것 또는 NM_175867.3에 의해 인코딩된 단백질)를 포함한다. 일부 구현예에서, DNMT3a/3L은 서열번호 21 또는 서열번호 114의 아미노산 서열을 포함한다: 일부 구현예에서, 본 명세서에 기재된 이펙터 도메인은 서열번호 21 또는 서열번호 114, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, DNMT3a/3L은 서열번호 54의 뉴클레오타이드 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 54의 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 54, 15, 16, 13, 12, 11, 14, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 본 명세서에 기재된 폴리펩타이드 또는 발현 리프레서에 사용하기 위한 DNMT3a/3L은, 예를 들어 서열번호 21 또는 서열번호 114의 DNMT3a/3L과 대비하여 하나 이상의 돌연변이를 포함하는 변이체이다. 일부 구현예에서, DNMT3a/3L 변이체는 서열번호 21 또는 서열번호 114와 대비하여 하나 이상의 아미노산 치환, 결실, 또는 삽입을 포함한다. 일부 구현예에서, 폴리펩타이드 또는 발현 리프레서는, DNMT3a/3L이거나 이를 포함하는 이펙터 모이어티 및 표적화 모이어티를 포함하는 융합 단백질이다. 일부 구현예에서, 표적화 모이어티는 징크 핑거 도메인, TAL 도메인, 또는 CRISPR/Cas 도메인, 예를 들어 dCas9 도메인이거나 이를 포함한다. 일부 구현예에서, 발현 억제 시스템은 2개 이상(예를 들어, 2, 3, 또는 4개)의 발현 리프레서를 포함하며, 여기서 제1 발현 리프레서는 DNMT3a/3L, 또는 이의 기능성 변이체 또는 단편을 포함하는 이펙터 모이어티를 포함한다.
일부 구현예에서, 이펙터 모이어티는 폴리펩타이드이거나 이를 포함한다. 일부 구현예에서, 이펙터 모이어티는 핵산이거나 이를 포함한다. 일부 구현예에서, 이펙터 모이어티는 화학물질, 예를 들어 시토신 I 또는 아데닌(A)을 조절하는 화학물질(예를 들어 중아황산나트륨, 중아황산암모늄)이다. 이펙터 모이어티는 효소 활성(예를 들어, 메틸 트랜스퍼라제, 데메틸라제, 뉴클레아제(예를 들어, Cas9), 또는 데아미나제 활성)을 갖는다. 이펙터 모이어티는 소분자, 펩타이드, 핵산, 나노입자, 앱타머, 또는 불량한 PK/PD를 갖는 약제(pharmaco-agent) 중 하나 이상이거나 이를 포함할 수 있다.
일부 구현예에서, 이펙터 모이어티는 펩타이드 리간드, 전장 단백질, 단백질 단편, 항체, 항체 단편, 및/또는 표적화 앱타머를 포함할 수 있다. 일부 구현예에서, 단백질은 수용체, 예컨대 세포외 수용체, 신경펩타이드, 호르몬 펩타이드, 펩타이드 약물, 독성 펩타이드, 바이러스 또는 미생물 펩타이드, 합성 펩타이드, 또는 효현제 또는 길항제에 결합할 수 있다.
일부 구현예에서, 이펙터 모이어티는 항원, 항체, 항체 단편, 예컨대 단일 도메인 항체, 리간드, 또는 수용체, 예컨대 글루카곤-유사 펩타이드-1(GLP-1), GLP-2 수용체 2, 콜레시스토키닌 B(CCKB), 또는 소마토스타틴 수용체, 펩타이드 치료제, 예컨대 특정 세포 표면 수용체, 예컨대 G 단백질-커플링 수용체(GPCR) 또는 이온 채널에 결합하는 것, 자연-생체활성 펩타이드의 합성 또는 유사 펩타이드, 항-미생물 펩타이드, 기공-형성 펩타이드, 종양 표적화 또는 세포독성 펩타이드, 또는 분해 또는 자가-파괴 펩타이드, 예컨대 아폽토시스-유도 펩타이드 신호 또는 광감작 펩타이드를 포함할 수 있다.
본 명세서에 기재된 바와 같은 이펙터 모이어티에 사용하기 위한 펩타이드 또는 단백질 모이어티는 또한, 작은 항원-결합 펩타이드, 예를 들어 항원 결합 항체 또는 항체-유사 단편, 예컨대 단일 사슬 항체, 나노바디를 포함한다(예를 들어, 문헌[Steeland et al. 2016. Nanobodies as therapeutics: big opportunities for small antibodies. Drug Discov Today: 21(7):1076-113] 참조). 그러한 작은 항원 결합 펩타이드는, 예를 들어 사이토졸 항원, 핵 항원, 세포소기관-내 항원에 결합할 수 있다.
일부 구현예에서, 이펙터 모이어티는 우성 음성 성분(예를 들어, 우성 음성 모이어티), 예를 들어 서열(예를 들어, 앵커 서열, 예를 들어 CTCF 결합 모티프)을 인식하고 이에 결합하지만, 비활성(예를 들어, 돌연변이된) 이량체화 도메인, 예를 들어 기능성 앵커 서열-매개 연접부를 형성할 수 없거나, 기능성 전사 인자의 형성을 방지하는 게놈 복합체(예를 들어, 전사 인자 서브유닛 등) 등의 성분에 결합하는 이량체화 도메인을 갖는 단백질을 포함한다. 예를 들어, CTCF의 징크 핑거 도메인은 (측접 핵산을 인식하는 징크 핑거를 추가함으로써) 특정 앵커 서열에 결합하도록 변경될 수 있는 한편, 동종-이량체화 도메인은 조작된 CTCF와 CTCF의 내인성 형태 사이의 상호작용을 방지하도록 변경된다. 일부 구현예에서, 우성 음성 성분은 표적 앵커 서열-매개 연접부 내의 앵커 서열에 대해 선택된 결합 친화도를 갖는 합성 핵형성 폴리펩타이드를 포함한다. 일부 구현예에서, 결합 친화도는 표적 앵커 서열과 회합하는 내인성 핵형성 폴리펩타이드(예를 들어, CTCF)의 결합 친화도보다 적어도 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 이상으로 더 높거나 이하로 더 낮을 수 있다. 합성 핵형성 폴리펩타이드는 상응하는 내인성 핵형성 폴리펩타이드와 30 내지 90%, 30 내지 85%, 30 내지 80%, 30 내지 70%, 50 내지 80%, 50 내지 90% 아미노산 서열 동일성을 가질 수 있다. 핵형성 폴리펩타이드는, 예컨대 경쟁적 결합, 예를 들어 앵커 서열에 대한 내인성 핵형성 폴리펩타이드의 결합과의 경쟁을 통해 조절(예를 들어, 파괴)할 수 있다.
일부 구현예에서, 이펙터 모이어티는 항체 또는 이의 단편을 포함할 수 있다. 일부 구현예에서, 표적 유전자(예를 들어, MYC) 발현은 하나 이상의 항체 또는 이의 단편이거나 이를 포함하는 이펙터 모이어티의 사용을 통해 변경된다. 일부 구현예에서, 유전자 발현은 하나 이상의 항체(또는 이의 단편) 및 dCas9이거나 이를 포함하는 이펙터 모이어티의 사용을 통해 변경된다.
일부 구현예에서, 이펙터 모이어티에 사용하기 위한 항체 또는 이의 단편은 모노클로날일 수 있다. 항체는 융합체, 키메라 항체, 비-인간화 항체, 부분적 또는 완전 인간화 항체 등일 수 있다. 당업자에 의해 이해될 바와 같이, 사용되는 항체(들)의 형식은 주어진 표적에 따라 동일하거나 상이할 수 있다.
일부 구현예에서, 이펙터 모이어티는 연접부 핵형성 분자, 연접부 핵형성 분자를 인코딩하는 핵산, 또는 이들의 조합을 포함한다. 연접부 핵형성 분자는, 예를 들어 CTCF, 코헤신, USF1, YY1, TATA-박스 결합 단백질 연관 인자 3(TAF3), ZNF143 결합 모티프, 또는 앵커 서열-매개 연접부의 형성을 촉진시키는 또 다른 폴리펩타이드일 수 있다. 연접부 핵형성 분자는 내인성 폴리펩타이드 또는 다른 단백질, 예컨대 전사 인자, 예를 들어 자가면역 조절제(AIRE), 또 다른 인자, 예를 들어 X-비활성화 특이적 전사체(XIST), 또는 관심이 있는 특정 DNA 서열을 인식하도록 조작된, 예를 들어 서열 인식을 위해 징크 핑거, 류신 지퍼 또는 bHLH 도메인을 갖는 조작된 폴리펩타이드일 수 있다. 연접부 핵형성 분자는 (예를 들어, 표적화 모이어티에 의해 표적화된 게놈 서열 요소와 회합되거나 이를 포함하는) 앵커 서열-매개 연접부 내 또는 그 주위에서 DNA 상호작용을 조절할 수 있다. 예를 들어, 연접부 핵형성 분자는 앵커 서열-매개 연접부 형성 또는 파괴를 변경시키는 앵커 서열로 다른 인자를 동원할 수 있다.
연접부 핵형성 분자는 또한 동종- 또는 이종이량체화를 위해 이량체화 도메인을 가질 수 있다. 예를 들어 내인성 및 조작된, 하나 이상의 연접부 핵형성 분자는 상호작용하여 앵커 서열-매개 연접부를 형성할 수 있다. 일부 구현예에서, 연접부 핵형성 분자는 안정화 도메인, 예를 들어 코헤신 상호작용 도메인을 추가로 포함하도록 조작되어, 앵커 서열-매개 연접부를 안정화시킨다. 일부 구현예에서, 연접부 핵형성 분자는 표적 서열에 결합하도록 조작되며, 예를 들어 표적 서열 결합 친화도가 조절된다. 일부 구현예에서, 연접부 핵형성 분자는 앵커 서열-매개 연접부 내의 앵커 서열에 대해 선택된 결합 친화도를 갖는 연접부 핵형성 분자가 선택되거나 조작된다.
연접부 핵형성 분자 및 이의 상응하는 앵커 서열은 CTCF의 비활성화 돌연변이를 보유하는 세포 및 염색체 형태 포획 또는 3C-기반 방법, 예를 들어 Hi-C 또는 고처리량 서열분석을 사용하여 위상학적으로 연관된 도메인, 예를 들어 CTCF의 부재 시 원위 DNA 영역 또는 유전자좌 사이의 위상학적 상호작용을 검사함으로써 확인될 수 있다. 장거리 DNA 상호작용도 또한 확인될 수 있다. 추가의 분석은 미끼, 예컨대 코헤신, YY1 또는 USF1, ZNF143 결합 모티프, 및 MS를 사용하는 ChIA-PET 분석을 포함하여 미끼와 회합되는 복합체를 확인할 수 있다.
일부 구현예에서, 이펙터 모이어티는 단백질의 DNA-결합 도메인을 포함한다. 일부 구현예에서, 이펙터 모이어티의 DNA 결합 도메인은 조절제의 표적화를 향상시키거나 변경시키지만 단독으로는 조절제에 의한 완전한 표적화를 달성하지 못한다(예를 들어, 표적화 모이어티는 여전히 조절제의 표적화를 달성하는 데 필요하다). 일부 구현예에서, DNA 결합 도메인은 조절제의 표적화를 향상시킨다. 일부 구현예에서, DNA 결합 도메인은 조절제의 효능을 향상시킨다. DNA-결합 단백질은, 예를 들어 당업자에게 공지된 DNA 결합에서 중요한 역할을 하는, 별개의 구조적 모티프를 갖는다. 일부 구현예에서, DNA-결합 도메인은 리프레서 단백질의 일반적인 DNA 인식 모티프인 나선-회전-나선(helix-turn-helix; HTH) 모티프를 포함한다. 그러한 모티프는 2개의 나선을 포함하며, 이들 나선 중 하나는 결합 특이성을 제공하는 측쇄를 갖는 DNA(일명, 인식 나선)를 인식한다. 그러한 모티프는 일반적으로 발달 과정에 관여하는 단백질을 조절하는 데 사용된다. 때때로 하나 초과의 단백질은 동일한 서열에 대해 경쟁하거나 동일한 DNA 단편을 인식한다. 상이한 단백질은 H-결합, 염 다리 및 반데르발스 상호작용을 통해 각각 동일한 서열 또는 DNA 형태에 대해 친화도가 상이할 수 있다.
DNA-결합 도메인은 나선-헤어핀-나선(HhH) 모티프를 포함한다. HhH 구조 모티프를 갖는 DNA-결합 단백질은 단백질 백본 질소와 DNA 포스페이트 기 사이의 수소 결합의 형성을 통해 일어나는 서열 비특이적 DNA 결합에 관여할 수 있다.
일부 구현예에서, DNA-결합 도메인은 나선-루프-나선(HLH) 모티프를 포함한다. HLH 구조 모티프를 갖는 DNA-결합 단백질은 전사 조절 단백질이며, 매우 다양한 개발 과정에 주로 관련되어 있다. 잔기의 관점에서 HTH 또는 HhH 모티프보다 HLH 구조 모티프가 더 길다. 이들 단백질 중 다수는 상호작용하여 동종- 및 이종-이량체를 형성한다. 구조 모티프는, N-말단 나선이 DNA에 결합되면서 2개의 긴 나선 영역으로 구성되지만, 복합체 영역은 단백질이 이량체화될 수 있게 한다.
일부 구현예에서, DNA-결합 도메인은 류신 지퍼 모티프를 포함한다. 일부 전사 인자에서는, 이량체 결합 부위가 DNA와 함께 류신 지퍼를 형성한다. 이 모티프는 2개의 양친매성 나선을 포함하며, 각 하위단위로부터 하나씩 유래되며, 서로 상호작용하여 왼손방향 코일드-코일 슈퍼 2차 구조를 발생시킨다. 류신 지퍼는 한쪽 나선 내의 규칙적으로 이격된 류신 잔기와 인접한 나선으로부터의 류신의 상호감합(interdigitation)이다. 대개, 류신 지퍼에 관여하는 나선은 헵타드(heptad) 서열(abcdefg)을 나타내며, 이때 잔기 a 및 d는 소수성이고, 기타 다른 잔기는 친수성이다. 류신 지퍼 모티프는 동종이량체 형성 또는 이종이량체 형성 중 어느 하나를 매개할 수 있다.
일부 구현예에서, DNA-결합 도메인은 Zn 핑거 도메인을 포함하며, 여기서 Zn++ 이온은 2개의 Cys 및 2개의 His 잔기에 의해 배위된다. 그러한 전사 인자는 화학량론 ββ'α를 갖는 삼량체를 포함한다. Zn++ 배위의 겉보기 효과는 소수성 코어 잔기 대신에 작은 복합체 구조의 안정화이다. 각 Zn-핑거는 이중 나선의 큰 홈(major groove) 내의 연속적인 삼중 염기쌍 세그먼트와 입체구조적으로 동일한 방식으로 상호작용한다. 단백질-DNA 상호작용은 다음 2개의 인자에 의해 결정된다: (i) α-나선과 DNA 세그먼트 사이, 대개 Arg 잔기와 구아닌 염기 사이의 H-결합 상호작용. (ii) DNA 포스페이트 백본과의, 대개 Arg 및 His와의 H-결합 상호작용. 대안적인 Zn-핑거 모티프는 Zn++를 6개의 Cys로 킬레이트화한다.
일부 구현예에서, DNA-결합 도메인인은 TATA 박스 결합 단백질(TBP)을 포함한다. TBP는 처음에 클래스 II 개시 인자 TFIID의 성분으로 확인되었다. 이들 결합 단백질은 핵 RNA 중합효소 각각의 서브유닛으로 작용하는 3개의 핵 RNA 중합효소 모두에 의한 전사에 참여한다. TBP의 구조는 89 내지 90개 아미노산으로 구성된 2개의 α/β 구조 도메인을 나타낸다. TBP의 C-말단 또는 코어 영역은 작은 홈(minor groove) 결정인자를 인식하고 DNA 굽힘을 촉진시키는 TATA 컨센서스 서열(TATAa/tAa/t, 서열번호 210)에 높은 친화도로 결합한다. TBP는 분자 안장과 비슷하다. 결합면에는 10개 가닥 역평행 β-시트 중 중심 8개 가닥으로 늘어서 있다. 상부 표면은 4개의 α-나선을 포함하고 전사 기구의 다양한 성분에 결합한다. 
일부 구현예에서, DNA-결합 도메인은 전사 인자이거나 이를 포함한다. 전사 인자(RF)는 염기 서열의 특정 인식을 담당하는 DNA-결합 도메인 및 전사를 활성화시키거나 억제시킬 수 있는 하나 이상의 이펙터 도메인을 포함하는 모듈 단백질일 수 있다. TF는 염색질과 상호작용하고 보조활성화인자(coactivator) 또는 보조억제인자(corepressor)의 역할을 하는 단백질 복합체를 동원한다.
일부 구현예에서, 이펙터 모이어티는 하나 이상의 RNA(예를 들어, gRNA) 및 dCas9를 포함한다. 일부 구현예에서, 하나 이상의 RNA는 dCas9 및 표적-특이적 가이드 RNA를 통해 게놈 서열 요소에 표적화된다. 당업자에 의해 이해될 바와 같이, 표적화에 사용되는 RNA는 주어진 표적에 따라 동일하거나 상이할 수 있다. 이펙터 모이어티는 앱타머, 예컨대 올리고뉴클레오타이드 앱타머 또는 펩타이드 앱타머를 포함할 수 있다. 앱타머 모이어티는 올리고뉴클레오타이드 또는 펩타이드 앱타머이다.
이펙터 모이어티는 올리고뉴클레오타이드 앱타머를 포함할 수 있다. 올리고뉴클레오타이드 앱타머는 단백질 및 펩타이드를 포함하는 사전 선택된 표적에 높은 친화도 및 특이성으로 결합할 수 있는 단일-가닥 DNA 또는 RNA(ssDNA 또는 ssRNA) 분자이다.
올리고뉴클레오타이드 앱타머는 다양한 분자 표적, 예컨대 소분자, 단백질, 핵산, 및 심지어 세포, 조직 및 유기체에 결합하기 위해 반복된 라운드의 시험관내 선택 또는 동등하게 SELEX(systematic evolution of ligands by exponential enrichment; 지수적 농축에 의한 리간드의 계통적 진화)를 통해 조작될 수 있는 핵산 종이다. 앱타머는 차별적인 분자 인식을 제공하며, 화학적 합성에 의해 생성될 수 있다. 추가적으로, 앱타머는 바람직한 저장 특성을 가지며, 치료적 응용에서 면역원성을 거의 또는 전혀 이끌어내지 않는다.
DNA 및 RNA 앱타머는 둘 다 다양한 표적에 대하여 강력한 결합 친화성을 나타낸다. 예를 들어, DNA 및 RNA 앱타머는 t 리소자임, 트롬빈, 인간 면역결핍 바이러스 트랜스-작용 반응성 요소(HIV TAR), 헤민(hemin), 인터페론 γ, 혈관 내피 성장 인자(VEGF), 전립선 특이적 항원(PSA), 도파민, 및 비-고전적 종양유전자, 열 충격 인자 1(HSF1)에 대해 선택되었다.
앱타머-기반 혈장 단백질 프로파일링을 위한 진단 기법은 앱타머 혈장 프로테오믹스를 포함한다. 이 기술은 질환 대 건강한 상태의 진단적 구별을 도울 수 있는 미래의 다중-바이오마커 단백질 측정을 가능하게 할 것이다.
이펙터 모이어티는 펩타이드 앱타머 모이어티를 포함할 수 있다. 펩타이드 앱타머는 12 내지 14 kDa인 저분자량을 갖는 펩타이드를 포함하여, 하나(또는 그 이상)의 짧은 가변 펩타이드 도메인을 갖는다. 펩타이드 앱타머는 세포에 특이적으로 결합하고 세포 내부의 단백질-단백질 상호작용을 간섭하도록 설계될 수 있다.
펩타이드 앱타머는 특정 표적 분자에 결합하도록 선택되거나 조작된 인공 단백질이다. 이들 단백질은 가변 서열의 하나 이상의 펩타이드 복합체를 포함한다. 이들 단백질은 통상적으로 조합 라이브러리로부터 단리되며, 종종 유도된 돌연변이 또는 가변 영역 돌연변이유발 및 선택 라운드에 의해 후속적으로 개선된다. 생체내에서, 펩타이드 앱타머는 세포 단백질 표적에 결합할 수 있고, 이들의 표적화된 분자와 다른 단백질의 정상적인 단백질 상호작용을 방해하는 것을 포함하여, 생물학적 효과를 발휘할 수 있다. 구체적으로, 전사 인자 결합 도메인에 부착된 가변 펩타이드 앱타머 복합체는 전사 인자 활성화 도메인에 부착된 표적 단백질에 대해 스크리닝된다. 생체내에서 이러한 선택 전략을 통해 표적에 대한 펩타이드 앱타머의 결합은 하류 효모 마커 유전자의 발현으로 검출된다. 그러한 실험은 앱타머에 의해 결합되는 특정 단백질, 및 앱타머가 파괴하는 단백질 상호작용을 확인하여, 주어진 표현형을 유발한다. 추가적으로, 적절한 기능성 모이어티로 유도체화된 펩타이드 앱타머는 표적 단백질의 특정 번역후 변형을 유발하거나 표적의 세포내 국재화를 변경할 수 있다. 펩타이드 앱타머는 또한 시험관내에서 표적을 인식할 수 있다. 펩타이드 앱타머는 바이오센서에서 항체 대신에 사용되는 것을 발견하였으며, 비활성 및 활성 단백질 형태 둘 다를 포함하는 집단으로부터 단백질의 활성 이소형(isoform)을 검출하는 데 사용되었다. 펩타이드 앱타머 "헤드"가 독특한 서열의 이중-가닥 DNA "테일(tail)"에 공유적으로 연결된 태드폴(tadpole)로서 알려져 있는 유도체는 (예를 들어, 정량적 실시간 중합효소 연쇄 반응을 사용하여) 이들의 DNA 테일의 PCR에 의해 혼합물 중 드문 표적 분자의 정량화를 가능하게 한다.
펩타이드 앱타머 선택은 상이한 시스템을 사용하여 이루어질 수 있지만, 현재 효모 2-하이브리드 시스템이 가장 많이 사용된다. 펩타이드 앱타머는 또한 파지 디스플레이 및 다른 표면 디스플레이 기술, 예컨대 mRNA 디스플레이, 리보솜 디스플레이, 박테리아 디스플레이 및 효모 디스플레이에 의해 구축된 조합 펩타이드 라이브러리로부터 선택될 수 있다. 이들 실험 절차는 또한 바이오패닝(biopanning)으로서 알려져 있다. 바이오패닝으로부터 수득되는 펩타이드 중에, 미모토프(mimotope)는 펩타이드 앱타머의 한 종류로서 간주될 수 있다. 조합 펩타이드 라이브러리로부터 패닝된 펩타이드는 명칭이 MimoDB인 특수 데이터에 저장되었다.
예시적인 이펙터 모이어티는 하기를 포함할 수 있지만 이로 한정되지 않는다: 유비퀴틴, 유비퀴틴 리가제 억제제로서의 바이사이클릭 펩타이드, 전사 인자, DNA 및 단백질 변형 효소, 예컨대 토포이소머라제, 토포이소머라제 억제제, 예컨대 토포테칸, DNA 메틸트랜스퍼라제, 예컨대 DNMT 패밀리(예를 들어, DNMT3A, DNMT3B, DNMT3a/3L, MQ1), 단백질 메틸트랜스퍼라제(예를 들어, 바이러스 라이신 메틸트랜스퍼라제(vSET), 단백질-라이신 N-메틸트랜스퍼라제(SMYD2), 데아미나제(예를 들어, APOBEC, UG1), 히스톤 메틸트랜스퍼라제, 예컨대 제스트 인핸서 상동체 2(enhancer of zeste homolog 2, EZH2), PRMT1, 히스톤-라이신-N-메틸트랜스퍼라제(Setdb1), 히스톤 메틸트랜스퍼라제(SET2), 진정 염색질(euchromatic) 히스톤-라이신 N-메틸트랜스퍼라제 2(G9a), 히스톤-라이신 N-메틸트랜스퍼라제(SUV39H1), 및 G9a), 히스톤 데아세틸라제(예를 들어, HDAC1, HDAC2, HDAC3), DNA 탈메틸화에서 역할을 갖는 효소(예를 들어, TET 패밀리 효소는 5-메틸시토신의 5-하이드록시메틸시토신 및 더 고차의 산화적 유도체로의 산화를 촉매함), 단백질 데메틸라제, 예컨대 KDM1A 및 라이신-특이적 히스톤 데메틸라제 1(LSD1), 헬리카제, 예컨대 DHX9, 데아세틸라제(예를 들어, 시르투인(sirtuin) 1, 2, 3, 4, 5, 6, 또는 7), 키나제, 포스파타제, DNA 삽입제, 예컨대 에티듐 브로마이드, SYBR 그린, 및 프로플라빈, 유출 펌프(efflux pump) 억제제, 예컨대 페닐알라닌 아르기닐 β-나프틸아미드 또는 퀴놀린 유도체와 같은 펩타이드모방체, 핵 수용체 활성화제 및 억제제, 프로테아좀 억제제, 리소좀 저장 질환에 관여하는 것들과 같은 효소에 대한 경쟁적 억제제, 단백질 합성 억제제, 뉴클레아제(예를 들어, Cpf1, Cas9, 징크 핑거 뉴클레아제), 단백질 유래 도메인, 예컨대 KRAB 도메인, 및 이들 중 하나 이상의 융합체(예를 들어, dCas9-DNMT, dCas9-MQ1, dCas9-KRAB).
일부 구현예에서, 당업자에게 알려진 방법에 의해 이펙터 모이어티로서 사용하기에 적합한 것으로 후보 도메인이 결정될 수 있다. 예를 들어, 후보 이펙터 모이어티가 세포의 핵 내에 존재하고, (예를 들어, 표적 유전자 또는 상기 표적 유전자에 작동가능하게 연결된 전사 제어 요소에, 예를 들어 표적화 모이어티를 통해) 적절하게 국재화될 때, 후보 이펙터 모이어티가 세포 내의 표적 유전자의 발현을 감소시키는지, 예를 들어 표적 유전자에 의해 인코딩된 RNA 전사체의 수준을 감소시키는지(예를 들어, RNASeq 또는 노턴 블롯(Northern blot)에 의해 측정되는 바와 같음), 또는 표적 유전자에 의해 인코딩된 단백질의 수준을 감소시키는지(예를 들어, ELISA에 의해 측정되는 바와 같음)의 여부를 분석함으로써 후보 리프레서 도메인이 시험될 수 있다.
일부 구현예에서, 발현 리프레서는 복수의 이펙터 모이어티를 포함하며, 여기서 각 이펙터 모이어티는 또 다른 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 이펙터 모이어티는 제2 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다.
일부 구현예에서, 발현 억제 시스템은 복수의 발현 리프레서를 포함하며, 여기서 복수의 발현 리프레서의 각 구성원은 이펙터 모이어티를 포함하며, 여기서 각 이펙터 모이어티는 또 다른 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 이펙터 모이어티는 제2 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 그것에 결합하지 않는다. 일부 구현예에서, 발현 억제 시스템은 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 이펙터 모이어티는 또 다른 제1 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않고, 제2 이펙터 모이어티는 제2 이펙터 모이어티에 검출가능하게 결합하지 않으며, 예를 들어 이에 결합하지 않는다. 일부 구현예에서, 본 명세서에 기재된 조성물 및 방법에 사용하기 위한 이펙터 모이어티는 단량체성 상태, 예를 들어 비-이량체성 상태에서 기능성이다.
일부 구현예에서, 이펙터 모이어티는 후성유전학적 변형 모이어티, 예를 들어 염색질의 2차원 구조를 조절하는(즉, 염색질의 2차원 표현을 변경시키는 방식으로 염색질의 구조를 조절하는) 후성유전학적 변형 모이어티이거나 이를 포함한다.
본 개시내용의 방법 및 조성물에 유용한 후성유전학적 변형 모이어티는 후성유전학적 마커, 예를 들어 DNA 메틸화, 히스톤 메틸화, 히스톤 아세틸화, 히스톤 수모화, 히스톤 인산화, 및 RNA-연관 침묵에 영향을 주는 작용제를 포함한다. 본 명세서에 기재된 바와 같은 게놈 서열 요소에 표적화될 수 있는 예시적인 후성유전학적 효소는 DNA 메틸라제(예를 들어, DNMT3a, DNMT3b, DNMT3a/3L, MQ1), DNA 탈메틸화(예를 들어, TET 패밀리), 히스톤 메틸트랜스퍼라제, 히스톤 데아세틸라제(예를 들어, HDAC1, HDAC2, HDAC3), 시르투인 1, 2, 3, 4, 5, 6, 또는 7, 라이신-특이적 히스톤 데메틸라제 1(LSD1), 히스톤-라이신-N-메틸트랜스퍼라제(Setdb1), 진정 염색질 히스톤-라이신 N-메틸트랜스퍼라제 2(G9a), 히스톤-라이신 N-메틸트랜스퍼라제(SUV39H1), 제스트 인핸서 상동체 2(EZH2), 바이러스 라이신 메틸트랜스퍼라제(vSET), 히스톤 메틸트랜스퍼라제(SET2), 및 단백질-라이신 N-메틸트랜스퍼라제(SMYD2)를 포함한다. 그러한 후성유전학적 변형제의 예는, 예를 들어 문헌[de Groote et al. Nuc. Acids Res. (2012):1-18]에 기재되어 있다.
일부 구현예에서, 발현 리프레서, 예를 들어 본 발명에 유용한 후성유전학적 변형 모이어티를 포함하는 발현 리프레서는 문헌[Koferle et al. Genome Medicine 7.59 (2015):1-3]에 기재된 작제물이거나 이를 포함하며, 이는 본 명세서에 참조로 포함된다. 예를 들어, 일부 구현예에서, 발현 리프레서는 문헌[Koferle et al.]의 표 1에서 확인되는 작제물, 예를 들어 표 1에 기재된 히스톤 데아세틸라제, 히스톤 메틸트랜스퍼라제, DNA 탈메틸화, 또는 H3K4 및/또는 H3K9 히스톤 데메틸라제(예를 들어, dCas9-p300, TALE-TET1, ZF-DNMT3A, 또는 TALE-LSD1)이거나 이를 포함한다.
일부 구현예에서, 이펙터 모이어티는 유전자 편집 시스템의 성분, 예를 들어 CRISPR/Cas 도메인, 예를 들어 Zn 핑거 도메인, 예를 들어 TAL 이펙터 도메인을 포함한다. 일부 구현예에서, 후성유전학적 변형 모이어티는 gRNA에 연결되는 폴리펩타이드(예를 들어, 펩타이드 또는 단백질 모이어티) 및 표적화 뉴클레아제, 예를 들어 Cas9, 예를 들어 야생형 Cas9, 닉카제 Cas9(예를 들어, Cas9 D10A), 촉매적으로 비활성인 Cas9(dCas9), eSpCas9, Cpf1, C2C1, 또는 C2C3, 또는 그러한 뉴클레아제를 인코딩하는 핵산을 포함할 수 있다.
본 명세서에 사용되는 바와 같이, "이펙터 도메인의 생물학적 활성 부분"은 이펙터 도메인의 기능을 (예를 들어, 완전히, 부분적으로, 최소한으로) 유지하는 일부분(예를 들어, "최소" 또는 "코어" 도메인)이다. 일부 구현예에서, dCas9와 후성유전학적 변형제(예컨대, DNA 메틸화의 역할을 하는 DNA 메틸라제 또는 효소, 예를 들어 DNMT3a, DNMT3b, DNMT3L, DNMT 억제제, 이들의 조합, TET 패밀리 효소, 단백질 아세틸 트랜스퍼라제 또는 데아세틸라제, dCas9-DNMT3a/3L, dCas9-DNMT3a/3L/KRAB, dCas9/VP64)의 하나 이상의 이펙터 도메인의 전부 또는 일부와의 융합은 폴리펩타이드와 연결되고 본 명세서에 기재된 방법에 유용한 키메라 단백질을 형성한다. 그러한 키메라 단백질을 포함하는 이펙터 모이어티는 유전자 변형 모이어티(유전자 편집 시스템 성분인 Cas9의 사용으로 인함) 또는 후성유전학적 변형 모이어티(후성유전학적 변형제의 이펙터 도메인의 사용으로 인함)로 지칭된다.
일부 구현예에서, 제공된 기술은 표적 유전자를 특이적으로 표적화하는 gRNA를 포함하는 것으로 기재된다. 일부 구현예에서, 표적 유전자는 종양유전자, 종양 억제인자, 또는 MYC 오조절 장애 관련 유전자이다. 일부 구현예에서, 표적 유전자는 MYC이다.
일부 구현예에서, 본 명세서에서 제공되는 기술은 그러한 모이어티를 융합 분자의 일부로서 표적화 모이어티에 연결함으로써, 본 명세서에 기재된 하나 이상의 유전자 변형 모이어티(예를 들어, CRISPR 시스템 성분)를 대상체에게, 예를 들어 대상체의 세포 또는 조직의 핵에 전달하는 방법을 포함한다. 일부 구현예에서, 본 명세서에서 제공되는 기술은 지질 나노입자에서 하나 이상의 유전자 변형 모이어티(예를 들어, CRISPR 시스템 성분)를 캡슐화함으로써, 본 명세서에 기재된 하나 이상의 유전자 변형 모이어티(예를 들어, CRISPR 시스템 성분)를 대상체에게, 예를 들어 대상체의 세포 또는 조직의 핵에 전달하는 방법을 포함한다.
추가의 모이어티
발현 리프레서는 (예를 들어, 하나 이상의 표적화 모이어티 및 하나 이상의 이펙터 모이어티에 추가하여) 하나 이상의 추가의 모이어티를 추가로 포함할 수 있다. 일부 구현예에서, 추가의 모이어티는 태깅 또는 모니터링 모이어티, 절단성 모이어티(예를 들어, DNA-표적화 모이어티와 이펙터 모이어티 사이에 위치하거나, 폴리펩타이드의 N- 또는 C-말단 단부에 위치한 절단성 모이어티), 소분자, 막 전좌 폴리펩타이드, 또는 약제 모이어티로부터 선택된다.
예시적인 발현 리프레서
하기의 예시적인 발현 리프레서는 단지 예시 목적으로 제시되며, 제한적인 것으로 의도되지 않는다.
일부 구현예에서, 발현 리프레서는 dCas9, 예를 들어 S. 아우레우스 dCas9를 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 68(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 발현 리프레서는 서열번호 119의 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 68, 119의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-MQ1 뉴클레오타이드 서열:
일부 구현예에서, 발현 리프레서는 서열번호 35 또는 151의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 35 또는 151의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-MQ1 단백질 서열:
일부 구현예에서, 발현 리프레서는 dCas9, 예를 들어 S. 피오게네스 dCas9를 포함하는 표적화 모이어티, 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 67(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 67의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-KRAB 뉴클레오타이드 서열:
일부 구현예에서, 발현 리프레서는 서열번호 34 또는 150의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 34, 150의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-KRAB 단백질 서열:
일부 구현예에서, 발현 리프레서는 dCas9, 예를 들어 S. 아우레우스 dCas9를 포함하는 DNA-표적화 모이어티, 및 DNMT1, 예를 들어 인간 DNMT1을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 69(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 69의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-DNMT1 뉴클레오타이드 서열
일부 구현예에서, 발현 리프레서는 서열번호 36 또는 152의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 36 또는 152의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-DNMT1 단백질 서열:
일부 구현예에서, 발현 리프레서는 dCas9, 예를 들어 S. 아우레우스 dCas9를 포함하는 DNA-표적화 모이어티, 및 DNMT13a/3L을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 70(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열에 의해 인코딩된다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 70의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-DNMT3a/3L 뉴클레오타이드 서열
일부 구현예에서, 발현 리프레서는 서열번호 37 또는 153의 아미노산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 37의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
dCas9-DNMT3a/3L 단백질 서열
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인을 포함하는 표적화 모이어티, 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 55, 56, 57, 58, 59, 60, 189, 194, 195, 및 196 중 임의의 것(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열에 의해 인코딩된다. 이러한 예시적인 발현 리프레서의 핵산 서열은 표 6에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 55 내지 60, 189, 194 내지 196 중 임의의 것의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다. 일부 구현예에서 핵산 서열은 폴리-A 서열을 포함하고, 다른 구현예에서 핵산은 폴리-A 서열이 결여되어 있다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 5 내지 10 또는 169 내지 172 중 임의의 것에 따른 아미노산 서열을 가짐)을 포함하는 표적화 모이어티, 및 KRAB(예를 들어, 서열번호 18의 아미노산 서열), 예를 들어 KRAB 도메인을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 22, 23, 24, 25, 26, 27, 139 내지 144, 177 내지 180, 또는 183 내지 186 중 임의의 것의 아미노산 서열을 포함한다. 이러한 예시적인 발현 리프레서의 단백질 서열은 표 7에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 22 내지 27, 139 내지 144, 177 내지 180, 183 내지 186 중 임의의 것의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 44 내지 49 또는 115 중 임의의 것의 뉴클레오타이드 서열에 의해 인코딩되는 것)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 52의 뉴클레오타이드 서열에 의해 인코딩되는 것)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 61, 62, 63, 64, 65, 66, 116, 117, 118, 또는 130의 핵산 서열에 의해 인코딩된다. 이러한 예시적인 발현 리프레서의 핵산 서열은 표 8에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 61 내지 66, 116 내지 118, 130 중 임의의 것의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다. 일부 구현예에서 핵산 서열은 폴리-A 서열을 포함하고, 다른 구현예에서 핵산은 폴리-A 서열이 결여되어 있다. 예를 들어, 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 61 내지 66, 116 내지 118, 또는 130 중 임의의 것에 따른 서열(또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열)을 포함하지만, 3' 폴리-A-서열이 결여되어 있거나, 더 짧은 길이의 3' 폴리-A-서열을 포함하는 서열을 포함한다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 11 내지 14 중 임의의 것의 아미노산 서열을 포함함)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 19)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 28, 29, 30, 31, 32, 33, 129, 및 145 내지 149 중 임의의 것의 아미노 서열을 포함한다. 이러한 예시적인 발현 리프레서의 단백질 서열은 표 9에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 28 내지 33, 129 중 임의의 것의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 11 내지 14 중 임의의 것의 아미노산 서열을 가짐)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 87)을 포함하는 이펙터 모이어티를 포함한다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 166 내지 168 중 임의의 것의 뉴클레오타이드 서열에 의해 인코딩되는 것)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 52의 뉴클레오타이드 서열에 의해 인코딩되는 것)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 157, 158, 또는 159의 핵산 서열에 의해 인코딩된다. 이러한 예시적인 발현 리프레서의 핵산 서열은 표 16에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 166 내지 168 중 임의의 것의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다. 일부 구현예에서 핵산 서열은 폴리-A 서열을 포함하고, 다른 구현예에서 핵산은 폴리-A 서열이 결여되어 있다. 예를 들어, 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 166 내지 168 중 임의의 것에 따른 서열(또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열)을 포함하지만, 3' 폴리-A-서열이 결여되어 있거나, 더 짧은 길이의 3' 폴리-A-서열을 포함하는 서열을 포함한다.
일부 구현예에서, 발현 리프레서는 Zn 핑거 도메인(예를 들어, 서열번호 154 내지 156 중 임의의 것의 아미노산 서열을 포함함)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 19)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 160 내지 165 중 임의의 것의 아미노 서열을 포함한다. 이러한 예시적인 발현 리프레서의 단백질 서열은 표 17에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 서열번호 160 내지 165 중 임의의 것의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 본 개시내용은 제1 ZF를 포함하는 제1 표적화 모이어티, DNA 메틸트랜스퍼라제, 예를 들어 MQ1 또는 이의 기능성 단편을 포함하는 제1 이펙터 모이어티, 제2 ZF를 포함하는 제2 표적화 모이어티, 및 KRAB, 예를 들어 KRAB 도메인을 포함하는 제2 이펙터 모이어티를 포함하는 발현 리프레서 시스템을 제공한다. 일부 구현예에서, 발현 리프레서 시스템은 제1 표적화 모이어티 및 제1 이펙터 모이어티를 인코딩하는 제1 핵산(여기서, 발현은 제1 프로모터 또는 IRES에 의해 구동됨), 및 제2 표적화 모이어티 및 제2 이펙터 모이어티를 인코딩하는 제2 핵산(여기서, 발현은 제2 프로모터 또는 IRES에 의해 구동됨)에 의해 인코딩된다. 일부 구현예에서, 단일-시스트론(mono-cistronic) 서열이 사용된다. 일부 구현예에서, 발현 리프레서 시스템을 인코딩하는 핵산은 다중-시스트론(multi-cistronic) 서열이다. 일부 구현예에서, 다중-시스트론 서열은 이중-시스트론(bi-cistronic) 서열이다. 일부 구현예에서, 다중-시스트론 서열은 제1 발현 리프레서를 인코딩하는 서열 및 제2 발현 리프레서를 인코딩하는 서열을 포함한다. 일부 구현예에서, 다중-시스트론 서열은 자가-절단성 펩타이드 서열, 예를 들어 2A 펩타이드 서열, 예를 들어 T2A 펩타이드 서열, P2A 서열을 인코딩한다. 일부 구현예에서, 다중-시스트론 서열은 T2A 펩타이드 서열 및 P2A 펩타이드 서열을 인코딩한다. 일부 구현예에서, 다중-시스트론 서열은 탠덤 2A 서열, 예를 들어 tPT2A 서열을 인코딩한다. 일부 구현예에서, 다중-시스트론 작제물은 5'에서 3'으로, (i) 제1 핵 국재화 신호, 예를 들어 SV40 NLS, (ii) 제1 표적화 모이어티, 예를 들어 DNA 결합 도메인, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF-9, (iii) 제1 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1, (iv) 제2 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS, (v) 링커, 예를 들어 tPT2A 링커, (vi) 제3 핵 국재화 신호, 예를 들어 SV40NLS, (vii) 제2 표적화 모이어티, 예를 들어 DNA 결합 도메인, 예를 들어 징크 핑거 결합 도메인, 예를 들어 ZF-3, (viii) 제2 이펙터 모이어티, 예를 들어 전사 리프레서 모이어티, 예를 들어 KRAB, 및 (ix) 제4 핵 국재화 신호, 예를 들어 뉴클레오플라스민 NLS를 인코딩한다. 일부 구현예에서, 이중-시스트론 작제물은 폴리A 테일을 추가로 포함한다. 일부 구현예에서, 이중-시스트론 작제물의 전사 시, 제1 발현 리프레서, 및 제2 발현 리프레서를 인코딩하는 단일 mRNA 전사체가 생산되며, 이는 번역 시, 예를 들어 2A 펩타이드 내의 글리신 잔기 이후에 절단되어, 2개의 별개의 단백질로서 제1 발현 리프레서 및 제2 발현 리프레서를 산출한다. 일부 구현예에서, 제1 및 제2 발현 리프레서는 "리보솜-스킵핑"에 의해 분리된다. 일부 구현예에서 제1 발현 리프레서 및/또는 제2 발현 리프레서는 리보솜 스킵핑 후 2A 펩타이드의 단편을 유지한다. 일부 구현예에서, 제1 및 제2 발현 리프레서의 발현 수준은 동일하다. 일부 구현예에서, 제1 및 제2 발현 리프레서의 발현 수준은 상이하다. 일부 구현예에서, 제1 발현 리프레서의 단백질 수준은 제2 발현 리프레서의 단백질 수준의 1%, 2%, 5%, 또는 10% 이내(더 크거나 더 작음)이다.
일부 구현예에서, 이중-시스트론 핵산에 의해 인코딩되는 시스템은 표적 유전자(예를 들어, MYC)의 발현을 다르게는 유사한 시스템보다 세포에서 적어도 1%, 적어도 2%, 적어도 3%, 적어도 4%, 적어도 5%, 적어도 10%, 적어도 20%, 적어도 30%, 적어도 40%, 적어도 50% 감소시키며, 제1 및 제2 발현 리프레서는 단일-시스트론 핵산에 의해 인코딩된다.
일부 구현예에서, 이중-시스트론 서열은 서열번호 91, 92, 121, 122, 181, 182, 187, 188의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다. 일부 구현예에서, 발현 리프레서 시스템은 Zn 핑거 도메인(예를 들어, 서열번호 7 내지 13 중 임의의 것의 아미노산 서열을 포함함)을 포함하는 표적화 모이어티, 및 MQ1, 예를 들어 박테리아 MQ1(예를 들어, 서열번호 19) 또는 KRAB, 예를 들어 KRAB 도메인(예를 들어, 서열번호 18)을 포함하는 이펙터 모이어티를 포함한다. 일부 구현예에서, 발현 리프레서는 서열번호 91, 92, 121, 122, 181, 182, 187, 188 중 임의의 것의 아미노 서열을 포함한다. 이러한 예시적인 발현 리프레서 시스템의 단백질 서열은 표 10에 개시되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서 시스템은 서열번호 91 내지 92, 121 내지 122, 181, 182, 187, 188 중 임의의 것의 아미노산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다.
일부 구현예에서, 이중-시스트론 서열은 서열번호 93 또는 112(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA)) 또는 서열번호 94 또는 113(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열을 포함한다. 일부 구현예에서, 이중-시스트론 서열은 서열번호 196(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA)) 또는 서열번호 197(예를 들어, 발현 리프레서를 인코딩하는 핵산(예를 들어, cDNA))의 핵산 서열을 포함한다. 일부 구현예에서, 본 명세서에 기재된 핵산은 서열번호 93, 94, 112, 113, 196, 또는 197의 핵산 서열, 또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함한다. 이러한 예시적인 발현 리프레서 시스템을 인코딩하는 핵산 서열은 표 10에 개시되어 있다. 일부 구현예에서 핵산 서열은 폴리-A 서열을 포함하고, 다른 구현예에서 핵산은 폴리-A 서열이 결여되어 있다.
일부 구현예에서, 발현 리프레서는 핵 국재화 서열(NLS)을 포함한다. 일부 구현예에서, 발현 리프레서는 NLS, 예를 들어 N-말단에 있는 SV40 NLS를 포함한다. 일부 구현예에서, 발현 리프레서는 NLS, 예를 들어 C-말단에 있는 뉴클레오플라스민 NLS를 포함한다. 일부 구현예에서, 발현 리프레서는 N-말단에 있는 제1 NLS 및 C-말단에 있는 제2 NLS를 포함한다. 일부 구현예에서, 제1 NLS와 제2 NLS는 동일한 서열을 갖는다. 일부 구현예에서, 제1 NLS와 제2 NLS는 상이한 서열을 갖는다. 일부 구현예에서, 발현 억제 리프레서는 SV40 NLS를 포함하며, 예를 들어 발현 리프레서는 PKKKRK(서열번호 135)에 따른 서열을 포함한다. 일부 구현예에서, N-말단 서열은, 예를 들어 MAPKKKRKVGIHGVPAAGSSGS(서열번호 88)에 따른 서열을 갖는 스페이서 및 NLS를 포함한다. 일부 구현예에서, 발현 리프레서는, 예를 들어 스페이서, 뉴클레오플라스민 핵 국재화 서열 및 HA-태그: 예를 들어 SGGKRPAATKKAGQAKKKGSYPYDVPDYA(서열번호 89) 중 하나 이상, 예를 들어 이들 중 임의의 2개 또는 3개 모두를 포함한다. 일부 구현예에서, 발현 리프레서는 에피토프 태그는 에피토프 태그, 예를 들어 HA 태그: YPYDVPDYA(서열번호 90)를 포함한다. 예를 들어, 발현 리프레서는 에피토프 태그의 2개의 카피를 포함할 수 있다.
에피토프 태그가 많은 연구 상황에서 유용하지만, 치료적 상황에서는 에피토프 태그를 생략하는 것이 때때로 바람직하다. 따라서, 일부 구현예에서, 발현 리프레서는 에피토프 태그가 결여되어 있다. 일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 본 명세서에 제공된 서열(또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열)을 포함하지만, 서열번호 90의 HA 태그가 결여되어 있다. 일부 구현예에서, 본 명세서에 기재된 핵산은 본 명세서에 제공된 서열(또는 이것과 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열)을 포함하지만, 서열번호 90의 HA 태그를 인코딩하는 영역이 결여되어 있다. 일부 구현예에서, 발현 리프레서는 뉴클레오플라스민 NLS를 포함하며, 예를 들어 발현 리프레서는 KRPAATKKAGQAKKK(서열번호 136)의 서열을 포함한다. 일부 구현예에서, 발현 리프레서는 NLS를 포함하지 않는다. 일부 구현예에서, 발현 리프레서는 에피토프 태그를 포함하지 않는다. 일부 구현예에서 발현 리프레서는 HA 태그를 포함하지 않는다. 일부 구현예에서, 발현 리프레서는 서열번호 90에 따른 HA 태그 서열을 포함하지 않는다.
일부 구현예에서, 본 개시내용은 자가-절단 펩타이드를 포함하는 발현 리프레서 시스템을 제공한다. 피코르나바이러스에서 처음 발견된 자가-절단 펩타이드는 19 내지 22개 아미노산 길이의 펩타이드이며, 보통 피코르나바이러스 패밀리의 일부 구성원의 2가지 단백질 사이에서 발견된다. 자가-절단 단백질을 사용하여, 피코르나바이러스는 동일한 mRNA에서 등몰 수준의 여러 유전자를 생산할 수 있다. 그러한 자가-절단 단백질은 다른 종의 바이러스에서 발견되는 것으로 알려져 있으며, 본 명세서에 제공된 정보에 기반하여 당업자는 필요한 경우 본 명세서에 개시된 자가-절단 단백질에 대한 적합한 치환을 쉽게 결정할 수 있을 것이다. 일부 구현예에서, 발현 리프레서 시스템은 자가-절단 펩타이드, 예를 들어 2A 자가-절단 펩타이드를 포함한다. 일부 구현예에서, 2A 펩타이드는 단일 절단 부위, 예를 들어 2A 펩타이드, 예를 들어 P2A, T2A, E2A, 또는 F2A 펩타이드를 포함한다. 일부 구현예에서, 자가-절단 펩타이드, 예를 들어 2A 펩타이드는 2개 절단 부위, 예를 들어 pPT2A, 또는 P2A-T2A-E2A를 포함한다. 일부 구현예에서, 발현 리프레서 시스템은 복수의 절단 부위를 포함하는 자가-절단 펩타이드, 예를 들어 T2A 자가-절단 펩타이드 및 P2A 자가-절단 펩타이드를 포함한다. 일부 구현예에서, 2A 펩타이드는 번역 후에 절단된다. 일부 구현예에서, 자가-절단 펩타이드는 절단 후에 2개 이상의 단편을 생산한다. 일부 구현예에서, 2A 펩타이드 단편은 서열번호 126 내지 128의 서열을 포함한다. 일부 구현예에서, 2A 자가-절단 펩타이드는 서열번호 120, 124, 125의 서열 또는 이의 유도체를 포함한다. 일부 구현예에서, 서열번호 95는 자가-절단 펩타이드의 서열을 포함한다.
PSSGGKRPAATKKAGQAKKKKGSYPYDVPDYAGSYPYDVPDYAATNFSLLKQAGDVEENPGPTSAGKLGSGEGRGSLLTCGDVEENPGPLEGSSGSGSPKKKRKVGIHGVPAAGSSGS (서열번호 95)
EGRGSLLTCGDVEENPGP (서열번호 120)
ATNFSLLKQAGDVEENPGPTSAGKLGSGEGRGSLLTCGDVEENPGP (서열번호 124)
ATNFSLLKQAGDVEENPGP (서열번호125)
ATNFSLLKQAGDVEENPG (서열번호 126)
PTSAGKLGSGEGRGSLLTCGDVEENPG (서열번호 127)
P (서열번호 128)
2A 서열, 예를 들어 tPT2A 서열(예를 들어, 서열번호 124에 따름)은 과학 문헌 및 본 명세서에서 자가-절단 펩타이드로 지칭될 수 있지만, 이는 비-제한적인 이론에 따른 것임이 물론 이해된다. 또 다른 비-제한적인 이론에 따르면, 일부 구현예에서 2A 서열은 리보솜-스킵핑을 통해 작용한다. 예를 들어, 2A 서열을 인코딩하는 mRNA는 리보솜 스킵핑을 유도할 수 있으며, 여기서 리보솜은 2A 영역을 번역하는 동안 펩타이드 결합을 형성하지 못하여, 번역 산물의 첫 번째 부분을 방출하게 된다. 그 다음 리보솜은 번역 산물의 두 번째 부분을 생산한다. 전체적으로, 제1 서열과 제2 서열 사이에 위치한 2A 서열이 제1 서열을 포함하는 제1 단백질과, 제2 서열을 포함하는 별개의 제2 단백질의 생산을 야기할 것이라는 것은 잘 확립되어 있다. 본 개시내용은 이것이 달성되는 분자 메커니즘에 관한 임의의 특정 이론에 의해 구속되지 않는다.
기능적 특성
본 개시내용의 발현 리프레서 또는 시스템은 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 감소시키는 데 사용될 수 있다. 일반적으로, 본 명세서에 기재된 바와 같은 발현 리프레서 또는 시스템은 (예를 들어, 표적화 모이어티를 통해) 표적 유전자, 예를 들어 MYC에 근접하고/하거나 이에 작동가능하게 연결된 게놈 서열 요소에 결합한다. 일부 구현예에서, 게놈 서열 요소에 대한 발현 리프레서 또는 시스템의 결합은 표적 유전자, 예를 들어 MYC의 발현을 조절한다(예를 들어, 감소시킨다). 예를 들어, 게놈 서열 요소에 대한 전사 기구의 성분의 동원을 억제하는 이펙터 모이어티를 포함하는 발현 리프레서 또는 시스템의 결합은 표적 유전자, 예를 들어 MYC의 발현을 조절할(예를 들어, 감소시킬) 수 있다. 추가의 예로서, 효소 활성을 갖는 이펙터 모이어티(예를 들어, 후성유전학적 변형 모이어티)를 포함하는 발현 리프레서 또는 시스템의 결합은 이펙터 모이어티의 국재화된 효소 활성을 통해 표적 유전자, 예를 들어 MYC의 발현을 조절할(예를 들어, 감소시킬) 수 있다. 추가의 예로서, 게놈 서열 요소에 대한 발현 리프레서 또는 시스템의 결합 및 발현 리프레서 또는 시스템의 국재화된 효소 활성 둘 다는 표적 유전자, 예를 들어 MYC의 발현에 있어서의 생성되는 조절(예를 들어, 감소)에 기여할 수 있다.
일부 구현예에서, 발현의 감소는 표적 유전자, 예를 들어 MYC에 의해 인코딩되는 RNA, 예를 들어 mRNA의 수준의 감소를 포함한다. 일부 구현예에서, 발현의 감소는 표적 유전자, 예를 들어 MYC에 의해 인코딩되는 단백질의 수준의 감소를 포함한다. 일부 구현예에서, 발현의 감소는 표적 유전자, 예를 들어 MYC에 의해 인코딩되는 mRNA 및 단백질의 수준 둘 다의 감소를 포함한다. 일부 구현예에서, 본 명세서에 개시된 발현 리프레서 또는 발현 억제 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자의 발현은 본 명세서에 개시된 발현 리프레서 또는 발현 억제 시스템에 의해 접촉되지 않거나 이를 포함하지 않는 세포 내의 표적 유전자의 발현 수준보다 적어도 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.55×, 1.6×, 1.65×, 1.7×, 1.75×, 1.8×, 1.85×, 1.9×, 1.95×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 30×, 40×, 50×, 60×, 70×, 80×, 90×, 또는 100× 더 낮다. 표적 유전자, 예를 들어 MYC의 발현은 RT-PCR, ELISA, 웨스턴 블롯을 포함한 당업자에게 알려진 방법, 및 실시예 2 또는 9의 방법에 의해 분석될 수 있다. 대상체, 예를 들어 환자, 예를 들어 MYC 오조절 장애를 갖는 환자, 예를 들어 간 질환을 갖는 환자, 신생물 및/또는 바이러스 또는 알코올 관련 간 질환을 갖는 환자, 예를 들어 간암종을 갖는 환자, 예를 들어 간암종 하위유형 S1 또는 간암종 하위유형 S2를 갖는 환자에서 표적 유전자, 예를 들어 MYC의 발현 수준은 표적 유전자, 예를 들어 MYC의 혈액(예를 들어, 전혈) 수준을 평가함으로써, 예를 들어 문헌[Oglesbee et al. Clin Chem. 2013 Oct;59(10):1461-9. Doi: 10.1373/clinchem.2013.207472] 또는 [Deutsch et al. J Neurol Neurosurg Psychiatry. 2014 Sep;85(9):994-1002. Doi: 10.1136/jnnp-2013-306788]의 방법에 의해 평가될 수 있으며, 이의 내용은 전체적으로 본 명세서에 참조로 포함된다.
본 개시내용의 발현 리프레서 또는 시스템은 일정 기간 동안 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 감소시키는 데 사용될 수 있다. 일부 구현예에서, 발현 리프레서 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자, 예를 들어 MYC의 발현은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 14, 또는 15일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 상당히 감소된다. 선택적으로, 발현 리프레서 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자, 예를 들어 MYC의 발현은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하 동안 상당히 감소된다. 일부 구현예에서, 발현 리프레서 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자, 예를 들어 MYC의 발현은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10회 세포 분열 동안 상당히 감소된다. 본 개시내용의 발현 리프레서 또는 시스템은 표적 프로모터, 예를 들어 MYC 프로모터에서 CpG 뉴클레오타이드를 메틸화하는 데 사용될 수 있다. 일부 구현예에서, MYC 발현의 전사 변화는 CpG 메틸화의 백분율과 상관관계가 있다. 일부 구현예에서, 메틸화는 본 명세서에 개시된 발현 리프레서 또는 시스템으로 치료 후 적어도 1일, 적어도 2일, 적어도 5일, 적어도 7일, 적어도 10일, 적어도 15일, 또는 적어도 20일 동안 지속된다.
본 개시내용의 발현 리프레서 또는 시스템은 표적 유전자좌, 예를 들어 MYC 유전자좌를 포함하는 세포의 생존능을 감소시키는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 표적 유전자좌, 예를 들어 MYC 유전자좌를 포함하는 복수의 세포의 생존능을 감소시는 데 사용될 수 있다. 일부 구현예에서, 발현 리프레서, 또는 시스템에 의해 접촉되거나 이를 포함하는 생존 세포의 수는 발현 리프레서 또는 시스템에 의해 접촉되지 않거나 이를 포함하지 않는 세포의 대조군 집단의 생존 세포의 수와 비교하여 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%만큼 상당히 감소된다.
일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 암 세포 및 비-암 세포를 포함하는 복수의 세포의 생존능을 감소시는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 더 많이 감소시키는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 많이 감소시키는 데 사용될 수 있다.
일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 감염 세포 및 비감염 세포를 포함하는 복수의 세포의 생존능을 감소시는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 복수의 비감염 세포의 생존능을 감소시키는 것보다 복수의 감염 세포의 생존능을 더 많이 감소시키는 데 사용될 수 있다. 일부 구현예에서, 본 개시내용의 발현 리프레서 또는 시스템은 복수의 비감염 세포의 생존능을 감소시키는 것보다 복수의 감염 세포의 생존능을 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 많이 감소시키는 데 사용될 수 있다.
발현 억제 시스템은 복수의 발현 리프레서를 포함할 수 있으며, 각 발현 리프레서는 다른 발현 리프레서의 이펙터 모이어티와 상이한 기능성을 갖는 이펙터 모이어티를 포함한다. 예를 들어, 발현 억제 시스템은 2개의 발현 리프레서를 포함할 수 있으며, 여기서 제1 발현 리프레서는 후성유전학적 변형 모이어티를 포함하는 제1 이펙터 모이어티, 예를 들어 DNA 메틸트랜스퍼라제, 예를 들어 MQ1을 포함하고 제2 발현 리프레서는 전사 리프레서, 예를 들어 KRAB를 포함하는 제2 이펙터 모이어티를 포함한다. 일부 구현예에서, 제2 발현 리프레서는 제2 이펙터 모이어티를 포함하지 않는다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 MYC의 발현의 억제에 대해 서로 상보적인 기능성을 갖는 이펙터 모이어티의 조합을 포함하는 발현 리프레서를 포함하며, 이들 기능성은 함께, 발현을 억제할 수 있고, 선택적으로, 개별적으로 존재할 때에는 발현을 억제하지 않거나 무시할 만한 정도로 억제한다. 일부 구현예에서, 발현 억제 시스템은 복수의 발현 리프레서를 포함하며, 여기서 각 발현 리프레서는 서로의 발현 리프레서의 이펙터 모이어티를 보완하는 이펙터 모이어티를 포함하고, 예를 들어 각 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다.
일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 MYC의 발현의 억제에 대해 서로 상승작용하는 기능성을 갖는 이펙터 모이어티의 조합을 포함하는 발현 리프레서를 포함한다. 이론에 의해 구애되고자 함이 없이, 다수의 억제 후성유전학적 마커(예를 들어, 다수의 상이한 유형의 후성유전학적 마커 및/또는 주어진 유형의 더 광범위한 마킹)가 개별적으로, 단독으로의 개별적인 변형보다 더 효과적으로 발현을 함께 감소시킨다는 점에서(예를 들어, 발현의 더 큰 감소의 생성 및/또는 발현의 더 오래 지속된 감소), 게놈 유전자좌에 대한 후성유전학적 변형은 누적될 수 있다. 일부 구현예에서, 발현 억제 시스템은 복수의 발현 리프레서를 포함하며, 여기서 각 발현 리프레서는 서로의 발현 리프레서의 이펙터 모이어티와 상승작용하는 이펙터 모이어티를 포함하고, 예를 들어 각 이펙터 모이어티는 표적 유전자, 예를 들어 MYC의 발현을 감소시킨다.
일부 구현예에서, 발현 리프레서 또는 시스템은 표적 유전자, 예를 들어 MYC와 연관된 하나 이상의 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열을 변경시킴으로써 표적 유전자, 예를 들어 MYC의 발현을 조절한다(예를 들어, 감소시킨다). 일부 구현예에서, 변경시키는 것은 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열의 수준을 감소시키는 것을 포함한다. 후성유전학적 마커는 DNA 메틸화, 히스톤 메틸화, 및 히스톤 데아세틸화를 포함하지만 이에 제한되지 않는다.
일부 구현예에서, 후성유전학적 마커의 수준을 변경시키는 것은 리프레서 또는 시스템에 의해 접촉되지 않거나 이를 포함하지 않는 세포 내의 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열의 수준보다 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 대조군 서열의 수준을 적어도 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.55×, 1.6×, 1.65×, 1.7×, 1.75×, 1.8×, 1.85×, 1.9×, 1.95×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 30×, 40×, 50×, 60×, 70×, 80×, 90×, 또는 100× 더 낮게 감소시킨다. 후성유전학적 마커의 수준은 전체 게놈 중아황산염 서열분석, 감소된 표현의 중아황산염 서열분석, 중아황산염 앰플리콘 서열분석, 메틸화 어레이, 파이로시퀀싱, ChIP-seq, 또는 ChIP-qPCR을 포함한 당업자에게 알려진 방법에 의해 분석될 수 있다. 일부 구현예에서, 후성유전학적 마커, 예를 들어 DNA 메틸화의 변화(예를 들어, 증가 또는 감소)는, 예를 들어 hg19 참조 게놈에 따른 chr8:129188693-129189048 사이에서 hg19 참조 게놈에 따른 정확한 게놈 좌표에서 중아황산염 게놈 서열분석을 사용하여 분석될 수 있다. 일부 구현예에서, 후성유전학적 마커, 예를 들어 DNA 메틸화의 변화(예를 들어, 증가 또는 감소)는 서열번호 123에 따른 게놈 위치에서 중아황산염 게놈 서열분석을 사용하여 분석될 수 있다.
본 개시내용의 발현 리프레서 또는 시스템은 일정 기간 동안 세포 내의 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열의 수준을 변경시키는 데 사용될 수 있다. 일부 구현예에서, 발현 리프레서 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열의 수준은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 상당히 감소된다. 선택적으로, 발현 리프레서 또는 시스템에 의해 접촉되거나 이를 포함하는 세포 내의 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커 또는 이와 작동가능하게 연결된 발현 제어 서열의 수준은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하 동안 상당히 감소된다.
레프레서의 조합
일부 구현예에서, 발현 억제 시스템은 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서 및 제2 이펙터 모이어티를 포함하는 제2 발현 리프레서를 포함하며, 여기서 제1 이펙터 모이어티 및 제2 이펙터 모이어티는 서로 상이하다. 일부 구현예에서, 제1 이펙터 모이어티는 제1 후성유전학적 변형 모이어티(예를 들어, 제1 후성유전학적 마커를 증가시키거나 감소시킴) 또는 이의 기능성 단편이거나 이를 포함하고 제2 이펙터 모이어티는 제2 후성유전학적 변형 모이어티(예를 들어, 제2 후성유전학적 마커를 증가시키거나 감소시킴) 또는 이의 기능성 단편이거나 이를 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 DNA 메틸트랜스퍼라제 또는 이의 기능성 단편이거나 이를 포함하고 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 단편이거나 이를 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데아세틸라제 또는 이의 기능성 단편이거나 이를 포함하고 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 단편이거나 이를 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 메틸트랜스퍼라제 또는 이의 기능성 단편이거나 이를 포함하고 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 단편이거나 이를 포함한다. 일부 구현예에서, 제1 이펙터 모이어티는 히스톤 데메틸라제 또는 이의 기능성 단편이거나 이를 포함하고 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2 또는 이들 중 임의의 것의 기능성 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB(예를 들어, KRAB 도메인), MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 KRAB(예를 들어, KRAB 도메인), MeCP2, HP1, RBBP4, REST, FOG1, SUZ12, 또는 이들 중 임의의 것의 기능성 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 MQ1, DNMT1, DNMT3A1, DNMT3A2, DNMT3B1, DNMT3B2, DNMT3B3, DNMT3B4, DNMT3B5, DNMT3B6, DNMT3L, HDAC1, HDAC2, HDAC3, HDAC4, HDAC5, HDAC6, HDAC7, HDAC8, HDAC9, HDAC10, HDAC11, SIRT1, SIRT2, SIRT3, SIRT4, SIRT5, SIRT6, SIRT7, SIRT8, SIRT9, KDM1A(즉, LSD1), KDM1B(즉, LSD2), KDM2A, KDM2B, KDM5A, KDM5B, KDM5C, KDM5D, KDM4B, NO66, SETDB1, SETDB2, EHMT2(즉, G9A), EHMT1(즉, GLP), SUV39H1, EZH2, EZH1, SUV39H2, SETD8, SUV420H1, SUV420H2 또는 이들 중 임의의 것의 기능성 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 박테리아 MQ1 또는 이의 기능성 변이체 또는 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 DNMT3A 또는 이의 기능성 변이체 또는 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 DNMT3B 또는 이의 기능성 변이체 또는 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 DNMT3L 또는 이의 기능성 변이체 또는 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다.
일부 구현예에서, 제1 이펙터 모이어티는 DNMT3a/3L 복합체 또는 이의 기능성 변이체 또는 단편이거나 이를 포함하고, 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편이거나 이를 포함한다.
표적 부위
본 명세서에 개시된 발현 리프레서 또는 발현 리프레서 시스템은 세포, 예를 들어 대상체 또는 환자의 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하는 데, 예를 들어 감소시키는 데 유용하다. 표적 유전자, 예를 들어 MYC는 당업자에게 알려진 임의의 유전자일 수 있다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC는 대상체, 예를 들어 포유동물, 예를 들어 인간, 소, 말, 양, 닭, 래트, 마우스, 고양이, 또는 개에서 질환 또는 병태와 연관되어 있다. 표적 유전자는 코딩 서열, 예를 들어 엑손, 및/또는 비-코딩 서열, 예를 들어 인트론, 3'UTR, 또는 5'UTR을 포함할 수 있다. 일부 구현예에서, 표적 유전자는 전사 제어 요소에 작동가능하게 연결된다.
본 명세서에 기재된 발현 리프레서 또는 시스템의 발현 리프레서에서 사용하기에 적합한 표적화 모이어티는 표적 유전자, 예를 들어 MYC 내 임의의 부위, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소, 앵커 서열(예를 들어 표적 유전자에 근접하거나 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부와 회합된 앵커 서열(예를 들어, 앵커 서열-매개 연접부는 연접부의 파괴가 표적 유전자, 예를 들어 MYC의 발현을 변경시키는 경우, 표적 유전자에 작동가능하게 연결됨)), 또는 슈퍼 인핸서 영역에 위치된 조절 요소(예를 들어, MYC의 슈퍼 인핸서에 위치한 조절 요소)에 결합, 예를 들어 특이적으로 결합할 수 있다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서는 부위에 근접한 부위에서 또는 위치에서 결합한다. 예를 들어, 표적화 모이어티는 리프레서(제2 부위)에 근접한 제1 부위에 결합할 수 있고, 상기 표적화 모이어티와 연관된 이펙터 모이어티는, 표적 유전자의 발현에 대한 인핸서의 효과가 마치 제2 부위(인핸서 서열)가 결합되고/되거나 변형된 것처럼 실질적으로 동일하게 변형되도록 제1 부위를 후성유전학적으로 변형시킬 수 있다. 일부 구현예에서, 표적 유전자(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위)에 근접한 부위, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소에 근접한 부위, 또는 앵커 서열에 근접한 부위는 표적 유전자, 예를 들어 MYC(예를 들어, 표적 유전자, 예를 들어 MYC 내의 엑손, 인트론, 또는 스플라이스 부위), 전사 제어 요소, 또는 앵커 서열로부터 5000, 5000, 4000, 3000, 2000, 1000, 900, 800, 700, 600, 500, 400, 300, 200, 100, 50, 또는 25개의 염기쌍(그리고 선택적으로, 표적 유전자, 예를 들어 MYC(예를 들어, 표적 유전자 내의 엑손, 인트론, 또는 스플라이스 부위), 전사 제어 요소, 또는 앵커 서열)로부터 적어도 적어도 20, 25, 50, 100, 200, 또는 300개의 염기쌍) 미만에 있다.
일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC에 결합한다. 일부 구현예에서, DNA-표적화 모이어티는 표적 유전자, 예를 들어 MYC의 엑손 내의 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC의 인트론 내의 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC의 엑손 및 인트론의 경계에 있는 부위, 예를 들어 스플라이스 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC의 5'UTR 내의 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC의 3'UTR 내의 부위에 결합한다. 표적 유전자는 MYC를 인코딩하는 유전자를 포함하지만 이에 제한되지 않는다.
일부 구현예에서, 표적화 모이어티는 표적 유전자(예를 들어, MYC)에 작동가능하게 연결된 전사 제어 요소, 예를 들어 프로모터 또는 인핸서에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적화 유전자, 예를 들어 MYC에 작동가능하게 연결된 프로모터의 일부분 또는 프로모터 내의 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC의 전사 개시 부위에 결합한다. 일부 구현예에서, 표적화 모이어티는 표적화 유전자, 예를 들어 MYC에 작동가능하게 연결된 프로모터의 일부분 또는 인핸서 내의 부위에 결합한다. 일부 구현예에서, 게놈 복합체(예를 들어, ASMC)는 2개 이상의 게놈 서열 요소를 공국재화하며, 여기서 2개 이상의 게놈 서열 요소는 프로모터를 포함한다. 프로모터는 통상적으로 연관된 유전자의 전사를 개시하는 서열 요소이다. 프로모터는 통상적으로 전사 개시 부위에서 멀지 않은 유전자의 5' 말단 근처에 있다. 당업자가 인식하는 바와 같이, 진핵 세포에서의 단백질-코딩 유전자의 전사는 통상적으로 RNA 중합효소 II를 전사 개시 부위로 유도하는 전개시 복합체(preinitiation complex)로서의 코어 프로모터 서열에 대한 일반적인 전사 인자(예를 들어, TFIID, TFIIE, TFIIH, FUSE, CT-요소 등) 및 메디에이터의 결합에 의해 개시되고, 많은 경우에 1차 전사체의 RNA 중합효소 탈출 및 신장이 개시된 후조차도 코어 프로모터 서열에 결합된 상태로 남아 있다. 일부 구현예에서, 프로모터는 서열 요소, 예컨대 TATA, Inr, DPE, 또는 BRE를 포함하지만, 당업자는 그러한 서열이 프로모터를 정의하는 데 반드시 필요한 것은 아님을 잘 알고 있다. 당업자는 유전자와 연관된 다양한 양성(예를 들어, 인핸서) 또는 음성(예를 들어, 리프레서 또는 사일런서) 전사 제어 요소에 익숙하다. 일부 구현예에서, 전사 제어 요소는 전사 인자 결합 부위이다. 통상적으로, 동족 조절 단백질이 그러한 전사 제어 요소에 결합될 때, 연관된 유전자(들)로부터의 전사는 변경된다(예를 들어, 증가되거나 감소된다). 일부 구현예에서, 표적화 모이어티는 게놈 좌표 GRCh37: chr8:129162465-129212140 내에 위치한 게놈 서열에 결합한다.
일부 구현예에서, 표적화 모이어티는 게놈 서열 요소에 의해 포함되거나 부분적으로 포함되는 표적 서열에 결합한다. 일부 구현예에서, 게놈 서열 요소는 발현 제어 서열이거나 이를 포함한다. 일부 구현예에서, 게놈 서열 요소는 표적 유전자, 예를 들어 MYC 또는 표적 유전자, 예를 들어 MYC의 일부이거나 이를 포함한다. 일부 구현예에서, 표적화 모이어티는 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 또는 35개 염기 길이(및 선택적으로 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 또는 20개 이하의 염기 길이)인 표적 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 10 내지 30, 15 내지 30, 15 내지 25, 18 내지 24, 19 내지 23, 20 내지 23, 21 내지 23, 또는 22 내지 23개 염기 길이인 표적 서열에 결합한다. 일부 구현예에서, 표적 서열은 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40개 염기 길이이다. 일부 구현예에서, 게놈 서열 요소는 앵커 서열이거나 이를 포함한다.
각 ASMC는 하나 이상, 예를 들어 복수의 앵커 서열을 포함한다. 일부 구현예에서, 앵커 서열은 자연 발생 게놈 복합체(예를 들어, ASMC)를 조절(예를 들어, 파괴)하거나 새로운 게놈 복합체(예를 들어, ASMC)를 형성(예를 들어, 외인성 또는 변경된 앵커 서열을 갖는 비-자연 발생 게놈 복합체(예를 들어, SMC)를 형성)하도록 조작되거나 변경될 수 있다. 일부 구현예에서, 앵커 서열-매개 연접부는 표적 유전자의 발현을 변경시키도록, 예를 들어 억제하도록, 예를 들어 감소시키도록 파괴될 수 있다. 그러한 파괴는, 예를 들어 DNA의 토폴로지 구조를 변경시킴으로써, 예를 들어 전사 제어 요소(예를 들어, 인핸싱 및 침묵/억제 서열)와 상호작용할 수 있는 표적 유전자의 능력을 조절함으로써, 유전자 발현을 조절할 수 있다.
일부 구현예에서, 표적화 모이어티는 앵커 서열, 예를 들어 표적 유전자, 예를 들어 MYC에 근접하거나 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부(ASMC)와 회합된 앵커 서열(예를 들어, 앵커 서열-매개 연접부는 연접부의 파괴가 표적 유전자, 예를 들어 MYC의 발현을 변경시키는 경우, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결됨)에 결합할 수 있다. 일반적으로, 앵커 서열은 게놈 복합체 성분, 예를 들어 핵형성 폴리펩타이드가 특이적으로 결합하는 게놈 서열 요소이다. 일부 구현예에서, 앵커 서열에 대한 게놈 복합체 성분의 결합은 복합체 형성, 예를 들어 ASMC 형성을 핵형성한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC에 유전자좌 결합한다. 유전자좌는 일반적으로 표적 유전자, 예를 들어 MYC를 포함하는 ASMC의 전사된 영역, 프로모터, 및 앵커 부위를 포함하는 것으로 정의된다. 일부 구현예에서, 표적화 모이어티는 서열번호 75 내지 86 또는 199 내지 206 중 어느 하나를 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 75 내지 86 중 어느 하나를 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 75 내지 86 중 어느 하나를 포함하는 서열에 결합하며, 여기서 제1 및 제2 표적화 모이어티는 동일한 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 75 내지 86 중 어느 하나를 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 75 내지 86 중 어느 하나를 포함하는 서열에 결합하며, 여기서 제1 및 제2 표적화 모이어티는 상이한 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 83, 203, 또는 206 중 임의의 것을 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 77을 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 77을 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 83, 203, 또는 206 중 임의의 것을 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 83, 203, 또는 206 중 임의의 것을 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 199, 204, 또는 205 중 임의의 것을 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 199, 204, 또는 205 중 임의의 것을 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 83, 203, 또는 206 중 임의의 것을 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 83, 203, 또는 206 중 임의의 것을 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 201을 포함하는 서열에 결합한다. 일부 구현예에서, 제1 및 제2 발현 리프레서를 인코딩하는 핵산은 제1 발현 리프레서를 인코딩하는 제1 영역을 포함하며, 여기서 제1 영역은 제2 발현 리프레서를 인코딩하는 제2 영역의 상류에 있다. 일부 구현예에서, 제1 및 제2 발현 리프레서를 인코딩하는 핵산은 제1 발현 리프레서를 인코딩하는 제1 영역을 포함하며, 여기서 제1 영역은 제2 발현 리프레서를 인코딩하는 제2 영역의 하류에 있다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 75 내지 86 또는 199 내지 206 중 어느 하나를 포함하는 서열에 결합하고, 제2 표적화 모이어티(예를 들어 gRNA를 포함하는 CRISPR/Cas 도메인)는 서열번호 1 내지 4 중 어느 하나를 포함하는 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합하며, 여기서 제1 및 제2 표적화 모이어티는 동일한 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합하고 제2 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합하며, 여기서 제1 및 제2 표적화 모이어티는 상이한 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 서열번호 96 내지 110 중 어느 하나를 포함하는 서열에 결합하고, 제2 표적화 모이어티(예를 들어 gRNA를 포함하는 CRISPR/Cas 도메인)는 서열번호 1 내지 4 중 어느 하나를 포함하는 서열에 결합한다. 일부 구현예에서, 제1 표적화 모이어티는 표 2, 12, 또는 13에 개시된 서열번호 중 어느 하나를 포함하는 서열에 결합하고, 제2 표적화 모이어티(예를 들어 gRNA를 포함하는 CRISPR/Cas 도메인)는 표 2, 12, 또는 13에 개시된 서열번호 중 어느 하나를 포함하는 서열에 결합한다.
예시적인 표적 서열은 표 12에 개시되어 있다.
일부 구현예에서, 발현 리프레서는 본 명세서에 제시된 서열, 예를 들어 서열번호 1 내지 4, 75 내지 86, 96 내지 110, 또는 199 내지 206 중 어느 하나를 갖는 게놈 유전자좌에 결합한다. 많은 경우에, 결합되는 게놈 유전자좌는 이중 가닥 DNA를 포함하고, 이 유전자좌는 그의 센스 가닥 또는 그의 안티센스 가닥의 서열을 제공함으로써 기재될 수 있음이 이해된다. 따라서, 제공된 스페이서 서열을 갖는 gRNA는 발현 리프레서가 특정 게놈 유전자좌에 결합되게 할 수 있으며, 여기서 게놈 유전자좌의 한쪽 가닥은 스페이서 서열과 유사하거나 동일한 서열을 갖고, 게놈 유전자좌의 나머지 다른 한쪽 가닥은 상보적 서열을 갖는다. 통상적으로, 게놈 유전자좌에 대한 gRNA 결합은 게놈 유전자좌의 약간의 풀림(unwinding) 및 gRNA 스페이서와 이 스페이서와 상보적인 가닥의 쌍형성을 수반할 것이다.
일부 구현예에서, 표적화 모이어티는 마우스 게놈에서 앵커 서열, 예를 들어 표적 유전자, 예를 들어 MYC에 근접하거나 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부(ASMC)와 회합된 앵커 서열(예를 들어, 앵커 서열-매개 연접부는 연접부의 파괴가 표적 유전자, 예를 들어 MYC의 발현을 변경시키는 경우, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결됨)에 결합할 수 있다. 일반적으로, 앵커 서열은 게놈 복합체 성분, 예를 들어 핵형성 폴리펩타이드가 특이적으로 결합하는 게놈 서열 요소이다. 일부 구현예에서, 앵커 서열에 대한 게놈 복합체 성분의 결합은 복합체 형성, 예를 들어 ASMC 형성을 핵형성한다. 일부 구현예에서, 표적화 모이어티는 표적 유전자, 예를 들어 MYC에 유전자좌 결합한다. 유전자좌는 일반적으로 표적 유전자, 예를 들어 MYC를 포함하는 ASMC의 전사된 영역, 프로모터, 및 앵커 부위를 포함하는 것으로 정의된다. 일부 구현예에서, 표적화 모이어티는 서열번호 190 내지 192 중 어느 하나를 포함하는 서열에 결합한다. 일부 구현예에서, 표적화 모이어티는 표 18에 개시된 서열번호 중 어느 하나를 포함하는 서열에 결합한다. 마우스 게놈에서 예시적인 표적 서열은 표 18에 개시되어 있다.
일부 구현예에서, 발현 리프레서는 본 명세서에 제시된 서열, 예를 들어 서열번호 190 내지 192 중 어느 하나를 갖는 게놈 유전자좌에 결합한다. 많은 경우에, 결합되는 게놈 유전자좌는 이중 가닥 DNA를 포함하고, 이 유전자좌는 그의 센스 가닥 또는 그의 안티센스 가닥의 서열을 제공함으로써 기재될 수 있음이 이해된다.
일 구현예에서, 앵커 서열-매개 연접부는 루프, 예컨대 염색체내 루프를 포함한다. 특정 구현예에서, 앵커 서열-매개 연접부는 복수의 루프를 갖는다. 하나 이상의 루프는 제1 앵커 서열, 핵산 서열, 전사 제어 서열, 및 제2 앵커 서열을 포함할 수 있다. 또 다른 구현예에서, 적어도 하나의 루프는 제1 앵커 서열, 전사 제어 서열, 및 제2 앵커 서열, 또는 제1 앵커 서열, 핵산 서열, 및 제2 앵커 서열을 순서대로 포함한다. 또 다른 구현예에서, 핵산 서열 및 전사 제어 서열 중 하나 또는 둘 다는 루프 내부 또는 외부에 위치한다. 또 다른 구현예에서, 루프 중 하나 이상은 전사 제어 서열을 포함한다.
일부 구현예에서, 앵커 서열-매개 연접부는 TATA 박스, CAAT 박스, GC 박스, 또는 CAP 부위를 포함한다. 일부 구현예에서, 앵커 서열-매개 연접부는 복수의 루프를 포함하고, 앵커 서열-매개 연접부는 하나 이상의 루프에 앵커 서열, 핵산 서열, 및 전사 제어 서열 중 적어도 하나를 포함한다.
일부 구현예에서, 염색질 구조는 앵커 서열 내에서 하나 이상의 뉴클레오타이드를 치환하거나, 추가하거나, 결실시킴으로써 변형된다. 일부 구현예에서, 염색질 구조는 앵커 서열-매개 연접부의 앵커 서열 내에서 하나 이상의 뉴클레오타이드를 치환하거나, 추가하거나, 결실시킴으로써 변형된다. 일부 구현예에서, 전사는 활성화 루프의 포함 또는 억제 루프의 배제에 의해 개시된다. 그러한 일 구현예에서, 앵커 서열-매개 연접부는 핵산 서열의 전사를 감소시키는 전사 제어 서열을 배제한다. 일부 구현예에서, 전사는 억제 루프의 포함 또는 활성화 루프의 배제에 의해 억제된다. 그러한 일 구현예에서, 앵커 서열-매개 연접부는 핵산 서열의 전사를 감소시키는 전사 제어 서열을 포함한다.
앵커 서열은 서로 인접하지 않을 수 있다. 비인접 앵커 서열을 갖는 구현예에서, 제1 앵커 서열은 제2 앵커 서열로부터 약 500 bp 내지 약 500 Mb, 약 750 bp 내지 약 200 Mb, 약 1 kb 내지 약 100 Mb, 약 25 kb 내지 약 50 Mb, 약 50 kb 내지 약 1 Mb, 약 100 kb 내지 약 750 kb, 약 150 kb 내지 약 15 500 kb, 또는 약 175 kb 내지 약 500 kb만큼 떨어져 있을 수 있다. 일부 구현예에서, 제1 앵커 서열은 제2 앵커 서열로부터 약 500 bp, 600 bp, 700 bp, 800 bp, 900 bp, 1 kb, 5 kb, 10 kb, 15 kb, 20 kb, 25 kb, 30 kb, 35 kb, 40 kb, 45 kb, 50 kb, 55 kb, 60 kb, 65 kb, 70 kb, 75 kb, 80 kb, 85 kb, 90 kb, 95 kb, 100 kb, 125 kb, 150 kb, 175 kb, 200 kb, 225 kb, 250 kb, 275 kb, 300 kb, 350 kb, 400 kb, 500 kb, 600 kb, 700 kb, 800 kb, 900 kb, 1 Mb, 2 Mb, 3 Mb, 4 Mb, 5 Mb, 6 Mb, 7 Mb, 8 Mb, 9 Mb, 10 Mb, 15 Mb, 20 Mb, 25 Mb, 50 Mb, 75 Mb, 20 100 Mb, 200 Mb, 300 Mb, 400 Mb, 500 Mb, 또는 이 사이의 임의의 크기만큼 떨어져 있다.
일부 더 많은 구현예에서, 표적화 모이어티는 다음 중 적어도 하나를 도입한다: 적어도 하나의 외인성 앵커 서열; 예컨대 연접부 핵형성 분자에 대한 결합 친화도의 변경에 의한, 적어도 하나의 연접부 핵형성 분자 결합 부위의 변경; 적어도 하나의 공통 뉴클레오타이드 서열, 예컨대 CTCF 결합 모티프, YY1 결합 모티프, ZNF143 결합 모티프, 또는 본 명세서에 언급된 다른 결합 모티프의 배향의 변화; 및 적어도 하나의 앵커 서열, 예컨대 CTCF 결합 모티프, YY1 결합 모티프, ZNF143 결합 모티프, 또는 본 명세서에 언급된 다른 결합 모티프의 치환, 추가 또는 결실.
일부 구현예에서, 앵커 서열은 핵형성 폴리펩타이드 결합 모티프, 예를 들어 CTCF-결합 모티프를 포함한다: N(T/C/G)N(G/A/T)CC(A/T/G)(C/G)(C/T/A)AG(G/A)(G/T)GG(C/A/T)(G/A)(C/G)(C/T/A)(G/A/C)(서열번호 71)(여기서, N은 임의의 뉴클레오타이드임).
CTCF-결합 모티프는 또한 반대 배향일 수 있으며, 예를 들어 (G/A/C)(C/T/A)(C/G)(G/A)(C/A/T)GG(G/T)(G/A)GA(C/T/A)(C/G)(A/T/G)CC(G/A/T)N(T/C/G)N(서열번호 72)이다. 여기서, N은 임의의 뉴클레오타이드이다.
일부 구현예에서, 앵커 서열은 서열번호 71 또는 서열번호 72를 포함하거나, 서열번호 71 또는 서열번호 72 중 어느 하나와 적어도 75%, 적어도 80%, 적어도 90%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99% 동일한 서열을 포함한다.
일부 구현예에서, 앵커 서열은 핵형성 폴리펩타이드 결합 모티프, 예를 들어 YY1-결합 모티프를 포함한다: CCGCCATNTT(서열번호 73)(여기서, N은 임의의 뉴클레오타이드임).
YY1-결합 모티프는 또한 반대 배향일 수 있으며, 예를 들어 AANATGGCGG(서열번호 74)(여기서, N은 임의의 뉴클레오타이드임)이다.
일부 구현예에서, 앵커 서열-매개 연접부는 적어도 제1 앵커 서열 및 제2 앵커 서열을 포함한다. 예를 들어, 일부 구현예에서, 제1 앵커 서열 및 제2 앵커 서열은 각각 핵형성 폴리펩타이드 결합 모티프를 포함할 수 있으며, 예를 들어 각각은 CTCF 결합 모티프를 포함한다.
일부 구현예에서, 제1 앵커 서열 및 제2 앵커 서열은 상이한 서열을 포함하며, 예를 들어 제1 앵커 서열은 CTCF 결합 모티프를 포함하고, 제2 앵커 서열은 CTCF 결합 모티프 이외의 앵커 서열을 포함한다. 일부 구현예에서, 각 앵커 서열은 핵형성 폴리펩타이드 결합 모티프 및 핵형성 폴리펩타이드 결합 모티프의 한쪽 또는 양쪽에 하나 이상의 측접 뉴클레오타이드를 포함한다.
ASMC를 형성할 수 있는 2개의 CTCF-결합 모티프(예를 들어, 연속 또는 비연속 CTCF 결합 모티프)는 임의의 배향으로, 예를 들어 5'-3'(좌측 탠덤, 예를 들어 서열번호 71을 포함하는 2개의 CTCF-결합 모티프) 또는 3'-5'(우측 탠덤, 예를 들어 서열번호 72를 포함하는 2개의 CTCF-결합 모티프) 중 어느 하나의 동일한 배향(탠덤)으로, 또는 하나의 CTCF-결합 모티프는 서열번호 71을 포함하고 또 다른 하나는 서열번호 72를 포함하는 수렴 배향으로 게놈에 존재할 수 있다.
일부 구현예에서, 앵커 서열은 표적 유전자(예를 들어, MYC)와 연관된 CTCF 결합 모티프를 포함하며, 표적 유전자는 질환, 장애 및/또는 병태, 예를 들어 MYC 오조절 장애, 예를 들어 간 장애(예를 들어, 간암종) 또는 폐암과 연관되어 있다.
일부 구현예에서, 본 개시내용의 방법은, 예를 들어 염색질 구조를 변형함으로써, 앵커 서열, 예를 들어 핵형성 폴리펩타이드 결합 모티프 내에서 하나 이상의 뉴클레오타이드를 치환하거나, 추가하거나, 결실시킴으로써, 게놈 복합체(예를 들어, ASMC)를 조절하는 것, 예를 들어 파괴하는 것을 포함한다. 하나 이상의 뉴클레오타이드는 앵커 서열, 예를 들어 핵형성 폴리펩타이드 결합 모티프 내에서 치환, 추가 또는 결실을 위해 특이적으로 표적화될 수 있으며, 예를 들어 표적화된 변경일 수 있다.
일부 구현예에서, 게놈 복합체(예를 들어, ASMC)는 적어도 하나의 핵형성 폴리펩타이드 결합 모티프의 배향을 변화시킴으로써 변경될 수 있다. 앵커 서열은 핵형성 폴리펩타이드 결합 모티프, 예를 들어 CTCF 결합 모티프를 포함하고, 표적화 모이어티는 적어도 하나의 핵형성 폴리펩타이드 결합 모티프에 변경을 도입하여, 예를 들어 핵형성 폴리펩타이드에 대한 결합 친화도를 변경시킨다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서 또는 시스템의 투여 전, 표적 유전자, 예를 들어 MYC는, 예를 들어 이환된 상태에서, 규정된 발현 상태를 갖는다. 예를 들어, 표적 유전자, 예를 들어 MYC는 질환 세포에서 높은 수준의 발현을 가질 수 있다. 앵커 서열-매개 연접부를 파괴함으로써, 표적 유전자, 예를 들어 MYC의 발현은 감소될 수 있다.
본 명세서에 기재된 발현 억제 시스템의 발현 리프레서에 사용하기에 적합한 표적화 모이어티는 적어도 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개의 뉴클레오타이드 또는 염기쌍(그리고 선택적으로, 50, 49, 48, 47, 46, 45, 44, 43, 42, 41, 40, 39, 38, 37, 36, 35, 34, 33, 32, 31, 30, 29, 28, 27, 26, 25, 24, 23, 22, 21, 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 또는 10개 이하의 뉴클레오타이드 또는 염기쌍)을 포함하는 부위에 결합할, 예를 들어 특이적으로 결합할 수 있다. 일부 구현예에서, DNA-표적화 모이어티는 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50개의 뉴클레오타이드 또는 염기쌍을 포함하는 부위에 결합한다.
본 개시내용의 발현 억제 시스템은 2개 이상의 발현 리프레서를 포함할 수 있다. 일부 구현예에서, 발현 리프레서 시스템의 발현 리프레서는 각각 상이한 표적화 모이어티를 포함한다.
일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 엑손, 인트론, 또는 엑손 인트론 경계(예를 들어, 스플라이스 부위)에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자, 예를 들어 엑손, 인트론, 또는 엑손 인트론 경계(예를 들어, 스플라이스 부위)에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 엑손, 인트론, 또는 엑손 인트론 경계(예를 들어, 스플라이스 부위)에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소(예를 들어, 프로모터 또는 인핸서)에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자에 작동가능하게 연결된 전사 제어 요소(예를 들어, 프로모터 또는 인핸서)에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자에 작동가능하게 연결된 전사 제어 요소(예를 들어, 프로모터 또는 인핸서)에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 MYC에 근접하거나, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소(예를 들어, 프로모터 또는 인핸서)에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 MYC에 근접하거나, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자(예를 들어, MYC), 예를 들어 엑손, 인트론, 또는 엑손 인트론 경계(예를 들어, 스플라이스 부위)에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 일부 구현예에서, 발현 억제 시스템은 표적 유전자, 예를 들어 MYC에 근접하거나, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자, 예를 들어 MYC에 근접하거나, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다.
일부 구현예에서, 발현 억제 시스템은, 예를 들어 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 프로모터에서, 제1 부위에 결합하는 표적화 모이어티를 포함하는 제1 발현 리프레서, 및 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 프로모터에서, 제2 부위에 결합하는 표적화 모이어티를 포함하는 제2 발현 리프레서를 포함한다. 제1 부위 및 제2 부위는 상이하고 비-중첩 부위일 수 있으며, 예를 들어 제1 부위 및 제2 부위는 공통으로 어떤 서열도 공유하지 않는다. 제1 부위 및 제2 부위는 상이하지만 중첩 부위일 수 있으며, 예를 들어 제1 부위 및 제2 부위는 상이한 서열을 포함할 수 있지만 공통으로 일부 서열을 공유한다.
일부 구현예에서, 표적 유전자는 MYC이다. 일부 구현예에서, MYC는 인간 8번 염색체 상에 위치한다. 일부 구현예에서, 본 명세서에 기재된 바와 같은 발현자 리프레서 또는 발현 리프레서 시스템은 MYC의 전사 개시 부위(TSS)에 결합한다.
기타 구성
핵산 및 벡터
본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템을 인코딩하는 핵산에 관한 것이다. 일부 구현예에서, 발현 리프레서는 발현 리프레서를 인코딩하는 핵산을 포함하는 조성물을 통해 제공될 수 있으며, 여기서 핵산은 관심 시스템 내에서(예를 들어, 특정 세포, 조직, 유기체 등 내에서) 발현 리프레서의 발현을 달성하기에 충분한 다른 서열과 연관되어 있다. 일부 구현예에서, 발현 억제 시스템은 발현 억제 시스템의 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 인코딩하는 핵산을 포함하는 조성물을 통해 제공될 수 있으며, 여기서 핵산은 관심 시스템 내에서(예를 들어, 특정 세포, 조직, 유기체 등 내에서) 발현 억제 시스템의 발현 억제 시스템, 예를 들어 발현 리프레서(들)의 발현을 달성하기에 충분한 다른 서열과 연관되어 있다.
일부 특정 구현예에서, 본 개시내용은 발현 리프레서 또는 이의 폴리펩타이드 부분을 인코딩하는 핵산의 조성물을 제공한다. 일부 그러한 구현예에서, 제공된 핵산은 DNA, RNA, 또는 본 명세서에 기재된 바와 같은 임의의 다른 핵산 모이어티 또는 실체이거나 이를 포함할 수 있으며, 본 명세서에 기재된 임의의 기술 또는 당업계에서 달리 이용가능한 기술(예를 들어, 합성, 클로닝, 증폭, 시험관내 또는 생체내 전사 등)에 의해 제조될 수 있다. 일부 구현예에서, 발현 리프레서를 인코딩하는 제공된 핵산, 또는 이의 폴리펩타이드는 관심 시스템에서(예를 들어, 특정 세포, 조직, 유기체 등에서) 제공된 핵산의 통합, 복제, 및/또는 발현을 달성하기에 적절한 및/또는 충분한 하나 이상의 복제, 통합, 및/또는 발현 신호와 작동적으로 연관될 수 있다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서를 전달하기 위한 조성물은 본 명세서에 기재된 바와 같은 발현 리프레서 또는 발현 리프레서의 하나 이상의 성분을 인코딩하는 하나 이상의 핵산을 포함하는 벡터, 예를 들어 바이러스 벡터이거나 이를 포함한다.
일부 특정 구현예에서, 본 개시내용은 발현 억제 시스템, 하나 이상의 발현 리프레서 또는 이의 폴리펩타이드 부분을 인코딩하는 핵산의 조성물을 제공한다. 일부 그러한 구현예에서, 제공된 핵산은 DNA, RNA, 또는 본 명세서에 기재된 바와 같은 임의의 다른 핵산 모이어티 또는 실체이거나 이를 포함할 수 있으며, 본 명세서에 기재된 임의의 기술 또는 당업계에서 달리 이용가능한 기술(예를 들어, 합성, 클로닝, 증폭, 시험관내 또는 생체내 전사 등)에 의해 제조될 수 있다. 일부 구현예에서, 발현 억제 시스템, 하나 이상의 발현 리프레서를 인코딩하는 제공된 핵산, 또는 이의 폴리펩타이드 부분은 관심 시스템에서(예를 들어, 특정 세포, 조직, 유기체 등에서) 제공된 핵산의 통합, 복제, 및/또는 발현을 달성하기에 적절한 및/또는 충분한 하나 이상의 복제, 통합, 및/또는 발현 신호와 작동적으로 연관될 수 있다.
일부 구현예에서, 본 명세서에 기재된 발현 억제 시스템을 전달하기 위한 조성물은 본 명세서에 기재된 바와 같은 발현 억제 시스템, 예를 들어 발현 억제 시스템의 발현 리프레서(들)의 하나 이상의 성분을 인코딩하는 하나 이상의 핵산을 포함하는 벡터, 예를 들어 바이러스 벡터이거나 이를 포함한다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서를 전달하기 위한 조성물은 본 명세서에 기재된 바와 같은 발현 리프레서 또는 발현 리프레서의 하나 이상의 성분을 인코딩하는 하나 이상의 핵산을 포함하는 RNA, 예를 들어 mRNA이거나 이를 포함한다.
일부 구현예에서, 본 명세서에 기재된 발현 억제 시스템을 전달하기 위한 조성물은 본 명세서에 기재된 바와 같은 발현 억제 시스템, 예를 들어 발현 억제 시스템의 발현 리프레서(들)의 하나 이상의 성분을 인코딩하는 하나 이상의 핵산을 포함하는 RNA, 예를 들어 mRNA이거나 이를 포함한다.
본 명세서에 기재된 바와 같은 핵산 또는 본 명세서에 기재된 단백질을 인코딩하는 핵산이 벡터 내로 도입될 수 있다. 레트로바이러스, 예컨대 렌티바이러스로부터 유래된 것들을 포함한 벡터가 장기간 유전자 전달을 달성하기에 적합한 도구인데, 그 이유는, 이들 벡터가 이식유전자의 장기간의 안정적인 통합 및 딸 세포에서의 그의 증식을 가능하게 하기 때문이다. 벡터의 예에는 발현 벡터, 복제 벡터, 프로브 생성 벡터 및 시퀀싱 벡터가 포함된다. 발현 벡터는 바이러스 벡터의 형태로 세포에 제공될 수 있다. 바이러스 벡터 기술은 당업계에 잘 알려져 있으며, 다양한 바이러스학 및 분자 생물학 매뉴얼에 기재되어 있다. 벡터로서 유용한 바이러스는 레트로바이러스, 아데노바이러스, 아데노-연관 바이러스, 헤르페스 바이러스, 및 렌티바이러스를 포함하지만 이로 한정되지 않는다. 일반적으로, 적합한 벡터는 적어도 하나의 유기체에서 기능성인 복제 기점, 프로모터 서열, 편리한 제한 엔도뉴클레아제 부위, 및 하나 이상의 선택가능한 마커를 포함한다.
천연 또는 합성 핵산의 발현은 통상적으로 관심 유전자를 인코딩하는 핵산을 프로모터에 작동가능하게 연결하고 작제물을 발현 벡터 내로 도입함으로써 달성된다. 벡터는 진핵세포에서 복제 및 통합에 적합할 수 있다. 통상적인 클로닝 벡터는 전사 및 번역 종결자, 개시 서열, 및 원하는 핵산 서열의 발현에 유용한 프로모터를 포함한다.
추가적인 프로모터 요소, 예를 들어 인핸싱 서열은 전사 개시의 빈도를 조절할 수 있다. 통상적으로, 이들 서열은 전사 개시 부위의 30 내지 110 bp 상류 영역 내에 위치되지만, 다수의 프로모터가 마찬가지로 전사 개시 부위의 하류에 기능성 요소를 포함하는 것으로 최근에 밝혀졌다.
일부 구현예에서, 본 명세서에 기재된 발현 리프레서 또는 시스템은 인핸싱 서열에서 작용한다. 일부 구현예에서, 인핸싱 서열은 인핸서, 스트레치(stretch) 인핸서, 섀도우(shadow) 인핸서, 유전자좌 제어 영역(LCR), 또는 슈퍼 인핸서이다. 일부 구현예에서, 슈퍼 인핸서는 인핸서의 클러스터 및 다른 조절 요소를 포함한다. 일부 구현예에서, 이러한 서열은 전사 개시 부위의 .2 내지 2 Mb 상류 또는 하류 영역 내에 위치한다. 일부 구현예에서, 영역은 비-코딩 영역이다. 일부 구현예에서, 영역은 암 발병 위험이 더 높은 것과 연관된 적어도 하나의 SNP를 포함한다. 일부 구현예에서, 영역은 표적 유전자, 예를 들어 MYC의 장거리 조절과 연관되어 있다. 일부 구현예에서, 영역은 세포-유형 특이적이다. 일부 구현예에서, 슈퍼-인핸서는 표적 유전자 프로모터, 예를 들어 MYC 프로모터를 동원함으로써, 표적 유전자 발현, 예를 들어 MYC 발현을 변형한다(예를 들어, 증가시키거나 감소시킨다). 일부 구현예에서, 슈퍼 인핸서는 인핸서 도킹(docking) 부위를 통해 표적 유전자 프로모터, 예를 들어 MYC 프로모터와 상호작용한다. 일부 구현예에서, 인핸서 도킹 부위는 앵커 서열이다. 일부 구현예에서, 인핸서 도킹 부위는 표적 유전자 프로모터, 예를 들어 MYC 프로모터로부터 적어도 100 bp, 200 bp, 500 bp, 1000 bp, 1500 bp, 2000 bp, 또는 3000 bp 떨어져 위치한다. 일부 구현예에서, 슈퍼 인핸서 영역은 적어도 100 bp, 적어도 200 bp, 적어도 300 bp, 적어도 500 bp, 적어도 1 kb, 적어도 2 kb, 적어도 3 kb, 적어도 5 kb, 적어도 10 kb, 적어도 15 kb, 적어도 20 kb, 또는 적어도 25 kb 길이이다.
프로모터 요소간의 간격은 빈번하게 가요성이어서, 요소들이 서로에 대해 역전되거나 이동될 때 프로모터 기능이 보존된다. 티미딘 키나제(tk) 프로모터에서는, 활성의 감소가 시작되기 전에 프로모터 요소간의 간격이 증가되어 50 bp로 떨어질 수 있다. 프로모터에 따라, 개별 요소들이 전사를 활성화하도록 협동적으로 또는 독립적으로 기능할 수 있는 것으로 나타난다.
적합한 프로모터의 한 예는 전초기 사이토메갈로바이러스(CMV) 프로모터 서열이다. 이러한 프로모터 서열은 강력한 구성적 프로모터 서열로서, 이것에 작동가능하게 연결된 임의의 폴리뉴클레오타이드 서열의 고수준의 발현을 유도할 수 있다. 일부 구현예에서, 적합한 프로모터는 연장 성장 인자-1α(EF-1α)이다. 그러나, 다른 구성적 프로모터 서열이 또한 사용될 수 있으며, 이에는 유인원 바이러스 40(SV40) 초기 프로모터, 마우스 유선 종양 바이러스(MMTV), 인간 면역결핍 바이러스(HIV) 긴 말단 반복부(LTR) 프로모터, MoMuLV 프로모터, 조류 백혈병 바이러스 프로모터, 엡스타인-바(Epstein-Barr) 바이러스 전초기 프로모터, 라우스 육종 바이러스 프로모터뿐만 아니라, 인간 유전자 프로모터, 예컨대 제한 없이, 액틴 프로모터, 미오신 프로모터, 헤모글로빈 프로모터, 및 크레아틴 키나제 프로모터가 포함되지만 이로 한정되지 않는다.
본 개시내용은 임의의 특정 프로모터 또는 프로모터 카테고리(예를 들어, 구성적 프로모터)의 사용으로 제한되는 것으로 해석되어서는 안 된다. 예를 들어, 일부 구현예에서, 유도성 프로모터가 본 개시내용의 일부로서 고려된다. 일부 구현예에서, 유도성 프로모터의 사용은, 그것에 작동가능하게 연결된 폴리뉴클레오타이드 서열의 발현이 요구될 때, 그러한 발현을 켤 수 있는 분자 스위치를 제공한다. 일부 구현예에서, 유도성 프로모터의 사용은, 발현이 요구되지 않을 때 발현을 끌 수 있는 분자 스위치를 제공한다. 유도성 프로모터의 예에는 메탈로티오닌(metallothionine) 프로모터, 글루코코르티코이드 프로모터, 프로게스테론 프로모터, 및 테트라사이클린 프로모터가 포함되지만 이로 한정되지 않는다.
일부 구현예에서, 도입하려는 발현 벡터는 또한 선택가능한 마커 유전자 또는 리포터 유전자 중 어느 하나 또는 둘 다를 함유하여, 바이러스 벡터를 통해 형질감염시키거나 감염시키고자 하는 세포 집단으로부터의 발현 세포의 확인 및 선택을 용이하게 할 수 있다. 일부 양태에서, 선택가능한 마커는 별개의 DNA 조각 상에서 운반되어 공동-형질감염 절차에 사용될 수 있다. 선택가능한 마커 및 리포터 유전자 둘 다에는 숙주 세포에서의 발현을 가능하게 하기에 적절한 전사 제어 서열이 측접될 수 있다. 유용한 선택가능한 마커는, 예를 들어 항생제-저항성 유전자, 예컨대 neo 등을 포함할 수 있다.
일부 구현예에서, 리포터 유전자는 잠재적으로 형질감염 세포를 확인하는 데 그리고/또는 전사 제어 서열의 기능성을 평가하는 데 사용될 수 있다. 일반적으로, 리포터 유전자는, (리포터 유전자의) 수용자 공급원에 존재하지 않거나 그에 의해 발현되지 않고, 어떠한 용이하게 검출가능한 특성, 예를 들어 효소 활성 또는 시각화 가능한 형광에 의해 발현이 나타나는 폴리펩타이드를 인코딩하는 유전자이다. 리포터 유전자의 발현은 DNA가 수용자 세포 내로 도입된 후 적합한 시간에 분석된다. 적합한 리포터 유전자는 루시퍼라제, 베타-갈락토시다제, 클로람페니콜 아세틸 트랜스퍼라제, 분비 알칼리성 포스파타제, 또는 녹색 형광 단백질 유전자를 인코딩하는 유전자를 포함할 수 있다(예를 들어, 문헌[Ui-Tei et al., 2000 FEBS Letters 479: 79-82]). 적합한 발현 시스템은 널리 알려져 있으며, 알려진 기법을 사용하여 제조되거나 상업적으로 입수될 수 있다. 일반적으로, 최고 수준의 리포터 유전자 발현을 나타내는 최소 5' 측접 영역을 갖는 작제물이 프로모터로서 확인된다. 그러한 프로모터 영역은 리포터 유전자에 연결되어, 프로모터-구동 전사를 조절하는 능력에 대하여 작용제를 평가하는 데 사용될 수 있다.
세포
본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템을 포함하는 세포에 관한 것이다. 당업자에게 알려진 임의의 세포, 예를 들어 세포주, 예를 들어 재조합 폴리펩타이드의 발현에 적합한 세포주가 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템을 포함하기에 적합하다. 일부 구현예에서, 세포, 예를 들어 세포주는 본 명세서에 기재된 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 발현하는 데 사용될 수 있다. 일부 구현예에서, 세포, 예를 들어 세포주가 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 인코딩하는 핵산, 예를 들어 벡터를 발현하거나 증폭시키는 데 사용될 수 있다. 일부 구현예에서, 세포는 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 인코딩하는 핵산을 포함한다.
일부 구현예에서, 세포는 발현 억제 시스템, 예를 들어 제1 발현 리프레서의 제1 성분을 인코딩하는 제1 핵산, 및 발현 억제 시스템, 예를 들어 제2 발현 리프레서의 제2 성분을 인코딩하는 제2 핵산을 포함한다. 일부 구현예에서, 세포가 2개 이상의 발현 리프레서를 포함하는 발현 억제 시스템을 인코딩하는 핵산을 포함하는 경우, 각 발현 리프레서를 인코딩하는 서열은 별개의 핵산 분자 상에, 예를 들어 상이한 벡터 상에, 예를 들어 제1 발현 리프레서를 인코딩하는 제1 벡터 및 제2 발현 리프레서를 인코딩하는 제2 백터 상에 배치된다. 일부 구현예에서, 각 발현 리프레서를 인코딩하는 서열은 동일한 핵산 분자 상에, 예를 들어 동일한 벡터 상에 배치된다. 일부 구현예에서, 발현 억제 시스템을 인코딩하는 핵산 중 일부 또는 전부는 세포의 게놈 DNA 내로 통합된다. 일부 구현예에서, 발현 억제 시스템의 제1 발현 리프레서를 인코딩하는 핵산은 세포의 게놈 DNA 내로 통합되고, 발현 억제 시스템의 제2 발현 리프레서를 인코딩하는 핵산은 세포의 게놈 DNA 내로 통합되지 않는다(예를 들어, 벡터 상에 위치한다). 일부 구현예에서, 발현 억제 시스템의 제1 및 제2 발현 리프레서를 인코딩하는 핵산(들)은, 예를 들어 게놈 DNA 내의 동일한(예를 들어, 인접하거나 공국재화된) 또는 상이한 부위에서 세포의 게놈 DNA 내로 통합된다.
본 명세서에 기재된 발현 억제 시스템 또는 발현 리프레서를 포함하고/하거나 발현할 수 있는 세포의 예에는 간세포, 뉴런 세포, 내피 세포, 근세포, 및 림프구가 포함되지만 이로 한정되지 않는다.
추가로 본 개시내용은, 부분적으로, 본 명세서에 기재된 방법 또는 공정에 의해 제조된 세포에 관한 것이다. 일부 구현예에서, 본 개시내용은 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템을 제공하는 단계, 세포를 제공하는 단계, 및 세포를 발현 리프레서(또는 발현 리프레서를 인코딩하는 핵산, 또는 상기 발현 리프레서 또는 핵산을 포함하는 조성물) 또는 발현 억제 시스템(또는 발현 억제 시스템을 인코딩하는 핵산, 또는 상기 발현 억제 시스템 또는 핵산을 포함하는 조성물)와 접촉시키는 단계에 의해 생산되는 세포를 제공한다. 일부 구현예에서, 세포를 발현 리프레서와 접촉시키는 것은 세포를, 세포가 발현 리프레서를 생산할 수 있게 하는 조건 하에서 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것을 포함한다. 일부 구현예에서, 세포를 발현 리프레서와 접촉시키는 것은 세포를 포함하는 유기체를, 세포가 발현 리프레서를 생산할 수 있게 하는 조건 하에서 발현 리프레서 또는 발현 리프레서를 인코딩하는 핵산과 접촉시키는 것을 포함한다.
이론에 의해 구애되고자 함이 없이, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템과 접촉된 세포는 발현 리프레서 또는 발현 억제 시스템에 의해 접촉되지 않은 유사한 세포와 비교하여, 표적 유전자(예를 들어, MYC)의 발현의 감소 및/또는 표적 유전자, 예를 들어 MYC와 연관된 후성유전학적 마커, 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소, 또는 표적 유전자에 근접하거나 표적 유전자, 예를 들어 MYC에 작동 가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열의 변형을 나타낼 수 있다. 일부 구현예에서, 상기 표적 유전자, 예를 들어 MYC의 발현의 감소 및/또는 후성유전학적 마커의 변형을 나타내는 세포는 발현 리프레서 또는 발현 억제 시스템을 포함하지 않는다. 후성유전학적 마커의 발현 및/또는 변형의 감소는 발현 리프레서 또는 발현 억제 시스템과의 접촉 후에, 예를 들어 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 지속될 수 있다.
일부 구현예에서, 발현 리프레서 또는 발현 억제 시스템에 의해 이전에 접촉된 세포는 발현 리프레서 또는 발현 억제 시스템이 세포에 더 이상 존재하지 않은 후에, 예를 들어 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 10, 또는 14일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안, 발현 리프레서 또는 발현 억제 시스템이 세포에 더 이상 존재하지 않은 후 후성유전학적의 발현의 감소 및/또는 변형을 유지한다.
발현 억제 시스템 및/또는 발현 리프레서의 제조 방법
일부 구현예에서, 발현 리프레서는 단백질이거나 이를 포함하며, 이에 따라 단백질의 제조 방법에 의해 생성될 수 있다. 일부 구현예에서, 발현 억제 시스템, 예를 들어 발현 억제 시스템의 발현 리프레서(들)는 하나 이상의 단백질을 포함하며, 이에 따라 단백질의 제조 방법에 의해 생성될 수 있다. 당업자에 의해 이해되는 바와 같이, (본 명세서에 기재된 바와 같은 조절제 내에 포함될 수 있는) 단백질 또는 폴리펩타이드의 제조 방법은 당업계에서 일상적이다. 일반적으로, 문헌[males & James (Eds.), Therapeutic Proteins: Methods and Protocols (Methods in Molecular Biology), Humana Press (2005)]; 및 [Crommelin, Sindelar & Meibohm (Eds.), Pharmaceutical Biotechnology: Fundamentals and Applications, Springer (2013).]을 참조한다.
본 개시내용의 조성물의 단백질 또는 폴리펩타이드는 표준 고상(solid phase) 기법을 사용함으로써 생화학적으로 합성될 수 있다. 그러한 방법은 전체 고상 합성 방법, 부분 고상 합성 방법, 단편 축합, 고전적 용액 합성을 포함한다. 이들 방법은 펩타이드가 비교적 짧을 때(예를 들어, 10 kDa) 그리고/또는 그것이 재조합 기법에 의해 생성될 수 없을 때(즉, 핵산 서열에 의해 인코딩되지 않을 때) 사용될 수 있으며, 이에 따라 상이한 화학을 수반한다.
고상 합성 절차는 당업계에 잘 알려져 있으며, 문헌[John Morrow Stewart and Janis Dillaha Young, Solid Phase Peptide Syntheses, 2nd Ed., Pierce Chemical Company, 1984]; 및 문헌[Coin, I., et al., Nature Protocols, 2:3247-3256, 2007]에 의해 추가로 기재되어 있다.
더 긴 펩타이드의 경우, 재조합 방법이 사용될 수 있다. 재조합 치료용 폴리펩타이드의 제조 방법은 당업계에서 일상적이다. 일반적으로, 문헌[males & James (Eds.), Therapeutic Proteins: Methods and Protocols (Methods in Molecular Biology), Humana Press (2005)]; 및 [Crommelin, Sindelar & Meibohm (Eds.), Pharmaceutical Biotechnology: Fundamentals and Applications, Springer (2013).]을 참조한다.
재조합 단백질은 또한 곤충 세포, 효모, 박테리아 또는 기타 세포를 사용하여 적절한 프로모터 제어 하에 생산될 수도 있지만, 치료적 약학 단백질 또는 폴리펩타이드를 생산하기 위한 예시적인 방법은 포유동물 세포에서의 발현을 포함한다. 포유동물 발현 벡터는 복제 기점, 적합한 프로모터, 및 기타 5' 또는 3' 측접하는 비-전사 서열과 같은 비-전사 요소들, 및 필요한 리보솜 결합 부위, 폴리아데닐화 부위, 스플라이스 공여체 및 수용체 부위, 및 종료 서열과 같은 5' 또는 3' 비번역 서열을 포함할 수 있다. SV40 바이러스 게놈, 예를 들어 SV40 기원으로부터 유래된 DNA 서열, 초기 프로모터, 스플라이스 및 폴리아데닐화 부위는 이종 DNA 서열의 발현에 필요한 기타 유전자 요소를 제공하는 데 사용될 수 있다. 박테리아, 진균, 효모, 및 포유동물 세포 숙주와의 사용을 위한 적절한 클로닝과 발현 벡터가 문헌[Green & Sambrook, Molecular Cloning: A Laboratory Manual (Fourth Edition), Cold Spring Harbor Laboratory Press (2012)]에 기재되어 있다.
대량의 단백질 또는 폴리펩타이드가 필요한 경우, 그것은 문헌[Brian Bray, Nature Reviews Drug Discovery, 2:587-593, 2003]; 및 문헌[Weissbach & Weissbach, 1988, Methods for Plant Molecular Biology, Academic Press, NY, Section VIII, pp 421-463]에 기재된 바와 같은 기법을 사용하여 생성될 수 있다.
다양한 포유동물 세포 배양 시스템이 재조합 단백질 발현 및 제조를 위해 사용될 수 있다. 포유동물 발현 시스템의 예에는 CHO 세포, COS 세포, HeLA 및 BHK 세포주가 포함된다. 단백질 치료제의 생산을 위한 숙주 세포 배양의 과정은 문헌[Zhou and Kantardjieff (Eds.), Mammalian Cell Cultures for Biologics Manufacturing (Advances in Biochemical Engineering/Biotechnology), Springer (2014)]에 기재되어 있다. 본 명세서에 기재된 조성물은 재조합 단백질을 인코딩하는, 벡터, 예컨대 바이러스 벡터, 예를 들어 렌티바이러스 벡터를 포함할 수 있다. 일부 구현예에서, 벡터, 예를 들어 바이러스 벡터는 재조합 단백질을 인코딩하는 핵산을 포함할 수 있다. 본 명세서에 기재된 조성물은 재조합 단백질을 인코딩하는, 벡터, 예컨대 바이러스 벡터, 예를 들어 렌티바이러스 벡터를 캡슐화하는 지질 나노입자를 포함할 수 있다. 일부 구현예에서, 벡터, 예를 들어 바이러스 벡터를 캡슐화하는 지질 나노입자는 재조합 단백질을 인코딩하는 핵산을 포함할 수 있다.
단백질 치료제의 정제는 문헌[Franks, Protein Biotechnology: Isolation, Characterization, and Stabilization, Humana Press (2013)]; 및 문헌[Cutler, Protein Purification Protocols (Methods in Molecular Biology), Humana Press (2010)]에 기재되어 있다. 단백질 치료제의 제형은 문헌[eyer (Ed.), Therapeutic Protein Drug Products: Practical Approaches to formulation in the Laboratory, Manufacturing, and the Clinic, Woodhead Publishing Series (2012)]에 기재되어 있다.
단백질은 하나 이상의 아미노산을 포함한다. 아미노산은, 예를 들어 하나 이상의 펩타이드 결합의 형성을 통해 폴리펩타이드 사슬 내로 도입될 수 있는 임의의 화합물 및/또는 물질을 포함한다. 일부 구현예에서, 아미노산은 일반 구조 H2N-C(H)I-COOH를 갖는다. 일부 구현예에서, 아미노산은 자연 발생 아미노산이다. 일부 구현예에서, 아미노산은 비천연 아미노산이고; 일부 구현예에서, 아미노산은 D-아미노산이며; 일부 구현예에서, 아미노산은 L-아미노산이다. "표준 아미노산"은 자연 발생 펩타이드에서 일반적으로 발견되는 20개의 표준 L-아미노산 중 임의의 것을 지칭한다. "비표준 아미노산"은 그것이 합성에 의해 제조되는지 또는 천연 공급원으로부터 수득되는지의 여부에 관계 없이 표준 아미노산 이외의 임의의 아미노산을 지칭한다. 일부 구현예에서, 폴리펩타이드 내의 카르복시- 및/또는 아미노-말단 아미노산을 포함한 아미노산은 상기 일반적인 구조와 비교하여 구조적 변형을 포함할 수 있다. 예를 들어, 일부 구현예에서, 아미노산은 일반적인 구조와 비교하여 메틸화, 아미드화, 아세틸화, PEG화, 글리코실화, 인산화, 및/또는 치환(예를 들어, 아미노 기, 카르복실산 기, 하나 이상의 양성자, 및/또는 하이드록실 기의 치환)에 의해 변형될 수 있다. 일부 구현예에서, 그러한 변형은, 예를 들어 달리 동일한 비변형된 아미노산을 함유하는 것와 비교하여, 변형된 아미노산을 함유하는 폴리펩타이드의 순환 반감기를 변경시킬 수 있다. 일부 구현예에서, 그러한 변형은, 달리 동일한 비변형된 아미노산을 함유하는 것와 비교하여, 변형된 아미노산을 함유하는 폴리펩타이드의 관련 활성을 유의하게 변경시키지 않는다. 맥락으로부터 명백한 바와 같이, 일부 구현예에서, 용어 "아미노산"은 유리 아미노산을 지칭하는 데 사용될 수 있으며; 일부 구현예에서 그것은 폴리펩타이드의 아미노산 잔기를 지칭하는 데 사용될 수 있다.
약제학적 조성물, 제형, 전달, 및 투여
추가로 본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 포함하는 약제학적 조성물, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 인코딩하는 핵산을 포함하는 약제학적 조성물, 및/또는 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 세포, 조직, 기관, 및/또는 대상체에게 전달하는 조성물에 관한 것이다.
본 명세서에 사용되는 바와 같이, 용어 "약제학적 조성물"은 하나 이상의 약제학적으로 허용되는 담체(예를 들어, 당업자에게 알려진 약제학적으로 허용되는 담체)와 함께 제형화된 활성제(예를 들어, 발현 리프레서 또는 발현 수용체의 핵산, 예를 들어 발현 억제 시스템, 예를 들어 발현 리프레서 시스템의 발현 리프레서(들), 또는 이를 인코딩하는 핵산)를 지칭한다. 일부 구현예에서, 활성제는 관련 집단에 투여될 때 사전결정된 치료적 효과를 달성할 통계학적으로 유의한 확률을 나타내는 치료 투약계획에서 투여하기에 적절한 단위 용량으로 존재한다. 일부 구현예에서, 본 개시내용의 발현 리프레서를 포함하는 약제학적 조성물은 발현 리프레서 또는 이를 인코딩하는 핵산(들)을 포함한다. 일부 구현예에서, 본 개시내용의 발현 억제 시스템을 포함하는 약제학적 조성물은 발현 억제 시스템의 각각의 발현 리프레서 또는 이를 인코딩하는 핵산(들)을 포함한다(예를 들어, 발현 억제 시스템이 제1 발현 리프레서 및 제2 발현 리프레서를 포함한다면, 약제학적 조성물은 제1 및 제2 발현 리프레서를 포함한다). 일부 구현예에서, 약제학적 조성물은 복수의 발현 리프레서를 포함하는 발현 억제 시스템의 발현 리프레서 전부보다 적게 포함한다. 예를 들어, 발현 억제 시스템은 제1 발현 리프레서 및 제2 발현 리프레서를 포함할 수 있으며, 제1 약제학적 조성물은 제1 발현 리프레서 또는 이를 인코딩하는 핵산를 포함할 수 있고 제2 약제학적 조성물은 제2 발현 리프레서 또는 이를 인코딩하는 핵산을 포함할 수 있다. 일부 구현예에서, 약제학적 조성물은 하나 이상의 발현 리프레서, 또는 이를 인코딩하는 핵산(들)의 공제형을 포함할 수 있다.
일부 구현예에서, 약제학적 조성물은 고체 또는 액체 형태로의 투여를 위해 특수하게 제형화될 수 있으며, 이에는 하기에 맞게 구성된 것들이 포함된다: 경구 투여, 예를 들어 드렌치(drench)(수성 또는 비수성 용액 또는 현탁액), 정제, 예를 들어 협측, 설하, 및 전신 흡수를 목표로 한 것들, 볼루스, 분말, 과립, 혀에 적용하기 위한 페이스트; 비경구 투여, 예를 들어 피하, 근육내, 정맥내 또는 경막외 주사에 의한 투여, 예를 들어 멸균 용액 또는 현탁액, 또는 지속-방출 제형으로서의 주사; 국소 적용, 예를 들어 피부, 폐, 또는 구강에 적용되는 크림, 연고, 또는 제어-방출 패치 또는 스프레이로서의 적용; 질내 또는 직장내 투여, 예를 들어 페서리(pessary), 크림, 또는 폼(foam)으로서의 투여; 설하 투여; 안내 투여(ocularly); 경피 투여; 또는 비강, 폐, 및/또는 기타 다른 점막 표면 투여.
본 명세서에 사용되는 바와 같이, 용어 "약제학적으로 허용되는"은, 적절한 의학적 판단의 범주 내에서, 합리적인 이득/위험 비에 부합하면서, 과도한 독성, 자극, 알러지 반응, 또는 다른 문제 또는 합병증 없이 인간 및 동물의 조직과 접촉하여 사용하기에 적합한 화합물, 물질, 조성물, 및/또는 투여 형태를 지칭한다.
본 명세서에 사용되는 바와 같이, 용어 "약제학적으로 허용되는 담체"는 대상 화합물을 하나의 기관, 또는 신체의 일부분을 또 다른 기관, 또는 신체의 일부분으로 운반 또는 수송하는 데 관여하는 약제학적으로 허용되는 물질, 조성물, 또는 비히클, 예컨대 액체 또는 고체 충전제, 희석제, 부형제, 또는 용매 캡슐화 물질을 의미한다. 각 담체는, 제형의 나머지 다른 성분들과 상용성이고 환자에게 해롭지 않다는 의미에서 "허용되어야" 한다. 일부 구현예에서, 예를 들어, 약제학적으로 허용되는 담체로서의 역할을 할 수 있는 물질은 하기를 포함한다: 당, 예컨대 락토스, 글루코스 및 수크로스; 전분, 예컨대 옥수수 전분 및 감자 전분; 셀룰로스, 및 이의 유도체, 예컨대 나트륨 카르복시메틸 셀룰로스, 에틸 셀룰로스 및 셀룰로스 아세테이트; 분말형 트래거캔스; 맥아; 젤라틴; 활석; 부형제, 예컨대 코코아 버터 및 좌제 왁스; 오일, 예컨대 땅콩유, 면실유, 홍화유, 참깨유, 올리브유, 옥수수유 및 대두유; 글리콜, 예컨대 프로필렌 글리콜; 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜; 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; 한천; 완충제, 예컨대 수산화마그네슘 및 수산화알루미늄; 알긴산; 무발열성 물(pyrogen-free water); 등장 식염수; 링거 용액; 에틸 알코올; pH 완충 용액; 폴리에스테르, 폴리카르보네이트 및/또는 폴리무수물; 및 약제학적 제형에 사용되는 기타 다른 무독성 상용성 물질.
본 명세서에 사용되는 바와 같이, "약제학적으로 허용되는 염"은 약제학적 맥락에서 사용하기에 적절한 그러한 화합물의 염, 즉, 올바른 의학적 판단의 범주 내에서, 과도한 독성, 자극, 알러지 반응 등 없이 인간 및 하등 동물의 조직과 접촉하여 사용하기에 적합하고, 합리적인 효과/위험 비에 부합하는 염을 지칭한다. 약제학적으로 허용되는 염은 당업계에 잘 알려져 있다. 예를 들어, S. M. Berge외 다수는 문헌[J. Pharmaceutical Sciences, 66: 1-19 (1977)]에서 약제학적으로 허용되는 염을 상세히 기재한다. 일부 구현예에서, 약제학적으로 허용되는 염은 비독성 산 부가 염을 포함하지만 이로 한정되지 않으며, 이때 비독성 산 부가 염은 무기 산, 예컨대 염산, 브롬화수소산, 인산, 황산 및 과염소산과 함께 또는 유기 산, 예컨대 아세트산, 말레산, 타르타르산, 시트르산, 석신산, 또는 말론산과 함께 형성되는 아미노 기의 염이거나, 당업계에서 사용되는 다른 방법, 예컨대 이온 교환을 사용함으로써 형성된 것이다. 일부 구현예에서, 약제학적으로 허용되는 염은 아디페이트, 알기네이트, 아스코르베이트, 아스파르테이트, 벤젠설포네이트, 벤조에이트, 바이셀페이트, 보레이트, 부티레이트, 캄퍼레이트, 캄퍼설포네이트, 시트레이트, 사이클로펜탄프로피오네이트, 디글루코네이트, 도데실설페이트, 에탄설포네이트, 포르메이트, 푸마레이트, 글루코헵토네이트, 글리세로포스페이트, 글루코네이트, 헤미설페이트, 헵타노에이트, 헥사노에이트, 하이드로요오다이드, 2-하이드록시-에탄설포네이트, 락토바이오네이트, 락테이트, 라우레이트, 라우릴 설페이트, 말레이트, 말레에이트, 말로네이트, 메탄설포네이트, 2-나프탈렌설포네이트, 니코티네이트, 니트레이트, 올레에이트, 옥살레이트, 팔미테이트, 파모에이트, 펙티네이트, 퍼설페이트, 3-페닐프로피오네이트, 포스페이트, 피크레이트, 피발레이트, 프로피오네이트, 스테아레이트, 석시네이트, 설페이트, 타르트레이트, 티오시아네이트, p-톨루엔설포네이트, 운데카노에이트, 발레레이트 염 등을 포함하지만 이로 한정되지 않는다. 대표적인 알칼리 금속 또는 알칼리 토금속 염은 나트륨, 리튬, 칼륨, 칼슘, 마그네슘 등을 포함한다. 일부 구현예에서, 약제학적으로 허용되는 염은 적절한 경우, 비독성 암모늄, 4차 암모늄, 및 할라이드, 하이드록사이드, 카르복실레이트, 설페이트, 포스페이트, 니트레이트, 1 내지 6개의 탄소 원자를 갖는 알킬, 설포네이트, 및 아릴 설포네이트와 같은 반대이온을 사용하여 형성된 아민 양이온을 포함한다.
다양한 구현예에서, 본 개시내용은 약제학적으로 허용되는 부형제와 함께 본 명세서에 기재된 약제학적 조성물을 제공한다. 약제학적으로 허용되는 부형제는, 일반적으로 안전하고, 비독성이고, 바람직한 약제학적 조성물을 제조하는 데 유용한 부형제를 포함하고, 인간의 약제학적 용도뿐만 아니라 수의용 용도에 허용되는 부형제를 포함한다. 그러한 부형제는 고체, 액체, 반고체이거나, 에어로졸 조성물의 경우에는 가스상일 수 있다.
약제학적 제제는, 정제 형태에 대해서는 필요에 따라 밀링, 혼합, 과립화, 및 압축을; 또는 경질 젤라틴 캡슐 형태에 대해서는 밀링, 혼합, 및 충전을 수반하는 통상적인 조제 기법에 따라 제조될 수 있다. 액체 담체가 사용될 때, 제제는 시럽, 엘릭서, 에멀젼 또는 수성 또는 비수성 용액 또는 현탁액의 형태일 수 있다. 그러한 액체 제형은 직접 os(경구) 투여될 수 있다.
일부 구현예에서, 약제학적 조성물은 임의의 투여 경로를 통한 세포 및/또는 대상체에 대한 전달을 위해 제형화될 수 있다. 대상체에 대한 투여 방식은 주사, 주입, 흡입, 비강내, 안내(intraocular), 국소 전달, 캐뉼러내 전달, 또는 섭취를 포함할 수 있다. 주사는, 제한 없이, 정맥내, 근육내, 동맥내, 수강내, 뇌실내, 관절낭내, 안와내, 심장내, 피내, 복막내, 경기관(transtracheal), 피하, 표피하, 관절내, 피막하, 지주막하, 척수내, 뇌척수내, 및 흉골내 주사 및 주입을 포함한다. 일부 구현예에서, 투여는 에어로졸 흡입, 예를 들어 네뷸라이제이션에 의한 에어로졸 흡입을 포함한다. 일부 구현예에서, 투여는 전신(예를 들어, 경구, 직장, 비강, 설하, 협측, 또는 비경구), 장내(예를 들어, 전신에 미치는 효과를 갖지만, 위장관을 통해 전달됨), 또는 국부(예를 들어, 피부 상에의 국부 적용, 유리체강내 주사) 투여이다. 일부 구현예에서, 하나 이상의 조성물이 전신 투여된다. 일부 구현예에서, 투여는 비경구외(non-parenteral) 투여이고, 치료제는 비경구 치료제이다. 일부 구현예에서, 투여는 기관지(예를 들어, 기관지 점적주입에 의함), 협측, 진피(이는, 예를 들어 진피, 피내, 피간, 경피 등에 대한 국소 투여 중 하나 이상일 수 있거나 이를 포함할 수 있음), 장내, 동맥내, 피내, 위내, 수내, 근육내, 비강내, 복막내, 수강내, 정맥내, 뇌실내, 특정 기관 내(예를 들어, 간내), 점막, 비강, 경구, 직장, 피하, 설하, 국소, 기관(tracheal)(예를 들어, 기관내 점적주입에 의함), 질내, 유리체 투여 등일 수 있다. 일부 구현예에서, 투여는 단회 용량일 수 있다. 일부 구현예에서, 투여는 간헐적(예를 들어, 복수의 용량이 시간적으로 분리됨) 및/또는 주기적(예를 들어, 개별 용량이 공통된 기간에 의해 분리됨) 투약을 수반할 수 있다. 일부 구현예에서, 투여는 적어도 선택된 기간 동안 연속 투약(예를 들어, 관류)을 수반할 수 있다. 일부 구현예에서, 6, 8, 10, 12, 15 또는 20회, 또는 그 이상의 투여가 1회 치료 동안 또는 치료 투약계획으로서 일정 기간에 걸쳐 대상체에게 제공될 수 있다.
일부 구현예에서, 예를 들어 질환, 장애 또는 병태와 연관된 증상이 지속되는 한, 필요에 따라 투여가 제공될 수 있다. 일부 구현예에서, 반복 투여는 대상체의 남은 생애 동안 필요할 수 있다. 치료 기간은 다양할 수 있으며, 예를 들어 1일, 2일, 3일, 1주, 2주, 1개월, 2개월, 3개월, 6개월, 1년, 또는 그 이상일 수 있다.
투약량
투여되는 작용제 또는 조성물의 투약량은, 예를 들어 치료되는 병태, 질환의 중증도, 대상체의 개별 파라미터(연령, 생리학적 조건, 크기 및 체중을 포함함), 치료 지속기간, (존재하는 경우) 수행될 치료의 유형, 특정 투여 경로 및 유사한 인자에 기반하여 달라질 수 있다. 따라서, 본 명세서에 기재된 작용제의 투여되는 용량은 그러한 다양한 파라미터에 좌우될 수 있다. 투여되는 조성물의 투약량은 또한 대상체의 성별, 전반적인 의학적 상태, 및 치료하려는 장애의 중증도와 같은 기타 다른 인자에 따라 달라질 수 있다. 또한 더 낮거나 더 높은 투약량이 상황에 따라 투여될 수 있지만 단일 정맥내 주입으로서 약 1 mg/kg 내지 6 mg/kg의 범위인 본 명세서에 개시된 조절제 또는 조절제의 조합의 투약량을 대상체에게 제공하는 것이 바람직할 수 있다. 투약량은 필요에 따라, 예를 들어 매일 1회(예를 들어, 1 내지 30일 동안), 3일마다 1회(예를 들어, 1 내지 30일 동안), 5일마다 1회(예를 들어, 1 내지 30일 동안), 1주마다 1회(예를 들어, 1 내지 6주 동안 또는 2 내지 5주 동안) 반복될 수 있다. 일부 구현예에서, 투약량은 1.0 mg/kg 내지 6 mg/kg, 1.0 mg/kg 내지 5 mg/kg, 1.0 mg/kg 내지 4 mg/kg, 1.0 내지 3.0 mg/kg, 1.5 mg/kg 내지 3.0 mg/kg, 1.0 mg/kg 내지 1.5 mg/kg, 1.5 mg/kg 내지 3 mg/kg, 3 mg/kg 내지 4 mg/kg, 4 mg/kg 내지 5 mg/kg, 또는 5 mg/kg 내지 6 mg/kg을 포함할 수 있지만 이에 제한되지 않는다. 투약량은 다수 회, 예를 들어 1주마다 1회 또는 2회, 또는 1 또는 2주마다 1회 투여될 수 있다. 일부 구현예에서, 대상체는 또한 더 낮거나 더 높은 투약량이 상황에 따라 투여될 수 있지만 다중 정맥내 주입으로서 약 1 mg/kg 내지 6 mg/kg의 범위인 본 명세서에 개시된 조절제 또는 조절제의 조합의 투약량을 제공받는다.
본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 3 내지 5일마다 1회 투약량으로 투여될 수 있고, 총 적어도 3회 투약량에 대해 반복된다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 25일 동안 5일마다 3 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 1 내지 10회 용량에 대해 3 내지 5일마다 1.0 내지 5.0 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 3회 용량에 대해 5일마다, 그 다음 3회 용량에 대해 3일마다 1.0 내지 3.0 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 4회 용량에 대해 5일마다, 그 다음 3회 용량에 대해 3일마다 1.0 내지 3.0 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 1 내지 10회 용량에 대해 5일마다 6 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 1 내지 10회 용량에 대해 5일마다 3 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 2회 용량에 대해 5일마다 1.5 mg/kg, 3회 용량에 대해 5일마다 3 mg/kg, 1회 용량에 대해 3일마다 3 mg/kg으로 투여될 수 있다. 대안적으로, 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합은 5일마다 6 mg/kg으로 투여될 수 있거나 5일 동안 1일 1회 1.5 mg/kg으로 투여되고 2일은 중단될 수 있다. 투약 일정은 선택적으로 다른 간격으로 반복될 수 있고 투약량은 용량과 일정을 적절하게 조정하여 다양한 비경구 경로를 통해 제공될 수 있다. 일부 구현예에서, 조절제 또는 조절제의 조합의 투약은 1.0 mg/kg 내지 6.0 mg/kg의 투약량을 포함할 수 있으며, 선택적으로 매주, 1주에 2회, 또는 격주로 제공될 수 있다. 당업자는 다양한 인자, 예컨대 연령, 성별, 체중, 치료될 장애의 중증도가 본 명세서에 개시된 바와 같은 조절제 또는 조절제의 조합의 투약량을 선택하는 데 고려될 수 있으며, 투약량 및/또는 투여 빈도가 치료 과정 동안 증가 또는 감소될 수 있음을 인식할 것이다. 투약량은 필요에 따라 반복될 수 있으며, 2 내지 8회만큼의 투약 후 종양 부피의 감소의 증거가 관찰된다. 본 명세서에 개시된 투약량 및 투여 일정은 시스플라틴, 소라페닙, 또는 소분자 비교자와 비교하여 대상체의 전체 체중에 대한 최소한의 효과를 나타낸다. 대상 방법은 CT 및/또는 PET/CT를 사용하여 규칙적인 간격으로 종양 반응을 측정하는 것을 포함할 수 있다. 종양 마커의 혈중 수치도 또한 모니터링될 수 있다. 투약량 및/또는 투여 일정은 영상화 및/또는 마커 혈중 수치의 결과에 따라 필요에 따라 조정될 수 있다.
일부 구현예에서, 본 명세서에 개시된 조성물은 외과적 절제, 타이로신 키나제 억제제(TKI), 예를 들어 소라페닙, 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1, 예를 들어 BET672, 예를 들어 비라브레십, MEK 억제제, (예를 들어, 트라메티닙), 동소 간 이식, 고주파 절제, 면역요법, 면역 관문 및 항-혈관-내피-성장 인자 병용 요법, 광역동 치료(PDT), 레이저 치료, 근접치료, 방사선 치료, 경-카테터 동맥 화학- 또는 방사선-색전술, 정위 방사선 치료, 화학요법, 및/또는 전신 화학요법으로부터 선택되는 하나 이상의 치료제 또는 방법과 조합하여 투여되어 질환 또는 장애를 치료할 수 있다. 하기 표 21은 예시적인 치료제를 개시한다.
본 개시내용에 따른 약제학적 조성물은 치료적 유효량으로 전달될 수 있다. 정확한 치료적 유효량은 주어진 대상체에서 치료 효능의 관점에서 가장 효과적인 결과를 가져오게 될 조성물의 양이다. 이 양은 치료적 화합물의 특성(활성, 약동학적 특성, 약력학적 특성, 및 생체이용률을 포함함), 대상체의 생리학적 조건(연령, 성별, 질환 유형 및 병기, 전반적인 신체적 상태, 주어진 투약량에 대한 반응, 및 약제의 유형을 포함함), 제형에서의 약제학적으로 허용되는 담체 또는 담체들의 성질, 및/또는 투여 경로를 포함하지만 이로 한정되지 않는 다양한 인자에 따라 달라질 것이다.
일부 양태에서, 본 개시내용은 치료제를 전달하는 방법을 제공하며, 상기 방법은 본 명세서에 기재된 바와 같은 조성물을 대상체에게 투여하는 단계를 포함하며, 여기서 조절제는 치료제이고/이거나 치료제의 전달은 치료제의 부재 하에서의 유전자 발현과 대비하여 유전자 발현의 변화를 야기한다.
본 명세서의 다양한 구현예에 제공된 바와 같은 방법이 본 명세서에 기재된 임의의 일부 양태에서 이용될 수 있다. 일부 구현예에서, 하나 이상의 조성물은 특정 세포, 또는 하나 이상의 특정 조직에 표적화된다.
예를 들어, 일부 구현예에서 하나 이상의 조성물은 간, 상피, 결합, 근육, 생식, 및/또는 신경 조직 또는 세포에 표적화된다. 일부 구현예에서, 조성물은 특정 기관계의 세포 또는 조직, 예를 들어 심혈관계(심장, 혈관계); 소화계(식도, 위, 간, 담낭, 췌장, 장, 결장, 직장 및 항문); 내분비계(시상하부, 뇌하수체, 송과체 또는 송과선, 갑상선, 부갑상선, 부신); 배설계(신장, 요관, 방광); 림프계(림프, 림프절, 림프관, 편도선, 인두편도, 흉선, 비장); 외피계(피부, 모발, 손발톱); 근육계(예를 들어, 골격근); 신경계(뇌, 척수, 신경); 생식기계(난소, 자궁, 유선, 고환, 수정관, 정낭, 전립선); 호흡계(인두, 후두, 기관, 기관지, 폐, 횡격막); 골격계(뼈, 연골); 및/또는 이들의 조합에 표적화된다.
일부 구현예에서, 본 개시내용의 조성물은 혈액-뇌 장벽, 태반막, 또는 혈액-고환 장벽을 횡단한다.
일부 구현예에서, 본 명세서에 제공된 바와 같은 약제학적 조성물은 전신 투여된다.
일부 구현예에서, 투여는 비경구외(non-parenteral) 투여이고, 치료제는 비경구 치료제이다.
본 명세서에 제공된 방법 및 조성물은 질환, 장애, 및/또는 병태의 증상을 경감시키는 충분한 투약계획에 의해 투여되는 약제학적 조성물을 포함할 수 있다. 일부 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물을 투여함으로써 치료제를 전달하는 방법을 제공한다.
본 개시내용의 약제학적 용도는 본 명세서에 기재된 바와 같은 조성물(예를 들어, 조절제, 예를 들어 파괴제)을 포함할 수 있다.
일부 구현예에서, 본 개시내용의 약제학적 조성물은 활성제 단독과 비교하여 개선된 PK/PD, 예를 들어 증가된 약동학적 특성 또는 약력학적 특성, 예컨대 개선된 표적화, 흡수, 또는 수송(예를 들어, 적어도 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 75%, 80%, 90% 개선되거나 그 이상임)을 갖는다. 일부 구현예에서, 약제학적 조성물은 치료제 단독과 비교하여 바람직하지 않은 효과의 감소, 예컨대 비표적 위치로의 확산, 탈표적(off-target) 활성, 또는 독성 대사의 감소를 갖는다(예를 들어, 활성제 단독과 대비하여 적어도 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 75%, 80%, 90% 또는 그 이상이 감소됨). 일부 구현예에서, 조성물은 활성제 단독과 비교하여 (예를 들어, 적어도 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 75%, 80%, 90% 또는 그 이상) 치료제의 효능을 증가시키고/시키거나 독성을 감소시킨다.
본 명세서에 기재된 약제학적 조성물은, 예를 들어 담체, 예컨대 약제학적 담체 및/또는 중합체 담체, 예를 들어 나노입자, 리포좀 또는 소포를 포함하는 것으로 제형화되고, 알려진 방법에 의해 이를 필요로 하는 대상체(예를 들어, 인간 또는 비인간 농업용 동물 또는 가축 동물, 예를 들어 소, 개, 고양이, 말, 가금류)에게 전달될 수 있다. 그러한 방법은 형질감염(예를 들어, 지질-매개, 양이온성 중합체, 인산칼슘); 전기천공 또는 막 파괴(예를 들어, 뉴클레오펙션(nucleofection)) 및 바이러스 전달(예를 들어, 렌티바이러스, 레트로바이러스, 아데노바이러스, AAV)의 기타 다른 방법을 포함한다. 전달 방법은 또한, 예를 들어 문헌[Gori et al., Delivery and Specificity of CRISPR/Cas9 Genome Editing Technologies for Human Gene Therapy. Human Gene Therapy. July 2015, 26(7): 443-451. Doi:10.1089/hum.2015.074]; 및 문헌[Zuris et al. Cationic lipid-mediated delivery of proteins enables efficient protein-based genome editing in vitro and in vivo. Nat Biotechnol. 2014 Oct 30;33(1):73-80]에 기재되어 있다.
지질 나노입자
본 명세서에 기재된 바와 같은 발현 리프레서 또는 발현 억제 시스템은 입자를 포함한 임의의 생물학적 전달 시스템/제형, 예를 들어 나노입자 전달 시스템을 사용하여 전달될 수 있다. 나노입자는 치수(예를 들어, 직경)가 약 1 내지 약 1000 나노미터, 약 1 내지 약 500 나노미터 크기, 약 1 내지 약 100 nm, 약 30 nm 내지 약 200 nm, 약 50 nm 내지 약 300 nm, 약 75 nm 내지 약 200 nm, 약 100 nm 내지 약 200 nm, 및 이들 사이의 임의의 범위인 입자를 포함한다. 나노입자는 나노규모 치수들의 복합 구조를 갖는다. 일부 구현예에서, 나노입자는 통상적으로 구형이지만, 나노입자 조성에 따라 상이한 모폴로지가 가능하다. 나노입자의 외부 환경과 접촉해 있는 나노입자의 일부분은 일반적으로 나노입자의 표면으로서 확인된다. 일부 구현예에서, 나노입자는 최대 치수가 25 nm 내지 200 nm의 범위이다. 본 명세서에 기재된 바와 같은 나노입자는 고체, 반고체, 에멀젼, 또는 콜로이드성 나노입자를 포함하지만 이로 한정되지 않는 임의의 형태로 제공될 수 있는 전달 시스템을 포함한다. 나노입자 전달 시스템은 지질-기반 시스템, 리포좀, 미셀, 마이크로소포, 엑소솜, 또는 유전자 총(gene gun)을 포함할 수 있지만 이로 한정되지 않는다. 일 구현예에서, 나노입자는 지질 나노입자(LNP)이다. 일부 구현예에서, LNP는 분자간력에 의해 서로 물리적으로 회합된 복수의 지질 분자를 포함하는 입자이다.
일부 구현예에서, LNP는 다수의 성분, 예를 들어 3개 또는 4개의 성분을 포함할 수 있다. 일 구현예에서, 발현 리프레서 또는 상기 리프레서를 포함하는 약제학적 조성물(또는 발현 리프레서를 인코딩하는 핵산, 또는 상기 발현 리프레서 핵산을 포함하는 약제학적 조성물)이 LNP 내에 캡슐화된다. 일 구현예에서, 발현 억제 시스템 또는 상기 발현 억제 시스템을 포함하는 약제학적 조성물(또는 발현 억제 시스템을 인코딩하는 핵산, 또는 상기 발현 억제 시스템 핵산을 포함하는 약제학적 조성물)이 LNP 내에 캡슐화된다. 일부 구현예에서, 제1 발현 리프레서를 인코딩하는 핵산 및 제2 발현 리프레서를 인코딩하는 핵산이 동일한 LNP에 존재한다. 일부 구현예에서, 제1 발현 리프레서를 인코딩하는 핵산 및 제2 발현 리프레서를 인코딩하는 핵산이 상이한 LNP에 존재한다. LNP의 제조 및 조절제 캡슐화가 사용될 수 있고/있거나 문헌[Rosin et al, Molecular Therapy, vol. 19, no. 12, pages 1286-2200, December 2011]으로부터 변형될 수 있다. 일부 구현예에서, 본 명세서에 개시된 지질 나노입자 조성물은 mRNA에 의해 인코딩된 단백질의 발현에 유용하다. 일부 구현예에서, 핵산은, 지질 나노입자 내에 존재할 때, 수용액 중에서 뉴클레아제에 의한 분해에 저항한다.
일부 구현예에서, LNP 제형은 CCD 지질, 중성 지질, 및/또는 헬퍼 지질을 포함할 수 있다. 일부 구현예에서, LNP 제형은 이온화 가능한 지질을 포함한다. 일부 구현예에서, 이온화 가능한 지질은 양이온성 지질, 이온화 가능한 양이온성 지질, 또는 용이하게 양성자화될 수 있는 아민-함유 지질일 수 있다. 일부 구현예에서, 지질은 pH에 따라 양으로 하전된 형태 또는 중성 형태로 존재할 수 있는 양이온성 지질이다. 일부 구현예에서, 양이온성 지질은, 예를 들어 생리학적 조건 하에서 양으로 하전될 수 있는 지질이다. 일부 구현예에서, 지질 입자는 중성 지질, 이온화 가능한 아민-함유 지질, 생분해성 알킨 지질, 스테로이드, 인지질(다가불포화 지질을 포함함), 구조 지질(예를 들어, 스테롤), PEG, 콜레스테롤, 및 중합체 접합된 지질 중 하나 이상과 함께 제형 내에 양이온성 지질을 포함한다.
일부 구현예에서, LNP 제형(예를 들어, MC3 및/또는 SSOP)은 콜레스테롤, PEG, 및/또는 헬퍼 지질을 포함한다. LNP는, 예를 들어 미소구체, 예컨대 단층 및 다층 소포, 라멜라 상 지질 이중층일 수 있으며, 이는 일부 구현예에서 실질적으로 구형이다.
일부 구현예에서, LNP는 수성 코어, 예를 들어 본 명세서에 개시된 바와 같은 발현 리프레서 또는 시스템을 인코딩하는 핵산을 포함하는 수성 코어를 포함할 수 있다. 본 개시내용의 일부 구현예에서, LNP 제형을 위한 카고는 적어도 하나의 가이드 RNA를 포함한다. 일부 구현예에서, 카고, 예를 들어 본 명세서에 개시된 바와 같은 발현 리프레서, 또는 시스템를을 인코딩하는 핵산은 LNP, 예를 들어 양이온성 지질을 포함하는 LNP의 표면에 흡착될 수 있다. 일부 구현예에서, 카고, 예를 들어 본 명세서에 개시된 바와 같은 발현 리프레서, 또는 시스템을 인코딩하는 핵산은 LNP와 회합될 수 있다. 일부 구현예에서, 카고, 예를 들어 본 명세서에 개시된 바와 같은 발현 리프레서, 또는 시스템을 인코딩하는 핵산은 LNP 내에 캡슐화되며, 예를 들어 완전 캡슐화 및/또는 부분 캡슐화될 수 있다.
일부 구현예에서, 카고를 포함하는 LNP는 전신 전달, 예를 들어 유기체 내에서 활성제의 폭넓은 노출을 초래할 수 있는 카고의 치료적 유효 용량의 전달을 위해 투여될 수 있다. 지질 나노입자의 전신 전달은, 예를 들어 정맥내, 동맥내, 피하, 및 복막내 전달을 포함한 당업계에 알려진 임의의 수단에 의해 수행될 수 있다. 일부 구현예에서, 지질 나노입자의 전신 전달은 정맥내 전달에 의해 수행된다. 일부 구현예에서, 카고를 포함하는 LNP는 국부 전달, 예를 들어 유기체 내의 표적 부위로의 활성제의 직접 전달을 위해 투여될 수 있다. 일부 구현예에서, LNP는 질환 부위, 예를 들어 종양, 기타 다른 표적 부위, 예를 들어 염증 부위, 또는 표적 기관, 예를 들어 간, 폐, 위, 결장, 췌장, 자궁, 유방, 림프절 등으로 국부 전달될 수 있다. 일부 구현예에서, 본 명세서에 개시된 바와 같은 LNP는 특정 세포, 예를 들어 간세포, 성상 세포, 쿠퍼 세포, 내피 세포, 폐포 세포, 및/또는 상피 세포로 국부 전달될 수 있다. 일부 구현예에서, 본 명세서에 개시된 바와 같은 LNP는 특정 종양 부위, 예를 들어 피하, 동소 부위로 국부 전달될 수 있다.
LNP는 에멀젼 중에 분산상으로서, 미셀로서, 또는 현탁액 중에 내부상으로서 제형화될 수 있다. 일부 구현예에서, LNP는 생분해성이다. 일부 구현예에서, LNP는 치료적 유효 용량에서 세포독성 수준으로 축적되지 않거나 생체내에서 독성을 야기하지 않는다. 일부 구현예에서, LNP는 치료적 유효 용량으로 반복 투여 후에 세포독성 수준으로 축적되지 않거나 생체내에서 독성을 야기하지 않는다. 일부 구현예에서, LNP는 치료적 유효 용량에서 실질적으로 유해한 효과로 이어지는 선천성 면역 반응을 야기하지 않는다.
일부 구현예에서, 사용되는 LNP는 화학식 (6Z,9Z,28Z,31Z)-헵타트리아콘트-6,9,28,31-테트라엔-19-일 4-(디메틸아미노) 부타노네이트 또는 ssPalmO-페닐-P4C2(ssPalmOPhe, SS-OP)를 포함한다. 일부 구현예에서, LNP 제형은 화학식 (6Z,9Z,28Z,31Z)-헵타트리아콘트-6,9,28,31-테트라엔-19-일 4-(디메틸아미노)부타노네이트(MC3), 1,2-디올레오일-sn-글리세로-3-포스포콜린(DOPC), 콜레스테롤, 1,2-디미리스토일-rac-글리세로-3-메톡시폴리에틸렌 글리콜-2000(PEG2k-DMG), 예를 들어 MC3 LNP 또는 ssPalmO-페닐-P4C2(ssPalmOPhe, SS-OP), 1,2-디올레오일-sn-글리세로-3-포스포콜린(DOPC), 콜레스테롤, 1,2-디미리스토일-rac-글리세로-3-메톡시폴리에틸렌 글리콜-2000(PEG2k-DMG), 예를 들어 SSOP-LNP를 포함한다.
리포좀은 내부 수성 구획을 둘러싸는 단층 또는 다층 지질 이중층 및 상대적으로 불투과성인 외측 친유성 인지질 이중층으로 구성된 구형의 소포 구조이다. 리포좀은 음이온성, 중성 또는 양이온성일 수 있다. 리포좀은 생체적합성이고, 비독성이며, 친수성 및 친유성 약물 분자 둘 다를 전달하고, 혈장 효소에 의한 분해로부터 그들의 카고(cargo)를 보호하고, 생물학적 막 및 혈액-뇌 장벽(BBB)을 가로질러 그들의 로드를 수송할 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. Doi:10.1155/2011/469679] 참조).
소포는 몇몇 상이한 유형의 지질로부터 제조될 수 있지만, 약물 담체로서 리포좀을 생성하는 데 인지질이 가장 일반적으로 사용된다. 소포는, 제한 없이, DOTMA, DOTAP, DOTIM, DDAB를 단독으로 또는 콜레스테롤과 함께 포함하여 DOTMA와 콜레스테롤, DOTAP와 콜레스테롤, DOTIM과 콜레스테롤, 및 DDAB와 콜레스테롤을 생성할 수 있다. 다중라멜라 소낭 지질의 제조 방법은 당업계에 알려져 있다(예를 들어, 다중라멜라 소낭 지질 제제에 관한 교시가 본 명세서에 참조로 포함되는 미국 특허 6,693,086 참조). 지질 필름이 수용액과 혼합되는 경우 소낭 형성은 자발적일 수 있지만, 이는 또한 균질화기, 초음파처리기, 또는 압출 장치를 사용함으로써 진탕 형태로 힘을 가함으로써 더 신속히 처리될 수 있다(예를 들어, 검토를 위해 문헌[Spuch and Navarro, Journal of Drug Delivery, vol. 2011, Article ID 469679, 12 pages, 2011. Doi:10.1155/2011/469679] 참조). 압출된 지질은 압출된 지질 제제에 관한 교시가 본 명세서에 참조로 포함되는 문헌[Templeton et al., Nature Biotech, 15:647-652, 1997]에 기재된 바와 같이 감소하는 크기의 필터를 통해 압출시킴으로써 제조될 수 있다.
본 명세서에 제공된 방법 및 조성물은 질환, 장애, 및/또는 병태의 증상을 경감시키는 충분한 투약계획에 의해 투여되는 약제학적 조성물을 포함할 수 있다. 일부 양태에서, 본 개시내용은 본 명세서에 기재된 바와 같은 조성물을 투여함으로써 치료제를 전달하는 방법을 제공한다.
용도
본 개시내용은 추가로 본 명세서에 개시된 발현 리프레서 또는 발현 리프레서 시스템의 용도에 관한 것이다. 특히, 일부 구현예에서 그러한 제공된 기술은 표적 유전자, 예를 들어 MYC 발현의 조절, 예를 들어 억제를 달성하는 데, 그리고 예를 들어, 이를 테면 세포 내에서의 표적 유전자, 예를 들어 MYC의 활성, 전달, 및 침투의 제어를 가능하게 하는 데 사용될 수 있다. 일부 구현예에서, 세포는 포유동물 세포, 예를 들어 인간 세포이다. 일부 구현예에서, 세포는 체세포이다. 일부 구현예에서, 세포는 1차 세포이다. 예를 들어, 일부 구현예에서, 세포는 포유동물 체세포이다. 일부 구현예에서, 포유동물 체세포는 1차 세포이다. 일부 구현예에서, 포유동물 체세포는 비배아 세포이다.
유전자 발현의 조절
본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서(또는 이를 인코딩하는 핵산, 또는 상기 발현 리프레서 핵산을 포함하는 약제학적 조성물) 또는 발현 억제 시스템(또는 이를 인코딩하는 핵산, 또는 상기 발현 억제 시스템 또는 핵산을 포함하는 약제학적 조성물)을 제공하는 단계, 및 표적 유전자, 예를 들어 MYC, 및/또는 작동가능하게 연결된 전사 제어 요소(들)를 발현 리프레서 또는 발현 억제 시스템과 접촉시키는 단계를 포함하는, 표적 유전자, 예를 들어 MYC의 발현을 조절하는, 예를 들어 감소시키는 방법에 관한 것이다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC의 발현을 조절하는, 예를 들어 감소시키는 것은 참조값, 예를 들어 발현 리프레서 또는 발현 억제 시스템의 부재 하에서의 표적 유전자, 예를 들어 MYC의 전사와 비교하여 표적 유전자, 예를 들어 MYC의 전사의 조절을 포함한다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC의 발현을 조절하는, 예를 들어 감소시키는 방법은 생체외에서, 예를 들어 대상체, 예를 들어 포유동물 대상체, 예를 들어 인간 대상체 유래의 세포 상에서 사용된다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC의 발현을 조절하는, 예를 들어 감소시키는 방법은 생체내에서, 예를 들어 포유동물 대상체, 예를 들어 인간 대상체에서 사용된다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC의 발현을 조절하는, 예를 들어 감소시키는 방법은 시험관내에서, 예를 들어 본 명세서에 기재된 세포 또는 세포주에서 사용된다.
본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서(또는 이를 인코딩하는 핵산, 또는 상기 발현 리프레서 핵산을 포함하는 약제학적 조성물) 또는 발현 억제 시스템(또는 이를 인코딩하는 핵산, 또는 상기 발현 억제 시스템 또는 핵산을 포함하는 약제학적 조성물)을 대상체에게 투여하는 단계를 포함하는, 대상체에서 표적 유전자, 예를 들어 MYC의 오조절, 예를 들어 과발현과 연관된 병태를 치료하는 방법에 관한 것이다. 특정 유전자의 과발현과 연관된 병태는 당업자에게 알려져 있다. 그러한 병태는 대사 장애, 암(예를 들어, 고형암), 및 간염을 포함하지만 이에 제한되지 않는다.
본 명세서에 제공된 바와 같은 방법 및 조성물은 표적 유전자, 예를 들어 MYC의 전사를 안정하게 또는 일시적으로 변경시킴으로써(예를 들어, 감소시킴으로써) 표적 유전자, 예를 들어 MYC의 과발현 또는 오조절과 연관된 병태를 치료할 수 있다. 일부 구현예에서, 그러한 조절은 적어도 약 1시간 내지 약 30일, 또는 적어도 약 2시간, 6시간, 12시간, 18시간, 24시간, 2일, 3,일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 16일, 17일, 18일, 19일, 20일, 21일, 22일, 23일, 24일, 25일, 26일, 27일, 28일, 29일, 30일, 또는 더 긴 시간 동안 또는 이들 사이의 임의의 시간 동안 지속된다. 일부 구현예에서, 그러한 조절은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 또는 7일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 영구적으로 또는 무기한으로) 동안 지속된다. 선택적으로, 그러한 조절은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하의 기간 동안 지속된다.
일부 구현예에서, 본 명세서에 제공된 방법 또는 조성물은 상기 조성물에 의해 접촉되지 않거나 상기 방법으로 처리되지 않은 세포 내의 표적 유전자, 예를 들어 MYC의 발현 대비 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%(그리고 선택적으로, 최대 100%)만큼 세포 내의 표적 유전자의 발현을 감소시킬 수 있다.
일부 구현예에서, 본 명세서에 제공된 방법은 상기 표적 유전자와 회합된 게놈 복합체, 예를 들어 앵커 서열-매개 연접부를 파괴함으로써 표적 유전자, 예를 들어 MYC의 발현을 조절할, 예를 들어 감소시킬 수 있다. 앵커 서열-매개 연접부와 연관된 유전자는 연접부 내에 적어도 부분적으로 존재할 수 있거나(즉, 제1 앵커 서열과 제2 앵커 서열 사이에 서열식(sequence-wise)으로 위치할 수 있거나), 제1 앵커 서열과 제2 앵커 서열 사이에 서열식으로 위치하지 않고 동일한 염색체 상에 그리고 적어도 제1 또는 제2 앵커 서열에 충분히 근접하여 위치하여 그의 발현이 앵커 서열-매개 연접부의 토폴로지를 제어함으로써 조절될 수 있게 한다는 점에서 상기 유전자는 연접부의 외부에 있을 수 있다. 당업자는 2개의 요소 사이의(예를 들어, 유전자와 앵커 서열-매개 연접부 사이의) 3차원 공간의 거리는 일부 구현예에서 염기쌍의 관점에서의 거리보다 더 많이 관련되어 있을 수 있음을 이해할 것이다. 일부 구현예에서, 외부에 있지만 연관된 유전자는 제1 또는 제2 앵커 서열의 2 Mb 이내, 1.9 Mb 이내, 1.8 Mb 이내, 1.7 Mb 이내, 1.6 Mb 이내, 1.5 Mb 이내, 1.4 Mb 이내, 1.3 Mb 이내, 1.3 Mb 이내, 1.2 Mb 이내, 1.1 Mb 이내, 1 Mb 이내, 900 kb 이내, 800 kb 이내, 700 kb 이내, 500 kb 이내, 400 kb 이내, 300 kb 이내, 200 kb 이내, 100 kb 이내, 50 kb 이내, 20 kb 이내, 10 kb 이내, 또는 5 kb 이내에 위치한다.
일부 구현예에서, 일부 구현예에서, 유전자, 예를 들어 MYC의 발현을 조절하는 것은 유전자, 예를 들어 MYC에 대한 전사 제어 서열의 접근성을 변경시키는 것을 포함한다. 전사 제어 서열은, 앵커 서열-매개 연접부의 내부에 있든 외부에 있든 관계없이, 인핸싱 서열 또는 침묵(또는 억제) 서열일 수 있다.
일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 유전자 오조절 장애, 예를 들어 MYC 유전자 오조절 장애, 예를 들어 MYC 유전자 오조절과 연관된 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 이러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 MYC 유전자 오조절 장애 또는 MYC 유전자 오조절 장애와 연관된 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 장애는 MYC 오조절, 예를 들어 MYC 과발현과 연관되어 있다. 일부 구현예에서, 장애는 AFP 오조절, 예를 들어 AFP 과발현과 연관되어 있다. 일부 구현예에서, 그러한 제공된 기술은 표적 유전자, 예를 들어 MYC의 프로모터를 메틸화하여 이를 필요로 하는 대상체, 예를 들어 환자에서 유전자 오조절 장애, 예를 들어 MYC 유전자 오조절 장애, 예를 들어 MYC 유전자 오조절과 연관된 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 표적 유전자, 예를 들어 MYC에 의해 인코딩된 폴리펩타이드를 비정상적으로 발현하는 세포의 생존력에 선택적으로 영향을 미칠 수 있다.
일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 간 장애 또는 간 장애와 연관된 증상의 장애를 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 폐 장애 또는 간 장애와 연관된 증상의 장애를 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 신생물 장애, 예를 들어 신생물 장애와 연관된 장애 또는 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 바이러스 감염 관련 장애, 예를 들어 바이러스 감염 관련 장애와 연관된 장애 또는 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 알코올 오용 관련 장애, 예를 들어 알코올 오용 관련 장애와 연관된 장애 또는 증상을 치료하는 데 사용될 수 있다. 일부 구현예에서, 그러한 제공된 기술은 이를 필요로 하는 대상체, 예를 들어 환자에서 바이러스 감염 또는 알코올 오용과 연관된 신생물 장애, 예를 들어 바이러스 감염 또는 알코올 오용과 연관된 신생물 장애와 연관된 장애 또는 증상을 치료하는 데 사용될 수 있다.
일부 구현예에서, 치료되는 병태는 신생물이다. 일부 구현예에서, 치료되는 병태는 종양형성이다. 일부 구현예에서, 치료되는 병태는 암이다. 일부 구현예에서, 암은 불량한 예후와 연관된다. 일부 구현예에서, 암은 MYC 오조절, 예를 들어 MYC 과발현과 연관되어 있다. 일부 구현예에서, 암은 AFP 오조절, 예를 들어 AFP 과발현과 연관되어 있다. 일부 구현예에서, 암은 유방암, 간암, 결장직장암, 폐암, 췌장암, 위암, 및/또는 자궁암이다. 일부 구현예에서, 암은 감염, 예를 들어 바이러스, 예를 들어 박테리아와 연관되어 있다. 일부 구현예에서, 암은 알코올 오용과 연관되어 있다. 일부 구현예에서, 암은 간암종이다.
일부 구현예에서, 암 세포는 폐암 세포, 위암, 위장관암, 결장직장암, 췌장암 또는 간암 세포이다. 일부 구현예에서, 암은 간세포 암종(HCC), 섬유층판 간세포 암종(FHCC), 담관암종, 혈관육종, 2차 간암, 비소세포 폐암(NSCLC), 선암종, 소세포 폐암(SCLC), 대세포 (미분화) 암종, 삼중 음성 유방암, 위 선암종, 자궁내막 암종, 또는 췌 암종이다.
일부 구현예에서 치료되는 병태는 간 질환이다. 일부 구현예에서, 치료되는 병태는 MYC 오조절, 예를 들어 MYC 과발현과 연관되어 있다. 일부 구현예에서 치료되는 병태는 만성 질환이다. 일부 구현예에서 치료되는 병태는 만성 간 질환이다. 일부 구현예에서 치료되는 병태는 바이러스 감염이다. 일부 구현예에서, 치료되는 병태는 알코올 오용 연관 장애이다.
일부 구현예에서 치료되는 병태는 폐 질환이다. 일부 구현예에서, 치료되는 병태는 MYC 오조절, 예를 들어 MYC 과발현과 연관되어 있다. 일부 구현예에서 치료되는 병태는 만성 질환이다. 일부 구현예에서 치료되는 병태는 만성 폐 질환이다. 일부 구현예에서, 그러한 제공된 기술은 폐암 성장, 전이, 약물 내성, 및/또는 암 줄기 세포(CSC) 유지를 치료하거나 감소시키는 데 사용될 수 있다. 일부 구현예에서, 치료되는 병태는 암종, 예를 들어 비소세포 폐암(NSCLC)이다. 일부 구현예에서, 만성 폐 질환은 담배 오용과 연관되어 있다.
일부 구현예에서, 암은 간암종 하위유형 S1(HCC S1), 간암종 하위유형 S2(HCC S2), 또는 간암종 하위유형 S3(HCC S2)이다. 일부 구현예에서, HCC 하위유형은 MYC 과발현과 연관되어 있다. 일부 구현예에서, 암은 HCC S1 또는 HCC S2이다. 일부 구현예에서, 암 하위유형은 공격적인 종양 및 불량한 임상 결과와 연관되어 있다.
일부 구현예에서, 본 개시내용은 대상체에서 HCC 하위유형에 기초하여 대상체에 대해 고안될 수 있는 치료 요법, 예를 들어 대상체에 대한 HCC 하위유형에 기반하여 치료의 공격성을 맞춤화하기 위한 개인화된 접근법을 제공한다. 일부 구현예에서, 본 개시내용은 본 명세서에 개시된 발현 리프레서 또는 발현 리프레서 시스템을 사용하는 치료 방법을 제공하며, 방법은 환자에서 HCC 하위유형을 식별하는 단계를 포함하고, HCC 하위유형 확인에 기반하여 상기 발현 리프레서 및/또는 발현 리프레서 시스템의 투약량 및 투여 일정을 결정한다.
대상체가 화학요법 치료와 비교하여 최소한의 부작용 또는 전신 독성을 격도록 장애의 치료를 위해 대상체에게 본 명세서에 개시된 바와 같은 작용제, 또는 조성물을 전달하는 방법이 본 명세서에 기재되어 있다. 일부 구현예에서, 대상체는 본 명세서에 기재된 작용제 및/또는 조성물로 치료될 때 화학요법과 통상적으로 연관된 임의의 상당한 부작용을 경험허지 않는다. 일부 구현예에서, 대상체는 본 명세서에 기재된 작용제 및/또는 조성물로 치료될 때 탈모(alopecia), 구역, 구토, 식욕 부진, 통증, 백혈구감소증, 빈혈, 혈소판감소증, 어지럼증, 피로, 변비, 구강 궤양, 피부 가려움증, 피부 벗겨짐, 신경 및 근육 손상, 청각 변화, 체중 감소, 설사, 면역억제, 상처, 심장 이상, 출혈, 간 손상, 신경 손상, 부종, 입과 목 통증, 불임, 섬유증, 탈모(epilation), 습성 박리, 점막 건조, 현기증 및 뇌병증을 포함하지만 이에 제한되지 않는 상당한 부작용을 경험하지 않는다. 일부 구현예에서, 대상체는 본 명세서에 기재된 작용제 및/또는 조성물로 치료될 때 상당한 체중 감소를 나타내지 않는다.
본 명세서에 기재된 작용제 및 조성물은 본 명세서에 기재된 바와 같은 다양한 장애를 치료하거나 예방하기 위해, 대상체, 예를 들어 포유동물에게, 예를 들어 생체 내에서 투여될 수 있다. 이는 MYC의 변경된 발현 패턴을 특징으로 하는 세포와 관련된 장애를 포함한다.
후성유전학적 변형
본 개시내용은, 부분적으로, 표적 유전자, 표적 유전자에 작동가능하게 연결된 전사 제어 요소, 또는 앵커 서열(예를 들어, 표적 유전자에 근접하거나 표적 유전자에 작동가능하게 연결된 앵커 서열-매개 연접부와 연관된 앵커 서열)을 후성유전학적으로 변형시키는 방법에 관한 것이며, 방법은 발현 리프레서(또는 이를 인코딩하는 핵산) 또는 발현 억제 시스템(예를 들어, 발현 리프레서(들)), 또는 이를 인코딩하는 핵산 또는 상기 발현 리프레서(또는 이를 인코딩하는 핵산) 또는 발현 억제 시스템 또는 핵산을 포함하는 약제학적 조성물을 제공하는 단계; 및 표적 유전자 또는 표적 유전자에 작동가능하게 연결된 전사 제어 요소를 발현 리프레서 또는 발현 억제 시스템과 접촉시키는 단계를 포함하며, 이에 의해 표적 유전자, 예를 들어 MYC 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 것을 포함한다.
일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소의 DNA 메틸화를 증가 또는 감소시키는 단계를 포함한다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소와 연관된 히스톤의 히스톤 메틸화를 증가 또는 감소시키는 단계를 포함한다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소와 연관된 히스톤의 히스톤 아세틸화를 감소시키는 단계를 포함한다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소와 연관된 히스톤의 히스톤 수모화를 증가 또는 감소시키는 단계를 포함한다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소와 연관된 히스톤의 히스톤 인산화를 증가 또는 감소시키는 단계를 포함한다.
일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 상기 조성물에 의해 접촉되지 않거나 상기 방법으로 처리되지 않은 세포 내의 그러한 부위에서의 후성유전학적 변형의 수준 대비 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 또는 100%(그리고 선택적으로, 최대 100%)만큼 후성유전학적 변형의 수준을 감소시킬 수 있다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법은 상기 조성물에 의해 접촉되지 않거나 상기 방법으로 처리되지 않은 세포 내의 그러한 부위에서의 후성유전학적 변형의 수준 대비 적어도 10, 20, 30, 40, 50, 60, 70, 80, 90, 100, 120, 140, 160, 180, 200, 300, 400, 500, 600, 700, 800, 900, 또는 1000%(그리고 선택적으로, 최대 200, 300, 400, 500, 600, 700, 800, 900, 1000, 또는 2000%)만큼 후성유전학적 변형의 수준을 증가시킬 수 있다. 일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소의 후성유전학적 변형은, 예를 들어 본 명세서에 기재된 바와 같이, 표적 유전자, 예를 들어 MYC의 발현의 수준을 변형시킬 수 있다.
일부 구현예에서, 본 명세서에 기재된 방법에 의해 생성된 후성유전학적 변형은 적어도 약 1시간 내지 약 30일, 또는 적어도 약 2시간, 6시간, 12시간, 18시간, 24시간, 2일, 3,일, 4일, 5일, 6일, 7일, 8일, 9일, 10일, 11일, 12일, 13일, 14일, 15일, 16일, 17일, 18일, 19일, 20일, 21일, 22일, 23일, 24일, 25일, 26일, 27일, 28일, 29일, 30일, 또는 더 긴 시간 동안 또는 이들 사이의 임의의 시간 동안 지속된다. 일부 구현예에서, 그러한 조절은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 또는 24시간, 또는 적어도 1, 2, 3, 4, 5, 6, 또는 7일, 또는 적어도 1, 2, 3, 4, 또는 5주, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 또는 12개월, 또는 적어도 1, 2, 3, 4, 또는 5년(예를 들어, 무기한으로) 동안 지속된다. 선택적으로, 그러한 조절은 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1년 이하의 기간 동안 지속된다.
일부 구현예에서, 표적 유전자, 예를 들어 MYC, 또는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 제어 요소를 후성유전학적으로 변형시키는 방법에 사용하기 위한 발현 리프레서, 또는 발현 억제 시스템은 후성유전학적 변형 모이어티이거나 이를 포함하는 이펙터 모이어티를 포함하는 발현 리프레서를 포함한다.
예를 들어, 이펙터 모이어티는 DNA 메틸트랜스퍼라제 활성을 갖는 후성유전학적 변형 모이어티이거나 이를 포함할 수 있으며, 내인성 또는 자연 발생 표적 서열(예를 들어, 표적 유전자, 예를 들어 MYC 또는 전사 제어 요소)이 그의 메틸화를 증가시키도록(예를 들어, 전사 인자와 표적 유전자, 예를 들어 MYC 또는 전사 제어 요소의 일부분과의 상호작용을 감소시키도록, 앵커 서열에 대한 핵형성 단백질의 결합을 감소시키도록, 그리고/또는 앵커 서열-매개 연접부를 파괴하거나 방해하도록) 변경될 수 있거나, 그의 메틸화를 감소시키도록(예를 들어, 전사 인자와 표적 유전자, 또는 MYC 또는 전사 제어 요소의 일부분의 상호작용을 증가시키도록, 앵커 서열에 대한 핵형성 단백질의 결합을 증가시키도록, 그리고/또는 앵커 서열-매개 연접부의 강도를 촉진하거나 증가시키도록) 변경될 수 있다.
키트
본 개시내용은, 부분적으로, 본 명세서에 기재된 발현 리프레서 또는 발현 억제 시스템, 예를 들어 발현 리프레서를 포함하는 키트에 관한 것이다. 일부 구현예에서, 키트는 발현 리프레서 또는 발현 억제 시스템(예를 들어, 발현 억제 시스템의 발현 리프레서(들)), 및 상기 발현 리프레서 또는 발현 억제 시스템의 사용에 대한 설명서를 포함한다. 일부 구현예에서, 키트는 발현 리프레서를 인코딩하는 핵산 또는 발현 억제 시스템 또는 이의 성분(예를 들어, 발현 억제 시스템의 발현 리프레서(들))을 인코딩하는 핵산, 및 발현 리프레서(및/또는 상기 핵산) 및/또는 상기 발현 억제 시스템(및/또는 상기 핵산)의 사용에 대한 설명서를 포함한다. 일부 구현예에서, 키트는 발현 리프레서를 인코딩하는 핵산 또는 발현 억제 시스템 또는 이의 성분(예를 들어, 발현 억제 시스템의 발현 리프레서(들))을 인코딩하는 핵산을 포함하는 세포, 및 상기 세포, 핵산, 및/또는 상기 발현 리프레서 또는 발현 억제 시스템의 사용에 대한 설명서를 포함한다.
일부 양태에서, 키트는 a) 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC를 포함하는 앵커 서열 매개 연접부(ASMC)의 앵커 서열 또는 앵커 서열에 근접한 서열에 결합함)를 포함하는, 2개의 발현 리프레서를 포함하는 시스템을 포함하는 조성물을 포함하는 용기를 포함한다.
일부 양태에서, 본 키트는 a) 제1 표적화 모이어티 및 선택적으로 제1 이펙터 모이어티를 포함하는 제1 발현 리프레서(여기서, 제1 발현 리프레서는 표적 유전자, 예를 들어 MYC에 작동가능하게 연결된 전사 조절 요소(예를 들어, 프로모터 또는 전사 개시 부위(TSS)), 또는 전사 조절 요소에 근접한 서열에 결합함), 및 제2 표적화 모이어티 및 선택적으로 제2 이펙터 모이어티를 포함하는 발현 리프레서(여기서, 제2 발현 리프레서는 표적 유전자, 예를 들어 MYC의 슈퍼 인핸서 영역에 위치하는 게놈 유전자좌에 결합함)를 포함하는, 2개의 발현 리프레서를 포함하는 시스템을 포함하는 조성물을 포함하는 용기를 포함한다.
일부 구현예에서, 키트는 b) 상기 조성물을 이용하여 질환을 치료하거나 세포 내의 표적 유전자, 예를 들어 MYC의 발현을 조절하기 위한, 예를 들어 감소시키기 위한 적어도 하나의 방법을 포함하는 한 세트의 설명서을 추가로 포함한다. 일 구현예에서, 키트는 선택적으로 상기 조성물을 위한 전달 비히클(예를 들어, 지질 나노입자)을 포함할 수 있다. 시약은 부형제 및/또는 전달 비히클 중에 현탁된 상태로 제공될 수 있거나, 별개의 성분으로서 제공될 수 있는데, 이는 나중에 부형제 및/또는 전달 비히클과 배합될 수 있다. 일부 구현예에서, 키트는 조성물과 공동투여되는 추가의 치료제를 선택적으로 함유하여 원하는 표적 유전자 발현, 예를 들어 MYC 유전자 발현 조절에 영향을 미칠 수 있다. 설명 자료는 통상적으로 서면 자료 또는 인쇄 자료를 포함하지만, 이들은 그러한 것으로 제한되지 않는다. 그러한 설명서를 저장하고 이를 최종 사용자에게 전달할 수 있는 임의의 매체가 상정된다. 그러한 매체는 전자 저장 매체(예를 들어, 자기 디스크, 테이프, 카트리지, 칩), 광학 매체(예를 들어, CD ROM) 등을 포함하지만 이에 제한되지 않는다. 그러한 매체는 그러한 설명 자료를 제공하는 인터넷 사이트에 대한 주소를 포함할 수 있다.
일부 구현예에서, 키트는 본 명세서에 기재된 발현 리프레서, 발현 억제 시스템, 예를 들어 발현 리프레서(들)의 단위 투여량, 또는 본 명세서에 기재된 발현 억제 시스템, 예를 들어 발현 리프레서(들)를 인코딩하는 핵산, 예를 들어 벡터의 단위 투여량을 포함한다.
하기 실시예는 본 개시내용의 일부 구현예를 추가로 설명하기 위해 제공되지만, 본 개시내용의 범주를 제한하고자 하지 않으며; 그들의 예시적인 성질로 인해 당업자에게 알려진 기타 다른 절차, 방법, 또는 기법이 대안적으로 사용될 수 있음이 이해될 것이다.
실시예
실시예 1: CTCF 모티프의 표적화된 변형은 MYC CTCF의 하향조절을 초래한다
이 실시예는 MYC 발현을 하향조절하기 위해 Cas9를 이용하는 CTCF 모티프 또는 CTCF 모티프에 인접한 영역의 뉴클레아제 편집을 설명한다.
이 실시예에서, 엑손 1에 포함된 프로모터 영역 CpG 섬에 상보적인 4개 sgRNA를 MYC 유전자의 후성유전학적 이펙터 매개 하향조절을 지시하는 최상의 표적 영역을 확인하도록 설계하였다. c-MYC 유전자는 길고 번역되지 않은 엑손 1을 포함하며(Spencer CA, Groudine M 1991), 엑손 2 및 3은 주요 코딩 영역을 포함한다. 적합한 하향조절 영역을 확인하기 위해 4개의 sgRNA에 의해 MYC 프로모터 CpG 섬의 영역에 대해 표적화된 CRISPR-dCas9-KRAB 및 CRISPR-dCas9-MQ1(박테리아 몰리쿠테스 스피로플라스마 유래의 DNMT) 이펙터를 사용하여 게놈 편집을 수행하였다. (1) sgRNA와 조합된 dCas9(이펙터 없음), 및 (2) 비처리 세포를 둘 다 대조군으로 사용하여 MYC 발현에 대한 변화를 평가하였다. 쉽게 성장되고 형질감염 가능한 세포 K562 및 HEK293에서 sgRNA를 선택하기 위한 이러한 초기 스크린을 수행하였고, sgRNA, GD-28617이 MYC mRNA 하향조절에 대해 가장 강력한 영향을 매개한 것으로 결정되었다(데이터는 나타내지 않음).
CTCF 모티프(GD-28616) 또는 CTCF 모티프(GD-28859)(CTCF 앵커 부위)에 직접 인접한 상류 영역으로 표적화된 Cas9를 2.5 ug/ml의 SSOP 제형으로 3가지 인간 HCC 모델로 형질감염시켰다(표 11 및 도 1a 내지 b). (GD-28616과 함께) Cas9로 CTCF 모티프를 파괴하면 3가지 HCC 세포주(HepG2, Hep3B 및 SKHEP1) 모두에서 MYC 발현의 32 내지 39% 하향조절을 초래한다. CTCF 모티프(GD-28859)에 인접한 영역의 파괴는 3가지 세포주 중 2가지(HepG2 및 Hep3B)에서 MYC 발현을 35 내지 45% 하향조절하였다(도 2a). 세포주의 편집에서 AmpSeq에 의해 평가된 편집 효율이 77 내지 100%임을 확인하였다(도 2b).
가이드 명칭 표적 부위 표적 서열 게놈 좌표
GD-28616 CTCF ATGATCTCTGCTGCCAGTAG
(서열번호 1)
chr8:128746342-128746364
GD-28859 CTCF ATCGCGCCTGGATGTCAACG
(서열번호 2)
chr8:128746321-128746343
GD-28862 CTCF ATTGTGCAGTGCATCGGATT
(서열번호 3)
chr8:128746525-128746547
GD-28617 프로모터 GTCAAACAGTACTGCTACGG
(서열번호 4)
chr8:128748014-128748036
실시예 2: dCas9sgRNA에 융합된 KRAB 이펙터에 의한 MYC1 발현의 하향조절
이 실시예는 dCas9sgRNA에 융합된 KRAB 이펙터를 CTCF 모티프(GD-28616) 또는 CTCF 모티프(GD-28859)에 직접 인접한 상류 영역 또는 MYC 프로모터(GD-28617)에 대해 표적화함으로써 MYC1 발현을 하향조절하는 것을 설명한다. HCC에서 MYC 발현을 표적화하기 위해, CRISPR-dCas9 시스템을 KRAB에 테더링함으로써 CRISPR-dCas9 시스템을 변형시켰다.
이 실시예에서, CTCF 모티프(GD-28616), CTCF "앵커" 부위(GD-28859), 또는 MYC 프로모터(GD-28617)로 표적화하는 개별 sgRNA(표 1 및 도 1a 내지 b)와 함께 dCas9-KRAB mRNA를 인간 HCC 세포주(HepG2, Hep3B 및 SKHEP1)로 전달하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 sgRNA를 공동 전달하였다. 대조군의 경우, (1) sgRNA와 조합된 dCas9(이펙터 없음), 및 (2) 비처리 세포를 둘 다 사용하여 변화를 평가하였다. 성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(5000개 세포/웰). 그 다음 LNP 제형(2 내지 2.5 ug/ml)을 세포에 첨가하여 mRNA 및 sgRNA를 형질감염시켰다. 모든 처리를 생물학적으로 3중으로 수행하였다. 24 내지 168시간 범위의 시점을 MYC 발현 및 세포 생존능에 대해 평가하였다. 제조업체의 프로토콜에 따라 RNeasy® plus 96-웰 키트(Qiagen)를 사용하여 4개의 독립적인 실험에서 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다.
ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였다. 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물(calibrator)로서 사용하였다.
실험 데이터는 dCas9-KRAB/GD-28616의 LNP-매개 형질감염이 Hep3B 및 SKHEP1에서의 48/72시간 시점에서 11 내지 34%만큼 MYC 발현을 하향조절하였음을 나타내었다. dCas9-KRAB/GD-28859의 LNP-매개 형질감염은 3가지 HCC 모델 모두에서의 48/72시간 시점에서 18 내지 44%만큼 MYC 발현을 하향조절하였다(도 3). 이러한 효과는 2개 세포주(Hep3B 및 SKHEP1)에서 168시간까지 감소하였지만, MYC 발현은 HepG2 세포주에서 168시간째에 28%까지 감소를 유지하였다(도 3). dCas9-KRAB/GD-28617을 통해 dCas9-KRAB를 MYC 프로모터로 유도하면 3가지 HCC 모델 모두에서의 48/72시간 시점에서 24 내지 58%만큼 MYC 발현을 하향조절하였다. 이러한 효과는 2개 세포주(Hep3B 및 SKHEP1)에서 168시간까지 감소하였지만, MYC는 HepG2에서 168시간째에 43%까지 감소를 유지하였다(도 3).
실시예 3: 징크 핑거 도메인에 융합된 KRAB 이펙터에 의한 MYC1 발현의 하향조절
이 실시예는 징크 핑거 도메인에 융합된 KRAB 이펙터를 CTCF 모티프(GD-28859)에 직접 인접한 상류 영역에 대해 표적화함으로써 MYC1 발현을 하향조절하는 것을 설명한다.
이 실시예에서, GD-28859에 의해 표적화된 DNA 영역에서 앵커 부위에 결합하도록 징크 핑거-지시 KRAB 이펙터(ZF-KRAB 이펙터)를 설계하였다(도 4a). 7가지 작제물(dCas-KRAB/GD-59, ZF1-KRAB, ZF2-KRAB, ZF3-KRAB, ZF4-KRAB, ZF5-KRAB, 및 ZF6-KRAB)을 설계하고 인간 HCC 모델(HepG2, Hep3B, SKHEP1)에서 스크리닝하였다. 이 실험에 대한 음성 대조군은 비처리 세포를 포함하였고 dCas9-KRAB/GD-28859를 양성 대조군으로 사용하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여 2개의 독립적인 실험에서 RNA를 단리하였으며, 각 실험은 생물학적으로 3중으로 수행하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 Taqman 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물로서 사용하였다. CellTiter-GLO® Luminescent Cell Viability Assay(Promega #G9241)를 사용하여 ATP 정량화에 의해 세포 생존능을 평가하였다. 성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(5000개 세포/웰). 그 다음 LNP 제형(0.6 내지 2.5 ug/ml)을 세포에 첨가하여 mRNA 및 sgRNA를 형질감염시켰다. 모든 처리를 생물학적으로 3중으로 수행하였다.
이 데이터는 ZF2-KRAB, ZF3-KRAB 및 ZF4-KRAB가 Hep3B 세포에서 dCas9-KRAB/GD-28859와 동등하거나 더 큰 정도로 MYC를 하향조절하며, 이 때 ZF3-KRAB는 가장 강한 하향조절 효과를 나타내었음을 보였다(도 4b). ZF3-KRAB는 또한 다른 2가지 HCC 모델, 즉 HepG2 및 SKHEP1에서 dCas9-KRAB/GD-28859와 동등하거나 더 큰 정도로 MYC를 하향조절하는 것으로 나타났다(도 4c). ZF3-이펙터 없음(NE)은 또한 조절 부위의 입체적 차단으로 인해, MYC 발현에 대한 하향조절 효과를 나타내는 것으로 결정되었다. Hep3B에서 ZF3-KRAB 및 ZF3-NE는 둘 다 24, 72 및 120시간의 시간 경과에 따라 MYC 발현 및 생존능에 대해 하향조절 효과를 나타내었다(도 4d).
실시예 4: dCas9sgRNA에 융합된 MQ1 이펙터에 의한 MYC1 발현의 하향조절
이 실시예는 dCas9sgRNA에 융합된 MQ1 이펙터를 CTCF 모티프(GD-28616) 또는 CTCF 모티프(GD-28859), GD-28862에 직접 인접한 상류 영역, 또는 MYC 프로모터(GD-28617)에 대해 표적화함으로써 MYC1 발현을 하향조절하는 것을 설명한다.
이 실시예에서, CTCF "앵커" 부위, 또는 MYC 프로모터로 표적화하는 개별 sgRNA(표 11 및 도 1a 내지 b)와 함께 dCas9-MQ1 mRNA를 인간 HCC 세포주(HepG2, Hep3B 및 SKHEP1)로 전달하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 sgRNA를 공동 전달하였다. 대조군의 경우, (1) sgRNA와 조합된 dCas9(이펙터 없음), 및 (2) 비처리 세포를 둘 다 사용하여 변화를 평가하였다. 본질적으로 실시예 2에 기재된 바와 같은 프로토콜을 따라 실험을 수행하였다.
결과는 GD-16, GD-59 및 GD-62에 의해 CTCF로 표적화된 dCas9-MQ1이 세포주 특이적 방식으로 다양한 하향조절 및 상향조절을 야기한다는 것을 나타내었다. GD-17에 의해 프로모터로 표적화된 dCas9-MQ1은 72시간째에 50 내지 90%의 MYC 하향조절을 초래하였고 3가지 HCC 모델 모두에서 168시간까지 지속되었다(도 5). SK-HEP-1 생존능이 MYC 하향조절에 의해 최소로 영향을 받았지만, HepG2 및 Hep3B에서 72 및 168시간에 생존능을 극적으로 감소시켰다. dCas9-sgRNA 대조군은 비처리 대조군과 비교하여 발현 또는 생존능에 대해 영향을 미치지 않았다.
실시예 5: 징크-핑거 도메인에 융합된 MQ1 이펙터에 의한 MYC1 발현의 하향조절
이 실시예는 징크-핑거 도메인에 융합된 MQ1 이펙터를 MYC 프로모터(GD-28617)에 대해 표적화함으로써 MYC1 발현을 하향조절하는 것을 설명한다.
이 실시예에서, GD-28617에 의해 표적화된 DNA 영역에 결합하도록 징크 핑거-지시 MQ1 이펙터(ZF-MQ1 이펙터)를 설계하였다(도 4a 및 도 6a). 실시예 4 스크리닝에서 확인된 영역에 결합하도록 GD-28617 주위에 6가지 작제물(ZF7-MQ1, ZF8-MQ1, ZF9-MQ1, ZF10-MQ1, ZF11-MQ1, 및 ZF12-MQ1)을 설계하고 인간 HCC 모델(HepG2, Hep3B, SKHEP1)에서 스크리닝하였다. 비처리 세포 및 ZF 단백질 단독(ZF-이펙터 없음 또는 ZF-NE)로 형질감염 세포를 실험에 대한 음성 대조군으로 사용하였고 dCas9-KRAB/GD-28859를 양성 대조군으로 사용하였다. 실시예 3에 기재된 바와 같은 프로토콜을 따랐다.
결과는, ZF8-MQ1, ZF9-MQ1 및 ZF11-MQ1은 Hep3B 세포에서 가장 큰 정도로 MYC를 하향 조절하였으며, 이 때 ZF9-MQ1은 가장 강력한 하향조절 효과를 나타내었음을 입증하였다(도 6b). 데이터는 MYC 발현을 성공적으로 감소시킨 ZF-MQ1 분자(ZF8-MQ1, ZF9-MQ1 및 ZF11-MQ1)의 게놈 결합 부위가 MYC 발현을 변경시키지 않은 ZF-MQ1 분자(ZF7-MQ1, ZF10-MQ1 및 ZF12-MQ1)와 매우 근접해 있음을 추가로 입증하였다. 이는 MYC 프로모터의 조절 요소와 관련하여 결합 효율, 결합의 3-D 배향, 영역의 메틸화 확장, 또는 특정 이펙터 위치지정의 결과의 효과일 수 있다. ZF-이펙터 결합 부위의 약간의 이동은 MYC 유전자 조절에 상당한 영향을 미치는 것으로 보인다. ZF9-MQ1은 MYC mRNA를 강력하게 하향조절하고 3가지 HCC 모델 모두에서 생존능을 감소시키는 것으로 밝혀졌으며, ZF9-MQ1 작제물에 의해 보이는 효과는 dCas9-MQ1/GD-28617 시스템에 의해 지시될 수 있는 것보다 훨씬 더 컸음이 밝혀졌다.
실시예 6: ZF9-MQ1은 다른 ZF-MQ1 이펙터와 비교하여 MYC1 발현에 대한 가장 강력한 하향조절 효과를 나타낸다
이 실시예는 테스트한 다른 ZF-MQ1 이펙터와 비교하여 ZF9-MQ1이 징크-핑거 도메인에 융합된 MQ1 이펙터를 MYC 프로모터(GD-28617)에 대해 표적화함으로써 MYC1 발현을 하향조절하는 것에 대해 가장 강력한 효과를 미침을 설명한다.
이 실시예에서, HCC 모델(HepG2, Hep3B 및 SKHEP1) 모두에서 MYC 발현을 하향조절하는 것에 대한 ZF9-MQ1의 효과를 ZF12-MQ1, ZF8-MQ1, 및 dCas9-MQ1/GD-28617의 효과에 대해 각각 비교하였다. 비처리 세포 및 ZF 단백질 단독(ZF-이펙터 없음 또는 ZF-NE)로 형질감염 세포를 실험에 대한 음성 대조군으로 사용하였고 dCas9-KRAB/GD-28859를 양성 대조군으로 사용하였다. 실시예 3에 기재된 바와 같은 프로토콜을 따랐다.
ZF9-MQ1은 ZF12-MQ1과 비교하여 MYC를 강력하게 하향조절하고 검사된 3가지 HCC 모델(Hep3B, HepG2 및 SKHEP1) 모두에서 생존능을 감소시키는 것으로 나타났다(도 7a 내지 c). ZF9-MQ1 조절된 MYC1 발현 하향조절은 ZF8-MQ1의 존재 시 보이는 하향조절보다 비교적 더 크고(도 7d 내지 f), ZF9-MQ1 작제물에 의해 보이는 효과는 dCas9-MQ1/GD-28617 시스템에 의해 지시될 수 있는 것보다 훨씬 더 컸다(도 7g 내지 i). 데이터는, ZF9-MQ1이 24시간만큼 빠르게 MYC 발현을 하향조절하는 반면, 생존능에 대한 영향은 72시간 또는 그 이후까지 관찰되지 않았다는 것을 추가로 나타내었다. 대조적으로, ZF8-MQ1은 MYC mRNA에서 훨씬 덜 중요한 변화를 초래하였고, 세포 생존능을 훨씬 더 즉각적으로 감소시켰다.
실시예 7: dCas9-MQ1은 인간 dCas9-DNMT1 또는 dCas9-DNMT-3A-3L보다 MYC 발현에 대해 훨씬 더 큰 영향을 미친다
이 실시예는 dCas9-MQ1은 인간 dCas9-DNMT1 또는 dCas9-DNMT-3A-3L보다 MYC 발현에 대해 훨씬 더 큰 영향을 미친다는 것을 나타낸다.
이 실시예에서, CRISPR-dCas9 시스템은 KRAB, 인간 DNMT1, 인간 DNMT3A-3L 융합체, 인간 DNMT3Bm 원핵 DNMT, 및 MQ1을 포함하여, 후성유전학적 리프레서의 선택에 테터링함으로써 변형되었다. 이 분자는 억제 복합체(KRAB)를 동원하거나 DNA의 CpG 뉴클레오타이드(DNMT1, DNMT3A-3L, DNMT3B 및 MQ1)를 메틸화함으로써 전사 억제를 조절한다. HepG2, Hep3B 및 SKHEP1을 포함하여 인간 HCC 세포주의 패널을 이용하여 간암 모델에서 이펙터 스크리닝을 수행하였다. GD-28617 sgRNA를 dCas9-DNMT mRNA와 조합하였고 이들 세포주로 LNP 형질감염에 의해 공동 전달하였다. sgRNA/Cas9의 편집 효율을 측정함으로써 LNP 전달의 효능을 평가하는 CRISPR-Cas9 연구는 이 시스템을 사용하여 90 내지 99% 편집 효율을 확인하였다(데이터는 나타내지 않음). 형질감염 후, 세포를 다양한 시점에서, qPCR에 의해 MYC mRNA 발현에 대해, 그리고 CellTiter-GLO®에 의해 생존능에 대해 분석하였다. 중아황산염 서열분석에 의한 표적화 및 전체 메틸화 분석에 대해 Lucigen DNA 추출 키트를 사용하여 게놈 DNA를 단리하였다.
이 연구는 dCas9-MQ1이 검사된 인간 dCas9-DNMT 또는 dCas9-KRAB 중 임의의 것보다 MYC 발현에 대해 훨씬 더 큰 영향을 미친다는 것을 나타낸다(데이터는 나타내지 않음). dCas9-MQ1이 3가지 세포주 전체에 걸쳐 72시간에 mRNA의 50 내지 90% 감소를 초래하였다(도 8a). SK-HEP-1 생존능이 MYC 하향조절에 의해 최소로 영향을 받았지만, HepG2 및 Hep3B에서 72 및 168시간에 생존능을 극적으로 감소시켰다(도 8b). dCas9-sgRNA 대조군은 비처리 대조군과 비교하여 발현 또는 생존능에 대해 영향을 미치지 않았다.
SK-HEP-1 모델이 MYC 하향조절 시 생존능에 대해 최소한의 변화를 나타내었기 때문에, 이 세포주를 이용하여 MYC 발현에 대한 하향조절 효과의 지속성을 평가하였다. 5일째에, MYC mRNA는 dCas9 DBD 단독 및 비처리된 대조군과 비교하여 80%만큼 감소되었다. 7일 및 11일째에, MYC mRNA가 각각 약 70% 및 약 55% 감소되었다. 15일째까지, 전사체에서 약 40% 하향 조절이 유지되었다(도 8c). 단일 염기쌍 분해능에서 5-메틸시토신을 측정하는 정성적 및 정량적 수단인 중아황산염 게놈 서열분석을 사용하여, dCas9-MQ1/GD-28617에 의한 처리가 표적화된 영역으로의 새로운(de novo) 메틸화를 지시하고 이러한 전사 변화가 표적 영역에서 CpG 메틸화의 백분율과 밀접한 상관관계가 있으며 확인된 메틸화가 15일까지 지속된다는 것을 나타냄을 확립하였다(도 8d).
실시예 8: dCas9-MQ1/GD-17을 이용한 처리는 생체내에서 종양 성장을 억제한다
이 실시예는 피하 Hep3B 이종이식편의 dCas9-MQ1/GD-17 처리의 생체내 분석을 설명하며, 이는 대조군 처리(PBS 및/또는 dCas9/GD-SafeHarbor)와 비교하여 종양 성장의 억제를 초래한다.
이 실시예에서, 0.6 mg/ml LNP(MC3) 제형화 이펙터(dCas9-MQ1/GD-17)를 테스트 그룹 동물에서 1일 및 7일째(20 μl/마우스) 종양내 주사에 의해 종양 부위로 전달하였다. 대조군 마우스에 PBS 또는 0.6 mg/ml LNP(MC3) 대조군 이펙터 dCas9/GD-SafeHarbor(20 μl/마우스)를 종양 부위에 주사하였다. 각 대조군 및 테스트 그룹은 SubQ Hep3B 이종이식편(250 mm3)을 갖는 6마리 동물로 구성되었다. 각 그룹에 대한 종양 부피의 변화를 15일 동안 3일마다 측정하였다. 15일 후, 평균 종양 부피의 변화를 대응표본 T-검정(Paired T-test)을 사용하여 측정하였고 이를 플롯팅하였다. dCas9-MQ1/GD-17로 처리된 마우스는 2가지 대조군과 비교하여 종양 부피의 감소를 나타내었다(도 9).
실시예 9: dCas9-MQ1/GD-17은 인간 간세포에서 B형 간염의 맥락에서 MYC를 하향조절한다
이 실시예는 dCas9-MQ1/GD-17이 인간 간세포에서 B형 간염의 맥락에서 MYC를 하향조절함을 나타낸다.
이 실시예에서, 인간 간세포를 HBV로 감염시켰고 비감염 및 감염된 간세포를 둘 다 도말한 다음 8일에 걸쳐 성장시켰다. 9일 후, HBV 감염된 인간 간세포는 비감염 세포와 비교하여 더 높은 MYC 발현을 나타내었다. 비감염 및 HBV 감염 간세포를 둘 다 LNP에 의해 대조군 이펙터 (dCas9 + SafeHarbor sgRNA(GD-SH)), 또는 이펙터 dCas9-MQ1/GD-17로 형질감염시키고 추가 48시간 동안 성장시켰다. 그 다음 MYC 발현을 48시간 후 qPCR에 의해 평가하였다(도 8). 연구를 생물학적으로 3중으로 수행하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, dCas9 + GD-SH 샘플을 보정물로서 사용하였다.
48시간 후 qPCR에 의해 평가되고 비감염 인간 간세포 대조군에 대해 정규화될 때 MYC 발현은 dCas9-MQ1/GD-17(프로모터)은 비감염 세포 및 감염 세포에서 MYC를 하향조절함을 나타내었다(도 10).
실시예 10: MYC ASMC에 대해 표적화된 전사 이펙터 및 징크 핑거 도메인의 조합은 MYC 발현을 하향조절한다
이 실시예는 CTCF 모티프(ZF3-NE 또는 ZF3-KRAB)에 직접 인접한 상류 영역에 대해 징크-핑거 도메인에 융합된 KRAB 이펙터(또는 이펙터 없음 또는 NE)를 표적화 하는 것 및 MYC 프로모터에 대해 징크-핑거 도메인에 융합된 MQ1 이펙터를 표적화하는 것이 MYC mRNA 발현을 하향조절함을 나타낸다. ZF9-MQ1과 ZF3-KRAB의 조합은 개별적으로 또는 조합하여 이 실시예에서 테스트된 다른 이펙터와 비교하여 MYC 발현을 하향조절하는 데 더 효과적이다.
앵커 CTCF를 표적화하는 ZF3-NE 또는 ZF3-KRAB 이펙터를 HCC 세포주인, Hep3B에서 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1과 조합하였다. dCas-KRAB/GD-28859 및 dCas9-MQ1/GD-28617를 2개 영역에 대한 양성 대조군에 사용하였다. 이 실험에 대한 음성 대조군은 비처리 세포 및 ZF5-NE과 녹색-형광 단백질(GFP)로 형질감염 세포를 포함하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA를 공동 전달하였다. 성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(약 5000개 세포/웰). 그 다음 LNP 제형(0.6 ug/ml)을 세포에 첨가하여 mRNA를 형질감염시킨 다음 상이한 시점 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물로서 사용하였다.
이러한 데이터는 ZF3-KRAB와 ZF9-MQ1이 dCas9-KRAB/GD-28859, ZF3-KRAB, ZF3-NE, dCas9-MQ1/GD-28617, ZF9-MQ1 단독 또는 ZF3-NE 또는 ZF5-NE와 ZF9-MQ1 조합보다 더 큰 정도로 MYC를 하향조절함을 나타내었다(도 11). GFP 및 ZF5-NE 단독은 MYC 발현에 대해 미미한 효과를 미쳤다. 데이터는 테스트한 시간 경과(24, 48 및 72시간)에 걸쳐 비슷하였으며, 24시간 후 최대 억제는 적어도 72시간까지 계속되었다.
실시예 11: ZF9-MQ1과 ZF3-KRAB의 조합은 3가지 HCC 모델에서 MYC 발현을 하향조절한다.
이 실시예는 단독으로 또는 조합하여 테스트한 다른 이펙터와 비교하여 ZF9-MQ1과 ZF3-KRAB의 조합이 추가의 HCC 세포주(Hep3B, HepG2 및 SKHEP1)에서 MYC mRNA 발현을 더 많이 하향조절함을 나타낸다.
앵커 CTCF를 표적화하는 ZF3-NE 또는 ZF3-KRAB 이펙터를 3가지 HCC 세포주인, Hep3B, HepG2 및 SKHEP1에서 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1과 조합하였다. 이 실험에 대한 음성 대조군은 ZF5-NE로 형질감염 세포를 포함하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA를 공동 전달하였다. 성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(약 5000개 세포/웰). 그 다음 LNP 제형(0.6 ug/ml)을 세포에 첨가하여 mRNA를 형질감염시킨 다음 상이한 시점 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물로서 사용하였다.
이 데이터는 ZF3-KRAB와 ZF9-MQ1이 ZF9-MQ1 단독 또는 ZF3-NE와 ZF9-MQ1 조합보다 더 큰 정도로 MYC를 하향조절함을 나타낸다(도 12). 데이터는 테스트한 시간 경과(24, 48 및 72시간)에 걸쳐 비슷하였다.
실시예 12: 추가의 HCC 모델에서 ZF9-MQ1에 대한 생존력 및 MYC 발현의 용량 반응 곡선.
이 실시예는 5가지 HCC 세포주에서 용량 반응 곡선을 사용하여 ZF9-MQ1에 의한 Myc 발현 및 세포 생존능의 하향조절을 설명한다.
이 실시예에서, MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1이 5가지 HCC 세포주, 즉 Hep3B, HepG2, SKHEP1, SNU-182 및 SNU-449에서 다수 농도로 투약되었다. 비처리 세포를 음성 대조군으로 사용하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA를 전달하였다. 성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(약 5000개 세포/웰). 그 다음 LNP 제형(5 또는 0.6 ug/ml에서 시작함)을 각각 3개 웰에 첨가한 다음 후속 웰에서 6 내지 10회 용량에 대해 약 1:2로 희석하여 mRNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 상이한 복제물 플레이트를 생존능 및 RNA에 대해 수집하였다. 제조업체의 프로토콜에 따라 Promega의 Celltiter GLO 분석 키트를 사용하여 생존능을 측정하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물로서 사용하였다. 용량 반응 곡선으로부터 EC50 값을 계산하였다.
이 데이터는 ZF9-MQ1이 테스트한 5가지 HCC 세포주 모두에서 MYC 발현을 하향조절하고 생존능을 감소시켰음을 나타내었다. ZF9-MQ1은 0.0057 내지 0.065 ug/ml LNP/mRNA의 EC50 범위로 MYC 발현을 하향조절하였으며, 이들 5가지 HCC 세포주에서 72시간째에 시험관내에서 생존능에 대한 EC50 효과가 0.049 내지 .29 ug/ml 범위이었다. (도 13b 내지 f).
실시예 13: 누드 마우스에서 피하 성장된 Hep 3B 모델에서 ZF9-MQ1의 생체내 효능.
이 실시예는 ZF9-MQ1을 이용한 처리가 암컷 누드 마우스에서 확립된 Hep 3B 종양의 성장을 억제하였음을 입증한다.
Hep 3B 종양 세포를 30마리의 암컷 누드 마우스의 좌측 옆구리에 이식하여 종양을 유도하였다. 종양 부피의 변화를 측정하였고 평균 종양 부피가 대략 100 내지 150 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 처리군 및 대조군으로 마우스를 나누었다. 대조군에 PBS 또는 소분자 비교자인 MYCi975을 주사하였다. 각 그룹의 마우스에 PBS를 종양내로(3회 용량에 대해 5일마다, 그 다음 2회 용량에 대해 IV로 전환함), ZF9-MQ1을 정맥내로(3 mg/kg으로 5일마다) 또는 MYCi975를 복강내로(5일/주에 대해 매일 1회) 주사하였다. 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 각 그룹에 대한 종양 부피의 변화를 주당 3회 측정하였다. 22일의 과정에 걸쳐, 기준선 및 평균 종양 부피로부터 체중의 변화를 대응표본 T-검정(Paired T-test)을 사용하여 측정하였고 이를 플롯팅하였다(도 14a 내지 b).
결과는 ZF9-MQ1이 PBS 대조군 처리 마우스와 비교할 때 (6일째부터 앞으로) 종양 성장을 상당히 감소시킬 수 있었음을 나타낸다. ZF9-MQ1은 소분자 비교자(MYCi975)보다 종양 성장을 더 감소시켰다(도 14a). 추가적으로 마지막 투약 48시간 IHC 염색 후 ZF9-MQ1 폴리펩타이드의 발현, MYC 발현의 감소, 및 Ki67에 의해 측정된 증식의 감소를 나타내었다(데이터는 나타내지 않음). ZF9-MQ1이 전체 동물 체중에 대해 최소한의 영향을 미쳤다(도 14b).
실시예 14: Fox Chase CB17 SCID마우스에서 동소적으로 성장한 Hep 3B 모델에서 ZF9-MQ1 + ZF3-KRAB 의 생체내 효능.
이 마우스는 암컷 Fox Chase CB17 SCID 마우스의 동소 Hep3B-luc 모델에서, 투약 후 이중-시스트론 ZF9-MQ1 + ZF3-KRAB의 장기 항-종양 효능 및 지속성을 입증한다.
Hep-3B-luc 세포를 SCID 마우스의 간의 좌상엽에 주사하였다. 무작위화에서 각 그룹에 대한 평균 복면도 전신 종양-연관 생물발광(tumor-associated bioluminescence; TABL)은 약 2.8x109 p/s이었다. PBS 및 ZF9-MQ1+ZF3-KRAB을 이용한 처리를 위해 각 12마리의 마우스로 구성된 2개 그룹 및 세포 이식 후 7일째 소라페닙을 이용한 처리를 위해 6마리 마우스로 구성된 하나의 그룹으로 마우스를 무작위로 할당하였다. 종양 세포 이식 후 8일째에 처리를 시작하였다(그래프에서 투약 1일로 표시함). 마우스를 PBS를 이용하여 정맥내로(4회 용량에 대해 5일마다, 그 다음 2회 용량에 대해 3일마다), LNP(MC3) ZF9-MQ1 + ZF3-KRAB를 이용하여 정맥내로(2회 용량에 대해 5일마다 1.5 mg/kg, 3회 용량에 대해 5일마다 3 mg/kg, 1회 용량에 대해 3일마다 3 mg/kg), 소라페닙을 이용하여 경구로(메일 50 mg/kg) 처리하였다. 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 매주 2회 생물발광에 의해 종양 크기를 측정하였다.
결과는 ZF9-MQ1 + ZF3-KRAB를 이용한 처리가 PBS 대조군 처리 마우스와 비교할 때 (21일째부터 앞으로) 종양 성장을 상당히 감소시켰음을 나타낸다. 종양 성장을 감소시킨 ZF9-MQ1 + ZF3-KRAB는 소라페닙과 비슷하였다(도 15a). ZF9-MQ1 + ZF3-KRAB를 이용한 처리가 전체 동물 체중에 대해 최소한의 영향을 미쳤다(도 15b).
실시예 15: 누드 마우스에서 피하 성장된 Hep 3B 모델에서 ZF9-MQ1 및 공제형화된 ZF9-MQ1 + ZF3-KRAB의 생체내 효능.
이 실시예는 ZF9-MQ1 및 공제형화된 ZF9-MQ1 + ZF3-KRAB가 암컷 누드 마우스에서 용량-의존적 방식으로 Hep 3B 종양의 성장을 억제할 수 있었음을 입증한다.
Hep 3B 종양 세포를 72마리의 암컷 누드 마우스의 좌측 옆구리에 이식하여 종양을 유도하였다. 종양 부피의 변화를 측정하였고 평균 종양 부피가 대략 200 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 9개의 처리군(각각 8마리 마우스)으로 마우스를 나누었다. 각 그룹의 마우스에 PBS(3회 용량에 대해 5일마다, 그 다음 3회 용량에 대해 3일마다), 1 mg/kg 및 3 mg/kg의 ZF9-MQ1(3회 용량에 대해 5일마다, 그 다음 3회 용량에 대해 3일마다), 1 mg/kg 및 3 mg/kg의 공제형화된 ZF9-MQ1 + ZF3-KRAB(3회 용량에 대해 5일마다, 그 다음 3회 용량에 대해 3일마다), 1 mg/kg 및 3 mg/kg의 음성 대조군 mRNA(3회 용량마다 5일마다, 그 다음 3회 용량에 대해 3일마다)를 이용하여 정맥내로, 100 mg/kg의 MYCi975를 이용하여 복강내로(주당 5일동안 1일 1회) 또는 1 mg/kg의 시스플라틴을 이용하여 복강내로(15일마다 1회) 주사하였다. 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 종양 부피의 변화를 주당 3회 측정하였다.
결과는 1 mg/kg의 ZF9-MQ1 개별 및 ZF9-MQ1과 ZF3-KRAB의 조합물이 음성 대조군 처리 마우스와 비교하여 종양 성장을 감소시킬 수 있었음을 나타낸다(도 16a). 또한, 3 mg/kg의 ZF9-MQ1 개별(13일째부터 앞으로) 및 ZF9-MQ1 + ZF3-KRAB의 공제형의 조합물(6일째부터 앞으로)이 음성 대조군 처리 마우스와 비교할 때 종양 성장을 상당히 감소시킬 수 있었음을 나타낸다(도 16b). 공제형ghk ZF9-MQ1 +/ ZF3-KRAB는 1mg/kg 및 3 mg/kg 투약량 둘 다에서 시스플라틴 또는 소분자 비교자(MYCi975)보다 유사하거나 더 높은 수준으로 종양 성장을 감소시킬 수 있었다. 공제형화 ZF9-MQ1 +/- ZF3-KRAB는 1 mg/kg 및 3 mg/kg 투약량 둘 다에서 시스플라틴 및 MYCi975 둘 다와 비교하여 전체 동물 체중에 대해 최소한의 영향을 미쳤다(도 16c 내지 d).
실시예 16: MYC 절연 게놈 도메인(insulated genomic domain; IGD)으로 표적화된 DNA 메틸트랜스퍼라제와 징크 핑거 도메인의 조합물은 MYC 발현을 하향조절하고 다양한 폐암 세포주에서 세포 생존능을 감소시킨다
이 실시예는 NSCLC 세포주(A549, NCI-H2009, NCI-H358HCC95)에서 징크-핑거 도메인에 융합된 MQ1 이펙터를 MYC 프로모터에 대해 표적화함으로써(ZF9-MQ1) Myc1 mRNA 발현을 하향조절하는 것은 다수의 폐암 세포주에 걸쳐 세포 생존능의 손실을 초래함을 입증한다.
폐암 세포주에서 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1을, 비처리 세포 및 녹색-형광 단백질(GFP)로 형질감염 세포를 포함하는 음성 대조군과 함께 전달하였다. ZF9-MQ1 또는 GFP를 인코딩하는 mRNA를 상기 실시예 12 및 14에 기재된 바와 같이 SSOP LNP 전달을 사용하여 전달하였다. 성장 배지에서 96-웰 플레이트에 폐암 세포를 시딩하였다(약 10000개 세포/웰). 그 다음 LNP 제형(1 ug/ml)을 세포에 첨가하여 mRNA를 형질감염시킨 다음 72시간 및 120시간 동안 각각 인큐베이션하였다. 상이한 복제물 플레이트를 생존능 및 mRNA 발현의 변화를 결정하기 위해 수집하였다.
제조업체의 프로토콜에 따라 Promega의 CellTiter-GLO® 분석 키트를 사용하여 생존능을 측정하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플을 보정물로서 사용하였다.
이 데이터는 ZF9-MQ1이 4개의 폐암 세포주에서 MYC mRNA 수준을 80% 초과로 감소시킬 수 있고 이는 4개의 세포주 전체에 걸쳐 폐암 세포 생존능의 상당한 손실과 일치하였음을 나타내었다(도 17a 내지 h).
실시예 17: ZF9-MQ1은 NSCLC 세포주 NCI-H2009에서 세포 아폽토시스를 유도한다
이 실시예는 폐암 세포의 세포 아폽토시스에 대한 ZF9-MQ1의 효과를 입증한다.
Cell Titer GLO(실시예 16에서 사용됨)와 같은 생존능 분석은 ATP의 수준을 기준으로 웰에 남아 있는 세포의 상대적인 수를 결정함으로써 생존능을 측정한다. 이 분석은 세포 증식 손실과 상이한 유형의 세포 사멸(예를 들어, 괴사 대 아폽토시스)을 구별하지 않는다.
ANNEXIN V 단백질 및 프로피디움 요오다이드(PI) 핵 염색에 대한 형광 태깅된 항체를 ZF9-MQ1로 형질감염시킨 후 아폽토시스 세포를 정량화하는 데 이용하였다. 이펙터 단백질이 없는 ZF9 징크 핑거 도메인(ZF9-NE)을 인코딩하는 mRNA를 비처리 세포에 추가하여 음성 대조군으로 사용하였다. 폐 세포주 line NCI-H2009를 성장 배지에서 12 웰 플레이트에 도말하였다(웰당 50,000개 세포). 그 다음 mRNA가 있는 LNP 제형(1 ug/ml)을 세포에 첨가하여 ZF9-MQ1 또는 ZF9-NE mRNA를 형질감염시킨 다음 96시간 동안 인큐베이션하였다. 세포를 수확하고 BD Annexin V: FITC 아폽토시스 검출 키트(BDB556570)를 사용하여 염색한 다음 유세포 분석에 의해 분석하였다. Annexin V-FITC 및 PI에 대해 양성인 세포를 아폽토시스로 분류하였다.
이 데이터는 음성 대조군(ZF9-NE로 처리된 세포 및 비처리 세포)에서 96시간 후 단지 18%의 세포만 아폽토시스되었음을 나타내었다(도 18a 내지 b, 18d). 대조적으로, 40%의 세포는 ZF9-MQ1로 처리된 NCI-H2009 배양물에서 아폽토시스되었다(도 18c 내지 d). 이는 ZF9-MQ1이 폐암 세포의 세포 아폽토시스를 유도할 수 있음을 나타낸다.
실시예 18: 추가의 NSCLC 세포주에서 ZF9-MQ1에 대한 생존력 및 MYC 발현의 용량 반응 곡선.
이 실시예는 ZF9-MQ1이 용량 반응 방식으로 NSCLC 세포주에서 MYC1 발현 및 세포 생존능을 하향조절함을 입증한다.
MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1이 2가지 NSCLC 세포주, 즉 A549 및 HCC95에서 다수 농도로 투약되었다. 비처리 세포를 음성 대조군으로 사용하였다. SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA를 전달하였다. 성장 배지에서 96-웰 플레이트에 폐암 세포를 시딩하였다(약 10000개 세포/웰). 그 다음 LNP 제형(5 ug/ml에서 시작함)을 각각 3개 웰에 첨가한 다음 후속 웰에서 10회 용량에 대해 약 1:2로 희석하여 mRNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 상이한 복제물 플레이트를 생존능 및 mRNA 발현의 변화를 결정하기 위해 수집하였다.
제조업체의 프로토콜에 따라 Promega의 CellTiter-GLO® 분석 키트를 사용하여 생존능을 측정하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플 및 dCas9(이펙터 없음) 샘플을 보정물로서 사용하였다.
데이터는 ZF9-MQ1이 0.08 ug/ml LNP/mRNA의 EC50로 MYC를 하향조절하며, A549 및 HCC95 둘 다에서 72시간째에 시험관내 생존능(2 ug/ml)에 대해 약 25배 더 높은 EC50 효과를 갖는다는 것을 나타내었다(도 19a 내지 b).
실시예 19: ZF9-MQ1은 NSCLC 세포주 NCI-H2009에서 MYC 단백질 수준을 80% 초과로 감소시킨다
이 실시예는 면역블롯팅 기법을 통해 ZF9-MQ1 처리에 대한 반응으로 MYC 단백질 수준의 변경을 입증한다.
폐암 세포주에서 MYC 프로모터에 결합하고 이를 표적화하도록 설계된 ZF9-MQ1을, 음성 대조군인 ZF9-NE 및 비처리 세포와 함께 전달하였다. 폐 세포주 NCI-H2009를 성장 배지에서 12 웰 플레이트에 도말하였다(웰당 50,000개 세포). 그 다음 LNP 제형(1 ug/ml)을 세포에 첨가하여 ZF9-MQ1 또는 ZF9-NE mRNA를 형질감염시킨 다음 96시간 동안 인큐베이션하였다. 그 다음 세포를 RIPA 완충액에서 용해시키고 Pierce BCA 단백질 분석(23225)을 사용하여 단백질 수준을 정량화하였다. 동일한 양의 단백질을 각 샘플에 대해 로딩하고, NuPAGETM 미니 겔 시스템(Thermo Fisher)을 사용하여 크기별로 분리하였다. 그 다음 단백질을 iBlot™ 2 겔 전달 장치(Thermo Fisher)를 사용하여 PVDF 막으로 옮겼다. ABCAM 항-MYC 항체(ab32072)를 이용하여 막을 밤새 프로빙하였다. Cell Signaling 항-ACTIN 항체(8H10D10)를 로딩 대조군으로 사용하였다. 그 다음 MYC 및 ACTIN 항체 종에 대한 형광 2차 항체를 사용하는 LI-COR 영상화 시스템을 사용하여 신호를 시각화하고 정량화하였다.
데이터는 ZF9-MQ1 처리가 mRNA 발현 수준의 감소와 비슷하게(실시예 17) 폐암 세포주에서 처리 96시간 후 MYC 단백질 수준을 80% 초과로 감소시킴을 나타내었다(도 20a 내지 b).
실시예 20: 누드 마우스에서 피하 성장된 NCI-H2009 모델에서 ZF9-MQ1의 생체내 효능.
이 실시예는 ZF9-MQ1이 암컷 누드 마우스에서 확립된 NCI-H2009 종양의 성장을 억제함을 입증한다.
암컷 누드 마우스에서 좌측 옆구리에 NCI-H2009 종양 세포를 이식함으로써 질환을 유도하였다. 평균 종양 부피가 대략 100 내지 150 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 처리군으로 마우스를 나누었다. MC3 LNP로 mRNA를 전달하였다. 마우스에 ZF9-MQ1 또는 MC3 LNP의 비-암호화 mRNA를 3 mg/kg으로 또는 PBS를 정맥내로 주사하였다(4회 용량에 대해 5일마다 1회, 그 다음 3회 용량에 대해 3일마다 1회; 마우스에게 총 7회 용량을 제공함). 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 매주 3회 종양 크기를 측정하였다.
결과는 ZF9-MQ1이 PBS 대조군 처리 마우스와 비교할 때 (8일째부터 앞으로) 종양 성장을 상당히 감소시킬 수 있었음을 나타내었다(도 21). ZF9-MQ1이 전체 동물 체중에 대해 최소한의 영향을 미쳤다.
실시예 21: MYC IGD 슈퍼-인핸서에 대해 (dCas9를 통해) 표적화된 전사 리프레서 및 가이드 RNA의 조합물은 SSOP LNP를 사용하여 MYC 발현을 하향조절한다
이 실시예는 MYC mRNA 발현이 A549 세포에서 MYC 발현을 조절하는 폐 특이적 슈퍼-인핸서가 KRAB 이펙터 단백질에 의해 표적화될 때 하향조절됨을 입증한다.
가이드 RNA(표 13)를 폐 슈퍼-인핸서 영역 전체에 걸쳐 설계하였고 효소적으로 사멸된 CAS9에 접합된 KRAB 리프레서 단백질과 조합하여 테스트하였다. 음성 대조군으로서 GFP의 mRNA 전달과 함께 SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 가이드 RNA를 공동 전달하였다. 성장 배지에서 96-웰 플레이트에 NCSLC 세포주 A549를 시딩하였다(약 10000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml)을 세포에 첨가하여 이펙터 mRNA/가이드 RNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플을 보정물로서 사용하였다.
[표 13]
이 데이터는 dCAS9-KRAB 이펙터 mRNA와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 하향조절할 수 있었음을 나타내었으며, 이는 이러한 원위 조절 요소를 사용하여 종양발생 MYC를 삼소시키는 능력을 강조한다(도 22).
실시예 22: MYC IGD 슈퍼-인핸서에 대해 표적화된 전사 리프레서(dCas9) 및 가이드 RNA의 조합물은 MC3 LNP를 사용하여 MYC 발현을 하향조절한다
이 실시예는 대안적인 지질 MC3(대 실시예 21의 SSOP)을 이용하여 MYC 발현을 조절하는 폐 특이적 슈퍼-인핸서에 대해 KRAB 이펙터 단백질을 표적화함으로써 MYC mRNA 발현을 하향조절함을 설명한다.
가이드 RNA(표 13)를 폐 슈퍼-인핸서 영역 전체에 걸쳐 설계하였고 효소적으로 사멸된 CAS9에 접합된 KRAB 리프레서 단백질과 조합하여 테스트하였다. 음성 대조군으로서 GFP의 mRNA 전달과 함께 MC3를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 가이드 RNA를 공동 전달하였다. 성장 배지에서 96-웰 플레이트에 NCSLC 세포주 A549를 시딩하였다(약 10000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml)을 세포에 첨가하여 이펙터 mRNA/가이드 RNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플을 보정물로서 사용하였다.
이 데이터는 dCAS9-KRAB 이펙터 mRNA와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 하향조절할 수 있었음을 나타내었으며, 이는 이러한 원위 조절 요소를 사용하여 종양발생 MYC를 삼소시키는 능력을 강조한다(도 23). 이 효과는 SSOP(실시예 21) 및 MP3 지질 형질감염(실시예 22) 둘 다에 의해 나타났다.
실시예 23: MYC IGD 슈퍼-인핸서에 대해 표적화된 전사 리프레서(dCas9) 및 가이드 RNA의 조합물은 NSCLC에서 MYC 발현을 하향조절한다
이 실시예는 MYC 발현을 조절하는 폐 특이적 슈퍼-인핸서에 대해 다양한 전사 이펙터 단백질(EZH2, EZH2-KRAB, 또는 MQ1)을 표적화함으로써 MYC mRNA 발현을 하향조절함을 설명한다.
MYC 슈퍼-인핸서에 대해 표적화된 가이드 RNA(GD-29833 및 GD-29914)를 히스톤 메틸트랜스퍼라제 EZH2(단독 또는 KRAB와 조합하여) 및 효소적으로 사멸된 CAS9에 접합된 DNA 메틸트랜스퍼라제 MQ1을 포함하여 리프레서 단백질과 조합하여 테스트하였다. 음성 대조군으로서 GFP의 mRNA 전달과 함께 SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 가이드 RNA를 공동 전달하였다. 성장 배지에서 96-웰 플레이트에 NCSLC 세포주 A549 또는 NCI-H2009를 시딩하였다(약 10000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml)을 세포에 첨가하여 이펙터 mRNA/가이드 RNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플을 보정물로서 사용하였다.
이 데이터는 2가지 상이한 NSCLC 세포주(A549 및 NCI-H2009)에서 테스트된 3가지 이펙터 단백질(EZH2, EZH2-KRAB, 및 MQ1) 모두와 함께 전달될 때 가이드 RNA GD-29833 및 29914가 MYC mRNA 수준을 효과적으로 하향조절할 수 있었음을 나타낸다(도 24a 내지 b).
실시예 24: MYC IGD 슈퍼-인핸서에 대해 표적화된 전사 리프레서(dCas9) 및 가이드 RNA의 조합물은 120시간째에 NSCLC에서 MYC 발현을 추가로 하향조절한다
이 실시예는 폐암 세포주(A549 및 NCI-H2009)에서 KRAB 또는 MQ1 이펙터 단백질과 함께 슈퍼-인핸서 표적화된 가이드로 형질감염시킨 후 120시간째에 MYC mRNA 발현의 증가된 감소가 관찰됨을 입증한다.
MYC 슈퍼-인핸서에 대해 표적화된 가이드 RNA를 KRAB 리프레서 단백질 또는 MQ1 DNA 메틸트랜스퍼라제와 조합하여 테스트하였다. 음성 대조군으로서 GFP의 mRNA 전달과 함께 SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 가이드 RNA를 공동 전달하였다. 성장 배지에서 12 웰 플레이트에 NCSLC 세포주 A549 또는 NCI-H2009를 시딩하였다(약 50000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml)을 세포에 첨가하여 이펙터 mRNA/가이드 RNA를 형질감염시킨 다음 120시간 동안 인큐베이션하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 참조 유전자의 발현에 대비하여 MYC 발현을 정량화하였고, 비처리된 샘플을 보정물로서 사용하였다.
이 데이터는 KRAB 또는 MQ1과 함께 전달되는 가이드 RNA GD-29833 및 29914가 120시간째에 2개의 NSCLC 세포주(A549 및 NCI-H2009)에서 MYC mRNA 수준을 상당히 하향조절할 수 있었음을 나타낸다(도 25a 내지 b). 또한, 관찰된 하향조절은 NCI-H2009에서 ZF9-MQ1 처리에 의해 관찰된 하향조절과 비슷하다(도 25b).
실시예 25: dCAS9-MQ1을 MYC 슈퍼-인핸서로 유도하면 슈퍼-인핸서 표적 부위 및 MYC 프로모터 영역에서 DNA 메틸화가 증가한다.
이 실시예는 dCas9-MQ1이 MYC 슈퍼-인핸서로 유도되어 표적 부위 및 MYC 프로모터 영역의 메틸화를 초래함을 입증한다.
CRISPR-dCas9 시스템을 후성유전학적 리프레서: MQ1에 테더링함으로써 CRISPR-dCas9 시스템을 변형시켰다. 이 분자는 DNA의 CpG 뉴클레오타이드를 메틸화함으로써 전사 억제를 조절한다. 음성 대조군으로서 GFP 또는 dCAS9-이펙터 없음 작제물(dCas9-NE)의 mRNA 전달과 함께 SSOP를 이용한 LNP 전달을 사용하여 이펙터 mRNA 및 슈퍼-인핸서 가이드 RNA(29833 및 29914)를 공동 전달하였다. NCSLC 세포주 line NCI-H2009를 성장 배지에서 6 웰 플레이트에 시딩하였다(약 100000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml)을 세포에 첨가하여 이펙터 mRNA/가이드 RNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. Lucigen QuickExtract™DNA 추출 키트를 사용하여 DNA를 단리하였고 프로모터 및 슈퍼-인핸서 영역의 표적화된 중아황산염 서열분석을 사용하여 메틸화된 영역을 결정하였다.
이 연구는 dCas9-MQ1이 NSCLC에서 표적 부위 메틸화를 60%만큼 증가시키고 또한 원위 프로모터 영역으로 메틸화를 유도하였음(약 50%까지 증가함)을 입증하였다(도 26a 내지 b).
실시예 26: MYC IGD 슈퍼-인핸서에 대해 표적화된 전사 리프레서("사멸" CAS9를 통함) 및 가이드 RNA의 조합물은 NSCLC 세포주 NCI-H2009에서 MYC 단백질 수준을 감소시킨다
이 실시예는 면역블롯팅 기법을 통해 NSCLC 세포에서 MYC 슈퍼-인핸서에 대해 가이드 RNA를 표적화함으로써 MYC 단백질의 수준 변경을 입증한다.
폐암 세포주에서 MYC 슈퍼-인핸서에 결합하고 이를 표적화하도록 설계된 GD-29833을 dCAS9-KRAB 또는 dCAS9-MQ1 이펙터 mRNA와 함께 공동 전달하였다. 폐 세포주 line NCI-H2009를 성장 배지에서 12 웰 플레이트에 도말하였다(웰당 50,000개 세포). 그 다음 LNP 제형(1 ug/ml)을 세포에 첨가하여 가이드 및 이펙터 mRNA를 형질감염시킨 다음 96시간 동안 인큐베이션하였다. dCAS9-이펙터 없음(dCAS9-NE) 작제물을 음성 대조군으로 사용하였다. 그 다음 세포를 RIPA 완충액에서 용해시키고 Pierce BCA 단백질 분석(23225)을 사용하여 단백질 수준을 정량화하였다. 동일한 양의 단백질을 각 샘플에 대해 로딩하고, NuPAGETM 미니 겔 시스템(Thermo Fisher)을 사용하여 크기별로 분리하였다. 그 다음 단백질을 Invitrogen iBlot™2 겔 전달 장치(Thermo Fisher)를 사용하여 PVDF 막으로 옮겼다. ABCAM 항-MYC 항체(ab32072)를 이용하여 막을 밤새 프로빙하였다. Cell Signaling 항-ACTIN 항체(8H10D10)를 로딩 대조군으로 사용하였다. 그 다음 MYC 및 ACTIN 항체 종에 대한 형광 2차 항체를 사용하는 LI-COR 영상화 시스템을 사용하여 신호를 시각화하고 정량화하였다.
이 데이터는 전사 리프레서를 갖는 MYC 폐 슈퍼-인핸서로 가이드를 유도하는 것이 mRNA 발현 수준의 감소와 비슷하게(실시예 16) NCI-H2009 폐암 세포주에서 96시간째에 MYC 단백질 수준을 최대 50%까지 감소시킨다는 것을 나타내었다(도 27a 내지 b).
실시예 27: 전체 세포 용해물에서 ZF9-MQ1 단백질 존재가 Hep3B 세포주에서 MYC 단백질의 하향조절과 상관관계가 있다
이 실시예는 ZF9-MQ1로 처리 후 Hep 3B 세포에서 시간 경과에 따른 ZF9-MQ1 및 MYC 단백질 발현 수준의 변화를 결정하는 것을 설명한다.
ZF9-MQ1 및 MYC 단백질 발현 수준을 ZF9-MQ1 처리 후 6, 16 및 48시간째에 평가하였으며(웨스턴 블롯), 처리 개시 24시간 후에 LNP를 제거하고 배지를 교체하였다. RIPA 완충액을 사용하여 단백질을 추출하고 BCA 분석(Thermo Fisher)을 사용하여 총 단백질을 정량화하였다. 총 단백질을 NuPAGETM Bis-Tris Gels(Thermo Fisher), MOPS 실행 완충액에서 실행하고 iBlot™2 Gel Transfer Device(Thermo Fisher)를 사용하여 옮겼다.
MYC 웨스턴: β-액틴 항체를 594 nm 파장에서 방출하는 형광단으로 태깅된 2차 항체로 염색하였고 MYC 항체(Abcam)를 488 nm의 파장에서 방출하는 형광단으로 태깅된 2차 항체로 염색하였다. 근적외선(NIR) 형광을 사용하는 Odyssey® CLx Imaging System(LI-COR)을 사용하여 LI-COR 소프트웨어를 통해 정량화에 사용된 단백질 이미지를 캡처하였다. 각 MYC 및 ACTIN 밴드에 대한 곡선 하 면적(AUC)을 배경 영역을 차감한 다음, 모두 각 시점에 대해 음성 대조군에 대해 정규화하였다.
ZF9-MQ1(헤마글루티닌 [HA] 에피토프로 태깅된 컨트롤러) 웨스턴: β-액틴 항체를 594 nm 파장에서 방출하는 형광단 태그를 갖는 2차 항체로 염색하였고 HA 항체를 488 nm의 파장에서 방출하는 형광단 태그를 갖는 2차 항체로 염색하였다. NIR 형광을 사용하는 Odyssey® CLx Imaging System(LI-COR)을 사용하여 LI-COR 소프트웨어를 통해 정량화에 사용된 단백질 이미지를 캡처하였다. 각 HA 및 ACTIN 밴드에 대한 AUC를 배경 영역을 차감한 다음, 모두 각 시점에 대해 음성 대조군에 대해 정규화하였다.
데이터는 ZF9-MQ1 단백질 존재 및 MYC 단백질 발현 수준이 둘 다 ZF9-MQ1로 세포를 처리한 후 전체 세포 용해물에서 감소되고(도 28 a 내지 b) 전체 세포 용해물에서 ZF9-MQ1 단백질 존재가 MYC 단백질의 하향조절과 상관관계가 있음(도 28c)을 나타낸다.
실시예 28: MYC 발현 및 메틸화 상태의 감소 기간
본 실험은 ZF9-MQ1으로의 처리 후 MYC 발현의 감소 지속성을 평가한다. 추가적으로, 이 실험은 표적 유전자좌에서 MYC 발현화 DNA 메틸화 증가의 상관관계를 입증하고 평가한다.
생존력에 대한 최소한의 변화를 나타내었지만 40 내지 50% MYC 하향조절(실시예 4)을 나타낸 SKHEP-1 세포주를 이용하여 반응의 지속성을 평가하였다. SK-HEP-1을 LNP / ZF9-MQ1 또는 ZF-이펙터 없음(음성 대조군)으로 형질감염시킨 다음, 처리 24시간 후 새로운 배지로 교체하였다. 지정된 시점에서 mRNA 및 게놈 DNA의 추출을 위해 세포를 수집하였다(Qiagen RNA/DNA 키트). MYC mRNA를 평가하기 위해, 전체 세포 RNA를 처리하여 상보적 DNA(cDNA)(폴리-A 프라이머를 사용함)를 만든 다음, 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. 표적화된 유전자좌에서 메틸화 상태를 평가하기 위해, 표적화된 중아황산염 게놈 서열분석을 사용하여 단일 DNA 염기쌍 분해능에서 5-메틸시토신을 측정하였다.
3일째에, MYC mRNA는 음성 대조군(ZF-이펙터 없음) 및 비처리 세포와 비교하여 89%만큼 감소되었다(나타내지 않음). mRNA 발현의 하향조절은 서서히 증가되었으며, MYC 전사체에서 45% 하향조절이 15일째에 유지되었다(도 29a). 추가적으로, ZF9-MQ1의 발현은 MYC 프로모터 영역으로의 새로운 CpG 메틸화를 지시하였다. MYC 전사 변화는 15일째까지의 메틸화 백분율과 상관관계가 있었다(도 29b).
실시예 29: 1차 간세포에서 이중-시스트론 ZF9-MQ1_ ZF3-KRAB를 이용한 C-MYC 발현 및 세포 생존능
이 실시예는 1차 간세포에서 MYC mRNA 및 생존능에 대한 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 효과를 평가한다.
냉동보존된 1차 인간 간세포(Lonza)를 해동하고 예열된 해동 배지에 첨가한 다음 24시간부터 도말하였다. 세포를 도말 배지에 재현탁시키고 계수하여 명시된 농도(106개 세포/mL)로 제조하였다 그 다음 오십(50) uL의 세포 용액을 96-웰 플레이트(추가 50 uL의 도말 배지 포함)에 100 uL의 총 부피로 첨가하고 밤새 인큐베이션하였다. LNP 제형화 mRNA(GFP, ZF-NE, ZF9-MQ1, ZF3-KRAB, ZF9-MQ1+ ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB)을 0.6μg/ml, 1.25 μg/ml, 및 2.5 μg/ml의 농도로 100 μL의 추가 배지에 있는 세포에 첨가하였다. 세포를 72시간 동안 인큐베이션하고, 유지 배지 교체는 6시간째부터 시작하여 그 후 매일 수행하였다. MYC mRNA 발현 수준(RT-PCR) 및 세포 생존능(CellTiter-GLO®)을 처리 72시간 후에 평가하였다.
ZF9-MQ1, ZF9-MQ1 + ZF3-KRAB, 또는 이중-시스트론 ZF9-MQ1_ZF3-KRAB으로 처리된 1차 간세포는 GFP, ZF-NE 또는 ZF3-KRAB와 비교할 때 MYC mRNA 발현의 감소를 나타내었다(도 30a). 전체적으로, 처리는 생존능에 대해 최소한의 영향을 나타내었으며, 이는 HCC 세포주와 비교할 때 MYC 발현의 감소가 정상 세포에 덜 중요하다는 것을 나타낸다(도 30b).
또 다른 실험에서, 냉동보존된 PHH를 예열한 간세포 해동 배지로 해동하였고 실온에서 100 g로 8분 동안 회전하였다. 세포 펠렛을 간세포 도말 배지에서 재현탁시켰다. 그 다음 세포를 계수하고, 기준 생존능을 측정하였다. 세포 희석액을 준비하고, 50,000개 세포를 2중으로 96-웰 플레이트에 도말하였다. 세포를 밤새 인큐베이션하였다. 다음 날 도말 배지를 완전히 제거하고 예열된 간세포 배양 배지를 첨가하였다. 세포를 이중-시스트론 ZF9-MQ1_ZF3-KRAB, ZF9-MQ1, ZF3-KRAB, ZF9-NE 또는 대조군 GFP mRNA로 2.0, 1.0, 또는 0.5 μg/mL에서 3중으로 처리하고 6시간 동안 인큐베이션하였다. 그 다음 처리 배지를 제거하고 200 μL의 신선한 간세포 배양 배지로 교체하였다. 형질감염 후 추가 66시간 동안 세포를 인큐베이션하였다(총 72시간). 처리 후 1개의 플레이트를 CellTiter-GLO® 시약으로 용해시키고, Glo Max Discovery Plate Reader를 사용하여 발광을 정량화하였다. 흡인에 의해 세포의 제2 플레이트로부터 배지를 제거하고 세포를 RLT Plus Lysis 완충액으로 용해시켰다. 제조업체의 지침에 따라 Rneasy® Plus 96 Kit를 사용하여 mRNA 추출을 수행하였다. 추출 후 mRNA를 LunaScript® RT SuperMix Kit(NEB)를 사용하여 cDNA로 전환하였다. MYC(표적) 및 GAPDH(참조) 프로브를 이용하여 ΔΔCT qPCR을 통해 cDNA를 분석하였다.
이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리된 PHH는 대조군과 비교할 때 MYC mRNA의 감소를 나타내었다(도 30c). ZF9-MQ1(모든 용량) 및 ZF3-KRAB(2 μg/mL)는 세포 생존능에 최소한의 영향을 미치면서 MYC mRNA를 하향조절하였다(도 30d). ZF9-NE는 MYC mRNA 또는 생존능에 영향을 미치지 않았다(도 30c 내지 d). 전체적으로, 이중-시스트론 ZF9-MQ1_ZF3-KRAB 처리는 생존능에 대해 최소한의 영향을 나타내었으며, 이는 정상 세포에서 MYC 발현의 감소가 세포 생존능에 영향을 미치지 않았다는 것을 입증한다(도 30a 내지 d).
실시예 30: 누드 마우스에서 피하 성장된 ZF9-MQ1+ZF3-KRAB 모델에서 ZF9-MQ1의 생체내 효능.
이 실시예는 ZF9-MQ1+ZF3-KRAB가 암컷 누드 마우스에서 확립된 NCI-H2009 종양의 성장을 억제함을 입증한다.
암컷 누드 마우스에서 좌측 옆구리에 NCI-H2009 종양 세포를 이식함으로써 질환을 유도하였다. 평균 종양 부피가 대략 100 내지 150 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 처리군으로 마우스를 나누었다. MC3 LNP로 mRNA를 전달하였다. 마우스에 ZF9-MQ1+ZF3-KRAB를 3 mg/kg으로 5일마다, 또는 MC3 LNP의 비-코딩 mRNA를 3 mg/kg으로 5일마다 또는 시스플라틴을 1 mg/kg IP로 15일마다, 또는 PBS를 5일마다 주사하였다.
결과는 ZF9-MQ1+ZF3-KRAB로의 처리가 3회 투여 후 종양 크기의 통계적으로 유의한 감소를 나타내었으며, 대조군과 비교하여 25일째에 종양 부피를 63% 감소를 초래하고(도 31a), 처리된 마우스의 체중에 대해서는 유의한 효과가 없음을 나타내었다(도 31b). 이 연구에서, ZF9-MQ1+ZF3-KRAB 처리는 종양 부피에 대하여 시스플라틴으로의 처리에 대해 동등한 효과와 연관이 있었다(도 31a).
실시예 31: Fox Chase CB17 SCID마우스에서 동소적으로 성장한 Hep 3B 모델에서 ZF9-MQ1 + ZF3-KRAB 공제형의 생체내 효능.
이 마우스는 암컷 Fox Chase CB17 SCID 마우스의 동소 Hep3B-luc 모델에서, 투약 후 ZF9-MQ1 + ZF3-KRAB 공제형의 장기 항-종양 효능 및 지속성을 입증한다.
Hep-3B-luc 세포를 SCID 마우스의 간의 좌상엽에 주사하였다. 무작위화에서 각 그룹에 대한 평균 복면도 전신 종양-연관 생물발광(TABL)은 약 2.8x109 p/s이었다. PBS, ZF9-MQ1+ZF3-KRAB(더 높은 용량, 즉 6 mg/kg), ZF9-MQ1+ZF3-KRAB(중간 용량, 즉 3 mg/kg), ZF9-MQ1+ZF3-KRAB(낮은 량, 즉 3 mg/kg)를 이용한 처리를 위해 각 12마리의 마우스로 구성된 4개 그룹 및 세포 이식 후 7일째 소라페닙을 이용한 처리를 위해 6마리 마우스로 구성된 하나의 그룹으로 마우스를 무작위로 할당하였다. 종양 세포 이식 후 8일째에 처리를 시작하였다(그래프에서 투약 1일로 표시함). 마우스를 PBS(4회 용량에 대해 5일마다, 그 다음 2회 용량에 대해 3일마다), LNP(MC3) ZF9-MQ1 + ZF3-KRAB(5일마다 1.5 mg/kg)를 이용하여 정맥내로, LNP(MC3) ZF9-MQ1 + ZF3-KRAB를 이용하여 정맥내로(5일마다 3 mg/kg), LNP(MC3) ZF9-MQ1 + ZF3-KRAB를 이용하여 정맥내로(5일마다 6 mg/kg), 및 소라페닙을 이용하여 경구로(매일 50 mg/kg) 처리하였다. 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 매주 2회 생물발광에 의해 종양 크기를 측정하였다.
결과는 ZF9-MQ1 + ZF3-KRAB를 이용한 처리가 2회 투여 후 종양 크기의 상당한 억제와 연관이 있음을 나타내었다. 1.5 mg/kg 용량으로의 처리는 음성 대조군과 비교하여 23일째까지 종양 성장의 약 63% 억제를 초래하였고, 3 mg/kg으로의 처리는 음성 대조군과 비교하여 23일째까지 종양 성장의 약 54% 억제를 초래하였다(도 32a). 유사하게, 6 mg/kg의 ZF9-MQ1 + ZF3-KRAB로의 처리는 2회 투여 후 종양 크기의 통계적으로 유의한 감소와 연관되었으며, 음성 대조군과 비교하여 23일째에 종양 부피의 63% 감소를 초래하였다(도 32a). 3 mg/kg의 ZF9-MQ1 + ZF3-KRAB로의 처리는 소라페닙으로의 처리와 동등하였다(도 32a). ZF9-MQ1 + ZF3-KRAB로 처리된 마우스는 체중의 상당한 감소를 경험하지 않았음을 나타낸다(도 32b). 소라페닙으로 처리된 마우스는 처음에 체중 감소를 경험하였고 이후에 종양 덩어리의 증가로 인해 잠재적으로 전체 체중이 증가하였다(도 32b). 이 데이터는 ZF9-MQ1 + ZF3-KRAB로의 처리가 이 연구에서 잘 용인되었음을 제안하였다.
실시예 32: ZF9-MQ1 및 ZF3-KRAB를 인코딩하는 이중-시스트론 mRNA는 MYC 발현 및 세포 생존능을 감소시킨다
이 실시예는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB의 효능을 단일 작제물 ZF3-KRAB와 ZF9-MQ1, 및 ZF3-KRAB와 ZF9-MQ1의 공제형과 비교한다. 이들 작제물을 지질 나노입자(LNP)에 캡슐화된 mRNA를 통해 간세포 암종 세포로 전달한다.
LNP에 각각의 mRNA를 캡슐화함으로써 ZF9-MQ1, ZF3-KRAB, 이중-시스트론 ZF9-MQ1_ZF3-KRAB, 및 공제형화 ZF9-MQ1과 ZF3-KRAB 작제물을 제조하였다. 96웰 플레이트에서 웰당 10,000개 세포를 시딩함으로써 Hep 3B 세포를 형질감염시키고 0.6 μg/mL 및 2 μg/mL mRNA / LNP로 추가로 처리하였다.
MYC mRNA 및 세포 생존능을 형질감염 48시간 후에 분석하였다. 제조업체의 프로토콜에 따라 Promega의 CellTiter-GLO® 분석 키트를 사용하여 생존능을 측정하였다. 제조업체의 프로토콜에 따라 RNeasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 유전자의 발현에 대비하여 MYC 발현을 정량화하였다(TaqManTM 프라이머/프로브를 사용함). 비처리 세포를 사용하여 MYC의 발현을 정규화하였다.
이들 데이터는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB가 단일 작제물(ZF3-KRAB 또는 ZF9-MQ1) 단독보다 더 큰 정도로 Hep 3B 세포에서 MYC mRNA및 세포 생존능을 하향조절하였음을 나타낸다(도 33a 내지 33b). 이중-시스트론 ZF9-MQ1_ ZF3-KRAB는 0.6 μg/ml 및 2 μg/ml 농도 둘 다에서 48시간째에 총 MYC mRNA 수준을 99%만큼 감소시켰다(도 33a). 이중-시스트론 ZF9-MQ1_ ZF3-KRAB는 2 μg/ml 및 0.6 μg/ml 농도 둘 다에서 Hep3B 세포의 생존능을 각각 약 80% 및 27%만큼 감소시켰다(도 33b). 또한, 이중-시스트론 작제물로의 처리는 ZF3-KRAB와 ZF9-MQ1 작제물의 공제형과 동등하게 효과적이었다.
실시예 33: 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 HCC 하위유형 전체에 걸쳐 용량 의존적 방식으로 MYC mRNA 및 HCC 세포 생존능을 감소시킨다
이 실시예는 HCC 하위유형 S1 및 S2 전체에 걸쳐 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 효능을 평가한다. HCC S1 하위유형 세포주 SKHEP-1, SNU-449와 SNU-182 및 S2 하위유형 세포주 Hep 3B와 Hep G2를 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리하였다. 본 발명자들은 72시간 처리 후 연속적으로 희석된 농도에서 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB 의 MYC mRNA 및 세포 생존능을 평가하였다.
성장 배지에서 96-웰 플레이트에 HCC 세포를 시딩하였다(약 10,000개 세포/웰). 그 다음 LNP 제형(2.5 ug/ml에서 시작함)을 각각 3개 웰에 첨가한 다음 후속 웰에서 10회 용량 포인트에 대해 약 1:2로 희석하여 mRNA를 형질감염시킨 다음 72시간 동안 인큐베이션하였다. 상이한 복제물 플레이트를 생존능 및 RNA에 대해 수집하였다. 제조업체의 프로토콜에 따라 Promega의 CellTiter-GLO® 분석 키트를 사용하여 생존능을 측정하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 유전자의 발현에 대비하여 MYC 발현을 정량화하였다(TaqManTM 프라이머/프로브를 사용함). 비처리 세포를 사용하여 MYC의 발현을 정규화하였다.
결과는 이중-시스트론 ZF9-MQ1_ZF3-KRAB 처리가 HCC 하위유형 전체에 걸쳐 세포 생존능에 대한 효과를 나타내었음을 지시한다(도 34a 내지 c). MYC mRNA의 억제에 대한 EC50 값은 1 내지 20 ng/mL의 범위이며 S1 및 S2 하위유형 사이에 경향은 없다(도 34d). 유사하게, 50% 세포 생존능의 손실은 MYC mRNA와 비교하여 더 높은 범위의 값(120 내지 200 ng/mL)으로 변환되었다. MYC mRNA 발현 또는 세포 생존능에서 S1과 S2 하위유형 사이에 유의한 차이는 없었다. 3가지 S1 및 2가지 S2 하위유형 HCC 종양 세포주에 대한 EC50 값은, 이중-시스트론 ZF9-MQ1_ZF3-KRAB가 HCC 하위유형 둘 다에 대해 효과적이었음을 입증하였다(도 34d).
실시예 34: 이중-시스트론 ZF9-MQ1_ZF3-KRAB에 의한 HCC 세포의 아폽토시스 유도
이 실시예는 HCC 세포의 세포 아폽토시스에 대한 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 효과를 설명한다. CellTiter-GLO®와 같은 생존능 분석은 세포 증식 손실과 세포 사멸을 구분하지 않고 ATP의 수준을 기준으로 웰에 남아 있는 세포의 상대적인 수만을 평가한다.
이 실시예에서, Annexin V 단백질(Annexin V FITC) 및 프로피디움 요오다이드(PI)에 대한 형광으로 태깅된 항체를 사용하여 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 형질감염시킨 후 3가지 HCC 세포주, 즉 Hep 3B, Hep G2, 및 SK-HEP-1에서 아폽토시스 세포를 정량화하였다. 비-코딩 mRNA를 비처리 세포에 추가하여 음성 대조군으로 사용하였다. 성장 배지에서 12 웰 플레이트에 HCC 세포를 도말하였다(웰당 50,000개 세포). 그 다음 LNP 제형(1 μg/ml)을 세포에 첨가하여 mRNA를 형질감염시키고 48시간 동안 각각 인큐베이션하였다. 세포를 수확하고 BD Annexin V: FITC 아폽토시스 검출 키트(BDB556570)를 사용하여 염색한 다음 유세포 분석에 의해 분석하였다. Annexin V FITC 및 PI에 대해 양성인 세포를 아폽토시스로 분류하였다.
이들 데이터는 이중-시스트론 F9-MQ1_ZF3-KRAB로 처리한 후 48시간째에 75% 초과의 아폽토시스 세포가 Hep 3B 및 Hep G2 세포주에서 검출되었고 15% 아폽토시스 세포가 SK-HEP-1 세포주에서 검출되었음을 나타내었다(도 35). 세포는 비처리 세포(5 내지 20% 배경 아폽토시스)와 비교하여 비-코딩 mRNA 대조군에 의해 영향을 받지 않았으며, 이는 이중-시스트론 ZF9-MQ1_ZF3-KRAB가 배양물에서 HCC 세포주의 세포 아폽토시스를 유도할 수 있었음을 나타낸다.
실시예 35: 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 지속 가능한 방식으로 MYC mRNA 수준을 감소시킨다
이 실시예에서, MYC mRNA 하향조절에 대한 이중 시스트론 ZF9-MQ1_ZF3-KRAB의 지속성을 이중-시스트론 ZF9-MQ1_ZF3-KRAB SSOP LNP의 1회 처리 후에 평가하였다.. 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 메틸화 및 억제 히스톤 마크를 MYC IGD로 유도함으로써 MYC를 억제한다. 이러한 변형이 효과적일 수 있는 기간을 결정하기 위해, SK-HEP-1 세포를 이용하였는데 이는 이들 세포가 이중-시스트론 ZF9-MQ1_ZF3-KRAB를 이용한 처리 후 세포 생존능에 대하여 최소한의 영향을 나타내었기 때문이다. 이 연구의 목적은 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 1회 처리가 MYC mRNA 억제를 약 2주 동안 유지할 수 있는지를 결정하는 것이었다.
2 mL의 성장 배지에서 웰당 200,000개 세포로 6웰 플레이트에 SK-HEP-1 세포를 도말하였다. 그 다음 세포를 0.6 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB 또는 대조군 비-코딩 mRNA LNP로 처리하였다. 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 처리 후 1일째, 세포를 트립신화하고 3개의 샘플, 즉 RNA 추출을 위한 1개 샘플, 게놈 DNA(gDNA) 추출을 위한 1개 샘플, 향후 시점을 위해 저장된 1개 샘플로 분할하였다. 이 과정을 처리 후 3, 6, 9, 및 12일째에 대해 반복하였다. 15일째에 대해, 남은 세포를 RNA 및 gDNA 추출을 위해 동일하게 분할하였다. 제조업체의 프로토콜에 따라 Rneasy® Plus 96-웰 키트(Qiagen)를 사용하여, 3개의 생물학적 복제물로부터 RNA를 단리하였다. LunaScript® RT SuperMix Kit(NEB)를 사용하여 RNA 샘플을 cDNA로 역전사시키고 TaqManTM Fast Advanced Master Mix(Thermo Fisher Scientific)와 함께 MYC 특이적 TaqManTM 프라이머/프로브 세트 분석을 사용하여 정량적 PCR(qPCR)(기술적으로 3중으로)에 의해 분석하였다. ΔΔCt 방법을 사용하여 GAPDH 유전자의 발현에 대비하여 MYC 발현을 정량화하였다(TaqManTM 프라이머/프로브를 사용함). 비처리된 세포를 사용하여 MYC의 발현을 정규화하였다.
이 데이터는 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 지속성이 MYC 유전자 발현 조절을 매개하였음을 입증하였다. SKHEP1 세포에서 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 1회 처리 후, MYC mRNA 수준이 1일째에 감소되었고 처리 후 최대 15일까지 억제된 상태를 유지하였다(도 36).
실시예 36: 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 HCC 세포주에서 MYC mRNA 및 단백질 발현 및 세포 생존능을 감소시킨다
다수 HCC 세포에서 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 약력학을 이해하기 위해 HCC 세포에서 MYC mRNA 및 단백질 수준의 발현, 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 세포 생존능, 및 발현을 이중-시스트론 ZF9-MQ1_ZF3-KRAB로의 처리 96시간 후에 평가하였다.
Hep 3B 또는 SK-HEP-1 세포를 각각의 시점에 대해 배양 배지에서 웰당 10,000개 세포로 2개의 96-웰 플레이트 및 웰당 400,000개 세포로 6-웰 플레이트의 세트에 도말하였다. 96-웰 플레이트를 세포 생존능 및 mRNA 분석에 대해 1 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB 또는 비-코딩 mRNA로 3중으로 처리하였다. 6-웰 플레이트를 단백질 분석에 대해 1 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB 또는 비-코딩 mRNA로 2중으로 처리하였다. 처리 후 6, 24, 48, 72, 또는 96시간 동안 세포를 인큐베이션하고, 각 시점에서 세포의 하위집합을 비처리 음성 대조군으로 남겨 두었다. 각 시점에서, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GLOMAX®를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT LunaScript®를 이용하여 cDNA로 전환하였다. 그 다음 MYC(표적) 및 GAPDH(참조) 프로브를 이용하여 ΔΔCT qPCR을 통해 cDNA를 분석하였다. 6-웰 플레이트로부터의 세포를 각 시점에 단백질 단리를 위해 RIPA 완충액으로 용해하였다. Pierce BCA 단백질 분석(23225)을 사용하여 총 단백질을 정량화하였다. 동일한 양의 단백질을 각 샘플에 대해 로딩하고, NuPAGETM 미니 겔 시스템(Thermo Fisher)을 사용하여 크기별로 분리하였다. 그 다음 단백질을 iBlot™2 겔 전달 장치(Thermo Fisher)를 사용하여 PVDF 막으로 옮겼다. 항-MYC 항체(Abcam ab32072)를 이용하여 막을 밤새 프로빙하였다. 항-β-액틴 항체(Cell Signaling 8H10D10)를 로딩 대조군으로 사용하였다. 그 다음 MYC 및 β-항체 1차 항체에 대한 형광 2차 항체를 사용하는 LI-COR 영상화 시스템을 사용하여 신호를 시각화하고 정량화하였다.
2가지 세포주 모두에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB가 짧은 비-코딩 mRNA 또는 비처리된 세포와 비교할 때 6시간째에 MYC mRNA 및 단백질 발현을 감소시켰으며, 96시간 후에 감소된 상태를 유지하였음을 나타낸다(도 37). 2가지 세포주 둘 다에서, 세포 생존능의 감소가 이중-시스트론 ZF9-MQ1_ZF3-KRAB를 이용한 처리 48시간 후에 관찰되었다(도 37). 짧은 비-코딩 음성 대조군은 세포 생존능에 대해 영향을 미치지 않았다.
실시예 37: 이중-시스트론 ZF9-MQ1_ZF3-KRAB mRNA는 HA 태깅된 단백질에 의해 시각화된 바와 같이 ZF9-MQ1 및 ZF3-KRAB를 둘 다 발현한다
이 실시예에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB mRNA / LNP에 의해 인코딩된 단백질의 발현을 웨스턴 블롯 분석을 통해 확인하였다. 세포 내부에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB는, 이 실험에서 HA로 태깅된 2개의 ZF 단백질(ZF3-KRAB 및 ZF9-MQ1)을 생산하여, HCC 세포의 형질감염 후 단백질 발현의 정량화를 가능하게 한다.
Hep 3B 또는 SK-HEP-1 세포를 각각의 시점에 대해 배양 배지에서 웰당 400,000개 세포로 6-웰 플레이트의 세트에 도말하였다. 6-웰 플레이트를 단백질 분석에 대해 1 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB로 2중으로 처리하였다. 세포를 6 또는 24시간 동안 인큐베이션하였다. 그 다음 세포를 RIPA 완충액에서 용해시키고 Pierce BCA 단백질 분석(23225)을 사용하여 총 단백질 수준을 정량화하였다. 동일한 양의 단백질을 각 샘플에 대해 로딩하고, NuPAGETM 미니 겔 시스템(Thermo Fisher)을 사용하여 크기별로 분리하였다. 그 다음 단백질을 iBlot™2 겔 전달 장치(Thermo Fisher)를 사용하여 PVDF 막으로 옮겼다. Abcam HA 항체를 이용하여 막을 밤새 프로빙하였다. 항-β-액틴 항체(Cell Signaling 8H10D10)를 로딩 대조군으로 사용하였다. MYC 및 β-액틴 항체에 대한 형광 2차 항체를 사용하는 LI-COR 영상화 시스템을 사용하여 신호를 시각화하고 정량화하였다.
형질감염 후 6 및 24시간째 둘 다에서, 이중-시스트론 ZF9-MQ1_ZF3-KRAB mRNA에 의해 인코딩된 ZF3-KRAB 및 ZF9-MQ1 단백질 둘 다를 웨스턴 블롯 상의 HA 태그에 의해 시각화하였음을 나타낸다(도 38). ZF3-KRAB 및 ZF9-MQ1 작제물 둘 다의 축척은 두 시점 모두에서 관찰되었다.
실시예 38: 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 HCC 세포에서 소라페닙 반응을 증가시킨다
이 실시예에서, HCC 세포주에서 소분자 소라페닙(다중-키나제 억제제) 효능에 대한 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 효능을 평가하였다. 소라페닙을 HCC에서 표준 치료(standard of care)로 사용하고 높은 MYC 수준으로 소라페닙 내성을 예측할 수 있다. 이중-시스트론 ZF9-MQ1_ZF3-KRAB가 MYC의 하향조절을 통해 HCC를 소라페닙에 대해 재감작시킬 수 있다는 가설을 세웠다. 용량 반응 분석을 이용하여 이중-시스트론 ZF9-MQ1_ZF3-KRAB 처리가 소라페닙의 IC50을 감소시킬 수 있는지를 평가하하였다.
이중-시스트론 ZF9-MQ1_ZF3-KRAB과 소라페닙 사이의 잠재적인 시너지 효과를 평가하기 위하여, 웰당 10,000개 세포로 96 웰 플레이트에 Hep 3B 또는 SK-HEP-1 세포를 도말하였다. 그 다음 세포를 0.1 내지 25 μM의 용량 범위에서 1:2의 연속 희석으로 소라페닙으로 처리하였다. 그 다음 이중-시스트론 ZF9-MQ1_ZF3-KRAB를 보유하는 지질 혼합물을 0.1 또는 0.6 μg/mL의 용량으로 웰의 하위집합에 첨가하였다. 한 세트의 세포를 소라페닙 단독으로 처리하여 대조군으로 사용하였다. 72시간 처리 후, 세포를 CellTiter-GLO® 시약으로 용해하고 Glo Max를 사용하여 발광을 정량화하였다. 비처리 값을 평균화하고 각 실험의 루시퍼라제 값을 평균으로 나눔으로써 상대적인 세포 생존능을 계산하였다.
소라페닙 IC 50 에 대한 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 효과
Hep3B SKHEP-1
이중-시스트론 ZF9-MQ1_ZF3-KRAB 농도 소라페닙 IC50 이중-시스트론 ZF9-MQ1_ZF3-KRAB 농도 소라페닙 IC50
0 μg/ml 4.4 μM 0 μg/ml 12.3 μM
0.1 μg/ml 4.25 μM 0.1 μg/ml 12.3 μM
0.6 μg/ml 2.9 μM 0.6 μg/ml 10.7 μM
데이터는 0.6 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 소라페닙을 투여하였을 때 SKHEP1에서 소라페닙의 IC50은 12.3 μM에서 10.7 μM로 감소하였고(도 39a 및 표 19) Hep 3B에서 소라페닙의 IC50은 4.4 μM에서 2.9 μM로 감소되었음(도 39b 및 표 19)을 나타내었다. 소라페닙이 0.1 μg/ml 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 조합하여 투여될 때 소라페닙의 IC50은 Hep 3B 또는 SK-HEP-1 세포에서 별로 변하지 않았다(도 39a 내지 39b). 소라페닙과 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 조합물은 소라페닙 단독보다 더 효과적이었다(도 39a 내지 39b). 이 데이터는 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 소라페닙 사이의 상승효과 활성을 제안하였다.
실시예 39: 이중-시스트론 ZF9-MQ1_ZF3-KRAB는 HCC 세포에서 JQ1 반응을 증가시킨다
이 실시예는 다수의 HCC 세포주에서 JQ1(BET 억제제)과 조합한 이중-시스트론 ZF9-MQ1_ZF3-KRAB 의 효능을 평가한다. BET 단백질은 MYC 전사에 중요한 것으로 나타났다. 후기 세대 BET 억제제는 현재 임상에서 혈액학적 적응증에 대해 평가되고 있지만; 이들의 독성 프로파일은 사용을 제한하였다. 감소된 용량 수준으로 BET 억제제의 효능을 증가시킬 수 있는 조합 치료는 BET 억제제 내약성을 개선시킬 수 있었다.
이중-시스트론 ZF9-MQ1_ZF3-KRAB과 JQ1 사이의 잠재적인 시너지 효과를 평가하기 위하여, 웰당 10,000개 세포로 96 웰 플레이트에 Hep 3B 또는 SK-HEP-1 세포를 도말하였다. 그 다음 세포를 0.1 내지 25 μM의 용량 범위에서 1:2의 연속 희석으로 JQ1로 처리하였다. 그 다음 이중-시스트론 ZF9-MQ1_ZF3-KRAB를 보유하는 지질 혼합물을 0.1 또는 0.6 μg/mL의 용량으로 웰의 집합에 첨가하였다. 한 세트의 세포를 JQ1 단독으로 처리하여 대조군으로 사용하였다. 72시간 처리 후, 세포를 CellTiter-GLO® 시약으로 용해하고 Glo Max를 사용하여 발광을 정량화하였다. 비처리 값을 평균화하고 각 실험의 루시퍼라제 값을 평균으로 나눔으로써 상대적인 세포 생존능을 계산하였다.
JQ1 IC50에 대한 이중-시스트론 ZF9-MQ1_ZF3-KRAB의 효과
Hep3B SKHEP-1
이중-시스트론 ZF9-MQ1_ZF3-KRAB 농도 JQ1 IC50 이중-시스트론 ZF9-MQ1_ZF3-KRAB 농도 JQ1 IC50
0 μg/ml 6.6 μM 0 μg/ml >25 μM
0.1 μg/ml 0.6 μM 0.1 μg/ml 1.9 μM
0.6 μg/ml 0.2 μM 0.6 μg/ml 1.1 μM
0.6 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 JQ1의 조합물이 SK-HEP1에서 JQ1의 IC50을 25 μM에서 1.1 μM로 감소시켰고(도 40a 및 표 20) Hep 3B에서 JQ1의 IC50을 6.6 μM에서 0.2 μM로 감소시켰다(도 40b 및 표 20). 0.1 μg/mL의 이중-시스트론 ZF9-MQ1_ZF3-KRAB와 JQ1의 조합물이 SK-HEP1에서 JQ1의 IC50을 25 μM에서 1.9 μM로 감소시켰고(도 40a 및 표 20) Hep 3B에서 JQ1의 IC50을 6.6 μM에서 0.6 μM로 감소시켰다(도 40b 및 표 20). 이 데이터는 이중-시스트론 작제물 ZF9-MQ1_ ZF3-KRAB와 JQ1 사이의 상승효과 활성을 제안하였다.
실시예 40: MYC 게놈을 표적화하도록 설계된 마우스 대용 작제물의 스크리닝
이 실시예, 즉 간세포 암종인 Hepa1-6의 마우스 모델을 사용하여 마우스에서 MYC IGD를 표적화하는 작제물을 평가하였다. 이러한 작제물(ZF15-MQ1, ZF16-MQ1 및 ZF17-MQ1)을 마우스 게놈을 표적화하는 이중-시스트론 ZF9-MQ1_ZF3-KRAB에 대한 대용물로 개발하였다. 본 발명자들은 MYC mRNA 발현을 하향조절하고 마우스 HCC 세포 생존능을 감소시키는 이들 작제물의 능력을 평가하였다.
mRNA 추출 또는 세포 생존능 분석을 위해 2중 플레이트에 웰당 10,000개 세포를 시딩함으로써 마우스 대용 작제물(ZF15-MQ1, ZF16-MQ1 및 ZF17-MQ1)의 패널을 생성하고 Hepa1-6 세포에서 스크리닝하였다. 후보 ZF를 이용하여 0.6 또는 1.2 μg/mL로 96-웰 플레이트를 3중으로 처리하였다. 세포를 72시간 동안 인큐베이션하였다. 인큐베이션 기간 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT LunaScript®를 이용하여 cDNA로 전환하였다. 그 다음 MYC(표적) 및 GAPDH(참조) 프로브를 이용하여 ΔΔCT qPCR을 통해 cDNA를 분석하였다.
이 스크린은 ZF17-MQ1이 생존력 감소(도 41b)에 상응하는 마우스 MYC mRNA의 하향조절을 보였음(도 41a)을 나타내었다.
실시예 41: 세포 생존능 및 MYC mRNA 및 단백질 발현 HCC에 대한 마우스 대용 작제물 ZF17-MQ1의 효과
이 실시예에서, 간세포 암종인 Hepa1-6의 마우스 모델을 사용하여 MYC mRNA 및 단백질 발현 및 마우스 HCC 세포 생존능을 하향조절하는 ZF17-MQ1 작제물의 영향을 평가하였다.
MYC mRNA 및 세포 생존능을 ZF17-MQ1 또는 GFP mRNA를 이용한 처리 96시간 후에 분석하였다. mRNA 추출 또는 세포 생존능 분석을 위해 2중 플레이트에 웰당 10,000개 세포로 Hepa1-6 세포를 시딩하였다. ZF17-MQ1를 이용하여 0.6 또는 1.2 μg/mL로 96-웰 플레이트를 3중으로 처리하였다.
인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. RNeasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript를 이용하여 cDNA로 전환하였다. 그 다음 MYC(표적) 및 GAPDH(참조) 프로브를 이용하여 ΔΔCT qPCR을 통해 cDNA를 분석하였다.
12웰 플레이트에서 100,000개 세포를 ZF17-MQ1 또는 대조군 GFP mRNA로 형질감염시킴으로써 처리 24 및 48시간 후 MYC 단백질 수준을 분석하였다. 세포를 RIPA 완충액에서 용해시키고 Pierce BCA 단백질 분석(23225)을 사용하여 총 단백질 수준을 정량화하였다. 동일한 양의 단백질을 각 샘플에 대해 로딩하고, NuPAGETM 미니 겔 시스템(Thermo Fisher)을 사용하여 크기별로 분리하였다. 그 다음 단백질을 iBlot™겔 전달 장치(Thermo Fisher)를 사용하여 PVDF 막으로 옮겼다. 항-MYC 항체(Abcam ab32072)를 이용하여 막을 밤새 프로빙하였다. 항-β-액틴 항체(Cell Signaling 8H10D10)를 로딩 대조군으로 사용하였다. 그 다음 MYC 및 β-액틴 항체에 대한 형광 2차 항체를 사용하는 LI-COR 영상화 시스템을 사용하여 신호를 시각화하고 정량화하였다.
데이터는 ZF17-MQ1이 MYC IGD를 표적화함으로써 이중-시스트론 ZF9-MQ1_ZF3-KRAB에 대한 마우스 대용물로서 기능할 수 있음을 나타내었다. 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 24 및 48시간째에 MYC 단백질의 상당한 하향조절을 나타내었다(도 42a). 마우스 HCC 세포 Hepa1-6에서 ZF17-MQ1 처리가 96시간째에 MYC mRNA의 상당한 하향조절(도 42c) 및 96시간째에 세포 생존능의 감소(도 42d)을 나타내었다.
실시예 42: ZF17-MQ1의 효능을 나타내는 Hepa1-6 피하 동계 모델
이 실시예는 면역-적격 동물에서 ZF17-MQ1 효능을 입증한다. 구체적으로, Hepa1-6을 동계 수용자 C57BL/6 정상 마우스에 이식한다.
암컷 C57BL/6 마우스에서 좌측 옆구리에 Hepa1-6 종양 세포를 이식함으로써 질환을 유도하였다. 평균 종양 부피가 약 150 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 처리군(PBS 또는 ZF17-MQ1의 경우 각각 9마리 마우스, 소라페닙의 경우 6마리 마우스)으로 마우스를 나누었다. 마우스에 PBS 또는 ZF17-MQ1을 3 mg/kg으로 정맥내로 주사하였다. 양성 대조군인 표준 치료 약물 소라페닙을 50 mg/kg으로 경구 위관 영양법을 통해 매일 제공하였다. ZF17-MQ1을 4회 용량에 대해 5일마다 투약한 다음 2주간의 약물 휴지기가 주어졌으며, 치료가 2회 더 재개되었다. 모든 동물의 체중을 매일 측정하고 육안으로 평가하였다. 매주 3회 캘리퍼스를 통해 종양 크기를 측정하였다.
결과는 ZF17-MQ1이 4회 투약 후 동물 종양 부하를 상당히 감소시켰음을 나타내었다(도 43). 약물 휴지기 후, 마우스를 재처리하여 약 4주 후에 전체 종양 고갈을 초래하였다(도 43). 이러한 데이터는 ZF17-MQ1이 면역-적격 동물에서 수행된 HCC 이종이식에서 종양 부담을 효과적으로 감소시킬 수 있었음을 나타내었다.
실시예 43: HCC에 대한 잠재적인 신규 치료법으로서 MYC 종양유전자의 후성유전학적 조절
이 실시예는 MYC mRNA 및 세포 생존능을 측정함으로써 HCC 세포주(Hep 3B, Hep G2, SK-HEP-1, SNU-182 및 SNU-449)에서 이중-시스트론 ZF9-MQ1-ZF3-KRAB를 특성화하는 것을 설명한다.
MYC mRNA 및 세포 생존능을 측정함으로써 HCC 세포주(Hep 3B, Hep G2, SK-HEP-1, SNU-182 및 SNU-449)에서 이중-시스트론 ZF9-MQ1_ZF3KRAB 작제물을 특성화하였다. 이중-시스트론 ZF9-MQ1_ZF3KRAB를 지속 가능한 후성유전학적(예를 들어, DNA / 염색질 메틸화) 및 전사체(transcriptome)(예를 들어, RNA-seq) 변화에 대해 테스트하였다. 다양한 단백체학 방법을 사용하여 MYC 단백질 수준 및 경로 신호전달의 변화를 측정하였다. 마지막으로, 종양 부피, 종양-연관 생물발광(BLI) 및 면역조직화학(IHC)을 평가함으로써 피하(subQ) 및 동소성 HCC 모델에서 이중-시스트론 ZF9-MQ1_ZF3KRAB의 활성을 생체내에서 분석하였다.
본 발명자들은 MYC IGD의 여러 유전자좌를 표적화하고, 정상 세포를 아끼면서 HCC 세포에서 MYC mRNA, 단백질 및 세포 생존능을 감소시키는 데 효과적인 이중-시스트론 ZF9-MQ1_ZF3-KRAB를 포함하여 작제물을 확인하였다. HCC 세포에서, 이중-시스트론 ZF9-MQ1_ZF3KRAB 억제 EC50 중앙값은 MYC mRNA에 대해 0.001 ng/mL 미만이고 세포 생존능에 대해 120 ng/mL이다. 중요한 것은, 이중-시스트론 ZF9-MQ1_ZF3KRAB의 효과가 2주 초과 동안 지속되어 지속 가능한 MYC mRNA 억제를 제공하였다. 무흉선 누드 마우스의 Hep 3B subQ 모델에서 3 및 6 mg/kg Q5D의 LNP로 이중-시스트론 ZF9-MQ1_ZF3KRAB의 정맥내 전달은 음성 대조군과 비교하여 23일째까지 각각 54% 및 63%의 통계적으로 유의한 종양 성장 억제(TGI)를 나타내었다. 이중-시스트론 ZF9-MQ1_ZF3KRAB로 처리한 마우스는 음성 대조군 또는 소라페닙-처리 마우스와 비교하여 체중(BW)이 별로 감소하지 않았다. 이중-시스트론 ZF9-MQ1_ZF3KRAB 및 대조군 처리 종양의 IHC는 MYC와 증식 마커인 Ki67의 현저한 하향조절, 및 아폽토시스 마커인 카스파제 3의 상향조절을 나타내었다. Hep 3B 동소 모델에서 3 mg/kg 이중-시스트론 ZF9-MQ1_ZF3KRAB Q5D는 BW의 감소 없이 50 mg/kg QD에서 소라페닙에 대한 BLI의 비슷한 감소를 나타내었다.
실시예 44: LL2 세포에서 MYC 발현 및 세포 생존능에 대한 마우스 대용 작제물의 효과
실시예는 LL2 세포에서 MYC 발현 및 세포 생존능에 대한 마우스 대용 작제물(ZF15-MQ1, ZF16-MQ1, 및 ZF17-MQ1)의 효과를 평가하는 것에 관한 것이다.
mRNA 추출 또는 세포 생존능 분석을 위해 2중 플레이트에 웰당 5,000개 세포로 LL2 세포를 시딩하였다. 96-웰 플레이트를 0.625 μg/mL(mRNA 및 생존능 판독용) 및 1.25 μg/ml(mRNA 및 생존능 판독)로 ZF15-MQ1, ZF16-MQ1, 또는 ZF17-MQ1이 로딩된 LNP로 3중으로 처리하고, 인큐베이션하였다. 6 웰 플레이트를 웰당 200,000개 세포로 시딩하고 상기 작제물을 1.25 μg/ml(웨스턴 블롯 판독용)에서 상기 작제물로 형질감염시켰다. GFP 처리 세포를 음성 대조군으로 사용하였다. 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 마우스 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다. 웨스턴 블롯의 경우, β-액틴 항체를 594 nm 파장에서 방출하는 형광단으로 태깅된 2차 항체로 염색하였고 MYC 항체(Abcam)를 488 nm의 파장에서 방출하는 형광단으로 태깅된 2차 항체로 검출하였다. 근적외선(NIR) 형광을 사용하는 Odyssey® CLx Imaging System(LI-COR)을 사용하여 단백질 이미지를 캡처하였다.
데이터는 ZF17-MQ1로 처리된 세포가 비처리된 세포 또는 GFP-처리된 상태의 세포와 비교하여 LL2 세포에서 MYC 단백질 수준 감소를 나타내었음을 보였다(도 44a). 비처리된 세포에서 관찰된 수준과 비교하여, ZF17-MQ1 및 ZF16-MQ1이 LL2 세포에서 MYC mRNA 수준을 각각 99.9% 초과 또는 74%만큼 감소시켰다(도 44b). 또한, 3가지 작제물 모두 LL2 세포에서 비처리된 세포 및 GFP-처리된 세포보다 더 큰 정도로 세포 생존능을 감소시킬 수 있었다(도 44c). 비처리 세포와 비교하여, 작제물 ZF17-MQ1, ZF16-MQ1, 및 ZF15-MQ1은 LL2 세포에서 각각 최대 74%, 65%, 및 30%까지 생존능을 감소시켰다.
실시예 45: MYC 전사체는 ZF17-MQ1 처리 LL2 및 CT26 세포에서 하향조절된다
이 실시예는 CT26 및 LL2 세포에서 MYC mRNA 발현을 하향조절하고 세포 생존능을 감소시킴에 있어서 ZF17-MQ1 작제물의 효능 평가에 관한 것이다.
mRNA 추출 또는 세포 생존능 분석을 위해 2중 플레이트에 웰당 2,500개 세포로 CT26 및 LL2 세포를 시딩하였다. 1.25 μg/mL 및 2.5 μg/ml로 ZF17-MQ1를 이용하여 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 마우스 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 ZF17-MQ1이 LL2 및 CT26 세포에서 비처리된 세포 및 GFP-처리된 세포(음성 대조군)보다 더 큰 정도로 MYC mRNA를 하향조절하였고 세포 생존능을 감소시킴을 나타내었다. 비처리된 세포에서 관찰된 수준과 비교하여, 2.5 μg/mL에서 ZF17-MQ1은 LL2 및 CT26 세포에서 각각 93% 및 85%만큼 MYC mRNA 수준을 감소시켰다(도 45a). 또한, 비처리된 세포와 비교하여, 이러한 조건 하에, ZF17-MQ1은 LL2 및 CT26 세포에서 각각 87% 및 93%만큼 세포 생존능을 감소시켰다(도 45b).
실시예 46: MYC 전사체는 ZF17-MQ1 처리 LL2 및 CMT167 세포에서 하향조절된다
이 실시예는 CMT167 및 LL2 세포에서 MYC mRNA 발현을 하향조절하고 세포 생존능을 감소시킴에 있어서 ZF17-MQ1 작제물의 효능 평가에 관한 것이다.
mRNA 추출 또는 세포 생존능 분석을 위해 2중 플레이트에 웰당 5,000개 세포로 CMT167 및 LL2 세포를 시딩하였다. GFP, 비-코딩 RNA, 또는 ZF17-MQ1를 이용하여 1.0 μg/ml로 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 마우스 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 ZF17-MQ1이 CMT167 및 LL2 세포에서 비처리된 세포 및 GFP-처리된 세포(음성 대조군)보다 더 큰 정도로 MYC mRNA를 하향조절하였고 세포 생존능을 감소시킴을 나타내었다. 비처리된 세포에서 관찰된 수준과 비교하여, ZF17-MQ1은 CMT167 및 LL2 세포에서 각각 62% 및 73%만큼 MYC mRNA 수준을 감소시켰다(도 46). 또한, 비처리된 세포와 비교하여, 이러한 조건 하에, ZF17-MQ1은 CMT167 및 LL2 세포에서 각각 54% 및 57%만큼 세포 생존능을 감소시켰다(도 46).
실시예 47: ZF9-MQ1은 1차 세포 생존능에 거의 영향을 미치지 않음을 나타낸다
이 실시예는 1차 세포 생존능에 대한 ZF9-MQ1 작제물의 효과를 평가한다.
1차 소기도 상피 세포, 1차 엽 상피 세포, 및 1차 폐 섬유아세포를 세포 생존능 분석을 위해 2중 플레이트에 웰당 7,500개(1차 소기도 상피) 또는 5000개(1차 엽 상피 및 1차 폐 섬유아세포) 세포로 시딩하였다. GFP, 또는 ZF9-MQ1을 이용하여 1.0 μg/ml로 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다. Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 두 번째 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 1차 소기도 상피 세포, 1차 엽 상피 세포, 및 1차 폐 섬유아세포 각각의 무처리 세포와 비교하여 MYC mRNA 수준을 94%, 96%, 96% 수준만큼 하향조절하였음을 나타내었다(도 47). 그러나, 대조군 세포와 비교하여 생존율이 단지 16%, 9%, 및 22%만큼 감소되었으며, 이는 ZF9-MQ1이 H2009 암 세포에서 이전 발견과 달리 정상 폐 상피 또는 섬유아세포의 세포 생존력에 크지 않은 영향만을 미쳤음을 시사한다.
실시예 48: ZF9-MQ1과 JQ1의 공동 처리는 A549 생존능에 대한 부가적 효과보다 더 큰 효과를 나타내었다
이 실시예는다양한 농도의 JQ1 억제제와 함께 사용될 때 A549 cell 세포 생존능에 대한 ZF9-MQ1 작제물의 효과를 평가한다.
세포 생존능 분석을 위해 2중 플레이트에 웰당 4,000개 세포로 A549 세포를 시딩하였다. BET 억제제 JQ1의 농도 증가와 함께(최대 6.25 uM까지의 농도) 0.5 μg/mL 또는 1.0 μg/mL로 GFP 또는 ZF9-MQ1 로딩 LNP를 이용하여 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 72시간 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다.
데이터는 ZF9-MQ1 및 JQ1이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타내었다(도 48a). 조합될 때, ZF9-MQ1(0.5 또는 1 μg/ml) 및 JQ1(최대 6.25 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었음을 보였으며, 이는 ZF9-MQ1 및 JQ1 조합이 A549 세포에서 생존능을 억제하는 데 상승작용이 있음을 시사한다(도 48b 내지 48c).
실시예 49: ZF9-MQ1과 BET762의 공동 처리는 A549 생존능에 대한 부가적 효과보다 더 큰 효과를 나타내었다
이 실시예는다양한 농도의 BET762 억제제와 함께 사용될 때 A549 cell 세포 생존능에 대한 ZF9-MQ1 작제물의 효과를 평가한다.
세포 생존능 분석을 위해 2중 플레이트에 웰당 4,000개 세포로 A549 세포를 시딩하였다. BET 억제제 BET762의 농도 증가와 함께(최대 1.25 uM까지의 농도) 0.5 μg/mL 또는 1.0 μg/mL로 GFP 또는 ZF9-MQ1 로딩 LNP를 이용하여 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 72시간 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다.
데이터는 ZF9-MQ1 및 BET762이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타내었다(도 49a). 조합될 때, ZF9-MQ1(0.5 μg/ml) 및 BET762(0.5 μg/ml ZF9-MQ1 처리 세포의 경우 최대 1.25 uM까지의 농도, 그리고 1.0 μg/ml ZF9-MQ1 처리 세포의 경우 최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었음을 보인다(도 49b). 조합될 때, ZF9-MQ1(1.0 μg/ml) 및 BET762(최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었다(도 49c). 데이터는 ZF9-MQ1과 BET762 조합이 A549 세포에서 생존능을 억제하는 데 상승작용이 있음을 시사하였다(도 49b 내지 c).
실시예 50: ZF9-MQ1과 비라브레십의 공동 처리는 A549 생존능에 대한 부가적 효과보다 더 큰 효과를 나타내었다
이 실시예는다양한 농도의 BET 억제제인 비라브레십과 함께 사용될 때 A549 cell 세포 생존능에 대한 ZF9-MQ1 작제물의 효과를 평가한다.
세포 생존능 분석을 위해 2중 플레이트에 웰당 4,000개 세포로 A549 세포를 시딩하였다. BET 억제제 비라브레십의 농도 증가와 함께(0.5 μg/ml ZF9-MQ1 처리 세포의 경우 최대 0.6255 uM까지의 농도, 그리고 1.0 μg/ml ZF9-MQ1 처리 세포의 경우 최대 0.313 uM까지의 농도) 0.5 μg/mL 또는 1.0 μg/mL로 GFP 또는 ZF9-MQ1 로딩 LNP를 이용하여 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 72시간 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다.
데이터는 ZF9-MQ1 및 비라브레십이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타내었다(도 50a). 조합될 때, ZF9-MQ1(0.5 μg/ml) 및 비라브레십(최대 0.625 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었다(도 50b). 조합될 때, ZF9-MQ1(1.0 μg/ml) 및 비라브레십(최대 0.313 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었다(도 50c). 데이터는 ZF9-MQ1과 비라브레십 조합이 A549 세포에서 생존능을 억제하는 데 상승작용이 있음을 시사하였다(도 50b 내지 50c).
실시예 51: ZF9-MQ1과 트라메티닙의 공동 처리는 A549 생존능에 대한 부가적 효과보다 더 큰 효과를 나타내었다
이 실시예는 다양한 농도의 MEK 억제제인 트라메티닙과 함께 사용될 때 A549 cell 세포 생존능에 대한 ZF9-MQ1 작제물의 효과를 평가한다.
세포 생존능 분석을 위해 2중 플레이트에 웰당 4,000개 세포로 A549 세포를 시딩하였다. MEK 억제제인 트라메티닙의 농도 증가와 함께(최대 0.05 uM까지의 농도) 0.5 μg/mL 또는 1.0 μg/mL로 GFP 또는 ZF9-MQ1 로딩 LNP를 이용하여 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 72시간 인큐베이션 후, 하나의 96-웰 플레이트를 CellTiter-GLO®로 용해하고 GloMax® Discovery 플레이트 판독기를 사용하여 발광을 정량화하였다.
데이터는 ZF9-MQ1 및 트라메티닙이 각각 개별적으로 A549 세포의 세포 생존능을 억제하였음을 나타내었다(도 51a). 조합될 때, ZF9-MQ1(0.5 μg/ml) 및 트라메티닙(최대 0.05 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었다(도 51b). 조합될 때, ZF9-MQ1(1.0 μg/ml) 및 트라메티닙(최대 1.0 uM까지의 농도)이 개별 활성에 의해 예측된 것보다 A549 생존능의 억제에 대해 상가적 효과보다 더 큰 효과를 나타내었다(도 51c). 데이터는 ZF9-MQ1과 트라메티닙 조합이 A549 세포에서 생존능을 억제하는 데 상승작용이 있음을 시사하였다(도 51b 내지 51c).
실시예 52: 다수 세포주에서 ZF-KRAB 작제물을 표적화하는 슈퍼 인핸서 영역의 패널을 이용한 MYC 하향조절에 대한 연구
이 실시예는 H2009, H460, 및 H226 세포에서 MYC 하향조절에 대한 ZF9-MQ1 및 징크 핑거 작제물 ZF9-MQ1, ZF54-KRAB, ZF61-KRAB, ZF67-KRAB, 및 ZF68-KRAB를 표적화하는 슈퍼-인핸서 영역의 패널의 효과를 평가한다.
mRNA 분석을 위해 2중 플레이트에 웰당 5,000개 세포로 H2009 and H226 세포를 시딩하였다. GFP, ZF9-MQ1, ZF54-KRAB, ZF67-KRAB, 또는 ZF68-KRAB 로딩 LNP를 이용하여 1.0 μg/ml로 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비-코딩 RNA 로딩 LNP를 이용하여 1.0 μg/ml로 H226 세포를 또한 3중으로 처리하고 인큐베이션하였다. mRNA 분석을 위해 2중 플레이트에 웰당 5,000개 세포로 H460 세포를 시딩하였다. GFP, ZF9-MQ1, ZF61-KRAB, ZF67-KRAB, 또는 ZF68-KRAB 로딩 LNP를 이용하여 1.0 μg/ml로 96-웰 플레이트를 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 72시간 동안 인큐베이션한 후, 세포를 Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 ZF9-MQ1, ZF54-KRAB, ZF67-KRAB, 및 ZF68-KRAB가 비처리된 세포와 비교하여 MYC mRNA 수준을 H2009에서 적어도 42%만큼(도 52a) 및 H226 세포에서 적어도 27%만큼 하향조절하였음을 나타내었다(도 52b 내지 52c). 추가적으로, ZF9-MQ1, ZF61-KRAB, ZF67-KRAB, 및 ZF68-KRAB는 비처리 세포와 비교하여 MYC mRNA 수준을 H460 세포에서 적어도 26%만큼 하향조절하였다(도 52d).
실시예 53: ZF54-KRAB와 ZF9-MQ1의 공동 처리는 ZF9-MQ1 단독과 비교하여 MYC mRNA 수준을 추가로 감소시킨다
이 실시예는 H2009 세포에서 MYC 하향조절에 대한 ZF9-MQ1과 ZF54-KRAB의 조합 처리의 효과를 평가한다.
mRNA 분석을 위해 96 웰 플레이트에 웰당 5,000개 세포로 H2009 세포를 시딩하였다. ZF9-MQ1-로딩 LNP의 농도 증가와 함께 1.0 μg/mL 또는 2.0 μg/mL로 GFP, ZF9-MQ1 로딩 LNP를 이용하여 웰의 플레이트를 3중으로 처리하고 72시간 동안 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 인큐베이션한 후, 세포를 Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 테스트한 가장 높은 농도에서, ZF9-MQ1 및 ZF54-KRAB가 각각 개별적으로 비처리된 대조군 세포에 비해, H2009 세포에서 MYC mRNA를 각각 99% 또는 62%만큼 하향조절하였음을 나타내었다. 0.313 μg/mL 미만의 ZF9-MQ1이 1 또는 2 μg/mL ZF54-KRAB와 조합될 때, MYC mRNA가 단독 처리에 대해 관찰된 것보다 더 큰 정도로 하향조절되고, 이는 각 ZF9-MQ1 및 ZF54-KRAB가 시험관내에서 H2009 세포에서 MYC mRNA 수준의 하향조절에 기여하였음을 나타낸다(도 53).
실시예 54: ZF9-MQ1과 ZF54-KRAB의 1:1 조합은 최대 적어도 6일 동안 모든 시점에 대해 MYC 발현을 억제하였다
이 실시예는 H1299 세포에서 MYC 하향조절에 대한 ZF9-MQ1과 ZF54-KRAB의 조합 처리의 지속성을 평가한다.
mRNA 분석을 위해 96 웰 플레이트에 웰당 10,000개 세포로 H1299 세포를 시딩하였다. GFP, ZF54-KRAB, 또는 ZF9-MQ1+ ZF54-KRAB 로딩 LNP를 이용하여 1.0 μg/ml로 96-웰 플레이트의 웰을 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 형질감염 6시간, 1일, 2일, 3일, 또는 6일 후에 측정을 수행하였다. 인큐베이션 후, Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 하나의 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 ZF9-MQ1이 48시간까지 비처리된 대조군 세포에 비해 H1299 세포에서 MYC mRNA를 95%만큼 하향조절하였고 144시간째에 대조군 수준의 90%로 하향조절을 유지하였음을 나타내었다. ZF9-MQ1과 ZF54-KRAB의 조합은 48시간째에 MYC mRNA 수준을 98%까지 감소시켰고 144시간째에 대조군 수준의 93%로 하향조절을 유지하였다(도 54). 또한, 데이터는 ZF54-KRAB와 조합된 ZF9-MQ1 및 ZF9-MQ1이 H1299 세포에서 적어도 6일 동안 MYC mRNA 수준을 하향조절하였음을 나타내었다(도 54).
실시예 55: 이중-시스트론 ZF9-MQ1_ ZF54-KRAB는 ZF9-MQ1보다 이르게 MYC 수준을 억제한다
이 실시예는 ZF9-MQ1 및 ZF54-KRAB 단독과 비교하여 이중-시스트론 ZF9-MQ1_ZF54-KRAB 및 ZF54-KRAB_ZF9-MQ1의 효능을 평가한다.
mRNA 분석을 위해 96 웰 플레이트에 웰당 5,000개 세포로 H2009 세포를 시딩하였다. GFP, ZF9-MQ1, ZF54-KRAB, ZF9-MQ1_ZF54-KRAB 또는 ZF54-KRAB_ZF9-MQ1 로딩 LNP를 이용하여 0.5 μg/mL 또는 1.0 μg/mL로 96-웰 플레이트의 웰을 3중으로 처리하고 인큐베이션하였다. 비처리 세포 및 GFP 처리 세포를 대조군으로 사용하였다. 형질감염 24시간 및 48시간 후에 측정을 수행하였다. 인큐베이션 후, Rneasy® Plus 96 Kit를 사용하여 mRNA 추출에 대해 하나의 96-웰 플레이트를 RLT Plus Lysis 완충액을 이용하여 용해하였다. 용해된 샘플을 RNA 컬럼에 결합하고, 완충액으로 세척한 다음 용출하였다. 그 다음 mRNA를 RT Lunascript와 함께 폴리-A 프라이머를 사용하여 cDNA로 전환하였다. 그 다음 cDNA를 인간 MYC mRNA 전사체에 특이적인 TaqManTM 프로브(Thermo Fisher)를 사용하여 역전사 중합효소 연쇄 반응(RT-PCR) 분석에 사용하였다. GAPDH mRNA 전사체 수준을 그룹 전체에 걸친 정규화에 사용하였다.
데이터는 H2009 세포로의 도입 24시간 후, ZF9-MQ1 및 ZF54-KRAB가 비처리된 세포와 비교하여 MYC mRNA 수준을 각각 최개 83% 및 55%까지 하향조절하였음을 나타내었다. MYC mRNA 수준은 처리 48시간 후 비처리된 대조군의 96%에 대해 ZF9-MQ1-처리 세포에서 추가 13%만큼 추가로 감소된 반면, ZF54-KRAB는 MYC 수준을 추가로 하향조절하지 않았다. ZF9-MQ1_ZF54-KRAB 및 ZF54-KRAB_ZF9-MQ1로 처리된 세포에서 MYC mRNA 수준은 처리 후 24시간째에 대조군 세포의 각각 95% 및 96%로 감소되었다. 데이터는 이들 컨트롤러가 ZF9-MQ1보다 더 일찍 MYC mRNA 수준을 감소시켜 H2009 세포에서 24시간째에 ZF9-MQ1 처리된 세포와 비교하여 처리된 세포에서 더 높은 수준의 MYC 하향조절로 이어질 수 있었음을 나타내었다. (도 55).
실시예 56: H460 SQ 종양을 보유하는 마우스에서 종양 성장의 억제에 대한 ZF9-MQ1 처리의 효과
이 실시예는 ZF9-MQ1이 누드 마우스에서 확립된 피하 H460 종양의 성장을 억제함을 입증한다.
누드 마우스에서 좌측 옆구리에 피하 H460 종양 세포를 이식함으로써 질환을 유도하였다. 평균 종양 부피가 대략 100 내지 150 mm3에 도달했을 때 처리를 개시하였다. 각 그룹에서 평균 종양 부피가 대략 동일하도록 처리군으로 마우스를 나누었다. PBS(비히클), 소라페닙(표준 치료), MC3 LNP에 제형화된 비-코딩 RNA, 또는 MC3 LNP에 제형화된 ZF9-MQ1 mRNA로 종양을 처리하였다. PBS, 비-코딩 RNA(서열번호 198) LNP 및 ZF9-MQ1 LNP를 5일마다 투여하여 3 mg/kg으로 투약하였다. 소라페닙을 매일 50 mg/kg으로 투약하였다. 종양의 길이 및 너비를 매주 2회 측정하였다. 종양 부피를 (너비2 x 길이)/2로 계산하였다.
결과는 ZF9-MQ1 처리가 H460 피하 종양 모델에서 종양 성장을 억제함을 나타내었다. 연구 종료 시 평균 종양 부피는 PBS-처리, mRNA 음성 대조군-처리, 및 ZF09-MQ1-처리군에서 각각 1921 mm3, 1829 mm3, 및 702 mm3이었다. 소라페닙-처리 마우스에서 평균 종양 부피(752mm3)는 ZF9-MQ1-LNP 처리 마우스와 구별할 수 없었으며, 이는 ZF9-MQ1이 이 모델에서 표준 치료 작용제인 소라페닙과 유사하거나 더 나은 활성을 보였음을 나타낸다. 이러한 결과는 음성 대조군과 비교하여, ZF9-MQ1-로딩 LNP가 생체내 H460 피하 종양 모델에서 종양 성장을 억제하는 데 효과적임을 입증하였다(도 56).
균등물
본 발명이 이의 상세한 설명과 함께 기재되었지만, 전술한 설명은 예시하고자 하는 것이고, 첨부된 청구범위의 범주에 의해 규정되는 본 발명의 범주를 제한하고자 하는 것이 아님이 이해되어야 한다. 일부 양태, 이점, 및 변형이 하기 청구범위의 범주 내에 있다.
SEQUENCE LISTING <110> FLAGSHIP PIONEERING INNOVATIONS V, INC. <120> COMPOSITIONS AND METHODS FOR MODULATING MYC EXPRESSION <130> O2057-7029WO <140> <141> <150> 63/281,022 <151> 2021-11-18 <150> 63/212,991 <151> 2021-06-21 <150> 63/137,097 <151> 2021-01-13 <150> 63/125,833 <151> 2020-12-15 <160> 210 <170> PatentIn version 3.5 <210> 1 <211> 20 <212> DNA <213> Homo sapiens <400> 1 atgatctctg ctgccagtag 20 <210> 2 <211> 20 <212> DNA <213> Homo sapiens <400> 2 atcgcgcctg gatgtcaacg 20 <210> 3 <211> 20 <212> DNA <213> Homo sapiens <400> 3 attgtgcagt gcatcggatt 20 <210> 4 <211> 20 <212> DNA <213> Homo sapiens <400> 4 gtcaaacagt actgctacgg 20 <210> 5 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 5 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Arg Ser Asp Lys Leu Thr Glu His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Lys 35 40 45 Asn Ser Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg 65 70 75 80 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Thr Thr Gly Ala Leu Thr Glu His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg 145 150 155 160 Ala His Leu Glu Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val 180 185 190 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 6 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 6 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 35 40 45 Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val 65 70 75 80 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Thr Ser His Ser Leu Thr Glu His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn 145 150 155 160 Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr 180 185 190 Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 7 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 7 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg 35 40 45 Ala His Leu Glu Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val 65 70 75 80 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala 145 150 155 160 Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala 180 185 190 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 8 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 8 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser His Thr Gly His Leu Leu Glu His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr 35 40 45 Gly Asn Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr 65 70 75 80 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 145 150 155 160 Asp Lys Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Thr Asp Thr Leu Arg 180 185 190 Asp His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 9 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 9 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser His Thr Gly His Leu Leu Glu His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser 35 40 45 Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Asn Leu Val 65 70 75 80 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 145 150 155 160 Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile 180 185 190 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 10 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 10 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Asp Pro Gly Ala Leu Val Arg His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg 35 40 45 Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr 65 70 75 80 Asn His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro 145 150 155 160 Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val 180 185 190 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 11 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 11 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys 35 40 45 Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val 65 70 75 80 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Gln Ser Gly His Leu Thr Glu His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Lys 145 150 155 160 Asn Ser Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr 180 185 190 Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 12 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 12 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Arg Ser Asp Lys Leu Thr Glu His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Arg 35 40 45 Asp Glu Leu Asn Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr 65 70 75 80 Asn His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Lys 145 150 155 160 Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile 180 185 190 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 13 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 13 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Arg Ser Asp Asp Leu Val Arg His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu 35 40 45 Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr 65 70 75 80 Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg 145 150 155 160 Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg 180 185 190 Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 14 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 14 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser 35 40 45 Gly His Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg 65 70 75 80 Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Arg Asn Asp Thr Leu Thr Glu His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala 145 150 155 160 Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr His Leu Asp Leu Ile 180 185 190 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 15 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 15 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser His Thr Gly His Leu Leu Glu His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Lys 35 40 45 Lys Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala 65 70 75 80 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser 145 150 155 160 Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg 180 185 190 Val His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 16 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 16 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 35 40 45 Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg 65 70 75 80 Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Gln Ser Ser Asn Leu Val Arg His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 145 150 155 160 Asp Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg 180 185 190 Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 17 <211> 1367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 17 Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly 1 5 10 15 Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys 20 25 30 Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly 35 40 45 Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys 50 55 60 Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr 65 70 75 80 Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe 85 90 95 Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His 100 105 110 Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His 115 120 125 Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser 130 135 140 Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met 145 150 155 160 Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp 165 170 175 Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn 180 185 190 Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys 195 200 205 Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu 210 215 220 Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu 225 230 235 240 Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp 245 250 255 Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp 260 265 270 Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu 275 280 285 Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile 290 295 300 Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met 305 310 315 320 Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala 325 330 335 Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp 340 345 350 Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln 355 360 365 Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly 370 375 380 Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys 385 390 395 400 Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly 405 410 415 Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu 420 425 430 Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro 435 440 445 Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met 450 455 460 Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val 465 470 475 480 Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn 485 490 495 Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu 500 505 510 Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr 515 520 525 Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys 530 535 540 Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val 545 550 555 560 Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser 565 570 575 Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr 580 585 590 Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn 595 600 605 Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu 610 615 620 Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His 625 630 635 640 Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr 645 650 655 Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys 660 665 670 Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala 675 680 685 Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys 690 695 700 Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His 705 710 715 720 Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile 725 730 735 Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg 740 745 750 His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr 755 760 765 Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu 770 775 780 Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val 785 790 795 800 Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln 805 810 815 Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu 820 825 830 Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys Asp 835 840 845 Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg Gly 850 855 860 Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn 865 870 875 880 Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe 885 890 895 Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys 900 905 910 Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys 915 920 925 His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu 930 935 940 Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys 945 950 955 960 Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu 965 970 975 Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val Val 980 985 990 Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val 995 1000 1005 Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys 1010 1015 1020 Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr 1025 1030 1035 Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn 1040 1045 1050 Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr 1055 1060 1065 Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg 1070 1075 1080 Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu 1085 1090 1095 Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg 1100 1105 1110 Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys 1115 1120 1125 Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu 1130 1135 1140 Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser 1145 1150 1155 Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe 1160 1165 1170 Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu 1175 1180 1185 Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe 1190 1195 1200 Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu 1205 1210 1215 Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn 1220 1225 1230 Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro 1235 1240 1245 Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His 1250 1255 1260 Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg 1265 1270 1275 Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr 1280 1285 1290 Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile 1295 1300 1305 Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe 1310 1315 1320 Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr 1325 1330 1335 Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly 1340 1345 1350 Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 18 <211> 96 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 18 Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys 1 5 10 15 Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr 20 25 30 Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn 35 40 45 Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg 50 55 60 Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln 65 70 75 80 Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val 85 90 95 <210> 19 <211> 385 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 19 Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val Phe Glu Ala Phe 1 5 10 15 Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys Val Arg Lys Asp 20 25 30 Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val Pro Ala Ile Val 35 40 45 Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys Leu Glu Tyr Lys 50 55 60 Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu 65 70 75 80 Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys 85 90 95 Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu 100 105 110 Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu 115 120 125 Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser 130 135 140 Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser 145 150 155 160 Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys Asn 165 170 175 Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu Leu His 180 185 190 Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys Leu Glu Ser 195 200 205 Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala Ala Asp Phe Gly 210 215 220 Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser Thr Leu Asn Glu 225 230 235 240 Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys Ser Ile Lys Lys 245 250 255 Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu Asn Asn Leu Leu 260 265 270 Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser Asn Ile Asn Lys 275 280 285 Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr 290 295 300 Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser 305 310 315 320 Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp 325 330 335 Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val 340 345 350 Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly 355 360 365 Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly 370 375 380 Gly 385 <210> 20 <211> 480 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 20 Val Asp Leu Arg Thr Leu Asp Val Phe Ser Gly Cys Gly Gly Leu Ser 1 5 10 15 Glu Gly Phe His Gln Ala Gly Ile Ser Asp Thr Leu Trp Ala Ile Glu 20 25 30 Met Trp Asp Pro Ala Ala Gln Ala Phe Arg Leu Asn Asn Pro Gly Ser 35 40 45 Thr Val Phe Thr Glu Asp Cys Asn Ile Leu Leu Lys Leu Val Met Ala 50 55 60 Gly Glu Thr Thr Asn Ser Arg Gly Gln Arg Leu Pro Gln Lys Gly Asp 65 70 75 80 Val Glu Met Leu Cys Gly Gly Pro Pro Cys Gln Gly Phe Ser Gly Met 85 90 95 Asn Arg Phe Asn Ser Arg Thr Tyr Ser Lys Phe Lys Asn Ser Leu Val 100 105 110 Val Ser Phe Leu Ser Tyr Cys Asp Tyr Tyr Arg Pro Arg Phe Phe Leu 115 120 125 Leu Glu Asn Val Arg Asn Phe Val Ser Phe Lys Arg Ser Met Val Leu 130 135 140 Lys Leu Thr Leu Arg Cys Leu Val Arg Met Gly Tyr Gln Cys Thr Phe 145 150 155 160 Gly Val Leu Gln Ala Gly Gln Tyr Gly Val Ala Gln Thr Arg Arg Arg 165 170 175 Ala Ile Ile Leu Ala Ala Ala Pro Gly Glu Lys Leu Pro Leu Phe Pro 180 185 190 Glu Pro Leu His Val Phe Ala Pro Arg Ala Cys Gln Leu Ser Val Val 195 200 205 Val Asp Asp Lys Lys Phe Val Ser Asn Ile Thr Arg Leu Ser Ser Gly 210 215 220 Pro Phe Arg Thr Ile Thr Val Arg Asp Thr Met Ser Asp Leu Pro Glu 225 230 235 240 Val Arg Asn Gly Ala Ser Ala Leu Glu Ile Ser Tyr Asn Gly Glu Pro 245 250 255 Gln Ser Trp Phe Gln Arg Gln Leu Arg Gly Ala Gln Tyr Gln Pro Ile 260 265 270 Leu Arg Asp His Ile Cys Lys Asp Met Ser Ala Leu Val Ala Ala Arg 275 280 285 Met Arg His Ile Pro Leu Ala Pro Gly Ser Asp Trp Arg Asp Leu Pro 290 295 300 Asn Ile Glu Val Arg Leu Ser Asp Gly Thr Met Ala Arg Lys Leu Arg 305 310 315 320 Tyr Thr His His Asp Arg Lys Asn Gly Arg Ser Ser Ser Gly Ala Leu 325 330 335 Arg Gly Val Cys Ser Cys Val Glu Ala Gly Lys Ala Cys Asp Pro Ala 340 345 350 Ala Arg Gln Phe Asn Thr Leu Ile Pro Trp Cys Leu Pro His Thr Gly 355 360 365 Asn Arg His Asn His Trp Ala Gly Leu Tyr Gly Arg Leu Glu Trp Asp 370 375 380 Gly Phe Phe Ser Thr Thr Val Thr Asn Pro Glu Pro Met Gly Lys Gln 385 390 395 400 Gly Arg Val Leu His Pro Glu Gln His Arg Val Val Ser Val Arg Glu 405 410 415 Cys Ala Arg Ser Gln Gly Phe Pro Asp Thr Tyr Arg Leu Phe Gly Asn 420 425 430 Ile Leu Asp Lys His Arg Gln Val Gly Asn Ala Val Pro Pro Pro Leu 435 440 445 Ala Lys Ala Ile Gly Leu Glu Ile Lys Leu Cys Met Leu Ala Lys Ala 450 455 460 Arg Glu Ser Ala Ser Ala Lys Ile Lys Glu Glu Glu Ala Ala Lys Asp 465 470 475 480 <210> 21 <211> 457 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 21 Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp 1 5 10 15 Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly 20 25 30 Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys 35 40 45 Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala 50 55 60 Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn 65 70 75 80 Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg 85 90 95 Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr 100 105 110 Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg Ile 115 120 125 Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile 130 135 140 Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn Glu Lys Glu 145 150 155 160 Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe Pro Val 165 170 175 His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu 180 185 190 Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro 195 200 205 Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala Asn 210 215 220 Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg 225 230 235 240 Gly Ser His Met Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp 245 250 255 Arg Arg Gln Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys 260 265 270 Glu Leu Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln 275 280 285 Leu Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu 290 295 300 Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu Gly 305 310 315 320 His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe His Arg 325 330 335 Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg Pro Phe Phe 340 345 350 Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu Asp Leu Asp Val 355 360 365 Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr Ile Pro Asp Val His 370 375 380 Gly Gly Ser Leu Gln Asn Ala Val Arg Val Trp Ser Asn Ile Pro Ala 385 390 395 400 Ile Arg Ser Arg His Trp Ala Leu Val Ser Glu Glu Glu Leu Ser Leu 405 410 415 Leu Ala Gln Asn Lys Gln Ser Ser Lys Leu Ala Ala Lys Trp Pro Thr 420 425 430 Lys Leu Val Lys Asn Cys Phe Leu Pro Leu Arg Glu Tyr Phe Lys Tyr 435 440 445 Phe Ser Thr Glu Leu Thr Ser Ser Leu 450 455 <210> 22 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 22 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Ala 115 120 125 Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg Val His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 <210> 23 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 23 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr Glu His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 <210> 24 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 24 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 <210> 25 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 25 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp 115 120 125 Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 <210> 26 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 26 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Thr Ser Gly Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His 115 120 125 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 <210> 27 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 27 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His 115 120 125 Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 <210> 28 <211> 661 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 28 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly His 115 120 125 Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp 645 650 655 Val Pro Asp Tyr Ala 660 <210> 29 <211> 661 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 29 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Arg Asp Glu Leu Asn Val His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp 115 120 125 Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp 645 650 655 Val Pro Asp Tyr Ala 660 <210> 30 <211> 661 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 30 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn 115 120 125 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp 645 650 655 Val Pro Asp Tyr Ala 660 <210> 31 <211> 661 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 31 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Ser Gly His Leu Thr Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly His 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Thr Leu Thr Glu His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp 645 650 655 Val Pro Asp Tyr Ala 660 <210> 32 <211> 661 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 32 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His 115 120 125 Leu Leu Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp 645 650 655 Val Pro Asp Tyr Ala 660 <210> 33 <211> 661 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 33 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Asn 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp 645 650 655 Val Pro Asp Tyr Ala 660 <210> 34 <211> 1528 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 34 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 20 25 30 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 35 40 45 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 50 55 60 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 65 70 75 80 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 85 90 95 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 100 105 110 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 115 120 125 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 130 135 140 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 145 150 155 160 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 165 170 175 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 180 185 190 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 195 200 205 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 210 215 220 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 225 230 235 240 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 245 250 255 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 260 265 270 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 275 280 285 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 290 295 300 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 305 310 315 320 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 325 330 335 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 340 345 350 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 355 360 365 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 370 375 380 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 385 390 395 400 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 405 410 415 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 420 425 430 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 435 440 445 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 450 455 460 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 465 470 475 480 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 485 490 495 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 500 505 510 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 515 520 525 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 530 535 540 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 545 550 555 560 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 565 570 575 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 580 585 590 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 595 600 605 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 610 615 620 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 625 630 635 640 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 645 650 655 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 660 665 670 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 675 680 685 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 690 695 700 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 705 710 715 720 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 725 730 735 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 740 745 750 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 755 760 765 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 770 775 780 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 785 790 795 800 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 805 810 815 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 820 825 830 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 835 840 845 Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys 850 855 860 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg 865 870 875 880 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 885 890 895 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 900 905 910 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 915 920 925 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 930 935 940 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 945 950 955 960 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 965 970 975 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 980 985 990 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 995 1000 1005 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile 1025 1030 1035 Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe 1040 1045 1050 Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu 1055 1060 1065 Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly 1070 1075 1080 Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr 1085 1090 1095 Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys 1100 1105 1110 Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro 1115 1120 1125 Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp 1130 1135 1140 Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser 1145 1150 1155 Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu 1160 1165 1170 Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser 1175 1180 1185 Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr 1190 1195 1200 Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser 1205 1210 1215 Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1220 1225 1230 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1235 1240 1245 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His 1265 1270 1275 Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser 1280 1285 1290 Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser 1295 1300 1305 Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu 1310 1315 1320 Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala 1325 1330 1335 Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr 1340 1345 1350 Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile 1355 1360 1365 Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly 1370 1375 1380 Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys 1385 1390 1395 Lys Lys Ala Ser Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr 1400 1405 1410 Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu 1415 1420 1425 Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val 1430 1435 1440 Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu 1445 1450 1455 Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro 1460 1465 1470 Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser 1475 1480 1485 Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg 1490 1495 1500 Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly 1505 1510 1515 Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1520 1525 <210> 35 <211> 1820 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 35 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 20 25 30 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 35 40 45 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 50 55 60 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 65 70 75 80 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 85 90 95 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 100 105 110 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 115 120 125 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 130 135 140 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 145 150 155 160 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 165 170 175 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 180 185 190 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 195 200 205 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 210 215 220 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 225 230 235 240 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 245 250 255 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 260 265 270 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 275 280 285 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 290 295 300 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 305 310 315 320 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 325 330 335 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 340 345 350 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 355 360 365 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 370 375 380 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 385 390 395 400 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 405 410 415 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 420 425 430 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 435 440 445 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 450 455 460 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 465 470 475 480 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 485 490 495 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 500 505 510 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 515 520 525 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 530 535 540 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 545 550 555 560 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 565 570 575 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 580 585 590 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 595 600 605 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 610 615 620 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 625 630 635 640 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 645 650 655 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 660 665 670 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 675 680 685 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 690 695 700 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 705 710 715 720 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 725 730 735 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 740 745 750 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 755 760 765 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 770 775 780 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 785 790 795 800 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 805 810 815 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 820 825 830 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 835 840 845 Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys 850 855 860 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg 865 870 875 880 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 885 890 895 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 900 905 910 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 915 920 925 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 930 935 940 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 945 950 955 960 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 965 970 975 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 980 985 990 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 995 1000 1005 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile 1025 1030 1035 Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe 1040 1045 1050 Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu 1055 1060 1065 Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly 1070 1075 1080 Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr 1085 1090 1095 Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys 1100 1105 1110 Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro 1115 1120 1125 Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp 1130 1135 1140 Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser 1145 1150 1155 Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu 1160 1165 1170 Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser 1175 1180 1185 Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr 1190 1195 1200 Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser 1205 1210 1215 Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1220 1225 1230 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1235 1240 1245 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His 1265 1270 1275 Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser 1280 1285 1290 Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser 1295 1300 1305 Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu 1310 1315 1320 Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala 1325 1330 1335 Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr 1340 1345 1350 Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile 1355 1360 1365 Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly 1370 1375 1380 Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys 1385 1390 1395 Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu 1400 1405 1410 Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala 1415 1420 1425 Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala 1430 1435 1440 Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn 1445 1450 1455 Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu 1460 1465 1470 Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys 1475 1480 1485 Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu 1490 1495 1500 Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly 1505 1510 1515 Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn 1520 1525 1530 Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln 1535 1540 1545 Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser 1550 1555 1560 Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys 1565 1570 1575 Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu 1580 1585 1590 Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys 1595 1600 1605 Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 1610 1615 1620 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile 1625 1630 1635 Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys 1640 1645 1650 Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys 1655 1660 1665 Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys 1670 1675 1680 Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser 1685 1690 1695 Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly 1700 1705 1710 Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys 1715 1720 1725 Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu 1730 1735 1740 Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile 1745 1750 1755 Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser 1760 1765 1770 Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly 1775 1780 1785 Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly 1790 1795 1800 Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp 1805 1810 1815 Tyr Ala 1820 <210> 36 <211> 1922 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 36 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 20 25 30 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 35 40 45 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 50 55 60 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 65 70 75 80 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 85 90 95 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 100 105 110 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 115 120 125 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 130 135 140 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 145 150 155 160 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 165 170 175 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 180 185 190 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 195 200 205 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 210 215 220 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 225 230 235 240 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 245 250 255 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 260 265 270 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 275 280 285 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 290 295 300 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 305 310 315 320 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 325 330 335 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 340 345 350 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 355 360 365 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 370 375 380 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 385 390 395 400 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 405 410 415 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 420 425 430 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 435 440 445 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 450 455 460 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 465 470 475 480 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 485 490 495 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 500 505 510 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 515 520 525 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 530 535 540 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 545 550 555 560 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 565 570 575 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 580 585 590 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 595 600 605 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 610 615 620 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 625 630 635 640 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 645 650 655 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 660 665 670 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 675 680 685 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 690 695 700 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 705 710 715 720 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 725 730 735 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 740 745 750 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 755 760 765 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 770 775 780 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 785 790 795 800 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 805 810 815 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 820 825 830 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 835 840 845 Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys 850 855 860 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg 865 870 875 880 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 885 890 895 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 900 905 910 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 915 920 925 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 930 935 940 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 945 950 955 960 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 965 970 975 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 980 985 990 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 995 1000 1005 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile 1025 1030 1035 Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe 1040 1045 1050 Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu 1055 1060 1065 Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly 1070 1075 1080 Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr 1085 1090 1095 Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys 1100 1105 1110 Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro 1115 1120 1125 Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp 1130 1135 1140 Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser 1145 1150 1155 Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu 1160 1165 1170 Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser 1175 1180 1185 Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr 1190 1195 1200 Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser 1205 1210 1215 Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1220 1225 1230 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1235 1240 1245 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His 1265 1270 1275 Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser 1280 1285 1290 Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser 1295 1300 1305 Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu 1310 1315 1320 Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala 1325 1330 1335 Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr 1340 1345 1350 Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile 1355 1360 1365 Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly 1370 1375 1380 Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln 1385 1390 1395 Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Val Asp Leu Arg 1400 1405 1410 Thr Leu Asp Val Phe Ser Gly Cys Gly Gly Leu Ser Glu Gly Phe 1415 1420 1425 His Gln Ala Gly Ile Ser Asp Thr Leu Trp Ala Ile Glu Met Trp 1430 1435 1440 Asp Pro Ala Ala Gln Ala Phe Arg Leu Asn Asn Pro Gly Ser Thr 1445 1450 1455 Val Phe Thr Glu Asp Cys Asn Ile Leu Leu Lys Leu Val Met Ala 1460 1465 1470 Gly Glu Thr Thr Asn Ser Arg Gly Gln Arg Leu Pro Gln Lys Gly 1475 1480 1485 Asp Val Glu Met Leu Cys Gly Gly Pro Pro Cys Gln Gly Phe Ser 1490 1495 1500 Gly Met Asn Arg Phe Asn Ser Arg Thr Tyr Ser Lys Phe Lys Asn 1505 1510 1515 Ser Leu Val Val Ser Phe Leu Ser Tyr Cys Asp Tyr Tyr Arg Pro 1520 1525 1530 Arg Phe Phe Leu Leu Glu Asn Val Arg Asn Phe Val Ser Phe Lys 1535 1540 1545 Arg Ser Met Val Leu Lys Leu Thr Leu Arg Cys Leu Val Arg Met 1550 1555 1560 Gly Tyr Gln Cys Thr Phe Gly Val Leu Gln Ala Gly Gln Tyr Gly 1565 1570 1575 Val Ala Gln Thr Arg Arg Arg Ala Ile Ile Leu Ala Ala Ala Pro 1580 1585 1590 Gly Glu Lys Leu Pro Leu Phe Pro Glu Pro Leu His Val Phe Ala 1595 1600 1605 Pro Arg Ala Cys Gln Leu Ser Val Val Val Asp Asp Lys Lys Phe 1610 1615 1620 Val Ser Asn Ile Thr Arg Leu Ser Ser Gly Pro Phe Arg Thr Ile 1625 1630 1635 Thr Val Arg Asp Thr Met Ser Asp Leu Pro Glu Val Arg Asn Gly 1640 1645 1650 Ala Ser Ala Leu Glu Ile Ser Tyr Asn Gly Glu Pro Gln Ser Trp 1655 1660 1665 Phe Gln Arg Gln Leu Arg Gly Ala Gln Tyr Gln Pro Ile Leu Arg 1670 1675 1680 Asp His Ile Cys Lys Asp Met Ser Ala Leu Val Ala Ala Arg Met 1685 1690 1695 Arg His Ile Pro Leu Ala Pro Gly Ser Asp Trp Arg Asp Leu Pro 1700 1705 1710 Asn Ile Glu Val Arg Leu Ser Asp Gly Thr Met Ala Arg Lys Leu 1715 1720 1725 Arg Tyr Thr His His Asp Arg Lys Asn Gly Arg Ser Ser Ser Gly 1730 1735 1740 Ala Leu Arg Gly Val Cys Ser Cys Val Glu Ala Gly Lys Ala Cys 1745 1750 1755 Asp Pro Ala Ala Arg Gln Phe Asn Thr Leu Ile Pro Trp Cys Leu 1760 1765 1770 Pro His Thr Gly Asn Arg His Asn His Trp Ala Gly Leu Tyr Gly 1775 1780 1785 Arg Leu Glu Trp Asp Gly Phe Phe Ser Thr Thr Val Thr Asn Pro 1790 1795 1800 Glu Pro Met Gly Lys Gln Gly Arg Val Leu His Pro Glu Gln His 1805 1810 1815 Arg Val Val Ser Val Arg Glu Cys Ala Arg Ser Gln Gly Phe Pro 1820 1825 1830 Asp Thr Tyr Arg Leu Phe Gly Asn Ile Leu Asp Lys His Arg Gln 1835 1840 1845 Val Gly Asn Ala Val Pro Pro Pro Leu Ala Lys Ala Ile Gly Leu 1850 1855 1860 Glu Ile Lys Leu Cys Met Leu Ala Lys Ala Arg Glu Ser Ala Ser 1865 1870 1875 Ala Lys Ile Lys Glu Glu Glu Ala Ala Lys Asp Gly Gly Gly Gly 1880 1885 1890 Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1895 1900 1905 Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1910 1915 1920 <210> 37 <211> 1986 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 37 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 20 25 30 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 35 40 45 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 50 55 60 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 65 70 75 80 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 85 90 95 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 100 105 110 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 115 120 125 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 130 135 140 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 145 150 155 160 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 165 170 175 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 180 185 190 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 195 200 205 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 210 215 220 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 225 230 235 240 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 245 250 255 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 260 265 270 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 275 280 285 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 290 295 300 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 305 310 315 320 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 325 330 335 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 340 345 350 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 355 360 365 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 370 375 380 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 385 390 395 400 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 405 410 415 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 420 425 430 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 435 440 445 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 450 455 460 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 465 470 475 480 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 485 490 495 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 500 505 510 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 515 520 525 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 530 535 540 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 545 550 555 560 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 565 570 575 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 580 585 590 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 595 600 605 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 610 615 620 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 625 630 635 640 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 645 650 655 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 660 665 670 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 675 680 685 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 690 695 700 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 705 710 715 720 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 725 730 735 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 740 745 750 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 755 760 765 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 770 775 780 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 785 790 795 800 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 805 810 815 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 820 825 830 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 835 840 845 Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys 850 855 860 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg 865 870 875 880 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 885 890 895 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 900 905 910 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 915 920 925 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 930 935 940 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 945 950 955 960 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 965 970 975 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 980 985 990 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 995 1000 1005 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile 1025 1030 1035 Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe 1040 1045 1050 Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu 1055 1060 1065 Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly 1070 1075 1080 Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr 1085 1090 1095 Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys 1100 1105 1110 Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro 1115 1120 1125 Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp 1130 1135 1140 Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser 1145 1150 1155 Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu 1160 1165 1170 Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser 1175 1180 1185 Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr 1190 1195 1200 Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser 1205 1210 1215 Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1220 1225 1230 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1235 1240 1245 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His 1265 1270 1275 Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser 1280 1285 1290 Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser 1295 1300 1305 Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu 1310 1315 1320 Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala 1325 1330 1335 Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr 1340 1345 1350 Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile 1355 1360 1365 Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly 1370 1375 1380 Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 1385 1390 1395 Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly 1400 1405 1410 Ser Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro 1415 1420 1425 Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe 1430 1435 1440 Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile 1445 1450 1455 Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile 1460 1465 1470 Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly 1475 1480 1485 Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro 1490 1495 1500 Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile 1505 1510 1515 Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu 1520 1525 1530 Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu 1535 1540 1545 Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala 1550 1555 1560 Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser 1565 1570 1575 Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg 1580 1585 1590 Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu 1595 1600 1605 Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu 1610 1615 1620 His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr 1625 1630 1635 Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val 1640 1645 1650 Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu 1655 1660 1665 Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met 1670 1675 1680 Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val 1685 1690 1695 Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala 1700 1705 1710 Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser 1715 1720 1725 Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met 1730 1735 1740 Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp Arg Arg Gln 1745 1750 1755 Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys Glu Leu 1760 1765 1770 Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln Leu 1775 1780 1785 Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu 1790 1795 1800 Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu 1805 1810 1815 Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe 1820 1825 1830 His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg 1835 1840 1845 Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu 1850 1855 1860 Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr 1865 1870 1875 Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val 1880 1885 1890 Trp Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val 1895 1900 1905 Ser Glu Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser 1910 1915 1920 Lys Leu Ala Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe 1925 1930 1935 Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr 1940 1945 1950 Ser Ser Leu Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala 1955 1960 1965 Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro 1970 1975 1980 Asp Tyr Ala 1985 <210> 38 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 38 ctggagcccg gcgagaaacc ctacaagtgc cccgagtgcg gcaaatcctt ctctagaagc 60 gacaaactga ccgaacatca gaggacccac accggcgaga agccttataa gtgtcccgaa 120 tgcggcaaat ccttcagcac caagaactct ctgacagaac accagagaac acataccgga 180 gagaaacctt ataaatgccc cgagtgcggc aagtccttct cccagtccgg cgatctgagg 240 agacaccaaa gaacacatac cggcgaaaag ccttacaagt gccccgagtg tggaaagagc 300 ttctccacca ccggcgctct gaccgagcac cagagaacac acaccggcga gaaaccctat 360 aaatgtcccg agtgtggcaa atccttcagc gacagcggca atctgagagt gcaccaaaga 420 acccataccg gcgaaaaacc ctacaaatgc cccgagtgcg gcaaatcctt cagccagagg 480 gcccatctgg agaggcacca aaggacacac accggagaaa agccctacaa gtgtcccgag 540 tgtggaaaaa gctttagcac aagcggcgag ctggtgaggc atcaaaggac ccacaccggc 600 gaaaagccca ccggcaaaaa gaccagc 627 <210> 39 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 ctggagcccg gcgagaagcc ctacaagtgc cccgagtgcg gaaagtcctt cagctccccc 60 gccgatctga caagacatca gagaacccat accggcgaga aaccttacaa atgccccgaa 120 tgtggcaagt cctttagcga tcccggacat ctggtgaggc accagaggac acacaccggc 180 gaaaagccct ataaatgtcc cgagtgtgga aagagctttt ctagaagcga caatctcgtg 240 agacaccaga gaacccacac cggagagaag ccttacaagt gccccgagtg cggcaaatcc 300 ttcagccaga gctcctctct ggtgaggcac caaaggaccc acaccggcga gaaaccttat 360 aagtgtcccg agtgtggcaa aagcttcagc acctcccact ctctgaccga gcatcaaaga 420 acccacaccg gcgaaaaacc ttataaatgc cccgagtgtg gcaaatcctt cagcagaaat 480 gacgctctga cagagcacca aagaacacat accggagaaa agccctacaa atgccccgag 540 tgtggaaaat ccttttctag aaacgatgct ctgaccgaac accaaagaac acacaccggc 600 gaaaagccta ccggaaaaaa gaccagc 627 <210> 40 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 40 ctggagcccg gcgaaaaacc ttacaagtgc cccgagtgcg gaaagagctt cagcagaagc 60 gacaaactgg tgaggcatca aaggacacat accggagaga agccctataa gtgccccgaa 120 tgtggcaaat ccttttccca gagggctcat ctggaaagac accagaggac ccataccggc 180 gaaaaaccct acaaatgtcc cgagtgtgga aagagctttt ccgatcccgg ccatctggtc 240 agacatcaga ggacacatac cggcgaaaag ccttacaagt gtcccgaatg cggaaaatcc 300 ttctccagaa gcgacaagct ggtgaggcac caaagaaccc acaccggcga aaaaccctat 360 aaatgccccg agtgcggcaa gtcctttagc cagctggccc atctgagagc ccaccagaga 420 acacacaccg gagagaagcc ttataagtgt cccgagtgcg gaaagtcctt ctctagagcc 480 gacaatctga ccgaacatca aaggacacac accggcgaga aaccttataa atgccccgag 540 tgcggaaaaa gcttttccga ctgcagagat ctggctagac accagagaac ccacaccggc 600 gagaaaccca ccggcaaaaa gaccagc 627 <210> 41 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 41 ctggagcccg gcgaaaagcc ttataaatgt cccgaatgcg gcaagagctt tagccacacc 60 ggccatctgc tggaacacca aaggacccat accggcgaaa agccctataa gtgccccgag 120 tgtggcaaga gcttcagcac caccggcaat ctgacagtcc atcagaggac ccacaccgga 180 gagaaaccct ataaatgccc cgagtgtgga aagtccttct ccgacaagaa ggatctgaca 240 agacaccaga ggacccatac cggcgagaaa ccctacaaat gccccgagtg cggcaaatcc 300 ttctcccaga gcggcgatct gaggagacat caaagaacac ataccggcga aaaaccctat 360 aagtgccccg aatgcggcaa gtccttcagc cagagggccc atctggaaag gcatcagagg 420 acacacaccg gcgagaagcc ttacaaatgt cccgagtgcg gaaagagctt ctctagaagc 480 gacaagctga ccgagcatca gaggacccac accggagaaa aaccttacaa gtgccccgag 540 tgcggcaaaa gcttcagcag aaccgacaca ctgagagatc accaaaggac acacaccggc 600 gagaaaccca ccggcaaaaa gaccagc 627 <210> 42 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 42 ctggagcccg gcgagaagcc ttataagtgc cccgagtgtg gcaagagctt tagccacacc 60 ggccatctgc tggagcatca aaggacacac accggagaaa agccctataa gtgccccgag 120 tgtggcaaat ccttcagcac ctccggcaat ctcaccgaac accagagaac acacaccgga 180 gaaaaacctt acaaatgtcc cgagtgtgga aagagctttt ccaccagcgg caatctggtg 240 agacatcaaa gaacacatac cggcgaaaaa ccctataaat gccccgagtg tggaaaatcc 300 ttctcccaac tggcccatct gagggcccac cagaggacac ataccggaga aaaaccctac 360 aaatgccccg aatgcggaaa aagcttctcc gagagaagcc atctgagaga gcaccaaagg 420 acccataccg gagaaaagcc ttacaagtgt cccgagtgcg gaaaaagctt tagcgatccc 480 ggacatctgg tgagacatca gagaacccac accggcgaaa agccttataa atgtcccgaa 540 tgtggcaagt cctttagcac ccatctggat ctgattagac accaaagaac ccacaccggc 600 gagaaaccca ccggaaaaaa gaccagc 627 <210> 43 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 43 ctggagcccg gcgaaaagcc ttacaaatgt cccgagtgcg gaaagtcctt cagcgacccc 60 ggcgctctgg tgagacatca aagaacacat accggcgaga aaccttataa atgccccgaa 120 tgtggaaaat ccttcagcga aagaagccat ctgagggaac accagaggac ccacaccggc 180 gaaaaacctt ataagtgccc cgaatgcgga aaaagctttt ctagaagcga tcatctgacc 240 aaccatcaga gaacacacac cggcgaaaag ccctataaat gtcccgagtg tggcaaatcc 300 tttagcgaga ggtcccatct gagagagcac cagaggacac ataccggaga gaagccctac 360 aagtgccccg agtgtggcaa gagctttagc agaagcgacc atctgaccaa tcatcaaagg 420 acccacaccg gagagaagcc ttacaagtgt cccgagtgcg gaaagtcctt ttccgatccc 480 ggccacctcg tgaggcacca aagaacccat accggcgaga aaccctacaa atgccccgag 540 tgtggaaaga gcttctccag aagcgacaag ctggtgaggc atcagaggac acacaccggc 600 gaaaaaccca ccggcaagaa aaccagc 627 <210> 44 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 44 ctggagcccg gagagaagcc ctacaaatgc cccgagtgtg gaaagagctt ctctagaaat 60 gacgctctga cagaacacca gaggacccat accggcgaga aaccttacaa atgccccgag 120 tgcggaaaaa gctttagcga ttgcagagat ctggctagac atcagagaac acacaccggc 180 gagaagccct ataagtgccc cgaatgcggc aagagcttta gcgaccccgg ccatctggtg 240 agacatcaaa ggacacatac cggagaaaaa ccttacaagt gccccgagtg cggaaagtcc 300 ttctcccaga gcggccatct caccgagcat caaaggaccc acaccggcga aaagccttat 360 aaatgtcccg aatgtggcaa gtccttctct agagaggata atctgcacac ccatcagagg 420 acccacaccg gcgaaaagcc ttataaatgc cccgaatgtg gaaagtcctt ttccaccaag 480 aactctctga ccgagcatca gaggacacac accggagaga aaccctataa atgtcccgag 540 tgtggcaaga gcttcagcag agccgacaat ctgacagagc accaaagaac acataccggc 600 gaaaagccca ccggcaaaaa gaccagc 627 <210> 45 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 45 ctggagcccg gcgagaaacc ctacaagtgc cccgagtgtg gcaaatcctt ctctagatcc 60 gacaaactga ccgaacatca gaggacccat accggcgaaa aaccttataa atgtcccgag 120 tgcggaaagt ccttctctag aagggacgag ctgaacgtgc atcagagaac acataccggc 180 gagaagccct ataaatgccc cgaatgcggc aaaagcttct ctagaagcga tcatctgacc 240 aaccaccaga gaacccatac cggagaaaag ccttacaagt gtcccgaatg tggaaaatcc 300 ttcagctccc ccgccgatct gaccagacac caaaggaccc acaccggcga gaagccctat 360 aaatgccccg agtgcggcaa gagcttttcc agatccgacc atctgaccaa tcatcaaaga 420 acccacaccg gcgaaaagcc ttataaatgt cccgagtgcg gcaaatcctt ttccagcaag 480 aaggctctga ccgagcatca aaggacccat accggcgaga agccttacaa atgccccgag 540 tgtggaaagt cctttagcac ccatctggat ctgattagac accagaggac acacaccgga 600 gagaaaccca ccggcaaaaa gaccagc 627 <210> 46 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 46 ctggagcccg gcgagaaacc ttacaaatgc cccgagtgcg gcaagagctt cagcagaagc 60 gacgatctgg tgaggcacca aagaacccac accggcgaaa aaccttacaa gtgtcccgaa 120 tgcggaaagt ccttcagcag agaggacaat ctgcacaccc accagagaac acacaccgga 180 gaaaagcctt acaagtgccc cgaatgcggc aaatcctttt ctagaagcga tcatctgacc 240 acccaccaaa gaacacatac cggcgagaag ccttacaaat gtcccgagtg cggaaagtcc 300 ttctcccaga gagccaatct gagggctcat caaaggaccc ataccggcga aaagccctac 360 aaatgccccg agtgcggaaa atccttcagc cagctggccc atctgagagc ccaccaaagg 420 acacacaccg gagagaaacc ctataagtgc cccgagtgtg gaaaaagctt ttcccagagg 480 gccaatctga gggcccatca gaggacccat accggagaga agccttataa atgtcccgag 540 tgcggaaaaa gcttcagcga gaggagccat ctgagggaac atcaaagaac ccacaccggc 600 gaaaaaccca ccggaaaaaa gaccagc 627 <210> 47 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 47 ctggagcccg gcgagaaacc ctacaagtgc cccgagtgtg gaaaaagctt tagccaaagc 60 ggcgatctga ggagacacca aagaacacac accggcgaga agccctacaa atgtcccgag 120 tgcggaaaga gcttcagcca gagcggccat ctgaccgagc atcagagaac ccataccggc 180 gaaaaacctt ataagtgccc cgagtgtgga aagtccttct ccgagagatc ccatctgaga 240 gaacaccaga ggacacacac cggcgaaaaa ccttataagt gtcccgagtg cggaaagtcc 300 ttcagcgatc ccggccatct ggtgagacat caaaggacac ataccggcga aaaaccttat 360 aagtgtcccg aatgcggcaa gagctttagc agaaacgaca cactcaccga acaccagagg 420 acccacaccg gcgagaaacc ctacaaatgc cccgagtgcg gcaaatcctt ttctagagcc 480 gacaatctga ccgaacacca gaggacccat accggagaaa agccttacaa atgtcccgag 540 tgtggcaaat ccttctccac ccatctggat ctgattagac accaaagaac acataccgga 600 gaaaagccca ccggaaaaaa gaccagc 627 <210> 48 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 48 ctggagcccg gcgaaaaacc ctataagtgc cccgaatgtg gaaagagctt cagccatacc 60 ggccatctgc tggaacacca aaggacacac accggcgaga aaccttacaa gtgtcccgag 120 tgcggaaaaa gcttctcctc caaaaaggct ctcaccgagc accagagaac acataccggc 180 gaaaagcctt ataagtgccc cgagtgtggc aaatcctttt ccgactgtag agatctggcc 240 agacatcaaa gaacccacac cggagagaaa ccttataaat gccccgagtg cggcaagtcc 300 tttagccata ccggccatct gctggagcac cagaggaccc ataccggcga gaagccttac 360 aaatgccccg agtgcggcaa aagcttcagc agaaatgacg ctctgaccga gcatcaaagg 420 acccataccg gcgaaaagcc ctacaagtgt cccgagtgtg gaaagtcctt ctcccagagc 480 ggcgatctga ggagacacca gagaacacac accggcgaga aaccctataa atgtcccgag 540 tgcggaaaga gctttagcga cagcggcaat ctgagggtgc atcaaagaac acacaccggc 600 gaaaaaccca ccggaaaaaa gacaagc 627 <210> 49 <211> 538 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 49 caccggcgaa aagccttata agtgccccga gtgcggcaag tccttctcta gaagcgatca 60 cctcaccaat catcagagga cacataccgg agagaagccc tataagtgcc ccgagtgcgg 120 caagagcttt agccagctgg ctcatctgag agctcaccaa agaacccata ccggcgagaa 180 gccttacaaa tgccccgagt gtggaaaatc cttttcccag tccagcaacc tcgtcagaca 240 tcaaaggacc cataccggcg aaaagcctta caagtgtccc gagtgcggaa agtccttctc 300 tagatccgac aacctcgtga ggcaccagag aacccacacc ggcgagaaac cttacaaatg 360 tcccgagtgt ggcaaaagct tttctagaag cgacgagctg gtgagacatc aaagaaccca 420 taccggcgaa aaaccttata agtgtcccga gtgcggcaaa tcctttagcc agctggccca 480 tctgagggcc caccagagaa cacataccgg cgaaaaaccc accggcaaaa agacaagc 538 <210> 50 <211> 4101 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 50 gacaagaagt acagcatcgg cctggccatc ggcaccaaca gcgtgggctg ggccgtgatc 60 accgacgagt acaaggtgcc cagcaagaag ttcaaggtgc tgggcaacac cgaccggcac 120 agcatcaaga agaacctgat cggcgccctg ctgttcgaca gcggcgagac cgccgaggcc 180 acccggctga agcggaccgc ccggcggcgg tacacccggc ggaagaaccg gatctgctac 240 ctgcaggaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccaccggctg 300 gaggagagct tcctggtgga ggaggacaag aagcacgagc ggcaccccat cttcggcaac 360 atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gcggaagaag 420 ctggtggaca gcaccgacaa ggccgacctg cggctgatct acctggccct ggcccacatg 480 atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 540 gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga gaaccccatc 600 aacgccagcg gcgtggacgc caaggccatc ctgagcgccc ggctgagcaa gagccggcgg 660 ctggagaacc tgatcgccca gctgcccggc gagaagaaga acggcctgtt cggcaacctg 720 atcgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggac 780 gccaagctgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 840 atcggcgacc agtacgccga cctgttcctg gccgccaaga acctgagcga cgccatcctg 900 ctgagcgaca tcctgcgggt gaacaccgag atcaccaagg cccccctgag cgccagcatg 960 atcaagcggt acgacgagca ccaccaggac ctgaccctgc tgaaggccct ggtgcggcag 1020 cagctgcccg agaagtacaa ggagatcttc ttcgaccaga gcaagaacgg ctacgccggc 1080 tacatcgacg gcggcgccag ccaggaggag ttctacaagt tcatcaagcc catcctggag 1140 aagatggacg gcaccgagga gctgctggtg aagctgaacc gggaggacct gctgcggaag 1200 cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggcga gctgcacgcc 1260 atcctgcggc ggcaggagga cttctacccc ttcctgaagg acaaccggga gaagatcgag 1320 aagatcctga ccttccggat cccctactac gtgggccccc tggcccgggg caacagccgg 1380 ttcgcctgga tgacccggaa atccgaggag accatcaccc cctggaactt cgaggaggtg 1440 gtggacaagg gcgccagcgc ccagagcttc atcgagcgga tgaccaactt cgacaagaac 1500 ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtac 1560 aacgagctga ccaaggtgaa gtacgtgacc gagggcatgc ggaagcccgc cttcctgagc 1620 ggcgagcaga agaaggccat cgtggacctg ctgttcaaga ccaaccggaa ggtgaccgtg 1680 aagcagctga aggaggacta cttcaagaag atcgagtgct tcgacagcgt ggagatcagc 1740 ggcgtggagg accggttcaa cgccagcctg ggcacctacc acgacctgct gaagatcatc 1800 aaggacaagg acttcctgga caacgaggag aacgaggaca tcctggagga catcgtgctg 1860 accctgaccc tgttcgagga ccgggagatg atcgaggagc ggctgaaaac ctacgcccac 1920 ctgttcgacg acaaggtgat gaagcagctg aagcggcggc ggtacaccgg ctggggccgg 1980 ctgagccgga agctgatcaa cggcatccgg gacaagcaga gcggcaagac catcctggac 2040 ttcctgaaat ccgacggctt cgccaaccgg aacttcatgc agctgatcca cgacgacagc 2100 ctgaccttca aggaggacat ccagaaggcc caggtgagcg gccagggcga cagcctgcac 2160 gagcacatcg ccaacctggc cggcagcccc gccatcaaga agggcatcct gcagaccgtg 2220 aaggtggtgg acgagctggt gaaggtgatg ggccggcaca agcccgagaa catcgtgatc 2280 gagatggccc gggagaacca gaccacccag aagggccaga agaacagccg ggagcggatg 2340 aagcggatcg aggagggcat caaggagctg ggcagccaga tcctgaagga gcaccccgtg 2400 gagaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa cggccgggac 2460 atgtacgtgg accaggagct ggacatcaac cggctgagcg actacgacgt ggccgccatc 2520 gtgccccaga gcttcctgaa ggacgacagc atcgacaaca aggtgctgac ccggagcgac 2580 aaggcccggg gcaagagcga caacgtgccc agcgaggagg tggtgaagaa gatgaagaac 2640 tactggcggc agctgctgaa cgccaagctg atcacccagc ggaagttcga caacctgacc 2700 aaggccgagc ggggcggcct gagcgagctg gacaaggccg gcttcatcaa gcggcagctg 2760 gtggagaccc ggcagatcac caagcacgtg gcccagatcc tggacagccg gatgaacacc 2820 aagtacgacg agaacgacaa gctgatccgg gaggtgaagg tgatcaccct gaaatccaag 2880 ctggtgagcg acttccggaa ggacttccag ttctacaagg tgcgggagat caacaactac 2940 caccacgccc acgacgccta cctgaacgcc gtggtgggca ccgccctgat caagaagtac 3000 cccaagctgg agagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3060 atcgccaaga gcgagcagga gatcggcaag gccaccgcca agtacttctt ctacagcaac 3120 atcatgaact tcttcaagac cgagatcacc ctggccaacg gcgagatccg gaagcggccc 3180 ctgatcgaga ccaacggcga gaccggcgag atcgtgtggg acaagggccg ggacttcgcc 3240 accgtgcgga aggtgctgag catgccccag gtgaacatcg tgaagaaaac cgaggtgcag 3300 accggcggct tcagcaagga gagcatcctg cccaagcgga acagcgacaa gctgatcgcc 3360 cggaagaagg actgggaccc caagaagtac ggcggcttcg acagccccac cgtggcctac 3420 agcgtgctgg tggtggccaa ggtggagaag ggcaagagca agaagctgaa atccgtgaag 3480 gagctgctgg gcatcaccat catggagcgg agcagcttcg agaagaaccc catcgacttc 3540 ctggaggcca agggctacaa ggaggtgaag aaggacctga tcatcaagct gcccaagtac 3600 agcctgttcg agctggagaa cggccggaag cggatgctgg ccagcgccgg cgagctgcag 3660 aagggcaacg agctggccct gcccagcaag tacgtgaact tcctgtacct ggccagccac 3720 tacgagaagc tgaagggcag ccccgaggac aacgagcaga agcagctgtt cgtggagcag 3780 cacaagcact acctggacga gatcatcgag cagatcagcg agttcagcaa gcgggtgatc 3840 ctggccgacg ccaacctgga caaggtgctg agcgcctaca acaagcaccg ggacaagccc 3900 atccgggagc aggccgagaa catcatccac ctgttcaccc tgaccaacct gggcgccccc 3960 gccgccttca agtacttcga caccaccatc gaccggaagc ggtacaccag caccaaggag 4020 gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac ccggatcgac 4080 ctgagccagc tgggcggcga c 4101 <210> 51 <211> 288 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 51 gacgccaaga gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg 60 gacttcaccc gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac 120 gtgatgctgg agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac 180 gtgatcctgc ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag 240 gagacccacc ccgacagcga gaccgccttc gagatcaaga gcagcgtg 288 <210> 52 <211> 1155 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 52 agcaaggtgg agaacaagac caagaagctg cgggtgttcg aggccttcgc cggcatcggc 60 gcccagcgga aggccctgga gaaggtgcgg aaggacgagt acgagatcgt gggcctggcc 120 gagtggtacg tgcccgccat cgtgatgtac caggccatcc acaacaactt ccacaccaag 180 ctggagtaca agagcgtgag ccgggaggag atgatcgact acctggagaa caagaccctg 240 agctggaaca gcaagaaccc cgtgagcaac ggctactgga agcggaagaa ggacgacgag 300 ctgaagatca tctacaacgc catcaagctg agcgagaagg agggcaacat cttcgacatc 360 cgggacctgt acaagcggac cctgaagaac atcgacctgc tgacctacag cttcccctgc 420 caggacctga gccagcaggg catccagaag ggcatgaagc ggggcagcgg cacccggagc 480 ggcctgctgt gggagatcga gcgggccctg gacagcaccg agaagaacga cctgcccaag 540 tacctgctga tggagaacgt gggcgccctg ctgcacaaga agaacgagga ggagctgaac 600 cagtggaagc agaagctgga gagcctgggc taccagaaca gcatcgaggt gctgaacgcc 660 gccgacttcg gcagcagcca ggcccggcgg cgggtgttca tgatcagcac cctgaacgag 720 ttcgtggagc tgcccaaggg cgacaagaag cccaagagca tcaagaaggt gctgaacaag 780 atcgtgagcg agaaggacat cctgaacaac ctgctgaagt acaacctgac cgagttcaag 840 aaaaccaaga gcaacatcaa caaggccagc ctgatcggct acagcaagtt caacagcgag 900 ggctacgtgt acgaccccga gttcaccggc cccaccctga ccgccagcgg cgccaacagc 960 cggatcaaga tcaaggacgg cagcaacatc cggaagatga acagcgacga gaccttcctg 1020 tacatcggct tcgacagcca ggacggcaag cgggtgaacg agatcgagtt cctgaccgag 1080 aaccagaaga tcttcgtgtg cggcaacagc atcagcgtgg aggtgctgga ggccatcatc 1140 gacaagatcg gcggc 1155 <210> 53 <211> 1440 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 53 gtggatctga ggacactcga cgtgtttagc ggatgcggcg gactctccga aggcttccac 60 caagccggaa tttccgacac actctgggcc attgagatgt gggaccccgc cgctcaagcc 120 ttcagactga ataatcccgg ctccaccgtg ttcaccgagg actgcaacat tctgctgaag 180 ctggtgatgg ctggcgaaac caccaactct agaggccaga ggctgcccca gaagggagat 240 gtggaaatgc tctgtggagg ccctccttgc caaggcttct ccggcatgaa caggttcaac 300 tctagaacat acagcaagtt caagaactct ctggtcgtga gctttctgag ctactgcgac 360 tactatagac ctaggttctt tctgctggag aacgtgagaa atttcgtgtc cttcaagagg 420 agcatggtgc tgaagctgac actgaggtgt ctggtgagga tgggctacca gtgcacattc 480 ggagtgctgc aagctggcca gtacggcgtg gcccagacca gaaggagggc catcattctg 540 gctgctgccc ccggcgagaa actccctctg ttccccgagc ccctccacgt gttcgcccct 600 agagcttgcc agctgagcgt ggtggtcgac gataagaagt tcgtgagcaa catcacaagg 660 ctgtccagcg gacccttcag aaccattacc gtgagggata ccatgtccga cctccccgag 720 gtgaggaatg gcgccagcgc tctggagatt tcctacaacg gcgaacctca gagctggttc 780 caaaggcagc tgagaggcgc tcagtatcag cccattctga gggaccacat ctgcaaagat 840 atgagcgctc tggtggccgc tagaatgaga catattcctc tggcccccgg cagcgactgg 900 agagatctgc ccaatattga ggtgagactc agcgacggaa caatggctag aaaactgagg 960 tacacccatc atgatagaaa gaacggaagg agcagcagcg gcgctctgag aggagtgtgt 1020 agctgcgtgg aagctggcaa ggcttgcgat cccgccgcta ggcagttcaa taccctcatc 1080 ccttggtgtc tgcctcacac cggcaacaga cacaatcatt gggctggact gtatggaagg 1140 ctcgaatggg acggcttttt cagcaccacc gtgaccaatc ccgaacctat gggcaagcaa 1200 ggaagggtgc tccaccccga gcagcataga gtcgtgtccg tgagagaatg cgctagaagc 1260 caaggcttcc ccgacaccta tagactgttc ggcaacattc tggataagca cagacaagtg 1320 ggaaatgctg tccctcctcc tctggccaag gctatcggac tggagatcaa gctgtgtatg 1380 ctcgccaaag ctagggagag cgcttccgcc aagattaagg aggaggaggc cgccaaggac 1440 <210> 54 <211> 1626 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 54 aaccacgacc aggagttcga cccccccaag gtgtaccccc ccgtgcccgc cgagaagcgg 60 aagcccatcc gggtgctgag cctgttcgac ggcatcgcca ccggcctgct ggtgctgaag 120 gacctgggca tccaggtgga ccggtacatc gccagcgagg tgtgcgagga cagcatcacc 180 gtgggcatgg tgcggcacca gggcaagatc atgtacgtgg gcgacgtgcg gagcgtgacc 240 cagaagcaca tccaggagtg gggccccttc gacctggtga tcggcggcag cccctgcaac 300 gacctgagca tcgtgaaccc cgcccggaag ggcctgtacg agggcaccgg ccggctgttc 360 ttcgagttct accggctgct gcacgacgcc cggcccaagg agggcgacga ccggcccttc 420 ttctggctgt tcgagaacgt ggtggccatg ggcgtgagcg acaagcggga catcagccgg 480 ttcctggaga gcaaccccgt gatgatcgac gccaaggagg tgagcgccgc ccaccgggcc 540 cggtacttct ggggcaacct gcccggcatg aaccggcccc tggccagcac cgtgaacgac 600 aagctggagc tgcaggagtg cctggagcac ggccggatcg ccaagttcag caaggtgcgg 660 accatcacca cccggagcaa cagcatcaag cagggcaagg accagcactt ccccgtgttc 720 atgaacgaga aggaggacat cctgtggtgc accgagatgg agcgggtgtt cggcttcccc 780 gtgcactaca ccgacgtgag caacatgagc cggctggccc ggcagcggct gctgggccgg 840 agctggagcg tgcccgtgat ccggcacctg ttcgcccccc tgaaggagta cttcgcctgc 900 gtgagcagcg gcaacagcaa cgccaacagc cggggcccca gcttcagcag cggcctggtg 960 cccctgagcc tgcggggcag ccacatgaat cctctggaga tgttcgagac agtgcccgtg 1020 tggagaaggc aacccgtgag ggtgctgagc ctcttcgagg acattaagaa ggagctgacc 1080 tctctgggct ttctggaatc cggcagcgac cccggccagc tgaaacacgt ggtggacgtg 1140 accgacacag tgaggaagga cgtggaagag tggggcccct ttgacctcgt gtatggagcc 1200 acacctcctc tcggccacac atgcgatagg cctcccagct ggtatctctt ccagttccac 1260 agactgctcc agtacgccag acctaagccc ggcagcccca gacccttctt ctggatgttc 1320 gtggacaatc tggtgctgaa caaggaggat ctggatgtgg ccagcagatt tctggagatg 1380 gaacccgtga caatccccga cgtgcatggc ggctctctgc agaacgccgt gagagtgtgg 1440 tccaacatcc ccgccattag aagcagacac tgggctctgg tgagcgagga ggaactgtct 1500 ctgctggccc agaataagca gtcctccaag ctggccgcca agtggcccac caagctggtg 1560 aagaactgct ttctgcctct gagggagtat ttcaagtatt tcagcaccga actgaccagc 1620 agcctg 1626 <210> 55 <211> 1345 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 55 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgagaa accctacaag tgccccgagt gcggcaaatc cttctctaga agcgacaaac 180 tgaccgaaca tcagaggacc cacaccggcg agaagcctta taagtgtccc gaatgcggca 240 aatccttcag caccaagaac tctctgacag aacaccagag aacacatacc ggagagaaac 300 cttataaatg ccccgagtgc ggcaagtcct tctcccagtc cggcgatctg aggagacacc 360 aaagaacaca taccggcgaa aagccttaca agtgccccga gtgtggaaag agcttctcca 420 ccaccggcgc tctgaccgag caccagagaa cacacaccgg cgagaaaccc tataaatgtc 480 ccgagtgtgg caaatccttc agcgacagcg gcaatctgag agtgcaccaa agaacccata 540 ccggcgaaaa accctacaaa tgccccgagt gcggcaaatc cttcagccag agggcccatc 600 tggagaggca ccaaaggaca cacaccggag aaaagcccta caagtgtccc gagtgtggaa 660 aaagctttag cacaagcggc gagctggtga ggcatcaaag gacccacacc ggcgaaaagc 720 ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780 gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840 gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900 agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960 ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020 ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200 cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260 tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaa 1345 <210> 56 <211> 1345 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 56 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgagaa gccctacaag tgccccgagt gcggaaagtc cttcagctcc cccgccgatc 180 tgacaagaca tcagagaacc cataccggcg agaaacctta caaatgcccc gaatgtggca 240 agtcctttag cgatcccgga catctggtga ggcaccagag gacacacacc ggcgaaaagc 300 cctataaatg tcccgagtgt ggaaagagct tttctagaag cgacaatctc gtgagacacc 360 agagaaccca caccggagag aagccttaca agtgccccga gtgcggcaaa tccttcagcc 420 agagctcctc tctggtgagg caccaaagga cccacaccgg cgagaaacct tataagtgtc 480 ccgagtgtgg caaaagcttc agcacctccc actctctgac cgagcatcaa agaacccaca 540 ccggcgaaaa accttataaa tgccccgagt gtggcaaatc cttcagcaga aatgacgctc 600 tgacagagca ccaaagaaca cataccggag aaaagcccta caaatgcccc gagtgtggaa 660 aatccttttc tagaaacgat gctctgaccg aacaccaaag aacacacacc ggcgaaaagc 720 ctaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780 gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840 gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900 agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960 ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020 ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200 cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260 tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaa 1345 <210> 57 <211> 1345 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 57 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgaaaa accttacaag tgccccgagt gcggaaagag cttcagcaga agcgacaaac 180 tggtgaggca tcaaaggaca cataccggag agaagcccta taagtgcccc gaatgtggca 240 aatccttttc ccagagggct catctggaaa gacaccagag gacccatacc ggcgaaaaac 300 cctacaaatg tcccgagtgt ggaaagagct tttccgatcc cggccatctg gtcagacatc 360 agaggacaca taccggcgaa aagccttaca agtgtcccga atgcggaaaa tccttctcca 420 gaagcgacaa gctggtgagg caccaaagaa cccacaccgg cgaaaaaccc tataaatgcc 480 ccgagtgcgg caagtccttt agccagctgg cccatctgag agcccaccag agaacacaca 540 ccggagagaa gccttataag tgtcccgagt gcggaaagtc cttctctaga gccgacaatc 600 tgaccgaaca tcaaaggaca cacaccggcg agaaacctta taaatgcccc gagtgcggaa 660 aaagcttttc cgactgcaga gatctggcta gacaccagag aacccacacc ggcgagaaac 720 ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780 gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840 gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900 agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960 ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020 ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200 cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260 tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaa 1345 <210> 58 <211> 1345 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 58 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgaaaa gccttataaa tgtcccgaat gcggcaagag ctttagccac accggccatc 180 tgctggaaca ccaaaggacc cataccggcg aaaagcccta taagtgcccc gagtgtggca 240 agagcttcag caccaccggc aatctgacag tccatcagag gacccacacc ggagagaaac 300 cctataaatg ccccgagtgt ggaaagtcct tctccgacaa gaaggatctg acaagacacc 360 agaggaccca taccggcgag aaaccctaca aatgccccga gtgcggcaaa tccttctccc 420 agagcggcga tctgaggaga catcaaagaa cacataccgg cgaaaaaccc tataagtgcc 480 ccgaatgcgg caagtccttc agccagaggg cccatctgga aaggcatcag aggacacaca 540 ccggcgagaa gccttacaaa tgtcccgagt gcggaaagag cttctctaga agcgacaagc 600 tgaccgagca tcagaggacc cacaccggag aaaaacctta caagtgcccc gagtgcggca 660 aaagcttcag cagaaccgac acactgagag atcaccaaag gacacacacc ggcgagaaac 720 ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780 gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840 gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900 agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960 ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020 ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200 cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260 tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaa 1345 <210> 59 <211> 1345 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 59 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgagaa gccttataag tgccccgagt gtggcaagag ctttagccac accggccatc 180 tgctggagca tcaaaggaca cacaccggag aaaagcccta taagtgcccc gagtgtggca 240 aatccttcag cacctccggc aatctcaccg aacaccagag aacacacacc ggagaaaaac 300 cttacaaatg tcccgagtgt ggaaagagct tttccaccag cggcaatctg gtgagacatc 360 aaagaacaca taccggcgaa aaaccctata aatgccccga gtgtggaaaa tccttctccc 420 aactggccca tctgagggcc caccagagga cacataccgg agaaaaaccc tacaaatgcc 480 ccgaatgcgg aaaaagcttc tccgagagaa gccatctgag agagcaccaa aggacccata 540 ccggagaaaa gccttacaag tgtcccgagt gcggaaaaag ctttagcgat cccggacatc 600 tggtgagaca tcagagaacc cacaccggcg aaaagcctta taaatgtccc gaatgtggca 660 agtcctttag cacccatctg gatctgatta gacaccaaag aacccacacc ggcgagaaac 720 ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780 gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840 gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900 agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960 ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020 ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200 cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260 tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaa 1345 <210> 60 <211> 1345 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 60 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgaaaa gccttacaaa tgtcccgagt gcggaaagtc cttcagcgac cccggcgctc 180 tggtgagaca tcaaagaaca cataccggcg agaaacctta taaatgcccc gaatgtggaa 240 aatccttcag cgaaagaagc catctgaggg aacaccagag gacccacacc ggcgaaaaac 300 cttataagtg ccccgaatgc ggaaaaagct tttctagaag cgatcatctg accaaccatc 360 agagaacaca caccggcgaa aagccctata aatgtcccga gtgtggcaaa tcctttagcg 420 agaggtccca tctgagagag caccagagga cacataccgg agagaagccc tacaagtgcc 480 ccgagtgtgg caagagcttt agcagaagcg accatctgac caatcatcaa aggacccaca 540 ccggagagaa gccttacaag tgtcccgagt gcggaaagtc cttttccgat cccggccacc 600 tcgtgaggca ccaaagaacc cataccggcg agaaacccta caaatgcccc gagtgtggaa 660 agagcttctc cagaagcgac aagctggtga ggcatcagag gacacacacc ggcgaaaaac 720 ccaccggcaa gaaaaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780 gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840 gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900 agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960 ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020 ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200 cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260 tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaa 1345 <210> 61 <211> 2227 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 61 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggagagaa gccctacaaa tgccccgagt gtggaaagag cttctctaga aatgacgctc 180 tgacagaaca ccagaggacc cataccggcg agaaacctta caaatgcccc gagtgcggaa 240 aaagctttag cgattgcaga gatctggcta gacatcagag aacacacacc ggcgagaagc 300 cctataagtg ccccgaatgc ggcaagagct ttagcgaccc cggccatctg gtgagacatc 360 aaaggacaca taccggagaa aaaccttaca agtgccccga gtgcggaaag tccttctccc 420 agagcggcca tctcaccgag catcaaagga cccacaccgg cgaaaagcct tataaatgtc 480 ccgaatgtgg caagtccttc tctagagagg ataatctgca cacccatcag aggacccaca 540 ccggcgaaaa gccttataaa tgccccgaat gtggaaagtc cttttccacc aagaactctc 600 tgaccgagca tcagaggaca cacaccggag agaaacccta taaatgtccc gagtgtggca 660 agagcttcag cagagccgac aatctgacag agcaccaaag aacacatacc ggcgaaaagc 720 ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780 gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840 cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900 agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960 tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020 gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080 tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200 aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260 gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320 acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380 agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440 ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500 tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560 tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620 aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680 gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740 ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800 acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860 accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920 acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980 aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040 cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100 cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaa 2227 <210> 62 <211> 2227 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 62 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgagaa accctacaag tgccccgagt gtggcaaatc cttctctaga tccgacaaac 180 tgaccgaaca tcagaggacc cataccggcg aaaaacctta taaatgtccc gagtgcggaa 240 agtccttctc tagaagggac gagctgaacg tgcatcagag aacacatacc ggcgagaagc 300 cctataaatg ccccgaatgc ggcaaaagct tctctagaag cgatcatctg accaaccacc 360 agagaaccca taccggagaa aagccttaca agtgtcccga atgtggaaaa tccttcagct 420 cccccgccga tctgaccaga caccaaagga cccacaccgg cgagaagccc tataaatgcc 480 ccgagtgcgg caagagcttt tccagatccg accatctgac caatcatcaa agaacccaca 540 ccggcgaaaa gccttataaa tgtcccgagt gcggcaaatc cttttccagc aagaaggctc 600 tgaccgagca tcaaaggacc cataccggcg agaagcctta caaatgcccc gagtgtggaa 660 agtcctttag cacccatctg gatctgatta gacaccagag gacacacacc ggagagaaac 720 ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780 gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840 cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900 agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960 tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020 gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080 tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200 aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260 gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320 acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380 agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440 ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500 tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560 tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620 aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680 gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740 ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800 acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860 accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920 acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980 aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040 cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100 cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaa 2227 <210> 63 <211> 2227 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 63 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgagaa accttacaaa tgccccgagt gcggcaagag cttcagcaga agcgacgatc 180 tggtgaggca ccaaagaacc cacaccggcg aaaaacctta caagtgtccc gaatgcggaa 240 agtccttcag cagagaggac aatctgcaca cccaccagag aacacacacc ggagaaaagc 300 cttacaagtg ccccgaatgc ggcaaatcct tttctagaag cgatcatctg accacccacc 360 aaagaacaca taccggcgag aagccttaca aatgtcccga gtgcggaaag tccttctccc 420 agagagccaa tctgagggct catcaaagga cccataccgg cgaaaagccc tacaaatgcc 480 ccgagtgcgg aaaatccttc agccagctgg cccatctgag agcccaccaa aggacacaca 540 ccggagagaa accctataag tgccccgagt gtggaaaaag cttttcccag agggccaatc 600 tgagggccca tcagaggacc cataccggag agaagcctta taaatgtccc gagtgcggaa 660 aaagcttcag cgagaggagc catctgaggg aacatcaaag aacccacacc ggcgaaaaac 720 ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780 gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840 cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900 agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960 tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020 gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080 tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200 aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260 gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320 acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380 agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440 ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500 tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560 tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620 aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680 gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740 ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800 acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860 accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920 acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980 aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040 cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100 cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaa 2227 <210> 64 <211> 2080 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 64 agtgtggaaa aagctttagc caaagcggcg atctgaggag acaccaaaga acacacaccg 60 gcgagaagcc ctacaaatgt cccgagtgcg gaaagagctt cagccagagc ggccatctga 120 ccgagcatca gagaacccat accggcgaaa aaccttataa gtgccccgag tgtggaaagt 180 ccttctccga gagatcccat ctgagagaac accagaggac acacaccggc gaaaaacctt 240 ataagtgtcc cgagtgcgga aagtccttca gcgatcccgg ccatctggtg agacatcaaa 300 ggacacatac cggcgaaaaa ccttataagt gtcccgaatg cggcaagagc tttagcagaa 360 acgacacact caccgaacac cagaggaccc acaccggcga gaaaccctac aaatgccccg 420 agtgcggcaa atccttttct agagccgaca atctgaccga acaccagagg acccataccg 480 gagaaaagcc ttacaaatgt cccgagtgtg gcaaatcctt ctccacccat ctggatctga 540 ttagacacca aagaacacat accggagaaa agcccaccgg aaaaaagacc agcgctagcg 600 gcagcggcgg cggcagcggc ggcgcccggg acagcaaggt ggagaacaag accaagaagc 660 tgcgggtgtt cgaggccttc gccggcatcg gcgcccagcg gaaggccctg gagaaggtgc 720 ggaaggacga gtacgagatc gtgggcctgg ccgagtggta cgtgcccgcc atcgtgatgt 780 accaggccat ccacaacaac ttccacacca agctggagta caagagcgtg agccgggagg 840 agatgatcga ctacctggag aacaagaccc tgagctggaa cagcaagaac cccgtgagca 900 acggctactg gaagcggaag aaggacgacg agctgaagat catctacaac gccatcaagc 960 tgagcgagaa ggagggcaac atcttcgaca tccgggacct gtacaagcgg accctgaaga 1020 acatcgacct gctgacctac agcttcccct gccaggacct gagccagcag ggcatccaga 1080 agggcatgaa gcggggcagc ggcacccgga gcggcctgct gtgggagatc gagcgggccc 1140 tggacagcac cgagaagaac gacctgccca agtacctgct gatggagaac gtgggcgccc 1200 tgctgcacaa gaagaacgag gaggagctga accagtggaa gcagaagctg gagagcctgg 1260 gctaccagaa cagcatcgag gtgctgaacg ccgccgactt cggcagcagc caggcccggc 1320 ggcgggtgtt catgatcagc accctgaacg agttcgtgga gctgcccaag ggcgacaaga 1380 agcccaagag catcaagaag gtgctgaaca agatcgtgag cgagaaggac atcctgaaca 1440 acctgctgaa gtacaacctg accgagttca agaaaaccaa gagcaacatc aacaaggcca 1500 gcctgatcgg ctacagcaag ttcaacagcg agggctacgt gtacgacccc gagttcaccg 1560 gccccaccct gaccgccagc ggcgccaaca gccggatcaa gatcaaggac ggcagcaaca 1620 tccggaagat gaacagcgac gagaccttcc tgtacatcgg cttcgacagc caggacggca 1680 agcgggtgaa cgagatcgag ttcctgaccg agaaccagaa gatcttcgtg tgcggcaaca 1740 gcatcagcgt ggaggtgctg gaggccatca tcgacaagat cggcggcccc agcagcggcg 1800 gcaagcggcc cgccgccacc aagaaggccg gccaggccaa gaagaagaag ggcagctacc 1860 cctacgacgt gcccgactac gcctgagcgg ccgcttaatt aagctgcctt ctgcggggct 1920 tgccttctgg ccatgccctt cttctctccc ttgcacctgt acctcttggt ctttgaataa 1980 agcctgagta ggaagtctag aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2040 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2080 <210> 65 <211> 1929 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 65 gccttataag tgccccgagt gtggcaaatc cttttccgac tgtagagatc tggccagaca 60 tcaaagaacc cacaccggag agaaacctta taaatgcccc gagtgcggca agtcctttag 120 ccataccggc catctgctgg agcaccagag gacccatacc ggcgagaagc cttacaaatg 180 ccccgagtgc ggcaaaagct tcagcagaaa tgacgctctg accgagcatc aaaggaccca 240 taccggcgaa aagccctaca agtgtcccga gtgtggaaag tccttctccc agagcggcga 300 tctgaggaga caccagagaa cacacaccgg cgagaaaccc tataaatgtc ccgagtgcgg 360 aaagagcttt agcgacagcg gcaatctgag ggtgcatcaa agaacacaca ccggcgaaaa 420 acccaccgga aaaaagacaa gcgctagcgg cagcggcggc ggcagcggcg gcgcccggga 480 cagcaaggtg gagaacaaga ccaagaagct gcgggtgttc gaggccttcg ccggcatcgg 540 cgcccagcgg aaggccctgg agaaggtgcg gaaggacgag tacgagatcg tgggcctggc 600 cgagtggtac gtgcccgcca tcgtgatgta ccaggccatc cacaacaact tccacaccaa 660 gctggagtac aagagcgtga gccgggagga gatgatcgac tacctggaga acaagaccct 720 gagctggaac agcaagaacc ccgtgagcaa cggctactgg aagcggaaga aggacgacga 780 gctgaagatc atctacaacg ccatcaagct gagcgagaag gagggcaaca tcttcgacat 840 ccgggacctg tacaagcgga ccctgaagaa catcgacctg ctgacctaca gcttcccctg 900 ccaggacctg agccagcagg gcatccagaa gggcatgaag cggggcagcg gcacccggag 960 cggcctgctg tgggagatcg agcgggccct ggacagcacc gagaagaacg acctgcccaa 1020 gtacctgctg atggagaacg tgggcgccct gctgcacaag aagaacgagg aggagctgaa 1080 ccagtggaag cagaagctgg agagcctggg ctaccagaac agcatcgagg tgctgaacgc 1140 cgccgacttc ggcagcagcc aggcccggcg gcgggtgttc atgatcagca ccctgaacga 1200 gttcgtggag ctgcccaagg gcgacaagaa gcccaagagc atcaagaagg tgctgaacaa 1260 gatcgtgagc gagaaggaca tcctgaacaa cctgctgaag tacaacctga ccgagttcaa 1320 gaaaaccaag agcaacatca acaaggccag cctgatcggc tacagcaagt tcaacagcga 1380 gggctacgtg tacgaccccg agttcaccgg ccccaccctg accgccagcg gcgccaacag 1440 ccggatcaag atcaaggacg gcagcaacat ccggaagatg aacagcgacg agaccttcct 1500 gtacatcggc ttcgacagcc aggacggcaa gcgggtgaac gagatcgagt tcctgaccga 1560 gaaccagaag atcttcgtgt gcggcaacag catcagcgtg gaggtgctgg aggccatcat 1620 cgacaagatc ggcggcccca gcagcggcgg caagcggccc gccgccacca agaaggccgg 1680 ccaggccaag aagaagaagg gcagctaccc ctacgacgtg cccgactacg cctgagcggc 1740 cgcttaatta agctgccttc tgcggggctt gccttctggc catgcccttc ttctctccct 1800 tgcacctgta cctcttggtc tttgaataaa gcctgagtag gaagtctaga aaaaaaaaaa 1860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1920 aaaaaaaaa 1929 <210> 66 <211> 1779 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 66 gacccatacc ggcgaaaagc cttacaagtg tcccgagtgc ggaaagtcct tctctagatc 60 cgacaacctc gtgaggcacc agagaaccca caccggcgag aaaccttaca aatgtcccga 120 gtgtggcaaa agcttttcta gaagcgacga gctggtgaga catcaaagaa cccataccgg 180 cgaaaaacct tataagtgtc ccgagtgcgg caaatccttt agccagctgg cccatctgag 240 ggcccaccag agaacacata ccggcgaaaa acccaccggc aaaaagacaa gcgctagcgg 300 cagcggcggc ggcagcggcg gcgcccggga cagcaaggtg gagaacaaga ccaagaagct 360 gcgggtgttc gaggccttcg ccggcatcgg cgcccagcgg aaggccctgg agaaggtgcg 420 gaaggacgag tacgagatcg tgggcctggc cgagtggtac gtgcccgcca tcgtgatgta 480 ccaggccatc cacaacaact tccacaccaa gctggagtac aagagcgtga gccgggagga 540 gatgatcgac tacctggaga acaagaccct gagctggaac agcaagaacc ccgtgagcaa 600 cggctactgg aagcggaaga aggacgacga gctgaagatc atctacaacg ccatcaagct 660 gagcgagaag gagggcaaca tcttcgacat ccgggacctg tacaagcgga ccctgaagaa 720 catcgacctg ctgacctaca gcttcccctg ccaggacctg agccagcagg gcatccagaa 780 gggcatgaag cggggcagcg gcacccggag cggcctgctg tgggagatcg agcgggccct 840 ggacagcacc gagaagaacg acctgcccaa gtacctgctg atggagaacg tgggcgccct 900 gctgcacaag aagaacgagg aggagctgaa ccagtggaag cagaagctgg agagcctggg 960 ctaccagaac agcatcgagg tgctgaacgc cgccgacttc ggcagcagcc aggcccggcg 1020 gcgggtgttc atgatcagca ccctgaacga gttcgtggag ctgcccaagg gcgacaagaa 1080 gcccaagagc atcaagaagg tgctgaacaa gatcgtgagc gagaaggaca tcctgaacaa 1140 cctgctgaag tacaacctga ccgagttcaa gaaaaccaag agcaacatca acaaggccag 1200 cctgatcggc tacagcaagt tcaacagcga gggctacgtg tacgaccccg agttcaccgg 1260 ccccaccctg accgccagcg gcgccaacag ccggatcaag atcaaggacg gcagcaacat 1320 ccggaagatg aacagcgacg agaccttcct gtacatcggc ttcgacagcc aggacggcaa 1380 gcgggtgaac gagatcgagt tcctgaccga gaaccagaag atcttcgtgt gcggcaacag 1440 catcagcgtg gaggtgctgg aggccatcat cgacaagatc ggcggcccca gcagcggcgg 1500 caagcggccc gccgccacca agaaggccgg ccaggccaag aagaagaagg gcagctaccc 1560 ctacgacgtg cccgactacg cctgagcggc cgcttaatta agctgccttc tgcggggctt 1620 gccttctggc catgcccttc ttctctccct tgcacctgta cctcttggtc tttgaataaa 1680 gcctgagtag gaagtctaga aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1740 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 1779 <210> 67 <211> 4829 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 67 aaggaaataa gagagaaaag aagagtaaga agaaatataa gagccaccat ggcccccaag 60 aagaagcgga aggtgggcat ccacggcgtg cccgccgccg acaagaagta cagcatcggc 120 ctggccatcg gcaccaacag cgtgggctgg gccgtgatca ccgacgagta caaggtgccc 180 agcaagaagt tcaaggtgct gggcaacacc gaccggcaca gcatcaagaa gaacctgatc 240 ggcgccctgc tgttcgacag cggcgagacc gccgaggcca cccggctgaa gcggaccgcc 300 cggcggcggt acacccggcg gaagaaccgg atctgctacc tgcaggagat cttcagcaac 360 gagatggcca aggtggacga cagcttcttc caccggctgg aggagagctt cctggtggag 420 gaggacaaga agcacgagcg gcaccccatc ttcggcaaca tcgtggacga ggtggcctac 480 cacgagaagt accccaccat ctaccacctg cggaagaagc tggtggacag caccgacaag 540 gccgacctgc ggctgatcta cctggccctg gcccacatga tcaagttccg gggccacttc 600 ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg acaagctgtt catccagctg 660 gtgcagacct acaaccagct gttcgaggag aaccccatca acgccagcgg cgtggacgcc 720 aaggccatcc tgagcgcccg gctgagcaag agccggcggc tggagaacct gatcgcccag 780 ctgcccggcg agaagaagaa cggcctgttc ggcaacctga tcgccctgag cctgggcctg 840 acccccaact tcaagagcaa cttcgacctg gccgaggacg ccaagctgca gctgagcaag 900 gacacctacg acgacgacct ggacaacctg ctggcccaga tcggcgacca gtacgccgac 960 ctgttcctgg ccgccaagaa cctgagcgac gccatcctgc tgagcgacat cctgcgggtg 1020 aacaccgaga tcaccaaggc ccccctgagc gccagcatga tcaagcggta cgacgagcac 1080 caccaggacc tgaccctgct gaaggccctg gtgcggcagc agctgcccga gaagtacaag 1140 gagatcttct tcgaccagag caagaacggc tacgccggct acatcgacgg cggcgccagc 1200 caggaggagt tctacaagtt catcaagccc atcctggaga agatggacgg caccgaggag 1260 ctgctggtga agctgaaccg ggaggacctg ctgcggaagc agcggacctt cgacaacggc 1320 agcatccccc accagatcca cctgggcgag ctgcacgcca tcctgcggcg gcaggaggac 1380 ttctacccct tcctgaagga caaccgggag aagatcgaga agatcctgac cttccggatc 1440 ccctactacg tgggccccct ggcccggggc aacagccggt tcgcctggat gacccggaaa 1500 tccgaggaga ccatcacccc ctggaacttc gaggaggtgg tggacaaggg cgccagcgcc 1560 cagagcttca tcgagcggat gaccaacttc gacaagaacc tgcccaacga gaaggtgctg 1620 cccaagcaca gcctgctgta cgagtacttc accgtgtaca acgagctgac caaggtgaag 1680 tacgtgaccg agggcatgcg gaagcccgcc ttcctgagcg gcgagcagaa gaaggccatc 1740 gtggacctgc tgttcaagac caaccggaag gtgaccgtga agcagctgaa ggaggactac 1800 ttcaagaaga tcgagtgctt cgacagcgtg gagatcagcg gcgtggagga ccggttcaac 1860 gccagcctgg gcacctacca cgacctgctg aagatcatca aggacaagga cttcctggac 1920 aacgaggaga acgaggacat cctggaggac atcgtgctga ccctgaccct gttcgaggac 1980 cgggagatga tcgaggagcg gctgaaaacc tacgcccacc tgttcgacga caaggtgatg 2040 aagcagctga agcggcggcg gtacaccggc tggggccggc tgagccggaa gctgatcaac 2100 ggcatccggg acaagcagag cggcaagacc atcctggact tcctgaaatc cgacggcttc 2160 gccaaccgga acttcatgca gctgatccac gacgacagcc tgaccttcaa ggaggacatc 2220 cagaaggccc aggtgagcgg ccagggcgac agcctgcacg agcacatcgc caacctggcc 2280 ggcagccccg ccatcaagaa gggcatcctg cagaccgtga aggtggtgga cgagctggtg 2340 aaggtgatgg gccggcacaa gcccgagaac atcgtgatcg agatggcccg ggagaaccag 2400 accacccaga agggccagaa gaacagccgg gagcggatga agcggatcga ggagggcatc 2460 aaggagctgg gcagccagat cctgaaggag caccccgtgg agaacaccca gctgcagaac 2520 gagaagctgt acctgtacta cctgcagaac ggccgggaca tgtacgtgga ccaggagctg 2580 gacatcaacc ggctgagcga ctacgacgtg gccgccatcg tgccccagag cttcctgaag 2640 gacgacagca tcgacaacaa ggtgctgacc cggagcgaca aggcccgggg caagagcgac 2700 aacgtgccca gcgaggaggt ggtgaagaag atgaagaact actggcggca gctgctgaac 2760 gccaagctga tcacccagcg gaagttcgac aacctgacca aggccgagcg gggcggcctg 2820 agcgagctgg acaaggccgg cttcatcaag cggcagctgg tggagacccg gcagatcacc 2880 aagcacgtgg cccagatcct ggacagccgg atgaacacca agtacgacga gaacgacaag 2940 ctgatccggg aggtgaaggt gatcaccctg aaatccaagc tggtgagcga cttccggaag 3000 gacttccagt tctacaaggt gcgggagatc aacaactacc accacgccca cgacgcctac 3060 ctgaacgccg tggtgggcac cgccctgatc aagaagtacc ccaagctgga gagcgagttc 3120 gtgtacggcg actacaaggt gtacgacgtg cggaagatga tcgccaagag cgagcaggag 3180 atcggcaagg ccaccgccaa gtacttcttc tacagcaaca tcatgaactt cttcaagacc 3240 gagatcaccc tggccaacgg cgagatccgg aagcggcccc tgatcgagac caacggcgag 3300 accggcgaga tcgtgtggga caagggccgg gacttcgcca ccgtgcggaa ggtgctgagc 3360 atgccccagg tgaacatcgt gaagaaaacc gaggtgcaga ccggcggctt cagcaaggag 3420 agcatcctgc ccaagcggaa cagcgacaag ctgatcgccc ggaagaagga ctgggacccc 3480 aagaagtacg gcggcttcga cagccccacc gtggcctaca gcgtgctggt ggtggccaag 3540 gtggagaagg gcaagagcaa gaagctgaaa tccgtgaagg agctgctggg catcaccatc 3600 atggagcgga gcagcttcga gaagaacccc atcgacttcc tggaggccaa gggctacaag 3660 gaggtgaaga aggacctgat catcaagctg cccaagtaca gcctgttcga gctggagaac 3720 ggccggaagc ggatgctggc cagcgccggc gagctgcaga agggcaacga gctggccctg 3780 cccagcaagt acgtgaactt cctgtacctg gccagccact acgagaagct gaagggcagc 3840 cccgaggaca acgagcagaa gcagctgttc gtggagcagc acaagcacta cctggacgag 3900 atcatcgagc agatcagcga gttcagcaag cgggtgatcc tggccgacgc caacctggac 3960 aaggtgctga gcgcctacaa caagcaccgg gacaagccca tccgggagca ggccgagaac 4020 atcatccacc tgttcaccct gaccaacctg ggcgcccccg ccgccttcaa gtacttcgac 4080 accaccatcg accggaagcg gtacaccagc accaaggagg tgctggacgc caccctgatc 4140 caccagagca tcaccggcct gtacgagacc cggatcgacc tgagccagct gggcggcgac 4200 aagcggcccg ccgccaccaa gaaggccggc caggccaaga agaagaaggc cagcgacgcc 4260 aagagcctga ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc 4320 acccgggagg agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg 4380 ctggagaact acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc 4440 ctgcggctgg agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggagacc 4500 caccccgaca gcgagaccgc cttcgagatc aagagcagcg tgagcggcgg caagcggccc 4560 gccgccacca agaaggccgg ccaggccaag aagaagaagg gcagctaccc ctacgacgtg 4620 cccgactacg cctgagcggc cgcttaatta agctgccttc tgcggggctt gccttctggc 4680 catgcccttc ttctctccct tgcacctgta cctcttggtc tttgaataaa gcctgagtag 4740 gaagtctaga aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 4800 aaaaaaaaaa aaaaaaaaaa aaaaaaaaa 4829 <210> 68 <211> 2591 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 68 gagttcgtgt acggcgacta caaggtgtac gacgtgcgga agatgatcgc caagagcgag 60 caggagatcg gcaaggccac cgccaagtac ttcttctaca gcaacatcat gaacttcttc 120 aagaccgaga tcaccctggc caacggcgag atccggaagc ggcccctgat cgagaccaac 180 ggcgagaccg gcgagatcgt gtgggacaag ggccgggact tcgccaccgt gcggaaggtg 240 ctgagcatgc cccaggtgaa catcgtgaag aaaaccgagg tgcagaccgg cggcttcagc 300 aaggagagca tcctgcccaa gcggaacagc gacaagctga tcgcccggaa gaaggactgg 360 gaccccaaga agtacggcgg cttcgacagc cccaccgtgg cctacagcgt gctggtggtg 420 gccaaggtgg agaagggcaa gagcaagaag ctgaaatccg tgaaggagct gctgggcatc 480 accatcatgg agcggagcag cttcgagaag aaccccatcg acttcctgga ggccaagggc 540 tacaaggagg tgaagaagga cctgatcatc aagctgccca agtacagcct gttcgagctg 600 gagaacggcc ggaagcggat gctggccagc gccggcgagc tgcagaaggg caacgagctg 660 gccctgccca gcaagtacgt gaacttcctg tacctggcca gccactacga gaagctgaag 720 ggcagccccg aggacaacga gcagaagcag ctgttcgtgg agcagcacaa gcactacctg 780 gacgagatca tcgagcagat cagcgagttc agcaagcggg tgatcctggc cgacgccaac 840 ctggacaagg tgctgagcgc ctacaacaag caccgggaca agcccatccg ggagcaggcc 900 gagaacatca tccacctgtt caccctgacc aacctgggcg cccccgccgc cttcaagtac 960 ttcgacacca ccatcgaccg gaagcggtac accagcacca aggaggtgct ggacgccacc 1020 ctgatccacc agagcatcac cggcctgtac gagacccgga tcgacctgag ccagctgggc 1080 ggcgacaagc ggcccgccgc caccaagaag gccggccagg ccaagaagaa gaaggcccgg 1140 gacagcaagg tggagaacaa gaccaagaag ctgcgggtgt tcgaggcctt cgccggcatc 1200 ggcgcccagc ggaaggccct ggagaaggtg cggaaggacg agtacgagat cgtgggcctg 1260 gccgagtggt acgtgcccgc catcgtgatg taccaggcca tccacaacaa cttccacacc 1320 aagctggagt acaagagcgt gagccgggag gagatgatcg actacctgga gaacaagacc 1380 ctgagctgga acagcaagaa ccccgtgagc aacggctact ggaagcggaa gaaggacgac 1440 gagctgaaga tcatctacaa cgccatcaag ctgagcgaga aggagggcaa catcttcgac 1500 atccgggacc tgtacaagcg gaccctgaag aacatcgacc tgctgaccta cagcttcccc 1560 tgccaggacc tgagccagca gggcatccag aagggcatga agcggggcag cggcacccgg 1620 agcggcctgc tgtgggagat cgagcgggcc ctggacagca ccgagaagaa cgacctgccc 1680 aagtacctgc tgatggagaa cgtgggcgcc ctgctgcaca agaagaacga ggaggagctg 1740 aaccagtgga agcagaagct ggagagcctg ggctaccaga acagcatcga ggtgctgaac 1800 gccgccgact tcggcagcag ccaggcccgg cggcgggtgt tcatgatcag caccctgaac 1860 gagttcgtgg agctgcccaa gggcgacaag aagcccaaga gcatcaagaa ggtgctgaac 1920 aagatcgtga gcgagaagga catcctgaac aacctgctga agtacaacct gaccgagttc 1980 aagaaaacca agagcaacat caacaaggcc agcctgatcg gctacagcaa gttcaacagc 2040 gagggctacg tgtacgaccc cgagttcacc ggccccaccc tgaccgccag cggcgccaac 2100 agccggatca agatcaagga cggcagcaac atccggaaga tgaacagcga cgagaccttc 2160 ctgtacatcg gcttcgacag ccaggacggc aagcgggtga acgagatcga gttcctgacc 2220 gagaaccaga agatcttcgt gtgcggcaac agcatcagcg tggaggtgct ggaggccatc 2280 atcgacaaga tcggcggccc cagcagcggc ggcaagcggc ccgccgccac caagaaggcc 2340 ggccaggcca agaagaagaa gggcagctac ccctacgacg tgcccgacta cgcctgagcg 2400 gccgcttaat taagctgcct tctgcggggc ttgccttctg gccatgccct tcttctctcc 2460 cttgcacctg tacctcttgg tctttgaata aagcctgagt aggaagtcta gaaaaaaaaa 2520 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2580 aaaaaaaaaa a 2591 <210> 69 <211> 6010 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 69 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120 tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180 gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240 gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300 ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360 agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420 aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480 acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540 ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600 tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660 tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720 aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780 tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840 cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900 acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960 tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020 acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080 accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140 agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200 aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260 tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320 gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380 tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440 cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500 ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560 agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620 ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680 acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740 tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800 tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860 ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920 acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980 gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040 agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100 gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160 ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220 agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280 gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340 aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400 ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460 aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520 agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580 acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640 acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700 acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760 ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820 gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880 agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940 tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000 acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060 tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120 tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180 tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240 agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300 ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360 tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420 gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480 agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540 tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600 tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660 aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720 gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780 ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840 ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900 tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960 aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020 tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080 ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140 accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200 gcggcggcaa gcggcccgcc gccaccaaga aggccggcca ggccaagaag aagaagtcgg 4260 gcgggggtgg ctcagtggat ctgaggacac tcgacgtgtt tagcggatgc ggcggactct 4320 ccgaaggctt ccaccaagcc ggaatttccg acacactctg ggccattgag atgtgggacc 4380 ccgccgctca agccttcaga ctgaataatc ccggctccac cgtgttcacc gaggactgca 4440 acattctgct gaagctggtg atggctggcg aaaccaccaa ctctagaggc cagaggctgc 4500 cccagaaggg agatgtggaa atgctctgtg gaggccctcc ttgccaaggc ttctccggca 4560 tgaacaggtt caactctaga acatacagca agttcaagaa ctctctggtc gtgagctttc 4620 tgagctactg cgactactat agacctaggt tctttctgct ggagaacgtg agaaatttcg 4680 tgtccttcaa gaggagcatg gtgctgaagc tgacactgag gtgtctggtg aggatgggct 4740 accagtgcac attcggagtg ctgcaagctg gccagtacgg cgtggcccag accagaagga 4800 gggccatcat tctggctgct gcccccggcg agaaactccc tctgttcccc gagcccctcc 4860 acgtgttcgc ccctagagct tgccagctga gcgtggtggt cgacgataag aagttcgtga 4920 gcaacatcac aaggctgtcc agcggaccct tcagaaccat taccgtgagg gataccatgt 4980 ccgacctccc cgaggtgagg aatggcgcca gcgctctgga gatttcctac aacggcgaac 5040 ctcagagctg gttccaaagg cagctgagag gcgctcagta tcagcccatt ctgagggacc 5100 acatctgcaa agatatgagc gctctggtgg ccgctagaat gagacatatt cctctggccc 5160 ccggcagcga ctggagagat ctgcccaata ttgaggtgag actcagcgac ggaacaatgg 5220 ctagaaaact gaggtacacc catcatgata gaaagaacgg aaggagcagc agcggcgctc 5280 tgagaggagt gtgtagctgc gtggaagctg gcaaggcttg cgatcccgcc gctaggcagt 5340 tcaataccct catcccttgg tgtctgcctc acaccggcaa cagacacaat cattgggctg 5400 gactgtatgg aaggctcgaa tgggacggct ttttcagcac caccgtgacc aatcccgaac 5460 ctatgggcaa gcaaggaagg gtgctccacc ccgagcagca tagagtcgtg tccgtgagag 5520 aatgcgctag aagccaaggc ttccccgaca cctatagact gttcggcaac attctggata 5580 agcacagaca agtgggaaat gctgtccctc ctcctctggc caaggctatc ggactggaga 5640 tcaagctgtg tatgctcgcc aaagctaggg agagcgcttc cgccaagatt aaggaggagg 5700 aggccgccaa ggacggaggt ggcggatcgg gaaagcggcc cgccgccacc aagaaggccg 5760 gtcaggccaa gaagaagaag ggcagctacc cctacgacgt gcccgactac gcctgagcgg 5820 ccgcttaatt aagctgcctt ctgcggggct tgccttctgg ccatgccctt cttctctccc 5880 ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtctag aaaaaaaaaa 5940 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6000 aaaaaaaaaa 6010 <210> 70 <211> 6202 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 70 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccga caagaagtac agcatcggcc 120 tggccatcgg caccaacagc gtgggctggg ccgtgatcac cgacgagtac aaggtgccca 180 gcaagaagtt caaggtgctg ggcaacaccg accggcacag catcaagaag aacctgatcg 240 gcgccctgct gttcgacagc ggcgagaccg ccgaggccac ccggctgaag cggaccgccc 300 ggcggcggta cacccggcgg aagaaccgga tctgctacct gcaggagatc ttcagcaacg 360 agatggccaa ggtggacgac agcttcttcc accggctgga ggagagcttc ctggtggagg 420 aggacaagaa gcacgagcgg caccccatct tcggcaacat cgtggacgag gtggcctacc 480 acgagaagta ccccaccatc taccacctgc ggaagaagct ggtggacagc accgacaagg 540 ccgacctgcg gctgatctac ctggccctgg cccacatgat caagttccgg ggccacttcc 600 tgatcgaggg cgacctgaac cccgacaaca gcgacgtgga caagctgttc atccagctgg 660 tgcagaccta caaccagctg ttcgaggaga accccatcaa cgccagcggc gtggacgcca 720 aggccatcct gagcgcccgg ctgagcaaga gccggcggct ggagaacctg atcgcccagc 780 tgcccggcga gaagaagaac ggcctgttcg gcaacctgat cgccctgagc ctgggcctga 840 cccccaactt caagagcaac ttcgacctgg ccgaggacgc caagctgcag ctgagcaagg 900 acacctacga cgacgacctg gacaacctgc tggcccagat cggcgaccag tacgccgacc 960 tgttcctggc cgccaagaac ctgagcgacg ccatcctgct gagcgacatc ctgcgggtga 1020 acaccgagat caccaaggcc cccctgagcg ccagcatgat caagcggtac gacgagcacc 1080 accaggacct gaccctgctg aaggccctgg tgcggcagca gctgcccgag aagtacaagg 1140 agatcttctt cgaccagagc aagaacggct acgccggcta catcgacggc ggcgccagcc 1200 aggaggagtt ctacaagttc atcaagccca tcctggagaa gatggacggc accgaggagc 1260 tgctggtgaa gctgaaccgg gaggacctgc tgcggaagca gcggaccttc gacaacggca 1320 gcatccccca ccagatccac ctgggcgagc tgcacgccat cctgcggcgg caggaggact 1380 tctacccctt cctgaaggac aaccgggaga agatcgagaa gatcctgacc ttccggatcc 1440 cctactacgt gggccccctg gcccggggca acagccggtt cgcctggatg acccggaaat 1500 ccgaggagac catcaccccc tggaacttcg aggaggtggt ggacaagggc gccagcgccc 1560 agagcttcat cgagcggatg accaacttcg acaagaacct gcccaacgag aaggtgctgc 1620 ccaagcacag cctgctgtac gagtacttca ccgtgtacaa cgagctgacc aaggtgaagt 1680 acgtgaccga gggcatgcgg aagcccgcct tcctgagcgg cgagcagaag aaggccatcg 1740 tggacctgct gttcaagacc aaccggaagg tgaccgtgaa gcagctgaag gaggactact 1800 tcaagaagat cgagtgcttc gacagcgtgg agatcagcgg cgtggaggac cggttcaacg 1860 ccagcctggg cacctaccac gacctgctga agatcatcaa ggacaaggac ttcctggaca 1920 acgaggagaa cgaggacatc ctggaggaca tcgtgctgac cctgaccctg ttcgaggacc 1980 gggagatgat cgaggagcgg ctgaaaacct acgcccacct gttcgacgac aaggtgatga 2040 agcagctgaa gcggcggcgg tacaccggct ggggccggct gagccggaag ctgatcaacg 2100 gcatccggga caagcagagc ggcaagacca tcctggactt cctgaaatcc gacggcttcg 2160 ccaaccggaa cttcatgcag ctgatccacg acgacagcct gaccttcaag gaggacatcc 2220 agaaggccca ggtgagcggc cagggcgaca gcctgcacga gcacatcgcc aacctggccg 2280 gcagccccgc catcaagaag ggcatcctgc agaccgtgaa ggtggtggac gagctggtga 2340 aggtgatggg ccggcacaag cccgagaaca tcgtgatcga gatggcccgg gagaaccaga 2400 ccacccagaa gggccagaag aacagccggg agcggatgaa gcggatcgag gagggcatca 2460 aggagctggg cagccagatc ctgaaggagc accccgtgga gaacacccag ctgcagaacg 2520 agaagctgta cctgtactac ctgcagaacg gccgggacat gtacgtggac caggagctgg 2580 acatcaaccg gctgagcgac tacgacgtgg ccgccatcgt gccccagagc ttcctgaagg 2640 acgacagcat cgacaacaag gtgctgaccc ggagcgacaa ggcccggggc aagagcgaca 2700 acgtgcccag cgaggaggtg gtgaagaaga tgaagaacta ctggcggcag ctgctgaacg 2760 ccaagctgat cacccagcgg aagttcgaca acctgaccaa ggccgagcgg ggcggcctga 2820 gcgagctgga caaggccggc ttcatcaagc ggcagctggt ggagacccgg cagatcacca 2880 agcacgtggc ccagatcctg gacagccgga tgaacaccaa gtacgacgag aacgacaagc 2940 tgatccggga ggtgaaggtg atcaccctga aatccaagct ggtgagcgac ttccggaagg 3000 acttccagtt ctacaaggtg cgggagatca acaactacca ccacgcccac gacgcctacc 3060 tgaacgccgt ggtgggcacc gccctgatca agaagtaccc caagctggag agcgagttcg 3120 tgtacggcga ctacaaggtg tacgacgtgc ggaagatgat cgccaagagc gagcaggaga 3180 tcggcaaggc caccgccaag tacttcttct acagcaacat catgaacttc ttcaagaccg 3240 agatcaccct ggccaacggc gagatccgga agcggcccct gatcgagacc aacggcgaga 3300 ccggcgagat cgtgtgggac aagggccggg acttcgccac cgtgcggaag gtgctgagca 3360 tgccccaggt gaacatcgtg aagaaaaccg aggtgcagac cggcggcttc agcaaggaga 3420 gcatcctgcc caagcggaac agcgacaagc tgatcgcccg gaagaaggac tgggacccca 3480 agaagtacgg cggcttcgac agccccaccg tggcctacag cgtgctggtg gtggccaagg 3540 tggagaaggg caagagcaag aagctgaaat ccgtgaagga gctgctgggc atcaccatca 3600 tggagcggag cagcttcgag aagaacccca tcgacttcct ggaggccaag ggctacaagg 3660 aggtgaagaa ggacctgatc atcaagctgc ccaagtacag cctgttcgag ctggagaacg 3720 gccggaagcg gatgctggcc agcgccggcg agctgcagaa gggcaacgag ctggccctgc 3780 ccagcaagta cgtgaacttc ctgtacctgg ccagccacta cgagaagctg aagggcagcc 3840 ccgaggacaa cgagcagaag cagctgttcg tggagcagca caagcactac ctggacgaga 3900 tcatcgagca gatcagcgag ttcagcaagc gggtgatcct ggccgacgcc aacctggaca 3960 aggtgctgag cgcctacaac aagcaccggg acaagcccat ccgggagcag gccgagaaca 4020 tcatccacct gttcaccctg accaacctgg gcgcccccgc cgccttcaag tacttcgaca 4080 ccaccatcga ccggaagcgg tacaccagca ccaaggaggt gctggacgcc accctgatcc 4140 accagagcat caccggcctg tacgagaccc ggatcgacct gagccagctg ggcggcgaca 4200 gcgccggcgg cggcggcagc ggcggcggcg gcagcggcgg cggcggcagc ggccccaaga 4260 agaagcggaa ggtggccgcc gccggcagca accacgacca ggagttcgac ccccccaagg 4320 tgtacccccc cgtgcccgcc gagaagcgga agcccatccg ggtgctgagc ctgttcgacg 4380 gcatcgccac cggcctgctg gtgctgaagg acctgggcat ccaggtggac cggtacatcg 4440 ccagcgaggt gtgcgaggac agcatcaccg tgggcatggt gcggcaccag ggcaagatca 4500 tgtacgtggg cgacgtgcgg agcgtgaccc agaagcacat ccaggagtgg ggccccttcg 4560 acctggtgat cggcggcagc ccctgcaacg acctgagcat cgtgaacccc gcccggaagg 4620 gcctgtacga gggcaccggc cggctgttct tcgagttcta ccggctgctg cacgacgccc 4680 ggcccaagga gggcgacgac cggcccttct tctggctgtt cgagaacgtg gtggccatgg 4740 gcgtgagcga caagcgggac atcagccggt tcctggagag caaccccgtg atgatcgacg 4800 ccaaggaggt gagcgccgcc caccgggccc ggtacttctg gggcaacctg cccggcatga 4860 accggcccct ggccagcacc gtgaacgaca agctggagct gcaggagtgc ctggagcacg 4920 gccggatcgc caagttcagc aaggtgcgga ccatcaccac ccggagcaac agcatcaagc 4980 agggcaagga ccagcacttc cccgtgttca tgaacgagaa ggaggacatc ctgtggtgca 5040 ccgagatgga gcgggtgttc ggcttccccg tgcactacac cgacgtgagc aacatgagcc 5100 ggctggcccg gcagcggctg ctgggccgga gctggagcgt gcccgtgatc cggcacctgt 5160 tcgcccccct gaaggagtac ttcgcctgcg tgagcagcgg caacagcaac gccaacagcc 5220 ggggccccag cttcagcagc ggcctggtgc ccctgagcct gcggggcagc cacatgaatc 5280 ctctggagat gttcgagaca gtgcccgtgt ggagaaggca acccgtgagg gtgctgagcc 5340 tcttcgagga cattaagaag gagctgacct ctctgggctt tctggaatcc ggcagcgacc 5400 ccggccagct gaaacacgtg gtggacgtga ccgacacagt gaggaaggac gtggaagagt 5460 ggggcccctt tgacctcgtg tatggagcca cacctcctct cggccacaca tgcgataggc 5520 ctcccagctg gtatctcttc cagttccaca gactgctcca gtacgccaga cctaagcccg 5580 gcagccccag acccttcttc tggatgttcg tggacaatct ggtgctgaac aaggaggatc 5640 tggatgtggc cagcagattt ctggagatgg aacccgtgac aatccccgac gtgcatggcg 5700 gctctctgca gaacgccgtg agagtgtggt ccaacatccc cgccattaga agcagacact 5760 gggctctggt gagcgaggag gaactgtctc tgctggccca gaataagcag tcctccaagc 5820 tggccgccaa gtggcccacc aagctggtga agaactgctt tctgcctctg agggagtatt 5880 tcaagtattt cagcaccgaa ctgaccagca gcctgagcgg cggcaagcgg cccgccgcca 5940 ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 6000 acgcctgagc ggccgcttaa ttaagctgcc ttctgcgggg cttgccttct ggccatgccc 6060 ttcttctctc ccttgcacct gtacctcttg gtctttgaat aaagcctgag taggaagtct 6120 agaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 6180 aaaaaaaaaa aaaaaaaaaa aa 6202 <210> 71 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (1)..(1) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (3)..(3) <223> a, c, t, g, unknown or other <400> 71 nbndccdsha grkgghrshv 20 <210> 72 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (18)..(18) <223> a, c, t, g, unknown or other <220> <221> modified_base <222> (20)..(20) <223> a, c, t, g, unknown or other <400> 72 vhsrhggkrg ahsdccdnbn 20 <210> 73 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (8)..(8) <223> a, c, t, g, unknown or other <400> 73 ccgccatntt 10 <210> 74 <211> 10 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <220> <221> modified_base <222> (3)..(3) <223> a, c, t, g, unknown or other <400> 74 aanatggcgg 10 <210> 75 <211> 21 <212> DNA <213> Homo sapiens <400> 75 gctggaaacc ttgcacctcg g 21 <210> 76 <211> 21 <212> DNA <213> Homo sapiens <400> 76 ctgctgccag tagagggcac a 21 <210> 77 <211> 21 <212> DNA <213> Homo sapiens <400> 77 gcccagagag ggggcggagg g 21 <210> 78 <211> 21 <212> DNA <213> Homo sapiens <400> 78 acgcggggag caaccaatcg c 21 <210> 79 <211> 21 <212> DNA <213> Homo sapiens <400> 79 actggcagca gagatcatcg c 21 <210> 80 <211> 21 <212> DNA <213> Homo sapiens <400> 80 gggggcagga gcaggagcgt c 21 <210> 81 <211> 21 <212> DNA <213> Homo sapiens <400> 81 cagccttagc gaggcgccct g 21 <210> 82 <211> 21 <212> DNA <213> Homo sapiens <400> 82 actcacagga caaggatgcg g 21 <210> 83 <211> 21 <212> DNA <213> Homo sapiens <400> 83 agcaaaagaa aatggtaggc g 21 <210> 84 <211> 21 <212> DNA <213> Homo sapiens <400> 84 actcagccgg gcagccgagc a 21 <210> 85 <211> 21 <212> DNA <213> Homo sapiens <400> 85 cgtaccaggc tgcagggcgc c 21 <210> 86 <211> 21 <212> DNA <213> Homo sapiens <400> 86 agagtggagg aaagaagggt a 21 <210> 87 <211> 386 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 87 Met Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val Phe Glu Ala 1 5 10 15 Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys Val Arg Lys 20 25 30 Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val Pro Ala Ile 35 40 45 Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys Leu Glu Tyr 50 55 60 Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu Asn Lys Thr 65 70 75 80 Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg 85 90 95 Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser 100 105 110 Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr 115 120 125 Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu 130 135 140 Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg 145 150 155 160 Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys 165 170 175 Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu Leu 180 185 190 His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys Leu Glu 195 200 205 Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala Ala Asp Phe 210 215 220 Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser Thr Leu Asn 225 230 235 240 Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys Ser Ile Lys 245 250 255 Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu Asn Asn Leu 260 265 270 Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser Asn Ile Asn 275 280 285 Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu Gly Tyr Val 290 295 300 Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser Gly Ala Asn 305 310 315 320 Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys Met Asn Ser 325 330 335 Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg 340 345 350 Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys 355 360 365 Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile 370 375 380 Gly Gly 385 <210> 88 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 88 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser 20 <210> 89 <211> 29 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 89 Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1 5 10 15 Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 20 25 <210> 90 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 90 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1 5 <210> 91 <211> 1123 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 91 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn 115 120 125 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp 645 650 655 Val Pro Asp Tyr Ala Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 660 665 670 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 675 680 685 Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly 690 695 700 Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Glu 705 710 715 720 Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ile 725 730 735 His Gly Val Pro Ala Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu 740 745 750 Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp 755 760 765 Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys 770 775 780 Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg 785 790 795 800 His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys 805 810 815 Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr 820 825 830 His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe 835 840 845 Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu 850 855 860 Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala 865 870 875 880 His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys 885 890 895 Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu 900 905 910 His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys 915 920 925 Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr 930 935 940 His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser 945 950 955 960 Gly Gly Gly Ser Gly Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg 965 970 975 Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu 980 985 990 Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met 995 1000 1005 Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr 1010 1015 1020 Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp 1025 1030 1035 Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu 1040 1045 1050 Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg Pro 1055 1060 1065 Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 1070 1075 1080 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Ser Gly Gly Lys Arg 1085 1090 1095 Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly 1100 1105 1110 Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1115 1120 <210> 92 <211> 1123 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 92 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln 340 345 350 Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ala Thr Asn Phe Ser 370 375 380 Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser 385 390 395 400 Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 405 410 415 Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Glu Gly Ser Ser Gly Ser 420 425 430 Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 435 440 445 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 450 455 460 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His 465 470 475 480 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 485 490 495 Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His 500 505 510 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 515 520 525 Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys 530 535 540 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn 545 550 555 560 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 565 570 575 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 580 585 590 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 595 600 605 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 610 615 620 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 625 630 635 640 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 645 650 655 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 660 665 670 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 675 680 685 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 690 695 700 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 705 710 715 720 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 725 730 735 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 740 745 750 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 755 760 765 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 770 775 780 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 785 790 795 800 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 805 810 815 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 820 825 830 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 835 840 845 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 850 855 860 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 865 870 875 880 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 885 890 895 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 900 905 910 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 915 920 925 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 930 935 940 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 945 950 955 960 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 965 970 975 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 980 985 990 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 995 1000 1005 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln 1010 1015 1020 Asp Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln 1025 1030 1035 Lys Ile Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu 1040 1045 1050 Ala Ile Ile Asp Lys Ile Gly Gly Pro Ser Gly Gly Lys Arg Pro 1055 1060 1065 Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 1070 1075 1080 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Ser Gly Gly Lys Arg 1085 1090 1095 Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly 1100 1105 1110 Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1115 1120 <210> 93 <211> 3332 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 93 gcggcaaatc cttttctaga agcgatcatc tgaccaccca ccaaagaaca cataccggcg 60 agaagcctta caaatgtccc gagtgcggaa agtccttctc ccagagagcc aatctgaggg 120 ctcatcaaag gacccatacc ggcgaaaagc cctacaaatg ccccgagtgc ggaaaatcct 180 tcagccagct ggcccatctg agagcccacc aaaggacaca caccggagag aaaccctata 240 agtgccccga gtgtggaaaa agcttttccc agagggccaa tctgagggcc catcagagga 300 cccataccgg agagaagcct tataaatgtc ccgagtgcgg aaaaagcttc agcgagagga 360 gccatctgag ggaacatcaa agaacccaca ccggcgaaaa acccaccgga aaaaagacca 420 gcgctagcgg cagcggcggc ggcagcggcg gcgcccggga cagcaaggtg gagaacaaga 480 ccaagaagct gcgggtgttc gaggccttcg ccggcatcgg cgcccagcgg aaggccctgg 540 agaaggtgcg gaaggacgag tacgagatcg tgggcctggc cgagtggtac gtgcccgcca 600 tcgtgatgta ccaggccatc cacaacaact tccacaccaa gctggagtac aagagcgtga 660 gccgggagga gatgatcgac tacctggaga acaagaccct gagctggaac agcaagaacc 720 ccgtgagcaa cggctactgg aagcggaaga aggacgacga gctgaagatc atctacaacg 780 ccatcaagct gagcgagaag gagggcaaca tcttcgacat ccgggacctg tacaagcgga 840 ccctgaagaa catcgacctg ctgacctaca gcttcccctg ccaggacctg agccagcagg 900 gcatccagaa gggcatgaag cggggcagcg gcacccggag cggcctgctg tgggagatcg 960 agcgggccct ggacagcacc gagaagaacg acctgcccaa gtacctgctg atggagaacg 1020 tgggcgccct gctgcacaag aagaacgagg aggagctgaa ccagtggaag cagaagctgg 1080 agagcctggg ctaccagaac agcatcgagg tgctgaacgc cgccgacttc ggcagcagcc 1140 aggcccggcg gcgggtgttc atgatcagca ccctgaacga gttcgtggag ctgcccaagg 1200 gcgacaagaa gcccaagagc atcaagaagg tgctgaacaa gatcgtgagc gagaaggaca 1260 tcctgaacaa cctgctgaag tacaacctga ccgagttcaa gaaaaccaag agcaacatca 1320 acaaggccag cctgatcggc tacagcaagt tcaacagcga gggctacgtg tacgaccccg 1380 agttcaccgg ccccaccctg accgccagcg gcgccaacag ccggatcaag atcaaggacg 1440 gcagcaacat ccggaagatg aacagcgacg agaccttcct gtacatcggc ttcgacagcc 1500 aggacggcaa gcgggtgaac gagatcgagt tcctgaccga gaaccagaag atcttcgtgt 1560 gcggcaacag catcagcgtg gaggtgctgg aggccatcat cgacaagatc ggcggcccca 1620 gcagcggcgg caagcggccc gccgccacca agaaggccgg ccaggccaag aagaagaagg 1680 gcagctaccc ctacgacgtg cccgactacg ccgggtccta cccgtacgac gtgcccgatt 1740 acgccgccac caacttctcg ctgctgaagc aggccggaga tgtggaagaa aaccctggac 1800 ctaccagtgc cggaaagctc ggtagcggag agggtcgggg aagcctgctt acttgcggcg 1860 acgtggaaga gaaccccggt ccgctggagg gttcgtccgg ctccggatcc cccaagaaga 1920 agcggaaggt gggcatccac ggcgtgcccg ccgccggcag cagcggatcc ctggagcccg 1980 gcgaaaaacc ttacaagtgc cccgagtgcg gaaagagctt cagcagaagc gacaaactgg 2040 tgaggcatca aaggacacat accggagaga agccctataa gtgccccgaa tgtggcaaat 2100 ccttttccca gagggctcat ctggaaagac accagaggac ccataccggc gaaaaaccct 2160 acaaatgtcc cgagtgtgga aagagctttt ccgatcccgg ccatctggtc agacatcaga 2220 ggacacatac cggcgaaaag ccttacaagt gtcccgaatg cggaaaatcc ttctccagaa 2280 gcgacaagct ggtgaggcac caaagaaccc acaccggcga aaaaccctat aaatgccccg 2340 agtgcggcaa gtcctttagc cagctggccc atctgagagc ccaccagaga acacacaccg 2400 gagagaagcc ttataagtgt cccgagtgcg gaaagtcctt ctctagagcc gacaatctga 2460 ccgaacatca aaggacacac accggcgaga aaccttataa atgccccgag tgcggaaaaa 2520 gcttttccga ctgcagagat ctggctagac accagagaac ccacaccggc gagaaaccca 2580 ccggcaaaaa gaccagcgct agcggcagcg gcggcggcag cggcggcgac gccaagagcc 2640 tgaccgcctg gagccggacc ctggtgacct tcaaggacgt gttcgtggac ttcacccggg 2700 aggagtggaa gctgctggac accgcccagc agatcctgta ccggaacgtg atgctggaga 2760 actacaagaa cctggtgagc ctgggctacc agctgaccaa gcccgacgtg atcctgcggc 2820 tggagaaggg cgaggagccc tggctggtgg agcgggagat ccaccaggag acccaccccg 2880 acagcgagac cgccttcgag atcaagagca gcgtgagcgg cggcaagcgg cccgccgcca 2940 ccaagaaggc cggccaggcc aagaagaaga agggcagcta cccctacgac gtgcccgact 3000 acgcctgaag cagcggcggc aagcggcccg ccgccaccaa gaaggccggc caggccaaga 3060 agaagaaggg cagctacccc tacgacgtgc ccgactacgc ctgagcggcc gcttaattaa 3120 gctgccttct gcggggcttg ccttctggcc atgcccttct tctctccctt gcacctgtac 3180 ctcttggtct ttgaataaag cctgagtagg aagtctagaa aaaaaaaaaa aaaaaaaaaa 3240 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3300 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aa 3332 <210> 94 <211> 3012 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 94 tataaatgcc ccgagtgcgg aaaaagcttt tccgactgca gagatctggc tagacaccag 60 agaacccaca ccggcgagaa acccaccggc aaaaagacca gcgctagcgg cagcggcggc 120 ggcagcggcg gcgacgccaa gagcctgacc gcctggagcc ggaccctggt gaccttcaag 180 gacgtgttcg tggacttcac ccgggaggag tggaagctgc tggacaccgc ccagcagatc 240 ctgtaccgga acgtgatgct ggagaactac aagaacctgg tgagcctggg ctaccagctg 300 accaagcccg acgtgatcct gcggctggag aagggcgagg agccctggct ggtggagcgg 360 gagatccacc aggagaccca ccccgacagc gagaccgcct tcgagatcaa gagcagcgtg 420 agcagcggcg gcaagcggcc cgccgccacc aagaaggccg gccaggccaa gaagaagaag 480 ggcagctacc cctacgacgt gcccgactac gccgggtcct acccgtacga cgtgcccgat 540 tacgccgcca ccaacttctc gctgctgaag caggccggag atgtggaaga aaaccctgga 600 cctaccagtg ccggaaagct cggtagcgga gagggtcggg gaagcctgct tacttgcggc 660 gacgtggaag agaaccccgg tccgctggag ggttcgtccg gctccggatc ccccaagaag 720 aagcggaagg tgggcatcca cggcgtgccc gccgccggca gcagcggatc cctggagccc 780 ggcgagaaac cttacaaatg ccccgagtgc ggcaagagct tcagcagaag cgacgatctg 840 gtgaggcacc aaagaaccca caccggcgaa aaaccttaca agtgtcccga atgcggaaag 900 tccttcagca gagaggacaa tctgcacacc caccagagaa cacacaccgg agaaaagcct 960 tacaagtgcc ccgaatgcgg caaatccttt tctagaagcg atcatctgac cacccaccaa 1020 agaacacata ccggcgagaa gccttacaaa tgtcccgagt gcggaaagtc cttctcccag 1080 agagccaatc tgagggctca tcaaaggacc cataccggcg aaaagcccta caaatgcccc 1140 gagtgcggaa aatccttcag ccagctggcc catctgagag cccaccaaag gacacacacc 1200 ggagagaaac cctataagtg ccccgagtgt ggaaaaagct tttcccagag ggccaatctg 1260 agggcccatc agaggaccca taccggagag aagccttata aatgtcccga gtgcggaaaa 1320 agcttcagcg agaggagcca tctgagggaa catcaaagaa cccacaccgg cgaaaaaccc 1380 accggaaaaa agaccagcgc tagcggcagc ggcggcggca gcggcggcgc ccgggacagc 1440 aaggtggaga acaagaccaa gaagctgcgg gtgttcgagg ccttcgccgg catcggcgcc 1500 cagcggaagg ccctggagaa ggtgcggaag gacgagtacg agatcgtggg cctggccgag 1560 tggtacgtgc ccgccatcgt gatgtaccag gccatccaca acaacttcca caccaagctg 1620 gagtacaaga gcgtgagccg ggaggagatg atcgactacc tggagaacaa gaccctgagc 1680 tggaacagca agaaccccgt gagcaacggc tactggaagc ggaagaagga cgacgagctg 1740 aagatcatct acaacgccat caagctgagc gagaaggagg gcaacatctt cgacatccgg 1800 gacctgtaca agcggaccct gaagaacatc gacctgctga cctacagctt cccctgccag 1860 gacctgagcc agcagggcat ccagaagggc atgaagcggg gcagcggcac ccggagcggc 1920 ctgctgtggg agatcgagcg ggccctggac agcaccgaga agaacgacct gcccaagtac 1980 ctgctgatgg agaacgtggg cgccctgctg cacaagaaga acgaggagga gctgaaccag 2040 tggaagcaga agctggagag cctgggctac cagaacagca tcgaggtgct gaacgccgcc 2100 gacttcggca gcagccaggc ccggcggcgg gtgttcatga tcagcaccct gaacgagttc 2160 gtggagctgc ccaagggcga caagaagccc aagagcatca agaaggtgct gaacaagatc 2220 gtgagcgaga aggacatcct gaacaacctg ctgaagtaca acctgaccga gttcaagaaa 2280 accaagagca acatcaacaa ggccagcctg atcggctaca gcaagttcaa cagcgagggc 2340 tacgtgtacg accccgagtt caccggcccc accctgaccg ccagcggcgc caacagccgg 2400 atcaagatca aggacggcag caacatccgg aagatgaaca gcgacgagac cttcctgtac 2460 atcggcttcg acagccagga cggcaagcgg gtgaacgaga tcgagttcct gaccgagaac 2520 cagaagatct tcgtgtgcgg caacagcatc agcgtggagg tgctggaggc catcatcgac 2580 aagatcggcg gccccagcgg cggcaagcgg cccgccgcca ccaagaaggc cggccaggcc 2640 aagaagaaga agggcagcta cccctacgac gtgcccgact acgcctgaag cagcggcggc 2700 aagcggcccg ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc 2760 tacgacgtgc ccgactacgc ctgagcggcc gcttaattaa gctgccttct gcggggcttg 2820 ccttctggcc atgcccttct tctctccctt gcacctgtac ctcttggtct ttgaataaag 2880 cctgagtagg aagtctagaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2940 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3000 aaaaaaaaaa aa 3012 <210> 95 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 95 Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln 1 5 10 15 Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 20 25 30 Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ala Thr Asn Phe Ser 35 40 45 Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser 50 55 60 Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 65 70 75 80 Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Glu Gly Ser Ser Gly Ser 85 90 95 Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 100 105 110 Ala Gly Ser Ser Gly Ser 115 <210> 96 <211> 20 <212> DNA <213> Homo sapiens <400> 96 tgccacttcc ccactaaccc 20 <210> 97 <211> 20 <212> DNA <213> Homo sapiens <400> 97 ggccacacaa ggaagctgca 20 <210> 98 <211> 20 <212> DNA <213> Homo sapiens <400> 98 ccacacaagg aagctgcagg 20 <210> 99 <211> 20 <212> DNA <213> Homo sapiens <400> 99 tgattggaat gcaacccgaa 20 <210> 100 <211> 20 <212> DNA <213> Homo sapiens <400> 100 ttttgccctt gctaccccaa 20 <210> 101 <211> 20 <212> DNA <213> Homo sapiens <400> 101 agctgatggt atccactagg 20 <210> 102 <211> 20 <212> DNA <213> Homo sapiens <400> 102 cacatccaag aatgtagtgg 20 <210> 103 <211> 20 <212> DNA <213> Homo sapiens <400> 103 gatacagcca caaagctcac 20 <210> 104 <211> 20 <212> DNA <213> Homo sapiens <400> 104 attacataac agaatccagg 20 <210> 105 <211> 20 <212> DNA <213> Homo sapiens <400> 105 cccttgactg tgctgccacc 20 <210> 106 <211> 20 <212> DNA <213> Homo sapiens <400> 106 cagacgagga acctgaaccc 20 <210> 107 <211> 20 <212> DNA <213> Homo sapiens <400> 107 agaatccctt ggggtagcaa 20 <210> 108 <211> 20 <212> DNA <213> Homo sapiens <400> 108 cagcactctc gctgaccgca 20 <210> 109 <211> 20 <212> DNA <213> Homo sapiens <400> 109 gttgagtcat gtgtactctg 20 <210> 110 <211> 20 <212> DNA <213> Homo sapiens <400> 110 aggaacagga tgttacaact 20 <210> 111 <211> 20 <212> DNA <213> Homo sapiens <400> 111 ggggccacta gggacaggat 20 <210> 112 <211> 3650 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 112 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgagaa accttacaaa tgccccgagt gcggcaagag cttcagcaga agcgacgatc 180 tggtgaggca ccaaagaacc cacaccggcg aaaaacctta caagtgtccc gaatgcggaa 240 agtccttcag cagagaggac aatctgcaca cccaccagag aacacacacc ggagaaaagc 300 cttacaagtg ccccgaatgc ggcaaatcct tttctagaag cgatcatctg accacccacc 360 aaagaacaca taccggcgag aagccttaca aatgtcccga gtgcggaaag tccttctccc 420 agagagccaa tctgagggct catcaaagga cccataccgg cgaaaagccc tacaaatgcc 480 ccgagtgcgg aaaatccttc agccagctgg cccatctgag agcccaccaa aggacacaca 540 ccggagagaa accctataag tgccccgagt gtggaaaaag cttttcccag agggccaatc 600 tgagggccca tcagaggacc cataccggag agaagcctta taaatgtccc gagtgcggaa 660 aaagcttcag cgagaggagc catctgaggg aacatcaaag aacccacacc ggcgaaaaac 720 ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780 gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840 cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900 agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960 tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020 gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080 tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200 aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260 gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320 acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380 agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440 ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500 tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560 tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620 aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680 gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740 ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800 acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860 accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920 acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980 aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc gggtcctacc 2040 cgtacgacgt gcccgattac gccgccacca acttctcgct gctgaagcag gccggagatg 2100 tggaagaaaa ccctggacct accagtgccg gaaagctcgg tagcggagag ggtcggggaa 2160 gcctgcttac ttgcggcgac gtggaagaga accccggtcc gctggagggt tcgtccggct 2220 ccggatcccc caagaagaag cggaaggtgg gcatccacgg cgtgcccgcc gccggcagca 2280 gcggatccct ggagcccggc gaaaaacctt acaagtgccc cgagtgcgga aagagcttca 2340 gcagaagcga caaactggtg aggcatcaaa ggacacatac cggagagaag ccctataagt 2400 gccccgaatg tggcaaatcc ttttcccaga gggctcatct ggaaagacac cagaggaccc 2460 ataccggcga aaaaccctac aaatgtcccg agtgtggaaa gagcttttcc gatcccggcc 2520 atctggtcag acatcagagg acacataccg gcgaaaagcc ttacaagtgt cccgaatgcg 2580 gaaaatcctt ctccagaagc gacaagctgg tgaggcacca aagaacccac accggcgaaa 2640 aaccctataa atgccccgag tgcggcaagt cctttagcca gctggcccat ctgagagccc 2700 accagagaac acacaccgga gagaagcctt ataagtgtcc cgagtgcgga aagtccttct 2760 ctagagccga caatctgacc gaacatcaaa ggacacacac cggcgagaaa ccttataaat 2820 gccccgagtg cggaaaaagc ttttccgact gcagagatct ggctagacac cagagaaccc 2880 acaccggcga gaaacccacc ggcaaaaaga ccagcgctag cggcagcggc ggcggcagcg 2940 gcggcgacgc caagagcctg accgcctgga gccggaccct ggtgaccttc aaggacgtgt 3000 tcgtggactt cacccgggag gagtggaagc tgctggacac cgcccagcag atcctgtacc 3060 ggaacgtgat gctggagaac tacaagaacc tggtgagcct gggctaccag ctgaccaagc 3120 ccgacgtgat cctgcggctg gagaagggcg aggagccctg gctggtggag cgggagatcc 3180 accaggagac ccaccccgac agcgagaccg ccttcgagat caagagcagc gtgagcggcg 3240 gcaagcggcc cgccgccacc aagaaggccg gccaggccaa gaagaagaag ggcagctacc 3300 cctacgacgt gcccgactac gcctgaagca gcggcggcaa gcggcccgcc gccaccaaga 3360 aggccggcca ggccaagaag aagaagggca gctaccccta cgacgtgccc gactacgcct 3420 gagcggccgc ttaattaagc tgccttctgc ggggcttgcc ttctggccat gcccttcttc 3480 tctcccttgc acctgtacct cttggtcttt gaataaagcc tgagtaggaa gtctagaaaa 3540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3600 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3650 <210> 113 <211> 3650 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 113 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgaaaa accttacaag tgccccgagt gcggaaagag cttcagcaga agcgacaaac 180 tggtgaggca tcaaaggaca cataccggag agaagcccta taagtgcccc gaatgtggca 240 aatccttttc ccagagggct catctggaaa gacaccagag gacccatacc ggcgaaaaac 300 cctacaaatg tcccgagtgt ggaaagagct tttccgatcc cggccatctg gtcagacatc 360 agaggacaca taccggcgaa aagccttaca agtgtcccga atgcggaaaa tccttctcca 420 gaagcgacaa gctggtgagg caccaaagaa cccacaccgg cgaaaaaccc tataaatgcc 480 ccgagtgcgg caagtccttt agccagctgg cccatctgag agcccaccag agaacacaca 540 ccggagagaa gccttataag tgtcccgagt gcggaaagtc cttctctaga gccgacaatc 600 tgaccgaaca tcaaaggaca cacaccggcg agaaacctta taaatgcccc gagtgcggaa 660 aaagcttttc cgactgcaga gatctggcta gacaccagag aacccacacc ggcgagaaac 720 ccaccggcaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gacgccaaga 780 gcctgaccgc ctggagccgg accctggtga ccttcaagga cgtgttcgtg gacttcaccc 840 gggaggagtg gaagctgctg gacaccgccc agcagatcct gtaccggaac gtgatgctgg 900 agaactacaa gaacctggtg agcctgggct accagctgac caagcccgac gtgatcctgc 960 ggctggagaa gggcgaggag ccctggctgg tggagcggga gatccaccag gagacccacc 1020 ccgacagcga gaccgccttc gagatcaaga gcagcgtgag cagcggcggc aagcggcccg 1080 ccgccaccaa gaaggccggc caggccaaga agaagaaggg cagctacccc tacgacgtgc 1140 ccgactacgc cgggtcctac ccgtacgacg tgcccgatta cgccgccacc aacttctcgc 1200 tgctgaagca ggccggagat gtggaagaaa accctggacc taccagtgcc ggaaagctcg 1260 gtagcggaga gggtcgggga agcctgctta cttgcggcga cgtggaagag aaccccggtc 1320 cgctggaggg ttcgtccggc tccggatccc ccaagaagaa gcggaaggtg ggcatccacg 1380 gcgtgcccgc cgccggcagc agcggatccc tggagcccgg cgagaaacct tacaaatgcc 1440 ccgagtgcgg caagagcttc agcagaagcg acgatctggt gaggcaccaa agaacccaca 1500 ccggcgaaaa accttacaag tgtcccgaat gcggaaagtc cttcagcaga gaggacaatc 1560 tgcacaccca ccagagaaca cacaccggag aaaagcctta caagtgcccc gaatgcggca 1620 aatccttttc tagaagcgat catctgacca cccaccaaag aacacatacc ggcgagaagc 1680 cttacaaatg tcccgagtgc ggaaagtcct tctcccagag agccaatctg agggctcatc 1740 aaaggaccca taccggcgaa aagccctaca aatgccccga gtgcggaaaa tccttcagcc 1800 agctggccca tctgagagcc caccaaagga cacacaccgg agagaaaccc tataagtgcc 1860 ccgagtgtgg aaaaagcttt tcccagaggg ccaatctgag ggcccatcag aggacccata 1920 ccggagagaa gccttataaa tgtcccgagt gcggaaaaag cttcagcgag aggagccatc 1980 tgagggaaca tcaaagaacc cacaccggcg aaaaacccac cggaaaaaag accagcgcta 2040 gcggcagcgg cggcggcagc ggcggcgccc gggacagcaa ggtggagaac aagaccaaga 2100 agctgcgggt gttcgaggcc ttcgccggca tcggcgccca gcggaaggcc ctggagaagg 2160 tgcggaagga cgagtacgag atcgtgggcc tggccgagtg gtacgtgccc gccatcgtga 2220 tgtaccaggc catccacaac aacttccaca ccaagctgga gtacaagagc gtgagccggg 2280 aggagatgat cgactacctg gagaacaaga ccctgagctg gaacagcaag aaccccgtga 2340 gcaacggcta ctggaagcgg aagaaggacg acgagctgaa gatcatctac aacgccatca 2400 agctgagcga gaaggagggc aacatcttcg acatccggga cctgtacaag cggaccctga 2460 agaacatcga cctgctgacc tacagcttcc cctgccagga cctgagccag cagggcatcc 2520 agaagggcat gaagcggggc agcggcaccc ggagcggcct gctgtgggag atcgagcggg 2580 ccctggacag caccgagaag aacgacctgc ccaagtacct gctgatggag aacgtgggcg 2640 ccctgctgca caagaagaac gaggaggagc tgaaccagtg gaagcagaag ctggagagcc 2700 tgggctacca gaacagcatc gaggtgctga acgccgccga cttcggcagc agccaggccc 2760 ggcggcgggt gttcatgatc agcaccctga acgagttcgt ggagctgccc aagggcgaca 2820 agaagcccaa gagcatcaag aaggtgctga acaagatcgt gagcgagaag gacatcctga 2880 acaacctgct gaagtacaac ctgaccgagt tcaagaaaac caagagcaac atcaacaagg 2940 ccagcctgat cggctacagc aagttcaaca gcgagggcta cgtgtacgac cccgagttca 3000 ccggccccac cctgaccgcc agcggcgcca acagccggat caagatcaag gacggcagca 3060 acatccggaa gatgaacagc gacgagacct tcctgtacat cggcttcgac agccaggacg 3120 gcaagcgggt gaacgagatc gagttcctga ccgagaacca gaagatcttc gtgtgcggca 3180 acagcatcag cgtggaggtg ctggaggcca tcatcgacaa gatcggcggc cccagcggcg 3240 gcaagcggcc cgccgccacc aagaaggccg gccaggccaa gaagaagaag ggcagctacc 3300 cctacgacgt gcccgactac gcctgaagca gcggcggcaa gcggcccgcc gccaccaaga 3360 aggccggcca ggccaagaag aagaagggca gctaccccta cgacgtgccc gactacgcct 3420 gagcggccgc ttaattaagc tgccttctgc ggggcttgcc ttctggccat gcccttcttc 3480 tctcccttgc acctgtacct cttggtcttt gaataaagcc tgagtaggaa gtctagaaaa 3540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3600 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3650 <210> 114 <211> 542 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 114 Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro 1 5 10 15 Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile 20 25 30 Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg 35 40 45 Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val 50 55 60 Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr 65 70 75 80 Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly 85 90 95 Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu 100 105 110 Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His 115 120 125 Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe 130 135 140 Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg 145 150 155 160 Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala 165 170 175 Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg 180 185 190 Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu 195 200 205 Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr 210 215 220 Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe 225 230 235 240 Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val 245 250 255 Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu 260 265 270 Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg 275 280 285 His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly 290 295 300 Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val 305 310 315 320 Pro Leu Ser Leu Arg Gly Ser His Met Asn Pro Leu Glu Met Phe Glu 325 330 335 Thr Val Pro Val Trp Arg Arg Gln Pro Val Arg Val Leu Ser Leu Phe 340 345 350 Glu Asp Ile Lys Lys Glu Leu Thr Ser Leu Gly Phe Leu Glu Ser Gly 355 360 365 Ser Asp Pro Gly Gln Leu Lys His Val Val Asp Val Thr Asp Thr Val 370 375 380 Arg Lys Asp Val Glu Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala 385 390 395 400 Thr Pro Pro Leu Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu 405 410 415 Phe Gln Phe His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser 420 425 430 Pro Arg Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys 435 440 445 Glu Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr 450 455 460 Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val Trp 465 470 475 480 Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val Ser Glu 485 490 495 Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser Lys Leu Ala 500 505 510 Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe Leu Pro Leu Arg 515 520 525 Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr Ser Ser Leu 530 535 540 <210> 115 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 115 ctggagcccg gcgagaaacc ctataaatgc cccgaatgcg gaaaaagctt cagccagtcc 60 agctctctgg tgagacatca gaggacacac accggcgaaa agccttataa gtgccccgag 120 tgcggcaagt ccttctctag aagcgatcac ctcaccaatc atcagaggac acataccgga 180 gagaagccct ataagtgccc cgagtgcggc aagagcttta gccagctggc tcatctgaga 240 gctcaccaaa gaacccatac cggcgagaag ccttacaaat gccccgagtg tggaaaatcc 300 ttttcccagt ccagcaacct cgtcagacat caaaggaccc ataccggcga aaagccttac 360 aagtgtcccg agtgcggaaa gtccttctct agatccgaca acctcgtgag gcaccagaga 420 acccacaccg gcgagaaacc ttacaaatgt cccgagtgtg gcaaaagctt ttctagaagc 480 gacgagctgg tgagacatca aagaacccat accggcgaaa aaccttataa gtgtcccgag 540 tgcggcaaat cctttagcca gctggcccat ctgagggccc accagagaac acataccggc 600 gaaaaaccca ccggcaaaaa gacaagc 627 <210> 116 <211> 2227 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 116 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgagaa accctacaag tgccccgagt gtggaaaaag ctttagccaa agcggcgatc 180 tgaggagaca ccaaagaaca cacaccggcg agaagcccta caaatgtccc gagtgcggaa 240 agagcttcag ccagagcggc catctgaccg agcatcagag aacccatacc ggcgaaaaac 300 cttataagtg ccccgagtgt ggaaagtcct tctccgagag atcccatctg agagaacacc 360 agaggacaca caccggcgaa aaaccttata agtgtcccga gtgcggaaag tccttcagcg 420 atcccggcca tctggtgaga catcaaagga cacataccgg cgaaaaacct tataagtgtc 480 ccgaatgcgg caagagcttt agcagaaacg acacactcac cgaacaccag aggacccaca 540 ccggcgagaa accctacaaa tgccccgagt gcggcaaatc cttttctaga gccgacaatc 600 tgaccgaaca ccagaggacc cataccggag aaaagcctta caaatgtccc gagtgtggca 660 aatccttctc cacccatctg gatctgatta gacaccaaag aacacatacc ggagaaaagc 720 ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780 gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840 cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900 agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960 tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020 gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080 tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200 aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260 gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320 acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380 agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440 ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500 tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560 tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620 aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680 gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740 ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800 acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860 accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920 acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980 aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040 cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100 cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaa 2227 <210> 117 <211> 2227 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 117 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgaaaa accctataag tgccccgaat gtggaaagag cttcagccat accggccatc 180 tgctggaaca ccaaaggaca cacaccggcg agaaacctta caagtgtccc gagtgcggaa 240 aaagcttctc ctccaaaaag gctctcaccg agcaccagag aacacatacc ggcgaaaagc 300 cttataagtg ccccgagtgt ggcaaatcct tttccgactg tagagatctg gccagacatc 360 aaagaaccca caccggagag aaaccttata aatgccccga gtgcggcaag tcctttagcc 420 ataccggcca tctgctggag caccagagga cccataccgg cgagaagcct tacaaatgcc 480 ccgagtgcgg caaaagcttc agcagaaatg acgctctgac cgagcatcaa aggacccata 540 ccggcgaaaa gccctacaag tgtcccgagt gtggaaagtc cttctcccag agcggcgatc 600 tgaggagaca ccagagaaca cacaccggcg agaaacccta taaatgtccc gagtgcggaa 660 agagctttag cgacagcggc aatctgaggg tgcatcaaag aacacacacc ggcgaaaaac 720 ccaccggaaa aaagacaagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780 gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840 cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900 agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960 tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020 gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080 tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200 aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260 gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320 acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380 agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440 ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500 tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560 tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620 aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680 gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740 ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800 acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860 accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920 acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980 aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040 cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100 cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaa 2227 <210> 118 <211> 2227 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 118 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgagaa accctataaa tgccccgaat gcggaaaaag cttcagccag tccagctctc 180 tggtgagaca tcagaggaca cacaccggcg aaaagcctta taagtgcccc gagtgcggca 240 agtccttctc tagaagcgat cacctcacca atcatcagag gacacatacc ggagagaagc 300 cctataagtg ccccgagtgc ggcaagagct ttagccagct ggctcatctg agagctcacc 360 aaagaaccca taccggcgag aagccttaca aatgccccga gtgtggaaaa tccttttccc 420 agtccagcaa cctcgtcaga catcaaagga cccataccgg cgaaaagcct tacaagtgtc 480 ccgagtgcgg aaagtccttc tctagatccg acaacctcgt gaggcaccag agaacccaca 540 ccggcgagaa accttacaaa tgtcccgagt gtggcaaaag cttttctaga agcgacgagc 600 tggtgagaca tcaaagaacc cataccggcg aaaaacctta taagtgtccc gagtgcggca 660 aatcctttag ccagctggcc catctgaggg cccaccagag aacacatacc ggcgaaaaac 720 ccaccggcaa aaagacaagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780 gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840 cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900 agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960 tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020 gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080 tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200 aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260 gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320 acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380 agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440 ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500 tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560 tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620 aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680 gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740 ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800 acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860 accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920 acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980 aggccaagaa gaagaagggc agctacccct acgacgtgcc cgactacgcc tgagcggccg 2040 cttaattaag ctgccttctg cggggcttgc cttctggcca tgcccttctt ctctcccttg 2100 cacctgtacc tcttggtctt tgaataaagc ctgagtagga agtctagaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaa 2227 <210> 119 <211> 5705 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 119 aaggaaataa gagagaaaag aagagtaaga agaaatataa gagccaccat ggcccccaag 60 aagaagcgga aggtgggcat ccacggcgtg cccgccgccg acaagaagta cagcatcggc 120 ctggccatcg gcaccaacag cgtgggctgg gccgtgatca ccgacgagta caaggtgccc 180 agcaagaagt tcaaggtgct gggcaacacc gaccggcaca gcatcaagaa gaacctgatc 240 ggcgccctgc tgttcgacag cggcgagacc gccgaggcca cccggctgaa gcggaccgcc 300 cggcggcggt acacccggcg gaagaaccgg atctgctacc tgcaggagat cttcagcaac 360 gagatggcca aggtggacga cagcttcttc caccggctgg aggagagctt cctggtggag 420 gaggacaaga agcacgagcg gcaccccatc ttcggcaaca tcgtggacga ggtggcctac 480 cacgagaagt accccaccat ctaccacctg cggaagaagc tggtggacag caccgacaag 540 gccgacctgc ggctgatcta cctggccctg gcccacatga tcaagttccg gggccacttc 600 ctgatcgagg gcgacctgaa ccccgacaac agcgacgtgg acaagctgtt catccagctg 660 gtgcagacct acaaccagct gttcgaggag aaccccatca acgccagcgg cgtggacgcc 720 aaggccatcc tgagcgcccg gctgagcaag agccggcggc tggagaacct gatcgcccag 780 ctgcccggcg agaagaagaa cggcctgttc ggcaacctga tcgccctgag cctgggcctg 840 acccccaact tcaagagcaa cttcgacctg gccgaggacg ccaagctgca gctgagcaag 900 gacacctacg acgacgacct ggacaacctg ctggcccaga tcggcgacca gtacgccgac 960 ctgttcctgg ccgccaagaa cctgagcgac gccatcctgc tgagcgacat cctgcgggtg 1020 aacaccgaga tcaccaaggc ccccctgagc gccagcatga tcaagcggta cgacgagcac 1080 caccaggacc tgaccctgct gaaggccctg gtgcggcagc agctgcccga gaagtacaag 1140 gagatcttct tcgaccagag caagaacggc tacgccggct acatcgacgg cggcgccagc 1200 caggaggagt tctacaagtt catcaagccc atcctggaga agatggacgg caccgaggag 1260 ctgctggtga agctgaaccg ggaggacctg ctgcggaagc agcggacctt cgacaacggc 1320 agcatccccc accagatcca cctgggcgag ctgcacgcca tcctgcggcg gcaggaggac 1380 ttctacccct tcctgaagga caaccgggag aagatcgaga agatcctgac cttccggatc 1440 ccctactacg tgggccccct ggcccggggc aacagccggt tcgcctggat gacccggaaa 1500 tccgaggaga ccatcacccc ctggaacttc gaggaggtgg tggacaaggg cgccagcgcc 1560 cagagcttca tcgagcggat gaccaacttc gacaagaacc tgcccaacga gaaggtgctg 1620 cccaagcaca gcctgctgta cgagtacttc accgtgtaca acgagctgac caaggtgaag 1680 tacgtgaccg agggcatgcg gaagcccgcc ttcctgagcg gcgagcagaa gaaggccatc 1740 gtggacctgc tgttcaagac caaccggaag gtgaccgtga agcagctgaa ggaggactac 1800 ttcaagaaga tcgagtgctt cgacagcgtg gagatcagcg gcgtggagga ccggttcaac 1860 gccagcctgg gcacctacca cgacctgctg aagatcatca aggacaagga cttcctggac 1920 aacgaggaga acgaggacat cctggaggac atcgtgctga ccctgaccct gttcgaggac 1980 cgggagatga tcgaggagcg gctgaaaacc tacgcccacc tgttcgacga caaggtgatg 2040 aagcagctga agcggcggcg gtacaccggc tggggccggc tgagccggaa gctgatcaac 2100 ggcatccggg acaagcagag cggcaagacc atcctggact tcctgaaatc cgacggcttc 2160 gccaaccgga acttcatgca gctgatccac gacgacagcc tgaccttcaa ggaggacatc 2220 cagaaggccc aggtgagcgg ccagggcgac agcctgcacg agcacatcgc caacctggcc 2280 ggcagccccg ccatcaagaa gggcatcctg cagaccgtga aggtggtgga cgagctggtg 2340 aaggtgatgg gccggcacaa gcccgagaac atcgtgatcg agatggcccg ggagaaccag 2400 accacccaga agggccagaa gaacagccgg gagcggatga agcggatcga ggagggcatc 2460 aaggagctgg gcagccagat cctgaaggag caccccgtgg agaacaccca gctgcagaac 2520 gagaagctgt acctgtacta cctgcagaac ggccgggaca tgtacgtgga ccaggagctg 2580 gacatcaacc ggctgagcga ctacgacgtg gccgccatcg tgccccagag cttcctgaag 2640 gacgacagca tcgacaacaa ggtgctgacc cggagcgaca aggcccgggg caagagcgac 2700 aacgtgccca gcgaggaggt ggtgaagaag atgaagaact actggcggca gctgctgaac 2760 gccaagctga tcacccagcg gaagttcgac aacctgacca aggccgagcg gggcggcctg 2820 agcgagctgg acaaggccgg cttcatcaag cggcagctgg tggagacccg gcagatcacc 2880 aagcacgtgg cccagatcct ggacagccgg atgaacacca agtacgacga gaacgacaag 2940 ctgatccggg aggtgaaggt gatcaccctg aaatccaagc tggtgagcga cttccggaag 3000 gacttccagt tctacaaggt gcgggagatc aacaactacc accacgccca cgacgcctac 3060 ctgaacgccg tggtgggcac cgccctgatc aagaagtacc ccaagctgga gagcgagttc 3120 gtgtacggcg actacaaggt gtacgacgtg cggaagatga tcgccaagag cgagcaggag 3180 atcggcaagg ccaccgccaa gtacttcttc tacagcaaca tcatgaactt cttcaagacc 3240 gagatcaccc tggccaacgg cgagatccgg aagcggcccc tgatcgagac caacggcgag 3300 accggcgaga tcgtgtggga caagggccgg gacttcgcca ccgtgcggaa ggtgctgagc 3360 atgccccagg tgaacatcgt gaagaaaacc gaggtgcaga ccggcggctt cagcaaggag 3420 agcatcctgc ccaagcggaa cagcgacaag ctgatcgccc ggaagaagga ctgggacccc 3480 aagaagtacg gcggcttcga cagccccacc gtggcctaca gcgtgctggt ggtggccaag 3540 gtggagaagg gcaagagcaa gaagctgaaa tccgtgaagg agctgctggg catcaccatc 3600 atggagcgga gcagcttcga gaagaacccc atcgacttcc tggaggccaa gggctacaag 3660 gaggtgaaga aggacctgat catcaagctg cccaagtaca gcctgttcga gctggagaac 3720 ggccggaagc ggatgctggc cagcgccggc gagctgcaga agggcaacga gctggccctg 3780 cccagcaagt acgtgaactt cctgtacctg gccagccact acgagaagct gaagggcagc 3840 cccgaggaca acgagcagaa gcagctgttc gtggagcagc acaagcacta cctggacgag 3900 atcatcgagc agatcagcga gttcagcaag cgggtgatcc tggccgacgc caacctggac 3960 aaggtgctga gcgcctacaa caagcaccgg gacaagccca tccgggagca ggccgagaac 4020 atcatccacc tgttcaccct gaccaacctg ggcgcccccg ccgccttcaa gtacttcgac 4080 accaccatcg accggaagcg gtacaccagc accaaggagg tgctggacgc caccctgatc 4140 caccagagca tcaccggcct gtacgagacc cggatcgacc tgagccagct gggcggcgac 4200 aagcggcccg ccgccaccaa gaaggccggc caggccaaga agaagaaggc ccgggacagc 4260 aaggtggaga acaagaccaa gaagctgcgg gtgttcgagg ccttcgccgg catcggcgcc 4320 cagcggaagg ccctggagaa ggtgcggaag gacgagtacg agatcgtggg cctggccgag 4380 tggtacgtgc ccgccatcgt gatgtaccag gccatccaca acaacttcca caccaagctg 4440 gagtacaaga gcgtgagccg ggaggagatg atcgactacc tggagaacaa gaccctgagc 4500 tggaacagca agaaccccgt gagcaacggc tactggaagc ggaagaagga cgacgagctg 4560 aagatcatct acaacgccat caagctgagc gagaaggagg gcaacatctt cgacatccgg 4620 gacctgtaca agcggaccct gaagaacatc gacctgctga cctacagctt cccctgccag 4680 gacctgagcc agcagggcat ccagaagggc atgaagcggg gcagcggcac ccggagcggc 4740 ctgctgtggg agatcgagcg ggccctggac agcaccgaga agaacgacct gcccaagtac 4800 ctgctgatgg agaacgtggg cgccctgctg cacaagaaga acgaggagga gctgaaccag 4860 tggaagcaga agctggagag cctgggctac cagaacagca tcgaggtgct gaacgccgcc 4920 gacttcggca gcagccaggc ccggcggcgg gtgttcatga tcagcaccct gaacgagttc 4980 gtggagctgc ccaagggcga caagaagccc aagagcatca agaaggtgct gaacaagatc 5040 gtgagcgaga aggacatcct gaacaacctg ctgaagtaca acctgaccga gttcaagaaa 5100 accaagagca acatcaacaa ggccagcctg atcggctaca gcaagttcaa cagcgagggc 5160 tacgtgtacg accccgagtt caccggcccc accctgaccg ccagcggcgc caacagccgg 5220 atcaagatca aggacggcag caacatccgg aagatgaaca gcgacgagac cttcctgtac 5280 atcggcttcg acagccagga cggcaagcgg gtgaacgaga tcgagttcct gaccgagaac 5340 cagaagatct tcgtgtgcgg caacagcatc agcgtggagg tgctggaggc catcatcgac 5400 aagatcggcg gccccagcag cggcggcaag cggcccgccg ccaccaagaa ggccggccag 5460 gccaagaaga agaagggcag ctacccctac gacgtgcccg actacgcctg agcggccgct 5520 taattaagct gccttctgcg gggcttgcct tctggccatg cccttcttct ctcccttgca 5580 cctgtacctc ttggtctttg aataaagcct gagtaggaag tctagaaaaa aaaaaaaaaa 5640 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 5700 aaaaa 5705 <210> 120 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 120 Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro 1 5 10 15 Gly Pro <210> 121 <211> 1092 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 121 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn 115 120 125 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp 645 650 655 Val Pro Asp Tyr Ala Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 660 665 670 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 675 680 685 Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly 690 695 700 Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Glu 705 710 715 720 Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ile 725 730 735 His Gly Val Pro Ala Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu 740 745 750 Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp 755 760 765 Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys 770 775 780 Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg 785 790 795 800 His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys 805 810 815 Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr 820 825 830 His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe 835 840 845 Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu 850 855 860 Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala 865 870 875 880 His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys 885 890 895 Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu 900 905 910 His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys 915 920 925 Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr 930 935 940 His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser 945 950 955 960 Gly Gly Gly Ser Gly Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg 965 970 975 Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu 980 985 990 Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met 995 1000 1005 Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr 1010 1015 1020 Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro Trp 1025 1030 1035 Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu 1040 1045 1050 Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg Pro 1055 1060 1065 Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 1070 1075 1080 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1085 1090 <210> 122 <211> 1092 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 122 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln 340 345 350 Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ala Thr Asn Phe Ser 370 375 380 Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser 385 390 395 400 Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys 405 410 415 Gly Asp Val Glu Glu Asn Pro Gly Pro Leu Glu Gly Ser Ser Gly Ser 420 425 430 Gly Ser Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 435 440 445 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 450 455 460 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His 465 470 475 480 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 485 490 495 Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His 500 505 510 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 515 520 525 Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys 530 535 540 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn 545 550 555 560 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 565 570 575 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 580 585 590 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 595 600 605 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 610 615 620 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 625 630 635 640 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 645 650 655 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 660 665 670 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 675 680 685 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 690 695 700 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 705 710 715 720 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 725 730 735 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 740 745 750 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 755 760 765 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 770 775 780 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 785 790 795 800 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 805 810 815 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 820 825 830 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 835 840 845 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 850 855 860 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 865 870 875 880 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 885 890 895 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 900 905 910 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 915 920 925 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 930 935 940 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 945 950 955 960 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 965 970 975 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 980 985 990 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 995 1000 1005 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln 1010 1015 1020 Asp Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln 1025 1030 1035 Lys Ile Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu 1040 1045 1050 Ala Ile Ile Asp Lys Ile Gly Gly Pro Ser Gly Gly Lys Arg Pro 1055 1060 1065 Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 1070 1075 1080 Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1085 1090 <210> 123 <211> 355 <212> DNA <213> Homo sapiens <400> 123 cagagaagga ggaagttaat tcacattctt aattttttct aagggcaaaa aaaaaaaaaa 60 aatgcaccag ctcattttcc atctctgctt gggtcatcag tgtgcattgt gagcctgtac 120 aaaggcctta gacggggaat gctgccgaga gcatcacctt ttatgtcttc ttttatatga 180 aatgtgccac ttccccacta accctggctc tgggctctgc ctctgctctc ctgatggtgt 240 gtttatggtg gattcagcat tctgggccac acaaggaagc tgcagggggt gtccaagttc 300 acatgtcccc gcattccagg cgaatgtttc tgacattgag caatgatatg gctct 355 <210> 124 <211> 46 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 124 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly 20 25 30 Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro 35 40 45 <210> 125 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 125 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly Pro <210> 126 <211> 18 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 126 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 1 5 10 15 Pro Gly <210> 127 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 127 Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg Gly Ser Leu 1 5 10 15 Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly 20 25 <210> 128 <211> 1 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 128 Pro 1 <210> 129 <211> 652 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 129 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn 115 120 125 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 645 650 <210> 130 <211> 2234 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 130 gggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ccggcgagaa accttacaaa tgccccgagt gcggcaagag cttcagcaga agcgacgatc 180 tggtgaggca ccaaagaacc cacaccggcg aaaaacctta caagtgtccc gaatgcggaa 240 agtccttcag cagagaggac aatctgcaca cccaccagag aacacacacc ggagaaaagc 300 cttacaagtg ccccgaatgc ggcaaatcct tttctagaag cgatcatctg accacccacc 360 aaagaacaca taccggcgag aagccttaca aatgtcccga gtgcggaaag tccttctccc 420 agagagccaa tctgagggct catcaaagga cccataccgg cgaaaagccc tacaaatgcc 480 ccgagtgcgg aaaatccttc agccagctgg cccatctgag agcccaccaa aggacacaca 540 ccggagagaa accctataag tgccccgagt gtggaaaaag cttttcccag agggccaatc 600 tgagggccca tcagaggacc cataccggag agaagcctta taaatgtccc gagtgcggaa 660 aaagcttcag cgagaggagc catctgaggg aacatcaaag aacccacacc ggcgaaaaac 720 ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780 gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840 cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900 agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960 tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020 gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080 tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200 aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260 gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320 acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380 agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440 ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500 tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560 tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620 aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680 gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740 ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800 acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860 accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920 acaagatcgg cggccccagc agcggcggca agcggcccgc cgccaccaag aaggccggcc 1980 aggccaagaa gaagaagggc agctgagcgg ccgcttaatt aagctgcctt ctgcggggct 2040 tgccttctgg ccatgccctt cttctctccc ttgcacctgt acctcttggt ctttgaataa 2100 agcctgagta ggaagtctag aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaaaaa aaaa 2234 <210> 131 <211> 627 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 131 cuggagcccg gcgagaaacc uuacaaaugc cccgagugcg gcaagagcuu cagcagaagc 60 gacgaucugg ugaggcacca aagaacccac accggcgaaa aaccuuacaa gugucccgaa 120 ugcggaaagu ccuucagcag agaggacaau cugcacaccc accagagaac acacaccgga 180 gaaaagccuu acaagugccc cgaaugcggc aaauccuuuu cuagaagcga ucaucugacc 240 acccaccaaa gaacacauac cggcgagaag ccuuacaaau gucccgagug cggaaagucc 300 uucucccaga gagccaaucu gagggcucau caaaggaccc auaccggcga aaagcccuac 360 aaaugccccg agugcggaaa auccuucagc cagcuggccc aucugagagc ccaccaaagg 420 acacacaccg gagagaaacc cuauaagugc cccgagugug gaaaaagcuu uucccagagg 480 gccaaucuga gggcccauca gaggacccau accggagaga agccuuauaa augucccgag 540 ugcggaaaaa gcuucagcga gaggagccau cugagggaac aucaaagaac ccacaccggc 600 gaaaaaccca ccggaaaaaa gaccagc 627 <210> 132 <211> 1155 <212> RNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 132 agcaaggugg agaacaagac caagaagcug cggguguucg aggccuucgc cggcaucggc 60 gcccagcgga aggcccugga gaaggugcgg aaggacgagu acgagaucgu gggccuggcc 120 gagugguacg ugcccgccau cgugauguac caggccaucc acaacaacuu ccacaccaag 180 cuggaguaca agagcgugag ccgggaggag augaucgacu accuggagaa caagacccug 240 agcuggaaca gcaagaaccc cgugagcaac ggcuacugga agcggaagaa ggacgacgag 300 cugaagauca ucuacaacgc caucaagcug agcgagaagg agggcaacau cuucgacauc 360 cgggaccugu acaagcggac ccugaagaac aucgaccugc ugaccuacag cuuccccugc 420 caggaccuga gccagcaggg cauccagaag ggcaugaagc ggggcagcgg cacccggagc 480 ggccugcugu gggagaucga gcgggcccug gacagcaccg agaagaacga ccugcccaag 540 uaccugcuga uggagaacgu gggcgcccug cugcacaaga agaacgagga ggagcugaac 600 caguggaagc agaagcugga gagccugggc uaccagaaca gcaucgaggu gcugaacgcc 660 gccgacuucg gcagcagcca ggcccggcgg cggguguuca ugaucagcac ccugaacgag 720 uucguggagc ugcccaaggg cgacaagaag cccaagagca ucaagaaggu gcugaacaag 780 aucgugagcg agaaggacau ccugaacaac cugcugaagu acaaccugac cgaguucaag 840 aaaaccaaga gcaacaucaa caaggccagc cugaucggcu acagcaaguu caacagcgag 900 ggcuacgugu acgaccccga guucaccggc cccacccuga ccgccagcgg cgccaacagc 960 cggaucaaga ucaaggacgg cagcaacauc cggaagauga acagcgacga gaccuuccug 1020 uacaucggcu ucgacagcca ggacggcaag cgggugaacg agaucgaguu ccugaccgag 1080 aaccagaaga ucuucgugug cggcaacagc aucagcgugg aggugcugga ggccaucauc 1140 gacaagaucg gcggc 1155 <210> 133 <211> 690 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 133 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn 115 120 125 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp 645 650 655 Val Pro Asp Tyr Ala Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 660 665 670 Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn 675 680 685 Pro Gly 690 <210> 134 <211> 366 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 134 Pro Leu Glu Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys 1 5 10 15 Val Gly Ile His Gly Val Pro Ala Ala Gly Ser Ser Gly Ser Leu Glu 20 25 30 Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 35 40 45 Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 50 55 60 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His 65 70 75 80 Leu Glu Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 85 90 95 Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His 100 105 110 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 115 120 125 Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His 130 135 140 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 145 150 155 160 Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys 165 170 175 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn 180 185 190 Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 195 200 205 Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His 210 215 220 Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr Ser Ala 225 230 235 240 Ser Gly Ser Gly Gly Gly Ser Gly Gly Asp Ala Lys Ser Leu Thr Ala 245 250 255 Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr 260 265 270 Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg 275 280 285 Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln 290 295 300 Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro 305 310 315 320 Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser Glu 325 330 335 Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg Pro Ala 340 345 350 Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 355 360 365 <210> 135 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 135 Pro Lys Lys Lys Arg Lys 1 5 <210> 136 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 136 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys 1 5 10 15 <210> 137 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 137 Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp 1 5 10 <210> 138 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 138 Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly 1 5 10 <210> 139 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 139 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Ala 115 120 125 Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg Val His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser 355 <210> 140 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 140 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser His Ser Leu Thr Glu His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Asn Asp Ala Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser 355 <210> 141 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 141 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser 355 <210> 142 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 142 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp 115 120 125 Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala His Leu Glu Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser 355 <210> 143 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 143 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Thr Ser Gly Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His 115 120 125 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser 355 <210> 144 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 144 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly Ala Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His 115 120 125 Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Asp Pro Gly His Leu Val Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe 245 250 255 Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp 260 265 270 Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys 275 280 285 Asn Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu 290 295 300 Arg Leu Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His 305 310 315 320 Gln Glu Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser 325 330 335 Val Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser 355 <210> 145 <211> 652 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 145 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Pro Gly His Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly His 115 120 125 Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Thr Lys Asn Ser Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 645 650 <210> 146 <211> 652 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 146 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Thr Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Arg Asp Glu Leu Asn Val His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro Ala Asp 115 120 125 Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 645 650 <210> 147 <211> 652 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 147 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Ser Gly His Leu Thr Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Pro Gly His 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Thr Leu Thr Glu His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Thr His Leu Asp Leu Ile Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 645 650 <210> 148 <211> 652 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 148 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His Leu Leu Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Ser Lys Lys Ala Leu Thr Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Thr Gly His 115 120 125 Leu Leu Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 645 650 <210> 149 <211> 652 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 149 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Ser Asp His Leu Thr Asn His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Asn 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ser Asp Glu Leu Val Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Gln Leu Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr 625 630 635 640 Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 645 650 <210> 150 <211> 1519 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 150 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 20 25 30 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 35 40 45 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 50 55 60 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 65 70 75 80 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 85 90 95 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 100 105 110 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 115 120 125 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 130 135 140 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 145 150 155 160 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 165 170 175 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 180 185 190 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 195 200 205 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 210 215 220 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 225 230 235 240 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 245 250 255 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 260 265 270 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 275 280 285 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 290 295 300 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 305 310 315 320 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 325 330 335 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 340 345 350 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 355 360 365 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 370 375 380 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 385 390 395 400 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 405 410 415 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 420 425 430 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 435 440 445 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 450 455 460 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 465 470 475 480 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 485 490 495 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 500 505 510 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 515 520 525 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 530 535 540 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 545 550 555 560 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 565 570 575 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 580 585 590 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 595 600 605 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 610 615 620 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 625 630 635 640 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 645 650 655 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 660 665 670 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 675 680 685 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 690 695 700 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 705 710 715 720 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 725 730 735 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 740 745 750 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 755 760 765 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 770 775 780 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 785 790 795 800 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 805 810 815 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 820 825 830 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 835 840 845 Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys 850 855 860 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg 865 870 875 880 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 885 890 895 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 900 905 910 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 915 920 925 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 930 935 940 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 945 950 955 960 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 965 970 975 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 980 985 990 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 995 1000 1005 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile 1025 1030 1035 Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe 1040 1045 1050 Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu 1055 1060 1065 Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly 1070 1075 1080 Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr 1085 1090 1095 Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys 1100 1105 1110 Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro 1115 1120 1125 Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp 1130 1135 1140 Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser 1145 1150 1155 Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu 1160 1165 1170 Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser 1175 1180 1185 Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr 1190 1195 1200 Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser 1205 1210 1215 Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1220 1225 1230 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1235 1240 1245 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His 1265 1270 1275 Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser 1280 1285 1290 Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser 1295 1300 1305 Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu 1310 1315 1320 Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala 1325 1330 1335 Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr 1340 1345 1350 Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile 1355 1360 1365 Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly 1370 1375 1380 Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys 1385 1390 1395 Lys Lys Ala Ser Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr 1400 1405 1410 Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg Glu Glu 1415 1420 1425 Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr Arg Asn Val 1430 1435 1440 Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr Gln Leu 1445 1450 1455 Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu Glu Pro 1460 1465 1470 Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro Asp Ser 1475 1480 1485 Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Ser Gly Gly Lys Arg 1490 1495 1500 Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly 1505 1510 1515 Ser <210> 151 <211> 1811 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 151 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 20 25 30 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 35 40 45 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 50 55 60 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 65 70 75 80 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 85 90 95 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 100 105 110 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 115 120 125 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 130 135 140 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 145 150 155 160 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 165 170 175 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 180 185 190 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 195 200 205 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 210 215 220 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 225 230 235 240 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 245 250 255 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 260 265 270 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 275 280 285 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 290 295 300 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 305 310 315 320 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 325 330 335 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 340 345 350 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 355 360 365 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 370 375 380 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 385 390 395 400 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 405 410 415 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 420 425 430 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 435 440 445 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 450 455 460 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 465 470 475 480 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 485 490 495 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 500 505 510 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 515 520 525 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 530 535 540 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 545 550 555 560 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 565 570 575 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 580 585 590 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 595 600 605 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 610 615 620 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 625 630 635 640 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 645 650 655 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 660 665 670 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 675 680 685 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 690 695 700 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 705 710 715 720 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 725 730 735 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 740 745 750 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 755 760 765 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 770 775 780 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 785 790 795 800 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 805 810 815 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 820 825 830 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 835 840 845 Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys 850 855 860 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg 865 870 875 880 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 885 890 895 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 900 905 910 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 915 920 925 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 930 935 940 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 945 950 955 960 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 965 970 975 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 980 985 990 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 995 1000 1005 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile 1025 1030 1035 Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe 1040 1045 1050 Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu 1055 1060 1065 Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly 1070 1075 1080 Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr 1085 1090 1095 Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys 1100 1105 1110 Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro 1115 1120 1125 Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp 1130 1135 1140 Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser 1145 1150 1155 Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu 1160 1165 1170 Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser 1175 1180 1185 Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr 1190 1195 1200 Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser 1205 1210 1215 Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1220 1225 1230 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1235 1240 1245 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His 1265 1270 1275 Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser 1280 1285 1290 Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser 1295 1300 1305 Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu 1310 1315 1320 Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala 1325 1330 1335 Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr 1340 1345 1350 Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile 1355 1360 1365 Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly 1370 1375 1380 Asp Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys 1385 1390 1395 Lys Lys Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu 1400 1405 1410 Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala 1415 1420 1425 Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala 1430 1435 1440 Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn 1445 1450 1455 Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu 1460 1465 1470 Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys 1475 1480 1485 Asn Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu 1490 1495 1500 Leu Lys Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly 1505 1510 1515 Asn Ile Phe Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn 1520 1525 1530 Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln 1535 1540 1545 Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser Gly Thr Arg Ser 1550 1555 1560 Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser Thr Glu Lys 1565 1570 1575 Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly Ala Leu 1580 1585 1590 Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln Lys 1595 1600 1605 Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 1610 1615 1620 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile 1625 1630 1635 Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys 1640 1645 1650 Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys 1655 1660 1665 Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys 1670 1675 1680 Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser 1685 1690 1695 Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly 1700 1705 1710 Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys 1715 1720 1725 Asp Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu 1730 1735 1740 Tyr Ile Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile 1745 1750 1755 Glu Phe Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser 1760 1765 1770 Ile Ser Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly 1775 1780 1785 Pro Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly 1790 1795 1800 Gln Ala Lys Lys Lys Lys Gly Ser 1805 1810 <210> 152 <211> 1913 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 152 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 20 25 30 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 35 40 45 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 50 55 60 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 65 70 75 80 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 85 90 95 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 100 105 110 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 115 120 125 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 130 135 140 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 145 150 155 160 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 165 170 175 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 180 185 190 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 195 200 205 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 210 215 220 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 225 230 235 240 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 245 250 255 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 260 265 270 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 275 280 285 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 290 295 300 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 305 310 315 320 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 325 330 335 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 340 345 350 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 355 360 365 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 370 375 380 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 385 390 395 400 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 405 410 415 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 420 425 430 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 435 440 445 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 450 455 460 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 465 470 475 480 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 485 490 495 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 500 505 510 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 515 520 525 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 530 535 540 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 545 550 555 560 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 565 570 575 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 580 585 590 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 595 600 605 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 610 615 620 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 625 630 635 640 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 645 650 655 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 660 665 670 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 675 680 685 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 690 695 700 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 705 710 715 720 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 725 730 735 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 740 745 750 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 755 760 765 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 770 775 780 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 785 790 795 800 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 805 810 815 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 820 825 830 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 835 840 845 Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys 850 855 860 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg 865 870 875 880 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 885 890 895 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 900 905 910 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 915 920 925 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 930 935 940 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 945 950 955 960 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 965 970 975 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 980 985 990 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 995 1000 1005 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile 1025 1030 1035 Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe 1040 1045 1050 Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu 1055 1060 1065 Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly 1070 1075 1080 Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr 1085 1090 1095 Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys 1100 1105 1110 Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro 1115 1120 1125 Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp 1130 1135 1140 Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser 1145 1150 1155 Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu 1160 1165 1170 Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser 1175 1180 1185 Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr 1190 1195 1200 Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser 1205 1210 1215 Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1220 1225 1230 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1235 1240 1245 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His 1265 1270 1275 Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser 1280 1285 1290 Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser 1295 1300 1305 Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu 1310 1315 1320 Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala 1325 1330 1335 Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr 1340 1345 1350 Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile 1355 1360 1365 Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly 1370 1375 1380 Asp Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln 1385 1390 1395 Ala Lys Lys Lys Lys Ser Gly Gly Gly Gly Ser Val Asp Leu Arg 1400 1405 1410 Thr Leu Asp Val Phe Ser Gly Cys Gly Gly Leu Ser Glu Gly Phe 1415 1420 1425 His Gln Ala Gly Ile Ser Asp Thr Leu Trp Ala Ile Glu Met Trp 1430 1435 1440 Asp Pro Ala Ala Gln Ala Phe Arg Leu Asn Asn Pro Gly Ser Thr 1445 1450 1455 Val Phe Thr Glu Asp Cys Asn Ile Leu Leu Lys Leu Val Met Ala 1460 1465 1470 Gly Glu Thr Thr Asn Ser Arg Gly Gln Arg Leu Pro Gln Lys Gly 1475 1480 1485 Asp Val Glu Met Leu Cys Gly Gly Pro Pro Cys Gln Gly Phe Ser 1490 1495 1500 Gly Met Asn Arg Phe Asn Ser Arg Thr Tyr Ser Lys Phe Lys Asn 1505 1510 1515 Ser Leu Val Val Ser Phe Leu Ser Tyr Cys Asp Tyr Tyr Arg Pro 1520 1525 1530 Arg Phe Phe Leu Leu Glu Asn Val Arg Asn Phe Val Ser Phe Lys 1535 1540 1545 Arg Ser Met Val Leu Lys Leu Thr Leu Arg Cys Leu Val Arg Met 1550 1555 1560 Gly Tyr Gln Cys Thr Phe Gly Val Leu Gln Ala Gly Gln Tyr Gly 1565 1570 1575 Val Ala Gln Thr Arg Arg Arg Ala Ile Ile Leu Ala Ala Ala Pro 1580 1585 1590 Gly Glu Lys Leu Pro Leu Phe Pro Glu Pro Leu His Val Phe Ala 1595 1600 1605 Pro Arg Ala Cys Gln Leu Ser Val Val Val Asp Asp Lys Lys Phe 1610 1615 1620 Val Ser Asn Ile Thr Arg Leu Ser Ser Gly Pro Phe Arg Thr Ile 1625 1630 1635 Thr Val Arg Asp Thr Met Ser Asp Leu Pro Glu Val Arg Asn Gly 1640 1645 1650 Ala Ser Ala Leu Glu Ile Ser Tyr Asn Gly Glu Pro Gln Ser Trp 1655 1660 1665 Phe Gln Arg Gln Leu Arg Gly Ala Gln Tyr Gln Pro Ile Leu Arg 1670 1675 1680 Asp His Ile Cys Lys Asp Met Ser Ala Leu Val Ala Ala Arg Met 1685 1690 1695 Arg His Ile Pro Leu Ala Pro Gly Ser Asp Trp Arg Asp Leu Pro 1700 1705 1710 Asn Ile Glu Val Arg Leu Ser Asp Gly Thr Met Ala Arg Lys Leu 1715 1720 1725 Arg Tyr Thr His His Asp Arg Lys Asn Gly Arg Ser Ser Ser Gly 1730 1735 1740 Ala Leu Arg Gly Val Cys Ser Cys Val Glu Ala Gly Lys Ala Cys 1745 1750 1755 Asp Pro Ala Ala Arg Gln Phe Asn Thr Leu Ile Pro Trp Cys Leu 1760 1765 1770 Pro His Thr Gly Asn Arg His Asn His Trp Ala Gly Leu Tyr Gly 1775 1780 1785 Arg Leu Glu Trp Asp Gly Phe Phe Ser Thr Thr Val Thr Asn Pro 1790 1795 1800 Glu Pro Met Gly Lys Gln Gly Arg Val Leu His Pro Glu Gln His 1805 1810 1815 Arg Val Val Ser Val Arg Glu Cys Ala Arg Ser Gln Gly Phe Pro 1820 1825 1830 Asp Thr Tyr Arg Leu Phe Gly Asn Ile Leu Asp Lys His Arg Gln 1835 1840 1845 Val Gly Asn Ala Val Pro Pro Pro Leu Ala Lys Ala Ile Gly Leu 1850 1855 1860 Glu Ile Lys Leu Cys Met Leu Ala Lys Ala Arg Glu Ser Ala Ser 1865 1870 1875 Ala Lys Ile Lys Glu Glu Glu Ala Ala Lys Asp Gly Gly Gly Gly 1880 1885 1890 Ser Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1895 1900 1905 Lys Lys Lys Gly Ser 1910 <210> 153 <211> 1977 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 153 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 20 25 30 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 35 40 45 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 50 55 60 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 65 70 75 80 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 85 90 95 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 100 105 110 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 115 120 125 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 130 135 140 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 145 150 155 160 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 165 170 175 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 180 185 190 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 195 200 205 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 210 215 220 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 225 230 235 240 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 245 250 255 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 260 265 270 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 275 280 285 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 290 295 300 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 305 310 315 320 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 325 330 335 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 340 345 350 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 355 360 365 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 370 375 380 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 385 390 395 400 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 405 410 415 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 420 425 430 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 435 440 445 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 450 455 460 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 465 470 475 480 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 485 490 495 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 500 505 510 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 515 520 525 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 530 535 540 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 545 550 555 560 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 565 570 575 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 580 585 590 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 595 600 605 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 610 615 620 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 625 630 635 640 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 645 650 655 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 660 665 670 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 675 680 685 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 690 695 700 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 705 710 715 720 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 725 730 735 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 740 745 750 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 755 760 765 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 770 775 780 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 785 790 795 800 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 805 810 815 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 820 825 830 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 835 840 845 Leu Ser Asp Tyr Asp Val Ala Ala Ile Val Pro Gln Ser Phe Leu Lys 850 855 860 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Ala Arg 865 870 875 880 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 885 890 895 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 900 905 910 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 915 920 925 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 930 935 940 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 945 950 955 960 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 965 970 975 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 980 985 990 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 995 1000 1005 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu 1010 1015 1020 Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile 1025 1030 1035 Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe 1040 1045 1050 Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu 1055 1060 1065 Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly 1070 1075 1080 Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr 1085 1090 1095 Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys 1100 1105 1110 Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro 1115 1120 1125 Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp 1130 1135 1140 Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser 1145 1150 1155 Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu 1160 1165 1170 Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser 1175 1180 1185 Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr 1190 1195 1200 Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser 1205 1210 1215 Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala 1220 1225 1230 Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr 1235 1240 1245 Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly 1250 1255 1260 Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His 1265 1270 1275 Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser 1280 1285 1290 Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser 1295 1300 1305 Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu 1310 1315 1320 Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala 1325 1330 1335 Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr 1340 1345 1350 Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile 1355 1360 1365 Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly 1370 1375 1380 Asp Ser Ala Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly 1385 1390 1395 Gly Gly Ser Gly Pro Lys Lys Lys Arg Lys Val Ala Ala Ala Gly 1400 1405 1410 Ser Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro 1415 1420 1425 Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe 1430 1435 1440 Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile 1445 1450 1455 Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile 1460 1465 1470 Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly 1475 1480 1485 Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro 1490 1495 1500 Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile 1505 1510 1515 Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu 1520 1525 1530 Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu 1535 1540 1545 Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala 1550 1555 1560 Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser 1565 1570 1575 Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg 1580 1585 1590 Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu 1595 1600 1605 Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu 1610 1615 1620 His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr 1625 1630 1635 Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val 1640 1645 1650 Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu 1655 1660 1665 Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met 1670 1675 1680 Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val 1685 1690 1695 Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala 1700 1705 1710 Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser 1715 1720 1725 Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met 1730 1735 1740 Asn Pro Leu Glu Met Phe Glu Thr Val Pro Val Trp Arg Arg Gln 1745 1750 1755 Pro Val Arg Val Leu Ser Leu Phe Glu Asp Ile Lys Lys Glu Leu 1760 1765 1770 Thr Ser Leu Gly Phe Leu Glu Ser Gly Ser Asp Pro Gly Gln Leu 1775 1780 1785 Lys His Val Val Asp Val Thr Asp Thr Val Arg Lys Asp Val Glu 1790 1795 1800 Glu Trp Gly Pro Phe Asp Leu Val Tyr Gly Ala Thr Pro Pro Leu 1805 1810 1815 Gly His Thr Cys Asp Arg Pro Pro Ser Trp Tyr Leu Phe Gln Phe 1820 1825 1830 His Arg Leu Leu Gln Tyr Ala Arg Pro Lys Pro Gly Ser Pro Arg 1835 1840 1845 Pro Phe Phe Trp Met Phe Val Asp Asn Leu Val Leu Asn Lys Glu 1850 1855 1860 Asp Leu Asp Val Ala Ser Arg Phe Leu Glu Met Glu Pro Val Thr 1865 1870 1875 Ile Pro Asp Val His Gly Gly Ser Leu Gln Asn Ala Val Arg Val 1880 1885 1890 Trp Ser Asn Ile Pro Ala Ile Arg Ser Arg His Trp Ala Leu Val 1895 1900 1905 Ser Glu Glu Glu Leu Ser Leu Leu Ala Gln Asn Lys Gln Ser Ser 1910 1915 1920 Lys Leu Ala Ala Lys Trp Pro Thr Lys Leu Val Lys Asn Cys Phe 1925 1930 1935 Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Thr Glu Leu Thr 1940 1945 1950 Ser Ser Leu Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala 1955 1960 1965 Gly Gln Ala Lys Lys Lys Lys Gly Ser 1970 1975 <210> 154 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 154 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg 35 40 45 Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Thr Leu Thr 65 70 75 80 Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr Glu His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Thr Ser Gly Ser Leu Val Arg His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro 145 150 155 160 Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg 180 185 190 Val His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 155 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 155 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg 35 40 45 Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn Leu Thr 65 70 75 80 Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val Arg His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Ser Pro 145 150 155 160 Ala Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly His Leu Thr 180 185 190 Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 156 <211> 209 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 156 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser 35 40 45 Gly Asp Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg 65 70 75 80 Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser His Arg Thr Thr Leu Thr Asn His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Ser 145 150 155 160 Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser Leu Val 180 185 190 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr 195 200 205 Ser <210> 157 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 157 cttgagcccg gagaaaagcc atacaaatgt cctgaatgcg gaaagtcatt ttctacgagc 60 ggcgaactcg tgcggcacca aaggactcat accggcgaaa agccttacaa atgcccggag 120 tgcggaaaaa gcttctccga gcgctcgcac ttgcgggaac accagcgaac ccacacaggg 180 gagaaaccgt ataagtgccc agagtgcggc aaatcgttct cccggaacga caccctgacc 240 gaacaccaac gcactcatac tggcgaaaaa ccttacaagt gccctgagtg tggaaagagc 300 ttctcccgcg ccgataacct gaccgagcac cagcggaccc ataccgggga aaagccgtac 360 aagtgtccgg aatgcggcaa aagcttcagc acctcgggtt ccctggtccg gcatcagaga 420 actcacaccg gagagaaacc ctataagtgt cctgagtgcg ggaagtcctt ttcatcgccc 480 gcggacctga ctagacacca gaggacccac accggggaga agccctacaa gtgccccgaa 540 tgtggaaagt ccttctccga ctccggcaac ctccgggtgc accagcgcac ccacactgga 600 gagaagccga ccggaaagaa aacttcc 627 <210> 158 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 158 ctggaacccg gagaaaaacc ttataagtgc cctgaatgcg gaaagtcatt ctcgaggtcg 60 gacaagctcg tgcggcacca gaggacacac accggggaaa agccatacaa gtgtcccgaa 120 tgtggaaagt ccttcagcca acgcgccaac ctgagagctc atcagcggac tcacactggc 180 gaaaaaccgt acaaatgccc cgaatgcggc aaaagcttct cccgcgccga caacttgacc 240 gagcaccagc ggacccatac cggcgaaaag ccgtacaagt gcccggagtg tgggaagtcg 300 ttcagccagt cctcttccct cgtgcgccac caacgcaccc atactgggga gaagccctat 360 aagtgtcctg agtgtggcaa atcattcagc gataagaagg atcttacccg gcaccaacgg 420 actcataccg gagagaagcc ttacaagtgc cccgagtgcg gaaagagctt ctcgtccccg 480 gcggacctga ctagacacca gcgcacccac accggagaaa agccctacaa gtgcccagag 540 tgcgggaagt ccttttccca atccggtcac ctgactgagc accagagaac ccacacggga 600 gagaaaccga ccggaaagaa aacctcc 627 <210> 159 <211> 627 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 159 ttggaacccg gagaaaagcc atacaaatgc cccgaatgcg gaaagtcgtt cagccagtcc 60 ggcgacctca gacggcacca acggactcac accggcgaaa aaccgtacaa gtgcccagag 120 tgcggcaaaa gctttagcca gtcgggcgat ctgcggagac atcagcgcac tcacactggt 180 gaaaagccct acaagtgtcc tgagtgcggg aagtccttca gcgagcgctc ccatcttcgc 240 gagcaccaga gaacccacac tggagaaaaa ccttataagt gccctgagtg tggcaaatcc 300 ttctcaacca ccggcaacct gactgtgcac cagcggaccc acacagggga gaagccttac 360 aagtgcccgg agtgtgggaa gtcattctcc catcggacga ccctgaccaa ccaccagagg 420 acccatactg gcgaaaagcc gtataagtgt ccggagtgcg gaaagagctt ctccgactcc 480 ggaaacctca gggtgcacca acgcacccac accggagaga agccgtacaa atgtcccgaa 540 tgtggaaagt ccttctccca atcctcttcg ctggtccggc accagcgaac tcataccggg 600 gaaaagccca ccggaaagaa aacctcg 627 <210> 160 <211> 659 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 160 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Asn Asp Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn 115 120 125 Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Ser Leu Val Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys 625 630 635 640 Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro 645 650 655 Asp Tyr Ala <210> 161 <211> 659 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 161 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Gln Ser Gly His Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys 625 630 635 640 Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro 645 650 655 Asp Tyr Ala <210> 162 <211> 659 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 162 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn 115 120 125 Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser His Arg Thr Thr Leu Thr Asn His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys 625 630 635 640 Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro 645 650 655 Asp Tyr Ala <210> 163 <211> 650 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 163 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Asn Asp Thr Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ala Asp Asn 115 120 125 Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Ser Leu Val Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys 625 630 635 640 Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 645 650 <210> 164 <211> 650 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 164 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ala Asp Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Ser 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Ser Pro Ala Asp Leu Thr Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Gln Ser Gly His Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys 625 630 635 640 Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 645 650 <210> 165 <211> 650 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 165 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn 115 120 125 Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser His Arg Thr Thr Leu Thr Asn His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Asp Ser Gly Asn Leu Arg Val His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Gln Ser Ser Ser Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys 625 630 635 640 Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser 645 650 <210> 166 <211> 2255 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 166 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tcccttgagc 120 ccggagaaaa gccatacaaa tgtcctgaat gcggaaagtc attttctacg agcggcgaac 180 tcgtgcggca ccaaaggact cataccggcg aaaagcctta caaatgcccg gagtgcggaa 240 aaagcttctc cgagcgctcg cacttgcggg aacaccagcg aacccacaca ggggagaaac 300 cgtataagtg cccagagtgc ggcaaatcgt tctcccggaa cgacaccctg accgaacacc 360 aacgcactca tactggcgaa aaaccttaca agtgccctga gtgtggaaag agcttctccc 420 gcgccgataa cctgaccgag caccagcgga cccataccgg ggaaaagccg tacaagtgtc 480 cggaatgcgg caaaagcttc agcacctcgg gttccctggt ccggcatcag agaactcaca 540 ccggagagaa accctataag tgtcctgagt gcgggaagtc cttttcatcg cccgcggacc 600 tgactagaca ccagaggacc cacaccgggg agaagcccta caagtgcccc gaatgtggaa 660 agtccttctc cgactccggc aacctccggg tgcaccagcg cacccacact ggagagaagc 720 cgaccggaaa gaaaacttcc gcctccggtt cgggaggagg ctcaggagga gcgagagatt 780 ccaaggtcga gaacaagacc aagaagctgc gggtgttcga ggcctttgct ggcatcggag 840 cccagaggaa ggccctcgag aaggtccgca aggatgagta cgagatcgtg ggactcgcgg 900 agtggtacgt gcccgccatt gtgatgtacc aggccatcca taacaacttc cacactaagc 960 tggagtacaa gtccgtgtcc cgggaggaaa tgattgacta cctggagaat aagaccctgt 1020 catggaactc taagaacccc gtgtcgaacg gttactggaa gagaaagaag gatgacgaac 1080 tgaagattat ctacaacgcg atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctcta caagcgcacc ttgaagaaca tcgatctgct gacctactcc ttcccgtgcc 1200 aagacctgag ccagcagggc atccagaagg ggatgaaacg gggctccggt actcgcagcg 1260 gcttgctgtg ggaaattgag cgggccctgg atagcaccga gaagaacgac ttgccgaagt 1320 atcttctcat ggaaaacgtc ggggctctcc ttcacaagaa gaacgaggaa gaactgaacc 1380 agtggaagca aaagctggaa tccctcggat accagaactc cattgaggtc ctgaacgccg 1440 ccgacttcgg atcgtcgcaa gccagacgga gggtgttcat gattagcact ctgaacgaat 1500 tcgtggaact gccgaagggc gacaagaagc ctaagtccat caagaaggtg ctgaacaaga 1560 tcgtgtccga gaaggacatt ctcaacaatc tgctgaagta caacctgaca gagttcaaga 1620 aaaccaagtc caacatcaac aaggcctcct tgattggtta ctcaaagttc aacagcgagg 1680 gatacgtgta cgaccccgaa ttcactggac ccactctgac cgcctccgga gcaaactcta 1740 ggattaagat caaggacggc tccaacatcc ggaagatgaa ctccgacgaa acctttctgt 1800 acatcggctt cgactcgcaa gacggaaagc gcgtgaacga gatcgaattt cttaccgaaa 1860 accagaagat cttcgtgtgc ggcaattcaa tctccgtgga agtcctggaa gcgattatcg 1920 acaagatcgg aggcagtggt ggaaagcgcc cagcagccac taagaaggcc ggacaggcca 1980 agaagaagaa gggatcctac ccttacgatg tgccggatta cgcttgagcg gccgcttaat 2040 taagctgcct tctgcggggc ttgccttctg gccatgccct tcttctctcc cttgcacctg 2100 tacctcttgg tctttgaata aagcctgagt aggaagtcta gaaaaaaaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 2255 <210> 167 <211> 2255 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 167 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggaac 120 ccggagaaaa accttataag tgccctgaat gcggaaagtc attctcgagg tcggacaagc 180 tcgtgcggca ccagaggaca cacaccgggg aaaagccata caagtgtccc gaatgtggaa 240 agtccttcag ccaacgcgcc aacctgagag ctcatcagcg gactcacact ggcgaaaaac 300 cgtacaaatg ccccgaatgc ggcaaaagct tctcccgcgc cgacaacttg accgagcacc 360 agcggaccca taccggcgaa aagccgtaca agtgcccgga gtgtgggaag tcgttcagcc 420 agtcctcttc cctcgtgcgc caccaacgca cccatactgg ggagaagccc tataagtgtc 480 ctgagtgtgg caaatcattc agcgataaga aggatcttac ccggcaccaa cggactcata 540 ccggagagaa gccttacaag tgccccgagt gcggaaagag cttctcgtcc ccggcggacc 600 tgactagaca ccagcgcacc cacaccggag aaaagcccta caagtgccca gagtgcggga 660 agtccttttc ccaatccggt cacctgactg agcaccagag aacccacacg ggagagaaac 720 cgaccggaaa gaaaacctcc gcctccggtt cgggaggagg ctcaggagga gcgagagatt 780 ccaaggtcga gaacaagacc aagaagctgc gggtgttcga ggcctttgct ggcatcggag 840 cccagaggaa ggccctcgag aaggtccgca aggatgagta cgagatcgtg ggactcgcgg 900 agtggtacgt gcccgccatt gtgatgtacc aggccatcca taacaacttc cacactaagc 960 tggagtacaa gtccgtgtcc cgggaggaaa tgattgacta cctggagaat aagaccctgt 1020 catggaactc taagaacccc gtgtcgaacg gttactggaa gagaaagaag gatgacgaac 1080 tgaagattat ctacaacgcg atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctcta caagcgcacc ttgaagaaca tcgatctgct gacctactcc ttcccgtgcc 1200 aagacctgag ccagcagggc atccagaagg ggatgaaacg gggctccggt actcgcagcg 1260 gcttgctgtg ggaaattgag cgggccctgg atagcaccga gaagaacgac ttgccgaagt 1320 atcttctcat ggaaaacgtc ggggctctcc ttcacaagaa gaacgaggaa gaactgaacc 1380 agtggaagca aaagctggaa tccctcggat accagaactc cattgaggtc ctgaacgccg 1440 ccgacttcgg atcgtcgcaa gccagacgga gggtgttcat gattagcact ctgaacgaat 1500 tcgtggaact gccgaagggc gacaagaagc ctaagtccat caagaaggtg ctgaacaaga 1560 tcgtgtccga gaaggacatt ctcaacaatc tgctgaagta caacctgaca gagttcaaga 1620 aaaccaagtc caacatcaac aaggcctcct tgattggtta ctcaaagttc aacagcgagg 1680 gatacgtgta cgaccccgaa ttcactggac ccactctgac cgcctccgga gcaaactcta 1740 ggattaagat caaggacggc tccaacatcc ggaagatgaa ctccgacgaa acctttctgt 1800 acatcggctt cgactcgcaa gacggaaagc gcgtgaacga gatcgaattt cttaccgaaa 1860 accagaagat cttcgtgtgc ggcaattcaa tctccgtgga agtcctggaa gcgattatcg 1920 acaagatcgg aggcagtggt ggaaagcgcc cagcagccac taagaaggcc ggacaggcca 1980 agaagaagaa gggatcctac ccttacgatg tgccggatta cgcttgagcg gccgcttaat 2040 taagctgcct tctgcggggc ttgccttctg gccatgccct tcttctctcc cttgcacctg 2100 tacctcttgg tctttgaata aagcctgagt aggaagtcta gaaaaaaaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 2255 <210> 168 <211> 2255 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 168 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccttggaac 120 ccggagaaaa gccatacaaa tgccccgaat gcggaaagtc gttcagccag tccggcgacc 180 tcagacggca ccaacggact cacaccggcg aaaaaccgta caagtgccca gagtgcggca 240 aaagctttag ccagtcgggc gatctgcgga gacatcagcg cactcacact ggtgaaaagc 300 cctacaagtg tcctgagtgc gggaagtcct tcagcgagcg ctcccatctt cgcgagcacc 360 agagaaccca cactggagaa aaaccttata agtgccctga gtgtggcaaa tccttctcaa 420 ccaccggcaa cctgactgtg caccagcgga cccacacagg ggagaagcct tacaagtgcc 480 cggagtgtgg gaagtcattc tcccatcgga cgaccctgac caaccaccag aggacccata 540 ctggcgaaaa gccgtataag tgtccggagt gcggaaagag cttctccgac tccggaaacc 600 tcagggtgca ccaacgcacc cacaccggag agaagccgta caaatgtccc gaatgtggaa 660 agtccttctc ccaatcctct tcgctggtcc ggcaccagcg aactcatacc ggggaaaagc 720 ccaccggaaa gaaaacctcg gcctccggtt cgggaggagg ctcaggagga gcgagagatt 780 ccaaggtcga gaacaagacc aagaagctgc gggtgttcga ggcctttgct ggcatcggag 840 cccagaggaa ggccctcgag aaggtccgca aggatgagta cgagatcgtg ggactcgcgg 900 agtggtacgt gcccgccatt gtgatgtacc aggccatcca taacaacttc cacactaagc 960 tggagtacaa gtccgtgtcc cgggaggaaa tgattgacta cctggagaat aagaccctgt 1020 catggaactc taagaacccc gtgtcgaacg gttactggaa gagaaagaag gatgacgaac 1080 tgaagattat ctacaacgcg atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctcta caagcgcacc ttgaagaaca tcgatctgct gacctactcc ttcccgtgcc 1200 aagacctgag ccagcagggc atccagaagg ggatgaaacg gggctccggt actcgcagcg 1260 gcttgctgtg ggaaattgag cgggccctgg atagcaccga gaagaacgac ttgccgaagt 1320 atcttctcat ggaaaacgtc ggggctctcc ttcacaagaa gaacgaggaa gaactgaacc 1380 agtggaagca aaagctggaa tccctcggat accagaactc cattgaggtc ctgaacgccg 1440 ccgacttcgg atcgtcgcaa gccagacgga gggtgttcat gattagcact ctgaacgaat 1500 tcgtggaact gccgaagggc gacaagaagc ctaagtccat caagaaggtg ctgaacaaga 1560 tcgtgtccga gaaggacatt ctcaacaatc tgctgaagta caacctgaca gagttcaaga 1620 aaaccaagtc caacatcaac aaggcctcct tgattggtta ctcaaagttc aacagcgagg 1680 gatacgtgta cgaccccgaa ttcactggac ccactctgac cgcctccgga gcaaactcta 1740 ggattaagat caaggacggc tccaacatcc ggaagatgaa ctccgacgaa acctttctgt 1800 acatcggctt cgactcgcaa gacggaaagc gcgtgaacga gatcgaattt cttaccgaaa 1860 accagaagat cttcgtgtgc ggcaattcaa tctccgtgga agtcctggaa gcgattatcg 1920 acaagatcgg aggcagtggt ggaaagcgcc cagcagccac taagaaggcc ggacaggcca 1980 agaagaagaa gggatcctac ccttacgatg tgccggatta cgcttgagcg gccgcttaat 2040 taagctgcct tctgcggggc ttgccttctg gccatgccct tcttctctcc cttgcacctg 2100 tacctcttgg tctttgaata aagcctgagt aggaagtcta gaaaaaaaaa aaaaaaaaaa 2160 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 2255 <210> 169 <211> 204 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 169 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 35 40 45 Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala 65 70 75 80 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 145 150 155 160 Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Thr Asp Thr Leu Arg 180 185 190 Asp His Gln Arg Thr His Thr Gly Lys Lys Thr Ser 195 200 <210> 170 <211> 204 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 170 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Gln Lys Ser Ser Leu Ile Ala His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser His Lys 35 40 45 Asn Ala Leu Gln Asn His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Ser Asn Leu Val 65 70 75 80 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala Leu Thr Glu His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ala 145 150 155 160 Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr 180 185 190 Arg His Gln Arg Thr His Thr Gly Lys Lys Thr Ser 195 200 <210> 171 <211> 204 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 171 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys 35 40 45 Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val 65 70 75 80 Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Thr 145 150 155 160 Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His 180 185 190 Thr His Gln Arg Thr His Thr Gly Lys Lys Thr Ser 195 200 <210> 172 <211> 204 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 172 Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 1 5 10 15 Phe Ser Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Lys 35 40 45 Ser Ser Leu Ile Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 50 55 60 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Arg Asp Glu Leu Asn 65 70 75 80 Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 85 90 95 Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp Leu Arg Arg His Gln Arg 100 105 110 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 115 120 125 Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly 130 135 140 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser 145 150 155 160 Gly Asn Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 165 170 175 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ala Gly His Leu Ala 180 185 190 Ser His Gln Arg Thr His Thr Gly Lys Lys Thr Ser 195 200 <210> 173 <211> 612 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 173 ctggagcctg gagagaaacc ctacaaatgc ccggaatgcg ggaagtcctt ttccgaacgc 60 tcgcacctga gggaacacca gagaactcac accggcgaaa aaccctataa gtgcccagaa 120 tgcggaaaga gcttttcacg gtcggacaac ctcgtgcggc accaacgcac tcataccgga 180 gagaagccgt acaagtgtcc tgagtgcgga aagtcattct ccgactgccg ggatttggcc 240 cgccaccaaa gaacacacac tggcgaaaag ccctacaagt gcccggagtg tggaaagtcc 300 ttcagcactt ccggagagct ggtccggcac cagaggaccc acaccgggga gaagccttac 360 aaatgtccag agtgcggtaa aagcttctcc accaccggca acctcaccgt gcaccagcgg 420 acccacactg gagaaaagcc gtataaatgc cccgaatgcg gcaagagctt ctcgcgatcc 480 gataagcttg tgcggcatca gagaacgcac actggggaaa agccttataa gtgtccggag 540 tgcggcaaat ccttctcccg cactgacacc ctgcgggacc atcagcgcac ccataccggc 600 aaaaagacct ct 612 <210> 174 <211> 612 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 174 cttgaacccg gggagaagcc ctacaagtgc ccggaatgcg gaaagagctt cagccagaag 60 tcctcgctga tcgcgcacca gaggactcac accggcgaaa agccatacaa gtgtcctgag 120 tgtggcaaat ccttctcgca caagaacgca ctgcagaacc accagagaac ccacaccggg 180 gaaaagccgt ataagtgccc cgaatgtgga aagtcgttca gccagtcatc caacctcgtg 240 cgccatcaaa ggactcatac cggagagaaa ccttacaaat gccctgaatg cggcaaatct 300 ttctcccgga atgatgccct gaccgagcac cagcgcactc acacgggaga gaagccgtac 360 aaatgtccgg agtgcggaaa gtccttctcc gacaagaagg acttgaccag acaccagcgg 420 acccatactg gcgaaaaacc ctataagtgt ccagagtgcg ggaagtcctt tagccaagcc 480 ggtcacctcg cttcccacca acggacccac acaggagaaa agccttataa atgccccgag 540 tgcggcaaaa gcttctccga taagaaggac ctgactcggc atcagcgcac ccataccgga 600 aagaaaacct ca 612 <210> 175 <211> 612 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 175 ctggagcctg gcgaaaaacc ctataagtgc ccagaatgcg gaaagagctt ttcacggtcg 60 gacaacctcg tgcggcacca acgcactcat accggagaga agccgtacaa gtgtcctgag 120 tgcggaaagt cattctccga ctgccgggat ttggcccgcc accaaagaac acacactggc 180 gaaaagccct acaagtgccc ggagtgtgga aagtccttca gcacttccgg agagctggtc 240 cggcaccaga ggacccacac cggggagaag ccttacaaat gtccagagtg cggtaaaagc 300 ttctccacca ccggcaacct caccgtgcac cagcggaccc acactggaga aaagccgtat 360 aaatgccccg aatgcggcaa gagcttctcg cgatccgata agcttgtgcg gcatcagaga 420 acgcacactg gggaaaagcc ttataagtgt ccggagtgcg gcaaatcctt ctcccgcact 480 gacaccctgc gggaccacca gagaacccat actggcgaga agccatacaa atgcccggaa 540 tgtggaaaga gtttctcgcg cgaggacaac ctccacaccc atcagcgcac ccataccggc 600 aaaaagacct ct 612 <210> 176 <211> 612 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 176 ctggaacccg gagagaaacc ctacaaatgc ccagagtgcg gcaaatcgtt ctcacggtcc 60 gatcacctca ccacccacca gaggacccat accggggaga agccttacaa gtgtcctgag 120 tgtggaaagt ccttcagcca aaagtcctcg ctgatcgcac accagcgcac gcacactggg 180 gaaaagccat ataaatgccc ggagtgtggc aaatccttct cccgccgcga cgaactgaac 240 gtgcaccaga gaacccacac tggagagaag ccgtataagt gtccggagtg cggaaagagc 300 ttctcgcaat ccggggacct tcggagacat cagaggacac acactggcga aaagccctat 360 aagtgccctg agtgcgggaa gtcctttagc caagccggtc acctggcctc ccaccaacgg 420 actcacaccg gcgaaaaacc gtacaagtgc cccgaatgcg gaaagtcgtt ctctacctcc 480 ggaaacttga ccgaacacca gcggacccac accggagaaa agccgtacaa atgtcctgaa 540 tgcggcaaaa gcttcagcca ggccggtcat ctcgcgagcc atcagcggac tcatactggc 600 aaaaagacct ca 612 <210> 177 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 177 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Lys Lys 210 215 220 Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp 225 230 235 240 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 245 250 255 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 260 265 270 Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 275 280 285 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 290 295 300 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 305 310 315 320 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro 325 330 335 Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 <210> 178 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 178 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Gln Lys Ser Ser Leu Ile Ala His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser His Lys Asn Ala Leu Gln Asn His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Gln Ser Ser Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala 115 120 125 Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Lys Lys 210 215 220 Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp 225 230 235 240 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 245 250 255 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 260 265 270 Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 275 280 285 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 290 295 300 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 305 310 315 320 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro 325 330 335 Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 <210> 179 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 179 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn 115 120 125 Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Lys Lys 210 215 220 Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp 225 230 235 240 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 245 250 255 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 260 265 270 Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 275 280 285 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 290 295 300 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 305 310 315 320 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro 325 330 335 Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 <210> 180 <211> 367 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 180 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Thr His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Lys Ser Ser Leu Ile Ala His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Arg Asp Glu Leu Asn Val His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp 115 120 125 Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Ala Gly His Leu Ala Ser His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly Lys Lys 210 215 220 Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp 225 230 235 240 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 245 250 255 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 260 265 270 Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 275 280 285 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 290 295 300 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 305 310 315 320 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro 325 330 335 Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 355 360 365 <210> 181 <211> 1082 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 181 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn 115 120 125 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys 625 630 635 640 Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val 645 650 655 Pro Asp Tyr Ala Gly Ser Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala 660 665 670 Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly 675 680 685 Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu 690 695 700 Asn Pro Gly Pro Leu Glu Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys 705 710 715 720 Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala Gly Ser Ser Gly 725 730 735 Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys 740 745 750 Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr 755 760 765 Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg 770 775 780 Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro 785 790 795 800 Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu 805 810 815 Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro 820 825 830 Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln 835 840 845 Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys 850 855 860 Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His Thr 865 870 875 880 Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg 885 890 895 Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro 900 905 910 Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Thr Asp Thr Leu 915 920 925 Arg Asp His Gln Arg Thr His Thr Gly Lys Lys Thr Ser Ala Ser Gly 930 935 940 Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp Ala Lys Ser Leu Thr 945 950 955 960 Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe 965 970 975 Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr 980 985 990 Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr 995 1000 1005 Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu 1010 1015 1020 Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro 1025 1030 1035 Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro Ser Ser 1040 1045 1050 Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1055 1060 1065 Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1070 1075 1080 <210> 182 <211> 1082 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 182 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Lys Lys 210 215 220 Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp 225 230 235 240 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 245 250 255 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 260 265 270 Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 275 280 285 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 290 295 300 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 305 310 315 320 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro 325 330 335 Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly 355 360 365 Ser Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu 370 375 380 Asn Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg 385 390 395 400 Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Leu 405 410 415 Glu Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly 420 425 430 Ile His Gly Val Pro Ala Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly 435 440 445 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 450 455 460 Asp Asp Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 465 470 475 480 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His 485 490 495 Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 500 505 510 Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Thr His Gln Arg 515 520 525 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 530 535 540 Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly 545 550 555 560 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu 565 570 575 Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 580 585 590 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg 595 600 605 Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 610 615 620 Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg 625 630 635 640 Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly 645 650 655 Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Ser Lys Val Glu Asn Lys 660 665 670 Thr Lys Lys Leu Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln 675 680 685 Arg Lys Ala Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly 690 695 700 Leu Ala Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His 705 710 715 720 Asn Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu 725 730 735 Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn 740 745 750 Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys 755 760 765 Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe 770 775 780 Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu 785 790 795 800 Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys 805 810 815 Gly Met Lys Arg Gly Ser Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile 820 825 830 Glu Arg Ala Leu Asp Ser Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu 835 840 845 Leu Met Glu Asn Val Gly Ala Leu Leu His Lys Lys Asn Glu Glu Glu 850 855 860 Leu Asn Gln Trp Lys Gln Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser 865 870 875 880 Ile Glu Val Leu Asn Ala Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg 885 890 895 Arg Val Phe Met Ile Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys 900 905 910 Gly Asp Lys Lys Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val 915 920 925 Ser Glu Lys Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu 930 935 940 Phe Lys Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr 945 950 955 960 Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly 965 970 975 Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp 980 985 990 Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile 995 1000 1005 Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile Glu Phe 1010 1015 1020 Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser Ile Ser 1025 1030 1035 Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly Pro Ser 1040 1045 1050 Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1055 1060 1065 Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala 1070 1075 1080 <210> 183 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 183 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Lys Lys 210 215 220 Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp 225 230 235 240 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 245 250 255 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 260 265 270 Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 275 280 285 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 290 295 300 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 305 310 315 320 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro 325 330 335 Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser 355 <210> 184 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 184 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Gln Lys Ser Ser Leu Ile Ala His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser His Lys Asn Ala Leu Gln Asn His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Gln Ser Ser Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Asn Asp Ala 115 120 125 Leu Thr Glu His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Asp Lys Lys Asp Leu Thr Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Asp Lys Lys Asp Leu Thr Arg His Gln Arg Thr His Thr Gly Lys Lys 210 215 220 Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp 225 230 235 240 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 245 250 255 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 260 265 270 Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 275 280 285 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 290 295 300 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 305 310 315 320 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro 325 330 335 Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser 355 <210> 185 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 185 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Thr Ser Gly Glu Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn 115 120 125 Leu Thr Val His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His Thr Gly Lys Lys 210 215 220 Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp 225 230 235 240 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 245 250 255 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 260 265 270 Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 275 280 285 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 290 295 300 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 305 310 315 320 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro 325 330 335 Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser 355 <210> 186 <211> 358 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 186 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Thr His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Gln Lys Ser Ser Leu Ile Ala His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Arg Asp Glu Leu Asn Val His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Ser Gly Asp 115 120 125 Leu Arg Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Ala Gly His Leu Ala Ser His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Thr Ser Gly Asn Leu Thr Glu His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Gln Ala Gly His Leu Ala Ser His Gln Arg Thr His Thr Gly Lys Lys 210 215 220 Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp 225 230 235 240 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 245 250 255 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 260 265 270 Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 275 280 285 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 290 295 300 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 305 310 315 320 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro 325 330 335 Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser 355 <210> 187 <211> 1073 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 187 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser Asp Asp Leu Val Arg His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Glu Asp Asn Leu His Thr His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Arg Ser Asp His Leu Thr Thr His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn 115 120 125 Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu Ala His Leu Arg Ala His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr Gly Glu Lys 210 215 220 Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly 225 230 235 240 Gly Ala Arg Asp Ser Lys Val Glu Asn Lys Thr Lys Lys Leu Arg Val 245 250 255 Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln Arg Lys Ala Leu Glu Lys 260 265 270 Val Arg Lys Asp Glu Tyr Glu Ile Val Gly Leu Ala Glu Trp Tyr Val 275 280 285 Pro Ala Ile Val Met Tyr Gln Ala Ile His Asn Asn Phe His Thr Lys 290 295 300 Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu Met Ile Asp Tyr Leu Glu 305 310 315 320 Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn Pro Val Ser Asn Gly Tyr 325 330 335 Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys Ile Ile Tyr Asn Ala Ile 340 345 350 Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe Asp Ile Arg Asp Leu Tyr 355 360 365 Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu Thr Tyr Ser Phe Pro Cys 370 375 380 Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys Gly Met Lys Arg Gly Ser 385 390 395 400 Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile Glu Arg Ala Leu Asp Ser 405 410 415 Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu Leu Met Glu Asn Val Gly 420 425 430 Ala Leu Leu His Lys Lys Asn Glu Glu Glu Leu Asn Gln Trp Lys Gln 435 440 445 Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser Ile Glu Val Leu Asn Ala 450 455 460 Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg Arg Val Phe Met Ile Ser 465 470 475 480 Thr Leu Asn Glu Phe Val Glu Leu Pro Lys Gly Asp Lys Lys Pro Lys 485 490 495 Ser Ile Lys Lys Val Leu Asn Lys Ile Val Ser Glu Lys Asp Ile Leu 500 505 510 Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu Phe Lys Lys Thr Lys Ser 515 520 525 Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr Ser Lys Phe Asn Ser Glu 530 535 540 Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly Pro Thr Leu Thr Ala Ser 545 550 555 560 Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp Gly Ser Asn Ile Arg Lys 565 570 575 Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile Gly Phe Asp Ser Gln Asp 580 585 590 Gly Lys Arg Val Asn Glu Ile Glu Phe Leu Thr Glu Asn Gln Lys Ile 595 600 605 Phe Val Cys Gly Asn Ser Ile Ser Val Glu Val Leu Glu Ala Ile Ile 610 615 620 Asp Lys Ile Gly Gly Pro Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys 625 630 635 640 Lys Ala Gly Gln Ala Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val 645 650 655 Pro Asp Tyr Ala Gly Ser Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala 660 665 670 Gly Asp Val Glu Glu Asn Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly 675 680 685 Ser Gly Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu 690 695 700 Asn Pro Gly Pro Leu Glu Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys 705 710 715 720 Lys Arg Lys Val Gly Ile His Gly Val Pro Ala Ala Gly Ser Ser Gly 725 730 735 Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys 740 745 750 Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg Thr His Thr 755 760 765 Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg 770 775 780 Ser Asp Asn Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro 785 790 795 800 Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Asp Cys Arg Asp Leu 805 810 815 Ala Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro 820 825 830 Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu Leu Val Arg His Gln 835 840 845 Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys 850 855 860 Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His Gln Arg Thr His Thr 865 870 875 880 Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg 885 890 895 Ser Asp Lys Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro 900 905 910 Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Thr Asp Thr Leu 915 920 925 Arg Asp His Gln Arg Thr His Thr Gly Lys Lys Thr Ser Ala Ser Gly 930 935 940 Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp Ala Lys Ser Leu Thr 945 950 955 960 Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe 965 970 975 Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Leu Tyr 980 985 990 Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr 995 1000 1005 Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu 1010 1015 1020 Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu Thr His Pro 1025 1030 1035 Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro Ser Ser 1040 1045 1050 Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1055 1060 1065 Lys Lys Lys Gly Ser 1070 <210> 188 <211> 1073 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 188 Met Ala Pro Lys Lys Lys Arg Lys Val Gly Ile His Gly Val Pro Ala 1 5 10 15 Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly Glu Lys Pro Tyr Lys Cys 20 25 30 Pro Glu Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His 35 40 45 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 50 55 60 Lys Ser Phe Ser Arg Ser Asp Asn Leu Val Arg His Gln Arg Thr His 65 70 75 80 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 85 90 95 Asp Cys Arg Asp Leu Ala Arg His Gln Arg Thr His Thr Gly Glu Lys 100 105 110 Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Thr Ser Gly Glu 115 120 125 Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys 130 135 140 Pro Glu Cys Gly Lys Ser Phe Ser Thr Thr Gly Asn Leu Thr Val His 145 150 155 160 Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly 165 170 175 Lys Ser Phe Ser Arg Ser Asp Lys Leu Val Arg His Gln Arg Thr His 180 185 190 Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser 195 200 205 Arg Thr Asp Thr Leu Arg Asp His Gln Arg Thr His Thr Gly Lys Lys 210 215 220 Thr Ser Ala Ser Gly Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Asp 225 230 235 240 Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys Asp 245 250 255 Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr Ala 260 265 270 Gln Gln Ile Leu Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn Leu 275 280 285 Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu 290 295 300 Glu Lys Gly Glu Glu Pro Trp Leu Val Glu Arg Glu Ile His Gln Glu 305 310 315 320 Thr His Pro Asp Ser Glu Thr Ala Phe Glu Ile Lys Ser Ser Val Pro 325 330 335 Ser Ser Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala 340 345 350 Lys Lys Lys Lys Gly Ser Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Gly 355 360 365 Ser Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu 370 375 380 Asn Pro Gly Pro Thr Ser Ala Gly Lys Leu Gly Ser Gly Glu Gly Arg 385 390 395 400 Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro Gly Pro Leu 405 410 415 Glu Gly Ser Ser Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Gly 420 425 430 Ile His Gly Val Pro Ala Ala Gly Ser Ser Gly Ser Leu Glu Pro Gly 435 440 445 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Ser 450 455 460 Asp Asp Leu Val Arg His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 465 470 475 480 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Arg Glu Asp Asn Leu His 485 490 495 Thr His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 500 505 510 Cys Gly Lys Ser Phe Ser Arg Ser Asp His Leu Thr Thr His Gln Arg 515 520 525 Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser 530 535 540 Phe Ser Gln Arg Ala Asn Leu Arg Ala His Gln Arg Thr His Thr Gly 545 550 555 560 Glu Lys Pro Tyr Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Leu 565 570 575 Ala His Leu Arg Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr 580 585 590 Lys Cys Pro Glu Cys Gly Lys Ser Phe Ser Gln Arg Ala Asn Leu Arg 595 600 605 Ala His Gln Arg Thr His Thr Gly Glu Lys Pro Tyr Lys Cys Pro Glu 610 615 620 Cys Gly Lys Ser Phe Ser Glu Arg Ser His Leu Arg Glu His Gln Arg 625 630 635 640 Thr His Thr Gly Glu Lys Pro Thr Gly Lys Lys Thr Ser Ala Ser Gly 645 650 655 Ser Gly Gly Gly Ser Gly Gly Ala Arg Asp Ser Lys Val Glu Asn Lys 660 665 670 Thr Lys Lys Leu Arg Val Phe Glu Ala Phe Ala Gly Ile Gly Ala Gln 675 680 685 Arg Lys Ala Leu Glu Lys Val Arg Lys Asp Glu Tyr Glu Ile Val Gly 690 695 700 Leu Ala Glu Trp Tyr Val Pro Ala Ile Val Met Tyr Gln Ala Ile His 705 710 715 720 Asn Asn Phe His Thr Lys Leu Glu Tyr Lys Ser Val Ser Arg Glu Glu 725 730 735 Met Ile Asp Tyr Leu Glu Asn Lys Thr Leu Ser Trp Asn Ser Lys Asn 740 745 750 Pro Val Ser Asn Gly Tyr Trp Lys Arg Lys Lys Asp Asp Glu Leu Lys 755 760 765 Ile Ile Tyr Asn Ala Ile Lys Leu Ser Glu Lys Glu Gly Asn Ile Phe 770 775 780 Asp Ile Arg Asp Leu Tyr Lys Arg Thr Leu Lys Asn Ile Asp Leu Leu 785 790 795 800 Thr Tyr Ser Phe Pro Cys Gln Asp Leu Ser Gln Gln Gly Ile Gln Lys 805 810 815 Gly Met Lys Arg Gly Ser Gly Thr Arg Ser Gly Leu Leu Trp Glu Ile 820 825 830 Glu Arg Ala Leu Asp Ser Thr Glu Lys Asn Asp Leu Pro Lys Tyr Leu 835 840 845 Leu Met Glu Asn Val Gly Ala Leu Leu His Lys Lys Asn Glu Glu Glu 850 855 860 Leu Asn Gln Trp Lys Gln Lys Leu Glu Ser Leu Gly Tyr Gln Asn Ser 865 870 875 880 Ile Glu Val Leu Asn Ala Ala Asp Phe Gly Ser Ser Gln Ala Arg Arg 885 890 895 Arg Val Phe Met Ile Ser Thr Leu Asn Glu Phe Val Glu Leu Pro Lys 900 905 910 Gly Asp Lys Lys Pro Lys Ser Ile Lys Lys Val Leu Asn Lys Ile Val 915 920 925 Ser Glu Lys Asp Ile Leu Asn Asn Leu Leu Lys Tyr Asn Leu Thr Glu 930 935 940 Phe Lys Lys Thr Lys Ser Asn Ile Asn Lys Ala Ser Leu Ile Gly Tyr 945 950 955 960 Ser Lys Phe Asn Ser Glu Gly Tyr Val Tyr Asp Pro Glu Phe Thr Gly 965 970 975 Pro Thr Leu Thr Ala Ser Gly Ala Asn Ser Arg Ile Lys Ile Lys Asp 980 985 990 Gly Ser Asn Ile Arg Lys Met Asn Ser Asp Glu Thr Phe Leu Tyr Ile 995 1000 1005 Gly Phe Asp Ser Gln Asp Gly Lys Arg Val Asn Glu Ile Glu Phe 1010 1015 1020 Leu Thr Glu Asn Gln Lys Ile Phe Val Cys Gly Asn Ser Ile Ser 1025 1030 1035 Val Glu Val Leu Glu Ala Ile Ile Asp Lys Ile Gly Gly Pro Ser 1040 1045 1050 Gly Gly Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys 1055 1060 1065 Lys Lys Lys Gly Ser 1070 <210> 189 <211> 1376 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 189 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ctggagagaa accctacaaa tgcccggaat gcgggaagtc cttttccgaa cgctcgcacc 180 tgagggaaca ccagagaact cacaccggcg aaaaacccta taagtgccca gaatgcggaa 240 agagcttttc acggtcggac aacctcgtgc ggcaccaacg cactcatacc ggagagaagc 300 cgtacaagtg tcctgagtgc ggaaagtcat tctccgactg ccgggatttg gcccgccacc 360 aaagaacaca cactggcgaa aagccctaca agtgcccgga gtgtggaaag tccttcagca 420 cttccggaga gctggtccgg caccagagga cccacaccgg ggagaagcct tacaaatgtc 480 cagagtgcgg taaaagcttc tccaccaccg gcaacctcac cgtgcaccag cggacccaca 540 ctggagaaaa gccgtataaa tgccccgaat gcggcaagag cttctcgcga tccgataagc 600 ttgtgcggca tcagagaacg cacactgggg aaaagcctta taagtgtccg gagtgcggca 660 aatccttctc ccgcactgac accctgcggg accatcagcg cacccatacc ggcaaaaaga 720 cctctgctag cggcagcggc ggcggcagcg gcggcgcccg ggacgacgcc aagagcctga 780 ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc acccgggagg 840 agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg ctggagaact 900 acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc ctgcggctgg 960 agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggaaacc caccccgaca 1020 gcgaaaccgc cttcgagatc aagagcagcg tgcccagcag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200 cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260 tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1376 <210> 190 <211> 21 <212> DNA <213> Homo sapiens <400> 190 aacacagttc agccgagcgc t 21 <210> 191 <211> 21 <212> DNA <213> Homo sapiens <400> 191 cgaacaaccg tacagaaagg g 21 <210> 192 <211> 21 <212> DNA <213> Homo sapiens <400> 192 gtaaacagta atagcgcagc a 21 <210> 193 <211> 1376 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 193 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tcccttgaac 120 ccggggagaa gccctacaag tgcccggaat gcggaaagag cttcagccag aagtcctcgc 180 tgatcgcgca ccagaggact cacaccggcg aaaagccata caagtgtcct gagtgtggca 240 aatccttctc gcacaagaac gcactgcaga accaccagag aacccacacc ggggaaaagc 300 cgtataagtg ccccgaatgt ggaaagtcgt tcagccagtc atccaacctc gtgcgccatc 360 aaaggactca taccggagag aaaccttaca aatgccctga atgcggcaaa tctttctccc 420 ggaatgatgc cctgaccgag caccagcgca ctcacacggg agagaagccg tacaaatgtc 480 cggagtgcgg aaagtccttc tccgacaaga aggacttgac cagacaccag cggacccata 540 ctggcgaaaa accctataag tgtccagagt gcgggaagtc ctttagccaa gccggtcacc 600 tcgcttccca ccaacggacc cacacaggag aaaagcctta taaatgcccc gagtgcggca 660 aaagcttctc cgataagaag gacctgactc ggcatcagcg cacccatacc ggaaagaaaa 720 cctcagctag cggcagcggc ggcggcagcg gcggcgcccg ggacgacgcc aagagcctga 780 ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc acccgggagg 840 agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg ctggagaact 900 acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc ctgcggctgg 960 agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggaaacc caccccgaca 1020 gcgaaaccgc cttcgagatc aagagcagcg tgcccagcag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200 cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260 tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1376 <210> 194 <211> 1376 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 194 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggagc 120 ctggcgaaaa accctataag tgcccagaat gcggaaagag cttttcacgg tcggacaacc 180 tcgtgcggca ccaacgcact cataccggag agaagccgta caagtgtcct gagtgcggaa 240 agtcattctc cgactgccgg gatttggccc gccaccaaag aacacacact ggcgaaaagc 300 cctacaagtg cccggagtgt ggaaagtcct tcagcacttc cggagagctg gtccggcacc 360 agaggaccca caccggggag aagccttaca aatgtccaga gtgcggtaaa agcttctcca 420 ccaccggcaa cctcaccgtg caccagcgga cccacactgg agaaaagccg tataaatgcc 480 ccgaatgcgg caagagcttc tcgcgatccg ataagcttgt gcggcatcag agaacgcaca 540 ctggggaaaa gccttataag tgtccggagt gcggcaaatc cttctcccgc actgacaccc 600 tgcgggacca ccagagaacc catactggcg agaagccata caaatgcccg gaatgtggaa 660 agagtttctc gcgcgaggac aacctccaca cccatcagcg cacccatacc ggcaaaaaga 720 cctctgctag cggcagcggc ggcggcagcg gcggcgcccg ggacgacgcc aagagcctga 780 ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc acccgggagg 840 agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg ctggagaact 900 acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc ctgcggctgg 960 agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggaaacc caccccgaca 1020 gcgaaaccgc cttcgagatc aagagcagcg tgcccagcag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200 cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260 tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1376 <210> 195 <211> 1376 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 195 aggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gcccccaaga 60 agaagcggaa ggtgggcatc cacggcgtgc ccgccgccgg cagcagcgga tccctggaac 120 ccggagagaa accctacaaa tgcccagagt gcggcaaatc gttctcacgg tccgatcacc 180 tcaccaccca ccagaggacc cataccgggg agaagcctta caagtgtcct gagtgtggaa 240 agtccttcag ccaaaagtcc tcgctgatcg cacaccagcg cacgcacact ggggaaaagc 300 catataaatg cccggagtgt ggcaaatcct tctcccgccg cgacgaactg aacgtgcacc 360 agagaaccca cactggagag aagccgtata agtgtccgga gtgcggaaag agcttctcgc 420 aatccgggga ccttcggaga catcagagga cacacactgg cgaaaagccc tataagtgcc 480 ctgagtgcgg gaagtccttt agccaagccg gtcacctggc ctcccaccaa cggactcaca 540 ccggcgaaaa accgtacaag tgccccgaat gcggaaagtc gttctctacc tccggaaact 600 tgaccgaaca ccagcggacc cacaccggag aaaagccgta caaatgtcct gaatgcggca 660 aaagcttcag ccaggccggt catctcgcga gccatcagcg gactcatact ggcaaaaaga 720 cctcagctag cggcagcggc ggcggcagcg gcggcgcccg ggacgacgcc aagagcctga 780 ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc acccgggagg 840 agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg ctggagaact 900 acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc ctgcggctgg 960 agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggaaacc caccccgaca 1020 gcgaaaccgc cttcgagatc aagagcagcg tgcccagcag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgcctg agcggccgct taattaagct gccttctgcg gggcttgcct tctggccatg 1200 cccttcttct ctcccttgca cctgtacctc ttggtctttg aataaagcct gagtaggaag 1260 tctagaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaa 1376 <210> 196 <211> 3521 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 196 gggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gccccaaaga 60 agaagagaaa ggtcggaatt catggcgtgc ccgcagccgg cagcagcggt tccctggagc 120 ccggcgagaa accttacaaa tgccccgagt gcggcaagag cttcagcaga agcgacgatc 180 tggtgaggca ccaaagaacc cacaccggcg aaaaacctta caagtgtccc gaatgcggaa 240 agtccttcag cagagaggac aatctgcaca cccaccagag aacacacacc ggagaaaagc 300 cttacaagtg ccccgaatgc ggcaaatcct tttctagaag cgatcatctg accacccacc 360 aaagaacaca taccggcgag aagccttaca aatgtcccga gtgcggaaag tccttctccc 420 agagagccaa tctgagggct catcaaagga cccataccgg cgaaaagccc tacaaatgcc 480 ccgagtgcgg aaaatccttc agccagctgg cccatctgag agcccaccaa aggacacaca 540 ccggagagaa accctataag tgccccgagt gtggaaaaag cttttcccag agggccaatc 600 tgagggccca tcagaggacc cataccggag agaagcctta taaatgtccc gagtgcggaa 660 aaagcttcag cgagaggagc catctgaggg aacatcaaag aacccacacc ggcgaaaaac 720 ccaccggaaa aaagaccagc gctagcggca gcggcggcgg cagcggcggc gcccgggaca 780 gcaaggtgga gaacaagacc aagaagctgc gggtgttcga ggccttcgcc ggcatcggcg 840 cccagcggaa ggccctggag aaggtgcgga aggacgagta cgagatcgtg ggcctggccg 900 agtggtacgt gcccgccatc gtgatgtacc aggccatcca caacaacttc cacaccaagc 960 tggagtacaa gagcgtgagc cgggaggaga tgatcgacta cctggagaac aagaccctga 1020 gctggaacag caagaacccc gtgagcaacg gctactggaa gcggaagaag gacgacgagc 1080 tgaagatcat ctacaacgcc atcaagctga gcgagaagga gggcaacatc ttcgacatcc 1140 gggacctgta caagcggacc ctgaagaaca tcgacctgct gacctacagc ttcccctgcc 1200 aggacctgag ccagcagggc atccagaagg gcatgaagcg gggcagcggc acccggagcg 1260 gcctgctgtg ggagatcgag cgggccctgg acagcaccga gaagaacgac ctgcccaagt 1320 acctgctgat ggagaacgtg ggcgccctgc tgcacaagaa gaacgaggag gagctgaacc 1380 agtggaagca gaagctggag agcctgggct accagaacag catcgaggtg ctgaacgccg 1440 ccgacttcgg cagcagccag gcccggcggc gggtgttcat gatcagcacc ctgaacgagt 1500 tcgtggagct gcccaagggc gacaagaagc ccaagagcat caagaaggtg ctgaacaaga 1560 tcgtgagcga gaaggacatc ctgaacaacc tgctgaagta caacctgacc gagttcaaga 1620 aaaccaagag caacatcaac aaggccagcc tgatcggcta cagcaagttc aacagcgagg 1680 gctacgtgta cgaccccgag ttcaccggcc ccaccctgac cgccagcggc gccaacagcc 1740 ggatcaagat caaggacggc agcaacatcc ggaagatgaa cagcgacgag accttcctgt 1800 acatcggctt cgacagccag gacggcaagc gggtgaacga gatcgagttc ctgaccgaga 1860 accagaagat cttcgtgtgc ggcaacagca tcagcgtgga ggtgctggag gccatcatcg 1920 acaagatcgg cggccccagc ggcggcaagc ggcccgccgc caccaagaag gccggccagg 1980 ccaagaagaa gaagggcagc tacccctacg acgtgcccga ctacgccggg tccgccacca 2040 acttctcgct gctgaagcag gccggagacg tggaagaaaa ccctggacct accagtgccg 2100 gaaagctcgg tagcggagag ggtcggggaa gcctgcttac ttgcggcgac gtggaagaga 2160 accccggtcc gctggagggt tcgtccggct ccggatcccc caagaagaag cggaaggtgg 2220 gcatccacgg cgtgcccgcc gccggcagca gcggatccct ggagcctgga gagaaaccct 2280 acaaatgccc ggaatgcggg aagtcctttt ccgaacgctc gcacctgagg gaacaccaga 2340 gaactcacac cggcgaaaaa ccctataagt gcccagaatg cggaaagagc ttttcacggt 2400 cggacaacct cgtgcggcac caacgcactc ataccggaga gaagccgtac aagtgtcctg 2460 agtgcggaaa gtcattctcc gactgccggg atttggcccg ccaccaaaga acacacactg 2520 gcgaaaagcc ctacaagtgc ccggagtgtg gaaagtcctt cagcacttcc ggagagctgg 2580 tccggcacca gaggacccac accggggaga agccttacaa atgtccagag tgcggtaaaa 2640 gcttctccac caccggcaac ctcaccgtgc accagcggac ccacactgga gaaaagccgt 2700 ataaatgccc cgaatgcggc aagagcttct cgcgatccga taagcttgtg cggcatcaga 2760 gaacgcacac tggggaaaag ccttataagt gtccggagtg cggcaaatcc ttctcccgca 2820 ctgacaccct gcgggaccat cagcgcaccc ataccggcaa aaagacctct gctagcggca 2880 gcggcggcgg cagcggcggc gcccgggacg acgccaagag cctgaccgcc tggagccgga 2940 ccctggtgac cttcaaggac gtgttcgtgg acttcacccg ggaggagtgg aagctgctgg 3000 acaccgccca gcagatcctg taccggaacg tgatgctgga gaactacaag aacctggtga 3060 gcctgggcta ccagctgacc aagcccgacg tgatcctgcg gctggagaag ggcgaggagc 3120 cctggctggt ggagcgggag atccaccagg aaacccaccc cgacagcgaa accgccttcg 3180 agatcaagag cagcgtgccc agcagcggcg gcaagcggcc cgccgccacc aagaaggccg 3240 gccaggccaa gaagaagaag ggcagctacc cctacgacgt gcccgactac gcctgagcgg 3300 ccgcttaatt aagctgcctt ctgcggggct tgccttctgg ccatgccctt cttctctccc 3360 ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtctag aaaaaaaaaa 3420 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3480 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 3521 <210> 197 <211> 3521 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 197 gggaaataag agagaaaaga agagtaagaa gaaatataag agccaccatg gccccaaaga 60 agaagagaaa ggtcggaatt catggcgtgc ccgcagccgg cagcagcggt tccctggagc 120 ctggagagaa accctacaaa tgcccggaat gcgggaagtc cttttccgaa cgctcgcacc 180 tgagggaaca ccagagaact cacaccggcg aaaaacccta taagtgccca gaatgcggaa 240 agagcttttc acggtcggac aacctcgtgc ggcaccaacg cactcatacc ggagagaagc 300 cgtacaagtg tcctgagtgc ggaaagtcat tctccgactg ccgggatttg gcccgccacc 360 aaagaacaca cactggcgaa aagccctaca agtgcccgga gtgtggaaag tccttcagca 420 cttccggaga gctggtccgg caccagagga cccacaccgg ggagaagcct tacaaatgtc 480 cagagtgcgg taaaagcttc tccaccaccg gcaacctcac cgtgcaccag cggacccaca 540 ctggagaaaa gccgtataaa tgccccgaat gcggcaagag cttctcgcga tccgataagc 600 ttgtgcggca tcagagaacg cacactgggg aaaagcctta taagtgtccg gagtgcggca 660 aatccttctc ccgcactgac accctgcggg accatcagcg cacccatacc ggcaaaaaga 720 cctctgctag cggcagcggc ggcggcagcg gcggcgcccg ggacgacgcc aagagcctga 780 ccgcctggag ccggaccctg gtgaccttca aggacgtgtt cgtggacttc acccgggagg 840 agtggaagct gctggacacc gcccagcaga tcctgtaccg gaacgtgatg ctggagaact 900 acaagaacct ggtgagcctg ggctaccagc tgaccaagcc cgacgtgatc ctgcggctgg 960 agaagggcga ggagccctgg ctggtggagc gggagatcca ccaggaaacc caccccgaca 1020 gcgaaaccgc cttcgagatc aagagcagcg tgcccagcag cggcggcaag cggcccgccg 1080 ccaccaagaa ggccggccag gccaagaaga agaagggcag ctacccctac gacgtgcccg 1140 actacgccgg gtccgccacc aacttctcgc tgctgaagca ggccggagac gtggaagaaa 1200 accctggacc taccagtgcc ggaaagctcg gtagcggaga gggtcgggga agcctgctta 1260 cttgcggcga cgtggaagag aaccccggtc cgctggaggg ttcgtccggc tccggatccc 1320 ccaagaagaa gcggaaggtg ggcatccacg gcgtgcccgc cgccggcagc agcggatccc 1380 tggagcccgg cgagaaacct tacaaatgcc ccgagtgcgg caagagcttc agcagaagcg 1440 acgatctggt gaggcaccaa agaacccaca ccggcgaaaa accttacaag tgtcccgaat 1500 gcggaaagtc cttcagcaga gaggacaatc tgcacaccca ccagagaaca cacaccggag 1560 aaaagcctta caagtgcccc gaatgcggca aatccttttc tagaagcgat catctgacca 1620 cccaccaaag aacacatacc ggcgagaagc cttacaaatg tcccgagtgc ggaaagtcct 1680 tctcccagag agccaatctg agggctcatc aaaggaccca taccggcgaa aagccctaca 1740 aatgccccga gtgcggaaaa tccttcagcc agctggccca tctgagagcc caccaaagga 1800 cacacaccgg agagaaaccc tataagtgcc ccgagtgtgg aaaaagcttt tcccagaggg 1860 ccaatctgag ggcccatcag aggacccata ccggagagaa gccttataaa tgtcccgagt 1920 gcggaaaaag cttcagcgag aggagccatc tgagggaaca tcaaagaacc cacaccggcg 1980 aaaaacccac cggaaaaaag accagcgcta gcggcagcgg cggcggcagc ggcggcgccc 2040 gggacagcaa ggtggagaac aagaccaaga agctgcgggt gttcgaggcc ttcgccggca 2100 tcggcgccca gcggaaggcc ctggagaagg tgcggaagga cgagtacgag atcgtgggcc 2160 tggccgagtg gtacgtgccc gccatcgtga tgtaccaggc catccacaac aacttccaca 2220 ccaagctgga gtacaagagc gtgagccggg aggagatgat cgactacctg gagaacaaga 2280 ccctgagctg gaacagcaag aaccccgtga gcaacggcta ctggaagcgg aagaaggacg 2340 acgagctgaa gatcatctac aacgccatca agctgagcga gaaggagggc aacatcttcg 2400 acatccggga cctgtacaag cggaccctga agaacatcga cctgctgacc tacagcttcc 2460 cctgccagga cctgagccag cagggcatcc agaagggcat gaagcggggc agcggcaccc 2520 ggagcggcct gctgtgggag atcgagcggg ccctggacag caccgagaag aacgacctgc 2580 ccaagtacct gctgatggag aacgtgggcg ccctgctgca caagaagaac gaggaggagc 2640 tgaaccagtg gaagcagaag ctggagagcc tgggctacca gaacagcatc gaggtgctga 2700 acgccgccga cttcggcagc agccaggccc ggcggcgggt gttcatgatc agcaccctga 2760 acgagttcgt ggagctgccc aagggcgaca agaagcccaa gagcatcaag aaggtgctga 2820 acaagatcgt gagcgagaag gacatcctga acaacctgct gaagtacaac ctgaccgagt 2880 tcaagaaaac caagagcaac atcaacaagg ccagcctgat cggctacagc aagttcaaca 2940 gcgagggcta cgtgtacgac cccgagttca ccggccccac cctgaccgcc agcggcgcca 3000 acagccggat caagatcaag gacggcagca acatccggaa gatgaacagc gacgagacct 3060 tcctgtacat cggcttcgac agccaggacg gcaagcgggt gaacgagatc gagttcctga 3120 ccgagaacca gaagatcttc gtgtgcggca acagcatcag cgtggaggtg ctggaggcca 3180 tcatcgacaa gatcggcggc cccagcggcg gcaagcggcc cgccgccacc aagaaggccg 3240 gccaggccaa gaagaagaag ggcagctacc cctacgacgt gcccgactac gcctgagcgg 3300 ccgcttaatt aagctgcctt ctgcggggct tgccttctgg ccatgccctt cttctctccc 3360 ttgcacctgt acctcttggt ctttgaataa agcctgagta ggaagtctag aaaaaaaaaa 3420 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 3480 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 3521 <210> 198 <211> 1385 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 198 gaaataagag agaaaagaag agtaagaaga aatataagac ctaatagtaa tagtaatagc 60 ccaagaagaa gcgcaaggtc gggatccacg gagtcccggc agcaggatcc tcaggctcac 120 tggaaccggg ggaaaaaccc tacaagtgcc cggagtgcgg caagagcttc tcgacctccg 180 ggaacctgac cgagcaccag cgcacccaca ccggagagaa accgtacaag tgccccgagt 240 gcgggaaatc gttctcagac tcgggaaacc tcagggtgca ccagcggacc cacacggggg 300 aaaagccgta caagtgcccg gagtgcggga agtcattctc ccacaagaac gcgctgcaga 360 accaccaaag aacccacacc ggcgaaaaac cgtacaagtg ccccgagtgc ggaaagtcct 420 tctcccgcaa cgacaccctc accgaacacc aacgcaccca caccggagaa aagccctaca 480 agtgcccgga gtgcggaaag agcttcagcc agagggccca cctggaaaga caccagagaa 540 cccacaccgg cgaaaagccg tacaagtgcc cggagtgcgg gaagtccttc agccggtcag 600 acaagctggt ccgccaccaa aggacccaca caggagaaaa gccctacaag tgcccggagt 660 gcggaaaatc gttcagcgac cccggacacc tggtccggca ccagaggacc cacaccgggg 720 agaagccgac cggcaaaaag acctcagcaa gcgggagcgg aggaggaagc ggaggggacg 780 ccaagagcct gaccgcgtgg agcaggaccc tcgtgacctt caaagacgtg ttcgtggact 840 tcacccgcga agagtggaag ctgctggaca ccgcgcagca aatcctgtac cggaacgtga 900 tgctggaaaa ctacaagaac ctcgtcagcc tcggctacca actgaccaag cccgacgtga 960 tcctgcggct ggaaaagggc gaagaaccct ggctcgtgga gcgggagatc caccaggaaa 1020 cccacccgga cagcgaaacc gcgttcgaaa tcaagagcag cgtcagcgga ggaaaaagac 1080 cagccgccac caagaaggcc ggccaagcca agaagaaaaa gggcagctac ccctacgacg 1140 tgccggacta cgcatgagcg gccgcttaat taagctgcct tctgcggggc ttgccttctg 1200 gccatgccct tcttctctcc cttgcacctg tacctcttgg tctttgaata aagcctgagt 1260 aggaagtcta gaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1320 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1380 aaaaa 1385 <210> 199 <211> 21 <212> DNA <213> Homo sapiens <400> 199 acggggaatg ctgccgagag c 21 <210> 200 <211> 21 <212> DNA <213> Homo sapiens <400> 200 acctgaaccc tggaaattat a 21 <210> 201 <211> 21 <212> DNA <213> Homo sapiens <400> 201 tagacgggga atgctgccga g 21 <210> 202 <211> 21 <212> DNA <213> Homo sapiens <400> 202 tgacattgag caatgatatg g 21 <210> 203 <211> 21 <212> DNA <213> Homo sapiens <400> 203 agcaaaagaa aatggtaggc g 21 <210> 204 <211> 21 <212> DNA <213> Homo sapiens <400> 204 acggggaatg ctgccgagag c 21 <210> 205 <211> 21 <212> DNA <213> Homo sapiens <400> 205 acggggaatg ctgccgagag c 21 <210> 206 <211> 21 <212> DNA <213> Homo sapiens <400> 206 agcaaaagaa aatggtaggc g 21 <210> 207 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 207 Gly Gly Gly Gly Ser 1 5 <210> 208 <211> 830 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 208 gatgttcatt agcagtggtg ataggttaat tttcaccatc tcttatgcgg ttgaatagtc 60 acctctgaac cactttttcc tccagtaact cctctttctt cggaccttct gcagccaacc 120 tgaaagaata acaaggaggt ggctggaaac ttgttttaag gaaccgcctg tccttccccc 180 gctggaaacc ttgcacctcg gacgctcctg ctcctgcccc cacctgaccc ccgccctcgt 240 tgacatccag gcgcgatgat ctctgctgcc agtagagggc acacttactt tactttcgca 300 aacctgaacg cgggtgctgc ccagagaggg ggcggaggga aagacgcttt gcagcaaaat 360 ccagcatagc gattggttgc tccccgcgtt tgcggcaaag gcctggaggc aggagtaatt 420 tgcaatcctt aaagctgaat tgtgcagtgc atcggatttg gaagctacta tattcactta 480 acacttgaac gctgagctgc aaactcaacg ggtaataacc catcttgaac agcgtacatg 540 ctatacacgc acccctttcc cccgaattgt tttctctttt ggaggtggtg gagggagaga 600 aaagtttact taaaatgcct ttgggtgagg gaccaaggat gagaagaatg ttttttgttt 660 ttcatgccgt ggaataacac aaaataaaaa atcccgaggg aatatacatt atatattaaa 720 tatagatcat ttcagggagc aaacaaatca tgtgtggggc tgggcaacta gctaagtcga 780 agcgtaaata aaatgtgaat acacgtttgc gggttacata cagtgcactt 830 <210> 209 <211> 830 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 209 taggcatcgt tttcctcctt atgcctctat cattcctccc tatctacact aacatcccac 60 gctctgaacg cgcgcccatt aatacccttc tttcctccac tctccctggg actcttgatc 120 aaagcgcggc cctttcccca gccttagcga ggcgccctgc agcctggtac gcgcgtggcg 180 tggcggtggg cgcgcagtgc gttctcggtg tggagggcag ctgttccgcc tgcgatgatt 240 tatactcaca ggacaaggat gcggtttgtc aaacagtact gctacggagg agcagcagag 300 aaagggagag ggtttgagag ggagcaaaag aaaatggtag gcgcgcgtag ttaattcatg 360 cggctctctt actctgttta catcctagag ctagagtgct cggctgcccg gctgagtctc 420 ctccccacct tccccaccct ccccaccctc cccataagcg cccctcccgg gttcccaaag 480 cagagggcgt gggggaaaag aaaaaagatc ctctctcgct aatctccgcc caccggccct 540 ttataatgcg agggtctgga cggctgagga cccccgagct gtgctgctcg cggccgccac 600 cgccgggccc cggccgtccc tggctcccct cctgcctcga gaagggcagg gcttctcaga 660 ggcttggcgg gaaaaagaac ggagggaggg atcgcgctga gtataaaagc cggttttcgg 720 ggctttatct aactcgctgt agtaattcca gcgagaggca gagggagcga gcgggcggcc 780 ggctagggtg gaagagccgg gcgagcagag ctgcgctgcg ggcgtcctgg 830 <210> 210 <211> 7 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 210 tatawaw 7

Claims (57)

  1. 서열번호 83의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 제1 표적화 모이어티, 및
    DNA 메틸트랜스퍼라제를 포함하는 제1 이펙터 모이어티
    를 포함하는, 발현 리프레서.
  2. 제1항에 있어서, 상기 제1 표적화 모이어티는 징크 핑거 도메인을 포함하는, 발현 리프레서.
  3. 제1항 또는 제2항에 있어서, 상기 제1 표적화 모이어티는 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 상기 제1 이펙터 모이어티는 MQ1 또는 이의 기능성 변이체 또는 단편을 포함하는, 발현 리프레서.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 제1 이펙터 모이어티는 서열번호 19 또는 87의 서열, 또는 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 상기 제1 이펙터 모이어티는 서열번호 30 또는 129의 서열, 또는 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
  7. 제1항 내지 제6항 중 어느 한 항의 발현 리프레서를 인코딩하는 핵산.
  8. 제7항에 있어서, 상기 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 표적화 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 46 또는 131에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
  9. 제7항 또는 제8항 중 어느 한 항에 있어서, 상기 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열을 포함하고, 제1 이펙터 모이어티를 인코딩하는 뉴클레오타이드 서열은 서열번호 52 또는 132에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
  10. 제7항 내지 제9항 중 어느 한 항에 있어서, 서열번호 63 또는 130에 따른 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하며, 폴리-A 서열은 선택적인, 핵산.
  11. 제1항 내지 제6항 중 어느 한 항에 따른 제1 발현 리프레서, 및
    제2 발현 리프레서
    를 포함하는, 시스템.
  12. 제11항에 있어서, 상기 제2 발현 리프레서는
    게놈 유전자좌에 결합하는 제2 표적화 모이어티, 및
    제2 이펙터 모이어티
    를 포함하는, 시스템.
  13. 제12항에 있어서, 상기 제2 표적화 모이어티는 서열번호 77, 199 또는 201의 서열의 적어도 14, 15, 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는, 시스템.
  14. 제12항 또는 제13항에 있어서, 상기 제2 표적화 모이어티는 징크 핑거 도메인을 포함하는, 시스템.
  15. 제12항 내지 제14항 중 어느 한 항에 있어서, 상기 제2 표적화 모이어티는 서열번호 7, 169, 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템.
  16. 제12항 내지 제15항 중 어느 한 항에 있어서, 상기 제2 이펙터 모이어티는 KRAB 또는 이의 기능성 변이체 또는 단편을 포함하는, 시스템.
  17. 제12항 내지 제16항 중 어느 한 항에 있어서, 상기 제2 이펙터는 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템.
  18. 제12항 내지 제17항 중 어느 한 항에 있어서, 상기 제2 발현 리프레서는 서열번호 24, 177, 183, 179, 또는 185에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 시스템.
  19. 제12항 내지 제18항 중 어느 한 항의 시스템의 제1 발현 리프레서 및 제2 리프레서를 인코딩하는 핵산.
  20. 제19항에 있어서, 서열번호 113, 196, 또는 197에 따른 뉴클레오타이드 서열을 포함하고, 폴리-A 서열은 선택적인, 핵산.
  21. a) i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티 및
    ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
    를 포함하는 제1 발현 리프레서; 및
    b) i) 서열번호 7에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
    ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
    를 포함하는 제2 발현 리프레서
    를 포함하는, 발현 억제 시스템.
  22. a) i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티 및
    ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
    를 포함하는 제1 발현 리프레서, 및
    b) i) 서열번호 169, 또는 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
    ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
    를 포함하는 제2 발현 리프레서
    를 포함하는, 발현 억제 시스템.
  23. a) i) 서열번호 169, 또는 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
    ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
    를 포함하는 제1 발현 리프레서, 및
    b) i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 13, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
    ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
    를 포함하는 제2 발현 리프레서
    를 포함하는 발현 억제 시스템.
  24. 제1항 내지 제23항 중 어느 한 항에 있어서, 예를 들어 ELISA에 의해 측정 시, 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25일, 또는 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10회 세포 분열의 기간 동안 MYC의 발현을 상당히 감소시키는, 발현 리프레서 또는 발현 억제 시스템.
  25. 본 명세서에 기재된 제1 발현 리프레서를 인코딩하는 제1 아미노산 영역 및 본 명세서에 기재된 제2 발현 리프레서를 포함하는 제2 아미노산 영역을 포함하는 융합 단백질.
  26. 제1항 내지 제25항 중 어느 한 항에 있어서, 상기 MYC 유전자좌에 대한 발현 리프레서의 결합은 발현 리프레서 또는 발현 억제 시스템으로 형질감염 후 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 16, 20, 24, 28, 32, 36, 40, 44, 48, 52, 56, 60, 64, 68, 72, 76, 80, 또는 96시간 후에 MYC의 발현을 상당히 감소시키는, 발현 리프레서, 융합 단백질, 또는 발현 억제 시스템.
  27. 제1항 내지 제26항 중 어느 한 항에 있어서, 복수의 세포를 발현 리프레서, 발현 리프레서 시스템, 또는 발현 리프레서 또는 제1 발현 리프레서 및 제2 발현 리프레서와 접촉시키는 것은 복수의 세포의 생존능을 감소시키는, 발현 리프레서, 융합 단백질, 또는 발현 억제 시스템.
  28. 제1항 내지 제27항 중 어느 한 항에 있어서, 상기 발현 리프레서 또는 발현 억제 시스템의 투여는 적어도 5%, 6%, 7%, 8%, 9% 10%, 12%, 15%, 17%, 20%, 25% 30%, 40%, 45%, 50%, 55%, 60%, 65%, 75%의 표적 세포(예를 들어, 암 세포)의 아폽토시스를 초래하는, 발현 리프레서, 융합 단백질, 또는 발현 억제 시스템.
  29. 제17d항에 있어서, 상기 복수의 세포는 복수의 암 세포 및 복수의 비-암 세포를 포함하는, 발현 리프레서, 융합 단백질, 또는 발현 억제 시스템.
  30. 제17e에 있어서, 상기 복수의 세포를 시스템 또는 시스템을 인코딩하는 핵산과 접촉시키는 것은 복수의 비-암 세포의 생존능을 감소시키는 것보다 복수의 암 세포의 생존능을 감소시키며, 선택적으로 복수의 암 세포의 생존능은 복수의 비-암 세포의 생존능보다 1.05×(즉, 1.05배), 1.1×, 1.15×, 1.2×, 1.25×, 1.3×, 1.35×, 1.4×, 1.45×, 1.5×, 1.6×, 1.7×, 1.8×, 1.9×, 2×, 3×, 4×, 5×, 6×, 7×, 8×, 9×, 10×, 20×, 50×, 또는 100× 더 많이 감소시키는, 발현 리프레서, 융합 단백질, 또는 발현 억제 시스템.
  31. 제1항 내지 제30항 중 어느 한 항의 발현 리프레서, 융합 단백질, 또는 시스템을 인코딩하는 서열을 포함하는 핵산.
  32. 발현 억제 시스템을 인코딩하는 핵산으로서, 상기 핵산은
    a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서,
    i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
    ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
    를 포함하는, 제1 발현 리프레서, 및
    b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서,
    i) 서열번호 7에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
    ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
    를 포함하는, 제2 발현 리프레서
    를 포함하는, 핵산.
  33. 발현 억제 시스템을 인코딩하는 핵산으로서,
    a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서, 상기 제1 발현 리프레서는 다음을 포함함:
    i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
    ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티, 및
    b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서, 제2 발현 리프레서는 다음을 포함함:
    i) 서열번호 169, 또는 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
    ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 19, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
    를 포함하는, 핵산.
  34. 발현 억제 시스템을 인코딩하는 핵산으로서,
    a) 제1 발현 리프레서를 인코딩하는 제1 영역으로서,
    i) 서열번호 169, 또는 171에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 표적화 모이어티, 및
    ii) 서열번호 18에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제1 이펙터 모이어티
    를 포함하는, 제1 발현 리프레서, 및
    b) 제2 발현 리프레서를 인코딩하는 제2 영역으로서,
    i) 서열번호 13에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 13, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 표적화 모이어티, 및
    ii) 서열번호 19 또는 87에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 제2 이펙터 모이어티
    를 포함하는 제2 발현 리프레서
    를 포함하는, 핵산.
  35. 제19항, 제21항 또는 제22항 중 어느 한 항에 있어서, 서열번호 93, 94, 112, 113, 196, 197의 뉴클레오타이드 서열, 또는 이와 적어도 80, 85, 90, 95, 또는 99% 동일성을 갖는 서열, 또는 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
  36. 표 12의 서열의 적어도 16, 17, 18, 19, 또는 20개 뉴클레오타이드를 포함하는 게놈 유전자좌에 결합하는 표적화 모이어티, 및
    선택적으로, 이펙터 모이어티
    를 포함하는, 발현 리프레서.
  37. 표 4에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 7169, 12, 11, 10, 9, 8, 4, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 갖는, 표적화 모이어티, 및
    선택적으로, 이펙터 모이어티
    를 포함하는, 발현 리프레서.
  38. 제37항에 있어서, 표 7 또는 표 9에 따른 아미노산 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 7, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 발현 리프레서.
  39. 표 5, 표 6, 표 8, 표 16, 표 10에 따른 서열, 또는 이와 적어도 80, 85, 90, 95, 99, 또는 100% 동일성을 갖거나, 이와 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8, 5, 6, 5, 4, 3, 2, 또는 1개 이하의 위치에서 상이한 서열을 포함하는, 핵산.
  40. 제1항 내지 제39항 중 어느 한 항의 융합 단백질, 시스템, 또는 발현 리프레서를 인코딩하는 핵산을 포함하는 벡터.
  41. 제1항 내지 제40항 중 어느 한 항의 발현 리프레서, 시스템, 융합 단백질, 핵산, 또는 벡터를 포함하는 반응 혼합물.
  42. 제1항 내지 제41항 중 어느 한 항의 발현 리프레서, 시스템, 융합 단백질, 핵산, 벡터, 또는 반응 혼합물을 포함하는 약제학적 조성물.
  43. 필요로 하는 대상체에서 암을 치료하는 방법으로서, 상기 방법은
    제1항 내지 제20항 중 어느 한 항의 발현 리프레서, 시스템, 융합 단백질, 또는 발현 리프레서 또는 시스템을 인코딩하는 핵산을 투여하는 단계
    를 포함하는, 방법.
  44. 제43항에 있어서, 상기 암은 간세포 암종(HCC), 섬유층판 간세포 암종(FHCC), 담관암종, 혈관육종, 2차 간암, 폐암, 비소세포 폐암(NSCLC), 선암종, 소세포 폐암(SCLC), 대세포 (미분화) 암종, 삼중 음성 유방암, 위 선암종, 자궁내막 암종, 또는 췌 암종인, 방법.
  45. 필요로 하는 대상체에서 간염을 치료하는 방법으로서, 상기 방법은
    제1항 내지 제42항 중 어느 한 항의 발현 리프레서, 융합 단백질, 시스템, 또는 발현 리프레서 또는 시스템을 인코딩하는 핵산을 투여하는 단계
    를 포함하는 방법.
  46. 필요로 하는 대상체에서 종양 성장을 감소시키는 방법으로서, 상기 방법은
    제1항 내지 제42항 중 어느 한 항의 발현 리프레서, 융합 단백질, 시스템, 핵산, 벡터, 또는 약제학적 조성물을 대상체에게 투여하는 단계
    를 포함하며,
    이에 의해 대상체에서 종양 성장을 감소시키는, 방법.
  47. 키나제 억제제, 예를 들어 소라페닙에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 제1항 내지 제42항 중 어느 한 항의 발현 리프레서 또는 시스템을 암을 앓는 대상체에게 투여하는 단계를 포함하며, 선택적으로 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석에서 키나제 억제제의 IC50을 10%, 20%, 30%, 또는 40%만큼 낮추는, 방법.
  48. 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 제1항 내지 제42항 중 어느 한 항의 발현 리프레서, 또는 시스템을 암을 앓는 대상체에게 투여하는 단계를 포함하며, 선택적으로 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석에서 브로모도메인 억제제의 IC50를 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%만큼 낮추는, 방법.
  49. MEK 억제제, 예를 들어 트라메티닙에 대한 암의 감수성을 증가 또는 회복시키는 방법으로서, 상기 방법은 제1항 내지 제42항 중 어느 한 항의 발현 리프레서, 또는 시스템을 암을 앓는 대상체에게 투여하는 단계를 포함하며, 선택적으로 발현 리프레서 또는 시스템의 투여는, 예를 들어 암 세포 생존능 분석에서 MEK 억제제의 IC50를 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%만큼 낮추는, 방법.
  50. 제43항 내지 제49항 중 어느 한 항에 있어서, 상기 암은 참조 수준에 비해(예를 들어, 참조 서열의 MYC 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 증가된 MYC 발현을 특징으로 하는 세포, 및 참조 수준에 비해(예를 들어, 참조 세포의 MYC 발현, 예를 들어 다르게는 대상체의 유사한 비-암성 세포에 비해) 증가된 MYC 발현을 특징으로 하지 않는, 예를 들어 정상적인 MYC 발현을 갖는 세포를 포함하는, 방법.
  51. 제43항 내지 제50항 중 어느 한 항에 있어서,
    a) 첫째, 대상체에게 청구항 중 어느 하나의 발현 리프레서 또는 시스템의 제1 복수의 용량을 투여하되, 선택적으로 제1 복수의 용량의 각각의 후속 용량은 제1 복수의 용량의 이전 용량으로부터 5일 후에 투여되는, 단계;
    b) 둘째, 일정 기간(예를 들어, "약물 휴지기") 동안, 예를 들어 약 2주 동안 발현 리프레서 또는 시스템을 중단시키는 단계, 및
    c) 셋째, 대상체에게 발현 리프레서 또는 시스템의 제2 복수의 용량을 투여하되, 선택적으로 제2 복수의 용량의 후속 용량은 제2 복수의 용량의 이전 용량으로부터 5일 후에 투여되는, 단계
    를 포함하는, 방법.
  52. 제43항 내지 제51항 중 어느 한 항에 있어서, 종양 부피는 발현 리프레서, 융합 단백질, 또는 시스템으로의 치료 중단 후 (예를 들어, 검출 가능하지 않은 수준으로) 감소되는, 방법.
  53. 제43항 내지 제52항 중 어느 한 항에 있어서, 상기 방법은
    a. 세포를 제2 치료제와 접촉시키는 단계, 또는
    b. 제2 치료제를 대상체에게 투여하되, 선택적으로 상기 제2 치료제는 청구항 중 어느 한 항의 발현 리프레서, 시스템, 융합 단백질, 핵산, 벡터, 반응 혼합물, 또는 약제학적 조성물이 아닌, 단계
    를 추가로 포함하는, 방법.
  54. 제43항 내지 제53항 중 어느 한 항에 있어서, 상기 제2 치료제는 면역요법, 면역 관문 및 항-혈관-내피-성장 인자 요법 중 하나 또는 둘 다, 전신 화학요법, 타이로신 키나제 억제제, 예를 들어 소라페닙, 미토겐-활성화 단백질 키나제 키나제 억제제), 예를 들어 트라메티닙, 또는 브로모도메인 억제제, 예를 들어 BET 억제제, 예를 들어 JQ1, 예를 들어 비라브레십인, 방법.
  55. 제43항 내지 제54항 중 어느 한 항에 있어서, 상기 제1 및 제2 치료제는 동시에 투여되는, 방법
  56. 제43항 내지 제55항 중 어느 한 항에 있어서, 상기 제1 및 제2 치료제는 순차적으로 투여되는, 방법.
  57. 제43항 내지 제56항 중 어느 한 항에 있어서, 상기 대상체는 적어도 일부 세포에서 MYC의 과발현을 갖는, 방법.
KR1020237024060A 2020-12-15 2021-12-15 Myc 발현을 조절하기 위한 조성물 및 방법 KR20230120138A (ko)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US202063125833P 2020-12-15 2020-12-15
US63/125,833 2020-12-15
US202163137097P 2021-01-13 2021-01-13
US63/137,097 2021-01-13
US202163212991P 2021-06-21 2021-06-21
US63/212,991 2021-06-21
US202163281022P 2021-11-18 2021-11-18
US63/281,022 2021-11-18
PCT/US2021/010059 WO2022132195A2 (en) 2020-12-15 2021-12-15 Compositions and methods for modulation myc expression

Publications (1)

Publication Number Publication Date
KR20230120138A true KR20230120138A (ko) 2023-08-16

Family

ID=82060102

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237024060A KR20230120138A (ko) 2020-12-15 2021-12-15 Myc 발현을 조절하기 위한 조성물 및 방법

Country Status (6)

Country Link
EP (1) EP4262849A2 (ko)
JP (1) JP2023553490A (ko)
KR (1) KR20230120138A (ko)
AU (1) AU2021401231A1 (ko)
CA (1) CA3205133A1 (ko)
WO (1) WO2022132195A2 (ko)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115192714A (zh) * 2022-07-08 2022-10-18 沈阳药科大学 Hdac6抑制剂在制备治疗dnmt3a基因缺失癌症的药物中的用途

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201119904D0 (en) * 2011-11-17 2011-12-28 Univ Vilnius Analysis of methylation sites
KR101900278B1 (ko) * 2016-04-18 2018-09-19 건국대학교 글로컬산학협력단 Myc-ap4 축 활성화된 암의 예방 또는 치료용 조성물의 스크리닝 방법
WO2018183808A1 (en) * 2017-03-31 2018-10-04 Agenovir Corporation Antiviral therapeutic
US20220380760A1 (en) * 2018-10-15 2022-12-01 Flagship Pioneering Innovations V, Inc. Disrupting genomic complex assembly in fusion genes
WO2020163017A1 (en) * 2019-02-06 2020-08-13 Klogenix Llc Dna binding proteins and uses thereof

Also Published As

Publication number Publication date
WO2022132195A8 (en) 2023-06-22
AU2021401231A1 (en) 2023-06-29
JP2023553490A (ja) 2023-12-21
WO2022132195A3 (en) 2022-07-28
WO2022132195A2 (en) 2022-06-23
EP4262849A2 (en) 2023-10-25
CA3205133A1 (en) 2022-06-23

Similar Documents

Publication Publication Date Title
JP7008850B2 (ja) 核酸ターゲティング核酸の組成物および方法
KR102302679B1 (ko) 가이드 rna 및 엔도뉴클레아제를 유효성분으로 포함하는 암 치료용 약학적 조성물
US20220389519A1 (en) Biomarkers predictive of anti-immune checkpoint response
EP3867368A1 (en) Disrupting genomic complex assembly in fusion genes
JP2011254830A (ja) 結腸癌に関するポリヌクレオチド
KR20230074525A (ko) 유전자 발현을 억제하기 위한 조성물 및 방법
CN115209923A (zh) 治疗肝病的组合物和方法
KR20230120138A (ko) Myc 발현을 조절하기 위한 조성물 및 방법
US20140248254A1 (en) The use of ache as nuclease
Dockendorff et al. Cloning of karyopherin-α3 from Drosophila through its interaction with the nuclear localization sequence of germ cell-less protein
TW202317601A (zh) 用於調節myc表現之組合物及方法
US20220267756A1 (en) Compositions and methods for modulating genomic complex integrity index
WO2020081588A1 (en) Swi/snf family chromatin remodeling complexes and uses thereof
US20220348893A1 (en) Methods and compositions for modulating frataxin expression and treating friedrich&#39;s ataxia
WO2002101076A2 (en) Methods for targeted expression of therapeutic nucleic acid
KR20230079181A (ko) 다중 유전자의 발현을 억제하는 조성물 및 방법
WO2024040229A2 (en) Combination therapies comprising myc modulators and checkpoint inhibitors
CN116635086A (zh) 用于抑制多个基因的表达的组合物和方法
CN116829175A (zh) 用于调节myc表达的组合物和方法
KR20230172456A (ko) 침입하고 자율적으로 용해하도록 설계된 치료 단백질의 세포내 전달 및 이의 사용 방법