KR20230051578A - Shank3 유전자 치료 접근법 - Google Patents

Shank3 유전자 치료 접근법 Download PDF

Info

Publication number
KR20230051578A
KR20230051578A KR1020237009262A KR20237009262A KR20230051578A KR 20230051578 A KR20230051578 A KR 20230051578A KR 1020237009262 A KR1020237009262 A KR 1020237009262A KR 20237009262 A KR20237009262 A KR 20237009262A KR 20230051578 A KR20230051578 A KR 20230051578A
Authority
KR
South Korea
Prior art keywords
leu
pro
gly
ser
ala
Prior art date
Application number
KR1020237009262A
Other languages
English (en)
Inventor
구오핑 펑
시안 가오
유안 메이
Original Assignee
메사추세츠 인스티튜트 오브 테크놀로지
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메사추세츠 인스티튜트 오브 테크놀로지 filed Critical 메사추세츠 인스티튜트 오브 테크놀로지
Publication of KR20230051578A publication Critical patent/KR20230051578A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4702Regulators; Modulating activity
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K67/00Rearing or breeding animals, not otherwise provided for; New or modified breeds of animals
    • A01K67/027New or modified breeds of vertebrates
    • A01K67/0275Genetically modified vertebrates, e.g. transgenic
    • A01K67/0276Knock-out vertebrates
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0075Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the delivery route, e.g. oral, subcutaneous
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P25/00Drugs for disorders of the nervous system
    • A61P25/18Antipsychotics, i.e. neuroleptics; Drugs for mania or schizophrenia
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/07Animals genetically altered by homologous recombination
    • A01K2217/075Animals genetically altered by homologous recombination inducing loss of function, i.e. knock out
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2227/00Animals characterised by species
    • A01K2227/10Mammal
    • A01K2227/105Murine
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/0306Animal model for genetic diseases
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2267/00Animals characterised by purpose
    • A01K2267/03Animal model, e.g. for test or diseases
    • A01K2267/035Animal model for multifactorial diseases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2750/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssDNA viruses
    • C12N2750/00011Details
    • C12N2750/14011Parvoviridae
    • C12N2750/14111Dependovirus, e.g. adenoassociated viruses
    • C12N2750/14141Use of virus, viral particle or viral elements as a vector
    • C12N2750/14143Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Animal Behavior & Ethology (AREA)
  • Veterinary Medicine (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Public Health (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biomedical Technology (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Environmental Sciences (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Animal Husbandry (AREA)
  • Neurology (AREA)
  • Psychiatry (AREA)
  • Neurosurgery (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

본 개시내용의 양태는 Shank3 단백질을 코딩하는 비자연 발생 폴리뉴클레오타이드, 폴리뉴클레오타이드를 포함하는 AAV 벡터, 및 유전자 치료 방법에 관한 것이다.

Description

SHANK3 유전자 치료 접근법
관련 출원에 대한 상호 참조
본 출원은 35 U.S.C.§ 119(e) 하에 2020년 8월 17일에 제출된 "SHANK3 GENE THERAPY APPROACHES"라는 제목의 미국 가출원 제63/066,570호의 이익을 주장하며, 이의 전체 개시내용은 그 전체가 참조로 본원에 포함되어 있다.
EFS-WEB을 통해 텍스트 파일로 제출된 서열 목록에 대한 참조
본 출원은 EFS-Web을 통해 ASCII 형식으로 제출된 서열 목록을 포함하며, 이는 그 전체가 참조로 본원에 포함되어 있다. 2021년 8월 16일에 생성된 상기 ASCII 사본의 이름은 B119570108WO00-SEQ-SXT이고, 크기는 151,434 바이트이다.
본 발명의 분야
본 개시내용은 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 대상체에게 전달하기 위한 유전자 치료 접근법에 관한 것이다.
Shank3와 관련된 결실 및/또는 돌연변이는 모든 자폐 스펙트럼 장애(ASD) 환자의 약 0.5-1%를 차지하고 지적 장애(ID)가 있는 ASD 환자의 약 2%를 차지한다. 그러나, ASD 및/또는 ID에 대한 효과적인 치료법은 없다. ASD 및 ID와 관련된 수많은 병리를 교정할 수 있는 약리학적 치료법을 개발하는 데 몇 가지 문제가 발생하였다.
본 개시내용의 양태는 Shank3 돌연변이를 갖는 대상체에 대한 효과적인 유전자 치료 접근법의 개발에 관한 것이다.
본 개시내용의 양태는 Shank3 단백질을 코딩하는 비자연 발생 폴리뉴클레오타이드에 관한 것으로서, Shank3 단백질은 SH3 도메인, PDZ 도메인, 호머(Homer) 결합 도메인, 코르탁틴(Cortactin) 결합 도메인, 및 SAM 도메인을 포함한다. 일부 구현예에서, SH3 도메인은 서열번호: 6의 잔기 474-525에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 473-524에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, PDZ 도메인은 서열번호: 6의 잔기 573-662에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 572-661에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, SAM 도메인은 서열번호: 6의 잔기 1664-1729에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 1663-1728에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 4.7 kb 미만이다.
일부 구현예에서, 폴리뉴클레오타이드는 프롤린-풍부 영역을 추가로 포함한다. 일부 구현예에서, SH3 도메인은 서열번호: 6의 잔기 474-525 또는 서열번호: 5의 잔기 473-524를 포함하고/거나, PDZ 도메인은 서열번호: 6의 잔기 573-662 또는 서열번호: 5의 잔기 572-661을 포함하고/거나, 호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323을 포함하고/거나, 코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426을 포함하고/하거나 SAM 도메인은 서열번호: 6의 잔기 1664-1729 또는 서열번호: 5의 잔기 1663-1728을 포함한다.
일부 구현예에서, 폴리뉴클레오타이드는 서열번호: 1 또는 2에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 서열번호: 1 또는 2를 포함한다.
일부 구현예에서, 폴리뉴클레오타이드에 의해 코딩된 Shank3 단백질은 안키린 반복 도메인을 추가로 포함한다. 일부 구현예에서, 안키린 반복 도메인은 서열번호: 6의 잔기 148-345에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 147-313에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 서열번호: 6의 잔기 148-345 또는 서열번호: 5의 잔기 147-313을 포함한다.
일부 구현예에서, 폴리뉴클레오타이드는 서열번호: 3 또는 4에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 서열번호: 3 또는 4를 포함한다.
일부 구현예에서, 폴리뉴클레오타이드는 약 4.6 kb, 4.5 kb, 4.4 kb, 4.3 kb, 4.2 kb, 4.1 kb, 4.0 kb, 3.9 kb, 3.8 kb, 3.7 kb, 3.6 kb, 3.5 kb, 3.4 kb, 3.3 kb, 3.2 kb, 3.1 kb, 3.0 kb, 2.9 kb, 2.8 kb, 2.7 kb, 2.6 kb, 2.5 kb, 2.4 kb, 2.3 kb, 2.2 kb, 또는 2.1 kb 미만이다.
일부 구현예에서, Shank3 단백질은 서열번호: 5 또는 6의 전장에 걸쳐 서열번호: 5 또는 6에 대해 65% 미만 동일하다.
일부 구현예에서, Shank3 단백질은 서열번호: 17-20 중 어느 하나에 대해 적어도 90% 동일한 아미노산 서열을 포함한다. 일부 구현예에서, Shank3 단백질은 서열번호: 17-20 중 어느 하나를 포함하는 아미노산 서열을 포함한다.
본 개시내용의 추가 양태는 본원에 기재된 폴리펩타이드에 의해 코딩된 Shank3 단백질에 관한 것이다.
본 개시내용의 추가 양태는 본원에 기재된 폴리뉴클레오타이드를 포함하는 벡터에 관한 것이다. 일부 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, 벡터는 AAV 벡터이다. 일부 구현예에서, 벡터는 본원에 기재된 폴리뉴클레오타이드에 작동가능하게 연결된 프로모터를 포함한다. 일부 구현예에서, 폴리뉴클레오타이드는 AAV 역위 말단 반복(ITR)에 의해 측접된다. 일부 구현예에서, AAV 벡터는 서열번호: 7 또는 21에 대해 적어도 90% 동일하고 Shank3 활성을 갖는 단백질을 코딩하는 서열을 포함한다. 일부 구현예에서, AAV 벡터는 서열번호: 7 또는 21의 서열을 포함하고 Shank3 활성을 갖는 단백질을 코딩한다. 일부 구현예에서, AAV 벡터는 서열번호: 2 또는 4에 대해 적어도 90% 동일하고 Shank3 활성을 갖는 단백질을 코딩하는 서열을 포함한다. 일부 구현예에서, AAV 벡터는 Shank3 활성을 갖는 단백질을 코딩하는 서열번호: 2 또는 4의 서열을 포함한다. 일부 구현예에서, AAV 벡터는 서열번호: 1 또는 3에 대해 적어도 90% 동일하고 Shank3 활성을 갖는 단백질을 코딩하는 서열을 포함한다. 일부 구현예에서, AAV 벡터는 Shank3 활성을 갖는 단백질을 코딩하는 서열번호: 1 또는 3의 서열을 포함한다.
본 개시내용의 추가 양태는 AAV 벡터 및 캡시드 단백질을 포함하는 AAV 입자에 관한 것으로서, 캡시드는 AAV1, 2, 5, 6, 8, 9, rh10, 및 PHP.eB로부터 선택되는 혈청형이다. 일부 구현예에서, 혈청형은 AAV9이다. 일부 구현예에서, 혈청형은 AAV10이다. 일부 구현예에서, 혈청형은 PHP.eB이다.
일부 구현예에서, AAV 벡터는 프로모터를 추가로 포함한다. 일부 구현예에서, 프로모터는 인간 프로모터이다. 일부 구현예에서, 프로모터는 hSyn1이다.
본 개시내용의 추가 양태는 본원에 기재된 AAV 벡터 또는 입자를 이를 필요로 하는 대상체에게 투여하는 단계를 포함하는 방법에 관한 것이다. 일부 구현예에서, 대상체는 인간 대상체이다. 일부 구현예에서, 인간 대상체는 성인이다. 일부 구현예에서, 인간 대상체는 성인이 아니다. 일부 구현예에서, 인간 대상체는 25세 이하이다. 일부 구현예에서, 인간 대상체는 10세 이하이다. 일부 구현예에서, 대상체는 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있다. 일부 구현예에서, 대상체는 자폐 스펙트럼 장애(ASD)를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있다. 일부 구현예에서, 대상체는 ASD의 하나 이상의 증상을 나타낸다. 일부 구현예에서, 대상체는 펠란-맥더미드 증후군(Phelan-McDermid syndrome)을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있다. 일부 구현예에서, 대상체는 발달 지연, 지적 장애(ID), 수면 장애, 저긴장, 언어능력 부족 또는 언어 지연 중 하나 이상을 나타낸다.
본 개시내용의 추가 양태는 신경발달 장애를 갖는 대상체를 치료하는 방법에 관한 것이다. 일부 구현예에서, 본 개시내용은 자폐 스펙트럼 장애(ASD)를 갖는 대상체를 치료하는 방법에 관한 것이다. 일부 구현예에서, 본 개시내용은 펠란-맥더미드 증후군을 갖는 대상체를 치료하는 방법에 관한 것이다. 일부 구현예에서, 치료 방법은 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 AAV 벡터를 포함하는 조성물의 유효량을 대상체에게 투여하는 단계를 포함한다. 일부 구현예에서, 조성물은 약제학적으로 허용가능한 담체 내에 있다.
일부 구현예에서, AAV 벡터는 대상체의 뇌로 전달된다. 일부 구현예에서, AAV 벡터는 대상체의 피질, 선조체 및/또는 시상으로 전달된다.
일부 구현예에서, 대상체는 대조군 대상체에 비해 Shank3 유전자의 감소된 발현을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있다. 일부 구현예에서, 대조군 대상체는 신경발달 장애, 자폐 스펙트럼 장애(ASD) 및/또는 펠란-맥더미드 증후군을 갖지 않거나, 갖는 것으로 의심되지 않거나, 또는 가질 위험이 없는 대상체이다. 일부 구현예에서, Shank3 유전자의 감소된 발현은 Shank3 유전자의 적어도 하나의 카피의 파괴에 의해 유발된다. 일부 구현예에서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 결실을 포함한다. 일부 구현예에서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 하나 이상의 돌연변이를 포함한다.
본 개시내용의 추가 양태는 서열번호: 17-20 중 어느 하나에 대해 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 서열을 포함하는 MiniShank3 단백질에 관한 것이다. 일부 구현예에서, MiniShank3 단백질은 서열번호: 17-20 중 어느 하나의 서열을 포함한다.
도 1a-1b는 Shank3B-/- 마우스에서의 피부 병변 및 증가된 그루밍(grooming)을 보여준다.
도 2a-2c는 Shank3B 돌연변이체 마우스가 사회적 상호작용 결손을 나타냄을 보여준다. 도 2a에서 "스트레인저(동물)(Stranger) 1"은 시험 동물과의 사회적 접촉 행동에 대해 시험된 파트너를 나타낸다. 도 2a에서 "스트레인저 2"는 이전에 빈 와이어 케이지 내로 도입된 초보(novice) 사회적 파트너를 나타낸다. S1: 스트레인저 1; S2: 스트레인저 2; E: 빈 케이지.
도 3a-3c는 Shank3B-/- 마우스가 선조체 PSD에서 변경된 분자 조성을 나타냄을 보여준다.
도 4a-4e는 Shank3B 돌연변이체 마우스에서의 피질-선조체 시냅스 결함을 보여준다. PPR: 쌍 펄스 비율(paired-pulse ratio).
도 5a-5c는 miniShank3-v1의 디자인을 보여준다. 도 5a는 전장 Shank3의 단백질 도메인 다이어그램을 보여준다. 도 5b는 본 개시내용에 제공된 miniShank3-v1의 개략도를 보여준다. 도 5c는 인간 시냅신-1 프로모터(hSyn-1)를 갖는 GFP-태깅된 miniShank3-v1의 개략도를 보여준다. ANK, 안키린 반복; SH3, src 상동성 3 도메인; PDZ, PDZ 도메인; Pro, 프롤린 풍부 영역; HBD, 호머 결합 도메인; CBD, 코르탁틴 결합 도메인; SAM, 멸균 알파 모티프.
도 6a-6c는 miniShank3-v2의 디자인을 보여준다. 도 6a는 전장 Shank3의 단백질 도메인 다이어그램을 보여준다. 도 6b는 본 개시내용에 제공된 miniShank3-v2의 개략도를 보여준다. 도 6c는 인간 시냅신-1 프로모터(hSyn-1)를 갖는 GFP-태깅된 miniShank3-v2의 개략도를 보여준다. ANK, 안키린 반복; SH3, src 상동성 3 도메인; PDZ, PDZ 도메인; Pro, 프롤린 풍부 영역; HBD, 호머 결합 도메인; CBD, 코르탁틴 결합 도메인; SAM, 멸균 알파 모티프.
도 7a-7h는 GFP-miniShank3-v1이 시냅스에 국소화되었음을 보여준다. hSyn1-GFP-miniShank3-v1은 피질-선조체 공동 배양에서 선조체 중간 가시 뉴런(MSN) 내로 형질감염되었다. 도 7a는 GFP-miniShank3-v1이 MSN에서 발현되었음을 보여주고, 도 7b-7c는 시냅스를 표시하기 위해 PSD95로 염색된 동일한 배양물(도 7b) 및 수상돌기를 나타내기 위해 MAP2로 염색된 동일한 배양물(도 7c)을 보여준다. 도 7d는 도 7a-7c의 병합된 이미지를 보여준다. 도 7e-7h는 수상돌기(도 7g) 및 병합된 이미지에서 수상돌기 가시(도 7h) 상의 PSD95를 이용한(도 7f) GFP-miniShank3-v1의 정확한 국소화(도 7e)를 보여주기 위한 도 7a-7d로부터의 고배율 이미지를 보여준다.
도 8은 출생 후 0일 안면 정맥 주사 후 GFP-miniShank3-v1의 효율적인 발현이 있었음을 보여준다. P0 마우스에게 마우스당 6.42E+11개의 바이러스 게놈(vg)을 주사하였다. AAV 주사 2개월 후 마우스 뇌를 수집하고 뇌를 절단하여 GFP 발현을 관찰하였다.
도 9a-9f는 P0에서 AAV-miniShank3-v1의 단일 정맥내 주사가 Shank3 결핍 마우스에서 PSD 단백질 결손을 구제하였음을 보여준다. 도 9a는 AAV-매개 miniShank3-v1 유전자 요법 실험의 타임라인 및 실험 그룹을 보여준다. 도 9b는 AAV-GFP가 주사된 야생형 마우스(WT), AAV-GFP가 주사된 InsG3680+/+ 마우스(돌연변이체), AAV-GFP-miniShank3-v1가 주사된 InsG3680+/+ 마우스(miniShank3), GFP-miniShank3-v1을 코딩하는 cDNA 플라스미드를 발현하는 HEK293 세포로부터의 용해물(HEK293-a), 및 GFP-p2A miniShank3-v1을 코딩하는 cDNA 플라스미드를 발현하는 HEK293 세포(HEK 293-b)로부터 제조된 선조체 시냅토솜 원형질막(SPM) 분획에서의 miniShank3 발현을 나타내는 웨스턴 블롯을 제공하며, 이는 항 Shank3 항체를 사용하여 검출되었다. 도 9c 및 9e는 AAV 주사된 마우스인 AAV-GFP가 주사된 WT(WT), AAV-GFP가 주사된 InsG3680+/+ 마우스(돌연변이체), 및 AAV-GFP-miniShank3-v1이 주사된 InsG3680+/+ 마우스(miniShank3)로부터의 선조체(도 9c) 및 피질(도 9e) SPM 분획에서 특정 항체에 의해 검출된 단백질에 대한 대표적인 블롯을 보여준다. 도 9d 및 9f는 선조체(도 9d) 및 피질(도 9f) SPM으로부터 튜불린 단백질 발현에 대해 정규화된 단백질의 상대적 수준의 정량화를 보여준다(n = 유전자형당 단백질당 4개 샘플, 각 n은 2마리의 마우스로부터 풀링된 조직임). 돌연변이체에서의 PSD 단백질 수준은 Minishank3 그룹에서의 WT 수준으로 회복되었다. *p<0.05, **p<0.01, ***p<0.001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 9d 및 9f).
도 10a-10b는 P0에 AAV-miniShank3-v1의 단일 정맥내 주사가 Shank3 결핍 마우스에서 선조체 시냅스 결함을 구제하였음을 보여준다. 도 10a는 돌연변이체 마우스에서 감소된 선조체 팝 스파이크 진폭(pop spike amplitude)이 miniShank3-v1 주사된 동물에서 구제되었음을 보여준다. 도 10b는 지시된 치료를 받은 마우스로부터의 대표적인 피질-선조체 팝 스파이크 흔적을 보여준다.
도 11a-11e는 P0에서 miniShank3-v1의 전신 전달이 Shank3 결핍 마우스에서 행동 결손을 구제하였음을 보여준다. 도 11a는 사회적 상호작용 시험에서 돌연변이체 마우스가 대조군과 비교하여 새로운 객체(O)보다 스트레인저 마우스(S)에 대해 선호도를 나타내지 않았음을 보여준다. 이 행동은 miniShank3 처리에 의해 구제되었다. 도 11b는 miniShank3 처리가 돌연변이체 마우스에서의 더 낮은 운동 활동(개방 필드 시험에서 감소된 이동 거리)을 야생형 수준까지 구제하였음을 보여준다. 도 11c는 Shank3 돌연변이체 마우스에서의 감소된 탐구적 행동(양육 시간)이 WT 수준 miniShank3 처리 그룹까지 회복되었음을 보여준다. 도 11d는 Shank3 돌연변이체 마우스에서의 불안 유사 행동(고위 제로 미로(elevated zero maze) 시험에서 감소된 개방 팔 시간)이 또한 miniShank3 처리 그룹에서 구제되었음을 보여준다. 도 11e는 Shank3 돌연변이체 그룹과 비교하여 miniShank3 처리 그룹에서 운동 기능(로타로드 시험)의 개선 경향이 관찰되었음을 보여준다. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 11a-11d), 본페로니 사후 검정을 이용한 이원 ANOVA(도 11e). 데이터는 평균 ± SEM으로 표시된다(a: n=16 WT + GFP, n=12 돌연변이체 + GFP 및 n=14 돌연변이체 + miniShank3; b-e: n= 26 WT + GFP, n=29 돌연변이체 + GFP 및 n=19 돌연변이체 + miniShank3).
도 12a-12f는 출생후 28일(P28)에 miniShank3 처리가 Shank3 돌연변이체 마우스에서 사회적 장애 및 운동 결손을 선택적으로 구제하였음을 보여준다. 도 12a는 II상 사회적 선호도 분석에서 객체(O) 대 스트레인저 마우스(S)와의 긴밀한 사회적 상호작용에 소모한 시간을 보여준다. 도 12b는 개방 필드 시험에서 이동한 총 거리를 보여준다. 도 12c는 로타로드 시험에서 낙하 지연시간을 통해 평가된 운동 학습의 평가를 보여준다. 도 12d는 로타로드 시험에서 낙하 지연시간을 통해 평가된 운동 협응(motor coordination)의 평가를 보여준다. 도 12e는 불안 유사 행동을 평가하기 위해 고위 제로 미로의 개방 팔에서 소모한 시간의 정량화를 보여준다. 도 12f는 2시간 비디오 촬영에서 그루밍 시간의 평가를 보여준다. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 12a, 12b, 12e 및 12f), 본페로니 사후 검정을 이용한 이원 ANOVA(도 12c 및 12d). 모든 데이터는 평균 ± SEM으로 표시된다(도 12a: n=21 WT, n=23 Mut, 및 n=18 MiniShank3; 도 12b: n= 14 WT, n=20 Mut, 및 n=13 MiniShank3; 도 12c: n=17 WT, n=14 Mut 및 n=10 MiniShank3; 도 12d: n=17 WT, n=14 Mut 및 n=10 MiniShan3k; 도 12e: n=14 WT, n=20 Mut 및 n=14 MiniShank3; 도 12f: n=15 WT, n=18 Mut 및 n=17 MiniShank3). WT는 야생형을 나타내고, mut는 Shanks3 돌연변이체를 나타내며, MiniShank3은 Shank 3 돌연변이체 + miniShank3 처리를 나타낸다.
도 13a-13i는 생후 일(P7)에 miniShank3 처리가 Shank3 돌연변이체 마우스에서 모든 행동 결손뿐만 아니라 수면 방해를 완전히 구제하였음을 보여준다. 도 13a는 II상 사회적 선호도 분석에서 객체(O) 대 스트레인저 마우스(S)와의 긴밀한 사회적 상호작용에 소모한 시간을 보여준다. 도 13b는 2시간 비디오 촬영에서 그루밍 시간의 평가를 보여준다. 도 13c는 불안 유사 행동을 평가하기 위해 고위 제로 미로의 개방 팔에서 소모한 시간의 정량화를 보여준다. 도 13d 및 13e는 개방 필드 시헙에서 이동한 총 거리를 보여준다. 도 13f는 로타로드 시험에서 낙하 지연시간를 통해 평가된 운동 학습 및 협응의 평가를 보여준다. 도 13g는 Shank3 돌연변이체 마우스에서 수면 행동을 평가하기 위한 NREM 수면 지속 시간의 정량화를 보여준다. 도 13h는 Shank3 돌연변이체 마우스에서 수면 행동을 평가하기 위한 NREM 수면 유지 길이의 정량화를 보여준다. 도 13i는 Shank3 돌연변이체 마우스에서 수면 행동을 평가하기 위한 델타 파워의 정량화를 나타낸다. *p<0.05, **p<0.01, ***p<0.001, ****p<0.0001, 본페로니 사후 검정을 이용한 일원 ANOVA(도 13a, 13b, 13c, 13d, 13g, 13h 및 13i), 본페로니 사후 검정을 이용한 이원 ANOVA(도 13e 및 13f). 데이터는 평균 ± SEM으로 표시된다(도 13a: n=16 WT, n=9 Mut 및 n=14 MiniShank3; 도 13b: n=18 WT, n=12 Mut 및 n=14 MiniShank3; 도 13c: n=10 WT, n=10 Mut 및 n=10 MiniShank3; 도 13d: n=18 WT, n=14 Mut 및 n=18 MiniShank3; 도 13e: n=18 WT, n=14 Mut 및 n=18 MiniShank3; 도 13f: n=17 WT, n=15 Mut 및 n=17 MiniShank3; 도 13g-13i: n=9 WT, n=8 Mut 및 n=8 MiniShank3). WT는 야생형을 나타내고, mut는 Shanks3 돌연변이체를 나타내며, MiniShank3은 Shank3 돌연변이체 + miniShank3 처리를 나타낸다.
도 14a-14b는 생후 일(P7)에 miniShank3 처리가 Shank3 돌연변이체에서 발작 활동을 유발하지 않았음을 보여준다. 도 14a는 야생형 동물, 대조군 바이러스가 주사된 돌연변이체, miniShank3이 주사된 돌연변이체, 또는 Scn2a 돌연변이체의 대표적인 EEG 트레이스를 보여준다. 도 14b는 패널 a에 나타낸 4개의 실험 그룹에서 관찰된 스파이크파 방전(SWD)의 정량화를 보여준다(데이터는 평균 ± SEM으로 표시됨). ***p<0.001, 본페로니 사후 검정을 이용한 일원 ANOVA.
도 15는 hSyn1 프로모터를 갖는 인간 miniShank3 유전자의 플라스미드 구성을 보여주는 개략도를 예시한다.
본 개시내용의 양태는 신경발달 장애를 치료하기 위한 유전자 치료 접근법에 관한 것이다. 실시예는 유전자 전달 벡터에서 발현되고 대상체에게 투여될 수 있는 Shank3 단백질을 코딩하는 비자연 발생 폴리뉴클레오타이드를 입증한다. 본원에 개시된 유전자 요법 전략은 AAV 시스템을 사용하여 Shank3 유전자의 기능적 카피를 뇌 세포로 전달하여 세포 기능을 회복시킨다.
SHANK3은 흥분성 글루타메이트성 시냅스(excitatory glutamatergic synapse)에서 시냅스 스캐폴딩 단백질을 코딩하고, 신호전달 분자의 모집을 조정하고, 적절한 시냅스 발달 및 기능에 중요한 거대분자 시냅스후 단백질 복합체의 조립을 조율한다. SHANK3의 결실은 펠란-맥더미드 증후군의 핵심적인 신경발달 및 신경행동 결손의 주요 원인이다. 인간 유전 연구들은 SHANK3 돌연변이가 자폐 스펙트럼 장애(ASD)의 약 1%를 차지한다는 것을 확인하였다. 펠란-맥더미드 증후군 환자 및 SHANK3 돌연변이를 가진 다른 개체들은 종종 발달 지연, 수면 장애, 저긴장, 언어능력 부족 또는 심각한 언어 지연, 및 ASD의 특징적인 특색을 포함하는 다양한 동반이환 특성을 나타낸다. 현재 ASD에 대한 효과적인 치료법은 없다.
ASD와 Shank3의 관련성은 시냅스 기능장애와 ASD의 병리생리학 사이에 즉각적인 연결을 제공하였다. 동물 모델은 ASD의 인간 유전학을 임상 표현(clinical presentation)의 근본이 되는 뇌 병리학에 연결하고, 궁극적으로 효과적인 치료법을 발견하고 평가하는 데 도움을 준다. 파리, 어류 및 설치류에서의 이전 연구들은 SHANK3 손실로 인한 시냅스 기능장애 및 행동 이상을 밝혀내었다. 예를 들어, 마우스 모델에서 Shank3의 파괴는 시냅스 결함, 사회적 상호작용 장애, 운동 곤란, 반복적인 그루밍 및 불안 수준 증가를 초래하였다. Shank3 결핍은 설치류, 원숭이 및 인간 환자에서 심각한 수면 장애를 유발하므로, 수면 효율은 ASD에 대한 독특한 바이오마커를 제공한다. 또한, 시냅스 결함 및 행동 이상은 Shank3가 회복될 때 가역적이기 때문에, Shank3 결핍 마우스 모델은 예측 타당성을 제시한다. 따라서, 유전자 대체는 이 단일유전자 질환에 대한 치료 전략으로 매우 적합하다.
새로운 재조합 아데노 관련 바이러스(rAAV)는 이들의 광범위한 조직 친화성(tissue tropism), 낮은 면역원성, 매우 효율적이고 지속적인 유전자 전달, 및 임상적으로 입증된 안전성 추적 기록으로 인해 유망한 유전자 전달 플랫폼에 해당한다. 그러나, Shank3은 AAV 벡터의 패키징 용량을 초과하는 약 5.7 kb의 코딩 서열을 갖는 큰 단백질이라는 것이 당업계에 공지되어 있다. 본 출원의 발명자들은 Shank3 단백질의 특정 영역이 단백질의 기능에 중요하지 않다는 것을 발견하였고, 따라서 유의하게 더 작은 코딩 서열(약 2.1 kb 내지 약 3.1 kb)을 갖는 이종 Shank3 발현 작제물을 설계하였는데, 이들이 특정 비필수 영역이 제거된 Shank3 단백질의 한 가지 형태를 코딩하기 때문이다. 본원에 기재된 생성된 소형화된 Shank3 단백질은 AAV와 같은 벡터에 의해 전달될 수 있다. 본 출원의 발명자들은 놀랍게도 소형화된 Shank3 단백질이 마우스 모델에서 Shank3 단백질을 코딩하는 유전자의 결실 또는 돌연변이에 의해 유발된 결함 기능을 회복시킬 수 있고, 따라서 Shank3 돌연변이 또는 결실과 관련된 질환에 의해 유발된 이상을 잠재적으로 구제할 수 있음을 발견하였다. 이것은 Shank3 단백질의 부분적인 단편을 복구하거나 개선하는 데 초점을 맞추지만 Shank 단백질의 기능을 회복시킬 수 없는 당업계에 알려진 방법과 대조된다. 따라서, 본 개시내용은 소형화된 Shank3 단백질("MiniShank3")을 사용하여 Shank3의 활성을 회복시킴으로써 신경발달 장애를 치료하기 위한 방법 및 조성물에 관한 것이다.
Shank 단백질
Shank 계열의 단백질(예컨대, Shank1, Shank 2 및 Shank3)은 흥분성 뉴런의 시냅스에서 스캐폴딩 단백질을 묶고 조직화하는 마스터 스캐폴딩 단백질이다. 이 계열의 구성원은 적어도 5개의 주요 도메인 영역인 N-말단 안키린 반복, SH3 도메인, PDZ 도메인, 프롤린-풍부 영역 및 C-말단 SAM 도메인을 공유한다. 이러한 기능적 도메인을 통해, Shank 단백질은 많은 시냅스후 밀도(postsynaptic density, PSD) 단백질과 상호작용한다. 임의의 이론에 얽매이지 않으면서, Shank 단백질은 SAPAP에 결합할 수 있으며, 이는 결국 PSD95에 결합하여 PSD95/SAPAP/Shank 시냅스후 복합체를 형성한다. 함께, 이들 다중도메인 단백질은 주요 스캐폴드를 형성하여, 글루타메이트성 시냅스에서 거대분자 시냅스후 신호전달 복합체의 조립을 조율하는 것으로 제안된다. 이 복합체는 신경전달자 수용체 및 신호전달 분자의 시냅스 국소화를 표적화, 고정 및 동적으로 조절하는 데 중요한 역할을 하는 것으로 나타났다. 또 다른 예에서, Shank 계열의 단백질은 호머(Homer)에 대한 결합을 통해 mGluR 경로에 연결된다.
액틴 결합 단백질에 대한 그의 연결로 인해, Shank는 또한 가시(spine) 발달에도 중요한 역할을 한다. Shank3의 형질감염이 배양된 무가시 소뇌 과립 세포에서 기능적 수상돌기 가시 시냅스를 유도하기에 충분한 것으로 밝혀졌으며, 이는 가시 유도에서의 역할을 나타낸다. Shank3은 가장 긴 Shank3 동형인 Shank3α, Shank3β 및 Shank3γ를 포함하는 3개의 주요 동형을 갖는다. Shank3의 siRNA 넉다운은 DIV18 배양된 해마 뉴런에서 수상돌기 가시의 수를 감소시키고 길이를 증가시킨 것으로 보고되었고, 이는 가시 성숙에서의 역할을 함축한다. 이 제안된 기능은 Shank1의 과발현이 배양된 해마 뉴런에 이미 존재하는 수상돌기 가시를 확대하였다는 발견에 의해 뒷받침되었다. 또한, Shank1 돌연변이체 마우스는 더 작은 수상돌기 가시 및 더 약한 시냅스 전달을 갖는 것으로 보고되었다.
일부 구현예에서, 본 개시내용은 파괴된 Shank 단백질 활성을 갖는 대상체에서 시냅스 활성을 회복시킬 수 있는 Shank 단백질에 관한 것이다. 일부 구현예에서, 파괴된 Shank 단백질 활성은 신경발달 장애, 자폐 스펙트럼 장애(ASD), 및/또는 펠란-맥더미드 증후군을 가진 대상체에 존재한다. 일부 구현예에서, 본 개시내용과 관련된 Shank 단백질은 Shank1 단백질이다. 일부 구현예에서, 본 개시내용은 이를 필요로 하는 대상체에서 Shank1 또는 Shank1의 변이체를 코딩하는 폴리뉴클레오타이드의 발현에 관한 것이다. 일부 구현예에서, 본 개시내용에서의 Shank 단백질은 Shank2 단백질이다. 일부 구현예에서, 본 개시내용은 이를 필요로 하는 대상체에서 Shank2 또는 Shank2의 변이체를 코딩하는 폴리뉴클레오타이드의 발현에 관한 것이다. 일부 구현예에서, 본 개시내용에서의 Shank 단백질은 Shank3 단백질이다. 일부 구현예에서, 본 개시내용은 이를 필요로 하는 대상체에서 Shank3 또는 Shank3의 변이체를 코딩하는 폴리뉴클레오타이드의 발현에 관한 것이다. 본 개시내용과 관련된 Shank 단백질은 흥분성 뉴런의 시냅스에서 스캐폴딩 단백질로서 기능하는 임의의 Shank 단백질, 예컨대 그의 변이체 또는 단편을 포함할 수 있는 것으로 이해되어야 한다.
또한 유전자 요법에 사용하기 위한 Shank 단백질(Shank1, Shank 2 및 Shank3)을 코딩하는 폴리뉴클레오타이드가 본원에 개시되어 있다.
GenBank 등록번호 BAE16756.1에 상응하는 Shank3 전장 마우스 단백질 서열은 서열번호: 5에 의해 제공된다:
Figure pct00001
일부 구현예에서, 서열번호: 5에 상응하는 Shank3 전장 마우스 단백질 서열은 서열번호: 15에 의해 제공되는 GenBank 등록번호 NM_021423에 상응하는 핵산 서열에 의해 코딩된다:
Figure pct00002
Figure pct00003
GenBank 등록번호 Q9BYB0.3에 상응하는 Shank3 전장 인간 단백질 서열은 서열번호: 6에 의해 제공된다:
Figure pct00004
Figure pct00005
일부 구현예에서, 서열번호: 6에 상응하는 Shank3 전장 인간 단백질 서열은 서열번호: 16에 의해 제공되는 GenBank 등록번호 NM_001372044에 상응하는 핵산 서열에 의해 코딩된다:
Figure pct00006
Figure pct00007
Figure pct00008
전장 Shank3 단백질은 다수의 도메인을 포함하며, 약 5.2 kb 크기인 유전자에 의해 코딩된다. 그 크기 때문에, AAV 벡터를 통해 전장 Shank3을 관심있는 조직이나 세포에 전달하는 것은 어렵다. 본 출원의 발명자들은 흥분성 뉴런에서 Shank3 활성을 회복시키는 데 효과적인 MiniShank3을 생산하기 위해 특정 도메인이 전장 Shank3 단백질로부터 제거되거나 절단될 수 있음을 발견하였다(도 5b 및 6b). 본원에 기재된 폴리뉴클레오타이드에 의해 코딩되는 Shank 단백질(예컨대, Shank3 단백질)은 천연 전장 Shank3 단백질의 단축된 변이체를 형성하기 위해 소형화될 수 있다. 본원에 개시된 바와 같이, 소형화된 Shank3 단백질, 또는 소형화된 Shank3 단백질을 코딩하는 DNA 작제물은 "miniShank3" 또는 "MiniShank3"으로 상호교환적으로 지칭된다.
일부 구현예에서, 본원에 개시된 Shank3 단백질은 소형화된 Shank3 DNA 작제물로서 발현된다. 일부 구현예에서, 본원에 개시된 변이체 Shank3 DNA 작제물 및 Shank3 단백질(MiniShank3)은 전장 Shank3 유전자 및 단백질보다 더 적은 도메인을 포함한다. 일부 구현예에서, 본원에 개시된 Shank3 단백질은 비자연 발생 폴리뉴클레오타이드에 의해 코딩된다.
본원에 기재된 폴리뉴클레오타이드에 의해 코딩되는 Shank3 단백질은 하나 이상의 단백질 도메인을 포함할 수 있다. 예를 들어, Shank3 단백질은 SH3 도메인, PDZ 도메인, 호머 결합 도메인, 코르탁틴 도메인, SAM 도메인 및/또는 안키린 반복 도메인 중 하나 이상을 포함할 수 있다.
일부 구현예에서, SH3 도메인은 그 사이의 모든 값을 포함하여 서열번호: 6의 잔기 474-525 또는 서열번호: 5의 잔기 473-524에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, SH3 도메인은 서열번호: 6의 잔기 474-525에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, SH3 도메인은 서열번호: 5의 잔기 473-524에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, SH3 도메인은 서열번호: 6의 잔기 474-525를 포함한다. 일부 구현예에서, SH3 도메인은 서열번호: 5의 잔기 473-524를 포함한다. 일부 구현예에서, SH3 도메인은 MiniShank3의 제작에 적합한 서열번호: 6의 잔기 474-525에 대해 임의의 퍼센트 동일성을 포함할 수 있다. 일부 구현예에서, SH3 도메인은 MiniShank3의 제작에 적합한 서열번호: 5의 잔기 473-524에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, PDZ 도메인은 그 사이의 모든 값을 포함하여 서열번호: 6의 573-662 또는 서열번호: 5의 잔기 572-661에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, PDZ 도메인은 서열번호: 6의 잔기 573-662에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, PDZ 도메인은 서열번호: 5의 잔기 572-661에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, PDZ 도메인은 서열번호: 6의 잔기 573-662를 포함한다. 일부 구현예에서, PDZ 도메인은 서열번호: 5의 잔기 572-661을 포함한다. 일부 구현예에서, PDZ 도메인은 MiniShank3의 제작에 적합한 서열번호: 6의 잔기 573-662에 대해 임의의 퍼센트 동일성을 포함할 수 있다. 일부 구현예에서, PDZ 도메인은 MiniShank3의 제작에 적합한 서열번호: 5의 잔기 572-661에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, 호머 결합 도메인은 그 사이의 모든 값을 포함하여 서열번호: 5 또는 6의 잔기 1294-1323에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, 호머 도메인은 서열번호: 5의 잔기 1294-1323에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 호머 도메인은 서열번호: 6의 잔기 1294-1323에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 호머 도메인은 서열번호: 5 또는 6의 잔기 1294-1323을 포함한다. 일부 구현예에서, 호머 도메인은 MiniShank3의 제작에 적합한 서열번호: 5 또는 6의 잔기 1294-1323에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, 코르탁틴 결합 도메인은 그 사이의 모든 값을 포함하여 서열번호: 5 또는 6의 잔기 1400-1426에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, 코르탁틴 결합 도메인은 서열번호: 5의 잔기 1400-1426에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 코르탁틴 결합 도메인은 서열번호: 6의 잔기 1400-1426에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426을 포함한다. 일부 구현예에서, 코르탁틴 결합 도메인은 MiniShank3의 제작에 적합한 서열번호: 5 또는 6의 잔기 1400-1426에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, SAM 도메인은 그 사이의 모든 값을 포함하여 서열번호: 6의 잔기 1664-1729 또는 서열번호: 5의 잔기 1663-1728에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, SAM 결합 도메인은 서열번호: 6의 잔기 1664-1729에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, SAM 결합 도메인은 서열번호: 5의 잔기 1663-1728에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, SAM 도메인은 서열번호: 6의 잔기 1664-1729를 포함한다. 일부 구현예에서, SAM 도메인은 서열번호: 5의 잔기 1663-1728을 포함한다. 일부 구현예에서, SAM 결합 도메인은 MiniShank3의 제작에 적합한 서열번호: 6의 잔기 1664-1729에 대해 임의의 퍼센트 동일성을 포함할 수 있다. 일부 구현예에서, SAM 결합 도메인은 MiniShank3의 제작에 적합한 서열번호: 5의 잔기 1663-1728에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, 안키린 반복 도메인은 그 사이의 모든 값을 포함하여 서열번호: 6의 잔기 148-345 또는 서열번호: 5의 잔기 147-313에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하다. 일부 구현예에서, 안키린 반복 도메인은 서열번호: 6의 잔기 148-345에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 안키린 반복 도메인은 서열번호: 5의 잔기 147-313에 대해 적어도 90% 동일성을 포함한다. 일부 구현예에서, 안키린 반복 도메인은 MiniShank3의 제작에 적합한 서열번호: 6의 잔기 148-345에 대해 임의의 퍼센트 동일성을 포함할 수 있다. 일부 구현예에서, 안키린 반복 도메인은 MiniShank3의 제작에 적합한 서열번호: 5의 잔기 147-313에 대해 임의의 퍼센트 동일성을 포함할 수 있다.
일부 구현예에서, MiniShank3 단백질은 서열번호: 5의 전장에 걸쳐 서열번호: 5에 대해 65% 미만 동일하다. 일부 구현예에서, MiniShank3 단백질은 서열번호: 6의 전장에 걸쳐 서열번호: 6에 대해 65% 미만 동일하다. 본원에서 사용된 바와 같이, "65% 미만"은 MiniShank3의 제작에 적합한 65% 미만의 임의의 퍼센트 동일성을 포함한다. 일부 구현예에서, MiniShank3 단백질은 서열번호: 5의 전장에 걸쳐 서열번호: 5에 대해 64%, 63%, 62%, 61%, 60%, 59%, 58%, 57%, 56%, 55%, 54%, 53%, 52%, 51%, 50%, 49%, 48%, 47%, 46%, 45%, 44%, 43%, 42%, 41%, 40%, 39%, 38%, 37%, 36%, 35%, 34%, 33%, 32%, 31%, 30%, 29%, 28%, 27%, 26%, 25%, 24%, 23%, 22%, 21%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11% 또는 10% 미만 동일하다.
일부 구현예에서, MiniShank3 단백질은 그 사이의 모든 값을 포함하여 표 1에 제공된 서열번호: 17-20 중 어느 하나에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일하거나 100% 동일한 아미노산 서열을 포함한다.
일부 구현예에서, MiniShank3 단백질은 서열번호: 17-20 중 어느 하나를 포함한다. 일부 구현예에서, 서열번호: 17은 서열번호: 1에 의해 코딩된다. 일부 구현예에서, 서열번호: 18은 서열번호: 2에 의해 코딩된다. 일부 구현예에서, 서열번호: 19는 서열번호: 3에 의해 코딩된다. 일부 구현예에서, 서열번호: 20은 서열번호: 4에 의해 코딩된다.
일부 구현예에서, MiniShank3 단백질은 안키린 반복 도메인을 포함한다. MiniShank3 단백질이 안키린 반복 도메인을 포함하는 특정 구현예에서, MiniShank3 단백질은 서열번호: 19 및/또는 20을 포함한다.
다른 구현예에서, MiniShank3 단백질은 안키린 반복 도메인을 포함하지 않는다. MiniShank3 단백질이 안키린 반복 도메인을 포함하지 않는 특정 구현예에서, MiniShank3 단백질은 서열번호: 17 및/또는 18을 포함한다.
일부 구현예에서, 본 개시내용과 관련된 MiniShank3 단백질을 코딩하는 폴리뉴클레오타이드의 서열은 그 사이의 모든 값을 포함하여 서열번호: 1-4 중 어느 하나에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하며 Shank3 활성을 갖는 하나 이상의 단백질을 코딩한다. 일부 구현예에서, 본 개시내용과 관련된 MiniShank3 단백질을 코딩하는 폴리뉴클레오타이드의 서열은 서열번호: 1-4 중 어느 하나에 대해 적어도 90% 동일성을 포함하며 Shank3 활성을 갖는 하나 이상의 단백질을 코딩한다. 일부 구현예에서, 본 개시내용과 관련된 MiniShank3 단백질을 코딩하는 폴리뉴클레오타이드의 서열은 서열번호: 1-4 중 어느 하나를 포함한다. 일부 구현예에서, 서열번호: 1-4 중 어느 하나는 부분적인 Shank3 활성을 갖는 하나 이상의 단백질을 코딩한다. 일부 구현예에서, 서열번호: 1-4 중 어느 하나는 완전한 Shank3 활성을 갖는 하나 이상의 단백질을 코딩한다.
일부 구현예에서, MiniShank3은 표 1에 제공된 서열번호: 1-4 중 어느 하나에 의해 코딩된다. 서열번호: 1 및 서열번호: 3은 마우스 MiniShank3 핵산 서열에 상응하는 한편, 서열번호: 2 및 서열번호: 4는 인간 MiniShank3 핵산 서열에 상응한다. 서열번호: 1 및 서열번호: 2는 안키린 반복 도메인 또는 N-말단 도메인을 포함하지 않는 MiniShank3 단백질을 코딩한다. 서열번호: 3 및 서열번호: 4는 안키린 반복 도메인 및 N-말단 도메인을 포함하는 MiniShank3 단백질을 코딩한다.
MiniShank3 단백질을 코딩하는 본원에 기재된 폴리뉴클레오타이드는 적어도 부분적인 Shank3 활성을 갖는 단백질을 코딩한다.
본원에 개시된 바와 같이, 서열의 "동일성"은 당업자에게 공지된 수학적 모델, 알고리즘, 또는 컴퓨터 프로그램에 의해 다뤄지는 갭 정렬을 갖는 2개 이상의 서열 사이의 동일한 매치의 퍼센트의 측정 또는 계산을 지칭한다. 2개의 서열(예컨대, 핵산 또는 아미노산 서열)의 퍼센트 동일성은, 예를 들어 BLAST®(Basic Local Alignment Search Tool), 예컨대 NBLAST® 및 XBLAST® 프로그램(버전 2.0)을 사용하여 결정될 수 있다. Clustal Omega와 같은 정렬 기술이 다중 서열 정렬에 사용될 수 있다. 다른 알고리즘 또는 정렬 방법은, 비제한적으로 스미스-워터만(Smith-Waterman) 알고리즘, 니들만-분쉬(Needleman-Wunsch) 알고리즘, 또는 FOGSAA(Fast Optimal Global Sequence Alignment Algorithm)를 포함할 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 Shank 단백질(Shank 1, Shank2, Shank3)을 코딩하는 폴리뉴클레오타이드는 약 4.6 kb, 약 4.5 kb, 약 4.4 kb, 약 4.3 kb, 약 4.2 kb, 약 4.1 kb, 약 4.0 kb, 약 3.9 kb, 약 3.8 kb, 약 3.7 kb, 약 3.6 kb, 약 3.5 kb, 약 3.4 kb, 약 3.3 kb, 약 3.2 kb, 약 3.1 kb, 약 3.0 kb, 약 2.9 kb, 약 2.8 kb, 약 2.7 kb, 약 2.6 kb, 약 2.5 kb, 약 2.4 kb, 약 2.3 kb, 약 2.2 kb 또는 약 2.1 kb 크기 미만이다. 일부 구현예에서, 본원에 개시된 바와 같은 Shank 단백질(Shank 1, Shank2, Shank3)을 코딩하는 폴리뉴클레오타이드는 본 개시내용에 개시된 방법 및 벡터에 적합한 임의의 크기일 수 있다.
질환 및 장애
본 개시내용은 신경발달 장애, 예컨대 자폐 스펙트럼 장애(ASD) 또는 펠란-맥더미드 증후군을 치료하기에 적합한 조성물 및 방법을 제공한다.
본원에 사용된 바와 같이, "신경발달 장애"는 뇌 및/또는 중추신경계의 성장 및/또는 발달을 손상시키는 임의의 장애를 지칭한다. 일부 구현예에서, 신경발달 장애는 하나 이상의 뇌 기능, 예컨대 감정, 학습 능력, 자기 통제, 및 기억에 영향을 미친다. 본 개시내용의 양태가 임의의 신경발달 장애의 치료에 적용될 수 있는 것으로 이해되어야 한다.
일부 구현예에서, 신경발달 장애는 자폐 스펙트럼 장애(ASD)이다. ASD의 진단은 주로 의사소통 결함, 사회적 상호작용 장애, 및 반복적이거나 제한된 관심 및 행동과 같은 기준을 기초로 한다. ASD는 일란성 쌍생아의 경우 90%로 높은 일치율을 갖는 고도로 유전되는 장애이다. 그러나, ASD는 임상적으로 이질적이어서, 구별되는 증상 중증도의 다양한 별개의 장애를 커버한다. ASD는 병인학적으로 이질적이어서, 아마도 다유전자성, 단일유전자성 및 환경적 요인을 포괄하는 것으로 여겨진다.
시냅스 연결 및 기능의 변경이 ASD의 근간이 되는 핵심 메커니즘으로 제안되었다. 최근의 유전 연구들은 ASD에 대한 상당히 많은 후보 유전자를 확인하였고, 이들 중 다수는 Shank3, Neuroligin-3, Neuroligin-4 및 Neurexin-1을 포함하는 시냅스 단백질을 코딩한다. 이러한 결과는 시냅스 기능장애가 ASD의 하위 집합에 대한 일반적인 메커니즘의 근간이 될 수 있음을 시사한다. 다양한 Shank3 돌연변이가 지적 장애(ID)와 함께 ASD의 단일유전자 원인으로 확인되었다. ASD 환자에서, 확인된 모든 Shank3 결실 및/또는 돌연변이는 Shank3 유전자의 2개의 정상적인 카피 중 하나에서 기능의 상실(LoF)을 초래한다(즉, 일배체 부족). 최근 유전자 스크린은 또한 펠란-맥더미드 증후군(PMS)으로 진단되지 않은 ASD 환자에서 미세결실(microdeletion), 넌센스 돌연변이 및 반복 중단점을 포함하여 Shank3 유전자에서 다수의 돌연변이를 확인하였다. 이들은 Shank3 유전자 파괴 및/또는 돌연변이가 자폐 스펙트럼 장애(ASD)의 단일유전자 원인이라는 것을 의미한다. 현재 추정치는 Shank3와 관련된 결실 및/또는 돌연변이가 ID를 가진 모든 ASD 환자의 약 2%를 차지한다는 것이다. 따라서, Shank3의 기능의 이해는 ASD의 병리학적 메커니즘에 대한 통찰력을 제공할 수 있다.
본원에 사용된 바와 같이, "지적 장애"는 대상체가 지적 기능 및/또는 적응 기능에 결손을 갖게 하는 장애를 의미한다. 지적 기능은, 예를 들어 추론, 문제 해결, 계획, 추상적 사고, 판단, 학업 학습 및/또는 경험 학습을 포함할 수 있다. 지적 기능은 IQ 검사와 같이 당업계에 알려진 임의의 방법을 사용하여 측정될 수 있다. 적응 기능은, 예를 들어 의사소통 및 사회적 기술과 같이 독립적이고 책임있는 방식으로 생활하는 데 필요한 기술을 포함할 수 있다. 일부 경우에, 지적 장애는 아동기 또는 청소년기 동안 명백할 수 있다.
일부 구현예에서, 신경발달 장애는 펠란-맥더미드 증후군(PMS, 22q13.3 결실 증후군)이며, 이는 자폐 유사 행동, 저긴장, 중증 지적 장애 및 언어능력 및 말의 발달 장애를 나타내는 자폐 스펙트럼 장애이다. Shank3은 펠란-맥더미드 증후군에서 결실된 것으로 보고된 유전자 중 하나이다. Shank3의 파괴는 펠란-맥더미드 증후군의 핵심 신경발달 및 신경행동 결손의 원인인 것으로 생각되는데, 온전한 Shank3 유전자를 갖는 고리 염색체 22를 보유하는 개체가 표현형적으로 정상이기 때문이다.
다른 신경발달 장애는, 비제한적으로 주의력 결핍/과잉행동 장애(ADHD), 학습 장애, 예컨대 난독증 또는 난산증, 지적 장애(정신 지체), 행위 또는 운동 장애, 뇌성마비, 시각 및 청각 장애, 발달 말 장애, 신경유전 장애, 예컨대 취약성 X 증후군, 다운 증후군, 레트 증후군, 저성선자극호르몬성 성선저하 증후군(hypogonadotropic hypogonadal syndrome), 및 외상성 뇌 손상을 포함할 수 있다.
대상체
본원에 기재된 방법에 의해 치료될 대상체는 인간 대상체 또는 비인간 대상체일 수 있다. 비인간 대상체는, 예를 들어 비인간 영장류; 농장 동물, 예컨대 소, 말, 염소, 양, 및 돼지; 애완동물, 예컨대 개 및 고양이; 및 설치류를 포함한다.
본원에 기재된 방법에 의해 치료될 대상체는 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 발병할 위험이 있는 대상체일 수 있다. 일부 구현예에서, 대상체는 신경발달 장애를 갖는 것으로 진단된 한편, 다른 구현예에서, 대상체는 신경발달 장애를 갖는 것으로 진단되지 않았다. 일부 구현예에서, 대상체는 자폐 스펙트럼 장애(ASD)를 갖거나, 갖는 것으로 의심되거나, 또는 발병할 위험이 있는 인간 대상체이다. 일부 구현예에서, 대상체는 펠란-맥더미드 증후군을 갖거나, 갖는 것으로 의심되거나, 또는 발병할 위험이 있는 인간 대상체이다. 일부 구현예에서, 대상체는 대조군 대상체에 비해 Shank3 유전자의 감소된 발현을 갖는 대상체이다. 일부 구현예에서, Shank3 유전자의 발현은 대조군 대상체와 비교하여 대상체에서 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%까지, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배 감소된다. 일부 구현예에서, 대조군 대상체는 신경발달 장애를 갖지 않거나, 갖는 것으로 의심되지 않거나, 또는 가질 위험이 없는 대상체이다. 일부 구현예에서, 대상체에서 Shank3 유전자의 감소된 발현은 Shank3 유전자의 적어도 하나의 카피의 파괴에 의해 유발된다. 일부 구현예에서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내의 결실을 포함한다. 일부 구현예에서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 하나 이상의 돌연변이를 포함한다.
일부 구현예에서, 대상체는 ASD의 하나 이상의 증상을 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 발달 지연을 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 지적 장애(ID)를 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 수면 장애를 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 저긴장을 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 언어능력 부족을 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 언어 지연을 나타내는 인간 대상체이다. 일부 구현예에서, 대상체는 ASD의 임의의 증상 또는 징후를 나타내는 인간 대상체이다.
일부 구현예에서, 대상체는 성인인 인간 대상체이다. 일부 구현예에서, 성인은 25세 초과이다. 일부 구현예에서, 성인은 25세 이하이다. 일부 구현예에서, 성인은 21세 이하이다. 일부 구현예에서, 성인은 18세 이하이다. 일부 구현예에서, 성인은 16세이다. 일부 구현예에서, 대상체는 노인(예컨대, 65세 이상)이다. 일부 구현예에서, 성인은 본원에 개시된 치료에 적합한 성인기의 임의의 연령일 수 있다.
일부 구현예에서, 대상체는 성인이 아닌 인간 대상체이다. 일부 구현예에서, 인간 대상체는 16세 이하이다. 일부 구현예에서, 인간 대상체는 10세 이하이다. 일부 구현예에서, 인간 대상체는 10세 이하이다. 일부 구현예에서, 인간 대상체는 어린이 또는 유아이다. 일부 구현예에서, 인간 대상체는 걸음마 아기이다. 일부 구현예에서, 인간 대상체는 발달의 태아 단계에 있다. 일부 구현예에서, 인간 대상체는 발달의 출생전 단계에 있다.
바이러스 벡터
본원에 개시된 바와 같이, MiniShank3 단백질을 코딩하는 폴리뉴클레오타이드는 바이러스 벡터에서 관심있는 조직 또는 세포로 전달될 수 있다. 본원에 기재된 벡터는, 예컨대 대상체의 특정 기관 또는 중추신경계(CNS)로의 전달을 포함하여, 대상체에게 관심있는 단백질을 코딩하는 핵산을 전달하는 데 사용될 수 있다. 일부 구현예에서, 관심있는 단백질은 Shank 단백질이다. 일부 구현예에서, 관심있는 단백질은 Shank3 단백질이다. 일부 구현예에서, 관심있는 단백질은 MiniShank3 단백질이다.
일부 구현예에서, 본 개시내용은 본원에 개시된 Shank 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 제공한다. 일부 구현예에서, 본 개시내용은 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 제공한다. 일부 구현예에서, 벡터는 바이러스 벡터이다. 일부 구현예에서, 벡터는 AAV 벡터이다.
AAV는 바이러스의 파르보비리대(Parvoviridae) 속에 속하는 복제 결핍 데펜도파르보바이러스(Dependoparvovirus)를 지칭한다. AAV는 자연 발생 바이러스로부터 유래될 수 있거나 재조합일 수 있다. AAV는 자연 발생 캡시드 단백질 또는 재조합 캡시드 단백질로부터 유래될 수 있는 캡시드 내로 패키징될 수 있다. AAV의 단일 가닥 DNA 게놈은 역위 말단 반복(ITR)을 포함한다. ITR은 숙주 게놈에서의 그의 통합 및 그의 절제와 함께 AAV 게놈의 복제 및 캡슐화에 관여한다. 임의의 이론에 구속되지 않으면서, AAV 벡터는 5' ITR 및/또는 3' ITR을 포함하는 하나 이상의 ITR, 하나 이상의 프로모터, 하나 이상의 관심있는 단백질을 코딩하는 하나 이상의 핵산 서열, 및/또는 추가적인 전사후 조절자 요소를 포함할 수 있다. 본원에 개시된 AAV 벡터는, 예를 들어 그 전체가 참조로 본원에 포함된 문헌[Sambrook el al. (Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, N.Y. (2012))]에 기재된 바와 같이, 당업자에게 알려진 표준 분자 생물학 기술을 사용하여 제조될 수 있다.
일부 구현예에서, AAV는 숙주 세포 게놈으로 통합된다. 일부 구현예에서, AAV는 숙주 게놈 내로 통합되지 않는다. 일부 구현예에서, 본원에 개시된 AAV 벡터는 임의의 알려진 유기체로부터의 서열을 포함할 수 있다. 일부 구현예에서, 본원에 개시된 AAV 벡터는 합성 서열을 포함할 수 있다. AAV 벡터 서열은 당업자에게 알려진 임의의 방식으로, 예컨대 삽입, 결실 또는 치환을 포함시킴으로써, 및/또는 전사후 조절 요소, 예컨대 프로모터, 인핸서, 및 전사 및 번역 종결자, 예컨대 폴리아데닐화 신호의 사용을 통해 변형될 수 있다. 일부 구현예에서, AAV 벡터는 복제 및 통합과 관련된 서열을 포함할 수 있다.
일부 구현예에서, 본원에 개시된 바와 같은 MiniShank3은 AAV 벡터를 통해 관심있는 조직 또는 세포로 전달된다. 일부 구현예에서, 본원에 개시된 바와 같은 MiniShank3을 전달하는 AAV 벡터는 대상체의 중추신경계(CNS)로 전달된다. 본원에 사용된 바와 같이, AAV 벡터를 CNS로 전달하는 것은 AAV 벡터를 CNS 내의 관심있는 임의의 조직 또는 세포로 전달하는 것을 포함할 수 있다. 일부 구현예에서, AAV 벡터를 CNS로 전달하는 것은 AAV 벡터를 신경 조직 또는 세포로 전달하는 것을 포함한다. 일부 구현예에서, AAV 벡터를 CNS로 전달하는 것은 AAV 벡터를 뇌로 전달하는 것을 포함한다. 일부 구현예에서, AAV 벡터를 CNS로 전달하는 것은 AAV 벡터를 척수로 전달하는 것을 포함한다. 일부 구현예에서, AAV 벡터를 CNS로 전달하는 것은 AAV 벡터를 백질 및 회백질로 전달하는 것을 포함한다. 일부 구현예에서, 본원에 개시된 바와 같은 MiniShank3을 전달하는 AAV 벡터는 본원에 개시된 바와 같은 치료에 적합한 대상체의 관심있는 임의의 조직 또는 세포로 전달된다.
본 개시내용에서 사용되는 바와 같이, AAV 벡터를 "전달하는 것" 또는 "투여하는 것"은 AAV 벡터 또는 AAV 벡터를 포함하는 조성물을 대상체에게 전달 또는 투여하기 위한 당업계에 공지된 임의의 방법을 포함할 수 있다. 투여는 비제한적으로 AAV 벡터 또는 AAV 벡터를 포함하는 조성물의 직접 투여, 또는 당업계에 공지된 바와 같이 혈액 뇌 장벽을 우회하기 위한 수동 확산 또는 대류 강화 전달(CED)을 통한 말초 투여를 포함할 수 있다. 본원에 기재된 AAV 벡터는 본 개시내용의 양태과 양립할 임의의 조성물로 투여될 수 있다.
AAV 벡터는, 예를 들어 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10 및 AAV11을 포함하는 임의의 공지된 AAV 혈청형을 포함할 수 있다. 일부 구현예에서, AAV 혈청형은 AAV9이다. AAV 바이러스의 분기군(clade)은 문헌[Gao et al. (2004) J. Virol. 78(12):6381-6388]에 기재되어 있으며, 이로부터 참조로 포함되어 있다. 일부 구현예에서, CNS로의 전달에 적합한 임의의 AAV 혈청형이 선택될 수 있다.
본 개시내용의 AAV 벡터는 임의의 천연 또는 재조합 AAV 혈청형을 포함하거나 이로부터 유래될 수 있다. 일부 구현예에서, AAV 벡터는 그 내용이 그 전체가 참조로 본원에 포함된 WO 2017/201258A1에 기재된 AAV 혈청형, 예컨대 비제한적으로 AAV1, AAV2, AAV2G9, AAV3, AAV3a, AAV3b, AAV3-3, AAV4, AAV4-4, AAV5, AAV6, AAV6.1, AAV6.2, AAV6.1.2, AAV7, AAV7.2, AAV8, AAV9, AAV9.11, AAV9.13, AAV9.16, AAV9.24, AAV9.45, AAV9.47, AAV9.61, AAV9.68, AAV9.84, AAV9.9, AAV10, AAV11, AAV12, AAV16.3, AAV24.1, AAV27.3, AAV42.12, AAV42-1b, AAV42-2, AAV42-3a, AAV42-3b, AAV42-4, AAV42-5a, AAV42-5b, AAV42-6b, AAV42-8, AAV42-10, AAV42-11, AAV42-12, AAV42-13, AAV42-15, AAV42-aa, AAV43-1, AAV43-12, AAV43-20, AAV43-21, AAV43- 23, AAV43-25, AAV43-5, AAV44.1, AAV44.2, AAV44.5, AAV223.1, AAV223.2, AAV223.4, AAV223.5, AAV223.6, AAV223.7, AAV1-7/rh.48, AAV1-8/rh.49, AAV2-15/rh.62, AAV2- 3/rh.61, AAV2-4/rh.50, AAV2-5/rh.51, AAV3.1/hu.6, AAV3.1/hu.9, AAV3-9/rh.52, AAV3- 11/rh.53, AAV4-8/r11.64, AAV4-9/rh.54, AAV4-19/rh.55, AAV5-3/rh.57, AAV5-22/rh.58, AAV7.3/hu.7, AAV16.8/hu.10, AAV16.12/hu.11, AAV29.3/bb.1, AAV29.5/bb.2, AAV106.1/hu.37, AAV114.3/hu.40, AAV127.2/hu.41, AAV127.5/hu.42, AAV128.3/hu.44, AAV130.4/hu.48, AAV145.1/hu.53, AAV145.5/hu.54, AAV145.6/hu.55, AAV161.10/hu.60, AAV161.6/hu.61, AAV33.12/hu.17, AAV33.4/hu.15, AAV33.8/hu.16, AAV52/hu.19, AAV52.1/hu.20, AAV58.2/hu.25, AAVA3.3, AAVA3.4, AAVA3.5, AAVA3.7, AAVC1, AAVC2, AAVC5, AAV-DJ, AAV-DJ8, AAVF3, AAVF5, AAVH2, AAVrh.72, AAVhu.8, AAVrh.68, AAVrh.70, AAVpi.1, AAVpi.3, AAVpi.2, AAVrh.60, AAVrh.44, AAVrh.65, AAVrh.55, AAVrh.47, AAVrh.69, AAVrh.45, AAVrh.59, AAVhu.12, AAVH6, AAVLK03, AAVH-1/hu.1, AAVH-5/hu.3, AAVLG-10/rh.40, AAVLG-4/rh.38, AAVLG-9/hu.39, AAVN721-8/rh.43, AAVCh.5, AAVCh.5R1, AAVcy.2, AAVcy.3, AAVcy.4, AAVcy.5, AAVCy.5R1, AAVCy.5R2, AAVCy.5R3, AAVCy.5R4, AAVcy.6, AAVhu.1, AAVhu.2, AAVhu.3, AAVhu.4, AAVhu.5, AAVhu.6, AAVhu.7, AAVhu.9, AAVhu.10, AAVhu.11, AAVhu.13, AAVhu.15, AAVhu.16, AAVhu.17, AAVhu.18, AAVhu.20, AAVhu.21, AAVhu.22, AAVhu.23.2, AAVhu.24, AAVhu.25, AAVhu.27, AAVhu.28, AAVhu.29, AAVhu.29R, AAVhu.31, AAVhu.32, AAVhu.34, AAVhu.35, AAVhu.37, AAVhu.39, AAVhu.40, AAVhu.41, AAVhu.42, AAVhu.43, AAVhu.44, AAVhu.44R1, AAVhu.44R2, AAVhu.44R3, AAVhu.45, AAVhu.46, AAVhu.47, AAVhu.48, AAVhu.48R1, AAVhu.48R2, AAVhu.48R3, AAVhu.49, AAVhu.51, AAVhu.52, AAVhu.54, AAVhu.55, AAVhu.56, AAVhu.57, AAVhu.58, AAVhu.60, AAVhu.61, AAVhu.63, AAVhu.64, AAVhu.66, AAVhu.67, AAVhu.14/9, AAVhu.t 19, AAVrh.2, AAVrh.2R, AAVrh.8, AAVrh.8R, AAVrh.10, AAVrh.12, AAVrh.13, AAVrh.13R, AAVrh.14, AAVrh.17, AAVrh.18, AAVrh.19, AAVrh.20, AAVrh.21, AAVrh.22, AAVrh.23, AAVrh.24, AAVrh.25, AAVrh.31, AAVrh.32, AAVrh.33, AAVrh.34, AAVrh.35, AAVrh.36, AAVrh.37, AAVrh.37R2, AAVrh.38, AAVrh.39, AAVrh.40, AAVrh.46, AAVrh.48, AAVrh.48.1, AAVrh.48.1.2, AAVrh.48.2, AAVrh.49, AAVrh.51, AAVrh.52, AAVrh.53, AAVrh.54, AAVrh.56, AAVrh.57, AAVrh.58, AAVrh.61, AAVrh.64, AAVrh.64R1, AAVrh.64R2, AAVrh.67, AAVrh.73, AAVrh.74, AAVrh8R, AAVrh8R A586R 돌연변이체, AAVrh8R R533A 돌연변이체, AAAV, BAAV, 염소 AAV, 소 AAV, AAVhE1.1, AAVhEr1.5, AAVhER1.14, AAVhEr1.8, AAVhEr1.16, AAVhEr1.18, AAVhEr1.35, AAVhEr1.7, AAVhEr1.36, AAVhEr2.29, AAVhEr2.4, AAVhEr2.16, AAVhEr2.30, AAVhEr2.31, AAVhEr2.36, AAVhER1.23, AAVhEr3.1, AAV2.5T , AAV-PAEC, AAV-LK01, AAV-LK02, AAV-LK03, AAV-LK04, AAV-LK05, AAV-LK06, AAV-LK07, AAV-LK08, AAV-LK09, AAV-LK10, AAV-LK11, AAV-LK12, AAV-LK13, AAV-LK14, AAV-LK15, AAV-LK16, AAV-LK17, AAV-LK18, AAV-LK19, AAV-PAEC2, AAV-PAEC4, AAV- PAEC6, AAV-PAEC7, AAV-PAEC8, AAV-PAEC11, AAV-PAEC12, AAV-2-pre-miRNA- 101 , AAV-8h, AAV-8b, AAV-h, AAV-b, AAV SM 10-2, AAV 셔플 100-1 , AAV 셔플 100-3, AAV 셔플 100-7, AAV 셔플 10-2, AAV 셔플 10-6, AAV 셔플 10-8, AAV 셔플 100-2, AAV SM 10-1, AAV SM 10-8 , AAV SM 100-3, AAV SM 100-10, BNP61 AAV, BNP62 AAV, BNP63 AAV, AAVrh.50, AAVrh.43, AAVrh.62, AAVrh.48, AAVhu.19, AAVhu.11, AAVhu.53, AAV4-8/rh.64, AAVLG-9/hu.39, AAV54.5/hu.23, AAV54.2/hu.22, AAV54.7/hu.24, AAV54.1/hu.21, AAV54.4R/hu.27, AAV46.2/hu.28, AAV46.6/hu.29, AAV128.1/hu.43, 트루 타입 AAV(ttAAV), UPENN AAV 10, 일본 AAV 10 혈청형, AAV CBr-7.1, AAV CBr-7.10, AAV CBr-7.2, AAV CBr-7.3, AAV CBr-7.4, AAV CBr-7.5, AAV CBr-7.7, AAV CBr-7.8, AAV CBr-B7.3, AAV CBr-B7.4, AAV CBr-E1, AAV CBr-E2, AAV CBr-E3, AAV CBr-E4, AAV CBr-E5, AAV CBr-e5, AAV CBr-E6, AAV CBr-E7, AAV CBr- E8, AAV CHt-1, AAV CHt-2, AAV CHt-3, AAV CHt-6.1, AAV CHt-6.10, AAV CHt-6.5, AAV CHt-6.6, AAV CHt-6.7, AAV CHt-6.8, AAV CHt-P1, AAV CHt-P2, AAV CHt-P5, AAV CHt-P6, AAV CHt-P8, AAV CHt-P9, AAV CKd-1, AAV CKd-10, AAV CKd-2, AAV CKd-3, AAV CKd-4, AAV CKd-6, AAV CKd-7, AAV CKd-8, AAV CKd-B1, AAV CKd-B2, AAV CKd-B3, AAV CKd-B4, AAV CKd-B5, AAV CKd-B6, AAV CKd-B7, AAV CKd-B8, AAV CKd-H1, AAV CKd-H2, AAV CKd-H3, AAV CKd-H4, AAV CKd-H5, AAV CKd-H6, AAV CKd-N3, AAV CKd-N4, AAV CKd-N9, AAV CLg-F1, AAV CLg-F2, AAV CLg-F3, AAV CLg-F4, AAV CLg-F5, AAV CLg-F6, AAV CLg-F7, AAV CLg-F8, AAV CLv-1, AAV CLv1- 1, AAV Clv1-10, AAV CLv1-2, AAV CLv-12, AAV CLv1-3, AAV CLv-13, AAV CLv1-4, AAV Clv1-7, AAV Clv1-8, AAV Clv1-9, AAV CLv-2, AAV CLv-3, AAV CLv-4, AAV CLv-6, AAV CLv-8, AAV CLv-D1, AAV CLv-D2, AAV CLv-D3, AAV CLv-D4, AAV CLv-D5, AAV CLv-D6, AAV CLv-D7, AAV CLv-D8, AAV CLv-E1, AAV CLv-K1, AAV CLv-K3, AAV CLv-K6, AAV CLv-L4, AAV CLv-L5, AAV CLv-L6, AAV CLv-M1, AAV CLv-M11, AAV CLv-M2, AAV CLv-M5, AAV CLv-M6, AAV CLv-M7, AAV CLv-M8, AAV CLv-M9, AAV CLv-R1, AAV CLv-R2, AAV CLv-R3, AAV CLv-R4, AAV CLv-R5, AAV CLv-R6, AAV CLv-R7, AAV CLv-R8, AAV CLv-R9, AAV CSp-1, AAV CSp-10, AAV CSp-11, AAV CSp-2, AAV CSp-3, AAV CSp-4, AAV CSp-6, AAV CSp-7, AAV CSp-8, AAV CSp-8.10, AAV CSp-8.2, AAV CSp-8.4, AAV CSp-8.5, AAV CSp-8.6, AAV CSp-8.7, AAV CSp-8.8, AAV CSp-8.9, AAV CSp-9, AAV.hu.48R3, AAV.VR-355, AAV3B, AAV4, AAV5, AAVF1/HSC1, AAVF11/HSC11, AAVF12/HSC12, AAVF13/HSC13, AAVF14/HSC14, AAVF15/HSC15, AAVF16/HSC16, AAVF17/HSC17, AAVF2/HSC2, AAVF3/HSC3, AAVF4/HSC4, AAVF5/HSC5, AAVF6/HSC6, AAVF7/HSC7, AAVF8/HSC8, AAVF9/HSC9, AAV-PHP.B(PHP.B), AAV-PHP.A(PHP.A), G2B-26, G2B-13, TH1.1-32 및/또는 TH1.1-35, 및 이의 변이체를 이용하거나 이를 기반으로 할 수 있다. AAV 벡터는 US 9,585,971, US 2017/0166926, 및 WO2020/160337에 추가로 기재되어 있으며, 이들은 그 전체가 본원에 참조로 포함되어 있다.
일부 구현예에서, 본원에 개시된 MiniShank3은 AAV 벡터에 의해 전달된다. 일부 구현예에서, AAV 벡터는 이식유전자 및 이의 조절 서열, 및 선택적으로 5' 및 3' ITR을 포함한다. 일부 구현예에서, 이식유전자 및 그의 조절 서열은 5' 및 3' ITR 서열에 측접된다. 이식유전자는 본원에 개시된 바와 같이 MiniShank3을 코딩하는 하나 이상의 영역을 포함할 수 있다. 이식유전자는 또한 또 다른 단백질을 코딩하는 영역을 포함할 수 있다. 이식유전자는 또한 하나 이상의 발현 제어 서열(예컨대, 폴리-A 테일)을 포함할 수 있다. 일부 구현예에서, AAV 벡터는 적어도 AAV ITR 및 MiniShank3 이식유전자를 포함한다.
일부 구현예에서, AAV는 AAV 입자로 패키징되고 대상체에게 투여되고/되거나 선택된 표적 세포로 전달될 수 있다. 일부 구현예에서, AAV 입자는 AAV 캡시드 단백질을 포함한다. 일부 구현예에서, AAV 입자는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV6.2, AAV7, AAV8, AAV9, PHB.eB, AAV.rh8, AAV.rh10, AAV.rh39, AAV.43, AAV2/2-66, AAV2/2-84, 및 AAV2/2-125, 또는 전술한 것 중 임의의 것의 변이체를 포함하는 본원에 개시된 바와 같은 AAV 혈청형으로부터 선택된 적어도 하나의 캡시드 단백질을 포함한다.
일부 구현예에서, AAV 벡터 내의 miniShank3 이식유전자 코딩 서열은 조직 특이적 유전자 발현을 위한 조절 서열에 작동가능하게 연결된다. 일부 경우, 조직 특이적 조절 서열은 조직 특이적 방식으로 전사를 유도하는 조직 특이적 전사 인자에 결합한다. 그러한 조직 특이적 조절 서열(예컨대, 프로모터, 인핸서 등)은 당업계에 잘 알려져 있다. 일부 구현예에서, 조직 특이적 조절 서열은 Syn 프로모터(예컨대, hSyn1)일 수 있다. 일부 구현예에서, 조직 특이적 조절 서열은 뉴런 특이적이며 본원에 기재된 치료에 적합한 임의의 프로모터 또는 인핸서일 수 있다.
일부 구현예에서, AAV 벡터에서 서열번호: 2 또는 4를 포함하는 miniShank3 이식유전자 코딩 서열은 프로모터에 작동 가능하게 연결되고, AAV ITR에 의해 측접된다. 일부 구현예에서, AAV 벡터에서 서열번호: 1 또는 3을 포함하는 miniShank3 이식유전자 코딩 서열은 프로모터에 작동가능하게 연결되고, AAV ITR에 의해 측접된다.
본 개시내용의 양태은 miniShank3 이식유전자를 발현하는 AAV 벡터에 관한 것이다. 일부 구현예에서, miniShank3 이식유전자는 AAV ITR에 의해 측접된다. 일부 구현예에서, AAV ITR은 AAV2 ITR을 포함한다. 일부 구현예에서, AAV ITR은 AAV1 ITR을 포함한다. 일부 구현예에서, AAV ITR은 AAV5 ITR을 포함한다. 일부 구현예에서, AAV ITR은 AAV6 ITR을 포함한다. 일부 구현예에서, AAV ITR은 AAV8 ITR을 포함한다. 일부 구현예에서, AAV ITR은 AAV9 ITR을 포함한다. 일부 구현예에서, AAV ITR은 rh10 ITR을 포함한다. 일부 구현예에서, AAV ITR은 자기 상보적 ITR을 포함할 수 있다.
본원에 기재된 AAV 벡터는 MiniShank3과 같은 이식유전자, 5' 및/또는 3' ITR, 프로모터, 인트론, 및/또는 당업계에 공지된 다른 관련 조절 요소를 포함하는 DNA 작제물을 포함할 수 있는 것으로 이해되어야 한다.
일부 구현예에서, AAV 벡터는 miniShank3 이식유전자 발현을 향상시킬 수 있는 우드척 간염 바이러스 전사후 조절 요소(Woodchuck Hepatitis Virus Posttranscriptional Regulatory Element, WPRE)를 포함한다. 일부 구현예에서, AAV 벡터는 미번역 부분, 예컨대 인트론 또는 5' 또는 3' 미번역 영역을 포함한다. 일부 구현예에서, 인트론은 프로모터/인핸서 서열 및 miniShank3 이식유전자 사이에 위치할 수 있다.
일부 구현예에서, 본원에서 사용되는 AAV 벡터는 자기 상보적 벡터일 수 있다.
도 15는 인간 시냅신 1(hSyn1) 프로모터의 제어 하에 발현되는 인간 miniShank3 이식유전자를 포함하는 AAV 벡터의 예(도 15에서 "AAV-hSyn1-HumanMiniShank3-V1"으로 지칭됨)를 보여준다. 도 15에 나타낸 AAV 벡터는 표 1에서 서열번호: 21로 제공된 서열을 포함한다.
도 15에 나타낸 바와 같이, 서열번호: 21은 인간 Mini-Shank3 유전자, 5'-ITR, 3'-ITR, WPRE, hGH polyA, F1 원점, NeoR/KanR 마커, hSyn1 프로모터, 및 PUC 원점을 포함한다. 일부 구현예에서, 역위 말단 반복(ITR) 서열은 각각 약 145개의 뉴클레오타이드를 포함한다. 이러한 요소는 효과적인 복제 및 캡슐화를 위해 cis에서 유용할 수 있다. 당업자는 당업계에 공지된 AAV 벡터의 임의의 요소가 본 개시내용의 양태와 양립할 수 있음을 인식할 것이다. 당업자는 또한 기능적 MiniShank3 단백질을 코딩하는 본원에 기재된 임의의 폴리뉴클레오타이드 서열이 AAV 전달을 위해 도 15에 나타낸 것과 유사한 DNA 작제물에서 발현될 수 있음을 인식할 것이다. 이들 DNA 작제물은 도 15에 나타낸 요소 중 하나 이상을 포함할 수 있다. 예를 들어, 일부 구현예에서, 서열번호: 1-4 중 어느 하나에 대해 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일성을 포함하는 코딩 서열은 도 15에 나타낸 것과 같은 DNA 작제물에서 발현된다. 일부 구현예에서 서열번호: 1-4 중 어느 하나의 서열을 포함하는 코딩 서열은 도 15에 나타낸 것과 같은 DNA 작제물에서 발현된다. 일부 구현예에서, DNA 작제물은 도 15에 나타낸 요소, 예컨대 프로모터, 5'-ITR, 3'-ITR, WPRE, hGH polyA, F1 원점, NeoR/KanR 마커 및/또는 PUC 원점 중 하나 이상을 포함한다.
일부 구현예에서, 본 개시내용과 관련된 AAV 벡터는 그 사이의 모든 값을 포함하여 서열번호: 21의 서열에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 포함하거나 100% 동일한 MiniShank3 단백질을 코딩하는 핵산 서열을 포함한다. 일부 구현예에서, AAV 벡터는 서열번호: 18의 서열을 포함하는 MiniShank3 단백질을 코딩하는 서열번호: 21에 상응하는 서열을 포함한다.
일부 구현예에서, 그 사이의 모든 값을 포함하여 서열번호: 21의 서열에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일하고 서열번호: 18의 서열을 포함하는 MiniShank3 단백질을 코딩하는 서열을 포함하는 AAV 벡터는 이를 필요로 하는 인간 대상체에게 전달할 수 있고, 신경발달 장애를 가진 인간 대상체를 치료하는 데 적합할 수 있다.
당업자가 이해할 수 있는 바와 같이, 임상 사용을 위해 AAV 벡터를 설계하고 AAV 벡터를 전달하기 위한 당업계에 공지된 임의의 방법은 본 개시내용의 양태과 양립가능할 수 있다. 예를 들어, AAV 벡터 및 전달과 관련된 개시내용의 비제한적 예는 "Adeno-associated virus (AAV) clades, sequences, vectors containing same, and uses therefor"라는 명칭의 미국 특허 7,906,111 및 "AAV-vectors for use in gene therapy of choroideremia"라는 명칭의 미국 특허 9,834,788에 제공되며 참조로 포함되고, 이들 각각은 그 전체가 본원에 참고로 포함되어 있다.
일부 구현예에서, 본 개시내용과 관련된 AAV 벡터는 그 사이의 모든 값을 포함하여 표 1에 제공된 서열번호: 7 또는 21의 서열에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일한 AAV 전달을 위한 MiniShank3 단백질을 코딩하는 서열을 포함한다. 서열번호: 7은 서열번호: 11의 단백질 서열을 코딩한다. 서열번호: 8은 서열번호: 12의 단백질 서열을 코딩한다. 서열번호: 10은 서열번호: 14의 단백질 서열을 코딩한다. 서열번호: 21은 서열번호: 18의 단백질 서열을 코딩한다.
일부 구현예에서, AAV 전달을 위한 MiniShank3 단백질을 코딩하는 AAV 벡터는 표 1에 제공된 서열번호: 11 또는 17-20 중 어느 하나에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 동일성을 포함하거나 100% 동일한 서열을 갖는 단백질을 코딩한다.
일부 구현예에서, 본원에 개시된 바와 같은 miniShank3을 전달하기 위해 사용되는 벡터는 렌티바이러스 벡터일 수 있다. 일부 구현예에서, 본원에 개시된 바와 같은 miniShank3을 전달하기 위해 사용되는 벡터는 아데노바이러스 벡터일 수 있다.
일부 구현예에서, 본원에 개시된 벡터 작제물은 표 1에 나타낸 바와 같은 서열번호: 21을 포함할 수 있다.
일부 구현예에서, Shank3 단백질의 폴리뉴클레오타이드를 포함하는 벡터(즉, miniShank3 DNA 작제물)는 관심있는 특정 조직 또는 세포에서 발현될 수 있다. 일부 구현예에서, 본원에 개시된 벡터는 프로모터를 포함한다. 일부 구현예에서, 벡터는 세포 유형 특이적 프로모터를 포함한다. 일부 구현예에서, 프로모터는 인간 프로모터이다. 일부 구현예에서, 인간 프로모터는 인간 시냅신 1(hSyn1)이다. 일부 구현예에서, hSyn1 프로모터는 서열번호: 22에 상응하는 폴리뉴클레오타이드 서열을 갖는다. 일부 구현예에서, 인간 프로모터는 당업계에 공지되고 miniShank3의 제작에 적합한 임의의 프로모터일 수 있다. 일부 구현예에서, 인간 프로모터는 뉴런 조직 및 세포에 대해 높은 특이성을 갖는 임의의 프로모터일 수 있다. 일부 구현예에서, 프로모터는 구성적 프로모터일 수 있다. 예를 들어, 구성적 프로모터는 CAG 프로모터일 수 있다. 당업자가 이해할 수 있는 바와 같이, 선택된 프로모터가 본 개시내용의 양태와 양립가능한 한 임의의 프로모터가 사용될 수 있다.
조성물 및 투여
본 개시내용은 본원에 개시된 바와 같은 AAV 벡터에서 전달된 폴리뉴클레오타이드(예컨대, miniShank3) 및 약제학적으로 허용가능한 담체를 포함하는 약제학적 조성물을 포함하는 조성물을 제공한다.
본 개시내용의 조성물은 AAV 단독, 또는 하나 이상의 다른 바이러스와 조합된 AAV를 포함할 수 있다. 일부 구현예에서, 조성물은 각각 하나 이상의 상이한 Shank 단백질을 갖는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개, 또는 그 초과의 상이한 AAV를 포함한다.
적합한 담체는 AAV가 지시된 조치에 비추어 당업자에 의해 쉽게 선택될 수 있다. 예를 들어, 하나의 적합한 담체는 다양한 완충 용액(예컨대, 인산염 완충 식염수)으로 제제화될 수 있는 식염수를 포함한다. 다른 예시적인 담체는 멸균 식염수, 락토스, 수크로스, 인산칼슘, 젤라틴, 덱스트란, 한천, 펙틴, 땅콩유, 참기름 및 물을 포함한다. 담체의 선택은 본 개시내용의 제한이 아니다. AAV 벡터를 포함하는 약제학적 조성물은 US 9,585,971 및 US 2017/0166926에 추가로 기재되어 있으며, 이들은 그 전체가 참조로 본원에 포함되어 있다.
본원에 사용된 바와 같이, "담체"는 임의의 및 모든 용매, 분산 매질, 비히클, 코팅, 희석제, 항균제 및 항진균제, 등장성 및 흡수 지연제, 완충제, 담체 용액, 현탁액, 콜로이드 등을 포함한다. 약제학적 활성 물질에 대한 이러한 매질 및 제제의 사용은 당업계에 잘 알려져 있다. 보충 활성 성분이 또한 조성물에 혼입될 수 있다. 문구 "약제학적으로 허용가능한"은 숙주에 투여될 때 알레르기 또는 유사한 원치 않는 반응을 일으키지 않는 분자 엔티티 및 조성물을 지칭한다.
전달 비히클, 예컨대 리포좀, 나노캡슐, 미세입자, 미소구체, 지질 입자, 소포 등은 본 개시내용의 조성물을 적합한 숙주 세포로 도입하기 위해 사용될 수 있다. 특히, AAV 벡터 전달된 이식유전자는 지질 입자, 리포좀, 소포, 나노구체 또는 나노입자 등에 캡슐화된 전달을 위해 제제화될 수 있다.
이러한 제제는 본원에 개시된 핵산 또는 AAV 작제물의 약제학적으로 허용가능한 제제의 도입에 바람직할 수 있다. 리포좀의 형성 및 사용은 일반적으로 당업자에게 공지되어 있다. 최근에는, 혈청 안정성과 순환 반감기가 개선된 리포좀이 개발되었다(미국 특허 5,741,516). 또한, 잠재적인 약물 담체로서 리포좀 및 리포좀 유사 제제의 다양한 방법이 기재되었다(US 특허 5,567,434; 5,552,157; 5,565,213; 5,738,868 및 5,795,587).
리포좀은 수성 매질에 분산되어 자발적으로 다중층 동심원 이중층 소포(다층 소포(MLV)라고도 함)를 형성하는 인지질로부터 형성된다. MLV는 일반적으로 25 nm 내지 4 μm의 직경을 갖는다. MLV의 초음파 처리는 코어에 수용액을 함유하는, 200~500 Å 범위의 직경을 갖는 작은 단층 소포(SUV)의 형성을 초래한다.
대안적으로, AAV 벡터의 나노캡슐 제제가 사용될 수 있다. 나노캡슐은 일반적으로 안정적이고 재현가능한 방식으로 물질을 포획할 수 있다. 세포내 고분자 과부하로 인한 부작용을 피하기 위해, 이러한 초미세 입자(약 0.1 μm 크기)는 생체내에서 분해될 수 있는 고분자를 사용하여 설계되어야 한다. 이러한 요구사항을 충족하는 생분해성 폴리알킬-시아노아크릴레이트 나노입자가 사용을 위해 고려된다.
일부 구현예에서, AAV 벡터에서 전달되는 핵산을 포함하는 약제학적 조성물은 다른 약제학적 성분, 예컨대 보존제, 또는 화학적 안정제를 포함한다. 적합한 예시적인 방부제는 클로로부탄올, 소르브산칼륨, 소르브산, 이산화황, 프로필 갈레이트, 파라벤, 에틸 바닐린, 글리세린, 페놀, 티메로살, 및 파라클로로페놀을 포함한다. 적합한 화학적 안정제는 젤라틴 및 알부민을 포함한다. 많은 경우에, 등장화제, 예를 들어 당 또는 염화나트륨을 포함하는 것이 바람직할 것이다. 약제학적 조성물의 연장된 흡수는 흡수를 지연시키는 제제, 예를 들어 알루미늄 모노스테아레이트 및 젤라틴을 조성물에 사용함으로써 야기될 수 있다.
AAV 벡터를 전달하기에 적합한 약제학적 형태는 멸균 주사액 또는 분산액의 즉석 제조를 위한 멸균 수용액 또는 분산액 및 멸균 분말을 포함한다. 분산액은 또한 글리세롤, 액체 폴리에틸렌 글리콜, 및 이들의 혼합물 및 오일에서 제조될 수 있다. 일반적인 보관 및 사용 조건 하에서, 이들 제제는 미생물의 성장을 방지하기 위한 보존제를 함유한다. 많은 경우에, 상기 형태는 쉽게 주사할 수 있을 정도로 무균 상태이고 유동적이다. 그것은 제조 및 보관 조건 하에 안정해야 하며 박테리아 및 곰팡이와 같은 미생물의 오염 작용에 대해 보존되어야 한다.
본원에 기재된 방법은 원하는 조직(예를 들어, 뇌)의 세포를 형질감염시키고 과도한 부작용 없이 충분한 수준의 유전자 전달 및 발현을 제공하기에 충분한 양으로 AAV 벡터를 투여하는 단계를 포함한다. 통상적이고 약제학적으로 허용가능한 투여 경로는 비제한적으로 선택된 기관으로의 직접 전달, 경구, 흡입, 안구내, 안면 정맥 주사 및 안와후 주사를 포함하는 정맥내, 뇌실내(ICV), 근육내, 척수강내, 두개내, 피하, 피내, 종양내, 및 기타 비경구 투여 경로를 포함한다. 투여 경로는 원하는 경우 조합될 수 있다. 일부 구현예에서, 본원에 개시된 바와 같은 벡터는 정맥내로 투여된다.
일부 구현예에서, 본 개시내용은 신경발달 장애를 갖는 대상체를 치료하는 방법을 제공한다. 일부 구현예에서, 본 개시내용은 자폐 스펙트럼 장애(ASD)를 갖는 대상체를 치료하는 방법을 제공한다. 일부 구현예에서, 본 개시내용은 펠란-맥더미드 증후군을 갖는 대상체를 치료하는 방법을 제공한다. 본원에 제공된 방법은, 일부 구현예에서 Shank3 단백질(예컨대, miniShank3)을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 조성물의 유효량을 대상체의 표적 환경 또는 조직에 투여하고 전달하는 단계를 포함한다. 일부 구현예에서, 표적 조직은 피질이다. 일부 구현예에서, 표적 조직은 선조체이다. 일부 구현예에서, 표적 조직은 시상 소뇌이다. 일부 구현예에서, 표적 조직은 해마이다. 일부 구현예에서, 표적 조직은 임의의 뇌 구조이다. 일부 구현예에서, Shank3 단백질(예컨대, miniShank3)을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 조성물의 유효량을 표적 환경 또는 조직에 투여하고 전달하는 방법은 조성물을 뉴런 또는 다른 뇌 세포 유형에 전달하는 단계를 포함한다. 일부 구현예에서, 벡터는 AAV 벡터이다. 일부 구현예에서, 이를 필요로 하는 대상체의 표적 환경 또는 조직에 핵산을 전달하기 위한 방법은 대상체의 표적 환경 또는 조직에 전달될 적어도 핵산(예컨대, miniShank3)을 포함하는 AAV 벡터를 포함하는 조성물을 제공하는 단계 및 조성물을 대상체에게 투여하는 단계를 포함한다. AAV 벡터의 사용 방법은 US 9,585,971, US 2017/0166926, 및 WO2020/160337에 추가로 기재되어 있으며, 이들은 그 전체가 본원에 참조로 포함된다. 일부 구현예에서, 조성물은 캡시드 단백질을 포함할 수 있다.
일부 구현예에서, Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 조성물은 정맥내 투여, 전신 투여, 뇌실내 투여, 자궁내 투여, 척수강내 투여, 안와후 주사 또는 안면 정맥 주사를 통해 대상체에게 전달된다. 일부 구현예에서, 자궁내 투여는 발달의 출생전 단계에 있는 대상체에게 사용된다. 일부 구현예에서, 조성물은 나노입자를 통해 대상체에게 전달된다. 일부 구현예에서, 조성물은 바이러스 벡터를 통해 대상체에게 전달된다. 일부 구현예에서, 조성물은 핵산 물질을 전달하기에 적합한 임의의 담체를 통해 대상체에게 전달된다.
대상체에게 일부 유용하거나 이익이 될 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 포함하는 임의의 조성물은 본원에 개시된 방법에 따라 대상체의 표적 환경 또는 조직으로 전달될 수 있다
상기 기재된 전달 방법 외에도, AAV 조성물을 숙주에 전달하는 대안적인 방법으로서 하기 기술이 또한 고려된다. 초음파 치료(즉, 초음파)가 사용되었고, 순환계 내로 및 이를 통한 약물 침투의 속도 및 효능을 향상시키기 위한 장치로서 US 5,656,016에 기재되었다. 고려되는 다른 약물 전달 대안은 골내 주사(미국 특허 5,779,708), 마이크로칩 장치(미국 특허 5,797,898), 안과용 제제(Bourlais et al., 1998), 경피 매트릭스(미국 특허 5,770,219 및 5,783,208) 및 피드백 제어 전달(미국 특허 5,697,899)이다.
특정 "치료 효과"를 달성하는 데 필요한 Shank3 단백질(예컨대, miniShank3)을 코딩하는 폴리뉴클레오타이드를 포함하는 AAV의 용량, 예컨대 절대 벡터 게놈(vg) 또는 약제학적 용액의 밀리리터당 벡터 게놈(vg/mL)의 용량 단위는, 비제한적으로 AAV 투여 경로, 치료 효과를 달성하는 데 필요한 유전자 발현의 수준, 치료될 특정 질환 또는 장애, 및 유전자 산물의 안정성을 포함하는 여러 인자에 따라 달라질 수 있다. 신경발달에 영향을 미치지 않으면서 감염의 최대 백분율을 제공하는 용량도 적합하다. 당업자는 전술한 인자뿐만 아니라 다른 인자에 기초하여 특정 질환 또는 장애를 갖는 환자를 치료하기 위한 AAV 용량 범위를 쉽게 결정할 수 있다.
AAV 벡터의 유효량은 동물 또는 인간 대상체를 감염시키거나 원하는 조직을 표적으로 하기에 충분한 양이다. 유효량은 주로 대상체의 종, 연령, 성별, 체중, 건강, 및 표적화될 조직과 같은 인자에 따라 달라질 것이며, 이는 따라서 대상체와 조직 간에 다를 수 있다. 대상체에게 투여하기 위한 조성물 또는 용량의 맥락에서 용어 "유효량"은 대상체에서 하나 이상의 원하는 반응을 생성하는 조성물의 양 또는 용량을 지칭한다. 일부 구현예에서, 본원에 개시된 조성물의 유효량은 돌연변이된 Shank3 유전자의 효과를 부분적으로 또는 완전히 구제하고/하거나 Shank3 단백질의 기능 손실을 부분적으로 또는 완전히 회복할 수 있다. 유효량은 바람직하지 않은 반응의 수준을 감소시키는 것을 포함할 수 있지만, 일부 구현예에서 그것은 바람직하지 않은 반응을 모두 방지하는 것을 포함한다. 유효량은 또한 바람직하지 않은 반응의 발생을 지연시키는 것을 포함할 수 있다. 유효량은 또한 원하는 치료 종점 또는 원하는 치료 결과를 생성하는 양일 수 있다. 다른 구현예에서, 유효량은 치료 종점 또는 결과와 같은 원하는 반응의 수준을 향상시키는 것을 포함할 수 있다. 상기 중 어느 것의 달성은 통상적인 방법 및 본 출원에 개시된 방법에 의해 모니터링될 수 있다. 유효량은 물론 치료되는 특정 대상체; 병태의 중증도; 연령, 신체 상태, 체격 및 체중을 포함하는 개별 환자 매개변수; 치료 지속기간; 동시 요법의 특성(있는 경우); 특정 투여 경로 및 유사 인자에 따라 달라질 것이다.
예를 들어, 일부 구현예에서, 개체에 투여된 벡터 게놈의 수는 약 6.0x1011 vg 내지 약 9.0x1013 vg 사이의 임의의 값이다. 일부 구현예에서, 대상체에게 투여되는 벡터 게놈의 수는 약 6.0 x1013 vg/mL 내지 약 9.0 x1013 vg 사이의 임의의 값이다. 일부 구현예에서, 대상체에게 투여된 벡터 게놈의 수는 약 1x1010 내지 약 1x1012 vg 사이의 임의의 값이다. 특정 구현예에서, AAV의 유효량은 kg당 1010, 1011, 1012, 1013, 또는 1014 게놈 카피이다. 특정 구현예에서, AAV의 유효량은 대상체당1010, 1011, 1012, 1013, 1014, 또는 1015 게놈 카피이다. 일부 경우에, 약 1011 내지 1013 AAV 게놈 카피 사이의 투여량이 적절하다. 일부 구현예에서, 대상체에게 투여된 벡터 게놈의 수는 본원에 개시된 치료 및 방법에 적합한 임의의 용량일 수 있다.
일부 구현예에서, AAV의 용량은 역일(예컨대, 24시간 기간)당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 2, 3, 4, 5, 6 또는 7 역일당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 역주(예컨대, 7 역일)당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 격주(예컨대, 2 역주 기간에 1회) 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 역월당 1회(예컨대, 30일에 1회) 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 6 역월당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 역년(예컨대, 365일 또는 윤년의 366일)당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, rAAV의 용량은 2역년(예컨대, 730일 또는 윤년의 731일)당 1회 이하로 대상체에게 투여된다. 일부 구현예에서, AAV의 용량은 3역년(예컨대, 1095일 또는 윤년의 1096일)당 1회 이하로 대상체에게 투여된다.
본원에 개시된 약제학적으로 허용가능한 부형제 및 담체 용액의 제제는 다양한 치료 요법에서 본원에 기재된 특정 조성물을 사용하기 위한 적합한 투여량 및 치료 요법의 개발과 마찬가지로 당업자에게 잘 알려져 있다. 전형적으로, 이들 제제는 적어도 약 0.1%의 활성 화합물 또는 그 이상을 함유할 수 있지만, 활성 성분(들)의 백분율은 물론 달라질 수 있고 편리하게는 총 제제의 중량 또는 부피의 약 1 또는 2% 및 약 70% 또는 80% 이상 사이일 수 있다. 당연히, 각각의 치료학적으로 유용한 조성물에서 활성 화합물의 양은 화합물의 임의의 주어진 단위 용량에서 적합한 투여량이 얻어지는 방식으로 제조될 수 있다. 용해도, 생체이용률, 생물학적 반감기, 투여 경로, 제품 유효 기간뿐만 아니라 기타 약리학적 고려 사항과 같은 인자가 이러한 약제학적 제제를 제조하는 당업자에 의해 고려될 것이며, 이와 같이 다양한 투여량 및 치료 요법이 바람직할 수 있다.
Shank 단백질 네트워크와 관련된 단백질의 발현
본원에 제공된 방법 및 조성물은, 일부 구현예에서 예를 들어 자폐 스펙트럼 장애(ASD) 또는 펠란-맥더미드 증후군과 같은 신경발달 장애를 치료하는 데 유용하다. 본 개시내용의 발명자들은 마우스 모델에서 AAV 벡터와 같은 바이러스 벡터를 통한 miniShank3의 전달이 시냅스후 밀도(PSD) 단백질의 기능성을 회복시키는 데 효과적임을 발견하였다. 일부 구현예에서, PSD 단백질의 발현 수준은 miniShank3 투여의 효능을 평가하는 데 사용된다. 일부 구현예에서, PSD 단백질은 호머이다. 일부 구현예에서, PSD 단백질은 시냅스후 밀도 단백질 95(PSD95)이다. 일부 구현예에서, PSD 단백질은 SynGap1이다. 일부 구현예에서, PSD 단백질은 SAPAP3이다. 일부 구현예에서, PSD 단백질은 NR1이다. 일부 구현예에서, PSD 단백질은 NR2B이다. 일부 구현예에서, PSD 단백질은 GluR2이다. 일부 구현예에서, PSD 단백질은 miniShank3 치료시 개선되거나 회복될 수 있는 임의의 단백질이다.
일부 구현예에서, 처리되지 않은 대조군 대상체와 비교하여 임의의 PSD 단백질의 증가는 miniShank3의 효능을 나타낼 수 있다. 유전자 발현 및 단백질 수준을 검출하는 방법은 당업계에 잘 알려져 있다.
일부 구현예에서, miniShank3으로 치료된 후 대상체에서 호머의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 시냅스후 단백질(PSD95)의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 SynGap1의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 SAPAP3의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 NR1의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 NR2B의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배 또는 적어도 1000배까지 증가된다. 일부 구현예에서, miniShank3으로 치료된 후 대상체에서 GluR2의 발현은 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배 또는 적어도 1000배까지 증가된다.
일부 구현예에서, MiniShank3 또는 MiniShank3을 포함하는 조성물의 투여는 수면 효율을 개선할 수 있다. 일부 구현예에서, 대상체는 MiniShank3 단백질과 같은 Shank 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 발현 작제물을 포함하는 조성물의 유효량을 투여받은 후 개선된 수면 효율을 갖는다. 일부 구현예에서, 조성물의 유효량을 투여한 후 대상체의 수면 효율은 대조군 대상체와 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 증가된다. 개선된 수면 효율은 적은 수면 장애를 포함하며, 이는 비제한적으로 잠들기 어려움 및 잠자는 상태를 유지하기 어려움을 갖는 것을 포함한다. 수면 효율의 측정은 당업계에 공지된 임의의 방법을 사용하여 수행될 수 있다.
일부 구현예에서, MiniShank3 또는 MiniShank3을 포함하는 조성물의 투여는 사회적 장애를 개선할 수 있다. 일부 구현예에서, MiniShank3 단백질과 같은 Shank 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 발현 작제물을 포함하는 조성물의 유효량이 투여된 후 대상체의 사회적 장애가 개선된다. 일부 구현예에서, 조성물의 유효량을 투여한 후 대상체의 사회적 장애는 대조군 대상체와 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 감소된다. 사회적 장애의 측정은 당업계에 공지된 임의의 방법을 사용하여 수행될 수 있다.
본원에 사용된 바와 같이, "사회적 장애"는 대상체가 자발적인 사회적 상호작용을 나타내지 못하게 하는 행동 이상 또는 결함을 지칭한다.
일부 구현예에서, MiniShank3 또는 MiniShank3을 포함하는 조성물의 투여는 보행 및/또는 운동 협응 결손을 개선할 수 있다. 일부 구현예에서, MiniShank3 단백질과 같은 Shank 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 발현 작제물을 포함하는 조성물의 유효량을 투여한 후에 대상체의 보행 및/또는 운동 협응 결손이 개선된다. 일부 구현예에서, 조성물의 유효량을 투여한 후 대상체의 보행 및/또는 운동 협응 결손은 대조군 대상체와 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 감소된다. 보행 및/또는 운동 협응 결손의 측정은 당업계에 공지된 임의의 방법을 사용하여 수행될 수 있다.
본원에 사용된 바와 같이, "보행 및/또는 운동 협응 결손"은, 예를 들어 협응 부족, 균형 상실, 및/또는 질질 끄는 걸음걸이를 포함할 수 있다.
일부 구현예에서, MiniShank3 또는 MiniShank3을 포함하는 조성물의 투여는 피질-선조체 시냅스 기능장애를 개선할 수 있다. 일부 구현예에서, MiniShank3 단백질과 같은 Shank 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 발현 작제물을 포함하는 조성물의 유효량을 투여한 후에 대상체의 피질-선조체 시냅스 기능장애가 개선된다. 일부 구현예에서, 조성물의 유효량을 투여한 후 대상체의 피질-선조체 시냅스 기능장애는 대상체 대조군과 비교하여 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 또는 적어도 2배, 적어도 5배, 적어도 10배, 적어도 20배, 적어도 50배, 적어도 100배, 또는 적어도 1000배까지 감소된다. 피질-선조체 시냅스 기능장애의 측정은 당업계에 공지된 임의의 방법을 사용하여 수행될 수 있다.
본원에 사용된 바와 같이, "피질-선조체 시냅스 기능장애"는 반복적 및 강박 행동, 예컨대 신경정신병적 장애 및 신경발달 질환, 예컨대 자폐증, 강박 장애, 및 투렛 증후군을 유발할 수 있는 뇌에서의 결함있는 피질선조체 회로를 지칭한다.
본원에 기재된 기술의 일부 양태는 하기 실시예 섹션에 기재된 비제한적인 예시적인 구현예에 기초하여 추가로 이해될 수 있다. 하기 실시예 섹션에 기재된 구현예의 임의의 제한은 하기 실시예 섹션에 기재된 구현예의 제한일 뿐이며 본원에 기재된 임의의 다른 구현예의 제한이 아니다.
실시예
본원에 기재된 본 발명이 보다 완전히 이해될 수 있도록, 하기 실시예가 제시된다. 본 출원에 기재된 실시예는 본원에 제공된 시스템 및 방법을 예시하기 위해 제공되며 어떤 식으로든 그 범위를 제한하는 것으로 해석되지 않아야 한다.
실시예 1: Shank3 돌연변이를 갖는 마우스 모델은 시냅스 결함 및 행동 이상을 나타내었다
Shank3 유전자의 돌연변이가 뇌 발달, 신경 구조, 시냅스 및 회로 기능, 및 행동에 얼마나 영향을 미치는지 연구하기 위해 Shank3 LoF 돌연변이를 갖는 다수의 마우스 및 원숭이 모델이 이전에 개발되었다. 이들 모델은 잠재적인 치료제를 시험하기 위한 기초 역할을 한다.
Shank3 돌연변이체 마우스의 2개의 상이한 대립유전자를 생성하였다: Shank3A 및 Shank3B. Shank3A 돌연변이체 마우스에서, 안키린 반복을 코딩하는 유전자의 일부가 표적화되어, 가장 긴 Shank3 이소형인 Shank3α의 완전한 제거를 초래하였다. 그러나, 다른 2개의 이소형은 영향을 받지 않았다(본원에서 Shank3β 및 Shank3γ로 명명됨). Shank3B 돌연변이체에서, PDZ 도메인이 표적화되어, Shank3α 및 Shank3β 이소형 모두의 완전한 제거 및 추정되는 Shank3γ의 유의한 감소를 야기하였다. 추가 분석은 주로 Shank3B 돌연변이체 마우스에 집중되었다.
Shank3B-/- 마우스는 조직학적 분석을 통해 전체적인 뇌 이상을 나타내지 않았다. 그러나, 3-6개월령에, Shank3B-/- 마우스는 뚜렷한 피부 병변을 발생하였다. 병변은 이유기에 격리된 동물에서 존재하였기 때문에 자초한 것이었고, Shank3B-/- 마우스와 함께 태어날 때부터 수용된 야생형(WT) 마우스에서 병변이 발견되지 않았기 때문에 과도한 서로 핥아주기(allogrooming)로 인한 것은 아니었다. 24시간 비디오 촬영은 병변 전 Shank3B-/- 마우스가 WT 대조군과 비교하여 그루밍에 소모한 시간의 증가를 나타내었음을 밝혀내었고(도 1a-1b), 이는 Shank3B-/- 마우스가 과도한 그루밍 및 자해 행동을 가지고 있었음을 나타낸다. 결론적으로, Shank3B 돌연변이체 마우스는 피부 병변을 유발하는 반복적이고 강박적인 그루밍을 나타내었다.
Shank3 돌연변이체가 사회적 행동에 미치는 영향을 연구하기 위해, 3-챔버 사회적 영역을 사용하여 동물을 이들의 사회적 상호작용의 자발적인 개시 및 사회적 새로움을 구별하는 능력에 대해 조사하였다. 초기에는, 실험 동물을 와이어 케이지 또는 동일하지만 빈 와이어 케이지("빈 케이지") 안에 있는 파트너("스트레인저 1")와 사회적 접촉을 탐색하고 개시하도록 두었다. Shank3B-/- 마우스는 사회적 파트너보다는 빈 케이지와 상호작용하는 것에 대해 분명한 선호도를 보였다(도 2a-2b). 후속 시험에서, 새로운 사회적 파트너("스트레인저 2")를 이전에 비어 있는 와이어 케이지에 도입하였다. WT 마우스는 새로운 동물에 대한 선호도를 나타낸 반면, Shank3B-/- 돌연변이체는 중앙 챔버에서 더 많은 시간을 보냈다(도 2a 및 2c). 결론적으로, Shank3B 돌연변이체 마우스는 사회적 상호작용 결손을 나타내었다.
Shank3 돌연변이체 마우스를 Shank3 돌연변이가 선조체 시냅스에 미치는 영향을 연구하는 데 사용하였다. 기저핵(basal ganglia)은 ASD와 관련된 뇌 영역 중 하나이다. Shank3B-/- 마우스의 반복적인 그루밍 행동은 피질-선조체 기능의 결함을 시사하였다. 더욱이, Shank3은 선조체에서 고도로 발현된 유일한 Shank 패밀리 구성원이었다(도 3a). 따라서, 분석은 선조체 뉴런과 피질-선조체 시냅스에 집중되었다.
Shank3의 파괴가 PSD 단백질 네트워크에 얼마나 영향을 미칠 수 있는지를 결정하기 위해, 선조체로부터의 정제된 PSD를 스캐폴딩 단백질 및 글루타메이트 수용체 서브유닛에 대해 조사하였다(도 3b-3c). Shank3B-/- 마우스에서 SAPAP3, 호머-1b/c 및 PSD93, 및 글루타메이트 수용체 서브유닛 GluR2, NR2A 및 NR2B의 감소된 수준이 관찰되었다. 이것은 선조체에서 PSD의 분자 조성의 변경 및 글루타메이트성 신호전달(glutamatergic signaling)의 파괴를 시사하였고, 이는 Shank 단백질이 마스터 스캐폴드라는 가설을 뒷받침한다.
골지 추적(Golgi tracing)을 사용하여, Shank3B-/- MSN에서 수상돌기 분지(dendritic arbor)의 복잡성, 전체 수상돌기 길이 및 표면적의 증가에 의해 나타난 바와 같이 신경 비대가 발견되었다. 또한, MSN의 염료 필링(dye filling)은 Shank3B-/- 마우스에서 가시 밀도의 감소를 밝혀내었다. EM 분석은 WT에 비해 Shank3B-/- 마우스로부터 PSD의 평균 두께 및 길이의 감소를 보여주었다. 종합하면, 이들 결과는 선조체에서 MSN 및 글루타메이트성 시냅스의 발달에서 Shank3의 중요한 역할을 강조하였다.
시냅스에 대한 Shank3 파괴의 기능적 중요성을 설명하기 위해, 6-7주령의 Shank3B-/- 마우스의 급성 뇌 절편에서 피질-선조체 시냅스 회로의 기록을 수행하고, 동일한 연령의 행동 시험을 수행하였다. 대조군과 비교했을 때 Shank3B-/- 마우스에서 필드 집단 스파이크(field population spike)가 유의하게 감소된 것으로 밝혀졌다(도 4a). 음성 피크 1(NP1) 및 쌍 펄스 비율(paired-pulse ratio, PPR)로 명명된 반응의 활동 전위 구성요소의 진폭에 대한 자극 강도의 관계에 의해 표시된 바와 같이 시냅스전 기능은 분명히 변경되지 않았다. 이들 결과는 전체 필드 반응의 감소가 시냅스 기능의 시냅스후 손상 및/또는 기능적 시냅스 수의 감소로 인한 것일 가능성이 가장 높다는 것을 나타내었다.
배외측(dorsolateral) 선조체 MSN에서 AMPAR-mEPSC의 전체 세포 전압 클램프 기록을 또한 수행하였다. mEPSC의 빈도는 Shank3B-/- MSN에서 유의하게 감소하였으며(도 4b-4c), 이는 PPR에서 결함이 관찰되지 않았기 때문에 Shank3B-/- MSN에서 기능적 시냅스 수의 감소를 시사하였다(도 4e). Shank3B-/- MSN에서 최대 mEPSC 진폭도 감소하였으며(도 4b 및 4d), 이는 이용가능한 시냅스로부터 시냅스후 반응의 감소를 나타낸다. 이들 데이터는 피질-선조체 회로에서의 시냅스후 기능에서 Shank3의 중요한 역할을 입증하였다.
유사한 조사가 원숭이 모델에서 시험된 다음 임상 시험에서 Shank3 돌연변이를 갖는 인간 ASD 환자에서 시험될 것이다.
실시예 2: miniShank3 유전자의 설계 및 제작
본원에 개시된 바와 같은 Shank3 돌연변이에 대한 유전자 요법 전략은 AAV를 사용하여 Shank3 cDNA의 기능적 카피를 뇌 세포로 전달하여 환자에서 Shank3 발현 수준을 회복시키는 것이었다. 그러나, Shank3은 큰 단백질이고 코딩 서열은 ~5.7 kb로 AAV 벡터의 패키징 용량을 초과한다. 이 문제를 해결하기 위해, 소형화된 Shank3(miniShank3)은 그의 기능을 그대로 유지하면서 크기를 줄이는 것을 목표로 설계되었다.
miniShank3의 첫 번째 버전(miniShank3-v1, 도 5b)에서, N-말단 도메인 및 다른 영역, 예컨대 안키린 반복 및 중요하지 않은 것으로 간주되는 프롤린-풍부 도메인의 주요 부분을 포함하는 프롤린-풍부 도메인 및 PDZ 도메인 사이의 연결 서열이 결실되었다. 이것은 Shank3 단백질의 기능에 중요한 것으로 예측된 도메인만 유지함으로써 Shank3 코딩 서열을 2.1 kb까지 효과적으로 감소시켰다.
임의의 이론에 얽매이지 않으면서, Shank3 단백질의 N-말단 도메인(NTD)은 시냅스 가소성에서 특수한 역할을 할 수 있다. 시냅스 가소성은 다양한 자극에 대한 반응으로 그의 시냅스 강도를 조절하는 뉴런의 능력을 지칭하며, 이는 학습하고 환경 변화에 적응하는 인간의 능력의 초석인 것으로 여겨진다. Shank3은 주요 시냅스 가소성 조절자인 CaMKIIα와 특정한 상호작용을 하는 것으로 밝혀졌다. 심각한 ID를 갖는 인간 ASD 환자에서 확인된 미스센스 돌연변이는 이러한 상호작용을 손상시킨다. 동일한 돌연변이를 가진 넉인(knock-in) 마우스가 생성되었고, 이들 마우스는 시냅스 가소성 결함을 가지고 있었다. 이러한 결과를 기초로, miniShank3-v1에 NTD를 추가하는 것은 miniShank3의 기능을 더 개선할 수 있을 것으로 추측되었다.
miniShank3의 두 번째 버전은 NTD를 함유하도록 설계되었다(miniShank3-v2, 도 6b). miniShank3-v2(3.1 kb)는 miniShank3-v1(2.1 kb)보다 상당히 더 크지만, 여전히 AAV 패키징 용량 내이다. miniShank3-v1 데이터를 기초로, 두 버전 모두 Shank3 기능을 회복시키는 데 효과적일 것으로 예상되었다. miniShank3-v2는 시냅스 가소성 기능을 회복시키는 데 특정 이점이 있을 수 있으며, 이는 유전자 요법 치료의 창을 여러 발달 단계로 잠재적으로 확장할 수 있는 효과이다.
피질-선조체 공동 배양을 수행하였다. 요약하면, 1차 피질-선조체 공동 배양물을 이전에 당업계에 설명된 바와 같이 제조하였다. 선조체 조직을 P0 Shank3 InsG3680/InsG3680 돌연변이체로부터 절개하였다. 피질 조직을 P0 야생형 새끼로부터 절개하였다. 조직을 파파인(Worthington Biochemical Corporation)으로 분해하고, 작은 유리 파스퇴르 피펫으로 분리하였다. 약 5백만 개의 선조체 중간 가시 뉴런(MSN)을 1 μg의 AAV-hSyn-GFP 플라스미드 단독 또는 2 μg의 AAV-hSyn1-minishank3 플라스미드와 혼합된 1 μg의 AAV-hSyn1-GFP 플라스미드로 마우스 뉴런 NucleofectorTM 키트(Lonza)를 사용하여 전기천공하였다. 그 다음, 선조체 MSN 및 피질 뉴런을 3:1의 비율로 혼합하고, 0.5 mM 글루타민(Invitrogen), 1X B27(Invitrogen), 50 μg/mL 페니실린/스트렙토마이신(Invitrogen), 50 ng/mL BDNF(R&D Systems), 및 30 ng/mL GDNF(R&D Systems)가 보충된 Neurobasal A 배지(Invitrogen)를 갖는 24-웰 플레이트 내부에 1x105 세포/cm2의 밀도로 폴리 D-라이신/라미닌(Neuvitro, GG-12-1.5-라미닌)으로 사전코팅된 12 mm 커버슬립 상에 플레이팅하였다. 초기 플레이팅 후, 배지의 절반을 3-4일마다 BDNF 및 GDNF가 없는 새로운 배지로 교환하였다.
miniShank3가 Shank3의 주요 기능을 유지하는지 여부를 조사하기 위해, Shank3 돌연변이체 마우스로부터의 배양된 뉴런에서 그의 발현 및 국소화를 먼저 시험하였다. Shank3은 시냅스 단백질이므로, miniShank3이 내인성 Shank3 단백질과 유사하게 시냅스에 국소화되는 것이 중요하였다. GFP 태그된 miniShank3v1이 피질-선조체 공동 배양의 뉴런에서 발현되었을 때, GFP-miniShank3은 시냅스후 마커 PSD95와의 그의 공동국소화에 의해 표시되는, 시냅스에 정확하게 국소화된 것으로 밝혀졌다(도 7a-7h). 따라서, miniShank3은 시냅스 단백질의 핵심 기능을 유지하였다.
실시예 3: 마우스 모델에서 miniShank3의 기능적 표현
miniShank3가 내인성 Shank3의 전체 기능을 포착하는지 여부를 조사하기 위해, Shank3 돌연변이체 마우스에서 신경 기능을 회복하는 MiniShank3-v1의 능력을 시험하였다. Shank3 돌연변이체 마우스는 시냅스 및 행동의 전기생리학적 특성의 이상을 포함하여 시냅스후 밀도(PSD)의 분자 조성에 결손을 나타내는 것으로 이전에 입증되었다. Shank3 InsG3680 돌연변이체 마우스에서 이들 결손 각각을 회복하는 miniShank3-v1의 능력을 시험하였다. 이 마우스는 인간 ASD 환자에게서 발견되는 InsG3680 돌연변이를 모방한다. 이전 연구는 이들 마우스가 ASD와 관련된 분자적, 전기생리학적 및 행동적 결손을 나타내었음을 보여주었다. 따라서, 이 모델을 사용하여 miniShank3-v1이 이러한 돌연변이체 마우스에서 관찰된 결손을 회복시킬 수 있는지 여부를 시험하였다.
GFP-miniShank3-v1을 pHP.eB AAV 벡터에 클로닝하였다. AAV-GFP-miniShank3-v1 바이러스를 제조하고, 안면 정맥 주사를 통해 생후 0 내지 2일(P0-P2) 마우스에 투여하였다. 마우스당 6.42E+11개의 바이러스 게놈(vg)의 용량에서, GFP-miniShank3-v1은 뇌 내의 대부분의 뉴런에서 고도로 발현되는 것으로 밝혀졌다(도 8). AAV-hSyn1-GFP를 대조군으로서 주사하였다.
표준 생화학적 접근법을 사용하여, PSD를 AAV-hSyn1-GFP가 주사된 야생형 마우스, AAV-hSyn1-GFP가 주사된 Shank3 돌연변이체 마우스, 및 AAV-GFP-miniShank3-v1이 주사된 Shank3 돌연변이체 마우스의 뇌로부터 분리하였다(도 9a). 웨스턴 블롯 분석을 사용하여 PSD에서 다양한 시냅스 단백질의 수준을 검출하였다(도 9b). 이전에 보고된 바와 같이, 야생형 마우스와 비교하여, 호머, PSD95, SynGap1, SAPAP3, NR1, NR2B, 및 GluR2를 포함하는 여러 시냅스 단백질의 수준은 Shank3 돌연변이체 마우스의 PSD에서 감소하였다(도 9c-9f). miniShank3-v1의 발현은 이들 시냅스 단백질의 발현 수준을 야생형 수준으로 회복시켰고, 이는 miniShank3-v1이 PSD의 분자 조성을 회복하는 데 완전히 기능적이었음을 나타낸다(도 9c-9f). 결론적으로, miniShank3은 Shank3 돌연변이체 마우스에서 시냅스후 밀도(PSD)의 분자 결함을 회복시킨다.
Shank3은 선조체에서 고도로 발현된다. 피질-선조체 시냅스 통신은 Shank3 돌연변이체 마우스에서 결함이 있다. miniShank3-v1이 시냅스 결함을 회복할 수 있는지 여부를 시험하기 위해, Shank3 돌연변이체 마우스로부터의 급성 뇌 절편에서 피질-선조체 시냅스 회로의 전기생리학적 기록을 수행하였다. 이전에 보고된 바와 같이, 필드 집단 스파이크는 대조군과 비교할 때 Shank3 돌연변이체 마우스에서 유의미하게 감소하였다(도 10a). Shank3 돌연변이체 마우스에서의 이러한 결함은 miniShank3-v1 발현에 의해 구제되었다(도 10a). 시냅스전 기능은 음성 피크 1(NP1; 도 10b)로 명명된 반응의 활동 전위 구성요소의 진폭에 대한 자극 강도의 관계에 의해 표시되는 바와 같이 변경되지 않았다. 이들 결과는 전체 필드 반응의 감소가 시냅스 기능의 시냅스후 손상 및/또는 기능적 시냅스 수의 감소로 인한 가능성이 가장 높으며, 이들 결함은 P0에서 AAV 매개 miniShank3-v1 발현에 의해 효과적으로 교정될 수 있음을 나타내었다. 결론적으로, miniShank3은 Shank3 돌연변이체 마우스에서 피질-선조체 시냅스 결함을 회복시킨다.
이전 연구는 Shank3 돌연변이체 마우스가 펠란-맥더미드 증후군 또는 Shank3 돌연변이를 갖는 환자에서 관찰되는 증상과 관련된 몇 가지 행동 표현형을 나타내는 것으로 나타났다. P0에서 miniShank3-v1 처리는 단지 개선 경향을 나타낸 운동 학습의 단일 분석에서의 성능을 제외하고 Shank3 돌연변이체 마우스에서 모든 시험된 행동 결손을 완전히 구제한 것으로 밝혀졌다. miniShank3-v1 처리는 3-챔버 사회적 상호작용 분석에 의해 측정된 사회적 상호작용 결손(도 11a), 개방 필드 시험에서 이동 거리에 의해 측정된 운동 활동 결함(도 11b), 개방 필드 시험에서 양육 시간에 의해 측정된 탐색적 행동 결손(도 11c), 및 고위 제로 미로에서 나타나는 불안 유사 행동(도 11d)을 완전히 구제하였다. 그러나, 돌연변이체 Shank3에서의 운동 학습 결손은 로타로드 시험에서 약간만 개선되었다(도 11e). 이것은 마우스에서 소뇌 발달이 출생 후에 시작되어 P0에서 AAV 감염을 제한했기 때문에 P0에 주사했을 때 소뇌에서 miniShank3의 매우 낮은 수준의 발현과 관련이 있을 가능성이 있다. 결론적으로, miniShank3은 Shank3 돌연변이체 마우스에서 행동 결함을 회복한다.
실시예 4: miniShank3 유전자 요법에 대한 치료 시기의 결정
이전 연구는 Shank3 돌연변이체에서 특정 행동을 구제하기 위한 중요한 발달적 시간 윈도우가 있음을 보여주었다. miniShank3의 AAV 매개 전달을 위한 효과적인 치료 윈도우를 결정하기 위해, 상이한 발달 단계에서 정맥 내 바이러스 주사를 수행하고, 성체기 동안 행동에 미치는 영향을 분석하였다. 모든 행동 실험을 마우스에 AAV 주사 후 적어도 8주 후에 수행하였다. 요약하면, 야생형 마우스, Shank3 돌연변이체 마우스, 및 상이한 연령(P0, P2, P7 및 P28)에서 Shank3 처리된 Shank3 돌연변이체 마우스를 실험 그룹으로 할당하였다. P0 및 P2에서의 마우스에게 멸균 식염수에 희석된 AAV-PHP.eB-hSyn-GFP 또는 AAV-PHP.eB-hSyn-GFP-MiniShank3의 6.0 x1011개의 총 바이러스 게놈(vg)으로 구성된 20 μl의 주사 혼합물을 정맥내로 주사하였다. P0-P2령의 마우스의 경우, 안면 정맥 주사를 사용하였다. P7 및 P28에서의 마우스에게 AAV-PHP.eB-hSyn-GFP 또는 AAV-PHP.eB-hSyn-GFP-MiniShank3의 7.0x1011개의 총 바이러스 게놈(vg)을 정맥내로 주사하였다. P7 및 P28령의 마우스의 경우, 안와후 주사 또는 뇌실내(ICV) 주사를 사용하였다.
출생후 일(P28)에 MiniShank3 처리는 Shank3 InsG3680 돌연변이체에서 사회적 행동 장애를 완전히 구제하였고, 선호도를 나타내지 않은 처리되지 않은 돌연변이체와 달리 처리된 마우스는 스트레인저 마우스에 대해 강한 선호도를 나타내었다(도 12a). P28 처리된 miniShank3 마우스는 또한 돌연변이체 마우스와 비교하여 유의하게 증가된 보행 활동을 나타내었다(도 12b). P28에서 miniShank3 처리는 운동 학습(도 12c) 및 운동 협응(도 12d)을 유의하게 개선하는 것으로 밝혀졌다. 사회적 행동 및 운동 행동과 대조적으로, P28에서 miniShank3 처리는 불안 유사 행동 및 반복적인 그루밍에 대해 최소한의 효과를 나타내었다(도 12d). 고위 제로 미로에서, miniShank3 처리된 마우스는 개방 팔에서의 탐색 시간에서 돌연변이체 마우스와 유의한 차이를 보이지 않았고(도 12f), 그루밍 분석에서 miniShank3 처리된 마우스는 그루밍 행동의 단지 약간의 감소를 나타내었다(도 12f).
성체 마우스에서 Shank3 발현의 유전적 구제를 설명하는 이전 연구들은 그루밍 표현형이 성체에서 가역적이며 피질-선조체-시상-피질 회로 기능장애가 반복적/강박적 유사 행동과 강하게 관련되어 있음을 보여주었다. P28에서 miniShank3으로 처리된 돌연변이체에서 이러한 행동 표현형의 구제의 부족이 그루밍 관련 뇌 영역에서의 불량한 miniShank3 발현 때문인지 여부를 다루기 위해, P28 처리된 동물에서 GFP 발현을 평가하여 miniShank3의 생체분포를 조사하였고, GFP 발현이 시상에서 매우 낮고 선조체에서 제한됨을 발견하였다. 따라서, P28에서 miniShank3 처리는 사회적 행동, 보행, 및 운동 협응의 결함을 선택적으로 구제한 반면, 이 연령에서 시상 및 선조체의 AAV 기반 표적화를 위한 개선된 전략은 불안 및 반복적 행동에 대한 추가 치료 이점을 가능하게 할 수 있다.
출생후 7일(P7)에 miniShank3가 투여된 돌연변이체 마우스는 P0-P2 주사에서 관찰된 것과 유사하게 그들의 돌연변이체 한배새끼와 비교하여 스트레인저 마우스에 대한 강화된 선호도를 보여주었다(도 13a). 전기생리학 연구들은 P7에서 miniShank3 전달이 Shank3 돌연변이체 마우스에서 관찰된 피질-선조체 시냅스 결함을 회복하기에 충분하다는 것을 보여주었다. 피질-선조체 회로 기능장애는 자폐증 및 강박 장애와 관련된 반복적이고 강박적인 행동과 강하게 관련되어 있었고. Shank3 돌연변이체는 과도한 그루밍 표현형을 나타내었다. 이 이론을 시험하기 위해, 개별 WT 마우스, Shank3 돌연변이체 마우스, 및 P7에서 miniShank3로 처리된 Shank3 돌연변이체 마우스를 2시간 동안 모니터링하고, 세션 동안 그루밍에 소모한 시간의 백분율을 정량화하였다. Shank3 돌연변이체 마우스는 WT 마우스와 비교하여 그루밍에 유의하게 증가된 백분율의 시간을 사용한 것으로 나타났다. 그러나, miniShank3 처리된 마우스는 그루밍하는 데 유의하게 감소된 양의 시간을 사용하였고, 이는 WT 동물과 유사하였다(도 13b).
P7에서 MiniShank3 처리는 개방 필드 시험에서 이동한 총 거리에 의해 측정된 바와 같이 Shank3 돌연변이체에서 관찰된 보행 표현형(도 13c), 고위 제로 미로에서 불안 유사 행동(도 13d-13e)을 완전히 구제하였다. miniShank3의 P0-P2(출생후 0일 - 출생후 2일) 전달과 대조적으로, P7에서 miniShank3으로 처리된 Shank3 돌연변이체 마우스는 돌연변이 한배새끼보다 운동 학습 및 운동 협응 모두에서 유의하게 더 잘 수행하였고(도 13f), 이는 Shank3 돌연변이에서 관찰된 운동 결함이 적절한 발단 단계에서 주어지는 경우 AAV 매개 miniShank3 유전자 요법에 의해 가역적임을 시사한다. 함께, 이러한 행동 결과는 P7에서의 miniShank3 유전자 요법이 Shank3 InsG3680 돌연변이 동물에서 모든 보고된 행동 표현형을 효과적으로 구제할 수 있음을 보여준다.
실시예 5: P7에서 miniShank3의 전신 전달은 Shank3 InsG3680 돌연변이체에서 수면 장애의 개선을 초래한다
펠란-맥더미드 증후군을 갖는 환자 및 SHANK3 돌연변이를 갖는 다른 개체는 종종 잠들고 잠든 상태를 유지하기 어려운 것을 포함하는 심각한 수면 장애를 나타낸다. 예를 들어, 짧은꼬리 원숭이에서의 SHANK3 돌연변이는 현저한 수면 장애를 나타낸다. Shank3 InsG3680 돌연변이체 마우에서의 수면 장애를 평가하기 위해, EEG/EMG 관련 수술을 수행하였고, 3개의 모든 실험 그룹으로부터의 신호를 조사하여 Shank3의 돌연변이에 의해 수면이 영향을 받는지 여부를 결정하였다. InsG3680 동형접합체는 WT 대조군보다 더 짧은 유지 길이(도 13h)와 함께 감소된 NREM 수면 지속 시간(도 13g), 및 NREM 수면 동안 전두엽 EEG에서 델타 리듬(1-4Hz)의 감쇠된 파워(도 13i)를 나타내었다. 이들 결과는 Shank3 돌연변이체 마우스에서 심각한 수면 장애를 보여주었다. P7에 주사된 MiniShank3은 NREM 수면의 감소(도 13g) 및 처리되지 않은 돌연변이체에서 관찰된 감소된 수면 유지 시간(도 13h) 모두를 유의하게 완화시켰다. 또한, P7에 주사된 miniShank3은 감소된 델타 파워를 부분적으로 구제하였다(도 13i). 함께, 이들 결과는 miniShank3이 동형접합 Shank3 InsG3680 마우스에서 수면 장애를 감쇠시킬 수 있고, ASD 관련 행동 표현형을 구제하는 miniShank3의 광범위한 능력과 일치한다는 것을 보여주었다.
실시예 6: P7에서 MiniShank3 처리는 Shank3 InsG3680 돌연변이체에서 발작 행동을 유발하지 않는다
발작 행동에 대한 miniShank3 처리의 잠재적인 효과를 시험하기 위해, WT 마우스, 대조군 바이러스가 주사된 Shank3 돌연변이체, miniShank3이 주사된 Shank3 돌연변이체, 및 Scn2a 돌연변이체를 연구에 포함시켰다. EEG 분석을 위해, 수면 모니터링, 자발 발작, 및 청력 발작과 같은 지표를 수행하였다. 24시간의 기록 동안 안정적인 EEG 기저선에 의해 입증된 바와 같이 Shank3 InsG3680 돌연변이체 마우스에서 자발적인 간질 EEG 이상이 관찰되지 않았다(대표적인 트레이스, 도 14a). 청력 발작(124 dB 음향 자극)을 유도하는 Shank3 돌연변이체의 감수성을 조사하였고, 돌연변이체 마우스에서 청력 발작의 행동 징후가 존재하지 않는 것으로 나타났다. miniShank3의 안전성을 평가하기 위해, P7에 miniShank3가 주사된 돌연변이체 마우스에서 자발적인 간질성 EEG 이상을 조사하였고, EEG 상에서 감지될 수 있는 과흥분 활성이 관찰되지 않았다(도 14a). 또한, Shank3 InsG3680 돌연변이체 마우스 및 miniShank3이 주사된 돌연변이체 마우스는 작은 발작(absence seizure)의 EEG 시그니처인 스파이크-파동 방전(spike-and-wave discharge, SWD)을 나타내지 않았다. 그러나, 빈번한 작은 발작을 초래한 Scn2a에 이형접합 돌연변이를 갖는 동물의 분석은 시간당 약 60회의 SWD 에피소드를 발견하였고, 이는 분석 파이프라인의 유효성을 검증하였다(도 14b). 함께, 이들 결과는 Shank3 InsG3680 돌연변이가 간질 활성을 나타내지 않았고 miniShank3 발현이 검출가능한 발작을 초래하지 않았음을 보여준다.
실시예 7: miniShank3을 이용한 성인 인간 대상체의 치료
자폐 스펙트럼 장애(ASD) 또는 펠란-맥더미드 증후군과 같은 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 성인 대상체는 본원에 기재된 바와 같은 방법, 벡터 및 비자연 발생 폴리뉴클레오타이드를 사용하여 miniShank3에 의해 치료될 수 있다. 성인 인간 대상체는 16세 이상의 임의의 남성 또는 여성 성인을 포함할 수 있다. 25세 미만의 성인이 본원에 개시된 바와 같은 miniShank3 치료에 바람직할 수 있다. 투여 및 전달 방법은 본원에 개시된 바와 같이 안면 정맥 주사 및 뇌실내 주사를 포함할 수 있다. 당업자에게 공지된 다른 방법이 또한 사용될 수 있다. 성인 인간 대상체는 AAV와 같은 바이러스 벡터에 의해 전달되는 miniShank3으로 치료된다. 예를 들어, 성인 인간 대상체는 miniShank3 이식유전자를 발현하는 서열번호: 21의 서열을 포함하는 AAV 벡터로 치료될 수 있다. 임의의 이론에 얽매이지 않으면서, 치료를 위한 용량은 1x1010 내지 1x1012 바이러스 게놈(vg)일 수 있다. 당업자는 성별, 체중, 연령, 질환 상태, 및 질환 유형과 같은 다양한 인자가 특정 성인에 대한 용량을 결정할 때 고려될 수 있음을 이해할 것이다. 용량은 1x1010 및 1x1012 vg 범위 밖일 수 있다. 투여 경로는, 예를 들어 정맥내, 안면 정맥내, 두개내, 뇌실내, 안구내, 또는 경막내일 수 있다.
실시예 8: miniShank3을 이용한 비성인 인간 대상체의 치료
자폐 스펙트럼 장애(ASD), 또는 펠란-맥더미드 증후군과 같은 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 비성인 인간 대상체는 본원에 기재된 바와 같은 방법, 벡터, 및 비자연 발생 폴리뉴클레오타이드를 사용하여 miniShank3에 의해 치료될 수 있다. 비성인 인간 대상체는 16세 이하의 임의의 남성 또는 여성을 포함할 수 있다. 임의의 이론에 얽매이지 않으면서, 유아 또는 걸음마 아기와 같은 10세 이하의 인간 대상체가 본원에 개시된 바와 같은 miniShank3 치료에 바람직할 수 있다. 투여 및 전달 방법은 안면 정맥 주사를 포함할 수 있으며, 뇌실내 주사가 본원에 개시되어 있다. 당업자에게 공지된 다른 방법이 또한 사용될 수 있다. 성인이 아닌 인간 대상체는 AAV와 같은 바이러스 벡터에 의해 전달되는 miniShank3으로 치료된다. 예를 들어, 성인이 아닌 인간 대상체는 miniShank3 이식유전자를 발현하는 서열번호: 21의 서열을 포함하는 AAV 벡터로 치료될 수 있다. 임의의 이론에 구애됨이 없이, 치료를 위한 용량은 1x1010 내지 1x1012 바이러스 게놈(vg)일 수 있다. 당업자는 성별, 체중, 연령, 질환 상태, 및 질환 유형과 같은 다양한 인자가 특정 성인에 대한 용량을 결정할 때 고려될 수 있음을 이해할 것이다. 복용량은 1x1010 및 1x1012 vg 범위 밖일 수 있다. 투여 경로는, 예를 들어 정맥내, 안면 정맥내, 두개내, 뇌실내, 안구내 또는 척수강내일 수 있다. 투여 경로는 성인이 아닌 인간 대상체가 태아 또는 발달의 출생전 단계에 있는 경우 자궁내일 수 있다.
실시예 9: miniShank1 또는 miniShank2를 이용한 인간 대상체의 치료
신경발달 장애, 자폐 스펙트럼 장애(ASD) 또는 펠란-맥더미드 증후군을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 인간 대상체는 본원에 기재된 바와 같은 방법, 벡터, 및 비자연 발생 폴리뉴클레오타이드를 사용하여 miniShank1 또는 miniShank2로 치료될 수 있다. 성인 인간 대상은 임의의 남성 또는 여성 인간 대상체를 포함할 수 있다. 치료 방법은 miniShank3 작제물(서열번호: 1-4 및 21)이 Shank1(miniShank1) 또는 Shank2(miniShank2)를 포함하도록 변형된 것을 제외하면, 본원에 기재된 방법과 유사할 것이다. 성인 또는 성인이 아닌 인간 대상체는 AAV와 같은 바이러스 벡터에 의해 전달되는 miniShank1 또는 miniShank2로 치료된다. 예를 들어, 성인 인간 또는 성인이 아닌 인간 대상체는 miniShank3 이식유전자를 발현하는 서열번호: 21의 서열을 포함하는 AAV 벡터로 치료될 수 있다. 임의의 이론에 얽매이지 않으면서, 치료를 위한 용량은 1x1010 내지 1x1012 바이러스 게놈(vg)일 수 있다. 당업자는 성별, 체중, 연령, 질환 상태, 및 질환 유형과 같은 다양한 인자가 특정 성인에 대한 용량을 결정할 때 고려될 수 있음을 이해할 것이다. 용량은 1x1010 및 1x1012 vg 범위 밖일 수 있다. 투여 경로는, 예를 들어 정맥내, 안면 정맥내, 두개내, 뇌실내, 안구내, 또는 경막내일 수 있다. 투여 경로는 성인이 아닌 인간 대상체가 태아 또는 발달의 출생전 단계에 있는 경우 자궁내일 수 있다.
실시예 10: 렌티바이러스 바이러스 벡터를 사용한 miniShank3의 전달
자폐 스펙트럼 장애(ASD) 또는 펠란-맥더미드 증후군과 같은 신경 발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 인간 대상체는 본원에 기재된 바와 같은 방법, 벡터 및 비자연 발생 폴리뉴클레오타이드를 사용하여 miniShank1 또는 miniShank2에 의해 치료될 수 있다. 성인 또는 성인이 아닌 인간 대상체는 렌티바이러스와 같은 바이러스 벡터에 의해 전달되는 miniShank3으로 치료된다. 임의의 이론에 얽매이지 않으면서, 치료를 위한 용량은 1x1010 내지 1x1012 바이러스 게놈(vg)일 수 있다. 당업자는 성별, 체중, 연령, 질환 상태, 및 질환 유형과 같은 다양한 인자가 특정 성인에 대한 용량을 결정할 때 고려될 수 있음을 이해할 것이다. 용량은 1x1010 및 1x1012 vg 범위 밖일 수 있다. 투여 경로는, 예를 들어 정맥내, 안면 정맥내, 두개내, 뇌실내, 안구내, 또는 경막내일 수 있다. 투여 경로는 성인이 아닌 인간 대상체가 태아 또는 발달의 출생전 단계에 있는 경우 자궁내일 수 있다.
표 1. 마우스 및 인간 miniShank3 서열 및 벡터 서열
Figure pct00009
Figure pct00010
Figure pct00011
Figure pct00012
Figure pct00013
Figure pct00014
Figure pct00015
Figure pct00016
Figure pct00017
Figure pct00018
Figure pct00019
Figure pct00020
Figure pct00021
Figure pct00022
Figure pct00023
Figure pct00024
참고문헌
1. Prasad C, Prasad AN, Chodirker BN, Lee C, Dawson AK, Jocelyn LJ, Chudley AE. (2000) Genetic evaluation of pervasive developmental disorders: the terminal 22q13 deletion syndrome may represent a recognizable phenotype. Clin Genet 57:103-109.
2. Precht KS, Lese CM, Spiro RP, Huttenlocher PR, Johnston KM, Baker JC, Christian SL, Kittikamron K, Ledbetter DH. (1998) Two 22q telomere deletions serendipitously detected by FISH. J Med Genet 35:939-942.
3. Manning MA, Cassidy SB, Clericuzio C, Cherry AM, Schwartz S, Hudgins L, Enns GM, Hoyme HE. (2004) Terminal 22q deletion syndrome: a newly recognized cause of speech and language disability in the autism spectrum. Pediatrics 114, 451-457.
4. Wilson HL, Wong AC, Shaw SR, Tse WY, Stapleton GA, Phelan MC, Hu S, Marshall J, McDermid HE. (2003) Molecular characterisation of the 22q13 deletion syndrome supports the role of haploinsufficiency of SHANK3/PROSAP2 in the major neurological symptoms. J Med Genet 40, 575-584.
5. Jeffries AR, Curran S, Elmslie F, Sharma A, Wenger S, Hummel M, Powell J (2005) Molecular and phenotypic characterization of ring chromosome 22. Am J Med Genet A 137:139-147.
6. Durand CM, Betancur C, Boeckers TM, Bockmann J, Chaste P, Fauchereau F, Nygren G, Rastam M, Gillberg IC, Anckarsater H, Sponheim E, Goubran-Botros H, Delorme R, Chabane N, Mouren-Simeoni MC, de Mas P, Bieth E, Roge B, Heron D, Burglen L, Gillberg C, Leboyer M, Bourgeron T. (2007) Mutations in the gene encoding the synaptic scaffolding protein SHANK3 are associated with autism spectrum disorders. Nat Genet 39, 25-27.
7. Moessner R, Marshall CR, Sutcliffe JS, Skaug J, Pinto D, Vincent J, Zwaigenbaum L, Fernandez B, Roberts W, Szatmari P, Scherer SW. (2007) Contribution of SHANK3 mutations to autism spectrum disorder. Am J Hum Genet 81, 1289-1297.
8. Gauthier J, Spiegelman D, Piton A, Lafreniere RG, Laurent S, St-Onge J, Lapointe L, Hamdan FF, Cossette P, Mottron L, Fombonne E, Joober R, Marineau C, Drapeau P, Rouleau GA. (2009) Novel de novo SHANK3 mutation in autistic patients. Am J Med Genet B Neuropsychiatr Genet 150B, 421-424.
9. Boccuto et al., Prevalence of SHANK3 variants in patients with different subtypes of autism spectrum disorders. Eur J Hum Genet. 2013 Mar;21(3):310-6.
10. Betancur C, Buxbaum JD. SHANK3 haploinsufficiency: a "common" but underdiagnosed highly penetrant monogenic cause of autism spectrum disorders. Mol Autism. 2013 Jun 11;4(1):17.
11. Du, Y., Weed, S.A., Xiong, W.C., Marshall, T.D. & Parsons, J.T. (1998) Identification of a novel cortactin SH3 domain-binding protein and its localization to growth cones of cultured neurons. Mol Cell Biol 18, 5838-5851 (1998).
12. Naisbitt S, Kim E, Tu JC, Xiao B, Sala C,Valtschanoff J, Weinberg RJ, Worley PF, Sheng M. (1999) Shank, a novel family of postsynaptic density proteins that binds to the NMDA receptor/PSD-95/GKAP complex and cortactin. Neuron 23: 569-82.
13. Boeckers TM, Winter C, Smalla KH, Kreutz MR, Bockmann J, Seidenbecher C, Garner CC, Gundelfinger ED. (1999a) Proline-rich synapse-associated proteins ProSAP1 and ProSAP2 interact with synaptic proteins of the SAPAP/GKAP family. Biochem Biophys Res Commun. 264:247-52.
14. Boeckers TM, Kreutz MR, Winter C, Zuschratter W, Smalla KH, Sanmarti-Vila L, Wex H, Langnaese K, Bockmann J, Garner CC, Gundelfinger ED. (1999b) Proline-rich synapse-associated protein-1/cortactin binding protein 1 (ProSAP1/CortBP1) is a PDZ-domain protein highly enriched in the postsynaptic density. J Neurosci. 19:6506-18.
15. Sheng, M. & Kim, E. (2000) The Shank family of scaffold proteins. J Cell Sci 113 ( Pt 11), 1851-1856.
16. Montgomery JM, Zamorano PL, Garner CC. (2004) MAGUKs in synapse assembly and function: an emerging view. Cell Mol Life Sci. 61:911-29
17. Kim, E. and M. Sheng (2004). PDZ domain proteins of synapses. Nat Rev Neurosci 5: 771-81.
18. McAllister AK. (2007) Dynamic aspects of CNS synapse formation. Annu Rev Neurosci. 30:425-50.
19. Tu JC, Xiao B, Naisbitt S, Yuan JP, Petralia RS, Brakeman P, Doan A, Aakalu VK, Lanahan AA, Sheng M, Worley PF. (1999) Coupling of mGluR/Homer and PSD-95 complexes by the Shank family of postsynaptic density proteins. Neuron 23, 583-592.
20. Valtschanoff, J.G. & Weinberg, R.J. (2011) Laminar organization of the NMDA receptor complex within the postsynaptic density. J Neurosci 21, 1211-1217.
21. Baron MK, Boeckers TM, Vaida B, Faham S, Gingery M, Sawaya MR, Salyer D, Gundelfinger ED, Bowie JU. (2006) An architectural framework that may lie at the core of the postsynaptic density. Science 311:531-5.
22. Kreienkamp, H.J. (2008) Scaffolding proteins at the postsynaptic density: shank as the architectural framework. Handb Exp Pharmacol, 365-380.
23. Hayashi MK, Tang C, Verpelli C, Narayanan R, Stearns MH, Xu RM, Li H, Sala C, Hayashi Y. (2009) The postsynaptic density proteins Homer and Shank form a polymeric network structure. Cell 137:159-71.
24. Roussignol G, Ango F, Romorini S, Tu JC, Sala C, Worley PF, Bockaert J, Fagni L. (2005) Shank expression is sufficient to induce functional dendritic spine synapses in aspiny neurons. J Neurosci 25, 3560-3570.
25. Sala C, Piech V, Wilson NR, Passafaro M, Liu G, Sheng M. Regulation of dendritic spine morphology and synaptic function by Shank and Homer. (2001) Regulation of dendritic spine morphology and synaptic function by Shank and Homer. Neuron 31, 115-130.
26. Hung AY, Futai K, Sala C, Valtschanoff JG, Ryu J, Woodworth MA, Kidd FL, Sung CC, Miyakawa T, Bear MF, Weinberg RJ, Sheng M. (2008) Smaller dendritic spines, weaker synaptic transmission, but enhanced spatial learning in mice lacking Shank1. J Neurosci. 28:1697-708.
27. American Psychiatric Association. & American Psychiatric Association. Task Force on DSM-IV. Diagnostic and statistical manual of mental disorders : DSM-IV-TR, (American Psychiatric Association, Washington, DC, 2000.
28. Bertrand J, Mars A, Boyle C, Bove F, Yeargin-Allsopp M, Decoufle P. (2001) Prevalence of autism in a United States population: the Brick Township, New Jersey, investigation. Pediatrics 108:1155-1161.
29. Chakrabarti, S. & Fombonne, E. (2005) Pervasive developmental disorders in preschool children: confirmation of high prevalence. Am J Psychiatry 162:1133-1141.
30. Baird G, Simonoff E, Pickles A, Chandler S, Loucas T, Meldrum D, Charman T. (2006) Prevalence of disorders of the autism spectrum in a population cohort of children in South Thames: the Special Needs and Autism Project (SNAP). Lancet 368:210-215.
31. Rosenberg RE, Law JK, Yenokyan G, McGready J, Kaufmann WE, Law PA. (2009) Characteristics and concordance of autism spectrum disorders among 277 twin pairs. Arch Pediatr Adolesc Med 163:907-914.
32. Newschaffer CJ, Croen LA, Daniels J, Giarelli E, Grether JK, Levy SE, Mandell DS, Miller LA, Pinto-Martin J, Reaven J, Reynolds AM, Rice CE, Schendel D, Windham GC. (2007) The epidemiology of autism spectrum disorders. Annu Rev Public Health 28:235-258.
33. Veenstra-VanderWeele, J., Christian, S.L. & Cook, E.H. (2004) Autism as a paradigmatic complex genetic disorder. Annu Rev Genom Hum G. 5, 379-405.
34. Zoghbi, H.Y. [2003] Postnatal neurodevelopmental disorders: meeting at the synapse? Science 302:826-830.
35. Cline H. (2005) Synaptogenesis: a balancing act between excitation and inhibition. Curr Biol. 15:R203-5.
36. Sudhof TC. (2008) Neuroligins and neurexins link synaptic function to cognitive disease. Nature 455:903-11.
37. Betancur C, Sakurai T, Buxbaum JD. (2009) The emerging role of synaptic cell-adhesion pathways in the pathogenesis of autism spectrum disorders. Trends Neurosci. 32:402-12.
38. Bourgeron T. (2009) A synaptic trek to autism. Curr Opin Neurobiol. 19:231-4.
39. Pfeiffer BE, Huber KM. (2009) The state of synapses in fragile X syndrome. Neuroscientist 15:549-67.
40. Abrahams, B.S. & Geschwind, D.H. (2008) Advances in autism genetics: on the threshold of a new neurobiology. Nat Rev Genet 9:341-355.
41. State MW. (2010) The genetics of child psychiatric disorders: focus on autism and Tourette syndrome. Neuron 68:254-69.
42. van de Lagemaat, L.N. & Grant, S.G. (2010) Genome variation and complexity in the autism spectrum. Neuron 67:8-10.
43. Kumar RA, Christian SL. (2009) Genetics of autism spectrum disorders. Curr Neurol Neurosci Rep. 9:188-97.
44. Peca J, Feliciano C, Ting JT, Wang W, Wells MF, Venkatraman TY, Lascola CD, Fu Z and Feng G. (2011) Shank3 mutant mice display autistic-like behaviours and striatal dysfunction. Nature, 472:437
45. Zhou Y, Kaiser T, Monteiro P, Zhang X, Van der Goes MS, Wang D, Barak B, Zeng M, Li C, Lu C, Wells M, Amaya A, Nguyen S, Lewis M, Sanjana N, Zhou Y, Zhang M, Zhang F, Fu Z, Feng G. (2016) Mice with Shank3 mutations associated with ASD and schizophrenia display both shared and distinct defects. Neuron 89:147-162.
46. Guo B, Chen J, Chen Q, Ren K, Feng D, Mao H, Yao H, Yang J, Liu H, Liu Y, Jia F, Qi C, Lynn-Jones T, Hu H, Fu Z, Feng G*, Wang W*, Wu S*. (2019) Anterior cingulate cortex dysfunction underlies social deficits in Shank3 mutant mice. Nat Neurosci. 22(8):1223-1234. *co-corresponding authors.
47. Zhou Y, Sharma J, Ke Q, Landman R, Yuan J, Chen H, Hayden DS, Fisher JW 3rd, Jiang M, Menegas W, Aida T, Yan T, Zou Y, Xu D, Parmar S, Hyman JB, Fanucci-Kiss A, Meisner O, Wang D, Huang Y, Li Y, Bai Y, Ji W, Lai X, Li W, Huang L, Lu Z, Wang L, Anteraper SA, Sur M, Zhou H*, Xiang AP*, Desimone R, Feng G*, Yang S*. (2019) Atypical behaviour and connectivity in SHANK3-mutant macaques. Nature. 570:326-331. *co-corresponding authors.
48. Chen Q, Deister CA, Gao X, Guo B, Lynn-Jones T, Chen N, Wells MF, Liu R, Goard MJ, Dimidschstein J, Feng S, Shi Y, Liao W, Lu Z, Fishell G, Moore CI#, Feng G#. (2020) Dysfunction of cortical GABAergic neurons leads to sensory hyper-reactivity in a Shank3 mouse model of ASD. Nat Neurosci. 23:520-532. #corresponding authors.
49. Wang W, Li C, Chen Q, van der Goes MS, Hawrot J, Yao AY, Gao X, Lu C, Zang Y, Zhang Q, Lyman K, Wang D, Guo B, Wu S, Gerfen CR, Fu Z#, Feng G# (2017) Striatopallidal dysfunction underlies repetitive behavior in Shank3-deficient model of autism. J Clin Invest. pii: 87997. #co-corresponding authors.
50. Mei Y, Monteiro P, Zhou Y, Kim J-A, Gao X, Fu Z and Feng G. (2016) Adult Restoration of Shank3 Expression Rescues Selective Autistic-Like Phenotypes. Nature, 530:481-4.
51. Segal, M., Greenberger, V. & Korkotian, E. Formation of dendritic spines in cultured striatal neurons depends on excitatory afferent activity. Eur. J. Neurosci. 17, 2573-2585 (2003)
52. Tian, X., Kai, L., Hockberger, P. E., Wokosin, D. L. & Surmeier, D. J. medium spiny neurons. 44, 94-108 (2011).
53. Zhang, Q. et al. Impaired dendritic development and memory in sorbs2 knock-out mice. J. Neurosci. 36, 2247-2260 (2016).
54. Luh, L. M., Das, I. & Bertolotti, A. qMotor, a set of rules for sensitive, robust and quantitative measurement of motor performance in mice. Nat. Protoc. 12, 1451-1457 (2017).
청구범위에서, "a", "an" 및 "the"와 같은 관사는 달리 명시되지 않거나 문맥으로부터 달리 명백하지 않는 한 하나 또는 둘 이상을 의미할 수 있다. 그룹의 하나 이상의 구성원 사이에 "또는"을 포함하는 청구항 또는 설명은 달리 명시되지 않거나 문맥으로부터 달리 명백하지 않는 한 그룹 구성원 중 하나, 둘 이상, 또는 모두가 주어진 생성물 또는 과정에 존재하거나, 사용되거나, 관련이 있는 경우 충족되는 것으로 간주된다. 본 개시내용은 그룹의 정확히 하나의 구성원이 주어진 생성물 또는 과정에 존재하거나, 사용되거나, 관련되는 구현예를 포함한다. 본 개시내용은 그룹 구성원 중 둘 이상 또는 모두가 주어진 생성물 또는 과정에 존재하거나, 사용되거나, 관련되는 구현예를 포함한다.
또한, 본 개시내용은 나열된 청구범위 중 하나 이상으로부터의 하나 이상의 제한, 요소, 절 및 설명 용어가 또 다른 청구범위에 도입되는 모든 변형, 조합 및 순열을 포함한다. 예를 들어, 또 다른 청구범위에 종속된 임의의 청구범위는 동일한 기본 청구범위에 종속된 임의의 다른 청구범위에서 발견되는 하나 이상의 제한을 포함하도록 변형될 수 있다. 요소가 목록으로서 제시되는 경우(예컨대, 마쿠쉬 그룹 형식), 요소의 각 하위그룹이 또한 개시되며, 임의의 요소(들)가 그룹에서 제거될 수 있다. 일반적으로, 개시내용 또는 개시내용의 양태가 특정 요소 및/또는 특징을 포함하는 것으로 언급되는 경우, 개시내용 또는 개시내용의 양태의 특정 구현예는 이러한 요소 및/또는 특징으로 구성되거나, 또는 본질적으로 구성되는 것으로 이해되어야 한다. 단순화를 위해, 이들 구현예는 본원에서 이러한 말로 명시적으로 제시되지 않았다. 또한 용어 "포함하는" 및 "함유하는"은 개방적인 것으로 의도되며 추가 요소 또는 단계의 포함을 허용한다는 점에 유의한다. 범위가 주어지는 경우, 달리 명시되지 않는 한, 종점이 이러한 범위에 포함된다. 또한, 달리 나타내지 않거나 문맥 및 당업자의 이해로부터 달리 명백하지 않는 한, 범위로 표현되는 값은 개시내용의 상이한 구현예에서 명시된 범위 내의 임의의 특정 값 또는 하위범위를 문맥에서 달리 명시하지 않는 한 범위의 하한의 단위의 10분의 1까지 가정할 수 있다.
본 출원은 다양한 발행된 특허, 공개된 특허출원, 저널 기사, 및 기타 간행물을 참조하며, 이들 모두는 참조로 본원에 포함된다. 포함된 참고문헌 중 어느 것과 본 명세서 사이에 충돌이 있는 경우, 명세서가 우선할 것이다. 또한, 종래 기술에 속하는 본 개시내용의 임의의 특정 구현예는 임의의 하나 이상의 청구범위에서 명시적으로 제외될 수 있다. 이러한 구현예는 당업자에게 공지된 것으로 간주되기 때문에, 제외가 본원에서 명시적으로 제시되지 않는 경우에도 이들은 제외될 수 있다. 본 개시내용의 임의의 특정 구현예는 선행 기술의 존재와 관련이 있는지 여부에 관계없이 어떤 이유로든 청구범위에서 제외될 수 있다.
당업자는 단지 일상적인 실험을 사용하여 본원에 기술된 특정 구현예에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 본원 기술된 본 구현예의 범위는 상기 설명에 한정되는 것이 아니라, 첨부된 특허청구범위에 기재된 바와 같다. 당업자는 하기 청구범위에 정의된 바와 같은 본 개시내용의 사상 또는 범위를 벗어나지 않고 본 설명에 대한 다양한 변경 및 변형이 이루어질 수 있음을 이해할 것이다.
SEQUENCE LISTING <110> Massachusetts Institute of Technology <120> SHANK3 GENE THERAPY APPROACHES <130> B1195.70108WO00 <140> Not Yet Assigned <141> Concurrently Herewith <150> US 63/066,570 <151> 2020-08-17 <160> 22 <170> PatentIn version 3.5 <210> 1 <211> 2121 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 1 atgggcccga agcggaaact ttacagtgcc gtccccggcc gcaagttcat cgctgtgaag 60 gcgcacagcc cgcagggcga gggcgagatc ccgctgcacc gcggcgaggc cgtgaaggtg 120 ctcagcattg gggagggcgg tttctgggag ggaaccgtga agggccgaac aggctggttc 180 ccagctgact gtgtggaaga agtgcagatg cgacagtatg acacccggca tgaaaccaga 240 gaggaccgga cgaagcgtct cttccgccac tacactgtgg gttcctatga cagcctcact 300 tcacacagcg attatgtcat cgatgataag gtggctatcc tgcagaaaag ggaccatgag 360 gggtttggct ttgttctccg gggagccaaa gcagagaccc ccattgagga gtttacaccc 420 acacctgcct tccctgcact ccaatacctt gagtctgtag atgtggaagg tgtggcctgg 480 agggctggac ttcgaactgg ggacttcctc attgaggtga acggagtgaa tgtcgtgaag 540 gttggacaca agcaagtggt gggtctcatc cgtcagggtg gcaaccgcct ggtcatgaag 600 gttgtgtctg tgaccaggaa acccgaggag gatggtgctc ggcgcagagc cccaccaccc 660 ccaaagaggg ctcccagcac cacgctgacc ctgcggtcca agtccatgac ggctgagctc 720 gaggaacttg cttccattcg gagctcagag gaggagccag agctggtatt cgctgtgaac 780 ctgccacctg ctcagctgtc ctccagcgat gaggagacca gagaggagct ggcccgcata 840 gggctagtgc caccccctga agagtttgcc aatgggatcc tgctgaccac cccgccccca 900 gggccgggcc ccttgcccac cacggtaccc agcccggcct cagggaagcc cagcagcgag 960 ctgccccctg cccctgagtc tgcagctgac tctggagtag aggaggctga cactcgaagc 1020 tccagtgacc cccacctgga gaccacaagc accatttcca cagtgtccag catgtccacc 1080 ctgagctcgg agagtgggga actcacggac acccacacct cctttgccga tggacacact 1140 tttctactcg agaagccacc agtgcctccc aagcccaagc tcaagtcccc gctggggaag 1200 gggccggtga ccttcaggga cccgctgctg aagcaatcct cggacagtga gctcatggcc 1260 cagcagcacc atgctgcctc tactgggttg gcttctgctg ctgggcccgc ccgccctcgc 1320 tacctcttcc agagaaggtc caagctgtgg ggggaccccg tggagagtcg ggggctccct 1380 gggcctgaag atgacaaacc aactgtgatc agtgagctca gctcccgtct gcagcagctg 1440 aataaagaca cacgctcctt gggggaggaa ccagttggtg gcctgggcag cctgctggac 1500 cctgctaaga agtcacccat tgcagcagct cggctcttca gcagcctcgg tgagctgagc 1560 accatctcag cgcagcgcag cccggggggc ccgggcggag gggcctccta ctcggtgcgg 1620 cccagcggcc ggtaccccgt ggcgagacga gccccgagcc cagtgaaacc cgcatcgctg 1680 gagcgggtgg aggggctggg ggcgggcgtg ggaggcgcgg ggcggccctt cggcctcacg 1740 cctcccacca tcctcaagtc gtccagcctc tccatcccgc acgaacccaa ggaagtgcgc 1800 ttcgtggtgc gaagtgtgag tgcgcgcagc cgctccccct caccatctcc gctgccctcg 1860 ccttctcccg gctctggccc cagtgccggc ccgcgtcggc catttcaaca gaagcccctg 1920 cagctctgga gcaagttcga tgtgggcgac tggctggaga gcatccactt aggcgagcac 1980 cgagaccgct tcgaggacca tgagatcgaa ggcgcacacc tgcctgcgct caccaaggaa 2040 gacttcgtgg agctgggcgt cacacgcgtt ggccaccgca tgaacatcga gcgtgcgctc 2100 aggcagctgg atggcagctg a 2121 <210> 2 <211> 2124 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 2 atgggcccga agcggaaact ttacagcgcc gtccccggcc gcaagttcat cgccgtgaag 60 gcgcacagcc cgcagggtga aggcgagatc ccgctgcacc gcggcgaggc cgtgaaggtg 120 ctcagcattg gggagggcgg tttctgggag ggaaccgtga aaggccgcac gggctggttc 180 ccggccgact gcgtggagga agtgcagatg aggcagcatg acacacggcc tgaaacgcgg 240 gaggaccgga cgaagcggct ctttcggcac tacacagtgg gctcctacga cagcctcacc 300 tcacacagcg attatgtcat tgatgacaaa gtggctgtcc tgcagaaacg ggaccacgag 360 ggctttggtt ttgtgctccg gggagccaaa gcagagaccc ccatcgagga gttcacgccc 420 acgccagcct tcccggcgct gcagtatctc gagtcggtgg acgtggaggg tgtggcctgg 480 agggccgggc tgcgcacggg agacttcctc atcgaggtga acggggtgaa cgtggtgaag 540 gtcggacaca agcaggtggt ggctctgatt cgccagggtg gcaaccgcct cgtcatgaag 600 gttgtgtctg tgacaaggaa gccagaagag gacggggctc ggcgcagagc cccaccgccc 660 cccaagaggg cccccagcac cacactgacc ctgcgctcca agtccatgac agctgagctc 720 gaggaacttg cctccattcg gagctcagag gaagagccag agctggtgtt tgctgtgaac 780 ctgccacctg cccagctgtc gtccagcgat gaggagacca gggaggagct ggcccgaatt 840 gggttggtgc caccccctga agagtttgcc aacggggtcc tgctggccac cccactcgct 900 ggcccgggcc cctcgcccac cacggtgccc agcccggcct cagggaagcc cagcagtgag 960 ccaccccctg cccctgagtc tgcagccgac tctggggtgg aggaggctga cacacgcagc 1020 tccagcgacc cccacctgga gaccacaagc accatctcca cggtgtccag catgtccacc 1080 ttgagctcgg agagcgggga actcactgac acccacacct ccttcgctga cggacacact 1140 tttctactcg agaagccacc agtgcctccc aagcccaagc tcaagtcccc gctggggaag 1200 gggccggtga ccttcaggga cccgctgctg aagcagtcct cggacagcga gctcatggcc 1260 cagcagcacc acgccgcctc tgccgggctg gcctctgccg ccgggcctgc ccgccctcgc 1320 tacctcttcc agagaaggtc caagctatgg ggggaccccg tggagagccg ggggctccct 1380 gggcctgaag acgacaaacc aactgtgatc agtgagctca gctcccgcct gcagcagctg 1440 aacaaggaca cgcgttccct gggggaggaa ccagttggtg gcctgggcag cctgctggac 1500 cctgccaaga agtcgcccat cgcagcagct cggctcttca gcagcctcgg tgagctgagc 1560 tccatttcag cgcagcgcag ccccgggggc ccgggcggcg gggcctcgta ctcggtgagg 1620 cccagtggcc gctaccccgt ggcgagacgc gccccgagcc cggtgaagcc cgcgtcgctg 1680 gagcgggtgg aggggctggg ggcgggcgcg gggggcgcag ggcggccctt cggcctcacg 1740 ccccccacca tcctcaagtc gtccagcctc tccatcccgc acgagcccaa ggaggtgcgc 1800 ttcgtggtgc gcagcgtgag cgcgcgcagt cgctccccct cgccgtcgcc gctgccctcg 1860 cccgcgtccg gccccggccc cggcgccccc ggcccacgcc gacccttcca gcagaagccg 1920 ctgcagctct ggagcaagtt cgacgtgggc gactggctgg agagcatcca cctaggcgag 1980 caccgcgacc gcttcgagga ccatgagata gaaggcgcgc acctacccgc gcttaccaag 2040 gacgacttcg tggagctggg cgtcacgcgc gtgggccacc gcatgaacat cgagcgcgcg 2100 ctcaggcagc tggacggcag ctga 2124 <210> 3 <211> 3276 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 3 atggacggcc ccggggccag cgccgtggtc gtgcgcgtcg gcatcccgga cctgcaacaa 60 acgaagtgcc tgcgtctgga cccaaccgcg cccgtgtggg ccgccaagca gcgtgtgctc 120 tgcgccctca atcatagcct tcaagacgcg ctcaactacg ggctattcca gcctccctcc 180 cggggtcgcg ccggcaagtt cctggatgaa gagcggctct tacaggacta cccgcctaac 240 ctggacacgc ccctgcccta tctggagttc cgatacaagc ggagagttta tgcccagaac 300 ctcatagatg acaagcagtt tgcaaagcta cacacaaagg caaacctgaa gaagttcatg 360 gactatgtcc agctacacag cacagataag gtggcccgcc tgctggacaa ggggctggac 420 cccaatttcc atgaccctga ctcaggagag tgccctctga gccttgcggc acagttggac 480 aacgccactg acctcctgaa ggttctccgc aacggcggtg ctcatctgga cttccggacc 540 cgagatgggc tgacagccgt ccactgtgct acccgccagc ggaacgcagg ggcattgacg 600 accctgctgg acctgggggc ttcgcctgac tacaaggaca gccgcggcct gacgcccctg 660 taccatagtg ccctaggggg cggggatgcc ctctgttgcg agctgcttct ccatgatcat 720 gcacagctgg ggaccactga tgagaatggt tggcaagaga tccatcaggc ctgtcgcttt 780 ggacacgtgc agcacctgga gcaccttttg ttctatgggg ccaacatggg tgctcagaat 840 gcctcgggaa acacagccct gcacatctgt gccctctaca accaggagag ttgcgcgcgc 900 gtcctgcttt tccgtggtgc caacaaggac gtccgcaatt acaacagcca gacagccttc 960 caggtggcca ttattgcagg gaactttgag cttgccgagg taatcaagac ccacaaagac 1020 tccgatgtcg taccattcag ggaaaccccc agctatgcaa agcgacggcg tctggctggc 1080 ccgagtggcc tggcatcccc acggccctta cagcgctcag ccagtgatat caacctgaaa 1140 ggtgcgccgc cgccccgggg cccgaagcgg aaactttaca gtgccgtccc cggccgcaag 1200 ttcatcgctg tgaaggcgca cagcccgcag ggcgagggcg agatcccgct gcaccgcggc 1260 gaggccgtga aggtgctcag cattggggag ggcggtttct gggagggaac cgtgaagggc 1320 cgaacaggct ggttcccagc tgactgtgtg gaagaagtgc agatgcgaca gtatgacacc 1380 cggcatgaaa ccagagagga ccggacgaag cgtctcttcc gccactacac tgtgggttcc 1440 tatgacagcc tcacttcaca cagcgattat gtcatcgatg ataaggtggc tatcctgcag 1500 aaaagggacc atgaggggtt tggctttgtt ctccggggag ccaaagcaga gacccccatt 1560 gaggagttta cacccacacc tgccttccct gcactccaat accttgagtc tgtagatgtg 1620 gaaggtgtgg cctggagggc tggacttcga actggggact tcctcattga ggtgaacgga 1680 gtgaatgtcg tgaaggttgg acacaagcaa gtggtgggtc tcatccgtca gggtggcaac 1740 cgcctggtca tgaaggttgt gtctgtgacc aggaaacccg aggaggatgg tgctcggcgc 1800 agagccccac cacccccaaa gagggctccc agcaccacgc tgaccctgcg gtccaagtcc 1860 atgacggctg agctcgagga acttgcttcc attcggagct cagaggagga gccagagctg 1920 gtattcgctg tgaacctgcc acctgctcag ctgtcctcca gcgatgagga gaccagagag 1980 gagctggccc gcatagggct agtgccaccc cctgaagagt ttgccaatgg gatcctgctg 2040 accaccccgc ccccagggcc gggccccttg cccaccacgg tacccagccc ggcctcaggg 2100 aagcccagca gcgagctgcc ccctgcccct gagtctgcag ctgactctgg agtagaggag 2160 gctgacactc gaagctccag tgacccccac ctggagacca caagcaccat ttccacagtg 2220 tccagcatgt ccaccctgag ctcggagagt ggggaactca cggacaccca cacctccttt 2280 gccgatggac acacttttct actcgagaag ccaccagtgc ctcccaagcc caagctcaag 2340 tccccgctgg ggaaggggcc ggtgaccttc agggacccgc tgctgaagca atcctcggac 2400 agtgagctca tggcccagca gcaccatgct gcctctactg ggttggcttc tgctgctggg 2460 cccgcccgcc ctcgctacct cttccagaga aggtccaagc tgtgggggga ccccgtggag 2520 agtcgggggc tccctgggcc tgaagatgac aaaccaactg tgatcagtga gctcagctcc 2580 cgtctgcagc agctgaataa agacacacgc tccttggggg aggaaccagt tggtggcctg 2640 ggcagcctgc tggaccctgc taagaagtca cccattgcag cagctcggct cttcagcagc 2700 ctcggtgagc tgagcaccat ctcagcgcag cgcagcccgg ggggcccggg cggaggggcc 2760 tcctactcgg tgcggcccag cggccggtac cccgtggcga gacgagcccc gagcccagtg 2820 aaacccgcat cgctggagcg ggtggagggg ctgggggcgg gcgtgggagg cgcggggcgg 2880 cccttcggcc tcacgcctcc caccatcctc aagtcgtcca gcctctccat cccgcacgaa 2940 cccaaggaag tgcgcttcgt ggtgcgaagt gtgagtgcgc gcagccgctc cccctcacca 3000 tctccgctgc cctcgccttc tcccggctct ggccccagtg ccggcccgcg tcggccattt 3060 caacagaagc ccctgcagct ctggagcaag ttcgatgtgg gcgactggct ggagagcatc 3120 cacttaggcg agcaccgaga ccgcttcgag gaccatgaga tcgaaggcgc acacctgcct 3180 gcgctcacca aggaagactt cgtggagctg ggcgtcacac gcgttggcca ccgcatgaac 3240 atcgagcgtg cgctcaggca gctggatggc agctga 3276 <210> 4 <211> 3279 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 4 atggacggcc ccggggccag cgccgtggtc gtgcgcgtcg gcatcccgga cctgcagcag 60 acgaagtgcc tgcgcctgga cccggccgcg cccgtgtggg ccgccaagca gcgcgtgctc 120 tgcgccctca accacagcct ccaggacgcg ctcaactatg ggcttttcca gccgccctcc 180 cggggccgcg ccggcaagtt cctggatgag gagcggctcc tgcaggagta cccgcccaac 240 ctggacacgc ccctgcccta cctggagttt cgatacaagc ggcgagttta tgcccagaac 300 ctcatcgatg ataagcagtt tgcaaagctt cacacaaagg cgaacctgaa gaagttcatg 360 gactacgtcc agctgcatag cacggacaag gtggcacgcc tgttggacaa ggggctggac 420 cccaacttcc atgaccctga ctcaggagag tgccccctga gcctcgcagc ccagctggac 480 aacgccacgg acctgctaaa ggtgctgaag aatggtggtg cccacctgga cttccgcact 540 cgcgatgggc tcactgccgt gcactgtgcc acacgccagc ggaatgcggc agcactgacg 600 accctgctgg acctgggggc ttcacctgac tacaaggaca gccgcggctt gacacccctc 660 taccacagcg ccctgggggg tggggatgcc ctctgctgtg agctgcttct ccacgaccac 720 gctcagctgg ggatcaccga cgagaatggc tggcaggaga tccaccaggc ctgccgcttt 780 gggcacgtgc agcatctgga gcacctgctg ttctatgggg cagacatggg ggcccagaac 840 gcctcgggga acacagccct gcacatctgt gccctctaca accaggagag ctgtgctcgt 900 gtcctgctct tccgtggagc taacagggat gtccgcaact acaacagcca gacagccttc 960 caggtggcca tcatcgcagg gaactttgag cttgcagagg ttatcaagac ccacaaagac 1020 tcggatgttg taccattcag ggaaaccccc agctatgcga agcggcggcg actggctggc 1080 cccagtggct tggcatcccc tcggcctctg cagcgctcag ccagcgatat caacctgaag 1140 ggggcaccgc cgccccgggg cccgaagcgg aaactttaca gcgccgtccc cggccgcaag 1200 ttcatcgccg tgaaggcgca cagcccgcag ggtgaaggcg agatcccgct gcaccgcggc 1260 gaggccgtga aggtgctcag cattggggag ggcggtttct gggagggaac cgtgaaaggc 1320 cgcacgggct ggttcccggc cgactgcgtg gaggaagtgc agatgaggca gcatgacaca 1380 cggcctgaaa cgcgggagga ccggacgaag cggctctttc ggcactacac agtgggctcc 1440 tacgacagcc tcacctcaca cagcgattat gtcattgatg acaaagtggc tgtcctgcag 1500 aaacgggacc acgagggctt tggttttgtg ctccggggag ccaaagcaga gacccccatc 1560 gaggagttca cgcccacgcc agccttcccg gcgctgcagt atctcgagtc ggtggacgtg 1620 gagggtgtgg cctggagggc cgggctgcgc acgggagact tcctcatcga ggtgaacggg 1680 gtgaacgtgg tgaaggtcgg acacaagcag gtggtggctc tgattcgcca gggtggcaac 1740 cgcctcgtca tgaaggttgt gtctgtgaca aggaagccag aagaggacgg ggctcggcgc 1800 agagccccac cgccccccaa gagggccccc agcaccacac tgaccctgcg ctccaagtcc 1860 atgacagctg agctcgagga acttgcctcc attcggagct cagaggaaga gccagagctg 1920 gtgtttgctg tgaacctgcc acctgcccag ctgtcgtcca gcgatgagga gaccagggag 1980 gagctggccc gaattgggtt ggtgccaccc cctgaagagt ttgccaacgg ggtcctgctg 2040 gccaccccac tcgctggccc gggcccctcg cccaccacgg tgcccagccc ggcctcaggg 2100 aagcccagca gtgagccacc ccctgcccct gagtctgcag ccgactctgg ggtggaggag 2160 gctgacacac gcagctccag cgacccccac ctggagacca caagcaccat ctccacggtg 2220 tccagcatgt ccaccttgag ctcggagagc ggggaactca ctgacaccca cacctccttc 2280 gctgacggac acacttttct actcgagaag ccaccagtgc ctcccaagcc caagctcaag 2340 tccccgctgg ggaaggggcc ggtgaccttc agggacccgc tgctgaagca gtcctcggac 2400 agcgagctca tggcccagca gcaccacgcc gcctctgccg ggctggcctc tgccgccggg 2460 cctgcccgcc ctcgctacct cttccagaga aggtccaagc tatgggggga ccccgtggag 2520 agccgggggc tccctgggcc tgaagacgac aaaccaactg tgatcagtga gctcagctcc 2580 cgcctgcagc agctgaacaa ggacacgcgt tccctggggg aggaaccagt tggtggcctg 2640 ggcagcctgc tggaccctgc caagaagtcg cccatcgcag cagctcggct cttcagcagc 2700 ctcggtgagc tgagctccat ttcagcgcag cgcagccccg ggggcccggg cggcggggcc 2760 tcgtactcgg tgaggcccag tggccgctac cccgtggcga gacgcgcccc gagcccggtg 2820 aagcccgcgt cgctggagcg ggtggagggg ctgggggcgg gcgcgggggg cgcagggcgg 2880 cccttcggcc tcacgccccc caccatcctc aagtcgtcca gcctctccat cccgcacgag 2940 cccaaggagg tgcgcttcgt ggtgcgcagc gtgagcgcgc gcagtcgctc cccctcgccg 3000 tcgccgctgc cctcgcccgc gtccggcccc ggccccggcg cccccggccc acgccgaccc 3060 ttccagcaga agccgctgca gctctggagc aagttcgacg tgggcgactg gctggagagc 3120 atccacctag gcgagcaccg cgaccgcttc gaggaccatg agatagaagg cgcgcaccta 3180 cccgcgctta ccaaggacga cttcgtggag ctgggcgtca cgcgcgtggg ccaccgcatg 3240 aacatcgagc gcgcgctcag gcagctggac ggcagctga 3279 <210> 5 <211> 1730 <212> PRT <213> Mus musculus <400> 5 Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro 1 5 10 15 Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Thr Ala Pro Val 20 25 30 Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln 35 40 45 Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala 50 55 60 Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Asp Tyr Pro Pro Asn 65 70 75 80 Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val 85 90 95 Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr 100 105 110 Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr 115 120 125 Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His 130 135 140 Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp 145 150 155 160 Asn Ala Thr Asp Leu Leu Lys Val Leu Arg Asn Gly Gly Ala His Leu 165 170 175 Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg 180 185 190 Gln Arg Asn Ala Gly Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser 195 200 205 Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala 210 215 220 Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His 225 230 235 240 Ala Gln Leu Gly Thr Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln 245 250 255 Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr 260 265 270 Gly Ala Asn Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His 275 280 285 Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe 290 295 300 Arg Gly Ala Asn Lys Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe 305 310 315 320 Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys 325 330 335 Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr 340 345 350 Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg 355 360 365 Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Asp Gln Pro 370 375 380 Ala Ala Ser Pro Gly Pro Thr Leu Arg Ser Leu Pro His Gln Leu Leu 385 390 395 400 Leu Gln Arg Leu Gln Glu Glu Lys Asp Arg Asp Arg Asp Gly Glu Leu 405 410 415 Glu Asn Asp Ile Ser Gly Pro Ser Ala Gly Arg Gly Gly His Asn Lys 420 425 430 Ile Ser Pro Ser Gly Pro Gly Gly Ser Gly Pro Ala Pro Gly Pro Gly 435 440 445 Pro Ala Ser Pro Ala Pro Pro Ala Pro Pro Pro Arg Gly Pro Lys Arg 450 455 460 Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe Ile Ala Val Lys Ala 465 470 475 480 His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu His Arg Gly Glu Ala 485 490 495 Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe Trp Glu Gly Thr Val 500 505 510 Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys Val Glu Glu Val Gln 515 520 525 Met Arg Gln Tyr Asp Thr Arg His Glu Thr Arg Glu Asp Arg Thr Lys 530 535 540 Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr Asp Ser Leu Thr Ser 545 550 555 560 His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala Ile Leu Gln Lys Arg 565 570 575 Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly Ala Lys Ala Glu Thr 580 585 590 Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe Pro Ala Leu Gln Tyr 595 600 605 Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp Arg Ala Gly Leu Arg 610 615 620 Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val Asn Val Val Lys Val 625 630 635 640 Gly His Lys Gln Val Val Gly Leu Ile Arg Gln Gly Gly Asn Arg Leu 645 650 655 Val Met Lys Val Val Ser Val Thr Arg Lys Pro Glu Glu Asp Gly Ala 660 665 670 Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala Pro Ser Thr Thr Leu 675 680 685 Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu Glu Glu Leu Ala Ser 690 695 700 Ile Arg Arg Arg Lys Gly Glu Lys Leu Asp Glu Ile Leu Ala Val Ala 705 710 715 720 Ala Glu Pro Thr Leu Arg Pro Asp Ile Ala Asp Ala Asp Ser Arg Ala 725 730 735 Ala Thr Val Lys Gln Arg Pro Thr Ser Arg Arg Ile Thr Pro Ala Glu 740 745 750 Ile Ser Ser Leu Phe Glu Arg Gln Gly Leu Pro Gly Pro Glu Lys Leu 755 760 765 Pro Gly Ser Leu Arg Lys Gly Ile Pro Arg Thr Lys Ser Val Gly Glu 770 775 780 Asp Glu Lys Leu Ala Ser Leu Leu Glu Gly Arg Phe Pro Arg Ser Thr 785 790 795 800 Ser Met Gln Asp Thr Val Arg Glu Gly Arg Gly Ile Pro Pro Pro Pro 805 810 815 Gln Thr Ala Pro Pro Pro Pro Pro Ala Pro Tyr Tyr Phe Asp Ser Gly 820 825 830 Pro Pro Pro Thr Phe Ser Pro Pro Pro Pro Pro Gly Arg Ala Tyr Asp 835 840 845 Thr Val Arg Ser Ser Phe Lys Pro Gly Leu Glu Ala Arg Leu Gly Ala 850 855 860 Gly Ala Ala Gly Leu Tyr Asp Pro Ser Thr Pro Leu Gly Pro Leu Pro 865 870 875 880 Tyr Pro Glu Arg Gln Lys Arg Ala Arg Ser Met Ile Ile Leu Gln Asp 885 890 895 Ser Ala Pro Glu Val Gly Asp Val Pro Arg Pro Ala Pro Ala Ala Thr 900 905 910 Pro Pro Glu Arg Pro Lys Arg Arg Pro Arg Pro Ser Gly Pro Asp Ser 915 920 925 Pro Tyr Ala Asn Leu Gly Ala Phe Ser Ala Ser Leu Phe Ala Pro Ser 930 935 940 Lys Pro Gln Arg Arg Lys Ser Pro Leu Val Lys Gln Leu Gln Val Glu 945 950 955 960 Asp Ala Gln Glu Arg Ala Ala Leu Ala Val Gly Ser Pro Gly Pro Val 965 970 975 Gly Gly Ser Phe Ala Arg Glu Pro Ser Pro Thr His Arg Gly Pro Arg 980 985 990 Pro Gly Ser Leu Asp Tyr Ser Ser Gly Glu Gly Leu Gly Leu Thr Phe 995 1000 1005 Gly Gly Pro Ser Pro Gly Pro Val Lys Glu Arg Arg Leu Glu Glu 1010 1015 1020 Arg Arg Arg Ser Thr Val Phe Leu Ser Val Gly Ala Ile Glu Gly 1025 1030 1035 Ser Pro Pro Ser Ala Asp Leu Pro Ser Leu Gln Pro Ser Arg Ser 1040 1045 1050 Ile Asp Glu Arg Leu Leu Gly Thr Gly Ala Thr Thr Gly Arg Asp 1055 1060 1065 Leu Leu Leu Pro Ser Pro Val Ser Ala Leu Lys Pro Leu Val Gly 1070 1075 1080 Gly Pro Ser Leu Gly Pro Ser Gly Ser Thr Phe Ile His Pro Leu 1085 1090 1095 Thr Gly Lys Pro Leu Asp Pro Ser Ser Pro Leu Ala Leu Ala Leu 1100 1105 1110 Ala Ala Arg Glu Arg Ala Leu Ala Ser Gln Thr Pro Ser Arg Ser 1115 1120 1125 Pro Thr Pro Val His Ser Pro Asp Ala Asp Arg Pro Gly Pro Leu 1130 1135 1140 Phe Val Asp Val Gln Thr Arg Asp Ser Glu Arg Gly Pro Leu Ala 1145 1150 1155 Ser Pro Ala Phe Ser Pro Arg Ser Pro Ala Trp Ile Pro Val Pro 1160 1165 1170 Ala Arg Arg Glu Ala Glu Lys Pro Pro Arg Glu Glu Arg Lys Ser 1175 1180 1185 Pro Glu Asp Lys Lys Ser Met Ile Leu Ser Val Leu Asp Thr Ser 1190 1195 1200 Leu Gln Arg Pro Ala Gly Leu Ile Val Val His Ala Thr Ser Asn 1205 1210 1215 Gly Gln Glu Pro Ser Arg Leu Gly Ala Glu Glu Glu Arg Pro Gly 1220 1225 1230 Thr Pro Glu Leu Ala Pro Ala Pro Met Gln Ala Ala Ala Val Ala 1235 1240 1245 Glu Pro Met Pro Ser Pro Arg Ala Gln Pro Pro Gly Ser Ile Pro 1250 1255 1260 Ala Asp Pro Gly Pro Gly Gln Gly Ser Ser Glu Glu Glu Pro Glu 1265 1270 1275 Leu Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser 1280 1285 1290 Asp Glu Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro 1295 1300 1305 Pro Pro Glu Glu Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro 1310 1315 1320 Pro Gly Pro Gly Pro Leu Pro Thr Thr Val Pro Ser Pro Ala Ser 1325 1330 1335 Gly Lys Pro Ser Ser Glu Leu Pro Pro Ala Pro Glu Ser Ala Ala 1340 1345 1350 Asp Ser Gly Val Glu Glu Ala Asp Thr Arg Ser Ser Ser Asp Pro 1355 1360 1365 His Leu Glu Thr Thr Ser Thr Ile Ser Thr Val Ser Ser Met Ser 1370 1375 1380 Thr Leu Ser Ser Glu Ser Gly Glu Leu Thr Asp Thr His Thr Ser 1385 1390 1395 Phe Ala Asp Gly His Thr Phe Leu Leu Glu Lys Pro Pro Val Pro 1400 1405 1410 Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys Gly Pro Val Thr 1415 1420 1425 Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser Glu Leu Met 1430 1435 1440 Ala Gln Gln His His Ala Ala Ser Thr Gly Leu Ala Ser Ala Ala 1445 1450 1455 Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys Leu 1460 1465 1470 Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp 1475 1480 1485 Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln 1490 1495 1500 Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly 1505 1510 1515 Leu Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala 1520 1525 1530 Ala Arg Leu Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala 1535 1540 1545 Gln Arg Ser Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val 1550 1555 1560 Arg Pro Ser Gly Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro 1565 1570 1575 Val Lys Pro Ala Ser Leu Glu Arg Val Glu Gly Leu Gly Ala Gly 1580 1585 1590 Val Gly Gly Ala Gly Arg Pro Phe Gly Leu Thr Pro Pro Thr Ile 1595 1600 1605 Leu Lys Ser Ser Ser Leu Ser Ile Pro His Glu Pro Lys Glu Val 1610 1615 1620 Arg Phe Val Val Arg Ser Val Ser Ala Arg Ser Arg Ser Pro Ser 1625 1630 1635 Pro Ser Pro Leu Pro Ser Pro Ser Pro Gly Ser Gly Pro Ser Ala 1640 1645 1650 Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro Leu Gln Leu Trp Ser 1655 1660 1665 Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile His Leu Gly Glu 1670 1675 1680 His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly Ala His Leu 1685 1690 1695 Pro Ala Leu Thr Lys Glu Asp Phe Val Glu Leu Gly Val Thr Arg 1700 1705 1710 Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu Asp 1715 1720 1725 Gly Ser 1730 <210> 6 <211> 1731 <212> PRT <213> Homo sapiens <400> 6 Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro 1 5 10 15 Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Ala Ala Pro Val 20 25 30 Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln 35 40 45 Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala 50 55 60 Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Glu Tyr Pro Pro Asn 65 70 75 80 Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val 85 90 95 Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr 100 105 110 Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr 115 120 125 Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His 130 135 140 Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp 145 150 155 160 Asn Ala Thr Asp Leu Leu Lys Val Leu Lys Asn Gly Gly Ala His Leu 165 170 175 Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg 180 185 190 Gln Arg Asn Ala Ala Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser 195 200 205 Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala 210 215 220 Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His 225 230 235 240 Ala Gln Leu Gly Ile Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln 245 250 255 Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr 260 265 270 Gly Ala Asp Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His 275 280 285 Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe 290 295 300 Arg Gly Ala Asn Arg Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe 305 310 315 320 Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys 325 330 335 Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr 340 345 350 Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg 355 360 365 Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Glu Ala Gln 370 375 380 Pro Ala Ala Ser Pro Gly Pro Ser Leu Arg Ser Leu Pro His Gln Leu 385 390 395 400 Leu Leu Gln Arg Leu Gln Glu Glu Lys Asp Arg Asp Arg Asp Ala Asp 405 410 415 Gln Glu Ser Asn Ile Ser Gly Pro Leu Ala Gly Arg Ala Gly Gln Ser 420 425 430 Lys Ile Ser Pro Ser Gly Pro Gly Gly Pro Gly Pro Ala Pro Gly Pro 435 440 445 Gly Pro Ala Pro Pro Ala Pro Pro Ala Pro Pro Pro Arg Gly Pro Lys 450 455 460 Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe Ile Ala Val Lys 465 470 475 480 Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu His Arg Gly Glu 485 490 495 Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe Trp Glu Gly Thr 500 505 510 Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys Val Glu Glu Val 515 520 525 Gln Met Arg Gln His Asp Thr Arg Pro Glu Thr Arg Glu Asp Arg Thr 530 535 540 Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr Asp Ser Leu Thr 545 550 555 560 Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala Val Leu Gln Lys 565 570 575 Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly Ala Lys Ala Glu 580 585 590 Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe Pro Ala Leu Gln 595 600 605 Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp Arg Ala Gly Leu 610 615 620 Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val Asn Val Val Lys 625 630 635 640 Val Gly His Lys Gln Val Val Ala Leu Ile Arg Gln Gly Gly Asn Arg 645 650 655 Leu Val Met Lys Val Val Ser Val Thr Arg Lys Pro Glu Glu Asp Gly 660 665 670 Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala Pro Ser Thr Thr 675 680 685 Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu Glu Glu Leu Ala 690 695 700 Ser Ile Arg Arg Arg Lys Gly Glu Lys Leu Asp Glu Met Leu Ala Ala 705 710 715 720 Ala Ala Glu Pro Thr Leu Arg Pro Asp Ile Ala Asp Ala Asp Ser Arg 725 730 735 Ala Ala Thr Val Lys Gln Arg Pro Thr Ser Arg Arg Ile Thr Pro Ala 740 745 750 Glu Ile Ser Ser Leu Phe Glu Arg Gln Gly Leu Pro Gly Pro Glu Lys 755 760 765 Leu Pro Gly Ser Leu Arg Lys Gly Ile Pro Arg Thr Lys Ser Val Gly 770 775 780 Glu Asp Glu Lys Leu Ala Ser Leu Leu Glu Gly Arg Phe Pro Arg Ser 785 790 795 800 Thr Ser Met Gln Asp Pro Val Arg Glu Gly Arg Gly Ile Pro Pro Pro 805 810 815 Pro Gln Thr Ala Pro Pro Pro Pro Pro Ala Pro Tyr Tyr Phe Asp Ser 820 825 830 Gly Pro Pro Pro Ala Phe Ser Pro Pro Pro Pro Pro Gly Arg Ala Tyr 835 840 845 Asp Thr Val Arg Ser Ser Phe Lys Pro Gly Leu Glu Ala Arg Leu Gly 850 855 860 Ala Gly Ala Ala Gly Leu Tyr Glu Pro Gly Ala Ala Leu Gly Pro Leu 865 870 875 880 Pro Tyr Pro Glu Arg Gln Lys Arg Ala Arg Ser Met Ile Ile Leu Gln 885 890 895 Asp Ser Ala Pro Glu Ser Gly Asp Ala Pro Arg Pro Pro Pro Ala Ala 900 905 910 Thr Pro Pro Glu Arg Pro Lys Arg Arg Pro Arg Pro Pro Gly Pro Asp 915 920 925 Ser Pro Tyr Ala Asn Leu Gly Ala Phe Ser Ala Ser Leu Phe Ala Pro 930 935 940 Ser Lys Pro Gln Arg Arg Lys Ser Pro Leu Val Lys Gln Leu Gln Val 945 950 955 960 Glu Asp Ala Gln Glu Arg Ala Ala Leu Ala Val Gly Ser Pro Gly Pro 965 970 975 Gly Gly Gly Ser Phe Ala Arg Glu Pro Ser Pro Thr His Arg Gly Pro 980 985 990 Arg Pro Gly Gly Leu Asp Tyr Gly Ala Gly Asp Gly Pro Gly Leu Ala 995 1000 1005 Phe Gly Gly Pro Gly Pro Ala Lys Asp Arg Arg Leu Glu Glu Arg 1010 1015 1020 Arg Arg Ser Thr Val Phe Leu Ser Val Gly Ala Ile Glu Gly Ser 1025 1030 1035 Ala Pro Gly Ala Asp Leu Pro Ser Leu Gln Pro Ser Arg Ser Ile 1040 1045 1050 Asp Glu Arg Leu Leu Gly Thr Gly Pro Thr Ala Gly Arg Asp Leu 1055 1060 1065 Leu Leu Pro Ser Pro Val Ser Ala Leu Lys Pro Leu Val Ser Gly 1070 1075 1080 Pro Ser Leu Gly Pro Ser Gly Ser Thr Phe Ile His Pro Leu Thr 1085 1090 1095 Gly Lys Pro Leu Asp Pro Ser Ser Pro Leu Ala Leu Ala Leu Ala 1100 1105 1110 Ala Arg Glu Arg Ala Leu Ala Ser Gln Ala Pro Ser Arg Ser Pro 1115 1120 1125 Thr Pro Val His Ser Pro Asp Ala Asp Arg Pro Gly Pro Leu Phe 1130 1135 1140 Val Asp Val Gln Ala Arg Asp Pro Glu Arg Gly Ser Leu Ala Ser 1145 1150 1155 Pro Ala Phe Ser Pro Arg Ser Pro Ala Trp Ile Pro Val Pro Ala 1160 1165 1170 Arg Arg Glu Ala Glu Lys Val Pro Arg Glu Glu Arg Lys Ser Pro 1175 1180 1185 Glu Asp Lys Lys Ser Met Ile Leu Ser Val Leu Asp Thr Ser Leu 1190 1195 1200 Gln Arg Pro Ala Gly Leu Ile Val Val His Ala Thr Ser Asn Gly 1205 1210 1215 Gln Glu Pro Ser Arg Leu Gly Gly Ala Glu Glu Glu Arg Pro Gly 1220 1225 1230 Thr Pro Glu Leu Ala Pro Ala Pro Met Gln Ser Ala Ala Val Ala 1235 1240 1245 Glu Pro Leu Pro Ser Pro Arg Ala Gln Pro Pro Gly Gly Thr Pro 1250 1255 1260 Ala Asp Ala Gly Pro Gly Gln Gly Ser Ser Glu Glu Glu Pro Glu 1265 1270 1275 Leu Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser 1280 1285 1290 Asp Glu Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro 1295 1300 1305 Pro Pro Glu Glu Phe Ala Asn Gly Val Leu Leu Ala Thr Pro Leu 1310 1315 1320 Ala Gly Pro Gly Pro Ser Pro Thr Thr Val Pro Ser Pro Ala Ser 1325 1330 1335 Gly Lys Pro Ser Ser Glu Pro Pro Pro Ala Pro Glu Ser Ala Ala 1340 1345 1350 Asp Ser Gly Val Glu Glu Ala Asp Thr Arg Ser Ser Ser Asp Pro 1355 1360 1365 His Leu Glu Thr Thr Ser Thr Ile Ser Thr Val Ser Ser Met Ser 1370 1375 1380 Thr Leu Ser Ser Glu Ser Gly Glu Leu Thr Asp Thr His Thr Ser 1385 1390 1395 Phe Ala Asp Gly His Thr Phe Leu Leu Glu Lys Pro Pro Val Pro 1400 1405 1410 Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys Gly Pro Val Thr 1415 1420 1425 Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser Glu Leu Met 1430 1435 1440 Ala Gln Gln His His Ala Ala Ser Ala Gly Leu Ala Ser Ala Ala 1445 1450 1455 Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys Leu 1460 1465 1470 Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp 1475 1480 1485 Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln 1490 1495 1500 Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly 1505 1510 1515 Leu Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala 1520 1525 1530 Ala Arg Leu Phe Ser Ser Leu Gly Glu Leu Ser Ser Ile Ser Ala 1535 1540 1545 Gln Arg Ser Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val 1550 1555 1560 Arg Pro Ser Gly Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro 1565 1570 1575 Val Lys Pro Ala Ser Leu Glu Arg Val Glu Gly Leu Gly Ala Gly 1580 1585 1590 Ala Gly Gly Ala Gly Arg Pro Phe Gly Leu Thr Pro Pro Thr Ile 1595 1600 1605 Leu Lys Ser Ser Ser Leu Ser Ile Pro His Glu Pro Lys Glu Val 1610 1615 1620 Arg Phe Val Val Arg Ser Val Ser Ala Arg Ser Arg Ser Pro Ser 1625 1630 1635 Pro Ser Pro Leu Pro Ser Pro Ala Ser Gly Pro Gly Pro Gly Ala 1640 1645 1650 Pro Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro Leu Gln Leu Trp 1655 1660 1665 Ser Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile His Leu Gly 1670 1675 1680 Glu His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly Ala His 1685 1690 1695 Leu Pro Ala Leu Thr Lys Asp Asp Phe Val Glu Leu Gly Val Thr 1700 1705 1710 Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu 1715 1720 1725 Asp Gly Ser 1730 <210> 7 <211> 7459 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 7 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180 ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240 acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300 atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360 cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420 gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480 ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540 gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600 cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660 atccttcgaa accggtgcta gcagcgctgt taacaccatg gtgagcaagg gcgaggagct 720 gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 780 cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat 840 ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg 900 cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc 960 catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 1020 gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 1080 catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 1140 ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat 1200 ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc 1260 catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct 1320 gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 1380 cgggatcact ctcggcatgg acgagctgta caagggaagc ggaggaattc acggcccgaa 1440 gcggaaactt tacagtgccg tccccggccg caagttcatc gctgtgaagg cgcacagccc 1500 gcagggcgag ggcgagatcc cgctgcaccg cggcgaggcc gtgaaggtgc tcagcattgg 1560 ggagggcggt ttctgggagg gaaccgtgaa gggccgaaca ggctggttcc cagctgactg 1620 tgtggaagaa gtgcagatgc gacagtatga cacccggcat gaaaccagag aggaccggac 1680 gaagcgtctc ttccgccact acactgtggg ttcctatgac agcctcactt cacacagcga 1740 ttatgtcatc gatgataagg tggctatcct gcagaaaagg gaccatgagg ggtttggctt 1800 tgttctccgg ggagccaaag cagagacccc cattgaggag tttacaccca cacctgcctt 1860 ccctgcactc caataccttg agtctgtaga tgtggaaggt gtggcctgga gggctggact 1920 tcgaactggg gacttcctca ttgaggtgaa cggagtgaat gtcgtgaagg ttggacacaa 1980 gcaagtggtg ggtctcatcc gtcagggtgg caaccgcctg gtcatgaagg ttgtgtctgt 2040 gaccaggaaa cccgaggagg atggtgctcg gcgcagagcc ccaccacccc caaagagggc 2100 tcccagcacc acgctgaccc tgcggtccaa gtccatgacg gctgagctcg aggaacttgc 2160 ttccattcgg agctcagagg aggagccaga gctggtattc gctgtgaacc tgccacctgc 2220 tcagctgtcc tccagcgatg aggagaccag agaggagctg gcccgcatag ggctagtgcc 2280 accccctgaa gagtttgcca atgggatcct gctgaccacc ccgcccccag ggccgggccc 2340 cttgcccacc acggtaccca gcccggcctc agggaagccc agcagcgagc tgccccctgc 2400 ccctgagtct gcagctgact ctggagtaga ggaggctgac actcgaagct ccagtgaccc 2460 ccacctggag accacaagca ccatttccac agtgtccagc atgtccaccc tgagctcgga 2520 gagtggggaa ctcacggaca cccacacctc ctttgccgat ggacacactt ttctactcga 2580 gaagccacca gtgcctccca agcccaagct caagtccccg ctggggaagg ggccggtgac 2640 cttcagggac ccgctgctga agcaatcctc ggacagtgag ctcatggccc agcagcacca 2700 tgctgcctct actgggttgg cttctgctgc tgggcccgcc cgccctcgct acctcttcca 2760 gagaaggtcc aagctgtggg gggaccccgt ggagagtcgg gggctccctg ggcctgaaga 2820 tgacaaacca actgtgatca gtgagctcag ctcccgtctg cagcagctga ataaagacac 2880 acgctccttg ggggaggaac cagttggtgg cctgggcagc ctgctggacc ctgctaagaa 2940 gtcacccatt gcagcagctc ggctcttcag cagcctcggt gagctgagca ccatctcagc 3000 gcagcgcagc ccggggggcc cgggcggagg ggcctcctac tcggtgcggc ccagcggccg 3060 gtaccccgtg gcgagacgag ccccgagccc agtgaaaccc gcatcgctgg agcgggtgga 3120 ggggctgggg gcgggcgtgg gaggcgcggg gcggcccttc ggcctcacgc ctcccaccat 3180 cctcaagtcg tccagcctct ccatcccgca cgaacccaag gaagtgcgct tcgtggtgcg 3240 aagtgtgagt gcgcgcagcc gctccccctc accatctccg ctgccctcgc cttctcccgg 3300 ctctggcccc agtgccggcc cgcgtcggcc atttcaacag aagcccctgc agctctggag 3360 caagttcgat gtgggcgact ggctggagag catccactta ggcgagcacc gagaccgctt 3420 cgaggaccat gagatcgaag gcgcacacct gcctgcgctc accaaggaag acttcgtgga 3480 gctgggcgtc acacgcgttg gccaccgcat gaacatcgag cgtgcgctca ggcagctgga 3540 tggcagctga gcggccatcg tcgacggcgc gccaagctta tcgataatca acctctggat 3600 tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 3660 ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 3720 tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 3780 caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 3840 accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 3900 ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 3960 tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgccta tgttgccacc 4020 tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 4080 ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag 4140 acgagtcgga tctccctttg ggccgcctcc ccgcatcgat accgagcgct gctcgagaga 4200 tctacgggtg gcatccctgt gacccctccc cagtgcctct cctggccctg gaagttgcca 4260 ctccagtgcc caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg 4320 tgtccttcta taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga 4380 agacaacctg tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat 4440 cttggctcac tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg 4500 agttgttggg attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga 4560 gacggggttt caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc 4620 caccttggcc tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc 4680 ttctgatttt gtaggtaacc acgtgcggac cgagcggccg caggaacccc tagtgatgga 4740 gttggccact ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc 4800 ccgacgcccg ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca 4860 ggggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatacg 4920 tcaaagcaac catagtacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt 4980 acgcgcagcg tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc 5040 ccttcctttc tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct 5100 ttagggttcc gatttagtgc tttacggcac ctcgacccca aaaaacttga tttgggtgat 5160 ggttcacgta gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc 5220 acgttcttta atagtggact cttgttccaa actggaacaa cactcaaccc tatctcgggc 5280 tattcttttg atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg 5340 atttaacaaa aatttaacgc gaattttaac aaaatattaa cgtttacaat tttatggtgc 5400 actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 5460 cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 5520 accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 5580 cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 5640 tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 5700 taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 5760 tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 5820 gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 5880 gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 5940 cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 6000 tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 6060 tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 6120 atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 6180 ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 6240 gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 6300 gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 6360 gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 6420 gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 6480 gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 6540 cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 6600 atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 6660 tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 6720 ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 6780 gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 6840 tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 6900 ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 6960 ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 7020 gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 7080 ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 7140 tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 7200 ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 7260 agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 7320 agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 7380 gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 7440 tggccttttg ctcacatgt 7459 <210> 8 <211> 5331 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 8 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180 ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240 acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300 atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360 cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420 gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480 ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540 gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600 cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660 atccttcgaa accggtgcta gcagcgctgt taacaccatg gtgagcaagg gcgaggagct 720 gttcaccggg gtggtgccca tcctggtcga gctggacggc gacgtaaacg gccacaagtt 780 cagcgtgtcc ggcgagggcg agggcgatgc cacctacggc aagctgaccc tgaagttcat 840 ctgcaccacc ggcaagctgc ccgtgccctg gcccaccctc gtgaccaccc tgacctacgg 900 cgtgcagtgc ttcagccgct accccgacca catgaagcag cacgacttct tcaagtccgc 960 catgcccgaa ggctacgtcc aggagcgcac catcttcttc aaggacgacg gcaactacaa 1020 gacccgcgcc gaggtgaagt tcgagggcga caccctggtg aaccgcatcg agctgaaggg 1080 catcgacttc aaggaggacg gcaacatcct ggggcacaag ctggagtaca actacaacag 1140 ccacaacgtc tatatcatgg ccgacaagca gaagaacggc atcaaggtga acttcaagat 1200 ccgccacaac atcgaggacg gcagcgtgca gctcgccgac cactaccagc agaacacccc 1260 catcggcgac ggccccgtgc tgctgcccga caaccactac ctgagcaccc agtccgccct 1320 gagcaaagac cccaacgaga agcgcgatca catggtcctg ctggagttcg tgaccgccgc 1380 cgggatcact ctcggcatgg acgagctgta caagtaaggc gcgcccctgc agggaattcg 1440 atatcaagct tatcgataat caacctctgg attacaaaat ttgtgaaaga ttgactggta 1500 ttcttaacta tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc 1560 atgctattgc ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt 1620 ctctttatga ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg 1680 ctgacgcaac ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt 1740 tcgctttccc cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct 1800 ggacaggggc tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt 1860 cctttccttg gctgctcgcc tatgttgcca cctggattct gcgcgggacg tccttctgct 1920 acgtcccttc ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc 1980 ggcctcttcc gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct 2040 ccccgcatcg ataccgagcg ctgctcgaga gatctacggg tggcatccct gtgacccctc 2100 cccagtgcct ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat 2160 aaaattaagt tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag 2220 gggggtggta tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta 2280 ttgggaacca agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg 2340 ggttcaagcg attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac 2400 caggctcagc taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct 2460 ggtctccaac tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt 2520 acaggcgtga accactgctc ccttccctgt ccttctgatt ttgtaggtaa ccacgtgcgg 2580 accgagcggc cgcaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc 2640 tcgctcactg aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc 2700 tcagtgagcg agcgagcgcg cagctgcctg caggggcgcc tgatgcggta ttttctcctt 2760 acgcatctgt gcggtatttc acaccgcata cgtcaaagca accatagtac gcgccctgta 2820 gcggcgcatt aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca 2880 gcgccctagc gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct 2940 ttccccgtca agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc 3000 acctcgaccc caaaaaactt gatttgggtg atggttcacg tagtgggcca tcgccctgat 3060 agacggtttt tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc 3120 aaactggaac aacactcaac cctatctcgg gctattcttt tgatttataa gggattttgc 3180 cgatttcggc ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta 3240 acaaaatatt aacgtttaca attttatggt gcactctcag tacaatctgc tctgatgccg 3300 catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 3360 tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 3420 ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt 3480 tataggttaa tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa 3540 atgtgcgcgg aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca 3600 tgagacaata accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc 3660 aacatttccg tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc 3720 acccagaaac gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt 3780 acatcgaact ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt 3840 ttccaatgat gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg 3900 ccgggcaaga gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact 3960 caccagtcac agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg 4020 ccataaccat gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga 4080 aggagctaac cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg 4140 aaccggagct gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa 4200 tggcaacaac gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac 4260 aattaataga ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc 4320 cggctggctg gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca 4380 ttgcagcact ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga 4440 gtcaggcaac tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta 4500 agcattggta actgtcagac caagtttact catatatact ttagattgat ttaaaacttc 4560 atttttaatt taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc 4620 cttaacgtga gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt 4680 cttgagatcc tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac 4740 cagcggtggt ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct 4800 tcagcagagc gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact 4860 tcaagaactc tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg 4920 ctgccagtgg cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata 4980 aggcgcagcg gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga 5040 cctacaccga actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag 5100 ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg 5160 agcttccagg gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac 5220 ttgagcgtcg atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca 5280 acgcggcctt tttacggttc ctggcctttt gctggccttt tgctcacatg t 5331 <210> 9 <211> 6369 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 9 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180 ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240 acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300 atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360 cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420 gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480 ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540 gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600 cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660 atccttcgaa accggtgcta gcaccatgcc taagaagaag agaaaggtat gcaggtcaca 720 ccaaaatttg cctgcattac cggtcgatgc aacgagtgat gaggttcgca agaacctgat 780 ggacatgttc agggatcgcc aggcgttttc tgagcatacc tggaaaatgc ttctgtccgt 840 ttgccggtcg tgggcggcat ggtgcaagtt gaataaccgg aaatggtttc ccgcagaacc 900 tgaagatgtt cgcgattatc ttctatatct tcaggcgcgc ggtctggcag taaaaactat 960 ccagcaacat ttgggccagc taaacatgct tcatcgtcgg tccgggctgc cacgaccaag 1020 tgacagcaat gctgtttcac tggttatgcg gcggatccga aaagaaaacg ttgatgccgg 1080 tgaacgtgca aaacaggctc tagcgttcga acgcactgat ttcgaccagg ttcgttcact 1140 catggaaaat agcgatcgct gccaggatat acgtaatctg gcatttctgg ggattgctta 1200 taacaccctg ttacgtatag ccgaaattgc caggatcagg gttaaagata tctcacgtac 1260 tgacggtggg agaatgttaa tccatattgg cagaacgaaa acgctggtta gcaccgcagg 1320 tgtagagaag gcacttagcc tgggggtaac taaactggtc gagcgatgga tttccgtctc 1380 tggtgtagct gatgatccga ataactacct gttttgccgg gtcagaaaaa atggtgttgc 1440 cgcgccatct gccaccagcc agctatcaac tcgcgccctg gaagggattt ttgaagcaac 1500 tcatcgattg atttacggcg ctaaggatga ctctggtcag agatacctgg cctggtctgg 1560 acacagtgcc cgtgtcggag ccgcgcgaga tatggcccgc gctggagttt caataccgga 1620 gatcatgcaa gctggtggct ggaccaatgt aaatattgtc atgaactata tccgtaacct 1680 ggatagtgaa acaggggcaa tggtgcgcct gctggaagat ggcgatgtta acgtgagcaa 1740 gggcgaggag ctgttcaccg gggtggtgcc catcctggtc gagctggacg gcgacgtaaa 1800 cggccacaag ttcagcgtgt ccggcgaggg cgagggcgat gccacctacg gcaagctgac 1860 cctgaagttc atctgcacca ccggcaagct gcccgtgccc tggcccaccc tcgtgaccac 1920 cctgacctac ggcgtgcagt gcttcagccg ctaccccgac cacatgaagc agcacgactt 1980 cttcaagtcc gccatgcccg aaggctacgt ccaggagcgc accatcttct tcaaggacga 2040 cggcaactac aagacccgcg ccgaggtgaa gttcgagggc gacaccctgg tgaaccgcat 2100 cgagctgaag ggcatcgact tcaaggagga cggcaacatc ctggggcaca agctggagta 2160 caactacaac agccacaacg tctatatcat ggccgacaag cagaagaacg gcatcaaggt 2220 gaacttcaag atccgccaca acatcgagga cggcagcgtg cagctcgccg accactacca 2280 gcagaacacc cccatcggcg acggccccgt gctgctgccc gacaaccact acctgagcac 2340 ccagtccgcc ctgagcaaag accccaacga gaagcgcgat cacatggtcc tgctggagtt 2400 cgtgaccgcc gccgggatca ctctcggcat ggacgagctg tacaagtaag tcgacggcgc 2460 gcccctgcag ggaattcgat atcaagctta tcgataatca acctctggat tacaaaattt 2520 gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt ggatacgctg 2580 ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc tcctccttgt 2640 ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg caacgtggcg 2700 tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc accacctgtc 2760 agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa ctcatcgccg 2820 cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat tccgtggtgt 2880 tgtcggggaa atcatcgtcc tttccttggc tgctcgccta tgttgccacc tggattctgc 2940 gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt ccttcccgcg 3000 gcctgctgcc ggctctgcgg cctcttccgc gtcttcgcct tcgccctcag acgagtcgga 3060 tctccctttg ggccgcctcc ccgcatcgat accgagcgct gctcgagaga tctacgggtg 3120 gcatccctgt gacccctccc cagtgcctct cctggccctg gaagttgcca ctccagtgcc 3180 caccagcctt gtcctaataa aattaagttg catcattttg tctgactagg tgtccttcta 3240 taatattatg gggtggaggg gggtggtatg gagcaagggg caagttggga agacaacctg 3300 tagggcctgc ggggtctatt gggaaccaag ctggagtgca gtggcacaat cttggctcac 3360 tgcaatctcc gcctcctggg ttcaagcgat tctcctgcct cagcctcccg agttgttggg 3420 attccaggca tgcatgacca ggctcagcta atttttgttt ttttggtaga gacggggttt 3480 caccatattg gccaggctgg tctccaactc ctaatctcag gtgatctacc caccttggcc 3540 tcccaaattg ctgggattac aggcgtgaac cactgctccc ttccctgtcc ttctgatttt 3600 gtaggtaacc acgtgcggac cgagcggccg caggaacccc tagtgatgga gttggccact 3660 ccctctctgc gcgctcgctc gctcactgag gccgggcgac caaaggtcgc ccgacgcccg 3720 ggctttgccc gggcggcctc agtgagcgag cgagcgcgca gctgcctgca ggggcgcctg 3780 atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatacg tcaaagcaac 3840 catagtacgc gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg 3900 tgaccgctac acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc 3960 tcgccacgtt cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc 4020 gatttagtgc tttacggcac ctcgacccca aaaaacttga tttgggtgat ggttcacgta 4080 gtgggccatc gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta 4140 atagtggact cttgttccaa actggaacaa cactcaaccc tatctcgggc tattcttttg 4200 atttataagg gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa 4260 aatttaacgc gaattttaac aaaatattaa cgtttacaat tttatggtgc actctcagta 4320 caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca cccgctgacg 4380 cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg accgtctccg 4440 ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga cgaaagggcc 4500 tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct tagacgtcag 4560 gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc taaatacatt 4620 caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa tattgaaaaa 4680 ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt gcggcatttt 4740 gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct gaagatcagt 4800 tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc cttgagagtt 4860 ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta tgtggcgcgg 4920 tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac tattctcaga 4980 atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc atgacagtaa 5040 gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac ttacttctga 5100 caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg gatcatgtaa 5160 ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac gagcgtgaca 5220 ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc gaactactta 5280 ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt gcaggaccac 5340 ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga gccggtgagc 5400 gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc cgtatcgtag 5460 ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag atcgctgaga 5520 taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca tatatacttt 5580 agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc ctttttgata 5640 atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca gaccccgtag 5700 aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc tgcttgcaaa 5760 caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta ccaactcttt 5820 ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt ctagtgtagc 5880 cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc gctctgctaa 5940 tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg ttggactcaa 6000 gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg tgcacacagc 6060 ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag ctatgagaaa 6120 gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc agggtcggaa 6180 caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat agtcctgtcg 6240 ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg gggcggagcc 6300 tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc tggccttttg 6360 ctcacatgt 6369 <210> 10 <211> 5703 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 10 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180 ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240 acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300 atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360 cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420 gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480 ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540 gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600 cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660 atccttcgaa accggtgcta gcaccatgcc taagaagaag agaaaggtat gcaggtcaca 720 ccaaaatttg cctgcattac cggtcgatgc aacgagtgat gaggttcgca agaacctgat 780 ggacatgttc agggatcgcc aggcgttttc tgagcatacc tggaaaatgc ttctgtccgt 840 ttgccggtcg tgggcggcat ggtgcaagtt gaataaccgg aaatggtttc ccgcagaacc 900 tgaagatgtt cgcgattatc ttctatatct tcaggcgcgc ggtctggcag taaaaactat 960 ccagcaacat ttgggccagc taaacatgct tcatcgtcgg tccgggctgc cacgaccaag 1020 tgacagcaat gctgtttcac tggttatgcg gcggatccga gttaacgtga gcaagggcga 1080 ggagctgttc accggggtgg tgcccatcct ggtcgagctg gacggcgacg taaacggcca 1140 caagttcagc gtgtccggcg agggcgaggg cgatgccacc tacggcaagc tgaccctgaa 1200 gttcatctgc accaccggca agctgcccgt gccctggccc accctcgtga ccaccctgac 1260 ctacggcgtg cagtgcttca gccgctaccc cgaccacatg aagcagcacg acttcttcaa 1320 gtccgccatg cccgaaggct acgtccagga gcgcaccatc ttcttcaagg acgacggcaa 1380 ctacaagacc cgcgccgagg tgaagttcga gggcgacacc ctggtgaacc gcatcgagct 1440 gaagggcatc gacttcaagg aggacggcaa catcctgggg cacaagctgg agtacaacta 1500 caacagccac aacgtctata tcatggccga caagcagaag aacggcatca aggtgaactt 1560 caagatccgc cacaacatcg aggacggcag cgtgcagctc gccgaccact accagcagaa 1620 cacccccatc ggcgacggcc ccgtgctgct gcccgacaac cactacctga gcacccagtc 1680 cgccctgagc aaagacccca acgagaagcg cgatcacatg gtcctgctgg agttcgtgac 1740 cgccgccggg atcactctcg gcatggacga gctgtacaag taagtcgacg gcgcgcccct 1800 gcagggaatt cgatatcaag cttatcgata atcaacctct ggattacaaa atttgtgaaa 1860 gattgactgg tattcttaac tatgttgctc cttttacgct atgtggatac gctgctttaa 1920 tgcctttgta tcatgctatt gcttcccgta tggctttcat tttctcctcc ttgtataaat 1980 cctggttgct gtctctttat gaggagttgt ggcccgttgt caggcaacgt ggcgtggtgt 2040 gcactgtgtt tgctgacgca acccccactg gttggggcat tgccaccacc tgtcagctcc 2100 tttccgggac tttcgctttc cccctcccta ttgccacggc ggaactcatc gccgcctgcc 2160 ttgcccgctg ctggacaggg gctcggctgt tgggcactga caattccgtg gtgttgtcgg 2220 ggaaatcatc gtcctttcct tggctgctcg cctatgttgc cacctggatt ctgcgcggga 2280 cgtccttctg ctacgtccct tcggccctca atccagcgga ccttccttcc cgcggcctgc 2340 tgccggctct gcggcctctt ccgcgtcttc gccttcgccc tcagacgagt cggatctccc 2400 tttgggccgc ctccccgcat cgataccgag cgctgctcga gagatctacg ggtggcatcc 2460 ctgtgacccc tccccagtgc ctctcctggc cctggaagtt gccactccag tgcccaccag 2520 ccttgtccta ataaaattaa gttgcatcat tttgtctgac taggtgtcct tctataatat 2580 tatggggtgg aggggggtgg tatggagcaa ggggcaagtt gggaagacaa cctgtagggc 2640 ctgcggggtc tattgggaac caagctggag tgcagtggca caatcttggc tcactgcaat 2700 ctccgcctcc tgggttcaag cgattctcct gcctcagcct cccgagttgt tgggattcca 2760 ggcatgcatg accaggctca gctaattttt gtttttttgg tagagacggg gtttcaccat 2820 attggccagg ctggtctcca actcctaatc tcaggtgatc tacccacctt ggcctcccaa 2880 attgctggga ttacaggcgt gaaccactgc tcccttccct gtccttctga ttttgtaggt 2940 aaccacgtgc ggaccgagcg gccgcaggaa cccctagtga tggagttggc cactccctct 3000 ctgcgcgctc gctcgctcac tgaggccggg cgaccaaagg tcgcccgacg cccgggcttt 3060 gcccgggcgg cctcagtgag cgagcgagcg cgcagctgcc tgcaggggcg cctgatgcgg 3120 tattttctcc ttacgcatct gtgcggtatt tcacaccgca tacgtcaaag caaccatagt 3180 acgcgccctg tagcggcgca ttaagcgcgg cgggtgtggt ggttacgcgc agcgtgaccg 3240 ctacacttgc cagcgcccta gcgcccgctc ctttcgcttt cttcccttcc tttctcgcca 3300 cgttcgccgg ctttccccgt caagctctaa atcgggggct ccctttaggg ttccgattta 3360 gtgctttacg gcacctcgac cccaaaaaac ttgatttggg tgatggttca cgtagtgggc 3420 catcgccctg atagacggtt tttcgccctt tgacgttgga gtccacgttc tttaatagtg 3480 gactcttgtt ccaaactgga acaacactca accctatctc gggctattct tttgatttat 3540 aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 3600 acgcgaattt taacaaaata ttaacgttta caattttatg gtgcactctc agtacaatct 3660 gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct gacgcgccct 3720 gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc tccgggagct 3780 gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag ggcctcgtga 3840 tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg tcaggtggca 3900 cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata cattcaaata 3960 tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga aaaaggaaga 4020 gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca ttttgccttc 4080 ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat cagttgggtg 4140 cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag agttttcgcc 4200 ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc gcggtattat 4260 cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct cagaatgact 4320 tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca gtaagagaat 4380 tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt ctgacaacga 4440 tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat gtaactcgcc 4500 ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt gacaccacga 4560 tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta cttactctag 4620 cttcccggca acaattaata gactggatgg aggcggataa agttgcagga ccacttctgc 4680 gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt gagcgtgggt 4740 ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc gtagttatct 4800 acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct gagataggtg 4860 cctcactgat taagcattgg taactgtcag accaagttta ctcatatata ctttagattg 4920 atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt gataatctca 4980 tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc gtagaaaaga 5040 tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa 5100 aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact ctttttccga 5160 aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg tagccgtagt 5220 taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg ctaatcctgt 5280 taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac tcaagacgat 5340 agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca cagcccagct 5400 tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga gaaagcgcca 5460 cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc ggaacaggag 5520 agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct gtcgggtttc 5580 gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg agcctatgga 5640 aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct tttgctcaca 5700 tgt 5703 <210> 11 <211> 950 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 11 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys Gly 225 230 235 240 Ser Gly Gly Ile His Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro 245 250 255 Gly Arg Lys Phe Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly 260 265 270 Glu Ile Pro Leu His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly 275 280 285 Glu Gly Gly Phe Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe 290 295 300 Pro Ala Asp Cys Val Glu Glu Val Gln Met Arg Gln Tyr Asp Thr Arg 305 310 315 320 His Glu Thr Arg Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr 325 330 335 Val Gly Ser Tyr Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp 340 345 350 Asp Lys Val Ala Ile Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe 355 360 365 Val Leu Arg Gly Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro 370 375 380 Thr Pro Ala Phe Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu 385 390 395 400 Gly Val Ala Trp Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu 405 410 415 Val Asn Gly Val Asn Val Val Lys Val Gly His Lys Gln Val Val Gly 420 425 430 Leu Ile Arg Gln Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val 435 440 445 Thr Arg Lys Pro Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro 450 455 460 Pro Lys Arg Ala Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met 465 470 475 480 Thr Ala Glu Leu Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu 485 490 495 Pro Glu Leu Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser 500 505 510 Ser Asp Glu Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro 515 520 525 Pro Pro Glu Glu Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro Pro 530 535 540 Gly Pro Gly Pro Leu Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys 545 550 555 560 Pro Ser Ser Glu Leu Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly 565 570 575 Val Glu Glu Ala Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr 580 585 590 Thr Ser Thr Ile Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu 595 600 605 Ser Gly Glu Leu Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr 610 615 620 Phe Leu Leu Glu Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser 625 630 635 640 Pro Leu Gly Lys Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln 645 650 655 Ser Ser Asp Ser Glu Leu Met Ala Gln Gln His His Ala Ala Ser Thr 660 665 670 Gly Leu Ala Ser Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln 675 680 685 Arg Arg Ser Lys Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro 690 695 700 Gly Pro Glu Asp Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg 705 710 715 720 Leu Gln Gln Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val 725 730 735 Gly Gly Leu Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala 740 745 750 Ala Ala Arg Leu Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala 755 760 765 Gln Arg Ser Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg 770 775 780 Pro Ser Gly Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys 785 790 795 800 Pro Ala Ser Leu Glu Arg Val Glu Gly Leu Gly Ala Gly Val Gly Gly 805 810 815 Ala Gly Arg Pro Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser 820 825 830 Ser Leu Ser Ile Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg 835 840 845 Ser Val Ser Ala Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser 850 855 860 Pro Ser Pro Gly Ser Gly Pro Ser Ala Gly Pro Arg Arg Pro Phe Gln 865 870 875 880 Gln Lys Pro Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu 885 890 895 Glu Ser Ile His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu 900 905 910 Ile Glu Gly Ala His Leu Pro Ala Leu Thr Lys Glu Asp Phe Val Glu 915 920 925 Leu Gly Val Thr Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu 930 935 940 Arg Gln Leu Asp Gly Ser 945 950 <210> 12 <211> 239 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 12 Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu 1 5 10 15 Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly 20 25 30 Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile 35 40 45 Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr 50 55 60 Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys 65 70 75 80 Gln His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu 85 90 95 Arg Thr Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu 100 105 110 Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly 115 120 125 Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr 130 135 140 Asn Tyr Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn 145 150 155 160 Gly Ile Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser 165 170 175 Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly 180 185 190 Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu 195 200 205 Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe 210 215 220 Val Thr Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys 225 230 235 <210> 13 <211> 587 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 13 Met Pro Lys Lys Lys Arg Lys Val Cys Arg Ser His Gln Asn Leu Pro 1 5 10 15 Ala Leu Pro Val Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met 20 25 30 Asp Met Phe Arg Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met 35 40 45 Leu Leu Ser Val Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn 50 55 60 Arg Lys Trp Phe Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu 65 70 75 80 Tyr Leu Gln Ala Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu 85 90 95 Gly Gln Leu Asn Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser 100 105 110 Asp Ser Asn Ala Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn 115 120 125 Val Asp Ala Gly Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr 130 135 140 Asp Phe Asp Gln Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln 145 150 155 160 Asp Ile Arg Asn Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu 165 170 175 Arg Ile Ala Glu Ile Ala Arg Ile Arg Val Lys Asp Ile Ser Arg Thr 180 185 190 Asp Gly Gly Arg Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val 195 200 205 Ser Thr Ala Gly Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu 210 215 220 Val Glu Arg Trp Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn 225 230 235 240 Tyr Leu Phe Cys Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala 245 250 255 Thr Ser Gln Leu Ser Thr Arg Ala Leu Glu Gly Ile Phe Glu Ala Thr 260 265 270 His Arg Leu Ile Tyr Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu 275 280 285 Ala Trp Ser Gly His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala 290 295 300 Arg Ala Gly Val Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Thr 305 310 315 320 Asn Val Asn Ile Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr 325 330 335 Gly Ala Met Val Arg Leu Leu Glu Asp Gly Asp Val Asn Val Ser Lys 340 345 350 Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp 355 360 365 Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly Glu Gly 370 375 380 Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly 385 390 395 400 Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly 405 410 415 Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His Asp Phe 420 425 430 Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Phe 435 440 445 Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu 450 455 460 Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys 465 470 475 480 Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr Asn Ser 485 490 495 His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile Lys Val 500 505 510 Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln Leu Ala 515 520 525 Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu 530 535 540 Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys Asp Pro 545 550 555 560 Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala 565 570 575 Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys 580 585 <210> 14 <211> 365 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 14 Met Pro Lys Lys Lys Arg Lys Val Cys Arg Ser His Gln Asn Leu Pro 1 5 10 15 Ala Leu Pro Val Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met 20 25 30 Asp Met Phe Arg Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met 35 40 45 Leu Leu Ser Val Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn 50 55 60 Arg Lys Trp Phe Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu 65 70 75 80 Tyr Leu Gln Ala Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu 85 90 95 Gly Gln Leu Asn Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser 100 105 110 Asp Ser Asn Ala Val Ser Leu Val Met Arg Arg Ile Arg Val Asn Val 115 120 125 Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu 130 135 140 Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Ser Gly Glu Gly 145 150 155 160 Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr 165 170 175 Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr 180 185 190 Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Gln His 195 200 205 Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr 210 215 220 Ile Phe Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg Ala Glu Val Lys 225 230 235 240 Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp 245 250 255 Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Tyr 260 265 270 Asn Ser His Asn Val Tyr Ile Met Ala Asp Lys Gln Lys Asn Gly Ile 275 280 285 Lys Val Asn Phe Lys Ile Arg His Asn Ile Glu Asp Gly Ser Val Gln 290 295 300 Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val 305 310 315 320 Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Ala Leu Ser Lys 325 330 335 Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr 340 345 350 Ala Ala Gly Ile Thr Leu Gly Met Asp Glu Leu Tyr Lys 355 360 365 <210> 15 <211> 5193 <212> DNA <213> Mus musculus <400> 15 atggacggcc ccggggccag cgccgtggtc gtgcgcgtcg gcatcccgga cctgcaacaa 60 acgaagtgcc tgcgtctgga cccaaccgcg cccgtgtggg ccgccaagca gcgtgtgctc 120 tgcgccctca atcatagcct tcaagacgcg ctcaactacg ggctattcca gcctccctcc 180 cggggtcgcg ccggcaagtt cctggatgaa gagcggctct tacaggacta cccgcctaac 240 ctggacacgc ccctgcccta tctggagttc cgatacaagc ggagagttta tgcccagaac 300 ctcatagatg acaagcagtt tgcaaagcta cacacaaagg caaacctgaa gaagttcatg 360 gactatgtcc agctacacag cacagataag gtggcccgcc tgctggacaa ggggctggac 420 cccaatttcc atgaccctga ctcaggagag tgccctctga gccttgcggc acagttggac 480 aacgccactg acctcctgaa ggttctccgc aacggcggtg ctcatctgga cttccggacc 540 cgagatgggc tgacagccgt ccactgtgct acccgccagc ggaacgcagg ggcattgacg 600 accctgctgg acctgggggc ttcgcctgac tacaaggaca gccgcggcct gacgcccctg 660 taccatagtg ccctaggggg cggggatgcc ctctgttgcg agctgcttct ccatgatcat 720 gcacagctgg ggaccactga tgagaatggt tggcaagaga tccatcaggc ctgtcgcttt 780 ggacacgtgc agcacctgga gcaccttttg ttctatgggg ccaacatggg tgctcagaat 840 gcctcgggaa acacagccct gcacatctgt gccctctaca accaggagag ttgcgcgcgc 900 gtcctgcttt tccgtggtgc caacaaggac gtccgcaatt acaacagcca gacagccttc 960 caggtggcca ttattgcagg gaactttgag cttgccgagg taatcaagac ccacaaagac 1020 tccgatgtcg taccattcag ggaaaccccc agctatgcaa agcgacggcg tctggctggc 1080 ccgagtggcc tggcatcccc acggccctta cagcgctcag ccagtgatat caacctgaaa 1140 ggtgatcagc ccgcagcttc tccagggccc actctccgaa gcctccctca tcaactcttg 1200 ctccagaggc ttcaggagga gaaagaccgt gacagggatg gtgaactgga gaatgacatc 1260 agcggcccct cagcaggcag gggtggccac aacaagatca gccccagtgg gcccggcgga 1320 tccggccccg cgcccggccc cggcccggcg tctcccgcgc cccccgcgcc gccgccccgg 1380 ggcccgaagc ggaaacttta cagtgccgtc cccggccgca agttcatcgc tgtgaaggcg 1440 cacagcccgc agggcgaggg cgagatcccg ctgcaccgcg gcgaggccgt gaaggtgctc 1500 agcattgggg agggcggttt ctgggaggga accgtgaagg gccgaacagg ctggttccca 1560 gctgactgtg tggaagaagt gcagatgcga cagtatgaca cccggcatga aaccagagag 1620 gaccggacga agcgtctctt ccgccactac actgtgggtt cctatgacag cctcacttca 1680 cacagcgatt atgtcatcga tgataaggtg gctatcctgc agaaaaggga ccatgagggg 1740 tttggctttg ttctccgggg agccaaagca gagaccccca ttgaggagtt tacacccaca 1800 cctgccttcc ctgcactcca ataccttgag tctgtagatg tggaaggtgt ggcctggagg 1860 gctggacttc gaactgggga cttcctcatt gaggtgaacg gagtgaatgt cgtgaaggtt 1920 ggacacaagc aagtggtggg tctcatccgt cagggtggca accgcctggt catgaaggtt 1980 gtgtctgtga ccaggaaacc cgaggaggat ggtgctcggc gcagagcccc accaccccca 2040 aagagggctc ccagcaccac gctgaccctg cggtccaagt ccatgacggc tgagctcgag 2100 gaacttgctt ccattcggag aagaaaaggg gagaagttgg atgagatcct ggcagttgcc 2160 gcggagccga cactgaggcc ggacattgca gatgctgact cgagggcggc cactgtcaag 2220 cagcggccca ccagccggag gatcacccct gctgagatca gctcattgtt tgagcgccag 2280 ggcctcccag gcccagagaa gctgccgggc tctctgcgga aggggattcc acggaccaaa 2340 tctgtagggg aggatgagaa gctggcatcc ctactggaag ggcgcttccc acgcagcacg 2400 tcaatgcagg acacagtgcg tgaaggtcga ggcattccac ccccgccgca gaccgccccg 2460 ccacccccac ccgcgcccta ctacttcgac tccgggccac cccccacctt ctcaccgccg 2520 ccaccaccgg gccgggccta tgacactgtg cgctccagct tcaaaccagg cctggaggct 2580 cgtctgggtg cgggggccgc cggcctgtat gatccgagca cgcctctggg cccgctgccc 2640 taccctgagc gtcagaagcg tgcgcgctcc atgatcatac tgcaggactc tgcgccagaa 2700 gtgggtgatg tcccccggcc tgcgcctgcc gccacaccgc ctgagcgccc caagcgccgg 2760 cctcggccgt caggccctga tagtccctat gccaacctgg gcgccttcag tgccagcctc 2820 ttcgctccgt cgaaaccaca gcgccgcaag agcccgctgg tgaagcagct tcaggtggag 2880 gacgctcagg agcgcgcggc cctggccgtg ggtagcccgg gaccagtggg cggaagcttt 2940 gcacgagaac cctctccgac gcaccgcggg ccccggccag gcagccttga ctacagctct 3000 ggagaaggcc taggccttac cttcggcggc cctagccctg gcccagtcaa ggagcggcgc 3060 ctggaggagc gacgccgttc cactgtgttc ctctctgtgg gtgccatcga gggcagccct 3120 cccagcgcgg atctgccatc cctacaaccc tcccgctcca ttgatgagcg cctcctgggg 3180 acaggcgcca ccactggccg cgatttgcta ctcccctccc ctgtctctgc tctgaagcca 3240 ttggtcggtg gtcccagcct tgggccctca ggctccacct tcatccaccc tctcactggc 3300 aaacccttgg atcctagctc acccttagct cttgctctgg ctgcccggga gcgggctctg 3360 gcctcgcaaa caccttcccg gtcccccaca cctgtgcaca gccccgatgc tgaccgccct 3420 ggacccctct ttgtggatgt gcaaacccga gactctgaga gaggaccgtt ggcttcccca 3480 gccttctccc ctcggagtcc agcgtggatt ccagtgcctg ctcggagaga ggcagagaag 3540 ccccctcggg aagagcggaa gtcaccagag gacaagaagt ccatgatcct cagcgtcttg 3600 gacacgtcct tgcaacggcc agctggcctc attgttgtgc atgccaccag caatgggcag 3660 gagcccagca ggctgggggc tgaagaggag cgccccggta ctccggagct ggccccagcc 3720 cccatgcagg cagcagctgt ggcagagccc atgccaagcc cccgggccca gccccctggc 3780 agcatcccag cagatcccgg gccaggtcaa ggcagctcag aggaggagcc agagctggta 3840 ttcgctgtga acctgccacc tgctcagctg tcctccagcg atgaggagac cagagaggag 3900 ctggcccgca tagggctagt gccaccccct gaagagtttg ccaatgggat cctgctgacc 3960 accccgcccc cagggccggg ccccttgccc accacggtac ccagcccggc ctcagggaag 4020 cccagcagcg agctgccccc tgcccctgag tctgcagctg actctggagt agaggaggct 4080 gacactcgaa gctccagtga cccccacctg gagaccacaa gcaccatttc cacagtgtcc 4140 agcatgtcca ccctgagctc ggagagtggg gaactcacgg acacccacac ctcctttgcc 4200 gatggacaca cttttctact cgagaagcca ccagtgcctc ccaagcccaa gctcaagtcc 4260 ccgctgggga aggggccggt gaccttcagg gacccgctgc tgaagcaatc ctcggacagt 4320 gagctcatgg cccagcagca ccatgctgcc tctactgggt tggcttctgc tgctgggccc 4380 gcccgccctc gctacctctt ccagagaagg tccaagctgt ggggggaccc cgtggagagt 4440 cgggggctcc ctgggcctga agatgacaaa ccaactgtga tcagtgagct cagctcccgt 4500 ctgcagcagc tgaataaaga cacacgctcc ttgggggagg aaccagttgg tggcctgggc 4560 agcctgctgg accctgctaa gaagtcaccc attgcagcag ctcggctctt cagcagcctc 4620 ggtgagctga gcaccatctc agcgcagcgc agcccggggg gcccgggcgg aggggcctcc 4680 tactcggtgc ggcccagcgg ccggtacccc gtggcgagac gagccccgag cccagtgaaa 4740 cccgcatcgc tggagcgggt ggaggggctg ggggcgggcg tgggaggcgc ggggcggccc 4800 ttcggcctca cgcctcccac catcctcaag tcgtccagcc tctccatccc gcacgaaccc 4860 aaggaagtgc gcttcgtggt gcgaagtgtg agtgcgcgca gccgctcccc ctcaccatct 4920 ccgctgccct cgccttctcc cggctctggc cccagtgccg gcccgcgtcg gccatttcaa 4980 cagaagcccc tgcagctctg gagcaagttc gatgtgggcg actggctgga gagcatccac 5040 ttaggcgagc accgagaccg cttcgaggac catgagatcg aaggcgcaca cctgcctgcg 5100 ctcaccaagg aagacttcgt ggagctgggc gtcacacgcg ttggccaccg catgaacatc 5160 gagcgtgcgc tcaggcagct ggatggcagc tga 5193 <210> 16 <211> 5421 <212> DNA <213> Homo sapiens <400> 16 atgcagctga gccgcgccgc cgccgccgcc gccgccgccc ctgcggagcc cccggagccg 60 ctgtcccccg cgccggcccc ggccccggcc ccccccggcc ccctcccgcg cagcgcggcc 120 gacggggctc cggcgggggg gaaggggggg ccggggcgcc gcgcggagtc cccgggcgct 180 ccgttccccg gcgcgagcgg ccccggcccg ggccccggcg cggggatgga cggccccggg 240 gccagcgccg tggtcgtgcg cgtcggcatc ccggacctgc agcagacgaa gtgcctgcgc 300 ctggacccgg ccgcgcccgt gtgggccgcc aagcagcgcg tgctctgcgc cctcaaccac 360 agcctccagg acgcgctcaa ctatgggctt ttccagccgc cctcccgggg ccgcgccggc 420 aagttcctgg atgaggagcg gctcctgcag gagtacccgc ccaacctgga cacgcccctg 480 ccctacctgg agtttcgata caagcggcga gtttatgccc agaacctcat cgatgataag 540 cagtttgcaa agcttcacac aaaggcgaac ctgaagaagt tcatggacta cgtccagctg 600 catagcacgg acaaggtggc acgcctgttg gacaaggggc tggaccccaa cttccatgac 660 cctgactcag gagagtgccc cctgagcctc gcagcccagc tggacaacgc cacggacctg 720 ctaaaggtgc tgaagaatgg tggtgcccac ctggacttcc gcactcgcga tgggctcact 780 gccgtgcact gtgccacacg ccagcggaat gcggcagcac tgacgaccct gctggacctg 840 ggggcttcac ctgactacaa ggacagccgc ggcttgacac ccctctacca cagcgccctg 900 gggggtgggg atgccctctg ctgtgagctg cttctccacg accacgctca gctggggatc 960 accgacgaga atggctggca ggagatccac caggcctgcc gctttgggca cgtgcagcat 1020 ctggagcacc tgctgttcta tggggcagac atgggggccc agaacgcctc ggggaacaca 1080 gccctgcaca tctgtgccct ctacaaccag gagagctgtg ctcgtgtcct gctcttccgt 1140 ggagctaaca gggatgtccg caactacaac agccagacag ccttccaggt ggccatcatc 1200 gcagggaact ttgagcttgc agaggttatc aagacccaca aagactcgga tgttgtacca 1260 ttcagggaaa cccccagcta tgcgaagcgg cggcgactgg ctggccccag tggcttggca 1320 tcccctcggc ctctgcagcg ctcagccagc gatatcaacc tgaaggggga ggcacagcca 1380 gcagcttctc ctggaccctc gctgagaagc ctcccccacc agctgctgct ccagcggctg 1440 caagaggaga aagatcgtga ccgggatgcc gaccaggaga gcaacatcag tggcccttta 1500 gcaggcaggg ccggccaaag caagatcagc ccgagcgggc ccggcggccc cggccccgcg 1560 cccggccccg gccccgcgcc ccctgcgccc cccgcaccgc cgccccgggg cccgaagcgg 1620 aaactttaca gcgccgtccc cggccgcaag ttcatcgccg tgaaggcgca cagcccgcag 1680 ggtgaaggcg agatcccgct gcaccgcggc gaggccgtga aggtgctcag cattggggag 1740 ggcggtttct gggagggaac cgtgaaaggc cgcacgggct ggttcccggc cgactgcgtg 1800 gaggaagtgc agatgaggca gcatgacaca cggcctgaaa cgcgggagga ccggacgaag 1860 cggctctttc ggcactacac agtgggctcc tacgacagcc tcacctcaca cagcgattat 1920 gtcattgatg acaaagtggc tgtcctgcag aaacgggacc acgagggctt tggttttgtg 1980 ctccggggag ccaaagcaga gacccccatc gaggagttca cgcccacgcc agccttcccg 2040 gcgctgcagt atctcgagtc ggtggacgtg gagggtgtgg cctggagggc cgggctgcgc 2100 acgggagact tcctcatcga ggtgaacggg gtgaacgtgg tgaaggtcgg acacaagcag 2160 gtggtggctc tgattcgcca gggtggcaac cgcctcgtca tgaaggttgt gtctgtgaca 2220 aggaagccag aagaggacgg ggctcggcgc agagccccac cgccccccaa gagggccccc 2280 agcaccacac tgaccctgcg ctccaagtcc atgacagctg agctcgagga acttgcctcc 2340 attcggagaa gaaaagggga gaagctggac gagatgctgg cagccgccgc agagccaacg 2400 ctgcggccag acatcgcaga cgcagactcc agagccgcca ccgtcaaaca gaggcccacc 2460 agtcggagga tcacacccgc cgagattagc tcattgtttg aacgccaggg cctcccaggc 2520 ccagagaagc tgccgggctc cttgcggaag gggattccac ggaccaagtc tgtaggggag 2580 gacgagaagc tggcgtccct gctggaaggg cgcttcccgc ggagcacctc gatgcaagac 2640 ccggtgcgcg agggtcgcgg catcccgccc ccgccgcaga ccgcgccgcc tcccccgccc 2700 gcgccctact acttcgactc ggggccgccc ccggccttct cgccgccgcc cccgccgggc 2760 cgcgcctacg acacggtgcg ctccagcttc aagcccggcc tggaggcgcg cctgggcgcg 2820 ggcgctgccg gcctgtacga gccgggcgcg gccctcggcc cgctgccgta tcccgagcgg 2880 cagaagcgcg cgcgctccat gatcatcctg caggactcgg cgcccgagtc gggcgacgcc 2940 cctcgacccc cgcccgcggc caccccgccc gagcgaccca agcgccggcc gcggccgccc 3000 ggccccgaca gcccctacgc caacctgggc gccttcagcg ccagcctctt cgctccgtcc 3060 aagccgcagc gccgcaagag ccccctggtg aagcagctgc aggtggagga cgcgcaggag 3120 cgcgcggccc tggccgtggg cagccccggt cccggcggcg gcagcttcgc ccgcgagccc 3180 tccccgaccc accgcggtcc gcgcccgggt ggcctcgact acggcgcggg cgatggcccg 3240 gggctcgcgt tcggcggccc gggcccggcc aaggaccggc ggctggagga gcggcgccgc 3300 tccactgtgt tcctgtccgt gggggccatc gagggcagcg cccccggcgc ggatctgcca 3360 tccctacagc cctcccgctc catcgacgag cgcctcctgg ggaccggccc caccgccggc 3420 cgcgacctgc tgctgccctc cccggtgtct gccctgaagc cgttggtcag cggcccgagc 3480 ctggggccct cgggttccac cttcatccac ccactcaccg gcaaacccct ggaccccagc 3540 tcacccctgg cccttgccct ggctgcccga gagcgagctc tggcctccca ggcgccctcc 3600 cggtccccca cacccgtgca cagtcccgac gccgaccgcc ccggacccct gtttgtggat 3660 gtacaggccc gggacccaga gcgagggtcc ctggcttccc cggctttctc cccacggagc 3720 ccagcctgga ttcctgtgcc tgctcgcagg gaggcagaga aggtcccccg ggaggagcgg 3780 aagtcacccg aggacaagaa gtccatgatc ctcagcgtcc tggacacatc cctgcagcgg 3840 ccagctggcc tcatcgttgt gcacgccacc agcaacgggc aggagcccag caggctgggg 3900 ggggccgaag aggagcgccc gggcaccccg gagttggccc cggcccccat gcagtcagcg 3960 gctgtggcag agcccctgcc cagcccccgg gcccagcccc ctggtggcac cccggcagac 4020 gccgggccag gccagggcag ctcagaggaa gagccagagc tggtgtttgc tgtgaacctg 4080 ccacctgccc agctgtcgtc cagcgatgag gagaccaggg aggagctggc ccgaattggg 4140 ttggtgccac cccctgaaga gtttgccaac ggggtcctgc tggccacccc actcgctggc 4200 ccgggcccct cgcccaccac ggtgcccagc ccggcctcag ggaagcccag cagtgagcca 4260 ccccctgccc ctgagtctgc agccgactct ggggtggagg aggctgacac acgcagctcc 4320 agcgaccccc acctggagac cacaagcacc atctccacgg tgtccagcat gtccaccttg 4380 agctcggaga gcggggaact cactgacacc cacacctcct tcgctgacgg acacactttt 4440 ctactcgaga agccaccagt gcctcccaag cccaagctca agtccccgct ggggaagggg 4500 ccggtgacct tcagggaccc gctgctgaag cagtcctcgg acagcgagct catggcccag 4560 cagcaccacg ccgcctctgc cgggctggcc tctgccgccg ggcctgcccg ccctcgctac 4620 ctcttccaga gaaggtccaa gctatggggg gaccccgtgg agagccgggg gctccctggg 4680 cctgaagacg acaaaccaac tgtgatcagt gagctcagct cccgcctgca gcagctgaac 4740 aaggacacgc gttccctggg ggaggaacca gttggtggcc tgggcagcct gctggaccct 4800 gccaagaagt cgcccatcgc agcagctcgg ctcttcagca gcctcggtga gctgagctcc 4860 atttcagcgc agcgcagccc cgggggcccg ggcggcgggg cctcgtactc ggtgaggccc 4920 agtggccgct accccgtggc gagacgcgcc ccgagcccgg tgaagcccgc gtcgctggag 4980 cgggtggagg ggctgggggc gggcgcgggg ggcgcagggc ggcccttcgg cctcacgccc 5040 cccaccatcc tcaagtcgtc cagcctctcc atcccgcacg agcccaagga ggtgcgcttc 5100 gtggtgcgca gcgtgagcgc gcgcagtcgc tccccctcgc cgtcgccgct gccctcgccc 5160 gcgtccggcc ccggccccgg cgcccccggc ccacgccgac ccttccagca gaagccgctg 5220 cagctctgga gcaagttcga cgtgggcgac tggctggaga gcatccacct aggcgagcac 5280 cgcgaccgct tcgaggacca tgagatagaa ggcgcgcacc tacccgcgct taccaaggac 5340 gacttcgtgg agctgggcgt cacgcgcgtg ggccaccgca tgaacatcga gcgcgcgctc 5400 aggcagctgg acggcagctg a 5421 <210> 17 <211> 706 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 17 Met Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe 1 5 10 15 Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu 20 25 30 His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe 35 40 45 Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys 50 55 60 Val Glu Glu Val Gln Met Arg Gln Tyr Asp Thr Arg His Glu Thr Arg 65 70 75 80 Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr 85 90 95 Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala 100 105 110 Ile Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly 115 120 125 Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe 130 135 140 Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp 145 150 155 160 Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val 165 170 175 Asn Val Val Lys Val Gly His Lys Gln Val Val Gly Leu Ile Arg Gln 180 185 190 Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys Pro 195 200 205 Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala 210 215 220 Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu 225 230 235 240 Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu Val 245 250 255 Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu Glu 260 265 270 Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu Glu 275 280 285 Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro Pro Gly Pro Gly Pro 290 295 300 Leu Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser Glu 305 310 315 320 Leu Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu Ala 325 330 335 Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr Ile 340 345 350 Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu Leu 355 360 365 Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu Glu 370 375 380 Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys 385 390 395 400 Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser 405 410 415 Glu Leu Met Ala Gln Gln His His Ala Ala Ser Thr Gly Leu Ala Ser 420 425 430 Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys 435 440 445 Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp 450 455 460 Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln Leu 465 470 475 480 Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu Gly 485 490 495 Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg Leu 500 505 510 Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala Gln Arg Ser Pro 515 520 525 Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly Arg 530 535 540 Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser Leu 545 550 555 560 Glu Arg Val Glu Gly Leu Gly Ala Gly Val Gly Gly Ala Gly Arg Pro 565 570 575 Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser Ile 580 585 590 Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser Ala 595 600 605 Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ser Pro Gly 610 615 620 Ser Gly Pro Ser Ala Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro Leu 625 630 635 640 Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile His 645 650 655 Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly Ala 660 665 670 His Leu Pro Ala Leu Thr Lys Glu Asp Phe Val Glu Leu Gly Val Thr 675 680 685 Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu Asp 690 695 700 Gly Ser 705 <210> 18 <211> 707 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 18 Met Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys Phe 1 5 10 15 Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro Leu 20 25 30 His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly Phe 35 40 45 Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp Cys 50 55 60 Val Glu Glu Val Gln Met Arg Gln His Asp Thr Arg Pro Glu Thr Arg 65 70 75 80 Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser Tyr 85 90 95 Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val Ala 100 105 110 Val Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg Gly 115 120 125 Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala Phe 130 135 140 Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala Trp 145 150 155 160 Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly Val 165 170 175 Asn Val Val Lys Val Gly His Lys Gln Val Val Ala Leu Ile Arg Gln 180 185 190 Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys Pro 195 200 205 Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg Ala 210 215 220 Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu Leu 225 230 235 240 Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu Val 245 250 255 Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu Glu 260 265 270 Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu Glu 275 280 285 Phe Ala Asn Gly Val Leu Leu Ala Thr Pro Leu Ala Gly Pro Gly Pro 290 295 300 Ser Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser Glu 305 310 315 320 Pro Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu Ala 325 330 335 Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr Ile 340 345 350 Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu Leu 355 360 365 Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu Glu 370 375 380 Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly Lys 385 390 395 400 Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp Ser 405 410 415 Glu Leu Met Ala Gln Gln His His Ala Ala Ser Ala Gly Leu Ala Ser 420 425 430 Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser Lys 435 440 445 Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu Asp 450 455 460 Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln Leu 465 470 475 480 Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu Gly 485 490 495 Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg Leu 500 505 510 Phe Ser Ser Leu Gly Glu Leu Ser Ser Ile Ser Ala Gln Arg Ser Pro 515 520 525 Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly Arg 530 535 540 Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser Leu 545 550 555 560 Glu Arg Val Glu Gly Leu Gly Ala Gly Ala Gly Gly Ala Gly Arg Pro 565 570 575 Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser Ile 580 585 590 Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser Ala 595 600 605 Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ala Ser Gly 610 615 620 Pro Gly Pro Gly Ala Pro Gly Pro Arg Arg Pro Phe Gln Gln Lys Pro 625 630 635 640 Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu Glu Ser Ile 645 650 655 His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu Ile Glu Gly 660 665 670 Ala His Leu Pro Ala Leu Thr Lys Asp Asp Phe Val Glu Leu Gly Val 675 680 685 Thr Arg Val Gly His Arg Met Asn Ile Glu Arg Ala Leu Arg Gln Leu 690 695 700 Asp Gly Ser 705 <210> 19 <211> 1091 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 19 Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro 1 5 10 15 Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Thr Ala Pro Val 20 25 30 Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln 35 40 45 Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala 50 55 60 Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Asp Tyr Pro Pro Asn 65 70 75 80 Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val 85 90 95 Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr 100 105 110 Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr 115 120 125 Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His 130 135 140 Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp 145 150 155 160 Asn Ala Thr Asp Leu Leu Lys Val Leu Arg Asn Gly Gly Ala His Leu 165 170 175 Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg 180 185 190 Gln Arg Asn Ala Gly Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser 195 200 205 Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala 210 215 220 Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His 225 230 235 240 Ala Gln Leu Gly Thr Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln 245 250 255 Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr 260 265 270 Gly Ala Asn Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His 275 280 285 Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe 290 295 300 Arg Gly Ala Asn Lys Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe 305 310 315 320 Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys 325 330 335 Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr 340 345 350 Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg 355 360 365 Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Ala Pro Pro 370 375 380 Pro Arg Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys 385 390 395 400 Phe Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro 405 410 415 Leu His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly 420 425 430 Phe Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp 435 440 445 Cys Val Glu Glu Val Gln Met Arg Gln Tyr Asp Thr Arg His Glu Thr 450 455 460 Arg Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser 465 470 475 480 Tyr Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val 485 490 495 Ala Ile Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg 500 505 510 Gly Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala 515 520 525 Phe Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala 530 535 540 Trp Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly 545 550 555 560 Val Asn Val Val Lys Val Gly His Lys Gln Val Val Gly Leu Ile Arg 565 570 575 Gln Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys 580 585 590 Pro Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg 595 600 605 Ala Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu 610 615 620 Leu Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu 625 630 635 640 Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu 645 650 655 Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu 660 665 670 Glu Phe Ala Asn Gly Ile Leu Leu Thr Thr Pro Pro Pro Gly Pro Gly 675 680 685 Pro Leu Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser 690 695 700 Glu Leu Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu 705 710 715 720 Ala Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr 725 730 735 Ile Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu 740 745 750 Leu Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu 755 760 765 Glu Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly 770 775 780 Lys Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp 785 790 795 800 Ser Glu Leu Met Ala Gln Gln His His Ala Ala Ser Thr Gly Leu Ala 805 810 815 Ser Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser 820 825 830 Lys Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu 835 840 845 Asp Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln 850 855 860 Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu 865 870 875 880 Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg 885 890 895 Leu Phe Ser Ser Leu Gly Glu Leu Ser Thr Ile Ser Ala Gln Arg Ser 900 905 910 Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly 915 920 925 Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser 930 935 940 Leu Glu Arg Val Glu Gly Leu Gly Ala Gly Val Gly Gly Ala Gly Arg 945 950 955 960 Pro Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser 965 970 975 Ile Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser 980 985 990 Ala Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ser Pro 995 1000 1005 Gly Ser Gly Pro Ser Ala Gly Pro Arg Arg Pro Phe Gln Gln Lys 1010 1015 1020 Pro Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu Glu 1025 1030 1035 Ser Ile His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His Glu 1040 1045 1050 Ile Glu Gly Ala His Leu Pro Ala Leu Thr Lys Glu Asp Phe Val 1055 1060 1065 Glu Leu Gly Val Thr Arg Val Gly His Arg Met Asn Ile Glu Arg 1070 1075 1080 Ala Leu Arg Gln Leu Asp Gly Ser 1085 1090 <210> 20 <211> 1092 <212> PRT <213> Artificial Sequence <220> <223> Synthetic <400> 20 Met Asp Gly Pro Gly Ala Ser Ala Val Val Val Arg Val Gly Ile Pro 1 5 10 15 Asp Leu Gln Gln Thr Lys Cys Leu Arg Leu Asp Pro Ala Ala Pro Val 20 25 30 Trp Ala Ala Lys Gln Arg Val Leu Cys Ala Leu Asn His Ser Leu Gln 35 40 45 Asp Ala Leu Asn Tyr Gly Leu Phe Gln Pro Pro Ser Arg Gly Arg Ala 50 55 60 Gly Lys Phe Leu Asp Glu Glu Arg Leu Leu Gln Glu Tyr Pro Pro Asn 65 70 75 80 Leu Asp Thr Pro Leu Pro Tyr Leu Glu Phe Arg Tyr Lys Arg Arg Val 85 90 95 Tyr Ala Gln Asn Leu Ile Asp Asp Lys Gln Phe Ala Lys Leu His Thr 100 105 110 Lys Ala Asn Leu Lys Lys Phe Met Asp Tyr Val Gln Leu His Ser Thr 115 120 125 Asp Lys Val Ala Arg Leu Leu Asp Lys Gly Leu Asp Pro Asn Phe His 130 135 140 Asp Pro Asp Ser Gly Glu Cys Pro Leu Ser Leu Ala Ala Gln Leu Asp 145 150 155 160 Asn Ala Thr Asp Leu Leu Lys Val Leu Lys Asn Gly Gly Ala His Leu 165 170 175 Asp Phe Arg Thr Arg Asp Gly Leu Thr Ala Val His Cys Ala Thr Arg 180 185 190 Gln Arg Asn Ala Ala Ala Leu Thr Thr Leu Leu Asp Leu Gly Ala Ser 195 200 205 Pro Asp Tyr Lys Asp Ser Arg Gly Leu Thr Pro Leu Tyr His Ser Ala 210 215 220 Leu Gly Gly Gly Asp Ala Leu Cys Cys Glu Leu Leu Leu His Asp His 225 230 235 240 Ala Gln Leu Gly Ile Thr Asp Glu Asn Gly Trp Gln Glu Ile His Gln 245 250 255 Ala Cys Arg Phe Gly His Val Gln His Leu Glu His Leu Leu Phe Tyr 260 265 270 Gly Ala Asp Met Gly Ala Gln Asn Ala Ser Gly Asn Thr Ala Leu His 275 280 285 Ile Cys Ala Leu Tyr Asn Gln Glu Ser Cys Ala Arg Val Leu Leu Phe 290 295 300 Arg Gly Ala Asn Arg Asp Val Arg Asn Tyr Asn Ser Gln Thr Ala Phe 305 310 315 320 Gln Val Ala Ile Ile Ala Gly Asn Phe Glu Leu Ala Glu Val Ile Lys 325 330 335 Thr His Lys Asp Ser Asp Val Val Pro Phe Arg Glu Thr Pro Ser Tyr 340 345 350 Ala Lys Arg Arg Arg Leu Ala Gly Pro Ser Gly Leu Ala Ser Pro Arg 355 360 365 Pro Leu Gln Arg Ser Ala Ser Asp Ile Asn Leu Lys Gly Ala Pro Pro 370 375 380 Pro Arg Gly Pro Lys Arg Lys Leu Tyr Ser Ala Val Pro Gly Arg Lys 385 390 395 400 Phe Ile Ala Val Lys Ala His Ser Pro Gln Gly Glu Gly Glu Ile Pro 405 410 415 Leu His Arg Gly Glu Ala Val Lys Val Leu Ser Ile Gly Glu Gly Gly 420 425 430 Phe Trp Glu Gly Thr Val Lys Gly Arg Thr Gly Trp Phe Pro Ala Asp 435 440 445 Cys Val Glu Glu Val Gln Met Arg Gln His Asp Thr Arg Pro Glu Thr 450 455 460 Arg Glu Asp Arg Thr Lys Arg Leu Phe Arg His Tyr Thr Val Gly Ser 465 470 475 480 Tyr Asp Ser Leu Thr Ser His Ser Asp Tyr Val Ile Asp Asp Lys Val 485 490 495 Ala Val Leu Gln Lys Arg Asp His Glu Gly Phe Gly Phe Val Leu Arg 500 505 510 Gly Ala Lys Ala Glu Thr Pro Ile Glu Glu Phe Thr Pro Thr Pro Ala 515 520 525 Phe Pro Ala Leu Gln Tyr Leu Glu Ser Val Asp Val Glu Gly Val Ala 530 535 540 Trp Arg Ala Gly Leu Arg Thr Gly Asp Phe Leu Ile Glu Val Asn Gly 545 550 555 560 Val Asn Val Val Lys Val Gly His Lys Gln Val Val Ala Leu Ile Arg 565 570 575 Gln Gly Gly Asn Arg Leu Val Met Lys Val Val Ser Val Thr Arg Lys 580 585 590 Pro Glu Glu Asp Gly Ala Arg Arg Arg Ala Pro Pro Pro Pro Lys Arg 595 600 605 Ala Pro Ser Thr Thr Leu Thr Leu Arg Ser Lys Ser Met Thr Ala Glu 610 615 620 Leu Glu Glu Leu Ala Ser Ile Arg Ser Ser Glu Glu Glu Pro Glu Leu 625 630 635 640 Val Phe Ala Val Asn Leu Pro Pro Ala Gln Leu Ser Ser Ser Asp Glu 645 650 655 Glu Thr Arg Glu Glu Leu Ala Arg Ile Gly Leu Val Pro Pro Pro Glu 660 665 670 Glu Phe Ala Asn Gly Val Leu Leu Ala Thr Pro Leu Ala Gly Pro Gly 675 680 685 Pro Ser Pro Thr Thr Val Pro Ser Pro Ala Ser Gly Lys Pro Ser Ser 690 695 700 Glu Pro Pro Pro Ala Pro Glu Ser Ala Ala Asp Ser Gly Val Glu Glu 705 710 715 720 Ala Asp Thr Arg Ser Ser Ser Asp Pro His Leu Glu Thr Thr Ser Thr 725 730 735 Ile Ser Thr Val Ser Ser Met Ser Thr Leu Ser Ser Glu Ser Gly Glu 740 745 750 Leu Thr Asp Thr His Thr Ser Phe Ala Asp Gly His Thr Phe Leu Leu 755 760 765 Glu Lys Pro Pro Val Pro Pro Lys Pro Lys Leu Lys Ser Pro Leu Gly 770 775 780 Lys Gly Pro Val Thr Phe Arg Asp Pro Leu Leu Lys Gln Ser Ser Asp 785 790 795 800 Ser Glu Leu Met Ala Gln Gln His His Ala Ala Ser Ala Gly Leu Ala 805 810 815 Ser Ala Ala Gly Pro Ala Arg Pro Arg Tyr Leu Phe Gln Arg Arg Ser 820 825 830 Lys Leu Trp Gly Asp Pro Val Glu Ser Arg Gly Leu Pro Gly Pro Glu 835 840 845 Asp Asp Lys Pro Thr Val Ile Ser Glu Leu Ser Ser Arg Leu Gln Gln 850 855 860 Leu Asn Lys Asp Thr Arg Ser Leu Gly Glu Glu Pro Val Gly Gly Leu 865 870 875 880 Gly Ser Leu Leu Asp Pro Ala Lys Lys Ser Pro Ile Ala Ala Ala Arg 885 890 895 Leu Phe Ser Ser Leu Gly Glu Leu Ser Ser Ile Ser Ala Gln Arg Ser 900 905 910 Pro Gly Gly Pro Gly Gly Gly Ala Ser Tyr Ser Val Arg Pro Ser Gly 915 920 925 Arg Tyr Pro Val Ala Arg Arg Ala Pro Ser Pro Val Lys Pro Ala Ser 930 935 940 Leu Glu Arg Val Glu Gly Leu Gly Ala Gly Ala Gly Gly Ala Gly Arg 945 950 955 960 Pro Phe Gly Leu Thr Pro Pro Thr Ile Leu Lys Ser Ser Ser Leu Ser 965 970 975 Ile Pro His Glu Pro Lys Glu Val Arg Phe Val Val Arg Ser Val Ser 980 985 990 Ala Arg Ser Arg Ser Pro Ser Pro Ser Pro Leu Pro Ser Pro Ala Ser 995 1000 1005 Gly Pro Gly Pro Gly Ala Pro Gly Pro Arg Arg Pro Phe Gln Gln 1010 1015 1020 Lys Pro Leu Gln Leu Trp Ser Lys Phe Asp Val Gly Asp Trp Leu 1025 1030 1035 Glu Ser Ile His Leu Gly Glu His Arg Asp Arg Phe Glu Asp His 1040 1045 1050 Glu Ile Glu Gly Ala His Leu Pro Ala Leu Thr Lys Asp Asp Phe 1055 1060 1065 Val Glu Leu Gly Val Thr Arg Val Gly His Arg Met Asn Ile Glu 1070 1075 1080 Arg Ala Leu Arg Gln Leu Asp Gly Ser 1085 1090 <210> 21 <211> 6701 <212> DNA <213> Artificial Sequence <220> <223> Synthetic <400> 21 cctgcaggca gctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 60 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 120 actccatcac taggggttcc tgcggccgca cgcgtttaat taagtgtcta gactgcagag 180 ggccctgcgt atgagtgcaa gtgggtttta ggaccaggat gaggcggggt gggggtgcct 240 acctgacgac cgaccccgac ccactggaca agcacccaac ccccattccc caaattgcgc 300 atcccctatc agagaggggg aggggaaaca ggatgcggcg aggcgcgtgc gcactgccag 360 cttcagcacc gcggacagtg ccttcgcccc cgcctggcgg cgcgcgccac cgccgcctca 420 gcactgaagg cgcgctgacg tcactcgccg gtcccccgca aactcccctt cccggccacc 480 ttggtcgcgt ccgcgccgcc gccggcccag ccggaccgca ccacgcgagg cgcgagatag 540 gggggcacgg gcgcgaccat ctgcgctgcg gcgccggcga ctcagcgctg cctcagtctg 600 cggtgggcag cggaggagtc gtgtcgtgcc tgagagcgca gtcgagaaac cggctagagg 660 atccttcgaa accggtgcta gcatgggccc gaagcggaaa ctttacagcg ccgtccccgg 720 ccgcaagttc atcgccgtga aggcgcacag cccgcagggt gaaggcgaga tcccgctgca 780 ccgcggcgag gccgtgaagg tgctcagcat tggggagggc ggtttctggg agggaaccgt 840 gaaaggccgc acgggctggt tcccggccga ctgcgtggag gaagtgcaga tgaggcagca 900 tgacacacgg cctgaaacgc gggaggaccg gacgaagcgg ctctttcggc actacacagt 960 gggctcctac gacagcctca cctcacacag cgattatgtc attgatgaca aagtggctgt 1020 cctgcagaaa cgggaccacg agggctttgg ttttgtgctc cggggagcca aagcagagac 1080 ccccatcgag gagttcacgc ccacgccagc cttcccggcg ctgcagtatc tcgagtcggt 1140 ggacgtggag ggtgtggcct ggagggccgg gctgcgcacg ggagacttcc tcatcgaggt 1200 gaacggggtg aacgtggtga aggtcggaca caagcaggtg gtggctctga ttcgccaggg 1260 tggcaaccgc ctcgtcatga aggttgtgtc tgtgacaagg aagccagaag aggacggggc 1320 tcggcgcaga gccccaccgc cccccaagag ggcccccagc accacactga ccctgcgctc 1380 caagtccatg acagctgagc tcgaggaact tgcctccatt cggagctcag aggaagagcc 1440 agagctggtg tttgctgtga acctgccacc tgcccagctg tcgtccagcg atgaggagac 1500 cagggaggag ctggcccgaa ttgggttggt gccaccccct gaagagtttg ccaacggggt 1560 cctgctggcc accccactcg ctggcccggg cccctcgccc accacggtgc ccagcccggc 1620 ctcagggaag cccagcagtg agccaccccc tgcccctgag tctgcagccg actctggggt 1680 ggaggaggct gacacacgca gctccagcga cccccacctg gagaccacaa gcaccatctc 1740 cacggtgtcc agcatgtcca ccttgagctc ggagagcggg gaactcactg acacccacac 1800 ctccttcgct gacggacaca cttttctact cgagaagcca ccagtgcctc ccaagcccaa 1860 gctcaagtcc ccgctgggga aggggccggt gaccttcagg gacccgctgc tgaagcagtc 1920 ctcggacagc gagctcatgg cccagcagca ccacgccgcc tctgccgggc tggcctctgc 1980 cgccgggcct gcccgccctc gctacctctt ccagagaagg tccaagctat ggggggaccc 2040 cgtggagagc cgggggctcc ctgggcctga agacgacaaa ccaactgtga tcagtgagct 2100 cagctcccgc ctgcagcagc tgaacaagga cacgcgttcc ctgggggagg aaccagttgg 2160 tggcctgggc agcctgctgg accctgccaa gaagtcgccc atcgcagcag ctcggctctt 2220 cagcagcctc ggtgagctga gctccatttc agcgcagcgc agccccgggg gcccgggcgg 2280 cggggcctcg tactcggtga ggcccagtgg ccgctacccc gtggcgagac gcgccccgag 2340 cccggtgaag cccgcgtcgc tggagcgggt ggaggggctg ggggcgggcg cggggggcgc 2400 agggcggccc ttcggcctca cgccccccac catcctcaag tcgtccagcc tctccatccc 2460 gcacgagccc aaggaggtgc gcttcgtggt gcgcagcgtg agcgcgcgca gtcgctcccc 2520 ctcgccgtcg ccgctgccct cgcccgcgtc cggccccggc cccggcgccc ccggcccacg 2580 ccgacccttc cagcagaagc cgctgcagct ctggagcaag ttcgacgtgg gcgactggct 2640 ggagagcatc cacctaggcg agcaccgcga ccgcttcgag gaccatgaga tagaaggcgc 2700 gcacctaccc gcgcttacca aggacgactt cgtggagctg ggcgtcacgc gcgtgggcca 2760 ccgcatgaac atcgagcgcg cgctcaggca gctggacggc agctgacggc gcgccaagct 2820 tatcgataat caacctctgg attacaaaat ttgtgaaaga ttgactggta ttcttaacta 2880 tgttgctcct tttacgctat gtggatacgc tgctttaatg cctttgtatc atgctattgc 2940 ttcccgtatg gctttcattt tctcctcctt gtataaatcc tggttgctgt ctctttatga 3000 ggagttgtgg cccgttgtca ggcaacgtgg cgtggtgtgc actgtgtttg ctgacgcaac 3060 ccccactggt tggggcattg ccaccacctg tcagctcctt tccgggactt tcgctttccc 3120 cctccctatt gccacggcgg aactcatcgc cgcctgcctt gcccgctgct ggacaggggc 3180 tcggctgttg ggcactgaca attccgtggt gttgtcgggg aaatcatcgt cctttccttg 3240 gctgctcgcc tatgttgcca cctggattct gcgcgggacg tccttctgct acgtcccttc 3300 ggccctcaat ccagcggacc ttccttcccg cggcctgctg ccggctctgc ggcctcttcc 3360 gcgtcttcgc cttcgccctc agacgagtcg gatctccctt tgggccgcct ccccgcatcg 3420 ataccgagcg ctgctcgaga gatctacggg tggcatccct gtgacccctc cccagtgcct 3480 ctcctggccc tggaagttgc cactccagtg cccaccagcc ttgtcctaat aaaattaagt 3540 tgcatcattt tgtctgacta ggtgtccttc tataatatta tggggtggag gggggtggta 3600 tggagcaagg ggcaagttgg gaagacaacc tgtagggcct gcggggtcta ttgggaacca 3660 agctggagtg cagtggcaca atcttggctc actgcaatct ccgcctcctg ggttcaagcg 3720 attctcctgc ctcagcctcc cgagttgttg ggattccagg catgcatgac caggctcagc 3780 taatttttgt ttttttggta gagacggggt ttcaccatat tggccaggct ggtctccaac 3840 tcctaatctc aggtgatcta cccaccttgg cctcccaaat tgctgggatt acaggcgtga 3900 accactgctc ccttccctgt ccttctgatt ttgtaggtaa ccacgtgcgg accgagcggc 3960 cgcaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 4020 aggccgggcg accaaaggtc gcccgacgcc cgggctttgc ccgggcggcc tcagtgagcg 4080 agcgagcgcg cagctgcctg caggggcgcc tgatgcggta ttttctcctt acgcatctgt 4140 gcggtatttc acaccgcata cgtcaaagca accatagtac gcgccctgta gcggcgcatt 4200 aagcgcggcg ggtgtggtgg ttacgcgcag cgtgaccgct acacttgcca gcgccctagc 4260 gcccgctcct ttcgctttct tcccttcctt tctcgccacg ttcgccggct ttccccgtca 4320 agctctaaat cgggggctcc ctttagggtt ccgatttagt gctttacggc acctcgaccc 4380 caaaaaactt gatttgggtg atggttcacg tagtgggcca tcgccctgat agacggtttt 4440 tcgccctttg acgttggagt ccacgttctt taatagtgga ctcttgttcc aaactggaac 4500 aacactcaac cctatctcgg gctattcttt tgatttataa gggattttgc cgatttcggc 4560 ctattggtta aaaaatgagc tgatttaaca aaaatttaac gcgaatttta acaaaatatt 4620 aacgtttaca attttatggt gcactctcag tacaatctgc tctgatgccg catagttaag 4680 ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc tgctcccggc 4740 atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga ggttttcacc 4800 gtcatcaccg aaacgcgcga gacgaaaggg cctcgtgata cgcctatttt tataggttaa 4860 tgtcatgata ataatggttt cttagacgtc aggtggcact tttcggggaa atgtgcgcgg 4920 aacccctatt tgtttatttt tctaaataca ttcaaatatg tatccgctca tgagacaata 4980 accctgataa atgcttcaat aatattgaaa aaggaagagt atgagtattc aacatttccg 5040 tgtcgccctt attccctttt ttgcggcatt ttgccttcct gtttttgctc acccagaaac 5100 gctggtgaaa gtaaaagatg ctgaagatca gttgggtgca cgagtgggtt acatcgaact 5160 ggatctcaac agcggtaaga tccttgagag ttttcgcccc gaagaacgtt ttccaatgat 5220 gagcactttt aaagttctgc tatgtggcgc ggtattatcc cgtattgacg ccgggcaaga 5280 gcaactcggt cgccgcatac actattctca gaatgacttg gttgagtact caccagtcac 5340 agaaaagcat cttacggatg gcatgacagt aagagaatta tgcagtgctg ccataaccat 5400 gagtgataac actgcggcca acttacttct gacaacgatc ggaggaccga aggagctaac 5460 cgcttttttg cacaacatgg gggatcatgt aactcgcctt gatcgttggg aaccggagct 5520 gaatgaagcc ataccaaacg acgagcgtga caccacgatg cctgtagcaa tggcaacaac 5580 gttgcgcaaa ctattaactg gcgaactact tactctagct tcccggcaac aattaataga 5640 ctggatggag gcggataaag ttgcaggacc acttctgcgc tcggcccttc cggctggctg 5700 gtttattgct gataaatctg gagccggtga gcgtgggtct cgcggtatca ttgcagcact 5760 ggggccagat ggtaagccct cccgtatcgt agttatctac acgacgggga gtcaggcaac 5820 tatggatgaa cgaaatagac agatcgctga gataggtgcc tcactgatta agcattggta 5880 actgtcagac caagtttact catatatact ttagattgat ttaaaacttc atttttaatt 5940 taaaaggatc taggtgaaga tcctttttga taatctcatg accaaaatcc cttaacgtga 6000 gttttcgttc cactgagcgt cagaccccgt agaaaagatc aaaggatctt cttgagatcc 6060 tttttttctg cgcgtaatct gctgcttgca aacaaaaaaa ccaccgctac cagcggtggt 6120 ttgtttgccg gatcaagagc taccaactct ttttccgaag gtaactggct tcagcagagc 6180 gcagatacca aatactgtcc ttctagtgta gccgtagtta ggccaccact tcaagaactc 6240 tgtagcaccg cctacatacc tcgctctgct aatcctgtta ccagtggctg ctgccagtgg 6300 cgataagtcg tgtcttaccg ggttggactc aagacgatag ttaccggata aggcgcagcg 6360 gtcgggctga acggggggtt cgtgcacaca gcccagcttg gagcgaacga cctacaccga 6420 actgagatac ctacagcgtg agctatgaga aagcgccacg cttcccgaag ggagaaaggc 6480 ggacaggtat ccggtaagcg gcagggtcgg aacaggagag cgcacgaggg agcttccagg 6540 gggaaacgcc tggtatcttt atagtcctgt cgggtttcgc cacctctgac ttgagcgtcg 6600 atttttgtga tgctcgtcag gggggcggag cctatggaaa aacgccagca acgcggcctt 6660 tttacggttc ctggcctttt gctggccttt tgctcacatg t 6701 <210> 22 <211> 495 <212> DNA <213> Homo sapiens <400> 22 gtgtctagac tgcagagggc cctgcgtatg agtgcaagtg ggttttagga ccaggatgag 60 gcggggtggg ggtgcctacc tgacgaccga ccccgaccca ctggacaagc acccaacccc 120 cattccccaa attgcgcatc ccctatcaga gagggggagg ggaaacagga tgcggcgagg 180 cgcgtgcgca ctgccagctt cagcaccgcg gacagtgcct tcgcccccgc ctggcggcgc 240 gcgccaccgc cgcctcagca ctgaaggcgc gctgacgtca ctcgccggtc ccccgcaaac 300 tccccttccc ggccaccttg gtcgcgtccg cgccgccgcc ggcccagccg gaccgcacca 360 cgcgaggcgc gagatagggg ggcacgggcg cgaccatctg cgctgcggcg ccggcgactc 420 agcgctgcct cagtctgcgg tgggcagcgg aggagtcgtg tcgtgcctga gagcgcagtc 480 gagaaaccgg ctaga 495

Claims (79)

  1. Shank3 단백질을 코딩하는 비자연 발생 폴리뉴클레오타이드로서,
    Shank3 단백질은 SH3 도메인, PDZ 도메인, 호머(Homer) 결합 도메인, 코르탁틴(Cortactin) 결합 도메인, 및 SAM 도메인을 포함하고;
    SH3 도메인은 서열번호: 6의 잔기 474-525에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 473-524에 대해 적어도 90% 동일성을 포함하고/거나;
    PDZ 도메인은 서열번호: 6의 잔기 573-662에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 572-661에 대해 적어도 90% 동일성을 포함하고/거나;
    호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323에 대해 적어도 90% 동일성을 포함하고/거나;
    코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426에 대해 적어도 90% 동일성을 포함하고/거나;
    SAM 도메인은 서열번호: 6의 잔기 1664-1729에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 1663-1728에 대해 적어도 90% 동일성을 포함하며;
    폴리뉴클레오타이드는 4.7 kb 미만인 폴리뉴클레오타이드.
  2. 제1항에 있어서, 폴리뉴클레오타이드는 프롤린-풍부 영역을 추가로 포함하는 것인 폴리뉴클레오타이드.
  3. 제1항 또는 제2항에 있어서, SH3 도메인은 서열번호: 6의 잔기 474-525 또는 서열번호: 5의 잔기 473-524를 포함하고/거나, PDZ 도메인은 서열번호: 6의 잔기 573-662 또는 서열번호: 5의 잔기 572-661을 포함하고/거나, 호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323을 포함하고/거나, 코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426을 포함하고/거나 SAM 도메인은 서열번호: 6의 잔기 1664-1729 또는 서열번호: 5의 잔기 1663-1728을 포함하는 것인 폴리뉴클레오타이드.
  4. 제1항 내지 제3항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호: 1 또는 2에 대해 적어도 90% 동일성을 포함하는 것인 폴리뉴클레오타이드.
  5. 제4항에 있어서, 폴리뉴클레오타이드는 서열번호: 1 또는 2를 포함하는 것인 폴리뉴클레오타이드.
  6. 제1항에 있어서, 폴리뉴클레오타이드에 의해 코딩된 Shank3 단백질은 안키린 반복 도메인을 추가로 포함하는 것인 폴리뉴클레오타이드.
  7. 제6항에 있어서, 안키린 반복 도메인은 서열번호: 6의 잔기 148-345에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 147-313에 대해 적어도 90% 동일성을 포함하는 것인 폴리뉴클레오타이드.
  8. 제7항에 있어서, 안키린 반복 도메인은 서열번호: 6의 잔기 148-345 또는 서열번호: 5의 잔기 147-313을 포함하는 것인 폴리뉴클레오타이드.
  9. 제6항 내지 제8항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호: 3 또는 4에 대해 적어도 90% 동일성을 포함하는 것인 폴리뉴클레오타이드.
  10. 제9항에 있어서, 폴리뉴클레오타이드는 서열번호: 3 또는 4를 포함하는 것인 폴리뉴클레오타이드.
  11. 제1항 내지 제10항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 약 4.6 kb, 4.5 kb, 4.4 kb, 4.3 kb, 4.2 kb, 4.1 kb, 4.0 kb, 3.9 kb, 3.8 kb, 3.7 kb, 3.6 kb, 3.5 kb, 3.4 kb, 3.3 kb, 3.2 kb, 3.1 kb, 3.0 kb, 2.9 kb, 2.8 kb, 2.7 kb, 2.6 kb, 2.5 kb, 2.4 kb, 2.3 kb, 2.2 kb, 또는 2.1 kb 미만인 폴리뉴클레오타이드.
  12. 제1항 내지 제11항 중 어느 한 항에 있어서, Shank3 단백질은 서열번호: 5 또는 6의 전장에 걸쳐 서열번호: 5 또는 6에 대해 65% 미만 동일한 것인 폴리뉴클레오타이드.
  13. 제1항 내지 제12항 중 어느 한 항에 있어서, Shank3 단백질은 서열번호: 17-20 중 어느 하나에 대해 적어도 90% 동일한 아미노산 서열을 포함하는 것인 폴리뉴클레오타이드.
  14. 제13항에 있어서, Shank3 단백질은 서열번호: 17-20 중 어느 하나의 아미노산 서열을 포함하는 것인 폴리뉴클레오타이드.
  15. 제1항 내지 제14항 중 어느 한 항의 폴리펩타이드에 의해 코딩되는 Shank3 단백질.
  16. 제1항 내지 제14항 중 어느 한 항의 폴리뉴클레오타이드를 포함하는 벡터.
  17. 제16항에 있어서, 벡터는 바이러스 벡터인 벡터.
  18. 제17항에 있어서, 벡터는 AAV 벡터인 벡터.
  19. 제18항에 있어서, 벡터는 제1항 내지 제14항 중 어느 한 항의 폴리뉴클레오타이드에 작동가능하게 연결된 프로모터를 포함하는 것인 AAV 벡터.
  20. 제19항에 있어서, 폴리뉴클레오타이드는 AAV 역위 말단 반복(ITR)에 의해 측접된 것인 AAV 벡터.
  21. 제18항 내지 제20항 중 어느 한 항에 있어서, AAV 벡터는 서열번호: 7 또는 21에 대해 적어도 90% 동일한 서열을 포함하는 것인 AAV 벡터.
  22. 제21항에 있어서, AAV 벡터는 서열번호: 7 또는 21의 서열을 포함하는 것인 AAV 벡터.
  23. 제19항 내지 제21항 중 어느 한 항의 AAV 벡터 및 캡시드 단백질을 포함하는 AAV 입자로서, 캡시드는 AAV1, 2, 5, 6, 8, 9, rh10, 및 PHP.eB로부터 선택되는 혈청형의 것인 AAV 입자.
  24. 제23항에 있어서, 혈청형은 AAV9인 AAV 입자.
  25. 제23항에 있어서, 혈청형은 AAV10인 AAV 입자.
  26. 제23항에 있어서, 혈청형은 AAV9-PHP.eB 혈청형인 AAV 입자.
  27. 제19항에 있어서, 프로모터는 인간 프로모터인 AAV 벡터.
  28. 제27항에 있어서, 프로모터는 hSyn1인 AAV 벡터.
  29. 제18항 내지 제21항 중 어느 한 항의 AAV 벡터 또는 제23항 내지 제26항의 AAV 입자를 이를 필요로 하는 대상체에게 투여하는 단계를 포함하는 방법.
  30. 제29항에 있어서, AAV 벡터 또는 입자는 정맥내로 투여되는 것인 방법.
  31. 제29항에 있어서, AAV 벡터 또는 입자는 대상체의 뇌로 전달되는 것인 방법.
  32. 제29항에 있어서, AAV 벡터 또는 입자는 대상체의 피질, 선조체 및/또는 시상으로 전달되는 것인 방법.
  33. 제29항에 있어서, 대상체는 인간 대상체인 방법.
  34. 제33항에 있어서, 인간 대상체는 성인인 방법.
  35. 제33항에 있어서, 인간 대상체는 성인이 아닌 것인 방법.
  36. 제334항에 있어서, 인간 대상체는 25세 이하인 방법.
  37. 제35항에 있어서, 인간 대상체는 10세 이하인 방법.
  38. 제28항 내지 제36항 중 어느 한 항에 있어서, 대상체는 신경발달 장애를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 것인 방법.
  39. 제29항 내지 제37항 중 어느 한 항에 있어서, 대상체는 자폐 스펙트럼 장애(ASD)를 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 것인 방법.
  40. 제29항 내지 제37항 중 어느 한 항에 있어서, 대상체는 ASD의 하나 이상의 증상을 나타내는 것인 방법.
  41. 제29항 내지 제37항 중 어느 한 항에 있어서, 대상체는 펠란-맥더미드 증후군(Phelan-McDermid syndrome)을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 것인 방법.
  42. 제29항 내지 제41항 중 어느 한 항에 있어서, 대상체는 발달 지연, 지적 장애(ID), 수면 장애, 저긴장, 언어능력 부족 또는 언어 지연 중 하나 이상을 나타내는 것인 방법.
  43. 제29항 내지 제42항 중 어느 한 항에 있어서, 대상체는 대조군 대상체에 비해 Shank3 유전자의 감소된 발현을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 것인 방법.
  44. 제43항에 있어서, 대조군 대상체는 신경발달 장애, 자폐 스펙트럼 장애(ASD) 및/또는 펠란-맥더미드 증후군을 갖지 않거나, 갖는 것으로 의심되지 않거나, 또는 가질 위험이 없는 대상체인 방법.
  45. 제43항 또는 제44항에 있어서, Shank3 유전자의 감소된 발현은 Shank3 유전자의 적어도 하나의 카피의 파괴에 의해 유발되는 것인 방법.
  46. 제45항에 있어서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 결실을 포함하는 것인 방법.
  47. 제45항에 있어서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 하나 이상의 돌연변이를 포함하는 것인 방법.
  48. 신경 발달 장애를 갖는 대상체를 치료하는 방법으로서, AAV 벡터를 포함하는 조성물의 유효량을 대상체에게 투여하는 단계를 포함하고, AAV 벡터는 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 것인 방법.
  49. 자폐 스펙트럼 장애(ASD)를 갖는 대상체를 치료하는 방법으로서, AAV 벡터를 포함하는 조성물의 유효량을 대상체에게 투여하는 단계를 포함하고, AAV 벡터는 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 것인 방법.
  50. 펠란-맥더미드 증후군을 갖는 대상체를 치료하는 방법으로서, AAV 벡터를 포함하는 조성물의 유효량을 대상체에게 투여하는 단계를 포함하고, AAV 벡터는 Shank3 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 것인 방법.
  51. 제48항 내지 제50항 중 어느 한 항에 있어서, Shank3 단백질은 SH3 도메인, PDZ 도메인, 호머 결합 도메인, 코르탁틴 결합 도메인, 및 SAM 도메인을 포함하는 것인 방법.
  52. 제48항 내지 제50항 중 어느 한 항에 있어서, Shank3 단백질은 안키린 반복 도메인을 추가로 포함하는 것인 방법.
  53. 제52항에 있어서, 안키린 반복 도메인은 서열번호: 6의 잔기 148-345에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 147-313에 대해 적어도 90% 동일성을 포함하는 것인 방법.
  54. 제51항 내지 제53항 중 어느 한 항에 있어서, SH3 도메인은 서열번호: 6의 잔기 474-525에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 473-524에 대해 적어도 90% 동일성을 포함하고/거나;
    PDZ 도메인은 서열번호: 6의 잔기 573-662에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 572-661에 대해 적어도 90% 동일성을 포함하고/거나;
    호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323에 대해 적어도 90% 동일성을 포함하고/거나;
    코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426에 대해 적어도 90% 동일성을 포함하고/거나;
    SAM 도메인은 서열번호: 6의 잔기 1664-1729에 대해 적어도 90% 동일성 또는 서열번호: 5의 잔기 1663-1728에 대해 적어도 90% 동일성을 포함하는 것인 방법.
  55. 제48항 내지 제50항 중 어느 한 항에 있어서, SH3 도메인은 서열번호: 6의 잔기 474-525 또는 서열번호: 5의 잔기 473-524를 포함하고/거나,
    PDZ 도메인은 서열번호: 6의 잔기 573-662 또는 서열번호: 5의 잔기 572-661을 포함하고/거나,
    호머 결합 도메인은 서열번호: 5 또는 6의 잔기 1294-1323을 포함하고/거나,
    코르탁틴 결합 도메인은 서열번호: 5 또는 6의 잔기 1400-1426을 포함하고/거나;
    SAM 도메인은 서열번호: 6의 잔기 1664-1729 또는 서열번호: 5의 잔기 1663-1728을 포함하는 것인 방법.
  56. 제47항 내지 제49항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 4.7 kb 미만인 방법.
  57. 제48항 내지 제50항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 약 4.6 kb, 4.5 kb, 4.4 kb, 4.3 kb, 4.2 kb, 4.1 kb, 4.0 kb, 3.9 kb, 3.8 kb, 3.7 kb, 3.6 kb, 3.5 kb, 3.4 kb, 3.3 kb, 3.2 kb, 3.1 kb, 3.0 kb, 2.9 kb, 2.8 kb, 2.7 kb, 2.6 kb, 2.5 kb, 2.4 kb, 2.3 kb, 2.2 kb, 또는 2.1 kb 미만인 방법.
  58. 제48항 내지 제50항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 프롤린-풍부 영역을 추가로 포함하는 것인 방법.
  59. 제48항 내지 제50항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호: 1-4 중 어느 하나에 대해 적어도 90% 동일성을 포함하는 것인 방법.
  60. 제48항 내지 제50항 중 어느 한 항에 있어서, 폴리뉴클레오타이드는 서열번호: 1-4 중 어느 하나를 포함하는 것인 방법.
  61. 제478항 내지 제50항 중 어느 한 항에 있어서, 대상체는 인간 대상체인 방법.
  62. 제61항에 있어서, 인간 대상체는 성인인 방법.
  63. 제61항에 있어서, 인간 대상체는 성인이 아닌 것인 방법.
  64. 제62항에 있어서, 인간 대상체는 25세 이하인 방법.
  65. 제63항에 있어서, 인간 대상체는 10세 이하인 방법.
  66. 제48항 내지 제65항 중 어느 한 항에 있어서, 조성물은 정맥내로 투여되는 것인 방법.
  67. 제48항 내지 제65항 중 어느 한 항에 있어서, 조성물은 대상체의 뇌로 전달되는 것인 방법.
  68. 제48항 내지 제65항 중 어느 한 항에 있어서, 조성물은 대상체의 선조체 및/또는 시상으로 전달되는 것인 방법.
  69. 제48항 내지 제68항 중 어느 한 항에 있어서, 대상체는 발달 지연, 지적 장애(ID), 수면 장애, 저긴장, 언어능력 부족 또는 언어 지연 중 하나 이상을 나타내는 것인 방법.
  70. 제48항에 있어서, 자폐 스펙트럼 장애(ASD)는 자폐 장애를 포함하는 것인 방법.
  71. 제48항 내지 제70항 중 어느 한 항에 있어서, 대상체는 대조군 대상체에 비해 Shank3 유전자의 감소된 발현을 갖거나, 갖는 것으로 의심되거나, 또는 가질 위험이 있는 것인 방법.
  72. 제71항에 있어서, 대조군 대상체는 신경발달 장애, 자폐 스펙트럼 장애(ASD) 및/또는 펠란-맥더미드 증후군을 갖지 않거나, 갖는 것으로 의심되지 않거나, 가질 위험이 없는 대상체인 방법.
  73. 제71항 또는 제72항에 있어서, Shank3 유전자의 감소된 발현은 Shank3 유전자의 적어도 하나의 카피의 파괴에 의해 유발되는 것인 방법.
  74. 제73항에 있어서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 결실을 포함하는 것인 방법.
  75. 제73항에 있어서, Shank3 유전자의 파괴는 Shank3 유전자의 적어도 하나의 카피 내에 하나 이상의 돌연변이를 포함하는 것인 방법.
  76. 제48항 내지 제50항 중 어느 한 항에 있어서, 대상체는 조성물의 유효량을 투여받은 후 개선된 수면 효율을 갖는 것인 방법.
  77. 제48항 내지 제76항 중 어느 한 항에 있어서, 조성물은 약제학적으로 허용가능한 담체 내에 있는 것인 방법.
  78. 서열번호: 17-20 중 어느 하나에 대해 적어도 80%, 적어도 85%, 적어도 90%, 또는 적어도 95% 동일한 서열을 포함하는 MiniShank3 단백질.
  79. 제78항에 있어서, MiniShank3 단백질은 서열번호: 17-20 중 어느 하나의 서열을 포함하는 것인 MiniShank3 단백질.
KR1020237009262A 2020-08-17 2021-08-17 Shank3 유전자 치료 접근법 KR20230051578A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202063066570P 2020-08-17 2020-08-17
US63/066,570 2020-08-17
PCT/US2021/046382 WO2022040239A1 (en) 2020-08-17 2021-08-17 Shank3 gene therapy approaches

Publications (1)

Publication Number Publication Date
KR20230051578A true KR20230051578A (ko) 2023-04-18

Family

ID=77951796

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020237009262A KR20230051578A (ko) 2020-08-17 2021-08-17 Shank3 유전자 치료 접근법

Country Status (11)

Country Link
US (1) US20230340041A1 (ko)
EP (1) EP4196494A1 (ko)
JP (1) JP2023539574A (ko)
KR (1) KR20230051578A (ko)
CN (1) CN116406305A (ko)
AU (1) AU2021328570A1 (ko)
BR (1) BR112023003023A2 (ko)
CA (1) CA3192052A1 (ko)
IL (1) IL300526A (ko)
MX (1) MX2023001998A (ko)
WO (1) WO2022040239A1 (ko)

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5549910A (en) 1989-03-31 1996-08-27 The Regents Of The University Of California Preparation of liposome and lipid complex compositions
US5252334A (en) 1989-09-08 1993-10-12 Cygnus Therapeutic Systems Solid matrix system for transdermal drug delivery
JP3218637B2 (ja) 1990-07-26 2001-10-15 大正製薬株式会社 安定なリポソーム水懸濁液
JP2958076B2 (ja) 1990-08-27 1999-10-06 株式会社ビタミン研究所 遺伝子導入用多重膜リポソーム及び遺伝子捕捉多重膜リポソーム製剤並びにその製法
US5741516A (en) 1994-06-20 1998-04-21 Inex Pharmaceuticals Corporation Sphingosomes for enhanced drug delivery
US5795587A (en) 1995-01-23 1998-08-18 University Of Pittsburgh Stable lipid-comprising drug delivery complexes and methods for their production
US5697899A (en) 1995-02-07 1997-12-16 Gensia Feedback controlled drug delivery system
US5738868A (en) 1995-07-18 1998-04-14 Lipogenics Ltd. Liposome compositions and kits therefor
US5656016A (en) 1996-03-18 1997-08-12 Abbott Laboratories Sonophoretic drug delivery system
US5797898A (en) 1996-07-02 1998-08-25 Massachusetts Institute Of Technology Microchip drug delivery devices
US5783208A (en) 1996-07-19 1998-07-21 Theratech, Inc. Transdermal drug delivery matrix for coadministering estradiol and another steroid
US5779708A (en) 1996-08-15 1998-07-14 Cyberdent, Inc. Intraosseous drug delivery device and method
EP2292779B1 (en) 2003-09-30 2016-11-16 The Trustees Of The University Of Pennsylvania Adeno-associated virus (AAV) clades, sequences, vectors containing same, and uses thereof
GB201103062D0 (en) 2011-02-22 2011-04-06 Isis Innovation Method
WO2015038958A1 (en) 2013-09-13 2015-03-19 California Institute Of Technology Selective recovery
IL259842B (en) 2015-12-11 2022-08-01 California Inst Of Techn Targeted peptides for the targeting of adeno-associated viruses -aavs-
KR20220108216A (ko) 2016-05-18 2022-08-02 보이저 테라퓨틱스, 인크. 헌팅톤 질환을 치료하기 위한 조성물 및 방법
WO2020160337A1 (en) 2019-01-30 2020-08-06 The Broad Institute, Inc. Systems for evolved adeno-associated viruses (aavs) for targeted delivery
IT201900008877A1 (it) * 2019-06-13 2020-12-13 Univ Bologna Alma Mater Studiorum Nuovi costrutti per terapia genica

Also Published As

Publication number Publication date
BR112023003023A2 (pt) 2023-04-11
EP4196494A1 (en) 2023-06-21
CA3192052A1 (en) 2022-02-24
US20230340041A1 (en) 2023-10-26
MX2023001998A (es) 2023-05-04
IL300526A (en) 2023-04-01
WO2022040239A8 (en) 2022-06-23
JP2023539574A (ja) 2023-09-15
AU2021328570A1 (en) 2023-03-09
WO2022040239A1 (en) 2022-02-24
CN116406305A (zh) 2023-07-07

Similar Documents

Publication Publication Date Title
CN108753824B (zh) 用于治疗视网膜营养不良的病毒载体
KR102178322B1 (ko) 변형된 인자 ix, 및 세포, 기관 및 조직으로 유전자를 전달하기 위한 조성물, 방법 및 용도
CN108289933B (zh) 作为认知和行为障碍药物的哺乳动物Klotho的分泌型剪接变体
KR102604096B1 (ko) 윌슨병을 치료하기 위한 유전자 치료
KR102654180B1 (ko) 프롤린 및 알라닌 잔기가 풍부한 반복적인 아미노산 서열을 암호화하고 낮은 반복적인 뉴클레오티드 서열을 갖는 핵산
CN112218882A (zh) Foxp3在经编辑的cd34+细胞中的表达
US20030177507A1 (en) Nematodes as model organisms for the investigation of neurodegenerative diseases, in particular parkinsons disease, uses and methods for the discovery of substances and genes which can used in the treatment of the above disease states and identification of anematode gene
KR20170107481A (ko) 신규한 마이크로-디스트로핀 및 관련된 사용 방법
CN110662839A (zh) 用于细胞疗法的基于靶向性配体-有效负载的药物递送
AU2016302335A1 (en) GLP-1 and use thereof in compositions for treating metabolic diseases
KR20210005146A (ko) 유전자 편집된 t 세포에서의 인간 foxp3의 발현
KR20230062873A (ko) 염기 편집 효소
JP2023524010A (ja) 高効率遺伝子送達系
TW202227476A (zh) 編碼GJB2之重組腺相關病毒(rAAV)及其用途
KR20230038508A (ko) Mybpc3 폴리펩티드 및 그의 용도
KR20210005178A (ko) X-연관 고 igm 증후군에서의 치료적 게놈 편집
KR20230051578A (ko) Shank3 유전자 치료 접근법
CN112203697A (zh) 编码氨基己糖苷酶alpha和beta亚基的双顺反子AAV载体及其用途
KR20230170686A (ko) 부정맥유발 우심실 심근병증에 대한 유전자 치료법
CN112342234B (zh) 一种调控n-乙酰神经氨酸产量提高的重组枯草芽孢杆菌
KR20220142502A (ko) 근육 특이적 핵산 조절 요소 및 이의 방법 및 용도
US9493747B2 (en) Engineered transglutaminase barrel proteins
US20230346977A1 (en) Treatment of neuromuscular diseases via gene therapy that expresses klotho protein
TW201030146A (en) High-expression promoter and method for producing gene product using the same
KR20240021166A (ko) 스테레오실린 이중 벡터 시스템을 사용하여 감각신경성 청력 상실을 치료하기 위한 조성물 및 방법