KR102500531B1 - 헤모글로빈병증 치료용 글로빈 유전자 치료법 - Google Patents

헤모글로빈병증 치료용 글로빈 유전자 치료법 Download PDF

Info

Publication number
KR102500531B1
KR102500531B1 KR1020177008935A KR20177008935A KR102500531B1 KR 102500531 B1 KR102500531 B1 KR 102500531B1 KR 1020177008935 A KR1020177008935 A KR 1020177008935A KR 20177008935 A KR20177008935 A KR 20177008935A KR 102500531 B1 KR102500531 B1 KR 102500531B1
Authority
KR
South Korea
Prior art keywords
region
expression cassette
globin
seq
nucleotide sequence
Prior art date
Application number
KR1020177008935A
Other languages
English (en)
Other versions
KR20170044752A (ko
Inventor
마이클 새들레인
이사벨 리비에르
조지 만실라-소토
시우얀 왕
조지 스태마토이안노포로스
존 스태마토이안노포로스
밍동 리우
Original Assignee
메모리얼 슬로안 케터링 캔서 센터
유니버시티 오브 워싱톤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 메모리얼 슬로안 케터링 캔서 센터, 유니버시티 오브 워싱톤 filed Critical 메모리얼 슬로안 케터링 캔서 센터
Priority to KR1020237005064A priority Critical patent/KR20230030002A/ko
Publication of KR20170044752A publication Critical patent/KR20170044752A/ko
Application granted granted Critical
Publication of KR102500531B1 publication Critical patent/KR102500531B1/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0066Manipulation of the nucleic acid to modify its expression pattern, e.g. enhance its duration of expression, achieved by the presence of particular introns in the delivered nucleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/005Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy characterised by an aspect of the 'active' part of the composition delivered, i.e. the nucleic acid delivered
    • A61K48/0058Nucleic acids adapted for tissue specific expression, e.g. having tissue specific promoters as part of a contruct
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/06Antianaemics
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/795Porphyrin- or corrin-ring-containing peptides
    • C07K14/805Haemoglobins; Myoglobins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/10041Use of virus, viral particle or viral elements as a vector
    • C12N2740/10043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/15011Lentivirus, not HIV, e.g. FIV, SIV
    • C12N2740/15041Use of virus, viral particle or viral elements as a vector
    • C12N2740/15043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2740/00Reverse transcribing RNA viruses
    • C12N2740/00011Details
    • C12N2740/10011Retroviridae
    • C12N2740/16011Human Immunodeficiency Virus, HIV
    • C12N2740/16041Use of virus, viral particle or viral elements as a vector
    • C12N2740/16043Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/008Vector systems having a special element relevant for transcription cell type or tissue specific enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/15Vector systems having a special element relevant for transcription chimeric enhancer/promoter combination
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/30Vector systems having a special element relevant for transcription being an enhancer not forming part of the promoter region
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/40Vector systems having a special element relevant for transcription being an insulator
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/46Vector systems having a special element relevant for transcription elements influencing chromatin structure, e.g. scaffold/matrix attachment region, methylation free island
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/48Vector systems having a special element relevant for transcription regulating transport or export of RNA, e.g. RRE, PRE, WPRE, CTE
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2830/00Vector systems having a special element relevant for transcription
    • C12N2830/50Vector systems having a special element relevant for transcription regulating RNA stability, not being an intron, e.g. poly A signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Public Health (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Veterinary Medicine (AREA)
  • Epidemiology (AREA)
  • Virology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Diabetes (AREA)
  • Hematology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 개시된 보호대상은 글로빈 유전자 또는 이의 기능성 부분의 발현을 가능하게 하는 발현 카세트, 이를 포함하는 벡터, 및 이러한 발현 카세트 및 벡터로 형질도입된 세포를 제공한다. 본 개시된 보호대상은 이러한 형질도입된 세포를 대상체에게 유효량 투여하는 단계를 포함하는, 대상체에서 헤모글로빈병증을 치료하는 방법도 제공한다.

Description

헤모글로빈병증 치료용 글로빈 유전자 치료법{GLOBIN GENE THERAPY FOR TREATING HEMOGLOBINOPATHIES}
관련 출원에 대한 상호-참조
본 출원은 2014년 9월 4일자로 출원되고 그 전체 내용이 인용에 의해 본 명세서에 포함되는 미국 가출원 제62/045,997호에 대한 우선권을 주장한다.
교부금 정보
본 발명은 미국 국립 심장, 폐 및 혈액 연구소로부터 교부금 번호 HL053750 하의 정부 지원으로 수행되었다. 정부는 본 발명에서 일정한 권리를 갖는다.
서론
본 개시된 보호대상은 글로빈 단백질, 예컨대 인간 β-글로빈 단백질을 발현하는 발현 카세트 및 이러한 발현 카세트를 포함하는 벡터를 제공한다. 본 개시된 보호대상은 추가로 복수의 Dnase I 과민감성 부위를 포함하는 β-글로빈 좌위(locus) 조절 영역(locus control region, LCR)과 작동가능하게 연결된 글로빈 유전자 또는 이의 기능성 부분을 포함하는 발현 카세트를 제공한다. 본 개시된 보호대상의 발현 카세트는 인핸서(enhancer) 구성요소의 효과에 대응하는 하나 이상의 인슐레이터(insulator)를 포함한다. 본 명세서에 개시된 인슐레이터는 본 발명의 발현 카세트를 포함하는 벡터의 역가(titer)에 실질적으로 부정적인 영향을 미치지 않는다. 상기 발현 카세트 및 벡터는 헤모글로빈병증(hemoglobinopathy), 예컨대 β-지중해빈혈(thalassemia) 및 겸상 세포 빈혈의 치료용으로 사용될 수 있다.
β-지중해빈혈 및 겸상 세포 빈혈은 결함이 있는 헤모글로빈의 β 쇄의 생성에 의해 유발되는 중증 선천성 빈혈이다. β-지중해빈혈에서, β 쇄의 결손은 세포내 침전을 과량의 α-글로빈 쇄의 침전을 유도하여, 비효과적인 적혈구생성 및 용혈성 빈혈을 유발한다(Weatherall and Clegg (1981), Stamatoyannopoulos et al., (1994), Weatherall (2001), Steinberg (2001)). 동형접합체 또는 복잡한 이형접합체에서 발견되는 가장 심각한 형태에 있어서, 빈혈은 어떠한 치료도 없으면 일생의 첫 번째 해 이내에 치명적이다(Cooley and Lee (1925)). 빈혈을 보정하고, 비효과적인 적혈구생성을 저해하며, 위장의 철 흡수를 억제하기 위하여 일생동안 수혈 치료법이 필요하다(Weatherall and Clegg (1981), Stamatoyannopoulos et al. (1994), Weatherall (2001), Steinberg (2001)). 그러나, 수혈 치료법 자체는 철 과부하를 유도하는데, 이는 치료되지 않으면 치명적이다. 철 과부하의 방지 및 치료는 현재 환자 관리의 주요 목표이다(Giardina (2001)). β-지중해빈혈을 치유하기 위한 현재의 유일한 치유적 치료는 동종이계 골수 이식(bone marrow transplantation, BMT)을 통해 정상 글로빈 유전자를 갖고 있는 적혈구 전구체를 제공하는 것이다(Giardini and Lucarelli (1994), Boulad et al. (1998), Lucarelli et al. (1999), Tisdale and Sadelain (2001)).
겸상 세포 빈혈에서, 헤모글로빈 β 쇄는 아미노산 위치 6에서 돌연변이(Glu → Val)되어, 정상적인 βA 쇄 대신에 βS의 합성을 유도한다(Steinberg (2001), Pauling et al. (1949)). 결과물인 헤모글로빈 HbS는 가속화된 적혈구 파괴, 적혈구 과다형성 및 고통적인 혈관-막힘 '위기'를 초래한다(Steinberg (2001)). 혈관-막힘은 기관에 손상을 주고, 결국 장기간의 장애(예컨대, 후속 뇌졸중 또는 뼈 괴사)와 때때로 돌연사를 초래한다. 매우 심각한 장애이지만, 겸상 세포 질환의 과정은 전형적으로 예측불가하다(Steinberg (2001)). 태아 헤모글로빈의 생산을 증가시키고(Swank and Stamatoyannopoulos (1998)) 조혈작용을 저해함으로써, 수산화요소는 측정가능한 임상적 이점을 생성할 수 있다(Platt et al. (1984)), Charache et al. (1992), Atweh and Loukopoulos (2001)). 수산화요소는 세포독성제이므로, γ-글로빈 유전자 발현을 유도하기 위하여 대체적인 독성이 덜한 약물에 대한 강한 필요성이 있다(Perrine et al. (2005), Stamatoyannopoulos (2005)). β-지중해빈혈에 대하여, 동종이계 골수 이식(BMT)은 현재 겸상 세포 질환에 대한 유일한 치유적 치료법이다(Tisdale and Sadelain (2001), Vermylen et al. (1998), Luzzatto and Goodfellow (1989)).
그러나, BMT는 대부분의 개체에 대해 HLA-일치된 골수 공여자의 부재로 인해 β-지중해빈혈 또는 겸상 세포 질환을 앓고 있는 대부분의 환자에게 치료적 옵션으로 이용불가이다. 또한, 잠재적으로 치유적이기는 하지만, 동종이계 BMT는 합병증이 없지 않다. 안전한 이식은 이식 거부 및 이식편-대-숙주 질환의 위험을 최소화하기 위하여 조직-적합성 공여자의 확인을 필요로 한다(Tisdale and Sadelain (2001), Vermylen et al. (1998), Luzzatto and Goodfellow (1989)). 일치된-비연관성 또는 불일치된 이식과 연관된 위험성이 더 커지기 때문에, 대부분의 환자는 평생 수혈 치료법에 적응해야 하는데, 이것은 비효과적인 적혈구생성을 보정하지 않고 전신성 철 축적을 악화시킨다. 또한, 지난 수십년 내에 기대 수명이 상당히 개선되었지만(Borgna-Pignatti et al. (2004), Telfer et al. (2009), Ladis et al. (2011)), 바이러스 감염, 철 독성 및 간 경화로부터 유래되는 장기간에 걸쳐 일어나는 일부 심각한 합병증의 위험성이 남아 있다(Mancuso et al. (2006)). 상기 의학적 위험성은 만성 β-지중해빈혈의 사회경제학적 비용과 함께 안전하교 효과적이며 치유적인 치료법에 대한 필요성을 강조한다.
중증 β-지중해빈혈을 치료보다는 치유하기 위한 유일한 방법은 환자에게 건강한 조혈 줄기 세포(hematopoietic stem cell, HSC)를 제공하는 것이다. HSC는 보통 성인에서 하루에 200억 RBC를 포함하는 모든 혈액 세포 유형을 발생시킨다. HSC는 야생형 β-글로빈 유전자를 갖는 공여자로부터 수확하여 헤모글로빈 함량이 정상인 오래 생존하는 적혈구 세포(RBC)를 생성할 수 있다. 다른 한편으로, 환자 자신의 HSC를 유전적으로 보정할 수 있으며, 이것은 공여자에 대한 검색을 즉시 해결하고 동종이계 BMT와 연관된 이식편-대-숙주 질환 및 이식 거부의 위험성을 제거한다(Sadelain (1997), Sadelain et al. (2007)). 글로빈 유전자 전달은 β-지중해빈혈 개체 자신의 혈액-형성 줄기 세포의 능력을 회복하여 충분한 헤모글로빈 함량을 갖는 RBC를 생성하는 것을 목표로 한다(Sadelain et al. (2007), Persons and Tisdale (2004), Sadelain (2006)). 겸상 세포 빈혈을 갖는 환자에서의 목표는 겸상화를 방지하는 것이며, 이것은 벡터-암호화된 글로빈 쇄를 포함하는 비-겸상화 Hb로 내인성 HbS를 희석함으로써 달성될 수 있다. 환자 자신의 HSC는 오래 지속하는 치료적 이점을 보장하고 치유적 줄기 세포-기반의 치료법을 달성하도록 유전적으로 변형되어야 하는 세포이다.
중증 β-지중해빈혈 및 겸상 세포 빈혈의 치료를 위한 글로빈 유전자 전달의 실행은 HSC에서 조절된 인간 β- 또는 β-유사 글로빈 유전자의 효과적인 도입을 필요로 한다. β-글로빈 유전자(또는 β-유사 변이체)는 특히 수혈-의존적 베타-제로 지중해빈혈의 치료를 위해서는 적혈구-특이적인 방식으로 높은 레벨로 발현되어야 한다.
지금까지 개발된 글로빈 벡터는 지중해빈혈 및 겸상 세포 환자에서의 안전한 사용을 제한하거나 심지어 배제할 수 있는 결점을 갖고 있다. 상기 벡터들 내에 함유되는 β-글로빈 좌위 조절 영역(LCR) 구성성분의 일부, 특히 Dnase I 과민감성 부위-2(HS2)는 비-적혈구 활성을 가질 수 있고, 환자를 비-특이적 발현 벡터에서 보여지는 것과 같은 삽입적 종양형성의 위험성에 노출시킨다. 또한, 큰 LCR 분절(segment)의 사용은 높은 역가의 벡터의 생산 및 환자 HSC의 효과적인 형질도입에 해로울 수 있다. 따라서, 삽입적 종양형성의 위험성을 최소화하고, 적혈구-특이적이고 분화 단계-특이적인 방식으로 글로빈 유전자(예컨대, 인간 β-글로빈 유전자)의 치료적 발현을 허용하며, 높은 레벨의 형질도입을 가능하게 하여, 지중해빈혈 및 겸상 세포 환자의 치료에 사용될 때 그 안전성을 개선하는 신규한 글로빈 발현 카세트에 대한 필요성이 있다.
본 개시된 보호대상은 일반적으로 인핸서 차단 인슐레이터를 제공하며, 어떤 인슐레이터는 부가적으로 장벽(barrier) 인슐레이터 활성을 갖고 있다. 본 개시된 보호대상은 또한 하나 이상의 인슐레이터를 포함하는 발현 카세트를 제공하고, 글로빈 유전자(예컨대, 인간 β 글로빈 유전자)의 발현을 허용한다. 또한, 이러한 발현 카세트를 포함하는 벡터, 이러한 발현 카세트 또는 이러한 벡터로 형질도입된 세포, 및 헤모글로빈병증(예컨대, β-지중해빈혈 및 겸상 세포 빈혈)의 치료를 위한 이러한 발현 카세트의 용도가 제공된다.
어떤 비제한적 구현예에서, 본 개시된 보호대상은 서열번호 18에 기재된 CTCF 결합 부위 서열을 포함하는 인슐레이터, 예를 들면, 이에 한정되는 것은 아니지만, 서열번호 1에 기재된 뉴클레오티드 서열을 갖는 인슐레이터와 같이 서열번호 24 또는 서열번호 25를 포함하는 인슐레이터를 제공한다(하기 참조). 본 개시된 보호대상은 또한 서열번호 18에 기재된 CTCF 결합 부위 서열을 포함하는 적어도 하나의 인슐레이터, 예를 들면, 이에 한정되는 것은 아니지만, 서열번호 1에 기재된 뉴클레오티드 서열을 갖는 인슐레이터와 같이 서열번호 24 또는 서열번호 25를 포함하는 인슐레이터를 포함하는 발현 카세트를 제공한다. 비제한적 구현예에서, 발현 카세트는 서열번호 18에 기재된 CTCF 결합 부위 서열을 포함하는 적어도 하나의 인슐레이터, 예를 들면, 이에 한정되는 것은 아니지만, 서열번호 1에 기재된 뉴클레오티드 서열을 갖는 인슐레이터와 같이 서열번호 24 또는 서열번호 25를 포함하는 인슐레이터, 및 β-글로빈 좌위 조절 영역(LCR)에 작동가능하게 연결된 글로빈 유전자 또는 이의 기능성 부분을 포함한다. 어떤 구현예에서, 상기 β-글로빈 LCR은 Dnase I 과민감성 부위-2(HS2) 영역을 포함하지 않는다. 어떤 구현예에서, 상기 β-글로빈 LCR 영역은 HS2의 코어(core) 서열을 포함하지 않는다. 한 비제한적 구현예에서, 상기 HS2의 코어 서열은 서열번호 20에 기재된 뉴클레오티드 서열을 갖는다. 한 비제한적 구현예에서, 상기 HS2의 코어 서열은 서열번호 21에 기재된 뉴클레오티드 서열을 갖는다. 어떤 구현예에서, 상기 β-글로빈 LCR은 HS2의 인핸서 활성을 유지하는 HS2 영역을 포함하지 않는다. 한 비제한적 구현예에서, 상기 β-글로빈 LCR은 Dnase I 과민감성 부위-1(HS1) 영역, Dnase I 과민감성 부위-3(HS3) 영역 및 Dnase I 과민감성 부위-4(HS4) 영역을 포함한다. 어떤 구현예에서, 상기 HS3 영역은 HS1 및 HS4 영역 사이에 위치한다.
어떤 구현예에서, 상기 HS1 영역은 약 1.1 kb bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS1 영역은 약 500 bp 및 약 1,000 bp 사이의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS1 영역은 서열번호 2에 기재된 뉴클레오티드 서열을 갖는다. 어떤 구현예에서, 상기 HS1 영역은 약 600 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS1 영역은 602 bp의 길이를 갖는다. 어떤 구현예에서, 상기 HS1 영역은 약 500 내지 약 600 bp 사이의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS1 영역은 서열번호 3에 기재된 뉴클레오티드 서열을 갖는다. 어떤 구현예에서, 상기 HS1 영역은 약 490 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS1 영역은 489 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS1 영역은 서열번호 4에 기재된 뉴클레오티드 서열을 갖는다. 한 비제한적 구현예에서, 상기 β-글로빈 LCR은 서열번호 2에 기재된 뉴클레오티드 서열을 갖는 HS1 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 HS3 영역 및 서열번호 6에 기재된 뉴클레오티드 서열을 갖는 HS4 영역을 포함하고, 상기 β-글로빈 LCR 영역은 HS2 영역을 포함하지 않는다. 한 비제한적 구현예에서, 상기 β-글로빈 LCR 영역은 서열번호 3에 기재된 뉴클레오티드 서열을 갖는 HS1 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 HS3 영역 및 서열번호 8에 기재된 뉴클레오티드 서열을 갖는 HS4 영역을 포함하고, 상기 β-글로빈 LCR은 HS2 영역을 포함하지 않는다. 한 비제한적 구현예에서, 상기 β-글로빈 LCR은 서열번호 4에 기재된 뉴클레오티드 서열을 갖는 HS1 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 HS3 영역 및 서열번호 8에 기재된 뉴클레오티드 서열을 갖는 HS4 영역을 포함하고, 상기 β-글로빈 LCR은 HS2 영역을 포함하지 않는다.
어떤 구현예에서, 상기 β-글로빈 LCR 영역은 HS1 영역을 포함하지 않거나 및/또는 HS2 영역을 포함하지 않고, 상기 β-글로빈 LCR은 HS2의 코어 서열을 포함하지 않는다. 어떤 구현예에서, 상기 β-글로빈 LCR은 HS1의 코어 서열을 포함하지 않는다. 한 비제한적 구현예에서, 상기 HS1의 코어 서열은 서열번호 22에 기재된 뉴클레오티드 서열을 갖는다. 한 비제한적 구현예에서, 상기 HS1의 코어 서열은 서열번호 23에 기재된 뉴클레오티드 서열을 갖는다. 어떤 구현예에서, 상기 β-글로빈 LCR은 HS1의 기능을 유지하는 HS1 영역을 포함하지 않는다. 어떤 구현예에서, 상기 β-글로빈 LCR은 HS3 영역 및 HS4 영역을 포함하고, HS1의 코어 서열을 포함하지 않는다. 어떤 구현예에서, 상기 HS3 영역은 글로빈 유전자 또는 이의 기능성 부분과 상기 HS4 영역 사이에 위치한다. 어떤 구현예에서, 상기 HS3 영역은 약 200 내지 약 1,400 bp 사이, 예컨대 길이가 약 1,300 및 1,400 bp 사이의 길이를 갖는다. 어떤 구현예에서, 상기 HS3 영역은 약 1,300 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS3 영역은 1,301 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS3 영역은 서열번호 5에 기재된 뉴클레오티드 서열을 갖는다. 어떤 구현예에서, 상기 HS4 영역은 약 200 및 약 1,200 bp 사이, 예컨대 길이가 약 400 및 1,100 bp 사이의 길이를 갖는다. 어떤 구현예에서, 상기 HS4 영역은 약 1.1 kb의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS4 영역은 1,065 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS4 영역은 서열번호 6에 기재된 뉴클레오티드 서열을 갖는다. 한 비제한적 구현예에서, 상기 HS4 영역은 서열번호 7에 기재된 뉴클레오티드 서열을 갖는다. 어떤 구현예에서, 상기 HS4 영역은 약 450 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS4 영역은 446 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS4 영역은 서열번호 8에 기재된 뉴클레오티드 서열을 갖는다. 한 비제한적 구현예에서, 상기 β-글로빈 LCR 영역은 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 HS3 영역 및 서열번호 6에 기재된 뉴클레오티드 서열을 갖는 HS4 영역을 포함하고, 상기 β-글로빈 LCR 영역은 HS1 영역 또는 HS2 영역을 포함하지 않는다.
다른 한편으로, 상기 β-글로빈 LCR 영역은 HS2 영역, HS3 영역 및 HS4 영역을 포함할 수 있다. 어떤 구현예에서, 상기 HS2 영역은 약 400 및 약 1,000 bp 사이, 예컨대 길이가 약 800 및 900 bp 사이의 길이를 갖는다. 어떤 구현예에서, 상기 HS2 영역은 약 860 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS2 영역은 서열번호 9에 기재된 뉴클레오티드 서열을 갖는다. 어떤 구현예에서, 상기 HS3 영역은 약 1,300 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS3 영역은 1,301 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS3 영역은 서열번호 5에 기재된 뉴클레오티드 서열을 갖는다. 어떤 구현예에서, 상기 HS4 영역은 약 1.1 kb의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS4 영역은 1,065 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 HS4 영역은 서열번호 7에 기재된 뉴클레오티드 서열을 갖는다. 한 비제한적 구현예에서, 상기 β-글로빈 LCR 영역은 서열번호 9에 기재된 뉴클레오티드 서열을 갖는 HS2 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 HS3 영역 및 서열번호 7에 기재된 뉴클레오티드 서열을 갖는 HS4 영역을 포함한다. 부가적으로, 상기 β-글로빈 LCR 영역은 HS1 영역을 추가로 포함할 수 있다.
어떤 구현예에서, 상기 글로빈 유전자는 β-글로빈 유전자, γ-글로빈 유전자 및 δ-글로빈 유전자로 이루어진 군으로부터 선택된다. 한 비제한적 구현예에서, 상기 글로빈 유전자는 인간 β-글로빈 유전자이다. 비제한적 구현예에서, 상기 인간 β-글로빈 유전자는 야생형 β-글로빈 유전자, 하나 이상의 인트론 서열의 결실을 포함하는 결실된 인간 β-글로빈 유전자 및 적어도 하나의 항-겸상화 아미노산 잔기를 암호화하는 돌연변이된 인간 β-글로빈 유전자로 이루어진 군으로부터 선택된다. 한 비제한적 구현예에서, 상기 인간 β-글로빈 유전자는 코돈 87에서 트레오닌의 글루타민으로의 돌연변이(βA - T87Q)를 암호화하는 인간 βA 글로빈 유전자이다.
어떤 구현예에서, 상기 발현 카세트는 서열번호 18에 기재된 CTCF 결합 부위 서열을 포함하는 1개의 인슐레이터, 예를 들면, 이에 한정되는 것은 아니지만, 서열번호 1에 기재된 뉴클레오티드 서열을 갖는 인슐레이터와 같이 서열번호 24 또는 서열번호 25를 포함하는 인슐레이터를 포함한다. 어떤 구현예에서, 상기 발현 카세트는 2개의 인슐레이터를 포함하고, 각각은 서열번호 18에 기재된 CTCF 결합 부위 서열을 포함하고, 예를 들면, 이에 한정되는 것은 아니지만, 1개 또는 2개의 모든 인슐레이터는 서열번호 24 또는 서열번호 25를 포함하거나 및/또는 서열번호 1에 기재된 뉴클레오티드 서열을 갖는다.
어떤 구현예에서, 상기 발현 카세트는 β-글로빈 프로모터를 추가로 포함한다. 어떤 구현예에서, 상기 β-글로빈 프로모터는 상기 글로빈 유전자 또는 이의 기능성 부분 및 β-글로빈 LCR 영역 사이에 위치한다. 어떤 구현예에서, 상기 β-글로빈 프로모터는 약 200 및 약 700 bp 사이의 길이를 갖는다. 한 비제한적 구현예에서, 상기 β-글로빈 프로모터는 약 613 bp의 길이를 갖는 인간 β-글로빈 프로모터이다. 한 비제한적 구현예에서, 상기 인간 β-글로빈 프로모터는 서열번호 10에 기재된 뉴클레오티드 서열을 갖는다. 다른 비제한적 구현예에서, 상기 β-글로빈 프로모터는 약 265 bp의 길이를 갖는 인간 β-글로빈 프로모터이다. 한 비제한적 구현예에서, 상기 인간 β-글로빈 프로모터는 서열번호 11에 기재된 뉴클레오티드 서열을 갖는다.
어떤 구현예에서, 상기 발현 카세트는 인간 β-글로빈 3' 인핸서를 추가로 포함한다. 어떤 구현예에서, 상기 인간 β-글로빈 3' 인핸서는 상기 글로빈 유전자 또는 이의 기능성 부분의 상류에 위치한다. 어떤 구현예에서, 상기 β-글로빈 3' 인핸서는 약 700 및 약 900 bp 사이의 길이, 예컨대 약 800 및 900 bp 사이의 길이를 갖는다. 한 비제한적 구현예에서, 상기 인간 β-글로빈 3' 인핸서는 약 879 bp의 길이를 갖는다. 한 비제한적 구현예에서, 상기 인간 β-글로빈 3' 인핸서는 서열번호 12에 기재된 뉴클레오티드 서열을 갖는다.
어떤 구현예에서, 상기 발현 카세트는 적어도 하나의 적혈구-특이적 인핸서를 추가로 포함한다. 어떤 구현예에서, 상기 적어도 하나의 적혈구-특이적 인핸서는 상기 글로빈 유전자 또는 이의 기능성 부분과 상기 β-글로빈 LCR 영역 사이에 위치한다. 어떤 구현예에서, 상기 적어도 하나의 적혈구-특이적 인핸서는 서열번호 13, 14, 15, 16 및 17로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 갖는다. 어떤 구현예에서, 상기 적어도 하나의 적혈구-특이적 인핸서는 약 100 및 약 200 bp 사이의 길이를 갖는다. 어떤 구현예에서, 상기 발현 카세트는 1개, 2개 또는 3개의 적혈구-특이적 인핸서를 포함한다.
어떤 구현예에서, 상기 발현 카세트는 포유류에서 상기 글로빈 유전자 또는 이의 기능성 부분의 발현을 허용한다. 한 비제한적 구현예에서, 상기 발현 카세트는 인간 β-글로빈 유전자의 발현을 허용한다. 어떤 구현예에서, 상기 글로빈 유전자 또는 이의 기능성 부분의 발현은 적혈구 조직에 한정된다.
본 개시된 보호대상은 또한 전술한 발현 카세트를 포함하는 재조합 벡터를 제공한다. 어떤 구현예에서, 상기 재조합 벡터는 레트로바이러스 벡터이다. 한 비제한적 구현예에서, 상기 레트로바이러스 벡터는 렌티바이러스 벡터이다. 어떤 구현예에서, 상기 재조합 벡터 내에 포함되는 발현 카세트는 1개의 인슐레이터를 포함한다. 어떤 구현예에서, 상기 재조합 벡터는 상기 벡터의 3' 긴 말단 반복부(long terminal repeat, LTR) 내의 우드척 간염 후-조절 요소(Woodchuck hepatitis post-regulatory element, WPRE)를 추가로 포함한다. 어떤 구현예에서, 상기 재조합 벡터는 상기 벡터의 3' 긴 말단 반복부(LTR) 내의 소 성장 호르몬 폴리아데닐화 신호를 추가로 포함한다.
또한, 본 개시된 보호대상은 전술한 발현 카세트를 포함하는 비-자연 발생형 또는 조작된 뉴클레아제를 제공한다. 어떤 구현예에서, 상기 뉴클레아제는 비-자연 발생형 또는 조작된 징크-핑거 뉴클레아제(ZFN), 비-자연 발생형 또는 조작된 메가뉴클레아제 및 비-자연 발생형 또는 조작된 전사 활성화제-유사 이펙터 뉴클레아제(TALEN)로 이루어진 군으로부터 선택된다. 어떤 구현예에서, 상기 뉴클레아제는 DNA 결합 도메인 및 뉴클레아제 절단 도메인을 포함한다. 어떤 구현예에서, 상기 뉴클레아제는 게놈 세이프 하버 부위(genomic safe harbor site)에 결합한다. 어떤 구현예에서, 상기 뉴클레아제는 상기 게놈 세이프 하버 부위에 결합한다. 어떤 구현예에서, 상기 뉴클레아제는 상기 게놈 세이프 하버 부위에서 이중 가닥 절단(double strand break, DSB)을 생성한다. 어떤 구현예에서, 상기 뉴클레아제 내에 포함되는 발현 카세트는 서열번호 1에 기재된 뉴클레오티드 서열을 갖는 인슐레이터를 2개 포함한다. 어떤 구현예에서, 상기 뉴클레아제는 상기 발현 카세트의 표적화된 운반을 허용한다. 본 개시된 보호대상은 또한 전술한 뉴클레아제를 암호화하는 폴리뉴클레오티드 및 상기 폴리뉴클레오티드를 포함하는 벡터를 제공한다. 한 비제한적 구현예에서, 상기 벡터는 렌티바이러스 벡터이다.
또한, 본 개시된 보호대상은 전술한 발현 카세트를 포함하는 비-자연 발생형 또는 조작된 CRISPR-Cas 시스템을 제공한다. 어떤 구현예에서, 상기 CRISPR-Cas 시스템은 CRISPR-Cas 뉴클레아제 및 단일-가이드(guide) RNA를 포함한다. 어떤 구현예에서, 상기 CRISPR-Cas 시스템은 게놈 세이프 하버 부위에 결합한다. 어떤 구현예에서, 상기 CRISPR-Cas 시스템은 상기 게놈 세이프 하버 부위에 이중 가닥 절단(DSB)을 생성한다. 어떤 구현예에서, 상기 CRISPR-Cas 시스템 내에 포함되는 발현 카세트는 서열번호 1에 기재된 뉴클레오티드 서열을 갖는 인슐레이터 2개를 포함한다. 어떤 구현예에서, 상기 CRISPR-Cas는 상기 발현 벡터의 표적화된 운반을 허용한다. 본 개시된 보호대상은 또한 전술한 CRISPR-Cas 시스템을 암호화하는 폴리뉴클레오티드 및 상기 폴리뉴클레오티드를 포함하는 벡터를 제공한다. 한 비제한적 구현예에서, 상기 벡터는 렌티바이러스 벡터이다.
일부 구현예에서, 상기 게놈 세이프 하버 부위는 유전자외적(extragenic) 게놈 세이프 하버 부위이다. 어떤 구현예에서, 상기 게놈 세이프 하버 부위는 1번 염색체 상에 위치한다. 일부 구현예에서, 상기 게놈 세이프 하버는 다음의 5가지 기준을 모두 충족한다: (ⅰ) 임의의 유전자의 5' 말단(예컨대, 상기 유전자의 5' 말단)으로부터 적어도 50 kb의 거리, (ⅱ) 임의의 암 관련 유전자로부터 적어도 300 kb의 거리, (ⅲ) 개방된/접근가능한 염색질 구조 내(천연 또는 조작된 뉴클레아제를 사용한 DNA 절단에 의해 측정됨), (ⅳ) 유전자 전사 유닛 외부에 위치, 및 (ⅴ) 인간 게놈의 초보존된 영역(ultraconserved region, UCR), microRNA 또는 긴 비-코딩 RNA 외부에 위치.
부가적으로, 본 개시된 보호대상은 전술한 발현 카세트로 형질도입된 세포, 전술한 재조합 벡터로 형질도입된 세포, 전술한 뉴클레아제로 형질도입된 세포, 전술한 CRISPR-Cas 시스템으로 형질도입된 세포를 제공한다. 또한, 본 개시된 보호대상은 전술한 벡터로 형질도입된 세포를 제공한다. 어떤 구현예에서, 상기 세포는 조혈 줄기 세포, 배아 줄기 세포, 유도된 다분화능 줄기 세포 및 조혈발생(hemogenic) 내피 세포로 이루어진 군으로부터 선택된다. 한 비제한적 구현예에서, 상기 조혈 줄기 세포는 CD34+ 조혈 줄기 세포이다. 어떤 구현예에서, 상기 세포는 생체외에서(ex vivo) 형질도입된다.
또한, 유효량의 전술한 세포 및 약학적으로 허용가능한 담체를 포함하는 약학 조성물이 제공된다. 본 개시된 보호대상은 또한 유효량의 전술한 세포 및 약학적으로 허용가능한 담체를 포함하는 헤모글로빈병증의 치료용 약학 조성물을 제공한다.
또한, 본 개시된 보호대상은 전술한 세포를 포함하는 헤모글로빈병증의 치료용 키트를 제공한다. 어떤 구현예에서, 상기 키트는 헤모글로빈병증을 갖는 대상체의 치료용 세포를 사용하기 위한 기록된 설명서를 추가로 포함한다.
또한, 본 개시된 보호대상은 대상체에서 유효량의 전술한 세포를 대상체에 투여하고, 이로 인해 정상 헤모글로빈을 함유하는 적혈구를 생산하기 위한 대상체의 능력을 회복하는 단계를 포함하는 헤모글로빈병증의 치료 방법을 제공한다. 어떤 구현예에서, 치료적으로 연관있는 레벨의 헤모글로빈은 상기 세포를 대상체에 투여한 후 상기 대상체에서 생성된다. 어떤 구현예에서, 상기 방법은 전술한 재조합 벡터로 형질도입된 유효량의 세포를 투여하는 단계를 포함한다. 일부 구현예에서, 상기 대상체에서 치료적으로 연관있는 레벨의 헤모글로빈을 제공하기 위한 세포 내의 상기 재조합 벡터의 벡터 카피 수(copy number)는 세포 당 약 0.5-2 벡터 카피 수이다. 어떤 구현예에서, 상기 방법은 상기 대상체에서 비효과적인 적혈구생성을 보정한다. 어떤 구현예에서, 상기 방법은 상기 대상체에서 이식편-대-숙주 질환의 위험성을 초래하지 않는다. 어떤 구현예에서, 상기 방법은 면역억제제를 투여하는 단계를 포함하지 않는다. 어떤 구현예에서, 상기 세포는 조혈 줄기 세포, 배아 줄기 세포, 유도된 다분화능 줄기 세포 및 조혈발생 내피 세포로 이루어진 군으로부터 선택된다. 한 비제한적 구현예에서, 상기 대상체는 인간이다. 어떤 구현예에서, 상기 세포는 상기 대상체로부터 유래된다. 한 비제한적 구현예에서, 상기 세포는 상기 대상체의 골수로부터 유래된다.
본 개시된 보호대상에 따르면, 상기 헤모글로빈병증은 헤모글로빈 C 질환, 헤모글로빈 겸상 세포 질환(sickle cell disease, SCD), 겸상 세포 빈혈, 유전성 빈혈, 지중해빈혈, β-지중해빈혈, 지중해빈혈 메이저(major), 지중해빈혈 인터메디아(intermedia), α-지중해빈혈 및 헤모글로빈 H 질환으로 이루어진 군으로부터 선택된다. 한 비제한적 구현예에서, 상기 헤모글로빈병증은 β-지중해빈혈이다. 다른 비제한적 구현예에서, 상기 헤모글로빈병증은 겸상 세포 빈혈이다.
본 발명을 기재된 특정 구현예들로 한정하기 위한 것이 아니라 예로써 제공된 하기 상세한 설명은 첨부된 도면과 함께 이해될 수 있다.
도 1은 본 개시된 보호대상의 한 비제한적 구현예에 따른 발현 카세트를 포함하는 재조합 벡터를 보여준다.
도 2는 본 개시된 보호대상의 한 비제한적 구현예에 따른 발현 카세트를 포함하는 재조합 벡터를 보여준다.
도 3은 본 개시된 보호대상의 한 비제한적 구현예에 따른 발현 카세트를 포함하는 재조합 벡터를 보여준다.
도 4는 본 개시된 보호대상의 한 비제한적 구현예에 따른 발현 카세트를 포함하는 재조합 벡터를 보여준다.
도 5의 a 내지 c는 인슐레이터 A1의 유전독성을 나타낸다. (a) 이용된 감마레트로바이러스 벡터 유전독성 분석을 보여준다. (b) 인슐레이팅된 감마레트로바이러스 벡터로 형질도입된 32D 세포를 제공받은 마우스들의 증가된 생존을 주목한다. cHS4 및 인슐레이팅되지 않은 대조군을 사용하여 수득한 결과도 주목한다. (c) 인슐레이터 A1이 유전독성의 위험을 감소시켰다는 것을 보여준다.
도 6은 치료 후 8주 및 44주에서 지중해빈혈 Hbbth3 /+ 마우스들에서의 표준화된 β 쇄 발현을 나타낸다.
도 7은 비-적혈구 K562 세포에서의 인핸서 활성의 평가를 나타낸다.
도 8은 본 개시된 보호대상의 일부 구현예들에 따른 적혈구-특이적 인핸서를 나타낸다.
도 9은 본 개시된 보호대상의 일부 구현예들에 따른 적혈구-특이적 인핸서를 나타낸다.
도 10a 및 10b는 본 개시된 발현 카세트를 포함하는 다양한 재조합 벡터들을 보여준다.
도 11은 본 개시된 발현 카세트를 포함하는 재조합 벡터의 역가를 나타낸다.
도 12는 본 개시된 발현 카세트를 포함하는 재조합 벡터의 역가를 나타낸다.
본 개시된 보호대상은 일반적으로 글로빈 유전자(예를 들면, 인간 β-글로빈 유전자)의 발현을 가능하게 하는 발현 카세트를 제공한다. 한 비제한적 예에서, 발현 카세트는 서열번호 18에 기재된 CTCF 결합 부위 서열을 포함하는 하나 이상의 인슐레이터, 예를 들면, 서열번호 24 또는 서열번호 25를 포함하는 인슐레이터, 예컨대, 서열번호 1에 기재된 뉴클레오티드 서열을 가진 인슐레이터(그러나, 이들로 한정되지 않음), 및 β-글로빈 좌위 조절 영역(LCR)에 작동가능하게 연결된 글로빈 유전자 또는 이의 기능성 부분을 포함한다. 본 개시된 발현 카세트에 의해 유도된 글로빈 유전자의 발현은 적혈구-특이적이고 분화 단계-특이적이고 고수준이고 지속된다. 본 개시된 보호대상은 재조합 벡터, 비-천연 생성 또는 조작된 뉴클레아제, 및 이러한 발현 카세트를 포함하는 비-천연 생성 또는 조작된 CRISPR-Cas 시스템, 및 이러한 발현 카세트, 재조합 벡터, 뉴클레아제 및 CRISPR-Cas 시스템으로 형질도입된 세포도 제공한다. 본 개시된 발현 카세트 및 이를 포함하는 벡터는 치료 전이유전자(transgene) 발현이 세포당 낮은 벡터 카피 수(예를 들면, 0.5-2, 1-2, 또는 심지어 0.5-1)로 달성되기(예를 들면, 치료적으로 적절한 수준의 헤모글로빈이 생성되기) 때문에 안전한 유전자 전달 요법을 제공한다. 또한, 본 개시된 보호대상은 헤모글로빈병증(예를 들면, β-지중해빈혈 및 겸상 세포 빈혈)을 치료하기 위해 이러한 형질도입된 세포를 사용하는 방법을 제공한다.
Ⅰ. 정의
달리 정의되어 있지 않은 한, 본원에서 사용된 모든 기술 용어들 및 과학 용어들은 본 발명이 속하는 분야에서 숙련된 자에 의해 통상적으로 이해되는 의미를 가진다. 하기 참고문헌들은 본 발명에서 사용된 용어들 중 대부분의 용어들의 일반적인 정의를 당업자에게 제공한다: 문헌[Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991)]. 본원에서 사용된 바와 같이, 달리 특정되어 있지 않은 한, 하기 용어들은 이하에서 그들에게 부여된 의미를 가진다.
본원에서 사용된 바와 같이, 용어 "발현 카세트"는 표적 세포에서 특정 핵산의 전사를 허용하는 일련의 특정된 핵산 요소들을 가진, 재조합 또는 합성에 의해 생성된 핵산 구축물을 지칭한다. 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 플라스티드 DNA, 바이러스 또는 핵산 영역 내로 도입될 수 있다. 발현 카세트 부분은 전사될 유전자, 및 이 유전자의 발현을 조절하는 요소(예를 들면, 프로모터)를 포함할 수 있다.
본원에서 사용된 바와 같이, 용어 "β-글로빈 좌위 조절 영역(LCR)"은 HS1 영역, HS2 영역, HS3 영역 및 HS4 영역을 포함하는 하나 이상의 Dnase I 과민감성 부위(HS) 영역으로 구성된 폴리뉴클레오티드를 지칭한다. β-글로빈 유전자들의 많은 LCR들의 구조는 예를 들면, 인간의 경우 문헌[Li et al., J. Biol. Chem. (1985); 260:14,901; Li et al., Proc. Natl. Acad. Sci. (1990) 87:8207]; 마우스의 경우 문헌[Shehee et al., J. Mol. Biol. (1989);205:41]; 토끼의 경우 문헌[Margot et al., J. Mol. Biol. (1989);205:15]; 및 염소의 경우 문헌[Li, Q., et al., Genomics (1991);9:488]에 공개되었고, 이들 문헌들 각각은 본원에 참고로 도입된다. 일부 구현예들에서, β-글로빈 LCR 영역은 HS2 영역을 포함한다(예를 들면, HS2 영역, HS3 영역 및 HS4 영역을 포함하는 β-글로빈 LCR 영역; 및 HS1 영역, HS2 영역, HS3 영역 및 HS4 영역을 포함하는 β-글로빈 LCR 영역). 일부 구현예들에서, β-글로빈 LCR 영역은 HS2 영역을 포함하지 않는다(예를 들면, HS1 영역, HS3 영역 및 HS4 영역을 포함하는 β-글로빈 LCR 영역). 일부 구현예들에서, β-글로빈 LCR 영역은 HS2 영역 또는 HS1 영역을 포함하지 않는다(예를 들면, HS3 영역 및 HS4 영역을 포함하는 β-글로빈 LCR 영역).
본원에서 사용된 바와 같이, 용어 "재조합"은 이종 핵산의 도입에 의해 변경된 세포 또는 벡터, 또는 이처럼 변경된 세포로부터 유래된 세포의 지칭을 포함한다. 따라서, 예를 들면, 재조합 세포는 천연(비-재조합) 형태의 세포 내에서 동일한 형태로 발견되지 않는 유전자를 발현하거나, 의도적인 인간 개입의 결과로서 다른 방식으로 비정상적으로 발현되거나, 과소발현되거나 전혀 발현되지 않는 천연 유전자를 발현하거나, 천연 유전자의 감소된 또는 제거된 발현을 가질 수 있다.
본원에서 사용된 바와 같이, 용어 "글로빈"은 산소의 결합 및 수송에 관여하는 헴(heme) 함유 단백질의 패밀리를 지칭한다. 척추동물 및 무척추동물 헤모글로빈, 척추동물 및 무척추동물 미요글로빈 또는 이들의 돌연변이체의 서브유닛들이 용어 글로빈에 의해 포함된다.
본원에서 사용된 바와 같이, 용어 "야생형"은 임의의 돌연변이 또는 변경을 갖지 않는 천연 상태로 발견된 정상 유전자, 바이러스 또는 유기체를 지칭한다.
용어 "폴리뉴클레오티드", "뉴클레오티드", "뉴클레오티드 서열", "핵산" 및 "올리고뉴클레오티드"는 상호교환적으로 사용된다. 이들은 데옥시리보뉴클레오티드 또는 리보뉴클레오티드 중 어느 하나인 임의의 길이의 뉴클레오티드들의 중합체 형태 또는 이들의 유사체를 지칭한다. 폴리뉴클레오티드는 임의의 3차원적 구조를 가질 수 있고, 공지되어 있거나 공지되어 있지 않은 임의의 기능을 수행할 수 있다. 폴리뉴클레오티드의 비제한적 예들은 다음과 같다: 유전자 또는 유전자 영역의 코딩 또는 비-코딩 영역, 연관 분석으로부터 정의된 좌위들(좌위), 엑손, 인트론, 메신저 RNA(mRNA), 전달 RNA, 리보좀 RNA, 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로-RNA (miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오티드, 분지된 폴리뉴클레오티드, 플라스미드, 벡터, 임의의 서열의 단리된 DNA, 임의의 서열의 단리된 RNA, 핵산 프로브 및 프라이머. 폴리뉴클레오티드는 하나 이상의 변경된 뉴클레오티드, 예컨대, 메틸화된 뉴클레오티드 및 뉴클레오티드 유사체를 포함할 수 있다. 특정 구현예에서, 본 개시된 보호대상은 하나 이상의 글로빈 유전자 또는 이의 기능성 부분을 암호화하는 폴리뉴클레오티드를 제공한다. 존재하는 경우, 뉴클레오티드 구조에 대한 변경은 중합체의 조립 전 또는 후에 부여될 수 있다. 뉴클레오티드의 서열은 비-뉴클레오티드 성분에 의해 단절될 수 있다. 폴리뉴클레오티드는 예컨대, 표지 성분과의 접합에 의해 중합 후에 더 변경될 수 있다. 이러한 폴리뉴클레오티드는 내생성 핵산 서열과 100% 동일할 필요는 없지만, 전형적으로 실질적인 동일성을 나타낼 것이다. 내생성 서열에 대한 "실질적인 동일성"을 가진 폴리뉴클레오티드는 전형적으로 이중 가닥 핵산 분자의 하나 이상의 가닥과 혼성화할 수 있다. "혼성화한다"는 다양한 엄격성 조건들 하에서 상보적인 폴리뉴클레오티드 서열들(예를 들면, 본원에 기재된 유전자) 또는 이들의 부분들 사이에 쌍을 이루어 이중 가닥 분자를 형성한다는 것을 의미한다(예를 들면, 문헌[Wahl, G. M. and S. L. Berger (1987) Methods Enzymol. 152:399; Kimmel, A. R. (1987) Methods Enzymol. 152:507] 참조).
예를 들면, 엄격한 염 농도는 통상적으로 약 750 mM NaCl 및 75 mM 삼나트륨 시트레이트 미만, 바람직하게는 약 500 mM NaCl 및 50 mM 삼나트륨 시트레이트 미만, 보다 바람직하게는 약 250 mM NaCl 및 25 mM 삼나트륨 시트레이트 미만일 것이다. 낮은 엄격성 혼성화는 유기 용매, 예를 들면, 포름아미드의 부재 하에서 수득될 수 있는 반면, 높은 엄격성 혼성화는 적어도 약 35% 포름아미드, 보다 바람직하게는 적어도 약 50% 포름아미드의 존재 하에서 수득될 수 있다. 엄격한 온도 조건은 통상적으로 적어도 약 30℃, 보다 바람직하게는 적어도 약 37℃, 가장 바람직하게는 적어도 약 42℃의 온도를 포함할 것이다. 추가 파라미터들, 예컨대, 혼성화 시간 및 세제, 예를 들면, 나트륨 도데실 설페이트(SDS)의 농도의 변경, 및 담체 DNA의 포함 또는 배제는 본 기술분야에서 숙련된 자에게 잘 공지되어 있다. 필요에 따라 이들 다양한 조건들을 조합하여 다양한 엄격성 수준을 달성한다. 바람직한 구현예에서, 혼성화는 30℃의 750 mM NaCl, 75 mM 삼나트륨 시트레이트 및 1% SDS에서 일어날 것이다. 보다 바람직한 구현예에서, 혼성화는 37℃의 500 mM NaCl, 50 mM 삼나트륨 시트레이트, 1% SDS, 35% 포름아미드 및 100 ㎍/㎖ 변성된 연어 정자 DNA(ssDNA)에서 일어날 것이다. 가장 바람직한 구현예에서, 혼성화는 42℃의 250 mM NaCl, 25 mM 삼나트륨 시트레이트, 1% SDS, 50% 포름아미드 및 200 ㎍/㎖ ssDNA에서 일어날 것이다. 이들 조건들에 대한 유용한 변경은 본 기술분야에서 숙련된 자에게 용이하게 자명할 것이다.
대부분의 적용들의 경우, 혼성화 후 수행되는 세척 단계도 엄격성 면에서 달라질 것이다. 세척 엄격성 조건은 염 농도 및 온도에 의해 정의될 수 있다. 전술된 바와 같이, 세척 엄격성은 염 농도의 감소 또는 온도의 증가에 의해 증가될 수 있다. 예를 들면, 세척 단계를 위한 엄격한 염 농도는 바람직하게는 약 30 mM NaCl 및 3 mM 삼나트륨 시트레이트 미만, 가장 바람직하게는 약 15 mM NaCl 및 1.5 mM 삼나트륨 시트레이트 미만일 것이다. 세척 단계를 위한 엄격한 온도 조건은 통상적으로 적어도 약 25℃, 보다 바람직하게는 적어도 약 42℃, 훨씬 더 바람직하게는 적어도 약 68℃의 온도를 포함할 것이다. 바람직한 구현예에서, 세척 단계는 25℃의 30 mM NaCl, 3 mM 삼나트륨 시트레이트 및 0.1% SDS에서 일어날 것이다. 보다 바람직한 구현예에서, 세척 단계는 42℃의 15 mM NaCl, 1.5 mM 삼나트륨 시트레이트 및 0.1% SDS에서 일어날 것이다. 보다 바람직한 구현예에서, 세척 단계는 68℃의 15 mM NaCl, 1.5 mM 삼나트륨 시트레이트 및 0.1% SDS에서 일어날 것이다. 이들 조건들에 대한 추가 변경은 본 기술분야에서 숙련된 자에게 용이하게 자명할 것이다. 혼성화 기법은 본 기술분야에서 숙련된 자에게 잘 공지되어 있고, 예를 들면, 문헌[Benton and Davis (Science 196:180, 1977)]; 문헌[Grunstein and Rogness (Proc. Natl. Acad. Sci., USA 72:3961, 1975)]; 문헌[Ausubel et al. (Current Protocols in Molecular Biology, Wiley Interscience, New York, 2001)]; 문헌[Berger and Kimmel (Guide to Molecular Cloning Techniques, 1987, Academic Press, New York)]; 및 문헌[Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press, New York]에 기재되어 있다.
본원에서 사용된 바와 같이, 용어 "폴리펩티드" 및 "단백질"은 아미노산 잔기들의 중합체, 및 이의 변이체 및 합성 유사체를 지칭하기 위해 상호교환적으로 사용된다. 따라서, 이들 용어들은 하나 이상의 아미노산 잔기가 합성 비-천연 생성 아미노산, 예컨대, 상응하는 천연 생성 아미노산의 화학적 유사체인 아미노산 중합체뿐만 아니라 천연 생성 아미노산 중합체에도 적용된다. 본 개시된 보호대상의 특정 구현예는 폴리펩티드 "변이체"도 포함한다. 폴리펩티드 "변이체"는 하나 이상의 아미노산 잔기의 추가, 결실, 절두 및/또는 치환에 의해 기준 폴리펩티드로부터 식별되고 생물학적 활성을 보유하는 폴리펩티드를 지칭한다. 일부 구현예들에서, 폴리펩티드 변이체는 본 기술분야에서 공지되어 있는 바와 같이 보존적 또는 비-보존적일 수 있는 하나 이상의 치환에 의해 기준 폴리펩티드로부터 식별된다. 일부 구현예들에서, 변이체 폴리펩티드는 기준 폴리펩티드의 상응하는 서열에 대한 적어도 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 이상의 서열 동일성 또는 유사성을 가진 아미노산 서열을 포함한다. 일부 구현예들에서, 아미노산 추가 또는 결실은 기준 폴리펩티드의 C-말단 및/또는 N-말단에서 일어난다. 일부 구현예들에서, 아미노산 결실은 모든 개재 수, 예를 들면, 25개, 26개, 27개, 29개, 30개 ... 100개, 101개, 102개, 103개, 104개, 105개 ... 170개, 171개, 172개, 173개, 174개 등의 아미노산들을 포함하는, 약 1개, 약 2개, 약 3개, 약 4개, 약 5개, 약 6개, 약 7개, 약 8개, 약 9개, 약 10개, 약 15개, 약 20개, 약 25개, 약 30개, 약 35개, 약 40개, 약 45개, 50개, 약 55개, 약 60개, 약 65개, 약 70개, 약 75개, 약 80개, 약 85개, 약 90개, 약 95개, 약 100개, 약 105개, 약 110개, 약 115개, 약 120개, 약 125개, 약 130개, 약 135개, 약 140개, 약 145개, 약 150개, 약 155개, 약 160개, 약 165개, 약 170개 또는 약 175개 이상의 아미노산들의 C-말단 절두를 포함한다.
상기 인지된 바와 같이, 본 개시된 보호대상의 폴리펩티드는 아미노산 치환, 결실, 절두 및 삽입을 포함하는 다양한 방식들로 변경될 수 있다. 이러한 조작 방법들은 본 기술분야에서 일반적으로 공지되어 있다. 예를 들면, 기준 폴리펩티드의 아미노산 서열 변이체는 DNA에서의 돌연변이에 의해 제조될 수 있다. 돌연변이유발 및 뉴클레오티드 서열 변경을 위한 방법들은 본 기술분야에서 잘 공지되어 있다. 예를 들면, 문헌[Kunkel (1985, Proc. Natl. Acad. Sci. USA. 82: 488-492)], 문헌[Kunkel et al., (1987, Methods in Enzymol, 154: 367-382)], 미국 특허 제4,873,192호, 문헌[Watson, J. D. et al., Molecular Biology of the Gene, Fourth Edition, Benjamin/Cummings, Menlo Park, Calif, 1987)] 및 이들에서 인용된 참고문헌들을 참조한다. 관심있는 단백질의 생물학적 활성에 영향을 미치지 않는 적절한 아미노산 치환에 대한 지침은 문헌[Dayhoff et al., (1978) Atlas of Protein Sequence and Structure (Natl. Biomed. Res. Found., Washington, D.C.)]의 모델에서 발견될 수 있다.
본원에서 사용된 바와 같이, 용어 "실질적으로 동일한"은 기준 아미노산 서열(예를 들면, 본원에 기재된 아미노산 서열들 중 어느 하나) 또는 핵산 서열(예를 들면, 본원에 기재된 핵산 서열들 중 어느 하나)에 대한 적어도 50% 동일성을 나타내는 폴리펩티드 또는 폴리뉴클레오티드를 지칭한다. 바람직하게는, 이러한 서열은 비교를 위해 사용된 서열과 아미노산 수준 또는 핵산 수준에서 적어도 60%, 보다 바람직하게는 80% 또는 85%, 보다 바람직하게는 90%, 95% 또는 심지어 99% 동일하다.
서열 동일성 또는 상동성은 전형적으로 서열 분석 소프트웨어(예를 들면, 미국 위스콘신주 53705 매디슨 유니버시티 애비뉴 1710 위스콘신 대학 생물공학 센터에 소재하는 제네틱스 컴퓨터 그룹(Genetics Computer Group)의 서열 분석 소프트웨어 팩키지, LAST, BESTFIT, GAP 또는 PILEUP/PRETTYBOX 프로그램)를 이용함으로써 측정된다. 이러한 소프트웨어는 상동성 정도를 다양한 치환들, 결실들 및/또는 다른 변경들에 배정함으로써 동일한 또는 유사한 서열들을 맞춘다. 동일성 또는 상동성 정도를 측정하는 예시적 방법에서, 밀접하게 관련된 서열을 표시하는 e-3 내지 e-100의 확률 점수와 함께 BLAST 프로그램이 이용될 수 있다. 2개의 서열들 사이의 동일성의 백분율도 프로그램, 예컨대, DNAMAN(Lynnon Biosoft, version 3.2)에 의해 측정될 수 있다. 이 프로그램을 이용할 때, 최적 정렬 알고리즘을 이용하여 2개의 서열들을 정렬할 수 있다(Smith and Waterman, 1981). 2개의 서열들의 정렬 후, 2개의 서열들 사이에 동일한 뉴클레오티드의 수를, 모든 갭들의 길이를 차감한 정렬된 서열의 길이로 나눔으로써 백분율 동일성을 계산할 수 있다.
폴리뉴클레오티드의 배향을 기술하는 용어들은 5'(통상적으로 자유 포스페이트 기를 가진 폴리뉴클레오티드의 말단) 및 3'(통상적으로 자유 하이드록실(OH) 기를 가진 폴리뉴클레오티드의 말단)을 포함한다. 폴리뉴클레오티드 서열은 5'부터 3'으로의 배향 또는 3'부터 5'으로의 배향으로 해독될 수 있다.
본원에서 사용된 바와 같이, "단일 가이드 RNA" 또는 "합성 가이드 RNA"는 가이드 서열, tracr 서열 및 tracr 메이트(mate) 서열을 포함하는 폴리뉴클레오티드 서열을 지칭한다. 용어 "가이드 서열"은 표적 부위를 특정하는, 가이드 RNA 내의 약 20 bp 서열을 지칭하고, 용어 "가이드" 또는 "스페이서"와 상호교환적으로 사용될 수 있다. 용어 "tracr 메이트 서열"은 용어 "직접적 반복부(들)"와 상호교환적으로 사용될 수도 있다.
용어 "비-천연 생성" 또는 "조작된"은 상호교환적으로 사용되고, 인간의 손의 개입을 표시한다. 상기 용어들은 핵산 분자 또는 폴리펩티드를 지칭하는 경우 핵산 분자 또는 폴리펩티드가 천연 상태에서 발견될 때 천연 상태에서 이들과 천연적으로 회합되어 있는 하나 이상의 다른 성분을 적어도 실질적으로 갖지 않는다는 것을 의미한다.
본원에서 사용된 바와 같이, 용어 "발현"은 폴리뉴클레오티드가 DNA 주형으로부터 (예컨대, mRNA 또는 다른 RNA 전사체로) 전사되는 과정 및/또는 전사된 mRNA가 후속적으로 펩티드, 폴리펩티드 또는 단백질로 번역되는 과정을 지칭한다. 전사체 및 코딩된 폴리펩티드는 "유전자 생성물"로서 총칭될 수 있다. 폴리뉴클레오티드가 게놈 DNA로부터 유래되는 경우, 발현은 진핵세포에서의 mRNA의 스플라이싱을 포함할 수 있다.
본원에서 사용된 바와 같이, 용어 "치료하는" 또는 "치료"는 치료되는 개체 또는 세포의 질환 경과를 변경시키기 위한 시도에서의 임상 중재를 지칭하고, 예방을 위해 또는 임상병리학의 과정 동안 수행될 수 있다. 치료의 치료 효과는 질환의 발생 또는 재발 예방, 증상의 완화, 질환의 임의의 직접적인 또는 간접적인 병리학적 결과의 감소, 전이의 예방, 질환 진행률의 감소, 질환 상태의 호전 또는 경감, 및 관해 또는 개선된 예후를 포함하나 이들로 한정되지 않는다. 치료는 질환 또는 장애의 진행을 예방함으로써 영향을 받거나 진단된 대상체 또는 장애를 가진 것으로 의심되는 대상체에서 장애로 인한 악화를 예방할 수 있을 뿐만 아니라, 치료는 장애에 대한 위험에 있거나 장애를 가진 것으로 의심되는 대상체에서 장애 또는 장애의 증상의 발병을 예방할 수 있다.
본원에서 사용된 바와 같이, 용어 "대상체"는 (예를 들면, 특정 치료의 수용자이거나 채취되는 세포의 기원인) 인간, 비-인간 영장류, 설치류 등을 포함하나 이들로 한정되지 않는 임의의 동물(예를 들면, 포유동물)을 지칭한다.
본원에서 사용된 바와 같이, 용어 "단리된 세포"는 세포를 천연적으로 동반하는 분자 및/또는 세포 성분으로부터 분리되어 있는 세포를 지칭한다. 본원에서 사용된 바와 같이, 용어 "단리된"은 물질이 그의 천연 상태에서 발견될 때 통상적으로 그와 동반되는 성분을 다양한 정도까지 갖지 않거나, 실질적으로 갖지 않거나 본질적으로 갖지 않는 물질을 지칭한다. "단리된"은 원래의 공급원 또는 환경으로부터의 분리 정도를 의미한다.
본원에서 사용된 바와 같이, 용어 "세포 집단"은 유사한 또는 상이한 표현형들을 발현하는 적어도 2종의 세포들의 군을 지칭한다. 비제한적 예에서, 세포 집단은 유사한 또는 상이한 표현형들을 발현하는 적어도 약 10종의 세포들, 적어도 약 100종의 세포들, 적어도 약 200종의 세포들, 적어도 약 300종의 세포들, 적어도 약 400종의 세포들, 적어도 약 500종의 세포들, 적어도 약 600종의 세포들, 적어도 약 700종의 세포들, 적어도 약 800종의 세포들, 적어도 약 900종의 세포들, 적어도 약 103종의 세포들, 적어도 약 104종의 세포들, 적어도 약 105종의 세포들, 적어도 약 106종의 세포들, 적어도 약 107종의 세포들 또는 적어도 약 108종의 세포들을 포함할 수 있다.
본원에서 사용된 바와 같이, 용어 "절단"은 DNA 분자의 공유 골격의 파괴를 지칭한다. 절단은 포스포디에스테르 결합의 효소적 또는 화학적 가수분해를 포함하나 이들로 한정되지 않는 다양한 방법들에 의해 시작될 수 있다. 단일 가닥 절단 및 이중 가닥 절단 둘 다가 가능하고, 이중 가닥 절단은 2개의 상이한 단일 가닥 절단 사건들의 결과로서 일어날 수 있다. DNA 절단은 블런트(blunt) 말단 또는 스태거드(staggered) 말단의 생성을 야기할 수 있다. 일부 구현예들에서, 융합 폴리펩티드는 표적화된 이중 가닥 DNA 절단을 위해 사용된다.
본원에서 사용된 바와 같이, 용어 "절단 절반-도메인"은 (동일한 또는 상이한) 제2 폴리펩티드와 함께 절단 활성(바람직하게는 이중 가닥 절단 활성)을 가진 복합체를 형성하는 폴리펩티드 서열을 지칭한다. 용어 "제1 절단 절반-도메인 및 제2 절단 절반-도메인", "+ 절단 절반-도메인 및 - 절단 절반-도메인" 및 "우측 절단 절반-도메인 및 좌측 절단 절반-도메인"은 이량체화하는 절단 절반-도메인들의 쌍을 지칭하는 데 상호교환적으로 사용된다.
본원에서 사용된 바와 같이, 용어 "염색체"는 세포의 게놈의 전부 또는 일부를 포함하는 염색질 복합체를 지칭한다. 종종 세포의 게놈은 세포의 게놈을 포함하는 모든 염색체들의 집합체인 그의 핵형(karyotype)을 특징으로 한다. 세포의 게놈은 하나 이상의 염색체를 포함할 수 있다.
본원에서 사용된 바와 같이, 용어 "유전자"는 유전자 생성물을 암호화하는 DNA 영역뿐만 아니라, 조절 서열이 코딩 서열 및/또는 전사되는 서열에 인접하는지 여부와 관계없이 유전자 생성물의 생성을 조절하는 모든 DNA 영역들도 포함한다. 따라서, 유전자는 프로모터 서열, 터미네이터(terminators), 번역 조절 서열, 예컨대, 리보좀 결합 부위 및 내부 리보좀 도입 부위, 인핸서, 사일런서(silencers), 인슐레이터, 경계 요소, 복제 기점, 매트릭스 부착 부위 및 좌위 조절 영역을 포함하나 이들로 한정되지 않는다.
용어 "작동가능한 연결" 및 "작동가능하게 연결된"(또는 "사용가능하게 연결된")은 2개 이상의 성분들(예컨대, 서열 요소들)의 병치에 대하여 상호교환적으로 사용되고, 이때 상기 성분들은 성분들 둘 다가 정상적으로 작용하고 성분들 중 하나 이상이 나머지 성분들 중 하나 이상에 대해 발휘하는 기능을 매개할 수 있을 가능성을 허용하도록 정렬된다. 예를 들면, 전사 조절 서열, 예컨대, 프로모터는 전사 조절 서열이 하나 이상의 전사 조절 인자의 존재 또는 부재에 반응하여 코딩 서열의 전사 수준을 조절하는 경우 상기 코딩 서열에 작동가능하게 연결되어 있다. 전사 조절 서열은 일반적으로 코딩 서열과 시스(cis)로 작동가능하게 연결되어 있으나, 상기 코딩 서열에 바로 인접할 필요는 없다. 예를 들면, 비록 인핸서와 코딩 서열이 인접하지 않을지라도, 인핸서는 코딩 서열에 작동가능하게 연결되어 있는 전사 조절 서열이다.
단백질, 폴리펩티드 또는 핵산의 "기능성 영역" 또는 "기능성 부분"은 전체 길이 단백질, 폴리펩티드 또는 핵산과 동일하지 않은 서열을 갖지만 여전히 전체 길이 단백질, 폴리펩티드 또는 핵산과 동일한 기능을 보유하는 단백질, 폴리펩티드 또는 핵산이다. 기능성 영역은 상응하는 천연 분자보다 더 많은 또는 더 적은 수의 잔기, 또는 상응하는 천연 분자와 동일한 수의 잔기를 가질 수 있고/있거나, 하나 이상의 아미노산 또는 뉴클레오티드 치환을 함유할 수 있다. 핵산의 기능(예를 들면, 코딩 기능, 또 다른 핵산에 혼성화하는 능력)을 확인하는 방법들은 본 기술분야에서 잘 공지되어 있다. 유사하게, 단백질 기능을 확인하는 방법들은 잘 공지되어 있다. 예를 들면, 폴리펩티드의 DNA 결합 기능은 예를 들면, 필터 결합, 전기영동적 이동-변동 또는 면역침전 분석에 의해 확인될 수 있다. DNA 절단은 겔 전기영동에 의해 분석될 수 있다. 또 다른 단백질과 상호작용하는 단백질의 능력은 예를 들면, 동시-면역침전, 투-하이브리드 분석, 또는 유전적 상보성 및 생화학적 상보성 둘 다에 의해 확인될 수 있다.
본원에서 사용된 바와 같이, 용어 "프로모터"는 RNA 중합효소가 결합하는 폴리뉴클레오티드(DNA 또는 RNA)의 인식 부위를 지칭한다. 용어 "인핸서"는 향상된 전사를 제공할 수 있는 서열을 함유하고 일부 경우 또 다른 조절 서열에 대한 그의 배향과 관계없이 작용할 수 있는 DNA 분절을 지칭한다. 인핸서는 프로모터 및/또는 다른 인핸서 요소와 협력적으로 또는 상가적으로 작용할 수 있다.
본원에서 사용된 바와 같이, 용어 "벡터"는 적절한 조절 요소와 연결될 때 복제할 수 있고 유전자 서열을 세포 내로 전달할 수 있는 임의의 유전적 요소, 예컨대, 플라스미드, 파지, 트랜스포존, 코스미드, 염색체, 바이러스, 비리온 등을 지칭한다. 따라서, 상기 용어는 클로닝 및 발현 비히클뿐만 아니라, 바이러스 벡터 및 플라스미드 벡터도 포함한다.
본원에서 사용된 바와 같이, 용어 "조절한다"는 긍정적으로 또는 부정적으로 변경시키는 것을 지칭한다. 예시적 조절은 약 1%, 약 2%, 약 5%, 약 10%, 약 25%, 약 50%, 약 75% 또는 약 100% 변화를 포함한다.
본원에서 사용된 바와 같이, 용어 "증가시킨다"는 약 5%까지, 약 10%까지, 약 25%까지, 약 30%까지, 약 50%까지, 약 75%까지 또는 약 100%까지 긍정적으로 변경시키는 것을 포함하나 이들로 한정되지 않는, 적어도 약 5%까지 긍정적으로 변경시키는 것을 지칭한다.
본원에서 사용된 바와 같이, 용어 "감소시킨다"는 약 5%까지, 약 10%까지, 약 25%까지, 약 30%까지, 약 50%까지, 약 75%까지 또는 약 100%까지 부정적으로 변경시키는 것을 포함하나 이들로 한정되지 않는, 적어도 약 5%까지 부정적으로 변경시키는 것을 지칭한다.
본원에서 사용된 바와 같이, 용어 "약" 또는 "대략"은 본 기술분야에서 통상의 기술을 가진 자에 의해 측정될 때 특정 값에 대한 허용가능한 오차 범위 내에 있다는 것을 의미하고, 이 오차 범위는 값이 측정되거나 결정되는 방법, 즉 측정 시스템의 한계에 의해 부분적으로 좌우될 것이다. 예를 들면, "약"은 본 기술분야의 관행에 따라 3 이내의 또는 3 초과의 표준 편차를 의미할 수 있다. 대안적으로, "약"은 소정의 값의 20% 이하, 바람직하게는 10% 이하, 보다 바람직하게는 5% 이하, 보다 바람직하게는 1% 이하의 범위를 의미할 수 있다. 대안적으로, 특히 생물학적 시스템 또는 과정과 관련하여, 상기 용어는 값의 한 자릿수, 바람직하게는 5배 이내, 보다 바람직하게는 2배 이내에 있다는 것을 의미할 수 있다.
Ⅱ. 인슐레이터
벡터 관련 악성 형질전환의 여러 사례들이 벡터에 의해 코딩된 인핸서에 의한 세포 종양유전자의 활성화와 관련된 임상 환경에서 보고되었고(Baum et al. (2006), Nienhuis et al. (2006), Ramezani et al. (2006)), 다양한 벡터 변경들이 벡터 유전독성을 감소시키기 위해 수행되었거나 제안되었다(Baum et al. (2006), Nienhuis et al. (2006), Ramezani et al. (2006)). 염색질 인슐레이터로서 공지된 DNA 요소들의 한 클래스는 벡터 안전성 및 성능을 개선하는 한 수단으로서 인식되었다(Emery (2011)).
인슐레이터는 인접 염색질 도메인들 사이의 기능성 경계로부터 돕는 천연 생성 DNA 요소이다. 인슐레이터는 염색질을 변형시키고 국부적 유전자 발현을 변경시키는 단백질에 결합한다. 본원에 기재된 벡터에서 인슐레이터의 배치는 1) 플랭킹 염색체에 의한 발현의 위치적 효과 다변화로부터 벡터를 차폐한다는 점(즉, 위치 효과 및 벡터 침묵을 감소시킬 수 있는 장벽 활성); 및 2) 벡터에 의한 내생성 유전자 발현의 삽입적 트랜스-활성화로부터 플랭킹 염색체를 차폐한다는 점(인핸서 차단)을 포함하나 이들로 한정되지 않는 다양한 잠재적 이점들을 제공한다. 염색질 인슐레이터들의 두 기본 클래스들이 존재한다: (a) 침묵 이종염색질이 전사적으로 허용되는 개방 염색질의 인접 영역들 내로 침입하는 것을 차단하는 장벽 인슐레이터, 및 (b) 인접 영역들의 인핸서-매개된 전사 활성화를 방해하는 인핸서 차단 인슐레이터. 이들 활성들을 매개하는 서열들은 물리적으로 분리될 수 있고 기작적으로 상이하다(Recillas-Targa et al. (2002)). 염색질 인슐레이터들은 혼자 스스로 고유의 전사 향상 또는 억제 활성을 나타내지 않는다. 따라서, 이들은 유전자 전달 벡터와 표적 세포 게놈 사이의 상호작용을 감소시키기 위한 이상적인 요소를 만든다. 인슐레이터들은 게놈 또는 유전적 환경에 포함된 유전자들 또는 전사 유닛들의 독립적인 기능을 보존하는 것을 도울 수 있고, 이때 상기 유전자들 또는 전사 유닛들의 발현은 게놈 또는 유전적 환경 내의 조절 신호에 의해 다른 방식으로 영향을 받을 수 있다(예를 들면, 문헌[Burgess-Beusse et al. (2002) Proc. Nat'l Acad. Sci. USA, 99: 16433; and Zhan et al. (2001) Hum. Genet., 109: 471] 참조).
유전독성의 위험이 염색질 인슐레이터의 사용에 의해 감소될 수 있다는 것이 입증된 것과 마찬가지로(Arumugam et al. (2007), Emery (2011), Evans-Galea et al. (2007), Rivella et al. (2000), Emery et al. (2000), Emery et al. (2002), Yannaki et al. (2002), Hino et al. (2004), Ramezani et al. (2003), Ramezani et al. (2008)), 바이러스 벡터의 삽입적 돌연변이유발에 의해 발생된 문제점들은 널리 공지되어 있다(Nienhuis (2013), Baum et al. (2006), Nienhuis et al. (2006)). 본 개시된 보호대상은 강력한 인핸서 차단 인슐레이터인 신규 인슐레이터를 제공하고, 일부 인슐레이터들은 장벽 인슐레이터 활성을 추가로 가진다. 척추동물에서, 인핸서 차단 인슐레이터의 기능은 징크-핑거 DNA 결합 인자 CTCF를 통해 매개된다(Gaszner and Felsenfeld (2006), Wallace and Felsenfeld (2007)). 일반적으로, 이들 요소들은 인접 인슐레이터 요소들 사이의 CTCF-매개된 상호작용에 의해 확립되거나 핵 내의 구조적 요소에의 염색질 섬유의 CTCF-매개된 고착을 통해 확립되는 물리적 루프 구조를 통해 작용하는 것으로 생각된다. 가장 먼저 특징규명된 척추동물 염색질 인슐레이터는 닭 β-글로빈 좌위 조절 영역 내에 위치한다. DNase-I 과민감성 부위-4(cHS4)를 함유하는 이 요소는 닭 β-글로빈 좌위의 5' 경계를 구성하는 듯하다(Prioleau et al. (1999) EMBO J. 18: 4035-4048). 상기 cHS4 요소를 함유하는 1.2-kb 영역은 세포주에서 글로빈 유전자 프로모터와 인핸서의 상호작용을 차단하는 능력(Chung et al. (1993) Cell, 74: 505-514), 및 초파리(상기 문헌), 형질전환된 세포주(Pikaart et al. (1998) Genes Dev. 12: 2852-2862) 및 형질전환 포유동물(Wang et al. (1997) Nat. Biotechnol., 15: 239-243; Taboit-Dameron et al. (1999) Transgenic Res., 8: 223-235)에서 발현 카세트를 위치 효과로부터 보호하는 능력을 포함하는 고전적인 인슐레이터 활성을 나타낸다. 이 활성의 대부분은 250-bp 영역에 함유되어 있다. 이 스트레치(stretch) 내에 인핸서 차단 분석(Bell et al. (1999) Cell, 98: 387-396)에 관여하는 징크 핑거 DNA 결합 단백질 CTCF와 상호작용하는 49-bp cHS4 요소(Chung et al. (1997) Proc. Natl. Acad. Sci., USA, 94: 575-580)가 존재한다.
인슐레이터, 예컨대, cHS4는 인핸서와 프로모터 사이에 배치될 때 이들 요소들 사이의 상호작용을 차단할 수 있다(Evans-Galea et al. (2007), Chung et al. (1997), Bell et al. (1999), Ryu et al. (2007), Ryu et al. (2008)). 여러 연구들은 감마레트로바이러스 벡터(Evans-Galea et al. (2007), Rivella et al. (2000), Emery et al. (2000), Emery et al. (2002), Yannaki et al. (2002), Hino et al. (2004), Ramezani et al. (2006), Yao et al. (2003), Nishino et al. (2006), Aker et al. (2007), Li and Emery (2008)) 및 렌티바이러스 벡터(Bank et al. (2005), Arumugam et al. (2007), Puthenveetil et al. (2004), Evans-Galea et al. (2007), Ramezani et al. (2003), Aker et al. (2007), Ma et al. (2003), Chang et al. (2005), Pluta et al. (2005))의 위치 효과 침묵을 감소시키는 cHS4 인슐레이터의 능력을 입증하였다. 이러한 적절하게 설계된 연구들은 cHS4 인슐레이터의 1.2 kb 버전의 포함이 적어도 일부 환경들에서 벡터 전이유전자 발현의 확률 및/일관성을 증가시킨다는 것을 입증하였다(Arumugam et al. (2007), Emery (2011), Evans-Galea et al. (2007), Emery et al. (2002), Yannaki et al. (2002), Hino et al. (2004), Ramezani et al. (2006), Aker et al. (2007), Li and Emery (2008), Pluta et al. (2005). Jakobsson et al. (2004)). 그럼에도 불구하고, cHS4 인슐레이터에 의해 부여된 보호 정도는 결코 완전하지 않다. 또한, 1.2 kb cHS4의 포함은 벡터 역가에 불리하게 영향을 미칠 수 있는 반면, 가장 작은 cHS4 코어는 비효과적인 것으로 입증되었다(Aker et al. (2007), Jakobsson et al. (2004)). 대조적으로, 본 개시된 보호대상의 인슐레이터는 바이러스 벡터의 역가에 불리하게 영향을 미치지 않고, cHS4 인슐레이터보다 더 강력하고 효과적이다.
본 개시된 인슐레이터는 게놈 접근법, 예를 들면, 강력한 인핸서 차단제일뿐만 아니라 인간 게놈의 장벽 인슐레이터인 인슐레이터를 확인하는 게놈 접근법의 이용을 통해 확인된다. 본 개시된 인슐레이터는 유전자 요법(예를 들면, 줄기 세포 유전자 요법, 글로빈 유전자 요법)의 안전성을 향상시킨다. 헤모글로빈병증의 유전자 요법의 경우, 강력한 인핸서가 치료적 수준의 글로빈 유전자 발현을 달성하기 위해 요구된다. 따라서, 강력한 인슐레이터는 삽입 벡터의 강력한 인핸서로부터 게놈 환경을 보호하는 한 수단을 대표한다.
본 개시된 인슐레이터는 강력한 인핸서 차단 활성을 가진다. 한정하기 위한 것이 아닌 예로써, 본 개시의 인슐레이터는 적어도 약 10%, 적어도 약 20%, 적어도 약 30%, 적어도 약 40%, 적어도 약 50%, 적어도 약 55%, 적어도 약 60%, 적어도 약 65%, 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 91%, 적어도 약 92%, 적어도 약 93%, 적어도 약 94%, 적어도 약 95%, 적어도 약 96%, 적어도 약 97%, 적어도 약 98% 또는 적어도 약 99%까지 인핸서 요소의 활성을 감소시킬 수 있다. 일부 구현예들에서, 인슐레이터는 인핸서 차단 활성 이외에 장벽 활성을 가진다. 본 개시된 인슐레이터는 삽입적 돌연변이유발의 위험 및 바이러스 벡터와 관련된 유전독성을 실질적으로 감소시킨다. 나아가, 본 개시된 인슐레이터가 벡터 내로 도입될 때, 상기 인슐레이터는 벡터의 벡터 역가에 불리하게 영향을 미치지 않는다. 일부 구현예들에서, 인슐레이터(예를 들면, 인슐레이터 A1)는 글로빈 유전자 또는 이의 기능성 부분의 생체내 발현을 증가시킨다.
일부 구현예들에서, 인슐레이터는 이하에 제공된 서열번호 18에 기재된 뉴클레오티드 서열을 가진 전사 억제제 CTCF 결합 부위를 포함한다:
Figure 112017031863395-pct00001
한 비제한적 구현예에서, 인슐레이터는 이하에 제공된 서열번호 1에 기재된 뉴클레오티드 서열, 또는 서열번호 1과 적어도 약 95% 상동하거나 적어도 약 98% 동일한(상동성) 서열을 가진다. 서열번호 1에 기재된 뉴클레오티드 서열을 가진 이 인슐레이터는 인슐레이터 A1로서 표기된다.
Figure 112017031863395-pct00002
일부 구현예들에서, 인슐레이터는 서열번호 24에 기재된 뉴클레오티드 서열, 또는 서열번호 24와 적어도 약 95% 동일하거나 적어도 약 98% 동일한 서열을 포함한다.
Figure 112017031863395-pct00003
일부 구현예들에서, 인슐레이터는 (서열번호 1의 역 상보체인) 서열번호 25에 기재된 뉴클레오티드 서열, 또는 서열번호 25와 적어도 약 95% 동일하거나 적어도 약 98% 동일한 서열을 포함한다.
Figure 112017031863395-pct00004
일부 구현예들에서, 인슐레이터는 염색체 1의 hg18 좌표 76229933 내지 76230115에 기재된 뉴클레오티드 서열을 포함한다.
일부 구현예들에서, 인슐레이터는 호모 사피엔스 염색체 1 클론 RP11-550H2(진뱅크 접근번호 AC092813.2)의 잔기 68041과 68160 사이, 잔기 68041과 68210 사이, 잔기 68041과 68280 사이, 또는 잔기 68005와 68305 사이의 뉴클레오티드 서열, 또는 이 서열과 적어도 95% 또는 98% 동일한 서열을 포함한다.
Ⅲ. 발현 카세트
본 개시된 보호대상은 하나 이상의 상기 개시된 인슐레이터(예를 들면, 인슐레이터 A1)를 포함하는 발현 카세트를 제공한다. 일부 구현예들에서, 발현 카세트는 서열번호 1에 기재된 뉴클레오티드 서열을 가진 하나 이상의 인슐레이터, 및 β-글로빈 LCR 영역에 작동가능하게 연결된 글로빈 유전자 또는 이의 기능성 부분을 포함한다.
β-글로빈 LCR 영역
인간 β-글로빈 유전자 클러스터는 많은 후각 수용체 유전자 어레이들 중 한 어레이 내에 내장된 5종의 유전자들로 구성된다(Bulger et al., PNAS (1999);96:5129-5134). 상기 클러스터는 염색체 11p15.4 상에서 80 kb에 걸쳐 있고, 5종의 발현되는 β-유사 유전자들, 및 개체발생 동안 이들의 단계-특이적 발현을 지시하는 시스-작용 조절 요소를 포함한다(Forget (2001), Molecular Mechanism of Beta Thalassemia. Steinberg MH et al., Eds. Disorders of Hemoglobin. Genetics, Pathophysiology and Clinical Management, Cambridge University Press, Cambridge). 상기 유전자들은 그들의 발생학적 발현의 순서로 정렬되어 있다(Stamatoyannopoulos et al., (2001) Hemoglobin Switching. In: Stamatoyannopoulos G, et al., Eds. Molecular Basis of Blood Disorders, W.B. Saunders, Philadelphia, PA), 5'-ε-Gγ-Aγ-ψη-δ-β-3'. α-유사 글로빈 유전자 클러스터(5'-ξ2-ψξ1-ψα2-ψα1-α2-α1-θ-3')는 염색체 16의 짧은 아암(arm)의 텔로미어(telomere)에 매우 가까이 위치하고 약 40 kb에 걸쳐 있다. 이들 2종의 독립적인 클러스터들 내에 코딩된 유전자들의 발현은 적혈구 세포로 한정되고, β-글로빈-유사 쇄들의 결과물이 α-쇄들의 결과물과 일치하도록 균형 잡힌다. 이 정밀하게 조정된 균형은 전사 수준, 전사 후 수준 및 번역 후 수준에서 조절된다.
발생학적 단계-특이적 발현은 다수의 근위 또는 원위 시스-작용 요소들, 및 이들에 결합하는 전사 인자들에 의해 조절된다. β-글로빈 유전자(HBB)의 경우, 근위 조절 요소는 β-글로빈 프로모터 및 2개의 다운스트림 인핸서들을 포함하는데, 상기 인핸서들 중 하나는 β-글로빈의 제2 인트론에 위치하고 나머지 하나는 상기 유전자로부터 대략 800 bp 다운스트림에 위치한다(Antoniou et al., EMBO J. (1988);7:377-384; Trudel et al., Genes Dev. (1987);1:954-961; Trudel et al., Mol. Cell. Biol. (1987);7:4024-4029). 가장 두드러진 원위 조절 요소는 HBB의 50 내지 60 kb 업스트림에 위치하고 적혈구 세포에서 DNaseI에 대한 강화된 민감성을 가진 여러 하위-영역들로 구성된 β-글로빈 LCR이다(Forget (2001); Grosveld et al., Cell (1987);51:975-985; Talbot et al., Nature (1989);338:352). LCR의 가장 두드러진 성질은 그의 강한 전사 향상 활성이다. 염색체 11 상의 인간 β-글로빈 영역의 예시적 뉴클레오티드 서열은 이하에 제공된 서열번호 19(진뱅크 접근번호 NG_000007.3)에 기재되어 있다:
Figure 112017031863395-pct00005
Figure 112017031863395-pct00006
Figure 112017031863395-pct00007
Figure 112017031863395-pct00008
Figure 112017031863395-pct00009
Figure 112017031863395-pct00010
Figure 112017031863395-pct00011
Figure 112017031863395-pct00012
Figure 112017031863395-pct00013
Figure 112017031863395-pct00014
Figure 112017031863395-pct00015
Figure 112017031863395-pct00016
Figure 112017031863395-pct00017
Figure 112017031863395-pct00018
Figure 112017031863395-pct00019
Figure 112017031863395-pct00020
Figure 112017031863395-pct00021
Figure 112017031863395-pct00022
5개의 5' 과민감성 부위(HS)들(HS1-HS5) 및 1개의 3' HS 부위가 인간 β-글로빈 LCR에서 확인되었다(Stamatoyannopoulos et al., (2001)). 5' HS1 내지 HS4는 Dnase I 과민감성 부위들이다. HS2 및 HS3 요소들은 많은 연구진들에 의해 확인된 바와 같이 LCR 내에서 가장 강력한 단일 요소들이다(Ellis et al., EMBO J. (1996), 15:562-568; Collis et al., EMBO J. (1990) 9:233-240). 형질전환 마우스들에서 βYAC의 환경 하에서 HS2의 결실은 HS 부위 형성에 심각하게 영향을 미칠뿐만 아니라 모든 발생학적 단계에서 모든 인간 β-글로빈 유전자들의 발현에도 심각하게 영향을 미친다(Bungert et al., Mol. Cell Biol. (1999);19:3062-3072). HS2의 결실은 난황으로부터 유래된 적혈구에서 배아 εy 및 βhi 글로빈 유전자의 발현을 최소한으로 감소시켰다고 보고되었다(Ley et al., Ann. N.Y. Acad. Sci. (1998);850:45-53; Hug et al., Mol. Cell Biol. (1996);26:2906-2912). HS2는 일차적으로 인핸서로서 작용한다.
일부 구현예들에서, β-글로빈 LCR 영역은 HS2 영역을 포함한다. 비제한적 예에서, β-글로빈 LCR 영역은 HS2 영역, HS3 영역 및 HS4 영역을 포함한다. 일부 구현예들에서, β-글로빈 LCR 영역 내의 HS2 영역, HS3 영역 및 HS4 영역은 인접한다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 본질적으로 HS2 영역, HS3 영역 및 HS4 영역으로 구성된다. 또 다른 구현예에서, β-글로빈 LCR 영역은 HS3 영역과 HS4 영역 사이의 연접부에서 2개의 도입된 GATA-1 결합 부위들을 포함한다. HS3 영역은 HS2 영역과 HS4 영역 사이에 놓일 수 있다. HS2 영역의 길이 및 서열은 달라질 수 있다. HS2 영역은 약 400 bp 내지 약 1000 bp, 예를 들면, 약 400 bp 내지 약 500 bp, 약 500 bp 내지 약 600 bp, 약 600 bp 내지 약 700 bp, 약 700 bp 내지 약 800 bp, 약 800 bp 내지 약 900 bp, 또는 약 900 bp 내지 약 1000 bp의 길이를 가질 수 있다. 한 비제한적 구현예에서, HS2 영역은 860 bp의 길이를 가진다. 한 비제한적 예에서, HS2 영역은 이하에 제공된 서열번호 9에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00023
일부 구현예들에서, HS2 영역은 약 840 bp의 길이를 가진다. 일부 구현예들에서, HS2 영역은 약 650 bp(예를 들면, 646 bp)의 길이를 가진다. 일부 구현예들에서, HS2 영역은 약 420 bp(예를 들면, 423 bp)의 길이를 가진다.
HS3 영역의 길이 및 서열은 달라질 수 있다. HS3 영역은 약 200 bp 내지 약 1400 bp, 예를 들면, 약 200 bp 내지 약 300 bp, 약 300 bp 내지 약 400 bp, 약 400 bp 내지 약 500 bp, 약 500 bp 내지 약 600 bp, 약 600 bp 내지 약 700 bp, 약 700 bp 내지 약 800 bp, 약 800 bp 내지 약 900 bp, 약 900 bp 내지 약 1000 bp, 약 1000 bp 내지 약 1100 bp, 약 1100 bp 내지 약 1200 bp, 약 1200 bp 내지 약 1300 bp, 또는 약 1300 bp 내지 약 1400 bp의 길이를 가질 수 있다. 일부 구현예들에서, HS3 영역은 약 1300 bp의 길이를 가진다. 한 비제한적 구현예에서, HS3 영역은 1308 bp의 길이를 가진다. 한 비제한적 구현예에서, HS3 영역은 1301 bp의 길이를 가진다. 한 비제한적 예에서, HS3 영역은 이하에 제공된 서열번호 5에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00024
일부 구현예들에서, HS3 영역은 약 850 bp(예를 들면, 845 bp)의 길이를 가진다. 일부 구현예들에서, HS3 영역은 약 280 bp 내지 약 290 bp(예를 들면, 280 bp 내지 287 bp)의 길이를 가진다.
유사하게, HS4 영역의 길이 및 서열은 달라질 수 있다. HS4 영역은 약 200 bp 내지 약 1200 bp, 예를 들면, 약 200 bp 내지 약 300 bp, 약 300 bp 내지 약 400 bp, 약 400 bp 내지 약 500 bp, 약 500 bp 내지 약 600 bp, 약 600 bp 내지 약 700 bp, 약 700 bp 내지 약 800 bp, 약 800 bp 내지 약 900 bp, 약 900 bp 내지 약 1000 bp, 약 1000 bp 내지 약 1100 bp, 또는 약 1100 bp 내지 약 1200 bp의 길이를 가질 수 있다.
일부 구현예들에서, HS4 영역은 약 1.0 kb 이상의 길이를 가진다. 일부 구현예들에서, HS4 영역은 약 1.1 kb의 길이를 가진다. 일부 구현예들에서, HS4 영역은 약 1150 bp(예를 들면, 1153 bp)의 길이를 가진다. 한 비제한적 구현예에서, HS4 영역은 1065 bp의 길이를 가진다. 한 비제한적 예에서, HS4 영역은 이하에 제공된 서열번호 6에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00025
한 비제한적 예에서, HS4 영역은 이하에 제공된 서열번호 7에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00026
일부 구현예들에서, HS4 영역은 약 1.0 kb 미만, 예를 들면, 약 900 bp 미만, 약 700 bp 미만, 약 600 bp 미만 또는 약 500 bp 미만의 길이를 가진다. 일부 구현예들에서, HS4 영역은 약 500 bp 미만의 길이를 가진다. 일부 구현예들에서, HS4 영역은 약 450 bp의 길이를 가진다. 한 비제한적 구현예에서, HS4 영역은 약 446 bp의 길이를 가진다. 한 비제한적 예에서, HS4 영역은 이하에 제공된 서열번호 8에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00027
일부 구현예들에서, HS4 영역은 약 280 bp(예를 들면, 283 bp)의 길이를 가진다. 일부 구현예들에서, HS4 영역은 약 240 bp(예를 들면, 243 bp)의 길이를 가진다.
일부 비제한적 구현예들에서, β-글로빈 LCR 영역은 서열번호 9, 서열번호 20 또는 서열번호 21에 기재된 뉴클레오티드 서열을 가진 HS2 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역, 및 서열번호 6, 서열번호 7 또는 서열번호 8에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함한다.
한 비제한적 구현예에서, β-글로빈 LCR 영역은 도 1에 표시된 바와 같이 서열번호 9에 기재된 뉴클레오티드 서열을 가진 HS2 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역, 및 서열번호 7에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함한다.
또 다른 비제한적 구현예에서, β-글로빈 LCR 영역은 HS1 영역을 추가로 포함한다. 즉, β-글로빈 LCR 영역은 HS1 영역, HS2 영역, HS3 영역 및 HS4 영역을 포함한다. 일부 구현예들에서, β-글로빈 LCR 영역 내의 HS1 영역, HS2 영역, HS3 영역 및 HS4 영역은 인접한다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 본질적으로 HS1 영역, HS2 영역, HS3 영역 및 HS4 영역으로 구성된다. 또 다른 구현예에서, β-글로빈 LCR 영역은 HS3 영역과 HS4 영역 사이의 연접부에서 2개의 도입된 GATA-1 결합 부위들을 포함한다.
HS1 영역의 길이 및 서열은 달라질 수 있다. 일부 구현예들에서, HS1 영역은 약 300 bp 내지 약 1500 bp의 길이, 예를 들면, 약 300 bp 내지 약 1100 bp의 길이를 가진다. 일부 구현예들에서, HS1 영역은 약 1.0 kb 이상, 예를 들면, 약 1.1 kb, 약 1.2 kb, 약 1.3 kb, 약 1.4 kb 또는 약 1.5 kb의 길이를 가진다. 일부 구현예들에서, HS1 영역은 약 1.1 kb의 길이를 가진다. 한 비제한적 예에서, HS1 영역은 1074 bp의 길이를 가진다. 한 비제한적 예에서, HS1 영역은 이하에 제공된 서열번호 2에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00028
일부 구현예들에서, HS1 영역은 약 1.0 kb 미만, 예를 들면, 약 400 bp 내지 약 700 bp, 약 400 bp 내지 약 500 bp, 약 500 bp 내지 약 600 bp, 약 600 bp 내지 약 700 bp, 약 700 bp 내지 약 800 bp, 약 800 bp 내지 약 900 bp, 또는 약 900 bp 내지 약 1.0 kb의 길이를 가진다. 일부 구현예들에서, HS1 영역은 약 700 bp 미만의 길이를 가진다. 일부 구현예들에서, HS1 영역은 약 600 bp의 길이를 가진다. 한 비제한적 구현예에서, HS1 영역은 602 bp의 길이를 가진다. 한 비제한적 예에서, HS1 영역은 이하에 제공된 서열번호 3에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00029
일부 구현예들에서, HS1 영역은 약 500 bp 미만의 길이를 가진다. 일부 구현예들에서, HS1 영역은 약 490 bp의 길이를 가진다. 한 비제한적 구현예에서, HS1 영역은 489 bp의 길이를 가진다. 한 비제한적 예에서, HS1 영역은 이하에 제공된 서열번호 4에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00030
최근의 연구는 HS2가 적혈구-특이적인 것이 아니라, 다른 세포주들 및 계통들에서 발현되고(실시예 3 및 도 4 참조) 미분화된 인간 배아 줄기 세포에도 존재한다는 것(Chang et al., Stem cell reviews (2013);9:397-407)을 보여주었다. HS2의 비-적혈구 활성으로 인해, HS2 함유 글로빈 벡터들은 예를 들면, 지중해빈혈 및 겸상 세포 환자들을 치료하기 위한 임상 치료에서 그들의 안전한 사용에 대한 위험을 제기하였다. 일부 구현예들에서, β-글로빈 LCR 영역은 HS2 영역을 포함하지 않는다. 일부 구현예들에서, β-글로빈 LCR 영역은 HS2의 코어 서열을 포함하지 않는다. HS2의 코어 서열은 위치 독립적인 고수준 발현을 제공한다. 또한, HS2의 코어 서열은 HS2의 인핸서 활성을 유지한다. 예를 들면, HS2의 코어 서열은 글로빈 유전자(예를 들면, 인간 β-글로빈 유전자)의 전사를 향상시킨다. 추가로, HS2의 코어 서열은 AP1 패밀리 단백질들의 구성원(예를 들면, NF-E2), GATA-1("NF-E1" 또는 "NFE1"로서도 공지되어 있음), 크루펠(Kruppel)-유사 Zn 핑거 단백질(예를 들면, 편재하는 단백질들 Sp1 및 YY1, 및 적혈구-제한된 인자 적혈구 크루펠-유사 인자(EKLF)), 및 기본 나선-루프-나선(bHLH) 단백질(E 박스)(예를 들면, USF 및 TAL1)을 포함하나 이들로 한정되지 않는, 편재하는 단백질들 및 조직-특이적(예를 들면, 적혈구-특이적) 단백질들(예를 들면, 전사 인자)에 대한 하나 이상의 결합 부위 또는 결합 모티프를 포함한다. AP1 결합 부위는 향상 및 유도를 위해 요구된다(Moi and Kan (1990); Ney et al., (1990); Talbot and Grosveld (1991)). 나아가, NF-E2의 결합은 HS2에서 시험관내 재구성된 염색질의 파괴를 야기할 수 있다(Armstrong and Emerson (1996)). GATA-1 결합 부위에서의 돌연변이는 형질전환 마우스들에서 HS2의 인핸서 활성의 감소를 야기할 수 있다(Caterina et al., (1994)). AP1(예를 들면, AP1/NF-E2) 및 GATA1 결합 부위들 둘 다가 코어 기능에 중요하지만, 이들 인자들을 결여하는 마우스들은 손상된 글로빈 유전자 발현을 보이지 않는다(Weiss et al., 1994).
일부 구현예들에서, β-글로빈 LCR 영역은 HS2의 코어 서열의 전체 길이를 포함하지 않는다. 일부 구현예들에서, HS2 영역의 코어 서열은 인간 HS2의 코어 서열이다. 한 비제한적 구현예에서, 인간 HS2의 코어 서열은 AP1 패밀리 단백질들의 구성원들(예를 들면, NF-E2)에 대한 한 직렬 쌍의 결합 부위들("AP1/NF-E2" 결합 부위들로서 지칭됨)(예를 들면, GCTGAGTCA 및 GATGAGTCA), 크루펠-유사 Zn 핑거 단백질에 대한 1개의 결합 부위(예를 들면, AGGGTGTGT), 1개의 GATA-1 결합 부위(예를 들면, CTATCT) 및 3개의 E 박스들(CANNTG, 예를 들면, CAGATG 및 CACCTG)을 포함한다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 이하에 제공된 서열번호 20에 기재된 뉴클레오티드 서열을 가진, 인간 HS2의 388 bp 코어 서열의 전체 길이를 포함하지 않는다:
Figure 112017031863395-pct00031
서열번호 20에 기재된 뉴클레오티드 서열은 서열번호 19의 뉴클레오티드 위치 16671 내지 위치 17058에 상응한다(진뱅크 접근번호 NG_000007.3). 서열번호 20에서, GCTGAGTCA의 뉴클레오티드 서열을 가진 1개의 AP1/NF-E2 결합 부위는 위치 175 내지 위치 183에 위치하고, GATGAGTCA의 뉴클레오티드 서열을 가진 1개의 AP1/NF-E2 결합 부위는 위치 185 내지 위치 193에 위치하고, AGGGTGTGT의 뉴클레오티드 서열을 가진 크루펠-유사 Zn 핑거 단백질에 대한 1개의 결합 부위는 위치 205 내지 위치 213에 위치하고, CAGATG의 뉴클레오티드 서열을 각각 가진 2개의 E 박스들은 위치 217 내지 위치 222 및 위치 278 내지 위치 283에 위치하고, CTATCT의 뉴클레오티드 서열을 가진 1개의 GATA-1 결합 부위는 위치 246 내지 위치 251에 위치하고, CACCTG의 뉴클레오티드 서열을 가진 1개의 E 박스는 위치 306 내지 위치 311에 위치한다.
한 비제한적 구현예에서, β-글로빈 LCR 영역은 이하에 제공된 서열번호 21에 기재된 뉴클레오티드 서열을 가진, 인간 HS2의 387 bp 코어 서열의 전체 길이를 포함하지 않는다:
Figure 112017031863395-pct00032
서열번호 21에서, GCTGAGTCA의 뉴클레오티드 서열을 가진 1개의 AP1/NF-E2 결합 부위는 위치 175 내지 위치 183에 위치하고, GATGAGTCA의 뉴클레오티드 서열을 가진 1개의 AP1/NF-E2 결합 부위는 위치 185 내지 위치 193에 위치하고, AGGGTGTGT의 뉴클레오티드 서열을 가진 크루펠-유사 Zn 핑거 단백질에 대한 1개의 결합 부위는 위치 204 내지 위치 212에 위치하고, CAGATG의 뉴클레오티드 서열을 각각 가진 2개의 E 박스들은 위치 216 내지 위치 221, 및 위치 277 내지 위치 282에 위치하고, CTATCT의 뉴클레오티드 서열을 가진 1개의 GATA-1 결합 부위는 위치 245 내지 위치 250에 위치하고, CACCTG의 뉴클레오티드 서열을 가진 1개의 E 박스는 위치 305 내지 위치 310에 위치한다.
일부 구현예들에서, β-글로빈 LCR 영역은 HS2의 코어 서열을 포함하는 HS2 영역을 포함하지 않는다. HS2의 코어 서열을 포함하는 HS2 영역은 길이 및 서열 면에서 달라질 수 있다. 비제한적 예에서, HS2의 코어 서열을 포함하는 HS2 영역은 약 400 bp 내지 약 1000 bp, 예를 들면, 약 400 bp 내지 약 500 bp, 약 500 bp 내지 약 600 bp, 약 600 bp 내지 약 700 bp, 약 700 bp 내지 약 800 bp, 약 800 bp 내지 약 900 bp, 또는 약 900 bp 내지 약 1000 bp의 길이를 가진다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 840 bp HS2 영역(예를 들면, 미국 특허 제7,541,179호에 개시된 글로빈 벡터 TNS9에 포함된 HS2 영역)을 포함하지 않는다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 860 bp HS2 영역을 포함하지 않는다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 약 650 bp HS2 영역을 포함하지 않는다. 한 비제한적 예에서, β-글로빈 LCR 영역은 646 bp HS2 영역(예를 들면, "β87"로서도 공지되어 있는 글로빈 벡터 LentiGlobin™에 포함된 HS2 영역)을 포함하지 않는다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 약 420 bp HS2 영역을 포함하지 않는다. 한 비제한적 예에서, β-글로빈 LCR 영역은 423 bp HS2 영역(예를 들면, 문헌[Sadelain et al., Proc. Nat'l Acad. Sci. (USA) (1995);92:6728-6732]에 개시된 글로빈 벡터에 포함된 HS2 영역)을 포함하지 않는다.
일부 구현예들에서, β-글로빈 LCR 영역은 HS2의 인핸서 활성을 유지하는 HS2 영역을 포함하지 않는다. 일부 구현예들에서, β-글로빈 LCR 영역은 글로빈 유전자(예를 들면, 인간 β-글로빈 유전자)의 전사를 향상시킬 수 있는 HS2 영역을 포함하지 않는다. 비제한적 예에서, β-글로빈 LCR 영역은 글로빈 유전자(예를 들면, 인간 β-글로빈 유전자)의 전사를 향상시키는 능력이 천연 HS2 영역에 비해 60% 이상, 70% 이상, 80% 이상, 90% 이상 또는 95% 이상인 HS2 영역을 포함하지 않는다.
일부 구현예들에서, β-글로빈 LCR 영역은 하기 결합 부위들 중 1개, 2개, 3개, 4개, 5개, 6개 또는 7개의 결합 부위들을 포함하는 HS2 영역을 포함하지 않는다: 2개(한 직렬 쌍)의 AP1/NF-E2 결합 부위들(예를 들면, GCTGAGTCA 및 GATGAGTCA), 크루펠-유사 Zn 핑거 단백질에 대한 1개의 결합 부위(예를 들면, AGGGTGTGT), 1개의 GATA-1 결합 부위(예를 들면, CTATCT), 및 3개의 E 박스들(CANNTG, 예를 들면, CAGATG 및 CACCTG). 일부 구현예들에서, β-글로빈 LCR 영역은 전술된 결합 부위들 중 6개의 결합 부위들을 포함하는 HS2 영역을 포함하지 않는다. 예를 들면, 일부 구현예들에서, β-글로빈 LCR 영역은 2개의 AP1/NF-E2 결합 부위들, 크루펠-유사 Zn 핑거 단백질에 대한 1개의 결합 부위, 1개의 GATA-1 결합 부위, 및 3개가 아니라 2개의 E 박스들을 포함하는 HS2 영역을 포함하지 않는다. 일부 구현예들에서, β-글로빈 LCR 영역은 2개가 아니라 1개의 AP1/NF-E2 결합 부위, 크루펠-유사 Zn 핑거 단백질에 대한 1개의 결합 부위, 1개의 GATA-1 결합 부위 및 3개의 E 박스들을 포함하는 HS2 영역을 포함하지 않는다. 일부 구현예들에서, β-글로빈 LCR 영역은 2개의 AP1/NF-E2 결합 부위들, 1개의 GATA-1 결합 부위 및 3개의 E 박스들을 포함하고 크루펠-유사 Zn 핑거 단백질에 대한 1개의 결합 부위를 포함하지 않는 HS2 영역을 포함하지 않는다. 일부 구현예들에서, β-글로빈 LCR 영역은 2개의 AP1/NF-E2 결합 부위들, 크루펠-유사 Zn 핑거 단백질에 대한 1개의 결합 부위 및 3개의 E 박스들을 포함하고 1개의 GATA-1 결합 부위를 포함하지 않는 HS2 영역을 포함하지 않는다.
일부 구현예들에서, β-글로빈 LCR 영역은 HS1 영역, HS3 영역 및 HS4 영역을 포함하고, HS2 영역을 포함하지 않는다. 일부 구현예들에서, β-글로빈 LCR 영역 내의 HS1 영역, HS3 영역 및 HS4 영역은 인접한다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 본질적으로 HS1 영역, HS3 영역 및 HS4 영역으로 구성된다. 또 다른 구현예에서, β-글로빈 LCR 영역은 HS3 영역과 HS4 영역 사이의 연접부에서 2개의 도입된 GATA-1 결합 부위들을 포함한다. HS3 영역은 HS1 영역과 HS4 영역 사이에 놓일 수 있다.
일부 비제한적 구현예들에서, β-글로빈 LCR 영역은 서열번호 2, 서열번호 3, 서열번호 4, 서열번호 22 또는 서열번호 23에 기재된 뉴클레오티드 서열을 가진 HS1 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역, 및 서열번호 6, 서열번호 7 또는 서열번호 8에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함하고, β-글로빈 LCR 영역은 HS2 영역을 포함하지 않는다.
한 비제한적 구현예에서, 도 2에 표시된 바와 같이, β-글로빈 LCR 영역은 서열번호 2에 기재된 뉴클레오티드 서열을 가진 HS1 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역, 및 서열번호 6에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함하고, β-글로빈 LCR 영역은 HS2 영역을 포함하지 않는다.
한 비제한적 구현예에서, 도 3에 표시된 바와 같이, β-글로빈 LCR 영역은 서열번호 3에 기재된 뉴클레오티드 서열을 가진 HS1 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역, 및 서열번호 8에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함하고, β-글로빈 LCR 영역은 HS2 영역을 포함하지 않는다.
한 비제한적 구현예에서, β-글로빈 LCR 영역은 서열번호 4에 기재된 뉴클레오티드 서열을 가진 HS1 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역, 및 서열번호 8에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함하고, β-글로빈 LCR 영역은 HS2 영역을 포함하지 않는다.
일부 구현예들에서, β-글로빈 LCR 영역은 HS1 영역 또는 HS2 영역을 포함하지 않는다. 일부 구현예들에서, β-글로빈 LCR 영역은 HS1의 코어 서열을 포함하지 않는다. HS1의 코어 서열은 HS1의 활성, 예를 들면, 인핸서 활성, 또는 다른 HS 영역, 예를 들면, HS2 내지 HS4의 인핸서 활성을 조절하기 위한 촉진제 또는 조절 요소로서의 기능을 유지한다. 추가로, HS1의 코어 서열은 GATA-1 및 크루펠-유사 Zn 핑거 단백질(예를 들면, 적혈구-제한된 인자 EKLF)을 포함하나 이들로 한정되지 않는 편재하는 단백질 및 조직-특이적(예를 들면, 적혈구-특이적) 단백질(예를 들면, 전사 인자)에 대한 하나 이상의 결합 부위 또는 결합 모티프를 포함한다.
일부 구현예들에서, β-글로빈 LCR 영역은 HS1의 코어 서열의 전체 길이를 포함하지 않는다. 일부 구현예들에서, HS1 영역의 코어 서열은 인간 HS1의 코어 서열이다. 한 비제한적 구현예에서, 인간 HS1의 코어 서열은 2개의 GATA-1 결합 부위들(예를 들면, TTATCT 및 CTATCA), 및 EKLF에 대한 1개의 결합 부위(예를 들면, CCACACACA)를 포함한다. 일부 구현예들에서, β-글로빈 LCR 영역은 인간 HS1의 286 bp 코어 서열의 전체 길이를 포함하지 않는다. 한 비제한적 구현예에서, 인간 HS1의 286 bp 코어 서열은 이하에 제공된 서열번호 22에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00033
서열번호 22에서, TTATCT의 뉴클레오티드 서열을 가진 1개의 GATA-1 결합 부위는 위치 173 내지 위치 178에 위치하고, CTATCA의 뉴클레오티드 서열을 가진 1개의 GATA-1 결합 부위는 위치 210 내지 위치 215에 위치하고, CCACACACA의 뉴클레오티드 서열을 가진, EKLF에 대한 1개의 결합 부위는 위치 183 내지 위치 191에 위치한다.
또 다른 비제한적 구현예에서, 인간 HS1의 286 bp 코어 서열은 이하에 제공된 서열번호 23에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00034
서열번호 23에 기재된 뉴클레오티드 서열은 서열번호 19(진뱅크 접근번호 NG_000007.3)의 뉴클레오티드 위치 21481 내지 위치 21766에 상응한다. 서열번호 23에서, TTATCT의 뉴클레오티드 서열을 가진 1개의 GATA-1 결합 부위는 위치 173 내지 위치 178에 위치하고, CTATCA의 뉴클레오티드 서열을 가진 1개의 GATA-1 결합 부위는 위치 210 내지 위치 215에 위치하고, CCACACACA의 뉴클레오티드 서열을 가진, EKLF에 대한 1개의 결합 부위는 위치 183 내지 위치 191에 위치한다.
일부 구현예들에서, β-글로빈 LCR 영역은 HS1의 코어 서열을 포함하는 HS1 영역을 포함하지 않는다. HS1의 코어 서열을 포함하는 HS1 영역은 길이 및 서열 면에서 달라질 수 있다. 비제한적 예에서, HS1의 코어 서열을 포함하는 HS1 영역은 약 300 bp 내지 약 1200 bp, 예를 들면, 약 300 bp 내지 약 400 bp, 약 400 bp 내지 약 500 bp, 약 500 bp 내지 약 600 bp, 약 600 bp 내지 약 700 bp, 약 700 bp 내지 약 800 bp, 약 800 bp 내지 약 900 bp, 약 900 bp 내지 약 1000 bp, 약 1000 bp 내지 약 1100 bp, 또는 약 1100 bp 내지 약 1200 bp의 길이를 가진다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 약 1.0 kb bp HS1 영역을 포함하지 않는다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 약 1.1 kb HS1 영역을 포함하지 않는다.
일부 구현예들에서, β-글로빈 LCR 영역은 HS1의 활성, 예를 들면, 인핸서 활성, 또는 다른 HS 영역, 예를 들면, HS2 내지 HS4의 인핸서 활성을 조절하기 위한 촉진제 또는 조절 요소로서의 기능을 유지하는 HS1 영역을 포함하지 않는다. 일부 구현예들에서, β-글로빈 LCR 영역은 글로빈 유전자(예를 들면, 인간 β-글로빈 유전자)의 전사를 향상시킬 수 있는 HS1 영역을 포함하지 않는다. 비제한적 예에서, β-글로빈 LCR 영역은 글로빈 유전자(예를 들면, 인간 β-글로빈 유전자)의 전사를 향상시키는 능력이 천연 HS1 영역에 비해 60% 이상, 70% 이상, 80% 이상, 90% 이상 또는 95% 이상인 HS1 영역을 포함하지 않는다. 비제한적 예에서, β-글로빈 LCR 영역은 HS2 내지 HS4 중 하나 이상의 인핸서 활성을 조절하는 능력이 천연 HS1 영역에 비해 60% 이상, 70% 이상, 80% 이상, 90% 이상 또는 95% 이상인 HS1 영역을 포함하지 않는다.
일부 구현예들에서, β-글로빈 LCR 영역은 하기 결합 부위들 중 1개, 2개 또는 3개의 결합 부위들을 포함하는 HS1 영역을 포함하지 않는다: 2개의 GATA-1 결합 부위들(예를 들면, TTATCT 및 CTATCA), 및 EKLF에 대한 1개의 결합 부위(예를 들면, CCACACACA). 일부 구현예들에서, β-글로빈 LCR 영역은 상기 결합 부위들 중 2개의 결합 부위들을 포함하는 HS1 영역을 포함하지 않는다. 예를 들면, 일부 구현예들에서, β-글로빈 LCR 영역은 2개의 GATA-1 결합 부위들을 포함하고 EKLF에 대한 1개의 결합 부위를 포함하지 않는 HS1 영역을 포함하지 않는다. 일부 구현예들에서, β-글로빈 LCR 영역은 2개가 아니라 1개의 AP1/NF-E2 결합 부위 및 EKLF에 대한 1개의 결합 부위를 포함하는 HS1 영역을 포함하지 않는다.
일부 구현예들에서, β-글로빈 LCR 영역은 HS3 영역 및 HS4 영역을 포함하고, β-글로빈 LCR 영역은 HS1 영역 또는 HS2 영역을 포함하지 않는다. 일부 구현예들에서, β-글로빈 LCR 영역 내의 HS3 영역 및 HS4 영역은 인접한다. 한 비제한적 구현예에서, β-글로빈 LCR 영역은 본질적으로 HS3 영역 및 HS4 영역으로 구성된다. 또 다른 구현예에서, β-글로빈 LCR 영역은 HS3 영역과 HS4 영역 사이의 연접부에서 2개의 도입된 GATA-1 결합 부위들을 포함한다. HS3 영역은 글로빈 유전자 또는 이의 기능성 부분과 HS4 영역 사이에 놓일 수 있다.
일부 구현예들에서, β-글로빈 LCR 영역은 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역, 및 서열번호 6, 서열번호 7 또는 서열번호 8에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함하고, β-글로빈 LCR 영역은 HS1 영역 또는 HS2 영역을 포함하지 않는다.
한 비제한적 구현예에서, 도 4에 표시된 바와 같이, β-글로빈 LCR 영역은 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역, 및 서열번호 6에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함하고, β-글로빈 LCR 영역은 HS1 영역 또는 HS2 영역을 포함하지 않는다.
글로빈 유전자
본 개시된 보호대상에 따라, 발현 카세트는 글로빈 유전자 또는 이의 기능성 부분을 포함한다. 글로빈 유전자는 β-글로빈 유전자, γ-글로빈 유전자 또는 δ-글로빈 유전자일 수 있다. 일부 구현예들에서, 발현 카세트는 인간 β-글로빈 유전자를 포함한다. 본 개시된 보호대상에 따라, 인간 β-글로빈 유전자는 야생형 인간 β-글로빈 유전자, 인트론 서열의 하나 이상의 결실을 포함하는 결실된 인간 β-글로빈 유전자, 또는 하나 이상의 항-겸상화(anti-sickling) 아미노산 잔기를 암호화하는 돌연변이된 인간 β-글로빈 유전자일 수 있다. 한 비제한적 구현예에서, 본 개시된 발현 카세트는 야생형 인간 β-글로빈 유전자를 포함한다. 또 다른 구현예에서, 본 개시된 발현 카세트는 코돈 87에서 글루타민으로의 쓰레오닌의 돌연변이(βA-T87Q)를 암호화하는 인간 βA-글로빈 유전자를 포함한다. 감마-글로빈 쇄에서 위치 87에 있는 글루타민 잔기는 베타 쇄의 산소 결합 특성을 보존하면서 베타 쇄에 비해 감마 쇄의 항-겸상화 활성을 증강시킨다(Nagel et al., Proc. Natl. Acad. Sci. U.S.A. (1979);76:670-672). 일부 구현예들에서, 글로빈 유전자의 기능성 부분은 상응하는 야생형 기준 폴리뉴클레오티드 서열에 대한 적어도 80%, 적어도 90%, 적어도 95% 또는 적어도 99%의 동일성을 가진다.
프로모터 및 인핸서
본 개시된 보호대상에 따라, 발현 카세트는 β-글로빈 프로모터를 추가로 포함할 수 있다. 일부 구현예들에서, β-글로빈 프로모터는 글로빈 유전자 또는 이의 기능성 부분과 β-글로빈 LCR 영역 사이에 위치한다. β-글로빈 프로모터의 길이 및 서열은 달라질 수 있다. 일부 구현예들에서, β-글로빈 프로모터는 약 100 bp 내지 약 1600 bp의 길이, 예를 들면, 약 200 bp 내지 약 700 bp, 약 100 bp 내지 약 200 bp, 약 200 bp 내지 약 300 bp, 약 300 bp 내지 약 400 bp, 약 400 bp 내지 약 500 bp, 약 500 bp 내지 약 600 bp, 약 600 bp 내지 약 700 bp, 약 700 bp 내지 약 800 bp, 약 800 bp 내지 약 900 bp, 약 900 bp 내지 약 1000 bp, 약 1000 bp 내지 약 1100 bp, 약 1100 bp 내지 약 1200 bp, 약 1200 bp 내지 약 1300 bp, 약 1300 bp 내지 약 1400 bp, 약 1400 bp 내지 약 1500 bp, 또는 약 1500 bp 내지 약 1600 bp의 길이를 가진다. 일부 구현예들에서, β-글로빈 프로모터는 약 130 bp, 약 613 bp, 약 265 bp 또는 약 1555 bp의 길이를 가진 인간 β-글로빈 프로모터이다. 한 구현예에서, β-글로빈 프로모터는 약 613 bp의 길이를 가진 인간 β-글로빈 프로모터이다. 한 비제한적 예에서, 인간 β-글로빈 프로모터는 이하에 제공된 서열번호 10에 기재된 뉴클레오티드 서열을 가진다:
Figure 112017031863395-pct00035
한 구현예에서, β-글로빈 프로모터는 약 265 bp의 길이를 가진 인간 β-글로빈 프로모터이다. 한 비제한적 예에서, 인간 β-글로빈 프로모터는 서열번호 11에 기재된 뉴클레오티드 서열을 가진다.
Figure 112017031863395-pct00036
추가로 또는 대안적으로, 본 개시된 발현 카세트는 인간 β-글로빈 3' 인핸서를 추가로 포함할 수 있다. 일부 구현예들에서, 인간 β-글로빈 3' 인핸서는 글로빈 유전자 또는 이의 기능성 부분의 업스트림에 위치한다. 일부 구현예들에서, β-글로빈 3' 인핸서는 약 500 bp 내지 약 1000 bp의 길이, 예를 들면, 약 500 bp 내지 약 600 bp, 약 600 bp 내지 약 700 bp, 약 700 bp 내지 약 800 bp, 또는 약 800 bp 내지 약 900 bp의 길이를 가진다. 한 구현예에서, 인간 β-글로빈 3' 인핸서는 약 879 bp의 길이를 가진다. 일례에서, 인간 β-글로빈 3' 인핸서는 서열번호 12에 기재된 뉴클레오티드 서열을 가진다.
Figure 112017031863395-pct00037
나아가, 본 개시된 발현 카세트는 하나 이상의 적혈구-특이적 인핸서를 추가로 포함할 수 있다. 본 개시된 발현 카세트는 적혈구-특이적 방식으로 글로빈 유전자(예를 들면, 인간 β-글로빈 유전자)의 발현을 가능하게 한다. 적혈구-특이적 인핸서는 적혈구-특이적 방식으로 글로빈 유전자의 발현을 향상시킬 수 있다. 예를 들면, 적혈구-특이적 인핸서는 비-적혈구 조직에서 인핸서 활성을 결여한다. 구체적으로, 일차적으로 발현 인핸서로서 작용하는 HS2 영역을 결여하는 β-글로빈 LCR 영역의 경우, 하나 이상의 적혈구-특이적 인핸서의 추가는 HS2 영역의 향상 활성을 보완할 수 있다. 더욱이, 본 개시된 적혈구-특이적 인핸서는 발현 카세트를 포함하는 벡터의 역가를 감소시키거나 경감시키지 않는다. 적혈구-특이적 인핸서의 길이는 달라질 수 있고, 예를 들면, 약 100 bp 내지 약 200 bp, 약 100 bp 내지 약 120 bp, 약 120 bp 내지 약 140 bp, 약 140 bp 내지 약 200 bp(예를 들면, 약 140 bp 내지 약 150 bp, 약 150 bp 내지 약 160 bp, 약 160 bp 내지 약 170 bp, 약 170 bp 내지 약 180 bp, 약 180 bp 내지 약 190 bp, 또는 약 190 bp 내지 약 200 bp)일 수 있다. 일부 구현예들에서, 적혈구-특이적 인핸서는 약 140 bp 내지 약 200 bp의 길이를 가진다. 한 비제한적 구현예에서, 적혈구-특이적 인핸서는 이하에 제공된 서열번호 13에 기재된 뉴클레오티드 서열을 가진 152 bp의 길이를 가진다:
Figure 112017031863395-pct00038
한 비제한적 구현예에서, 적혈구-특이적 인핸서는 이하에 제공된 서열번호 14에 기재된 뉴클레오티드 서열을 가진 157 bp의 길이를 가진다:
Figure 112017031863395-pct00039
한 비제한적 구현예에서, 적혈구-특이적 인핸서는 이하에 제공된 서열번호 15에 기재된 뉴클레오티드 서열을 가진 141 bp의 길이를 가진다:
Figure 112017031863395-pct00040
한 비제한적 구현예에서, 적혈구-특이적 인핸서는 이하에 제공된 서열번호 16에 기재된 뉴클레오티드 서열을 가진 171 bp의 길이를 가진다:
Figure 112017031863395-pct00041
한 비제한적 구현예에서, 적혈구-특이적 인핸서는 이하에 제공된 서열번호 17에 기재된 뉴클레오티드 서열을 가진 195 bp의 길이를 가진다:
Figure 112017031863395-pct00042
적혈구-특이적 인핸서는 본 기술분야에서 공지된 임의의 적합한 방법에 의해 확인될 수 있고 결정될 수 있다. 적혈구-특이적 인핸서는 β-글로빈 LCR 영역의 3' LTR(다운스트림) 또는 5' LTR(다운스트림)에 위치할 수 있다. 한 구현예에서, 하나 이상의 적혈구-특이적 인핸서는 β-글로빈 LCR 영역의 5' LTR, 예를 들면, HS3 영역의 업스트림에 위치한다. 발현 카세트는 1개, 2개, 3개, 4개 또는 5개의 적혈구-특이적 인핸서들을 포함할 수 있다. 한 구현예에서, 발현 카세트는 1개의 적혈구-특이적 인핸서를 포함한다. 또 다른 구현예에서, 발현 카세트는 2개의 적혈구-특이적 인핸서들을 포함한다. 또 다른 구현예에서, 발현 카세트는 3개의 적혈구-특이적 인핸서들을 포함한다. 일부 구현예들에서, 발현 카세트는 4개의 적혈구-특이적 인핸서들을 포함한다. 비제한적 구현예에서, 발현 카세트는 5개의 적혈구-특이적 인핸서들을 포함한다.
인슐레이터
본 개시된 보호대상에 따라, 발현 카세트는 전술된 인슐레이터들 중 하나 이상을 포함한다. 일부 구현예들에서, 본 개시된 발현 카세트는 서열번호 18에 기재된 CTCF 결합 부위 서열을 포함하는 하나 이상의 인슐레이터, 예를 들면, 서열번호 24 또는 서열번호 25를 포함하는 인슐레이터, 예컨대, 서열번호 1에 기재된 뉴클레오티드 서열을 가진 인슐레이터(즉, 인슐레이터 A1)(그러나, 이들로 한정되지 않음)를 포함한다. 다양한 비제한적 구현예들에서, 인슐레이터는 세포 게놈 내로 삽입되는 본 개시된 발현 카세트의 영역 내의 LTR들 중 하나 또는 둘 다 또는 다른 부위 내로 도입될 수 있거나 삽입될 수 있다. 한 구현예에서, 인슐레이터는 발현 카세트의 3' 말단에 위치한다. 한 구현예에서, 인슐레이터는 발현 카세트의 5' 말단에 위치한다. 한 구현예에서, 발현 카세트는 서열번호 1에 기재된 뉴클레오티드 서열을 가진 2개의 인슐레이터들을 포함하고, 이때 한 인슐레이터는 3' 말단에 위치하고 나머지 인슐레이터는 발현 카세트의 5' 말단에 위치한다.
본 개시된 인슐레이터는 강력한 인핸서 차단 활성을 가진다. 일부 구현예들에서, 인슐레이터는 인핸서 차단 활성 이외에 장벽 활성도 가진다. 본 개시된 인슐레이터는 삽입적 돌연변이유발의 위험 및 바이러스 벡터와 관련된 유전독성을 실질적으로 감소시킨다. 나아가, 본 개시된 인슐레이터가 벡터 내로 도입될 때, 상기 인슐레이터는 벡터의 바이러스 역가에 불리하게 영향을 미치지 않는다. 일부 구현예들에서, 인슐레이터(예를 들면, 인슐레이터 A1)는 글로빈 유전자 또는 이의 기능성 부분의 생체내 발현을 증가시킨다.
한정이 아니라 예시를 목적으로, 도 1 내지 4는 본 개시된 보호대상의 일부 구현예들에 따른 예시적 발현 카세트를 포함하는 재조합 벡터를 보여준다. 도 1은 860 bp HS2 영역(예를 들면, 서열번호 9에 기재된 뉴클레오티드 서열을 가진 HS2 영역), 1301 bp HS3 영역(예를 들면, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역), 및 1065 bp HS4 영역(예를 들면, 서열번호 7에 기재된 뉴클레오티드 서열을 가진 HS4 영역)을 포함하는 β-글로빈 LCR 영역에 작동가능하게 연결된 인간 βA-T87Q 글로빈 유전자를 포함하는 본 개시된 발현 카세트를 포함하는 재조합 벡터를 보여준다.
도 2는 본 개시된 보호대상의 한 구현예에 따른 발현 카세트를 포함하는 한 예시적 재조합 벡터를 보여준다. 도 2는 1.1 kb HS1 영역(예를 들면, 서열번호 2에 기재된 뉴클레오티드 서열을 가진 HS1 영역), 1301 bp HS3 영역(예를 들면, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역), 및 1065 bp HS4 영역(예를 들면, 서열번호 6에 기재된 뉴클레오티드 서열을 가진 HS4 영역)을 포함하는 β-글로빈 LCR 영역에 작동가능하게 연결된 인간 βA-T87Q 글로빈 유전자를 포함하는 본 개시된 발현 카세트를 포함하는 재조합 벡터를 보여준다.
도 3은 본 개시된 보호대상의 한 구현예에 따른 발현 카세트를 포함하는 한 예시적 재조합 벡터를 보여준다. 도 3은 602 bp HS1 영역(예를 들면, 서열번호 3에 기재된 뉴클레오티드 서열을 가진 HS1 영역), 1301 bp HS3 영역(예를 들면, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역), 및 446 bp HS4 영역(예를 들면, 서열번호 8에 기재된 뉴클레오티드 서열을 가진 HS4 영역)을 포함하는 β-글로빈 LCR 영역에 작동가능하게 연결된 인간 βA-T87Q 글로빈 유전자를 포함하는 본 개시된 발현 카세트를 포함하는 재조합 벡터를 보여준다.
도 4는 본 개시된 보호대상의 한 구현예에 따른 발현 카세트를 포함하는 한 예시적 재조합 벡터를 보여준다. 도 4는 1301 bp HS3 영역(예를 들면, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역), 및 1065 bp HS4 영역(예를 들면, 서열번호 6에 기재된 뉴클레오티드 서열을 가진 HS4 영역)을 포함하는 β-글로빈 LCR 영역에 작동가능하게 연결된 인간 βA-T87Q 글로빈 유전자를 포함하는 본 개시된 발현 카세트를 포함하는 재조합 벡터를 보여준다. 도 4에 표시된 발현 카세트는 하기 5개의 적혈구-특이적 인핸서들(도 4에서 "EE5"로서 표시됨)도 포함한다: 서열번호 13에 기재된 뉴클레오티드 서열을 가진 1개의 적혈구-특이적 인핸서, 서열번호 14에 기재된 뉴클레오티드 서열을 가진 1개의 적혈구-특이적 인핸서, 서열번호 15에 기재된 뉴클레오티드 서열을 가진 1개의 적혈구-특이적 인핸서, 서열번호 16에 기재된 뉴클레오티드 서열을 가진 1개의 적혈구-특이적 인핸서, 및 서열번호 17에 기재된 뉴클레오티드 서열을 가진 1개의 적혈구-특이적 인핸서.
도 1 내지 4에 표시된 바와 같이, 발현 카세트들 각각은 서열번호 1에 기재된 뉴클레오티드 서열을 가진 인슐레이터(즉, 인슐레이터 A1)를 포함한다. 추가로, 도 1 내지 4에 표시된 바와 같이, 발현 카세트들 각각은 인간 β-글로빈 유전자의 업스트림에 위치하는 879 bp 인간 β-글로빈 3' 인핸서를 포함한다. 나아가, 도 1 내지 4에 표시된 바와 같이, 발현 벡터들 각각은 벡터의 3' 긴 말단 반복부(LTR)(예를 들면, 3' LTR 내의 R 영역에 대해 3')에서 우드척 간염 후-조절 요소(WPRE) 및 소 성장 호르몬 폴리아데닐화 신호를 포함한다.
III. 벡터, 뉴클레아제 및 CRISPR-Cas 시스템
본 개시된 보호대상은 전술된 발현 카세트를 포함하는 벡터 및 전달 시스템(예를 들면, 비-천연 생성 또는 조작된 뉴클레아제 또는 CRISPR-Cas 시스템)을 제공한다. 상기 벡터 및 전달 시스템은 글로빈 유전자(예를 들면, 인간 β-글로빈)를 광범위한 표적 세포들의 게놈 내로 안정하게 도입하여 상기 세포에서 글로빈 단백질(인간 β-글로빈 단백질)의 발현을 증가시키는 데 적합한 전달 비히클이다.
일부 구현예들에서, 벡터는 전술된 발현 카세트를 숙주 세포(예를 들면, 조혈 줄기 세포, 배아 줄기 세포, 유도된 다분화능 줄기 세포 또는 조혈발생 내피 세포)의 게놈 내로 도입하거나 형질도입하는 데 사용되는 레트로바이러스(예를 들면, 감마레트로바이러스 또는 렌티바이러스) 벡터이다. 일부 구현예들에서, 레트로바이러스 벡터는 전술된 인슐레이터들 중 하나, 예를 들면, 인슐레이터 A1을 포함하는 발현 카세트를 포함한다. 인슐레이터는 발현 카세트의 3' 또는 5' 말단에 위치할 수 있다. 한 구현예에서, 인슐레이터는 발현 카세트의 3' 말단에 위치한다. 역전사 및 벡터 삽입 동안, 3' 말단에 위치하는 인슐레이터는 발현 카세트의 5' 말단 내로 카피된다. 생성된 위상기하학(topology)은 삽입된 바이러스의 5' LTR 및 3' LTR에 위치한 게놈 영역들 사이에 인슐레이터의 카피를 배치하고 5' LTR 및 내부 팩키지 프로모터로부터의 인핸서 활성을 함유하지만, 3' LTR에서 인핸서를 함유하지 않는다. 이 위상기하학은 유전독성을 감소시킴으로써, 종양 형성을 감소시킬 수 있고 동물 생존을 증가시킬 수 있다.
일부 구현예들에서, 재조합 벡터는 벡터의 3' 긴 말단 반복부(LTR)(예를 들면, 벡터의 3' LTR 내의 R 영역에 대해 3')에서 우드척 간염 후-조절 요소(WPRE)를 추가로 포함한다. 일부 구현예들에서, 재조합 벡터는 벡터의 3' 긴 말단 반복부(LTR)(예를 들면, 벡터의 3' LTR 내의 R 영역에 대해 3')에서 WPRE 이외에 소 성장 호르몬 폴리아데닐화 신호도 포함한다. 치료 글로빈 벡터의 본질적인 특징은 환자 세포의 효과적인 형질도입에 충분한 높은 역가를 달성하는 것이다. 글로빈 렌티바이러스 벡터들은 유전자, 프로모터, 인핸서 및/또는 LCR 요소를 포함하는 그들의 큰 적하물 때문에, 그들의 제조를 복잡하게 하고 그들의 임상 용도를 한정하는 낮은 역가라는 문제점을 본질적으로 가진다. 이 문제점은 벡터의 크기를 더 증가시키는, 추가 유전적 요소, 예컨대, 인슐레이터의 도입에 의해 더 악화된다. WPRE는 재조합 벡터의 역가를 증가시킬 수 있다. WPRE에의 소 성장 호르몬 폴리아데닐화 신호의 추가는 재조합 벡터의 역가를 더 증가시킬 수 있다. 일부 구현예들에서, WPRE 및 소 성장 호르몬 폴리아데닐화 신호는 발현 카세트 내에 포함되지 않으므로, 재조합 벡터로 형질도입된 세포에게 전달되지 않는다. 글로빈 렌티바이러스 벡터의 생성을 향상시키기 위한 이들 요소들의 도입은 보다 높은 역가의 제공 및 이로써 본원에 기재된 벡터의 임상 유용성에 필수적이다.
한 비제한적 예에서, 본 개시된 발현 카세트는 레트로바이러스 벡터 내로 클로닝될 수 있고, 발현은 그의 내생성 프로모터, 레트로바이러스 긴 말단 반복부 또는 대안적 내부 프로모터로부터 유도될 수 있다. 레트로바이러스 벡터와 적절한 팩키징 라인의 조합물도 적합하고, 이때 캡시드 단백질은 인간 세포를 감염시키는 데 작용할 것이다. PA12(Miller, et al. (1985) Mol. Cell. Biol. 5:431-437); PA317(Miller, et al. (1986) Mol. Cell. Biol. 6:2895-2902); 및 CRIP(Danos, et al. (1988) Proc. Natl. Acad. Sci. USA 85:6460-6464)를 포함하나 이들로 한정되지 않는 다양한 암포트로픽(amphotropic) 바이러스 생성 세포주들이 공지되어 있다. 비-암포트로픽 입자, 예를 들면, VSVG, RD114 또는 GALV 외피로 슈도타이핑된 입자 및 본 기술분야에서 공지된 임의의 다른 입자도 적합하다.
적합한 형질도입 방법은 예를 들면, 문헌(Bregni, et al. (1992) Blood 80:1418-1422)의 방법에 의한 세포와 생산자 세포의 직접적인 공-배양, 또는 예를 들면, 문헌(Xu, et al. (1994) Exp. Hemat. 22:223-230; and Hughes, et al. (1992) J. Clin. Invest. 89:1817)의 방법으로 적절한 성장 인자 및 다가양이온을 갖거나 갖지 않는 바이러스 상청액 단독 또는 농축된 벡터 스톡(stocks)을 사용하는 배양도 포함한다.
형질도입 바이러스 벡터는 숙주 세포(예를 들면, 조혈 줄기 세포, 배아 줄기 세포 또는 유도된 다분화능 줄기 세포)에서 글로빈 유전자(예를 들면, 인간 β-글로빈 유전자)를 발현하는 데 사용될 수 있다. 바람직하게는, 선택된 벡터는 고효율의 감염 및 안정한 삽입 및 발현을 나타낸다(예를 들면, 문헌[Cayouette et al., Human Gene Therapy (1997);8:423-430]; 문헌[Kido et al., Current Eye Research (1996);15:833-844]; 문헌[Bloomer et al., Journal of Virology (1997);71:6641-6649]; 문헌[Naldini et al., Science (1996);272:263-267]; 및 문헌[Miyoshi et al., Proc. Natl. Acad. Sci. U.S.A. 94:10319, 1997] 참조). 사용될 수 있는 다른 바이러스 벡터는 예를 들면, 아데노바이러스, 렌티바이러스 및 아데노 관련 바이러스 벡터, 백시니아 바이러스, 소 파필로마 바이러스 또는 헤르페스 바이러스, 예컨대, 엡스테인-바 바이러스를 포함한다(예를 들면, 문헌[Miller, Human Gene Therapy (1990);15-14]; 문헌[Friedman, Science (1989);244:1275-1281]; 문헌[Eglitis et al., BioTechniques 6:608-614, 1988]; 문헌[Tolstoshev et al., Current Opinion in Biotechnology (1990);1:55-61]; 문헌[Sharp, The Lancet (1991);337:1277-1278]; 문헌[Cornetta et al., Nucleic Acid Research and Molecular Biology (1987)36:311-322]; 문헌[Anderson, Science (1984);226:401-409]; 문헌[Moen, Blood Cells (1991);17:407-416]; 문헌[Miller et al., Biotechnology (1989);7:980-990]; 문헌[Le Gal La Salle et al., Science (1993);259:988-990]; 및 문헌[Johnson, Chest (1995);107:77S-83S]의 벡터들도 참조). 레트로바이러스 벡터가 특히 잘 개발되어 있고 임상 환경에서 사용되고 있다(Rosenberg et al., N. Engl. J. Med (1990);323:370; Anderson et al., 미국 특허 제5,399,346호).
효율적인 전달 및 삽입을 위한 요건은 레트로바이러스 벡터가 본 개시된 발현 카세트를 형질도입하는 데 적합하게 만든다. 레트로바이러스 벡터는 레트로비리대(retroviridae)의 3개 속들로부터 유도될 수 있다: γ-레트로바이러스(C-형 뮤린 레트로바이러스 또는 온코레트로바이러스로서도 공지되어 있음), 렌티바이러스 및 스푸마바이러스(포말 바이러스로서도 공지되어 있음). 복제-결함 레트로바이러스 입자의 생성을 위한 분자적 방법을 상세히 설명하는 여러 문헌들이 입수가능하다(Cornetta et al. (2005); Cockrell & Kafri (2007)). 치료 전이유전자 또는 cDNA를 암호화하는 벡터 그 자체는 팩키징 세포주에서의 바이러스 입자의 팩키징, 역전사 및 삽입을 가능하게 하는 데 필요한 최소한의 바이러스 서열을 보유한다. 팩키징 세포는 벡터 서열, 및 형질도입된 세포에서 그의 역전사 및 삽입에 필요한 기구를 함유하는 감염성 재조합 입자를 조립하는 데 요구되는 필수적인 구조 단백질들 및 효소들을 발현한다.
모든 레트로바이러스 벡터 유형들의 제조 양태가 동일한 일반적 원리를 따르지만, γ-레트로바이러스, 렌티바이러스 및 스푸마바이러스 벡터는 그들의 고유한 생물학적 성질들 중 일부에서 상이하다. 원형 뮤린 백혈병 바이러스(MLV)를 포함하는 감마-레트로바이러스는 많은 세포 유형들을 효과적으로 감염시키지만, 감염 후 즉시 S 기로 진행하지 않는 세포에서 삽입될 수 없다. 대조적으로, 렌티바이러스들 및 이들의 벡터 유도체들은 핵으로 전위하고 세포 분열의 부재 시 삽입되는 그들의 능력 때문에(Lewis & Emerman, 1994; Goff, 2001) 비-분열 세포를 형질도입할 수 있다(Follenzi & Naldini, 2002; Salmon & Trono, 2002). 렌티바이러스 벡터들의 또 다른 근본적인 특성은 글로빈 렌티바이러스 벡터에 대해 확립된 바와 같이(May et al., 2000) 그들의 상대적인 게놈 안정성이고, 이것은 MLV-기반 글로빈 벡터의 게놈 불안정성과 대비된다(Leboulch et al., 1994; Sadelain et al., 1995). 렌티바이러스 및 포말 벡터는 보다 더 우수한 팩키징 성능도 제공한다(Kumar et al., 2001; Rethwilm, 2007). 모든 3종의 벡터 유형들이 사이토카인에 의해 활성화된 HSC들의 형질도입을 위해 성공적으로 사용되고 있다(Miyoshi et al., 1999; Josephson et al., 2002; Leurs et al., 2003).
이들 3종의 벡터 시스템들은 그들의 삽입 패턴들에서 상이하다. 레트로바이러스의 삽입 패턴은 준무작위적(semi-random)이고 모든 삽입 사건들의 대략 3분의 2에서 유전자들 및 이들의 주변을 향해 편향되어 있다(Schroder et al., 2002; Wu et al., 2003; Mitchell et al., 2004; De Palma et al., 2005; Trobridge et al., 2006). 그러나, 이들의 정확한 분포에서 미묘한 및 가능하게는 유의한 차이가 있다. 감마-레트로바이러스는 전사된 유전자의 업스트림에서 삽입되는 경향을 가진 반면, 렌티바이러스 및 렌티바이러스 벡터는 전체 전사된 유전자 서열을 표적화한다. 포말 벡터는 유전자내 삽입의 경향이 더 낮은 듯하다(Trobridge et al., 2006). 한 구현예에서, 발현 카세트를 포함하는 벡터는 렌티바이러스 벡터이다. 상기 벡터는 인간 면역결핍-1(HIV-1), 인간 면역결핍-2(HIV-2), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV), 소 면역결핍 바이러스(BIV), 젬브라나(Jembrana) 질환 바이러스(JDV), 말 감염성 빈혈 바이러스(EIAV), 염소 관절염 뇌염 바이러스(CAEV) 등으로부터 유래될 수 있다. 한 비제한적 구현예에서, 렌티바이러스 벡터는 HIV 벡터이다. HIV-기반 구축물은 인간 세포의 형질도입 시 가장 효율적이다.
벡터 삽입의 준무작위적 패턴은 벡터가 인접 종양유전자를 트랜스-활성화시킬 때 환자를 삽입적 종양형성의 위험에 노출시킨다. 이것은 클론 증폭(Ott et al., 2006; Cavazzana-Calvo et al., 2010), 골수이형성증(Stein et al., 2010) 또는 백혈병(Hacein-Bey-Abina et al., 2003, 2008; Howe et al., 2008)을 초래할 수 있다. 비-천연 생성 또는 조작된 뉴클레아제(징크-핑거 뉴클레아제(ZFN), 메가뉴클레아제, 전사 활성화제-유사 이펙터 뉴클레아제(TALEN)를 포함하나 이들로 한정되지 않음) 또는 CRISPR-Cas 시스템을 사용하는 표적화된 유전자 전달 방법은 레트로바이러스 벡터의 사용에 본질적인 삽입적 종양형성이라는 우려를 감소시킬 수 있거나 심지어 제거할 수 있다.
진핵 세포는 DNA 이중 가닥 절단(DSB)에 반응하여 2종의 상이한 DNA 복구 기작들을 이용한다: 상동성 재조합(HR) 및 비-상동성 말단-연결(NHEJ). HR 복구 기구의 활성화는 세포 주기 상태에 의해 좌우되고, S 및 G2 기로 제한되고; 대조적으로, NHEJ 경로는 세포 주기 전체에서 활성 상태이다. 기작적으로, HR은 손상된 DNA 가닥을 복구하기 위해 상동성 주형을 요구하기 때문에 오류-부재 DNA 복구 기작이다. 다른 한편으로, NHEJ는 DNA 절단 부위에서 삽입 또는 결실을 유발하는 복구 동안의 DNA 말단 프로세싱으로 인해 부정확한 주형 독립적 복구 기작이다(Moynahan & Jasin, 2010). HR은 그의 상동성-기반 기작 때문에 상이한 종들의 게놈을 부위-특이적으로 조작하기 위한 수단으로서 사용되고 있다. 치료적 관점에서 볼 때, HR은 돌연변이된 유전자를 복구하는 데 성공적으로 사용되고 있으므로, 단일유전자성(monogenic) 질환의 세포-매개된 치료를 위한 기대되는 방법을 제공한다(Porteus et al., 2006).
HR에 의한 유전자 표적화는 관심있는 전이유전자/표적 부위를 플랭킹하는 2개의 상동성 아암들의 사용을 요구한다. 일반적으로, 표준 플라스미드 DNA들은 양성 선택 및 음성 선택을 위해 전이유전자와 함께 5 내지 10 kb의 상동성 아암을 전달하는 데 사용되고 있다. 이 방법은 마우스 배아 줄기(mES) 세포에서 유전자의 넉-아웃(knock-out)/넉-인(knock-in)에 통상적으로 사용된다(Capecchi, 2005; 도 2B). 인간 세포에서, 이 방법의 이용은 mES 세포에서의 효율보다 더 낮고 치료적으로 실용적이지 않은 대략 10-6의 효율로 유전자 표적화를 허용하였다. 특이적 희귀-절단 엔도뉴클레아제를 사용하여 표적 부위에서 DNA-이중 가닥 절단(DSB)을 도입하여 HR 효율을 증가시킴으로써, 정확한 유전자 표적화를 1,000배 이상 증가시킬 수 있다(Jasin, 1996). 이 현상의 발견은 상이한 종들의 게놈에서 부위-특이적 DSB를 생성하는 방법의 개발을 촉진하였다. 지난 십년에 걸쳐 이 목적을 위해 다양한 키메라 효소들, 즉 징크-핑거 뉴클레아제(ZFN), 메가뉴클레아제 및 전사 활성화제-유사 이펙터 뉴클레아제(TALEN)가 설계되었다.
ZFN은 ZF-기반 DNA 결합 도메인(DBD) 및 FokI 뉴클레아제 도메인을 함유하는 모듈식 키메라 단백질이다(Porteus & Carroll, 2005). DBD는 통상적으로 3-염기쌍 특이성을 각각 가진 3개의 ZF 도메인들로 구성되고; FokI 뉴클레아제 도메인은 2개의 플랭킹 ZFN들에 의해 표적화되는 DNA 닉킹(nicking) 활성을 제공한다. DBD의 모듈식 성질 때문에, 원칙적으로 게놈 내의 임의의 부위가 표적화될 수 있다. 그러나, 단일 ZFN이 DNA에 결합할 수 있고 DNA를 닉킹할 수 있기 때문에, 삽입/결실을 도입할 수 있거나 비-특이적 방식으로 표적화 벡터를 삽입할 수 있는 NHEJ 경로의 활성화를 야기하는, 다수의 탈-표적(off-target) 효과에 대한 잠재력이 있다. 이종이량체를 형성할 때에만 그들 각각의 DNA 가닥을 닉킹할 수 있는 필수적인 FokI 도메인들은 최근에 보고되었다(Doyon et al., 2011). 이러한 필수적인 ZFN들의 사용은 이 방법의 유전독성 효과를 감소시킬 수 있다.
메가뉴클레아제(MN)/귀소 엔도뉴클레아제(HE)는 진핵 게놈에서 낮은 절단 빈도로 큰 DNA 부위(14-40 bp)를 인식하고 절단하는 dsDNA 뉴클레아제이다(Paques & Duchateau, 2007). 이것은 잠재적인 표적 부위를 한정하지만, MN-DNA 구조물은 MN 특이성을 바꾸기 위해 DNA-상호작용 잔기를 특이적으로 변경시키기 위한 가이드로서 사용되고 있다(Marcaida et al., 2010). I-CreI는 인간 XPC 및 RAG1 유전자를 표적화하는 키메라 메가뉴클레아제를 생성하도록 성공적으로 조작되었고, 분명한 유전독성 없이 포유동물 세포에서 HR 활성을 자극하는 것으로 밝혀졌다(Redondo et al., 2008; Grizot et al., 2009). 이 방법의 유전독성은 ZFN 및 TALE 뉴클레아제의 유전독성과 비교될 필요가 있을 것이다.
TALEN은 DBD가 식물병원성 세균에 의해 사용되는 병독성 인자인 전사 활성화제-유사 이펙터(TALE)로부터 유래된다는 점을 제외하고 ZFN과 유사하다(Herbers, 1992). TALE DBD는 모듈식이고 34-잔기 반복부로 구성되고, 그의 DNA 특이성은 반복부의 수 및 순서에 의해 결정된다(Herbers, 1992). 각각의 반복부는 2개의 잔기만을 통해 표적 서열에서 단일 뉴클레오티드에 결합한다(Boch, 2011). ZFN 기술에 비해 장점은 DBD의 빠른 구축이다.
다수의 연구들이 이들 키메라 효소들을 사용하여 그들의 표적 부위에서 유전자 추가 또는 유전자 복구를 위한 HR을 자극하였다(Paques & Duchateau, 2007; Urnov et al., 2010). 포르테우스(Porteus)는 겸상 세포 돌연변이 뉴클레오티드를 둘러싸는 인간 HBB로부터 절반 부위 서열에 대한 ZFN을 디자인하였다(Porteus, 2006). 이 ZFN은 상기 서열을 표적화하고 Zif268 결합 부위를 표적화하는 ZFN과 조합될 때 키메라 DNA 표적에서 HR을 자극한다. 제대혈 CD34+ 세포에서 유전자를 표적화하는 데 있어서 최근에 진보가 있었다. CCR5 유전자를 표적화하기 위해 이들 세포들에서 ZFN 및 공여자 DNA를 전달하기 위한 비-삽입 렌티바이러스의 사용은 문헌(Lombardo et al., 2007)에 보고되었다. 문헌(Lombardo et al., 2007)은 양성적으로 선택된 세포의 80%에서 정확한 표적화와 함께 이 좌위에서의 유전자 추가를 보여주었다.
최근에 개시된 보호대상은 전술된 바와 같이 본 개시된 발현 카세트를 포함하는 비-천연 생성 또는 조작된 뉴클레아제를 제공한다. 적합한 뉴클레아제는 ZFN, 메가뉴클레아제 및 TALEN을 포함하나 이들로 한정되지 않는다. 본 개시된 뉴클레아제는 DNA 결합 도메인 및 뉴클레아제 절단 도메인을 포함한다. 뉴클레아제의 DNA 결합 도메인은 선택된 서열, 예를 들면, 소정의 부위에 결합하도록 조작될 수 있다. 조작된 DNA 결합 도메인은 천연 생성 뉴클레아제에 비해 상이한 결합 특이성을 가질 수 있다. 조작 방법은 합리적인 설계 및 다양한 유형의 선택을 포함하나 이들로 한정되지 않는다. 임의의 적합한 절단 도메인은 DNA 결합 도메인에 작동가능하게 연결되어 뉴클레아제를 형성할 수 있다. 예를 들면, 징크-핑거 단백질(ZFP) DNA 결합 도메인은 뉴클레아제 절단 도메인에 융합되어, 그의 조작된 ZFP DNA 결합 도메인을 통해 그의 의도된 핵산 표적을 인식할 수 있고 DNA가 뉴클레아제 활성을 통해 ZFP 결합 부위 근처에서 절단되게 할 수 있는 ZFNs-a 기능성 물질을 생성할 수 있다. 예를 들면, 문헌[Kim et al. Proc Nat'l Acad Sci USA (1996);93(3):1156-1160]을 참조한다. 마찬가지로, TALE DNA 결합 도메인은 뉴클레아제 절단 도메인에 융합되어 TALEN을 생성할 수 있다. 예를 들면, 미국 특허출원 공보 제20110301073호를 참조한다.
절단 도메인은 DNA 결합 도메인에 대한 이종성을 가질 수 있다(예를 들면, 메가뉴클레아제 DNA 결합 도메인 및 상이한 뉴클레아제로부터의 절단 도메인). 이종 절단 도메인은 임의의 엔도뉴클레아제 또는 엑소뉴클레아제로부터 수득될 수 있다. 절단 도메인의 기원이 될 수 있는 예시적 엔도뉴클레아제는 제한 엔도뉴클레아제 및 귀소 엔도뉴클레아제를 포함하나 이들로 한정되지 않는다. 예를 들면, 문헌[2002-2003 Catalog, New England Biolabs, Beverly, Mass.]; 및 문헌[Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388]을 참조한다. DNA를 절단하는 추가 효소는 공지되어 있다(예를 들면, S1 뉴클레아제; 녹두 뉴클레아제; 췌장 DNase I; 마이크로코칼 뉴클레아제; 효모 HO 엔도뉴클레아제; 문헌[Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993] 또한 참조). 이들 효소들(또는 이들의 기능성 영역들) 중 하나 이상은 절단 도메인 및 절단 절반-도메인의 공급원으로서 사용될 수 있다.
유사하게, 절단 절반-도메인은 절단 활성을 위해 이량체화를 요구하는 상기 뉴클레아제로부터 유래될 수 있다. 일반적으로, 융합 단백질이 절단 절반-도메인을 포함하는 경우 2개의 융합 단백질들이 절단을 위해 요구된다. 대안적으로, 2개의 절단 절반-도메인들을 포함하는 단일 도메인이 사용될 수 있다. 2개의 절단 절반-도메인들은 동일한 엔도뉴클레아제(또는 이의 기능성 부분)로부터 유래될 수 있거나, 각각의 절단 절반-도메인은 상이한 엔도뉴클레아제(또는 이의 기능성 부분)로부터 유래될 수 있다.
일부 구현예들에서, 뉴클레아제는 전술된 인슐레이터들 중 2개의 인슐레이터들, 예를 들면, 서열번호 1에 기재된 뉴클레오티드 서열을 가진 2개의 인슐레이터들을 포함하는 발현 카세트를 포함한다. 상기 2개의 인슐레이터들 중 하나는 발현 카세트의 3' 말단에 위치하고, 나머지 인슐레이터는 발현 카세트의 5' 말단에 위치한다.
본 개시된 보호대상은 상기 발현 카세트를 포함하는 비-천연 생성 또는 조작된 CRISPR-Cas 시스템도 제공한다. CRISPR(밀집된 규칙적으로 산재된 짧은 팔린드로믹 반복부(Clustered Regularly Interspaced Short Palindromic Repeats))-Cas (CRISPR 관련) 시스템은 게놈 조작을 위해 사용될 수 있는 세균 시스템을 기반으로 하는 조작된 뉴클레아제 시스템이다. 이것은 많은 세균들 및 고세균들의 후천성 면역 반응의 부분을 기반으로 한다. 바이러스 또는 플라스미드가 세균을 침입할 때, 침입자의 DNA의 분절은 "면역" 반응에 의해 CRISPR RNA(crRNA)로 전환된다. 그 다음, crRNA는 부분적 상보성의 영역을 통해 tracrRNA로서 지칭되는 또 다른 유형의 RNA와 회합하여, CRISPR-Cas 뉴클레아제를 "프로토 스페이서"로서 지칭되는 표적 DNA에서 crRNA와 상동한 영역으로 안내한다. CRISPR-Cas 뉴클레아제는 crRNA 전사체 내에 함유된 20-뉴클레오티드 가이드 서열에 의해 특정된 부위에서 DSB에서 블런트 말단을 생성하도록 DNA를 절단한다. CRISPR-Cas 뉴클레아제는 부위-특이적 DNA 인식 및 절단을 위해 crRNA 및 tracrRNA 둘 다를 요구한다. 이 시스템은 crRNA 및 tracrRNA가 한 분자("단일 가이드 RNA")로 조합될 수 있도록 조작되어 있고; 단일 가이드 RNA의 crRNA 등가 부분은 CRISPR-Cas 뉴클레아제를 안내하여 임의의 원하는 서열을 표적하도록 조작될 수 있다(문헌[Jinek et al., Science (2012);337:816-821] 참조). 따라서, CRISPR-Cas 시스템은 게놈 내의 원하는 표적에서 DSB를 생성하도록 조작될 수 있다. 일부 구현예들에서, CRISPR-Cas 시스템은 CRISPR-Cas 뉴클레아제 및 단일 가이드 RNA를 포함한다. CRISPR-Cas 뉴클레아제의 적합한 예는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로서도 공지되어 있음), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, 이들의 상동체, 또는 이들의 변경된 버전들을 포함하나 이들로 한정되지 않는다. 이들 CRISPR-Cas 뉴클레아제들은 공지되어 있고; 예를 들면, 스트렙토코커스 피오게네스(S. pyogenes) Cas9 단백질의 아미노산 서열은 접근번호 Q99ZW2 하에 스위스프롯(SwissProt) 데이터베이스에서 발견될 수 있다. 일부 구현예들에서, CRISPR-Cas 뉴클레아제는 DNA 절단 활성, 예를 들면, Cas9를 가진다. 일부 구현예들에서, CRISPR-Cas 뉴클레아제는 Cas9이다. CRISPR-Cas 뉴클레아제는 표적 서열의 위치(예를 들면, 게놈 세이프 하버 부위)에서 가닥들 중 하나 또는 둘 다를 직접적으로 절단할 수 있다. 추가로, CRISPR-Cas 뉴클레아제는 표적 서열의 첫 번째 또는 마지막 뉴클레오티드로부터 약 1개, 2개, 3개, 4개, 5개, 6개, 7개, 8개, 9개, 10개, 15개, 20개, 25개, 50개, 100개, 200개 또는 500개 이상의 염기쌍들 내에서 가닥들 중 하나 또는 둘 다를 직접적으로 절단할 수 있다.
본 개시된 뉴클레아제 및 CRISPR-Cas 시스템은 발현 카세트의 표적화된 전달을 가능하게 한다. 일부 구현예들에서, 본 개시된 CRISPR-Cas 시스템 또는 본 개시된 뉴클레아제의 DNA 결합 도메인은 게놈 세이프 하버 부위에 결합한다. 뉴클레아제 또는 CRISPR-Cas 시스템은 게놈 세이프 하버 부위에서 이중 가닥 절단을 생성한다. 게놈 세이프 하버 부위는 숙주 세포 또는 유기체에 불리한 영향을 미치지 않으면서 새로 삽입된 DNA의 예측가능한 발현을 수용할 수 있는 인간 게놈의 유전자내 또는 유전자외적 영역이다. 유용한 세이프 하버는 원하는 수준의 벡터-코딩된 단백질 또는 비-코딩 RNA를 제공하기에 충분한 전이유전자 발현을 허용해야 한다. 게놈 세이프 하버 부위는 세포가 악성 형질전환에 취약하지 않게 해야 하고 세포 기능도 변경시키지 않아야 한다. 게놈 세이프 하버 부위를 확인하는 방법은 전체로서 참고로 도입되는 문헌[Sadelain et al., "Safe Harbours for the integration of new DNA in the human genome," Nature Reviews (2012);12:51-58; Papapetrou et al., "Genomic safe harbors permit high β-globin transgene expression in thalassemia induced pluripotent stem cells" Nat Biotechnol. (2011) Jan;29(1):73-8]에 기재되어 있다. 본 개시된 게놈 세이프 하버 부위는 하기 5개의 기준들 중 하나 이상(1개, 2개, 3개, 4개 또는 5개)을 충족시킨다: (ⅰ) 임의의 유전자의 5' 말단(예를 들면, 유전자의 5' 말단)으로부터 적어도 50 kb의 거리, (ⅱ) 임의의 암 관련 유전자로부터 적어도 300 kb의 거리, (ⅲ) (천연 또는 조작된 뉴클레아제를 사용한 DNA 절단에 의해 측정된) 개방된/접근가능한 염색질 구조 내부에 위치, (ⅳ) 유전자 전사 유닛 외부에 위치, 및 (ⅴ) 인간 게놈의 초보존된 영역(UCR), microRNA 또는 긴 비-코딩 RNA 외부에 위치. 가장 흔한 삽입적 종양형성 사건은 인접 종양-촉진 유전자들의 트랜스활성화이기 때문에, 처음 2개 기준들은 유전자, 특히 인간 암에 기능적으로 관여된 유전자 또는 모델 유기체에서 암에 관여된 유전자의 인간 상동체인 암 관련 유전자의 프로모터 근처에 위치한 인간 게놈의 부분을 배제한다. miRNA 유전자에의 인접성은 miRNA가 세포 증식 및 분화를 포함하는 많은 세포 과정들의 조절에 관여하기 때문에 한 배제 기준이다. 전사 유닛 내의 벡터 삽입은 종양 억제제 유전자의 기능 상실 또는 비정상적으로 스플라이싱된 유전자 생성물의 생성을 통해 유전자 기능을 파괴할 수 있기 때문에, 네 번째 (ⅳ) 기준은 전사된 유전자 내부에 위치하는 모든 부위들을 배제한다. 다수의 척추동물들에 걸쳐 고도로 보존되어 있고 인핸서 및 엑손이 풍부한 것으로 공지되어 있는 영역인 UCR, 및 긴 비-코딩 RNA도 배제된다. 일부 구현예들에서, 게놈 세이프 하버 부위는 유전자외적 게놈 세이프 하버 부위이다. 일부 구현예들에서, 게놈 세이프 하버 부위는 염색체 1 상에 위치한다.
본 개시된 보호대상은 전술된 뉴클레아제를 암호화하는 폴리뉴클레오티드, 전술된 뉴클레아제를 암호화하는 폴리뉴클레오티드를 포함하는 벡터, 전술된 CRISPR-Cas 시스템을 암호화하는 폴리뉴클레오티드, 및 전술된 CRISPR-Cas 시스템을 암호화하는 폴리뉴클레오티드를 포함하는 벡터도 제공한다.
뉴클레아제 및 이 뉴클레아제를 암호화하는 폴리뉴클레오티드, 및 CRISPR-Cas 시스템 및 이 CRISPR-Cas 시스템을 암호화하는 폴리뉴클레오티드는 임의의 적합한 수단에 의해 생체내 또는 생체외 전달될 수 있다. 예를 들면, 본원에 기재된 뉴클레아제 및 CRISPR-Cas 시스템은 상기 뉴클레아제 또는 CRISPR-Cas 시스템을 암호화하는 폴리뉴클레오티드를 포함하는 벡터에 의해 세포(예를 들면, 조혈 줄기 세포, 배아 줄기 세포, 유도된 다분화능 줄기 세포, 또는 조혈발생 내피 세포)에게 전달될 수 있다. 플라스미드 벡터, 레트로바이러스 벡터(예를 들면, γ-레트로바이러스 벡터, 렌티바이러스 벡터 및 포말 바이러스 벡터), 아데노바이러스 벡터, 폭스바이러스 벡터, 헤르페스 바이러스 벡터 및 아데나 관련 바이러스 벡터 등을 포함하나 이들로 한정되지 않는 임의의 벡터가 사용될 수 있다. 한 구현예에서, 전술된 뉴클레아제 또는 전술된 CRISPR-Cas 시스템을 암호화하는 폴리뉴클레오티드를 포함하는 벡터는 렌티바이러스 벡터이다. 한 특정 구현예에서, 렌티바이러스 벡터는 비-삽입 렌티바이러스 벡터이다. 비-삽입 렌티바이러스 벡터의 예는 문헌[Ory et al. (1996) Proc. Natl. A cad. Sci. USA 93:11382-11388]; 문헌[Dull et al., (1998) J. Viral.72:8463-8471]; 문헌[Zuffery et al. (1998) J. Viral. 72:9873-9880]; 문헌[Follenzi et al., (2000) Nature Genetics 25:217-222]; 및 미국 특허출원 공보 제2009/054985호에 기재되어 있다.
추가로, 비-바이러스 방법도 세포에서 글로빈 유전자를 발현시키는 데 이용될 수 있다. 예를 들면, 핵산 분자는 리포펙션의 존재 하에서 핵산의 투여 (Feigner et al., Proc. Natl. Acad. Sci. U.S.A. 84:7413, 1987; Ono et al., Neuroscience Letters 17:259, 1990; Brigham et al., Am. J. Med. Sci. 298:278, 1989; Staubinger et al., Methods in Enzymology 101:512, 1983), 아시알로오로소뮤코이드-폴리라이신(asialoorosomucoid-polylysine) 접합(Wu et al., Journal of Biological Chemistry 263:14621, 1988; Wu et al., Journal of Biological Chemistry 264:16985, 1989), 또는 수술적 조건 하에서의 마이크로-주입(Wolff et al., Science 247:1465, 1990)에 의해 세포 내로 도입될 수 있다. 유전자 전달을 위한 다른 비-바이러스 수단은 인산칼슘, DEAE 덱스트란, 전기천공 및 원생동물 융합을 이용한 시험관내 형질감염을 포함한다. 리포좀도 DNA를 세포 내로 전달하는 데 잠재적으로 유리할 수 있다. 대상체의 영향받은 조직 내로의 정상 유전자의 이식도 정상 핵산을 생체외에서 배양가능한 세포 유형(예를 들면, 자가 또는 이종 일차 세포 또는 이의 자손) 내로 전달함으로써 달성될 수 있고, 그 후 상기 세포(또는 그의 자손)는 표적화된 조직 내로 주입되거나 전신적으로 주입된다. 트랜스포자제(transposases)를 사용하여 재조합 수용체도 유도할 수 있거나 수득할 수 있다. 일시적 발현은 RNA 전기천공에 의해 수득될 수 있다.
Ⅳ. 세포
세포(예를 들면, 조혈 줄기 세포, 배아 줄기 세포, 유도된 다분화능 줄기 세포, 및 조혈발생 내피 세포)의 유전적 변경은 실질적으로 균질한 세포 조성물을 재조합 DNA 또는 RNA 구축물(예를 들면, 전술된 발현 카세트를 포함하는 벡터 또는 전달 시스템)로 형질도입함으로써 달성될 수 있다. 본 개시된 보호대상은 전술된 발현 카세트로 형질도입된 세포, 전술된 벡터로 형질도입된 세포, 전술된 뉴클레아제 또는 이 뉴클레아제를 암호화하는 폴리뉴클레오티드를 포함하는 벡터로 형질도입된 세포, 및 전술된 CARISPR-Cas 시스템 또는 이 CARISPR-Cas 시스템을 암호화하는 폴리뉴클레오티드를 포함하는 벡터로 형질도입된 세포(이들은 "형질도입된 세포"로서 총칭됨)를 제공한다. 전술된 바와 같이, 상기 벡터, 뉴클레아제 및 CRISPR-Cas 시스템은 발현 카세트를 세포 내로 형질도입하여 글로빈 유전자(예를 들면, 인간 β-글로빈 유전자)를 발현시키는 데 사용된다. 일부 구현예들에서, 형질도입된 세포는 조혈 질환, 장애 또는 상태를 치료하고/하거나 예방하기 위해 대상체에게 투여된다. 본 개시된 인슐레이터는 세포 내로의 발현 카세트의 형질도입의 효율을 향상시킬 수 있다.
적합한 형질도입된 세포는 줄기 세포, 조상 세포 및 분화된 세포를 포함하나 이들로 한정되지 않는다. 본원에서 사용된 바와 같이, 용어 "조상" 또는 "조상 세포"는 자가-재생하고 더 성숙한 세포로 분화하는 능력을 가진 세포를 지칭한다. 조상 세포는 다분화능 줄기 세포 및 분화다능성 줄기 세포에 비해 감소된 효능을 가진다. 많은 조상 세포들이 단일 계통을 따라 분화하지만, 꽤 광범위한 증식 능력도 가질 수 있다.
일부 구현예들에서, 형질도입된 세포는 줄기 세포이다. 줄기 세포는 생체내 특정 생물학적 적소에 투여될 때 적절한 세포 유형으로 분화하는 능력을 가진다. 줄기 세포는 (1) 장기간 자가-재생할 수 있거나 원래의 세포의 하나 이상의 동일한 카피를 생성할 수 있고, (2) 단일 세포 수준에서 다수의 전문화된 세포 유형 및 일부 경우 단지 하나의 전문화된 세포 유형으로 분화할 수 있고, (3) 생체내에서 조직을 기능적으로 재생시킬 수 있는 미분화된 세포이다. 줄기 세포는 그들의 발달 잠재력에 따라 분화전능성, 다분화능, 분화다능성 및 올리고/단분화능으로서 하위-분류된다. 본원에서 사용된 바와 같이, 용어 "다분화능"은 신체 또는 체세포(즉, 적절한 배아)의 모든 계통들을 형성하는 세포의 능력을 의미한다. 예를 들면, 배아 줄기 세포는 3종의 배엽들, 즉 외배엽, 중배엽 및 내배엽 각각으로부터 세포를 형성할 수 있는 다분화능 줄기 세포의 일종이다. 본원에서 사용된 바와 같이, 용어 "분화다능성"은 한 계통의 다수의 세포 유형들을 형성하는 성체 줄기 세포의 능력을 지칭한다. 예를 들면, 조혈 줄기 세포는 혈액 세포 계통의 모든 세포들, 예를 들면, 림프 및 골수 세포들을 형성할 수 있다.
일부 구현예들에서, 형질도입된 세포는 배아 줄기 세포, 골수 줄기 세포, 제대 줄기 세포, 태반 줄기 세포, 중간엽 줄기 세포, 신경 줄기 세포, 간 줄기 세포, 췌장 줄기 세포, 심장 줄기 세포, 신장 줄기 세포 및/또는 조혈 줄기 세포이다. 한 구현예에서, 형질도입된 세포는 조혈 줄기 세포(HSC)이다. HSC는 유기체의 수명에 걸쳐 성숙 혈액 세포의 전체 레퍼토리를 생성할 수 있는 수임(committed) 조혈 조상 세포(HPC)를 발생시킨다. 용어 "조혈 줄기 세포" 또는 "HSC"는 골수(예를 들면, 단핵세포 및 대식세포, 호중구, 호염기구, 호산구, 적혈구, 거핵세포/혈소판, 수지상 세포) 및 림프 계통(예를 들면, T-세포, B-세포, NK-세포)을 포함하는, 유기체의 모든 혈액 세포 유형들을 발생시키는 분화다능성 줄기 세포를 지칭한다. 조혈 줄기 세포 및 조상 세포는 치사량의 방사선을 조사받은 동물 또는 인간 내로 이식될 때 적혈구, 호중구-대식세포, 거핵세포 및 림프 조혈 세포 풀을 재증식시킬 수 있다.
HSC는 골수, 제대혈 또는 말초혈로부터 단리될 수 있거나 채취될 수 있다. HSC는 특정 표현형적 또는 유전형적 마커들에 따라 확인될 수 있다. 예를 들면, HSC들은 그들의 작은 크기, 계통(lin) 마커의 결여, 생염료(vital dye), 예컨대, 로다민 123(롤로(rholo)로서도 지칭되는 로다민DULL) 또는 헥스트(Hoechst) 33342를 사용한 낮은 염색(부집단), 및 그들의 표면 상의 다양한 항원성 마커들(이들 중 대다수는 분화 시리즈(예를 들면, CD34, CD38, CD90, CD133, CD105, CD45, Terl 19, 및 c-kit, 줄기 세포 인자에 대한 수용체)의 클러스터에 속함)의 존재에 의해 확인될 수 있다. 한 구현예에서, 형질도입된 세포는 CD34+ HSC이다.
한 구현예에서, 형질도입된 세포는 배아 줄기 세포이다. 또 다른 구현예에서, 형질도입된 세포는 유도된 다분화능 줄기 세포이다. 또 다른 구현예에서, 형질도입된 세포는 조혈발생 내피 세포이다.
HSC들은 장기간 조혈을 회복시키기 위한 천연 비히클이지만, 이들의 사용은 일부 중요한 한계들을 가진다. 첫 번째는 채취된 세포 생성물이 너무 작을 때 궁극적으로 자가 HSC 요법을 불가능하게 할 수 있는 그들의 상대적인 부족이다. 두 번째는 성체 HSC들이 시험관내에서 복제될 수 없기 때문에 생물안전성 검사, 예컨대, 삽입 부위 분석을 수행하기 어렵고 결과적으로 선택된 삽입 부위를 가진 세포를 선택하기 어렵다는 것이다. 세 번째 한계는 현재의 기술을 이용한 상동성 재조합이 사실상 불가능하여, 유전자 보정의 출현을 위태롭게 한다는 점이다. 모든 이들 한계점들은 궁극적으로 성체 HSC들이 그들의 줄기 세포 능력을 상실하지 않으면서 시험관내에서 증폭될 수 없다는 사실에 기인한다. 이들 한계점들은 안정한 유전자 전달을 달성하는 데 있어서 현저히 신속하고 효율적인 바이러스 벡터, 예컨대, 감마-레트로바이러스 및 렌티바이러스 벡터의 엄청난 중요성을 설명한다. 이것은 한정된 양으로만 사용될 수 있는 HSC들을 다룰 때 필수적이다.
글로빈 유전자 요법을 위한 ES 및 유도된 다분화능 줄기(iPS) 세포의 용도는 문헌[Moi et al., Haematol March 1, 2008;93(3):325-330]에 개시되어 있다. 배아 줄기(ES) 세포는 유전자 표적화 및 보정을 받을 수 있고, 이것은 분화다능성을 상실하지 않으면서 한정되지 않은 시험관내 세포 분열을 요구한다. 문헌[Chang et al., Proc Natl Acad Sci USA 2006;103:1036-40]은 겸상 세포 빈혈을 가진 마우스에서 상동성 재조합 방법의 실행가능성의 원리 증거를 제공하였다. 문헌[Takahashi et al. Cell 2006;126:663-76]은 배아 줄기-유사 상태로의 섬유모세포의 성공적인 재프로그래밍을 보고하였다. 이 역-분화 과정에 의해 수득된 세포(유도된 다분화능 줄기(iPS) 세포로서 지칭됨)는 배아 또는 어린 성체 대용량 섬유모세포 배양물을, 배아 줄기 세포에서 생리학적으로 활성을 나타내지만 분화가 진행될 때 일반적으로 꺼져 있는 4종의 전사 인자들을 암호화하는 감마-레트로바이러스 벡터에 노출시킴으로써 생성되었다. 배양된 세포는 ES 세포 콜로니와 유사한 콜로니를 형성하였다. 이들 발견들은 다른 연구진들에 의해 확인되었고 마우스 섬유모세포 및 인간 섬유모세포 둘 다로 확장되었다(Meissner et al., Nat Biotechnol 2007;25:1177-81; Nakagawa et al., Nat Biotechnol 2007;26:101-6; Okita et al., Nature 2007; 448:313-7; Park et al., Nature 2007;451:141-6; Takahashi et al., Nat Protoc 2007;2:3081-9; Takahashi K et al., Cell 2007;131:861-72; Wernig et al., Nature 2007;448:318-24; Yu J et al., Science 2007;318: 1917-20). 루돌프 예니쉬(Rudolf Jaenisch)와 그의 동료들은 ES-유사 iPS 세포에서 상동성 재조합을 이용하여 겸상 세포 질환의 마우스 모델에서 성공적인 유전자 요법을 달성하였다(Hanna et al., Science 2007;318:1920-3). 상기 과정은 지금까지 피부 생검으로부터 채취된 섬유모세포에 주로 적용되어 왔고, 그 후 상기 섬유모세포는 4종의 줄기 세포 전사 인자들을 암호화하는 레트로바이러스 벡터를 사용한 형질도입에 의해 iPS가 되도록 유도된다. iPS는 표준 상동성 재조합 기법에 의한 SC 돌연변이의 보정을 받을 수 있고, 그 후 시험관내에서 한정되지 않은 양의 조혈 줄기 세포로 분화될 수 있다. 전체 과정은 그의 SC 질환을 치유받을 원래의 마우스 공여자 내로의 보정된 HSC의 자가 이식으로 종결된다. 이 기법은 상동성 재조합에 유용할 뿐만 아니라, 세포를 수용자 내로 주입하기 전에 상세한 삽입 부위 분석 및 적절한 시험관내 세포 증폭을 수행하기 위한 수단을 제공함으로써 β-지중해빈혈의 치료를 위한 렌티바이러스-매개된 글로빈 유전자 전달도 향상시킬 수 있다.
본 개시된 보호대상의 세포는 자가("자신") 또는 비-자가("비-자신", 예를 들면, 동종이계, 동계 또는 이종) 세포일 수 있다. 본원에서 사용된 바와 같이, "자가"는 동일한 대상체로부터의 세포를 지칭한다. 본원에서 사용된 바와 같이, "동종이계"는 비교되는 세포와 유전적으로 상이한 동일한 종의 세포를 지칭한다. 본원에서 사용된 바와 같이, "동계"는 비교되는 세포와 유전적으로 동일한 상이한 대상체의 세포를 지칭한다. 본원에서 사용된 바와 같이, "이종"은 비교되는 세포와 상이한 종의 세포를 지칭한다. 일부 구현예들에서, 세포는 자가 세포이고, 예를 들면, 본 개시된 발현 카세트로 형질도입된 세포는 그 세포가 채취된 대상체에게 투여되고, 예를 들면, 상기 세포는 상기 대상체의 골수, 제대혈, 말초혈 및/또는 지방 조직으로부터 채취된다. 일부 구현예들에서, 세포는 대상체의 골수로부터 수득되거나 채취된다.
일부 구현예들에서, 발현 카세트를 사용한 형질도입 전, 세포는 예를 들면, 하나 이상의 사이토카인(예를 들면, IL-3, IL-1α, IL-6, Kit 리간드("줄기 세포 인자(SCF)"로서도 공지되어 있음), 및 Flt-3 리간드), 및/또는 하나 이상의 당단백질(예를 들면, 쓰롬보포이에틴 및 피브로넥틴)의 존재 하에서 미리 자극된다. 한 비제한적 예에서, 세포는 Flt-3 리간드, SCF, 쓰롬보포이에틴, 인터류킨-3 및 피브로넥틴의 존재 하에서 미리 자극된다. 세포는 약 24시간 이상, 예를 들면, 약 48시간 또는 약 36시간 동안 미리 자극될 수 있다. 그 후, 세포는 본 개시된 발현 카세트, 또는 이러한 발현 카세트를 포함하는 벡터 또는 또 다른 전달 시스템으로 형질도입된다. 형질도입은 새로 채취된 세포 또는 동결된 세포에 대해 수행될 수 있다. 예를 들면, 서던 블롯 분석 및/또는 정량 PCR로 벡터 카피 수를 측정하고 삽입 부위 또는 삽입된 벡터 구조를 분석하기 위해 세포의 게놈 DNA를 단리한다. 글로빈 mRNA의 정량(예를 들면, 인간 β-글로빈 전이유전자 분석)을 위해, 세포로부터 총 RNA를 추출한다. 글로빈 mRNA의 정량을 위해 정량적 프라이머 연장 분석을 이용할 수 있다.
Ⅴ. 조성물 및 제제
본 개시된 보호대상은 전술된 바와 같은 본 개시된 형질도입된 세포 및 약학적으로 허용가능한 담체를 포함하는 약학 조성물을 제공한다. 본원에서 사용된 바와 같이, "약학적으로 허용가능한 담체"는 약학적으로 허용가능한 세포 배양 배지를 포함하는, 생리학적으로 상용가능한 임의의 모든 용매들, 분산 매질, 코팅제, 항균제 및 항진균제, 등장제 및 흡수 지연제 등을 포함한다. 약학적으로 허용가능한 담체는 비경구(예를 들면, 정맥내, 근육내, 피하 또는 복강내), 척추 또는 표피 투여(예를 들면, 주사, 주입 또는 이식에 의한 투여)에 적합할 수 있다. 투여 경로에 따라, 활성 화합물, 예를 들면, 형질도입된 세포는 상기 화합물을 불활성화시킬 수 있는 산의 작용 및 다른 천연 조건으로부터 상기 화합물을 보호하기 위한 물질로 코팅될 수 있다.
약학적으로 허용가능한 담체는 멸균 수성 용액 또는 분산액, 및 멸균 주사가능한 용액 또는 분산액의 즉석 제조를 위한 멸균 분말을 포함한다. 약학적 활성 물질을 위한 이러한 매질 및 물질의 사용은 본 기술분야에서 잘 공지되어 있다. 임의의 통상적인 매질 또는 물질이 형질도입된 세포와 상용불가능한 경우를 제외하고, 본 발명의 약학 조성물에서의 그의 사용이 고려된다.
본 개시된 보호대상의 약학 조성물은 단독으로 또는 하나 이상의 다른 치료 방법과 함께 세포 또는 동물에게 투여하기 위해 약학적으로 허용가능한 또는 생리학적으로 허용가능한 용액에서 제제화된, 본원에 기재된 하나 이상의 폴리펩티드, 폴리뉴클레오티드, 이를 포함하는 벡터, 형질도입된 세포 등을 추가로 포함할 수 있다. 원하는 경우, 본 개시된 보호대상의 약학 조성물은 사이토카인, 성장 인자, 호르몬, 작은 분자 또는 다양한 약학적 활성 물질들을 포함하나 이들로 한정되지 않는 다른 물질과 함께 투여될 수 있다. 의도된 유전자 요법을 전달하는 조성물의 능력에 불리하게 영향을 미치지 않는 임의의 추가 물질이 조성물에 포함될 수 있다.
본 개시된 보호대상의 약학 조성물에서, 예를 들면, 경구, 비경구, 정맥내, 코내 및 근육내 투여 및 제제화를 포함하는 다양한 치료 섭생법들로 본원에 기재된 특정 조성물을 사용하기 위한 적합한 투약 및 치료 섭생법이 개발되어 있는 것과 마찬가지로, 약학적으로 허용가능한 부형제 및 담체 용액의 제제화는 본 기술분야에서 통상의 기술을 가진 자에게 잘 공지되어 있다.
본 개시된 보호대상의 약학 조성물은 예를 들면, 미국 특허 제5,543,158호, 제5,641,515호 및 제5,399,363호에 기재된 바와 같이 비경구(예를 들면, 정맥내, 근육내 또는 복강내)로 전달될 수 있다. 유리 염기 또는 약리학적으로 허용가능한 염으로서 활성 화합물의 용액은 계면활성제, 예컨대, 하이드록시프로필셀룰로스와 적절하게 혼합된 물에서 제조될 수 있다. 분산액도 글리세롤, 액체 폴리에틸렌 글리콜 및 이들의 혼합물, 및 오일에서 제조될 수 있다. 통상의 저장 및 사용 조건 하에서, 이들 제제들은 미생물의 성장을 방지하기 위해 보존제를 함유한다.
약학적으로 허용가능한 담체는 멸균 수성 용액 또는 분산액, 및 멸균 주사가능한 용액 또는 분산액의 즉석 제조를 위한 멸균 분말을 포함한다. 약학적 활성 물질을 위한 이러한 매질 및 물질의 사용은 본 기술분야에서 공지되어 있다. 임의의 통상적인 매질 또는 물질이 활성 화합물과 상용불가능한 경우를 제외하고, 본 발명의 약학 조성물에서의 그의 사용이 고려된다. 보충 활성 화합물도 조성물 내로 도입될 수 있다.
치료 조성물은 전형적으로 제조 및 저장 조건 하에서 멸균되어야 하고 안정해야 한다. 조성물은 용액, 마이크로에멀전, 리포좀, 또는 높은 약물 농도에 적합한 다른 정돈된 구조물로서 제제화될 수 있다. 약학적으로 허용가능한 담체는 예를 들면, 물, 에탄올, 폴리올(예를 들면, 글리세롤, 프로필렌 글리콜 및 액체 폴리에틸렌 글리콜 등) 및 이들의 적합한 혼합물을 함유하는 용매 또는 분산 매질일 수 있다. 적절한 유동성은 예를 들면, 코팅제, 예컨대, 레시틴의 사용에 의해, 분산액의 경우 요구된 입자 크기의 유지에 의해 및 계면활성제의 사용에 의해 유지될 수 있다. 많은 경우들에서, 등장제, 예를 들면, 당, 폴리알코올, 예컨대, 만니톨, 소르비톨 또는 염화나트륨을 조성물에 포함시키는 것이 바람직할 것이다. 주사가능한 조성물의 연장된 흡수는 흡수를 지연시키는 물질, 예를 들면, 모노스테아레이트 염 및 젤라틴을 상기 조성물에 포함시킴으로써 달성될 수 있다.
본 개시된 보호대상의 약학 조성물은 선택된 pH까지 완충될 수 있는 멸균 액체 제제, 예를 들면, 등장성 수성 용액, 현탁액, 에멀전, 분산액 또는 점성 조성물로서 편리하게 제공될 수 있다. 액체 제제는 통상적으로 겔, 다른 점성 조성물 및 고체 조성물보다 제조하기 더 용이하다. 추가로, 액체 조성물은 특히 주사에 의해 투여하기에 다소 더 편리하다. 다른 한편으로, 점성 조성물은 특정 조직과 보다 더 긴 접촉 기간을 제공하기 위해 적절한 점성 범위 내에서 제제화될 수 있다. 액체 또는 점성 조성물은 예를 들면, 물, 식염수, 포스페이트 완충 식염수, 폴리올(예를 들면, 글리세롤, 프로필렌 글리콜, 액체 폴리에틸렌 글리콜 등) 및 이들의 적합한 혼합물을 함유하는 용매 또는 분산 매질일 수 있는 담체를 포함할 수 있다.
멸균 주사가능한 용액은 원하는 경우 다양한 양의 다른 성분들을 가진 요구된 양의 적절한 용매에 본 개시된 보호대상의 조성물을 도입함으로써 제조될 수 있다. 이러한 조성물은 적합한 담체, 희석제 또는 부형제, 예컨대, 멸균수, 생리학적 식염수, 글루코스, 덱스트로스 등과 혼합된 상태로 존재할 수 있다. 조성물은 동결건조될 수도 있다. 조성물은 원하는 투여 경로 및 제제에 따라 보조 물질, 예컨대, 습윤화제, 분산제 또는 에멀전화제(예를 들면, 메틸셀룰로스), pH 완충제, 겔화 또는 점성 향상 첨가제, 보존제, 풍미제, 안료 등을 함유할 수 있다. 과도한 실험 없이 적합한 제제를 제조하기 위해 표준 교재, 예컨대, 본원에 참고로 도입되는 문헌["REMINGTON'S PHARMACEUTICAL SCIENCE", 17th edition, 1985]을 참조할 수 있다.
항균 보존제, 항산화제, 킬레이팅제 및 완충제를 포함하는, 조성물의 안정성 및 멸균성을 향상시키는 다양한 첨가제들이 첨가될 수 있다. 미생물 작용의 방지는 다양한 항균제들 및 항진균제들, 예를 들면, 파라벤, 클로로부탄올, 페놀, 소르브산 등에 의해 보장될 수 있다. 주사가능한 약학 제형의 연장된 흡수는 흡수를 지연시키는 물질, 예를 들면, 알루미늄 모노스테아레이트 및 젤라틴의 사용에 의해 달성될 수 있다.
조성물은 등장성을 나타낼 수 있다. 즉, 조성물은 혈액 및 눈물과 동일한 삼투압을 가질 수 있다. 본 개시된 보호대상의 조성물의 원하는 등장성은 염화나트륨, 또는 다른 약학적으로 허용가능한 물질, 예컨대, 덱스트로스, 붕산, 나트륨 타르트레이트, 프로필렌 글리콜 또는 다른 무기 또는 유기 용질의 사용을 통해 달성될 수 있다. 염화나트륨은 특히 나트륨 이온을 함유하는 완충제를 위해 바람직하다.
수성 용액에서의 비경구 투여를 위해, 예를 들면, 상기 용액은 필요한 경우 적절하게 완충되어야 하고 액체 희석제는 먼저 충분한 식염수 또는 글루코스와 등장성을 갖게 되어야 한다. 멸균 주사가능한 용액은 요구된 경우 상기 나열된 성분들 중 하나 또는 상기 성분들의 조합물을 가진 적절한 용매 내로 요구된 양의 활성 화합물을 도입한 후 마이크로여과로 멸균함으로써 제조될 수 있다. 일반적으로, 분산액은 기본 분산 매질 및 상기 나열된 성분들 중 요구된 다른 성분을 함유하는 멸균 비히클 내로 활성 화합물을 도입함으로써 제조된다. 멸균 주사가능한 용액의 제조를 위한 멸균 분말의 경우, 바람직한 제조 방법은 활성 성분과 임의의 추가 원하는 성분으로 구성된 분말을 그의 미리 멸균-여과된 용액으로부터 제공하는 진공 건조 및 냉동-건조(동결건조)이다.
일부 구현예들에서, 조성물은 코내 분무, 흡입 및/또는 다른 에어로졸 전달 비히클에 의해 전달될 수 있다. 코 에어로졸 분무를 통해 유전자, 폴리뉴클레오티드 및 펩티드 조성물을 폐에 직접적으로 전달하는 방법은 예를 들면, 미국 특허 제5,756,353호 및 제5,804,212호에 기재되어 있다. 라이소포스파티딜-글리세롤 화합물을 사용하여 약물을 전달하는 방법은 예를 들면, 미국 특허 제5,725,871호에 기재되어 있다. 폴리테트라플루오로에틸렌 지지 매트릭스 형태의 경점막 약물 전달은 예를 들면, 미국 특허 제5,780,045호에 기재되어 있다. 본 개시된 보호대상의 조성물은 지질 입자, 리포좀, 소포, 나노스피어, 나노입자 등으로 캡슐화된 상태로 전달되도록 제제화될 수 있다. 이러한 전달 비히클의 제제화 및 사용은 공지되어 있는 통상적인 기법의 이용을 통해 수행될 수 있다. 본 개시된 보호대상의 제제 및 조성물은 단독으로 또는 하나 이상의 다른 치료 방법과 함께 세포 또는 동물에게 투여되기 위해 약학적으로 허용가능한 또는 생리학적으로 허용가능한 용액(예를 들면, 배양 배지)에서 제제화된, 본원에 기재된 임의의 수의 폴리펩티드, 폴리뉴클레오티드 및 소분자의 조합물을 포함하는 하나 이상의 억제제 및/또는 활성화제를 포함할 수 있다.
일부 양태들에서, 본 개시된 보호대상은 레트로바이러스(예를 들면, 렌티바이러스) 벡터들을 포함하나 이들로 한정되지 않는 바이러스 벡터 시스템의 전달(즉, 바이러스-매개된 형질도입)에 적합한 제제 또는 조성물을 제공한다. 생체외 전달을 위한 예시적 제제는 본 기술분야에서 공지되어 있는 다양한 형질감염제들, 예컨대, 인산칼슘, 전기천공, 열충격 및 다양한 리포좀 제제들(즉, 지질-매개된 형질감염)의 사용도 포함할 수 있다. 리포좀은 수성 유체의 극히 일부를 포획하는 지질 이중층이다. DNA는 (그의 전하를 통해) 양이온성 리포좀들의 외부 표면에 자발적으로 연결되고, 이들 리포좀들은 세포 막과 상호작용할 것이다.
당업자는 조성물 중의 세포 및 임의적 첨가제, 비히클 및/또는 담체의 양 및 본 개시된 보호대상의 방법에서 투여될 이들의 양을 용이하게 결정할 수 있다. 전형적으로, (형질도입된 세포(들) 및/또는 물질(들) 이외에) 임의의 첨가제가 포스페이트 완충 식염수 용액에 약 0.001 중량% 내지 약 50 중량%의 양으로 존재하고, 활성 성분은 대략 마이크로그램 내지 밀리그램, 예컨대, 약 0.0001 중량% 내지 약 5 중량%, 약 0.0001 중량% 내지 약 1 중량%, 약 0.0001 중량% 내지 약 0.05 중량%, 약 0.001 중량% 내지 약 20 중량%, 약 0.01 중량% 내지 약 10 중량%, 또는 약 0.05 중량% 내지 약 5 중량%의 양으로 존재한다. 동물 또는 인간에게 투여될 임의의 조성물 및 임의의 특정 투여 방법에 대한 독성은 예컨대, 적합한 동물 모델, 예를 들면, 설치류, 예컨대, 마우스에서의 치사량(LD) 및 LD50; 및 적합한 반응을 이끌어낼 조성물(들)의 복용량, 조성물에 존재하는 성분의 농도 및 조성물(들)의 투여 시기를 결정함으로써 측정되어야 한다. 이러한 결정은 당업자의 지식, 본 개시 및 본원에서 인용된 문헌들의 지식을 벗어나는 과도한 실험을 요구하지 않는다. 그리고, 순차적 투여를 위한 시간은 과도한 실험 없이 확인될 수 있다.
Ⅵ. 용도 및 방법
본 개시된 발현 카세트를 포함하는 벡터 및 다른 전달 시스템(뉴클레아제 및 CRISPR-Cas 시스템)은 개선된 유전자 요법 방법을 제공한다. 본원에서 사용된 바와 같이, 용어 "유전자 요법"은 유전자 및/또는 유전자의 발현을 회복시키거나, 보정하거나 변경시키는 폴리뉴클레오티드를 세포의 게놈 내로 도입하는 것을 지칭한다. 다양한 비제한적 구현예들에서, 본 개시된 벡터 또는 다른 전달 시스템(예를 들면, 뉴클레아제 또는 CRISPR-Cas 시스템)은 조혈 시스템의 질환, 장애 또는 질병으로 진단된 대상체 또는 이러한 질환, 장애 또는 질병을 가진 것으로 의심되는 대상체에게 치유적, 예방적 또는 완화적 이익을 제공하는 글로빈 단백질(예를 들면, 인간 β 글로빈 단백질)을 암호화하는 글로빈 유전자 또는 이의 기능성 부분을 포함하는 발현 카세트를 포함한다. 벡터 또는 다른 전달 시스템(예를 들면, 뉴클레아제 및 CRISPR-Cas 시스템)은 생체내에서, 생체외에서 또는 시험관내에서 세포를 감염시킬 수 있고 형질도입할 수 있다. 그 후, 생체외 및 시험관내 구현예에서, 형질도입된 세포는 치료를 필요로 하는 대상체에게 투여될 수 있다. 본 개시된 보호대상은 본 개시된 보호대상의 벡터 및 다른 전달 시스템(예를 들면, 뉴클레아제 또는 CRISPR-Cas 시스템), 바이러스 입자 및 형질도입된 세포가 대상체에서 조혈 시스템의 질환, 장애 또는 질병, 예를 들면, 헤모글로빈병증을 치료하고/하거나, 예방하고/하거나 완화하는 데 사용된다는 것을 예상한다.
본원에서 사용된 바와 같이, 용어 "헤모글로빈병증" 또는 "헤모글로빈병증성 질환"은 혈액에서의 비정상적인 헤모글로빈 분자의 존재를 수반하는 임의의 장애를 포함한다. 헤모글로빈병증의 예는 헤모글로빈 C 질환, 헤모글로빈 겸상 세포 질환(SCD), 겸상 세포 빈혈 및 지중해빈혈을 포함하나 이들로 한정되지 않는다. 비정상적인 헤모글로빈들의 조합물이 혈액에 존재하는 헤모글로빈병증(예를 들면, 겸상 세포/Hb-C 질환)도 포함된다.
본원에서 사용된 바와 같이, "지중해빈혈"은 헤모글로빈의 불완전한 생성을 특징으로 하는 유전성 장애를 지칭한다. 지중해빈혈의 예는 α-지중해빈혈 및 β-지중해빈혈을 포함한다. β-지중해빈혈은 베타 글로빈 쇄에서의 돌연변이에 의해 야기되고, 메이저(major) 형태 또는 마이너(minor) 형태로 발생할 수 있다. 메이저 형태의 β-지중해빈혈에서, 어린이는 출생 시 정상이지만, 태어난 첫 해 동안 빈혈을 발생시킨다. 경미한 형태의 β-지중해빈혈은 작은 적혈구 세포를 생성하고, 상기 지중해빈혈은 글로빈 쇄로부터의 유전자 또는 유전자들의 결실에 의해 야기된다. α-지중해빈혈은 전형적으로 HBA1 및 HBA2 유전자들을 수반하는 결실로부터 발생된다. 이들 유전자들 둘 다가 헤모글로빈의 성분(서브유닛)인 α-글로빈을 코딩한다. 각각의 세포 게놈에는 HBA1 유전자의 2개 카피 및 HBA2 유전자의 2개 카피가 존재한다. 결과적으로, α-글로빈을 생성하는 4개의 대립형질들이 존재한다. 상이한 유형의 지중해빈혈은 이들 대립형질들의 일부 또는 전부의 상실로부터 발생된다. 지중해빈혈의 가장 심각한 형태인 Hb Bart 증후군은 모든 4개의 α-글로빈 대립형질들의 상실로부터 발생된다. HbH 질환은 4개의 [알파]-글로빈 대립형질들 중 3개의 대립형질들의 상실에 의해 야기된다. 이들 두 질환들에서, [알파]-글로빈의 부족은 세포가 정상 헤모글로빈을 만들지 못하게 한다. 그 대신에, 세포는 헤모글로빈 Bart(Hb Bart) 또는 헤모글로빈 H(HbH)로서 지칭되는 비정상적인 형태의 헤모글로빈을 생성한다. 이들 비정상적인 헤모글로빈 분자는 산소를 신체의 조직에 효과적으로 운반할 수 없다. 정상 헤모글로빈 대신에 Hb Bart 또는 HbH의 치환은 지중해빈혈과 관련된 빈혈 및 다른 심각한 건강 문제를 야기한다.
본원에서 사용된 바와 같이, 용어 "겸상 세포 질환"은 글로빈 유전자의 돌연변이로부터 발생되고 비정상적인 강성 겸상 형태를 취하는 적혈구 세포를 특징으로 하는 상염색체 열성 유전적 혈액 장애의 일군을 지칭한다. 이들은 글루탐산이 펩티드의 아미노산 위치 6에서 발린으로 치환되어 있는 β-글로빈 쇄 변이체를 암호화하는 βS-유전자, 및 임상 표현형을 유발하는 HbS의 결정화를 가능하게 하는 돌연변이를 가진 제2 β-유전자의 존재에 의해 정의된다. 본원에서 사용된 바와 같이, 용어 "겸상 세포 빈혈"은 HbS를 야기하는 돌연변이에 대한 동형접합성을 나타내는 환자들에서 겸상 세포 질환의 특정 형태를 지칭한다. 겸상 세포 질환의 다른 흔한 형태는 HbS/β-지중해빈혈, HbS/HbC 및 HbS/HbD를 포함한다.
일부 구현예들에서, 본 개시된 보호대상의 유전자 요법 방법은 헤모글로빈 C 질환, 헤모글로빈 겸상 세포 질환(SCD), 겸상 세포 빈혈, 유전성 빈혈, 지중해빈혈, β-지중해빈혈, 지중해빈혈 메이저, 지중해빈혈 인터메디아, α-지중해빈혈 및 헤모글로빈 H 질환으로 이루어진 군으로부터 선택된 헤모글로빈병증을 치료하거나, 예방하거나 완화하는 데 이용된다. 한 비제한적 구현예에서, 헤모글로빈병증은 β-지중해빈혈이다. 또 다른 비제한적 구현예에서, 헤모글로빈병증은 겸상 세포 빈혈이다.
다양한 비제한적 구현예들에서, 본 개시된 발현 카세트를 포함하는 벡터 또는 다른 전달 시스템(예를 들면, 뉴클레아제 또는 CRISPR-Cas 시스템)은 생체내에서 유전자 요법을 필요로 하는 대상체의 세포, 조직 또는 장기에 직접 주사함으로써 투여된다. 다양한 다른 구현예들에서, 세포는 본 개시된 보호대상의 벡터 또는 다른 전달 시스템(예를 들면, 뉴클레아제 또는 CRISPR-Cas 시스템)으로 시험관내에서 또는 생체외에서 형질도입되고, 임의적으로 생체외에서 증폭된다. 그 다음, 예를 들면, 본원에 개시된 약학 제제 내의 형질도입된 세포는 유전자 요법을 필요로 하는 대상체에게 투여된다.
본 개시된 보호대상은 형질도입된 세포를 대상체에게 제공하는 방법을 제공한다. 다양한 비제한적 구현예들에서, 상기 방법은 본 개시된 발현 카세트, 또는 이러한 발현 카세트를 포함하는 벡터 또는 또 다른 전달 시스템(예를 들면, 뉴클레아제 또는 CRISPR-Cas 시스템)으로 형질도입된 하나 이상의 세포(세포 집단)를 대상체에게 (예를 들면, 비경구로) 투여하는 단계를 포함한다.
본 개시된 보호대상은 대상체에서 헤모글로빈병증을 치료하는 방법을 제공한다. 다양한 비제한적 구현예들에서, 상기 방법은 유효량의 본 개시된 형질도입된 세포 또는 본 개시된 형질도입된 세포들의 집단(예를 들면, HSC들, 배아 줄기 세포들, 또는 iPSC들)을 대상체에게 투여하는 단계를 포함한다.
치료를 위해, 투여되는 양은 원하는 효과를 생성하는 데 효과적인 양이다. 유효량은 1회 또는 일련의 투여로 제공될 수 있다. 유효량은 볼루스로 제공될 수 있거나 연속 관주에 의해 제공될 수 있다. "유효량"(또는 "치료 유효량")은 치료 시 유리한 또는 원하는 임상 결과를 달성하는 데 충분한 양이다. 유효량은 1회 이상의 복용량으로 대상체에게 투여될 수 있다. 치료의 관점에서, 유효량은 질환의 진행을 경감시키거나, 완화하거나, 안정화시키거나, 역전시키거나 늦추거나, 질환의 병리학적 결과를 다른 방식으로 감소시키기에 충분한 양이다. 유효량은 일반적으로 사례별로 의사에 의해 결정되고 당업자의 기술 내에 있다. 유효량을 달성하기 적절한 복용량을 결정할 때 전형적으로 여러 요인들이 고려된다. 이들 요인들은 대상체의 연령, 성별 및 체중, 치료되는 질환, 질환의 중증도, 및 투여되는 면역반응 세포의 형태 및 유효 농도를 포함한다.
한 비제한적 예에서, 하나 이상의 본 개시된 형질도입된 세포의 투여 후, 대상체의 말초혈을 채취하고 헤모글로빈 수준을 측정한다. 하나 이상의 본 개시된 형질도입된 세포의 투여 후, 치료적으로 적절한 수준의 헤모글로빈이 생성된다. 치료적으로 적절한 수준의 헤모글로빈은 (1) 빈혈을 개선하거나 보정하고/하거나, (2) 정상 헤모글로빈을 함유하는 적혈구 세포를 생성하는 대상체의 능력을 회복시키고/시키거나, (3) 대상체에서 비효과적인 적혈구생성을 보정하고/하거나, (4) 수질외 조혈(예를 들면, 비장 및 간 수질외 조혈)을 보정하고/하거나, (5) 예를 들면, 말초 조직 및 장기에서 철 축적을 감소시키기에 충분한 헤모글로빈의 수준이다. 헤모글로빈의 치료적으로 적절한 수준은 적어도 약 7 g/dL Hb, 적어도 약 7.5 g/dL Hb, 적어도 약 8 g/dL Hb, 적어도 약 8.5 g/dL Hb, 적어도 약 9 g/dL Hb, 적어도 약 9.5 g/dL Hb, 적어도 약 10 g/dL Hb, 적어도 약 10.5 g/dL Hb, 적어도 약 11 g/dL Hb, 적어도 약 11.5 g/dL Hb, 적어도 약 12 g/dL Hb, 적어도 약 12.5 g/dL Hb, 적어도 약 13 g/dL Hb, 적어도 약 13.5 g/dL Hb, 적어도 약 14 g/dL Hb, 적어도 약 14.5 g/dL Hb 또는 적어도 약 15 g/dL Hb일 수 있다. 추가로 또는 대안적으로, 헤모글로빈의 치료적으로 적절한 수준은 약 7 g/dL Hb 내지 약 7.5 g/dL Hb, 약 7.5 g/dL Hb 내지 약 8 g/dL Hb, 약 8 g/dL Hb 내지 약 8.5 g/dL Hb, 약 8.5 g/dL Hb 내지 약 9 g/dL Hb, 약 9 g/dL Hb 내지 약 9.5 g/dL Hb, 약 9.5 g/dL Hb 내지 약 10 g/dL Hb, 약 10 g/dL Hb 내지 약 10.5 g/dL Hb, 약 10.5 g/dL Hb 내지 약 11 g/dL Hb, 약 11 g/dL Hb 내지 약 11.5 g/dL Hb, 약 11.5 g/dL Hb 내지 약 12 g/dL Hb, 약 12 g/dL Hb 내지 약 12.5 g/dL Hb, 약 12.5 g/dL Hb 내지 약 13 g/dL Hb, 약 13 g/dL Hb 내지 약 13.5 g/dL Hb, 약 13.5 g/dL Hb 내지 약 14 g/dL Hb, 약 14 g/dL Hb 내지 약 14.5 g/dL Hb, 약 14.5 g/dL Hb 내지 약 15 g/dL Hb, 약 7 g/dL Hb 내지 약 8 g/dL Hb, 약 8 g/dL Hb 내지 약 9 g/dL Hb, 약 9 g/dL Hb 내지 약 10 g/dL Hb, 약 10 g/dL Hb 내지 약 11 g/dL Hb, 약 11 g/dL Hb 내지 약 12 g/dL Hb, 약 12 g/dL Hb 내지 약 13 g/dL Hb, 약 13 g/dL Hb 내지 약 14 g/dL Hb, 약 14 g/dL Hb 내지 약 15 g/dL Hb, 약 7 g/dL Hb 내지 약 9 g/dL Hb, 약 9 g/dL Hb 내지 약 11 g/dL Hb, 약 11 g/dL Hb 내지 약 13 g/dL Hb, 또는 약 13 g/dL Hb 내지 약 15 g/dL Hb일 수 있다. 일부 구현예들에서, 헤모글로빈의 치료적으로 적절한 수준은 적어도 약 6개월 동안, 적어도 약 12개월(또는 1년) 동안 또는 적어도 약 24개월(또는 2년) 동안 대상체에서 유지된다. 일부 구현예들에서, 헤모글로빈의 치료적으로 적절한 수준은 최대 약 6개월 동안, 최대 약 12개월(또는 1년) 동안 또는 최대 약 24개월(또는 2년) 동안 대상체에서 유지된다. 일부 구현예들에서, 헤모글로빈의 치료적으로 적절한 수준은 약 6개월, 약 12개월(또는 1년) 동안 또는 약 24개월(또는 2년) 동안 대상체에서 유지된다. 일부 구현예들에서, 헤모글로빈의 치료적으로 적절한 수준은 약 6개월 내지 약 12개월(예를 들면, 약 6개월 내지 약 8개월, 약 8개월 내지 약 10개월, 약 10개월 내지 약 12개월), 약 12개월 내지 약 18개월(예를 들면, 약 12개월 내지 약 14개월, 약 14개월 내지 약 16개월, 또는 약 16개월 내지 약 18개월), 또는 약 18개월 내지 약 24개월(예를 들면, 약 18개월 내지 약 20개월, 약 20개월 내지 약 22개월, 또는 약 22개월 내지 약 24개월) 동안 대상체에서 유지된다.
일부 구현예들에서, 상기 방법은 전술된 본 개시된 발현 카세트를 포함하는 재조합 벡터로 형질도입된 하나 이상의 세포를 투여하는 단계를 포함한다. 대상체에서 헤모글로빈의 치료적으로 적절한 수준(예를 들면, 9-10 g/dL)을 제공하는, 세포 내의 재조합 벡터의 벡터 카피 수는 세포당 약 0.5 내지 약 2, 약 0.5 내지 약 1, 또는 약 1 내지 약 2 벡터 카피 수이다. 일부 구현예들에서, 본 개시된 벡터의 벡터 카피 수는 세포당 약 0.5, 약 0.6, 약 0.7, 약 0.8, 약 0.9, 약 1.0, 약 1.1, 약 1.2, 약 1.3, 약 1.4, 약 1.5, 약 1.6, 약 1.7, 약 1.8, 약 1.9 또는 약 2.0 벡터 카피 수이다.
일부 구현예들에서, 대상체는 인간 백혈구 항원(HLA)-일치된 공여자를 결여한다. 일부 구현예들에서, 형질도입된 세포는 동일한 대상체로부터 유래된다. 한 구현예에서, 형질도입된 세포는 동일한 대상체의 골수로부터 유래된다. 따라서, 형질도입된 세포의 투여는 대상체에서 이식편-대-숙주 질환의 위험을 발생시키지 않는다. 상기 방법은 이식편 거부를 예방하기 위해 면역 억제를 요구하지 않는다. 예를 들면, 상기 방법은 면역억제제를 대상체에게 투여하는 단계를 포함하지 않는다.
본 개시된 보호대상은 대상체에서 백혈 세포 또는 백혈구에 비해 적혈구 세포 또는 적혈구의 비율을 증가시키는 방법도 제공한다. 다양한 비제한적 구현예들에서, 상기 방법은 유효량의 본 개시된 형질도입된 세포 또는 본 개시된 형질도입된 세포들의 집단(예를 들면, HSC들, 배아 줄기 세포들 또는 iPSC들)을 대상체에게 투여하는 단계를 포함하고, 이때 조혈 줄기 세포의 적혈구 세포 자손 세포의 비율은 대상체에서 조혈 줄기 세포의 백혈 세포 자손 세포에 비해 증가된다.
임의의 특정 이론에 구속받고자 하지 않지만, 본 개시된 보호대상의 발현 카세트, 벡터 및 다른 전달 시스템(예를 들면, 뉴클레아제 및 CRISPR-Cas시스템), 조성물 및 방법에 의해 제공된 중요한 장점은 기존 방법에 비해 더 낮은 백분율의 형질도입된 세포를 포함하는 세포 집단의 투여에 의해 달성될 수 있는 글로빈 유전자 요법의 고효율이다. 이것은 형질도입된 세포에서 세포 유전자의 유해한 돌연변이, 형질전환 또는 종양유전자 활성화의 감소된 가능성과 관련된 중요한 안전성 장점을 제공한다. 형질도입된 세포는 골수 제거 요법을 받았거나 받지 않은 개체에서 골수 또는 제대혈 이식물의 일부로서 투여될 수 있다.
본원에 기재된 발현 카세트로 형질도입된 본 개시된 세포의 치료적 용도에 관한 한 고려사항은 최적 효과를 달성하는 데 필요한 세포의 양이다. 투여될 형질도입된 세포의 양은 치료되는 대상체에 따라 달라질 것이다. 한 구현예에서, 약 1 x 104개 내지 약 1 x 105개 세포/kg, 약 1 x 105개 내지 약 1 x 106개 세포/kg, 약 1 x 106개 내지 약 1 x 107개 세포/kg, 약 1 x 107개 내지 약 1 x 108개 세포/kg, 약 1 x 108개 내지 약 1 x 109개 세포/kg, 또는 약 1 x 109개 내지 약 1 x 1010개 세포/kg의 본 개시된 형질도입된 세포가 대상체에게 투여된다. 훨씬 더 작은 수의 보다 효과적인 세포가 투여될 수 있다. 일부 구현예들에서, 적어도 약 1 x 108개 세포/kg, 적어도 약 2 x 108개 세포/kg, 적어도 약 3 x 108개 세포/kg, 적어도 약 4 x 108개 세포/kg, 또는 적어도 약 5 x 108개 세포/kg의 본 개시된 형질도입된 세포가 대상체에게 투여된다. 유효 복용량으로서 간주되는 복용량의 정확한 결정은 구체적인 대상체의 크기, 연령, 성별, 체중 및 상태를 포함하는, 각각의 대상체에게 개별적인 요인에 근거할 수 있다. 복용량은 본 개시 및 본 기술분야의 지식으로부터 당업자에 의해 용이하게 확인될 수 있다.
다양한 구현예들에서, 본 개시된 보호대상의 발현 카세트, 벡터 및 다른 전달 시스템(뉴클레아제 및 CRISPR-Cas 시스템), 조성물 및 방법은 생체외 유전자 요법 및 자가 이식을 이용하는 개선된 유전자 요법 방법을 제공한다. 발현 카세트로 형질도입된 세포를, 헤모글로빈병증을 가진 대상체 내로 이식하는 것은 질환의 장기간 보정을 일으킨다.
하나 이상의 본 개시된 형질도입된 세포는 비경구 투여(예를 들면, 근육내 투여, 정맥내 투여, 피하 투여 또는 복강내 투여), 척추 투여 및 표피 투여를 포함하나 이들로 한정되지 않는, 본 기술분야에서 공지된 임의의 방법에 의해 투여될 수 있다. 한 비제한적 구현예에서, 하나 이상의 형질도입된 세포는 정맥내로 대상체에게 전달된다. 하나 이상의 본 개시된 형질도입된 세포는 주사, 주입 또는 이식에 의해 투여될 수 있다. 한 비제한적 구현예에서, 하나 이상의 형질도입된 세포는 주사에 의해 투여된다. 또 다른 비제한적 구현예에서, 하나 이상의 형질도입된 세포는 정맥내 주사에 의해 투여된다.
대상체는 진행된 형태의 질환을 가질 수 있고, 이 경우 치료 목적은 질환 진행의 경감 또는 역전, 및/또는 부작용의 완화를 포함할 수 있다. 대상체는 이미 치료받은 병력을 가질 수 있고, 이 경우 치료 목적은 전형적으로 재발 위험의 감소 또는 지연을 포함할 것이다.
Ⅶ. 키트
본 개시된 보호대상은 헤모글로빈병증의 치료 또는 예방을 위한 키트를 제공한다. 한 구현예에서, 상기 키트는 본 개시된 발현 카세트로 형질도입된 유효량의 세포를 유닛 제형으로 함유하는 치료 또는 예방 조성물을 포함한다. 한 비제한적 구현예에서, 상기 키트는 본원에 개시된 하나 이상의 발현 카세트를 포함한다. 일부 구현예들에서, 상기 키트는 본원에 개시된 발현 카세트를 포함하는 하나 이상의 벡터를 포함한다. 일부 구현예들에서, 상기 키트는 상자, 앰플, 병, 바이알, 튜브, 백, 파우치, 블리스터-팩 또는 본 기술분야에서 공지된 다른 적합한 용기 형태일 수 있는 멸균 용기를 포함한다. 이러한 용기는 플라스틱, 유리, 적층된 종이, 금속 포일, 또는 약제를 지탱하기에 적합한 다른 재료로 만들어질 수 있다.
원하는 경우, 형질도입된 세포는 헤모글로빈병증을 갖거나 발생시킬 위험에 있는 대상체에게 상기 세포를 투여하는 것에 대한 설명서와 함께 제공된다. 상기 설명서는 일반적으로 헤모글로빈병증의 치료 또는 예방을 위한 조성물의 사용에 대한 정보를 포함할 것이다. 다른 구현예에서, 상기 설명서는 하기 정보들 중 하나 이상을 포함한다: 치료제의 설명; 헤모글로빈병증 또는 이의 증상의 치료 또는 예방을 위한 복용 일정 및 투여; 주의; 경고; 적응증; 역-적응증; 과다복용 정보; 불리한 반응; 동물 약리학; 임상 연구; 및/또는 참고자료. 대안적으로 또는 추가로, 키트는 하나 이상의 발현 카세트 및/또는 이러한 발현 카세트를 포함하는 벡터로 세포를 형질도입하는 것에 대한 설명서를 포함할 수 있다. 상기 설명서는 (존재할 때) 용기 상에 직접 인쇄될 수 있거나, 용기에 적용된 표지로서 인쇄될 수 있거나, 용기 내에 또는 용기와 함께 공급된 별도의 시트, 팜플렛, 카드 또는 폴더로서 인쇄될 수 있다.
실시예
달리 표시되어 있지 않은 한, 본 개시된 보호대상의 실시는 당업자의 이해범위 내에 있는 분자생물학(재조합 기법을 포함함), 미생물학, 세포생물학, 생화학 및 면역학의 통상적인 기법들을 이용한다. 이러한 기법들은 문헌, 예컨대, 문헌["Molecular Cloning: A Laboratory Manual", second edition (Sambrook, 1989)]; 문헌["Oligonucleotide Synthesis" (Gait, 1984)]; 문헌["Animal Cell Culture" (Freshney, 1987)]; 문헌["Methods in Enzymology" "Handbook of Experimental Immunology" (Weir, 1996)]; 문헌["Gene Transfer Vectors for Mammalian Cells" (Miller and Calos, 1987)]; 문헌["Current Protocols in Molecular Biology" (Ausubel, 1987)]; 문헌["PCR: The Polymerase Chain Reaction", (Mullis, 1994)]; 및 문헌["Current Protocols in Immunology" (Coligan, 1991)]에 충분히 설명되어 있다. 이들 기법들은 본 개시된 보호대상의 폴리뉴클레오티드 및 폴리펩티드의 제조에 적용될 수 있으므로, 본 개시된 보호대상의 제조 및 실시에서 고려될 수 있다. 특정 구현예를 위한 특히 유용한 기법은 하기 단락에서 논의될 것이다.
하기 실시예들은 본 개시된 보호대상의 발현 카세트, 벡터, 전달 시스템 및 치료 방법을 제조하고 사용하는 방법의 완전한 개시 및 설명을 본 기술분야에서 통상의 기술을 가진 자에게 제공하도록 기재되어 있고, 본 발명자들이 그들의 발명으로서 간주하는 것의 범위를 한정하기 위한 것이 아니다.
실시예 1: 신규 인슐레이터의 발견
유전독성의 위험이 염색질 인슐레이터의 사용에 의해 감소될 수 있다는 것이 입증된 것과 마찬가지로(Arumugam et al. (2007), Emery (2011), Evans-Galea et al. (2007), Rivella et al. (2000), Emery et al. (2000), Emery et al. (2002), Yannaki et al. (2002), Hino et al. (2004), Ramezani et al. (2003), Ramezani et al. (2008)), 바이러스 벡터의 삽입적 돌연변이유발에 의해 발생된 문제점은 널리 공지되어 있다(Nienhuis (2013), Baum et al. (2006), Nienhuis et al. (2006)). 인간 게놈에서 인핸서 차단 인슐레이터를 효율적으로 확인할 수 있게 하는 방법이 개발되어 있다. 이들 신규 인슐레이터들은 평균 150 bp의 짧은 길이를 갖고, 바이러스 벡터의 역가에 불리하게 영향을 미치지 않고, 인슐레이터 cHS4보다 몇 배 더 강력하다. 게놈 접근법은 인간 게놈의 가장 강력한 인핸서 차단제 및 장벽 인슐레이터를 발견하는 데 이용되었다. 헤모글로빈병증의 유전자 요법의 경우, 치료적 수준의 글로빈 유전자 발현을 달성하기 위해 강력한 인핸서가 요구된다. 따라서, 강력한 인슐레이터는 삽입 벡터의 강력한 인핸서로부터 게놈 환경을 보호하기 위한 한 수단을 제공할 수 있다.
여러 연구들은 감마레트로바이러스 벡터[Evans-Galea et al. (2007), Rivella et al. (2000), Emery et al. (2000), Emery et al. (2002), Yannaki et al. (2002), Hino et al. (2004), Ramezani et al. (2006), Yao et al. (2003), Nishino et al. (2006), Aker et al. (2007), Li and Emery (2008)], 및 렌티바이러스 벡터[Evans-Galea et al. (2007), Ramezani et al. (2003), Puthenveetil et al. (2004), Arumugam et al. (2007), Bank et al. (2005), Aker et al. (2007), Ma et al. (2003), Chang et al. (2005), Pluta et al. (2005)]의 위치-효과 침묵을 감소시키는 cHS4 인슐레이터의 능력을 입증하였다. 적절하게 설계된 연구들은 cHS4 인슐레이터의 1.2 kb 버전의 포함이 적어도 일부 환경에서 벡터 전이유전자 발현의 확률 및/또는 일관성을 증가시켰다는 것을 입증하였다(Arumugam et al. (2007), Evans-Galea et al. (2007), Emery et al. (2002), Yannaki et al. (2002), Hino et al. (2004), Ramezani et al. (2006), Aker et al. (2007), Li and Emery (2008), Pluta et al. (2005), Jakobsson et al. (2004)). 그럼에도 불구하고, cHS4 인슐레이터에 의해 부여된 보호의 정도는 결코 완전하지 않다. 추가로, 1.2 Kb cHS4의 포함은 벡터 역가에 불리하게 영향을 미칠 수 있는 반면, 가장 작은 cHS4 코어는 비효과적인 것으로 입증되었다(Aker et al. (2007), Jakobsson et al. (2004)).
마우스에서의 종양 형성의 정량을 기반으로 하는 생체내 분석을 이용하여 유전독성에 대한 효과를 시험하였다. 인슐레이터 A1에 의해 인슐레이팅된 벡터는 인슐레이팅되지 않은 대조군 또는 cHS4로 인슐레이팅된 대조군을 제공받은 마우스들에 비해 조혈 키메라에서 무작위적 벡터 삽입에 의해 유도된 종양 형성을 감소시켰다.
벡터 역가에 대한 효과를 평가하기 위해, 항시성 팩키지 프로모터로부터 GFP를 발현하는 제3세대 렌티바이러스 벡터의 이중-카피 영역 내로 인슐레이터 A1을 도입하였고, 바이러스 역가 및 GFP 발현을 측정하였다. 인슐레이터 A1은 벡터 GFP 발현에 불리하게 영향을 미치지 않았다.
생체내 유전독성 분석에서, 감마레트로바이러스 벡터로 형질도입된 세포주는 마우스들 내로의 이식 후 종양을 생성하였고 종양 부재 생존율의 측정에 의한 유전독성 효과의 정량을 가능하게 하였다. 유전독성에 대한 인슐레이터의 효과는 마우스들에서 형성된 종양의 수 및 종양 부재 생존율에 의해 정량되었다. 인슐레이터 A1은 3' LTR의 근위 부분에 삽입되었고, 역전사 및 벡터 삽입 동안 이러한 부분으로부터 5' LTR 내로 카피된다. 생성된 위상기하학은 삽입된 프로바이러스의 5' 및 3'에 위치하는 게놈 영역들 사이에 인슐레이터의 카피들을 배치하고 5' 바이러스 LTR 및 내부 Pgk 프로모터로부터의 인핸서 활성을 함유하지만, 3' LTR에서 인핸서를 함유하지 않는다. 이것은 유전독성을 감소시킴으로써, 종양 형성을 감소시킬 수 있고 동물의 생존을 증가시킬 수 있다. 인슐레이터 A1 또는 대조군 영역으로 플랭킹된 감마-레트로바이러스 레포터 벡터를 사용하여 성장 인자 의존성 세포주 32D를 형질도입하였고, 각각의 벡터에 대한 10개의 독립적인 서브-풀들(sub-pools)을 동계 C3H/HeJ 마우스들 내로 이식하였다. 모의물(mock)로 형질도입된 세포를 이식받은 10마리의 마우스들 전부가 32D 세포 유래의 종양을 갖지 않는 상태로 유지된 반면, 삽입물을 함유하지 않거나 790 bp 중성 스페이서를 함유하는 벡터로 형질도입된 32D 세포를 이식받은 거의 모든 마우스들은 평균 16주 이내에 종양을 발생시켰다(도 5b). cHS4 인슐레이터에 의한 이 벡터의 플랭킹은 종양 형성의 시작을 수주까지 지연시켰고, 종양을 발생시킨 동물의 빈도를 10분의 6까지 감소시켰다. 대조적으로, 10마리의 동물들 중 2마리의 동물들만이 인슐레이터 A1로 플랭킹된 벡터로 형질도입된 32D 세포를 사용한 이식 후 종양을 발생시켰다(도 5b). 원래의 서브-풀에서 종양을 가진 동물의 빈도 및 벡터 형질도입 사건의 수는 인슐레이터 A1에 의한 벡터의 플랭킹이 전체 종양 형성률을 105 프로바이러스당 46.9개의 종양부터 105 프로바이러스당 3.9개 종양까지 12배 감소시켰다는 것을 암시하였다(도 5c). 대조적으로, cHS4 인슐레이터는 전체 종양 형성률을 2.8배(105 프로바이러스당 16.9개 종양)까지 감소시킨 반면, 중성 스페이서는 종양 형성률에 대한 통계적으로 유의한 효과를 갖지 않았다. 이들 결과들은 발견된 인핸서 차단 인슐레이터가 삽입적 돌연변이유발의 위험 및 유전독성을 실질적으로 감소시킬 수 있다는 것을 시사한다.경숙
실시예 2: 하나 이상의 인슐레이터를 포함하는 글로빈 벡터의 특징규명
인슐레이터 A1; 및 서열번호 9에 기재된 뉴클레오티드 서열을 가진 HS2 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역 및 서열번호 7에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함하는 β-글로빈 LCR 영역에 작동가능하게 연결된, 코돈 87에서 글루타민으로의 쓰레오닌의 돌연변이(βA - T87Q)를 암호화하는 인간 βA-글로빈 유전자를 포함하는 본 개시된 발현 카세트(도 1에 표시된 바와 같이 "발현 카세트 1"로서 표기됨)를 생성하였다. 변이체 β 쇄(βA)를 사용하는 이유는 내생성 또는 주입된 베타 쇄로부터 이것을 식별하는, 벡터-코딩된 β-글로빈 유전자의 검출을 용이하게 한다는 것이다. γ-글로빈 쇄 내의 위치 87에 있는 글루타민(GLN) 잔기는 β 쇄의 성체 산소 결합 특성을 보존하면서 β 쇄에 비해 감마 쇄의 항-겸상화 활성을 증강시킨다(Nagel et al. (1979)). 벡터 1에서, 코돈 87을 변경시키는 점 돌연변이(βA - T87Q, 또는 β87)는 정상 쓰레오닌을 글루타민으로 대체하고 벡터-코딩된 β 쇄의 항-겸상화 활성을 증강시킨다. 이 β87 쇄는 HbE-지중해빈혈을 가진 환자에서 안전하게 사용되고 있다(Cavazzana-Calvo et al. (2010)).
발현 카세트 1을 렌티바이러스 벡터("벡터 1"로서 표기됨)에 삽입하였거나 도입하였다. 종래 기재된 바와 같이(May et al. (2000), May et al. (2002), Lisowski et al. (2007)), 벡터 1을 C57BL/6-Hbb th3/+ 마우스의 골수 세포에 도입하였고 치사량의 방사선을 조사받은 동계 수용자에게 이식하였다. V1의 벡터 역가는 인슐레이터 A1을 결여하는 발현 카세트를 포함하는 렌티바이러스 벡터의 역가에 필적할만하였다. 벡터 1의 β-글로빈 발현은 인슐레이터를 결여하고 서열번호 9에 기재된 뉴클레오티드 서열을 가진 HS2 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역 및 서열번호 6에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함하는 β-글로빈 LCR 영역에 작동가능하게 연결된 야생형 인간 β-글로빈 유전자를 포함하는 발현 카세트를 포함하는 렌티바이러스 벡터("벡터 2"로서 표기됨)의 β-글로빈 발현에 비교되었다. 도 6에 표시된 바와 같이, 벡터 2와 비교될 때, 벡터 카피로 표준화된 벡터 1의 β-글로빈 발현은 동등하였거나 약간 증가되었는데, 이것은 플랭킹 장벽 요소에 의해 제공된, 생체내 발현을 위한 추가된 이익을 암시한다.
실시예 3: 비-적혈구 K562 세포에서 인핸서 활성의 평가
HS2의 인핸서 활성을 비-적혈구 K562 세포에서 평가하였다. 도 7에 표시된 바와 같이, 벡터로 형질도입된 K562 세포에서의 GFP 발현은 인핸서에 연결되어 있지 않거나("Empty"), HS2, HS3-4, HS2-3-4, 또는 양성 대조군으로서 사용된 runx1 인핸서("RUNX1")에 연결된 최소 프로모터에 의해 유도되었다. 배경 발현은 대략 0.01%("Empty")이었지만, HS2-3-4의 사용 시 10배 이상 증가되었다("Lcr9", 0.17%). 이 향상은 HS3-4(0.05%)에 기인한 것이 아니라 주로 HS2(0.15%)에 기인하였다. 모든 세포주들이 비교가능하게 형질도입되었다(평균 벡터 카피 수 2.5). 결과는 HS3-HS4가 아니라 HS2가 비-적혈구 조혈 줄기 및 조상 세포에서 종양형성 위험을 초래할 수 있다는 것을 뒷받침한다.
실시예 4: 신규 적혈구-특이적 인핸서
도 8 및 9에 표시된 바와 같이, 5종의 적혈구-특이적 인핸서들이 HS2 대신에 사용되었다: ALAS 인트론 1, ALAS 인트론 8, BLVRB, PPOX 및 스펙트린(Spectrin)-알파. 본 발명자들은 모든 이들 5종의 인핸서들이 강력한 인핸서이고 비-적혈구 조직에서 인핸서 활성을 결여하고 벡터 역가를 감소시키지 않는다는 것을 보여주었다.
실시예 5: 3' LTR 변경을 통한 글로빈 렌티바이러스 벡터 생성의 증가
치료 글로빈 벡터의 본질적인 특징은 환자 세포의 효과적인 형질도입에 충분한 높은 역가를 달성하는 것이다. 글로빈 렌티바이러스 벡터들은 유전자, 프로모터, 인핸서 및/또는 LCR 요소를 포함하는 그들의 큰 적하물 때문에 본질적으로 낮은 역가를 갖고, 이 문제점은 그들의 제조를 복잡하게 하고 그들의 임상 사용을 한정한다. 이 문제점은 벡터의 크기를 더 증가시키는, 추가 유전적 요소, 예컨대, 인슐레이터의 도입에 의해 더 악화된다.
본 발명자들은 글로빈 벡터의 역가를 증가시키기 위해 글로빈 벡터의 3' 긴 말단 반복부(LTR)의 상이한 변경을 활용하였다. 서열번호 9에 기재된 뉴클레오티드 서열을 가진 HS2 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역 및 서열번호 7에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함하는 β-글로빈 LCR 영역에 작동가능하게 연결된 인간 β-글로빈 유전자를 포함하는 렌티바이러스 벡터에 대해 모델링된 62종의 변이들(1부터 62까지 넘버링됨)에 대해 평가하였다. 다시 말해, 벡터 #1부터 벡터 #62까지 전부가 서열번호 9에 기재된 뉴클레오티드 서열을 가진 HS2 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 가진 HS3 영역 및 서열번호 7에 기재된 뉴클레오티드 서열을 가진 HS4 영역을 포함하는 β-글로빈 LCR 영역을 포함한다. 벡터 #18은 3' LTR에서 표준 U3 결실을 포함하는 기준으로서 사용되었다. 벡터 #1(표시되어 있지 않음)은 임상적으로 사용될 수 없는 전체, 즉 야생형 LTR을 포함하였다. 3' LTR에 대한 변경은 도 10a 및 10b에 표시되어 있고, 그들의 역가는 도 11 및 12에 표시되어 있다(Y 축은 엄격히 동일한 조건 하에서 제조되고 시험된 벡터 스톡의 벡터 카피 수를 보여준다). 적정은 2명의 작업자들에 의해 동시에 수행된 삼중 레플리카(triple replicas)에서 측정되었고 다회 실험들에서 반복되었다.
도 11 및 12에 표시된 바와 같이, 벡터 #55는 반복적으로 보다 더 높은 역가를 보였다. 이 벡터는 3' LTR 내의 R 영역에 대해 3' 방향에서 우드척 간염 후-조절 요소(WPRE) 및 소 성장 호르몬 폴리아데닐화 신호를 포함한다. 따라서, WPRE 요소는 형질도입된 세포에게 전달되지 않는다.
글로빈 렌티바이러스 벡터의 생성을 향상시키기 위한 이들 요소들의 도입은 보다 더 높은 역가의 제공 및 이로써 본원에 기재된 벡터의 임상 유용성을 위해 필수적이다.
참고문헌
1. Weatherall, D.J. & Clegg, J.B. The Thalassemia Syndrome. Blackwell Scientific Oxford (1981).
2. Stamatoyannopoulos, G., Nienhuis, A.W., Majerus, P. & Varmus, H. The Molecular Basis of Blood Diseaes. WB Saunders, Philadelfphia (1994).
3. Weatherall, D.J. Phenotype-genotype relationships in monogenic disease: lessons from the thalassaemias. Nat Rev Genet 2, 245-255. (2001).
4. Steinberg, M.H., Forget, B.G., Higgs, D.R. & Nagel, R.L. Molecular Mechanism of β Thalassemia; Bernard G. Forget, (Cambridge University Press, Cambridge, UK, 2001).
5. Cooley, T.B. & Lee, P. A series of cases of splenomegaly in children with anemia and peculiar bone changes. Trans. Am. Pediatr. Soc. 37, 29 (1925).
6. Giardina, P.J. & Grady, R.W. Chelation therapy in beta-thalassemia: an optimistic update. Semin Hematol 38, 360-366. (2001).
7. Giardini, C. & Lucarelli, G. Bone marrow transplantation in the treatment of thalassemia. Current opinion in hematology 1, 170-176. (1994).
8. Boulad, F., Giardina, P., Gillio, A., Kernan, N., Small, T., Brochstein, J., Van Syckle, K., George, D., Szabolcs, P. & O'Reilly, R.J. Bone marrow transplantation for homozygous beta-thalassemia. The Memorial Sloan-Kettering Cancer Center experience. Ann N Y Acad Sci 850, 498-502. (1998).
9. Lucarelli, G., Clift, R.A., Galimberti, M., Angelucci, E., Giardini, C., Baronciani, D., Polchi, P., Andreani, M., Gaziev, D., Erer, B., Ciaroni, A., D'Adamo, F., Albertini, F. & Muretto, P. Bone marrow transplantation in adult thalassemic patients. Blood 93, 1164-1167. (1999).
10. Tisdale, J. & Sadelain, M. Toward gene therapy for disorders of globin synthesis. Semin Hematol 38, 382-392 (2001).
11. Pauling, L., Itano, H.A., Singer, S.J. & Wells, I.C. Sickle cell anemia, a molecular disease. Science 110, 543-546 (1949).
12. Swank, R.A. & Stamatoyannopoulos, G. Fetal gene reactivation. Curr Opin Genet Dev 8, 366-370 (1998).
13. Platt, O.S., Orkin, S.H., Dover, G., Beardsley, G.P., Miller, B. & Nathan, D.G. Hydroxyurea enhances fetal hemoglobin production in sickle cell anemia. J Clin Invest 74, 652-656. (1984).
14. Charache, S., Dover, G.J., Moore, R.D., Eckert, S., Ballas, S.K., Koshy, M., Milner, P.F., Orringer, E.P., Phillips, G., Jr., Platt, O.S. & et al. Hydroxyurea: effects on hemoglobin F production in patients with sickle cell anemia. Blood 79, 2555-2565. (1992).
15. Atweh, G.F. & Loukopoulos, D. Pharmacological induction of fetal hemoglobin in sickle cell disease and beta-thalassemia. Semin Hematol 38, 367-373. (2001).
16. Perrine, S.P., Castaneda, S.A., Boosalis, M.S., White, G.L., Jones, B.M. & Bohacek, R. Induction of fetal globin in beta-thalassemia: Cellular obstacles and molecular progress. Ann N Y Acad Sci 1054, 257-265 (2005).
17. Stamatoyannopoulos, G. Prospects for developing a molecular cure for thalassemia. Hematology 10 Suppl 1, 255-257 (2005).
18. Vermylen, C., Cornu, G., Ferster, A., Brichard, B., Ninane, J., Ferrant, A., Zenebergh, A., Maes, P., Dhooge, C., Benoit, Y., Beguin, Y., Dresse, M.F. & Sariban, E. Haematopoietic stem cell transplantation for sickle cell anaemia: the first 50 patients transplanted in Belgium. Bone Marrow Transplant 22, 1-6 (1998).
19. Luzzatto, L. & Goodfellow, P. Sickle cell anaemia. A simple disease with no cure. Nature 337, 17-18 (1989).
20. Sadelain, M. Genetic treatment of the haemoglobinopathies: recombinations and new combinations. Br J Haematol 98, 247-253 (1997).
21. Sadelain, M., Boulad, F., Galanello, R., Giardina, P., Locatelli, F., Maggio, A., Rivella, S., Riviere, I. & Tisdale, J. Therapeutic options for patients with severe beta-thalassemia: the need for globin gene therapy. Hum Gene Ther 18, 1-9 (2007).
22. Borgna-Pignatti, C., Rugolotto, S., De Stefano, P., Zhao, H., Cappellini, M.D., Del Vecchio, G.C., Romeo, M.A., Forni, G.L., Gamberini, M.R., Ghilardi, R., Piga, A. & Cnaan, A. Survival and complications in patients with thalassemia major treated with transfusion and deferoxamine. Haematologica 89, 1187-1193 (2004).
23. Telfer, P.T., Warburton, F., Christou, S., Hadjigavriel, M., Sitarou, M., Kolnagou, A. & Angastiniotis, M. Improved survival in thalassemia major patients on switching from desferrioxamine to combined chelation therapy with desferrioxamine and deferiprone. Haematologica 94, 1777-1778 (2009).
24. Ladis, V., Chouliaras, G., Berdoukas, V., Chatziliami, A., Fragodimitri, C., Karabatsos, F., Youssef, J., Kattamis, A. & Karagiorga-Lagana, M. Survival in a large cohort of Greek patients with transfusion-dependent beta thalassaemia and mortality ratios compared to the general population. European journal of haematology 86, 332-338 (2011).
25. Mancuso, A., Sciarrino, E., Renda, M.C. & Maggio, A. A prospective study of hepatocellular carcinoma incidence in thalassemia. Hemoglobin 30, 119-124 (2006).
26. Persons, D.A. & Tisdale, J.F. Gene therapy for the hemoglobin disorders. Semin Hematol 41, 279-286 (2004).
27. Sadelain, M. Recent advances in globin gene transfer for the treatment of beta-thalassemia and sickle cell anemia. Current opinion in hematology 13, 142-148 (2006).
28. May, C., Rivella, S., Callegari, J., Heller, G., Gaensler, K.M., Luzzatto, L. & Sadelain, M. Therapeutic haemoglobin synthesis in beta-thalassaemic mice expressing lentivirus-encoded human beta-globin. Nature 406, 82-86 (2000).
29. May, C., Rivella, S., Chadburn, A. & Sadelain, M. Successful treatment of murine beta-thalassemia intermedia by transfer of the human beta-globin gene. Blood 99, 1902-1908 (2002).
30. Rivella, S., May, C., Chadburn, A., Riviere, I. & Sadelain, M. A novel murine model of Cooley anemia and its rescue by lentiviral-mediated human beta-globin gene transfer. Blood 101, 2932-2939 (2003).
31. Sadelain, M., Boulad, F., Lisowki, L., Moi, P. & Riviere, I. Stem cell engineering for the treatment of severe hemoglobinopathies. Curr Mol Med 8, 690-697 (2008).
32. Bank, A., Dorazio, R. & Leboulch, P. A phase I/II clinical trial of beta-globin gene therapy for beta-thalassemia. Ann N Y Acad Sci 1054, 308-316 (2005).
33. Cavazzana-Calvo, M., Payen, E., Negre, O., Wang, G., Hehir, K., Fusil, F., Down, J., Denaro, M., Brady, T., Westerman, K., Cavallesco, R., Gillet-Legrand, B., Caccavelli, L., Sgarra, R., Maouche-Chretien, L., Bernaudin, F., Girot, R., Dorazio, R., Mulder, G.J., Polack, A., Bank, A., Soulier, J., Larghero, J., Kabbara, N., Dalle, B., Gourmel, B., Socie, G., Chretien, S., Cartier, N., Aubourg, P., Fischer, A., Cornetta, K., Galacteros, F., Beuzard, Y., Gluckman, E., Bushman, F., Hacein-Bey-Abina, S. & Leboulch, P. Transfusion independence and HMGA2 activation after gene therapy of human beta-thalassaemia. Nature 467, 318-322 (2010).
34. Braun, C.J., Boztug, K., Paruzynski, A., Witzel, M., Schwarzer, A., Rothe, M., Modlich, U., Beier, R., Gohring, G., Steinemann, D., Fronza, R., Ball, C.R., Haemmerle, R., Naundorf, S., Kuhlcke, K., Rose, M., Fraser, C., Mathias, L., Ferrari, R., Abboud, M.R., Al-Herz, W., Kondratenko, I., Marodi, L., Glimm, H., Schlegelberger, B., Schambach, A., Albert, M.H., Schmidt, M., von Kalle, C. & Klein, C. Gene therapy for Wiskott-Aldrich syndrome--long-term efficacy and genotoxicity. Sci Transl Med 6, 227ra233 (2014).
35. Chang, A.H. & Sadelain, M. The genetic engineering of hematopoietic stem cells: the rise of lentiviral vectors, the conundrum of the ltr, and the promise of lineage-restricted vectors. Mol Ther 15, 445-456 (2007).
36. Pawliuk, R., Westerman, K.A., Fabry, M.E., Payen, E., Tighe, R., Bouhassira, E.E., Acharya, S.A., Ellis, J., London, I.M., Eaves, C.J., Humphries, R.K., Beuzard, Y., Nagel, R.L. & Leboulch, P. Correction of sickle cell disease in transgenic mouse models by gene therapy. Science 294, 2368-2371 (2001).
37. Emery, D.W., Chen, H., Li, Q. & Stamatoyannopoulos, G. Development of a condensed locus control region cassette and testing in retrovirus vectors for A gamma-globin. Blood Cells Mol Dis 24, 322-339 (1998).
38. Miccio, A., Cesari, R., Lotti, F., Rossi, C., Sanvito, F., Ponzoni, M., Routledge, S.J., Chow, C.M., Antoniou, M.N. & Ferrari, G. In vivo selection of genetically modified erythroblastic progenitors leads to long-term correction of beta-thalassemia. Proc Natl Acad Sci U S A 105, 10547-10552 (2008).
39. Sadelain, M., Wang, C.H., Antoniou, M., Grosveld, F. & Mulligan, R.C. Generation of a high-titer retroviral vector capable of expressing high levels of the human beta-globin gene. Proc Natl Acad Sci U S A 92, 6728-6732 (1995).
40. Samakoglu, S., Lisowski, L., Budak-Alpdogan, T., Usachenko, Y., Acuto, S., Di Marzo, R., Maggio, A., Zhu, P., Tisdale, J.F., Riviere, I. & Sadelain, M. A genetic strategy to treat sickle cell anemia by 코어gulating globin transgene expression and RNA interference. Nat Biotechnol 24, 89-94 (2006).
41. Pestina, T.I., Hargrove, P.W., Jay, D., Gray, J.T., Boyd, K.M. & Persons, D.A. Correction of murine sickle cell disease using gamma-globin lentiviral vectors to mediate high-level expression of fetal hemoglobin. Mol Ther 17, 245-252 (2009).
42. Hanawa, H., Yamamoto, M., Zhao, H., Shimada, T. & Persons, D.A. Optimized lentiviral vector design improves titer and transgene expression of vectors containing the chicken beta-globin locus HS4 insulator element. Mol Ther 17, 667-674 (2009).
43. Arumugam, P.I., Scholes, J., Perelman, N., Xia, P., Yee, J.K. & Malik, P. Improved human beta-globin expression from self-inactivating lentiviral vectors carrying the chicken hypersensitive site-4 (cHS4) insulator element. Mol Ther 15, 1863-1871 (2007).
44. Fraser, P., Pruzina, S., Antoniou, M. & Grosveld, F. Each hypersensitive site of the human beta-globin locus control region confers a different developmental pattern of expression on the globin genes. Genes & development 7, 106-113 (1993).
45. Navas, P.A., Peterson, K.R., Li, Q., Skarpidi, E., Rohde, A., Shaw, S.E., Clegg, C.H., Asano, H. & Stamatoyannopoulos, G. Developmental specificity of the interaction between the locus control region and embryonic or fetal globin genes in transgenic mice with an HS3 core deletion. Molecular and cellular biology 18, 4188-4196 (1998).
46. Li, Q. & Stamatoyannopoulos, G. Hypersensitive site 5 of the human beta locus control region functions as a chromatin insulator. Blood 84, 1399-1401 (1994).
47. Li, Q., Zhang, M., Han, H., Rohde, A. & Stamatoyannopoulos, G. Evidence that DNase I hypersensitive site 5 of the human beta-globin locus control region functions as a chromosomal insulator in transgenic mice. Nucleic Acids Res 30, 2484-2491 (2002).
48. Puthenveetil, G., Scholes, J., Carbonell, D., Qureshi, N., Xia, P., Zeng, L., Li, S., Yu, Y., Hiti, A.L., Yee, J.K. & Malik, P. Successful correction of the human beta-thalassemia major phenotype using a lentiviral vector. Blood 104, 3445-3453 (2004).
49. Wilber, A., Nienhuis, A.W. & Persons, D.A. Transcriptional regulation of fetal to adult hemoglobin switching: new therapeutic opportunities. Blood 117, 3945-3953 (2011).
50. Arumugam, P.I., Higashimoto, T., Urbinati, F., Modlich, U., Nestheide, S., Xia, P., Fox, C., Corsinotti, A., Baum, C. & Malik, P. Genotoxic potential of lineage-specific lentivirus vectors carrying the beta-globin locus control region. Mol Ther 17, 1929-1937 (2009).
51. Chang, K.H., Fang, X., Wang, H., Huang, A., Cao, H., Yang, Y., Bonig, H., Stamatoyannopoulos, J.A. & Papayannopoulou, T. Epigenetic modifications and chromosome conformations of the beta globin locus throughout development. Stem cell reviews 9, 397-407 (2013).
52. Papayannopoulou, T., Priestley, G.V., Rohde, A., Peterson, K.R. & Nakamoto, B. Hemopoietic lineage commitment decisions: in vivo evidence from a transgenic mouse model harboring micro LCR-betapro-LacZ as a transgene. Blood 95, 1274-1282 (2000).
53. Nienhuis, A.W. Development of gene therapy for blood disorders: an update. Blood 122, 1556-1564 (2013).
54. Baum, C., Kustikova, O., Modlich, U., Li, Z. & Fehse, B. Mutagenesis and oncogenesis by chromosomal insertion of gene transfer vectors. Hum Gene Ther 17, 253-263 (2006).
55. Nienhuis, A.W., Dunbar, C.E. & Sorrentino, B.P. Genotoxicity of retroviral integration in hematopoietic cells. Mol Ther 13, 1031-1049 (2006).
56. Emery, D.W. The use of chromatin insulators to improve the expression and safety of integrating gene transfer vectors. Hum Gene Ther 22, 761-774 (2011).
57. Evans-Galea, M.V., Wielgosz, M.M., Hanawa, H., Srivastava, D.K. & Nienhuis, A.W. Suppression of clonal dominance in cultured human lymphoid cells by addition of the cHS4 insulator to a lentiviral vector. Mol Ther 15, 801-809 (2007).
58. Rivella, S., Callegari, J.A., May, C., Tan, C.W. & Sadelain, M. The cHS4 insulator increases the probability of retroviral expression at random chromosomal integration sites. J Virol 74, 4679-4687 (2000).
59. Emery, D.W., Yannaki, E., Tubb, J. & Stamatoyannopoulos, G. A chromatin insulator protects retrovirus vectors from chromosomal position effects. Proc Natl Acad Sci U S A 97, 9150-9155 (2000).
60. Emery, D.W., Yannaki, E., Tubb, J., Nishino, T., Li, Q. & Stamatoyannopoulos, G. Development of virus vectors for gene therapy of beta chain hemoglobinopathies: flanking with a chromatin insulator reduces gamma-globin gene silencing in vivo. Blood 100, 2012-2019 (2002).
61. Yannaki, E., Tubb, J., Aker, M., Stamatoyannopoulos, G. & Emery, D.W. Topological constraints governing the use of the chicken HS4 chromatin insulator in oncoretrovirus vectors. Mol Ther 5, 589-598 (2002).
62. Hino, S., Fan, J., Taguwa, S., Akasaka, K. & Matsuoka, M. Sea urchin insulator protects lentiviral vector from silencing by maintaining active chromatin structure. Gene Ther 11, 819-828 (2004).
63. Ramezani, A., Hawley, T.S. & Hawley, R.G. Performance- and safety-enhanced lentiviral vectors containing the human interferon-beta scaffold attachment region and the chicken beta-globin insulator. Blood 101, 4717-4724 (2003).
64. Ramezani, A., Hawley, T.S. & Hawley, R.G. Combinatorial incorporation of enhancer-blocking components of the chicken beta-globin 5'HS4 and human T-cell receptor alpha/delta BEAD-1 insulators in self-inactivating retroviral vectors reduces their genotoxic potential. Stem Cells 26, 3257-3266 (2008).
65. Yannaki, E., Emery, D.W. & Stamatoyannopoulos, G. Gene therapy for beta-thalassaemia: the continuing challenge. Expert reviews in molecular medicine 12, e31 (2010).
66. Persons, D.A. The challenge of obtaining therapeutic levels of genetically modified hematopoietic stem cells in beta-thalassemia patients. Ann N Y Acad Sci 1202, 69-74 (2010).
67. Perumbeti, A. & Malik, P. Therapy for beta-globinopathies: a brief review and determinants for successful and safe correction. Ann N Y Acad Sci 1202, 36-44 (2010).
68. Johnson, K.D., Grass, J.A., Park, C., Im, H., Choi, K. & Bresnick, E.H. Highly restricted localization of RNA polymerase II within a locus control region of a tissue-specific chromatin domain. Molecular and cellular biology 23, 6484-6493 (2003).
69. Vieira, K.F., Levings, P.P., Hill, M.A., Crusselle, V.J., Kang, S.H., Engel, J.D. & Bungert, J. Recruitment of transcription complexes to the beta-globin gene locus in vivo and in vitro. J Biol Chem 279, 50350-50357 (2004).
70. Levings, P.P., Zhou, Z., Vieira, K.F., Crusselle-Davis, V.J. & Bungert, J. Recruitment of transcription complexes to the beta-globin locus control region and transcription of hypersensitive site 3 prior to erythroid differentiation of murine embryonic stem cells. The FEBS journal 273, 746-755 (2006).
71. Felsenfeld, G. & Groudine, M. Controlling the double helix. Nature 421, 448-453 (2003).
72. Felsenfeld, G. Chromatin as an essential part of the transcriptional mechanism. Nature 355, 219-224 (1992).
73. Brownell, J.E. & Allis, C.D. Special HATs for special occasions: linking histone acetylation to chromatin assembly and gene activation. Curr Opin Genet Dev 6, 176-184 (1996).
74. Kingston, R.E. & Narlikar, G.J. ATP-dependent remodeling and acetylation as regulators of chromatin fluidity. Genes & development 13, 2339-2352 (1999).
75. Tsukiyama, T. & Wu, C. Chromatin remodeling and transcription. Curr Opin Genet Dev 7, 182-191 (1997).
76. Wolffe, A.P., Wong, J. & Pruss, D. Activators and repressors: making use of chromatin to regulate transcription. Genes to cells : devoted to molecular & cellular mechanisms 2, 291-302 (1997).
77. Kadonaga, J.T. Eukaryotic transcription: an interlaced network of transcription factors and chromatin-modifying machines. Cell 92, 307-313 (1998).
78. Struhl, K. Histone acetylation and transcriptional regulatory mechanisms. Genes & development 12, 599-606 (1998).
79. Gross, D.S. & Garrard, W.T. Nuclease hypersensitive sites in chromatin. Annual review of biochemistry 57, 159-197 (1988).
80. Elgin, S.C. Anatomy of hypersensitive sites. Nature 309, 213-214 (1984).
81. Wu, C. The 5' ends of Drosophila heat shock genes in chromatin are hypersensitive to DNase I. Nature 286, 854-860 (1980).
82. Felsenfeld, G., Boyes, J., Chung, J., Clark, D. & Studitsky, V. Chromatin structure and gene expression. Proc Natl Acad Sci U S A 93, 9384-9388 (1996).
83. Burgess-Beusse, B., Farrell, C., Gaszner, M., Litt, M., Mutskov, V., Recillas-Targa, F., Simpson, M., West, A. & Felsenfeld, G. The insulation of genes from external enhancers and silencing chromatin. Proc Natl Acad Sci U S A 99 Suppl 4, 16433-16437 (2002).
84. Elgin, S.C. DNAase I-hypersensitive sites of chromatin. Cell 27, 413-415 (1981).
85. McGhee, J.D., Wood, W.I., Dolan, M., Engel, J.D. & Felsenfeld, G. A 200 base pair region at the 5' end of the chicken adult beta-globin gene is accessible to nuclease digestion. Cell 27, 45-55 (1981).
86. Lowrey, C.H., Bodine, D.M. & Nienhuis, A.W. Mechanism of DNase I hypersensitive site formation within the human globin locus control region. Proc Natl Acad Sci U S A 89, 1143-1147 (1992).
87. Adams, C.C. & Workman, J.L. Binding of disparate transcriptional activators to nucleosomal DNA is inherently cooperative. Molecular and cellular biology 15, 1405-1421 (1995).
88. McArthur, M., Gerum, S. & Stamatoyannopoulos, G. Quantification of DNaseI-sensitivity by real-time PCR: quantitative analysis of DNaseI-hypersensitivity of the mouse beta-globin LCR. J Mol Biol 313, 27-34 (2001).
89. Dorschner, M.O., Hawrylycz, M., Humbert, R., Wallace, J.C., Shafer, A., Kawamoto, J., Mack, J., Hall, R., Goldy, J., Sabo, P.J., Kohli, A., Li, Q., McArthur, M. & Stamatoyannopoulos, J.A. High-throughput localization of functional elements by quantitative chromatin profiling. Nat Methods 1, 219-225 (2004).
90. Sabo, P.J., Kuehn, M.S., Thurman, R., Johnson, B.E., Johnson, E.M., Cao, H., Yu, M., Rosenzweig, E., Goldy, J., Haydock, A., Weaver, M., Shafer, A., Lee, K., Neri, F., Humbert, R., Singer, M.A., Richmond, T.A., Dorschner, M.O., McArthur, M., Hawrylycz, M., Green, R.D., Navas, P.A., Noble, W.S. & Stamatoyannopoulos, J.A. Genome-scale mapping of DNase I sensitivity in vivo using tiling DNA microarrays. Nat Methods 3, 511-518 (2006).
91. Sabo, P.J., Hawrylycz, M., Wallace, J.C., Humbert, R., Yu, M., Shafer, A., Kawamoto, J., Hall, R., Mack, J., Dorschner, M.O., McArthur, M. & Stamatoyannopoulos, J.A. Discovery of functional noncoding elements by digital analysis of chromatin structure. Proc Natl Acad Sci U S A 101, 16837-16842 (2004).
92. Sabo, P.J., Humbert, R., Hawrylycz, M., Wallace, J.C., Dorschner, M.O., McArthur, M. & Stamatoyannopoulos, J.A. Genome-wide identification of DNaseI hypersensitive sites using active chromatin sequence libraries. Proc Natl Acad Sci U S A 101, 4537-4542 (2004).
93. Thurman, R.E., Rynes, E., Humbert, R., Vierstra, J., Maurano, M.T., Haugen, E., Sheffield, N.C., Stergachis, A.B., Wang, H., Vernot, B., Garg, K., John, S., Sandstrom, R., Bates, D., Boatman, L., Canfield, T.K., Diegel, M., Dunn, D., Ebersol, A.K., Frum, T., Giste, E., Johnson, A.K., Johnson, E.M., Kutyavin, T., Lajoie, B., Lee, B.K., Lee, K., London, D., Lotakis, D., Neph, S., Neri, F., Nguyen, E.D., Qu, H., Reynolds, A.P., Roach, V., Safi, A., Sanchez, M.E., Sanyal, A., Shafer, A., Simon, J.M., Song, L., Vong, S., Weaver, M., Yan, Y., Zhang, Z., Zhang, Z., Lenhard, B., Tewari, M., Dorschner, M.O., Hansen, R.S., Navas, P.A., Stamatoyannopoulos, G., Iyer, V.R., Lieb, J.D., Sunyaev, S.R., Akey, J.M., Sabo, P.J., Kaul, R., Furey, T.S., Dekker, J., Crawford, G.E. & Stamatoyannopoulos, J.A. The accessible chromatin landscape of the human genome. Nature 489, 75-82 (2012).
94. Stergachis, A.B., Neph, S., Reynolds, A., Humbert, R., Miller, B., Paige, S.L., Vernot, B., Cheng, J.B., Thurman, R.E., Sandstrom, R., Haugen, E., Heimfeld, S., Murry, C.E., Akey, J.M. & Stamatoyannopoulos, J.A. Developmental fate and cellular maturity encoded in human regulatory DNA landscapes. Cell 154, 888-903 (2013).
95. Neph, S., Stergachis, A.B., Reynolds, A., Sandstrom, R., Borenstein, E. & Stamatoyannopoulos, J.A. Circuitry and dynamics of human transcription factor regulatory networks. Cell 150, 1274-1286 (2012).
96. Maurano, M.T., Humbert, R., Rynes, E., Thurman, R.E., Haugen, E., Wang, H., Reynolds, A.P., Sandstrom, R., Qu, H., Brody, J., Shafer, A., Neri, F., Lee, K., Kutyavin, T., Stehling-Sun, S., Johnson, A.K., Canfield, T.K., Giste, E., Diegel, M., Bates, D., Hansen, R.S., Neph, S., Sabo, P.J., Heimfeld, S., Raubitschek, A., Ziegler, S., Cotsapas, C., Sotoodehnia, N., Glass, I., Sunyaev, S.R., Kaul, R. & Stamatoyannopoulos, J.A. Systematic localization of common disease-associated variation in regulatory DNA. Science 337, 1190-1195 (2012).
97. Stergachis, A.B., Haugen, E., Shafer, A., Fu, W., Vernot, B., Reynolds, A., Raubitschek, A., Ziegler, S., LeProust, E.M., Akey, J.M. & Stamatoyannopoulos, J.A. Exonic transcription factor binding directs codon choice and affects protein evolution. Science 342, 1367-1372 (2013).
98. Neph, S., Vierstra, J., Stergachis, A.B., Reynolds, A.P., Haugen, E., Vernot, B., Thurman, R.E., John, S., Sandstrom, R., Johnson, A.K., Maurano, M.T., Humbert, R., Rynes, E., Wang, H., Vong, S., Lee, K., Bates, D., Diegel, M., Roach, V., Dunn, D., Neri, J., Schafer, A., Hansen, R.S., Kutyavin, T., Giste, E., Weaver, M., Canfield, T., Sabo, P., Zhang, M., Balasundaram, G., Byron, R., MacCoss, M.J., Akey, J.M., Bender, M.A., Groudine, M., Kaul, R. & Stamatoyannopoulos, J.A. An expansive human regulatory lexicon encoded in transcription factor footprints. Nature 489, 83-90 (2012).
99. Ramezani, A., Hawley, T.S. & Hawley, R.G. Stable gammaretroviral vector expression during embryonic stem cell-derived in vitro hematopoietic development. Mol Ther 14, 245-254 (2006).
100. Recillas-Targa, F., Pikaart, M.J., Burgess-Beusse, B., Bell, A.C., Litt, M.D., West, A.G., Gaszner, M. & Felsenfeld, G. Position-effect protection and enhancer blocking by the chicken beta-globin insulator are separable activities. Proc Natl Acad Sci U S A 99, 6883-6888 (2002).
101. Gaszner, M. & Felsenfeld, G. Insulators: exploiting transcriptional and epigenetic mechanisms. Nat Rev Genet 7, 703-713 (2006).
102. Wallace, J.A. & Felsenfeld, G. We gather together: insulators and genome organization. Curr Opin Genet Dev 17, 400-407 (2007).
103. Chung, J.H., Bell, A.C. & Felsenfeld, G. Characterization of the chicken beta-globin insulator. Proc Natl Acad Sci U S A 94, 575-580 (1997).
104. Bell, A.C., West, A.G. & Felsenfeld, G. The protein CTCF is required for the enhancer blocking activity of vertebrate insulators. Cell 98, 387-396 (1999).
105. Ryu, B.Y., Persons, D.A., Evans-Galea, M.V., Gray, J.T. & Nienhuis, A.W. A chromatin insulator blocks interactions between globin regulatory elements and cellular promoters in erythroid cells. Blood Cells Mol Dis 39, 221-228 (2007).
106. Ryu, B.Y., Evans-Galea, M.V., Gray, J.T., Bodine, D.M., Persons, D.A. & Nienhuis, A.W. An experimental system for the evaluation of retroviral vector design to diminish the risk for proto-oncogene activation. Blood 111, 1866-1875 (2008).
107. Yao, S., Osborne, C.S., Bharadwaj, R.R., Pasceri, P., Sukonnik, T., Pannell, D., Recillas-Targa, F., West, A.G. & Ellis, J. Retrovirus silencer blocking by the cHS4 insulator is CTCF independent. Nucleic Acids Res 31, 5317-5323 (2003).
108. Nishino, T., Tubb, J. & Emery, D.W. Partial correction of murine beta-thalassemia with a gammaretrovirus vector for human gamma-globin. Blood Cells Mol Dis 37, 1-7 (2006).
109. Aker, M., Tubb, J., Groth, A.C., Bukovsky, A.A., Bell, A.C., Felsenfeld, G., Kiem, H.P., Stamatoyannopoulos, G. & Emery, D.W. Extended core sequences from the cHS4 insulator are necessary for protecting retroviral vectors from silencing position effects. Hum Gene Ther 18, 333-343 (2007).
110. Li, C.L. & Emery, D.W. The cHS4 chromatin insulator reduces gammaretroviral vector silencing by epigenetic modifications of integrated provirus. Gene Ther 15, 49-53 (2008).
111. Ma, Y., Ramezani, A., Lewis, R., Hawley, R.G. & Thomson, J.A. High-level sustained transgene expression in human embryonic stem cells using lentiviral vectors. Stem Cells 21, 111-117 (2003).
112. Chang, L.J., Liu, X. & He, J. Lentiviral siRNAs targeting multiple highly conserved RNA sequences of human immunodeficiency virus type 1. Gene Ther 12, 1133-1144 (2005).
113. Pluta, K., Luce, M.J., Bao, L., Agha-Mohammadi, S. & Reiser, J. Tight control of transgene expression by lentivirus vectors containing second-generation tetracycline-responsive promoters. J Gene Med 7, 803-817 (2005).
114. Jakobsson, J., Rosenqvist, N., Thompson, L., Barraud, P. & Lundberg, C. Dynamics of transgene expression in a neural stem cell line transduced with lentiviral vectors incorporating the cHS4 insulator. Experimental cell research 298, 611-623 (2004).
115. Leboulch, P., Huang, G.M., Humphries, R.K., Oh, Y.H., Eaves, C.J., Tuan, D.Y. & London, I.M. Mutagenesis of retroviral vectors transducing human beta-globin gene and beta-globin locus control region derivatives results in stable transmission of an active transcriptional structure. EMBO J 13, 3065-3076 (1994).
116. Kim, T.H., Abdullaev, Z.K., Smith, A.D., Ching, K.A., Loukinov, D.I., Green, R.D., Zhang, M.Q., Lobanenkov, V.V. & Ren, B. Analysis of the vertebrate insulator protein CTCF-binding sites in the human genome. Cell 128, 1231-1245 (2007).
117. Yusufzai, T.M. & Felsenfeld, G. The 5'-HS4 chicken beta-globin insulator is a CTCF-dependent nuclear matrix-associated element. Proc Natl Acad Sci U S A 101, 8620-8624 (2004).
118. Phillips, J.E. & Corces, V.G. CTCF: master weaver of the genome. Cell 137, 1194-1211 (2009).
119. Giles, K.E., Gowher, H., Ghirlando, R., Jin, C. & Felsenfeld, G. Chromatin boundaries, insulators, and long-range interactions in the nucleus. Cold Spring Harbor symposia on quantitative biology 75, 79-85 (2010).
120. Barski, A., Cuddapah, S., Cui, K., Roh, T.Y., Schones, D.E., Wang, Z., Wei, G., Chepelev, I. & Zhao, K. High-resolution profiling of histone methylations in the human genome. Cell 129, 823-837 (2007).
121. Wang, H., Maurano, M.T., Qu, H., Varley, K.E., Gertz, J., Pauli, F., Lee, K., Canfield, T., Weaver, M., Sandstrom, R., Thurman, R.E., Kaul, R., Myers, R.M. & Stamatoyannopoulos, J.A. Widespread plasticity in CTCF occupancy linked to DNA methylation. Genome research 22, 1680-1688 (2012).
122. Schmidt, D., Schwalie, P.C., Wilson, M.D., Ballester, B., Goncalves, A., Kutter, C., Brown, G.D., Marshall, A., Flicek, P. & Odom, D.T. Waves of retrotransposon expansion remodel genome organization and CTCF binding in multiple mammalian lineages. Cell 148, 335-348 (2012).
123. Renda, M., Baglivo, I., Burgess-Beusse, B., Esposito, S., Fattorusso, R., Felsenfeld, G. & Pedone, P.V. Critical DNA binding interactions of the insulator protein CTCF: a small number of zinc fingers mediate strong binding, and a single finger-DNA interaction controls binding at imprinted loci. J Biol Chem 282, 33336-33345 (2007).
124. Dickson, J., Gowher, H., Strogantsev, R., Gaszner, M., Hair, A., Felsenfeld, G. & West, A.G. VEZF1 elements mediate protection from DNA methylation. PLoS Genet 6, e1000804 (2010).
125. Li, C.L., Xiong, D., Stamatoyannopoulos, G. & Emery, D.W. Genomic and functional assays demonstrate reduced gammaretroviral vector genotoxicity associated with use of the cHS4 chromatin insulator. Mol Ther 17, 716-724 (2009).
126. Lisowski, L. & Sadelain, M. Locus control region elements HS1 and HS4 enhance the therapeutic efficacy of globin gene transfer in beta-thalassemic mice. Blood 110, 4175-4178 (2007).
127. Nagel, R.L., Bookchin, R.M., Johnson, J., Labie, D., Wajcman, H., Isaac-Sodeye, W.A., Honig, G.R., Schiliro, G., Crookston, J.H. & Matsutomo, K. Structural bases of the inhibitory effects of hemoglobin F and hemoglobin A2 on the polymerization of hemoglobin S. Proc Natl Acad Sci U S A 76, 670-672 (1979).
128. Sadelain et al., Proc. Nat'l Acad. Sci. (USA) (1995);92:6728-6732.
129. Armstrong, J.A., Emerson, B.M., 1996. NFE2 disrupts chromatin structure at human fl-globin locus control region hypersensitive site 2 in vitro. Mol. Cell. Biol. 16, 5634-5644.
130. Caterina, J.J., Ciavatta, D.J., Donze, D., Behringer, R.R., Townes, T.M., 1994. Multiple elements in human fl-globin locus control region 5' HS2 are involved in enhancer activity and position-independent transgene expression. Nucleic Acids Res. 22, 1006 1011.
131. Moi, P., Kan, Y.W., 1990. Synergistic enhancement of globin gene expression by activator protein-l-like proteins. Proc. Natl. Acad, Sci. USA 87, 9000-9004.
132. Ney, P., Sorrentino, B., McDonagh, K., Nienhuis, A., 1990. Tandem AP-l-binding sites within the human /j-globin dominant control region function as an inducible enhancer in erythroid cells. Genes Dev. 4, 993 1006.
133. Shivdasani, R.A., Rosenblatt, M.F., Zucker-Franklin, D., Jackson, C.W., Hunt, P., Saris, C.J.M., Orkin, S.H., 1995. Transcription factor NF-E2 is required for platelet formation independent of the actions of thrombopoietin/MGDF in megakaryocyte development. Cell 81,695-704.
134. Talbot, D., Grosveld, F., 1991. The 5'HS2 of the globin locus control region enhances transcription through the interaction of a multimeric complex binding at two functionally distinct NF-E2 binding sites. EMBO J. 10, 1391-1398.
135. Hardison et al., Gene (1997);205:73-94.
136. Elnitski et al., The Journal of Biological Chemistry (1997);272(1):369-378; Horak et al., PNAS (2002);99(5):2924-2929.
137. Shimotsuma et al., Journal of Biological Chemistry (2010);285(19):14495-14503.
상기 설명으로부터, 본원에 기재된 본 개시된 보호대상을 다양한 용도들 및 조건에 맞추기 위해 변경 및 변형시킬 수 있다는 것은 자명할 것이다. 이러한 구현예들도 하기 청구범위 내에 있다.
본 명세서에서 언급된 접근번호 또는 참조번호에 의해 지칭된 모든 특허들 및 공개문헌들 및 서열들은 마치 각각의 독립적인 특허 및 공개문헌 및 서열이 참고로 도입되는 것으로 구체적으로 및 개별적으로 표시되는 것처럼 동일한 정도로 본원에 참고로 도입된다.
<110> MEMORIAL SLOAN-KETTERING CANCER CENTER UNIVERSITY OF WASHINGTON <120> GLOBIN GENE THERAPY FOR TREATING HEMOGLOBINOPATHIES <130> 2017-FPA-7991 <150> 62/045,997 <151> 2014-09-04 <160> 26 <170> PatentIn version 3.5 <210> 1 <211> 305 <212> DNA <213> Homo sapiens <400> 1 tccttccttt ctaaatgacg agagagacag aagaattctt caaggttagt gtgtccagca 60 tgcaaccttt ccttcctgga tgagcatccc tggagtagga gagccagcct gcctcctgcg 120 ctggcacaga gcccggttcc ctagacaact gcctctccaa atctgatgtc cagcgccacc 180 tggtgtccac atcaagcaga cacaattaat agtcaacctg ttcaggaaaa ctgtgagggg 240 gaaaaaaaag aaagaggatt tatgaaggga aaagaaagtt tagaggatat gccacgattg 300 gctag 305 <210> 2 <211> 1074 <212> DNA <213> Homo sapiens <400> 2 aagtaaactt ccacaaccgc aagcttattg aggctaaggc atctgtgaag gaaagaaaca 60 tctcctctaa accactatgc tgctagagcc tcttttctgt actcaagcct cattcagaca 120 ctagtgtcac cagtctcctc atatacctat tgtattttct tcttcttgct ggtttagtca 180 tgttttctgg gagcttaggg gcttatttta ttttgttttg ttttctaatc aacagagatg 240 ggcaaaccca ttattttttt ctttagactt gggatggtga tagctgggca gcgtcagaaa 300 ctgtgtgtgg atatagataa gagctcggac tatgctgagc tgtgatgagg gagggaccta 360 gccaaaggca gtgagagtca gaatgctcct gctattgcct tctcagtccc cacgcttggt 420 ttctacacaa gtagatacat agaaaaggct ataggttagt gtttgagagt cctgcatgag 480 ttagttgctc agaaatgccc gataaatatg ttatgtgtgt ttatgtatat atatgtttta 540 tatatatata tgtgtgtgtg tgtgtgtgtg tgtgttgtgt ttacaaatat gtgattatca 600 tcaaaacgtg agggctaaag tgaccagata acttgcaggt cctaggatac caggaaaata 660 aattacattc caaaaattta actgagactt taaaaaaaaa aaaaaaaaaa aaaaaaaaac 720 cagtgatcca tggacacagg gaggggaaca tcacacactg gggcctgttg ggggtggggg 780 gctaggggaa ggatagcatt aggagaaata cctaatgtag atgacgggtt gatgggtgca 840 gcaaaccacc atggcacatg taccccagaa cttaaagcat attaaaaaaa cagtgatcat 900 aaaagaagct caaatttaac tataagagac ggaatggctc ccacaattct taactataat 960 cttacagaat attctcattg aatagaagta tgcttatcat tagagatttg gacagccagg 1020 aaagcacaga aaaaaaaaaa aggagctctg ttgccttata gcctagaggt gttt 1074 <210> 3 <211> 602 <212> DNA <213> Homo sapiens <400> 3 ggcatctgtg aaggaaagaa acatctcctc taaaccacta tgctgctaga gcctcttttc 60 tgtactcaag cctcattcag acactagtgt caccagtctc ctcatatacc tattgtattt 120 tcttcttctt gctggtttag tcatgttttc tgggagctta ggggcttatt ttattttgtt 180 ttgttttcta atcaacagag atgggcaaac ccattatttt tttctttaga cttgggatgg 240 tgatagctgg gcagcgtcag aaactgtgtg tggatataga taagagctcg gactatgctg 300 agctgtgatg agggagggac ctagccaaag gcagtgagag tcagaatgct cctgctattg 360 ccttctcagt ccccacgctt ggtttctaca caagtagata catagaaaag gctataggtt 420 agtgtttgag agtcctgcat gagttagttg ctcagaaatg cccgataaat atgttatgtg 480 tgtttatgta tatatatgtt ttatatatat atatgtgtgt gtgtgtgtgt gtgtgtgttg 540 tgtttacaaa tatgtgatta tcatcaaaac gtgagggcta aagtgaccag ataacttgca 600 gg 602 <210> 4 <211> 489 <212> DNA <213> Homo sapiens <400> 4 ggcatctgtg aaggaaagaa acatctcctc taaaccacta tgctgctaga gcctcttttc 60 tgtactcaag cctcattcag acactagtgt caccagtctc ctcatatacc tattgtattt 120 tcttcttctt gctggtttag tcatgttttc tgggagctta ggggcttatt ttattttgtt 180 ttgttttcta atcaacagag atgggcaaac ccattatttt tttctttaga cttgggatgg 240 tgatagctgg gcagcgtcag aaactgtgtg tggatataga taagagctcg gactatgctg 300 agctgtgatg agggagggac ctagccaaag gcagtgagag tcagaatgct cctgctattg 360 ccttctcagt ccccacgctt ggtttctaca caagtagata catagaaaag gctataggtt 420 agtgtttgag agtcctgcat gagttagttg ctcagaaatg cccgataaat atgttatgtg 480 tgtttatgt 489 <210> 5 <211> 1301 <212> DNA <213> Homo sapiens <400> 5 aagctttcat taaaaaaagt ctaaccagct gcattcgact ttgactgcag cagctggtta 60 gaaggttcta ctggaggagg gtcccagccc attgctaaat taacatcagg ctctgagact 120 ggcagtatat ctctaacagt ggttgatgct atcttctgga acttgcctgc tacattgaga 180 ccactgaccc atacatagga agcccatagc tctgtcctga actgttaggc cactggtcca 240 gagagtgtgc atctcctttg atcctcataa taaccctatg agatagacac aattattact 300 cttactttat agatgatgat cctgaaaaca taggagtcaa ggcacttgcc cctagctggg 360 ggtatagggg agcagtccca tgtagtagta gaatgaaaaa tgctgctatg ctgtgcctcc 420 cccacctttc ccatgtctgc cctctactca tggtctatct ctcctggctc ctgggagtca 480 tggactccac ccagcaccac caacctgacc taaccaccta tctgagcctg ccagcctata 540 acccatctgg gccctgatag ctggtggcca gccctgaccc caccccaccc tccctggaac 600 ctctgataga cacatctggc acaccagctc gcaaagtcac cgtgagggtc ttgtgtttgc 660 tgagtcaaaa ttccttgaaa tccaagtcct tagagactcc tgctcccaaa tttacagtca 720 tagacttctt catggctgtc tcctttatcc acagaatgat tcctttgctt cattgcccca 780 tccatctgat cctcctcatc agtgcagcac agggcccatg agcagtagct gcagagtctc 840 acataggtct ggcactgcct ctgacatgtc cgaccttagg caaatgcttg actcttctga 900 gctcagtctt gtcatggcaa aataaagata ataatagtgt ttttttatgg agttagcgtg 960 aggatggaaa acaatagcaa aattgattag actataaaag gtctcaacaa atagtagtag 1020 attttatcat ccattaatcc ttccctctcc tctcttactc atcccatcac gtatgcctct 1080 taattttccc ttacctataa taagagttat tcctcttatt atattcttct tatagtgatt 1140 ctggatatta aagtgggaat gaggggcagg ccactaacga agaagatgtt tctcaaagaa 1200 gccattctcc ccacatagat catctcagca gggttcagga agataaagga ggatcaaggt 1260 cgaaggtagg aactaaggaa gaacactggg caagtggatc c 1301 <210> 6 <211> 1065 <212> DNA <213> Homo sapiens <400> 6 tgagcccctt ttcctctaac tgaaagaagg aaaaaaaaaa tggaacccaa aatattctac 60 atagtttcca tgtcacagcc agggctgggc agtctcctgt tatttctttt aaaataaata 120 tatcatttaa atgcataaat aagcaaaccc tgctcgggaa tgggagggag agtctctgga 180 gtccacccct tctcggccct ggctctgcag atagtgctat caaagccctg acagagccct 240 gcccattgct gggccttgga gtgagtcagc ctagtagaga ggcagggcaa gccatctcat 300 agctgctgag tgggagagag aaaagggctc attgtctata aactcaggtc atggctattc 360 ttattctcac actaagaaaa agaatgagat gtctacatat accctgcgtc ccctcttgtg 420 tactggggcc cccaagagct ctctaaaagt gatggcaaag tcattgcgct agatgccatc 480 ccatctatta taaacctgca tttgtctcca cacaccagtc atggacaata accctcctcc 540 caggtccacg tgcttgtctt tgtataatac tcaagtaatt tcggaaaatg tattctttca 600 atcttgttct gttattcctg tttcaatggc ttagtagaaa aagtacatac ttgttttccc 660 ataaattgac aatagacaat ttcacatcaa tgtctatatg ggtcgttgtg tttgctgtgt 720 ttgcaaaaac tcacaataac tttatattgt tactactcta agaaagttac aacatggtga 780 atacaagaga aagctattac aagtccagaa aataaaagtt atcatcttga ggcctcagct 840 ttctaggaat aatatcaata ttacaaaatt taatctaaca attatgaaca gcaatgagat 900 aatatgtaca aagtacccag acctatgtgg tagagcatca aggaagcgca ttgcggagca 960 gttttttgtt tgtttgtttt tgtattctgt ttcgtgaggc aaggtttcac tctgctgtcc 1020 aggctggagt gcagtggcaa gatcatgtct cactgcagcc ttgac 1065 <210> 7 <211> 1065 <212> DNA <213> Homo sapiens <400> 7 tgagcccctt ttcctctaac tgaaagaagg aaaaaaaaaa tggaacccaa aatattctac 60 atagtttcca tgtcacagcc agggctgggc agtctcctgt tatttctttt aaaataaata 120 tatcattaaa tgcataaata agcaaaccct gctcgggaat gggagggaga gtctctggag 180 tccacccctt ctcggccctg gctctgcaga tagtgctatc aaagccctga cagagccctg 240 cccattgctg ggccttggag tgagtcagcc tagtagagag gcagggcaag ccatctcata 300 gctgctgagt gggagagaga aaagggctca ttgtctataa actcaggtca tggctattct 360 tattctcaca ctaagaaaaa gaatgagatg tctacatata ccctgcgtcc cctcttgtgt 420 actggggccc ccaagagctc tctaaaagtg atggcaaagt cattgcgcta gatgccatcc 480 catctattat aaacctgcat ttgtctccac acaccagtca tggacaataa ccctcctccc 540 aggtccacgt gcttgtcttt gtataatact caagtaattt cggaaaatgt attctttcaa 600 tcttgttctg ttattcctgt ttcaatggct tagtagaaaa agtacatact tgttttccca 660 taaattgaca atagacaatt tcacatcaat gtctatatgg gtcgttgtgt ttgctgtgtt 720 tgcaaaaact cacaataact ttatattgtt actactctaa gaaagttaca acatggtgaa 780 tacaagagaa agctattaca agtccagaaa ataaaagtta tcatcttgag gcctcagctt 840 tctaggaata atatcaatat tacaaaatta atctaacaat tatgaacagc aatgagataa 900 tatgtacaaa gtacccagac ctatgtggta gagcatcaag gaagcgcatt gcggagcagt 960 tttttgtttg tttgtttttg tattctgttt cgtgaggcaa ggtttcactc tgctgtccag 1020 gctggagtgc agtggcaaga tcatgtctca ctgcagcctt gacac 1065 <210> 8 <211> 446 <212> DNA <213> Homo sapiens <400> 8 tggaacccaa aatattctac atagtttcca tgtcacagcc agggctgggc agtctcctgt 60 tatttctttt aaaataaata tatcatttaa atgcataaat aagcaaaccc tgctcgggaa 120 tgggagggag agtctctgga gtccacccct tctcggccct ggctctgcag atagtgctat 180 caaagccctg acagagccct gcccattgct gggccttgga gtgagtcagc ctagtagaga 240 ggcagggcaa gccatctcat agctgctgag tgggagagag aaaagggctc attgtctata 300 aactcaggtc atggctattc ttattctcac actaagaaaa agaatgagat gtctacatat 360 accctgcgtc ccctcttgtg tactggggtc cccaagagct ctctaaaagt gatggcaaag 420 tcattgcgct agatgccatc ccatct 446 <210> 9 <211> 860 <212> DNA <213> Homo sapiens <400> 9 gtatatgtgt atatatatat atatatattc aggaaataat atattctaga atatgtcaca 60 ttctgtctca ggcatccatt ttctttatga tgccgtttga ggtggagttt tagtcaggtg 120 gtcagcttct cctttttttt gccatctgcc ctgtaagcat cctgctgggg acccagatag 180 gagtcatcac tctaggctga gaacatctgg gcacacaccc taagcctcag catgactcat 240 catgactcag cattgctgtg cttgagccag aaggtttgct tagaaggtta cacagaacca 300 gaaggcgggg gtggggcact gaccccgaca ggggcctggc cagaactgct catgcttgga 360 ctatgggagg tcactaatgg agacacacag aaatgtaaca ggaactaagg aaaaactgaa 420 gcttatttaa tcagagatga gatgctggaa gggatagagg gagctgagct tgtaaaaagt 480 atagtaatca ttcagcaaat ggttttgaag cacctgctgg atgctaaaca ctattttcag 540 tgcttgaatc ataaataaga ataaaacatg tatcttattc cccacaagag tccaagtaaa 600 aaataacagt taattataat gtgctctgtc ccccaggctg gagtgcagtg gcacgatctc 660 agctcactgc aacctccgcc tcccgggttc aagcaattct cctgcctcag ccaccctaat 720 agctgggatt acaggtgcac accaccatgc caggctaatt tttgtacttt ttgtagaggc 780 agggtatcac catgttgtcc aagatggtct tgaactcctg agctccaagc agtccaccca 840 cctcagcctc ccaaagtgct 860 <210> 10 <211> 613 <212> DNA <213> Homo sapiens <400> 10 aagcaataga tggctctgcc ctgactttta tgcccagccc tggctcctgc cctccctgct 60 cctgggagta gattggccaa ccctagggtg tggctccaca gggtgaggtc taagtgatga 120 cagccgtacc tgtccttggc tcttctggca ctggcttagg agttggactt caaaccctca 180 gccctccctc taagatatat ctcttggccc cataccatca gtacaaattg ctactaaaaa 240 catcctcctt tgcaagtgta tttacgtaat atttggaatc acagcttggt aagcatattg 300 aagatcgttt tcccaatttt cttattacac aaataagaaa ttgatgcact aaaagtggaa 360 gagttttgtc taccataatt cagctttggg atatgtagat ggatctcttc ctgcgtctcc 420 agaatatgca aaatacttac aggacagaat ggatgaaaac tctacctcag ttctaagcat 480 atcttctcct tatttggatt aaaaccttct ggtaagaaaa gaaaaaaaat atatatatat 540 atgtgtatat atacacacat acatatacat atatatgcat tcatttgttg ttgtttttct 600 taatttgctc atg 613 <210> 11 <211> 265 <212> DNA <213> Homo sapiens <400> 11 aagcaataga tggctctgcc ctgactttta tgcccagccc tggctcctgc cctccctgct 60 cctgggagta gattggccaa ccctagggtg tggctccaca gggtgaggtc taagtgatga 120 cagccgtacc tgtccttggc tcttctggca ctggcttagg agttggactt caaaccctca 180 gccctccctc taagatatat ctcttggccc cataccatca gtacaaattg ctactaaaaa 240 catcctcctt tgcaagtgta tttac 265 <210> 12 <211> 879 <212> DNA <213> Homo sapiens <400> 12 taggtattga ataagaaaaa tgaagttaag gtggttgatg gtaacactat gctaataact 60 gcagagccag aagcaccata agggacatga taagggagcc agcagacctc tgatctcttc 120 ctgaatgcta atcttaaaca tcctgaggaa gaatgggact tccatttggg gtgggcctat 180 gatagggtaa taagacagta gtgaatatca agctacaaaa agcccccttt caaattcttc 240 tcagtcctaa cttttcatac taagcccagt ccttccaaag cagactgtga aagagtgata 300 gttccgggag actagcactg cagattccgg gtcactgtga gtgggggagg cagggaagaa 360 gggctcacag gacagtcaaa ccatgccccc tgtttttcct tcttcaagta gacctctata 420 agacaacaga gacaactaag gctgagtggc caggcgagga gaaaccatct cgccgtaaaa 480 catggaagga acacttcagg ggaaaggtgg tatctctaag caagagaact gagtggagtc 540 aaggctgaga gatgcaggat aagcaaatgg gtagtgaaaa gacattcatg aggacagcta 600 aaacaataag taatgtaaaa tacagcatag caaaacttta acctccaaat caagcctcta 660 cttgaatcct tttctgaggg atgaataagg cataggcatc aggggctgtt gccaatgtgc 720 attagctgtt tgcagcctca ccttctttca tggagtttaa gatatagtgt attttcccaa 780 ggtttgaact agctcttcat ttctttatgt tttaaatgca ctgacctccc acattccctt 840 tttagtaaaa tattcagaaa taatttaaat acatcattg 879 <210> 13 <211> 152 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 13 tctcccacgc cctggtctca gcttggggag tggtcagacc ccaatggcga taaactctgg 60 caactttatc tgtgcactgc aggctcagcc ccaacagctt tagctttcac aagcaggcag 120 gggaagggaa acacatatct ccagatatga gg 152 <210> 14 <211> 157 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 14 ctaaacccct cccccaccct agccccaagc ttcatcttag ctccactcct gaccctatcc 60 agctaaaggt ccccacccag ctcctgccta tctagtcatt gcatatggca agacttgaaa 120 gtcctatctc aaagcagcag aattatcagc tacgact 157 <210> 15 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 15 ccatccccca gcactccctg cccccacagc ccagacttga ccaactccca gctccgcctg 60 ggacttccag atatggggcc ccacccttgc aggccttggg gacgctgaag atattgacta 120 tctgcgtgcc ggaaaagggt g 141 <210> 16 <211> 171 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 16 aaaggctggg ggtgggagta gcggatttga agcacttgtt ggcctacaga ggtgtggcaa 60 gcagagcacc tcagaactca ggcgtactgc ccgccgcccg agccctgcga gggccgatag 120 cgagggtgtg gcccttatct gcacccagca gagcgccggc ggggtacggt c 171 <210> 17 <211> 195 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 17 cagttgcctc agctgagtat gtcttctaaa gataatgtcg attgtgtatg gctgatggga 60 ttctaggacc aagcaagagg tttttttttt tcccccacat acttaacgtt tctatatttc 120 tatttgaatt cgactggaca gttccatttg aattatttct ctctctctct ctctctgaca 180 cattttatct tgcca 195 <210> 18 <211> 14 <212> DNA <213> Homo sapiens <400> 18 caccaggtgg cgct 14 <210> 19 <211> 81706 <212> DNA <213> Homo sapiens <400> 19 ggatcctcac atgagttcag tatataattg taacagaata aaaaatcaat tatgtattca 60 agttgctagt gtcttaagag gttcacattt ttatctaact gattatcaca aaaatacttc 120 gagttacttt tcattataat tcctgactac acatgaagag actgacacgt aggtgcctta 180 cttaggtagg ttaagtaatt tatccaaaac cacacaatgt agaacctaag ctgattcggc 240 catagaaaca caatatgtgg tataaatgag acagagggat ttctctcctt cctatgctgt 300 cagatgaata ctgagataga atatttagtt catctatcac acattaaacg ggactttaca 360 tttctgtctg ttgaagattt gggtgtgggg ataactcaag gtatcatatc caagggatgg 420 atgaaggcag gtgactctaa cagaaaggga aaggatgttg gcaaggctat gttcatgaaa 480 gtatatgtaa aatccacatt aagcttcttt ctgcatgcat tggcaatgtt tatgaataat 540 gtgtatgtaa aagtgtgctg tatattcaaa agtgtttcat gtgcctaggg gtgtcaaata 600 ctttgagttt gtaagtatat acttctctgt aatgtgtctg aatatctcta tttacttgat 660 tctcaataag taggtatcat agtgaacatc tgacaaatgt ttgaggaaca atttagtgtt 720 tacctattca ccaaaattta ttaaatgcct aatctgtatc agatatacaa ttatctggcg 780 aaatctgtaa ttcctaattt aaacagctgt gtagcctaat tagggataaa ggcatgcaaa 840 cccataattt gtgtaggttg aaatgagcta tagaaaaatg cagtatattt atcagaagtc 900 tttagggtca tgaaaaggaa tggtcaactg acactgccag ggactcatat gtaagagata 960 actaatgtga agtgacttta aaggagaaat tagcagaagt tttctttcca tgtctcctca 1020 tcatgttaca ataacggaag agattaaaac aacaaataca tttagacagc aatgtttatc 1080 ctggttagat gttttaatct aaatctatct tggagtgtta aaatgcattt gctcacctac 1140 tttaaaatat aaatgaaggt aggaacctgt agatacaaaa agttggagaa aaaaagacaa 1200 taaagatgac aaaaatctat taatccttga tagaaaatga gaagagataa aacactggtt 1260 tacataaaga aaataagatg gatagatagc agatccttat aaaagtgata atttgagaaa 1320 aaaaatactc catattctga gtttcttcac ataaaataat acaaatctgc tgtggtaagt 1380 tacaaagaga tagatttttt atcattatat aaaagatatt ttaaacagag ttatacaaca 1440 aaggaacaga ctatgtcata tattctcact tatcactata aacatctcag aaaaatctgc 1500 aaaatcattt catagcattt taaatagtta ggaataatgt agaaaactga aacagttcta 1560 agtttcccac aaacttagag tctcaaatgt tgcattacct aacttacctg caaatatttt 1620 atacaaattt gcacatgcta ctctagtcaa aaatatatgt acattatggg tattttctgt 1680 gtgtaacttg gttctagttg cttctttcag aaatagcctc tatttttgat ttacctgata 1740 aaatcacatt cctctccaaa gccttctaaa tacttccaga ctaactactt tttagtacat 1800 ctaagaagaa aagagttttg tctcttatcc acctctgagt caaaaagcag catgtccatc 1860 aattggtaca tagttcccac agccccactt agctctggat tggagttcta cttggcattg 1920 tttgcaacta catggacgta aaatgcatgg attctcttga aaaaatgttt ctgccatgat 1980 gttctctgaa agagactaac cttccctcgc tttgcagaga aagactcgtg taatccttga 2040 caatgtcatc tcatctattt attcccatgt ctacccatat gtgaccttca tgtctttgct 2100 ctaagcccct acatcctcaa tctacacact aggatagtat aaaagtaata gtaataatag 2160 tagtaatagt aataacaata caatgattat ggcttatact atacacaaga cactgttgat 2220 atattatttc atttagtatt cacagtaact ctgtgcctca agtactattg taataccctt 2280 taagaggagg aaactgaggc acagggccct aaagtaatat tccaagatga agtggctact 2340 aactgacaga gggcataatt caactcatga tatttggctc tagaatacat gctctgaatc 2400 attatacaat aataattcat gaggaaacat tttttaaagc ctaagttatt tgctctgaaa 2460 taagacataa tttggggtga gaaagcttag attccatgaa gtattacagc atttggtagt 2520 ctttttgcac tccaggtctt atttttactg cttaaacata ataaaacata tggttcagta 2580 tgcctttgat tttacaataa tattcctgtt atttttggaa gcacagggtg tgggataatg 2640 ctaattacta gtgattagta ttgagaggtg acagcgtgct ggcagtcctc acagccctcg 2700 ctcgctcttg gcgcctcctc tgcctgggct cccacattgg tggcacttga ggagcccttc 2760 agccggccgc tgcactgtgg gagccctttt ctgggctggc caaggccaga gccggctccc 2820 tcagcttgcc aggaggtgtg gagggacaga cgcgggcagg aaccgggctg tgcgccgtgc 2880 ttgagggagt tccgggtggg catgggctcc gaggaccccg cactcggagc cgccagccgg 2940 ccccaccggc cgcgggcagt gaggggctta gcacctgggc cagcagctgc tgtgctcaat 3000 tcctcgccgg gccttagctg ccttcctgcg gggcagggct cgggacctgc agcgcgccat 3060 gcctgagcct ccccaccttc atgggctcct gtgcggcccg agcctcgccg acgagcgccg 3120 ccccctgctc cagggcaccc agtcccatcg accacccaag ggctgaagag tgcgggcgca 3180 cggcagggga ctggcaggca gctccccctg cagcccaggt gcgggatcca ctgggtgaag 3240 ccggctaggc tcctgagttt gctggggatg cgaagaaccc ttatgtctag ataagggatt 3300 gtaaatacac caattggcac tctgtatcta gctcaaggtt tgtaaacaca ccaatcagca 3360 ccctgtgtct agctcagggt ttgtgaatgc accaatcaac actctatcta gctactctgg 3420 tggggccttg gagaaccttt atgtctagct cagggattgt aaatacacca atcggcagtc 3480 tgtatctagc tcaaggtttg taaacacacc aatcagcacc ctgtgtctag ctcagggttt 3540 gtgaatgcac caatcaacac tctgtatcta gctactctgg tggggacgtg gagaaccttt 3600 atgtctagct cagggattgt aaatacacca ctcggcagtc tgtatctagc tcaaggtttg 3660 taaacacacc aatcagcacc ctgtgtctag ctcagggttt gtgaatgcac caatcaacac 3720 tctgtatcta gctactctgg tggggacttg gagaaccttt gtgtggacac tctgtatcta 3780 gctaatctgg tggggacgtg gagaaccttt gtgtctagct catggattgt aaatgcacca 3840 atcagtgccc tgtcaaaaca gaccactggg ctctaccaat cagcaggatg tgggtggggc 3900 cagataagag aataaaagca ggctgcccga gccagcagtg gcaacccgct cgggtcccct 3960 tccacactgt ggaagctttg ttctttcgct ctttgcaata aatcttgctg ctgctcactg 4020 tttgggtcta cactgccttt atgagctgta acgctcaccg cgaaggtctg cagcttcact 4080 cttgaagcca gcgagaccac gaacccaccg ggaggaacga acaactccag aggcgccgcc 4140 ttaagagctg gaacgttcac tgtgaaggtc tgcagcttca ctcctgagcc agcgagacca 4200 cgaacccatc agaaggaaga aactccgaac acatccaaac atcagaacga acaaactcca 4260 cacacgcagc ctttaagaac tgtaacactc accacgaggg tccccggctt cattcttgaa 4320 gtcagtgaaa ccaagaaccc accaattccg gacacagtat gtcagaaaca atatgagtca 4380 ctaaatcaat atacttctca acaatttcca acagcccttg caattaactt ggccatgtga 4440 ctggttgtga ctaaaataat gtggagataa taatgtgtta ctccctaagg cagagtgccc 4500 ttctatcatt ctctttccct tcctctatgt ggcagaaagt aaaagattct gaaatgataa 4560 agtcaatcac aggaaggcac ctggactcct ggcccactgc ttggaggaga gcactcagga 4620 ccatgaacat ctgactgtga cgtagcaata aagaaaccca cgtttcatat gaaactgctt 4680 aaaattaatg gcacaagtca tgtttttgat gttgcacatt tgtctttatt tgtggcttgt 4740 tttgcttcca catcaatcca ctcaaggcct acattctgct ataatgcaat ttcaagttct 4800 ttacaggccg agaaaaatga atctgaattc ctgacctcca aaagtgatca agatattttt 4860 agttcaggct ccaaaatttt ctcattttca taggttttcc tcgattgatc attattcatg 4920 atttgcaagg aatcattcaa tgttttctaa atctattact gcatcctgac acatatgaca 4980 ttttaactat gttccagatt tttgaatgaa gagtgtaaat tttaaatgtt ttcaccacaa 5040 aaaataagta tgtgaagtgg tggatttgtt aattagcctt atttaaccat ttaatattgt 5100 acacgtacac caaagcatca tgttgtaccc catgaataca cacaattatt atttgtcaat 5160 ttaaaatgaa ataataaaaa ataacaaagg cattagcctc tgcattgcct ttaccggtca 5220 tcctcacggt gactaacgca aaaaacgttc tatttcatcc ttacaaacat ccctatcttt 5280 gatgcctctt tgtctagatc tctatcccct cctgttttct ctacgttatt tatatgggta 5340 tcatcaccat cctggacaac atcaggacag atatccctca ccaagccaat gttcctctct 5400 atgttggctc aaatgtcctt gaactttcct ttcaccaccc tttccacagt caaaaggata 5460 ttgtagttta atgcctcaga gttcagcttt taagcttctg acaaattatt cttcctcttt 5520 aggttctcct ttatggaatc ttctgtactg atggccatgt cctttaacta ctatgtagat 5580 atctgctact acctgtatta tgcctctacc tttattagca gagttatctg tactgttggc 5640 atgacaatca tttgttaata tgacttgcct ttcctttttc tgctattctt gatcaaatgg 5700 ctcctctttc ttgctcctct catttctcct gccttcactt ggacgtgctt cacgtagtct 5760 gtgcttatga ctggattaaa aattgatatg gacttatcct aatgttgttc gtcataatat 5820 gggttttatg gtccattatt atttcctatg cattgatctg gagaaggctt caatcctttt 5880 actctttgtg gaaaatatct gtaaaccttc tggttcactc tgctatagca atttcagttt 5940 aggctagtaa gcatgaggat gcctccttct ctgatttttc ccacagtctg ttggtcacag 6000 aataacctga gtgattactg atgaaagagt gagaatgtta ttgatagtca caatgacaaa 6060 aaacaaacaa ctacagtcaa aatgtttctc tttttattag tggattatat ttcctgacct 6120 atatctggca ggactcttta gagaggtagc tgaagctgct gttatgacca ctagagggaa 6180 gaagatacct gtggagctaa tggtccaaga tggtggagcc ccaagcaagg aagttgttaa 6240 ggagcccttt tgattgaagg tgggtgcccc caccttacag ggacaggaca tctggatact 6300 cctcccagtt tctccagttt ccctttttcc taatatatct cctgataaaa tgtctatact 6360 cacttcccca tttctaataa taaagcaaag gctagttagt aagacatcac cttgcatttt 6420 gaaaatgcca tagactttca aaattatttc atacatcggt ctttctttat ttcaagagtc 6480 cagaaatggc aacattacct ttgattcaat gtaatggaaa gagctctttc aagagacaga 6540 gaaaagaata atttaatttc tttccccaca cctccttccc tgtctcttac cctatcttcc 6600 ttccttctac cctccccatt tctctctctc atttctcaga agtatatttt gaaaggattc 6660 atagcagaca gctaaggctg gttttttcta agtgaagaag tgatattgag aaggtagggt 6720 tgcatgagcc ctttcagttt tttagtttat atacatctgt attgttagaa tgttttataa 6780 tataaataaa attatttctc agttatatac tagctatgta acctgtggat atttccttaa 6840 gtattacaag ctatacttaa ctcacttgga aaactcaaat aaatacctgc ttcatagtta 6900 ttaataagga ttaagtgaga taatgcccat aagattccta ttaataacag ataaatacat 6960 acacacacac acacattgaa aggattctta ctttgtgcta ggaactataa taagttcatt 7020 gatgcattat atcattaagt tctaatttca acactagaag gcaggtatta tctaaatttc 7080 atactggata cctccaaact cataaagata attaaattgc cttttgtcat atatttattc 7140 aaaagggtaa actcaaacta tggcttgtct aattttatat atcaccctac tgaacatgac 7200 cctattgtga tattttataa aattattctc aagttattat gaggatgttg aaagacagag 7260 aggatggggt gctatgcccc aaatcagcct cacaattaag ctaagcagct aagagtcttg 7320 cagggtagtg tagggaccac agggttaagg gggcagtaga attatactcc cactttagtt 7380 tcatttcaaa caatccatac acacacagcc ctgagcactt acaaattata ctacgctcta 7440 tactttttgt ttaaatgtat aaataagtgg atgaaagaat agatagatag atagacagat 7500 agatgataga tagaataaat gcttgccttc atagctgtct ccctaccttg ttcaaaatgt 7560 tcctgtccag accaaagtac cttgccttca cttaagtaat caattcctag gttatattct 7620 gatgtcaaag gaagtcaaaa gatgtgaaaa acaatttctg acccacaact catgctttgt 7680 agatgactag atcaaaaaat ttcagccata tcttaacagt gagtgaacag gaaatctcct 7740 cttttcccta catctgagat cccagcttct aagaccttca attctcactc ttgatgcaac 7800 agaccttgga agcatacagg agagctgaac ttggtcaaca aaggagaaaa gtttgttggc 7860 ctccaaaggc acagctcaaa cttttcaagc cttctctaat cttaaaggta aacaagggtc 7920 tcatttcttt gagaacttca gggaaaatag acaaggactt gcctggtgct tttggtaggg 7980 gagcttgcac tttccccctt tctggaggaa atatttatcc ccaggtagtt ccctttttgc 8040 accagtggtt ctttgaagag acttccacct gggaacagtt aaacagcaac tacagggcct 8100 tgaactgcac actttcagtc cggtcctcac agttgaaaag acctaagctt gtgcctgatt 8160 taagcctttt tggtcataaa acattgaatt ctaatctccc tctcaaccct acagtcaccc 8220 atttggtata ttaaagatgt gttgtctact gtctagtatc cctcaagtag tgtcaggaat 8280 tagtcattta aatagtctgc aagccaggag tggtggctca tgtctgtaat tccagcactt 8340 gagaggtaga agtgggagga ctgcttgagc tcaagagttt gatattatcc tggacaacat 8400 agcaagacct cgtctctact taaaaaaaaa aaaaaaatta gccaggcatg tgatgtacac 8460 ctgtagtccc agctactcag gaggccgaaa tgggaggatc ccttgagctc aggaggtcaa 8520 ggctgcagtg agacatgatc ttgccactgc actccagcct ggacagcaga gtgaaacctt 8580 gcctcacgaa acagaataca aaaacaaaca aacaaaaaac tgctccgcaa tgcgcttcct 8640 tgatgctcta ccacataggt ctgggtactt tgtacacatt atctcattgc tgttcataat 8700 tgttagatta attttgtaat attgatatta ttcctagaaa gctgaggcct caagatgata 8760 acttttattt tctggacttg taatagcttt ctcttgtatt caccatgttg taactttctt 8820 agagtagtaa caatataaag ttattgtgag tttttgcaaa cacagcaaac acaacgaccc 8880 atatagacat tgatgtgaaa ttgtctattg tcaatttatg ggaaaacaag tatgtacttt 8940 ttctactaag ccattgaaac aggaataaca gaacaagatt gaaagaatac attttccgaa 9000 attacttgag tattatacaa agacaagcac gtggacctgg gaggagggtt attgtccatg 9060 actggtgtgt ggagacaaat gcaggtttat aatagatggg atggcatcta gcgcaatgac 9120 tttgccatca cttttagaga gctcttgggg accccagtac acaagagggg acgcagggta 9180 tatgtagaca tctcattctt tttcttagtg tgagaataag aatagccatg acctgagttt 9240 atagacaatg agcccttttc tctctcccac tcagcagcta tgagatggct tgccctgcct 9300 ctctactagg ctgactcact ccaaggccca gcaatgggca gggctctgtc agggctttga 9360 tagcactatc tgcagagcca gggccgagaa ggggtggact ccagagactc tccctcccat 9420 tcccgagcag ggtttgctta tttatgcatt taaatgatat atttatttta aaagaaataa 9480 caggagactg cccagccctg gctgtgacat ggaaactatg tagaatattt tgggttccat 9540 ttttttttcc ttctttcagt tagaggaaaa ggggctcact gcacatacac tagacagaaa 9600 gtcaggagct ttgaatccaa gcctgatcat ttccatgtca tactgagaaa gtccccaccc 9660 ttctctgagc ctcagtttct ctttttataa gtaggagtct ggagtaaatg atttccaatg 9720 gctctcattt caatacaaaa tttccgttta ttaaatgcat gagcttctgt tactccaaga 9780 ctgagaagga aattgaacct gagactcatt gactggcaag atgtccccag aggctctcat 9840 tcagcaataa aattctcacc ttcacccagg cccactgagt gtcagatttg catgcactag 9900 ttcacgtgtg taaaaaggag gatgcttctt tcctttgtat tctcacatac ctttaggaaa 9960 gaacttagca cccttcccac acagccatcc caataactca tttcagtgac tcaacccttg 10020 actttataaa agtcttgggc agtatagagc agagattaag agtacagatg ctggagccag 10080 accacctgag tgattagtga ctcagtttct cttagtagtt gtatgactca gtttcttcat 10140 ctgtaaaatg gagggttttt taattagttt gtttttgaga aagggtctca ctctgtcacc 10200 caaatgggag tgtagtggca aaatctcggc tcactgcaac ttgcacttcc caggctcaag 10260 cggtcctccc acctcaacat cctgagtagc tggaaccaca ggtacacacc accatacctc 10320 gctaattttt tgtatttttg gtagagatgg ggtttcacat gttacacagg atggtctcag 10380 actccggagc tcaagcaatc tgcccacctc agccttccaa agtgctggga ttataagcat 10440 gattacagga gttttaacag gctcataaga ttgttctgca gcccgagtga gttaatacat 10500 gcaaagagtt taaagcagtg acttataaat gctaactact ctagaaatgt ttgctagtat 10560 tttttgttta actgcaatca ttcttgctgc aggtgaaaac tagtgttctg tactttatgc 10620 ccattcatct ttaactgtaa taataaaaat aactgacatt tattgaaggc tatcagagac 10680 tgtaattagt gctttgcata attaatcata tttaatactc ttggattctt tcaggtagat 10740 actattatta tccccatttt actacagtta aaaaaactac ctctcaactt gctcaagcat 10800 acactctcac acacacaaac ataaactact agcaaatagt agaattgaga tttggtccta 10860 attatgtctt tgctcactat ccaataaata tttattgaca tgtacttctt ggcagtctgt 10920 atgctggatg ctggggatac aaagatgttt aaatttaagc tccagtctct gcttccaaag 10980 gcctcccagg ccaagttatc cattcagaaa gcatttttta ctctttgcat tccactgttt 11040 ttcctaagtg actaaaaaat tacactttat tcgtctgtgt cctgctctgg gatgatagtc 11100 tgactttcct aacctgagcc taacatccct gacatcagga aagactacac catgtggaga 11160 aggggtggtg gttttgattg ctgctgtctt cagttagatg gttaactttg tgaagttgaa 11220 aactgtggct ctctggttga ctgttagagt tctggcactt gtcactatgc ctattattta 11280 acaaatgcat gaatgcttca gaatatggga atattatctt ctggaatagg gaatcaagtt 11340 atattatgta acccaggatt agaagattct tctgtgtgta agaatttcat aaacattaag 11400 ctgtctagca aaagcaaggg cttggaaaat ctgtgagctc ctcaccatat agaaagcttt 11460 taacccatca ttgaataaat ccctataggg gatttctacc ctgagcaaaa ggctggtctt 11520 gattaattcc caaactcata tagctctgag aaagtctatg ctgttaacgt tttcttgtct 11580 gctaccccat catatgcaca acaataaatg caggcctagg catgactgaa ggctctctca 11640 taattcttgg ttgcatgaat cagattatca acagaaatgt tgagacaaac tatggggaag 11700 cagggtatga aagagctctg aatgaaatgg aaaccgcaat gcttcctgcc cattcagggc 11760 tccagcatgt agaaatctgg ggctttgtga agactggctt aaaatcagaa gccccattgg 11820 ataagagtag ggaagaacct agagcctacg ctgagcaggt ttccttcatg tgacagggag 11880 cctcctgccc cgaacttcca gggatcctct cttaagtgtt tcctgctgga atctcctcac 11940 ttctatctgg aaatggtttc tccacagtcc agcccctggc tagttgaaag agttacccat 12000 gcagaggccc tcctagcatc cagagactag tgcttagatt cctactttca gcgttggaca 12060 acctggatcc acttgcccag tgttcttcct tagttcctac cttcgacctt gatcctcctt 12120 tatcttcctg aaccctgctg agatgatcta tgtggggaga atggcttctt tgagaaacat 12180 cttcttcgtt agtggcctgc ccctcattcc cactttaata tccagaatca ctataagaag 12240 aatataataa gaggaataac tcttattata ggtaagggaa aattaagagg catacgtgat 12300 gggatgagta agagaggaga gggaaggatt aatggacgat aaaatctact actatttgtt 12360 gagacctttt atagtctaat caattttgct attgttttcc atcctcacgc taactccata 12420 aaaaaacact attattatct ttattttgcc atgacaagac tgagctcaga agagtcaagc 12480 atttgcctaa ggtcggacat gtcagaggca gtgccagacc tatgtgagac tctgcagcta 12540 ctgctcatgg gccctgtgct gcactgatga ggaggatcag atggatgggg caatgaagca 12600 aaggaatcat tctgtggata aaggagacag ccatgaagaa gtctatgact gtaaatttgg 12660 gagcaggagt ctctaaggac ttggatttca aggaattttg actcagcaaa cacaagaccc 12720 tcacggtgac tttgcgagct ggtgtgccag atgtgtctat cagaggttcc agggagggtg 12780 gggtggggtc agggctggcc accagctatc agggcccaga tgggttatag gctggcaggc 12840 tcagataggt ggttaggtca ggttggtggt gctgggtgga gtccatgact cccaggagcc 12900 aggagagata gaccatgagt agagggcaga catgggaaag gtgggggagg cacagcatag 12960 cagcattttt cattctacta ctacatggga ctgctcccct atacccccag ctaggggcaa 13020 gtgccttgac tcctatgttt tcaggatcat catctataaa gtaagagtaa taattgtgtc 13080 tatctcatag ggttattatg aggatcaaag gagatgcaca ctctctggac cagtggccta 13140 acagttcagg acagagctat gggcttccta tgtatgggtc agtggtctca atgtagcagg 13200 caagttccag aagatagcat caaccactgt tagagatata ctgccagtct cagagcctga 13260 tgttaattta gcaatgggct gggaccctcc tccagtagaa ccttctaacc agctgctgca 13320 gtcaaagtcg aatgcagctg gttagacttt ttttaatgaa agcttagctt tcattaaaga 13380 ttaagctcct aagcagggca cagatgaaat tgtctaacag caactttgcc atctaaaaaa 13440 atctgacttc actggaaaca tggaagccca aggttctgaa catgagaaat ttttaggaat 13500 ctgcacagga gttgagaggg aaacaagatg gtgaagggac tagaaaccac atgagagaca 13560 cgaggaaata gtgtagattt aggctggagg taaatgaaag agaagtggga attaatactt 13620 actgaaatct ttctatatgt caggtgccat tttatgatat ttaataatct cattacatat 13680 ggtaattctg tgagatatgt attattgaac atactataat taatactaat gataagtaac 13740 acctcttgag tacttagtat atgctagaat caaatttaag tttatcatat gaggccgggc 13800 acggtggctc atatatggga ttacatgcct gtaatcccag cactttggga ggccaaggca 13860 attggatcac ctgaggtcag gagttccaga ccagcctggc caacatggtg aaaccccttc 13920 tctactaaaa aatacaaaaa atcagccagg tgtggtggca cgcgtctata atcccagcta 13980 ctcaggaggc tgaggcagga gaatcacttg aacccaggag gtggaggttg cagtgagcta 14040 agattgcacc actgcactcc agcctaggcg acagagtgag actccatctc aaaaaaaaaa 14100 aaagaagttt attatatgaa ttaacttagt tttactcaca ccaatactca gaagtagatt 14160 attacctcat ttattgatga ggagcccaat gtacttgtag tgtagatcaa cttattgaaa 14220 gcacaagcta ataagtagac aattagtaat tagaagtcag atggtctgag ctctcctact 14280 gtctacatta catgagctct tattaactgg ggactcgaaa atcaaagaca tgaaataatt 14340 tgtccaagct tacagaacca ccaagtagta aggctaggat gtagacccag ttctgctacc 14400 tctgaagaca gtgttttttc cacagcaaaa cacaaactca gatattgtgg atgcgagaaa 14460 ttagaagtag atattcctgc cctgtggccc ttgcttctta cttttacttc ttgtcgattg 14520 gaagttgtgg tccaagccac agttgcagac catacttcct caaccataat tgcatttctt 14580 caggaaagtt tgagggagaa aaaggtaaag aaaaatttag aaacaacttc agaataaaga 14640 gattttctct tgggttacag agattgtcat atgacaaatt ataagcagac acttgagaaa 14700 actgaaggcc catgcctgcc caaattaccc tttgacccct tggtcaagct gcaactttgg 14760 ttaaagggag tgtttatgtg ttatagtgtt catttactct tctggtctaa cccattggct 14820 ccgtcttcat cctgcagtga cctcagtgcc tcagaaacat acatatgttt gtctagttta 14880 agtttgtgtg aaattctaac tagcgtcaag aactgagggc cctaaactat gctaggaata 14940 gtgctgtggt gctgtgatag gtacacaaga aatgagaaga aactgcagat tctctgcatc 15000 tccctttgcc gggtctgaca acaaagtttc cccaaatttt accaatgcaa gccatttctc 15060 catatgctaa ctactttaaa atcatttggg gcttcacatt gtctttctca tctgtaaaaa 15120 gaatggaaga actcattcct acagaactcc ctatgtcttc cctgatgggc tagagttcct 15180 ctttctcaaa aattagccat tattgtattt ccttctaagc caaagctcag aggtcttgta 15240 ttgcccagtg acatgcacac tggtcaaaag taggctaagt agaagggtac tttcacagga 15300 acagagagca aaagaggtgg gtgaatgaga gggtaagtga gaaaagacaa atgagaagtt 15360 acaacatgat ggcttgttgt ctaaatatct cctagggaat tattgtgaga ggtctgaata 15420 gtgttgtaaa ataagctgaa tctgctgcca acattaacag tcaagaaata cctccgaata 15480 actgtacctc caattattct ttaaggtagc atgcaactgt aatagttgca tgtatatatt 15540 tatcataata ctgtaacaga aaacacttac tgaatatata ctgtgtccct agttctttac 15600 acaataaact aatctcatcc tcataattct attagctaat acatattatc atcctatatt 15660 tcagagactt caagaagtta agcaacttgc tcaagatcat ctaagaagta ggtggtattt 15720 ctgggctcat ttggcccctc ctaatctctc atggcaacat ggctgcctaa agtgttgatt 15780 gccttaattc atcagggatg ggctcatact cactgcagac cttaactggc atcctctttt 15840 cttatgtgat ctgcctgacc ctagtagact tatgaaattt ctgatgagaa aggagagagg 15900 agaaaggcag agctgactgt gatgagtgat gaaggtgcct tctcatctgg gtaccagtgg 15960 ggcctctaag actaagtcac tctgtctcac tgtgtcttag ccagttcctt acagcttgcc 16020 ctgatgggag atagagaatg ggtatcctcc aacaaaaaaa taaattttca tttctcaagg 16080 tccaacttat gttttcttaa tttttaaaaa aatcttgacc attctccact ctctaaaata 16140 atccacagtg agagaaacat tcttttcccc catcccataa atacctctat taaatatgga 16200 aaatctgggc atggtgtctc acacctgtaa tcccagcact ttgggaggct gaggtgggtg 16260 gactgcttgg agctcaggag ttcaagacca tcttggacaa catggtgata ccctgcctct 16320 acaaaaagta caaaaattag cctggcatgg tggtgtgcac ctgtaatccc agctattagg 16380 gtggctgagg caggagaatt gcttgaaccc gggaggcgga ggttgcagtg agctgagatc 16440 gtgccactgc actccagcct gggggacaga gcacattata attaactgtt attttttact 16500 tggactcttg tggggaataa gatacatgtt ttattcttat ttatgattca agcactgaaa 16560 atagtgttta gcatccagca ggtgcttcaa aaccatttgc tgaatgatta ctatactttt 16620 tacaagctca gctccctcta tcccttccag catcctcatc tctgattaaa taagcttcag 16680 tttttcctta gttcctgtta catttctgtg tgtctccatt agtgacctcc catagtccaa 16740 gcatgagcag ttctggccag gcccctgtcg gggtcagtgc cccacccccg ccttctggtt 16800 ctgtgtaacc ttctaagcaa accttctggc tcaagcacag caatgctgag tcatgatgag 16860 tcatgctgag gcttagggtg tgtgcccaga tgttctcagc ctagagtgat gactcctatc 16920 tgggtcccca gcaggatgct tacagggcag atggcaaaaa aaaggagaag ctgaccacct 16980 gactaaaact ccacctcaaa cggcatcata aagaaaatgg atgcctgaga cagaatgtga 17040 catattctag aatatattat ttcctgaata tatatatata tatacacata tacgtatata 17100 tatatatata tatatatttg ttgttatcaa ttgccataga atgattagtt attgtgaatc 17160 aaatatttat cttgcaggtg gcctctatac ctagaagcgg cagaatcagg ctttattaat 17220 acatgtgtat agatttttag gatctataca catgtattaa tatgaaacaa ggatatggaa 17280 gaggaaggca tgaaaacagg aaaagaaaac aaaccttgtt tgccatttta aggcacccct 17340 ggacagctag gtggcaaaag gcctgtgctg ttagaggaca catgctcaca tacggggtca 17400 gatctgactt ggggtgctac tgggaagctc tcatcttaag gatacatctc aggccagtct 17460 tggtgcatta ggaagatgta ggcaactctg atcctgagag gaaagaaaca ttcctccagg 17520 agagctaaaa gggttcacct gtgtgggtaa ctgtgaagga ctacaagagg atgaaaaaca 17580 atgacagaca gacataatgc ttgtgggaga aaaaacagga ggtcaagggg atagagaagg 17640 cttccagaag aatggctttg aagctggctt ctgtaggagt tcacagtggc aaagatgttt 17700 cagaaatgtg acatgactta aggaactata caaaaaggaa caaatttaag gagaggcaga 17760 taaattagtt caacagacat gcaaggaatt ttcagatgaa tgttatgtct ccactgagct 17820 tcttgaggtt agcagctgtg agggttttgc aggcccagga cccattacag gacctcacgt 17880 atacttgaca ctgttttttg tattcatttg tgaatgaatg acctcttgtc agtctactcg 17940 gtttcgctgt gaatgaatga tgtcttgtca gcctacttgg tttcgctaag agcacagaga 18000 gaagatttag tgatgctatg taaaaacttc ctttttggtt caagtgtatg tttgtgatag 18060 aaatgaagac aggctacatg atgcatatct aacataaaca caaacattaa gaaaggaaat 18120 caacctgaag agtatttata cagataacaa aatacagaga gtgagttaaa tgtgtaataa 18180 ctgtggcaca ggctggaata tgagccattt aaatcacaaa ttaattagaa aaaaaacagt 18240 ggggaaaaaa ttccatggat gggtctagaa agactagcat tgttttaggt tgagtggcag 18300 tgtttaaagg gtgatatcag actaaacttg aaatatgtgg ctaaataact agaatactct 18360 ttattttttc gtatcatgaa tagcagatat agcttgatgg ccccatgctt ggtttaacat 18420 ccttgctgtt cctgacatga aatccttaat ttttgacaaa ggggctattc attttcattt 18480 tatattgggc ctagaaatta tgtagatggt cctgaggaaa agtttatagc ttgtctattt 18540 ctctctctaa catagttgtc agcacaatgc ctaggctata ggaagtactc aaagcttgtt 18600 aaattgaatt ctatccttct tattcaattc tacacatgga ggaaaaactc atcagggatg 18660 gaggcacgcc tctaaggaag gcaggtgtgg ctctgcagtg tgattgggta cttgcaggac 18720 gaagggtggg gtgggagtgg ctaaccttcc attcctagtg cagaggtcac agcctaaaca 18780 tcaaattcct tgaggtgcgg tggctcactc ctgtaatcac agcagtttgg gacgccaagg 18840 tgggcagatc acttgaggtc aggagttgga caccagccca gccaacatag tgaaacctgg 18900 tctctgctta aaaatataaa aattagctgg acgtggtgac gggagcctgt aatccaacta 18960 cttgggaggc tgaggcagga gaatcgcttg aaccggggag gtggagtttg cactgagcag 19020 agatcatgcc attgcactcc agcctccaga gcgagactct gtctaaagaa aaacgaaaac 19080 aaacaaacaa acaaacaaac aaaacccatc aaattccctg accgaacaga attctgtctg 19140 attgttctct gacttatcta ccattttccc tccttaaaga aactgtgaac ttccttcagc 19200 tagaggggcc tggctcagaa gcctctggtc agcatccaag aaatacttga tgtcactttg 19260 gctaaaggta tgatgtgtag acaagctcca gagatggttt ctcatttcca tatccaccca 19320 cccagctttc caattttaaa gccaattctg aggtagagac tgtgatgaac aaacaccttg 19380 acaaaattca acccaaagac tcactttgcc tagcttcaaa atccttactc tgacatatac 19440 tcacagccag aaattagcat gcactagagt gtgcatgagt gcaacacaca cacacaccaa 19500 ttccatattc tctgtcagaa aatcctgttg gtttttcgtg aaaggatgtt ttcagaggct 19560 gaccccttgc cttcacctcc aatgctacca ctctggtcta agtcactgtc accaccacct 19620 aaattatagc tgttgactca taacaatctt cctgcttcta ccactgcccc actacaattt 19680 cttcccaata tactatccaa attagtcttt tcaaaatgta agtcatatat ggtcacctct 19740 ttgttcaaag tcttctgata gtttcctata tcatttataa taaaaccaaa tccttacaat 19800 tctctacaat agttgttcat gcatatatta tgtttattac agatacatat atatagctct 19860 catataaata aatatatata tttatgtgta tgtgtgtaga gtgttttttc ttacaactct 19920 atgatgtagg tattattagt gtcccaaatt ttataattta ggacttctat gatctcatct 19980 tttattctcc ccttcaccga atctcatcct acattggcct tattgatatt ccttgaaaat 20040 tctaagcatc ttacatcttt agggtattta catttgccat tccctatgcc ctaaatattt 20100 aatcatagtt tcatataaat gggttcctca tcatctatgg gtactctctc aggtgttaac 20160 tttatagtga ggactttcct gccatactac ttaaagtagc gatacccttt caccctgtcc 20220 taatcacact ctggccttca tttcagtttt ttttttttct ccatagcacc taatctcatt 20280 ggtatataac atgtttcatt tgcttattta atgtcaagct ctttccacta tcaagtccat 20340 gaaaacagga actttattcc tctattctgt ttttgtgctg tattcttagc aattttacaa 20400 ttttgaatga atgaatgagc agtcaaacac atatacaact ataattaaaa ggatgtatgc 20460 tgacacatcc actgctatgc acacacaaag aaatcagtgg agtagagctg gaagtgctaa 20520 gcctgcatag agctagttag ccctccgcag gcagagcctt gatgggatta ctgagttcta 20580 gaattggact catttgtttt gtaggctgag atttgctctt gaaaacttgt tctgaccaaa 20640 ataaaaggct caaaagatga atatcgaaac cagggtgttt tttacactgg aatttataac 20700 tagagcactc atgtttatgt aagcaattaa ttgtttcatc agtcaggtaa aagtaaagaa 20760 aaactgtgcc aaggcaggta gcctaatgca atatgccact aaagtaaaca ttatttcata 20820 ggtgtcagat atggcttatt catccatctt catgggaagg atggccttgg cctggacatc 20880 agtgttatgt gaggttcaaa acacctctag gctataaggc aacagagctc cttttttttt 20940 tttctgtgct ttcctggctg tccaaatctc taatgataag catacttcta ttcaatgaga 21000 atattctgta agattatagt taagaattgt gggagccatt ccgtctctta tagttaaatt 21060 tgagcttctt ttatgatcac tgttttttta atatgcttta agttctgggg tacatgtgcc 21120 atggtggttt gctgcaccca tcaacccgtc atctacatta ggtatttctc ctaatgctat 21180 ccttccccta gccccccacc cccaacaggc cccagtgtgt gatgttcccc tccctgtgtc 21240 catggatcac tggttttttt ttgttttttt ttttttttta aagtctcagt taaatttttg 21300 gaatgtaatt tattttcctg gtatcctagg acttgcaagt tatctggtca ctttagccct 21360 cacgttttga tgataatcac atatttgtaa acacaacaca cacacacaca cacacacaca 21420 tatatatata tataaaacat atatatacat aaacacacat aacatattta tcgggcattt 21480 ctgagcaact aatcatgcag gactctcaaa cactaaccta tagccttttc tatgtatcta 21540 cttgtgtaga aaccaagcgt ggggactgag aaggcaatag caggagcatt ctgactctca 21600 ctgcctttag ctaggcccct ccctcatcac agctcagcat agtcctgagc tcttatctat 21660 atccacacac agtttctgac gctgcccagc tatcaccatc ccaagtctaa agaaaaaaat 21720 aatgggtttg cccatctctg ttgattagaa aacaaaacaa aataaaataa gcccctaagc 21780 tcccagaaaa catgactaaa ccagcaagaa gaagaaaata caataggtat atgaggagac 21840 tggtgacact agtgtctgaa tgaggcttga gtacagaaaa gaggctctag cagcatagtg 21900 gtttagagga gatgtttctt tccttcacag atgccttagc ctcaataagc ttgcggttgt 21960 ggaagtttac tttcagaaca aactcctgtg gggctagaat tattgatggc taaaagaagc 22020 ccgggggagg gaaaaatcat tcagcatcct cacccttagt gacacaaaac agagggggcc 22080 tggttttcca tatttcctca tgatggatga tctcgttaat gaaggtggtc tgacgagatc 22140 attgcttctt ccatttaagc cttgctcact tgccaatcct cagttttaac cttctccaga 22200 gaaatacaca ttttttattc aggaaacata ctatgttata gtttcaatac taaataatca 22260 aagtactgaa gatagcatgc ataggcaaga aaaagtcctt agctttatgt tgctgttgtt 22320 tcagaattta aaaaagatca ccaagtcaag gacttctcag ttctagcact agaggtggaa 22380 tcttagcata taatcagagg tttttcaaaa tttctagaca taagattcaa agccctgcac 22440 ttaaaatagt ctcatttgaa ttaactcttt atataaattg aaagcacatt ctgaactact 22500 tcagagtatt gttttatttc tatgttctta gttcataaat acattaggca atgcaattta 22560 attaaaaaaa cccaagaatt tcttagaatt ttaatcatga aaataaatga aggcatcttt 22620 acttactcaa ggtcccaaaa ggtcaaagaa accaggaaag taaagctata tttcagcgga 22680 aaatgggata tttatgagtt ttctaagttg acagactcaa gttttaacct tcagtgccca 22740 tcatgtagga aagtgtggca taactggctg attctggctt tctactcctt tttcccatta 22800 aagatccctc ctgcttaatt aacattcaca agtaactctg gttgtacttt aggcacagtg 22860 gctcccgagg tcagtcacac aataggatgt ctgtgctcca agttgccaga gagagagatt 22920 actcttgaga atgagcctca gccctggctc aaactcacct gcaaacttcg tgagagatga 22980 ggcagaggta cactacgaaa gcaacagtta gaagctaaat gatgagaaca catggactca 23040 tagagggaaa caacgcatac tggggcctat cagagggtgg agggtgagag aaggagagga 23100 tcaggaaaaa tcactaatgg atgctaagcg taatacctga gtgatgagat catctataca 23160 acaaaccccc ttgacattca tttatctatg taacaaacct gcacatcctg tacatgtacc 23220 cctgaactta aaataaaagt tgaaaacaag aaagcaacag tttgaacact tgttatggtc 23280 tattctctca ttctttacaa ttacactaga aaatagccac aggcttcctg caaggcagcc 23340 acagaattta tgacttgtga tatccaagtc attcctggat aatgcaaaat ctaacacaaa 23400 atctagtaga atcatttgct tacatctatt tttgttctga gaatatagat ttagatacat 23460 aatggaagca gaataattta aaatctggct aatttagaat cctaagcagc tcttttccta 23520 tcagtggttt acaagccttg tttatatttt tcctatttta aaaataaaaa taaagtaagt 23580 tatttgtggt aaagaatatt cattaaagta tttatttctt agataatacc atgaaaaaca 23640 ttcagtgaag tgaagggcct actttactta acaagaatct aatttatata atttttcata 23700 ctaatagcat ctaagaacag tacaatattt gactcttcag gttaaacata tgtcataaat 23760 tagccagaaa gatttaagaa aatattggat gtttccttgt ttaaattagg catcttacag 23820 tttttagaat cctgcataga acttaagaaa ttacaaatgc taaagcaaac ccaaacaggc 23880 aggaattaat cttcatcgaa tttgggtgtt tctttctaaa agtcctttat acttaaatgt 23940 cttaagacat acatagattt tattttacta attttaatta tatagacaat aaatgaatat 24000 tcttactgat tactttttct gactgtctaa tctttctgat ctatcctgga tggccataac 24060 acttatctct ctgaactttg ggcttttaat ataggaaaga aaagcaataa tccatttttc 24120 atggtatctc atatgataaa caaataaaat gcttaaaaat gagcaggtga agcaatttat 24180 cttgaaccaa caagcatcga agcaataatg agactgcccg cagcctacct gacttctgag 24240 tcaggattta taagccttgt tactgagaca caaacctggg cctttcaatg ctataacctt 24300 tcttgaagct cctccctacc acctttagcc ataaggaaac atggaatggg tcagatccct 24360 ggatgcaagc caggtctgga accataggca gtaaggagag aagaaaatgt gggctctgca 24420 actggctccg agggagcagg agaggatcaa ccccatactc tgaatctaag agaagactgg 24480 tgtccatact ctgaatggga agaatgatgg gattacccat agggcttgtt ttagggagaa 24540 acctgttctc caaactcttg gccttgagat acctggtcct tattccttgg actttggcaa 24600 tgtctgaccc tcacattcaa gttctgagga agggccactg ccttcatact gtggatctgt 24660 agcaaattcc ccctgaaaac ccagagctgt atcttaattg gttaaaaaaa attatattat 24720 ctcaacgact gttcttctct gagtagccaa gctcagcttg gttcaagcta caagcagctg 24780 agctgctttt tgtctagtca ttgttctttt atttcagtgg atcaaatacg ttctttccaa 24840 acctaggatc ttgtcttcct aggctatata ttttgtccca ggaagtctta atctggggtc 24900 cacagaacac tagggggctg gtgaagttta tagaaaaaaa atctgtattt ttacttacat 24960 gtaactgaaa tttagcattt tcttctactt tgaatgcaaa ggacaaacta gaatgacatc 25020 atcagtacct attgcatagt tataaagaga aaccacagat attttcatac tacaccatag 25080 gtattgcaga tctttttgtt tttgtttttg tttgagatgg agtttcgctc ttattgccca 25140 ggctggagtg cagtggcatg atttcggctc actgcaacct ccccttcctg cattcaagca 25200 attctcctgc cttggcctcc tgagtagctg gggattacag gcacctgcca ccatgccagt 25260 ctaatttttg tatttttagt agagatgggg tttcgccatg ttggccaggc tggtcttgaa 25320 ctcctgacct cagatgatct gcccgccttg gcctcctgaa gtgctgggat tataggtgtg 25380 agccaccacg cctggcccat tgcagatatt tttaattcac atttatctgc atcactactt 25440 ggatcttaag gtagctgtag acccaatcct agatctaatg ctttcataaa gaagcaaata 25500 taataaatac tataccacaa atgtaatgtt tgatgtctga taatgatatt tcagtgtaat 25560 taaacttagc actcctatgt atattatttg atgcaataaa aacatatttt tttagcactt 25620 acagtctgcc aaactggcct gtgacacaaa aaaagtttag gaattcctgg ttttgtctgt 25680 gttagccaat ggttagaata tatgctcaga aagataccat tggttaatag ctaaaagaaa 25740 atggagtaga aattcagtgg cctggaataa taacaatttg ggcagtcatt aagtcaggtg 25800 aagacttctg gaatcatggg agaaaagcaa gggagacatt cttacttgcc acaagtgttt 25860 tttttttttt ttttttttat cacaaacata agaaaatata ataaataaca aagtcaggtt 25920 atagaagaga gaaacgctct tagtaaactt ggaatatgga atccccaaag gcacttgact 25980 tgggagacag gagccatact gctaagtgaa aaagacgaag aacctctagg gcctgaacat 26040 acaggaaatt gtaggaacag aaattcctag atctggtggg gcaaggggag ccataggaga 26100 aagaaatggt agaaatggat ggagacggag gcagaggtgg gcagatcatg aggtcaagag 26160 atcgagacca tcctggcaaa catggtgaaa tcccgtctct actaaaaata aaaaaattag 26220 ctgggcatgg tggcatgcgc ctgtagtccc agctgctcgg gaggctgagg caggagaatc 26280 gtttgaaccc aggaggcgaa ggttgcagtg agctgagata gtgccattgc actccagtct 26340 ggcaacagag tgagactccg tctcaaaaaa aaaaaaaaaa gaaagaaaga aaagaaaaag 26400 aaaaaagaaa aaataaatgg atgtagaaca agccagaagg aggaactggg ctggggcaat 26460 gagattatgg tgatgtaagg gacttttata gaattaacaa tgctggaatt tgtggaactc 26520 tgcttctatt attcccccaa tcattacttc tgtcacattg atagttaaat aatttctgtg 26580 aatttattcc ttgattctaa aatatgagga taatgacaat ggtattataa gggcagatta 26640 agtgatatag catgagcaat attcttcagg cacatggatc gaattgaata cactgtaaat 26700 cccaacttcc agtttcagct ctaccaagta aagagctagc aagtcatcaa aatggggaca 26760 tacagaaaaa aaaaaggaca ctagaggaat aatataccct gactcctagc ctgattaata 26820 tatcgattca cttttttctc tgtttgatga caaattctgg ctttaaataa ttttaggatt 26880 ttaggcttct cagctccctt cccagtgaga agtataagca ggacagacag gcaagcaaga 26940 agagagcccc aggcaatact cacaaagtag ccaatgtccc ctgtggtcat agagaaatga 27000 aaagagagag gattctctgg aagcactgga tgtaatcttt tctgtctgtc ctctctaggg 27060 aatcacccca aggtactgta ctttgggatt aaggctttag tcccactgtg gactacttgc 27120 tattctgttc agtttctaga aggaactatg tacggttttt gtctccctag agaaactaag 27180 gtacagaagt tttgtttaca atgcactcct taagagagct agaactgggt gagattctgt 27240 tttaacagct ttattttctt ttccttggcc ctgtttttgt cactgtcacc acctttaagg 27300 caaatgttaa atgcgctttg gctgaaactt tttttcctat tttgagattt gctcctttat 27360 atgaggcttt cttggaaaag gagaatggga gagatggata tcattttgga agatgatgaa 27420 gagggtaaaa aaggggacaa atggaaattt gtgttgcaga tagatgagga gccaacaaaa 27480 aagagcctca ggatccagca cacattatca caaacttagt gtccatccat cactgctgac 27540 cctctccgga cctgactcca cccctgaggg acacaggtca gccttgacca atgactttta 27600 agtaccatgg agaacagggg gccagaactt cggcagtaaa gaataaaagg ccagacagag 27660 aggcagcagc acatatctgc ttccgacaca gctgcaatca ctagcaagct ctcaggcctg 27720 gcatcatggt gcattttact gctgaggaga aggctgccgt cactagcctg tggagcaaga 27780 tgaatgtgga agaggctgga ggtgaagcct tgggcaggta agcattggtt ctcaatgcat 27840 gggaatgaag ggtgaatatt accctagcaa gttgattggg aaagtcctca agattttttg 27900 catctctaat tttgtatctg atatggtgtc atttcataga ctcctcgttg tttacccctg 27960 gacccagaga ttttttgaca gctttggaaa cctgtcgtct ccctctgcca tcctgggcaa 28020 ccccaaggtc aaggcccatg gcaagaaggt gctgacttcc tttggagatg ctattaaaaa 28080 catggacaac ctcaagcccg cctttgctaa gctgagtgag ctgcactgtg acaagctgca 28140 tgtggatcct gagaacttca aggtgagttc aggtgctggt gatgtgattt tttggcttta 28200 tattttgaca ttaattgaag ctcataatct tattggaaag accaacaaag atctcagaaa 28260 tcatgggtcg agcttgatgt tagaacagca gacttctagt gagcataacc aaaacttaca 28320 tgattcagaa ctagtgacag taaaggacta ctaacagcct gaattggctt aacttttcag 28380 gaaatcttgc cagaacttga tgtgtttatc ccagagaatt gtattataga attgtagact 28440 tgtgaaagaa gaatgaaatt tggcttttgg tagatgaaag tccatttcaa ggaaatagaa 28500 atgccttatt ttatgtgggt catgataatt gaggtttaga aagagatttt tgcaaaaaaa 28560 ataaaagatt tgctcaaaga aaaataagac acattttcta aaatatgtta aatttcccat 28620 cagtattgtg accaagtgaa ggcttgtttc cgaatttgtt ggggatttta aactcccgct 28680 gagaactctt gcagcactca cattctacat ttacaaaaat tagacaattg cttaaagaaa 28740 aacagggaga gagggaaccc aataatactg gtaaaatggg gaagggggtg agggtgtagg 28800 taggtagaat gttgaatgta gggctcatag aataaaattg aacctaagct catctgaatt 28860 ttttgggtgg gcacaaacct tggaacagtt tgaggtcagg gttgtctagg aatgtaggta 28920 taaagccgtt tttgtttgtt tgtttgtttt ttcatcaagt tgttttcgga aacttctact 28980 caacatgcct gtgtgttatt ttgtcttttg cctaacagct cctgggtaac gtgatggtga 29040 ttattctggc tactcacttt ggcaaggagt tcacccctga agtgcaggct gcctggcaga 29100 agctggtgtc tgctgtcgcc attgccctgg cccataagta ccactgagtt ctcttccagt 29160 ttgcaggtgt tcctgtgacc ctgacaccct ccttctgcac atggggactg ggcttggcct 29220 tgagagaaag ccttctgttt aataaagtac attttcttca gtaatcaaaa attgcaattt 29280 tatcttctcc atcttttact cttgtgttaa aaggaaaaag tgttcatggg ctgagggatg 29340 gagagaaaca taggaagaac caagagcttc cttaagaaat gtatgggggc ttgtaaaatt 29400 aatgtggatg ttatgggaga attccaggat tccaaggagg atgatatgat ggagaaaaat 29460 ctttatcggg gtgggaaaat ggttaattaa gtggacagag actcctaggc agtttttact 29520 gcaccgggga aagaaggagc tgttagtggt acctgagaaa gcagatttgt ggtacatgtc 29580 acttttcatt aaaaacaaaa acaaaacaaa acaaaacttc atagatatcc aagatatagg 29640 ctagaattac tattttaatt tactcttatt tacattttga agtagctagc ttgtcacatg 29700 ttttatgaaa ttgatttgga gataagatga gtgtgtatca acaatagcct gctctttcca 29760 tgaaggattc cattatttca tgggttagct gaagctaaga cacatgatat cattgtgcat 29820 tatcttctga tagaatgtaa catgcactaa aataaagtta gagttaggac ctgagtggga 29880 aagtttttgg agagtgtgat gaagactttc cgtgggagat agaatactaa taaaggctta 29940 aattctaaaa ccagcaagct agggcttcgt gacttgcatg aaactggctc tctggaagta 30000 gaagggagag taagacatac gtagaggact aggaaagacc agatagtaca gggcctggct 30060 acaaaaatac aagcttttac tatgctattg caatactaaa cgataagcat taggatgtta 30120 agtgactcag gaaataagat tttgggaaaa agtaatctgc ttatgtgcac aaaatggatt 30180 caagtttgca gataaaataa aatatggatg atgattcaag gggacagata caatggttca 30240 aacccaagag gagcagtgag tctgtggaat ttgaaggatg gacaaaggtg gggtgagaaa 30300 gacatagtat tcgactgact gtgggagatg agaaggaaga aggaggtgat aaatgactga 30360 aagctcccag actggtgaag ataacaggag gaaaccatgc actgacctgg tgactctcat 30420 gtgtgaaggg tagagggata ttaacagatt tactttttag gaagtgctag attggtcagg 30480 gagttttgac cttcaggtct tgtgtctttc atatcaagga acctttgcat tttccaagtt 30540 agagtgccat attttggcaa atataacttt attagtaatt ttatagtgct ctcacattga 30600 tcagactttt tcctgtgaat tacttttgaa tttggctgta tatatccaga atatgggaga 30660 gagacaaata attattgtag ttgcaggcta tcaacaatac tggtctctct gagccttata 30720 acctttcaat atgcccataa acagagtaaa cagggattat tcatggcact aaatattttc 30780 acctagtcag tcaacaaatg ggagcaatgt gcattttttg atacatattt ttatatattt 30840 atggggtaca tgtgatactt acatgcctag aacatgtgat gattaagtct agatatttag 30900 gatatccatt gctttgagca tttatcattt ctatgtattg agaaaatttc aaatcctcat 30960 ttctagccat tttgaaatat ataataaata gtaattaact atagtcaccc tactcaaata 31020 tcaaacatta tggcttaatc cttctatcca actgtgtttg tacctattaa ccaacatctc 31080 ttaaatcccc tcccatacac actcacactt tttccagcct ctgataacta tcattctact 31140 ctctaccacc atgagaccca cttttttagc tcccacagat gaataaaaac atgtgatatt 31200 tgactttctg tatctggctt attttattat ctatctcttt ggcataccaa gagtttgttt 31260 ttgttctgct tcagggcttt caattaacat aatgacctct ggttccatcc atgttgctac 31320 aaatgacaag atttcattct ttttcatggc aaaatagtac tgtgcaaaaa tacaattttt 31380 taatccgttc atctgttgat agacacttag gttgatccca aaccttaact attgtgaata 31440 gtgcttcaat aaacatgagt gtaatgtgtc cattggatat actgatttcc tttcttttgg 31500 ataaataacc actagtgaga ttgctggatt gtatgatagt tctgttttta gtttactgag 31560 aaatcttcat actgttttcc ataatggttg tactatttta cattcccacc aacagtgtgt 31620 aagaaagagt tcccttttct ccatatcctc acaaggatct gttatttttt gtcttttttg 31680 ttaatagccg ttttaactag agtaagtaga tatctcattg tagttttgat ttgcatttcc 31740 ctgatcatta gtgatgttga gaattttttc atatgtttgt tggtcatttg tatatctttt 31800 tctgagaatt gtctgttcat gtccttagcc tactttttat tgggattgtt tgttattttc 31860 ttgataatct atttgtgttc attttagagc ctggatatta ttcttttgtc agatgtatag 31920 attgtgaaga ttttctccca ctctgtgggt tgtctgttta ttctgcagac tcttcctttt 31980 gccatgcaaa agctctttag tttaatttag tcccagatat tttctttgtt tttatgtatt 32040 tgcatttgtg ttcttggtca tgaaatcctt tcctaagcca atgtgtagaa gggtttttcc 32100 gatgttattt tctagaattg ttacagtttc agggcttaga tttaagtcct tgatccatct 32160 tgagttgatt tttgtataag gtgagagatg aagatccagt ttcattctcc tacatgtagc 32220 ttgccagcta tccccgcacc atttgttgaa tagggtgccc tttccccact ttatgttttt 32280 gtttgctttg tcaaagatca gttggatgta agtatttgag tttatttctg ggttctctat 32340 tctgttccat tggtcgatgt gcctatttgt acaccagcat catgctgttt tggtgactat 32400 ggccttattg tatagtttga aatgaggtaa tgtaatgcct tcagatttgt tctttttttt 32460 agacttgctt gtttattggg ctcttttttg gttccataag aattttagga ttgttttttc 32520 tagttctgtg aagactaatg gtggtatttt gatgggaatt gcaatgaatt tgtaggttgc 32580 ttctggcatt atggccattt tcacaatatt gattctaccc atctatgaga atggcatgtg 32640 tttccatttg tttgtgtctt atatgattac tttcagccgt gttttgtagt tttccttgta 32700 gatgtctttc acctccttgg ttaggtatat attcctaagt ttttgttttg ttttgttttg 32760 ttttttgcag ctattgtaaa aggggttgag ttcttgattt tattctcagc ttggtcattg 32820 ctggtatgta agaaagcaac tcattggtgt acgttaattt tgtatccaga aactttgctg 32880 aattatttta tcagttctag ggggttttgg aggagtcttt agagttttct acatacacaa 32940 tcatatcatc agcaaacagt gacagtttga ctttctcttt aacaatttgg atgtgcttta 33000 cttgtttctc ttgtctgatt gctcttgcta ggacttccag taatatgtta aagagaagtg 33060 gtgagagtgg gtatccttgt ctcattccag ttttcagaca gaatgctttt aactttttcc 33120 cattcaatat aatgttggct gtgtgtttac catagctggc ttttattaca ttgaggtatg 33180 tcctttgtaa accgattttg ctgagtttta gtcataaagt gatgttgaat tttgttgaat 33240 gcagtttctg tggctattga gataatcaca tgatttttgt ttccaattct ctttatgttg 33300 tgtatcacac ttattgactt gcgtatgtta aaccatccgt gcatccctcg catgaaaccc 33360 acttgatcat gggttttgat atgctgtcgg atgctattag ctagtatttt gtcaaggatg 33420 ttggcatcta tgttcatcag ggatattgat ctgtagtgtt tttttttttt ggttatgttc 33480 tttcccagtt ttggtattaa ggtgatactg gcttcataga atgatttagg gaggattctc 33540 tctttctcta tcttgtagaa tactgtcaat aggattggta tcaattcttc tttgaatgtc 33600 tggtagaatt cagctgtgaa tctatctggt cctggacttt tttgttgttg gtaaattttt 33660 attatcattt cagtcttgct gcttattact ggtctgttca gggtatctaa ttcttcctga 33720 cttaagctag agccctgtat ctttccagga attcgaacgt ctcctttagg ttttctagtt 33780 tatgcatgta aaggtgttca tagtagcctt gaataatctt ttgtatttct gtggtatcag 33840 taatagtatc tcctgttttg tttctaattg agtttatttg cacttctctc ctcttttctt 33900 ggttaatctt gctaatggtc tatcagtttt atttatcttt tcaaagaacc agctttttat 33960 ttcatttagc ttttgtattt ttttgcagtt gttttaattt catttagttc tcctcttatc 34020 ttagttattc cctttctttt gctgggtttt ggttctgttt gtttttgttt ctctagtttc 34080 ttgtggtgtg accttatatt gtctgtctgt cctctttcag actctttgac atcgacattt 34140 agggctgtga actttccttt tagcaccatc tttgctgtat cctagaggtt ttgataggtt 34200 gtgtcactat tgtcggtcag ttcaagtaat tttgttgttc ttattatact ttaagttctg 34260 ggatacatgt gcagaatgtg caggtttgtt acataggtat agatgtgcca tggtggtttg 34320 ctgcacccat caacctgtca tctacattag gtatttcttt taatgttatc cctctcctaa 34380 ccccctcacc ccccgacagg ccctggtgtg tgatgttccc ctccctgtgt ccatgtgttc 34440 tcattgttca actcccactt atgagtgaga acgtgtggtg tttggtttct ctgttcctgt 34500 gttagtttgc tcagaatgat ggtttccacc ttcatccatg tccctgcaaa gacatgaact 34560 catcattttt atggctgcat agtattccat ggtgtatatg tgccacattt tctttatcca 34620 ttatatcgct gatggccatt tgggttggtt ccaagtcttt gctattgtga atagtgccac 34680 aataaacata cgtgtgcacg tgtctttata gtagaatgat ttctaattct ttgggtatat 34740 acccagtaat gggattgctg ggtcaaacag tatttctggt tctagatcct tgaggaatcg 34800 ccacactgtc ttccacaatg gttgaactaa tttacacacc catcaacagt gtaaaatttt 34860 tcctattctt ccacatcctc tccagcacct tttgtttcct gactttttaa taattgccat 34920 tctaactggc atgagatggt atctcattgt ggttttgatt tgcatttctc taatgaccag 34980 tgatgatgag cttcttttca tgtgtttctt ggccacataa atgacttctt tagagaagca 35040 tctgttcata tcctttgtcc actttttgat ggggtcgtta ggttttttct tgtaaatttg 35100 ttgaagttct ttgtagattt tggatgttag ccctttgtca gatggataga ttgcaaaaat 35160 tttctcccat tctgtaggtt gcctgttcac tctgatgata gtcttttgct gtgcagaagc 35220 tctttagttt aattagatcc catatgtcaa ttttggcctt tgttgtcatt gcttttgatg 35280 ttttagtcgt gaatttttgc ccatgcctat gtcctgaatg gtattgccta ggttatcttc 35340 taggattttt atggttttag gttgcacatt taagtcttta atccaccttg agttaatttt 35400 tgtataaggt gtaaggaagg ggtacagttt cagttttatg catattgcta gccagttttt 35460 ccagcaccat ttattaaata gggaattctt tctccattgc ttttgtgatg tttgtcaaag 35520 atcagatggt cgtagatgtg tggcattatt tctgaggctt ctgttctgtt ccactggtct 35580 atatatctgt tttggtacca gtaccatgct gtttttgtta ctgtagcctt gtagtatagt 35640 ttgaagtcag gtagcatcat gcctccagct ttgttctttt tgtttaggat tgtcttggct 35700 atatgggctc ttttttgatt ccatatgaca tttaaagtag ttttttctaa ttctttgaaa 35760 aaagtcagtg gtagcttgat ggggatagca ttgaatctat aaattacttt gggcagtatg 35820 gccattttaa agatattgat tctttctatc tatgagcatg gaatgttttt ccatttgttt 35880 gtgtcctctc ttatttcctt gagcagtgag tggtttgtag ctctccttga agaggttctt 35940 cacatccctt agaagttgta tttctaggta ttttatttta ttctctttgc agcaattgtg 36000 aatgggagtt cacccatgat ttggctctct gcttgtctat tattggtgta taggaacgct 36060 tgtgatttct gcacactgat tttgtatctt gagactttgc tgaagctgtt tatcagctta 36120 agattttggg ctgagatgac agggtcttct aaatatacaa tcatgtcatc tgcaaacaga 36180 gacaatttga cttcctctct tcctatttga atatgcttta tttctttctc ttgcctgatt 36240 gtcctggcga gaacttccaa tactatgttg agtaagagtg gcgagagggc atccttgtct 36300 tgtgccggtt ttcaaagcaa atgattttta aatttccatc ttgatttcat tgttgaccca 36360 atgatcattc aggagcaggt tatttaattt ccctgtattt gcatggtttt gaaggttcct 36420 tttgtagttg atttccaatt ttattctact gtggtctgag agagtgcttg atataatttc 36480 aatttttaaa aatttattga ggcttgtttt gtggcatatc atatggccta tcttggagaa 36540 agttccatgt gctgatgaat agaatgtgta ttctgcagtt gttgggtaga atgtcctgta 36600 aatatctgtt aagtccattt gttctttaaa tccattgttt ctttgtagac tgtcttgatg 36660 acctgcctag tgcagtcagt ggagtattga agtcccccac tattattatg ttgctgtcta 36720 gtctagtagt aattgtttta taaatttggg atctccagta ttagatgcat atatattaag 36780 aattgtaata ttctcccatt ggacaagggc ttttatcatt atatgatgtc cctctttgtc 36840 ttttttaact gctgtttctt taaagtttgt tttgtctgac ataagaatag ctgctttggc 36900 tcgcttttgg tgtccatttg tgtggaatgt cattttccac ccctttacct taagtttatg 36960 tgagtcctta tgtgttaggt gagtctcctg aaggcggcag ataactggtt ggtgaattct 37020 tattcattct gcaattctgt atcttttaag tggagcattt agtccattta cattcaacat 37080 cagtattgag gtgtgaggta ctattccatt cttcgtggta tttgttgcct gtgtatcttt 37140 ttatctgtat ttttgttgta tatgtcctat gggatttatg ctttaaagag gttctgtttt 37200 gatgtgcttc cagggtttat ttcaagattt agagctcctt ttatcagttc ttgtagtgtt 37260 ggcttggtag tgccgaattc tctcagcatt tgtttttctg aaaaacactg tgtattttct 37320 tcatttgtga agcttagttt cactggatat aaaattcttg gctgataatt gttttgttta 37380 agaaggctga agatagggcc atattcactt ctagctttta cggtttctgc tgagaaatct 37440 gctgttaatc tgataggttt tctttcatag gttacctggt agtttcacct cacagctctt 37500 aagattctct ttgtctttag ataactttgg atactctgat gacaatgtac ctaggcaatg 37560 atatttttgc aatgaatttc ccaggtgttt attgagcttc ttgtatttgg atatctaggt 37620 ctctagcaag gtgggggaag ttttccttga ttatttccct ggataagttt tccaaacttt 37680 tagatttctc ttctttctca ggaatgctga ttattcttag gtttgattgt ttaacataat 37740 cccagatttc ttggaggctt tgttcatatt ttcttattct tttttctttg tctttgttgg 37800 attgggttaa ttcaaaaact ttgtcttcaa gctctgaatt tcttctgctt ggattctatt 37860 gctgagactt tctagagcat tttgcatttc tataagtgca tccattcatc cattgtttcc 37920 tgaagttttg aatgtttttt atttatgcta tctctttaac tgaagatttc tcccctcatt 37980 tcttgtatca tatttttggt ttttttaaaa ttggacttca ccttcctcgg atgcctcctt 38040 gattagctta ataactgacc ttctgaatta tttttcaggt aaatcaggga tttcttcttg 38100 gtttggatgc attgctggtg agctagtatg attttttggg gggtgttaaa gaaccttgtt 38160 tttcatatta ccagagttag ttttctggtt ccttctcact tgggtaggct ctgtcagagg 38220 gaaagtctag gcctcaaggc tgagactttt gtcccatgag gtgttccctt gatgtagcac 38280 agtccccctt ttcctaggcg tggggcttcc tgagagccga actgtagtga ttgttatctc 38340 tcttctggat ctagccaccc atcaggtcta ccagactcca ggctggtact ggggtttgtc 38400 tgcacagagt cttgtgacgt gaaccatctg tgggtctctc agccatagat acaaccacct 38460 gctccaatgg aggtggcaga ggatgaaatg gactctgtga gggtccttac ttttggttgt 38520 tcaatgcact atttttgtgc tggttggcct cctgccagga ggtggcactt tctagaaagc 38580 atcagcagag gcagtcaggt ggtggtggct gggggggctg gggcacccta gaactcccaa 38640 gaatatatgc cctttgtctt cagctaccag ggtgagtaag gaaggaccat caggtggggg 38700 caggactagt cgtgtctgag ctcagagtct ccttgggcag gtctttctgt ggctactgtg 38760 ggaggatggg ggtgtagttt ccaggtcaat ggatttatgt tcctaggaca attatggctg 38820 cctctgctgt gtcatgcagg tcatcaggaa agtgggggaa agcaagcagt cacgtgactt 38880 gcccagctcc catgcaactc aaaaggttgg tctcacttcc agcgtgcacc ctcccccgca 38940 acagcaccga atctgtttcc atgcagtcag tgagcaaggc tgagaacttg ccccaggcta 39000 ccagctgcga aaccaagtag ggctgtccta cttccctgcc agtggagtct gcacaccaaa 39060 ttcatgtccc cccaccaacc cccccactgc ccagccccta gatctggcca ggtggagatt 39120 ttctttttcc tgtcatcttt tcccagttcc tctggcagcc ctcccaaatg acccctgtga 39180 ggcaaggcag aaatggcttc ctaggggacc cagagagccc acagggcttt tcccgctgct 39240 tcctctaccc ctgtattttg cttggccctc taaattgact cagctccagg taaggtcaga 39300 atcttctcct gtggtctaga tcttcaggtt ccccagtgag gatgtgtgtt tgggggtaga 39360 cggtccccct tttccacttc cacagtttgg gcactcacaa tatttggggt gtttcccggg 39420 tcctgcagga gcaatctgct tctttcagag ggtgtgtgcg ttctctcagc tttcttgatt 39480 tatttctgca ggtggttctg caaaaaaaat tcctgatggg agacttcaca tgctgctctg 39540 tgcatccgag tgggagctgc aatgtacttc tgctgcctcc catctgccat caccctctaa 39600 tttgtcggta atatgcattt ttaatcaatc tttttttctc tctctctctt tttcttctcc 39660 cccaaaacta tactgccctt tgatatcaag gaatcaagga cgtgatgttg aggggtgggc 39720 agtggataca ctctttaccc cttagggagc tatatctaga tttagatatt gccaattcaa 39780 gataacttaa ttgaaagcaa attcataatg aatacacaca cacacacaca catctgcatg 39840 acaagatttt taatagttga aagaataact aataattgtc cacaggcaat aagggctttt 39900 taagcaaaac agttgtgata aacaggtcat tcttagaata gtaatccagc caatagtaca 39960 ggttgcttag agattatgtc attaccagag ttaaaattct ataatggctt ctcactccct 40020 accactgagg acaagtttat gtccttaggt ttatgcttcc ctgaaacaat accacctgct 40080 attctccact ttacatatca acggcactgg ttctttatct aactctctgg cacagcagga 40140 gtttgttttc ttctgcttca gagctttgaa tttactattt cagcttctaa actttatttg 40200 gcaatgcctt cccatggcag attccttctg tcattttgcc tctgttcgaa tactttctcc 40260 ttaatttcat tcttagttaa taatatctga aattattttg ttgtttaact taattattaa 40320 ttttatgtat gttctaccta gattataatc ttcagaggaa agttttattc tctgacttat 40380 ttaacttaaa tgcccactac tttaaaaatt atgacattta tttaacagat atttgctgaa 40440 caaatgtttg aaaatacatg ggaaagaatg cttgaaaaca cttgaaattg cttgtgtaaa 40500 gaaacagttt tatcagttag gatttaatca atgtcagaag caatgatata ggaaaaatcg 40560 aggaataaga cagttatgga taaggagaaa tcaacaaact cttaaaagat attgcctcaa 40620 aagcataaga ggaaataagg gtttatacat gacttttaga acactgcctt ggtttttgga 40680 taaatgggga agttgtttga aaacaggagg gatcctagat attccttagt ctgaggagga 40740 gcaattaaga ttcacttgtt tagaggctgg gagtggtggc tcacgcctgt aatcccagaa 40800 ttttgggagg ccaaggcagg cagatcacct gaggtcaaga gttcaagacc aacctggcca 40860 acatggtgaa atcccatctc tacaaaaata caaaaattag acaggcatga tggcaagtgc 40920 ctgtaatccc agctacttgg gaggctgagg aaggagaatt gcttgaacct ggaaggcagg 40980 agttgcagtg agccgagatc ataccactgc actccagcct gggtgacaga acaagactct 41040 gtctcaaaaa aaaaaaagag agattcaaaa gattcacttg tttaggcctt agcgggctta 41100 gacaccagtc tctgacacat tcttaaaggt caggctctac aaatggaacc caaccagact 41160 ctcagatatg gccaaagatc tatacacacc catctcacag atcccctatc ttaaagagac 41220 cctaatttgg gttcacctca gtctctataa tctgtaccag cataccaata aaaatctttc 41280 tcacccatcc ttagattgag agaagtcact tattattatg tgagtaactg gaagatactg 41340 ataagttgac aaatcttttt ctttcctttc ttattcaact tttattttaa cttccaaaga 41400 acaagtgcaa tatgtgcagc tttgttgcgc aggtcaacat gtatctttct ggtcttttag 41460 ccgcctaaca ctttgagcag atataagcct tacacaggat tatgaagtct gaaaggattc 41520 caccaatatt attataattc ctatcaacct gataggttag gggaaggtag agctctcctc 41580 caataagcca gatttccaga gtttctgacg tcataatcta ccaaggtcat ggatcgagtt 41640 cagagaaaaa acaaaagcaa aaccaaacct accaaaaaat aaaaatccca aagaaaaaat 41700 aaagaaaaaa acagcatgaa tacttcctgc catgttaagt ggccaatatg tcagaaacag 41760 cactgagtta cagataaaga tgtctaaact acagtgacat cccagctgtc acagtgtgtg 41820 gactattagt caataaaaca gtccctgcct cttaagagtt gttttccatg caaatacatg 41880 tcttatgtct tagaataaga ttccctaaga agtgaaccta gcatttatac aagataatta 41940 attctaatcc atagtatctg gtaaagagca ttctaccatc atctttaccg agcatagaag 42000 agctacacca aaaccctggg tcatcagcca gcacatacac ttatccagtg ataaatacac 42060 atcatcgggt gcctacatac atacctgaat ataaaaaaaa tacttttgct gagatgaaac 42120 aggcgtgatt tatttcaaat aggtacggat aagtagatat tgaagtaagg attcagtctt 42180 atattatatt acataacatt aatctattcc tgcactgaaa ctgttgcttt ataggatttt 42240 tcactacact aatgagaact taagagataa tggcctaaaa ccacagagag tatattcaaa 42300 gataagtata gcacttctta tttggaaacc aatgcttact aaatgagact aagacgtgtc 42360 ccatcaaaaa tcctggacct atgcctaaaa cacatttcac aatccctgaa cttttcaaaa 42420 attggtacat gctttaactt taaactacag gcctcactgg agctacagac aagaaggtga 42480 aaaacggctg acaaaagaag tcctggtatc ttctatggtg ggagaagaaa actagctaaa 42540 gggaagaata aattagagaa aaattggaat gactgaatcg gaacaaggca aaggctataa 42600 aaaaaattaa gcagcagtat cctcttgggg gccccttccc cacactatct caatgcaaat 42660 atctgtctga aacggtccct ggctaaactc cacccatggg ttggccagcc ttgccttgac 42720 caatagcctt gacaaggcaa acttgaccaa tagtcttaga gtatccagtg aggccagggg 42780 ccggcggctg gctagggatg aagaataaaa ggaagcaccc ttcagcagtt ccacacactc 42840 gcttctggaa cgtctgaggt tatcaataag ctcctagtcc agacgccatg ggtcatttca 42900 cagaggagga caaggctact atcacaagcc tgtggggcaa ggtgaatgtg gaagatgctg 42960 gaggagaaac cctgggaagg taggctctgg tgaccaggac aagggaggga aggaaggacc 43020 ctgtgcctgg caaaagtcca ggtcgcttct caggatttgt ggcaccttct gactgtcaaa 43080 ctgttcttgt caatctcaca ggctcctggt tgtctaccca tggacccaga ggttctttga 43140 cagctttggc aacctgtcct ctgcctctgc catcatgggc aaccccaaag tcaaggcaca 43200 tggcaagaag gtgctgactt ccttgggaga tgccataaag cacctggatg atctcaaggg 43260 cacctttgcc cagctgagtg aactgcactg tgacaagctg catgtggatc ctgagaactt 43320 caaggtgagt ccaggagatg tttcagcact gttgccttta gtctcgaggc aacttagaca 43380 actgagtatt gatctgagca cagcagggtg tgagctgttt gaagatactg gggttgggag 43440 tgaagaaact gcagaggact aactgggctg agacccagtg gcaatgtttt agggcctaag 43500 gagtgcctct gaaaatctag atggacaact ttgactttga gaaaagagag gtggaaatga 43560 ggaaaatgac ttttctttat tagatttcgg tagaaagaac tttcaccttt cccctatttt 43620 tgttattcgt tttaaaacat ctatctggag gcaggacaag tatggtcatt aaaaagatgc 43680 aggcagaagg catatattgg ctcagtcaaa gtggggaact ttggtggcca aacatacatt 43740 gctaaggcta ttcctatatc agctggacac atataaaatg ctgctaatgc ttcattacaa 43800 acttatatcc tttaattcca gatgggggca aagtatgtcc aggggtgagg aacaattgaa 43860 acatttgggc tggagtagat tttgaaagtc agctctgtgt gtgtgtgtgt gtgtgtgcgc 43920 gcgtgtgttt gtgtgtgtgt gagagcgtgt gtttctttta acgttttcag cctacagcat 43980 acagggttca tggtggcaag aagataacaa gatttaaatt atggccagtg actagtgctg 44040 caagaagaac aactacctgc atttaatggg aaagcaaaat ctcaggcttt gagggaagtt 44100 aacataggct tgattctggg tggaagcttg gtgtgtagtt atctggaggc caggctggag 44160 ctctcagctc actatgggtt catctttatt gtctcctttc atctcaacag ctcctgggaa 44220 atgtgctggt gaccgttttg gcaatccatt tcggcaaaga attcacccct gaggtgcagg 44280 cttcctggca gaagatggtg actggagtgg ccagtgccct gtcctccaga taccactgag 44340 ctcactgccc atgatgcaga gctttcaagg ataggcttta ttctgcaagc aatcaaataa 44400 taaatctatt ctgctaagag atcacacatg gttgtcttca gttctttttt tatgtctttt 44460 taaatatatg agccacaaag ggttttatgt tgagggatgt gtttatgtgt atttatacat 44520 ggctatgtgt gtttgtgtca tgtgcacact ccacactttt ttgtttacgt tagatgtggg 44580 ttttgatgag caaataaaag aactaggcaa taaagaaact tgtacatggg agttctgcaa 44640 gtgggagtaa aaggtgcagg agaaatctgg ttggaagaaa gacctctata ggacaggact 44700 cctcagaaac agatgttttg gaagagatgg ggaaaggttc agtgaagggg gctgaacccc 44760 cttccctgga ttgcagcaca gcagcgagga aggggctcaa cgaagaaaaa gtgttccaag 44820 ctttaggaag tcaaggttta ggcagggata gccattctat tttattaggg gcaatactat 44880 ttccaacggc atctggcttt tctcagccct tgtgaggctc tacagggagg ttgaggtgtt 44940 agagatcaga gcaggaaaca ggtttttctt tccacggtaa ctacaatgaa gtgatcctta 45000 ctttactaag gaacttttca ttttaagtgt tgacgcatgc ctaaagaggt gaaattaatc 45060 ccataccctt aagtctacag actggtcaca gcatttcaag gaggagacct cattgtaagc 45120 ttctagggag gtggggactt aggtgaagga aatgagccag cagaagctca caagtcagca 45180 tcagcgtgtc atgtctcagc agcagaacag cacggtcaga tgaaaatata gtgtgaagaa 45240 tttgtataac attaattgag aaggcagatt cactggagtt cttatataat tgaaagttaa 45300 tgcacgttaa taagcaagag tttagtttaa tgtgatggtg ttatgaactt aacgcttgtg 45360 tctccagaaa attcacatgc tgaatcccca actcccaatt ggctccattt gtgggggagg 45420 ctttggaaaa gtaatcaggt ttagaggagc tcatgagagc agatccccat catagaatta 45480 ttttcctcat cagaagcaga gagattagcc atttctcttc cttctggtga ggacacagtg 45540 ggaagtcagc cacctgcaac ccaggaagag agccctgacc aggaaccagc agaaaagtga 45600 gaaaaaatcc tgttgttgaa gtcacccagt ctatgctatt ttgttatagc accttgcact 45660 aagtaaggca gatgaagaaa gagaaaaaaa taagcttcgg tgttcagtgg attagaaacc 45720 atgtttatct caggtttaca aatctccact tgtcctctgt gtttcagaat aaaataccaa 45780 ctctactact ctcatctgta agatgcaaat agtaagcctg agcccttctg tctaactttg 45840 aattctattt tttcttcaac gtactttagg cttgtaatgt gtttatatac agtgaaatgt 45900 caagttcttt ctttatattt ctttctttct tttttttcct cagcctcaga gttttccaca 45960 tgcccttcct actttcagga acttctttct ccaaacgtct tctgcctggc tccatcaaat 46020 cataaaggac ccacttcaaa tgccatcact cactaccatt tcacaattcg cactttcttt 46080 ctttgtcctt ttttttttta gtaaaacaag tttataaaaa attgaaggaa taaatgaatg 46140 gctacttcat aggcagagta gacgcaaggg ctactggttg ccgattttta ttgttatttt 46200 tcaatagtat gctaaacaag gggtagatta tttatgctgc ccatttttag accataaaag 46260 ataacttcct gatgttgcca tggcattttt ttccttttaa ttttatttca tttcatttta 46320 atttcgaagg tacatgtgca ggatgtgcag gcttgttaca tgggtaaatg tgtgtctttc 46380 tggcctttta gccatctgta tcaatgagca gatataagct ttacacagga tcatgaagga 46440 tgaaagaatt tcaccaatat tataataatt tcaatcaacc tgatagctta ggggataaac 46500 taatttgaag atacagcttg cctccgataa gccagaattc cagagcttct ggcattataa 46560 tctagcaagg ttagagatca tggatcactt tcagagaaaa acaaaaacaa actaaccaaa 46620 agcaaaacag aaccaaaaaa ccaccataaa tacttcctac cctgttaatg gtccaatatg 46680 tcagaaacag cactgtgtta gaaataaagc tgtctaaagt acactaatat tcgagttata 46740 atagtgtgtg gactattagt caataaaaac aacccttgcc tctttagagt tgttttccat 46800 gtacacgcac atcttatgtc ttagagtaag attccctgag aagtgaacct agcatttata 46860 caagataatt aattctaatc cacagtacct gccaaagaac attctaccat catctttact 46920 gagcatagaa gagctacgcc aaaaccctgg gtcatcagcc agcacacaca cttatccagt 46980 ggtaaataca catcatctgg tgtatacata catacctgaa tatggaatca aatatttttc 47040 taagatgaaa cagtcatgat ttatttcaaa taggtacgga taagtagata ttgaggtaag 47100 cattaggtct tatattatgt aacactaatc tattactgcg ctgaaactgt ggctttatag 47160 aaattgtttt cactgcacta ttgagaaatt aagagataat ggcaaaagtc acaaagagta 47220 tattcaaaaa gaagtatagc actttttcct tagaaaccac tgctaactga aagagactaa 47280 gatttgtccc gtcaaaaatc ctggacctat gcctaaaaca catttcacaa tccctgaact 47340 tttcaaaaat tggtacatgc tttagcttta aactacaggc ctcactggag ctagagacaa 47400 gaaggtaaaa aacggctgac aaaagaagtc ctggtatcct ctatgatggg agaaggaaac 47460 tagctaaagg gaagaataaa ttagagaaaa actggaatga ctgaatcgga acaaggcaaa 47520 ggctataaaa aaaattagca gtatcctctt gggggcccct tccccacact atctcaatgc 47580 aaatatctgt ctgaaacggt ccctggctaa actccaccca tgggttggcc agccttgcct 47640 tgaccaatag ccttgacaag gcaaacttga ccaatagtct tagagtatcc agtgaggcca 47700 ggggccggcg gctggctagg gatgaagaat aaaaggaagc acccttcagc agttccacac 47760 actcgcttct ggaacgtctg aggttatcaa taagctccta gtccagacgc catgggtcat 47820 ttcacagagg aggacaaggc tactatcaca agcctgtggg gcaaggtgaa tgtggaagat 47880 gctggaggag aaaccctggg aaggtaggct ctggtgacca ggacaaggga gggaaggaag 47940 gaccctgtgc ctggcaaaag tccaggtcgc ttctcaggat ttgtggcacc ttctgactgt 48000 caaactgttc ttgtcaatct cacaggctcc tggttgtcta cccatggacc cagaggttct 48060 ttgacagctt tggcaacctg tcctctgcct ctgccatcat gggcaacccc aaagtcaagg 48120 cacatggcaa gaaggtgctg acttccttgg gagatgccac aaagcacctg gatgatctca 48180 agggcacctt tgcccagctg agtgaactgc actgtgacaa gctgcatgtg gatcctgaga 48240 acttcaaggt gagtccagga gatgtttcag ccctgttgcc tttagtctcg aggcaactta 48300 gacaacggag tattgatctg agcacagcag ggtgtgagct gtttgaagat actggggttg 48360 ggggtgaaga aactgcagag gactaactgg gctgagaccc agtggtaatg ttttagggcc 48420 taaggagtgc ctctaaaaat ctagatggac aattttgact ttgagaaaag agaggtggaa 48480 atgaggaaaa tgacttttct ttattagatt ccagtagaaa gaactttcat ctttccctca 48540 tttttgttgt tttaaaacat ctatctggag gcaggacaag tatggtcgtt aaaaagatgc 48600 aggcagaagg catatattgg ctcagtcaaa gtggggaact ttggtggcca aacatacatt 48660 gctaaggcta ttcctatatc agctggacac atataaaatg ctgctaatgc ttcattacaa 48720 acttatatcc tttaattcca gatgggggca aagtatgtcc aggggtgagg aacaattgaa 48780 acatttgggc tggagtagat tttgaaagtc agctctgtgt gtgtgtgtgt gtgtgcgcgc 48840 gcgcgtgtgt gtgtgtgtgt cagcgtgtgt ttcttttaac gtcttcagcc tacaacatac 48900 agggttcatg gtggcaagaa gatagcaaga tttaaattat ggccagtgac tagtgcttga 48960 aggggaacaa ctacctgcat ttaatgggaa ggcaaaatct caggctttga gggaagttaa 49020 cataggcttg attctgggtg gaagcttggt gtgtagttat ctggaggcca ggctggagct 49080 ctcagctcac tatgggttca tctttattgt ctcctttcat ctcaacagct cctgggaaat 49140 gtgctggtga ccgttttggc aatccatttc ggcaaagaat tcacccctga ggtgcaggct 49200 tcctggcaga agatggtgac tgcagtggcc agtgccctgt cctccagata ccactgagct 49260 cactgcccat gattcagagc tttcaaggat aggctttatt ctgcaagcaa tacaaataat 49320 aaatctattc tgctgagaga tcacacatga ttttcttcag ctcttttttt tacatctttt 49380 taaatatatg agccacaaag ggtttatatt gagggaagtg tgtatgtgta tttctgcatg 49440 cctgtttgtg tttgtggtgt gtgcatgctc ctcatttatt tttatatgag atgtgcattt 49500 tgatgagcaa ataaaagcag taaagacact tgtacacggg agttctgcaa gtgggagtaa 49560 atggtgtagg agaaatccgg tgggaagaaa gacctctata ggacaggact tctcagaaac 49620 agatgttttg gaagagatgg gaaaaggttc agtgaagacc tgggggctgg attgattgca 49680 gctgagtagc aaggatggtt cttaaggaag ggaaagtgtt ccaagcttta ggaattcaag 49740 gtttagtcag gtgtagcaat tctattttat taggaggaat actatttcta atggcactta 49800 gcttttcaca gcccttgtgg atgcctaaga aagtgaaatt aatcccatgc cctcaagtgt 49860 gcagattggt cacagcattt caagggagag acctcattgt aagactctgg gggaggtggg 49920 gacttaggtg taagaaatga atcagcagag gctcacaagt cagcatgagc atgttatgtc 49980 tgagaaacag accagcactg tgagatcaaa atgtagtggg aagaatttgt acaacattaa 50040 ttggaaggct tacttaatgg aatttttgta tagttggatg ttagtgcatc tctataagta 50100 agagtttaat atgatggtgt tacggaccta atgtttgtgt ctcctcaaaa ttcacatgct 50160 gaatccccaa ctcccaactg accttatctg tgggggaggc ttttgaaaag taattaggtt 50220 tagatgagct cataagagca gatccccatc ataaaattat tttccttatc agaagcagag 50280 agacaagcca tttctctttc ctcccggtga ggacacagtg agaagtccgc catctgcaat 50340 ccaggaagag aaccctgacc acgagtcagc cttcagaaat gtgagaaaaa actctgttgt 50400 tgaagccacc cagtcttttg tattttgtta tagcaccttg cactgagtaa ggcagatgaa 50460 gaaggagaaa aaaataagct tgggttttga gtggactaca gaccatgttt atctcaggtt 50520 tgcaaagctc ccctcgtccc ctatgtttca gtataaaata cctactctac tactctcatc 50580 tataagaccc aaataataag cctgcgccct tctctctaac tttgatttct cctattttta 50640 cttcaacatg ctttactcta gccttgtaat gtctttacat acagtgaaat gtaaagttct 50700 ttattctttt tttctttctt tcttttttct cctcagcctc agaatttggc acatgccctt 50760 ccttctttca ggaacttctc caacatctct gcctggctcc atcatatcat aaaggtccca 50820 cttcaaatgc agtcactacc gtttcagaat atgcactttc tttctttttt gttttttgtt 50880 ttttttaagt caaagcaaat ttcttgagag agtaaagaaa taaacgaatg actactgcat 50940 aggcagagca gccccgaggg ccgctggttg ttccttttat ggttatttct tgatgatatg 51000 ttaaacaagt tttggattat ttatgccttc tctttttagg ccatataggg taactttctg 51060 acattgccat ggcatttttc ttttaattta atttactgtt accttaaatt caggggtaca 51120 cgtacaggat atgcaggttt gttttatagg taaaagtgtg ccatggtttt aatgggtttt 51180 ttttttcttg taaagttgtt taagtttctt gtttactctg gatattaggc ctttgtcaga 51240 agaatagatt ggaaaatctt tttcccattc tgtagattgt ctttcgctct gatggtagtt 51300 tcttttgctg agcaggagct ctttagttta attagattcc attggtcaat ttttgctttt 51360 gctgcaattg cttttcacgc tttcatcatg aaatctgtgc ccgtgtttat atcatgaata 51420 gtattgcctt gatttttttc taggcttttt atagtttggg gtttttcatt taagtctcta 51480 atccatctgg agttaatttt ggataaggta taaggaagga gtccagtttc atttttcagc 51540 atatggctag ccagttctcc cccatcattt attaaattga aaatcctttc cccattgctt 51600 gcttttgtca ggtttctaaa agaccagatg gttgtaggta caatatgcag tttcttcaag 51660 tcatataata ccatctgaaa tctcttatta attcatttct tttagtatgt atgctggtct 51720 cctctgctca ctatagtgag ggcaccatta gccagagaat ctgtctgtct agttcatgta 51780 agattctcag aattaagaaa aatggatggc atatgaatga aacttcatgg atgacatatg 51840 gaatctaata tgtatttgtt gaattaatgc ataagatgca acagagagaa gttgacaact 51900 gcaatgataa cctggtattg atgatataag agtctataga tcacagtaga agcaataatc 51960 atggaaaaca attggaaatg gggaacagcc acaaacaaga aagaatcaat acttccagga 52020 aagtgactgc aggtcacttt tcctggagcg ggtgagagaa aagtggaagt tagcagtaac 52080 tgctgaattc ctggttggct gatggaaaga tggggcagct gttcactggt acgcagggtt 52140 ttagatgtat gtacctaagg atatgaggta tggcaatgaa cagaaattct tttgggaatg 52200 agttttaggg ccattaaagg acatgacctg aagtttcctc tgaggccagt ccccacaact 52260 caatataaat gtgtttcctg catatagtca aagttgccac ttctttttct tcatatcatc 52320 gatctctgct cttaaagata atcttggttt tgcctcaaac tgtttgtcac tacaaacttt 52380 ccccatgttc ctaagtaaaa caggtaactg cctctcaact atatcaagta gactaaaata 52440 ttgtgtctct aatatcagaa attcagcttt aatatattgg gtttaactct ttgaaattta 52500 gagtctcctt gaaatacaca tgggggtgat ttcctaaact ttatttcttg taaggattta 52560 tctcaggggt aacacacaaa ccagcatcct gaacctctaa gtatgaggac agtaagcctt 52620 aagaatataa aataaactgt tcttctctct gccggtggaa gtgtgccctg tctattcctg 52680 aaattgcttg tttgagacgc atgagacgtg cagcacatga gacacgtgca gcagcctgtg 52740 gaatattgtc agtgaagaat gtctttgcct gattagatat aaagacaagt taaacacagc 52800 attagactat agatcaagcc tgtgccagac acaaatgacc taatgcccag cacgggccac 52860 ggaatctcct atcctcttgc ttgaacagag cagcacactt ctcccccaac actattagat 52920 gttctggcat aattttgtag atatgtagga tttgacatgg actattgttc aatgattcag 52980 aggaaatctc ctttgttcag ataagtacac tgactactaa atggattaaa aaacacagta 53040 ataaaaccca gttttcccct tacttcccta gtttgtttct tattctgctt tcttccaagt 53100 tgatgctgga tagaggtgtt tatttctatt ctaaaaagtg atgaaattgg ccgggcgcgg 53160 tggctcacac ctgtaatccc agcactttgg gaggctgagg tgggcggatc acgaggtcag 53220 gagatcaaga ccatcctggc taacatggtg aaaccccatc tctactaaaa atacaaaaaa 53280 ttagccagag acagtggcgg gtgcctgtag tcccagctac tcgggaggct gaggcaggag 53340 aatggcgtga acctgggagg cagagcttgc ggtgagcaga gatcgcgcca ctgcacactc 53400 cagcctgggt gacaaagcga gactccatct caaaaaaaaa aaaaaaaaaa agaaaaagaa 53460 agaaagaaag aaaaaaaaac tgatgaaatt gtgtattcaa tgtagtctca agagaattga 53520 aaaccaagaa aggctgtggc ttcttccaca taaagcctgg atgaataaca ggataacacg 53580 ttgttacatt gtcacaactc ctgatccagg aattgatggc taagatattc gtaattctta 53640 tccttttcag ttgtaactta ttcctatttg tcagcattca ggttattagc ggctgctggc 53700 gaagtccttg agaaataaac tgcacactgg atggtggggg tagtgtagga aaatggaggg 53760 gaaggaagta aagtttcaaa ttaagcctga acagcaaagt tcccctgaga aggccacctg 53820 gattctatca gaaactcgaa tgtccatctt gcaaaacttc cttgcccaaa ccccacccct 53880 ggagtcacaa cccacccttg accaatagat tcattttact gagggaggca aagggctggt 53940 caatagattc atttcactgg gagaggcaaa gggctggggg ccagagagga gaagtaaaaa 54000 gccacacatg aagcagcaat gcaggcatgc ttctggctca tctgtgatca ccaggaaact 54060 cccagatctg acactgtagt gcatttcact gctgacaaga aggctgctgc caccagcctg 54120 tgaagcaagg ttaaggtgag aaggctggag gtgagattct gggcaggtag gtactggaag 54180 ccgggacaag gtgcagaaag gcagaaagtg tttctgaaag agggattagc ccgttgtctt 54240 acatagtctg actttgcacc tgctctgtga ttatgactat cccacagtct cctggttgtc 54300 tacccatgga cctagaggta ctttgaaagt tttggatatc tgggctctga ctgtgcaata 54360 atgggcaacc ccaaagtcaa ggcacatggc aagaaggtgc tgatctcctt cggaaaagct 54420 gttatgctca cggatgacct caaaggcacc tttgctacac tgagtgacct gcactgtaac 54480 aagctgcacg tggaccctga gaacttcctg gtgagtagta agtacactca cgctttcttc 54540 tttaccctta gatatttgca ctatgggtac ttttgaaagc agaggtggct ttctcttgtg 54600 ttatgagtca gctatgggat atgatatttc agcagtggga ttttgagagt tatgttgctg 54660 taaataacat aactaaaatt tggtagagca aggactatga ataatggaag gccacttacc 54720 atttgatagc tctgaaaaac acatcttata aaaaattctg gccaaaatca aactgagtgt 54780 ttttggatga gggaacagaa gttgagatag agaaaataac atctttcctt tggtcagcga 54840 aattttctat aaaaattaat agtcactttt ctgcatagtc ctggaggtta gaaaaagatc 54900 aactgaacaa agtagtggga agctgttaaa aagaggattg tttccctccg aatgatgatg 54960 gtatactttt gtacgcatgg tacaggattc tttgttatga gtgtttggga aaattgtatg 55020 tatgtatgta tgtatgtatg tgatgactgg ggacttatcc tatccattac tgttccttga 55080 agtactatta tcctactttt taaaaggacg aagtctctaa aaaaaaaatg aaacaatcac 55140 aatatgttgg ggtagtgagt tggcatagca agtaagagaa ggataggaca caatgggagg 55200 tgcagggctg ccagtcatat tgaagctgat atctagccca taatggtgag agttgctcaa 55260 actctggtga aaaaggatgt aagtgttata tctatttact gcaagtccag cttgaggcct 55320 tctattcact atgtaccatt ttctttttta tcttcactcc ctccccagct cttaggcaac 55380 gtgatattga ttgttttggc aacccacttc agcgaggatt ttaccctaca gatacaggct 55440 tcttggcagt aactaacaaa tgctgtggtt aatgctgtag cccacaagac cactgagttc 55500 cctgtccact atgtttgtac ctatggtcca ctatgtttgt acctatgtcc caaaatctca 55560 tctcctttag atgggggagg ttggggagaa gagcagtatc ctgcctgctg attcagttcc 55620 tgcatgataa aaatagaata aagaaatatg ctctctaaga aatatcattg tactcttttt 55680 ctgtctttat attttaccct gattcagcca aaaggacgca ctatttctga tggaaatgag 55740 aatgttggag aatgggagtt taaggacaga gaagatactt tcttgcaatc ctgcaagaaa 55800 agagagaact cgtgggtgga tttagtgggg tagttactcc taggaagggg aaatcgtctc 55860 tagaataaga caatgttttt acagaaaggg aggtcaatgg aggtactctt tggaggtgta 55920 agaggattgt tggtagtgtg tagaggtatg ttaggactca aattagaagt tctgtatagg 55980 ctattatttg tatgaaactc aggatatagc tcatttggtg actgcagttc acttctactt 56040 attttaaaca acatattttt tattatttat aatgaagtgg ggatggggct tcctagagac 56100 caatcaaggg ccaaaccttg aactttctct taacgtcttc aatggtatta atagagaatt 56160 atctctaagg catgtgaact ggctgtcttg gttttcatct gtacttcatc tgctacctct 56220 gtgacctgaa acatatttat aattccatta agctgtgcat atgatagatt tatcatatgt 56280 attttcctta aaggattttt gtaagaacta attgaattga tacctgtaaa gtctttatca 56340 cactacccaa taaataataa atctctttgt tcagctctct gtttctataa atatgtacaa 56400 gttttattgt ttttagtggt agtgatttta ttctctttct atatatatac acacacatgt 56460 gtgcattcat aaatatatac aatttttatg aataaaaaat tattagcaat caatattgaa 56520 aaccactgat ttttgtttat gtgagcaaac agcagattaa aaggctgaga tttaggaaac 56580 agcacgttaa gtcaagttga tagaggagaa tatggacatt taaaagaggc aggatgatat 56640 aaaattaggg aaactggatg cagagaccag atgaagtaag aaaaatagct atcgttttga 56700 gcaaaaatca ctgaagtttc ttgcatatga gagtgacata ataaataggg aaacgtagaa 56760 aattgattca catgtatata tatatataga actgattaga caaagtctaa cttgggtata 56820 gtcagaggag cttgctgtaa ttatattgag gtgatggata aagaactgaa gttgatggaa 56880 acaatgaagt taagaaaaaa aatcgagtaa gagaccattg tggcagtgat tgcacagaac 56940 tggaaaacat tgtgaaacag agagtcagag atgacagcta aaatccctgt ctgtgaatga 57000 aaagaaggaa atttattgac agaacagcaa atgcctacaa gccccctgtt tggatctggc 57060 aatgaacgta gccattctgt ggcaatcact tcaaactcct gtacccaaga cccttaggaa 57120 gtatgtagca ccctcaaacc taaaacctca aagaaagagg ttttagaaga tataataccc 57180 tttcttctcc agtttcatta atcccaaaac ctctttctca aagtatttcc tctatgtgtc 57240 caccccaaag agctcacctc accatatctc ttgagtggga gcacatagat aggcggtgct 57300 accatctaac agcttctgaa attcctttgt catatttttg agtccccact aataacccac 57360 aaagcagaat aaataccagt tgctcatgta caataatcac tcaactgctg tcttgtagca 57420 tacattaatt aagcacattc tttgaataat tactgtgtcc aaacaatcac actttaaaat 57480 ctcacacttg tgctatccct tgcccttctg aatgtcactc tgtattttaa atgaagagat 57540 gagggttgaa tttcctgtgt tacttattgt tcatttctcg atgaggagtt ttcacattca 57600 cctttagtgg aaaacacata agtacacatc ttacaggaaa aatataccaa actgacatgt 57660 agcatgaatg cttgtgcatg tagtcatata aaatcttgta gcaatgtaaa cattctctga 57720 tatacacata cagatgtgtc tatatgtcta cacaatttct tatgctccat gaacaaacat 57780 tccatgcaca cataagaaca cacactgtta cagatgcata cttgagtgca ttgacaaaat 57840 taccccagtc aatctagaga atttggattt ctgcatttga ctctgttagc tttgtacatg 57900 ctgttcattt actctgggtg atgtctttcc ctcattttgc cttgtctatc ttgtactcat 57960 actttaagtc ctaacttata tgttatctca actaagaagc tatttttttt taattttaac 58020 tgggcttaaa gccctgtcta taaactctgc tacaattatg ggctctttct tataatattt 58080 agtgtttttc ctactaatgt acttaatctg ctcattgtat attcctacca ctaaatttta 58140 acctctttta tggtagagac attgtcttgt aaactcttat ttccctagta tttggagatg 58200 aaaaaaaaga ttaaattatc caaaattaga tctctctttt ctacattatg agtattacac 58260 tatccataga gaagtttgtt tgagacctaa actgaggaac ctttggttct aaaatgacta 58320 tgtgatatct tagtatttat aggtcatgag gttccttcct ctgcctctgc tatagtttga 58380 ttagtcaaca agcatgtgtc atgcatttat tcacatcaga atttcataca ctaataagac 58440 atagtatcag aagtcagttt attagttata tcagttaggg tccatcaagg aaaggacaaa 58500 ccattatcag ttactcaacc tagaattaaa tacagctctt aatagttaat tatccttgta 58560 ttggaagagc taaaatatca aataaaggac agtgcagaaa tctagatgtt agtaacatca 58620 gaaaacctct tccgccatta ggcctagaag ggcagaagga gaaaatgttt ataccaccag 58680 agtccagaac cagagcccat aaccagaggt ccactggatt cagtgagcta gtgggtgctc 58740 cttggagaga gccagaactg tctaatgggg gcatcaaagt atcagccata aaaaaccata 58800 aaaaagactg tctgctgtag gagatccgtt cagagagaga gagagaccag aaataatctt 58860 gcttatgctt tccctcagcc agtgtttacc attgcagaat gtacatgcga ctgaaagggt 58920 gaggaaacct gggaaatgtc agttcctcaa atacagagaa cactgaggga aggatgagaa 58980 ataaatgtga aagcagacat gaatggtaat tgacagaagg aaactaggat gtgtccagta 59040 aatgaataat tacagtgtgc agtgattatt gcaatgatta atgtattgat aagataatat 59100 gaaaacacag aattcaaaca gcagtgaact gagattagaa ttgtggagag cactggcatt 59160 taagaatgtc acacttagaa tgtgtctcta ggcattgttc tgtgcatata tcatctcaat 59220 attcattatc tgaaaattat gaattaggta caaagctcaa ataatttatt ttttcaggtt 59280 agcaagaact tttttttttt ttttctgaga tagagcattg ctatggttgc ccaggctgga 59340 gtgcaatggc atgatccagg ctcactgcaa catctgcctc ccaggttcaa gcgattctcc 59400 tgcctcagcc tcccaagtag ctggcactac aggcatgtgc caccaccatg cctggctaat 59460 tttctatttt tagtagatag ggggtttcac catgttggtc aggctgatct cgaactccta 59520 acatcaggtg atccaccctc ctcggcctct gaaagtgctg ggatcacagg cgtgagccac 59580 cacacccagc caagaatgtg aattttgtag aaggatataa cccatatttc tctgacccta 59640 gagtccttag tatacctccc ataccatgtg gctcatcctc cttacataca tttcccatct 59700 ttcaccctac cttttccttt ttgtttcagc ttttcactgt gtcaaaatct agaaccttat 59760 ctcctacctg ctctgaaacc aacagcaagt tgacttccat tctaacccac attggcatta 59820 cactaattaa aatcgatact gagttctaaa atcatcgggg attttgggga ctatgtctta 59880 cttcatactt ccttgagatt tcacattaaa tgttggtgtt cattaaaggt ccttcattta 59940 actttgtatt catcacactc ttggattcac agttatatct aaactcttaa atacagcctg 60000 tataatccca attcccaact ctgatttcta acctctgacc tccaacctca gtgccaaacc 60060 catatatcaa acaatgtact gggcttattt atatagatgt cctataggca cctcagactc 60120 agcatgggta tttcacttgt tatactaaaa ctgtttctct tccagtgttt tccattttag 60180 tcattagata gctacttgcc cattcaccaa ggtcacagat taaaatcatt tccctacctc 60240 taatcaacag ttcgattctg cttcaatttg tccctatcta ttaatcacca ctcttactgc 60300 ccagtcaggt cctcattgtt tcctgaacaa gagtagatgc tattctttcc acttttagac 60360 cttatcctgg ctggatgcgg tggctcaggc ttgtaaaccc agcactttgg gaggccaagg 60420 caggcagatc acttgaggtc aggagttcaa gaccagcctg accaacatgg tgaaacccca 60480 tctctactaa aaatacaaaa tcagccgggc gtgtggtgca tgcctgcagt cccagctatt 60540 caggtggctg aggcaggaga attgcttgaa cccaggaggc agaggttgcg gtgagcctag 60600 attgcaccat tgcactctag cttgggcaat agggatgaaa ctccatctca gaagagaaaa 60660 gaaaaaaaga ccttattctg ttatacaaat cctctcaatg caatccatat agaataaaca 60720 tgtaaccaga tctcccaatg tgtaaaatca tttcaggtag aacagaatta aagtgaaaag 60780 ccaagtcttt ggaattaaca gacaaagatc aaataacagt cctcatggcc ttaagaattt 60840 acctaacatt ttttttagaa tcaattttct tatatatgaa ttggaaacat aattcctccc 60900 tcacaaacac attctaagat tttaaggaga tattgatgaa gtacatcatc tgtcattttt 60960 aacaggtagt ggtagtgatt cacacagcac attatgatct gttcttgtat gttctgttcc 61020 attctgtatt cttgacctgg ttgtattctt tctgagctcc agatccacat atctaagtac 61080 atctttttgc attttacaag agtgcataca atacaatgta tccaagactg tatttctgat 61140 tttatcgtac cactaaactc acaaatgtgg ccctattctt gtgttcacga ctgacatcac 61200 cgtcatggtc caagtctgat aatagaaatg gcattgtcac tttcttccct actgcaacag 61260 aagcccagct atttgtctcc cattttctct acttctaaaa tacatttctt cactaagtga 61320 gaataatctt ttaaagacac aaatcaaacc atgccaccac ctttcttgaa ttattcaata 61380 tctttcgttg gcttccaggt tacagaaaaa taacttgtaa caaagtttaa aggtcattca 61440 tggctcctct ctaccctatt ttataacatt tccccttgtg atcagaatct caggcacatc 61500 atccatcttt ctatatacaa ataaagtcat atagtttgaa ctcacctctg gttactttta 61560 atcaaccaaa tgctgtaaaa tgcatttgta tcgctacgtg ttaagcagta gttgattctt 61620 ttcatttctg tgtaatattc tattctttga ctataccgta atttatcaat tctactgttg 61680 gtaagcattt aagtggctac cggtttgagg tttttatgat tattgctgtc ataagcattt 61740 ctatacatgt ctttggatac acacatgcat gtgtttctga atatctaaaa atgtaattgc 61800 taggtaatag acttatcaag catccagcat ttgtggatac tattaaaggt tttccaaagg 61860 ggttatacta ttgtacagtg tcaccaacag agtttgagtt tctattgatc catatcacca 61920 ccaaaatttg aactgtcagt cttatctctt ctcttgtctc ttttttcctc ttttttttcc 61980 ttcccttccc ctctcttcgt ttcttttctc tcctcttctc ttctttcctc tcttcccttc 62040 cctttctctt tctcttccct atcccttctc ctctcctctc ccctcctttt ttctcctctc 62100 ctctccatta tttatttttc cttcttctcc tccatccctt ccatcctctc tcttcccctc 62160 ttccttcctt cctttctcca tttcttcctc ctctttcctt caatccttcc ttttggatat 62220 gctcatgggt gtgtatttgt ctgccattgt ggcattattt gaattcagaa aagagtgaaa 62280 aactactggg atcttcattc ctgggtctaa ttccacattt ttttttaaga acacatctgt 62340 aaaaatgttc tgtactagca tattcccagg aacttcgtta aatttaatct ggctgaatat 62400 ggtaaatcta cttttcactt tgcattcttt ctttagtcat accataattt taaacattca 62460 aaatatttgt atataatatt tgattttatc tgtcattaaa atgttaacct taaaattcat 62520 gtttccagaa cctatttcaa taactggtaa ataaacacta ttcatttttt aaatattctt 62580 ttaatggata tttatttcaa tataataaaa aattagagtt ttattatagg aagaatttac 62640 caaaagaagg aggaagcaag caagtttaaa ctgcagcaat agatttgtcc attccaacct 62700 ctcaaaattc ccttggagac aaaaatctct agaggcaaag aagaacttta tattgagtca 62760 acttgttaaa acatctgctt ttagataagt tttcttagta taaagtgaca gaaacaaata 62820 agttaaactc taagatacat tccactatat tagcctaaaa cacttctgca aaaatgaaac 62880 taggaggata tttttagaaa caactgctga aagagatgcg gtggggagat atgtagagga 62940 gaacagggtt tctgagtcaa gacacacatg acagaacagc caatctcagg gcaagttaag 63000 ggaatagtgg aatgaaggtt catttttcat tctcacaaac taatgaaacc ctgcttatct 63060 taaaccaacc tgctcactgg agcagggagg acaggaccag cataaaaggc agggcagagt 63120 cgactgttgc ttacactttc ttctgacata acagtgttca ctagcaacct caaacagaca 63180 ccatggtgca tctgactcct gaggagaaga ctgctgtcaa tgccctgtgg ggcaaagtga 63240 acgtggatgc agttggtggt gaggccctgg gcaggttggt atcaaggtta taagagaggc 63300 tcaaggaggc aaatggaaac tgggcatgtg tagacagaga agactcttgg gtttctgata 63360 ggcactgact ctctgtccct tgggctgttt tcctaccctc agattactgg tggtctaccc 63420 ttggacccag aggttctttg agtcctttgg ggatctgtcc tctcctgatg ctgttatggg 63480 caaccctaag gtgaaggctc atggcaagaa ggtgctaggt gcctttagtg atggcctggc 63540 tcacctggac aacctcaagg gcactttttc tcagctgagt gagctgcact gtgacaagct 63600 gcacgtggat cctgagaact tcagggtgag tccaggagat gcttcacttt tctcttttta 63660 ctttctaatc ttacattttg gttcttttac ctacctgctc ttctcccaca tttttgtcat 63720 tttactatat tttatcattt aatgcttcta aaattttgtt aattttttat ttaaatattc 63780 tgcatttttt ccttcctcac aatcttgcta ttttaaatta tttaatatcc tgtctttctc 63840 tcccaacccc ctcccttcat ttttccttct ctaacaacaa ctcaaattat gcataccagc 63900 tctcacctgc taattctgca cttagaataa tccttttgtc tctccacatg ggtatgggag 63960 aggctccaac tcaaagatga gaggcataga atactgtttt agaggctata aatcatttta 64020 caataaggaa taattggaat tttataaatt ctgtagtaaa tggaatggaa aggaaagtga 64080 atatttgatt atgaaagact aggcagttac actggaggtg gggcagaagt cgttgctagg 64140 agacagccca tcatcacact gattaatcaa ttaatttgta tctattaatc tgtttatagt 64200 aattaatttg tatatgctat atacacatac aaaattaaaa ctaatttgga attaatttgt 64260 atatagtatt atacagcata tatagcatat atgtacatat atagactaca tgctagttaa 64320 gtacatagag gatgtgtgtg tatagatata tgttatatgt atgcattcat atatgtactt 64380 atttatgctg atgggaataa cctggggatc agttttgtct aagatttggg cagaaaaaaa 64440 tgggtgttgg ctcagtttct cagaagccag tctttatttc tctgttaacc atatgcatgt 64500 atctgcctac ctcttctccg cagctcttgg gcaatgtgct ggtgtgtgtg ctggcccgca 64560 actttggcaa ggaattcacc ccacaaatgc aggctgccta tcagaaggtg gtggctggtg 64620 tggctaatgc cctggctcac aagtaccatt gagatcctgg actgtttcct gataaccata 64680 agaagaccct atttccctag attctatttt ctgaacttgg gaacacaatg cctacttcaa 64740 gggtatggct tctgcctaat aaagaatgtt cagctcaact tcctgattaa tttcacttat 64800 ttcatttttt tgtccaggtg tgtaagaagg ttcctgaggc tctacagata gggagcactt 64860 gtttatttta caaagagtac atgggaaaag agaaaagcaa gggaaccgta caaggcatta 64920 atgggtgaca cttctacctc caaagagcag aaattatcaa gaactcttga tacaaagata 64980 atactggcac tgcagaggtt ctagggaaga cctcaaccct aagacatagc ctcaagggta 65040 atgctacgat taaactccaa caattactga gaaaataatg tgctcaatta aaggcataat 65100 gattactcaa gacaatgtta tgttgtcttt cttcctcctt cctttgcctg cacattgtag 65160 cccataatac tataccccat caagtgttcc tgctccaaga aatagcttcc tcctcttact 65220 tgccccagaa catctctgta aagaatttcc tcttatcttc ccatatttca gtcaagattc 65280 attgctcacg tattacttgt gacctctctt gaccccagcc acaataaact tctctatact 65340 acccaaaaaa tctttccaaa ccctccccca caccattttt tatattttta tatttttctt 65400 atttatttca tgcacacaca cacactccgt gctttataag caattctgcc tattctctac 65460 cttcttacat gcctactgtg cctcatatta aattcatcaa tgggcagaaa gaaaatattt 65520 attcaagaaa acagtgaatg aatgaacgaa tgagtaaatg agtaaatgaa ggaatgatta 65580 ttccttgctt tagaacttct ggaattagag gacaatatta ataataccat cgcacagtgt 65640 ttctttgttg ttaatgctac aacatacaaa gaggaagcat gcagtaaaca accgaacagt 65700 tatttccttt ctgatcatag gagtaatatt tttttccttg agcaccattt ttgccatagg 65760 taaaattaga aggattttta gaactttctc agttgtatac atttttaaaa atctgtatta 65820 tatgcatgtt gattaatttt aaacttactt gaatacctaa acagaatctg ttgtttcctt 65880 gtgtttgaaa gtgctttcac agtaactctg tctgtactgc cagaatatac tgacaatgtg 65940 ttatagttaa ctgttttgat cacaacattt tgaattgact ggcagcagaa gctcttttat 66000 atccatgtgt tttccttaag tcattataca tagtaggcac tgagaactct ttatatctga 66060 ataagatatt taggaaccac tggtttacat atcagaagca gagctactca gggcattttg 66120 gggaagatca ctttcacatt cctgagcata gggaagttct cataagagta agatattaaa 66180 aggagatact tgtgtggtat tcgaaagaca gtaagagaga ttgtagacct tatgatcttg 66240 atagggaaaa caaactacat tcctttctcc aaaagtcaaa aaaaaagagc aaatatagct 66300 tactatacct tctattccta caccattaga agtagtcagt gagtctaggc aagatgttgg 66360 ccctaaaaat ccaaatacca gagaattcat gagaacatca cctggatggg acatgtgccg 66420 agcacacaca attactatat gctaggcatt gctatcttca tattgaagat gaggaggtca 66480 agagatgaaa aaagacttgg caccttgttg ttatattaaa attatttgtt agagtagagc 66540 ttttgtaaga gtctaggagt gtgggagcta aatgatgata cacatggaca caaaaaatag 66600 atcaacagac acccaggcct acttgagggt tgagggtggg aagagggaga cgatgaaaaa 66660 gaacctattg ggtattaagt tcatcactga gtgatgaaat aatctgtaca tcaagaccca 66720 gtgatatgca atttacctat ataacttgta catgtacccc caaatttaaa atgaaagtta 66780 aaacaaagta taggaatgga attaattcct caagatttgg ctttaatttt atttgataat 66840 ttatcaaatg gttgtttttc ttttctcact atggcgttgc tttataaact atgttcagta 66900 tgtctgaatg aaagggtgtg tgtgtgtgtg aaagagaggg agagaggaag ggaagagagg 66960 acgtaataat gtgaatttga gttcatgaaa atttttcaat aaaataattt aatgtcagga 67020 gaattaagcc taatagtctc ctaaatcatc catctcttga gcttcagagc agtcctctga 67080 attaatgcct acatgtttgt aaagggtgtt cagactgaag ccaagattct acctctaaag 67140 agatgcaatc tcaaatttat ctgaagactg tacctctgct ctccataaat tgacaccatg 67200 gcccacttaa tgaggttaaa aaaaagctaa ttctgaatga aaatctgagc ccagtggagg 67260 aaatattaat gaacaaggtg cagactgaaa tataaatttt tctgtaataa ttatgcatat 67320 actttagcaa agttctgtct atgttgactt tattgctttt tggtaagaaa tacaactttt 67380 taaagtgaac taaactatcc tatttccaaa ctattttgtg tgtgtgcggt ttgtttctat 67440 gggttctggt tttcttggag catttttatt tcattttaat taattaattc tgagagctgc 67500 tgagttgtgt ttactgagag attgtgtatc tgcgagagaa gtctgtagca agtagctaga 67560 ctgtgcttga cctaggaaca tatacagtag attgctaaaa tgtctcactt ggggaatttt 67620 agactaaaca gtagagcatg tataaaaata ctctagtcaa gtgctgcttt tgaaacaaat 67680 gataaaacca cactcccata gatgagtgtc atgattttca tggaggaagt taatattcat 67740 cctctaagta tacccagact agggccattc tgatataaaa cattaggact taagaaagat 67800 taatagactg gagtaaagga aatggacctc tgtctctctc gctgtctctt ttttgaggac 67860 ttgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgttgtg gtcagtgggg ctggaataaa 67920 agtagaatag acctgcacct gctgtggcat ccattcacag agtagaagca agctcacaat 67980 agtgaagatg tcagtaagct tgaatagttt ttcaggaact ttgaatgctg atttagattt 68040 gaaactgagg ctctgaccat aaccaaattt gcactattta ttgcttcttg aaacttattt 68100 gcctggtatg cctgggcttt tgatggtctt agtatagctt gcagccttgt ccctgcaggg 68160 tattatgggt aatagaaaga aaagtctgcg ttacactcta gtcacactaa gtaactacca 68220 ttggaaaagc aacccctgcc ttgaagccag gatgatggta tctgcagcag ttgccaacac 68280 aagagaagga tccatagttc atcatttaaa aaagaaaaca aaatagaaaa aggaaaacta 68340 tttctgagca taagaagttg tagggtaagt ctttaagaag gtgacaattt ctgccaatca 68400 ggatttcaaa gctcttgctt tgacaatttt ggtctttcag aatactataa atataaccta 68460 tattataatt tcataaagtc tgtgcatttt ctttgaccca ggatatttgc aaaagacata 68520 ttcaaacttc cgcagaacac tttatttcac atatacatgc ctcttatatc agggatgtga 68580 aacagggtct tgaaaactgt ctaaatctaa aacaatgcta atgcaggttt aaatttaata 68640 aaataaaatc caaaatctaa cagccaagtc aaatctgcat gttttaacat ttaaaatatt 68700 ttaaagacgt cttttcccag gattcaacat gtgaaatctt ttctcaggga tacacgtgtg 68760 cctagatcct cattgcttta gttttttaca gaggaatgaa tataaaaaga aaatacttaa 68820 attttatccc tcttacctct ataatcatac ataggcataa ttttttaacc taggctccag 68880 atagccatag aagaaccaaa cactttctgc gtgtgtgaga ataatcagag tgagattttt 68940 tcacaagtac ctgatgaggg ttgagacagg tagaaaaagt gagagatctc tatttattta 69000 gcaataatag agaaagcatt taagagaata aagcaatgga aataagaaat ttgtaaattt 69060 ccttctgata actagaaata gaggatccag tttcttttgg ttaacctaaa ttttatttca 69120 ttttattgtt ttattttatt ttattttatt ttattttgtg taatcgtagt ttcagagtgt 69180 tagagctgaa aggaagaagt aggagaaaca tgcaaagtaa aagtataaca ctttccttac 69240 taaaccgaca tgggtttcca ggtaggggca ggattcagga tgactgacag ggcccttagg 69300 gaacactgag accctacgct gacctcataa atgcttgcta cctttgctgt tttaattaca 69360 tcttttaata gcaggaagca gaactctgca cttcaaaagt ttttcctcac ctgaggagtt 69420 aatttagtac aaggggaaaa agtacagggg gatgggagaa aggcgatcac gttgggaagc 69480 tatagagaaa gaagagtaaa ttttagtaaa ggaggtttaa acaaacaaaa tataaagaga 69540 aataggaact tgaatcaagg aaatgatttt aaaacgcagt attcttagtg gactagagga 69600 aaaaaataat ctgagccaag tagaagacct tttcccctcc tacccctact ttctaagtca 69660 cagaggcttt ttgttccccc agacactctt gcagattagt ccaggcagaa acagttagat 69720 gtccccagtt aacctcctat ttgacaccac tgattacccc attgatagtc acactttggg 69780 ttgtaagtga ctttttattt atttgtattt ttgactgcat taagaggtct ctagtttttt 69840 atctcttgtt tcccaaaacc taataagtaa ctaatgcaca gagcacattg atttgtattt 69900 attctatttt tagacataat ttattagcat gcatgagcaa attaagaaaa acaacaacaa 69960 atgaatgcat atatatgtat atgtatgtgt gtatatatac acacatatat atatatattt 70020 tttcttttct taccagaagg ttttaatcca aataaggaga agatatgctt agaaccgagg 70080 tagagttttc atccattctg tcctgtaagt attttgcata ttctggagac gcaggaagag 70140 atccatctac atatcccaaa gctgaattat ggtagacaaa actcttccac ttttagtgca 70200 tcaacttctt atttgtgtaa taagaaaatt gggaaaacga tcttcaatat gcttaccaag 70260 ctgtgattcc aaatattacg taaatacact tgcaaaggag gatgttttta gtagcaattt 70320 gtactgatgg tatggggcca agagatatat cttagaggga gggctgaggg tttgaagtcc 70380 aactcctaag ccagtgccag aagagccaag gacaggtacg gctgtcatca cttagacctc 70440 accctgtgga gccacaccct agggttggcc aatctactcc caggagcagg gagggcagga 70500 gccagggctg ggcataaaag tcagggcaga gccatctatt gcttacattt gcttctgaca 70560 caactgtgtt cactagcaac ctcaaacaga caccatggtg catctgactc ctgaggagaa 70620 gtctgccgtt actgccctgt ggggcaaggt gaacgtggat gaagttggtg gtgaggccct 70680 gggcaggttg gtatcaaggt tacaagacag gtttaaggag accaatagaa actgggcatg 70740 tggagacaga gaagactctt gggtttctga taggcactga ctctctctgc ctattggtct 70800 attttcccac ccttaggctg ctggtggtct acccttggac ccagaggttc tttgagtcct 70860 ttggggatct gtccactcct gatgctgtta tgggcaaccc taaggtgaag gctcatggca 70920 agaaagtgct cggtgccttt agtgatggcc tggctcacct ggacaacctc aagggcacct 70980 ttgccacact gagtgagctg cactgtgaca agctgcacgt ggatcctgag aacttcaggg 71040 tgagtctatg ggacgcttga tgttttcttt ccccttcttt tctatggtta agttcatgtc 71100 ataggaaggg gataagtaac agggtacagt ttagaatggg aaacagacga atgattgcat 71160 cagtgtggaa gtctcaggat cgttttagtt tcttttattt gctgttcata acaattgttt 71220 tcttttgttt aattcttgct ttcttttttt ttcttctccg caatttttac tattatactt 71280 aatgccttaa cattgtgtat aacaaaagga aatatctctg agatacatta agtaacttaa 71340 aaaaaaactt tacacagtct gcctagtaca ttactatttg gaatatatgt gtgcttattt 71400 gcatattcat aatctcccta ctttattttc ttttattttt aattgataca taatcattat 71460 acatatttat gggttaaagt gtaatgtttt aatatgtgta cacatattga ccaaatcagg 71520 gtaattttgc atttgtaatt ttaaaaaatg ctttcttctt ttaatatact tttttgttta 71580 tcttatttct aatactttcc ctaatctctt tctttcaggg caataatgat acaatgtatc 71640 atgcctcttt gcaccattct aaagaataac agtgataatt tctgggttaa ggcaatagca 71700 atatctctgc atataaatat ttctgcatat aaattgtaac tgatgtaaga ggtttcatat 71760 tgctaatagc agctacaatc cagctaccat tctgctttta ttttatggtt gggataaggc 71820 tggattattc tgagtccaag ctaggccctt ttgctaatca tgttcatacc tcttatcttc 71880 ctcccacagc tcctgggcaa cgtgctggtc tgtgtgctgg cccatcactt tggcaaagaa 71940 ttcaccccac cagtgcaggc tgcctatcag aaagtggtgg ctggtgtggc taatgccctg 72000 gcccacaagt atcactaagc tcgctttctt gctgtccaat ttctattaaa ggttcctttg 72060 ttccctaagt ccaactacta aactggggga tattatgaag ggccttgagc atctggattc 72120 tgcctaataa aaaacattta ttttcattgc aatgatgtat ttaaattatt tctgaatatt 72180 ttactaaaaa gggaatgtgg gaggtcagtg catttaaaac ataaagaaat gaagagctag 72240 ttcaaacctt gggaaaatac actatatctt aaactccatg aaagaaggtg aggctgcaaa 72300 cagctaatgc acattggcaa cagcccctga tgcatatgcc ttattcatcc ctcagaaaag 72360 gattcaagta gaggcttgat ttggaggtta aagttttgct atgctgtatt ttacattact 72420 tattgtttta gctgtcctca tgaatgtctt ttcactaccc atttgcttat cctgcatctc 72480 tcagccttga ctccactcag ttctcttgct tagagatacc acctttcccc tgaagtgttc 72540 cttccatgtt ttacggcgag atggtttctc ctcgcctggc cactcagcct tagttgtctc 72600 tgttgtctta tagaggtcta cttgaagaag gaaaaacagg ggtcatggtt tgactgtcct 72660 gtgagccctt cttccctgcc tcccccactc acagtgaccc ggaatctgca gtgctagtct 72720 cccggaacta tcactctttc acagtctgct ttggaaggac tgggcttagt atgaaaagtt 72780 aggactgaga agaatttgaa aggcggcttt ttgtagcttg atattcacta ctgtcttatt 72840 accctgtcat aggcccaccc caaatggaag tcccattctt cctcaggatg tttaagatta 72900 gcattcagga agagatcaga ggtctgctgg ctcccttatc atgtccctta tggtgcttct 72960 ggctctgcag ttattagcat agtgttacca tcaaccacct taacttcatt tttcttattc 73020 aatacctagg taggtagatg ctagattctg gaaataaaat atgagtctca agtggtcctt 73080 gtcctctctc ccagtcaaat tctgaatcta gttggcaaga ttctgaaatc aaggcatata 73140 atcagtaata agtgatgata gaagggtata tagaagaatt ttattatatg agagggtgaa 73200 accctcaaaa tgaaatgaaa tcagaccctt gtcttacacc ataaacaaaa ataaatttga 73260 atgggttaaa gaattaaact aagacctaaa accataaaaa tttttaaaga aatcaaaaga 73320 agaaaattct aatattcacg ttgcagccgt tttttgaatt tgatatgaga agcaaaggca 73380 acaaaaggaa aaataaagaa gtgaggctac atcaaactaa aaaatttcca cacaaaaaac 73440 aaaacaatga acaaatgaaa ggtgaaccat gaaatggcat atttgcaaac caaatatttc 73500 ttaaatattt tggttaatat ccaaaatata taagaaacac agatgattca ataacaaaca 73560 aaaaattaaa aataggaaaa taaaaaaatt aaaaagaaga aaatcctgcc atttatggca 73620 gaattgatga acctggagga tgtaaaacta agaaaaataa gcctgacaca aaaagacaaa 73680 tactacacaa ccttgctcat atgtgaaaca taaaaaagtc actctcatgg aaacagacag 73740 tagaggtatg gtttccaggg gttgggggtg ggagaatcag gaaactatta ctcaaagggt 73800 ataaaatttc agttatgtgg gatgaataaa ttctagatat ctaatgtaca gcatcgtgac 73860 tgtagttaat tgtactgtaa gtatatttaa aatttgcaaa gagagtagat tttttttttt 73920 ttttagatgg agttttgctc ttgttgtcca ggctggagtg caatggcaag atcttggctc 73980 actgcaacct ccgcctcctg ggttcaagca aatctcctgc ctcagcctcc cgagtagctg 74040 ggattacagg catgcgacac catgcccagc taattttgta tttttagtag agacggggtt 74100 tctccatgtt ggtcaggctg atccgcctgc ctcggccacc caaagggctg ggattacagg 74160 cgtgagccac cgggcctggc cgagagtaga tcttaaaagc atttaccaca agaaaaaggt 74220 aactatgtga gataatgggt atgttaatta gcttgattgt ggtaatcatt tcacaaggta 74280 tacatatatt aaaacatcat gttgtacacc ttaaatatat acaattttta tttgtgaatg 74340 atacctcaat aaagttgaag aataataaaa aagaatagac atcacatgaa ttaaaaaact 74400 aaaaaataaa aaaatgcatc ttgatgatta gaattgcatt cttgattttt cagatacaaa 74460 tatccatttg actgtttact cttttccaaa acaatacaat aaattttagc actttatctt 74520 cattttcccc ttcccaatct ataattatat atatatatat tttagatatt ttgtatagtt 74580 ttactcccta gattttctag tgttattatt aaatagtgaa gaaatgttta cacttatgta 74640 caaaatgttt tgcatgcttt tcttcatttc taacattctc tctaagttta ttctattttt 74700 ttctgattat ccttaatatt atctctttct gctggaaata cattgttact tttggtttat 74760 ctaaaaatgg cttcattttc ttcattctaa aatcatgtta aattaatacc actcatgtgt 74820 aagtaagata gtggaataaa tagaaatcca aaaactaaat ctcactaaaa tataataatg 74880 tgatatataa aaatatagct tttaaattta gcttggaaat aaaaaacaaa cagtaattga 74940 acaactatac tttttgaaaa gagtaaagtg aaatgcttaa ctgcatatac cacaatcgat 75000 tacacaatta ggtgtgaagg taaaattcag tcacgaaaaa actagaataa aaatatggga 75060 agacatgtat ataatcttag agataacact gttatttaat tatcaaccca aagtagaaac 75120 tatcaaggga gaaataaatt cagtcaacaa taaaagcatt taagaagtta ttctaggctg 75180 ggagcggtgg ctcacacctg caattgcagc actttgggag gcctagacag gcggatcacg 75240 acgtcaggag ttcaagatca gcctggccaa catagtgaaa cctcatcgct actaaaaata 75300 taaaaactta gcctggcgtg gtggcaggca tgtgtaatcc cagcaatttg ggaggctgag 75360 gcaggagaat cgcttgatcc tgggaggcag aggttgcagt gagccaagat tgtgccactg 75420 cattccagcc caggtgacag catgagactc cgtcacaaaa aaaaaagaaa aaaaaaaggg 75480 gggggggagc ggtggagcca agatgaccga ataggaacag ctccagtcta tagctcccat 75540 cgtgagtgac gcagaagacg ggtgatttct gcatttccaa ctgaggtacc aggttcatct 75600 cacagggaag tgccaggcag tgggtgcagg acagtaggtg cagtgcactg tgcatgagcc 75660 aaagcagggc gaggcatcac ctcacccggg aagcacaagg ggtcagggaa ttccctttcc 75720 tagtcaaaga aaagggtgac agatggcacc tggaaaatcg ggtcactccc gccctaatac 75780 tgcgctcttc caacaagctt aacaaatggc acaccaggag attatatccc atgcctggct 75840 cagagggtcc tacgcccatg gagcctcgct cattgctagc acagcagtct gaggtcaaac 75900 tgcaaggtgg cagtgaggct gggggagggg tgcccaccat tgtccaggct tgagcaggta 75960 aacaaagccg cctggaagct cgaactgggt ggagcccacc acagctcaag gaggcctgcc 76020 tgcctctgta ggctccacct ctaggggcag ggcacagaca aacaaaagac aacaagaacc 76080 tctgcagact taaatgtccc tgtctgacag ctttgaagag agtagtggtt ctcccagcac 76140 atagcttcag atctgagaac aggcagactg cctcctcaag tgggtccctg acccccgagt 76200 agcctaactg ggaggcatcc cccagtaggg gcagactgac acctcacatg gctggtactc 76260 ctctaagaca aaacttccag aggaatgatc aggcagcagc atttgcggtt caccaatatc 76320 cactgttctg cagccaccgc tgttgatacc caggaaaaca gcttctggag tggacctcca 76380 gtaaactcca acagacctgc agctgagggt cctgactgtt agaaggaaaa ctaacaaaca 76440 gaaaggacat ccacaccaaa aacccatctg tacatcgcca tcatcaaaga ccaaaggtag 76500 ataaaaccat aaagatgggg aaaaagcaga gcagaaaaac tggacactct aaaaatgaga 76560 gtgcctctcc tcctccaaag taacgcagct cctcaccagc aatggaacaa agctgggcag 76620 agaatgactt tgacgagttg agagaggaag gcttcagaag atcaaactac tccaagctaa 76680 aggaggaagt tcgaacaaac ggcaaagaag taaaaaactt tgaaaaaaaa ttagatgaat 76740 ggataactag aataaccaat gcacagaagt ccttaaagga cctgatggag ctgaaaacca 76800 aggcaggaga actacgtgac aaatacacaa gcctcagtaa ccgatgagat caactggaag 76860 aaagggtatc aatgacgaaa gatgaaatga atgaaatgaa gcatgaagag aagtttagag 76920 aaaaaagaat aaaaagaaac gaacaaagcc tccaagaaat atgggactat gtgaaaagac 76980 caaatctaca tctaattggt gtagctgaaa gtgatgggga gaatggaacc aagttggaaa 77040 acactctgca ggatattatc caggagaact tccccaatct agcaaggcaa gcccaaattc 77100 acattcagga aatacagaga acgccacaaa gatactccta gagaaaagca actccaagac 77160 acataactgt cagattcacc aaagttgaaa tgaaggaaaa aatgttaagg gcagccagag 77220 agaaaggtcg ggttacccac aaagggaagc ccatcagact aacagctgat ctatcggcag 77280 aaactctaca agccagaaga aagtgggggc caatattcaa cattgttaaa gaaaagaatt 77340 ttcaacccag aatttcatat ccagccaaac taagcttcat aagtgaagga gaaataaaat 77400 cctttacaga caagcaaatg ctgagagatt ttgtcaccac caggcctgcc ctacaagagc 77460 tcctgaagga agcactaaac atggaaagga acaactagta tcagccactg caaaaacatg 77520 ccaaattgta aagaccatca aggctaggaa gaaactgcat caacgagcaa aataaccagc 77580 taacatcata atgacaggat caaattcata cataacaata ctcaccttaa atgtaaatag 77640 gctaaatgct ccaattaaaa gacacagact ggcaaattgg ataaggagtc aagacccatc 77700 tgtgttctgt attcaggaaa cccatctcac gtgcagagac acacataggc tcgaaataaa 77760 aggatggagg aatatctacc aagcaaatgg aaaacaaaaa aaggcagggg ttgcaatcct 77820 agtctctgat aaaacagatt ttaaaccaac aaagatcaaa agagacaaag aaggccatta 77880 cataatggca aagggatcta ttcaagaaga agaactaact atactaaata tatatgcacc 77940 caatacagga gcacccagat tcataaaaca agtcctgagt gacctacaaa gagacttaga 78000 tgcccacaca ataataatgg gagactttaa caccccactg tcaacattag acagatcaac 78060 gagacagaaa gttaacaagg atatccagga attggactca gctctgcacc aagcagacct 78120 aatagacatc tacagaactc tccaccccaa atcaacagaa tatacattct tttcagcacc 78180 acaccacacc tattccaaaa ctgaccacat agttggaagt aaagctctcc tcagcaaatg 78240 taaaagaaca gaaactataa caaactgtct ctcagaccac agtgcaatca aactagaact 78300 caggattaag aaactcactc aaaaccactc agctacatgg aaactgaaca gcctgctcct 78360 gaatgactac tgggtacata acaaaatgaa ggcagaaata aagatgttct ttgaaaccaa 78420 cgagaacaaa gacacaacac accagaatct ctgagacaca ttcaaagcag tgtgtagagg 78480 gaaatttata gcactaaatg cccacaaggg aaagcaggaa agatctaaaa ttgacaccct 78540 aacatcacaa ttaaaaaact agagaagcag gagcaaacac attcaaaagc taacagaaga 78600 caagaaataa ctaagatcag agcagaagtg aaggacatag agacacaaaa aaacccttca 78660 aaaaaatcaa tgaatccaga agctgttttt ttgaaaagat caacaaaatt gatagactgc 78720 tagcaagact aataaagaag aaaagagaga agaatcaaat agacgcaata aaaaatgaca 78780 cggggtatca ccactgatcc cacagaaata caaactaccg tcagagaata ctataaacac 78840 ctctacgcaa ataaactaga aaatctagaa gaaatggata aattcctcga cacatacact 78900 ctgccaagac taaaccagga agaagttgta tctctgaata gaccaataac aggctctgaa 78960 attgaggcaa taattaatag cttatcaacc aaaaaaagtc cgggaccagt aggattcata 79020 gccgaattct accagaggta caaggaggag ctggtaccat tccttctgaa actattccaa 79080 tcaatagaaa aagagggaat cctccctaac tcattttatg aggccagcat catcctgata 79140 ccaaagcctg acagagacac aacaaaaaaa gagaatgtta caccaatatc cttgatgaac 79200 attgatgcaa aaatcctcaa taaaatactg gcaaactgat ccaccatgat caagtgggct 79260 tcatccctgc catgcaaggc tggttcaaca tacgaaaatc aataaacata atccagcata 79320 taaacagaac caaagacaca aaccatatga ttatctcaat agatgcagaa aaggcctttg 79380 acaaaattca acaacgcttc atgctaaaaa ctctcaataa attaggtatt gatgggacat 79440 atctcaaaat aataagagct atctatgaca aacccacagc caatatcata ctgagtggac 79500 aaaaactgga agcattccct ttgaaaactg gcacaaggca gggatgccct ctctcaccac 79560 tcctattcaa catagtgttg taagttctgg ccagggcaat caggcaggag aaggaaataa 79620 agggcattca attaggaaaa gaggaagtga aattgtccct gtttgcagat gacatgattg 79680 tatatctaga aaaccccatt gtctcagccc aaaatctcct taagctgata agcaacttca 79740 gcaaagtctc aggatataaa atcagtgtgc aaaaatcaca agtattccta tgcaccaata 79800 acagacaaac agagagccaa atcatgagtg aactcccatt cacaattgct tcaaagagaa 79860 taaaatacct aggaatccaa cttacaaggg atgtgaagga cctcttcaag gagaactaca 79920 aaccactgct caatgaaata aaagaggata caaacaaatg gaagaacatt ccatgctcat 79980 gggtaggaag aatcaatatc gtgaaaatgg tcatactgcc caaggtaatt tatagattca 80040 atgccatccc catcaagcta ccaatgactt tcttcacaga actggaaaaa actactttaa 80100 agttcatatg gaaccaaaaa agagcccaca tcaccaaggc aatcctaagc caaaagaaca 80160 aagctggagg catcacgcta cctgacttca aactatacta caatgctacg gtaaccaaaa 80220 cagcatggta ctggtaccaa aacagagatc tagaccaatg gaacagaaca gagccctcag 80280 aaataatgcc gcatatctac aactatctga tctttgacaa acctgagaga aacaagcaat 80340 ggggaaagga ttccctattt aataaatggt gctgggaaaa ctggctagcc atatgtagaa 80400 agctgaaact ggatcccttc cttacacctt atacaaaaat taattcaaga tggattaaag 80460 acttacatgt tagacctaaa accataaaaa ccctagaaaa aaacctaggc aataccattc 80520 aggacatagg catgggcaag gacttcatgt ctaaaacacc aaaagcaatg gcaacaaaag 80580 acaaaatgga caaacgggat ctaattaaac taaagagctt ctgcacagct aaagaaacta 80640 ccatcagagt gaacaggcaa cctacaaaat gggagaaaat ttttgcaatc tactcatctg 80700 acaaagggct aatatccaga atctacaatg aactcaaaca aatttacaag aaaaaacaaa 80760 caaccccatc aaaaagtggg caaaggatat gaacagacac ttcgcaaaag aagacattta 80820 tgtaatcaaa aaacacatga aaaaatgctc atcatcacta gccatcagag aaatgcaaat 80880 caaaaccaca atgagatacc atctcacacc agttagaatg gcgatcatta aaaagtcagg 80940 aaacaacagg tgctggagag gatgtggaga aacaggaaca acttttacac tgttggtggg 81000 actgtaaact agttcaacca ttgcggaagt cagtgtggca attcctcagg aatctagaac 81060 tagaaatacc atttgaccca gccatcccat tactgggtac atacccaaag gattataaat 81120 catgctgcta taaagacaca tgcacacgta tgtttattgc agcactattc acaatagcaa 81180 agacttggaa ccaacccaaa tgtccaacaa cgatagactg gattaagaaa atgtggcaca 81240 tatacaccat ggaatactat gcagccataa aaaatgatga gttcatgtcc tttgtaggga 81300 catggatgaa gctggaaact atcattctca gcaaactatc acaaggagaa taaaccaaac 81360 accgcatgtt ctcactcata ggtgggaatt gaacaatgag aacacatgga cacatgaaga 81420 ggaacatcac actctgggga ctgttatggg gtggggggca ggggcaggga tagcactagg 81480 agatatacct aatgctaaat gacgagttaa tgggtgcagc acaccaacat ggcacatgta 81540 tacatatata acaaacctgc atgttgtgca catgtaccct aaaacttgaa gtataataat 81600 aaaaaaaagt tatcctatta aaactgatct cacacatccg tagagccatt atcaagtctt 81660 tctctttgaa atagacagaa atttagtgtt ttctcagtca gttaac 81706 <210> 20 <211> 388 <212> DNA <213> Homo sapiens <400> 20 taagcttcag tttttcctta gttcctgtta catttctgtg tgtctccatt agtgacctcc 60 catagtccaa gcatgagcag ttctggccag gcccctgtcg gggtcagtgc cccacccccg 120 ccttctggtt ctgtgtaacc ttctaagcaa accttctggc tcaagcacag caatgctgag 180 tcatgatgag tcatgctgag gcttagggtg tgtgcccaga tgttctcagc ctagagtgat 240 gactcctatc tgggtcccca gcaggatgct tacagggcag atggcaaaaa aaaggagaag 300 ctgaccacct gactaaaact ccacctcaaa cggcatcata aagaaaatgg atgcctgaga 360 cagaatgtga catattctag aatatatt 388 <210> 21 <211> 387 <212> DNA <213> Homo sapiens <400> 21 taagcttcag tttttcctta gttcctgtta catttctgtg tgtctccatt agtgacctcc 60 catagtccaa gcatgagcag ttctggccag gcccctgtcg gggtcagtgc cccacccccg 120 ccttctggtt ctgtgtaacc ttctaagcaa accttctggc tcaagcacag caatgctgag 180 tcatgatgag tcatgctgag gctagggtgt gtgcccagat gttctcagcc tagagtgatg 240 actcctatct gggtccccag caggatgctt acagggcaga tggcaaaaaa aaggagaagc 300 tgaccacctg actaaaactc cacctcaaac ggcatcataa agaaaatgga tgcctgagac 360 agaatgtgac atattctaga atatatt 387 <210> 22 <211> 286 <212> DNA <213> Homo sapiens <400> 22 ctgagcaact aactcatgca ggactctcaa acactaacct atagcctttt ctatgtatct 60 acttgtgtag aaaccaagcg tggggactga gaaggcaata gcaggagcat tctgactctc 120 actgcctttg gctaggtccc tccctcatca cagctcagca tagtccgagc tcttatctat 180 atccacacac agtttctgac gctgcccagc tatcaccatc ccaagtctaa agaaaaaaat 240 aatgggtttg cccatctctg ttgattagaa aacaaaacaa aataaa 286 <210> 23 <211> 286 <212> DNA <213> Homo sapiens <400> 23 ctgagcaact aatcatgcag gactctcaaa cactaaccta tagccttttc tatgtatcta 60 cttgtgtaga aaccaagcgt ggggactgag aaggcaatag caggagcatt ctgactctca 120 ctgcctttag ctaggcccct ccctcatcac agctcagcat agtcctgagc tcttatctat 180 atccacacac agtttctgac gctgcccagc tatcaccatc ccaagtctaa agaaaaaaat 240 aatgggtttg cccatctctg ttgattagaa aacaaaacaa aataaa 286 <210> 24 <211> 301 <212> DNA <213> Homo sapiens <400> 24 ccaatcgtgg catatcctct aaactttctt ttcccttcat aaatcctctt tctttttttt 60 ccccctcaca gttttcctga acaggttgac tattaattgt gtctgcttga tgtggacacc 120 aggtggcgct ggacatcaga tttggagagg cagttgtcta gggaaccggg ctctgtgcca 180 gcgcaggagg caggctggct ctcctattcc agggatgctc atccaggaag gaaaggttgc 240 atgctggaca cactaacctt gaagaattct tctgtctctc tcgtcattta gaaaggaagg 300 a 301 <210> 25 <211> 305 <212> DNA <213> Homo sapiens <400> 25 ctagccaatc gtggcatatc ctctaaactt tcttttccct tcataaatcc tctttctttt 60 ttttccccct cacagttttc ctgaacaggt tgactattaa ttgtgtctgc ttgatgtgga 120 caccaggtgg cgctggacat cagatttgga gaggcagttg tctagggaac cgggctctgt 180 gccagcgcag gaggcaggct ggctctccta ctccagggat gctcatccag gaaggaaagg 240 ttgcatgctg gacacactaa ccttgaagaa ttcttctgtc tctctcgtca tttagaaagg 300 aagga 305 <210> 26 <211> 896 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 26 ctcgagttaa ttaatctccc acgccctggt ctcagcttgg ggagtggtca gaccccaatg 60 gcgataaact ctggcaactt tatctgtgca ctgcaggctc agccccaaca gctttagctt 120 tcacaagcag gcaggggaag ggaaacacat atctccagat atgaggttaa ttaacctgca 180 ggctaaaccc ctcccccacc ctagccccaa gcttcatctt agctccactc ctgaccctat 240 ccagctaaag gtccccaccc agctcctgcc tatctagtca ttgcatatgg caagacttga 300 aagtcctatc tcaaagcagc agaattatca gctacgactc ctgcaggtta taaccatccc 360 ccagcactcc ctgcccccac agcccagact tgaccaactc ccagctccgc ctgggacttc 420 cagatatggg gccccaccct tgcaggcctt ggggacgctg aagatattga ctatctgcgt 480 gccggaaaag ggtgttataa accggtaaag gctgggggtg ggagtagcgg atttgaagca 540 cttgttggcc tacagaggtg tggcaagcag agcacctcag aactcaggcg tactgcccgc 600 cgcccgagcc ctgcgagggc cgatagcgag ggtgtggccc ttatctgcac ccagcagagc 660 gccggcgggg tacggtcacc ggtcccgggc agttgcctca gctgagtatg tcttctaaag 720 ataatgtcga ttgtgtatgg ctgatgggat tctaggacca agcaagaggt tttttttttt 780 cccccacata cttaacgttt ctatatttct atttgaattc gactggacag ttccatttga 840 attatttctc tctctctctc tctctgacac attttatctt gccacccggg ctcgag 896

Claims (137)

  1. 서열번호 18에 기재된 CTCF 결합 부위 서열을 포함하는 인슐레이터.
  2. 청구항 1에 있어서,
    서열번호 24 또는 서열번호 25를 포함하는 인슐레이터.
  3. 청구항 2에 있어서,
    서열번호 1에 기재된 뉴클레오티드 서열을 갖는 인슐레이터.
  4. 청구항 1의 인슐레이터, 및 β-글로빈 좌위 조절 영역(LCR)의 영역에 작동가능하게 연결된 글로빈 유전자 또는 이의 기능성 부분을 포함하는 발현 카세트.
  5. 청구항 4에 있어서,
    상기 β-글로빈 LCR 영역은 Dnase I 과민감성 부위-2(HS2) 영역을 포함하지 않는 발현 카세트.
  6. 청구항 5에 있어서,
    상기 β-글로빈 LCR 영역은 HS2의 코어 서열을 포함하지 않는 발현 카세트.
  7. 청구항 6에 있어서,
    상기 HS2의 코어 서열은 서열번호 20에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  8. 청구항 6에 있어서,
    상기 HS2의 코어 서열은 서열번호 21에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  9. 청구항 4에 있어서,
    상기 β-글로빈 LCR 영역은 HS2의 인핸서 활성을 유지하는 HS2 영역을 포함하지 않는 발현 카세트.
  10. 청구항 4에 있어서,
    상기 β-글로빈 LCR 영역은 Dnase I 과민감성 부위-1(HS1) 영역, Dnase I 과민감성 부위-3(HS3) 영역 및 Dnase I 과민감성 부위-4(HS4) 영역을 포함하는 발현 카세트.
  11. 청구항 10항에 있어서,
    상기 HS3 영역은 상기 HS1 영역과 HS4 영역 사이에 위치하는 발현 카세트.
  12. 청구항 10에 있어서,
    상기 HS1 영역은 1.1 kb의 길이를 갖는 발현 카세트.
  13. 청구항 12에 있어서,
    상기 HS1 영역은 서열번호 2에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  14. 청구항 10에 있어서,
    상기 HS1 영역은 600 bp의 길이를 갖는 발현 카세트.
  15. 청구항 10에 있어서,
    상기 HS1 영역은 602 bp의 길이를 갖는 발현 카세트.
  16. 청구항 15에 있어서,
    상기 HS1 영역은 서열번호 3에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  17. 청구항 10에 있어서,
    상기 HS1 영역은 490 bp의 길이를 갖는 발현 카세트.
  18. 청구항 10에 있어서,
    상기 HS1 영역은 489 bp의 길이를 갖는 발현 카세트.
  19. 청구항 18에 있어서,
    상기 HS1 영역은 서열번호 4에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  20. 청구항 4에 있어서,
    상기 β-글로빈 LCR 영역은 HS1 영역을 포함하지 않는 발현 카세트.
  21. 청구항 20에 있어서,
    상기 β-글로빈 LCR 영역은 HS1의 코어 서열을 포함하지 않는 발현 카세트.
  22. 청구항 21에 있어서,
    상기 HS1의 코어 서열은 서열번호 22에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  23. 청구항 21에 있어서,
    상기 HS1의 코어 서열은 서열번호 23에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  24. 청구항 20에 있어서,
    상기 β-글로빈 LCR 영역은 HS1의 기능을 유지하는 HS1 영역을 포함하지 않는 발현 카세트.
  25. 청구항 20에 있어서,
    상기 β-글로빈 LCR 영역은 HS3 영역 및 HS4 영역을 포함하는 발현 카세트.
  26. 청구항 25에 있어서,
    상기 HS3 영역은 상기 글로빈 유전자 또는 이의 기능성 부분과 HS4 영역 사이에 위치하는 발현 카세트.
  27. 청구항 10에 있어서,
    상기 HS3 영역은 1300 bp의 길이를 갖는 발현 카세트.
  28. 청구항 10에 있어서,
    상기 HS3 영역은 1301 bp의 길이를 갖는 발현 카세트.
  29. 청구항 28에 있어서,
    상기 HS3 영역은 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  30. 청구항 10에 있어서,
    상기 HS4 영역은 1.1 kb의 길이를 갖는 발현 카세트.
  31. 청구항 10에 있어서,
    상기 HS4 영역은 1065 bp의 길이를 갖는 발현 카세트.
  32. 청구항 31에 있어서,
    상기 HS4 영역은 서열번호 6에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  33. 청구항 31에 있어서,
    상기 HS4 영역은 서열번호 7에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  34. 청구항 10에 있어서,
    상기 HS4 영역은 450 bp의 길이를 갖는 발현 카세트.
  35. 청구항 10에 있어서,
    상기 HS4 영역은 446 bp의 길이를 갖는 발현 카세트.
  36. 청구항 35에 있어서,
    상기 HS4 영역은 서열번호 8에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  37. 청구항 5에 있어서,
    상기 β-글로빈 LCR 영역은 서열번호 2에 기재된 뉴클레오티드 서열을 갖는 HS1 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 HS3 영역, 및 서열번호 6에 기재된 뉴클레오티드 서열을 갖는 HS4 영역을 포함하고, 상기 β-글로빈 LCR 영역은 HS2 영역을 포함하지 않는 발현 카세트.
  38. 청구항 5에 있어서,
    상기 β-글로빈 LCR 영역은 서열번호 3에 기재된 뉴클레오티드 서열을 갖는 HS1 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 HS3 영역, 및 서열번호 8에 기재된 뉴클레오티드 서열을 갖는 HS4 영역을 포함하고, 상기 β-글로빈 LCR 영역은 HS2 영역을 포함하지 않는 발현 카세트.
  39. 청구항 5에 있어서,
    상기 β-글로빈 LCR 영역은 서열번호 4에 기재된 뉴클레오티드 서열을 갖는 HS1 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 HS3 영역, 및 서열번호 8에 기재된 뉴클레오티드 서열을 갖는 HS4 영역을 포함하고, 상기 β-글로빈 LCR 영역은 HS2 영역을 포함하지 않는 발현 카세트.
  40. 청구항 20에 있어서,
    상기 β-글로빈 LCR 영역은 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 HS3 영역 및 서열번호 6에 기재된 뉴클레오티드 서열을 갖는 HS4 영역을 포함하고, 상기 β-글로빈 LCR 영역은 HS1 영역 또는 HS2 영역을 포함하지 않는 발현 카세트.
  41. 청구항 4에 있어서,
    상기 β-글로빈 LCR 영역은 HS2 영역, HS3 영역 및 HS4 영역을 포함하는 발현 카세트.
  42. 청구항 41에 있어서,
    상기 HS2 영역은 860 bp의 길이를 갖는 발현 카세트.
  43. 청구항 42에 있어서,
    상기 HS2 영역은 서열번호 9에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  44. 청구항 41에 있어서,
    상기 HS3 영역은 1300 bp의 길이를 갖는 발현 카세트.
  45. 청구항 41에 있어서,
    상기 HS3 영역은 1301 bp의 길이를 갖는 발현 카세트.
  46. 청구항 45에 있어서,
    상기 HS3 영역은 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  47. 청구항 41에 있어서,
    상기 HS4 영역은 1.1 kb의 길이를 갖는 발현 카세트.
  48. 청구항 41에 있어서,
    상기 HS4 영역은 1065 bp의 길이를 갖는 발현 카세트.
  49. 청구항 48에 있어서,
    상기 HS4 영역은 서열번호 7에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  50. 청구항 41에 있어서,
    상기 β-글로빈 LCR 영역은 서열번호 9에 기재된 뉴클레오티드 서열을 갖는 HS2 영역, 서열번호 5에 기재된 뉴클레오티드 서열을 갖는 HS3 영역, 및 서열번호 7에 기재된 뉴클레오티드 서열을 갖는 HS4 영역을 포함하는 발현 카세트.
  51. 청구항 41에 있어서,
    상기 β-글로빈 LCR 영역은 HS1 영역을 추가로 포함하는 발현 카세트.
  52. 청구항 4에 있어서,
    상기 글로빈 유전자는 β-글로빈 유전자, γ-글로빈 유전자 및 δ-글로빈 유전자로 이루어진 군으로부터 선택되는 발현 카세트.
  53. 청구항 52에 있어서,
    상기 글로빈 유전자는 인간 β-글로빈 유전자인 발현 카세트.
  54. 청구항 53에 있어서,
    상기 인간 β-글로빈 유전자는 야생형 인간 β-글로빈 유전자, 인트론 서열의 하나 이상의 결실을 포함하는 결실된 인간 β-글로빈 유전자, 및 하나 이상의 항-겸상화 아미노산 잔기를 암호화하는 돌연변이된 인간 β-글로빈 유전자로 이루어진 군으로부터 선택되는 발현 카세트.
  55. 청구항 54에 있어서,
    상기 인간 β-글로빈 유전자는 코돈 87에서 글루타민으로의 쓰레오닌의 돌연변이를 암호화하는 인간 βA-글로빈 유전자(βA-T87Q)인 발현 카세트.
  56. 청구항 4에 있어서,
    서열번호 1에 기재된 뉴클레오티드 서열을 갖는 1개의 인슐레이터를 포함하는 발현 카세트.
  57. 청구항 4에 있어서,
    서열번호 1에 기재된 뉴클레오티드 서열을 갖는 2개의 인슐레이터를 포함하는 발현 카세트.
  58. 청구항 4에 있어서,
    β-글로빈 프로모터를 추가로 포함하는 발현 카세트.
  59. 청구항 58에 있어서,
    상기 β-글로빈 프로모터는 상기 글로빈 유전자 또는 이의 기능성 부분과 β-글로빈 LCR 영역 사이에 위치하는 발현 카세트.
  60. 청구항 58에 있어서,
    상기 β-글로빈 프로모터는 613 bp의 길이를 갖는 인간 β-글로빈 프로모터인 발현 카세트.
  61. 청구항 60에 있어서,
    상기 인간 β-글로빈 프로모터는 서열번호 10에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  62. 청구항 58에 있어서,
    상기 β-글로빈 프로모터는 265 bp의 길이를 갖는 인간 β-글로빈 프로모터인 발현 카세트.
  63. 청구항 62에 있어서,
    상기 인간 β-글로빈 프로모터는 서열번호 11에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  64. 청구항 4에 있어서,
    인간 β-글로빈 3' 인핸서를 추가로 포함하는 발현 카세트.
  65. 청구항 64에 있어서,
    상기 인간 β-글로빈 3' 인핸서는 상기 글로빈 유전자 또는 이의 기능성 부분의 업스트림에 위치하는 발현 카세트.
  66. 청구항 64에 있어서,
    상기 인간 β-글로빈 3' 인핸서는 879 bp의 길이를 갖는 발현 카세트.
  67. 청구항 66에 있어서,
    상기 인간 β-글로빈 3' 인핸서는 서열번호 12에 기재된 뉴클레오티드 서열을 갖는 발현 카세트.
  68. 청구항 5에 있어서,
    하나 이상의 적혈구-특이적 인핸서를 추가로 포함하는 발현 카세트.
  69. 청구항 68에 있어서,
    상기 하나 이상의 적혈구-특이적 인핸서는 상기 글로빈 유전자 또는 이의 기능성 부분과 β-글로빈 LCR 영역 사이에 위치하는 발현 카세트.
  70. 청구항 68에 있어서,
    상기 하나 이상의 적혈구-특이적 인핸서는 서열번호 13, 14, 15, 16 및 17로 이루어진 군으로부터 선택되는 뉴클레오티드 서열을 갖는 발현 카세트.
  71. 청구항 68에 있어서,
    1개, 2개 또는 3개의 적혈구-특이적 인핸서를 포함하는 발현 카세트.
  72. 청구항 4에 있어서,
    상기 발현 카세트는 포유동물에서 상기 글로빈 유전자 또는 이의 기능성 부분의 발현을 가능하게 하는 발현 카세트.
  73. 청구항 72에 있어서,
    상기 발현 카세트는 인간 β-글로빈 유전자의 발현을 가능하게 하는 발현 카세트.
  74. 청구항 71에 있어서,
    상기 글로빈 유전자 또는 이의 기능성 부분의 발현은 적혈구 조직으로 제한되는 발현 카세트.
  75. 청구항 4 내지 청구항 74 중 어느 한 항의 발현 카세트를 포함하는 재조합 벡터.
  76. 청구항 75에 있어서,
    상기 재조합 벡터는 레트로바이러스 벡터인 재조합 벡터.
  77. 청구항 76에 있어서,
    상기 레트로바이러스 벡터는 렌티바이러스 벡터인 재조합 벡터.
  78. 청구항 75에 있어서,
    상기 발현 카세트는 서열번호 1에 기재된 뉴클레오티드 서열을 갖는 1개의 인슐레이터를 포함하는 재조합 벡터.
  79. 청구항 75에 있어서,
    상기 벡터의 3' 긴 말단 반복부(LTR)에서 우드척 간염 후-조절 요소(WPRE)를 추가로 포함하는 재조합 벡터.
  80. 청구항 79에 있어서,
    상기 벡터의 3' 긴 말단 반복부(LTR)에서 소 성장 호르몬 폴리아데닐화 신호를 추가로 포함하는 재조합 벡터.
  81. 청구항 4 내지 청구항 74 중 어느 한 항의 발현 카세트를 포함하는 비-천연 생성 또는 조작된 뉴클레아제.
  82. 청구항 81에 있어서,
    상기 뉴클레아제는 비-천연 생성 또는 조작된 징크-핑거 뉴클레아제(ZFN), 비-천연 생성 또는 조작된 메가뉴클레아제, 및 비-천연 생성 또는 조작된 전사 활성화제-유사 이펙터 뉴클레아제(TALEN)로 이루어진 군으로부터 선택되는 뉴클레아제.
  83. 청구항 81에 있어서,
    상기 뉴클레아제는 DNA 결합 도메인 및 뉴클레아제 절단 도메인을 포함하는 뉴클레아제.
  84. 청구항 81에 있어서,
    상기 뉴클레아제는 게놈 세이프 하버 부위에 결합하는 뉴클레아제.
  85. 청구항 84에 있어서,
    상기 뉴클레아제는 상기 게놈 세이프 하버 부위에서 이중 가닥 절단(DSB)을 발생시키는 뉴클레아제.
  86. 청구항 84에 있어서,
    상기 게놈 세이프 하버 부위는 유전자외적 게놈 세이프 하버 부위인 뉴클레아제.
  87. 청구항 84에 있어서,
    상기 게놈 세이프 하버 부위는 염색체 1 상에 위치하는 뉴클레아제.
  88. 청구항 84에 있어서,
    상기 게놈 세이프 하버 부위는 하기 5개의 기준들 전부를 충족시키는 뉴클레아제: (ⅰ) 임의의 유전자의 5' 말단으로부터 적어도 50 kb의 거리, (ⅱ) 임의의 암 관련 유전자로부터 적어도 300 kb의 거리, (ⅲ) (천연 또는 조작된 뉴클레아제를 사용한 DNA 절단에 의해 측정된) 개방된/접근가능한 염색질 구조 내부에 위치, (ⅳ) 유전자 전사 유닛 외부에 위치, 및 (ⅴ) 인간 게놈의 초보존된 영역(UCR), microRNA 또는 긴 비-코딩 RNA 외부에 위치.
  89. 청구항 81에 있어서,
    상기 발현 카세트는 서열번호 1에 기재된 뉴클레오티드 서열을 갖는 2개의 인슐레이터를 포함하는 뉴클레아제.
  90. 청구항 81에 있어서,
    상기 발현 카세트의 표적화된 전달을 가능하게 하는 뉴클레아제.
  91. 청구항 81의 뉴클레아제를 암호화하는 폴리뉴클레오티드.
  92. 청구항 91의 폴리뉴클레오티드를 포함하는 벡터.
  93. 청구항 92에 있어서,
    상기 벡터는 렌티바이러스 벡터인 벡터.
  94. 청구항 4 내지 청구항 74 중 어느 한 항의 발현 카세트를 포함하는 비-천연 생성 또는 조작된 CRISPR-Cas 시스템.
  95. 청구항 94에 있어서,
    상기 CRISPR-Cas 시스템은 CRISPR-Cas 뉴클레아제 및 단일-가이드 RNA를 포함하는 CRISPR-Cas 시스템.
  96. 청구항 94에 있어서,
    상기 CRISPR-Cas 시스템은 게놈 세이프 하버 부위에 결합하는 CRISPR-Cas 시스템.
  97. 청구항 96에 있어서,
    상기 CRISPR-Cas 시스템은 상기 게놈 세이프 하버 부위에서 이중 가닥 절단(DSB)을 발생시키는 CRISPR-Cas 시스템.
  98. 청구항 96에 있어서,
    상기 게놈 세이프 하버 부위는 유전자외적 게놈 세이프 하버 부위인 CRISPR-Cas 시스템.
  99. 청구항 96에 있어서,
    상기 게놈 세이프 하버 부위는 염색체 1 상에 위치하는 CRISPR-Cas 시스템.
  100. 청구항 96에 있어서,
    상기 게놈 세이프 하버 부위는 하기 5개의 기준들 전부를 충족시키는 CRISPR-Cas 시스템: (ⅰ) 임의의 유전자의 5' 말단으로부터 적어도 50 kb의 거리, (ⅱ) 임의의 암 관련 유전자로부터 적어도 300 kb의 거리, (ⅲ) (천연 또는 조작된 뉴클레아제를 사용한 DNA 절단에 의해 측정된) 개방된/접근가능한 염색질 구조 내부에 위치, (ⅳ) 유전자 전사 유닛 외부에 위치, 및 (ⅴ) 인간 게놈의 초보존된 영역(UCR), microRNA 또는 긴 비-코딩 RNA 외부에 위치.
  101. 청구항 94에 있어서,
    상기 발현 카세트는 서열번호 1에 기재된 뉴클레오티드 서열을 갖는 2개의 인슐레이터를 포함하는 CRISPR-Cas 시스템.
  102. 청구항 94에 있어서,
    상기 발현 카세트의 표적화된 전달을 가능하게 하는 CRISPR-Cas 시스템.
  103. 청구항 94의 CRISPR-Cas 시스템을 암호화하는 폴리뉴클레오티드.
  104. 청구항 103의 폴리뉴클레오티드를 포함하는 벡터.
  105. 청구항 104에 있어서,
    상기 벡터는 렌티바이러스 벡터인 벡터.
  106. 청구항 4 내지 청구항 74 중 어느 한 항의 발현 카세트로 형질도입된 세포.
  107. 청구항 75의 재조합 벡터로 형질도입된 세포.
  108. 청구항 81의 뉴클레아제로 형질도입된 세포.
  109. 청구항 94의 CRISPR-Cas 시스템으로 형질도입된 세포.
  110. 청구항 92의 벡터로 형질도입된 세포.
  111. 청구항 106에 있어서,
    상기 세포는 조혈 줄기 세포, 배아 줄기 세포, 유도된 다분화능 줄기 세포 및 조혈발생 내피 세포로 이루어진 군으로부터 선택되는 세포.
  112. 청구항 111에 있어서,
    상기 조혈 줄기 세포는 CD34+ 조혈 줄기 세포인 세포.
  113. 청구항 106에 있어서,
    상기 세포는 생체외에서 형질도입되는 세포.
  114. 유효량의 청구항 106의 세포 및 약학적으로 허용가능한 담체를 포함하는 대상체에서 헤모글로빈병증 치료용 약학 조성물.
  115. 청구항 114에 있어서,
    상기 헤모글로빈병증은 헤모글로빈 C 질환, 헤모글로빈 겸상 세포 질환(SCD), 겸상 세포 빈혈, 유전성 빈혈, 지중해빈혈, β-지중해빈혈, 지중해빈혈 메이저, 지중해빈혈 인터메디아, α-지중해빈혈 및 헤모글로빈 H 질환으로 이루어진 군으로부터 선택되는 약학 조성물.
  116. 청구항 115에 있어서,
    상기 헤모글로빈병증은 β-지중해빈혈인 약학 조성물.
  117. 청구항 115에 있어서,
    상기 헤모글로빈병증은 겸상 세포 빈혈인 약학 조성물.
  118. 청구항 106의 세포를 포함하는 헤모글로빈병증 치료용 키트.
  119. 청구항 118에 있어서,
    상기 키트는 헤모글로빈병증을 갖는 대상체를 치료하기 위해 상기 세포를 사용하기 위한 기록된 설명서를 추가로 포함하는 키트.
  120. 청구항 118에 있어서,
    상기 헤모글로빈병증은 헤모글로빈 C 질환, 헤모글로빈 겸상 세포 질환(SCD), 겸상 세포 빈혈, 유전성 빈혈, 지중해빈혈, β-지중해빈혈, 지중해빈혈 메이저, 지중해빈혈 인터메디아, α-지중해빈혈 및 헤모글로빈 H 질환으로 이루어진 군으로부터 선택되는 키트.
  121. 청구항 120에 있어서,
    상기 헤모글로빈병증은 β-지중해빈혈인 키트.
  122. 청구항 120에 있어서,
    상기 헤모글로빈병증은 겸상 세포 빈혈인 키트.
  123. 청구항 115에 있어서,
    치료적으로 적절한 수준의 헤모글로빈이 상기 세포를 대상체에게 투여한 후 상기 대상체에서 생성되는 약학 조성물.
  124. 유효량의 청구항 75의 재조합 벡터로 형질도입된 세포 및 약학적으로 허용가능한 담체를 포함하는 대상체에서 헤모글로빈병증 치료용 약학 조성물.
  125. 청구항 124에 있어서,
    상기 대상체에서 치료적으로 적절한 수준의 헤모글로빈을 제공하는 상기 세포 내의 재조합 벡터의 벡터 카피 수는 세포당 0.5 내지 2 벡터 카피 수인 약학 조성물.
  126. 청구항 114에 있어서,
    상기 약학 조성물은 상기 대상체에서 비효과적인 적혈구생성을 보정하는 약학 조성물.
  127. 청구항 114에 있어서,
    상기 약학 조성물은 상기 대상체에게 이식편-대-숙주 질환의 위험을 발생시키지 않는 약학 조성물.
  128. 청구항 114에 있어서,
    상기 약학 조성물은 면역억제제를 포함하지 않는 약학 조성물.
  129. 청구항 124에 있어서,
    상기 헤모글로빈병증은 헤모글로빈 C 질환, 헤모글로빈 겸상 세포 질환(SCD), 겸상 세포 빈혈, 유전성 빈혈, 지중해빈혈, β-지중해빈혈, 지중해빈혈 메이저, 지중해빈혈 인터메디아, α-지중해빈혈 및 헤모글로빈 H 질환으로 이루어진 군으로부터 선택되는 약학 조성물.
  130. 청구항 129에 있어서,
    상기 헤모글로빈병증은 β-지중해빈혈인 약학 조성물.
  131. 청구항 129에 있어서,
    상기 헤모글로빈병증은 겸상 세포 빈혈인 약학 조성물.
  132. 청구항 114에 있어서,
    상기 세포는 조혈 줄기 세포, 배아 줄기 세포, 유도된 다분화능 줄기 세포 및 조혈발생 내피 세포로 이루어진 군으로부터 선택되는 약학 조성물.
  133. 청구항 114에 있어서,
    상기 대상체는 인간인 약학 조성물.
  134. 청구항 114에 있어서,
    상기 세포는 상기 대상체로부터 유래되는 약학 조성물.
  135. 청구항 134에 있어서,
    상기 세포는 상기 대상체의 골수로부터 유래되는 약학 조성물.
  136. 삭제
  137. 삭제
KR1020177008935A 2014-09-04 2015-09-04 헤모글로빈병증 치료용 글로빈 유전자 치료법 KR102500531B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020237005064A KR20230030002A (ko) 2014-09-04 2015-09-04 헤모글로빈병증 치료용 글로빈 유전자 치료법

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462045997P 2014-09-04 2014-09-04
US62/045,997 2014-09-04
PCT/US2015/048698 WO2016037138A1 (en) 2014-09-04 2015-09-04 Global gene therapy for treating hemoglobinopathies

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020237005064A Division KR20230030002A (ko) 2014-09-04 2015-09-04 헤모글로빈병증 치료용 글로빈 유전자 치료법

Publications (2)

Publication Number Publication Date
KR20170044752A KR20170044752A (ko) 2017-04-25
KR102500531B1 true KR102500531B1 (ko) 2023-02-17

Family

ID=55440425

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020177008935A KR102500531B1 (ko) 2014-09-04 2015-09-04 헤모글로빈병증 치료용 글로빈 유전자 치료법
KR1020237005064A KR20230030002A (ko) 2014-09-04 2015-09-04 헤모글로빈병증 치료용 글로빈 유전자 치료법

Family Applications After (1)

Application Number Title Priority Date Filing Date
KR1020237005064A KR20230030002A (ko) 2014-09-04 2015-09-04 헤모글로빈병증 치료용 글로빈 유전자 치료법

Country Status (11)

Country Link
US (2) US11717579B2 (ko)
EP (2) EP3189143B1 (ko)
JP (3) JP6710680B2 (ko)
KR (2) KR102500531B1 (ko)
CN (3) CN114457076A (ko)
AU (2) AU2015311681B2 (ko)
BR (1) BR112017004349A2 (ko)
CA (1) CA2960209C (ko)
ES (1) ES2746529T3 (ko)
MX (1) MX2017002900A (ko)
WO (1) WO2016037138A1 (ko)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6737714B2 (ja) 2014-03-14 2020-08-12 ユニヴァーシティ オブ ワシントン ゲノムインスレーターエレメントおよびその使用
EP3548617A4 (en) 2016-12-05 2020-06-17 The Regents of The University of California LENTIVIRAL VECTOR OPTIMIZED FOR HEMOGLOBINOPATHY STEM CELL THERAPY
TW201839136A (zh) 2017-02-06 2018-11-01 瑞士商諾華公司 治療血色素異常症之組合物及方法
WO2018183692A1 (en) * 2017-03-29 2018-10-04 Bluebird Bio, Inc. Vectors and compositions for treating hemoglobinopathies
EP3635120A1 (en) * 2017-06-02 2020-04-15 Institut National de la Santé et de la Recherche Médicale (INSERM) Recombinant lentiviral vector for stem cell-based gene therapy of sickle cell disorder
AU2018378683A1 (en) * 2017-12-06 2020-07-02 Memorial Sloan-Kettering Cancer Center Globin gene therapy for treating hemoglobinopathies
WO2019213011A1 (en) * 2018-04-30 2019-11-07 The Children's Hospital Of Philadelphia Compositions and methods for hemoglobin production
EP3886869A4 (en) * 2018-11-28 2022-07-06 Forty Seven, Inc. GENETICALLY MODIFIED CSPH RESISTANT TO ABLATIVE TREATMENT
EP3924376A4 (en) * 2019-02-14 2022-12-14 The Regents Of The University Of California OPTIMIZED LENTIVIRAL VECTOR COMPRISING MINIMUM ENABLING SEQUENCE ELEMENTS FOR HEMOGLOBINOPATHY STEM CELL GENE THERAPY
EP3931338A4 (en) * 2019-02-28 2023-01-11 The Regents Of The University Of California LENTIVIRAL VECTOR ENHANCEMENT SYSTEMS (CCLC-MGATA/ANK-CORE LCR-BETA-AS3-FB) TO INCREASE EXPRESSION
CN110042124A (zh) * 2019-04-25 2019-07-23 国家卫生健康委科学技术研究所 基因组碱基编辑增加人红细胞中胎儿血红蛋白水平的试剂盒及应用
CN109999053B (zh) * 2019-04-26 2021-03-23 周德旺 曲氟尿苷或曲氟尿苷替匹嘧啶组合物的医药用途
CN110106203B (zh) * 2019-05-24 2023-08-11 中国医学科学院血液病医院(血液学研究所) 一种新型hbb过表达载体及其设计方法和应用
CN110699381A (zh) * 2019-09-17 2020-01-17 合肥瑞灵生物科技有限公司 地中海贫血病基因治疗载体构建方法及其用途
EP4093442A4 (en) * 2020-01-22 2024-05-29 Altius Inst For Biomedical Sciences NOVEL ERYTHROD-SPECIFIC ENHANCERS AND THEIR USES
JP7031690B2 (ja) * 2020-01-27 2022-03-08 株式会社三洋物産 遊技機
WO2022212720A1 (en) * 2021-03-31 2022-10-06 Sigilon Therapeutics, Inc. Genetically modified human cell lines and uses thereof
CN113106098B (zh) * 2021-04-21 2022-04-01 贵州医科大学 一种在红系细胞中特异表达人β珠蛋白的重组序列及其应用
CN113564248A (zh) * 2021-09-26 2021-10-29 北京贝瑞和康生物技术有限公司 同时检测hba1/2、hbb和hbd基因位点多种突变的方法和试剂盒
CN114457119B (zh) * 2022-04-11 2022-08-12 中吉智药(南京)生物技术有限公司 慢病毒载体在制备治疗β-地中海贫血药物中的应用
CN116271106B (zh) * 2023-05-24 2023-08-11 中吉智药(南京)生物技术有限公司 慢病毒载体LentilAlpha在制备治疗α-地中海贫血药物中的应用

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100022006A1 (en) 2007-02-15 2010-01-28 The Govt. Of The Usa As Represented By The Secreta Gamma satellite insulator sequences and their use in preventing gene silencing
US20120115227A1 (en) 2009-04-03 2012-05-10 Centre National De La Recherche Scientifique Gene transfer vectors comprising genetic insulator elements and methods to identify genetic insulator elements
US20140043131A1 (en) 2012-08-10 2014-02-13 Tyco Electronics Corporation Planar electronic device
US20150138852A1 (en) 2012-08-03 2015-05-21 Abb Technology Ag Overload limitation in peak power operation

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4873192A (en) 1987-02-17 1989-10-10 The United States Of America As Represented By The Department Of Health And Human Services Process for site specific mutagenesis without phenotypic selection
US5399346A (en) 1989-06-14 1995-03-21 The United States Of America As Represented By The Department Of Health And Human Services Gene therapy
US5725871A (en) 1989-08-18 1998-03-10 Danbiosyst Uk Limited Drug delivery compositions comprising lysophosphoglycerolipid
US5707644A (en) 1989-11-04 1998-01-13 Danbiosyst Uk Limited Small particle compositions for intranasal drug delivery
US5399363A (en) 1991-01-25 1995-03-21 Eastman Kodak Company Surface modified anticancer nanoparticles
US5756353A (en) 1991-12-17 1998-05-26 The Regents Of The University Of California Expression of cloned genes in the lung by aerosol-and liposome-based delivery
DK0641192T3 (da) 1992-05-18 1998-03-02 Minnesota Mining & Mfg Anordning til transmucosal lægemiddelafgivelse
US5543158A (en) 1993-07-23 1996-08-06 Massachusetts Institute Of Technology Biodegradable injectable nanoparticles
IE80468B1 (en) 1995-04-04 1998-07-29 Elan Corp Plc Controlled release biodegradable nanoparticles containing insulin
IL178921A0 (en) 1998-12-24 2007-03-08 Yeda Res & Dev Caspase-8 interacting proteins
BR0211307A (pt) 2001-06-29 2004-09-14 Sloan Kettering Inst Cancer Lentivetor recombinante codificando o gene da globina humana, uso do mesmo no tratamento de hemoglobinopatias, células de mamìfero oriundas do progenitor hematopoietico e método para preparo de uma composição terapêutica para tratamento de hemoglobinopatia em um mamìfero
WO2004005458A2 (en) * 2002-06-13 2004-01-15 Regulome Corporation Functional sites
US20080069805A1 (en) * 2005-05-18 2008-03-20 Williams Bruce M Use of stem cells to cure genetic diseases in humans cure for sickle cell anemia
US8790345B2 (en) 2007-08-21 2014-07-29 Zimmer, Inc. Titanium alloy with oxidized zirconium for a prosthetic implant
US20090156534A1 (en) * 2007-09-13 2009-06-18 Memorial Sloan-Kettering Cancer Center Globin lentiviral vectors for treatment of disease
WO2010046493A2 (en) * 2008-10-23 2010-04-29 Université de Lausanne Gene transfer vectors comprising at least one isolated dna molecule having insulator and or boundary properties and methods to identify the same
CA2798988C (en) 2010-05-17 2020-03-10 Sangamo Biosciences, Inc. Tal-effector (tale) dna-binding polypeptides and uses thereof
US20150216903A1 (en) * 2012-08-10 2015-08-06 Bluebird Bio, Inc. Compounds for improved viral transduction
US20150224209A1 (en) * 2012-09-14 2015-08-13 The Regents Of The University Of California Lentiviral vector for stem cell gene therapy of sickle cell disease
US10072067B2 (en) * 2014-01-30 2018-09-11 Children's Hospital Medical Center Fetal hemoglobin for genetic correction of sickle cell disease
JP6737714B2 (ja) * 2014-03-14 2020-08-12 ユニヴァーシティ オブ ワシントン ゲノムインスレーターエレメントおよびその使用

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100022006A1 (en) 2007-02-15 2010-01-28 The Govt. Of The Usa As Represented By The Secreta Gamma satellite insulator sequences and their use in preventing gene silencing
US20120115227A1 (en) 2009-04-03 2012-05-10 Centre National De La Recherche Scientifique Gene transfer vectors comprising genetic insulator elements and methods to identify genetic insulator elements
US20150138852A1 (en) 2012-08-03 2015-05-21 Abb Technology Ag Overload limitation in peak power operation
US20140043131A1 (en) 2012-08-10 2014-02-13 Tyco Electronics Corporation Planar electronic device

Also Published As

Publication number Publication date
AU2015311681A1 (en) 2017-04-13
CN114457076A (zh) 2022-05-10
US20170173185A1 (en) 2017-06-22
EP3189143B1 (en) 2019-08-07
WO2016037138A1 (en) 2016-03-10
EP3620521B1 (en) 2024-05-29
ES2746529T3 (es) 2020-03-06
JP2022107736A (ja) 2022-07-22
JP7158427B2 (ja) 2022-10-21
KR20170044752A (ko) 2017-04-25
US20240066148A1 (en) 2024-02-29
AU2021290257A1 (en) 2022-01-27
JP2017532023A (ja) 2017-11-02
CN114480393A (zh) 2022-05-13
EP3189143A1 (en) 2017-07-12
AU2015311681B2 (en) 2021-09-23
EP3620521A1 (en) 2020-03-11
US11717579B2 (en) 2023-08-08
CA2960209A1 (en) 2016-03-10
JP6710680B2 (ja) 2020-06-17
BR112017004349A2 (pt) 2017-12-05
MX2017002900A (es) 2017-10-24
EP3189143A4 (en) 2018-03-21
AU2015311681A8 (en) 2019-08-08
WO2016037138A8 (en) 2017-03-16
JP2020079327A (ja) 2020-05-28
CA2960209C (en) 2023-08-29
KR20230030002A (ko) 2023-03-03
CN107208093B (zh) 2022-03-01
CN107208093A (zh) 2017-09-26

Similar Documents

Publication Publication Date Title
KR102500531B1 (ko) 헤모글로빈병증 치료용 글로빈 유전자 치료법
JP2024023294A (ja) 遺伝子編集のためのcpf1関連方法及び組成物
EP3684924B1 (en) Non-integrating dna vectors for the genetic modification of cells
KR101999410B1 (ko) 염색체 랜딩 패드 및 관련된 용도
US11753654B2 (en) Globin gene therapy for treating hemoglobinopathies
CN114174520A (zh) 用于选择性基因调节的组合物和方法
KR20220157944A (ko) 인간 대상체에서 비-연령-연관 청각 장애를 치료하기 위한 조성물 및 방법
KR20210082205A (ko) 레트로바이러스 인테그라제-Cas9 융합 단백질을 이용한 유도된 비상동 DNA 삽입에 의한 게놈 편집
CN111902164A (zh) 用于恢复pah基因功能的腺相关病毒组合物及其使用方法
KR20240035382A (ko) 아데노바이러스 유전자 요법 벡터
KR20230125806A (ko) 선천성 근이영양증의 치료를 위한 치료용 lama2 페이로드
CN117043324A (zh) 用于治疗先天性肌营养不良的治疗性lama2载荷
KR20240000580A (ko) 레트로바이러스 인테그라제-Cas 융합 단백질을 이용한 직접 비상동 DNA 삽입에 의한 게놈 편집 및 치료 방법

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant