KR20220038362A - 재조합 ad35 벡터 및 관련 유전자 요법 개선 - Google Patents

재조합 ad35 벡터 및 관련 유전자 요법 개선 Download PDF

Info

Publication number
KR20220038362A
KR20220038362A KR1020227003415A KR20227003415A KR20220038362A KR 20220038362 A KR20220038362 A KR 20220038362A KR 1020227003415 A KR1020227003415 A KR 1020227003415A KR 20227003415 A KR20227003415 A KR 20227003415A KR 20220038362 A KR20220038362 A KR 20220038362A
Authority
KR
South Korea
Prior art keywords
vector
genome
helper
nucleic acid
globin
Prior art date
Application number
KR1020227003415A
Other languages
English (en)
Inventor
한스-피터 키엠
안드레 리버
창 리
홍지에 왕
Original Assignee
프레드 헛친슨 켄서 리서치 센터
유니버시티 오브 워싱톤
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 프레드 헛친슨 켄서 리서치 센터, 유니버시티 오브 워싱톤 filed Critical 프레드 헛친슨 켄서 리서치 센터
Publication of KR20220038362A publication Critical patent/KR20220038362A/ko

Links

Images

Classifications

    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K48/00Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
    • A61K48/0091Purification or manufacturing processes for gene therapy compositions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/111General methods applicable to biologically active non-coding nucleic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/87Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
    • C12N15/90Stable introduction of foreign DNA into chromosome
    • C12N15/902Stable introduction of foreign DNA into chromosome using homologous recombination
    • C12N15/907Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/22Ribonucleases RNAses, DNAses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2310/00Structure or type of the nucleic acid
    • C12N2310/10Type of nucleic acid
    • C12N2310/20Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2330/00Production
    • C12N2330/50Biochemical production, i.e. in a transformed host cell
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10351Methods of production or purification of viral material
    • C12N2710/10352Methods of production or purification of viral material relating to complementing cells and packaging systems for producing virus or viral particles
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/50Vectors for producing vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/80Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/90Vectors containing a transposable element
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2810/00Vectors comprising a targeting moiety
    • C12N2810/50Vectors comprising as targeting moiety peptide derived from defined protein
    • C12N2810/60Vectors comprising as targeting moiety peptide derived from defined protein from viruses
    • C12N2810/6009Vectors comprising as targeting moiety peptide derived from defined protein from viruses dsDNA viruses
    • C12N2810/6018Adenoviridae
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2999/00Further aspects of viruses or vectors not covered by groups C12N2710/00 - C12N2796/00 or C12N2800/00
    • C12N2999/007Technological advancements, e.g. new system for producing known virus, cre-lox system for production of transgenic animals

Abstract

본 개시내용은 무엇보다도 헬퍼-의존적 아데노바이러스 혈청형 35(Ad35) 벡터를 제공한다. 다양한 구현예에서, 헬퍼-의존적 Ad35 벡터는 치료적 페이로드를 이를 필요로 하는 대상체에게 전달하는 데 사용될 수 있다. 예시적인 페이로드는 대체 단백질, 항체, CAR, TCR, 작은 RNA, 및 게놈 편집 시스템을 암호화할 수 있다. 특정 구현예에서, 헬퍼-의존적 Ad35 벡터는 페이로드를 숙주 세포 게놈 내로 통합하기 위해 조작된다. 본 개시내용은 헬퍼-의존적 Ad35 벡터를 이를 필요로 하는 대상체에게 투여하는 것을 포함하는 유전자 요법 방법을 추가로 포함한다.

Description

재조합 AD35 벡터 및 관련 유전자 요법 개선
관련 출원에 대한 상호 참조
본 출원은 2019년 7월 2일 출원된 미국 가출원 번호 제62/869,907호, 2019년 11월 14일 출원된 미국 가출원 번호 제62/935,507호, 및 2020년 4월 13일 출원된 미국 가출원 번호 제63/009,385호의 이익을 주장하며, 각각의 개시내용은 그 전문이 본원에 참조로 포함된다.
정부 지원
본 발명은 국립보건원(National Institutes of Health)에 의해 수여된 보조금 번호 HL130040, HL141781, 및 CA204036 하에 정부 지원으로 이루어졌다. 정부는 본 발명의 특정 권리를 갖는다.
서열 목록에 관한 진술
본 출원과 관련된 서열 목록은 종이 사본 대신에 텍스트 형식으로 제공되며 명세서에 참조로 포함된다. 서열 목록을 함유하는 텍스트 파일의 명칭은 F053-0107PCT_ST25.txt이다. 텍스트 파일은 945 KB이며, 2020년 7월 2일 생성되었고, EFS-Web을 통해 전자적으로 제출되고 있다.
많은 의학적 병태는 유전적 돌연변이에 의해 유발되고/되거나, 적어도 부분적으로, 유전자 요법에 의해 치료가능하다. 이러한 병태는 예를 들어, 혈색소병증, 면역 결핍, 및 암을 포함한다. 혈색소병증으로 알려진 유전 질환은 전세계적으로 가장 널리 퍼진 유전 질환 유형 중 하나이며, 저개발 국가에서 태어난 환자 중에서 생존율이 상당히 감소된다. 혈색소병증의 예는 겸상적혈구병 및 지중해빈혈을 포함한다. 면역 결핍은 1차성 또는 2차성일 수 있다. 80 개 초과의 1차성 면역 결핍 질환이 세계보건기구(World Health Organization)에 의해 인식되고 있다. 유전적 돌연변이에 의해 유발되고/되거나, 적어도 부분적으로, 유전자 요법에 의해 치료가능한 의학적 병태에 대한 예방적 및 치료적 치료가 필요하다.
유전자 요법은 혈색소병증, 면역 결핍, 및 암을 포함하나 이에 제한되지 않는 유전적 구성요소가 있는 많은 병태를 치료할 수 있다. 분자 생물학은 유전적 조작을 위한 다양한 도구를 포함하지만, 예를 들어, 생체외 및 생체내에서 유전자 요법 맥락에서 이러한 도구의 적용은 유전자 요법 벡터에서 사용하기 위한 유전적 작제물의 개발, 뿐만 아니라 벡터 자체의 개발과 적어도 부분적으로 연관된 새로운 기회 및 도전을 불러일으킨다.
본 개시내용은 무엇보다도, 표적 세포에서 염기 편집기의 발현을 위한 아데노바이러스 벡터 및 아데노바이러스 게놈(예를 들어, "재조합" 또는 "조작된" 아데노바이러스 벡터 및 아데노바이러스 게놈)을 포함한다. 본 개시내용은 무엇보다도, 표적 세포에서 CRISPR-연관 RNA-가이드된 엔도뉴클레아제 및/또는 가이드 RNA(gRNA)인 CRISPR 효소를 포함하는 CRISPR 시스템의 발현을 위한 아데노바이러스 벡터 및 아데노바이러스 게놈을 포함하며, 임의적으로 여기서 CRISPR 시스템의 적어도 하나의 구성요소의 발현은 자기-불활성화된다. 본 개시내용은 무엇보다도, 표적 세포에서 염기 편집 효소 및/또는 가이드 RNA(gRNA)를 포함하는 염기 편집 시스템의 발현을 위한 아데노바이러스 벡터 및 아데노바이러스 게놈을 포함하며, 임의적으로 여기서 염기 편집 시스템의 적어도 하나의 구성요소의 발현은 자기-불활성화된다. 본 개시내용은 무엇보다도, 표적 세포에서 발현 산물(예를 들어, 치료 발현 산물)의 발현을 지시하는 조절 서열을 포함하는 아데노바이러스 벡터 및 아데노바이러스 게놈을 포함하며, 여기서 조절 서열은 miRNA 결합 부위를 포함하거나 또는 여기서 조절 서열은 β-글로빈 유전자좌 제어 영역(LCR), 예컨대 β-글로빈 긴 LCR를 포함한다. 본 개시내용은 무엇보다도, 표적 세포에서 복수의 치료 발현 산물, 예를 들어, 질환 또는 병태의 치료에 함께 기여하는 치료 발현 산물을 발현하는 조합 아데노바이러스 벡터 및 아데노바이러스 게놈을 포함한다. 본 개시내용은 무엇보다도, β-글로빈 긴 LCR을 포함하는 페이로드(payload)의 표적 세포 게놈 내로의 통합을 위한 아데노바이러스 벡터 및 아데노바이러스 게놈을 포함한다. 본 개시내용은 무엇보다도, 특정 기존 벡터에 대한(예를 들어, Ad5 벡터에 대한) 면역원성이 감소된 아데노바이러스 벡터, 및 이의 아데노바이러스 게놈을 포함한다. 본 개시내용은 무엇보다도, Ad35 아데노바이러스 벡터, Ad35 아데노바이러스 게놈, HDAd35 아데노바이러스 벡터, HDAd35 아데노바이러스 게놈, 지지 벡터, 지지 게놈, Ad35 헬퍼 벡터, 및 ad Ad35 헬퍼 게놈을 포함하며, 여기서 HDAd35 벡터는 특정 기존 벡터에 대한(예를 들어, Ad5 벡터 또는 Ad5/35 벡터에 대한) 면역원성이 감소될 수 있다.
본 개시내용은 무엇보다도, 조혈 줄기 세포의 생체내 유전자 편집 및 관련된 유전자 요법 개선을 위해 CD46을 표적화하는 재조합 Ad35 벡터를 기재한다. 본원에 개시된 벡터 설계의 특정 구현예에서, 모든 단백질은 혈청형 35로부터 유래된다. 본원에 기재된 Ad35 벡터의 특정 구현예에서, 바이러스 유전자는 벡터에 남아있지 않다. 특정 구현예에서, ITR 및 패키징 서열은 Ad35로부터 유래된다. 특정 구현예에서, Ad35 전달 벡터는 치료 용도와 연관된 구성요소로 대체되고 제거된 모든 바이러스 단백질 암호화 유전자가 있다.
특정 구현예에서, Ad35 벡터는 헬퍼-의존적이며, 본 개시내용은 또한 새로-설계된 Ad35 헬퍼 벡터를 제공한다. 특정 구현예는 Ad35를 만들기 위해 헬퍼-의존적 및 이식유전자 플라스미드의 최적화된 비율을 제공한다.
본 개시내용 내에 기재된 관련된 유전자 요법 개선은 다음 중 하나 이상에 관한 것이다: (i) CD46 결합을 증가시키는 Ad35 놉(knob) 단백질의 신규 돌연변이; (ii) 생체내 변형된 세포의 양성 선택을 허용하는 벡터 특징; (iii) 임상적으로 관련된 시간 창 내에서 치료 단백질의 발현을 조절하는 microRNA 제어 시스템; (iv) 정의된 부위에서 표적화된 게놈 삽입을 용이하게 하기 위한 상동성 아암(arm)의 사용; (v) 게놈 억제인자 영역을 불활성화시켜, 내인성 유전자의 증가된 발현을 허용하기 위한 CRISPR의 사용; (vi) 표적화된 CD46-발현 세포에 Ad35 벡터의 전달을 증가시키기 위한 동원 전략의 사용; (vii) 유전자 발현을 증가시키기 위한 미니- 또는 긴-형태의 유전자좌 제어 영역의 사용; (viii) 트랜스포사제(transposase) 시스템과 함께 삽입될 수 있는 트랜스포존의 크기를 증가시키기 위한 재조합효소 시스템의 사용; (ix) 벡터 전달 전에 스테로이드 전달(예를 들어, 글루코코르티코이드, 덱사메타손); 및 (x) 치료 단백질을 생성 및 분비하는 적혈구. 이러한 관련 유전자 요법 개선은 각각 본원에 기재된 Ad35 벡터로 실행될 수 있고 또한 다른 바이러스 벡터 전달 시스템과 함께 활용될 수 있다. 일 예로서, CD46 결합을 증가시키는 돌연변이된 Ad35 놉 단백질은 렌티바이러스 또는 거품 전달 시스템과 함께 활용될 수 있다.
본원에 기재된 발전은 또한 다음에 관한 것이다: (i) HDAd5/35++ 벡터를 사용한 SB100x-매개 이식유전자 추가를 위한 생체내 HSC 형질도입/선택 기술; (ii) 적혈구 bcl11a-인핸서(예를 들어, BCL11A 발현 감소) 및 HBG1/2 프로모터 영역(γ-글로빈의 발현 증가)을 동시에 표적화함으로써 HbF 재활성화 증가; (iii) 생체내 CRISPR 게놈 조작; (iv) 지중해빈혈의 교정; (v) γ 유전자 추가 및 재활성화의 조합(SB100x 시스템); (vi) CRISPR/Cas9의 자기-불활성화; (vii) 자기-방출 카세트가 있는 HDAd를 공여자 벡터로 사용한 표적화된 통합; (viii) 분비된 치료 단백질의 고수준 생산을 위한 공장으로서 적혈구 세포를 사용한 생체내 HSC 유전자 요법; (ix) 암을 치료하기 위한 치료 접근법(예방적 및 치료적); 및 (x) HDAd35++ 벡터.
특정 구현예는 CD46에 대한 표적화된 결합을 증가시켜, 치료 유전자의 보다 표적화되고 특이적인 전달을 허용하는 돌연변이된 놉 단백질에 관한 것이다.
특정 구현예는 표적화된 게놈 삽입을 용이하게 하기 위한 상동성 아암의 사용에 관한 것이며, 이는 전형적으로 이식유전자 수준의 더 높은 발현을 허용하는 개방 염색질인 게놈 안전 항구(safe harbor) 내로의 염색체 통합을 제공하는 데 사용될 수 있다. 본원에 기재된 바와 같이, 특정 구현예에서, 1.8 b 상동성 아암은 잘 작동하며, 0.8을 하한으로 한다. 단일 뉴클레오티드 다형성은 1.8 b 초과의 상동성 아암에서 통합에 영향을 미치기 시작할 수 있다.
특정 구현예는 조건화에 대한 필요성을 완화하기 위한 동원 레지멘의 사용에 관한 것이다.
특정 구현예는 (i) 저용량 O6-벤질구아닌 및 비스-클로로에틸니트로소우레아를 사용한 단기간 치료에 의해 치료 효과를 증가시킬 수 있는 MGMTP140K 시스템, (ii) SB100X 트랜스포사제-기반 통합 기구, 및 (iii) 마이크로-LCR-구동된 γ-글로빈 유전자를 사용한, Ad35 생체내 유전자 요법을 제공한다.
특정 구현예는 (i) 내인성 유전자의 억제를 역전시키기 위해 HBG1/2 프로모터 내의 BCL11A 결합 부위를 표적화하는 CRISPR/Cas9 카세트, (ii) 5kb β-글로빈 미니-LCR에 의해 구동된 γ-글로빈 유전자 카세트, 및 FRT 및 트랜스포존 부위에 의해 플랭킹된 후자의 2 개 카세트와 함께 형질도입된 세포의 생체내 선택을 허용하는 EF1α- MGMTP140K 발현 카세트를 포함하는 Ad35 아데노바이러스 벡터(HDAd-comb)를 포함한다.
특정 구현예는 적혈구에서 태아 γ-글로빈 발현의 재활성화를 목표로 하는 성인 CD34+ 세포에서 CRISPR/Cas9-매개 게놈 편집 접근법을 기재한다. CD34+ 세포의 적혈구 분화를 수반하는 모델은 γ-글로빈 재활성화를 평가하는 데 있어서 한계가 있기 때문에, CRISPR/Cas9를 발현하는 인간 β-글로빈 유전자좌-유전자이식, 헬퍼-의존적 인간 CD46-표적화 아데노바이러스 벡터(HDAd-HBG-CRISPR)는 γ-글로빈 프로모터 내의 억제인자 결합 영역을 파괴하는 데 사용되었다.
특정 구현예는 통합 CD46 표적화된 Ad35 벡터 시스템을 제공한다: 이식유전자는 (i) γ 글로빈 유전자의 발현을 구동하는 β-글로빈 유전자좌 제어 영역(LCR), 및 (ii) 생체내 유전자-변형된 HSC의 양성 선택을 위한 MGMTP140K 카세트의 발현을 구동하는 EF1-α(구성적 프로모터)를 포함하였다.
특정 구현예는 통합 CD46 표적화된 Ad35 벡터 시스템을 제공한다: 이식유전자는 (i) γ 글로빈 유전자(임의적으로 3' UTR 포함)의 발현을 구동하는 21.5 kb(긴) 인간 β-글로빈 유전자좌 제어 영역(LCR(HS1-HS5)) 및 β-글로빈 프로모터(1.6 kb), 및 (ii) 생체내 유전자-변형된 HSC의 양성 선택을 위한 MGMTP140K 카세트의 발현을 구동하는 EF1- α(구성적 프로모터)를 포함하였다. 일부 구현예는 3'HS1(인간 β-글로빈 3'HS1; 3 kb, 예를 들어, 여기서 3'HS1은 염색체 11의 위치 5206867-5203839의 서열을 가짐)을 추가로 포함할 수 있다. 다양한 구현예에서, 3'HS1은 서열번호: 287에 제시된 바와 같은 하기 핵산 서열, 또는 서열번호: 287에 대해 적어도 80% 서열 동일성을 갖는 서열, 예를 들어, 서열번호: 287에 대해 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 서열을 갖는다. 이러한 구현예는 재조합효소 시스템(예를 들어, Flp/Frt; Cre/Lox)과 조합하여 과활성 트랜스포사제(예를 들어, SB100X)를 활용할 수 있다. 따라서, 일 특정 구현예에서, Ad35 벡터 시스템은 예를 들어, 긴 인간 β-글로빈 유전자좌 제어 영역(21.5 kb), 인간 β-글로빈 프로모터(1.6 kb), 3' UTR과 함께 인간 γ 글로빈 유전자(2.7 kb), 인간 β-글로빈 3' UTR, 및 3'HS1(3 kb)을 포함하는 전위성 이식유전자 삽입물을 포함할 수 있다. 전위성 이식유전자 삽입물은 MGMTP140K의 발현을 구동하는 EF1- α(구성적 프로모터)를 추가로 포함할 수 있다. 다양한 구현예에서, Ad35 벡터 시스템은 예를 들어, 32.4 kb의 전위성 이식유전자 삽입물을 포함할 수 있다.
특정 구현예는 치료 이식유전자의 발현을 제어하기 위해 HSPC가 종양에 모집될 때만 활성화되는 miRNA 조절 시스템을 제공한다. 본 개시내용의 이러한 특징은 항 PDL1-γ1을 이식유전자로서 사용하여 입증된다. 이러한 시스템은 종양 미세환경의 맥락에서 치료 이식유전자의 발현을 조절하는 데 사용될 수 있다.
다양한 구현예에서, microRNA 제어 시스템은 유전자의 발현이 microRNA 부위(예를 들어, microRNA가 상호작용할 수 있는 것이 있는 핵산 서열)의 존재에 의해 조절되는 방법 또는 조성물을 지칭할 수 있으며, 예는 실시예 5에 제공되었다. 특정 구현예에서, microRNA 제어 시스템은 유전자가 표적 세포, 예컨대 HSPC 예를 들어, 종양 침윤 HSPC에서 배타적으로 발현되도록 유전자의 발현을 조절하였다. 일부 구현예에서, 관심 단백질 또는 핵산(예를 들어, 항암제 예컨대 CAR, TCR, 항체, 및/또는 체크포인트 억제제, 예를 들어, 체크포인트 억제제인 αPD-L1 항체(예를 들어, αPD-L1γ1 항체))을 암호화하는 핵산(예를 들어, 치료 유전자)은 microRNA 부위, 복수의 동일한 microRNA 부위, 또는 복수의 별개의 microRNA 부위를 포함하거나, 이와 회합하거나, 또는 이와 작동가능하게 연결된다. 당업자는 관심 유전자를 암호화하는 서열을 갖는 핵산 또는 이의 부분과 microRNA 부위를 회합하는 수단 및 기술에 친숙할 것이지만, 특정 비제한적인 예가 본원에 제공된다. 예를 들어, 관심 유전자(예를 들어, αPD-L1γ1 항체를 암호화하는 서열)는 관심 유전자의 발현이 종양-침윤 백혈구 세포가 아니지만, 종양-침윤 백혈구에서 발현을 억제하지 않는 세포에서 발현을 억제하는 하나 이상의 microRNA 부위의 존재에 의해 조절되도록 핵산에 존재할 수 있다. 특정한 특정 예에서, 관심 유전자(예를 들어, αPD-L1γ1 항체를 암호화하는 서열)는 관심 유전자의 발현이 종양-침윤 백혈구 세포가 아니지만, 종양-침윤 백혈구에서 발현을 억제하지 않는 세포에서 발현을 억제하는 하나 이상의 miR423-5p microRNA 부위의 존재에 의해 조절되도록 핵산에 존재할 수 있다. 다양한 구현예에서, microRNA 제어 시스템은 하나 이상의 microRNA 부위, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개, 또는 그 이상의 microRNA 부위를 포함하거나, 또는 여기서 관심 단백질 또는 핵산의 발현이 이에 의해 조절되는 핵산을 포함할 수 있다. 다양한 구현예에서, microRNA 제어 시스템은 하나 이상의 miR423-5p microRNA 부위, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개, 또는 그 이상의 miR423-5p microRNA 부위를 포함하거나, 또는 여기서 관심 단백질 또는 핵산의 발현이 이에 의해 조절되는 핵산을 포함할 수 있다. 일부 특정 구현예에서, microRNA 제어 시스템은 αPD-L1γ1 항체를 암호화하고 하나 이상의 miR423-5p microRNA 부위, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개, 또는 그 이상의 miR423-5p microRNA 부위, 예를 들어, miR423-5p microRNA 부위를 포함하거나, 또는 여기서 αPD-L1γ1 항체의 발현이 이에 의해 조절되는 핵산을 포함할 수 있다.
본 개시내용은 조혈 줄기 세포의 생체내 유전자 편집 및 관련 유전자 요법 개선을 위해 CD46을 표적화하는 재조합 Ad35 벡터를 기재한다. 특정 구현예에서, Ad35 전달 벡터는 치료 용도와 연관된 구성요소로 대체되고 제거된 모든 바이러스 단백질 암호화 유전자가 있다. 바이러스 단백질을 암호화하는 모든 유전자의 제거는 30 kb의 벡터 운반 용량을 제공하며, 다른 바이러스 벡터 전달 플랫폼으로 이용가능한 것보다 상당히 더 많은 공간이다. 특정 구현예에서, Ad35 벡터는 헬퍼-의존적이고, 본 개시내용은 또한 새로-설계된 Ad35 헬퍼 벡터를 제공한다. 의심의 여지를 피하기 위해, 본원에 사용된 바와 같은 용어 "유전자 편집"은 핵산 서열을 변형시키기 위한 벡터 또는 제제의 임의의 사용을 포함하나 이에 제한되지 않는다.
본원에는 microRNA 제어 시스템 및 본원에 개시된 microRNA(또한 본원에서 miRNA로 지칭됨) 부위(또한 본원에서 표적 부위로 지칭됨)를 포함하는 다른 핵산을 포함하나 이에 제한되지 않는 본원에 제공된 핵산이거나 또는 이를 포함하고/하거나, 항체 예컨대 αPD-L1 항체(예를 들어, αPD-L1γ1 항체)를 포함하나 이에 제한되지 않는 본원에 개시된 제제를 암호화하는 벡터가 추가로 제공된다. 본 개시내용의 다양한 구현예 중 임의의 것에서, 벡터는 Ad5/35 벡터일 수 있으며, 임의적으로 여기서 Ad5/35 벡터는 헬퍼-의존적 Ad5/35(HDAd5/35)이다. 본 개시내용의 다양한 구현예 중 임의의 것에서, 벡터는 본원에 제공된 변이(예를 들어, 아미노산 돌연변이)를 포함하는 Ad5/35 벡터(예를 들어, HDAd5/35 벡터)일 수 있으며, 이들 중 특정 벡터는 Ad5/35++(예를 들어, HDAd5/35++)로 지정될 수 있다. 의심의 여지를 피하기 위해, 당업자는 Ad5/35 이외(예를 들어, Ad5/35++ 이외 또는 HDAd5/35++ 이외)의 벡터가 명시된 구현예를 포함하여, 임의의 벡터를 사용한 임의의 구현예가 관련 텍스트에 언급된 바와 같은 이러한 벡터 이외에, Ad5/35 벡터(예를 들어, HDAd5/35, Ad5/35++, 및 HDAd5/35++ 벡터 중 임의의 것 포함)인 벡터를 개시하는 것으로 구체적으로 판독해야 한다는 것을 본 개시내용으로부터 인식하도록 의도된다.
본 개시내용의 다양한 구현예 중 임의의 것에서, 벡터는 Ad35 벡터일 수 있으며, 임의적으로 여기서 Ad35 벡터는 HDAd35이다. 본 개시내용의 다양한 구현예 중 임의의 것에서, 벡터는 본원에 제공된 변이(예를 들어, 아미노산 돌연변이)를 포함하는 Ad35 벡터(예를 들어, HDAd35 벡터) 일 수 있으며, 이들 중 특정 벡터는 Ad35++(예를 들어, HDAd35++)로 지정될 수 있다. 의심의 여지를 피하기 위해, 당업자는 Ad35 벡터 이외(예를 들어, Ad35++ 이외 또는 HDAd35++ 이외)의 벡터가 명시된 구현예를 포함하여, 임의의 벡터를 사용한 임의의 구현예가 관련 텍스트에 언급된 바와 같은 이러한 벡터 이외에, Ad35 벡터(예를 들어, HDAd35, Ad35++, 및 HDAd35++ 벡터 중 임의의 것 포함)인 벡터를 개시하는 것으로 구체적으로 판독해야야 한다는 것을 본 개시내용으로부터 인식하도록 의도된다.
나타낸 바와 같이, 본원에 기재된 벡터는 겸상적혈구병의 치료, γ 글로빈 유전자 추가 및 재활성화, 및 γ 글로빈 재활성화를 위한 다중 표적 부위의 표적화를 포함하는 많은 용도를 갖는다. 또한, 인자 VIII(FVIII) 이외에, 개시된 접근법의 적용은 예를 들어 다음을 포함하는 다른 분비된 단백질에 사용될 수 있다: (i) 다른 응고 인자, 구체적으로 FXI, FVII, 폰빌레브란트(von Willebrand) 인자(VWF), 및 희귀 응혈 인자(즉, 인자 I, II, V, X, XI, 또는 XIII); (ii) 폼페병(산 알파(α)-글루코시다제), 고세병(글루코레세브로시다제), 파브리병(α-갈락토시다제 A), 및 I형 점액다당류증(α-L-이두로니다제)과 같은 리소좀 축적 질환에 대한 효소 대체 요법(ERT)에 현재 사용되는(교차-교정 메커니즘의 이점 취득) 효소; (iii) 면역결핍(예를 들어 SCID-ADA(아데노신 데아미나제)); (iv) 심혈관 질환, 예를 들어 가족성 아포지질단백질 E 결핍 및 아테롬성동맥경화증(ApoE); (v)  HIV, 만성 HCV, 또는 HBV 감염에 대한 바이러스 유인 수용체(예를 들어 HIV- 가용성 CD4, 또는 광범위한 중화 항체(bNAb))의 발현에 의한 바이러스 감염; (vi) 암(예를 들어 단클론 항체(예를 들어 트라스투주맙) 또는 체크포인트 억제제(예를 들어 aPDL1)의 제어된 발현 또는 치료 용량의 화학요법을 허용하기 위한 HSC의 보호 및 (vii) 판코니 빈혈에 대한 FANCA 유전자; (viii) A형 혈우병, B형 혈우병, 또는 폰빌레브란트병으로부터 임의적으로 선택된 응고 인자 결핍, (ix) 혈소판 장애, (x) 빈혈, (xi) 알파-1 항트립신 결핍, 또는 (xii) 면역 결핍. 다른 추가적인 용도는 본원의 다른 곳에 보다 상세하게 기재되어 있다.
따라서, 일 구현예는 조혈 줄기 세포의 생체내 유전자 편집을 위해 CD46을 표적화하는 재조합 혈청형 35 아데노바이러스(Ad35) 벡터를 제공한다.
또 다른 구현예는 치료 단백질을 발현하도록 유전적으로 변형된 적혈구이다. 예로서, 치료 단백질은 일부 경우에 바이러스 감염을 차단하거나 또는 감소시키는 응고 인자 또는 단백질을 포함한다. 임의적으로, 적혈구는 치료 단백질을 분비한다.
또한 본원에 기재된 재조합 Ad35 벡터 또는 적혈구의 용도가 제공된다. 이들 용도는 적혈구 bcl11a-인핸서 및 HBG 프로모터 영역을 동시에 표적화함으로써 HbF 재활성화 증가; γ-글로빈 유전자 추가 및 내인성 γ-글로빈 유전자 재활성화의 조합; 생체내 CRISPR 게놈 조작; 치료 유전자 제공; (i) 혈색소병증, (ii) 판코니 빈혈, (iii) A형 혈우병, B형 혈우병, 또는 폰빌레브란트병으로부터 임의적으로 선택된 응고 인자 결핍, (iv) 혈소판 장애, (v) 빈혈, (vi) 알파-1 항트립신 결핍, 또는 (v) 면역 결핍 치료; 지중해빈혈 치료; 암 치료, 암 재발 예방 또는 지연 또는 고위험 생식 계열 돌연변이의 보균자에서 암 발병 예방 또는 지연, 임의적으로 여기서 암은 유방암 또는 난소암인 것; CRISPR/Cas9의 자기-불활성화; 공여자 벡터로서 자기-방출 카세트가 있는 HDAd를 사용한 표적화된 통합을 위한 것을 포함한다. 이들 용도 중 임의의 것은 임의적으로 동원을 포함할 수 있으며, 예를 들면 여기서 동원은 Gro-베타, GM-CSF, S-CSF, 및/또는 AMD3100의 투여를 포함한다.
또한 또 다른 용도 구현예는 스테로이드(예를 들어, 글루코코르티코이드 또는 덱사메타손), IL-6 수용체 길항제, 및/또는 IL-1R 수용체 길항제를 Ad35 벡터 및/또는 적혈구를 받는 대상체에게 투여하는 것을 포함하는 본원에 기재된 재조합 Ad35 벡터 또는 적혈구 중 임의의 것의 용도이다.
또한 O6BG 및 TMZ(테모졸로미드) 또는 BCNU(카르무스틴)를 Ad35 벡터 및/또는 적혈구를 받는 대상체에게 투여하는 것을 포함하는, 본원에 기재된 재조합 Ad35 벡터 또는 적혈구 중 임의의 것을 이용하는 용도 구현예가 제공된다. 이러한 용도 구현예의 예에 의해, 대상체는 역형성 성상세포종, 유방암, 결장직장암, 미만성 내재성 뇌간 신경교종, 유잉 육종, 다형성 교모세포종(GBM), 악성 뇌교종, 흑색종, 전이성 악성 흑색종, 비인두암, 또는 소아암에 대한 치료로서 O6BG 및 TMZ 또는 BCNU를 받고 있다.
또한 또 다른 구현예는 다음을 포함하는 재조합 아데노바이러스 혈청형 35(Ad35) 벡터 생산 시스템이다: Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 서열의 적어도 일부를 플랭킹하는 재조합효소 DR을 포함하는 재조합 Ad35 헬퍼 게놈, 및 5' Ad35 ITR; 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열을 포함하는 재조합 헬퍼 의존적 Ad35 공여자 게놈.
또한 Ad35 섬유 샤프트; Ad35 섬유 놉; 및 Ad35 패키징 서열의 적어도 일부를 플랭킹하는 재조합효소 DR을 포함하는 Ad35 게놈을 포함하는 재조합 아데노바이러스 혈청형 35(Ad35) 헬퍼 벡터 구현예가 제공된다.
또한 Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 서열의 적어도 일부를 플랭킹하는 재조합효소 DR을 포함하는 재조합 Ad35 헬퍼 게놈 구현예가 제공된다.
또한 5' Ad35 ITR; 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열로, 여기서 게놈은 Ad35 바이러스 구조적 단백질을 암호화하는 핵산 서열을 포함하지 않는 것을 포함하는, 핵산 서열; 및 Ad35 섬유 샤프트 및/또는 Ad35 섬유 놉을 포함하는 재조합 헬퍼 의존적 Ad35 공여자 벡터 구현예가 제공된다.
또한 5' Ad35 ITR; 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열을 포함하는 재조합 헬퍼 의존적 Ad35 공여자 게놈 구현예가 제공되며, 여기서 Ad35 공여자 게놈은 야생형 Ad35 게놈에 의해 암호화된 발현 산물을 암호화하는 핵산 서열을 포함하지 않는다.
또 다른 구현예는 재조합 헬퍼 의존적 Ad35 공여자 벡터를 생산하는 방법으로, 상기 방법은 세포의 배양물로부터 재조합 헬퍼 의존적 Ad35 공여자 벡터를 단리하는 단계를 포함하며, 여기서 세포는 Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 서열의 적어도 일부를 플랭킹하는 재조합효소 DR을 포함하는 재조합 Ad35 헬퍼 게놈, 및 5' Ad35 ITR; 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열을 포함하는 재조합 헬퍼 의존적 Ad35 공여자 게놈을 포함한다.
또한 Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 ITR은 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 이내의 재조합효소 DR을 포함하는 재조합 Ad35 헬퍼 게놈, 및 5' Ad35 ITR; 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열을 포함하는 재조합 Ad35 공여자 게놈을 포함하는 재조합 Ad35 생산 시스템 구현예가 제공된다.
또 다른 구현예는 Ad35 섬유 샤프트; Ad35 섬유 놉; 및 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 ITR은 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 이내의 재조합효소 DR을 포함하나 Ad35 게놈을 포함하는 재조합 Ad35 헬퍼 벡터이다.
또 다른 구현예는 Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 ITR은 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 이내의 DR을 포함하는 재조합 Ad35 헬퍼 게놈이다.
또 다른 구현예는 재조합 헬퍼 의존적 Ad35 공여자 벡터를 생산하는 방법으로, 상기 방법은 세포의 배앙물로부터 재조합 헬퍼 의존적 Ad35 공여자 벡터를 단리하는 단계를 포함하며, 여기서 세포는 Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 ITR은 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 이내의 재조합효소 DR을 포함하는 재조합 Ad35 헬퍼 게놈, 및 5' Ad35 ITR; 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열을 포함하는 재조합 Ad35 공여자 게놈을 포함한다.
또한 또 다른 구현예는 본원에 기재된 바와 같은 헬퍼 벡터, 헬퍼 게놈, 공여자 벡터, 또는 공여자 게놈을 포함하는 세포이며, 임의적으로 여기서 세포는 HEK293 세포이다.
또 다른 구현예는 본원에 기재된 구현예 중 임의의 하나의 공여자 게놈을 포함하는 세포이며, 임의적으로 여기서 세포는 적혈구이고, 임의적으로 여기서 세포는 조혈 줄기 세포, T-세포, B-세포, 또는 골수성 세포이고, 임의적으로 여기서 세포는 발현 산물을 분비한다.
또한 세포를 변형시키는 방법이 제공되며, 상기 방법은 제공된 Ad35 공여자 벡터 구현예 중 임의의 하나에 따른 Ad35 공여자 벡터를 세포와 접촉시키는 단계를 포함한다.
또한 대상체의 세포를 변형시키는 방법이 제공되며, 상기 방법은 Ad35 공여자 벡터 구현예 중 임의의 하나에 따른 Ad35 공여자 벡터를 대상체에게 투여하는 단계를 포함하며, 임의적으로 여기서 상기 방법은 대상체로부터 세포의 단리를 포함하지 않는다.
또한 또 다른 구현예는 질환 또는 병태의 치료를 필요로 하는 대상체에서 질환 또는 병태를 치료하는 방법이며, 상기 방법은 본원에 제공된 Ad35 공여자 벡터 구현예 중 임의의 하나에 따른 Ad35 공여자 벡터를 대상체에게 투여하는 단계를 포함하며, 임의적으로 여기서 투여는 정맥내이다.
정의
단수형 : 본원에 사용된 바와 같이, 단수형은 관사의 문법적 대상의 하나 또는 하나 초과(즉, 적어도 하나)를 지칭한다. 예로서, "요소"는 정확히 하나의 요소의 구현예 및 하나 초과의 요소를 포함하는 구현예를 개시한다.
: 본원에 사용된 바와 같이, 용어 "약"은, 값과 관련하여 사용될 때, 참조된 값의 맥락에서 유사한 값을 지칭한다. 일반적으로, 문맥과 친숙한 당업자는 해당 문맥에서 "약"에 의해 포함된 적절한 변동 정도를 이해할 것이다. 예를 들어, 일부 구현예에서, 용어 "약"은 참조된 값의 25%, 20%, 19%, 18%, 17%, 16%, 15%, 14%, 13%, 12%, 11%, 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1% 이하 이내에서 값의 범위를 포함할 수 있다.
투여 : 본원에 사용된 바와 같이, 용어 "투여"는 전형적으로 조성물이거나, 또는 조성물에 포함된 제제의 전달을 달성하기 위해 대상체 또는 시스템에 조성물을 투여하는 것을 지칭한다.
입양 세포 요법 : 본원에 사용된 바와 같이, "입양 세포 요법" 또는 "ACT"는 치료 활성이 있는 세포를 대상체, 예를 들어, 병태, 장애, 또는 질환에 대한 치료를 필요로 하는 대상체 내로 전달하는 것을 수반한다. 일부 구현예에서, ACT는 세포의 생체외 및/또는 시험관내 조작 및/또는 확장 후에 세포를 대상체 내로 전달하는 것을 포함한다.
친화도 : 본원에 사용된 바와 같이, "친화도"는 특정 결합제(예를 들어, 바이러스 벡터), 및/또는 이의 결합 모이어티와, 결합 표적(예를 들어, 세포) 사이의 비공유 상호작용의 총 합계의 강도를 지칭한다. 달리 나타내지 않는 한, 본원에 사용된 바와 같이, "결합 친화도"는 결합제 및 이의 결합 표적(예를 들어, 바이러스 벡터와 바이러스 벡터의 표적 세포) 사이의 1:1 상호작용을 지칭한다. 당업자는 친화도의 변화가 참조와의 비교에 의해 기재될 수 있거나(예를 들어, 참조에 대한 증가 또는 감소), 또는 수치상으로 기재될 수 있음을 이해한다. 친화도는 평형 해리 상수(KD) 및/또는 평형 결합 상수(KA)를 포함하나 이에 제한되지 않는 당업계에 알려진 다양한 방식으로 측정 및/또는 표현될 수 있다. KD는 koff/kon의 몫인 반면, KA는 kon/koff의 몫이며, 여기서 kon은 예를 들어, 바이러스 벡터와 표적 세포의 결합 속도 상수를 지칭하고, koff는 예를 들어, 표적 세포로부터 바이러스 벡터의 해리를 지칭한다. kon 및 koff는 당업자에게 알려진 기술에 의해 결정될 수 있다.
제제 : 본원에 사용된 바와 같이, 용어 "제제"는 원자, 분자, 화합물, 아미노산, 폴리펩티드, 뉴클레오티드, 핵산, 단백질, 단백질 복합체, 액체, 용액, 당류, 다당류, 지질, 또는 이의 조합 또는 복합체 중 하나 이상의 임의의 것을 포함하나 이에 제한되지 않는 임의의 화학적 독립체를 치징할 수 있다.
동종이계 : 본원에 사용된 바와 같이, 용어 "동종이계"는 하나의 대상체로부터 유래된 다음 또 다른 대상체에게 도입된 임의의 물질, 예를 들어, 동종이계 T 세포 이식을 지칭한다.
사이에 또는 부터 : 본원에 사용된 바와 같이, 용어 "사이에"는 경계를 포함하여, 표시된 상부 및 하부, 또는 제1 및 제2 경계 사이에 속하는 내용물을 지칭한다. 유사하게, 용어 "부터"는, 값의 범위의 맥락에서 사용될 때, 범위가 경계를 포함하여, 표시된 상부 및 하부, 또는 제1 및 제2 경계 사이에 속하는 내용물을 포함함을 나타낸다.
결합 : 본원에 사용된 바와 같이, 용어 "결합"은 2 개 이상의 제제 사이 또는 중에서 비공유 회합을 지칭한다. "직접" 결합은 제제 사이의 물리적 접촉을 수반하고; 간접 결합은 하나 이상의 증간 제제와의 물리적 접촉 방식의 물리적 상호작용을 수반한다. 2 개 이상의 제제 사이의 결합은 상호작용하는 제제가 단리에서 또는 더 복잡한 시스템의 맥락에서(예를 들어, 담체 제제와 및/또는 생물학적 시스템 또는 세포에서 공유적으로 또는 달리 회합되는 동안) 연구되는 경우를 포함하여, 다양한 맥락 중 임의의 것에서 발생하고/하거나 평가할 수 있다.
암: 본원에 사용된 바와 같이, 용어 "암"은 세포가 상대적으로 비정상적, 비제어적, 및/또는 자율적 성장을 나타내어, 암 증식에 대한 제어의 상당한 손실을 특징으로 하는 비정상적으로 상승된 증식률 및/또는 비정상적인 성장 표현형을 나타내도록 하는, 병태, 장애, 또는 질환을 지칭한다. 일부 구현예에서, 암은 하나 이상의 종양을 포함할 수 있다. 일부 구현예에서, 암은 전암성(예를 들어, 양성), 악성, 전-전이성, 전이성, 및/또는 비-전이성인 세포이거나 또는 이를 포함할 수 있다. 일부 구현예에서, 암은 고형 종양이거나 또는 이를 포함할 수 있다. 일부 구현예에서, 암은 혈액 종양이거나 또는 이를 포함할 수 있다.
키메라 항원 수용체 : 본원에 사용된 바와 같이, "키메라 항원 수용체" 또는 "CAR"은 (i) 표적 항원에 결합하는 모이어티를 포함하는 세포외 도메인; (ii) 막관통 도메인; 및 (iii) CAR이 세포외 결합 모이어티와 표적 항원의 결합에 의해 자극될 때 활성화 신호를 보내는 세포내 신호전달 도메인을 포함하는 조작된 단백질을 지칭한다. 키메라 항원 수용체를 발현하도록 유전적으로 조작된 T 세포는 CAR T 세포로 지칭될 수 있다. 따라서, 예를 들어, 특정 CAR이 T 세포에 의해 발현될 때, CAR 세포외 결합 모이어티와 표적 항원의 결합은 T 세포를 활성화할 수 있다. CAR은 또한 키메라 T 세포 수용체 또는 키메라 면역수용체로 알려져 있다.
조합 요법 : 본원에 사용된 바와 같이, 용어 "조합 요법"은 2 개 이상의 제제 또는 레지멘이 함께 대상체의 병태, 장애, 또는 질환을 치료하도록 2 개 이상의 제제 또는 레지멘을 대상체에게 투여하는 것을 지칭한다. 일부 구현예에서, 2 개 이상의 치료제 또는 레지멘은 동시에, 순차적으로, 또는 중복 투약 레지멘으로 투여될 수 있다. 당업자 조합 요법이 2 개의 제제 또는 레지멘이 단일 조성물로 함께 투여되거나, 또는 동시에 투여되는 것을 포함하지만 요구하지 않음을 이해할 것이다.
발현 또는 활성 제어 : 본원에 사용된 바와 같이, 제1 요소(예를 들어, 단백질, 예컨대 전사 인자, 또는 핵산 서열, 예컨대 프로모터)는 제2 요소의 발현 또는 활성이 적어도 하나의 조건 세트 하에 제1 요소의 상태(예를 들어, 존재, 부재, 형태, 화학적 변형, 상호작용, 또는 다른 활성)에 따라 전체적으로 또는 부분적으로 의존하는 경우 제2 요소(예를 들어, 단백질과 같은 제제를 암호화하는 핵산 또는 단백질)의 발현 또는 활성을 "제어"하거나 또는 "구동"한다. 발현 또는 활성의 제어는 예를 들어, 제1 요소의 상태 변화가, 적어도 하나의 조건 세트 하에, 참조 대조군과 비교하여 제2 요소의 발현 또는 활성의 적어도 10%(예를 들어, 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 2-배, 3-배, 4-배, 5-배, 10-배, 20-배, 30-배, 40-배, 50-배, 100-배)의 변화를 초래한다는 점에서, 실질적인 제어 또는 활성일 수 있다.
에 상응하는 : 본원에 사용된 바와 같이, 용어 "에 상응하는"은 적절한 참조 화합물 또는 조성물과의 비교를 통해 화합물 또는 조성물에서 구조적 요소의 위치/동일성을 지정하기 위해 사용될 수 있다. 예를 들어, 일부 구현예에서, 중합체의 단량체성 잔기(예를 들어, 폴리펩티드의 아미노산 잔기 또는 폴리뉴클레오티드의 핵산 잔기)는 적절한 참조 중합체의 잔기"에 상응하는" 것으로 식별될 수 있다. 예를 들어, 당업자는 제공된 폴리펩티드 또는 폴리뉴클레오티드 서열의 잔기가 종종 관련된 참조 서열의 체계에 따라 지정(예를 들어, 넘버링 또는 라벨링)됨을 이해한다(예를 들어, 이러한 지정이 제공된 서열의 문자 넘버링을 반영하지 않는 경우에도). 예시로서, 참조 서열이 위치 100-110에서 특정 아미노산 모티프를 포함하고, 두번째 관련 서열이 위치 110-120에서 동일한 모티프를 포함하는 경우, 두번째 관련 서열의 모티프 위치는 참조 서열의 위치 100-110"에 상응한다"고 할 수 있다. 당업자는 상응하는 위치가 예를 들어, 서열의 정렬에 의해 용이하게 식별될 수 있고, 이러한 정렬이 예를 들어, BLAST, CS-BLAST, CUDASW++, DIAMOND, FASTA, GGSEARCH/GLSEARCH, Genoogle, HMMER, HHpred/HHsearch, IDF, Infernal, KLAST, USEARCH, parasail, PSI-BLAST, PSI-Search, ScalaBLAST, Sequilab, SAM, SSEARCH, SWAPHI, SWAPHI-LS, SWIMM, 또는 SWIPE와 같은 소프트웨어 프로그램을 포함하나 이에 제한되지 않는, 알려진 다양한 툴, 전략, 및/또는 알고리즘 중 임의의 것에 의해 통상적으로 달성됨을 이해한다.
투약 레지멘: 본원에 사용된 바와 같이, 용어 "투약 레지멘"은 대상체에게 투여되는 하나 이상의 동일하거나 또는 상이한 단위 용량의 세트를 지칭할 수 있으며, 전형적으로 일정 기간 동안 다른 대상체의 투여로부터 분리되는 것 중 각각의 복수의 단위 용량 투여를 포함한다. 다양한 구현예에서, 투약 레지멘의 하나 이상 또는 모든 단위 용량은 동일할 수 있거나 또는 달라질 수 있다(예를 들어, 시간 경과에 따라 증가하거나, 시간 경과에 따라 감소하거나, 또는 대상체 및/또는 의사의 결정에 따라 조정될 수 있음). 다양한 구현예에서, 각각의 용량 사이의 시간 기간 중 하나 이상 또는 모두는 동일할 수 있거나 또는 달라질 수 있다(예를 들어, 시간 경과에 따라 증가하거나, 시간 경과에 따라 감소하거나, 또는 대상체 및/또는 의사의 결정에 따라 조정될 수 있음). 일부 구현예에서, 주어진 치료제는 하나 이상의 용량을 수반할 수 있는 권고된 투약 레지멘을 갖는다. 전형적으로, 시판되는 약물의 적어도 하나의 권고된 투약 레지멘은 당업자에게 알려져 있다. 일부 구현예에서, 투약 레지멘은 관련 집단에 걸쳐 투여될 때 원하거나 또는 유리한 결과와 상관관계가 있다(즉, 치료 투약 레지멘임).
하류 상류: 본원에 사용된 바와 같이, 용어 "하류"는 제1 DNA 영역이, 제2 DNA 영역에 비해, 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 C-말단에 더 가깝다는 것을 의미한다. 본원에 사용된 바와 같이, 용어 "상류"는 제1 DNA 영역이, 제2 DNA 영역에 비해, 제1 DNA 영역 및 제2 DNA 영역을 포함하는 핵산의 N-말단에 더 가깝다는 것을 의미한다.
유효량: "유효량"은 대상체에서 원하는 생리학적 변화를 초래하는 데 필요한 제형의 양이다. 유효량은 종종 연구 목적을 위해 투여된다.
조작된 : 본원에 사용된 바와 같이, 용어 "조작된"은 인간의 손으로 조작된 측면을 지칭한다. 예를 들어, 폴리뉴클레오티드는 자연에서 그 순서로 함께 연결되지 않은 2 개 이상의 서열이 조작된 폴리뉴클레오티드에서 서로 직접적으로 연결되도록 사람의 손으로 조작될 때 "조작된" 것으로 간주된다. 당업자는 "조작된" 핵산 또는 아미노산 서열이 재조합 핵산 또는 아미노산 서열일 수 있고, "유전적으로 조작된" 것으로 지칭될 수 있음을 이해할 것이다. 일부 구현예에서, 조작된 폴리뉴클레오티드는 첫번째 서열과 작동가능하게 연결된 것으로 자연에서 발견되지만 두번째 서열과 작동가능하게 연결된 것으로 자연에서 발견되지 않는 코딩 서열 및/또는 조절 서열을 포함하며, 이는 인간의 손으로 두번째 서열에 작동가능하게 연결된 조작된 폴리펩티드에 있다. 일부 구현예에서, 세포 또는 유기체는 유전적 정보가 변경되도록 조작된 경우(예를 들어, 이전에 존재하지 않는 새로운 유전적 물질이 예를 들어 형질전환, 교배, 체세포 혼성화, 형질감염, 형질도입, 또는 다른 메커니즘에 의해 도입되었거나, 또는 이전에 존재하는 유전적 물질이 예를 들어 치환, 결실, 또는 교배에 의해 변경 또는 제거됨) "조작된" 또는 "유전적으로 조작된" 것으로 간주된다. 통상적인 관행이고 당업자에 의해 이해되는 바와 같이, 조작된 폴리뉴클레오티드 또는 세포의 완전하거나 또는 불완전한 자손 또는 카피는 직접 조작이 이전 독립체의 것이었을지라도 전형적으로 여전히 "조작된" 것으로 지칭된다.
부형제: 본원에 사용된 바와 같이, "부형제"는 예를 들어 원하는 일관성 또는 안정화 효과를 제공하거나 또는 이에 기여하기 위해 약제학적 조성물에 포함될 수 있는 비-치료제를 지칭한다. 일부 구현예에서, 적합한 약제학적 부형제는 예를 들어, 전분, 글루코스, 락토스, 수크로스, 젤라틴, 맥아, 벼, 밀가루, 백악, 실리카 겔, 나트륨 스테아레이트, 글리세롤 모노스테아레이트, 활석, 염화나트륨, 탈지분유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올 등을 포함할 수 있다.
발현 : 본원에 사용된 바와 같이, "발현"은 단백질과 같은 암호화된 제제의 핵산 서열로부터 생산을 초래하는 하나 이상의 생물학적 과정을 개별적으로 및/또는 점증적으로 지칭한다. 발현은 구체적으로 전사 및 번역 중 하나 또는 둘 다를 포함한다.
플랭크 : 본원에 사용된 바와 같이, 제2 요소 및 제3 요소와 인접한 서열에 존재하는 제1 요소(예를 들어, 핵산 서열 또는 아미노산 서열)는 제2 요소 및 제3 요소 사이의 인접한 서열에 위치하는 경우 제2 요소 및 제3 요소에 의해 "플랭킹된다". 따라서, 이러한 배열에서, 제2 요소 및 제3 요소는 제1 요소를 "플랭킹"하는 것으로 지칭될 수 있다. 플랭킹 요소는 플랭킹된 요소에 바로 인접하거나 또는 하나 이상의 관련 단위에 의해 플랭킹된 요소로부터 분리될 수 있다. 인접한 서열이 핵산 또는 아미노산 서열이고, 관련 단위가 각각 염기 또는 아미노산 잔기인 다양한 예에서, 플랭킹된 요소, 및 독립적으로, 제1 및/또는 제2 플랭킹 요소 사이에 있는 인접한 서열의 단위 수는 예를 들어, 50 개 이하 단위, 예를 들어, 50, 45, 40, 35, 30, 25, 20, 15, 10, 5, 4, 3, 2, 1, 또는 0 개 단위 이하일 수 있다.
단편: 본원에 사용된 바와 같이, "단편"은 참조 제제(때때로 "모체" 제제로 지칭됨)의 별개의 부분을 포함하고/하거나 이로 이루어진 구조를 지칭한다. 일부 구현예에서, 단편은 참조 제제에서 발견된 하나 이상의 모이어티가 결여되어 있다. 일부 구현예에서, 단편은 참조 제제에서 발견된 하나 이상의 모이어티를 포함하거나 또는 이로 이루어진다. 일부 구현예에서, 참조 제제는 폴리뉴클레오티드 또는 폴리펩티드와 같은 중합체이다. 일부 구현예에서, 중합체의 단편은 참조 중합체의 적어도 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50, 55, 60, 65, 70, 75, 80, 85, 90, 95, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 210, 220, 230, 240, 250, 275, 300, 325, 350, 375, 400, 425, 450, 475, 500 개 이상의 단량체성 단위(예를 들어, 잔기)를 포함하거나 또는 이로 이루어진다. 일부 구현예에서, 중합체의 단편은 참조 중합체에서 발견된 단량체성 단위(예를 들어, 잔기)의 적어도 5%, 10%, 15%, 20%, 25%, 30%, 25%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 이상을 포함하거나 또는 이로 이루어진다. 참조 중합체의 단편은 참조 중합체의 상응하는 부분과 반드시 동일하지는 않다. 예를 들어, 참조 중합체의 단편은 참조 중합체에 대해 적어도 5%, 10%, 15%, 20%, 25%, 30%, 25%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 이상의 동일성을 갖는 잔기의 서열을 갖는 중합체일 수 있다. 단편은 참조 제제의 물리적 단편화에 의해 생성될 수 있거나, 또는 생성될 수 없다. 일부 경우에, 단편은 참조 제제의 물리적 단편화에 의해 생성된다. 일부 경우에, 단편은 참조 제제의 물리적 단편화에 의해 생성되지 않고 대신에 예를 들어, 새로운 합성 또는 다른 수단에 의해 생성될 수 있다.
유전자, 이식유전자 : 본원에 사용된 바와 같이, 용어 "유전자"는 임의적으로 코딩 서열의 발현을 제어하는 조절 서열의 일부 또는 전부와 함께, 코딩 서열(즉, RNA 생성물 및/또는 폴리펩티드 생성물과 같은 발현 산물을 암호화하는 DNA 서열)이거나 또는 이를 포함하는 DNA 서열을 지칭한다. 일부 구현예에서, 유전자는 인트론과 같으나 이에 제한되지 않는 비-코딩 서열을 포함한다. 일부 구현예에서, 유전자는 코딩(예를 들어, 엑손) 및 비-코딩(예를 들어, 인트론) 서열을 둘 다 포함할 수 있다. 일부 구현예에서, 유전자는 프로모터인 조절 서열을 포함한다. 일부 구현예에서, 유전자는 (i) 소스 게놈과 같이, 참조 맥락에서 코딩 서열의 상류에 미리결정된 수의 뉴클레오티드를 확장하는 DNA 뉴클레오티드, 및 (ii) 소스 게놈과 같이, 참조 맥락에서 코딩 서열의 하류에 미리결정된 수의 뉴클레오티드를 확장하는 DNA 뉴클레오티드 중 하나 또는 둘 다를 포함한다. 다양한 구현예에서, 미리결정된 수의 뉴클레오티드는 500 bp, 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 10 kb, 20 kb, 30 kb, 40 kb, 50 kb, 75 kb, 또는 100 kb일 수 있다. 본원에 사용된 바와 같이, "이식유전자"는 유전자가 존재하거나 또는 유전자가 조작에 의해 배치될 수 있는 참조 맥락에 대해 내인성 또는 고유하지 않은 유전자를 지칭한다.
유전자 산물 또는 발현 산물 : 본원에 사용된 바와 같이, 용어 "유전자 산물" 또는 "발현 산물"은 일반적으로 유전자로부터 전사된 RNA(처리전 및/또는 처리후) 또는 유전자로부터 전사된 RNA에 의해 암호화된 폴리펩티드(변형전 및/또는 변형후)를 지칭한다.
숙주 세포, 표적 세포 : 본원에 사용된 바와 같이, "숙주 세포"는 이식유전자와 같은 외인성 DNA(재조합 또는 달리)가 도입된 세포를 지칭한다. 당업자는 "숙주 세포"가 외인성 DNA가 초기에 도입된 세포 및/또는 이의 완전하거나 또는 불완전한 자손 또는 카피일 수 있음을 이해한다. 일부 구현예에서, 숙주 세포는 하나 이상의 바이러스 유전자 또는 이식유전자를 포함한다. 일부 구현예에서, 의도되거나 또는 잠재적인 숙주 세포는 표적 세포로 지칭될 수 있다.
다양한 구현예에서, 숙주 세포 또는 표적 세포는 다양한 표면 마커의 존재, 부재, 또는 발현 수준에 의해 식별된다.
세포 또는 세포 집단이 특정 마커에 대해 "양성"이거나 또는 이를 발현한다는 진술은 특정 마커의 세포 상에서 또는 내에서 검출가능한 존재를 지칭한다. 표면 마커를 지칭할 때, 용어는 유세포 분석에 의해, 예를 들어, 마커에 특이적으로 결합하는 항체로 염색하고 상기 항체를 검출함으로써 검출되는 바와 같은 표면 발현의 존재를 지칭할 수 있으며, 여기서 염색은 달리 동일한 조건 하에 이소형-일치 대조군으로 동일한 절차를 수행하여 검출된 염색보다 실질적으로 높은 수준 및/또는 마커에 대해 양성인 것으로 알려진 세포에 대한 수준과 실질적으로 유사한 수준, 및/또는 마커에 대해 음성인 것으로 알려진 세포에 대한 수준보다 실질적으로 더 높은 수준에서 유세포 분석에 의해 검출가능하다.
세포 또는 세포 집단이 특정 마커에 대해 "음성"이거나 또는 마커의 발현이 결여되어 있다는 진술은 특정 마커의 세포 상에서 또는 내에서 실질적으로 검출가능한 존재의 부재를 지칭한다. 표면 마커를 지칭할 때, 용어는 유세포 분석에 의해, 예를 들어, 마커에 특이적으로 결합하는 항체로 염색하고 상기 항체를 검출함으로써 검출되는 바와 같은 표면 발현의 부재를 지칭할 수 있으며, 여기서 염색은 달리 동일한 조건 하에 이소형-일치된 조건과 동일한 절차를 수행하여 검출된 염색보다 실질적으로 높은 수준, 및/또는 마커에 대해 양성인 것으로 알려진 세포에 대한 수준보다 실질적으로 낮은 수준, 및/또는 마커에 대해 음성인 것으로 알려진 세포에 대한 수준과 비교하여 실질적으로 유사한 수준에서 유세포 분석에 의해 검출되지 않는다.
동일성 : 본원에 사용된 바와 같이, 용어 "동일성"은 중합체성 분자 사이, 예를 들어, 핵산 분자(예를 들어, DNA 분자 및/또는 RNA 분자) 사이 및/또는 폴리펩티드 분자 사이의 전반적인 관련성을 지칭한다. 2 개의 제공된 서열 사이의 퍼센트 동일성을 계산하는 방법은 당업계에 알려져 있다. 용어 "% 서열 동일성"은 서열을 비교함으로써 결정된 바와 같이, 2 개 이상의 서열 사이의 관계를 지칭한다. 당업계에서, "동일성"은 또한 이러한 서열의 스트링 사이의 일치에 의해 결정된 바와 같이 단백질 및 핵산 서열 사이의 서열 관련성 정도를 의미한다. "동일성"(종종 "유사성"으로 지칭됨)은 다음에 기재된 것들을 포함하여 알려진 방법에 의해 용이하게 계산될 수 있다: Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, NY (1988); Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, NY (1994); Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, NJ (1994); Sequence Analysis in Molecular Biology (Von Heijne, G., ed.) Academic Press (1987); 및 Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Oxford University Press, NY (1992). 동일성을 결정하기 위한 바람직한 방법은 테스트된 서열 사이의 최고 일치를 제공하도록 설계된다. 동일성 및 유사성을 결정하는 방법은 공개적으로 이용가능한 컴퓨터 프로그램에 성문화되어 있다. 예를 들면, 2 개의 핵산 또는 폴리펩티드 서열에 대한 퍼센트 동일성의 계산은, 예를 들어, 최적의 비교 목적을 위해 2 개의 서열(또는 하나 또는 두 서열의 보체)을 정렬함으로써 수행될 수 있다(예를 들어, 최적의 정렬을 위해 제1 및 제2 서열 중 하나 또는 둘 다에 갭이 도입될 수 있고 비교 목적을 위해 동일하지 않은 서열은 무시될 수 있다). 그런 다음 상응하는 위치에서 뉴클레오티드 또는 아미노산이 비교된다. 제1 서열에서 위치가 제2 서열에서 상응하는 위치와 동일한 잔기(예를 들어, 뉴클레오티드 또는 아미노산)에 의해 점유되면, 분자는 해당 위치에서 동일하다. 2 개의 서열 사이의 퍼센트 동일성은 서열에 의해 공유된 동일한 위치의 수의 함수이며, 임의적으로 갭의 수, 및 2 개의 서열의 최적의 정렬을 위해 도입될 필요가 있을 수 있는 각 갭의 길이를 설명한다. 2 개의 서열 사이의 서열 비교 및 퍼센트 동일성 결정은 컴퓨터 알고리즘, 예컨대 BLAST(기본 로컬 정렬 검색 도구)를 사용하여 달성될 수 있다. 서열 정렬 및 퍼센트 동일성 계산은 LASERGENE 생물정보학 컴퓨터 묶음의 Megalign 프로그램(DNASTAR, Inc., 위스콘신주 매디슨 소재)을 사용하여 수행될 수 있다. 서열의 다중 정렬은 또한 디폴트 매개변수(갭 패널티=10, 갭 길이 패널티=10)에 따른 Clustal 정렬 방법(Higgins and Sharp CABIOS, 5, 151-153 (1989)을 사용하여 수행될 수 있다. 관련 프로그램은 또한 GCG 프로그램 묶음(Wisconsin Package Version 9.0, Genetics Computer Group (GCG), 위스콘신주 매디슨 소재); BLASTP, BLASTN, BLASTX(Altschul 등, J. Mol. Biol. 215:403-410 (1990); DNASTAR(DNASTAR, Inc., 위스콘신주 매디슨 소재); 및 Smith-Waterman 알고리즘을 포함하는 FASTA 프로그램(Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(S): Suhai, Sandor. Publisher: Plenum, New York, N.Y를 포함한다. 본 개시내용의 맥락 내에서 서열 분석 소프트웨어가 분석을 위해 사용되는 경우, 분석 결과는 참조된 프로그램의 "디폴트 값"에 기반한 것으로 이해될 것이다. "디폴트 값"은 처음 초기화될 때 소프트웨어와 함께 원래 로드되는 임의의 값 또는 매개변수 세트를 의미할 것이다.
" 개선하다 ," " 증가하다 ," " 억제하다 ," 또는 " 감소하다 ": 본원에 사용된 바와 같이, 용어 "개선하다", "증가하다", "억제하다", 및 "감소하다", 및 이의 문법적 등가물은 참조와의 정성적 또는 정량적 차이를 나타낸다.
단리된: 본원에 사용된 바와 같이, "단리된"은 (1) 처음에 생산될 때(자연에서든 및/또는 실험적 설정에서든) 회합된 구성요소의 적어도 일부로부터 분리되고/되거나, (2) 인간의 손에 의해 설계, 생산, 제조, 및/또는 제작된 물질 및/또는 독립체를 지칭한다. 단리된 물질 및/또는 독립체는 처음에 회합된 다른 구성요소의 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99% 초과로부터 분리될 수 있다. 일부 구현예에서, 단리된 제제는 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 99% 초과로 순수하다. 본원에 사용된 바와 같이, 물질은 다른 구성요소가 실질적으로 없는 경우 "순수"하다. 일부 구현예에서, 당업자에 의해 이해되는 바와 같이, 물질은 예를 들어, 하나 이상의 담체 또는 부형제(예를 들어, 완충액, 용매, 물 등)와 같은 특정 다른 구성요소와 조합된 후에도 여전히 "단리된" 또는 심지어 "순수한" 것으로 간주될 수 있으며; 이러한 구현예에서, 물질의 단리 또는 순도 퍼센트는 이러한 담체 또는 부형제를 포함하지 않고 계산된다. 예를 하나 들자면, 일부 구현예에서, 자연에서 발생하는 폴리펩티드 또는 폴리뉴클레오티드와 같은 생물학적 중합체는 a) 기원 또는 유래원에 의해 자연에서 천연 상태로 수반하는 구성요소의 일부 또는 전부와 연관되지 않고; b) 자연에서 생산하는 종과 동일한 종의 다른 폴리펩티드 또는 핵산이 실질적으로 없고; c) 자연에서 생산하는 종의 것이 아닌 세포 또는 다른 발현 시스템으로부터의 구성요소에 의해 발현되거나 또는 달리 연관될 때 "단리된" 것으로 간주된다. 따라서, 예를 들면, 일부 구현예에서, 화학적으로 합성되거나 또는 자연에서 생산하는 것과 상이한 세포 시스템에서 합성된 폴리펩티드는 "단리된" 폴리펩티드인 것으로 간주된다. 대안적으로 또는 추가적으로, 일부 구현예에서, 하나 이상의 정제 기술에 적용된 폴리펩티드는 a) 자연에서 연관되고/되거나; b) 처음에 생산될 때 연관된 것이 있는 다른 구성요소로부터 분리된 정도로 "단리된" 폴리펩티드인 것으로 간주될 수 있다.
작동가능하게 연결된 : 본원에 사용된 바와 같이, "작동가능하게 연결된" 또는 "작동적으로 연결된"은 구성요소 요소가 의도된 방식으로 기능하도록 허용하는 관계에 있도록 적어도 제1 요소 및 제2 요소의 회합을 지칭한다. 예를 들어, 핵산 조절 서열은 조절 서열 및 코딩 서열이 조절 서열에 의해 코딩 서열에 대한 발현의 제어를 허용하는 방식으로 회합되는 경우 핵산 코딩 서열에 "작동가능하게 연결된"다. 일부 구현예에서, "작동가능하게 연결된" 조절 서열은 (예를 들어, 단일 핵산에서) 코딩 서열과 직접적으로 또는 간접적으로 공유적으로 회합된다. 일부 구현예에서, 조절 서열은 코딩 서열의 발현을 트랜스로 제어하고 코딩 서열과 동일한 핵산에서 조절 서열의 포함은 작동가능한 연결의 요건이 아니다.
약제학적으로 허용되는 : 본원에 사용된 바와 같이, 용어 "약제학적으로 허용되는," 본원에 개시된 바와 같은 조성물의 제형을 위한 하나 이상의, 또는 모든 구성요소(들)에 적용되는 바와 같이, 각 구성요소가 조성물의 다른 성분과 호환가능해야 하며 이의 수용자에게 해롭지 않음을 의미한다.
약제학적으로 허용되는 담체 : 본원에 사용된 바와 같이, 용어 "약제학적으로 허용되는 담체"는 제제(예를 들어, 약제학적 제제)의 제형을 용이하게 하거나, 제제의 생체이용률을 변형시키거나, 또는 대상체의 하나의 기관 또는 부분에서 또 다른 기관 또는 부분까지 제제의 수송을 용이하게 하는 액체 또는 고체 충전제, 희석제, 부형제, 또는 용매 캡슐화 물질과 같은 약제학적으로-허용되는 물질, 조성물, 또는 비히클을 지칭한다. 약제학적으로-허용되는 담체로서 제공할 수 있는 물질의 일부 예는 다음을 포함한다: 당, 예컨대 락토스, 글루코스 및 수크로스; 전분, 예컨대 옥수수 전분 및 감자 전분; 셀룰로스, 및 이의 유도체, 예컨대 나트륨 카르복시메틸 셀룰로스, 에틸 셀룰로스 및 셀룰로스 아세테이트; 분말화 트라가칸트; 맥아; 젤라틴; 활석; 부형제, 예컨대 코코아 버터 및 좌제 왁스; 오일, 예컨대 땅콩유, 면실유, 홍화유, 참깨유, 올리브유, 옥수수유 및 대두유; 글리콜, 예컨대 프로필렌 글리콜; 폴리올, 예컨대 글리세린, 소르비톨, 만니톨 및 폴리에틸렌 글리콜; 에스테르, 예컨대 에틸 올레에이트 및 에틸 라우레이트; 한천; 완충제, 예컨대 수산화마그네슘 및 수산화알루미늄; 알긴산; 무발열원수; 등장성 염수; 링거 용액; 에틸 알코올; pH 완충 용액; 폴리에스테르, 폴리카르보네이트 및/또는 폴리무수물; 및 약제학적 제형에 이용되는 다른 무독성 호환성 물질.
약제학적 조성물 : 본원에 사용된 바와 같이, 용어 "약제학적 조성물"은 활성제가 하나 이상의 약제학적으로 허용되는 담체와 함께 제형화된 조성물을 지칭한다.
프로모터 : 본원에 사용된 바와 같이, "프로모터" 또는 "프로모터 서열"은 코딩 서열의 전사의 개시 및/또는 가공성에 직접적으로 또는 간적적으로(예를 들어, 프로모터-결합된 단백질 또는 물질을 통해) 참여하는 DNA 조절 영역일 수 있다. 프로모터는 적합한 조건 하에, 하나 이상의 전사 인자 및/또는 조절 모이어티와 프로모터의 결합 시 코딩 서열의 전사를 개시할 수 있다. 코딩 서열의 전사 개시에 참여하는 프로모터는 코딩 서열에 "작동가능하게 연결될" 수 있다. 특정 경우에, 프로모터는 전사 개시 부위(이의 3' 말단)에서 상류(5' 방향) 위치로 확장되는 DNA 조절 영역일 수 있거나 또는 이를 포함할 수 있으며, 이렇게 지정된 서열이 전사 사건을 시작하는데 필요한 최소 수의 염기 또는 요소 중 하나 또는 둘 다를 포함하도록 한다. 프로모터는 인핸서 및 억제인자 서열과 같은 발현 제어 서열일 수 있거나, 이를 포함하거나, 또는 이와 작동가능하게 회합되거나 또는 이에 작동가능하게 연결될 수 있다. 일부 구현예에서, 프로모터는 유도성일 수 있다. 일부 구현예에서, 프로모터는 구성적 프로모터일 수 있다. 일부 구현예에서, 조건부(예를 들어, 유도성) 프로모터는 단방향성 또는 양방향성일 수 있다. 프로모터는 특정 종의 게놈에서 발생하는 것으로 알려진 서열과 동일한 서열일 수 있거나 또는 이를 포함할 수 있다. 일부 구현예에서, 프로모터는 하이브리드 프로모터일 수 있거나 또는 이를 포함할 수 있으며, 여기서 전사 조절 영역을 함유하는 서열은 하나의 공급원으로부터 수득될 수 있고 전사 개시 영역을 함유하는 서열은 제2 공급원으로부터 수득될 수 있다. 이식유전자 내의 코딩 서열에 제어 요소를 연결하기 위한 시스템은 당업계에 잘 알려져 있다(일반적인 분자 생물학적 및 재조합 DNA 기술은 Sambrook, Fritsch, 및 Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989에 기재되어 있다).
참조: 본원에 사용된 바와 같이, "참조"는 비교가 수행되는 것과 관련된 표준 또는 대조군을 지칭한다. 예를 들어, 일부 구현예에서, 제제, 샘플, 서열, 대상체, 동물, 또는 개인, 또는 이의 집단, 또는 이를 나타내는 척도 또는 특성은 참조, 제제, 샘플, 서열, 대상체, 동물, 또는 개인, 또는 이의 집단, 또는 이를 나타내는 척도 또는 특성과 비교된다. 일부 구현예에서, 참조는 측정된 값이다. 일부 구현예에서, 참조는 확립된 표준 또는 예상된 값이다. 일부 구현예에서, 참조는 역사적 참조이다. 참조는 정성적의 정량적일 수 있다. 전형적으로, 당업자에 의해 이해되는 바와 같이, 참조 및 비교되는 값은 비슷한 조건 하에 척도를 나타낸다. 당업자는 신뢰성 및/또는 비교를 정당화하기 위한 충분한 유사성이 존재하는 경우 이해할 것이다. 일부 구현예에서, 적절한 참조는 예를 들어, 하나 이상의 특정 값(예를 들어, 제제 또는 조건의 존재 또는 부재), 또는 이를 나타내는 척도 또는 특성을 평가하는 목적을 위해, 당업자가 비교할 수 있는 것으로 인식할 조건 하에, 제제, 샘플, 서열, 대상체, 동물, 또는 개인, 또는 이의 집단일 수 있다.
조절 서열 : 핵산 코딩 서열의 발현의 맥락에서 본원에 사용된 바와 같이, 조절 서열은 코딩 서열의 발현을 제어하는 핵산 서열이다. 일부 구현예에서, 조절 서열은 유전자 발현의 하나 이상의 측면(예를 들어, 세포-유형-특이적 발현, 유도성 발현 등)을 제어하거나 또는 영향을 미칠 수 있다.
대상체: 본원에 사용된 바와 같이, 용어 "대상체"는 유기체, 전형적으로 포유동물(예를 들어, 인간, 래트, 또는 마우스)을 지칭한다. 일부 구현예에서, 대상체는 질환, 장애 또는 병태를 앓고 있다. 일부 구현예에서, 대상체는 질환, 장애, 또는 병태에 취약하다. 일부 구현예에서, 대상체는 질환, 장애 또는 병태의 하나 이상의 증상 또는 특성을 나타낸다. 일부 구현예에서, 대상체는 질환, 장애 또는 병태를 앓고 있지 않다. 일부 구현예에서, 대상체는 질환, 장애, 또는 병태의 임의의 증상 또는 특성을 나타내지 않는다. 일부 구현예에서, 대상체는 질환, 장애, 또는 병태에 대한 감수성 또는 위험의 특성인 하나 이상의 특징을 갖는다. 일부 구현예에서, 대상체는 질환, 장애, 또는 병태에 대해 테스트된 대상체, 및/또는 요법이 투여된 대상체이다. 일부 경우에, 인간 대상체는 "환자" 또는 "개인"으로 상호교환가능하게 지칭될 수 있다.
치료제 : 본원에 사용된 바와 같이, 용어 "치료제"는 대상체에게 투여될 때 원하는 약리학적 효과를 도출하는 임의의 제제를 지칭한다. 일부 구현예에서, 제제는 적절한 집단에 걸쳐 통계적으로 유의한 효과를 입증하는 경우 치료제인 것으로 간주된다. 일부 구현예에서, 적절한 집단은 모델 유기체 집단 또는 인간 집단일 수 있다. 일부 구현예에서, 적절한 집단은 특정 연령군, 성별, 유전적 배경, 기존 임상 상태 등과 같은 다양한 기준에 의해 정의될 수 있다. 일부 구현예에서, 치료제는 질환, 장애, 또는 병태의 치료에 사용될 수 있는 물질이다. 일부 구현예에서, 치료제는 인간에게 투여하기 위해 시판될 수 있기 전에 정부 기관에 의해 승인되었거나 또는 승인될 필요가 있는 제제이다. 일부 구현예에서, 치료제는 인간에게 투여하기 위해 의학적 처방이 필요한 제제이다.
치료 유효량: 본원에 사용된 바와 같이, "치료 유효량"은 투여되기 위한 원하는 효과를 생성하는 양을 지칭한다. 일부 구현예에서, 용어는 치료 투약 레지멘에 따라 질환, 장애, 및/또는 병태를 앓고 있거나 또는 이에 취약한 집단에게 투여될 때 질환, 장애, 및/또는 병태를 치료하기에 충분한 양을 지칭한다. 일부 구현예에서, 치료 유효량은 질환, 장애, 및/또는 병태의 하나 이상의 증상의 발병률 및/또는 중증도를 감소시키고/시키거나, 이의 발병을 지연시키는 것이다. 당업자는 용어 "치료 유효량"이 실제로 특정 개인에서 달성될 성공적인 치료를 필요로 하지 않음을 이해할 것이다. 오히려, 치료 유효량은 이러한 치료를 필요로 하는 환자에게 투여될 때 상당한 수의 대상체에서 특정한 원하는 약리학적 반응을 제공하는 양일 수 있다. 일부 구현예에서, 치료 유효량에 대한 언급은 하나 이상의 특이적 조직(예를 들어, 질환, 장애 또는 병태에 걸린 조직) 또는 체액(예를 들어, 혈액, 타액, 혈청, 땀, 눈물, 소변 등)에서 측정된 바와 같은 양에 대한 언급일 수 있다. 당업자는 일부 구현예에서, 특정 제제 또는 요법의 치료 유효량이 단일 용량으로 제형화 및/또는 투여될 수 있음을 이해할 것이다. 일부 구현예에서, 치료적으로 유효한 제제는 예를 들어, 투약 레지멘의 일부로서 복수의 용량으로 제형화 및/또는 투여될 수 있다.
치료 : 본원에 사용된 바와 같이, 용어 "치료"(또한 "치료하다" 또는 "치료하는")는 특정 질환, 장애, 또는 병태의 하나 이상의 증상, 특징, 및/또는 원인의 발병을 부분적으로 또는 완전히 완화하고/하거나, 개선하고/하거나, 덜어주고/주거나, 억제하고/하거나, 지연시키고/시키거나, 이의 중증도를 감소시키고/시키거나, 이의 발병률을 감소시키거나, 또는 임의의 이러한 결과를 달성하려는 목적을 위해 투여되는 요법의 투여를 지칭한다. 일부 구현예에서, 이러한 치료는 관련 질환, 장애, 또는 병태의 징후를 나타내지 않는 대상체 및/또는 질환, 장애, 또는 병태의 초기 징후만을 나타내는 대상체의 치료일 수 있다. 대안적으로 또는 추가적으로, 이러한 치료는 관련 질환, 장애 및/또는 병태의 하나 이상의 확립된 징후를 나타내는 대상체의 치료일 수 있다. 일부 구현예에서, 치료는 관련 질환, 장애, 및/또는 병태를 앓고 있는 것으로 진단된 대상체의 치료일 수 있다. 일부 구현예에서, 치료는 관련 질환, 장애, 또는 병태의 발병 위험 증가와 통계적으로 상관관계가 있는 하나 이상의 감수성 인자를 갖는 것으로 알려진 대상체의 치료일 수 있다. "예방적 치료"는 치료가 병태가 발병할 위험을 줄이거나, 방지하거나, 또는 감소시키는 목적을 위해 투여되도록 치료될 병태의 징후 또는 증상을 나타내지 않거나 또는 치료될 병태의 초기 징후 또는 증상만을 나타내는 대상체에게 투여되는 치료를 포함한다. 따라서, 예방적 치료는 병태에 대한 예방 치료로서 기능을 한다. "치료적 치료"는 병태의 증상 또는 징후를 나타내는 대상체에게 투여되는 치료를 포함하며 병태의 중증도 또는 진행을 줄이려는 목적을 위해 대상체에게 투여된다.
단위 용량 : 본원에 사용된 바와 같이, 용어 "단위 용량"은 단일 용량 및/또는 약제학적 조성물의 물리적으로 별개의 단위로 투여되는 양을 지칭한다. 많은 구현예에서, 단위 용량은 미리결정된 양의 활성제, 예를 들면 미리결정된 바이러스 역가(주어진 부피에서 바이러스, 비리온, 또는 바이러스 입자의 수)를 함유한다. 일부 구현예에서, 단위 용량은 제제의 전체 단일 용량을 함유한다. 일부 구현예에서, 하나 초과의 단위 용량은 총 단일 용량을 달성하기 위해 투여된다. 일부 구현예에서, 의도된 효과를 달성하기 위해 다중 단위 용량의 투여가 필요하거나, 또는 필요할 것으로 예상된다. 단위 용량은 예를 들어, 미리결정된 양의 하나 이상의 치료 모이어티, 미리결정된 양의 고체 형태의 하나 이상의 치료 모이어티, 미리결정된 양의 하나 이상의 치료 모이어티를 함유하는 지속 방출 제형 또는 약물 전달 장치 등을 함유하는 액체(예를 들어, 허용되는 담체)의 부피일 수 있다. 단위 용량은 치료 모이어티(들) 이외에 다양한 구성요소 중 임의의 것을 포함하는 제형에 존재할 수 있음이 이해될 것이다. 예를 들어, 허용되는 담체(예를 들어, 약제학적으로 허용되는 담체), 희석제, 안정화제, 완충제, 보존제 등이 포함될 수 있다. 많은 구현예에서, 특정 치료제의 적절한 총 일일 투여량은 단위 용량의 일부, 또는 복수를 포함할 수 있고, 예를 들어, 건전한 의학적 판단의 범위 내에서 의사에 의해 결정될 수 있음이 당업자에 의해 이해될 것이다. 일부 구현예에서, 임의의 특정 대상체 또는 유기체에 대한 특이적 유효 용량 수준은 치료되는 장애 및 장애의 중증도; 이용되는 특이적 활성 화합물의 활성; 이용되는 특이적 조성물; 대상체의 연령, 체중, 일반적 건강, 성별, 및 식단; 이용되는 특이적 활성 화합물의 투여 시간, 및 배출률; 치료 지속기간; 이용되는 특이적 화합물(들)과 조합하거나 또는 동시에 사용되는 약물 및/또는 추가적인 요법을 포함하는 다양한 인자, 및 의학 분야에서 잘 알려진 유사 인자에 따라 달라질 수 있다.
본원에 제출된 많은 도면은 컬러로 더 잘 이해된다. 출원인은 도면의 컬러 버전을 원본 제출의 일부로 간주하고 이후 절차에서 도면의 컬러 이미지를 제시할 권리를 보유한다.
도 1. 예시적인 벡터 도식. 예시적인 벡터 도식은 제공된 Ad35 벡터의 구현예에서 유용한 통합된 카세트 및 일시적 발현 카세트에서 구성요소의 가능한 배열을 나타낸다. 통합된 카세트는 frt 부위 사이에 트랜스포존 및 다른 구성요소를 포함한다. HDAd 벡터는 γ-글로빈, GFP, mCherry, 및 hFVIII(ET3)과 같은 발현 산물(Exp. Product); EF1α, PGK 프로모터, 또는 β 프로모터와 같은 프로모터(들); mgmtP140K와 같은 선택 마커(들); 프로모터, polyA 꼬리, 및/또는 절연체(예컨대 cHS4)와 같은 조절 요소(Reg. Elements)를 포함할 수 있다. 일시적 발현 카세트는 유사한 구성요소, 뿐만 아니라 DNA 절단 분자(들)(예를 들어, spCas9) 또는 염기 편집기(들) 및 게놈 표적화 가이드(GTG; 예를 들어 sgRNA)를 포함한다. 트랜스포사제 벡터는 표적화 재조합효소(예를 들어, FlpE) 및 트랜스포사제(예를 들어, SB100x)를 포함한다. 벡터는 일 배향/방향으로 예시되어 있지만, 대안적으로 역방향으로 제공될 수 있다.
도 2a-2f. 혈색소병증의 HSPC 유전자 요법을 위한 통합 HDAd5/35++ 벡터.  (도 2a) 벡터 구조. HDAd-γ-글로빈/mgmt에서, 11.8-kb 트랜스포존은 HDAd-SB 벡터로부터 제공된 과활성 잠자는 미녀(Sleeping Beauty) 트랜스포사제(SB100X)를 통해 통합을 위한 도립된 트랜스포존 반복부(IR) 및 FRT 부위에 의해 플랭킹된다(오른쪽 패널). γ-글로빈 발현 카세트는 4 개의 DNase 과민성(HS) 영역을 포함하는 β-글로빈 LCR의 4.3-kb 버전 및 0.7-kb β-글로빈 프로모터을 함유한다. 3'-UTR을 포함하는 76-Ile HBG1 유전자를 사용하였다(적혈구에서 mRNA 안정화를 위함). LCR/β-프로모터 및 EF1A 프로모터 사이의 간섭을 피하기 위해, 1.2-kb 닭 HS4 염색질 절연체(Ins)를 카세트 사이에 삽입하였다. HDAd-SB 벡터는 보편적으로 활성인 PGK 및 EF1A 프로모터 각각의 제어 하에 활성-향상된 SB100X 트랜스포사제 및 Flpe 재조합효소에 대한 유전자를 함유한다. (도 2b) 동원된 CD46tg 마우스의 생체내 형질도입. HSPC를 4 일 동안 인간 재조합 G-CSF의 s.c. 주사 이어서 AMD3100의 1회 s.c. 주사에 의해 동원하였다. AMD3100 주사 30 및 60 분 후, 동물에게 HDAd-γ-글로빈/mgmt 및 HDAd-SB의 1:1 혼합물을 i.v. 주사하였다(2 회 주사, 각각 4 Х 1010 개의 바이러스 입자). 마우스를 인간 γ-글로빈 및 MGMTP140K에 대한 면역 반응을 피하기 위해 다음 4 주 동안 면역억제성(IS) 약물로 처리하였다. O6-BG/BCNU 처리를 4 주차에 시작하고 2 주마다 3 회 반복하였다. 각 주기마다 BCNU 농도를 5에서 7.5 내지 10 mg/kg으로 증가시켰다. 면역억제는 마지막 O6-BG/BCNU 주사 후 2 주에 재개하였다. (도 2c) 유세포 분석에 의해 측정된 인간 γ-글로빈+ 말초 RBC의 백분율. (도 2d) 말초 혈액 단핵 세포(MNC), 전체 세포, 적혈구 Ter119+ 세포, 및 비적혈구 Ter119- 세포에서 인간 γ-글로빈+ 세포의 백분율. (도 2e) 18 주차에 RBC에서 HPLC에 의해 측정된 성체 마우스 글로빈 쇄(α, β-주요, β-소수)와 비교한 인간 γ-글로빈 단백질의 백분율. (도 2f) 18 주차에 총 말초 혈액 세포에서 RT-qPCR에 의해 측정된 성체 마우스 β-주요 글로빈 mRNA와 비교한 인간 γ-글로빈 mRNA의 백분율. 어떠한 처리도 받지 않은 마우스를 대조군으로 사용하였다. 도 2c-2f에서, 각 기호는 개별 동물을 나타낸다.
도 3. 생체내 형질도입/선택 후 hCD46tg 대조군 마우스 및 대표적인 CD46tg 마우스로부터의 RBC에서 글로빈 쇄의 HPLC 분석. 숫자(볼트)는 피크 강도를 나타낸다. 각 그룹으로부터 총 4 마리의 마우스를 유사한 결과로 분석하였다. 데이터는 도 2e에 요약되어 있다. 도 3에서, 곡선하 면적(AUC) 값은 상응하는 피크의 왼쪽으로 상쇄된다.
도 4a-4c. 생체내 형질도입 후 18 주차에 수확된 골수 Lin- 세포로 이식받은 마우스("2차 수용자")의 분석. (도 4a) PBMC에서 인간 CD46-양성 세포의 백분율에 기반하여 표시된 시점에 혈액 샘플에서 측정된 생착. (도 4b) 20 주차에 골수, 비장, 및 PBMC에서 생착. (도 4c) RBC에서 HPLC에 의해 측정된 인간 γ- 대 마우스 α-글로빈 단백질의 비율. 각 기호는 개별 동물을 나타낸다. 통계적 분석은 비모수 Kruskal-Wallis 검정으로 수행하였다.
도 5a-5e. 20 주차에 2차 수용자의 골수 세포에서 이식유전자 통합 분석. (도 5a) 골수 세포의 마우스 염색체 상의 통합 부위의 국소화. 대표적인 마우스가 제시된다. 각 라인은 통합 부위이다. 이 샘플에서 통합 부위의 수는 2,197이다. (도 5b) 게놈 영역에서 통합 분포. 5 마리 마우스의 통합 부위 데이터를 풀링하고 사용하여 그래프를 생성하였다. (도 5c) 연속적 게놈 창 및 무작위화 마우스 게놈 창과 중첩되는 통합의 수 및 크기를 비교하였다. 풀링된 데이터를 도 5b)에서와 같이 사용하였다. 유사성에 대한 Pearson의 χ2 검정 P 값은 0.06381이며, 통합 패턴이 무작위에 가깝다는 것을 암시한다. (도 5d) 이식유전자 카피 수. 형질도입되지 않은 대조군 마우스 및 20 주차에 2차 수용자로부터의 총 골수 세포의 게놈 DNA를 인간 γ-글로빈-특이적 프라이머를 사용하여 qPCR에 적용하였다. 개별 동물에 대한 세포 당 카피 수가 제시되어 있다. 각 기호는 개별 동물을 나타낸다. (도 5e) 개별 클론 전구체 콜로니에서 이식유전자 카피 수. 골수 Lin- 세포를 메틸셀룰로스에 플레이팅하고, 개별 콜로니를 15 일 후에 선별하였다. qPCR을 게놈 DNA에 대해 수행하였다. 세포 당 이식유전자 카피 수로서 표현된 개별 콜로니에서 정규화된 qPCR 신호가 제시되어 있다(n = 113). 각 기호는 단일 세포로부터 유래된 개별 콜로니에서 카피 수를 나타낸다.
도 6. VCN을 측정하기 위한 단일 세포-유래 전구체 콜로니의 qPCR(도 7e 참조).
도 7a-7e. CD46tg 마우스에서 생체내 HSPC 형질도입/선택 후 혈액학적 매개변수(HDAd 주사 후 18 주).  (도 7a) WBC 계수. (도 7b) 미처리 마우스 및 HDAd-γ-글로빈/mgmt 및 HDAd-SB 주사 후 18 주차 마우스의 대표적인 혈액 도말. 스케일 바: 20 μm. WBC의 핵은 보라색으로 염색된다. (도 7c) 혈액학적 매개변수. Hb, 헤모글로빈; HCT, 적혈구용적률; MCV, 평균 미립자 부피; MCH, 평균 미립자 헤모글로빈; MCHC, 평균 미립자 헤모글로빈 농도; RDW, 적혈구 분포 폭.  n ≥ 3, *P < 0.05. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. (도 7d) 18 주차에 희생된 미처리(naive) 마우스(대조군) 및 처리된 마우스의 세포 골수 조성물. 계통 마커-양성 세포(Ter119+, CD3+, CD19+, 및 Gr-1+ 세포) 및 HSPC(LSK 세포)의 백분율이 제시되어 있다. (도 7e) 생체내 형질도입 후 18 주차에 수확된 골수 Lin- 세포의 콜로니-형성 가능성. 2,500 개의 Lin-세포의 플레이팅 후 형성된 콜로니의 수가 제시되어 있다. 도 7a 및 도 7c-7e에서, 각 기호는 개별 동물을 나타낸다. NE, 호중구; LY, 림프구; MO, 단핵구; BA, 호염구.
도 8. CD46++/Bhhth-3 지중해빈혈 모델의 생성. 암컷 CD46tg 마우스를 수컷 Hbbth-3 마우스와 교배시켰다. F1 하이브리드 마우스를 hCD46+/+ 마우스와 역교배시켜 hCD46+/+에 대해 동형접합성인 Hbbth-3 마우스를 생성하였다
도 9a-9c. CD46+/+/Hbbth-3 마우스 지중해빈혈 모델의 표현형.  (도 9a) CD46tg(n = 3) 및 Hbbth-3 마우스(n = 3)와 비교한 CD46+/+/Hbbth-3 마우스(n = 7)의 혈액학적 매개변수. 각 기호는 개별 동물을 나타낸다. *P ≤ 0.05, **P ≤ 0.0002, ***P ≤ 0.00003. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. RET, 망상적혈구. (도 9b) May-Grunwald/Giemsa로 염색한 후 대표적인 말초 혈액 도말. 스케일 바: 20 μm. (도 9c) CD46tg 마우스의 비장 및 간 절편(왼쪽 상단 2 개 패널)과 비교하여 CD46+/+/Hbbth-3 마우스의 간 및 비장 절편(왼쪽 하단 2 개 패널)에서 H&E 염색에 의한 골수외 혈구형성. 스케일 바: 20 μm. 간에서 적혈구모세포의 클러스터는 왼쪽 하단 패널에 표시된다. 중간 하단 패널에서 원은 비장의 거핵구를 표시한다. 비장에서 Perl의 프러시안 블루 염색에 의한 철분 침착(입상 푸른빛 침전물)은 CD46tg의 경우 오른쪽 상단 패널 및 CD46+/+/Hbbth-3 마우스의 경우 오른쪽 하단 패널에 제시되어 있다. 스케일 바: 25 μm.
도 10. "건강한" CD46tg 마우스와 비교하여 지중해빈혈 마우스(Hbbth-3 및 CD46+/+/Hbbth-3)의 백혈구 분석. WBC: 백혈구, NEU: 호중구, LY: 림프구, MONO: 단핵구. *p≤0.05, ** p≤0.0002, ***p ≤0.00003. 이들은 처리 전 마우스의 기준선 수준이다. (CD46tg의 경우 n=8, Hbbth3의 경우 n=4, CD46++/Hbbth3의 경우 n=20). 각 기호는 개별 동물을 나타낸다. 통계적 분석은 비모수 Kruskal-Wallis 검정으로 수행하였다.
도 11. CD46+/+/Hbbth-3 마우스에서 HSPC의 동원. 마지막 AMD3100 주사 1 시간 후에 말초 혈액에서 동원된 LSK(계통-/Sca-1+/c-Kit+/) 세포의 수가 제시되어 있다. n=17 동원된 마우스; n=3 미처리 마우스. 통계적 분석은 비모수 Kruskal-Wallis 검정으로 수행하였다.
도 12. 동원된 CD46+/+/Hbbth-3 마우스의 생체내 형질도입/선택. 동원된 CD46+/+/Hbbth3 마우스의 생체내 형질도입. HSPC를 6 일 동안 인간 재조합 G-CSF의 s.c. 주사(1-6 일) 이어서 AMD3100/플레릭사포르(Plerixafor)의 3 회 s.c 주사(5-7 일)에 의해 동원하였다. 플레릭사포르 주사 30 및 60 분 후, 동물에게 HDAd-γ-글로빈/mgtm + HDAd-SB의 1:1 혼합물을 정맥내로 주사하였다(2 회 주사, 각각 4x1010 vp). 생체내 형질도입 후, 인간 γ-글로빈 및 MGMTP140K 단백질에 대한 면역 반응을 피하기 위해 면역-억제를 17 주 동안 투여하였다. 17 주차에, 처리된 마우스는 2차 이식을 위한 공여자로서 제공되거나 또는 O6-BG/BCNU로 생체내 선택에 적용되었다. 2차 C57Bl/6 수용자를 면역억제 하에 16 주 동안 추적한 다음 희생시켰다. 생체내 선택에 적용된 마우스는 격주마다 증가하는(5, 7.5, 10, 10 mg/kg) O6-BG/BCNU 처리를 받았다. 마지막 O6-BG/BCNU 용량 2 주 후에 면역-억제를 재개하였다. 29 주차에, 마우스를 희생시키고, 이들의 골수를 C57Bl/6 2차 수용자 내로 이식하였다.
도 13a-13f. O6BG/BCNU 처리를 받지 않은 생체내-형질도입된 CD46+/+/Hbbth-3 마우스의 분석. (도 13a) 유세포 분석에 의해 측정된 말초 RBC에서 인간 γ-글로빈의 백분율. 실험을 3 회 수행하고, 상이한 기호 모양으로 표시하였다. (도 13b) 적혈구(Ter119+) 및 비적혈구(Ter119-) 혈액 세포에서 γ-글로빈 발현. 일원 ANOVA 검정에 의해 ***P ≤ 0.00003. (도 13c) 건강한(CD46tg) 마우스(n = 3), 동원 및 생체내 형질도입 전의 CD46+/+/Hbbth-3 마우스(n = 14), 및 생체내 형질도입을 겪고 16 주차에 분석된 CD46+/+/Hbbth-3 마우스(n = 8)의 RBC 분석. *P ≤ 0.05. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. (도 13d) 조직학적 표현형. 상단: 혈액 도말. 중간: 망상적혈구 검출을 위해 브릴리언트 크레실 블루(Brilliant cresyl blue)를 사용한 말초 혈액 도말의 초생체 염색. 대표적인 도말에서 양성으로 염색된 망상적혈구의 백분율은 다음과 같았다: CD46tg의 경우, 8% ± 0.8%; 형질도입 전 CD46+/+/Hbbth-3의 경우, 39% ± 1.3%; 및 형질도입 후 16 주차 CD46+/+/Hbbth-3의 경우, 26% ± 0.45%. 하단: 골수외 혈구형성. 스케일 바: 20 μm. (도 13e 및 도 13f) 2차 수용자의 분석. 16 주차에 생체내-형질도입된 마우스의 총 골수를 준치사량의 부술판 예조건화를 받은 C57BL/6 마우스 내로 이식하였다. 마우스는 관찰 기간 동안 면역억제를 받았다. (도 13e) 인간 CD46+(hCD46+) PBMC의 백분율에 기반한 생착. (C57BL/6 수용자는 hCD46을 발현하지 않는다.) (도 13f) 인간 γ-글로빈+ RBC의 백분율. 각 기호는 개별 동물을 나타낸다.
도 14a-14f. 생체내 선택 후 생체내-형질도입된 CD46+/+/Hbbth-3 마우스에서 γ-글로빈 발현의 분석.  (도 14a) 유세포 분석에 의해 측정된 말초 RBC에서 인간 γ-글로빈의 백분율. 화살표는 O6-BG/BCNU 처리 시점을 나타낸다. 상이한 기호는 3 개의 독립적인 실험을 나타낸다. 16 주차까지의 데이터는 도 13a에서의 것들과 동일하다. (도 14b) 유세포 분석에 의해 분석된 희생 시(29 주) 조혈 조직에서 γ-글로빈-발현 세포의 백분율. *P ≤ 0.05, **P ≤ 0.0002, ***P ≤ 0.00003. (도 14c) MACS-정제된 Ter119 세포에서 γ-글로빈 발현. 29 주차에 1차 수용자로부터의 골수 세포를 Ter119+ 세포에 대해 면역자기적으로 선택하였다. γ-글로빈 발현을 유세포 분석에 의해 Ter119+ 및 Ter119- 세포에서 측정하였다. ***P≤ 0.0002. (도 13d) 생체내 선택 전 대 후(16 주 vs. 29 주)에 말초 혈액, 골수, 및 비장에서 γ-글로빈+ 적혈구(Ter119+) 및 비적혈구(Ter119-) 세포의 배수 강화.  n = 5, **P≤ 0.0002. (도 14e) RBC에서 HPLC에 의해 측정된 마우스 α-글로빈 단백질과 비교한 인간 γ-글로빈 단백질의 백분율. 통계적 분석은 비모수 Kruskal-Wallis 검정으로 수행하였다. (도 14f) 말초 혈액 세포에서 RT-qPCR에 의해 측정된 성체 마우스 β-주요 글로빈 mRNA에 대한 인간 γ-글로빈 mRNA의 수준. 미처리 CD46+/+/Hbbth-3 마우스를 대조군으로 사용하였다. 각 기호는 개별 동물을 나타낸다.
도 15a-15d. RBC에서 글로빈 쇄의 HPLC 분석. (도 15a) 대조군 CD46tg 마우스에서 마우스 글로빈 피크의 대표적인 크로마토그램. 성체 마우스 알파(α), 베타(β)-소수, 및 β-주요 글로빈에 대한 피크가 표지된다. (도 15b-15d) CD46+/+/Hbbth-3 마우스(#71)의 RBC 크로마토그램. 이들 마우스는 β-소수 및 β-주요 유전자 결실에 대해 이형접합성임을 유의한다. 약 29 분의 추가 피크가 이와 연관될 수 있다. (도 15d)에서, 인간 γ-글로빈에 특이적인 피크가 표지된다. 대표적인 크로마토그램이 제시되어 있다. 숫자(볼트)는 피크 강도를 나타낸다. 도 15c 및 15d에서, AUC 값은 상응하는 피크의 왼쪽으로 상쇄된다.
도 16. 29 주차에 처리된 CD46++/Hbbth-3 마우스의 DNA 분석. 골수 세포 당 이식유전자(γ-글로빈) 카피 수. 각 기호는 개별 동물을 나타낸다.
도 17a-17e. 생체내 HSPC 형질도입/선택에 의한 CD46+/+/Hbbth-3 마우스의 표현형 교정. (도 17a) 건강한(CD46tg) 마우스, 동원 및 생체내 형질도입 전의 CD46+/+/Hbbth-3 마우스, 및 생체내 형질도입/선택을 겪은 (HDAd 투입 후 29 주차에 분석됨) CD46+/+/Hbbth-3 마우스의 RBC 분석(n = 5). *P≤ 0.05, **P≤ 0.0002, ***P≤ 0.00003. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. (도 17b) 망상적혈구 검출을 위해 브릴리언트 크레실 블루를 사용한 말초 혈액 도말의 초생체 염색. 화살표는 특징적인 잔여 RNA 및 미세-세포기관을 함유하는 망상적혈구를 나타낸다. 대표적인 도말에서 양성으로 염색된 망상적혈구의 백분율은 다음과 같았다: CD46의 경우, 7%; 처리전 CD46+/+/Hbbth-3의 경우, 31%; 및 처리후 CD46+/+/Hbbth-3의 경우, 12%. 스케일 바: 20 μm. (도 17c) 상단: 혈액 도말. 스케일 바: 20 μm. 중간: 골수 사이토스핀. 화살표는 상이한 성숙 단계에서 적혈구모세포 및 처리된 마우스에서 전적혈구모세포가 우세한 적혈구생성의 역행을 나타낸다. 스케일 바: 25 μm. 하단: Perl의 염색에 의한 조직 혈철소증. 철분 침착은 비장 조직 절편에서 헤모시데린의 세포질 청색 색소로 제시된다. (도 17c) 및 (도 18d)에서 대조군 마우스(CD46tg 및 CD46+/+/Hbbth-3, 형질도입 전)에 대한 혈액 도말 이미지는 동일한 샘플로부터의 것이다. (도 17d) 1 개의 대표적인 CD46tg 및 1 개의 미처리 CD46+/+/Hbbth-3 마우스 및 5 개의 처리된 CD46+/+/Hbbth-3 마우스의 거시적 비장 이미지. (도 17e) 희생 시, 비장 크기를 비장 체중 대 총 체중의 비(mg/g)로 결정하였다. 각 기호는 개별 동물을 나타낸다. 데이터는 평균 ± SEM으로 제시된다. *P≤ 0.05. 통계적 분석은 일원 ANOVA를 사용하여 수행하였다.
도 18a-18e. 처리된 CD46+/+/Hbbth-3 마우스로부터의 골수 세포가 이식된 2차 C57BL/6 수용자의 분석. (도 18a) 부술판 조건화 또는 전신 조사(TBI) 후 PMBC에서 인간 CD46+ (hCD46+) 세포의 백분율에 기반한 주변부에서 측정된 생착률. (C57BL/6 수용자는 hCD46을 발현하지 않는다.) (도 18b) 인간 γ-글로빈-발현 말초 혈액 RBC의 백분율. 모든 마우스는 이식 후 4 주부터 시작하여 면역억제를 받았다. (도 18c) hCD46+(공여자-유래) 세포에서 γ-글로빈+ 세포의 백분율. (도 18c 및 도 18d) 이식 후 20 주차에 2차 C57BL/6 수용자에서 γ-글로빈/CD46 발현(부술판 예조건화). CD46+ 세포를 3 개의 대표적인 2차 마우스의 키메라 골수로부터 면역자기적으로 분리하고 유세포 분석에 의해 γ-글로빈 발현에 대해 분석하였다. 특히, 인간과 달리, huCD46tg 마우스는 RBC 상에서 CD46을 발현한다. (도 18c) 희생 시 1차 및 2차 수용자의 γ-글로빈/CD46 마킹률. (도 18d) 2차 수용자의 조혈 조직으로부터의 CD46+-선택된 세포에서 γ-글로빈 발현(20 주). 각 기호는 개별 동물을 나타낸다. (도 18e) 신규(두번째) 차례의 HSPC 동원/생체내 형질도입을 받은 2차 수용자에서 γ-글로빈 발현(n = 5). 2차 수용자(부술판-예조건화)를 이식 후 20 주차에 γ-글로빈 및 CD46 발현에 대해 분석하였다("생체내 형질도입 전"). 그런 다음 이들 마우스를 동원하고 HDAd-γ-글로빈 및 HDAd-SB 벡터로 생체내 형질도입하였다. 생체내 형질도입 4 주 후, 마우스를 희생시키고 분석하였다("생체내 형질도입 후 4 주"). ***P≤ 0.00003. 통계적 분석은 일원 ANOVA를 사용하여 수행하였다.
도 19a-19d. CD46+/+/Hbbth-3 마우스 모델에서 생체내 형질도입/선택의 안전성. (도 19a) 생체내 선택 동안 및 후에 WBC 및 혈소판(PLT) 계수. O6BG/BCNU 처리는 별표로 표시된다.  n ≥ 3. (도 19b) 순환 WBC 하위집단의 절대 수.  n ≥ 3. (도 19c) 29 주차에 희생된 대조군 및 처리된 마우스에서 세포 골수 조성물. 계통 마커-양성 세포(Ter119+, CD3+, CD19+, 및 Gr-1+ 세포) 및 HSPC(LSK 세포)의 백분율이 제시된다. (도 19d) 29 주차에 수확된 골수 세포의 콜로니-형성 가능성. 각 기호는 개별 동물을 나타낸다. *P ≤ 0.05, **P ≤ 0.0002, ***P ≤ 0.00003. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. NEU: 호중구; LY: 림프구; MO: 단핵구.
도 20a-20f. 두번째 차례의 형질도입에 대한 항-HDAd5/35++ 항체의 효과. (도 20a) CD46tg 마우스를 동원하고 HDAd-mgmt/GFP + HDAd-SB를 주사하였다. 혈청 샘플을 나타낸 바와 같이 수집하였다. (도 20b, 도 20c) 동원/형질도입 후 4 일차 및 4 주차에 PBMC의 유세포 분석 분석. (도 20d) 4 주차에 두번째 차례의 동원/형질도입 및 후속 GFP 분석. (도 20e) OD450에 기반한 항-HDAd5/35++ 항체 역가. OD450=0.2 역가는 중화하는 것으로 간주된다. (도 20f) 상이한 코호트에서 측정된 GFP-양성 PBMC의 백분율(도 20b-20d 참조). Ctrl은 미처리 CD46tg 마우스이다. (도 20e) 및 (도 20f)에서 각 기호는 개별 동물을 나타낸다. 통계적 분석은 비모수 Kruskal-Wallis 검정으로 수행하였다.
도 21a-21d. HDAd 주사 후 18 주차(생체내 선택 10 주)에 벡터 DNA 생물분포(도 21a) 프라이머 설계. 연회색 프라이머는 이식유전자 카세트에 특이적이고 통합 및 에피솜 벡터 DNA를 둘 다 검출할 것이다. 진회색 프라이머는 플라스미드 pHCA로부터 유래된 벡터 스터퍼(stuffer) DNA를 검출할 것이다. SB100x-매개 통합 시, 진회색 프라이머에 대해 상응하는 표적 영역은 손실될 것이다. 따라서 진회색 프라이머를 사용하여 에피솜 벡터 카피를 측정한다. (도 21b) 통합된 이식유전자 카피 수의 표준 곡선. (도 21c) HCA(에피솜 벡터) 카피 수에 대한 표준 곡선. (도 21d) 세포 당 통합된 이식유전자 카피 수. 에피솜 벡터 카피(진회색 프라이머)를 총 벡터 카피에서 차감하였다(연회색 프라이머). 벡터-특이적 신호는 GAPDH로 정규화하였다. 각 기호는 개별 동물을 나타낸다.
도 22a-22c. O6BG/BCNU 처리의 돌연변이원성을 평가하기 위한 시험관내 검정. (도 22a) 동결보존으로부터 밤새 회복시킨 후, CD34+ 세포를 2 일 후 세포의 50%에서 GFP 발현이 매개되는 3000 vp/세포의 MOI에서 HDAd-mgmt/GFP 또는 HDAd 대조군으로 형질도입하였다. 그런 다음 세포를 10 mM O6BG 이어서 25 mM BCNU(또는 DMSO 용매)로 2 시간 동안 처리하였다. 세척 후, 세포를 CFU 검정을 위해 메틸셀룰로스에 플레이팅하였다(35 mm 접시 당 3000 개 세포). 콜로니 및 풀링된 세포를 14 일 후에 계수하고 게놈 DNA를 전체 엑솜 서열분석에 적용하였다. (도 22b) 플레이트 당 풀링된 세포의 수. 각 기호는 개별 35 mm 접시에서 세포 수를 나타낸다. 통계적 분석은 비모수 Kruskal-Wallis 검정으로 수행하였다. (도 22c) HDAd-mgmt/GFP + O6BG/BCNU 그룹으로부터의 대표적인 콜로니. 에피솜 바이러스 게놈의 손실로 인해 콜로니 주변부에서 GFP가 희미해지는 대부분의 세포에서 GFP 발현을 입증한다. 스케일 바는 1 mm이다.
도 23. 벡터 구조. HDAd-짧은-LCR: 이 벡터는 DNase 과민성 부위(HS) 1 내지 4의 코어 영역으로 이루어진 4.3 kb 미니-LCR 및 0.66 kb β-글로빈 프로모터를 함유한다. 트랜스포존의 길이는 11.8 kb이다. HDAd-긴-LCR. γ-글로빈 유전자는 21.5 kb β-글로빈 LCR(chr11: 5292319-5270789), 1.6 kb β -글로빈 프로모터(예를 들면, chr11: 5228631-5227023 또는 chr11: 5228631-5227018) 및 또한 β-글로빈 유전자좌로부터 유래된 3'HS1 영역(chr11: 5206867-5203839)의 제어 하에 있다. 적혈구 세포에서 RNA 안정화를 위해, γ-글로빈 유전자 UTR을 γ-글로빈 유전자의 3' 단부에 연결하였다. 벡터는 또한 mgmtP140K에 대한 발현 카세트를 함유하여 형질도입된 HSPC 및 HSPC 자손의 생체내 선택을 허용한다. γ-글로빈 및 mgmt 발현 카세트는 닭 글로빈 HS4 절연체(cHS4)에 의해 분리된다. 32.4 kb LCR- γ-글로빈/mgmt 트랜스포존은 SB100x에 의해 인식된 도립 반복부(IR) 및 Flpe 재조합효소에 의한 트랜스포존의 원형화를 허용하는 ftr 부위에 의해 플랭킹된다. HDAd-SB: 통합에 필요한 제2 벡터는 활성-향상된 잠자는 미녀 SB100x 트랜스포사제 및 Flpe 재조합효소에 대한 발현 카세트를 함유한다.
도 24a-24f. HDAd-긴-LCR을 사용한 생체외 HSPC 형질도입 연구 후 32.4 kb 트랜스포존의 SB100x-매개 통합. (도 24a) 실험적 레지멘: CD46-유전자이식 마우스로부터의 골수 Lin- 세포를 HDAd-긴-LCR 및 HDAd-SB로 500 vp/세포의 총 MOI에서 형질도입하였다. 배양 1 일후, 마우스 당 1x106 개의 형질도입된 세포를 치명적으로 조사된 C57Bl/6 마우스 내로 이식하였다. 4 주차에, O6BG/BCNU 처리를 시작하고 2 주마다 4 회 반복하였다. 각 주기마다, BCNU 농도를 5 mg/kg에서 7.5 mg/kg, 내지 10 mg/kg(2 회)까지 증가시켰다. 20 주차에, 마우스를 희생시켰다. (도 24b) 유세포 분석에 의해 측정된 인간 γ-글로빈-양성 말초 적혈구(RBC)의 백분율. 각 기호는 개별 동물이다. (도 24c) 이식 후 20 주차에 적혈구(Ter119+) 골수 세포(하부 패널)에서 인간 γ-글로빈-발현을 나타내는 대표적인 유세포 분석 데이터. 상단 패널은 모의-형질도입된 세포로 이식된 마우스를 나타낸다. (도 24d) iPCR 분석의 도식: 5 마이크로그램의 게놈 DNA을 SacI로 소화시키고, 재결찰시키고, 표시된 프라이머를 사용하여 중첩 역PCR에 적용하였다(재료 및 방법 참조). (도 24e) 통합 접합부를 함유하는 클로닝된 플라스미드의 아가로스 겔 전기영동. 표시된 밴드를 절제하고 서열분석하였다. 통합 부위의 염색체 국소화는 겔 아래에 제시된다. (도 24f) 접합부 서열의 예: 5' 단부 벡터 서열, 잠자는 미녀 IR/DR 서열, 통합 접합부(chr15, 6805206) 서열번호: 1; 5' 단부 벡터 서열, 잠자는 미녀 IR/DR 서열, 통합 접합부(chrX, 16897322) 서열번호: 2; 3' 단부 벡터 서열, 잠자는 미녀 IR/DR 서열, 통합 접합부(chr4, 10207667) 서열번호: 3. 벡터체 및 IR/DR 서열은 각각 평문 및 밑줄로 지정된다. 염색체 서열은 굵은 글씨로 지정된다. IR 및 염색체 DNA의 접합부에서 SB100x에 의해 사용되는 TA 디뉴클레오티드는 괄호에 표시된다.
도 25a-25e. 32.4 kb 트랜스포존을 함유하는 HDAd-긴-LCR 및 11.8 kb 트랜스포존을 함유하는 HDAd-짧은-LCR을 사용한 생체내 HSPC 형질도입. (도 25a) 처리 레지멘: hCD46tg 마우스를 동원하고 HDAd-짧은-LCR + HDAd-SB 또는 HDAd-긴-LCR +HDAd-SB를 IV 주사하였다(두 바이러스의 1:1 혼합물의 각각 4x1010 vp 2 회). 5 주 후, O6BG/BCNU 처리를 시작하였다. 각 주기마다, BCNU 농도를 5 mg/kg에서 7.5 mg/kg, 및 10 mg/kg까지 증가시켰다. O6BG 농도는 4 개 처리 모두에서 30 mg/kg이었다. 분석을 위해 동물이 희생된 20 주까지 마우스를 추적하였다. 골수 Lin- 세포를 2차 수용자 내로의 이식을 위해 사용하였다. 그런 다음 2차 수용자를 16 주 동안 추적하였다. (도 25b) 유세포 분석에 의해 측정된 말초 적혈구 (RBC)에서 인간 γ-글로빈-양성 세포의 백분율. 각 기호는 개별 동물이다. 모의-형질도입된 마우스에서, 0.1% 미만의 세포는 γ -글로빈-양성이었다. (도 25c) 생체내 HSPC 형질도입 후 20 주차에 RBC에서 HPLC에 의해 측정된 γ-글로빈 단백질 쇄 수준. 마우스 α-글로빈 단백질 쇄에 대한 인간 γ-글로빈의 백분율이 제시된다. (도 25d) 생체내 HSPC 형질도입 후 20 주차에 전체 혈액에서 qRT-PCR에 의해 측정된 γ-글로빈 mRNA 수준. 마우스 α -글로빈 mRNA에 대한 인간 γ-글로빈 mRNA의 백분율이 제시된다. (도 25e) 생체내 HSPC 형질도입 후 20 주차에 수확된 골수 단핵 세포에서 세포 당 벡터 카피 수. 두 그룹 사이의 차이는 유의하지 않다. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
도 26a-26d. 생체내 HSPC 형질도입 후 20 주차에 혈액학적 매개변수. (도 26a) 백혈구(WBC), 호중구(NE), 백혈구(LY), 단핵구(MO), 호산구(EO), 및 호염구(BA). (도 26b) 적혈구생성 매개변수. RBC: 적혈구, Hb: 헤모글로빈, MCV: 평균 미립자 부피, MCH: 평균 미립자 헤모글로빈, MCHC: 평균 미립자 헤모글로빈 농도, RDW: 적혈구 분포 폭. 세 그룹 사이의 차이는 유의하지 않았다. (도 26c) 세포 골수 조성물. (도 26d) 골수 Lin- 세포의 콜로니-형성 가능성. 그룹 사이의 차이는 도 26a-26d에서 유의하지 않았다.
도 27. 삽입 부위 분석의 도식. 잠자는 미녀 도립 반복부(IR)와 관련하여 HDAd-긴-LCR 벡터에서 NheI 및 KpnI 부위의 국소화가 표시된다. 이들 효소는 근접하지만, SB IR/DR의 외부를 절단하고 통합되지 않은 벡터의 배경을 감소시키는 데 사용된다. 골수 Lin- 세포로부터의 게놈 DNA를 NheI 및 KpnI로 소화시키고, 열 불활성화 후, NlaIII으로 추가로 소화시켰다. NlaIII은 4-절단기이며 작은 DNA 단편을 생성할 것이다. 그런 다음 소화된 DNA를 서열이 알려지고 소화된 NlaIII 단편에 대한 호환가능한 단부가 있는 이중 가닥 올리고와 결찰시켰다. 열-불활성화 및 정리 후, 링커-결찰된 생성물을 선형 증폭에 사용하여, SB 왼쪽 아암으로부터 프라이밍된 단일-가닥(ss) DNA 집단을 생성하였다. 프라이머는 비오티닐화되어, ssDNA는 스트렙타비딘 비드로 수집될 수 있다. 광범위한 세척 후, ssDNA를 비드로부터 융출시키고 2 차례의 중첩 PCR에 의해 추가로 증폭시켰다. PCR 앰플리콘을 겔 정제하고, 클로닝하고, 서열분석하고 마우스 게놈 서열에 맵핑하여 통합 부위를 표시하였다.
도 28a-28d. LAM-PCR/NGS에 의한 HSPC에서 벡터 통합 부위의 분석. HDAd-긴-LCR + HDAd-SB를 사용한 생체내 형질도입 후 20 주차에 수확된 골수 세포로부터 단리된 게놈 DNA. (도 28a) 통합 부위의 염색체 분포. 통합 부위는 수직선으로 표시된다. (도 28b) 접합부 서열의 예: 잠자는 미녀 IR/DR 서열, 통합 접합부(chr7, 79796094) 서열번호: 4; 잠자는 미녀 IR/DR 서열, 통합 접합부(반복 영역) 서열번호: 5. IR/DR 서열은 밑줄 및 굵은 글씨로 지정된다. 염색체 서열은 평문으로 지정된다. IR 및 염색체 DNA의 접합부에서 SB100x에 의해 사용된 TA 디뉴클레오티드는 굵은 글씨이다. (도 28c) 통합 부위를 마우스 게놈에 맵핑하고 유전자에 대한 이의 위치를 분석하였다. 1 kb 상류 전사 시작 부위(TSS)(0.0%), 엑손의 5'UTR(0.0%), 단백질 코딩 서열(0.0%), 인트론(17.0%), 3'UTR(0.0%), 3'UTR에서 1 kb 하류(0.0%), 및 유전자간(83.0%)이 발생한 통합 사건의 백분율이 제시된다. (도 28d) 마우스 게놈 창에서의 통합 패턴. 연속적 게놈 창 및 무작위화 마우스 게놈 창과 중첩된 통합의 수 및 크기를 비교하였다. 이는 통합 패턴이 연속 및 무작위 창에서 유사함을 나타낸다. 임의의 주어진 창에서 최대 통합 수는 3 이하였으며; 창 당 하나의 통합은 발생률이 더 높다.
도 29a-29i. 2차 수용자의 분석. 생체내 형질도입된 CD46tg 마우스로부터 20 주차에 수확된 골수 Lin- 세포를 치명적으로 조사된 C57Bl/6 마우스 내로 이식하였다. 2차 수용자를 16 주 동안 추적하였다. (도 29a) 이식 후 4, 8, 12, 및 16 주차에 CD46-양성 PBMC의 백분율에 기반한 생착률. 두 그룹 사이의 차이는 유의하지 않았다. (도 29b) 유세포 분석에 의해 측정된 γ-글로빈- 발현 말초 혈액 RBC의 백분율. 두 그룹 사이의 차이는 유의하지 않다. (도 29c) 생체내 HSPC 형질도입 후 20 주차에 수확된 골수 MNC에서 세포 당 벡터 카피 수. 두 그룹 사이의 차이는 유의하지 않다. (도 29d) 2차 수용자의 RBC에서 HPLC에 의한 인간 γ-글로빈 쇄의 분석. 성체 마우스 α-글로빈에 대한 인간 γ-글로빈의 백분율이 제시된다. *** p<0.0001. (도 29e) 마우스 α-글로빈 mRNA에 비해 전체 혈액 세포에서 γ-글로빈 mRNA 수준. (도 29f) 모든 골수 MNC에서 적혈구(Ter119+ 세포)를 발현하는 γ-글로빈의 백분율. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. (도 29g) p.t. 16 주차에 γ-글로빈 mRNA 수준 골수 MNC 마우스 α 및 β-주요 글로빈 mRNA에 대한 인간 γ-글로빈 m-RNA의 백분율이 제시된다. (도 29h) 적혈구 특이성. 적혈구(Ter119+) 및 비-적혈구(Ter119-) 세포에서 γ-글로빈+ 세포의 백분율. (도 29i) 생체내 HSPC 형질도입 후 20 주차에 수확된 골수 MNC에서 세포 당 벡터 카피 수(VCN). 두 그룹 사이의 차이는 유의하지 않다.
도 30a-30d. 이식 후 16 주차에 2차 수용자에서 혈액학적 매개변수. (도 30a) 백혈구. (도 30b) 적혈구생성 매개변수. RBC: 적혈구, Hb: 헤모글로빈, MCV: 평균 미립자 부피, MCH: 평균 미립자 헤모글로빈, MCHC: 평균 미립자 헤모글로빈 농도, RDW: 적혈구 분포 폭. (도 30c) 세포 골수 조성물. (도 30d) 골수 Lin- 세포의 콜로니-형성 가능성. 그룹 사이의 차이는 도 30a - 30d에서 유의하지 않았다. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
도 31a-31d. 인간 CD34+ 세포를 사용한 시험관내 연구. (도 31a) 실험의 도식: CD34+ 세포를 HDAd-긴-LCR + HD-SB 또는 HDAd-짧은-LCR + HDAd-SB로 형질도입하고 적혈구 분화(ED)에 적용하였다. O6BG-BCNU를 사용한 시험관내 선택을 ED의 5 일차에 시작하였다. 18 일차에 세포를 유세포 분석(도 31b) 및 HPLC(도 31c)에 의해 분석하였다. (도 31d) 18 차에 벡터 카피 수. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. * p<0.05; ** p<0.0001
도 32a-32h. HDAd-짧은-LCR 및 HDAd-긴-LCR을 사용한 Hbbth3/CD46 마우스의 생체내 HSC 유전자 요법 후 인간 γ -글로빈 발현. (도 32a) 처리 레지멘. 도 25a-25e와 대조적으로, 도 32a-32d는 지중해빈혈 Hbbth3/CD46 마우스 내의 결과를 나타낸다. (도 32b) 유세포 분석에 의해 측정된 말초 적혈구(RBC)에서 인간 γ -글로빈-양성 세포의 백분율. 각 기호는 개별 동물이다. (도 32c) 생체내 HSPC 형질도입 후 18 주차에 RBC에서 HPLC에 의해 측정된 γ -글로빈 단백질 쇄 수준. 마우스 α -글로빈 단백질 쇄에 대한 인간 γ-글로빈의 백분율이 제시된다. (도 32d) 미처리 Hbbth3/CD46 마우스(왼쪽 패널) 및 처리 후 21 주차에 마우스의 대표적인 크로마토그램. 마우스 α- 및 β-쇄 뿐만 아니라 추가된 인간 γ -글로빈이 표시된다.
도 32e - 32h. HDAd-짧은-LCR 및 HDAd-긴-LCR을 사용한 Hbbth3/CD46+/+ 마우스의 생체내 HSPC 유전자 요법 후 인간 γ-글로빈 발현. (도 32e) 처리 레지멘: 도 25에 제시된 연구와 대조적으로, 이 연구는 지중해빈혈 Hbbth3/CD46 마우스를 사용하여 수행하였다. (도 32f) 유세포 분석에 의해 측정된 말초 적혈구(RBC)에서 인간 γ-글로빈-양성 세포의 백분율. 각 기호는 개별 동물이다. (도 32g) 생체내 HSPC 형질도입 후 10 내지 16 주차에 RBC에서 HPLC에 의해 측정된 γ-글로빈 단백질 쇄 수준. 마우스 α-글로빈 단백질 쇄에 대한 인간 γ-글로빈의 백분율이 제시된다. (도 32h) 미처리 Hbbth3/CD46+/+ 마우스(왼쪽 패널) 및 처리 후 16 주차에 마우스의 대표적인 크로마토그램. 마우스 α- 및 β- 쇄 뿐만 아니라 추가된 인간 γ-글로빈이 표시된다. 특히, 2 개의 독립적인 연구를 Hbbth3/CD46+/+ 마우스를 사용하여 수행하였다. 첫번째 연구: HD-긴-LCR의 경우 N=6 및 HDAd-짧은-LCR의 경우 N=2를 21 주 동안 추적하였다. 두번째 연구: HD-긴-LCR의 경우 N=4 및 HDAd-짧은-LCR의 경우 N=5를 16 주 동안 추적하였다. 도 32f는 21 주까지 조합된 데이터를 나타낸다. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. * p<0.05; ** p<0.0001
도 33a, 33b. 희생 시 골수의 분석. 골수를 Hbbth3/CD46+/+ 마우스를 사용한 생체내 HSPC 형질도입 후 16 주차에 수집하였다. (도 33a) 골수 MNC에서 세포 당 벡터 카피 수. 두 그룹 사이의 차이는 유의하지 않다. (도 33b) 적혈구(Ter119+) 세포에서 γ-글로빈의 평균 형광 강도(MFI). 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
도 34. 처리 전 및 긴 LCR로 처리 후 10 주차에, C57BL6(정상 마우스) 및 Townes SCA 마우스의 정규화된 적혈구 형태학을 나타내는 현미경 사진.
도 35. 처리 전 Townes 마우스, 및 처리 후(긴 LCR) 10 주차에 Townes 마우스에 대한 정규화된 적혈구생성(망상적혈구 계수)을 나타내는 현미경 사진.
도 36a-36c. 표현형 교정. (도 36a, 36b) 왼쪽 패널은 Griemsa 염색으로 염색된 혈액 도말을 나타내고 오른쪽 패널은 May-Grunwald 염색으로 염색된 혈액 도말을 나타내는 혈액 세포 형태학. 망상적혈구에서 잔여 핵 및 세포질은 보라색으로 염색된다. (도 36a) 처리 전 및 14 주 차의 비교. (도 36b) CD46tg, 처리 전 Hbbth3/CD46 마우스, 18 주차에 HDAd-긴-LCR로 처리된 Hbbth3/CD46 마우스, 및 21 주차에 HDAd-긴-LCR로 처리된 Hbbth3/CD46 마우스에 대한 Giemsa 염색 및 망상적혈구의 비교. (도 36c) 골수 사이토스핀. 처리된 전적혈구모세포 우세와 함께 적혈구생성의 bac k-이동이 보인다. 스케일 바는 20 μm이다.
도 37a, 37b. 표현형 교정(16 주). (도 37a) 왼쪽 패널:
Figure pct00001
염색으로 염색된 혈액 도말(5 분). 오른쪽 패널: 망상적혈구에 대해 브릴리언트 크레실 블루로 염색된 혈액 도말. 망상적혈구에서 잔여 핵 및 세포질은 보라색 염색으로 보인다. (도 37b)
Figure pct00002
염색으로 염색된 골수 사이토스핀(15 분). (도 37a 및 37b) 상부 패널: 정상 골수 세포 분포 - 적혈구 계통은 적혈구 분화의 모든 단계에 의해 나타난다. 중간 패널: 백혈구 계통보다 적혈구 계통의 우세 - 적혈구 계통은 주로 전적혈구모세포 및 호염기성 적혈구모세포로 이루어진다. 하단 패널: 정상 골수 세포 분포 - 적혈구 계통은 주로 성숙한 다염성 및 정염성 적혈구모세포에 의해 나타난다. 스케일 바는 25 μm이다.
도 38: 1 주차(상단 패널) 및 10 주차(하단 패널)에 긴 LCR 벡터, 짧은 LCR 벡터, 및 대조군 CD46tg의 정규화된 적혈구 매개변수에 대한 그래프 묘사가 제시된다.
도 39a, 39b. Hbbth3/CD46+/+ 마우스의 생체내 HSPC 유전자 요법 전 및 후의 혈액학적 매개변수(16 주). (도 39a) 망상적혈구 계수. (도 39b) 혈액학적 매개변수. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. * p<0.05; ** p<0.0001
도 40a, 40b. 비장 및 간에서 골수외 조혈의 표현형 교정. (도 40ai) 희생 시 비장 크기(16 주). 왼쪽 패널: 대표적인 비장 이미지. 오른쪽 패널: 요약. 각 기호는 개별 동물을 나타낸다. 통계적 분석은 일원 ANOVA를 사용하여 수행하였다. ** p<0.0001. 두 벡터 사이의 차이는 유의하다. (도 40b) 간 및 비장 절편에서 헤마톡실린/에오신 염색에 의한 골수외 혈구형성. Hbbth3/CD46+/+ 마우스에서 간의 적혈구모세포 및 비장에서 거핵구의 클러스터는 검은색 화살표로 표시된다. 스케일 바는 20 μm이다. 대표적인 이미지가 제시된다.
도 41. 비장 및 간에서 혈철소증의 표현형 교정(16 주). 철분 침착은 비장 및 간 절편에서 헤모시데린의 세포질 청색 색소로 Perl의 염색에 의해 제시된다. 스케일 바는 20 μm이다. 대표적인 절편이 제시된다. (Exp: 2.24 ms, 이득: 4.1x, 포화: 1.50, 감마: 0.60).
도 42a-42c. 희생 시 골수의 분석(21 주). 골수를 Hbbth3/CD46tg 마우스의 생체내 HSC 형질도입 후 21 주차에 수확하였다. (도 42a) 골수 MNC에서 세포 당 벡터 카피 수. (도 42b, 42c) γ-글로빈 발현의 적혈구 특이성. (도 42b) γ-글로빈 발현 적혈구(Ter119+) 및 비-적혈구(Ter119-) 세포의 백분율. *p<0.05. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
도 43. 아데노바이러스 공여자 벡터의 투여 전에 CD46tg 및 CD46+/+/Hbbth-3 마우스의 간 및 비장 절편에서 헤마톡실린/에오신 염색에 의한 골수외 혈구형성. 철분 침착은 비장에서 헤모시데린의 세포질 청색 색소로서 Perl의 염색에 의해 제시된다.
도 44a-44e. 생체내 HSPC 형질도입/선택에 의한 CD46+/+/Hbbth-3 마우스의 표현형 교정. (도 44a) 건강한(CD46tg) 마우스, 동원 및 생체내 형질도입 전의 CD46+/+/Hbbth-3 마우스, 및 생체내 형질도입/선택을 겪은 CD46+/+/Hbbth-3 마우스(HDAd 주입 후 29 주차에 분석됨)의 RBC 분석(n = 5). *P ≤ 0.05, **P ≤ 0.0002, ***P ≤ 0.00003. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. (도 44b) 망상적혈구 검출을 위해 브릴리언트 크레실 블루를 사용한 말초 혈액 도말의 초생체 염색. 화살표는 특징적 잔여 RNA 및 미세-세포기관을 함유하는 망상적혈구를 나타낸다. 대표적인 도말에서 양성으로 염색된 망상적혈구의 백분율은 다음과 같았다: CD46의 경우, 7%; 처리 전 CD46+/+/Hbbth-3의 경우, 31%; 및 처리 후 CD46+/+/Hbbth-3의 경우, 12%. 스케일 바: 20 μm. (도 44c) 상단: 혈액 도말. 스케일 바: 20 μm. 중간: 골수 사이토스핀. 화살표는 상이한 성숙 단계에서 적혈구모세포 및 처리된 마우스에서 우세한 전적혈구모세포가 적혈구 생성에서 역행을 나타낸다. 스케일 바: 25 μm. 하단: Perl의 염색에 의한 조직 혈철소증. 철분 침착은 비장 조직 절편에서 헤모시데린의 세포질 청색 색소로서 제시된다. c 및 도 5d에서 대조군 마우스(CD46tg 및 CD46+/+/Hbbth-3, 형질도입 전)에 대한 혈액 도말 이미지는 동일한 샘플로부터 유래된다. (도 44d) 1 개의 대표적인 CD46tg 및 1 개의 미처리 CD46+/+/Hbbth-3 마우스 및 5 개의 처리된 CD46+/+/Hbbth-3 마우스의 거시적 비장 이미지. (도 44e) 희생 시, 비장 크기는 총 체중에 대한 비장 중량의 비(mg/g)로 결정하였다. 각 기호는 개별 동물을 나타낸다. 데이터는 평균 Å} SEM으로 제시된다. *P ≤ 0.05. 통계적 분석은 일원 ANOVA를 사용하여 수행하였다.
도 45. 생체내 형질도입 후 16 주차에 CD46 및 처리된 Hbbth3/CD46 마우스의 세포 골수 조성물. 그룹 사이의 차이는 유의하지 않았다. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
도 46. 인간 γ-글로빈 게이팅 전략. CD46/Hbbth3 마우스로부터의 고정 및 투과된 RBC를 적혈구 마커 Ter-119 및 세포내 γ -글로빈에 대해 염색하였다.
도 47a, 47b. CD34+ 세포의 전사체(transcriptome)에 대한 SB100x-매개 통합의 효과. (도 47a) 실험 도식. CD34+ 세포를 EF1α 프로모터 단독 또는 HDAd-SB와의 조합으로 제어 하에 GFP/mgmt 카세트를 함유하는 HDAd5/35++ 벡터로 형질감염시켰다. 형질도입된 세포를 16 일 동안 적혈구 분화 배지에서 확장시켰다. 2 차례의 O6BG/BCNU 선택(50 μM O6BG + 35 μM BCNU)을 통합된 트랜스포존이 있는 GFP- 양성 세포에 대해 강화시켰다. 16 일차에, GFP-양성 세포를 FACS 분류하였다(샘플 #6). 비교를 위해(샘플 #5), mgmt/GFP 벡터 단독으로 형질도입되고 선택에 적용된 CD34+ 세포를 사용하였다. 대조군 세포는 SB100x를 발현하지 않았기 때문에, 에피솜 mgmt/GFP 벡터가 손실되었고 따라서 GFP 음성이었다. 두 샘플로부터의 총 RNA를 Omega Bioservices에 의해 수행된 RNA-Seq에 적용하였다. (도 47b) mRNA 발현이 변경된 유전자(log2 배수 변화)를 이들의 p 값에 기반하여 순위를 매겼다.
도 48. 생체내 형질도입 후 16 주차에 골수 MNC에서 mgmt mRNA 발현 수준. 인간 mgmtP140K 및 마우스 mRPL10 수준을 총 골수 MNC에서 qRT-PCR에 의해 측정하였다. (mRPL10은 마우스 하우스키핑 유전자이다). 상대적 수준을 VCN에 의해 추가로 나누었다(도 33 참조). 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
도 49. 마우스에서 벡터 hCD46tg의 생체내 HSC 형질도입: "긴" 대 "짧은" 벡터 LCR. 마우스에서 벡터 Hbbth3/CD46의 생체내 형질도입. 그룹 1은 7 마리의 마우스에서 HDAd-긴-LCR-γ-글로빈/mgmt 및 HDAd-SB/Flpe의 생체내 형질도입을 나타낸다. 그룹 2는 3 마리의 마우스에서 HDAd-짧은-LCR γ-글로빈/mgmt 및 HDAd-SB/Flpe의 생체내 형질도입을 나타낸다. O6BG, BCNU에 대해 3 회 선택 주기만이 필요하였다.
도 50. Thbb 마우스 테스트(W6). 그래픽 결과는 짧은 LCR 벡터에 비해 긴 LCR 벡터로 형질도입될 때 마우스 사이에 차이가 없고 인간 γ-글로빈 발현이 거의 없음을 나타낸다.
도 51. Thbb 마우스 테스트(W8). 그래픽 결과는 짧은 LCR 벡터에 비해 긴 LCR로 형질도입될 때 마우스 사이의 차이를 나타내지만, 짧은 LCR 바이러스가 마우스에서 사멸되었는지는 불분명하다.
도 52. 마우스에서 인간 γ-글로빈 발현 RBC의 백분율을 나타내는 그래픽 묘사. 그래프는 생체내 선택의 3 주기 후에만 100% 마킹을 예시한다.
도 53. 마우스 HBA에 대한 상대적 인간 γ-글로빈을 나타내는 HPLC의 그래픽 묘사(10 주). 그래프는 짧은 LCR과 비교하여 긴 LCR에 대한 상당히 더 높은 γ-글로빈 수준을 나타낸다.
도 54. 긴 LCR 벡터를 함유하는 마우스 #57의 예시적인 10 주 혈액 HPLC의 그래픽 묘사.
도 55a-55e. HDR-매개 통합을 위한 AAVS1-특이적 CRISPR/Cas9 벡터 및 공여자 벡터의 특성화. (도 55a) HDAd-CRISPR 벡터 구조: AAVS1-특이적 sgRNA는 U6 프로모터로부터 PolIII에 의해 전사되고 spCas9 유전자는 EF1α 프로모터의 제어 하에 있다. Cas9 발현은 HDAd 생산자 116 세포에서 Cas9 발현을 억제하지만 CD34+ 세포에서 Cas9 발현에 부정적으로 영향을 미치지 않는 miR-183-5p 및 miR-218-5p에 의해 제어된다(Sayadaminova 등, Mol Ther Methods Clin Dev, 1, 14057, 2015). 상응하는 micro RNA 표적 부위(miR-T)를 β-글로빈 유전자의 3' 비번역 영역(3'UTR) 내로 포매시켰다. (도 55b) 2000 vp/세포의 MOI에서 HDAd-CRISPR 형질도입 3 일 후 T7E1 검정에 의해 측정된 인간 CD34+ 세포에서 표적 부위 절단 빈도. 특이적 절단 생성물은 474 bp 및 294 bp이다. 절단 효능은 겔 아래에 제시된다. (도 55c) HDAd-CRISPR-형질도입된 CD34+ 세포에서 발견된 상위 13 개의 가장 빈번한 indel(서열번호: 6-18, 위에서 아래 순서). 연회색으로 강조된 서열은 중간 회색으로 강조하는 표시된 TAM 서열이 있는 가이드 RNA의 표적을 나타낸다. CRISPR/Cas9 절단 부위는 수직 화살표로 표시된다. 녹색은 NHEJ에 의해 유발된 삽입이다. (도 55d) AAVS1 부위 내로 통합을 위한 공여자 벡터의 구조(HDAd-GFP-공여자). mgmtP140K 유전자는 자기-절단 피코르나바이러스 2A 펩티드를 통해 GFP 유전자에 연결되어 있다. 유전자는 EF1α 프로모터의 제어 하에 있다. PA: 폴리-아데닐화 신호. 이식유전자 카세트는 이전에 공개된 연구(Lombardo 등, Nat Methods 8, 861-869, 2011)와 유사한 AAVS1 유전자좌에 상동성인 0.8 kb 영역에 의해 플랭킹된다. 상동성 영역의 상류 및 하류는 공여자 카세트를 방출하는 AAVS1-특이적 CRISPR/Cas9에 대한 인식 부위이다. (도 55e) 공여자 카세트의 방출. CD34+ 세포를 HDAd-GFP-공여자(1000 또는 2000 vp/세포의 MOI) 단독으로 또는 HDAd-CRISPR(MOI 1000 vp/세포)과 조합하여 형질감염시켰다. 3 일 후에 게놈 DNA를 GFP-특이적 프로브와 함께 서던 블롯에 적용하였다. (선형) 전장 HDAd-공여자-GFP 게놈을 36 kb에서 실행한다. 방출된 카세트를 4.7 kb에서 실행한다. 절단 빈도는 겔 아래에 제시된다.
도 56a-56f. HUDEP-2 세포에서 표적화된 통합 vs. SB100x-매개 통합. (도 56a) 실험 도식. HUDEP-2 세포를 각 바이러스에 대해 1000 vp/세포의 MOI에서 표시된 HDAd 벡터로 형질감염시켰다. 21 일 동안 확장 후, GFP 양성 세포를 96 웰 플레이트 내로 분류하였다. 단일 세포-유래 클론을 2 주 동안 추가 확장에 의해 수득하였다. GFP 발현을 세포 집단에서 형질도입후 2 및 21 일차, 또는 세포 클론에서 35 일차에 측정하였다. (도 56b) 2 및 21 일차에 공여자 벡터 단독 또는 표적화 vs SB100x 통합 메커니즘이 있는 벡터로 처리된 세포에서 GFP 유세포 분석. (도 56c) 표적화 vs SB100x 통합이 있는 총 GFP+ 세포에서 GFP의 평균 형광 강도(21 일). 제시된 데이터(평균 ± SD)는 3 개의 독립적 실험을 나타낸다. (도 56d) 단일 클론에서 GFP의 평균 형광 강도. 각 기호는 하나의 세포 클론을 나타낸다. 제시된 데이터(평균 ± SD)는 2 개의 독립적인 실험을 나타낸다. (도 56e) 표적화 또는 SB100x-매개 통합이 있는 대표적인 세포 클론에서 GFP 발현을 나타내는 유세포 분석. (도 56f) GFP 프라이머를 사용한 qPCR에 의한 세포 클론에서 벡터 카피 수.
도 57a, 57b. 표적화된 통합 벡터로 형질도입된 HUDEP-2 클론의 통합 분석. (도 57a) 역PCR에 의한 통합 부위 분석. 상부 다이어그램은 활용된 NcoI 부위, 및 프라이머의 위치를 나타낸다(반 화살표. 진회색: 5'- 접합부에 대한 EF1α 프라이머; 연회색: 3' 접합부에 대한 pA 프라이머). 표적화된 통합에 대한 각 측면에서 예상된 앰플리콘 크기가 표시된다. 하부 겔 사진은 iPCR 결과를 나타낸다. 각 레인은 하나의 세포 클론을 나타낸다. New England Biolab의 1kb 래더(ladder)를 사용하였다. Ef1α 프라이머가 채택된 이후에 내인성 Ef1α의 추가 밴드가 검출되었다. 클론 #20의 경우, 앰플리콘 크기가 예측과 다를지라도, 클로닝 및 서열분석은 표적 통합이 있는 클론임을 입증하였다. (도 57b) In-Out PCR 분석. 상부 다이어그램은 프라이머의 위치를 나타낸다. 다양한 통합 패턴에 대한 예상된 생성물 크기가 나열된다. 하부 겔 사진은 대부분의 클론이 단일대립유전자성 표적화된 통합이 있음을 입증한다. (도 57a)의 결과와 관련하여, 클론 #17, #20 및 #36의 예상치 못한 앰플리콘 크기는 연쇄체(concatemeric) 통합으로부터 발생할 가능성이 있었다.
도 58a-58c. AAVS1/CD46tg 마우스에서 AAVS1 표적 부위의 절단. (도 58a) 시험관내 분석. 표시된 MOI의 시험관내 HDAd-CRISPR 형질도입 3 일 후 측정된 AAVS1/CD46tg 마우스의 골수 계통-음성 세포에서 표적 부위 절단 빈도. (도 58b) 이식 후 14 주차에 총 골수 단핵 세포로부터 DNA의 심층 서열분석에 의해 수득된 총 AAVS1 indel의 백분율. 각 기호는 개별 동물이다. (도 58c) 마우스에서 발견된 상위 29 개의 가장 빈번한 indel(서열번호: 19-23, 21, 21, 26-30, 27, 32, 28, 34-47), 위에서 아래 순서). 대표적인 데이터가 제시된다. 황색 서열은 청색으로 표시된 TAM 서열이 있는 가이드 RNA의 표적을 나타낸다. CRISPR/Cas9 절단 부위는 수직 화살표로 표시된다.
도 59a-59d. HDAd-AAVS1 및 HDAd-GFP-공여자를 사용한 AAVS1/CD46 Lin- 세포의 생체외 형질도입 및 치명적으로 조사된 수용자 내로 후속 이식. (도 59a) 실험 도식: 골수를 AAVS1/CD46tg 마우스로부터 수확하고 계통-음성 세포(Lin-)를 MACS에 의해 단리하였다. Lin- 세포를 HDAd-CRISPR 및 HDAd-GFP-공여자 단독으로 또는 500 vp/세포의 총 MOI에서 조합하여 형질도입하였다. 배양 1 일 후, 마우스 당 1x106 개의 형질도입된 세포를 치명적으로 조사된 C57Bl/6 마우스 내로 이식하였다. 4 주차에, O6BG/BCNU 처리를 시작하고 2 주마다 3 회 반복하였다. 각 주기마다, BCNU 농도를 5 mg/kg에서 7.5 mg/kg 내지 10 mg/kg까지 증가시켰다. 14 주차에, 마우스를 희생시키고 골수 Lin- 세포를 치명적으로 조사된 2차 C57Bl/6 수용자 내로 이식하기 위해 사용한 다음, 16 주 동안 추적하였다. (도 59b) 유세포 분석에 의해 측정된 말초 혈액 단핵 세포(PBMC)에서 GFP-양성 세포의 백분율. HDAd-CRISPR 단독, HDAd-GFP-공여자 단독, 및 HDAd-CRISPR + HDAd-GFP-공여자로 형질도입된 Lin- 세포를 이식한 그룹이 제시된다. 각 기호는 개별 동물을 나타낸다. (도 59c) Lin- 세포가 이식된 대표적인 마우스로부터의 PBMC에서 GFP+ 세포의 백분율. 4 주(선택 전) 및 12 주(선택 후)의 데이터가 제시된다. (도 59d) 계통-양성 세포 CD3+(T-세포), CD19+(B-세포), Gr-1+(골수성 세포), 및 HSC(LSK 세포)에서 GFP+ 세포의 백분율.
도 60a-60e. 생체외 형질도입된 Lin- 세포의 생착 분석. (도 60a) 유세포 분석에 의해 측정된 PBMC에 대한 인간 CD46 발현에 기반한 이식된 세포의 생착. 각 기호는 개별 동물이다. 특히, 형질도입된 공여자 세포는 CD46을 발현하였지만, 수용자 C57Bl/6 마우스는 발현하지 않았다. (도 60b) 14 주차에 PBMC(혈액), 비장, 및 골수에서 CD46-양성 세포의 백분율. (도 60c) 14 주차에 PBMC, 비장 및 골수에서 GFP-양성 세포의 백분율. (도 60d) 상이한 형질도입 설정에서 LSK 및 계통-양성 세포의 백분율. 3 개의 그룹 사이의 차이는 유의하지 않다. (도 60e) GFP+ 콜로니의 분석. 14 주차 마우스의 총 골수 Lin- 세포를 플레이팅하고 콜로니에서 GFP 발현을 12 일 후에 분석하였다. 각 기호는 개별 마우스에 대한 평균 GFP+ 콜로니 수이다(왼쪽 패널). 모든 콜로니의 세포를 풀링하고 유세포 분석에 의해 분석하였다(오른쪽 패널).
도 61a-61f. 2차 수용자에서 GFP 마킹 분석. HDAd-GFP-공여자 또는 HDAd-CRISPR + HDAd-GFP-공여자 형질도입된 Lin- 세포를 이식한 반응자 마우스의 골수 세포를 이식 후 14 주차에 수확하고, 계통-양성 세포에 대해 고갈시키고, 치명적으로 조사된 C57Bl/6 마우스 내로 이식하였다. (도 61a) 4 마리의 수용자 마우스에서 PBMC의 GFP-유세포 분석. 오른쪽 패널은 전형적인 분석을 나타낸다. 수직 축은 hCD46에 대한 염색을 나타내고, 수평 축은 GFP 염색을 나타낸다. (도 61b) 16 주차에 PBMC, 비장 및 골수에서 GFP-양성 세포의 백분율. (도 61c) 이식 후 16 주차에 수용자에서 계통-양성 및 -음성 세포의 GFP 흐름 분석. (도 61d) GFP+ 콜로니의 분석. 16 주차 마우스의 총 골수 Lin- 세포를 플레이팅하고 콜로니에서 GFP 발현을 12 일 후에 분석하였다. 각 기호는 개별 마우스에 대한 평균 GFP+ 콜로니 수이다(왼쪽 패널). 모든 콜로니의 세포를 풀링하고 유세포 분석에 의해 분석하였다(오른쪽 패널). (도 61e) 유세포 분석에 의해 측정된 PBMC에 대한 인간 CD46 발현에 기반한 이식된 세포의 생착. (도 61f) 상이한 형질도입 설정에서 계통-양성 및 -음성 세포의 백분율. 두 그룹 사이의 차이는 유의하지 않다.
도 62a-62f. HDAd-AAVS1-CRISPR + HDAd-GFP-공여자를 사용한 AAVS1/CD46tg 마우스의 생체내 형질도입. (도 62a) 처리 레지멘. AAVS1/hCD46tg 마우스를 동원하고 HDAd-CRISPR + HDAd-GFP-공여자를 IV 주사하였다(두 바이러스의1:1 혼합물의 각 4x1010 vp 2 회). 4 주 후에, O6BG/BCNU 처리를 시작하였다. 각 주기마다, BCNU 농도를 2.5 mg/kg에서 7.5 mg/kg 및 10 mg/kg까지 증가시켰다. O6BG 농도는 3 가지 처리 모두에서 30 mg/kg이었다. 마우스를 동물이 분석을 위해 희생되고 Lin- 세포가 2차 수용자 내로 이식될 때 12 주까지 추적하였다. 그런 다음 2차 수용자를 16 주 동안 추적하였다. (도 62b) 유세포 분석에 의해 측정된 말초 혈액 단핵 세포(PBMC)에서 GFP-양성 세포의 백분율. (도 62c) 14 주차에 PBMC, 비장 및 골수에서 GFP-양성 세포의 백분율. (도 62d) 계통-양성 세포 CD3+(T-세포), CD19+(B-세포), Gr-1+(골수성 세포), 및 HSC(LSK 세포)에서 GFP+ 세포의 백분율. (도 62e) GFP+ 콜로니의 분석. 14 주차 마우스의 총 골수 Lin- 세포를 플레이팅하고 콜로니에서 GFP 발현을 12 일 후에 분석하였다. 각 기호는 개별 마우스에 대한 평균 GFP+ 콜로니 수이다(왼쪽 패널). 모든 콜로니의 세포를 풀링하고 유세포 분석에 의해 분석하였다(오른쪽 패널). (도 62f) 14 주차에 계통-양성 및 -음성 세포의 백분율.
도 63a-63e. 도 59a-59d의 2차 수용자 분석. 14 주차에, 생체내 형질도입된 AAVS1/hCD46tg 마우스의 골수 Lin- 세포를 치명적으로 조사된 C57Bl/6 수용자 내로 이식하였다. (도 63a) 6 마리의 수용자 마우스에서 PBMC의 GFP-유세포 분석. (도 63b) 혈액, 비장 및 골수의 단핵 세포에서 GFP 발현. (도 63c) 이식 후 16 주차에 수용자에서 계통-양성 및 -음성 세포의 GFP 흐름 분석. (도 63d) 유세포 분석에 의해 측정된 PBMC에 대한 인간 CD46 발현에 기반한 이식된 세포의 생착. (도 63f) 16 주차에 계통-양성 및 -음성 세포의 백분율.
도 64a-64h. HDAd-AAVS1 및 HDAd-공여자-γ-글로빈 벡터를 사용한 AAVS1/CD46 Lin- 세포의 생체외 형질도입 및 치명적으로 조사된 수용자 내로의 후속 이식. (도 64a) 공여자의 구조. 전반적인 구조는 HDAds-GFP-공여자 벡터에 대한 것과 동일하다(도 55d 참조). 상동성 영역은 새로운 HDAd-글로빈-공여자 벡터에서 더 길다(1.8 kb vs 0.8 kb). γ -글로빈 발현 카세트는 4 개의 DNAse 과민성(HS) 영역 및 γ -글로빈 프로모터를 포함하는 γ-글로빈 LCR의 4.3 kb 버전을 함유한다(Lisowski 등, Blood. 110, 4175-4178, 1996). 3' UTR(적혈구에서 mRNA 안정화를 위함)을 포함하는 전장 γ -글로빈 cDNA를 사용하였다. mgmtP140K 유전자는 보편적으로 활성인 EF1α 프로모터의 제어 하에 있다. 양방향성 SV40 폴리-아데닐화 신호를 사용하여 전사를 종결한다. LCR/β-프로모터 및 EF1α 프로모터 사이의 간섭을 피하기 위해, 1.2 kb 닭 HS4 염색질 절연체(Emery 등, Proc Natl Acad Sci USA, 97, 9150-9155, 2000)를 카세트 사이에 삽입하였다. (도 64b) 처리 레지멘은 도 57a에 제시된 것과 동일하다. (도 64c) 유세포 분석에 의해 측정된 말초 적혈구(RBC)에서 인간 γ-글로빈-양성 세포의 백분율. 체내 형질도입 후 16 주차에 혈액 및 골수에서 적혈구(Ter119+) 및 비-적혈구(Ter119-) 세포의 인간 γ-글로빈-양성 세포의 (도 64d) 백분율 및 (도 64e) 평균 형광 강도. * p<0.05. (도 64f) HPLC에 의해 16 주차에 RBC에서 측정된 마우스 β-주요 쇄에 대한 γ -글로빈 쇄의 백분율. (도 64g) qRT-PCR에 의해 16 주차에 RBC에서 측정된 마우스 β-주요 RNA에 대한 γ -글로빈 mRNA의 백분율. (도 64h) Lin- 세포로부터 유래된 콜로니에서 세포 당 벡터 카피 수. 각 기호는 하나의 콜로니를 나타낸다. 동물 사이의 차이는 유의하지 않다.
도 65a, 65b. HDAd-CRISPR 및 HDAd-글로빈-공여자 벡터로 형질도입된 AAVS1/CD46 Lin- 세포의 생착. (도 65a) 유세포 분석에 의해 측정된 PBMC에 대한 인간 CD46 발현에 기반한 이식된 세포의 생착. (도 65b) 16 주차에 계통-양성 PBMC(혈액), 비장, 및 골수 세포 뿐만 아니라 골수 LSK 세포에서 CD46-양성 세포의 백분율.
도 66a-66c. 도 64a-64h의 2차 수용자 분석. HDAd-CRISPR + HDAd-글로빈-공여자 형질도입된 Lin- 세포가 이식된 마우스의 골수 세포를 이식 후 16 주차에 수확하고, 계통-양성 세포에 대해 고갈시키고, 치명적으로 조사된 C57Bl/6 마우스 내로 이식하였다. (도 66a) 5 마리의 수용자 마우스에서 RBC의 γ-글로빈 유세포 분석. (도 66b) 계통-양성 PBMC에서 CD46-양성 세포의 백분율. (도 66c) 2차 수용자 내로 이식 후 16 주차에 골수 조성물.
도 67a-67h. HDAd-CRISPR + HDAd-글로빈-공여자를 사용한 AAVS1/CD46tg 마우스의 생체내 형질도입. (도 67a) 처리 레지멘. (도 67b) γ-글로빈-양성 RBC의 백분율. (도 67c) 형질도입되지 않은 대조군 마우스 또는 형질도입 후 16 주차 마우스의 말초 RBC에서 γ-글로빈 발현의 백분율을 나타내는 대표적인 도트 팟(dot pot). (도 67d) 혈액 및 골수의 적혈구(Ter119+) 및 비-적혈구(Ter119-) 세포에서 γ-글로빈의 평균 형광 강도. * p<0.05. (도 67e) HPLC에 의해 16 주차에 RBC에서 측정된 마우스 β-주요 쇄에 대한 γ-글로빈 쇄의 백분율. * p<0.05. (도 67f) qRT-PCR에 의해 16 주차에 RBC에서 측정된 마우스 β-주요 RNA에 대한 γ-글로빈 mRNA의 백분율. * p<0.05. (도 67g) 4 마리의 반응자 마우스에서 Lin- 세포로부터 유래된 콜로니에서 세포 당 벡터 카피 수. 각 기호는 하나의 콜로니를 나타낸다. 동물 사이의 차이는 유의하지 않다. (도 67h) 생체내 형질도입 후 16 주차에 혈액, 비장 및 골수에서 계통-양성 세포 및 골수에서 LSK 세포의 조성물.
도 68a-68d. 도 67a-67h의 2차 수용자 분석. (도 68a) 유세포 분석에 의해 측정된 PBMC에 대한 인간 CD46 발현에 기반한 이식된 세포의 생착. (도 68b) RBC에서 γ-글로빈 발현. (도 68c) HPLC에 의해 16 주차에 2차 수용자의 RBC에서 측정된 마우스 β-주요 쇄에 대한 γ-글로빈 쇄의 백분율. (도 68d) 생체내 형질도입 후 16 주차에 혈액, 비장 및 골수에서 계통-양성 세포 조성물.
도 69a, 69b. AAVS1/CD46 유전자이식 마우스에서 AAVS1 유전자좌의 국소화 및 구조. (도 69a) 염색체 14 상의 불일치를 나타내는 TLA 데이터. AAVS1-특이적 프라이머 쌍을 사용하였다. 오른쪽 패널은 18 kb 갭이 보이는 염색체 14의 확대된 절편을 나타낸다. 갭은 추가된 인간 AAVS1 유전자좌에 상응한다. (도 69b)
도 70. 게놈 국소화를 나타내는 AAVS1 유전자좌의 상세한 구조. 음영 처리된 AAVS1 영역을 Sanger 서열분석에 의해 확인하였다. 빈 영역은 The Jackson Laboratory의 제한 분석 및 AAVS1 tg 마우스 유전적 배경 정보로부터 제하였다. CRISPR/Cas9 절단 부위는 가위로 표시된다. 반복부 #2 내지 #5는 완전한 8.2 kb 인간 AAVS1 EcoRI 단편이지만, 반복부 #1 및 #5만이 EcoRI 단편의 분획만을 함유한다. 특히, 반복부 #5는 완전한 5' 상동성 아암이 결여되어 있다. AAVS1tg 마우스에 존재하는 다중카피 AAVS1 유전자좌의 CRISPR/Cas9 절단에 따른 결과. 절단 위치에 관한 규칙은 다음과 같다: a) 반복부 #1 내지 #4에서 하나의 단일 절단: 바람직. b) 반복부 #5에서 하나의 단일 절단: 불완전한 왼쪽 상동성 아암으로 인한 선호도 감소. c) 2 개의 반대로 배향된 반복부(예를 들어 #1 및 #4)에서 2 개의 절단: 오른쪽 상동성 아암의 누락으로 인해 HDR-매개 표적화된 통합 없음. d) 동일한 방향을 직면한 2 개의 반복부(예를 들어 #1 및 #2)에서 2 개의 절단: 바람직. e) 2 개 초과의 절단의 경우, 각 측면에서 마우스 gDNA 서열에 대한 하나의 근위부만 고려: 규칙 c) 또는 d)에 따라서 적용. f) 반복부 #1 및 #5에서 절단 및 중심 영역의 결실. 또한, HDR-매개 표적화된 통합은 반복부 #2 내지 #4에서 발생하였고, CRISPR에 의한 플랭킹 반복부, 예를 들어 #1 및 #5에서 연속적 절단은 이미 통합된 이식유전자의 손실을 초래할 수 있다.
도 71a, 71b. HDAd-CRISPR + HDAd-GFP-공여자를 사용한 생체외 또는 생체내 HSC 형질도입 후 16 주차에 단리된 게놈 DNA의 서던에 의한 통합 부위 분석. (도 71a) AAVS1-특이적 프로브와의 혼성화. 상부 패널은 예상된 EcoRI 단편 크기 및 프로브의 국소화를 나타낸다. 하부 패널은 생체외 및 생체내 형질도입 설정에서 개별 마우스의 분석을 나타낸다. 더 큰 밴드는 비-표적화된 AAVS1 유전자좌 반복부를 나타낸다. (도 71b) BlpI-소화된 DNA와 GFP-특이적 프로브의 혼성화. 밴드 패턴은 다른 곳에서 논의된다.
도 72a-72c. HDAd-CRISPR + HDAd-GFP-공여자를 사용한 생체외 또는 생체내 HSC 형질도입 후 16 주차에 단리된 게놈 DNA의 역PCR(iPCR)에 의한 통합 부위 분석. (도 72a) 다이어그램은 NcoI 부위, 및 프라이머의 위치를 나타낸다(반 화살: 5' 접합부에 대한 EF1α 프라이머; 연회색: 3' 접합부에 대한 pA 프라이머). 반복부 #5에서 표적화된 통합을 위한 각 측면에서 예상된 앰플리콘 크기가 표시된다. (도 72b) 총 골수 세포에서 게놈 DNA를 사용한 iPCR 결과. 각 레인은 하나의 마우스를 나타낸다. #009, #023, #943, #944 및 #946은 생체외 HSC 형질도입 후 마우스이다. #147, #304 및 #467은 생체내 형질도입된 동물이다. (도 72c) GFP-양성 콜로니의 iPCR 분석. 14 주차 마우스의 골수 Lin- 세포를 플레이팅하고, 20 일 후에 게놈 DNA를 GFP+ 콜로니에서 단리하고 iPCR에 사용하였다. 마우스 #943 및 #946을 분석하였다. 각 레인은 하나의 콜로니를 나타낸다. 연회색 화살표: 표적화된 통합; 진회색 화살표: 표적외(off-target) 통합; 중간 회색 화살표: 통합된 전체 HDAd 바이러스 게놈.
도 73a, 73b. HDAd-CRISPR + HDAd-글로빈-공여자를 사용한 생체외 또는 생체내 HSC 형질도입 후 16 주차에 단리된 게놈 DNA의 역PCR(iPCR)의 통합 부위 분석. (도 73a) 다이어그램은 NcoI 부위, 및 프라이머의 위치를 나타낸다(반 화살표. 검정색 5' 접합부에 대한 EF1α 프라이머; 회색: 3' 접합부에 대한 pA 프라이머). 반복부 #5에서 표적화된 통합을 위한 각 측면에서 예상된 앰플리콘의 크기가 제시된다. (도 73b) 총 골수 세포에서 게놈 DNA를 사용한 iPCR 결과. 각 레인은 하나의 마우스를 나타낸다. #321, #322, #856, #857, #858 및 #945는 생체외 형질도입된 마우스이다. #504, #816 #869 및 #898은 생체내 형질도입된 동물이다. 흰색 화살촉은 표적화된 통합을 나타내고; 회색, 점선 화살촉: 표적외 통합; 흰색 전체 화살표: 통합된 전체 HDAd 바이러스 게놈.
도 74a-74d. (도 74a) 생체내 HSPC 형질도입을 위한 HDAd5/35++ 벡터. HDAd-GFP/mgmt에서, 트랜스포존은 HDAd-SB 벡터에서 제공된 과활성 잠자는 미녀 트랜스포사제(SB100X)를 통해 통합을 위해 도립된 트랜스포존 반복부(IR) 및 frt 부위에 의해 플랭킹된다. 이식유전자 카세트는 β-글로빈 3'UTR에 연결된 PGK-프로모터 구동된 GFP 유전자 뿐만 아니라 EF1α-프로모터 구동된 mgmtP140K 카세트를 함유한다. 두 카세트는 닭 글로빈 HS4 절연체에 의해 분리된다. HSPC를 인간 재조합 G-CSF의 s.c. 주사(5 μg/마우스/일, 4 일) 이어서 마지막 G-CSF 주사 18 시간 후 AMD3100의 s.c. 주사(5 mg/kg)에 의해 neu/CD46 유전자이식 마우스에서 동원하였다. HDAd-GFP/mgmt+HDAd-SB의 총 8x1010 개의 바이러스 입자를 AMD3100 주사 1 시간 후 i.v. 주사하였다. HDAd 주사 후 전염증성 사이토카인 방출을 방지하기 위해, 동물에게 바이러스 주사 16 시간 및 2 시간 전에 덱사메타손(10 mg/kg)을 i.p.로 제공하였다. 6 주 후, 3 차례의 O6BG/BCNU(i.p.)를 적용하여 형질도입된 HSPC가 말초 혈액 순환으로 빠져나가는 것을 활성화시켰다(30 mg/kg O6BG 및 5, 7.5, 및 10 mg/kg BCNU). 생체내 형질도입 17 주 후, 1x106 개의 MMC 세포를 유선 지방 패드 내로 이식하였다. 5 주 후, 종양 및 다른 조직을 수확하고 GFP 발현에 대해 분석하였다. (도 74b) 왼쪽 패널: 생체내 형질도입 후 상이한 시점에서 GFP-발현 PBMC의 백분율. 각 기호는 개별 동물을 나타낸다. 오른쪽 패널: 골수, 비장, 혈액, 및 콜라게나제/디스파제-소화된 종양에서 범-백혈구 마커 CD45에 대해 염색된 세포에서 GFP+ 세포의 백분율. (도 74c) GFP에 대한 항체 및 세포외 기질 단백질인 라미닌에 대한 항체로 염색된 종양 절편. 스케일 바는 50 μm이다. (도 74d) 혈액에서 GFP+ PBMC 및 종양에서 GFP+ 세포의 면역표현형.
도 75. MMC 세포에서 래트 Neu 발현. 세포를 Neu-특이적 단클론 항체 7.16.4 이어서 항-마우스 Ig-FITC로 염색하였다. 배양된 MMC 세포의 대표적인 공초점 현미경 이미지가 제시된다. 새로운-특이적 신호는 흰색 색조로 보인다. 스케일 바는 20 μm이다.
도 76. 면역표현형을 위한 게이팅 전략.
도 77. 골수 및 비장에서 GFP+ 세포의 면역표현형(MMC 모델). 상세한 내용은 도 74d를 참조한다.
도 78a-78f. 생체내 HSPC 형질도입 후 종양-침윤 백혈구에서 GFP 발현(TC-1 모델). (도 78a) 실험 도식. HSPC를 인간 재조합 G-CSF의 s.c. 주사(5 mg/마우스/일, 4 일) 이어서 마지막 G-CSF 주사 18 시간 후 AMD3100의 s.c. 주사(5 mg/kg)에 의해 CD46tg 유전자이식 마우스에서 동원하였다. HDAd-GFP/mgmt+HDAd-SB의 총 8x1010 개의 바이러스 입자를 AMD3100 1 시간 후 i.v. 주사하였다. HDAd 주사 후 전염증성 사이토카인 방출을 방지하기 위해, 동물에게 바이러스 주사 16 시간 및 2 시간 전에 덱사메타손(10 mg/kg)을 i.p.로 제공하였다. 6 주 후, 3 차례의 O6BG/BCNU(i.p.)를 적용하여 형질도입된 HSPC가 말초 혈액 순환으로 빠져나가는 것을 활성화시켰다(30 mg/kg O6BG 및 5, 7.5, 및 10 mg/kg BCNU. 생체내 형질도입 17 주 후, 5x104 개의 TC-1 세포를 유선 지방 패드 내로 이식하였다. 5 주 후, 종양 및 다른 조직을 수확하고 GFP 발현에 대해 분석하였다. (도 78b) 생체내 형질도입 후 상이한 시점에서 GFP-발현 PBMC의 백분율. 각 기호는 개별 동물을 나타낸다. (도 78c) 골수, 비장, 혈액, 및 콜라게나제/디스파제-소화된 종양에서 범백혈구 마커 CD45에 대해 염색된 세포에서 GFP+ 세포의 백분율. (도 78d) 전체(악성 + 종양 침윤) 세포에서 GFP+ 세포 및 GFP+ 양성 백혈구의 대표적인 유세포 분석 데이터. (도 78e). 대표적인 종양 절편. 왼쪽 패널: GFP 형광. 오른쪽 패널: GFP에 대한 항체(흰색) 및 세포외 기질 단백질 라미닌(회색)으로 염색. 스케일 바는 50 mm이다. (도 78f) 종양에서 GFP+ 세포 및 혈액에서 PBMC의 면역표현형. BD Biosciences의 림프구 유세포 분석 패널 8c(CD45, CD3, CD4, CD8, CD25, CD19) 및 골수성 패널 9c(CD45, CD11c, F4/80, MHCII, SiglecF-PecCP, Ly6C, CD11b, Ly6G)를 사용하였다.
도 79a-79c. 종양-침윤 백혈구 이외의 세포에서 억제하기 위한 miRNA 선택. (도 79a) 이식유전자 발현의 조직-특이성의 miRNA-기반 조절. miRNA는 전형적으로 천연 mRNA의 3' 비번역 영역(3' UTR)에 상주하는 miRNA 표적 부위(miR-T)로 지칭되는 표적 서열과의 염기 쌍형성을 통해 가이드 분자로서 기능한다. 이 상호작용은 mRNA 절단 또는 번역 억제를 매개하는 효과기 복합체를 모집한다. 이식유전자의 mRNA가 주어진 세포 유형에서 높은 수준으로 발현되는 miRNA에 대한 miR-T를 함유하는 경우, 이식유전자 발현은 이 세포 유형에서 방지될 것이다. 대조적으로, 특이적 miRNA를 발현하지 않는 세포 유형에서, 이식유전자가 발현될 것이다(Brown 등, Nat Med. 2006;12: 585- 591). (도 79b) MicroRNA-Seq를 5 마리의 마우스(neu/CD46tg-MMC 모델, 종양 접종 후 17 일)에서 풀링된 RNA에 대해 수행하였다. GFP+ 종양 13 개의 샘플에 대한 비장, 골수 및 혈액의 작은 RNA 서열분석에 의해 식별된 정규화된 microRNA 판독물 계수(100만 개의 맵핑된 microRNA 당 판독물 + 1)가 제시된다. miR-423을 포함하는, 종양에 존재하지 않는 MicroRNA를 유사-계수 1로 산점도의 왼쪽에 정렬한다. miR-423-5p는 블롯에 표시된다. (도 79c) MicroRNA-Seq를 5 마리의 마우스(CD46tg/TC-1 모델, 17 일)에서 풀링된 RNA에 대해 수행하였다. 상위 10 개 miRNA의 상대적 발현 수준을 종양의 수준(1로 설정)과 비교하였다.
도 80a-80c. HSPC에 대한 miR-423-5p 표적 부위 과발현의 효과. (도 80a) 벡터 구조. HDAd-GFP-miR-423은 GFP 유전자에 연결된 3'UTR에서 4 개의 miR-423-5p 표적 부위를 함유한다. (도 80b) 마우스 HSPC(M)(CD46-유전자이식 마우스의 골수로부터의 Lin- 세포) 및 인간 HSPC(Hu)(CD34+ 세포)를 HDAd-GFP 또는 HDAd-GFP-miR423으로 각각 500 또는 3000 vp/세포의 MOI에서 감염시켰다. 3 일 후, 세포 용해물을 CDKN1A에 대한 웨스턴 블롯에 의해 분석하였다. 블롯을 항-β-액틴 항체로 재프로빙하여 로딩 차이를 조정하였다. 오른쪽 패널은 b-액틴 신호에 대해 정규화된 CDKN1A 신호의 정량화를 나타낸다. 상응하는 마우스 및 인간 HDAd-GFP/mgmt 샘플의 신호를 100%로 취하였다. (도 80c) 전구체 콜로니 형성에 대한 효과. HDAd 감염 1 일 후, 마우스 Lin- 세포(35 mm 접시 당 2.5x103 개 세포) 또는 인간 CD34+ 세포(접시 당 3x103 개 세포)를 콜로니 검정을 위해 플레이팅하였다. 콜로니를 12 일 후 계수하였다. N=3. *p<0.05. 통계적 유의성을 양측 스튜던트(Student) t-검정(Microsoft Excel)에 의해 계산하였다. (이전 연구와 일치하여(Li 등, Mol Ther Methods Clin Dev. 2018;9: 390-401; Li 등, Mol Ther Methods Clin Dev. 9: 142-152, 2018), 상대적으로 높은 MOI에서 HSPC의 감염은 HSPC의 콜로니 형성 용량을 약간 감소시켰다)
도 81. 노던 블롯에 의해 miR-423-5p 발현 검증. 골수 계통-음성 세포, 비장, 전체 혈액 세포, 및 MMC-/TC-1-종양 침윤 백혈구의 총 RNA(2 μg)를 15% 변성 폴리아크릴아미드 겔에서 분리하고 블롯을 muRNA-423-5p에 특이적인 프로브 및 후속적으로 U6 RNA(로딩 대조군)에 대한 프로브와 혼성화하였다. Mir-423은 70 bp의 전구체 길이 및 23 bp의 성숙 miRNA 길이를 갖는다. miR-423-5p-특이적 신호는 혈액, 골수, 및 비장에서 보이지만, 두 종양 모델에서 종양-침윤 세포에는 없다.
도 82a, 82b. 인간에서 miRNA423-5p 발현. (도 82a) Ludwig 등, Nucleic Acids Res. 2016;44: 3865-3877에 공개된 miR-423-5p의 수준. 왼쪽에서 오른족으로, y-축 라벨은 다음을 포함한다: 지방세포, 동맥, 결장, 경막, 신장, 간, 폐, 근육, 심근, 피부, 비장, 위, 고환, 갑상선, 소장 십이지장, 소장 공장, 췌장, 신장 부신, 신피질, 신수질, 식도, 전립선, 골수, 정맥, 림프절, 흉막, 뇌하수체, 척수, 뇌시상, 뇌백질, 뇌꼬리핵, 뇌회백질, 대뇌피질 측두엽, 대뇌피질 전두엽, 대뇌피질 후두부, 및 소뇌. (도 82b) 2 명의 난소암 환자에서 플롯팅된 miRNA-Seq 데이터(풀링). CD45+ 세포를 고등급 장액성 난소의 생검으로부터 단리하였다. RNA를 종양-침윤 백혈구 및 일치하는 PBMC로부터 단리하고 LC Sciences, LLC의 miRNA-Seq에 적용하였다. miRNA-423-5p가 표시된다.
도 83a-83e. neu/MMC 모델에서 생체내 HSPC αPD-L1-γ1 면역-체크포인트 억제제 요법. (도 83a) MMC 종양 세포에서 PDL1 발현(흰색). 스케일 바는 20 μm이다. (도 83b) 요법 벡터의 전반적인 구조는 도 74a에 제시된 것과 동일하다. 벡터는 5' 단부 상의 HA 태그 및 분비 신호(LS) 및 3' 단부 상의 인간 IgG1의 힌지-CH2-CH3 도메인 및 myc 태그에 연결된 scFv 항-마우스 PD-L1에 대한 발현 카세트를 함유한다. miR423-5p 표적 부위를 3'UTR 내로 삽입하여 miR423-5p 조절에 의해 αPD-L1-γ1 발현을 종양-침윤 세포로 제한하였다. 벡터는 또한 mgtmP140K에 대한 발현 카세트를 함유한다. (도 83c) HDAd-GFP/mgmt 및 HDAd-αPD-L1-γ1 생체내 형질도입된 HSPC가 있는 마우스에서 MMC 세포 접종 후(0 일) 종양 부피. HDAd-αPD-L1-γ1 그룹의 마우스에게 첫번째 종양 세포 주사 후 80 일차에 1x105 개 MMC 세포의 피하 주사를 재접종하였다. 각 곡선은 개별 동물이다. (도 83d) 유세포 분석에 의한 T-세포 반응 분석. 미처리 neu-유전자이식 마우스 및 HDAd-αPD-L1-γ1-처리된 마우스(100 일)의 비장세포를 CD4, CD8, 및 세포내 IFNγ에 대해 유세포 분석에 의해 분석하거나 또는 Neu 사량체로 염색하였다. N=3. *p<0.05. (도 83e) Neu+ 및 Neucell로 자극 시 IFNγ 반응. 미처리 neu-유전자이식 마우스 및 HDAd-αPDL1-γ1-처리된 마우스(100 일)의 비장세포를 저지된 MMC 세포 (Neu+) 또는 neu유전자이식 마우스(Neu-)의 비장세포에 노출시키거나, 또는 PMA/이오노마이신("noAg")으로 처리하였다. 배양 상청액에서의 IFNγ 농도가 제시된다. N=3. * p<0.005.
도 84a-84c. αPD-L1-γ1 발현의 동역학. (도 84a) 항-HA 태그 항체를 사용한 αPD-L1-γ1 웨스턴 블롯. 3 마리의 동물을 17 일차에 희생시키고 조직을 웨스턴 블롯에 의해 αPD-L1-γ1 발현에 대해 분석하였다. αPD-L1-γ1 단백질은 완전히 환원되지 않아서, 2 개의 scFv 쇄(130 kDa)가 있는 완전한 αPD-L1-γ1 잔류물을 생성하였다(αPD-L1-γ1의 구조의 경우 오른쪽 패널 참조). β-액틴에 대한 염색은 로딩 대조군으로 사용하였다. 대표적인 샘플이 제시된다. 또한 웨스턴 블롯 신호의 정량화가 제시된다. N=5 마우스. (도 84b) 종양-침윤 백혈구, PBMC, 골수 세포 및 비장세포에서 αPD-L1-γ1 mRNA 발현. 마우스 PPIA mRNA를 내부 대조군으로 사용하였다. 결과를 2(-ΔΔCt) 방법에 따라 계산하고 상응하는 종양 샘플의 cDNA 수준을 100%로 설정하여 상대적 발현의 백분율로 제시하였다. (도 84c) 포획을 위한 재조합 마우스 PD-L1 및 검출을 위한 항-HA 항체-HRP 접합체를 사용하여 ELISA에 의해 측정된 혈청에서 분비된 αPD-L1-γ1의 수준. 각 기호는 개별 동물을 나타낸다. * p<0.05. 통계적 유의성은 양측 스튜던트 t-검정(Microsoft Excel)에 의해 계산하였다.
도 85a - 85f. ID8-p53-/-brca2-/- 난소암 모델에서 면역-예방 연구. (도 85a) ID8-p53-/-brca2-/- 종양의 분석. 총 2x106 개의 ID8-p53-/-brca2-/- 세포를 CD46-유전자이식 마우스에 복강내로 주사하였다. 복수/악액질이 6-8 주 후에 발생하였다. 그런 다음 종양을 제거하고 유세포 분석을 위해 디스파제/콜라게나제로 소화시켰다. 세포의 분획을 노던 블롯 분석을 위해 종양-연관 대식세포(TAM), 호중구(TAN), 및 T-세포(TIL)로 분류하였다. (도 76 참조). (도 85b) 종양-연관 백혈구의 면역표현형. (도 85c) miR-423-5p에 대한 노던 블롯. 레인 당 총 1 μg의 RNA를 로딩하였다. 상부 패널은 32P-표지된 miR-423-5p 프로브로 프로빙 후 신호를 나타낸다. 블롯을 스트립(stripped)하고 U6 RNA 특이적 프로브로 재프로빙하였다(하부 패널). Ambion의 32P-표지된 Decade 마커를 오른쪽 레인에서 실행하였다. (도 85d) 실험 체계. CD46-유전자이식 마우스를 동원하고 HDAd-αPDL1γ1miR423 + HDAd-SB, HDAd-GFP-miR423 + HDAd-SB를 주사하거나, 또는 모의-주사하였다. 4 차례의 O6BG/BCNU 생체내 선택이 주어졌다. ID8-p53-/-brca2-/- 세포를 마지막 O6BG/BCNU 처리 2 주 후 복강내로 주사하였다. 종양 세포 주사 2, 6, 및 11 주 후, αPDL1γ1 수준을 혈청에서 분석하였다. 복수 또는 이환율/악액질의 발병을 종점으로 취하였다. (도 85e) Kaplan-Meier 생존 플롯. N=7. (도 85f) ELISA에 의해 측정된 혈청 αPDL1γ1 수준. 각 기호는 개별 동물이다. * p<0.05. 통계적 유의성은 양측 스튜던트 t-검정(Microsoft Excel)에 의해 계산하였다
도 86a- 86d. ID8-p53-/-brca2-/- 난소암 모델에서 면역-요법 연구. (도 86a) 암 재발을 예방하기 위한 임상 설정. 생체내 HSC 형질도입은 외과적 종양 감량수술 후 또는, 수술이 옵션이 아닌 경우 화학요법과 함께 시작할 것이다. O6BG/BCNU 생체내 선택은 화학요법과 조합될 수 있다. 생체내 HSPC 형질도입/선택의 결과로서, 보강된 HSPC는 암이 재발할 때까지 휴면기에 놓여 HSPC 분화 및 효과기 유전자 발현의 활성화를 촉발할 것이다. (도 86b) 실험 체계. CD46 유전자이식 마우스에게 1x106 개의 ID8-p53-/-brca2-/- 종양 세포를 복강내로 주사하였다. 일단 종양이 확립되면, 생체내 HSPC 형질도입 및 선택을 수행하였다. miR-423-기반 발현 시스템의 활성화를 혈청 αPDL1γ1 수준에 기반하여 모니터링하였다. (도 86c) Kaplan-Meier 생존 플롯. 대조군 설정에서, HDAd-GFP-miR423을 주사하였다. N=9. (도 86d) 혈청 αPDL1γ1 수준을 ELISA에 의해 측정하였다. 각 기호는 개별 동물이다. * p<0.05. 통계적 유의성은 양측 스튜던트 t-검정(Microsoft Excel)에 의해 계산하였다.
도 87a, 87b. 종양 성장의 역전 전에, αPD-L1-γ1의 피크에서 17 일차에 희생된 동물의 자가면역 반응. (도 87a) 처리 전 동물(왼쪽 패널)과 비교하여 처리된 동물(오른쪽 패널)에서 털 변색. (도 87b) 처리된 동물의 기관에 대한 조직학적 분석. 절편을 H&E로 염색하였다. 대표적인 영역이 제시된다. 스케일 바는 20 mm이다. 단핵 세포의 침윤에 주목한다.
도 88a-88h. MMC 종양이 있는 neu-유전자이식 마우스에서 항-PD-L1 단클론 항체 요법의 효과 및 혈구형성에 대한 생체내 HSC 형질도입의 효과. 종양이 100 mm3의 부피에 도달했을 때, 마우스에게 항-마우스 PD1-L1 단클론 항체 muDX400*(5 mg/kg i.p.)(4 일마다 4 회) 또는 이소형 대조군 항체를 복강내 주사하였다. (도 88a) 개별 마우스의 종양 부피가 제시된다. (도 88b) 항-PD-L1에 대한 더 긴 생존을 나타내는 Kaplan-Meier 생존 플롯. 부피가 1000 mm3인 종양을 종점으로 취하였다. 두 그룹 사이의 차이는 유의하지 않다. (도 88c) 생체내 HSCPC 형질도입 후 2 주차에 도 85d에 제시된 hCD46-유전자이식 마우스의 혈액 세포 계수 (도 85a) 혈액학적 매개변수. RBC: 적혈구, Hb: 헤모글로빈, MCV: 평균 미립자 부피, MCH: 평균 미립자 헤모글로빈, MCHC: 평균 미립자 헤모글로빈 농도, RDW: 적혈구 분포 폭. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다. 세 그룹 사이의 차이는 유의하지 않았다. (도 88e) GFP+ 세포 분획의 niRNA-Seq. (도 88f) 웨스턴 블롯, qRT-PCR, 및 혈청 ELISA에 의한 αPDL1 발현의 동역학. (도 88g) miRNA-조절된 유전자 발현. (도 88h) 개시된 면역-예방적 및 암 재발 예방의 요약된 도식.
도 89a-89h. 적혈구의 GFP 발현과 관련된 데이터.
도 90a-90i. 적혈구의 인간 인자 VIII 발현과 관련된 데이터.
도 91a-91d. 혈액학적 이상은 관찰되지 않는다.
도 92a-92g. 억제제 항체에도 불구하고 A형 혈우병의 표현형 교정.
도 93a-93e. 원숭이(엠. 파시쿨라리스(M. fascicularis))의 생체내 형질도입. (도 93a) 실험 타임라인; (도 93b - 93d) 말초 혈액에서 동원된 CD34+ 세포의 GFP 마킹; (도 93e) 골수(3 일).
도 94a-94m. 조합된 생체내 HSC 형질도입 선택. mgmtP140K는 약물 내성 및 유전자-변형된 세포의 선택적 확장에 대한 메커니즘을 제공한다. (인간 O(6)-메틸구아닌-DNA-메틸트랜스퍼라제(MGMT)에 대한 P140K 돌연변이체는 벤질구아닌으로도 알려진 MGMT 억제제 O(6)-(4-브로모테닐) 구아닌(O6BG)에 대한 내성을 부여한다. (도 94a) MGMTp140k에 대한 벡터. (도 94b) 주사에 대한 타임라인 및 투여량을 나타내는 실험 설계. (도 94c) PBMC에서 GFP+ 세포의 퍼센트를 나타내는 데이터. (도 94d) 26 주차에 골수에서 GFP+ 세포의 퍼센트를 나타내는 데이터. (도 94e) Ad5/35-GFP 벡터. (도 94f) 4 일의 동원 이어서 Ad5/35 주사를 받은 돼지꼬리 원숭이를 묘사하는 실험 프로토콜. (도 94g) 동물 ID 및 G-CSF, SCF, AMD3100, 및 Ad5/35-GFP의 용량. (도 94h) AMD3100은 총 CD34+ 줄기 세포 수준을 G-CSF/SCF 단독보다 3-배 및 기준선보다 65-배 더 우수하게 증가시켰으며; 왼쪽 패널 말초 혈액에서 CD34+ 줄기 세포의 백분율을 나타내었고; 오른쪽 패널은 CD34+ 세포 계수를 나타내었다. (도 94i) AD5/35 주사 후 동원된 세포는 계통 왜곡 없이 건강한 콜로니를 형성하며; 왼쪽 패널은 Ad5/35 주사 후 0 시간에서 6 시간까지 콜로니의 빈도 및 수를 나타내는 수치 데이터를 제공하고; 오른쪽 패널은 CD34+ 세포의 형태학에 대한 육안 검사를 제공한다. (도 94j) 상단 패널은 주사 후 0 시간에서 6 시간까지 Ad5/35-GFP 세포의 유세포 분석 데이터를 제시한다. 하단 패널은 주사 후 0, 2, 및 6 시간에 Ad5/35-GFP를 함유하는 콜로니 수의 수치 데이터를 제시한다. (도 94k) 3% 초과의 말초 CD34+ 세포는 Ad5/35 주사 후 GFP를 발현한다. 상단 패널은 Ad5/35 주사 후 0 일에서 8 일까지 단핵 세포(MNC) 층에서 추출된 C34+ 세포를 도시한다. 하단 패널은 주사 후 2 및 6 시간에 평균 GFP+ 발현을 도시한다. (도 94l) 다중 방법은 동원 및 Ad5/35 주사 후 순환 세포의 성공적인 형질도입을 확인한다. 왼쪽 패널은 벡터 DNA의 Taqman 검출을 도시한다. 오른쪽 패널은 GFP 발현의 유세포 분석 데이터를 도시한다. (도 94m) 골수로 돌아가는 변형된 세포. 왼쪽 패널은 Ad5/35 주사 후 3, 7, 및 73 일차에 CD34+ 및 GFP+ 세포에서의 변화를 나타내는 유세포 분석 데이터를 도시한다. 오른쪽 패널은 Ad5/35 주사 후 기준선, 및 3, 7, 및 73 일차에 GFP+, CD34+ 세포의 퍼센트를 도시한다.
도 95. 본원에 기재된 대표적인 Ad35 헬퍼 바이러스 및 벡터의 특징. 5-점 별은 다음 텍스트를 나타낸다: -SB100x에 대한 조합(추가 및 재활성화) 및 표적화됨; -CRISPR 또는 BE에 대한 다중 sgRNA; -Cas9의 miRNA(miR187/218) 조절된 발현; 및 -Cas9의 자동-불활성화.
도 96. HDAd-TI-combo 벡터의 도식. CRISPR 시스템은 2 개의 상이한 부위(HBG 프로모터 및 적혈구 bcl11a 인핸서)를 표적화하여, 증가된 감마 재활성화를 야기한다.
도 97a-97d. (도 97a). HDAd-SB 및 HDAd-combo의 공동감염 시, Flpe가 발현되고 IR-플랭킹된 트랜스포존을 방출한 다음, SB100x 트랜스포사제에 의해 게놈 내로 통합될 것이다. 동시에, HBG1 및 bcl11a-E CRISPR이 발현되고 DNA indel을 생성하여 γ-글로빈의 재활성화를 야기할 것이다. 트랜스포존의 Flp―매개 방출 시, CRISPR 카세트는 분해되어 세포독성을 회피할 것이다. CRISPR 시스템은 2 개의 상이한 부위(HBG 프로모터 및 적혈구 bcl11a 인핸서)를 표적화하여, 증가된 γ 재활성화를 야기한다. (도 97b) 표적화 전략; (도 97c) 적혈구 특이적 BCL11A 인핸서; (도 97d) HBG 프로모터에서 BCL11A 결합 부위(서열번호: 48). HDAd-SB 및 HdAd-comb-SB의 도식은 도 102에서 찾을 수 있다.
도 98a-98n. 이중 CRISPR 벡터 및 γ-글로빈 재활성화. (도 98a) HDAd-Bcl11ae-CRISPR, HDad-HBG-CRISPR, HDAd-Dual-CRISPR, 및 HDAd-스크램블에 대한 벡터 설계. (도 98b) 이중 gRNA 벡터에 대한 HD-Ad5/35++ CRISPR 벡터. (도 98c) 인간 적혈구 전구체 세포주(HUDEP-2)의 HD-Ad5/35++ CRISPR 형질도입은 분화 전 및 후에 제시된다. 타임라인은 HUDEP-2 세포 이미지 아래에 제시된다. (도 98d) HD-AD5/35++ "Dual" gRNA 벡터는 미처리(UNTR), BCL11A, 또는 HBG 벡터와 비교하여 세포 생존력에 부정적인 영향을 미치지 않는다. (도 98e) HD-AD5/35++ "Dual" gRNA 벡터는 UNTR, BCL11A, 또는 HBG 벡터와 비교하여 증식에 부정적인 영향을 미치지 않는다. (도 98f, 도 98g) 이중 벡터는 표적 유전자좌 (도 98f) Bcl11a 인핸서 및 (도 98g) HBG 프로모터에 대한 단일 gRNA 벡터로 관찰된 것과 유사한 유사한 편집 수준을 달성한다. (도 98h) HD-AD5/35++ "Dual" gRNA 벡터는 단일 gRNA 벡터로 관찰된 것과 유사한 표적 유전자좌의 편집 수준을 달성한다. (도 98i) HbF+ 세포의 상당히 더 높은 백분율은 단일 gRNA 벡터와 비교하여 HD-Ad5/35 "Dual" gRNA 벡터로 형질도입된 HUDEP-2 세포에서 유세포 분석에 의해 관찰되었다. 유세포 분석 데이터를 요약하는 막대 차트는 유세포 분석 데이터 아래에 있다. (도 98j) HPLC에 의해 측정된 전반적인 감마 글로빈 발현은 이중 표적화된 샘플에서 상당히 더 높았다. (도 98k) 단일 녹아웃(knock-out) 클론보다 이중 녹아웃 클론에서 상당히 더 높은 태아 글로빈 발현이 관찰었으며 이는 더 높은 감마 발현/세포로 이어지는 2 개의 돌연변이의 가능한 상승 효과를 암시한다. (도 98l) 도식은 말초 혈액 동원된 CD34+ 세포가 HDAd5/35++ CRISPR 벡터로 형질도입되었음을 나타낸다. CRISPR/Cas9 세포독성을 최소화하기 위해, 세포를 항-Cas9 펩티드를 발현하는 HDAd5/35++ 벡터로 후속적으로 형질도입하였다. 세포를 준치명적으로 조사된 NSG 마우스 내로 이식하고 분석하였다. (도 98m) 이식 후 10 주차에, HD-Ad5/35 "Dual" gRNA 벡터로 형질도입된 세포는 단일 gRNA 벡터로 형질도입된 세포와 유사한 생착을 나타내었다. 계통 조성물은 모든 그룹에서 유사하였다. (도 98n) 이중 gRNA 벡터에 의해 형질도입되고 편집된 CD34+ 세포는 NSG 마우스에서 효율적으로 주입되었다. 또한, 적혈구 분화 후 주입된 이중 표적화된 세포는 상대적으로 더 낮은 편집 수준에도 불구하고, 단일 표적화된 세포와 비교하여, 대조군에 대해 더 높은 수준의 감마 글로빈을 발현하였다.
도 99a-99u. 이중 편집된 정상 및 thal CD34+ 세포의 생체외 형질도입. (도 99a) 실험 설계. 정상 CD34+ 세포에 대해 15 일째에 콜로니에서 (도 99b) HBF 발현 및 (도 99c) MFI. *는 p=0.034를 나타낸다. (도 99d) 정상 CD34+ 세포에서 15 일째에 콜로니에서 HBF 발현을 설명하는 유세포 분석 데이터. 정상 CD34+ 세포에 대한 적혈구 분화(ED) 후 (도 99e) HBF 발현 및 (도 99f) MFI. *는 p=0.01을 나타낸다. 정상 CD34+ 세포에서 형질도입 후(txd) 48 시간에 (도 99g) HBG 부위에 대한 TE71 및 (도 99h) BCL11A 부위에 대한 TE71. (도 99i) EC 및 적혈구 분화에서 HBF 발현을 설명하는 유세포 분석 데이터. (도 99j-99u) Thal CD34+ 세포. (도 99j) 0 일차 세포, 형질도입되지 않은 세포 및 CRISPR-Dual으로 형질도입된 세포의 면역표현형 및 (도 99k) 11 일에 걸쳐 형질도입되지 않은 세포 및 CRISPR-Dual으로 형질도입된 세포를 비교하는 성장 곡선. 15 일째에 콜로니에서 (도 99l) HBF 발현 및 (도 99m) MFI. **는 p=0.0046을 나타낸다. (도 99n) 형질도입되지 않은 세포에 대한 CRISPR-Dual을 비교하는 적혈구 및 골수성 구획에서 HBF 발현. (도 99o) 형질도입되지 않은 세포에 대한 CRISPR-Dual A 및 B를 비교하는 적혈구 및 골수성 구획에서 HBF 발현. (도 99p) EC에서 HBF 발현 및 (도 99q) MFI. ***는 p=0.0003을 나타내고 ****는 p=0.00003을 나타낸다. (도 99r) P04 및 P18에서 HBF 발현을 설명하는 유세포 분석 데이터. (도 99s, 99t) (도 99s) p04 및 (도 99t) p18에서 HBG 부위 적혈구 분화에 대한 TE71. (도 99u) 형질도입 48 시간 후 BCL11A 부위에 대한 TE71.
도 100. γ-글로빈 유전자 추가 및 내인성 γ-글로빈 재활성화의 조합을 설명하는 그래픽 요약.
도 101. 본원에 사용되는 HDAd5/35++ 벡터. γ-글로빈 유전자 추가는 발현 카세트를 플랭킹하는 IR 및 frt 부위가 있는 트랜스포존 벡터(HDAd-combo 및 HDAd-SB-추가 참조) 및 SB100x 및 Flpe 재조합효소를 트랜스로 제공하는 제2 벡터(HDAd-SB)로 이루어진 SB100x 트랜스포사제 시스템을 통해 달성된다. 무작위 통합을 위한 트랜스포존 카세트는 인간 γ-글로빈의 적혈구 특이적 발현을 위한 미니 β-글로빈 LCR/프로모터로 이루어진다. 3'UTR은 적혈구 세포에서 mRNA 안정화를 제공한다. γ-글로빈 발현 단위는 보편적으로 활성인 PGK 프로모터로부터 mgmtP140K 발현을 위한 카세트에서 닭 글로빈 HS4 절연체에 의해 분리된다. HDAd-CRISPR 및 HDAd-combo 벡터에서 CRISPR/Cas9 카세트는 EF1α 프로모터 제어 하에 SpCas9인 HBG1/2 프로모터 내의 BCL11A 결합 부위에 특이적인 U6 촉진-구동된 sgRNA로 이루어진다. HDAd 생산자 세포에서 Cas9의 발현은 miRNA 조절 시스템에 의해 억제된다(Saydaminova 등, Mol Ther Methods Clin Dev. 2015, 1: 14057, 2015). HDAd-combo에서, CRISPR/Cas9 카세트는 트랜스포존 외부에 배치되어 Flpe/SB100x-매개 통합 시 손실될 것이다(도 102 참조).
도 102. 제어된 Cas9 발현에 대한 도식. HDAd-combo에서, Flpe 재조합효소와 frt 부위의 상호작용은 트랜스포존의 원형화를 야기하여, CRISPR 카세트를 함유하는 벡터의 선형 단편을 남긴다. SB100x/Flpe 시스템을 사용한 이전 연구는 원형화된 트랜스포존이 SB100x에 의해 숙주 게놈 내로 통합되는 동안 이들 벡터 부분이 빠르게 손실됨을 임증하였다(Yant 등, Nat Biotechnol., 20: 999-1005, 2002).
도 103a-103d. Cas9 및 γ-글로빈 발현을 분석하기 위해 HUDEP-2 세포를 사용한 시험관내 연구. (도 103a 및 103b) 웨스턴 블롯에 의한 Cas9 발현의 분석. HUDEP-2 세포를 HDAd-combo 단독으로 및 HDAd-SB와 조합하여(즉, Flpe 및 SB100x를 트랜스로 제공하는 벡터) 형질도입하였다. 시험관내 적혈구 분화를 형질도입 후 4 일에 시작하고 8 일 동안 계속하였다. (적혈구 분화는 γ-글로빈 발현을 허용한다). 오른쪽 패널: Cas9 및 β-액틴 항체를 프로브로서 사용하는 대표적인 웨스턴 블롯. 왼쪽 패널: Cas9 신호의 요약. 막대는 HDAd-SB 공동 감염이 있거나 없는 Cas9, 즉, Flpe/SB100x 메커니즘에 의한 Cas9의 감소를 비교한다. (도 103c) 유세포 분석에 의한 γ-글로빈 발현 분석. HUDEP-2 세포를 HDAd-CRISPR("cut"), HDAd-SB-add("add")+HDAd-SB, 또는 HDAd-combo("combo")+HDAd-SB로 형질도입하고 표시된 시점에 분석하였다. (도 103d) qRT-PCR에 의한 γ-글로빈 mRNA 수준. d.p.t., 형질도입 후 일. Diff, 분화. * p<0.05
도 104a-104i. CD46/β-YAC 마우스의 생체내 형질도입 후 γ-글로빈 발현 연구. (도 104a) 실험 도식. HSPC를 4 일 동안 인간 재조합 G-CSF의 피하(s.c.) 주사 이어서 AMD3100의 1 회 s.c. 주사에 의해 동원하였다. AMD3100 주사 후 30 및 60 분에, 동물에게 다음 HDAd 벡터의 1:1 혼합물을 정맥내로 주사하였다(2 회 주사, 각각 4x1010 vp): HDAd-combo+HDAd-SB, HDAd-SB-add+HDAd-SB, 및 HDAd-cut. 인간 γ-글로빈 및 MGMT에 대한 면역 반응을 피하기 위해 마우스를 다음 4 주 동안 면역억제성(IS) 약물로 처리하였다. 4 주차에, O6-BG/BCNU 처리를 시작하고 2 주마다 3 회 반복하였다. 각 주기마다, BCNU 농도를 5 mg/kg에서 7.5 mg/kg 내지 10 mg/kg까지 증가시켰다. 18 주차에 동물을 조직 샘플 분석 및 치명적으로 조사된 C57Bl/6 마우스 내로 2차 이식을 위한 골수 Lin- 세포 수확을 위해 희생시킨 다음, 이후 16 주 동안 추적하였다. (도 104b) "combo" 및 "cut" 그룹에 대한 유세포 분석에 의한 말초 적혈구에서 γ-글로빈 발현의 검출. (도 104c) HPLC에 의해 측정된 γ-글로빈 단백질 수준. 오른쪽 패널: 인간 β-글로빈, 재활성화된 인간 Aγ, 및 추가된 γ-글로빈 쇄가 표시된 RBC 용해물(18 주)의 크로마토그램. 왼쪽 패널: HPLC 데이터의 요약. "cut", "add", 및 "combo" 벡터로 처리된 CD46/β-YAC 마우스에 대한 인간 β -글로빈에 대한 총 γ-글로빈의 백분율이 제시된다. *: p<0.05, n.s.. (도 104d) 마우스 β-주요 mRNA 발현에 대한 γ-글로빈 mRNA 발현(qRT-PCR에 의해 측정). (도 104e) CRISPR/Cas9에 의한 퍼센트 표적 부위 절단. 생체내 "cut" 및 "combo" 형질도입된 마우스로부터 18 주차에 수확된 PBMC 및 골수 MNC로부터의 게놈 DNA를 T7EI 검정에 적용하였다. 도 105의 데이터에 대한 요약이 제시된다. * p<0.05). (도 104f) "add" 및 "combo" 벡터로 형질도입 후 18 주차에 골수 HSPC에서 측정된 통합 벡터 카피 수. 그룹 사이의 차이는 유의하지 않다. (도 104g) "combo" 벡터 처리된 마우스의 개별 CFU에서 VCN의 스펙트럼. 골수 Lin- 세포를 전구체 검정을 위해 플레이팅하고 VCN을 qPCR에 의해 개별 콜로니에서 측정하였다. 4 마리의 상이한 마우스의 데이터가 제시된다. (도 104h) HPLC에 의한 인간 γ/인간 β 글로빈 단백질. (도 104i) 마우스 β-주요 mRNA 발현에 대한 인간 γ-글로빈 mRNA 발현의 백분율.
도 105a, 105b. 표시된 인간 β- 및 γ-글로빈 피크가 있는 RBC 용해물의 크로마토그램. (도 105a) 상부 패널은 처리 전 β-YAC 마우스를 나타낸다. 중간 패널은 HDAd-CRISPR("cut") 형질도입 후 18 주를 제시한다. 왼쪽 패널은 Gγ 및 Aγ 둘 다의 재활성화를 나타낸다. 하부 패널은 HDAd-CRISPR("cut") 형질도입 후 18 주를 나타낸다. (도 105b) 피크는 마지막 하단 패널에 표지되어 있다. 각 크로마토그램은 개별 동물이다. 인간 β-글로빈은 감소하고 γ-글로빈은 증가함에 유의한다(역 글로빈 스위치).
도 106. "cut" 및 "combo" 벡터로 형질도입 후 16 주차에 혈액, 비장, 및 골수의 MNC에 대한 T7EI 검정 데이터. 특이적 CRISPR/Cas9 절단 단편(255 및 110 bp)은 화살표로 표시된다. 밴드 신호 정량화에 기반한 절단 백분율은 각 레인 아래에 제시된다.
도 107a-107f. CD46/β-YAC 형질도입된 마우스로부터 Lin- 세포의 2차 수용자 분석. (도 107a) 표시된 시점에서 인간 γ-글로빈 발현 말초 혈액 RBC의 백분율. 모든 마우스는 이식후 4 주부터 시작하여 면역억제를 받았다. (도 107b) 이식 후 16 주차에 인간 β-글로빈에 대한 γ-글로빈 단백질의 수준. (도 107c 및 107d) 마우스 β주요-글로빈 및 인간 β-글로빈에 대한 γ-글로빈 단백질의 수준. (도 107e) 형질도입되지 않은 대조군 마우스와 비교하여 "combo" 벡터로 형질도입 후 16 주차에 혈액, 비장, 및 골수의 MNC에서 계통-양성 세포 조성물. 도 107f. γ-글로빈 프라이머를 사용하여 qPCR에 의해 측정된 HDAd-comb 그룹의 총 백혈구에서 세포 당 벡터 카피 수.
도 108a-108d. SCD에 대한 모델로서 삼중 유전자이식 CD46/Townes 마우스의 생성 및 특성화. (도 108a) CD46/Townes 마우스의 번식. Townes 마우스(hα/hα::βSS)를 3 차례에 걸쳐 CD46 유전자이식 마우스와 번식시켰다. CD46, HbS 및 HBA에 대해 동형접합성인 동물을 생체내 형질도입 연구에 사용하였다. (도 108b) 부동변형적혈구증가증, 다염적혈구증가증(검정색 화살표), 겸상 및 단편화 세포(별표가 있는 검정색 화살표)를 포함하는 인간 질환의 전형적인 특징이 있는 CD46/Townes 마우스의 말초 혈액 도말 스케일 바는 15 μm이다. (도 108c) 모체 "건강한" CD46-유전자이식 마우스와 비교하여 CD46/Townes 마우스의 말초 혈액의 혈액학적 분석. Ret: 망상적혈구; RBC: 적혈구, Hb: 헤모글로빈; HCT: 적혈구용적률; WBC: 백혈구. 모든 차이는 유의하다(p<0.05). (도 108d) CD46/Townes 마우스에서 비장비대. CD46tg 및 CD46/Townes 마우스에서 비장 대 체중의 비율이 제시된다. N=3.
도 109a-109f. CD46/Townes 마우스의 생체내 HSPC 형질도입 후 γ-글로빈 발현. 마우스를 동원하고, HDAd-combo+HDAd-SB를 주사하고, 도 104에 대해 기재된 바와 같이 O6BG/BCNU로 처리하였다. (도 109a) 유세포 분석에 의해 측정된 말초 RBC에서 γ-글로빈 마킹. 빈 사각형은 미처리 CD46/Townes 마우스의 RBC에서 마킹을 나타낸다. 수직 화살표는 생체내 선택 주기를 나타낸다. (도 109b) HPLC에 의해 13 주차에 측정된 RBC에서 γ-글로빈 수준. 왼쪽 패널: 개별 마우스에서 인간 α-글로빈 및 βs-글로빈 쇄에 대한 총 γ-글로빈 수준의 요약. 빈 사각형은 미처리 CD46/Townes 마우스에서 RBC의 수준을 나타낸다. 오른쪽 패널: 처리 전(상부 패널) 및 HDAd-combo+HDAd-SB로 생체내 HSPC 형질도입 후 13 주차에 CD46/Townes 마우스의 대표적인 크로마토그램. 인간 β-, βs, 재활성화된 Aγ, 및 추가된 γ-글로빈에 대한 피크가 표시된다. (도 109c) HPLC에 기반한 재활성화된 Aγ의 백분율. (도 109d) 개별 마우스에서 인간 α-글로빈 및 βs-글로빈 mRNA에 대한 총 γ-글로빈 mRNA의 백분율. (도 109e) HDAd-combo로 형질도입 후 163 주차에 골수 HSPC에서 측정된 통합 벡터 카피 수. (도 109f) HDAd-combo의 주사 후 13 주차에 CD46/Townes 마우스의 HBG1/2 표적 부위 절단 총 골수 핵 세포, Lin- 세포, PBMC, 및 비장세포. 특이적 CRISPR/Cas9 절단 단편(255 및 110 bp)은 화살표로 표시된다. 밴드 신호 정량화에 기반한 절단 백분율은 각 레인 아래에 제시된다.
도 110a, 110b. 형질도입된 CD46/Townes 마우스의 Lin- 세포로 이식된 2차 수용자의 분석. (도 110a) 인간 γ-글로빈 발현 말초 혈액 RBC의 백분율. (도 110b) 이식 후 16 주차에 인간 α- 및 βS 글로빈에 대한 γ-글로빈 단백질의 수준.
도 111a-111c. 혈액에서 표현형 교정. (도 111a) 브릴리언트 크레실 블루에 의한 망상적혈구에 대해 염색된 혈액 도말. 이 염료는 핵 및 세포질 구획의 잔류물을 염색한다. (정량화는 도 109c, 막대의 첫번째 그룹에서 발견될 수 있다). 스케일 바는 20 μm이다. (도 111b) HDAd-combo 유전자 요법 후 적혈구의 정상적혈구 형태학을 나타내는 혈액 도말. (도 111c) 말초 혈액의 혈액학적 분석. "CD46" 및 "combo 후 13 주차 CD46/Townes" 사이의 차이는 유의하지 않다.
도 112a-112c. 비장 및 간에서 표현형 교정. (도 112a) 조직 조직학. 상부 패널: 비장에서 철분 침착. Perl의 프러시안 블루 염색에 의해 비장 절편에서 헤모시데린을 검출하였다. 스케일 바는 20 μm이다. 중간 및 하부 패널: 비장 및 간 절편에서 헤마톡실린/에오신 염색에 의한 골수외 혈구형성. 간에서 적혈구모세포 및 CD46/Townes 마우스의 비장에서 거핵구의 클러스터는 흰색 화살표로 표시된다. 스케일 바는 20 μm이다. 대표적인 이미지가 제시된다. (도 112b) 처리된 CD46/Townes 마우스에서 보상 혈구형성의 측정가능한 특성인 비장 크기는 모체 CD46 마우스와 비교가능하다. (도 112c) 도 112a의 간 절편 이미지의 4-배 더 큰 배율. 처리 전에 CD46/Townes 마우스의 간 동양혈관에 포획된 겸상 RBC(왼쪽 패널) 및 처리 후에 간 동양혈관에서 겸상 적혈구의 부재(오른쪽 패널).
도 113. Ad5/35 헬퍼 바이러스 게놈의 왼쪽 단부. 진회색으로 음영 처리된 서열은 천연 Ad5 서열에 상응하며, 즉, 음영 처리되지 않거나 또는 연회색으로 강조된 서열은 인공적으로 도입되었다. 연회색으로 강조된 서열은 (나란히 반복된) loxP 서열의 2 개 카피이다. "cre 재조합효소" 단백질의 존재 하에, 2 개의 loxP 서열 사이의 뉴클레오티드 서열이 결실된다(loxP의 하나의 카피만 남아 있음). loxP 부위 사이의 Ad5 서열은 아데노바이러스 DNA를 (생산자 세포의 핵에서) 캡시드 내로 패키징하는 데 필수적이기 때문에, 이 결실은 패키징할 수 없는 헬퍼 아데노바이러스 게놈 DNA를 초래한다. 결과적으로, 결실 과정의 효율은 패키징된 헬퍼 게놈 DNA의 수준(원치않은 헬퍼 바이러스 "오염")에 직접 영향을 미친다. 상기 관점에서, Ad5 이외의 아데노바이러스 혈청형에 대해 동일한 체계를 번역하기 위해, 다음을 달성하는 것이 바람직하다: 1. loxP 서열 삽입에 의해 플랭킹되고 cre 재조합효소의 존재 하에 결실될 수 있도록 패키징에 필수적인 서열을 식별한다. 이러한 서열의 식별은 서열에서 유사성이 거의 없는 경우 간단하지 않다. 2. 천연 DNA 서열에서 loxP 서열의 삽입이 헬퍼 바이러스의 증식 및 패키징에 최소 영향을 미칠 위치를 결정한다(cre 재조합효소의 부재 하에). 3. 헬퍼-의존적 아데노바이러스의 생산 동안(즉, 116 세포주와 같은 cre 재조합효소 - 발현 세포주에서) 헬퍼 바이러스 패키징을 최소로 유지하고 패키징 서열의 효율적인 결실을 허용하기 위해 loxP 서열 사이의 간격을 결정한다.
도 114. Ad5 및 Ad35 패키징 신호의 정렬(서열번호: 49 및 50). Ad5의 왼쪽 단부 서열과 Ad35의 정렬은 패키징 신호를 식별하는 데 도움을 준다. 패키징(AI 내지 AV)에 중요한 Ad5 서열의 모티프는 상자에 있다(Schmid 등, J Virol., 71(5):3375-4, 1997의 도 1b 참조). loxP 삽입 부위의 위치는 검정색 화살표로 표시된다. 삽입은 AI 내지 AIV를 플랭킹하고 AV를 방해하는 것으로 보인다. Schmid 등에 표시된 바와 같은 추가적인 패키징 신호 AVI 및 AVII은 이 벡터의 E1 결실의 일부로서 Ad5 헬퍼 바이러스에서 결실되었음에 유의한다.
도 115. pAd35GLN-5E4의 도식. 이는 재조합 기술을 사용하여 벡터화된 Ad35 게놈(ATCC의 Holden 균주)에서 유래된 1세대(E1/E3-결실) Ad35 벡터이다(PMID: 28538186). 그런 다음 이 벡터 플라스미드를 사용하여 loxP 부위를 삽입하였다.
도 116. 플라스미드 패키징 신호에 대한 정보. 패키징 부위(PS)1 LoxP 삽입 부위는 뉴클레오티드 178 및 344 뒤에 있다. 이는 AI 내지 AIV를 제거하여야 한다. AVI 및 AVII을 포함하는 나머지 패키징 신호(344 이후)는 결실되었다(E1 결실(345 내지 3113)의 일부). PS2 LoxP 삽입 부위는 뉴클레오티드 178 및 481 뒤에 있다. 추가적으로, 뉴클레오티드 179 내지 365는 결실되어, AI 내지 AV는 존재하지 않는다. 나머지 패키징 모티프 AVI 및 AVII은 HDAd 생산 동안 cre 재조합효소에 의해 제거가능하다. E1 결실은 482에서 3113까지이다. PS3 LoxP 삽입 부위는 뉴클레오티드 154 및 481 뒤에 있다. 3 개의 조작된 벡터가 구제될 수 있다. 재배열된 loxP 부위가 있는 바이러스 게놈의 백분율은 PS1, PS2, 및 PS3에 대해 각각 50, 20, 및 60%였다. lox P 부위가 바이러스 복제 및 유전자 발현에 중대하게 영향을 미칠 때 재배열이 발생한다. 재배열된 loxP 부위가 있는 벡터는 패키징될 수 있고 HDAd prep을 오염시킬 것이다. 서열번호: 286, 51, 및 52는 각각 PS1, PS2, 및 PS3으로 도해된 벡터를 예시한다.
도 117. 현재 HDAd5/35 플랫폼과 비교한 차세대 HDAd35 플랫폼. 두 벡터는 CMV-GFP 카세트를 함유한다. Ad35 벡터는 면역원성 Ad5 캡시드 단백질을 함유하지 않는다. 시험관내에서 CD34+ 세포의 비슷한 형질도입 효율을 나타낸다. 가교 연구는 시험관내에서 CD34+ 세포의 비슷한 형질도입 효율을 나타낸다. G-CSF 동원된 공여자의 말초 CD34+ 세포인 인간 HSC를 HDAd35(Ad35 헬퍼 P-2로 생성) 또는 Ad5 캡시드와 Ad35의 섬유를 함유하는 키메라 벡터로 500, 1000, 2000 vp/세포의 MOI에서 형질도입하였다. GFP-양성 세포의 백분율을 3 개의 독립적인 실험에서 바이러스 추가 후 48 시간에 측정하였다. 특히, HDAd35로 감염은 헬퍼 바이러스 오염으로 인해 48 시간에 세포변형 효과를 촉발하였다.
도 118. PS2 헬퍼 벡터를 원숭이 연구에 초점을 맞춰 새로 만들었다. 다음으로부터 학습된 조치가 이어진다: E1 영역의 결실, Loxp에 의해 플랭킹된 돌연변이체 패키징 신호, 돌연변이체 패키징 서열, E3 영역의 결실(27435→30540), Ad5E4orf6으로 대체, copGFP 카세트를 플랭킹하는 스터퍼 DNA의 삽입, 및 놉에 돌연변이를 도입하여 Ad35K++ 제조.
도 119. 돌연변이된 패키징 신호 서열이 제공된다. 잔기 1 내지 137은 Ad35 ITR이다. 굵은 글씨는 SwaI 부위이고, Loxp 부위는 이탤릭체이고, 돌연변이된 패키징 신호는 밑줄로 표시된다.
도 120a, 120b. 다양한 헬퍼 벡터 및 패키징 신호 변이체의 개략적 도면. 구현예에서, E3 영역(27388 → 30402)은 결실되고 CMV - eGFP 카세트는 E3 결실, Ad35K++ 내에 위치하고, eGFP는 copGFP 대신에 사용된다. (도 120a)에 제시된 패키징 신호 변이체를 함유하는 4 개의 헬퍼 벡터 모두 구제될 수 있다. loxP 부위는 증폭이 보다 효율적일 수 있을 때 재배열되었다. 추가적인 패키징 신호 변이체는 도 120b에 예시되어 있다.
도 121. HDAd-combo 벡터의 묘사.
도 122. 실험 프로토콜.
도 123. +58 적혈구 bcl11a 인핸서 영역 내에서 GATAA 모티프를 편집하기 위한 벡터. 벡터 구조는 상부 패널에 제시되어 있다. 두 벡터는 GATAA 모티프를 표적화한다. 하부 패널은 HDAd-C-BE 벡터에 의해 매개된 염기 변화를 나타낸다. (서열번호: 65-68)
도 124a-124c. 인간 CD34+ 세포에 대한 벡터 분석. (도 124a) 세포를 2000 vp/세포의 MOI에서 감염시키고 1 일 후에 18 일 동안 적혈구 분화에 적용하였다. (도 124b) 상이한 시점에서 T7E1A 검정에 의한 표적 부위 절단을 위해 세포 분취액을 분석하였다. 왼쪽 막대: HDAd-wtCRISPR, 오른쪽 막대: HDAd-C-BE. (도 124c) 적혈구 분화의 종료에 γ-글로빈+ 세포의 백분율.
도 125. HDAd-wtCRISPR 및 HDAd-C-BE 형질도입된 CD34+ 세포의 생착. 형질도입의 MOI는 2000 vp/세포였다. 생착은 말초 혈액 단핵 세포에서 인간 CD45+ 세포의 백분율에 기반하여 측정하였다.
도 126. 염기 편집기 HDAd 벡터. sgRNA는 HBG1/2에서 적혈구 bcl11a 인핸서(상부 패널) 또는 BCL11a 단백질 결합 부위를 표적화한다. 중간 패널은 적혈구 전구체 세포주 HUDEP-2의 적혈구 분화 당일에 염기 전환율 %을 나타낸다. 오른쪽 패널은 γ-글로빈 재활성화 수준을 나타낸다. (서열번호: 67, 65, 및 71)
도 127a, 127b. (도 127a) 전형적인 겸상-유사 적혈구를 사용한 혈액 도말. (도 127b) 적혈구 매개변수.
도 128a-128c. (도 128a) 생체내 선택 없이 Townes/CD46 마우스의 생체내 형질도입. (도 128b) RBC에서 γ-글로빈 재활성화. (도 128c) 처리 전 및 처리 8 주차에 혈액 도말의 망상적혈구 염색.
도 129a-129d. 동원된 원숭이에서 생체내 HSC 형질도입. G-CSF, SCF, 및 AMD3100으로 동원 후, 2 마리의 수컷 원숭이에게 정맥내 주사에 의해 HDAd-GFP(1x1012vp/kg)를 제공하였다. HDAd 주사 전에, 동물을 덱사메타손을 전처리하여 가능한 사이토카인 방출을 차단하였다. (도 129a) 표시된 시점으로부터 정제된 말초 혈액 CD34+ 세포를 배양하고 유세포 분석에 의해 GFP 발현에 대해 분석하였다. 배양물에서 4 일에 걸쳐 GFP를 발현하는 세포의 평균 퍼센트가 제시된다 (도 129b) HDAd-GFP 주사 전(0 시간) 또는 후(6 시간) GFP를 발현하는 정제된 CD34+ 세포의 대표적인 흐름도. (도 129c) 콜로니 형성 검정을 말초 혈액 또는 총 PBMC로부터 정제된 CD34+ 세포로 개시하였다. 배양물에서 14 일 후, 개별 콜로니를 선별하고 PCR에 의해 GFP DNA의 존재에 대해 분석하였다. (도 129d) 골수 CD34+ 세포에서 GFP 발현의 분석. 대표적인 블롯이 제시된다. 이 연구에서, HDAd-GFP만을 주사하고 따라서 단기간 GFP 발현만을 측정하였다.
도 130. 가이드 서열의 스크리닝. HUDEP-2 세포를 표 14에 나열된 염기 편집기로 형질감염시켰다. γ-글로빈 발현을 형질감염 후 4 일차(4dpt) 및 시험관내 적혈구 분화 후 6 일차(Diff 6d)에 측정하였다. HBG1/2 프로모터에서 TGACCA 모티프를 표적화하는 CRISPR/Cas9 벡터를 양성 대조군(pos ctrl)으로 사용하였다. CBE 표적화 CCR5 코딩 영역을 음성 대조군(sgNeg)으로 포함하였다. 제시된 데이터(평균 ± SD)는 2 개의 독립적인 실험을 나타낸다.
도 131a, 131b. 상이한 버전의 사이티딘 염기 편집기의 비교. (도 131a) 293 세포(HEK293)를 WTCas9 또는 BE 벡터 + pSP-BE4-sgBCL11Ae1(3 + 1 μg)로 형질감염시키고 bcl11a 인핸서 표적 부위 절단 부위는 T7E1 검정에 의해 형질감염 4 일 후에 분석하였다. (도 131b) 동일한 연구를 적혈구백혈병 세포주(K562) WTCas9 또는 BE 벡터 + pSP-BE4-sgBCL11Ae1(2 + 0.66 μg)에서 수행하였다.
도 132a-132c. HDAd5/35++_BE 벡터의 설계 및 구제. (도 132a) 사이티딘 염기 편집기(CBE) 벡터 설계. 구제가능하지만 낮은 수율. (도 132b) 아데닌 염기 편집기(ABE) 벡터 설계의 첫번째 버전. 구제가능하지 않음. (도 132c) 반복성을 감소시키기 위한 ABE 코돈 최적화. TadA(tRNA 아데노신 데아미나제 효소)의 코돈 최적화를 나타내는 서열 비교를 포함한다(서열번호: 260 및 261)
도 133a-133h. HDAd5/35++_BE 벡터의 구축 및 검증. (도 133a) HDAd_ABE 벡터 다이어그램. 2 개의 frt-IR에 의해 플랭킹된 4.2 kb MGMT/GFP 카세트는 HDAd_SB 벡터와 공동-전달될 때 통합된 발현을 허용한다. 8.0 kb 염기 편집기 구성요소를 일시적 발현을 위해 트랜스포존 외부에 설계하였다. 2 개의 TadAN 반복부는 반복 서열을 감소시키기 위해 코돈 최적화되었다(*는 촉매 반복부를 나타낸다). microRNA 반응성 요소(miR)를 3' 인간 β-글로빈 UTR에 포매시켜 116 세포에서 ABE 발현을 특이적으로 하향조절함으로서 생산자 세포에 대한 독성을 최소화하였다. PGK, 인간 PGK 프로모터. bGHpA, 소 성장 호르몬 폴리아데닐화 서열. SV40pA, 시미안 바이러스 40 폴리아데닐화 신호. ITR, 도립된 말단 반복부. Ψ, 패키징 신호. (도 133b) 생성된 바이러스 벡터의 정보. 나열된 수율은 하나의 3L 스피너로부터 기인한다. (도 133c) HUDEP-2 세포에서 바이러스 벡터의 검증. 세포를 표시된 MOI(vp/세포)에서 다양한 벡터로 형질도입하였다. γ-글로빈 발현을 형질감염 후 4 일차(4dpt) 및 시험관내 적혈구 분화 후 6 일차(Diff 6d)에 측정하였다. CCR5 코딩 영역을 표적화하는 CBE 벡터를 음성 대조군(sgNeg)으로 포함하였다. 제시된 데이터(평균 ± SD)는 2 개의 독립적인 실험을 나타낸다. (도 133d) HDAd_sgHBG#2에 의한 표적 염기 전환. 표적화 염기를 포함하는 HBG1 또는 HBG2 게놈 분절을 증폭시키고 Sanger 서열분석에 적용하였다. 데이터를 EditR 1.0.9에 의해 분석하였다. 화살표는 표적화 염기를 나타낸다. 전환율 %은 크로마토그램 아래에 제시되었다. (도 133e) 분화 후 6 일차에 HPLC에 의해 측정된 α- 또는 β-글로빈에 대한 γ-글로빈 발현의 %. MOI=1000. 제시된 데이터(평균 ± SD)는 2 개의 독립적인 실험을 나타낸다. 도 133f-133h) HDAd_sgHBG#2로 형질도입된 HUDEP-2 세포로부터 유래된 대표적인 클론(#3). 단일대립유전자성 -116A→G 염기 전환이 HBG1 프로모터에서 검출되었으며(도 133f), 이는 유세포 분석에 의한 100% γ-글로빈+ 세포를 초래하였다(도 133g). γ-글로빈 단백질 수준은 HPLC에 의해 측정하였다(도 133h).
도 134a-134c. 도 133을 뒷받침하는 데이터. (도 134a) 도 133d의 보충. 표시된 바이러스로 처리된 HUDEP-2 세포에서 표적 염기 전환. (도 134b) 대표적인 단일 세포 HUDEP-2 클론. 도 133f의 보충. 화살표가 있는 B는 이중대립유전자성 편집을 나타내고 M 및 화살표는 단일대립유전자성 편집을 나타낸다. (도 134c) 상응하는 단일 세포 HUDEP-2 클론에서 γ-글로빈 발현은 상기 제시된다. 도 133g의 보충.
도 135a-135i. 생체내 형질도입 및 선택 후 βYAC 마우스에서 γ-글로빈의 재활성화. (도 135a) 실험 절차. β-YAC/CD46 마우스(n=9)를 G-CSF/AMD3100에 의해 동원하고 HDAd_sgHBG#2 + HDAd_SB로 생체내 형질도입하였다. O6BG/BCNU에 의한 4 차례의 선택을 형질도입 후 각각 4, 6, 8 및 10 주차에 수행하였다. 마우스를 16 주차에 안락사시켰다. 계통- 세포를 단리하고 치명적으로 조사된 C57BL/6 마우스에 IV 주사하였다. 2차 이식된 마우스를 이후 16 주 동안 추적하였다. (도 135b) 형질도입 후 상이한 시점에서 PBMC의 GFP 마킹. 각 점은 1 마리의 동물을 나타낸다. (도 135c) PBMC에서 GFP 발현의 대표적인 점 플롯. (도 135d) 유세포 분석에 의해 측정된 혈액 세포에서 γ-글로빈 발현. (도 135e) 혈액 세포에서 γ-글로빈 발현의 대표적인 점 플롯. (도 135f) 1차 마우스의 종료점에서 혈액 및 골수의 Ter-119+ 및 Ter-119- 세포에서 유세포 분석에 의한 γ-글로빈 발현. (도 135g) HPLC에 의해 측정된 적혈구 용해물에서 γ-글로빈 단백질 수준. 제시된 데이터는 마우스 α- 또는 β-글로빈 또는 인간 β-글로빈에 대한 백분율이다. (도 135h) RT-PCR에 의해 측정된 mRNA 수준에서 γ-글로빈 발현. 제시된 데이터는 마우스 HBA 또는 HBB, 또는 인간 HBB mRNA에 대한 배수 변화이다. (도 135i) 총 골수 세포에서 벡터 카피 수(세포 당 카피). MGMT에 대한 프라이머를 사용하였다.
도 136. 도 135h에 제시된 대표적인 데이터의 HPLC 플롯.
도 137a-137g. 표적 염기 전환. (도 137a) sgHBG#2 가이드 서열. 넘버링은 5' 단부에서 시작하였다. 주황색 배경으로 강조된 것은 보고된 BCL11A 결합 부위인 TGACCA 모티프이다. 모티프에서 2 개의 아데닌(A5 및 A8)은 2 개의 화살표로 표시하였다. (도 137b) 표적 염기 전환 백분율. HBG1HBG2 프로모터 영역에서 두 A5 및 A8이 제시되었다. 각 점은 1 마리의 동물을 나타낸다(n=9). (도 137c) 마우스 #1108의 HBG1HBG2 영역에서 표적 염기 전환을 나타내는 대표적인 크로마토그램. (도 137d) γ-글로빈 발현에 대한 평균 염기 전환 사이의 상관관계. 각 동물에서 평균 염기 전환 백분율은 HBG1HBG2 프로모터 영역의 A5 및 A8에서 평균 수준이었다. 각 점은 1 마리의 동물을 나타낸다(n=9). (도 137e) A5 및 A8에서 염기 전환 비교. 각 점은 1 마리의 동물을 나타낸다(n=9). (도 137f) 표적화된 아데닌 뉴클레오티드에서 전환 백분율을 나타내는 차트. (도 137g) 특정 마우스에서 표적화 염기 전환을 나타내는 크로마토그램(서열번호: 250).
도 138a-138d. 안전성 프로파일. (도 138a) 형질도입 후 16 주차에 혈액 샘플을 사용한 HEMAVET®에 의한 혈액학 분석. 제시된 데이터는 HDAd_sgHBG#2로 형질도입된 9 마리의 마우스 및 3 마리의 형질도입되지 않은 대조군 마우스를 나타내는 평균 ± SD이다. (도 138b) 16 주차에 혈액 샘플의 망상적혈구 백분율. 샘플을 브릴리언트 크레실 블루로 염색하였다. 제시된 데이터는 HDAd_sgHBG#2로 형질도입된 4 마리의 마우스 및 3 마리의 형질도입되지 않은 대조군 마우스를 나타내는 평균 ± SD이다. (도 138c) 1차 마우스의 종료점에서 골수 MNC의 세포 조성물. 형질도입되지 않은 마우스를 대조군으로 사용하였다. 각 점은 1 마리의 동물을 나타낸다. (도 138d) 브릴리언트 크레실 블루로 염색한 대표적인 망상적혈구.
도 139a-139c. 2차 이식. (도 139a) 유세포 분석을 사용하여 PBMC에서 인간 CD46 발현에 의해 측정된 생착. (도 139b) PBMC에서 GFP 발현. (도 139c) γ 유세포 분석에 의해 검출된 말초 혈액 세포에서 γ-글로빈 발현.
도 140a, 140b. 유전자간 결실의 검출. (도 140a) 유전자간 4.9 k 결실의 검출은 이전에 기재되었다(Li 등, Blood, 131(26): 2915, 2018). 총 골수 MNC로부터 단리된 게놈 DNA를 주형으로 사용하였다. HBG1HBG2 프로모터에서 2 개의 CRISPR 절단 부위에 걸쳐 있는 9.9 kb 게놈 영역을 PCR에 의해 증폭시켰다. 생성물에서 추가 5.0 kb 밴드는 4.9 k 결실의 발생을 나타낸다. 결실 백분율을 4.9 kb 결실의 비로 정의된 주형을 사용하여 PCR에 의해 생성된 표준 곡선 공식에 따라 계산하였다. HBG1/2 프로모터를 표적화하는 CRISPR 벡터로 형질도입된 생체내 마우스로부터 유래된 샘플을 비교에 사용하였다. 각 레인은 1 마리의 동물을 나타낸다. (도 140b) 도 140a에서 결실 백분율의 요약. 각 점은 1 마리의 동물을 나타낸다.
도 141. BE vs CRISPR/Cas9의 세포독성. CRISPR/Cas9를 사용한 현재 게놈-편집 기술에 대한 주요 관심사는 이중-가닥 DNA 파괴(DSB)를 도입하여, 원치않은 큰 단편 결실 및 p53-의존적 DNA 손상 반응을 야기함으로써 숙주 세포에 해로울 수 있다는 점이다. 염기 편집기는 표적화된 게놈 유전자좌에서 정확한 뉴클레오티드 돌연변이를 설치할 수 있고 DSB를 피하는 이점이 있다. 이 연구는 HSC의 주요한 기능적 특징, 즉 준치명적으로 조사된 NSG 마우스에서 생착이 BE에 의해 영향을 받지 않지만 CRISPR/Cas9 발현 벡터로 인간 CD34+ 세포의 형질도입 후 극적으로 감소됨을 나타낸다.
도 142. BE4-sgBCL11AE1에 의해 매개된 예상된 편집. BCL11A 유전자좌의 편집을 나타내는 도식. GATAA 모티프(서열번호: 65) 및 염기 편집 후 방해된 GATAA 모티프(서열번호: 67)가 제시된다.
도 143. 표적에 대한 최적 위치. 표적화를 위한 예시적인 위치를 강조하는 핵산 서열의 도식. 도면은 표적 C가 프로토스페이서 내의 위치 4 내지 8에 있을 때 부분적으로 C에서 T로의 편집을 나타낸다.
도 144는 염기 편집기를 암호화하는 벡터의 도식이다.
도 145. 바이러스 gDNA의 다이어그램. 단일 인접한 작제물을 나타내지만 제시의 용이성을 위해서만 2 개의 절편으로 나눠진 바이러스 gDNA(HBG2-miR, 아데닌 편집기)의 도식.
도 146. TadA 서열. 2 개의 'TadA +32aa'의 DNA 서열(서열번호: 367 및 268)을 포함하는, TadA 및 TadA*의 서열(서열번호: 265 및 266)의 개략도.
도 147. 염기 편집. 야생형(서열번호: 269) 및 편집된 서열(서열번호: 269)의 개략도.
도 148. 염기 편집. HDAd5/35++_BE4-sgBCL11Ae1-FI-mgmtGFP(041318-1) 바이러스에 의한 염기 편집과 관련한 개략도 및 2 개의 겔.
도 149. γ-글로빈+ 세포의 퍼센트. 표시된 MOI에서 γ-글로빈+ 세포의 백분율을 나타내는 그래프.
도 150. 염기 편집에 의한 HbF의 재활성화. 벡터 및 관련 정보의 목록.
도 151. 벡터 및 관련 정보의 목록, 및 염기 편집기의 다양한 MOI에서 퍼센트 HbF+ 세포를 나타내는 그래프.
도 152. γ-글로빈 발현(HUDEP-2), 2차 시험. HUDEP-2 세포에서 2차 시험의 % HbF+를 나타내는 그래프.
도 153. γ-글로빈 발현(HUDEP-2), 단일 세포 유래 클론. 다양한 단일 세포 유래 클론에서 % HbF+를 나타내는 그래프.
도 154a-154s. 개별 단일 세포 유래 클론을 나타내는 데이터. 도 154a-154s는 각각 단일 세포 클론을 나타내는 데이터를 포함한다. (서열번호: 271, 250, 252)
도 155. 293FT 세포에서의 테스트. 293FT 세포에서 염기 편집기의 사용 결과를 나타내는 2 개의 겔.
도 156a-156d. 편집된 염기(293FT 세포)를 확인하기 위한 Sanger 서열분석. 도 156a-156d는 각각 sanger 서열분석 결과를 나타내는 크로마토그램(들)을 포함한다. (서열번호: 269, 275-278)
도 157. HUDEP-2 세포에서의 테스트. 형질감염 4 일 후 HUDEP-2 세포에서 염기 편집기의 사용 결과를 나타내는 2 개의 겔.
도 158. γ-글로빈 발현(HUDEP-2). γ-글로빈의 발현을 나타내는 그래프.
도 159a-159d. 편집된 염기(HUDEP-2 세포)를 확인하기 위한 Sanger 서열분석. 도 159a-159d는 각각 이용가능한 경우 Sanger 서열분석 결과를 나타내는 크로마토그램(들)을 포함한다. (서열번호: 269, 275-278)
도 160. (Maxi 제조 하에) HDAd 바이러스 생산을 위한 선택된 작제물. (Maxi 제조 하에) HDAd 바이러스 생산을 위한 특정 작제물의 구축된 벡터 표시 선택 목록.
도 161. huCD45+ 세포의 생착을 나타내는 차트.
도 162. HUDEP-2 세포의 일시적 형질감염(T7EI에 의해 절단). HUDEP-2 세포의 일시적 형질감염(T7EI에 의해 절단) 결과를 나타내는 겔.
도 163. 이중 염기 편집 벡터 적용. 이중 염기 편집 벡터 구현예(서열번호: 279)의 개략도.
도 164. SB100x 트랜스포사제에 의한 인간 γ-글로빈/mgmt. 유전자 추가 및 HBG 프로모터에서 적혈구 bcl11a 인핸서 및 BCL11A 결합 부위를 표적화하는 CRISPR를 사용한 레서스 γ-글로빈 재활성화를 나타내는 HDad5/35++ combo 벡터의 벡터 도식.
도 165. HDAd-sgAAVS1-rm(no Cas9) 벡터 및 HDAd-Comb2를 나타내는 벡터 도식. 이 벡터의 특성은 1.8k 상동성 아암(HA), PBMC에서 형질도입을 추적하기 위한 GFP, HA 외부의 CRISPR 카세트, 및 HBG 프로모터 표적화이다.
도 166. LCR β-글로빈 프로모터 구동된 외인성 γ-글로빈 및 γ-글로빈 프로모터의 억제인자 결합 영역의 CRISPR/Cas9-매개 파괴를 통한 내인성 γ-글로빈의 재활성화를 사용하여 γ-글로빈을 발현하는 HDAd-rh-combo의 벡터 도식.
본 개시내용은 무엇보다도, 조혈 줄기 세포의 생체내 유전자 편집을 위해 CD46을 표적화하는 Ad5/35 및 Ad35 벡터와 같은 재조합 아데노바이러스 벡터를 기재한다. Ad35 벡터는 CD46 결합을 증가시키는 놉 단백질 돌연변이, 유전자의 발현을 조절하는 miRNA 제어 시스템, 내인성 유전자 발현을 활성화시키는 CRISPR 구성요소, 양성 선택 마커, 미니- 또는 긴-형태의 β-글로빈 유전자좌 제어 영역(LCR) 조절 서열, 트랜스포사제/재조합효소 시스템, 및/또는 조건화-없는 생체내 유전자 요법을 촉진하는 다수의 다른 유리한 진보를 포함하나 이에 제한되지 않는 본원에 개시된 다양한 다른 서열을 포함할 수 있다.
유전자 요법에 대한 많은 도구의 개발에도 불구하고, 벡터 및/또는 치료적으로 유용한 페이로드의 설계는 당 분야에서 중요한 과제로 남아있다. 유전자 요법 페이로드는 바이러스 벡터 또는 비-바이러스 벡터에 의해 전달될 수 있다. 예시적인 비-바이러스 벡터는 양이온성 지질, 지질 나노 에멀젼, 고체 지질 나노입자, 펩티드, 및 중합체-기반 전달 시스템을 포함한다. 바이러스 벡터는 AAV, 단순 포진, 레트로바이러스, 렌티바이러스, 알파바이러스, 플라비바이러스, 랍도바이러스, 홍역 바이러스, 뉴캐슬병 바이러스, 폭스바이러스, 피코르나바이러스, 콕사키바이러스 벡터, 및 아데노바이러스 벡터를 포함할 수 있으며, 각각은 다양한 별개의 특성을 갖는다. 아데노바이러스 중에는, 또한 50 개 초과의 혈청형이 있다. 또한 단백질, 조절 핵산, CRISPR/Cas9 시스템, 염기 편집 시스템, 트랜스포존 시스템, 및 상동 재조합 시스템을 암호화하는 페이로드를 포함하나 이에 제한되지 않는 핵산 서열의 발현 및/또는 변형을 위한 치료적 페이로드가 존재한다. 본원에 제공된 유전자 요법을 위한 방법 및 조성물은 제한 없이 아데노바이러스 벡터 및/또는 다양한 치료적 페이로드의 활용에서 다양한 과제를 해결한다.
본 명세서의 개시내용은 특정 맥락(예를 들어, 아데노바이러스 벡터 또는 게놈 맥락, 예를 들어, Ad5, Ad5/35, 또는 Ad35 맥락)에 있을 수 있지만, 각 구성요소는 임의의 이러한 맥락과 상관없이 추가로 개시되고 이와 같이 이러한 맥락과 상관없이 청구될 수 있다. 예시적인 개시내용은 본 개시내용의 서열 및 페이로드 작제물을 포함하며, 당업자는 임의의 특정 벡터, 혈청형, 또는 다른 맥락에 제한되지 않는 일반적인 연관성을 가질 수 있음을 이해할 것이다.
본 개시내용의 측면은 이제 다음과 같이 추가로 상세하게 기재된다: (I) 유전자 요법 벡터; (II) 표적 세포 집단; (III) 투여량, 제형, 및 투여; (IV) 적용; (V) 예시적인 구현예; (VI) 실험적 실시예; 및 (VII) 마무리 단락.
I. 유전자 요법 벡터
아데노바이러스(또는, 상호교환가능하게, "아데노바이러스") 벡터 및 게놈은 (a) 발현 작제물의 패키징을 지원하고 (b) 코딩 서열을 발현하기에 충분한 아데노바이러스 서열을 함유하는 그러한 작제물을 지칭한다. 아데노바이러스 게놈은 선형 이중-가닥 DNA 분자일 수 있다. 당업자가 이해하는 바와 같이, 아데노바이러스 게놈과 같은 선형 게놈은 예를 들어, 바이러스 생산 목적을 위해 원형 플라스미드에 존재할 수 있다.
천연 아데노바이러스 게놈은 혈청형에 따라 26 kb 내지 45 kb 길이 범위이다.
아데노바이러스 벡터는 프리마제-독립적 DNA 합성을 촉진하고 숙주 게놈 내로의 통합을 용이하게 하는 자기-프라이머로서 작용하는 도립된 말단 반복부(ITR)에 의해 양 말단 상에 플랭킹된 아데노바이러스 DNA를 포함한다. 아데노바이러스 게놈은 또한 적절한 바이러스 전사체 패키징을 용이하게 하고 게놈의 왼쪽 아암 상에 위치하는 패키징 서열을 함유한다. 바이러스 전사체는 초기 전사 단위, E1, E2, E3, 및 E4 및 Ad 비리온의 구조적 구성요소를 암호화하는 후기 전사 단위를 포함하는 여러 단백질을 암호화한다(Lee 등, Genes Dis., 4(2):43-63, 2017).
아데노바이러스 벡터는 아데노바이러스 게놈을 포함한다. 재조합 아데노바이러스 벡터는 재조합 아데노바이러스 게놈을 포함하는 아데노바이러스 벡터이다. 재조합 아데노바이러스 벡터는 아데노바이러스의 유전적으로 조작된 형태를 포함한다. 당업자는 본 출원 전반에 걸쳐 아데노바이러스 벡터의 개시내용이 이의 아데노바이러스 게놈의 개시내용을 포함하고, 아데노바이러스 게놈의 개시내용이 개시된 아데노바이러스 게놈을 포함하는 아데노바이러스 벡터의 개시내용을 포함함을 이해할 것이다.
아데노바이러스는 큰 20면체 형상의 비-외피보유 바이러스이다. 바이러스 캡시드는 섬유, 펜톤, 및 헥손 기반 단백질을 포함하는 3 가지 유형의 단백질을 포함한다. 헥손은 대부분 바이러스 캡시드로 구성되어, 20 개의 삼각형 면을 형성한다. 펜톤 염기는 캡시드의 12 개 꼭지점에 위치하고 섬유(또한 놉형 섬유로 지칭됨)은 각 펜톤 염기로부터 돌출된다. 펜톤 및 섬유인 이들 단백질은 캡시드가 숙주 세포에 부착하는 것을 용이하게 하기 때문에 수용체 결합 및 내재화에 특히 중요한 것이다(Lee 등, Genes Dis., 4(2):43-63, 2017).
Ad35 섬유는 섬유 단백질 삼량체이며, 각 섬유 단백질은 오량체성 펜톤 염기와 상호작용하는 N-말단 꼬리, 숙주 세포 수용체에 대한 부착 부위로서 기능하는 C-말단 구형의 놉 도메인(섬유 놉), 및 꼬리 및 놉 도메인을 연결하는 중심 샤프트(shaft) 도메인을 포함한다(샤프트). 삼량체성 섬유의 꼬리 도메인은 5-배 축에서 오량체성 펜톤 염기에 부착된다. 다양한 구현예에서, Ad35 섬유 놉은 표준 야생형 Ad35 섬유 단백질의 아미노산 123 내지 320을 포함한다. 다양한 구현예에서, Ad35 섬유 놉은 표준 야생형 Ad35 섬유 단백질의 아미노산 123 내지 320의 상응하는 단편과 적어도 80%(예를 들어, 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성) 서열 동일성을 갖는 적어도 60 개의 아미노산 (예를 들어, 적어도 60, 70, 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 또는 198 개의 아미노산)을 포함한다. 다양한 구현예에서, 섬유 놉은 표준 야생형 Ad35 섬유 단백질을 포함하는 참조 섬유 놉, 섬유 단백질, 섬유 또는 벡터와 비교하여, 섬유 단백질, 섬유, 또는 벡터에 CD46과의 증가된 친화도에 대해 조작되고/되거나, CD46과의 증가된 친화도를 부여하도록 조작되며, 임의적으로 여기서 증가는 적어도 1.1-배, 예를 들어, 적어도 1, 2, 3, 4, 5, 10, 15, 또는 20-배의 증가이다. 중심 샤프트 도메인은 5.5 개의 β-반복부로 구성되며, 각각은 β-턴으로 연결된 2 개의 역평행 β-가닥을 코딩하는 15-20 개의 아미노산을 함유한다. β-반복부는 연결되어 매우 강성이고 안정한 3 개의 서로 엮인 나선형 가닥의 연장된 구조를 형성한다.
아데노바이러스는 중간 크기의 게놈, 조작 용이성, 높은 역가, 넓은 표적-세포 범위 및 높은 감염성으로 인해 유전자 전달 벡터로서 사용하기에 특히 적합하다. 바이러스 게놈의 양 단부는 100-200 개의 염기쌍 ITR을 함유하며, 이는 바이러스 DNA 복제 및 패키징에 필요한 시스 요소이다. 게놈의 초기(E) 및 후기(L) 영역은 바이러스 DNA 복제 개시에 의해 구분되는 상이한 전사 단위를 함유한다. E1 영역(E1A 및 E1B)은 바이러스 게놈 및 몇몇 세포 유전자의 전사 조절을 담당하는 단백질을 암호화한다. E2 영역(E2A 및 E2B)의 발현은 바이러스 DNA 복제를 위한 단백질의 합성을 초래한다. 이들 단백질은 DNA 복제, 후기 유전자 발현 및 숙주 세포 차단(shut-off)에 수반된다. 대부분의 바이러스 캡시드 단백질를 포함하는 후기 유전자 산물은 주요 후기 프로모터(MLP)에 의해 비롯된 단일 1차 전사체의 상당한 처리 후에만 발현된다. MLP는 감염의 후기 단계 동안 특히 효율적이고, 이 프로모터로부터 비롯된 모든 mRNA는 번역에 선호되는 mNRA를 초래하는 5'-삼부 리더(TPL) 서열을 보유한다.
I(A). 유전자 요법 벡터 혈청형
아데노바이러스 중에는, 또한 50 개 초과의 혈청형이 있다. 아데노바이러스 5형은 다량의 생화학적 및 유전적 정보가 알려져 있고, 역사적으로 아데노바이러스를 벡터로서 이용하는 대부분의 구축물에 사용된 인간 아데노바이러스이다. Ad5는 유전자 요법 연구에서 광범위하게 사용되었다.
그러나, 대부분의 인간은 Ad5 캡시드 단백질에 대해 지시된 중화 혈청 항체를 가지며, 이는 HDAd5/35 벡터, 즉, Ad5 캡시드 단백질 및 키메라 Ad35 섬유를 함유하는 벡터와 같은 Ad5 캡시드를 포함하는 아데노바이러스 벡터로 생체내 형질도입을 차단할 수 있다. Ad5 캡시드 단백질에 대해 지시된 중화 혈청 항체의 존재는 Ad5 캡시드를 포함하는 아데노바이러스 벡터의 치료적 가치를 무시화하지 않는 반면, Ad5 캡시드를 포함하지 않는 아데노바이러스 벡터는 임상적으로 유의한 면역원성 반응의 일반적인 위험이 특히 Ad5 캡시드 단백질에 대해 지시된 중화 혈청 항체가 있는 대상체에서 감소될 것이라는 점에서 추가적인 이익을 제공할 것이다.
Ad35는 57 개의 알려진 인간 혈청형 중 가장 희귀한 것 중 하나이며, 혈청 유병률이 7% 미만이고 Ad5와의 교차 반응성이 없다. Ad35는 부분적으로 Ad35 섬유 놉의 T-세포 활성화의 약화로 인해 Ad5보다 면역원성이 적다. 또한, 정맥내(iv) 주사 후, 인간 CD46 유전자이식(hCD46tg) 마우스 및 비-인간 영장류에서 간을 포함하는 조직의 최소 형질도입만이 있다(PCR에 의해서만 검출가능). 1세대 Ad35 벡터는 백신접종 목적을 위해 임상적으로 사용되었다.
I(A)(i). Ad35 유전자 요법 벡터
대표적인 천연 Ad35 아데노바이러스의 완전한 게놈은 알려져 있고 공개적으로 이용가능하다(예를 들어, Gao 등, 2003 Gene Ther. 10(23): 1941-9; Reddy 등 2003 Virology 311(2): 384-393; GenBank 수탁 번호 AX049983 참조). Ad5 게놈은 35,935 bp이고 G + C 함량이 55.2%인 반면, Ad35 게놈은 34,794 bp 이고 G + C 함량이 48.9%이다. Ad35의 게놈은 도립된 말단 반복부(ITR)에 의해 플랭킹된다. 다양한 구현예에서, Ad35 ITRS는 137 bp를 포함하며(예를 들어, GenBank 수탁 번호 AX049983의 뉴클레오티드 1-137 또는 4-140을 포함하는 5' Ad35 및 GenBank 수탁 번호 AX049983의 뉴클레오티드 34658-34794를 포함하는 3' ITR), Ad5(103 bp)보다 더 길다. 다양한 구현예에서, Ad35 5' ITR은 GenBank 수탁 번호 AX049983의 뉴클레오티드 1-200의 상응하는 단편과 적어도 80% 서열 동일성(예를 들어, 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성)을 갖는 적어도 80 개의 뉴클레오티드(예를 들어, 적어도 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 또는 200 개의 뉴클레오티드, 예를 들어, 80, 90, 100, 110, 120, 또는 130 개 뉴클레오티드의 하한 및 130, 140, 150, 160, 170, 180, 190, 또는 200 개 뉴클레오티드의 상한, 예를 들어, 137 개의 뉴클레오티드를 갖는 다수의 뉴클레오티드)를 포함하고 Ad35 3' ITR은 GenBank 수탁 번호 AX049983의 뉴클레오티드 34595-34794의 상응하는 단편과 적어도 80% 서열 동일성(예를 들어, 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성)을 갖는 적어도 80 개의 뉴클레오티드(예를 들어, 적어도 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 또는 200 개의 뉴클레오티드, 예를 들어, 80, 90, 100, 110, 120, 또는 130 개 뉴클레오티드의 하한 및 130, 140, 150, 160, 170, 180, 190, 또는 200 개 뉴클레오티드의 상한, 예를 들어, 137 개의 뉴클레오티드를 갖는 다수의 뉴클레오티드)를 포함한다. 다양한 구현예에서, ITR은 Ad35 캡슐화 및/또는 복제 중 하나 또는 둘 다에 충분하다. 다양한 구현예에서, Ad35 벡터에 대한 Ad35 ITR 서열은 첫번째 8 bp가 CATCATCA보다 CTATCTAT라는 점에서 상이하다(Wunderlich, J. Gen Viro. 95: 1574-1584, 2014).
다양한 구현예에서, 아데노바이러스 게놈의 패키징은 ITR에 인접한 바이러스 게놈의 5' 단부에 위치한 시스-작용 패키징 서열 도메인에 의해 매개되고, 패키징은 왼쪽에서 오른쪽으로 극성 방식으로 발생한다. Ad35의 패키징 서열은 5 내지 7 개의 추정 "A" 반복부가 있는 게놈의 왼쪽 단부에 위치한다. 다양한 구현예에서, 본 개시내용은 Ad35 패키징 서열을 포함하는 재조합 Ad35 공여자 벡터 또는 게놈을 포함한다. 다양한 구현예에서, 본 개시내용은 재조합효소 부위에 의해 플랭킹된 패키징 서열을 포함하는 재조합 Ad35 헬퍼 벡터 또는 게놈을 포함한다. 다양한 구현예에서, Ad35 패키징 서열은 GenBank 수탁 번호 AX049983의 뉴클레오티드 138-481 또는 Ad35 벡터 또는 게놈의 패키징에 충분하거나 또는 필요한 이의 단편을 포함하는 핵산 서열을 지칭한다(예를 들어, 재조합효소 부위가 있는 서열의 플랭킹 및 재조합효소 부위의 재조합에 의한 절제는 패키징을 위한 벡터 또는 게놈 결핍을 예를 들어, 패키징 서열을 포함하는 참조와 비교하여 적어도 10%, 예를 들어, 적어도 10%, 20%, 30%, 40$, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%로 만들도록 하며, 임의적으로 여기서 참조는 재조합효소 부위에 의해 플랭킹된 패키징 서열을 포함한다). 다양한 구현예에서, Ad35 패키징 서열은 GenBank 수탁 번호 AX049983의 뉴클레오티드 137-481의 상응하는 단편과 적어도 80% 서열 동일성(예를 들어, 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 서열 동일성)을 갖는 적어도 80 개의 뉴클레오티드(예를 들어, 적어도 80, 90, 100, 110, 120, 130, 140, 150, 160, 170, 180, 190, 200, 225, 250, 275, 또는 300 개의 뉴클레오티드, 예를 들어, 80, 90, 100, 110, 120, 130, 140, 또는 150 개 뉴클레오티드의 하한 및 150, 160, 170, 180, 190, 200, 225, 250, 275, 또는 300 개 뉴클레오티드의 상한을 갖는 다수의 뉴클레오티드)를 포함한다.
다양한 구현예에서, Ad35 헬퍼 벡터는 패키징 서열에 플랭크하도록 삽입된 재조합효소 부위를 포함할 수 있으며, 여기서 제1 재조합효소 부위는 뉴클레오티드 130 내지 뉴클레오티드 400 사이에서 선택된 위치(예를 들어, 뉴클레오티드 138 내지 180, 138 내지 200, 138 내지 220, 138 내지 240, 138 내지 260, 138 내지 280, 138 내지 300, 138 내지 320, 138 내지 340, 138 내지 360, 138 내지 366, 138 내지 380, 또는 138 내지 400 사이)에 바로 인접하여(예를 들어, 앞에 또는 뒤에) 삽입되고 제2 재조합효소 부위는 뉴클레오티드 300 내지 뉴클레오티드 550 사이에서 선택된 위치(예를 들어, 뉴클레오티드 344 내지 360, 344 내지 380, 344 내지 400, 344 내지 420, 344 내지 440, 344 내지 460, 344 내지 480, 344 내지 481, 344 내지 500, 344 내지 520, 344 내지 540, 또는 344 내지 550 사이)에 바로 인접하여(예를 들어, 앞에 또는 뒤에) 삽입된다. 당업자는 용어 패키징 서열이 반드시 주어진 벡터 또는 게놈에 존재하는 패키징 요소를 모두 포함하지 않음을 이해할 것이다. 예를 들어, 헬퍼 게놈은 패키징 서열에 플랭킹하는 재조합효소 지시 반복부를 포함할 수 있으며, 여기서 플랭킹된 패키징 서열은 헬퍼 게놈에 존재하는 패키징 요소를 모두 포함하지 않는다. 따라서, 특정 구현예에서, 헬퍼 게놈의 1 또는 2 개의 재조합효소 지시 반복부는 더 큰 패키징 서열 내에 위치하여, 예를 들어 더 큰 패키징 서열이 1 또는 2 개의 재조합효소 지시 반복부의 도입에 의해 인접하지 않게 되도록 한다. 다양한 구현예에서, 헬퍼 게놈의 재조합효소 지시 반복부는 재조합효소 지시 반복부의 재조합에 의한 플랭킹된 패키징 서열의 절제가 헬퍼 게놈의 패키징 및/또는 헬퍼 게놈이 패키징되는 능력을 감소시키거나 또는 제거하도록(보다 일반적으로 방해하도록) 패키징 서열의 단편에 플랭킹한다. 예로서, 재조합효소 지시 반복부(DR)는 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 ITR은 방해하지 않기 위해 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내에 위치한다. 다양한 구현예에서, DR은 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 ITR은 방해하지 않기 위해, Ad35 게놈의 5' 단부로부터 550 개 뉴클레오티드보다 더 가깝게, 예를 들면 540, 530, 520, 510, 500, 495,490, 480, 470, 450, 440, 400, 380, 360 개 뉴클레오티드 이내에, 또는 Ad35 게놈의 5' 단부의 360 개 뉴클레오티드 이내보다 더 가깝게 위치한다.
다양한 구현예에서, 본 개시내용은 Ad35 5' ITR, Ad35 패키징 서열, 및 Ad35 3' ITR을 포함하는 재조합 Ad35 공여자 벡터 또는 게놈을 포함한다, 특정 구현예에서, Ad35 5' ITR, Ad35 패키징 서열, 및 Ad35 3' ITR은 표준 Ad35 게놈으로부터 유래되고/되거나, 이에 대해 적어도 80% 동일성을 갖는 재조합 Ad35 공여자 벡터 또는 게놈의 유일한 단편(예를 들어, 50 개 초과 또는 100 개 초과의 염기쌍에 대한 유일한 단편)이다.
Ad35 초기 영역은 E1A, E1B, E2A, E2B, E3, 및 E4를 포함한다. Ad35 중간 영역은 pIX 및 IVa2를 포함한다. Ad35의 후기 전사 단위는 16.9 맵 단위에 위치한 주요 후기 프로모터(MLP)로부터 전사된다. Ad35에서 후기 mRNA는 이러한 mRNA에 의해 사용되는 poly(A) 신호에 따라 5 개의 mRNA 패밀리(L1-L5)로 나눌 수 있다. MLP 공통 개시인자 요소, 및 스플라스 공여자 및 스플라이스 수용체 부위 서열을 기반으로, 삼부 리더(TPL)의 길이는 204 개 뉴클레오티드인 것으로 예측되었다. MLP에 인접한 TPL의 첫번째 리더는 45 개의 뉴클레오티드 길이이다. DNA 폴리머라제의 코딩 영역 내에 위치한 두번째 리더는 72 개의 뉴클레오티드 길이이다. 세번째 리더는 E2B 영역의 전구체 말단 단백질(pTP)의 코딩 영역 내에 놓여 있고 87 개의 뉴클레오티드 길이이다. Ad5는 2 개의 바이러스-연관(VA) RNA 유전자를 함유하지만, 하나의 바이러스-연관 RNA 유전자만이 Ad35의 게놈에서 발생한다. 이 VA RNA 유전자는 52/55K L1 단백질을 코딩하는 유전자 및 pTP 사이에 위치한다.
특정 구현예에서, Ad35++ 벡터는 돌연변이체 Ad35 섬유 놉이 있는 키메라 벡터(예를 들어, 돌연변이체 Ad35 섬유 놉이 있는 재조합 Ad35 벡터 또는 돌연변이체 Ad35 섬유 놉이 있는 Ad5/35 벡터)이다. 특정 구현예에서, Ad35++ 게놈은 돌연변이체 Ad35 섬유 놉을 암호화하는 게놈(예를 들어, 돌연변이체 Ad35 섬유 놉을 암호화하는 재조합 Ad35 헬퍼 게놈 또는 돌연변이체 Ad35 섬유 놉을 암호화하는 Ad5/35 헬퍼 게놈)이다. 다양한 구현예에서, Ad35++ 돌연변이체 섬유 놉은 CD46에 대한 친화도가, 예를 들어, 25-배 증가하도록 돌연변이된 Ad35 섬유 놉이며, 예를 들어, Ad35++ 돌연변이체 섬유 놉은 예를 들어, 더 낮은 감염 다중도(MOI)에서 세포 형질도입 효율을 증가시키도록 한다(Li and Lieber, FEBS Letters, 593(24): 3623-3648, 2019).
다양한 구현예에서, Ad35++ 돌연변이체 섬유 놉은 Ile192Val, Asp207Gly(또는 특정 Ad35 서열에서 Glu207Gly), Asn217Asp, Thr226Ala, Thr245Ala, Thr254Pro, Ile256Leu, Ile256Val, Arg259Cys, 및 Arg279His로부터 선택된 적어도 하나의 돌연변이를 포함한다. 다양한 구현예에서, Ad35++ 돌연변이체 섬유 놉은 다음 돌연변이 각각을 포함한다: Ile192Val, Asp207Gly(또는 특정 Ad35 서열에서 Glu207Gly), Asn217Asp, Thr226Ala, Thr245Ala, Thr254Pro, Ile256Leu, Ile256Val, Arg259Cys, 및 Arg279His. 다양한 구현예에서, Ad35 섬유의 아미노산 넘버링은 GenBank 수탁 AP_000601 또는 이에 상응하는 아미노산 서열에 따르며, 예를 들어, 여기서 위치 207은 Glu 또는 Asp이다. 다양한 구현예에서, Ad35 섬유는 GenBank 수탁 AP_000601에 따른 아미노산 서열을 갖는다. Ad35++ 섬유 놉 돌연변이에 대한 추가의 상세한 내용은 Wang 2008 J. Virol. 82(21): 10567-10579에 기재되어 있으며, 섬유 놉과 관련하여 그 전문이 본원에 참조로 포함된다.
I(A)(ii). Ad5/35 유전자 요법 벡터
본 개시내용의 Ad5/35 벡터는 Ad5 캡시드 폴리뉴클레오티드 및 Ad35 섬유 놉을 포함하는 키메라 섬유 폴리뉴클레오티드를 포함하는 아데노바이러스 벡터를 포함하며, 키메라 섬유 폴리뉴클레오티드는 전형적으로 또한 Ad35 섬유 샤프트(예를 들어, Ad35 섬유 아미노산 44-323과 조합된 Ad5 섬유 아미노산 1-44)를 포함한다. 다양한 구현예에서, 섬유는 Ad35++ 돌연변이체 섬유 놉을 포함한다. 본 개시내용의 다양한 Ad5/35 벡터에서, 섬유 놉 도메인 및 샤프트를 제외한 모든 단백질은 혈청형 5로부터 유래된 반면, 섬유 놉 도메인 및 샤프트는 혈청형 35로부터 유래되었고, CD46에 대한 친화도가 증가된 돌연변이는 Ad35 섬유 놉 내로 도입되었다(WO 2010/120541 A2 참조). 추가적으로, 다양한 구현예에서, Ad5/35 벡터의 ITR 및 패키징 서열은 Ad5로부터 유래된다. (예시적인 놉 돌연변이에 대해 표 1; 및 HDAd35 벡터 생산의 일반적인 도식에 대해 도 95 참조.)
표 1: CD46에 대한 결합이 증가된 돌연변이된 Ad35 놉
Figure pct00003
I(B). 헬퍼-의존적 Ad35 및 Ad5/35 벡터
일반적으로, 천연 아데노바이러스 벡터에서 헬퍼-의존적 아데노바이러스 벡터로의 경로는 3 가지 세대를 포함한다. 1세대 아데노바이러스 벡터는 유전자 E1 및 E3을 제거하도록 조작된다. 이들 유전자 없이, 아데노바이러스 벡터는 자체적으로 복제할 수 없지만 HEK293 세포와 같은 E1-발현 포유류 세포주에서 생성될 수 있다. 1세대 변형만으로, 아데노바이러스 벡터 클로닝 용량은 제한되고, 벡터에 대한 숙주 면역 반응은 효과적인 페이로드 발현에 문제가 될 수 있다. 2세대 아데노바이러스 벡터는 E1/E3 제거 이외에도, 비-구조적 유전자 E2 및 E4를 제거하도록 조작되어, 용량 증가 및 면역원성 감소를 초래한다. 3세대 아데노바이러스 벡터(또한 무기력한, 고용량 아데노바이러스 벡터, 또는 헬퍼-의존적 아데노바이러스 벡터(HdAd)로도 지칭됨)는 모든 바이러스 코딩 서열을 제거하고, 게놈의 ITR 및 게놈 또는 이의 기능적 단편의 패키징 서열만을 유지하도록 추가로 조작된다. 이들 게놈은 바이러스 생산에 필요한 단백질을 암호화하지 않기 때문에, 헬퍼-의존적이다: 헬퍼-의존적 게놈은 바이러스 단백질을 트랜스로 제공하는 핵산 서열을 포함하는 세포에 존재하는 경우에만 벡터 내로 패키징될 수 있다. 이들 헬퍼-의존적 벡터는 또한 여전히 더 큰 용량 및 추가로 감소된 면역원성을 특징으로 한다. 각 바이러스 게놈의 서열은 적어도 각 혈청형에 대해 구별되기 때문에, 주어진 혈청형에 대한 헬퍼-의존적 바이러스 게놈, 및/또는 헬퍼 게놈을 생성하는 데 필요한 적절한 변형은 다른 혈청형과 관련한 이용가능한 정보로부터 예측될 수 없다.
모든 바이러스 코딩 서열이 결여되도록 조작된 헬퍼-의존적 아데노바이러스 벡터(HDAd)는 광범위한 세포 유형을 효율적으로 형질도입할 수 있고, 무시할 수 있는 만성 독성으로 장기간 이식유전자 발현을 매개할 수 있다. 바이러스 코딩 서열을 결실시키고 게놈 복제(ITR) 및 캡슐화(Ψ)에 필요한 시스-작용 요소만을 남겨둠으로써, Ad 벡터에 대한 세포 면역 반응은 감소된다. HDAd 벡터는 최대 37 kb의 큰 클로닝 용량을 가져, 큰 페이로드의 전달을 허용한다. 이들 페이로드는 이식유전자 발현을 향상시키고, 연장하고, 조절하도록 큰 치료 유전자 또는 심지어 다중 이식유전자 및 큰 조절 구성요소를 포함할 수 있다. 다른 아데노바이러스 벡터와 마찬가지로, 전형적인 HDAd 게놈은 일반적으로 에피솜으로 남아있고 숙주 게놈과 통합하지 않는다(Rosewell 등, J Genet Syndr Gene Ther. Suppl 5:001, 2011, doi: 10.4172/2157-7412.s5-001).
일부 HDAd 벡터 시스템에서, 하나의 바이러스 게놈(헬퍼 게놈)은 복제에 필요한 단백질을 모두 암호화하지만 패키징 서열에 조건부 결함이 있어서, 비리온 내로 패키징될 가능성이 적다. 상기 언급된 바와 같이, 이는 패키징 서열 또는 기능적으로 기여하는(예를 들어, 기능적으로 필요한) 이의 단편의 식별 및 다른 아데노바이러스 혈청형과 관련하여 기존 지식에서 확인될 수 없는 헬퍼 벡터의 증식을 무효화하지 않는 방식으로 대상체 게놈의 변형을 필요로 할 수 있다, 개별 공여자 바이러스 게놈은 바이러스 ITR, 페이로드(예를 들어, 치료적 페이로드), 및 기능적 패키징 서열(예를 들어, 정상 야생형 패키징 서열, 또는 이의 기능적 단편)을 포함하여(예를 들어, 유일하게 포함하여), 이 공여자 바이러스 게놈이 HDAd 바이러스 벡터 내로 선택적으로 패키징되고 생산자 세포로부터 단리되게 한다. HDAd 공여자 벡터는 물리적 수단에 의해 헬퍼 벡터로부터 추가로 정제될 수 있다. 일반적으로, HDAd 바이러스 벡터 및 HDAd 바이러스 벡터 제형에서 헬퍼 벡터 및/또는 헬퍼 게놈의 일부 오염이 발생할 수 있고 허용될 수 있다.
일부 HDAd 벡터 시스템에서, 헬퍼 게놈은 Cre/loxP 시스템을 활용한다. 이러한 특정 HDAd 벡터 시스템에서, HDAd 공여자 게놈은 게놈 복제에 필요한 아데노바이러스 ITR, 및 게놈을 캡시드 내로 캡슐화하는 데 필요한 패키징 서열 또는 이의 기능적 단편인 Ψ를 포함하는 비코딩 아데노바이러스 DNA의 500 bp를 포함한다. 또한 HDAd 공여자 벡터 게놈은 총 길이가 27.7 kb 내지 37 kb일 때 가장 효율적으로 패키징될 수 있음이 관찰되었으며, 예를 들어, 치료적 페이로드 및/또는 "스터퍼" 서열로 구성될 수 있다. HDAd 공여자 게놈은 Cre 재조합효소를 발현하는 293 세포(HEK293)와 같은 세포로 전달될 수 있으며, 임의적으로 여기서 HDAd 공여자 게놈은 비-바이러스 벡터 형태, 예컨대 박테리아 플라스미드 형태로 세포에 전달된다(예를 들어, 여기서 HDAd 공여자 게놈은 박테리아 플라스미드(pHDAd)로 구축되고 제한 효소 소화로 유리된다). 동일한 세포는 헬퍼 게놈으로 형질도입될 수 있으며, 이는 Cre 재조합효소를 발현하는 293 세포의 감염 후, 패키징 서열 또는 기능적으로 기여하는(예를 들어, 기능적으로 필요한) 이의 단편이 loxP 부위 사이의 Cre-매개 부위-특이적 재조합에 의해 헬퍼 게놈으로부터 절제되도록 loxP 부위에 의해 플랭킹된 패키징 서열 또는 기능적으로 기여하는(예를 들어, 기능적으로 필요한) 이의 단편을 보유하는 E1-결실된 Ad 벡터를 포함한다. 따라서, HDAd 공여자 게놈은 Cre를 발현하는 293 세포(HEK293) 내로 형질감염될 수 있고 패키징 서열(Ψ) 또는 재조합효소 부위(예를 들어, loxP 부위)에 의해 플랭킹된 이의 기능적 단편을 보유하는 헬퍼 게놈으로 형질도입되어 Ψ의 상응하는 재조합효소에 의해 매개된 절제(예를 들어, Cre-매개 절제)가 헬퍼 바이러스 게놈을 패키징할 수 없게 만들지만, 여전히 HDAd의 증식을 위해 필요한 트랜스-작용 인자를 모두 제공할 수 있도록 한다. 패키징 서열 또는 기능적으로 기여하는(예를 들어, 기능적으로 필요한) 이의 단편의 절제 후, 헬퍼 게놈은 패키징할 수 없지만 여전히 DNA 복제를 겪을 수 있고 따라서 HDAd 공여자 게놈의 복제 및 캡슐화를 트랜스-보완할 수 있다. 일부 구현예에서, 293 세포(HEK293)에 존재하는 헬퍼 및 HDAd 공여자 게놈 사이의 상동 재조합의 결과로서 복제 적격 Ad(RCA; E1+)의 생성을 방지하기 위해 "스터퍼" 서열은 E3 영역 내로 삽입되어 임의의 E1+ 재조합체를 패키징하기에 너무 크게 만들 수 있다. 유사한 HDAd 생산 시스템은 FLP(예를 들어, FLPe)/frt 부위-특이적 재조합을 사용하여 개발되었으며, 여기서 헬퍼 게놈의 패키징 서열에 플랭킹 하는 frt 부위 사이의 FLP-매개 재조합은 FLP를 발현하는 293 세포(HEK293)에서 헬퍼 게놈의 캡슐화에 대해 선택한다. 헬퍼 벡터에 대해 선택하기 위한 대안적인 전략이 개발되었다. Ad35 헬퍼 바이러스는 전형적으로 E1 발현 산물이 생산자 세포주의 게놈으로부터 상보적 발현에 의해 공급될 수 있을 때, E1에서와 같은 것들을 제외한 모든 바이러스 유전자를 포함한다.
HDAd5/35 공여자 벡터, 공여자 게놈, 헬퍼 벡터 및 헬퍼 게놈은 본원에 제공되고 본 개시내용의 다양한 방법에 사용되는 조성물의 예시이다. HDAd5/35 벡터 또는 게놈은 Ad35 섬유 놉 및 Ad5 샤프트가 있는 헬퍼-의존적 키메라 Ad5/35 벡터 또는 게놈이다. HDAd5/35++ 벡터 또는 게놈은 돌연변이체 Ad35 섬유 놉이 있는 헬퍼-의존적 키메라 Ad5/35 벡터 또는 게놈이다. 벡터는 CD46에 대한 친화도가 예를 들어, 25-배 증가하도록 돌연변이되고 더 낮은 감염 다중도(MOI)에서 세포 형질도입 효율을 증가시킨다(Li & Lieber, FEBS Letters, 593(24): 3623-3648, 2019). Ad5/35 헬퍼 벡터는 조건부로 발현된(예를 들어, frt-부위 또는 loxP-부위 플랭킹된) 패키징 서열을 포함하고 공여자 게놈이 패키징될 수 있는 Ad5/35 비리온의 생산을 위해 필요한 트랜스-작용 인자를 모두 암호화하는 헬퍼 게놈을 포함하는 벡터이다.
HDAd35 공여자 벡터, 공여자 게놈, 헬퍼 벡터 및 헬퍼 게놈은 또한 본원에 제공되고 본 개시내용의 다양한 방법에 사용되는 조성물의 예시이다. HDAd35 벡터 또는 게놈은 헬퍼-의존적 Ad35 벡터 또는 게놈이다. HDAd35++ 벡터 또는 게놈은 CD46에 대한 친화도를 향상시키고 세포 형질도입 효율을 증가시키는 돌연변이체 Ad35 섬유 놉이 있는 헬퍼-의존적 Ad35 벡터 또는 게놈이다. Ad35 헬퍼 벡터는 조건부로 발현된(예를 들어, frt-부위 또는 loxP-부위 플랭킹된) 패키징 서열을 포함하고 공여자 게놈이 패키징될 수 있는 Ad35 비리온의 생산을 위해 필요한 트랜스-작용 인자를 모두 암호화하는 헬퍼 게놈을 포함하는 벡터이다. 본 개시내용은 HDAd35 공여자 게놈 및 Ad35 헬퍼 게놈을 포함하는 세포를 포함하는 HDAd35 공여자 벡터 생산 시스템을 추가로 포함한다. 이러한 특정 세포에서, 헬퍼 게놈에 의해 암호화되고 발현되는 바이러스 단백질은 HDAd35 공여자 게놈이 패키징되는 HDAd35 공여자 벡터의 생산에 활용될 수 있다. 따라서, 본 개시내용은 HDAd35 공여자 게놈 및 Ad35 헬퍼 게놈을 포함하는 세포를 배양함으로써 HDAd35 공여자 벡터를 생산하는 방법을 포함한다. 일부 구현예에서 세포는 Ad35 헬퍼 벡터의 패키징 서열에 플랭킹하는 재조합효소 지시 반복부에 상응하는 재죠합효소를 암호화하고 발현한다. 일부 구현예에서, Ad35 헬퍼 게놈의 플랭킹된 패키징 서열은 절제되었다.
일부 구현예에서 Ad35 헬퍼 게놈은 모든 Ad35 코딩 서열을 암호화한다. 일부 구현예에서 Ad35 헬퍼 게놈은 E1 영역의 하나 이상의 코딩 서열 및/또는 E3 코딩 서열 및/또는 E4 코딩 서열을 제외한 모든 Ad35 코딩 서열을 암호화하고/하거나 발현한다. 다양한 구현예에서, Ad35 E1 유전자를 암호화하고/하거나 발현하지 않는 헬퍼 게놈은 Ad35 E4 유전자를 암호화하고/하거나 발현하지 않으며, 임의적으로 여기서 Ad35 헬퍼 게놈은 Ad5 E4orf6 코딩 서열을 포함하도록 추가로 조작된다. 다양한 구현예에서, 당업자에 의해 이해되는 바와 같이, HDAd 35 공여자 벡터의 생산을 위한 조성물 및 방법의 세포는 Ad5 E1 발현 산물을 발현하는 세포일 수 있다. 다양한 구현예에서, 당업자에 의해 이해되는 바와 같이, HDAd 35 공여자 벡터의 생산을 위한 조성물 및 방법의 세포는 293 T 세포(HEK293)일 수 있다.
헬퍼는 야생형 또는 증식-적격 Ad5 벡터 또는 Ad35 벡터와 같은 야생형 또는 유사한 증식-적격 벡터로부터 조작될 수 있다. 당업자가 이해하는 바와 같이, 헬퍼 벡터의 조작에 사용될 수 있는 한 가지 전략은 E1 유전자 발현의 결실 또는 다른 기능적 파괴이다. 아데노바이러스 게놈의 5' 부분에 위치한 E1 영역은 초기 및 후기 유전자의 야생형 발현에 필요한 단백질을 암호화한다. E1 결실은 E1에 의해 제어된 특정 바이러스 유저자의 발현을 감소시키거나 또는 제거하고, E1-결실된 헬퍼 바이러스는 복제-결핍이다. 따라서, E1-결핍 헬퍼 바이러스는 E1을 발현하는 세포주를 사용하여 증식될 수 있다. 예를 들어, E1-결핍 Ad35 헬퍼 벡터가 Ad5 E4orf6을 암호화도록 조작되는 경우, 헬퍼 벡터는 Ad5 E1을 발현하는 세포주에서 증식될 수 있고, E1-결핍 Ad35 헬퍼 벡터가 Ad5 E4orf6을 암호화하는 경우, 헬퍼 벡터는 Ad5 E1을 발현하는 세포주에서 증식될 수 있다. HDAd35 벡터 생산을 위한 하나의 예시적인 세포 유형에서, HEK293 세포는 Ad5 E4 단백질 ORF6과 복합체를 형성하는 것으로 알려진 Ad5 E1b55k를 발현한다. 표 2는 Ad35 게놈에 의해 암호화된 발현 산물의 예시적인 요약을 제공한다(Gao, Gene Ther. 10:1941-1949, 2003 참조).
표 2. Ad35 게놈의 예측된 번역 특징.
Figure pct00004
Figure pct00005
본 개시내용은 무엇보다도, 예를 들어, 2 개의 Ad35 ITR이 페이로드에 플랭킹되는 Ad35 ITR(예를 들어, 5' Ad35 ITR 및 3' ITR)을 포함하는 HDAd35 공여자 벡터 및 게놈을 포함한다. 본 개시내용은 무엇보다도, Ad35 패키징 서열 또는 이의 기능적 단편을 포함하는 HDAd35 공여자 벡터 및 게놈을 포함한다. 본 개시내용은 무엇보다도, E1 또는 이의 단편이 결실된(예를 들어, E1 결실이 GenBank 수탁 번호 AX049983의 뉴클레오티드 481-3112 또는 본원에 제공된 또 다른 Ad35 벡터 서열의 상응하는 위치의 결실을 포함하는 경우) HDAd35 공여자 벡터 및 게놈을 포함한다. 본 개시내용은 무엇보다도, E3 또는 이의 단편이 결실된(예를 들어, E3 결실이 GenBank 수탁 번호 AX049983의 뉴클레오티드 27609 내지 30402 또는 27435-30542 또는 본원에 제공된 또 다른 Ad35 벡터 서열의 상응하는 위치의 결실을 포함하는 경우) HDAd35 벡터 및 게놈을 포함한다.
본 개시내용은 무엇보다도, 패키징 서열 또는 기능적으로 기여하는(예를 들어, 기능적으로 필요한) 이의 단편에 플랭킹하는 2 개의 재조합 부위 요소를 포함하는 Ad35 헬퍼 벡터 및 게놈을 포함하며, 각각의 재조합 부위 요소는 재조합 부위를 포함하며, 여기서 2 개의 재조합 부위는 동일한 재조합효소에 대한 부위이다. 상기 언급된 바와 같이, Ad35 헬퍼 벡터의 구축은 다른 벡터와 관련하여 기존 지식으로부터 예측가능하게 조작될 수 없다. 이에 반해, Ad35의 관련 서열은 예를 들어, Ad5의 상응하는 서열과 매우 상이하다(예를 들어, Ad35 및 Ad5의 5' 600 내지 620 개의 뉴클레오티드 비교). 더욱이, 패키징 서열은 혈청형-특이적이다. Ad35 패키징 서열은 적어도 Ad5 패키징 단일 서열 AI, AII, AIII, AIV, 및 AV에 상응하는 서열을 포함한다. 따라서, Ad35 헬퍼 벡터의 생산은 다음을 포함하여 여러 예측할 수 없는 결정을 필요로 한다: (1) 서열 유사성이 제한적인 경우 간단하지 않은, 재조합효소 부위 요소를 대상체 게놈 내로 삽입함으로써 재조합효소 부위(예를 들어, loxP 부위)에 의해 플랭킹되는 Ad35 패키징 서열 또는 기능적으로 기여하는(예를 들어, 기능적으로 필요한) 이의 단편의 식별; (2) 예측될 수 없는, (패키징 서열 또는 기능적으로 기여하는(예를 들어, 기능적으로 필요한) 이의 단편이 절제되지 않은 조건 하에) 헬퍼 벡터의 증식을 무효화하지 않는 재조합효소 부위 요소 삽입의 식별; 및/또는 (3) (예를 들어, 116 세포주와 같은 cre 재조합효소-발현 세포주에서) HDAd35 공여자 벡터의 생산 동안 헬퍼 바이러스 패키징을 감소시키면서 패키징 서열 또는 기능적으로 기여하는(예를 들어, 기능적으로 필요한) 이의 단편의 효율적인 결실을 허용하는 재조합 부위 요소 사이의 간격 식별.
본 개시내용은 (1) 적어도 플랭킹된 서열의 절제를 야기하는 loxP 부위의 재조합이 벡터의 증식을 예를 들어, 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%로 감소(예를 들어, 벡터의 증식을 20%, 30%, 40%, 50%, 60%, 70%의 하한, 및 60%, 70%, 80%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%의 상한을 갖는 백분율로 감소)시킨다는 점에서 Ad35 패키징 서열의 기능적으로 기여하거나 또는 기능적으로 필요한 단편에 플랭킹하는 loxP 부위를 포함하는 복수의 예시적인 Ad35 헬퍼 벡터 및 게놈을 포함하며, 임의적으로 여기서 퍼센트 증식은 비슷한 조건 하에 완전한 벡터(재조합효소 부위-플랭킹된 서열이 절제되지 않음) 또는 야생형 Ad35 벡터와 비교하여 절제된 벡터(절제된 재조합효소 부위-플랭킹된 서열)의 증식에 의해 생산된 바이러스 입자의 수로 측정된다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 178 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 437 뒤에 삽입된다. loxP-플랭킹된 서열의 절제는 패키징 서열 서열 AI 내지 AIV를 제거한다. 이러한 특정 구현예에서, 뉴클레오티드 345-3113의 결실은 E1 유전자 뿐만 아니라 패키징 단일 서열 AVI 및 AVII을 제거한다. 따라서, 플랭킹된 패키징 서열 또는 이의 단편은 위치 179-344에 상응한다. 이 설명에 따른 벡터는 증식되는 것으로 나타났다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 178 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 481 뒤에 삽입되며, 여기서 뉴클레오티드 179-365는 결실된다(패키징 서열 서열 AI 내지 AV를 제거하여, 나머지 서열 AVI 및 AVII이 재조합효소 부위 요소에 의해 플랭킹된 핵산 서열에 있도록 한다. 이러한 특정 구현예에서, 뉴클레오티드 482-3113의 결실은 E1 유전자를 제거한다. 따라서, 플랭킹된 패키징 서열 또는 이의 단편은 위치 366-481에 상응한다. 이 설명에 따른 벡터는 증식되는 것으로 나타났다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 154 다음에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 481 다음에 삽입된다, 이러한 특정 구현예에서, 뉴클레오티드 482-3113의 결실은 E1 유전자를 제거한다. 따라서, 플랭킹된 패키징 서열 또는 이의 단편은 위치 155-481에 상응한다. 이 설명에 따른 벡터는 증식되는 것으로 나타났다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 158 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 480 뒤에 삽입된다. 이 설명에 따른 벡터는 증식되는 것으로 나타났다. 이러한 특정 구현예에서, E3 영역을 포함하는 뉴클레오티드 27388-30402는 결실된다. 특정 구현예에서, 벡터는 Ad35++ 벡터이다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 158 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 446 뒤에 삽입된다. 이 설명에 따른 벡터는 증식되는 것으로 나타났다. 이러한 특정 구현예에서, E3 영역을 포함하는 뉴클레오티드 27388-30402는 결실된다. 특정 구현예에서, 벡터는 Ad35++ 벡터이다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 179 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 480 뒤에 삽입된다. 이 설명에 따른 벡터는 증식되는 것으로 나타났다. 이러한 특정 구현예에서, E3 영역을 포함하는 뉴클레오티드 27388-30402는 결실된다. 특정 구현예에서, 벡터는 Ad35++ 벡터이다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 206 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 480 뒤에 삽입된다. 이 설명에 따른 벡터는 증식되는 것으로 나타났다. 이러한 특정 구현예에서, E3 영역을 포함하는 뉴클레오티드 27,388-30,402는 결실된다. 특정 구현예에서, 뉴클레오티드 27,607-30,409 또는 27,609-30,402는 결실된다. 특정 구현예에서, 뉴클레오티드 27,240-27,608은 결실되지 않는다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 139 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 446 뒤에 삽입된다. 이러한 특정 구현예에서, 뉴클레오티드 27609-30402는 결실된다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 158 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 446 뒤에 삽입된다. 이러한 특정 구현예에서, 뉴클레오티드 27609-30402는 결실된다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 179 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 446 뒤에 삽입된다. 이러한 특정 구현예에서, 뉴클레오티드 27609-30402는 결실된다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 201 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 446 뒤에 삽입된다. 이러한 특정 구현예에서, 뉴클레오티드 27609-30402는 결실된다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 158 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 481 뒤에 삽입된다. 이러한 특정 구현예에서, 뉴클레오티드 27609-30402는 결실된다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 179 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 384 뒤에 삽입된다. 이러한 특정 구현예에서, 뉴클레오티드 27609-30402는 결실된다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 179 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 481 뒤에 삽입된다. 이러한 특정 구현예에서, 뉴클레오티드 27609-30402는 결실된다.
적어도 하나의 예시적인 Ad35 헬퍼 벡터에서, 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 206 뒤에 삽입되고 재조합효소 부위 요소(예를 들어, loxP 요소)는 뉴클레오티드 481 뒤에 삽입된다. 이러한 특정 구현예에서, 뉴클레오티드 27609-30402는 결실된다.
추가적인 임의적 조작 고려사항은 원심분리, 예를 들어, CsCl 초원심분리에 의해 HDAd35 공여자 벡터로부터 헬퍼 벡터의 분리를 허용하는 크기를 갖는 헬퍼 게놈의 조작일 수 있다. 이 결과를 달성하기 위한 한 가지 방식은 헬퍼 게놈의 크기를 34,794 bp의 야생형 길이를 갖는 전형적인 Ad35 게놈과 비교하여 증가시키는 것이다. 특히, 아데노바이러스 게놈은 야생형 길이의 적어도 104%까지 조작함으로써 증가될 수 있다. 본 개시내용의 특정 헬퍼 벡터는 Ad35 E1 영역 및 E4 영역을 포함하고, E3 영역이 결실되고, 페이로드 및/또는 스터퍼 서열을 수용할 수 있다.
Ad35 헬퍼 벡터는 Ad35 공여자 벡터의 생산에 사용될 수 있다. HDAd35++ 벡터의 생산은 HDAd 벡터 게놈을 함유하는 플라스미드 및 구조적 및 비-구조적 바이러스 단백질을 제공하는 패키징-결함 헬퍼 바이러스의 공동-형질감염을 포함할 수 있다. 헬퍼 바이러스 게놈은 Ad35 공여자 벡터의 증식을 구제할 수 있고 Ad35 공여자 벡터는 예를 들어, 대규모로 생산되고 단리될 수 있다. 다양한 프로토콜이 당업계, 예를 들어, Palmer 등, 2009 Gene Therapy Protocols. Methods in Molecular Biology, Volume 433. Humana Press; Totowa, NJ: 2009. pp. 33-53에 알려져 있다.
본 개시내용은 GFP를 암호화하는 페이로드 코딩 서열을 발현하는 접촉된 세포의 퍼센트로 측정된 바와 같이, 본 개시내용의 HDAd35 공여자 벡터가 인간 CD34+ 세포의 형질도입에서 HDAd5/35 공여자 벡터과 비슷하게 수행함을 입증하는 예시적인 데이터를 포함한다. 결과는 접촉된 세포 당 500 내지 2000 개의 벡터 입자 범위의 다중 MOI에서 확인되었다. 예시적인 실험은 예시적인 데이터를 생성하는 데 사용된 HDAd35 공여자 벡터를 사용하여 수행하였으며 loxP 부위가 플랭킹된 뉴클레오티드 366-481에 플랭킹된 상기 개시된 바와 같은 Ad35 헬퍼 벡터를 사용하여 생성하였다(예를 들어, 도 117 참조).
다양한 예시적인 공여자 벡터가 본원에 제공된다. 본 개시내용은 비제한적인 예로서 표 3-6에 제시된 바와 같은 HDAd35 공여자 게놈을 제공한다.
표 3: 서열번호: 304에 따른 예시적인 HDAd35 공여자 벡터.
Figure pct00006
표 4: 서열번호: 305에 따른 예시적인 HDAd35 공여자 벡터
Figure pct00007
표 5: 서열번호: 288에 따른 예시적인 HDAd35 공여자 벡터.
Figure pct00008
표 6: 서열번호: 289에 따른 예시적인 지지 벡터.
Figure pct00009
표 7: 서열번호: 286에 따른 예시적인 Ad35 헬퍼 벡터
Figure pct00010
표 8: 서열번호: 51에 따른 예시적인 Ad35 헬퍼 벡터.
Figure pct00011
표 9: 서열번호: 52에 따른 예시적인 Ad35 헬퍼 벡터.
Figure pct00012
I(C). 유전자 요법 벡터 페이로드
본 개시내용의 Ad35 및 Ad5/35 공여자 벡터 및 게놈은 하나 이상의 발현 산물을 암호화하는 하나 이상의 코딩 서열, 코딩 서열에 작동가능하게 연결된 하나 이상의 조절 서열, 하나 이상의 스터퍼 서열 등 중 임의의 것을 포함할 수 있는 다양한 핵산 페이로드를 포함할 수 있다. 다양한 구현예에서, 페이로드는 숙주 세포 또는 시스템에서 치료 효과와 같은 원하는 결과, 예를 들어, 치료 관심 단백질의 발현 또는 치료 관심의 서열 변형을 생성하기 위한 유전자 편집 시스템, 예를 들어, CRISPR/Cas 시스템 또는 염기 편집 시스템의 발현을 달성하기 위해 조작된다. 일부 구현예에서, 페이로드는 유전자를 포함할 수 있다. 유전자는 코딩 서열 뿐만 아니라 조절 영역 예컨대 프로모터, 인핸서, 종결 영역, 유전자좌 제어 영역(LCR), 종결 및 폴리아데닐화 신호 요소, 스플라이싱 신호 요소 등을 포함할 수 있다. 용어는 대안적인 스플라이스 부위를 초래하는 변이체와 함께, mRNA 전사체로부터 스플라이싱된 모든 인트론 및 다른 DNA 서열을 추가로 포함할 수 있다. 서열은 또한 특이적 유기체 또는 세포 유형에 코돈 선호도를 제공하도록 도입될 수 있는 참조 서열 또는 서열들의 축퇴성 코돈을 포함할 수 있다.
페이로드는 단일 유전자 또는 다중 유전자를 포함할 수 있다. 페이로드는 단일 조절 서열 또는 복수의 조절 서열을 포함할 수 있다. 페이로드는 단일 코딩 서열 또는 복수의 코딩 서열을 포함할 수 있다. 페이로드는 코딩 서열의 개별 발현 산물이 함께 예를 들어, 엔도뉴클레아제 및 가이드 RNA의 경우에서와 같이, 또는 독립적으로, 예를 들어 직접적으로 또는 간접적으로 결합하지 않는 2 개의 개별 단백질로서 기능하는 복수의 코딩 서열을 포함할 수 있다. 일부 경우에, 복수의 코딩 서열은 예를 들어 협력하여 기능할 수 있으며, 여기서 엔도뉴클레아제 및 가이드 RNA는 숙주 세포 또는 시스템에 내인성인 코딩 서열의 발현 증가를 야기하고 페이로드는 내인성 코딩 서열에 의해 암호화된 단백질의 것에 상응하는 적어도 하나의 생물학적 활성을 갖는 단백질을 추가로 암호화하고 발현한다. 당업자에 의해 이해되는 바와 같이, 표준 야생형 Ad35 게놈에 의해 암호화되지 않은 본원에 제공된 임의의 페이로드-암호화된 발현 산물은 본원에서 이종 발현 산물로 지칭될 수 있다.
I(C)(i). 페이로드 발현 산물
본 개시내용의 아데노바이러스 공여자 벡터 또는 아데노바이러스 공여자 게놈의 페이로드는 다양한 발현 산물 중 임의의 것을 암호화하는 하나 이상의 코딩 서열을 포함할 수 있다. 예시적인 발현 산물은 참조 수준과 비교하여 생물학적으로 활성인 단백질의 낮은 발현 또는 활성을 특징으로 하는 질환 또는 병태의 치료를 위한 대체 요법 단백질을 포함하나 이에 제한되지 않는 단백질을 포함한다. 예시적인 발현 산물은 CRISPR/Cas 및 염기 편집기 시스템을 포함한다. 예시적인 발현 산물은 항체, CAR, 및 TCR를 포함한다. 예시적인 발현 산물은 작은 RNA를 포함한다. 다양한 구현예에서, 예를 들어, 의도된 또는 표적 효과가 CRISPR 시스템 또는 염기 편집기 시스템에 의한 숙주 세포 게놈의 편집을 포함하는 특정 경우에, 공여자 벡터 페이로드의 전부 또는 일부의 숙주 세포 게놈 내로의 통합은 의도된 또는 표적 효과를 생성하도록 공여자 벡터 또는 게놈의 표적 세포에 전달하기 위해 요구되지 않는다. 다양한 구현예에서, 예를 들어, 페이로드-암호화된 발현 산물의 발현이 형질도입된 표적 세포의 자손 세포에서 바람직한 경우, 공여자 벡터 페이로드의 전부 또는 일부의 통합은 의도된 또는 표적 효과를 생성하도록 공여자 벡터 또는 게놈의 표적 세포에 전달하기 위해 요구되거나 또는 바람직하다. 다양한 구현예에서, 페이로드는 예를 들어, 재조합 또는 전위에 의해 숙주 세포 게놈 내로 통합을 위해 조작된 핵산 서열("통합 요소")을 포함할 수 있다.
하나 이상의 치료 단백질을 암호화하는 유전자 서열은 관련 아미노산 서열로부터 합성 또는 재조합 방법에 의해 용이하게 제조될 수 있다. 특정 구현예에서, 이들 서열 중 임의의 것을 암호화하는 유전자 서열은 또한 서열을 암호화하는 유전자 서열을 상이한 서열을 암호화하는 또 다른 유전자 서열로 대체하고 용이한 절제를 제공하기 위해 코딩 서열의 5' 및/또는 3' 단부에서 하나 이상의 제한 효소 부위를 가질 수 있다. 특정 구현예에서, 서열을 암호화하는 유전자 서열은 포유류 세포에서 발현을 위해 코돈 최적화될 수 있다.
치료 유전자 및/또는 유전자 산물의 특정 예는 γ-글로빈, 인자 VIII, γC, JAK3, IL7RA, RAG1, RAG2, DCLRE1C, PRKDC, LIG4, NHEJ1, CD3D, CD3E, CD3Z, CD3G, PTPRC, ZAP70, LCK, AK2, ADA, PNP, WHN, CHD7, ORAI1, STIM1, CORO1A, CIITA, RFXANK, RFX5, RFXAP, RMRP, DKC1, TERT, TINF2, DCLRE1B, 및 SLC46A1; FancA, FancB, FancC, FancD1(BRCA2), FancD2, FancE, FancF, FancG, FancI, FancJ(BRIP1), FancL, FancM, FancN(PALB2), FancO(RAD51C), FancP(SLX4), FancQ(ERCC4), FancR(RAD51), FancS(BRCA1), FancT(UBE2T), FancU(XRCC2), FancV(MAD2L2), 및 FancW(RFWD3)를 포함하는 FANC 패밀리 유전자; 가용성 CD40; CTLA; Fas L; CD4, CD5, CD7, CD52 등에 대한 항체; IL1, IL2, IL6에 대한 항체; 자가반응성 T 세포 상에 특이적으로 존재하는 TCR에 대한 항체; IL4; IL10; IL12; IL13; IL1Ra, sIL1RI, sIL1RII; sTNFRI; sTNFRII; TNF에 대한 항체; P53, PTPN22, 및 DRB1*1501/DQB1*0602; 글로빈 패밀리 유전자; WAS; phox; 디스트로핀; 피루베이트 키나제; CLN3; ABCD1; 아릴술파타제 A; SFTPB; SFTPC; NLX2.1; ABCA3; GATA1; 리보솜 단백질 유전자; TERT; TERC; DKC1; TINF2; CFTR; LRRK2; PARK2; PARK7; PINK1; SNCA; PSEN1; PSEN2; APP; SOD1; TDP43; FUS; 유비퀼린 2; C9ORF72 및 본원에 기재된 다른 치료 유전자를 포함한다.
치료 유전자는 적혈구 및 응혈과 관련된 질환에 대한 치료적으로 효과적인 반응을 제공하기 위해 선택될 수 있다. 특정 구현예에서, 질환은 지중해빈혈과 같은 혈색소병증, 또는 겸상적혈구병/특성이다. 치료 유전자는 예를 들어, 헤모글로빈의 생산을 유도하거나 또는 증가시키거나; β-글로빈, γ-글로빈, 또는 α-글로빈의 생산을 유도하거나 또는 증가시키거나; 또는 신체에서 세포에 대한 산소의 이용가능성을 증가시키는 유전자일 수 있다. 치료 유전자는 예를 들어, HBB 또는 CYB5R3일 수 있다. 예시적인 효과적인 치료는 예를 들어, 혈액 세포 계수를 증가시키거나, 혈액 세포 기능을 개선하거나, 또는 환자에서 세포의 산소화를 증가시킬 수 있다. 또 다른 특정 구현예에서, 질환은 혈우병이다. 치료 유전자는 예를 들어, 응고/응혈 인자 VIII 또는 응고/응혈 인자 IX의 생산을 증가시키거나, 응고 인자 VIII 또는 응고 인자 IX의 정상 버전의 생산을 야기하는 유전자, 응고/응혈 인자 VIII 또는 응고/응혈 인자 IX에 대한 항체의 생산을 감소시키는 유전자, 또는 혈전의 적절한 형성을 야기하는 유전자일 수 있다. 예시적인 치료 유전자는 F8 및 F9를 포함한다. 예시적인 효과적인 치료는 예를 들어, 응고/응혈 인자 VIII 및 IX의 생산을 증가시키거나 또는 유도하거나; 응고/응혈 인자 VIII 및 IX의 기능화를 개선하거나, 또는 대상체에서 응혈 시간을 감소시킬 수 있다.
본 개시내용의 다양한 구현예에서, 공여자 벡터는 글로빈 유전자를 암호화하며, 여기서 글로빈 유전자에 의해 암호화된 글로빈 단백질은 γ-글로빈, β-글로빈, 및/또는 α-글로빈으로부터 선택된다. 본 개시내용의 글로빈 유전자는 예를 들어, 글로빈 단백질을 암호화하는 핵산 서열에 작동가능하게 연결된 프로모터와 같은 하나 이상의 조절 서열을 포함할 수 있다. 당업자가 이해하는 바와 같이, γ-글로빈, β-글로빈, 및/또는 α-글로빈 각각은 태아 및/또는 성인 헤모글로빈의 구성요소이며 따라서 본원에 개시된 다양한 벡터에 유용하다.
다양한 구현예에서, 글로빈 단백질의 발현을 증가시키는 것은 (i) 특정 서열을 갖는 글로빈 단백질의 세포 또는 시스템에서 양, 농도, 또는 발현(예를 들어, 암호화하는 핵산의 전사 또는 번역)의 증가; (ii) 서로에 대한 단백질의 서열과 관련없이 특정 유형의 글로빈 단백질의 세포 또는 시스템에서(예를 들어, 암호화하는 핵산의 전사 또는 번역) 양, 농도, 또는 발현(예를 들어, 당업자에 의해 또는 본 명세서에 제시된 바와 같은 γ-글로빈(또는 대안적으로 β-글로빈 또는 α-글로빈)으로 식별될 모든 단백질의 총량)의 증가; 및/또는 (iii) 이종 글로빈 단백질, 예를 들어, 유전자 요법 전에 숙주 세포에 의해 암호화되지 않은 글로빈 단백질의 세포 또는 시스템에서 발현 중 하나 이상 중 임의의 것을 지칭할 수 있다.
다음 참고문헌은 기능적 글로빈 유전자의 특정 예시적인 서열을 설명한다. 참고문헌 1-4는 α-형 글로빈 서열에 관한 것이고 참고문헌 4-12는 β-형 글로빈 서열(β 및 γ 글로빈 서열)에 관한 것이며, 이의 서열은 본원에 참조로 포함된다: (1) GenBank 수탁 번호 Z84721 (Mar. 19, 1997); (2) GenBank 수탁 번호 NM_000517 (Oct. 31, 2000); (3) Hardison 등, J. Mol. Biol. (1991) 222(2):233-249; (4) A Syllabus of Human Hemoglobin Variants (1996), by Titus 등, published by The Sickle Cell Anemia Foundation in Augusta, Ga. (available online at globin.cse.psu.edu); (5) GenBank 수탁 번호 J00179 (Aug. 26, 1993); (6) Tagle 등, Genomics (1992) 13(3):741-760; (7) Grovsfeld 등, Cell (1987) 51(6):975-985; (8) Li 등, Blood (1999) 93(7):2208-2216; (9) Gorman 등, J. Biol. Chem. (2000) 275(46):35914-35919; (10) Slightom 등, Cell (1980) 21(3):627-638; (11) Fritsch 등, Cell (1980) 19(4): 959-972; (12) Marotta 등, J. Biol. Chem. (1977) 252(14):5040-5053. 글로빈을 암호화하는 유전자의 추가적인 코딩 및 비-코딩 영역에 대해 예를 들어, Marotta 등, Prog. Nucleic Acid Res. Mol. Biol. 19, 165-175, 1976, Lawn 등, Cell 21 (3), 647-651, 1980, 및 Sadelain 등, PNAS.; 92:6728-6732, 1995를 참조한다.
헤모글로빈 서브유닛 β의 예시적인 아미노산 서열은 예를 들어, NCBI 수탁 번호 P68871에 제공된다. β-글로빈에 대한 예시적인 아미노산 서열은 예를 들어, NCBI 수탁 번호 NP_000509에 제공된다.
치료 유전자 및/또는 유전자 산물 이외에도, 이식유전자는 또한 체크포인트 억제제 시약, 하나 이상의 암 항원에 특이적인 키메라 항원 수용체 분자, 및/또는 하나 이상의 암 항원에 특이적인 T-세포 수용체와 같은 치료 분자를 암호화할 수 있다.
또 다른 예로서, 치료 유전자는 리소좀 축적 장애에 대한 치료적으로 효과적인 반응을 제공하기 위해 선택될 수 있다. 특정 구현예에서, 리소좀 축적 장애는 뮤코다당류축적증(MPS), I형; MPS II 또는 헌터 증후군; MPS III 또는 산필리포 증후군; MPS IV 또는 모르키오 증후군; MPS V; MPS VI 또는 마로토-라미 증후군; MPS VII 또는 슬라이 증후군; α-만노사이드축적증; β-만노사이드축적증; GSDI로도 알려져 있는 글리코겐 축적 질환 I형, 폰 기르케병, 또는 테이 삭스; 폼페병; 고세병; 파브리병이다. 치료 유전자는 예를 들어 효소의 생산을 암호화하거나 또는 유도하거나, 또는 달리 리소좀에서 뮤코다당류의 분해를 야기하는 유전자일 수 있다. 예시적인 치료 유전자는 IDUA 또는 이두로니다제, IDS, GNS, HGSNAT, SGSH, NAGLU, GUSB, GALNS, GLB1, ARSB, 및 HYAL1을 포함한다. 리소좀 축적 질환에 대한 예시적인 효과적인 유전적 요법은 예를 들어, 리소좀에서 다양한 물질의 분해를 담당하는 효소의 생산을 암호화 또는 유도하고; 머리(대두증), 간, 비장, 혀, 또는 성대를 포함하는 다양한 기관에서 부종을 감소, 제거, 방지, 또는 지연시키고; 뇌의 체액을 감소시키고; 심장 판막 이상을 감소시키고; 좁아진 기도를 방지 또는 연장시키고 감염 및 수면 무호흡과 같은 관련 상부 호흡기 병태를 예방하고; 뉴런의 파괴, 및/또는 연관 증상을 감소, 제거, 예방, 또는 지연시킬 수 있다.
또 다른 예로서, 치료 유전자는 과증식성 질환에 대한 치료적으로 효과적인 반응을 제공하기 위해 선택될 수 있다. 특정 구현예에서, 과증식성 질환은 암이다. 치료 유전자는 예를 들어, 종양 억제인자 유전자, 세포자멸사를 유도하는 유전자, 효소를 암호화하는 유전자, 항체를 암호화하는 유전자, 또는 호르몬을 암호화하는 유전자일 수 있다. 예시적인 치료 유전자 및 유전자 산물은 (본원의 다른 곳에 나열된 것들 이외에도) 101F6, 123F2(RASSF1), 53BP2, abl, ABLI, ADP, aFGF, APC, ApoAI, ApoAIV, ApoE, ATM, BAI-1, BDNF, 베타*(BLU), bFGF, BLC1, BLC6, BRCA1, BRCA2, CBFA1, CBL, C-CAM, CNTF, COX-1, CSFIR, CTS-1, 사이토신 데아미나제, DBCCR-1, DCC, Dp, DPC-4, E1A, E2F, EBRB2, erb, ERBA, ERBB, ETS1, ETS2, ETV6, Fab, FCC, FGF, FGR, FHIT, fms, FOX, FUS1, FYN, G-CSF, GDAIF, 유전자 21(NPRL2), 유전자 26(CACNA2D2), GM-CSF, GMF, gsp, HCR, HIC-1, HRAS, hst, IGF, IL-1, IL-2, IL-3, IL-5, IL-6, IL-7, IL-8, IL-9, IL-11, ING1, 인터페론 α, 인터페론 β, 인터페론 γ, IRF-1, JUN, KRAS, LUCA-1(HYAL1), LUCA-2(HYAL2), LYN, MADH4, MADR2, MCC, mda7, MDM2, MEN-I, MEN-II, MLL, MMAC1, MYB, MYC, MYCL1, MYCN, neu, NF-1, NF-2, NGF, NOEY1, NOEY2, NRAS, NT3, NT5, OVCA1, p16, p21, p27, p57, p73, p300, PGS, PIM1, PL6, PML, PTEN, raf, Rap1A, ras, Rb, RB1, RET, rks-3, ScFv, scFV ras, SEM A3, SRC, TALI, TCL3, TFPI, 트롬보스폰딘, 티미딘 키나제, TNF, TP53, trk, T-VEC, VEGF, VHL, WT1, WT-1, YES, 및 zac1을 포함한다. 예시적인 효과적인 유전적 요법은 종양을 억제 또는 제거하거나, 암 세포 수를 감소시키거나, 종양 크기를 감소시키거나, 종양 성장을 지연 또는 제거하거나, 종양에 의해 야기된 증상을 완화할 수 있다.
또 다른 예로서, 치료 유전자는 감염성 질환에 대한 치료적으로 효과적인 반응을 제공하기 위해 선택될 수 있다. 특정 구현예에서, 감염성 질환은 인간 면역결핍 바이러스(HIV)이다. 치료 유전자는 예를 들어, 면역 세포가 HIV 감염에 대해 내성을 갖도록 하거나, 또는 면역 세포가 면역 재구축을 통해 바이러스를 효과적으로 중화할 수 있게 하는 유전자, 면역 세포에 의해 발현된 단백질을 암호화하는 유전자의 다형성, 환자에서 발현되지 않는 감염과 싸우는 데 유리한 유전자, 감염원, 수용체 또는 공수용체를 암호화하는 유전자; 수용체 또는 공수용체에 대한 리간드를 암호화하는 유전자; 특정 전사 인자의 작용을 차단하는 리보자임, 안티센스 RNA, 작은 간섭 RNA(siRNA) 또는 유인 RNA를 암호화하는 유전자; 우성 음성 바이러스 단백질, 세포내 항체, 인트라킨 및 자살 유전자를 암호화하는 유전자를 포함하는 바이러스 복제에 필수적인 바이러스 및 세포 유전자일 수 있다. 예시적인 치료 유전자 및 유전자 산물은 α2β1; αvβ3; αvβ5; αvβ63; BOB/GPR15; Bonzo/STRL-33/TYMSTR; CCR2; CCR3; CCR5; CCR8; CD4; CD46; CD55; CXCR4; 아미노펩티다제-N; HHV-7; ICAM; ICAM-1; PRR2/HveB; HveA; α-디스트로글리칸; LDLR/α2MR/LRP; PVR; PRR1/HveC; 및 라미닌 수용체를 포함한다. 예를 들어, HIV의 치료를 위한 치료 유효량은 HIV에 대한 대상체의 면역력을 증가시키거나, AIDS 또는 HIV와 연관된 증상을 개선시키거나, 또는 HIV에 대한 대상체에서 선천적 또는 적응 면역 반응을 유도할 수 있다. HIV에 대한 면역 반응은 항체 생산을 포함하고 AIDS 예방 및/또는 대상체의 AIDS 또는 HIV 감염 증상 개선을 초래하거나, 또는 HIV 감염성 및/또는 병독성을 감소 또는 제거할 수 있다.
다양한 구현예에서, 본 개시내용의 벡터 또는 게놈, 예를 들어, Ad35 헬퍼 벡터 또는 Ad35 헬퍼 게놈은 예를 들어, CRISPR/Cas의 정상 활성을 억제하는 파지로부터 유래된 항-CRISPR (Acr) 단백질을 암호화하고/하거나 발현한다.
I(C)(i)(a). 결합 도메인, 항체, CAR, 및 TCR 페이로드 발현 산물
본 개시내용은 다양한 결합 도메인을 포함한다. 항체는 결합 도메인의 일 예이며 세포 마커에 특이적으로 결합하는 전체 항체 또는 항체의 결합 단편, 예를 들어, Fv, Fab, Fab', F(ab')2, 및 단일 쇄(sc) 형태 및 이의 단편(예를 들어, scFv)을 포함한다. 항체 또는 항원 결합 단편은 다클론 항체, 단클론 항체, 인간 항체, 인간화 항체, 합성 항체, 비-인간 항체, 재조합 항체, 키메라 항체, 이중특이적 항체, 미니바디(mini body), 및 선형 항체의 전부 또는 일부를 포함할 수 있다. 이의 기능적 단편은 중쇄 가변 도메인(VH), 경쇄 가변 도메인(VL) 및 낙타과 유래 나노바디(nanobody)의 가변 도메인(VHH) 등과 같은 단일-도메인 항체를 포함한다.
일부 경우에, scFv는 당업계에 알려진 방법에 따라 제조될 수 있다(예를 들어, Bird 등, Science 242:423-426, 1988; 및 Huston 등, Proc. Natl. Acad. Sci. USA 85:5879-5883, 1988 참조). ScFv 분자는 유연한 폴리펩티드 링커를 사용하여 항체의 VL 및 VH 영역을 함께 연결함으로써 생성될 수 있다. 짧은 폴리펩티드 링커가 이용되는 경우(예를 들어, 5-10 개의 아미노산) 쇄간 접힘이 방지된다. 쇄간 접힘은 또한 기능적 에피토프 결합 부위를 형성하기 위해 2 개의 가변 영역을 함께 가져오는 데 필요하다. 링커 방향 및 크기의 예는 예를 들어, Hollinger 등 1993 Proc Natl Acad. Sci. U.S.A. 90:6444-6448, US 2005/0100543, US 2005/0175606, US 2007/0014794, WO2006/020258, 및 WO2007/024715를 참조한다.
scFv는 VL 및 VH 영역 사이에 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 25, 30, 35, 40, 45, 50 개, 또는 그 이상의 아미노산 잔기의 링커를 포함할 수 있다. 특정 구현예에서, 링커 서열은 임의의 자연 발생 아미노산을 포함할 수 있다. 일반적으로, scFv의 VL 및 VH를 연결하는 데 사용되는 링커 서열은 5 내지 35 개의 아미노산 길이이다. 특정 구현예에서, VL-VH 링커는 5 내지 35 개, 10 내지 30 개의 아미노산 또는 15 내지 25 개의 아미노산을 포함한다. 링커 길이의 변경은 활성을 유지하거나 또는 향상시켜, 활성 연구에서 우수한 효능을 일으킬 수 있다.
일부 구현예에서, scFv의 링커 서열은 아미노산 글리신 및 세린을 포함한다. 특정 구현예에서, 링커 서열은 (GlyxSery)n의 1 내지 10 개의 반복부와 같은 글리신 및 세린 반복부의 세트를 포함하며, 여기서 x 및 y는 독립적으로 0 내지 10의 정수이며, 단, x 및 y는 둘 다 0이 아니고 여기서 n은 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10의 정수이고) 여기서 연결된 VH-VL 영역은 기능적 면역글로불린-유사 결합 도메인(예를 들어, scFv, scTCR)을 형성한다. 특정 예는 (Gly4Ser)n, (Gly3Ser)n(Gly4Ser)n, (Gly3Ser)n(Gly2Ser)n, (Gly3Ser)n(Gly4Ser)1, (Gly4Ser)1, (Gly3Ser)1, 또는 (Gly2Ser)1을 포함한다. 특정 구현예에서, 링커는 (Gly4Ser)4 또는 (Gly4Ser)3이다. 상기 scTCR에 대한 참조를 통해 나타낸 바와 같이, 이러한 링커는 또한 T 세포 수용체 Vα/β 및 Cα/β 쇄(예를 들어, Vα-Cα, Vβ-Cβ, Vα-Vβ)에 연결하는 데 사용될 수 있다.
추가적인 예는 scFv-기반 그라바바디(grababody) 및 가용성 VH 도메인 항체를 포함한다. 이들 항체는 중쇄 가변 영역만을 사용하여 결합 영역을 형성한다. 예를 들어, Jespers 등, Nat. Biotechnol. 22:1161, 2004; Cortez-Retamozo 등, Cancer Res. 64:2853, 2004; Baral 등, Nature Med. 12:580, 2006; 및 Barthelemy 등, J. Biol. Chem. 283:3639, 2008 참조.
일부 경우에, 결합 도메인이 궁극적으로 사용될 동일한 종으로부터 유래되는 것이 유익하다. 예를 들어, 인간에서 사용하기 위해, 항원 결합 도메인이 인간 항체, 인간화 항체, 또는 이의 단편 또는 조작된 형태를 포함하는 것이 유익할 수 있다. 인간 기원의 항체 또는 인간화 항체는 인간에서 면역원성이 낮거나 또는 전혀 없고 비-인간 항체와 비교하여 더 적은 수의 비-면역원성 에피토프를 갖는다. 항체 및 이의 조작된 단편은 일반적으로 인간 대상체에서 감소된 수준의 항원성을 갖거나 또는 전혀 없도록 선택될 것이다.
특정 구현예에서, 결합 도메인은 인간화 항체 또는 이의 조작된 단편을 포함한다. 특정 구현예에서, 비-인간 항체는 인간화되며, 여기서 항체의 하나 이상의 아미노산 잔기는 인간 또는 이의 단편에서 자연적으로 생성된 항체에 대한 유사성을 증가시키도록 변형된다. 이들 비인간 아미노산 잔기는 종종 "유입" 잔기로 지칭되며, 전형적으로 "유입" 가변 도메인으로부터 취해진다. 본원에 제공된 바와 같이, 인간화 항체 또는 항체 단편은 비인간 면역글로불린 분자 및 프레임워크 영역으로부터 하나 이상의 CDR을 포함하며 여기서 프레임워크를 포함하는 아미노산 잔기는 인간 생식계열로부터 완전히 또는 대부분 유래된다. 일 측면에서, 항원 결합 도메인은 인간화된다. 인간화 항체는 CDR-이식(예를 들어, 유럽 특허 번호 EP 239,400; WO 91/09967; 및 US 5,225,539, US 5,530,101, 및 US 5,585,089 참조), 베니어링(veneering) 또는 재표면화(예를 들어, EP 592,106 및 EP 519,596; Padlan, 1991, Molecular Immunology, 28(4/5):489-498; Studnicka 등, 1994, Protein Engineering, 7(6):805-814; 및 Roguska 등, PNAS, 91:969-973, 1994 참조), 쇄 셔플링(shuffling)(예를 들어, US. 5,565,332 참조), 및 예를 들어, US 2005/0042664, US 2005/0048617, US 6,407,213, US 5,766,886, WO 9317105, Tan 등, J. Immunol., 169:1119-25, 2002, Caldas 등, Protein Eng., 13(5):353-60, 2000, Morea 등, Methods, 20(3):267-79, 2000, Baca 등, J. Biol. Chem., 272(16): 10678-84, 1997, Roguska 등, Protein Eng., 9(10):895-904, 1996, Couto 등, Cancer Res., 55 (23 Supp):5973s-5977s, 1995, Couto 등, Cancer Res., 55(8):1717-22, 1995, Sandhu, Gene, 150(2):409-10, 1994, 및 Pedersen 등, J. Mol. Biol., 235(3):959-73, 1994에 개시된 기술을 포함하여, 당업계에 알려진 다양한 기술을 사용하여 생성될 수 있다. 종종, 프레임워크 영역의 프레임워크 잔기는 CDR 공여자 항체로부터 상응하는 잔기로 치환되어 세포 마커 결합을 변경, 예를 들어 개선시킬 것이다. 이들 프레임워크 치환은 당업계에 잘 알려진 방법, 예를 들어, 세포 마커 결합에 중요한 프레임워크 잔기를 식별하기 위한 CDR 및 프레임워크 잔기의 상호작용 모델링 및 특정 위치에서 특이한 프레임워크 잔기를 식별하기 위한 서열 비교에 의해 식별된다. (예를 들어, US 5,585,089; 및 Riechmann 등, Nature, 332:323, 1988 참조).
특정 세포 마커에 특이적으로 결합하는 항체 및 다른 결합 도메인은 단클론 항체를 수득하는 방법, 파지 디스플레이 방법, 인간 또는 인간화 항체를 생성하는 방법, 또는 당업자에게 알려진 바와 같이 항체를 생성하도록 조작된 유전자이식 동물 또는 식물을 사용하는 방법을 사용하여 제조될 수 있다(예를 들어, US 6,291,161 및 US 6,291,158 참조). 부분적 또는 완전 합성 항체의 파지 디스플레이 라이브러리가 이용가능하며 세포 마커에 결합할 수 있는 항체 또는 이의 단편에 대해 스크리닝될 수 있다. 예를 들어, 결합 도메인은 관심 세포 마커에 특이적으로 결합하는 Fab 단편에 대한 Fab 파지 라이브러리를 스크리닝함으로써 식별될 수 있다(Hoet 등, Nat. Biotechnol. 23:344, 2005 참조). 인간 항체의 파지 디스플레이 라이브러리가 또한 이용가능하다. 추가적으로, 편리한 시스템(예를 들어, 마우스, HuMAb mouse®(GenPharm Int'l. Inc., 캘리포니아주 마운틴뷰 소재), TC mouse®(Kirin Pharma Co. Ltd., 일본 도쿄 소재), KM-mouse®(Medarex, Inc., 뉴저지주 프린스턴 소재), 라마, 닭, 래트, 햄스터, 토끼 등)에서 관심 세포 마커를 면역원으로 사용한 하이브리도마 개발을 위한 전통적인 전략을 사용하여 결합 도메인을 개발할 수 있다. 특정 구현예에서, 항체는 특정 암 세포 유형에 의해 우선적으로 발현되는 세포 마커에 특이적으로 결합하고 비특이적 구성요소 또는 관련되지 않은 표적과 교차 반응하지 않는다. 일단 식별되면, 항체의 아미노산 서열 및 항체를 암호화하는 유전자 서열은 단리되고/되거나 결정될 수 있다.
특정 구현예에서, 치료 유전자는 Fab 또는 scFv와 같은 항체 또는 항체의 결합 단편을 암호화할 수 있다. 발현될 수 있는 예시적인 항체(scFv 포함)는 WO2014/164553A1, US2017/0283504, US 7,083,785, US 10,189,906, US 10,174,095, WO2005102387, US2011/0206701A1, WO2014/179759A1, US2018/0037651A1, US2018/0118822A1, WO2008/047242A2, WO1996/016990A1, WO200/5103083A2, 및 WO1999/062526A2에 기재된 제공된 것들을 포함한다. 결합 도메인과 관련하여 상기 기재된 항체, 뿐만 아니라 아테졸리주맙, 블리나투모맙, 브렌툭시맙, 세툭시맙, 섬투주맙, 팔레투주맙, 겜투주맙, OKT3, 오레고보맙, 프로믹시맙, 펨브롤리주맙, 및 트라스투주맙이 또한 사용될 수 있다.
면역 체크포인트 억제제가 또한 사용될 수 있다. 면역 체크포인트 억제제는 면역 억제 체크포인트 단백질의 기능을 억제하는 화합물을 지칭한다. 억제는 기능 감소 및 완전 차단을 포함한다. 바람직한 면역 체크포인트 억제제는 면역 체크포인트 단백질을 특이적으로 인식하는 항체이다. 다수의 면역 체크포인트 억제제가 알려져 있으며 이러한 알려진 면역 체크포인트 단백질 억제제의 유사성에서, 대안적인 면역 체크포인트 억제제가 (가까운) 미래에 개발될 수 있다. 면역 체크포인트 억제제는 펩티드, 항체, 핵산 분자 및 소분자를 포함한다. 특정 구현예에서, 면역 체크포인트 억제제는 대상체에서 CD8+ T 세포의 증식, 이동, 지속 및/또는 세포독성 활성 및 특히 대상체의 CD8+ T 세포의 종양-침윤을 향상시킨다. 또 다른 예시적인 면역 체크포인트 억제제는 실시예 4에 개시된 바와 같은 체크포인트 억제제를 포함한다. 따라서, 본 개시내용의 예시적인 면역 체크포인트 억제제는 αPD-L1γ1 항체(대안적으로 αPD-L1γ1로 지칭됨)를 포함한다. αPD-L1γ1은 Engeland 등 Mol Ther 22(11):1949-1959, 2014에 추가로 기재되며, 특히 항-PD-L1 항체, 이를 암호화하는 핵산, 및 이의 용도와 관련하여그 전문이 본원에 참조로 포함된다.
PD-1 및 PD-L1 항체의 예는 US 7,488,802; US 7,943,743; US 8,008,449; US 8,168,757; US 8,217,149, WO03042402, WO2008156712, WO2010089411, WO2010036959, WO2011066342, WO2011159877, WO2011082400, 및 WO2011161699에 기재되어 있다. 일부 구현예에서, PD-1 차단제는 항-PD-L1 항체를 포함한다. 특정한 다른 구현예에서 PD-1 차단제는 항-PD-1 항체 및 유사한 결합 단백질 예컨대 리간드 PD-L1 및 PD-L2에 의해 PD-1에 결합하고 이의 활성화를 차단하는 완전 인간 IgG4 항체인 니볼루맙(MDX 1106, BMS 936558, ONO 4538); PD-1에 대한 인간화 단클론 IgG4 항체인 람브롤리주맙(MK-3475 또는 SCH 900475); PD-1에 결합하는 인간화 항체인 CT-011; B7-DC의 융합 단백질인 AMP-224; 항체 Fc 부분; PD-L1(B7-H1) 차단을 위한 BMS-936559(MDX-1105-01)를 포함한다.
다른 면역-체크포인트 억제제는 가용성 Ig 융합 단백질인 IMP321과 같은 림프구 활성화 유전자-3(LAG-3) 억제제를 포함한다(Brignone 등, 2007, J. Immunol. 179:4202-4211). 다른 면역-체크포인트 억제제는 B7-H3 및 B7-H4 억제제와 같은 B7 억제제를 포함한다. 특히, 항-B7-H3 항체 MGA271(Loo 등, 2012, Clin. Cancer Res. July 15 (18) 3834). 또한 TIM3(T-세포 면역글로불린 도메인 및 뮤신 도메인 3) 억제제가 포함된다(Fourcade 등, J. Exp. Med. 207:2175-86, 2010 및 Sakuishi 등, J. Exp. Med. 207:2187-94, 2010). 본원에 사용된 바와 같이, 용어 "TIM-3"은 당업계에서 일반적인 의미를 가지며 T 세포 면역글로불린 및 뮤신 도메인-함유 분자 3을 지칭한다. TIM-3의 천연 리간드는 갈렉틴 9(Ga19)이다. 따라서, 본원에 사용된 바와 같은 용어 "TIM-3 억제제"는 TIM-3의 기능을 억제할 수 있는 화합물, 물질 또는 조성물을 지칭한다. 예를 들어, 억제제는 TIM-3의 발현 또는 활성을 억제하고/하거나, TIM-3 신호전달 경로를 조절 또는 차단하고/하거나 갈렉틴-9에 대한 TIM-3의 결합을 차단할 수 있다. TIM-3에 대한 특이성을 갖는 항체는 당업계에 잘 알려져 있으며 전형적으로 WO2011/155607, WO2013/006490 및 WO2010/117057에 기재된 것들이다.
추가적인 특정 면역 체크포인트 억제제는 아테졸리주맙, BMS-936559, 이필리무맙, MEDI0680, MEDI4736, MSB0010718C, 펨브롤리주맙, 피딜리주맙, 및 트레멜리무맙을 포함한다. 또한 WO 1998/42752; WO 2000/37504; WO 2001/014424; WO 2004/035607; US 2005/0201994; US 2002/0039581; US 2002/086014; US 5,811,097; US 5,855,887; US 5,977,318; US 6,051,227; US 6,984,720; US 6,682,736; US 6,207,156; US 6,682,736; US 7,109,003; US 7,132,281; EP1212422B1; Hurwitz 등, Proc. Natl. Acad. Sci. USA, 95(17):10067-10071 (1998); Camacho 등, J. Clin. Oncology, 22(145): Abstract No. 2505, 2004(항체 CP-675206); 및 Mokyr 등, Cancer Res, 58:5301-5304, 1998 참조.
본 개시내용은 CD4, CD5, CD7, CD52 등에 결합하는 항체 및 다른 결합 도메인; 항체; IL1, IL2, IL6에 대한 항체; 자가반응성 T 세포 상에 특이적으로 존재하는 TCR에 대한 항체; IL4; IL10; IL12; IL13; IL1Ra; sIL1RI; sIL1RII; TNF에 대한 항체; ABCA3; ABCD1; ADA; AK2; APP; 아르기나제; 아릴술파타제 A; A1AT; CD3D; CD3E; CD3G; CD3Z; CFTR; CHD7; 키메라 항원 수용체(CAR); CIITA; CLN3; 보체 인자, CORO1A; CTLA; C1 억제제; C9ORF72; DCLRE1B; DCLRE1C; 유인 수용체; DKC1; DRB1*1501/DQB1*0602; 디스트로핀; 효소; 인자 VIII, FANC 패밀리 유전자(FancA, FancB, FancC, FancD1(BRCA2), FancD2, FancE, FancF, FancG, FancI, FancJ(BRIP1), FancL, FancM, FancN(PALB2), FancO(RAD51C), FancP(SLX4), FancQ(ERCC4), FancR(RAD51), FancS(BRCA1), FancT(UBE2T), FancU(XRCC2), FancV(MAD2L2), 및 FancW(RFWD3)); Fas L; FUS; GATA1; 글로빈 패밀리 유전자(즉, γ-글로빈); F8; 글루타미나제; HBA1; HBA2; HBB; IL7RA; JAK3; LCK; LIG4; LRRK2; NHEJ1; NLX2.1; 중화 항체; ORAI1; PARK2; PARK7; phox; PINK1; PNP; PRKDC; PSEN1; PSEN2; PTPN22; PTPRC; P53; 피루베이트 키나제; RAG1; RAG2; RFXANK; RFXAP; RFX5; RMRP; 리보솜 단백질 유전자; SFTPB; SFTPC; SOD1; 가용성 CD40; STIM1; sTNFRI; sTNFRII; SLC46A1; SNCA; TDP43; TERT; TERC; TINF2; 유비퀼린 2; WAS; WHN; ZAP70; γC; 및 본원에 기재된 다른 치료 유전자를 추가로 포함한다.
결합 도메인의 대안적인 공급원은 다음을 포함한다: 랜덤 펩티드 라이브러리를 암호화하는 서열 또는 scTCR과 같은 대안적인 비-항체 스캐폴드의 루프 영역에서 다양한 조작된 아미노산을 암호화하는 서열(예를 들어, Lake 등, Int. Immunol. 11:745, 1999; Maynard 등, J. Immunol. Methods 306:51, 2005; US 8,361,794 참조), 피브리노겐 도메인(예를 들어, Weisel 등, Science 230:1388, 1985 참조), 쿠니츠(Kunitz) 도메인(예를 들어, US 6,423,498 참조), 설계된 안키린 반복 단백질(DARPins; Binz 등, J. Mol. Biol. 332:489, 2003 및 Binz 등, Nat. Biotechnol. 22:575, 2004), 피브로넥틴 결합 도메인(아드넥틴 또는 모노바디(monobody); Richards 등, J. Mol. Biol. 326:1475, 2003; Parker 등, Protein Eng. Des. Selec. 18:435, 2005 and Hackel 등, J. Mol. Biol. 381:1238-1252, 2008), 시스테인-노트(knot) 미니단백질(Vita 등, 1995, Proc. Nat'l. Acad. Sci. (USA) 92:6404-6408; Martin 등, 2002, Nat. Biotechnol. 21:71, 2002 및 Huang 등, Structure 13:755, 2005), 테트라트리코펩티드 반복 도메인(Main 등, Structure 11:497, 2003 및 Cortajarena 등, ACS Chem. Biol. 3:161, 2008), 류신-풍부 반복 도메인(Stumpp 등, J. Mol. Biol. 332:471, 2003), 리포칼린 도메인(예를 들어, WO 2006/095164, Beste 등, Proc. Nat'l. Acad. Sci. (USA) 96:1898, 1999 및 Schonfeld 등, Proc. Nat'l. Acad. Sci. (USA) 106:8198, 2009 참조), V-유사 도메인(예를 들어, US 2007/0065431 참조), C-형 렉틴 도메인(Zelensky and Gready, FEBS J. 272:6179, 2005; Beavil 등, Proc. Nat'l. Acad. Sci. (USA) 89:753, 1992 및 Sato 등, Proc. Nat'l. Acad. Sci. (USA) 100:7779, 2003), 항원 결합 도메인이 있는 mAb2 또는 Fc-영역(Fcab™(F-Star Biotechnology, 영국 캠브리지 소재; 예를 들어, WO 2007/098934 및 WO 2006/072620 참조), 아르마딜로 반복 단백질(예를 들어, Madhurantakam 등, Protein Sci. 21: 1015, 2012; WO 2009/040338 참조), 아필린(Ebersbach 등, J. Mol. Biol. 372: 172, 2007), 아피바디(affibody), 아비버, 노틴(knottin), 피노머(fynomer), 아트리머(atrimer), 세포독성 T-림프구 연관 단백질-4(Weidle 등, Cancer Gen. Proteo. 10:155, 2013), 또는 기타(Nord 등, Protein Eng. 8:601, 1995; Nord 등, Nat. Biotechnol. 15:772, 1997; Nord 등, Euro. J. Biochem. 268:4269, 2001; Binz 등, Nat. Biotechnol. 23:1257, 2005; Boersma and Pluckthun, Curr. Opin. Biotechnol. 22:849, 2011).
펩티드 압타머는 단백질 스캐폴드의 양쪽 단부에 부착된 펩티드 루프(세포 마커에 특이적)를 포함한다. 이 이중 구조적 제약은 펩티드 압타머의 결합 친화도를 항체와 비슷한 수준으로 증가시킨다. 가변 루프 길이는 전형적으로 8 내지 20 개의 아미노산이고 스캐폴드는 안정되고, 가용성이고, 작고, 무독성인 임의의 단백질일 수 있다. 펩티드 압타머 선택은 효모 2-하이브리드 시스템(예를 들어, Gal4 효모-2-하이브리드 시스템), 또는 LexA 상호작용 트랩 시스템과 같은 상이한 시스템을 사용하여 이루어질 수 있다.
특정 구현예에서, 결합 도메인은 세포 마커 CD33에 결합한다. 특정 구현예에서, CD33에 결합하는 결합 도메인은 겜투주맙, 아클리주맙, 또는 HuM195 중 하나로부터 유래된다. 특정 구현예에서 CD33 결합 도메인은 서열번호: 91을 포함하는 CDRL1 서열, 서열번호: 92를 포함하는 CDRL2 서열, 및 서열번호: 93을 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열번호: 94를 포함하는 CDRH1 서열, 서열번호: 95를 포함하는 CDRH2 서열, 및 서열번호: 96을 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함하는 인간 또는 인간화 결합 도메인이다.
특정 구현예에서, CD33 결합 도메인은 서열번호: 97을 포함하는 CDRL1 서열, 서열번호: 98을 포함하는 CDRL2 서열, 및 서열번호: 99를 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열번호: 100을 포함하는 CDRH1 서열, 서열번호: 101을 포함하는 CDRH2 서열, 및 서열번호: 102를 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함하는 인간 또는 인간화 scFv이다. CD33에 결합하는 결합 도메인에 관한 더 많은 정보를 위해, 미국 특허 번호 제8759494호를 참조한다.
특정 구현예에서, 인간 CD33에 결합하는 서열은 서열 서열번호: 103을 포함하는 가변 경쇄 영역, 및 서열 서열번호: 104를 포함하는 가변 중쇄 영역을 포함한다. 특정 구현예에서, 인간 CD33에 결합하는 서열은 서열 서열번호: 103을 포함하는 가변 경쇄 영역, 및 서열 서열번호: 106을 포함하는 가변 중쇄 영역을 포함한다.
특정 구현예에서, 결합 도메인은 전장 CD33(CD33FL)에 결합한다. 특정 구현예에서, CD33FL에 결합하는 결합 도메인은 5D12, 8F5, 1H7, 린투주맙, 또는 겜투주맙 중 적어도 하나로부터 유래된다. 특정 구현예에서, CD33FL 결합 도메인은 인간 또는 인간화이며, 서열번호: 107을 포함하는 CDRL1 서열, 서열번호: 108을 포함하는 CDRL2 서열, 서열번호: 109를 포함하는 CDRL3 서열을 포함하는 가변 경쇄), 서열번호: 110을 포함하는 CDRH1 서열, 서열번호: 111을 포함하는 CDRH2 서열, 및 서열번호: 112를 포함하는 CDRH3 서열을 포함한다. CD33FL에 결합하는 결합 도메인에 관한 더 많은 정보를 위해, PCT/US17/42264을 참조한다.
특정 구현예에서, 인간 CD33FL에 결합하는 결합 도메인은 서열 서열번호: 113을 포함하는 가변 경쇄 영역), 및 서열 서열번호: 114를 포함하는 가변 중쇄 영역을 포함한다.
특정 구현예에서, 결합 도메인은 세포 마커 CD33델타E2(CD33ΔE2)에 결합한다. 특정 구현예에서, CD33ΔE2에 결합하는 결합 도메인은 12B12, 4H10, 11D5, 13E11, 11D11, 또는 1H7 중 적어도 하나로부터 유래된다. 특정 구현예에서, CD33ΔE2 결합 도메인은 인간 또는 인간화이며 서열번호: 115를 포함하는 CDRL1 서열, 서열번호: 116을 포함하는 CDRL2 서열, 서열번호: 117을 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 서열번호: 118을 포함하는 CDRH1 서열, 서열번호: 11을 포함하는 CDRH2 서열), 및 서열번호: 120을 포함하는 CDRH3 서열을 포함한다. CD33ΔE2에 결합하는 결합 도메인에 관한 더 많은 정보를 위해, PCT/US17/42264를 참조한다.
특정 구현예에서, 인간 CD33ΔE2에 결합하는 서열은 서열 서열번호: 121을 포함하는 가변 경쇄 영역, 및 서열 서열번호: 122를 포함하는 가변 중쇄 영역을 포함한다.
특정 구현예에서, 결합 도메인은 세포 마커 Her2에 결합한다. 특정 구현예에서, HER2에 결합하는 결합 도메인은 트라스투주맙(허셉틴(Herceptin))으로부터 유래된다. 특정 구현예에서, 결합 도메인은 서열번호: 12를 포함하는 CDRL1 서열), 서열번호: 124를 포함하는 CDRL2 서열, 및 서열번호: 125를 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열번호: 126을 포함하는 CDRH1 서열, 서열번호: 127을 포함하는 CDRH2 서열, 및 서열번호: 128을 포함하는 CDRH3을 포함하는 가변 중쇄를 포함한다.
특정 구현예에서, 결합 도메인은 세포 마커 PD-L1에 결합한다. 특정 구현예에서, PD-L1에 결합하는 결합 도메인은 펨브롤리주맙 또는 FAZ053(Novartis) 중 적어도 하나로부터 유래된다. 특정 구현예에서, 결합 도메인은 서열번호: 129를 포함하는 CDRL1 서열, 서열번호: 130을 포함하는 CDRL2 서열, 및 서열번호: 131을 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열번호: 132를 포함하는 CDRH1 서열, 서열번호: 133을 포함하는 CDRH2 서열, 및 서열번호: 134를 포함하는 CDRH3을 포함하는 가변 중쇄를 포함한다.
PD-L1에 대한 예시적인 결합 도메인은 아벨루맙 또는 아테졸리주맙을 포함하거나 또는 이로부터 유래될 수 있다. 특정 구현예에서, 아벨루맙의 가변 중쇄는 서열번호: 135를 포함한다. 특정 구현예에서, 아벨루맙의 가변 중쇄는 서열번호: 136을 포함한다.
특정 구현예에서, 아벨루맙의 CDR 영역은 서열번호: 137을 포함하는 CDRH1; 서열번호: 138을 포함하는 CDRH2; 서열번호: 139를 포함하는 CDRH3; 서열번호: 140을 포함하는 CDRL1; 서열번호: 141을 포함하는 CDRL2; 및 서열번호: 142를 포함하는 CDRL3을 포함한다. 특정 구현예에서, 아테졸리주맙의 가변 중쇄는 서열번호: 143을 포함한다. 특정 구현예에서, 아테졸리주맙의 가변 경쇄는 서열번호: 144를 포함한다.
특정 구현예에서, 아테졸리주맙의 CDR 영역은 서열번호: 145를 포함하는 CDRH; 서열번호: 146을 포함하는 CDRH2; 서열번호: 147을 포함하는 CDRH3; 서열번호: 148을 포함하는 CDRL1; 서열번호: 149를 포함하는 CDRL2; 및 서열번호: 150을 포함하는 CDRL3을 포함한다.
특정 구현예에서, 결합 도메인은 세포 마커 PSMA에 결합한다. 특정 구현예에서, 결합 도메인은 서열번호: 151을 포함하는 CDRL1 서열, 서열번호: 152를 포함하는 CDRL2 서열, 서열번호: 153을 포함하는 CDRL3 서열을 포함하는 가변 경쇄를 포함한다. 특정 구현예에서, 결합 도메인은 서열번호: 154를 포함하는 CDRH1 서열, 서열번호: 155를 포함하는 CDRH2 서열, 및 서열번호: 156을 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.
특정 구현예에서, 결합 도메인은 세포 마커 MUC16에 결합한다. 특정 구현예에서, 결합 도메인은 인간 또는 인간화이며 서열번호: 157을 포함하는 CDRL1 서열, GAS를 포함하는 CDRL2 서열, 서열번호: 158을 포함하는 CDRL3 서열을 포함하는 가변 경쇄를 포함한다. 특정 구현예에서, 결합 도메인은 인간 또는 인간화이며 서열번호: 159를 포함하는 CDRH1 서열, 서열번호: 160을 포함하는 CDRH2 서열, 및 서열번호: 161을 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.
특정 구현예에서, 결합 도메인은 세포 마커 FOLR에 결합한다. 특정 구현예에서, FOLR에 결합하는 결합 도메인은 팔레투주맙으로부터 유래된다. 특정 구현예에서, 결합 도메인은 서열번호: 162를 포함하는 CDRL1 서열, 서열번호: 163을 포함하는 CDRL2 서열, 및 서열번호: 164를 포함하는 CDRL3 서열을 포함하는 가변 경쇄, 및 서열번호: 165를 포함하는 CDRH1 서열, 서열번호: 166을 포함하는 CDRH2 서열, 및 서열번호: 167을 포함하는 CDRH3 서열을 포함하는 가변 중쇄를 포함한다.
메소텔린에 대한 예시적인 결합 도메인은 아마툭시맙을 포함하거나 또는 이로부터 유래될 수 있다. 특정 구현예에서, 아마툭시맙의 가변 중쇄는 서열번호: 168을 포함한다. 특정 구현예에서, 아마툭시맙의 가변 경쇄는 서열번호: 169를 포함한다.
특정 구현예에서, 아마툭시맙의 CDR 영역은 서열번호: 170을 포함하는 CDRH1 서열; 서열번호: 171을 포함하는 CDRH2 서열; 서열번호: 172를 포함하는 CDRH3 서열; 서열번호: 173을 포함하는 CDRL1 서열;(서열번호: 174를 포함하는 CDRL2 서열; 및 서열번호: 175를 포함하는 CDRL3 서열을 포함한다.
특정 구현예에서, 결합 도메인은 Vα/β 및 Cα/β 쇄(예를 들어, Vα-Cα, Vβ-Cβ, Vα-Vβ)를 포함하거나 또는 관심 세포 마커에 특이적인 Vα-Cα, Vβ-Cβ, Vα-Vβ 쌍(예를 들어, 펩티드-MHC 복합체)을 포함하는 sc T 세포 수용체(scTCR)이다.
특정 구현예에서, 결합 도메인은 알려지거나 또는 식별된 TCR Vα, Vβ, Cα, 또는 Cβ의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 또는 100% 동일한 서열을 포함하며, 여기서 각 CDR은 표적화된 세포 마커에 특이적으로 결합하는 TCR 또는 이의 단편 또는 유도체로부터 0 개의 변화 또는 최대 1, 2, 또는 3 개의 변화를 포함한다.
특정 구현예에서, 결합 도메인은 알려지거나 또는 식별된 TCR(예를 들어, 고-친화도 TCR)의 Vα, Vβ, Cα, 및/또는 Cβ로부터 유래되거나 또는 이에 기반한 Vα, Vβ, Cα, 및/또는 Cβ 영역을 포함하고 알려지거나 또는 식별된 TCR의 Vα, Vβ, Cα, 및/또는 Cβ와 비교할 때, 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 개)의 삽입, 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 개)의 결실, 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 개)의 아미노산 치환(예를 들어, 보존적 아미노산 치환 또는 비-보존적 아미노산 치환), 또는 상기 언급된 변화의 조합을 포함한다. 삽입, 결실 또는 치환은 Vα, Vβ, Cα, 및/또는 Cβ 영역의 아미노- 또는 카르복시-말단 또는 양쪽 단부를 포함하여 이러한 영역의 어디든 있을 수 있으며, 단, 각 CDR은 0 개의 변화 또는 최대 1, 2, 또는 3 개의 변화를 포함하고 변형된 Vα, Vβ, Cα, 또는 Cβ 영역을 함유하는 표적 결합 도메인이 제공되면 여전히 야생형과 유사한 친화도 및 작용으로 표적에 특이적으로 결합할 수 있다.
특정 구현예에서, 결합 도메인은 경쇄 가변 영역(VL) 또는 중쇄 가변 영역(VH), 또는 둘 다의 아미노산 서열과 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 적어도 99.5%, 또는 100% 동일한 서열이거나 또는 이를 포함하며, 여기서 각 CDR은 관심 세포 마커에 특이적으로 결합하는 단클론 항체 또는 이의 단편 또는 유도체로부터 0 개의 변화 또는 최대 1, 2, 또는 3 개의 변화를 포함한다.
특정 구현예에서, 본 개시내용의 결합 도메인에서 VL 영역은 알려진 단클론 항체의 VL로부터 유래되거나 또는 이를 기반으로 하고 알려진 단클론 항체의 VL과 비교할 때, 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 개)의 삽입, 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 개)의 결실, 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 개)의 아미노산 치환(예를 들어, 보존적 아미노산 치환), 또는 상기-언급된 변화의 조합을 함유한다. 삽입, 결실 또는 치환은 VL 영역의 아미노- 또는 카르복시-말단 또는 둘 다의 단부를 포함하여 이 영역의 어디든 있을 수 있으며, 단, 각 CDR은 0 개의 변화 또는 최대 1, 2, 또는 3 개의 변화를 포함하고 변형된 VL 영역을 함유하는 결합 도메인이 제공되면 여전히 야생형 결합 도메인과 유사한 친화도로 표적에 특이적으로 결합할 수 있다.
특정 구현예에서, 본 개시내용의 결합 도메인 VH 영역은 알려진 단클론 항체의 VH로부터 유래되거나 또는 이를 기반으로 할 수 있고 알려진 단클론 항체의 VH와 비교할 때, 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 개)의 삽입, 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 개)의 결실, 하나 이상(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10 개)의 아미노산 치환(예를 들어, 보존적 아미노산 치환 또는 비-보존적 아미노산 치환), 또는 상기-언급된 변화의 조합을 함유할 수 있다. 삽입, 결실 또는 치환은 VH 영역의 아미노- 또는 카르복시-말단 또는 둘 다의 단부를 포함하여 이 영역의 어디든 있을 수 있으며, 단, 각 CDR은 0 개의 변화 또는 최대 1, 2, 또는 3 개의 변화를 포함하고 변형된 VH 영역을 함유하는 결합 도메인이 제공되면 여전히 야생형 결합 도메인과 유사한 친화도로 표적에 특이적으로 결합할 수 있다.
주어진 CDR 또는 FR의 정확한 아미노산 서열 경계는 Kabat 등 (1991) "Sequences of Proteins of Immunological Interest," 5th Ed. Public Health Service, National Institutes of Health, Bethesda, Md.(Kabat 넘버링 체계); Al-Lazikani 등, J Mol Biol 273: 927-948, 1997(Chothia 넘버링 체계); Maccallum 등, J Mol Biol 262: 732-745, 1996(Contact 넘버링 체계); Martin 등, Proc. Natl. Acad. Sci., 86: 9268-9272, 1989(AbM 넘버링 체계); Lefranc 등, Dev Comp Immunol 27(1): 55-77, 2003(IMGT 넘버링 체계); 및 Honegger and Pluckthun, J Mol Biol 309(3): 657-670, 2001("Aho" 넘버링 체계)에 의해 기재된 것들을 포함하여 다수의 잘 알려진 체계 중 임의의 것을 사용하여 용이하게 결정될 수 있다. 주어진 CDR 또는 FR의 경계는 식별을 위해 사용되는 체계에 따라 달라질 수 있다. 예를 들어, Kabat 체계는 구조적 정렬에 기반한 반면, Chothia 체계는 구조적 정보에 기반한다. Kabat 및 Chothia 체계 둘 다에 대한 넘버링은 가장 통상적인 항체 영역 서열 길이를 기반으로 하며, 삽입은 삽입 문자, 예를 들어, "30a"로 수용되고 결실은 일부 항체에서 보인다. 두 체계는 상이한 위치에서 특정 삽입 및 결실("indel")을 배치하여, 차등 넘버링을 초래한다. Contact 체계는 복잡한 결정 구조의 분석을 기반으로 하고 Chothia 넘버링 체계에 대한 많은 측면에서 유사하다. 특정 구현예에서, 본원에 개시된 항체 CDR 서열은 Kabat 넘버링에 따른다.
전립선암과 연관된 특정 세포 마커는 PSMA, WT1, 전립선 줄기 세포 항원(PSCA), 및 SV40 T를 포함한다. 유방암과 연관된 특정 세포 마커는 HER2 및 ERBB2를 포함한다. 난소암과 연관된 특정 세포 마커는 L1-CAM, MUC16의 세포외 도메인(MUC-CD), 폴레이트 결합 단백질(폴레이트 수용체), Lewis Y, 메소텔린, 및 WT-1을 포함한다. 췌장암과 연관된 특정 세포 마커는 메소텔린, CEA 및 CD24를 포함한다. 다발성 골수종과 연관된 특정 세포 마커는 BCMA, GPRC5D, CD38, 및 CS-1을 포함한다. 백혈병 및/또는 림프종과 연관된 특정 마커는 CLL-1, CD123, CD33, 및 PD-L1을 포함한다.
또한 예를 들면 감염원 항원에 대한 결합에 의해 감염성 질환 제제에 특이적인 결합 도메인이 고려된다. 이들은 예를 들면 바이러스-감염된 세포에 의해 발현되는 바이러스 항원 또는 다른 바이러스 마커를 포함한다. 예시적인 바이러스는 아데노바이러스, 아레나바이러스, 부냐바이러스, 코로나바이러스, 플라비바이러스, 한타바이러스, 헤파드나바이러스, 헤르페스바이러스, 파필로마바이러스, 파라믹소바이러스, 파보바이러스, 피코르나바이러스, 폭스바이러스, 오르토믹소바이러스, 레트로바이러스, 레오바이러스, 랍도바이러스, 로타바이러스, 스폰지형 바이러스 또는 토가바이러스를 포함한다. 추가적인 구현예에서, 바이러스 항원 마커는 CMV, 감기 바이러스, 엡스타인-바(Epstein-Barr), 독감 바이러스, A형, B형, 및 C형 간염 바이러스, 단순 포진, HIV, 인플루엔자, 일본 뇌염, 홍역, 소아마비, 광견병, 호흡기 세포융합체, 풍진, 천연두, 수두 대상포진 또는 웨스트 나일(West Nile) 바이러스에 의해 발현되는 펩티드를 포함한다.
추가의 특정 예로서, 사이토메갈로바이러스 항원은 외피 당단백질 B 및 CMV pp65를 포함하고; 엡스타인-바 항원은 EBV EBNAI, EBV P18, 및 EBV P23을 포함하고; 간염 항원은 HBV의 S, M, 및 L 단백질, HBV의 프리-S 항원, HBCAG DELTA, HBV HBE, C형 간염 바이러스 RNA, HCV NS3 및 HCV NS4를 포함하고; 단순 포진 바이러스 항원은 급초기 단백질 및 당단백질 D를 포함하고; HIV 항원은 gag, pol, 및 env 유전자의 유전자 산물 예컨대 HIV gp32, HIV gp41, HIV gp120, HIV gp160, HIV P17/24, HIV P24, HIV P55 GAG, HIV P66 POL, HIV TAT, HIV GP36, Nef 단백질 및 역전사효소를 포함하고; 인플루엔자 항원은 헤마글루티닌 및 뉴라미니다제를 포함하고; 일본 뇌염 바이러스 항원은 단백질 E, M-E, M-E-NS1, NS1, NS1-NS2A 및 80% E를 포함하고; 홍역 항원은 홍역 바이러스 융합 단백질을 포함하고; 광견병 항원은 광견병 당단백질 및 광견병 핵단백질을 포함하고; 호흡기 세포융합 바이러스 항원은 RSV 융합 단백질 및 M2 단백질을 포함하고; 로타바이러스 항원은 VP7sc를 포함하고; 풍진 항원은 단백질 E1 및 E2를 포함하고; 수두 대상포진 바이러스 항원은 gpI 및 gpII를 포함한다.
추가적인 특정 예시적인 바이러스 항원 서열은 다음을 포함한다: Nef(66-97)(서열번호: 176), Nef(116-145)(서열번호: 177), Gag p17(17-35)(서열번호: 178), Gag p17-p24(253-284)(서열번호: 179), 및 Pol 325-355(RT 158-188)(서열번호: 180). 바이러스 항원의 추가적인 예에 대하여 Fundamental Virology, Second Edition, eds. Fields, B. N. and Knipe, D. M. (Raven Press, New York, 1991) 참조.
암 세포와 같은 원치않은 세포 유형을 표적화하고 사멸하기 위해 면역계의 T 세포를 유전적으로 조작하는 데 상당한 진전이 이루어졌다. 많은 이들 T 세포는 키메라 항원 수용체(CAR) 작제물을 발현하도록 유전적으로 조작되었다. CAR은 암 세포를 인식하고 사멸시키기 위해 T 세포를 유전적으로 변형시키는 여러 별개의 하위구성요소를 포함하는 단백질이다. 하위구성요소는 적어도 세포외 구성요소 및 세포내 구성요소를 포함한다.
세포외 구성요소는 원치않은 세포의 표면 상에 우선적으로 존재하는 마커에 특이적으로 결합하는 결합 도메인을 포함한다. 결합 도메인이 이러한 마커에 결합할 때, 세포내 구성요소는 결합된 암 세포를 파괴하도록 T 세포를 지시한다. 결합 도메인은 전형적으로 단클론 항체(mAb)로부터 유래된 단일-쇄 가변 단편(scFv)이지만, 이는 항체-유사 항원 결합 부위를 포함하는 다른 형식을 기반으로 할 수 있다.
세포내 구성요소는 효과기 도메인의 포함을 기반으로 활성화 신호를 제공한다. 1세대 CAR은 CD3ζ의 세포질 영역을 효과기 도메인으로 활용하였다. 2세대 CAR은 분화 클러스터 28(CD28) 또는 4-1BB(CD137)와 조합하여 CD3ζ을 활용한 반면, 3세대 CAR은 세포내 효과기 도메인 내에서 CD28 및 401BB와 조합하여 CD3ζ를 활용하였다.
CAR은 일반적으로 또한 분자 내에서 다양한 목적을 위해 사용되는 하나 이상의 링커 서열을 포함한다. 예를 들어, 막관통 도메인은 CAR의 세포외 구성요소를 세포내 구성요소에 연결하기 위해 사용될 수 있다. 결합 도메인에 막-근위에 있는 스페이서 영역으로 종종 지칭되는 유연한 링커 서열은 결합 도메인 및 세포 막 사이의 추가적인 거리를 생성하기 위해 사용될 수 있다. 이는 막에 대한 근접성을 기반으로 결합에 대한 입체 장애를 감소시키는 데 유익할 수 있다. 이 목적을 위해 사용되는 통상적인 스페이서 영역은 IgG4 링커이다. 표적화된 세포 마커에 따라, 더 조밀한 스페이서 또는 더 긴 스페이서가 사용될 수 있다. 다른 잠재적인 CAR 하위구성요소는 본원의 다른 곳에 보다 상세하게 기재된다. CAR의 구성요소는 이제 다음과 같이 추가로 상세하게 기재된다: (a) 결합 도메인; (b) 세포내 신호전달 구성요소; (c) 링커; (d) 막관통 도메인; (e) 접합부 아미노산; 및 (f) 태그 카세트를 포함하는 제어 특징.
(a) 결합 도메인. 결합 도메인은 세포 마커에 결합하여 복합체를 형성하는 물질을 포함하며, 본원에 개시된 모든 결합 도메인 및 항체를 포함하나 이에 제한되지 않는다. 결합 도메인의 선택은 표적 세포의 표면을 정의하는 세포 마커의 유형 및 수에 따라 달라질 수 있다. 결합 도메인의 예는 세포 마커 리간드, 수용체 리간드, 항체, 펩티드, 펩티드 압타머, 수용체(예를 들어, T 세포 수용체), 또는 이의 조합 및 조작된 단편 또는 형식을 포함한다.
(b) 세포내 신호전달 구성요소. CAR의 세포내 또는 달리 세포질 신호전달 구성요소는 CAR이 발현되는 세포의 활성화를 담당한다. 따라서 용어 "세포내 신호전달 구성요소" 또는 "세포내 구성요소"는 활성화 신호를 형질도입하기에 충분한 세포내 도메인의 임의의 부분을 포함하는 것을 의미한다. 발현된 CAR의 세포내 구성요소는 효과기 도메인을 포함한다. 효과기 도메인은 적절한 신호를 수신할 때 세포에서 생물학적 또는 생리학적 반응을 직접적으로 또는 간접적으로 촉진할 수 있는 융합 단백질 또는 수용체의 세포내 부분이다. 특정 구현예에서, 효과기 도메인은 결합될 때 신호를 수신하는 단백질 또는 단백질 복합체의 일부이거나, 또는 효과기 도메인로부터 신호를 촉발하는 표적 분자에 직접적으로 결합된다. 효과기 도메인은 면역수용체 티로신-기반 활성화 모티프(ITAM)와 같은 하나 이상의 신호전달 도메인 또는 모티프를 함유할 때 세포 반응을 직접적으로 촉진할 수 있다. 다른 구현예에서, 효과기 도메인은 공동-자극 도메인과 같이, 세포 반응을 직접적으로 촉진하는 하나 이상의 다른 단백질과 회합함으로써 세포 반응을 간접적으로 촉진할 것이다.
효과기 도메인은 암 세포에 의해 발현되는 세포 마커에 결합 시 변형된 세포의 적어도 하나의 기능의 활성화를 제공할 수 있다. 변형된 세포의 활성화는 분화, 증식 및/또는 활성화 또는 다른 효과기 기능 중 하나 이상을 포함할 수 있다. 특정 구현예에서, 효과기 도메인은 T 세포 수용체 및 공동-수용체 또는 공동-자극 분자로부터의 세포질 서열을 포함할 수 있는 공동-자극 도메인을 포함하는 세포내 신호전달 구성요소를 포함할 수 있다.
효과기 도메인은 1, 2, 3 개 또는 그 이상의 수용체 신호전달 도메인, 세포내 신호전달 구성요소(예를 들어, 세포질 신호전달 서열), 공동-자극 도메인, 또는 이의 조합을 포함할 수 있다. 예시적인 효과기 도메인은 4-1BB(CD137), CARD11, CD3γ, CD3δ, CD3ε, CD3ζ, CD27, CD28, CD79A, CD79B, DAP10, FcRα, FcRβ(FcεR1b), FcRγ, Fyn, HVEM(LIGHTR), ICOS, LAG3, LAT, Lck, LRP, NKG2D, NOTCH1, pTα, PTCH2, OX40, ROR2, Ryk, SLAMF1, Slp76, TCRα, TCRβ, TRIM, Wnt, Zap70, 또는 이의 임의의 조합으로부터 선택된 신호전달 및 자극 도메인을 포함한다. 특정 구현예에서, 예시적인 효과기 도메인은 CD86, FcγRIIa, DAP12, CD30, CD40, PD-1, 림프구 기능-연관 항원-1(LFA-1), CD2, CD7, LIGHT, NKG2C, B7-H3, CD83에 특이적으로 결합하는 리간드, CDS, ICAM-1, GITR, BAFFR, SLAMF7, NKp80(KLRF1), CD127, CD160, CD19, CD4, CD8α, CD8β, IL2Rβ, IL2Rγ, IL7Rα, ITGA4, VLA1, CD49a, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CD11d, ITGAE, CD103, ITGAL, CD11a, ITGAM, CD11b, ITGAX, CD11c, ITGB1, CD29, ITGB2, CD18, ITGB7, TNFR2, TRANCE/RANKL, DNAM1(CD226), SLAMF4(CD244, 2B4), CD84, CD96(Tactile), CEACAM1, CRTAM, Ly9(CD229), PSGL1, CD100(SEMA4D), CD69, SLAMF6(NTB-A, Ly108), SLAM(CD150, IPO-3), BLAME(SLAMF8), SELPLG(CD162), LTBR, GADS, PAG/Cbp, NKp44, NKp30, 또는 NKp46으로부터 선택된 신호전달 및 공동-자극 도메인을 포함한다.
자극 방식으로 작용하는 세포내 신호전달 구성요소 서열은 iTAM을 포함할 수 있다. 1차 세포질 신호전달 서열을 포함하는 iTAM의 예는 CD3γ, CD3δ, CD3ε, CD3ζ, CD5, CD22, CD66d, CD79a, CD79b, 및 공통 FcRγ(FCER1G), FcγRlla, FcRβ(Fcε Rib), DAP10, 및 DAP12로부터 유래된 것들을 포함한다. 특정 구현예에서,CD3ζ의 변이체는 적어도 하나, 2, 3 개, 또는 모든 ITAM 영역을 보유한다.
특정 구현예에서, 효과기 도메인은 세포질 신호전달 단백질과 회합하는 세포질 부분을 포함하며, 여기서 세포질 신호전달 단백질은 림프구 수용체 또는 이의 신호전달 도메인, 복수의 ITAM을 포함하는 단백질, 공동-자극 도메인, 또는 이의 임의의 조합이다.
세포내 신호전달 구성요소의 추가적인 예는 CD3ζ 쇄의 세포질 서열, 및/또는 결합 도메인 관여 후 신호 형질도입을 개시하기 위해 협력하여 작용하는 공동-수용체를 포함한다.
공동-자극 도메인은 세포 마커 결합에 대한 효율적인 림프구 반응에 필요할 수 있는 활성화가 있는 도메인이다. 일부 분자는 세포내 신호전달 구성요소 또는 공동-자극 도메인으로 상호교환가능하다. 공동 자극 도메인의 예는 CD27, CD28, 4-1BB(CD 137), OX40, CD30, CD40, PD-1, ICOS, 림프구 기능-연관 항원-1(LFA-1), CD2, CD7, LIGHT, NKG2C, B7-H3, 및 CD83과 특이적으로 결합하는 리간드를 포함한다. 예를 들어, CD27 공동-자극은 시험관내에서 인간 CART 세포의 확장, 효과기 기능, 및 생존을 향상시키고 생체내에서 인간 T 세포 지속 및 항암 활성을 증가시키는 것으로 입증되었다(Song 등 Blood. 2012; 119(3):696-706). 이러한 공동-자극 도메인 분자의 추가의 예는 CDS, ICAM-1, GITR, BAFFR, HVEM(LIGHTR), SLAMF7, NKp80(KLRF1), NKp44, NKp30, NKp46, CD160, CD19, CD4, CD8α, CD8β, IL2Rβ, IL2Rγ, IL7Rα, ITGA4, VLA1, CD49a, ITGA4, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CDlld, ITGAE, CD103, ITGAL, CDlla, ITGAM, CDl lb, ITGAX, CDllc, ITGBl, CD29, ITGB2, CD18, ITGB7, TNFR2, TRANCE/RANKL, DNAM1(CD226), SLAMF4 (CD244, 2B4), CD84, CD96(Tactile), NKG2D, CEACAM1, CRTAM, Ly9(CD229), PSGL1, CD100(SEMA4D), CD69, SLAMF6(NTB-A, Lyl08), SLAM(SLAMF1, CD150, IPO-3), BLAME(SLAMF8), SELPLG(CD162), LTBR, LAT, GADS, SLP-76, PAG/Cbp, 및 CD19a를 포함한다.
특정 구현예에서, 세포내 신호전달 구성요소의 아미노산 서열은 CD3ζ의 변이체 및 4-1BB 세포내 신호전달 구성요소의 일부를 포함한다.
특정 구현예에서, 세포내 신호전달 구성요소는 (i) CD3ζ의 신호전달 도메인의 전부 또는 일부, (ii) 4-1BB의 신호전달 도메인의 전부 또는 일부, 또는 (iii) CD3ζ 및 4-1BB의 신호전달 도메인의 전부 또는 일부를 포함한다.
세포내 구성요소는 또한 Wnt 신호전달 경로(예를 들어, LRP, Ryk, 또는 ROR2), NOTCH 신호전달 경로(예를 들어, NOTCH1, NOTCH2, NOTCH3, 또는 NOTCH4), Hedgehog 신호전달 경로(예를 들어, PTCH 또는 SMO), 수용체 티로신 키나제(RTK)(예를 들어, 표피 성장 인자(EGF) 수용체 패밀리, 섬유모세포 성장 인자(FGF) 수용체 패밀리, 간세포 성장 인자(HGF) 수용체 패밀리, 인슐린 수용체(IR) 패밀리, 혈소판-유래 성장 인자(PDGF) 수용체 패밀리, 혈관 내피 성장 인자(VEGF) 수용체 패밀리, 트로포마이신 수용체 키나제(Trk) 수용체 패밀리, 에프린(Eph) 수용체 패밀리, AXL 수용체 패밀리, 백혈구 티로신 키나제(LTK) 수용체 패밀리, 면역글로불린-유사 및 EGF-유사 도메인 1을 함유하는 티로신 키나제(TIE) 수용체 패밀리, 수용체 티로신 키나제-유사 고아(ROR) 수용체 패밀리, 디스코이딘 도메인(DDR) 수용체 패밀리, 형질감염 동안 재배열된(RET) 수용체 패밀리, 티로신-단백질 키나제-유사(PTK7) 수용체 패밀리, 수용체 관련된 티로신 키나제(RYK) 수용체 패밀리, 또는 근육 특이적 키나제(MuSK) 수용체 패밀리); G-단백질-커플링된 수용체, GPCR(Frizzled 또는 Smoothened); 세린/트레오닌 키나제 수용체(BMPR 또는 TGFR); 또는 사이토카인 수용체(IL1R, IL2R, IL7R, 또는 IL15R)의 단백질 중 하나 이상을 포함할 수 있다.
(c) 링커. 본원에 사용된 바와 같이, 링커는 분자의 2 개의 다른 하위 구성요소를 연결하는 역할을 하는 CAR 분자의 임의의 부분일 수 있다. 일부 링커는 다른 구성요소를 연결하는 것 이외의 목적을 제공하지 않는 반면 많은 링커는 추가적인 목적을 제공한다. scFv의 항체 유래된 결합 도메인의 VL 및 VH를 연결하는 맥락에서 링커는 상기 기재되어 있다. 링커는 또한 스페이서 영역, 및 접합부 아미노산을 포함할 수 있다.
스페이서 영역은 다른 연결된 구성요소로부터 적절한 거리 및/또는 유연성을 생성하는 데 사용되는 링커 영역의 한 유형이다. 특정 구현예에서, 스페이서 영역의 길이는 원치않은 세포 인식 및 파괴를 최적화하기 위해 원치않은 세포에 대한 개별 세포 마커를 맞춤화할 수 있다. 스페이서는 스페이서의 부재와 비교하여, 항원 결합 후 세포의 증가된 반응성을 제공하는 길이일 수 있다. 특정 구현예에서, 스페이서 영역 길이는 세포 마커 에피토프의 위치, 에피토프에 대한 결합 도메인의 친화도, 및/또는 세포 마커 인식에 반응하여 시험관내 및/또는 생체내에서 증식하는 분자를 발현하는 변형된 세포의 능력을 기반으로 선택될 수 있다. 스페이서 영역은 또한 변형된 세포에서 높은 발현 수준을 허용할 수 있다.
예시적인 스페이서는 10 내지 250 개의 아미노산, 10 내지 200 개의 아미노산, 10 내지 150 개의 아미노산, 10 내지 100 개의 아미노산, 10 내지 50 개의 아미노산, 또는 10 내지 25 개의 아미노산을 갖는 것을 포함한다. 특정 구현예에서, 스페이서 영역은 12 개의 아미노산, 20 개의 아미노산, 21 개의 아미노산, 26 개의 아미노산, 27 개의 아미노산, 45 개의 아미노산, 또는 50 개의 아미노산이다.
특정 구현예에서, 스페이서 영역은 IgG1, IgG2, lgG3, lgG4 또는 IgD 단독으로부터 힌지 영역 서열의 전부 또는 일부 또는 CH2 영역의 전부 또는 일부; CH3 영역의 전부 또는 일부; 또는 CH2 영역의 전부 또는 일부 및 CH3 영역의 전부 또는 일부와 조합하여 포함하는 군으로부터 선택된다.
예시적인 스페이서는 IgG4 힌지 단독, CH2 및 CH3 도메인에 연결된 IgG4 힌지, 또는 CH3 도메인에 연결된 IgG4 힌지를 포함한다. 특정 구현예에서, 스페이서는 아미노산 서열 서열번호: 181의 IgG4 링커를 포함한다. 힌지 영역은 의도되지 않은 파트너와의 이량체화와 같은 바람직하지 않은 구조적 상호작용을 피하기 위해 변형될 수 있다.
특정 구현예에서, 스페이서 영역은 II형 C-렉틴 도메인간(줄기) 영역 또는 분화 클러스터(CD) 분자 줄기 영역인 힌지 영역을 포함한다. 본원에 사용된 바와 같이, "야생형 면역글로불린 힌지 영역"은 CH1 및 CH2 도메인 사이에 개재되어 연결하거나(IgG, IgA, 및 IgD의 경우) 또는 항체의 중쇄에서 발견되는 CH1 및 CH3 도메인 사이에 개재되어 연결하는(IgE 및 IgM의 경우) 자연 발생 상부 및 중간 힌지 아미노산을 지칭한다.
II형 C-렉틴 또는 CD 분자의 "줄기 영역"은 C-형 렉틴-유사 도메인(CTLD; 예를 들어, 자연 살해자 세포 수용체의 CTLD와 유사) 및 소수성 부분(막관통 도메인) 사이에 위치한 II형 C-렉틴 또는 CD 분자의 세포외 도메인 부분을 지칭한다. 예를 들어, 인간 CD94의 세포외 도메인(GenBank 수탁 번호 AAC50291.1)은 아미노산 잔기 34-179에 상응하지만, CTLD는 아미노산 잔기 61-176에 상응하여, 인간 CD94 분자의 줄기 영역은 소수성 부분(막관통 도메인) 및 CTLD 사이에 위치한 아미노산 잔기 34-60을 포함한다(Boyington 등, Immunity 10:15, 1999 참조; 다른 줄기 영역의 설명을 위해, 또한 Beavil 등, Proc. Nat'l. Acad. Sci. USA 89:153, 1992; 및 Figdor 등, Nat. Rev. Immunol. 2:11, 2002 참조). 이러한 II형 C-렉틴 또는 CD 분자는 또한 줄기 영역 및 막관통 영역 또는 CTLD 사이에 접합부 아미노산(하기 기재됨)을 가질 수 있다. 또 다른 예에서, 233 개의 아미노산 인간 NKG2A 단백질(GenBank 수탁 번호 P26715.1)은 아미노산 71-93 범위의 소수성 부분(막관통 도메인) 및 아미노산 94-233 범위의 세포외 도메인을 갖는다. CTLD는 아미노산 119-231을 포함하고 줄기 영역은 아미노산 99-116을 포함하며, 이는 추가적인 접합부 아미노산에 의해 플랭킹될 수 있다. 다른 II형 C-렉틴 또는 CD 분자, 뿐만 아니라 이의 세포외 리간드-결합 도메인, 줄기 영역, 및 CTLD는 당업계에 알려져 있다(예를 들어, GenBank 수탁 번호 NP 001993.2; AAH07037.1; NP 001773.1; AAL65234.1; CAA04925.1 참조; 각각 인간 CD23, CD69, CD72, NKG2A, 및 NKG2D의 서열 및 이의 설명에 대한 것).
예시적인 스페이서는 또한 Hudecek 등 (Clin. Cancer Res., 19:3153, 2013) 또는 WO2014/031687에 기재된 것들을 포함한다. 특정 구현예에서, 스페이서 영역은 아미노산 서열 서열번호: 182의 CD28 링커일 수 있다. 특정 구현예에서, 스페이서 영역은 서열번호: 183이다. 특정 구현예에서, 스페이서 영역은 서열번호: 184이다.
특정 구현예에서, 긴 스페이서는 119 개 초과의 아미노산(예를 들어, 229 개의 아미노산)이고, 중간 스페이서는 13-119 개의 아미노산이고, 짧은 스페이서는 12 개 이하의 아미노산이다. 중간 스페이서 영역의 예는 IgG4 힌지 영역 서열 및 CH3 영역의 전부 또는 일부를 포함한다. 긴 스페이서의 예는 IgG4 힌지 영역 서열, CH2 영역, 및 CH3 영역의 전부 또는 일부를 포함한다. 본 개시내용의 특정 구현예에서, 짧은 스페이서 서열이 바람직하다.
스페이서 영역에 관한 추가의 설명으로서, 융합 단백질의 세포외 구성요소는 임의적으로 예를 들어, 적절한 세포/세포 접촉, 항원 결합 및 활성화를 가능하게 하기 위해 결합 도메인이 숙주 세포(예를 들어, T 세포) 표면으로부터 멀리 떨어져 위치할 수 있는 세포외, 비-신호전달 스페이서 또는 링커 영역을 포함한다(Patel 등, Gene Therapy 6: 412-419 (1999)). 나타낸 바와 같이, 융합 결합 단백질의 세포외 스페이서 영역은 일반적으로 소수성 부분 또는 막관통 도메인 및 세포외 결합 도메인 사이에 위치하고, 스페이서 영역 길이는 선택된 표적 분자, 선택된 결합 에피토프, 또는 항원-결합 도메인 크기 및 친화도를 기반으로 항원 인식(예를 들어, 종양 인식)을 최대화하도록 달라질 수 있다(예를 들어, Guest 등, J. Immunother. 28:203-11, 2005; WO 2014/031687 참조). 특정 구현예에서, 스페이서 영역은 면역글로불린 힌지 영역을 포함한다. 면역글로불린 힌지 영역은 야생형 면역글로불린 힌지 영역 또는 변경된 야생형 면역글로불린 힌지 영역일 수 있다. 특정 구현예에서, 면역글로불린 힌지 영역은 인간 면역글로불린 힌지 영역이다. 면역글로불린 힌지 영역은 IgG, IgA, IgD, IgE, 또는 IgM 힌지 영역일 수 있다. IgG 힌지 영역은 IgG1, IgG2, IgG3, 또는 IgG4 힌지 영역일 수 있다. 예시적인 변경된 IgG4 힌지 영역은 PCT 공개 번호 WO 2014/031687에 기재되어 있다. 본원에 기재된 융합 결합 단백질에 사용되는 힌지 영역의 다른 예는 야생형 또는 이의 변이체일 수 있는 CD8α, CD4, CD28 및 CD7과 같은 1형 막 단백질의 세포외 영역에 존재하는 힌지 영역을 포함한다.
특정 구현예에서, 세포외 스페이서 영역은 CH1 도메인, CH2 도메인, CH3 도메인, CH4 도메인, 또는 이의 임의의 조합으로부터 선택된 Fc 도메인의 전부 또는 일부를 포함한다(예를 들어, WO 2014/031687 참조). Fc 도메인 또는 이의 부분은 (예를 들어, 항체 효과기 기능을 감소시키기 위해) 변경된 야생형일 수 있다. 특정 구현예에서, 세포외 구성요소는 결합 도메인 및 소수성 부분 사이에 배치된 면역글로불린 힌지 영역, CH2 도메인, CH3 도메인, 또는 이의 임의의 조합을 포함한다. 특정 구현예에서, 세포외 구성요소는 IgG1 힌지 영역, IgG1 CH2 도메인, 및 IgG1 CH3 도메인을 포함한다. 추가의 구현예에서, IgG1 CH2 도메인은 (i) N297Q 돌연변이, (ii) 첫번째 6 개 아미노산(APEFLG)의 APPVA로의 치환, 또는 (i) 및 (ii) 둘 다를 포함한다. 특정 구현예에서, 면역글로불린 힌지 영역, Fc 도메인 또는 이의 부분, 또는 둘 다는 인간이다.
(d) 막관통 도메인. 나타낸 바와 같이, CAR 분자 내의 막관통 도메인은 종종 세포 막을 통해 세포외 구성요소 및 세포내 구성요소를 연결하는 역할을 한다. 막관통 도메인은 변형된 세포의 막에서 발현된 분자를 고정시킬 수 있다.
막관통 도메인은 천연 및/또는 합성 공급원으로부터 유래될 수 있다. 공급원이 천연일 때, 막관통 도메인은 임의의 막-결합 또는 막관통 단백질으로부터 유래될 수 있다. 막관통 도메인은 적어도 T-세포 수용체, CD28, CD27, CD3 엡실론, CD45, CD4, CD5, CD8, CD9, CD16, CD22; CD33, CD37, CD64, CD80, CD86, CD134, CD137 및 CD154의 α, β 또는 ζ 쇄의 막관통 영역(들)을 포함할 수 있다. 특정 구현예에서, 막관통 도메인은 적어도 예를 들어, KIRDS2, OX40, CD2, CD27, LFA-1(CD 11a, CD18), ICOS(CD278), 4-1BB(CD137), GITR, CD40, BAFFR, HVEM(LIGHTR), SLAMF7, NKp80(KLRF1), NKp44, NKp30, NKp46, CD160, CD19, IL2Rβ, IL2Rγ, IL7R a, ITGA1, VLA1, CD49a, ITGA4, IA4, CD49D, ITGA6, VLA-6, CD49f, ITGAD, CDl ld, ITGAE, CD103, ITGAL, CDl la, ITGAM, CDl lb, ITGAX, CDl lc, ITGB1, CD29, ITGB2, CD18, ITGB7, TNFR2, DNAM1(CD226), SLAMF4 (CD244, 2B4), CD84, CD96(Tactile), CEACAM1, CRT AM, Ly9(CD229), PSGL1, CD100(SEMA4D), SLAMF6(NTB-A, Lyl08), SLAM(SLAMF1, CD150, IPO-3), BLAME(SLAMF8), SELPLG(CD162), LTBR, PAG/Cbp, NKG2D, 또는 NKG2C의 막관통 영역(들)을 포함할 수 있다. 특정 구현예에서, 인간 Ig(면역글로불린) 힌지(예를 들어, IgG4 힌지, IgD 힌지), GS 링커(예를 들어, 본원에 기재된 GS 링커), KIR2DS2 힌지 또는 CD8a 힌지를 포함하는 다양한 인간 힌지가 또한 이용될 수 있다.
특정 구현예에서, 막관통 도메인은 세포 막에서 열역학적으로 안정되고, 일반적으로 15 내지 30 개의 아미노산 길이 범위인 3차원 구조를 갖는다. 막관통 도메인의 구조는 α 나선, β 베럴, β 시트, β 나선, 또는 이의 임의의 조합을 포함할 수 있다.
막관통 도메인은 막관통 영역에 인접한 하나 이상의 추가적인 아미노산, 예를 들어, CAR의 세포외 영역 내에서 하나 이상의 아미노산(예를 들어, 세포외 영역의 최대 15 개 아미노산) 및/또는 CAR의 세포내 영역 내에서 하나 이상의 추가적인 야미노산(예를 들어, 세포내 구성요소의 최대 15 개 아미노산)을 포함할 수 있다. 일 측면에서, 막관통 도메인은 신호전달 도메인, 공동-자극 도메인 또는 힌지 도메인이 유래된 것과 동일한 단백질로부터 유래된다. 또 다른 측면에서, 막관통 도메인은 CAR의 임의의 다른 도메인이 유래된 것과 동일한 단백질로부터 유래되지 않는다. 일부 경우에, 막관통 도메인은 수용체 복합체의 다른 의도되지 않은 구성원과의 상호작용을 최소화하기 위해 동일하거나 또는 상이한 표면 막 단백질의 막관통 도메인에 이러한 도메인의 결합을 피하기 위해 아미노산 치환에 의해 선택되거나 또는 변형될 수 있다. 일 측면에서, 막관통 도메인은 CAR-발현 세포의 세포 표면 상에서 또 다른 CAR과 동종이량체화할 수 있다. 상이한 측면에서, 막관통 도메인의 아미노산 서열은 동일한 CAR-발현 세포에 존재하는 천연 결합 파트너의 결합 도메인과의 상호작용을 최소화하기 위해 변형되거나 또는 치환될 수 있다. 특정 구현예에서, 막관통 도메인은 CD28 막관통 도메인의 아미노산 서열을 포함한다.
(e) 접합부 아미노산. 접합부 아미노산은 스페이서에 의해 제공되는 거리가 필요하지 않고/하거나 원치 않을 때 CAR 도메인의 서열을 연결하는 데 사용될 수 있는 링커일 수 있다. 접합부 아미노산 공동-자극 세포내 신호전달 구성요소를 연결하는 데 사용될 수 있는 짧은 아미노산 서열이다. 특정 구현예에서, 접합부 아미노산은 9 개 이하의 아미노산이다.
접합부 아미노산은 링커를 형성하는 짧은 올리고- 또는 단백질 링커, 바람직하게는 2 내지 9 개의 아미노산(예를 들어, 2, 3, 4, 5, 6, 7, 8, 또는 9 개의 아미노산) 길이일 수 있다. 특정 구현예에서, 글리신-세린 이중항이 적합한 접합부 아미노산 링커로서 사용될 수 있다. 특정 구현예에서, 단일 아미노산, 예를 들어, 알라닌, 글리신이 적합한 접합부 아미노산으로 사용될 수 있다.
(f) 태그 카세트, 형질도입 마커, 및 자살 스위치를 포함하는 제어 특징. 특정 구현예에서, CAR 작제물은 하나 이상의 태그 카세트, 형질도입 마커, 및/또는 자살 스위치를 포함할 수 있다. 일부 구현예에서, 형질도입 마커 및/또는 자살 스위치는 동일한 작제물 내에 있지만 세포 표면 상에서 별개의 분자로 발현된다. 태그 카세트 및 형질도입 마커는 시험관내, 생체내 및/또는 생체외에서 유전적으로 변형된 세포를 활성화, 이의 증식 촉진, 검출, 이에 대한 강화, 단리, 추적, 고갈 및/또는 제거에 사용될 수 있다. "태그 카세트"는 결합 특성이 태그된 단백질 및/또는 태그된 단백질을 발현하는 세포를 활성화, 이의 증식 촉진, 검출, 이에 대한 강화, 단리, 추적, 고갈 및/또는 제거에 사용될 수 있는 경우 동족 결합 분자(예를 들어, 리간드, 항체, 또는 다른 결합 파트너)가 특이적으로 결합할 수 있는 CAR에 부착되거나, 융합되거나, 또는 이의 일부인 고유한 합성 펩티드 서열을 지칭한다. 형질도입 마커는 동일한 목적을 제공할 수 있지만 자연 발생 분자로부터 유래되고 종종 나머지 CAR 분자로부터 형질도입 마커를 분리하는 스킵 요소를 사용하여 발현된다.
동족 결합 분자에 결합하는 태그 카세트는 예를 들어, His 태그, Flag 태그, Xpress 태그, Avi 태그, 칼모듈린 태그, 폴리글루타메이트 태그, HA 태그, Myc 태그, Softag 1, Softag 3, 및 V5 태그를 포함한다. 특정 구현예에서, CAR은 Myc 태그를 포함한다.
본원에 개시된 태그 카세트 서열에 특이적으로 결합하는 접합체 결합 분자는 상업적으로 이용가능하다. 예를 들어, His 태그 항체는 Life Technologies, Pierce Antibodies, 및 GenScript를 포함하는 공급처로부터 상업적으로 이용가능하다. Flag 태그 항체는 Pierce Antibodies, GenScript, 및 Sigma-Aldrich를 포함하는 공급처로부터 상업적으로 이용가능하다. Xpress 태그 항체는 Pierce Antibodies, Life Technologies 및 GenScript를 포함하는 공급처로부터 상업적으로 이용가능하다. Avi 태그 항체는 Pierce Antibodies, IsBio, 및 Genecopoeia를 포함하는 공급처로부터 상업적으로 이용가능하다. 칼모듈린 태그 항체는 Santa Cruz Biotechnology, Abcam, 및 Pierce Antibodies를 포함하는 공급처로부터 상업적으로 이용가능하다. HA 태그 항체는 Pierce Antibodies, Cell Signal 및 Abcam을 포함하는 공급처로부터 상업적으로 이용가능하다. Myc 태그 항체는 Santa Cruz Biotechnology, Abcam, 및 Cell Signal을 포함하는 공급처로부터 상업적으로 이용가능하다.
형질도입 마커는 절두된 CD19(tCD19; Budde 등, Blood 122: 1660, 2013 참조); 절두된 인간 EGFR(tEGFR; Wang 등, Blood 118: 1255, 2011 참조); 인간 CD34의 세포외 도메인; 및/또는 CD34의 표적 에피토프와 조합하는 RQR8(Fehse 등, Mol. Therapy 1(5 Pt 1); 448-456, 2000 참조) 및 CD20 항원(Philip 등, Blood 124: 1277-1278, 2014 참조) 중 적어도 하나로부터 선택될 수 있다.
특정 구현예에서, iCaspase9 작제물(iCasp9)을 암호화하는 폴리뉴클레오티드는 자살 스위치로서 CAR 뉴클레오티드 작제물 내로 삽입될 수 있다.
제어 특징은 CAR의 다중 카피에 존재할 수 있거나 또는 스키핑 요소를 사용하여 별개의 분자로서 표현될 수 있다. 예를 들어, CAR은 1, 2, 3, 4 또는 5 개의 태그 카세트를 가질 수 있고/있거나 1, 2, 3, 4, 또는 5 개의 형질도입 마커가 또한 발현될 수 있다. 예를 들어, 구현예는 2 개의 Myc 태그 카세트, 또는 His 태그 및 HA 태그 카세트, 또는 HA 태그 및 Softag 1 태그 카세트, 또는 Myc 태그 및 SBP 태그 카세트가 있는 CAR 작제물을 포함할 수 있다. 특정 구현예에서, 발현 후 다량체화될 CAR은 상이한 태그 카세트를 포함한다. 특정 구현예에서, 형질도입 마커는 tEFGR을 포함한다. 예시적인 형질도입 마커 및 동족 쌍은 US 13/463,247에 기재되어 있다.
CAR에서 적어도 하나의 제어 특징을 포함하는 한 가지 이점은 대상체에게 투여된 CAR 발현 세포가 태그 카세트에 대한 동족 결합 분자를 사용하여 고갈될 수 있다는 점이다. 특정 구현예에서, 본 개시내용은 태그 카세트에 특이적인 항체를 사용하거나, 제어 특징에 특이적인 동족 결합 분자를 사용하거나, 또는 CAR을 발현하고 제어 특징에 대한 특이성을 갖는 제2 변형된 세포를 사용함으로써 CAR을 발현하는 변형된 세포를 고갈시키는 방법을 제공한다. 변형된 세포의 제거는 제어 특징에 특이적인 고갈제를 사용하여 달성될 수 있다.
특정 구현예에서, 키메라 분자를 발현하는 변형된 세포는 제어 특징에 대한 특이성으로 결합하는 항체(예를 들어, 항-Tag 항체)를 사용하거나, 또는 제어 특징에 특이적으로 결합하는 다른 동족 결합에 의해 생체내에서 검출 또는 추적될 수 있으며, 제어 특징에 대한 결합 파트너는 형광 염료, 방사선-추적자, 산화철 나노입자 또는 X-선, CT-스캔, MRI-스캔, PET-스캔, 초음파, 유세포 분석, 근적외선 이미징 시스템, 또는 다른 이미징 양식에 의한 검출을 위해 당업계에 알려진 다른 이미징제에 접합된다(예를 들어, Yu, 등, Theranostics 2:3, 2012 참조).
따라서, CAR이 있는 적어도 하나의 제어 특징을 나타내는 변형된 세포는 예를 들어, 태그 카세트가 없는 변형된 세포와 비교하여 더 용이하게 식별, 단리, 분류, 증식 유도, 추적, 및/또는 제거될 수 있다.
본 개시내용의 방법 및 조성물에 유용한 예시적인 CAR 및 CAR 아키텍처는 WO2012/138475A1, US 9,624,306B2, US9266960B2, US2017/017477, EP2694549B1, US2017/0283504, US2017/0281766, US20170283500, US2018/0086846, US2010/0105136, US2010/0105136, WO2012/079000, WO2008045437, WO2016/139487A1, 및 WO2014/039523에 의해 제공된 것들을 포함한다.
TCR은 자연 발생 T 세포 수용체를 지칭한다. HSC는 선택된 TCR을 발현하도록 생체내에서 변형될 수 있다. CAR/TCR 하이브리드는 TCR의 요소 및 CAR의 요소를 갖는 단백질을 지칭한다. 예를 들어, CAR/TCR 하이브리드는 TCR 결합 도메인이 자연적으로 회합되지 않는 효과기 도메인과 함께 자연 발생 TCR 결합 도메인을 가질 수 있다. CAR/TCR 하이브리드는 돌연변이된 TCR 결합 도메인 및 ITAM 신호전달 도메인을 가질 수 있다. CAR/TCR 하이브리드는 삽입된 비-자연 발생 스페이서 영역 또는 막관통 도메인과 함께 자연 발생 TCR을 가질 수 있다.
특정 CAR/TCR 하이브리드는 매사추세츠주 케임브리지 소재의 TCR2 Therapeutics의 TRuC®(T 세포 수용체 융합 작제물) 하이브리드를 포함한다. 예로서, TCR 융합 단백질의 생산은 국제 특허 공개 WO 2018/026953 및 WO 2018/067993, 및 출원 공개 US 2017/0166622에 기재되어 있다.
특정 구현예에서, CAR/TCR 하이브리드는 "T-세포 수용체(TCR) 융합 단백질" 또는 "TFP"를 포함한다. TFP는 일반적으로 i) 표적 세포 상의 표면 항원에 결합할 수 있고 ii) 전형적으로 T-세포의 표면 내에 또는 표면 상에 공동-위치할 때, 온전한 TCR 복합체의 다른 폴리펩티드 구성요소와 상호작용할 수 있는 TCR을 포함하는 다양한 폴리펩티드로부터 유래된 재조합 폴리펩티드를 포함한다.
특정 구현예에서, TFP는 암 항원(예를 들어, CD19, ROR1)에 결합하는 항체 단편을 포함하며 여기서 항체 단편의 서열은 TCR 서브유닛 또는 이의 부분을 암호화하는 핵산 서열과 인접하고 이와 동일한 판독 프레임 내에 있다. TFP는 기능적 TCR 복합체를 형성하기 위해 하나 이상의 내인성(또는 대안적으로, 하나 이상의 외인성, 또는 내인성 및 외인성의 조합) TCR 서브유닛과 회합할 수 있다.
I(C)(i)(b). 유전자 편집 시스템 및 구성요소
다양한 구현예에서, 본 개시내용의 페이로드는 유전자 편집 시스템의 적어도 하나의 구성요소, 또는 모든 구성요소를 암호화한다. 본 개시내용의 유전자 편집 시스템은 CRISPR 시스템 및 염기 편집 시스템을 포함한다. 광범위하게, 유전자 편집 시스템은 CRISPR-연관 RNA-가이드된 엔도뉴클레아제 및 염기 편집 효소로부터 선택된 유전자 편집 효소 및 적어도 하나의 gRNA를 포함하는 복수의 구성요소를 포함할 수 있다. 따라서, 본 개시내용의 유전자 편집 시스템은 (i) CRISPR 시스템의 경우, CRISPR-연관 RNA-가이드된 엔도뉴클레아제인 CRISPR 효소 및 적어도 하나의 가이드 RNA(gRNA), 또는 (ii) 염기 편집 시스템의 경우, 염기 편집 효소 및 적어도 하나의 gRNA를 포함할 수 있다.
본 개시내용은 자기-불활성화 유전자 편집 시스템이 본 개시내용의 벡터에 존재하고 벡터의 일부, 예를 들어, 통합 요소의 숙주 세포 게놈 내로의 절제 및/또는 통합 시 비-기능적으로 만드는 유전자 편집 시스템을 포함한다는 것을 포함한다. 다양한 구현예에서, 유전자 편집 시스템은 통합 요소의 절제 및/또는 통합 요소의 숙주 세포 게놈 내로의 통합 후 유전자 편집 시스템의 적어도 하나의 구성요소를 암호화하는 벡터 서열의 분해에 의해 비-기능적으로 만든다.
본 개시내용은 다양한 구현예에서, CRISPR 효소 또는 염기 편집 효소가 PGK 프로모터와 작동가능하게 연결된 유전자 편집 시스템을 암호화하는 핵산 서열을 포함한다. 본 개시내용은 PGK가 공여자 벡터 생산을 위한 HEK293 세포와 같은 생산자 세포에서 더 약한 프로모터이지만(즉, 예를 들어, 생산자 세포의 Ef1α 프로모터와 비교하여 및/또는 HSC의 PGK 프로모터와 비교하여, 코딩 서열 발현의 상대적으로 낮거나 또는 감소된 수준을 구동) HSC에서 효율적인 이식유전자 발현을 구동하는(즉, 예를 들어, HSC의 Ef1α 프로모터와 비교하여 및/또는 HEK293 세포와 같은 생산자 세포의 PGK 프로모터와 비교하여, 코딩 서열 발현의 상대적으로 높거나 또는 증가된 수준을 구동) 실험적 발견을 포함한다.
다양한 구현예에서, CRISPR 효소 또는 염기 편집 효소를 포함하는 유전자 편집 시스템을 암호화하는 핵산 서열은 예를 들어, TadA 및/또는 Tad*의 발현으로부터, 예를 들어, 생산자 세포(들)에서 유전자 편집 시스템 발현(예를 들어, 염기 편집 시스템 발현)의 잠재적인 유해 효과를 피하거나 또는 감소시키기 위해, HEK293 세포와 같은 생산자 세포에서 효소의 발현을 감소시키거나 또는 억제하는 microRNA 표적 부위를 포함한다. 다양한 구현예에서, miR 서열은 예를 들어, Saydaminova 등, Mol. Ther. Meth. Clin. Dev. 1: 14057, 2015; Li 등, Mol. Ther. Meth. Clin. Dev. 9: 390-401, 2018에 기재된 바와 같이, HDAd35 공여자 벡터 생산 동안 생산자 세포에서 염기 편집 또는 CRISPR 효소 발현을 억제하는 서열일 수 있으며, 상기 문헌은 본원에 참조로 포함된다.
따라서, 의심의 여지를 피하기 위해, 본 개시내용은 유전자 편집 시스템을 암호화하는 핵산 서열이 (i) 임의적으로 핵산 서열이 본원에 개시된 바와 같은 변형된 TadA 및/또는 TadA*를 포함하는 경우, CRISPR 효소 또는 염기 편집 효소를 암호화하는 핵산 서열; (ii) CRISPR 효소 또는 염기 편집 효소 코딩 서열에 작동가능하게 연결된 PGK 프로모터; 및 (iii) HEK293 세포와 같은 생산자 세포에서 효소의 발현을 감소시키거나 또는 억제하는 microRNA 표적 부위의 전부 또는 임의의 것을 포함할 수 있는 구현예를 포함한다. 본 개시내용은 이러한 특징(i, ii, 및 iii)이 효과적인 유전자 요법에 개별적으로 및 상승적 조합으로 기여할 수 있음을 포함한다.
I(C)(i)(b)(1). CRISPR 페이로드 발현 산물
CRISPR(클러스터링된 규칙적인 간격을 갖는 짧은 회문 반복부)/Cas(CRISPR-연관 단백질) 뉴클레아제 시스템은 박테리아 시스템에 기반한 유전적 조작에 사용되는 조작된 뉴클레아제 시스템이다. 이는 부분적으로 많은 박테리아 및 고세균의 적응 면역 반응에 기반한다. 바이러스 또는 플라스미드가 박테리아를 침입하는 경우, 침입자의 DAN 분절은 박테리아의 "면역" 반응에 의해 CRISPR RNA(crRNA)로 전환된다. 그런 다음 crRNA는 부분적 상보성 영역을 통해, tracrRNA라 불리는 또 다른 유형의 RNA와 회합하여 "프로토스페이서"라 불리는 표적 DNA의 crRNA에 상동인 영역에 Cas 뉴클레아제를 가이드한다. Cas 뉴클레아제는 crRNA 전사체 내에 함유된 20-뉴클레오티드 상보적 가닥 서열에 의해 명시된 부위에서 이중-가닥 파괴 시 뭉툭한 단부를 생성하도록 DNA를 절단한다. 일부 경우에, Cas 뉴클레아제는 부위-특이적 DNA 인식 및 절단을 위해 crRNA 및 tracrRNA를 둘 다 필요로 한다.
가이드 RNA(gRNA)는 표적화 요소의 일 예이다. 가장 간단한 형태에서, gRNA는 상보성에 기반한 게놈 내의 부위를 표적화하는 서열(예를 들어, crRNA)을 제공한다. 그러나, 하기 예시된 바와 같이, gRNA는 또한 추가적인 구성요소를 포함할 수 있다. 예를 들어, 특정 구현예에서, gRNA는 표적화 서열(예를 들어, crRNA) 및 표적화 서열을 절단 요소에 연결하는 구성요소를 포함할 수 있다. 이 연결 구성요소는 tracrRNA일 수 있다. 특정 구현예에서, 하기 기재된 바와 같이, crRNA 및 tracrRNA를 포함하는 gRNA는 단일 gRNA(sgRNA)로 지칭되는 단일 분자로 표현될 수 있다. gRNA는 또한 다른 메커니즘을 통해 예컨대 나노입자를 통해 또는 이중 또는 다중-목적 분자의 발현 또는 구축을 통해 절단 요소에 연결될 수 있다. 당업자는 예를 들어, 본 개시내용의 아데노바이러스 공여자 벡터 또는 게놈의 숙주 세포에서 선택된 핵산 서열 교정 또는 변형을 생성하기 위한 gRNA 또는 다른 표적화 요소가 예를 들어, 이용가능한 서열 정보를 기반으로 용이하게 설계 및 구현될 수 있음을 이해할 것이다.
특정 구현예에서, 표적화 요소(예를 들어, gRNA)는 새롭거나 또는 향상된 특징(예를 들어, 개선된 안정성)이 있는 핵산을 제공하기 위해, 하나 이상의 변형(예를 들어, 염기 변형, 백본 변형)을 포함할 수 있다. 변형된 백본은 백본에서 인 원자를 유지하는 것들 및 백본에서 인 원자를 갖지 않는 것들을 포함할 수 있다. 인 원자를 함유하는 적합한 변형된 백본은 예를 들어, 포스포로티오에이트, 키랄 포스포로티오에이트, 포스포로디티오에이트, 포스포트리에스테르, 아미노알킬포스포트리에스테르, 메틸 및 다른 알킬 포스페이트 예컨대 3'-알킬렌 포스포네이트, 5'-알킬렌 포스포네이트, 키랄 포스포네이트, 포스피네이트, 3'-아미노 포스포라미데이트 및 아미노알킬포스포라미데이트를 포함하는 포스포라미데이트, 포스포로디아미데이트, 티오노포스포라미데이트, 티오노알킬포스포네이트, 티오노알킬포스포트리에스테르, 셀레노포스포네이트, 및 정상 3'-5' 연결, 2'-5' 연결된 유사체, 및 도립된 극성이 있는 것을 갖는 보라노포스페이트를 포함할 수 있으며 여기서 하나 이상의 뉴클레오티드간 연결은 3'에서 3'으로, 5'에서 5'으로 또는 2'에서 2'으로 연결이다. 도립된 극성을 갖는 적합한 표적화 요소는 3'-대부분 뉴클레오티드간 연결에서 단일 3'에서 3'으로 연결(즉, 핵염기가 누락되거나 또는 이 대신에 하이드록실 기를 갖는 단일 도립된 뉴클레오티드 잔기)를 포함할 수 있다. 다양한 염(예를 들어, 염화칼륨 또는 염화나트륨), 혼합 염, 및 유리 산 형태가 또한 포함될 수 있다.
표적화 요소는 하나 이상의 포스포로티오에이트 및/또는 헤테로원자 뉴클레오시드간 연결, 특히 --CH2-NH-O-CH2-, --CH2-N(CH3)-O-CH2-(즉, 메틸렌(메틸이미노) 또는 MMI 백본), --CH2-O-N(CH3)-CH2-, --CH2-N(CH3)-N(CH3)-CH2- 및 --O--N(CH3)-CH2-CH2-(여기서 천연 포스포디에스테르 뉴클레오티드간 연결은 --O--P(=O)(OH)-O-CH2-로 표현됨)를 포함할 수 있다.
특정 구현예에서, 표적화 요소는 모르폴리노 백본 구조를 포함할 수 있다. 예를 들어, 표적화 요소는 리보스 고리 대신에 6-원 모르폴리노 고리를 포함할 수 있다. 이러한 구현예 중 일부에서, 포스포로디아미데이트 또는 다른 비-포스포디에스테르 뉴클레오시드간 연결은 포스포디에스테르 연결을 대체한다.
특정 구현예에서, 표적화 요소는 하나 이상의 치환된 당 모이어티를 포함할 수 있다. 적합한 폴리뉴클레오티드는 OH; F; O-, S-, 또는 N-알킬; O-, S-, 또는 N-알케닐; O-, S- 또는 N-알키닐; 또는 O-알킬-O-알킬로부터 선택된 당 치환기를 포함할 수 있으며, 여기서 알킬, 알케닐 및 알키닐은 치환 또는 비치환된 C1 내지 C10 알킬 또는 C2 내지 C10 알케닐 및 알키닐일 수 있다. O((CH2)nO) mCH3, O(CH2)nOCH3, O(CH2)nNH2, O(CH2)nCH3, O(CH2)nONH2, 및 O(CH2)nON((CH2)nCH3)2가 특히 적합하며, 여기서 n 및 m은 1 내지 10이다.
절단 요소의 예는 뉴클레아제를 포함한다. CRISPR-Cas 유전자좌는 50 개 초과의 유전자 패밀리를 갖고 엄격하게 보편적인 유전자가 없으며, 이는 유전자좌 아키텍처의 빠른 진화 및 극도의 다양성을 나타낸다. 예시적인 Cas 뉴클레아제는 Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csnl 및 Csxl2로도 알려짐), CaslO, Cpfl, C2c3, C2c2 및 C2clCsyl, Csy2, Csy3, Csel, Cse2, Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Cpfl, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Csxl, Csxl5, Csfl, Csf2, Csf3, 및 Csf4를 포함한다.
3가지 주요 유형의 Cas 뉴클레아제(I형, II형, 및 III형), 및 5 개의 I형, 3 개의 II형, 및 2 개의 III형 단백질을 포함하는 10 개의 하위유형이 있다(예를 들어, Hochstrasser and Doudna, Trends Biochem Sci, 2015:40(l):58-66) 참조. II형 Cas 뉴클레아제는 Casl, Cas2, Csn2, 및 Cas9를 포함한다. 이들 Cas 뉴클레아제는 당업자에게 알려져 있다. 예를 들어, 스트렙토코쿠스 피오게네스(Streptococcus pyogenes) 야생형 Cas9 폴리펩티드의 아미노산 서열은 예를 들어, NCBI 참조 서열 번호 NP 269215에 제시되어 있고, 스트렙토코쿠스 써모필루스(Streptococcus thermophilus) 야생형 Cas9 폴리펩티드의 아미노산 서열은 예를 들어, NCBI 참조 서열 번호 WP_011681470에 제시되어 있다.
특정 구현예에서, Cas9는 RNA-가이드된 이중-가닥 DNA-결합 뉴클레아제 단백질 또는 닉카제 단백질을 지칭한다. 야생형 Cas9 뉴클레아제는 상이한 DNA 가닥을 절단하는 2 개의 기능적 도메인, 예를 들어, RuvC 및 HNH를 갖는다. Cas9는 두 기능적 도메인이 활성일 때 게놈 DNA(표적 DNA)에서 이중 가닥 파괴를 유도할 수 있다. 일부 구현예에서, Cas9 효소는 코리네박터(Corynebacter), 수테렐라(Sutterella), 레지오넬라(Legionella), 트레포네마(Treponema), 필리프 액터(Filif actor), 유박테리움(Eubacterium), 스트렙토코쿠스(Streptococcus), 락토바실루스(Lactobacillus), 마이코플라스마(Mycoplasma), 박테로이데스(Bacteroides), 플라비볼라(Flaviivola), 플라보박테리움(Flavobacterium), 스페로케타(Sphaerochaeta), 아조스피릴룸(Azospirillum), 글루코나세토박터(Gluconacetobacter), 네이세리아(Neisseria), 로세부리아(Roseburia), 파르비바쿨룸(Parvibaculum), 스타필로코쿠스(Staphylococcus), 니트라티프락터(Nitratifractor), 및 캄필로박터(Campylobacter)와 같은 박테리아로부터 유래된 Cas9 단백질의 하나 이상의 촉매적 도메인을 포함한다. 일부 구현예에서, Cas9는 융합 단백질이며, 예를 들어 2 개의 촉매적 도메인은 상이한 박테리아 종으로부터 유래된다.
이전에 나타낸 바와 같이, CRISPR/Cas 시스템은 특정 경우에, crRNA 및 tracrRNA가 단일 gRNA(sgRNA)라고 불리는 하나의 분자 내로 조합될 수 있도록 조작되었다. 이 조작된 접근법에서, sgRNA는 Cas가 임의의 원하는 서열을 표적화하도록 가이드한다(예를 들어, Jinek 등, Science 337:816-821, 2012; Jinek 등, eLife 2:e00471, 2013; Segal, eLife 2:e00563, 2013 참조). 따라서, CRISPR/Cas 시스템은 세포의 게놈에서 원하는 표적에서 이중 가닥 파괴를 생성하고, 세포의 내인성 메커니즘을 활용하여 HDR, 또는 NHEJ에 의해 유도된 파괴를 복구하도록 조작될 수 있다. 본원에 기재된 특정 구현예는 정의된 통합 부위에서 HDR을 촉진하기 위해 상동성 아암을 활용한다.
Cas9 뉴클레아제의 유용한 변이체는 RuvC" 또는 HNH" 효소 또는 닉카제와 같은 단일 불활성 촉매적 도메인을 포함한다. Cas9 닉카제는 활성 하나의 기능적 도메인만을 가지며, 일부 구현예에서, 표적 DNA의 한쪽 가닥만을 절단하여, 단일 가닥 파괴 또는 닉을 생성한다. 일부 구현예에서, 적어도 D10A 돌연변이를 갖는 돌연변이체 Cas9 뉴클레아제는 Cas9 닉카제이다. 다른 구현예에서, 적어도 H840A 돌연변이를 갖는 돌연변이체 Cas9 뉴클레아제는 Cas9 닉카제이다. Cas9 닉카제에 존재하는 돌연변이의 다른 예는 N854A 및 N863 A를 포함한다. 이중 가닥 파괴는 반대 DNA 가닥을 표적화하는 적어도 2 개의 DNA-표적화 RNA가 사용되는 경우 Cas9 닉카제를 사용하여 도입된다. 이중 닉 유도된 이중 가닥 파괴는 HDR 또는 NHEJ에 의해 복구된다. 이 유전자 편집 전략은 일반적으로 HDR을 선호하고 표적외 DNA 부위에서 indel 돌연변이의 빈도를 감소시킨다. 일부 구현예에서, Cas9 뉴클레아제 또는 닉카제는 표적 세포 또는 표적 유기체에 대해 코돈-최적화된다.
특정 구현예는 스타필로코쿠스 아우레우스(Staphylococcus aureus) Cas9(SaCas9)를 활용할 수 있다. 특정 구현예는 다음 위치 중 하나 이상에서 돌연변이가 있는 SaCas9를 활용할 수 있다: E782, N968, 및/또는 R1015. 특정 구현예는 다음 위치 중 하나 이상에서 돌연변이가 있는 SaCas9를 활용할 수 있다: E735, E782, K929, N968, A1021, K1044 및/또는 R1015. 일부 구현예에서, 변이체 SaCas9 단백질은 다음 돌연변이 중 하나 이상을 포함한다: R1015Q, R1015H, E782K, N968K, E735K, K929R, A1021T, 및/또는 K1044N. 일부 구현예에서, 변이체 SaCas9 단백질은 D10A, D556A, H557A, N580A, 예를 들어, D10A/H557A 및/또는 D10A/D556A/H557A/N580A에서 돌연변이를 포함한다. 일부 구현예에서, 변이체 SaCas9 단백질은 E735, E782, K929, N968, R1015, A1021, 및/또는 K1044로부터 선택된 하나 이상의 돌연변이를 포함한다. 일부 구현예에서, SaCas9 변이체는 다음 돌연변이 세트 중 하나를 포함할 수 있다: E782K/N968K/R1015H(KKH 변이체); E782K/K929R/R1015H(KRH 변이체); 또는 E782K/K929R/N968K/R1015H(KRKH 변이체).
Cpf1에 의해 예시된 클래스 II, V형 CRISPR-Cas 클래스는 Zetsche 등 (2015) Cell 163(3): 759-771에서 식별되었다. Cpf1 뉴클레아제는 특히 프로토스페이서-인접 모티프 또는 PAM으로 알려진 짧은 3 개의 염기 쌍 인식 서열(TTN)에 의해 표적 부위 선택에 추가의 유연성을 제공할 수 있다. Cpf1의 절단 부위는 PAM 서열로부터 적어도 18 bp 떨어져 있다. 더욱이, 끈적한 단부가 있는 엇갈린 DSB는 방향-특이적 공여자 주형 삽입을 허용하며, 이는 비-분할 세포에 유리하다.
특정 구현예는 조작된 Cpf1을 활용할 수 있다. 예를 들어, US 2018/0030425는 표적 특이성이 변경되고 개선된 라크노스피라세 박테리움(Lachnospiraceae bacterium) ND2006 악시다미노코쿠스 종(Acidaminococcus sp.) BV3L6으로부터 조작된 Cpf1 뉴클레아제를 기재한다. 특정 변이체는 예를 들어, 다음 위치 중 하나 이상에서 돌연변이(즉, 천연 아미노산을 상이한 아미노산, 예를 들어, 알라닌, 글리신, 또는 세린으로 대체)가 있는 아미노산 19-1246을 적어도 포함하는 라크노스피라세 박테리움 ND2006을 포함한다: S202, N274, N278, K290, K367, K532, K609, K915, Q962, K963, K966, K1002, 및/또는 S1003. 특정 Cpf1 변이체는 또한 다음 위치 중 하나 이상에서 돌연변이(즉, 천연 아미노산을 상이한 아미노산, 예를 들어, 알라닌, 글리신, 또는 세린(천연 아미노산이 세린인 경우 제외)으로 대체)가 있는 악시다미노코쿠스 종 BV3L6 Cpf1(AsCpf1)을 포함한다: N178, S186, N278, N282, R301, T315, S376, N515, K523, K524, K603, K965, Q1013, Q1014, 및/또는 K1054.
다른 Cpf1 변이체는 Zetsche 등 (2015) Cell 163: 759-771에 개시된 Cpf1 폴리펩티드 뿐만 아니라 U.S. 2016/0208243에 개시된 Cpf1 폴리펩티드의 Cpf1 상동체 및 오솔로그(ortholog)를 포함한다. 다른 조작된 Cpf1 변이체는 당업자에게 알려져 있고 본 개시내용의 범위 내에 포함된다(예를 들어, WO/2017/184768 참조).
CRISPR-Cas 시스템 및 이의 구성요소에 관한 추가적인 정보는 다음에 기재되어 있다: US 8697359, US 8771945, US 8795965, US 8865406, US 8871445, US 8889356, US 8889418, US 8895308, US 8906616, US 8932814, US 8945839, US 8993233 및 US 8999641 및 이와 관련된 출원; 및 WO2014/018423, WO2014/093595, WO2014/093622, WO2014/093635, WO2014/093655, WO2014/093661, WO2014/093694, WO2014/093701, WO2014/093709, WO2014/093712, WO2014/093718, WO2014/145599, WO2014/204723, WO2014/204724, WO2014/204725, WO2014/204726, WO2014/204727, WO2014/204728, WO2014/204729, WO2015/065964, WO2015/089351, WO2015/089354, WO2015/089364, WO2015/089419, WO2015/089427, WO2015/089462, WO2015/089465, WO2015/089473 및 WO2015/089486, WO2016/205711, WO2017/106657, WO2017/127807 및 이와 관련된 출원.
일부 구현예에서 CRISPR 시스템은 예를 들어, γ-글로빈의 발현을 증가시키기 위해 γ-글로빈을 암호화하는 핵산 서열을 변형시키도록 조작된다. 헤모글로빈의 주요 태아 형태인 헤모글로빈 F(HbF)는 γ-글로빈 폴리펩티드 서브유닛과 α-글로빈 폴리펩티드 서브유닛의 쌍형성에 의해 형성된다. 인간 태아 γ -글로빈 유전자(HBG1 및 HBG2; 진화적 복제에 의해 생성된 2 개의 고도로 상동성인 유전자)는 정상적으로 출생 시 침묵하는 반면, 성인 β-글로빈 유전자 발현(HBB 및 HBD)의 발현은 증가한다. 일생에 걸쳐 태아 γ-글로빈의 지속적인 발현을 야기하거나 또는 허용하는 돌연변이는 β-글로빈 결핍의 표현형을 개선할 수 있다. 따라서, 태아 γ-글로빈 유전자의 재활성화는 특히 β-글로빈 결핍이 있는 대상체에서 치료적으로 유익할 수 있다. γ-글로빈의 발현을 증가시키는 다양한 돌연변이는 당업계에 알려져 있고 본원에 개시되어 있다(예를 들어, Wienert, Trends in Genetics 34(12): 927-940, 2018을 참조하며, γ-글로빈의 발현을 증가시키는 돌연변이와 관련하여 그 전문이 본원에 참조로 포함된다). 이러한 특정 돌연변이는 HBG1 프로모터 또는 HBG2 프로모터에서 발견된다.
일부 구현예에서, 벡터 또는 게놈은 페이로드가 통합 요소를 포함하는 CRISPR 시스템을 포함하고 CRISPR 시스템의 적어도 하나의 구성요소는 페이로드에 존재하지만 통합 요소의 외부(예를 들어, 트랜스포존 도립 반복부에 의해 플랭킹된 전위성 통합 요소를 포함하는 페이로드 단편의 외부 또는 상동 통합을 위한 상동성 아암을 포함하는 페이로드 단편의 외부)에 있다. 페이로드가 전위성 통합 요소를 포함하는 특정한 특정 구현예에서, 전위성 통합 요소가 트랜스포존 도립 반복부에 의해 플랭킹된 경우, CRISPR 효소 및/또는 CRISPR 시스템의 하나 이상의 gRNA 중 하나 이상은 전위성 통합 요소의 외부 위치에서 (즉, 내부에 존재하지 않는) 페이로드에 존재한다(즉, 트랜스포존 도립 반복부에 의해 플랭킹된 핵산 서열에 존재하지 않음). 페이로드가 전위성 통합 요소를 포함하는 특정한 특정 구현예에서, 전위성 통합 요소가 상동성 아암에 의해 플랭킹된 경우, CRISPR 효소 및/또는 CRISPR 편집 시스템의 하나 이상의 gRNA 중 하나 이상은 통합 요소의 위부 위치에서 (즉, 내부에 존재하지 않는) 페이로드에 존재한다(즉, 상동성 아암에 의해 플랭킹된 핵산 서열에 존재하지 않음). 이러한 시스템에서, CRISPR 시스템의 발현 및/또는 활성은 일시적이며, 전위성 통합 요소의 전위의 경우 벡터를 파괴하고 전위성 통합 요소의 외부에 위치한 CRISPR 시스템 구성요소 중 하나 이상의 발현을 감소 또는 종결시킬 수 있다. (예를 들어, 전위 또는 상동 재조합에 의한) 통합 요소의 통합은 CRISPR 시스템의 발현 및/또는 활성을 불활성화할 수 있기 때문에 CRISPR 시스템을 포함하는 이러한 벡터는 때때로 "자기-불활성화" CRISPR 시스템 또는 벡터로 지칭될 수 있다. 다양한 구현예에서, 자기-불활성화 CRISPR 시스템은 조합 페이로드에 존재한다.
본 발명자들은 자기-불활성화 CRISPR 시스템 페이로드를 포함하는 아데노바이러스 벡터(예를 들어, HDAd 아데노바이러스 벡터)가 예를 들어, 다른 CRISPR 시스템 페이로드와 비교하여 유전자 요법(예를 들어, 생체내 유전자 요법)에서 절단 빈도 증가 및/또는 형질도입 및/또는 편집된 표적 세포의 생존 증가(예를 들어, 형질도입 HSPC의 생존 증가)를 초래함을 관찰하였으며, 여기서 CRISPR 시스템은 통합 요소 내에 완전히 있거나 또는 CRISPR 시스템은 숙주 세포 게놈 내로 통합되지 않지만 발현은 벡터 파괴에 의해 불활성화되지 않는다. CRISPR 시스템의 자기-불활성화는 CRISPR 효소 및/또는 gRNA의 발현을 단축시키고, 편집된 세포의 생존을 증가시키고, 장기간 재증식하는 세포의 백분율을 증가시킨다, 일 예를 제공하기 위해, HBG1 및/또는 HGB2의 재활성화를 위한 자기-불활성화 CRISPR 시스템을 포함하고 γ-글로빈의 발현을 위한 핵산 서열을 추가로 포함하는 조합 페이로드를 포함하는 HDAd 벡터를 사용한 유전자 요법은 비-불활성화 CRISPR 시스템 또는 γ-글로빈 단독의 발현을 위한 핵산 서열을 포함하는 HDAd 벡터가 형질도입 수행 후 RBC에서 상당히 더 높은 γ-글로빈을 생성하였다.
본원에는 예를 들어, 자기-불활성화 CRISPR 시스템을 포함하는 공여자 벡터가 통합 요소의 전위를 위한 트랜스포사제를 암호화하는 지지 벡터 또는 게놈과 조합하여 인간 대상체에게 투여되는 방법을 추가로 제공한다. 본 개시내용은 다양한 경우에 공여자 벡터가 지지 벡터의 투여 전에 투여되는 것을 포함하며, 여기서 공여자 벡터의 투여 및 지지 벡터의 투여 사이의 시간 기간은 CRISPR 시스템의 지속기간 및/또는 활성 수준을 조절하는 수단을 제공한다. 예를 들면, 다양한 구현예에서, 지지 벡터는 예를 들어, 공여자 벡터의 투여 후 일정 기간에 대상체에게 투여될 수 있으며 여기서 일정 기간은 적어도 1, 2, 3, 4, 5, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 30, 36, 42, 48, 54, 60, 66, 또는 72, 96, 또는 128 시간이다(예를 들어, 여기서 기간은 1, 2, 3, 4, 5, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 30, 36, 42, 48, 54, 60, 66, 또는 72 시간의 하한 및 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 30, 36, 42, 48, 54, 60, 66, 72, 96, 또는 128 시간의 상한을 갖는다).
일부 구현예에서, CRISPR 시스템 구성요소를 암호화하는(예를 들어, CRISPR 효소를 암호화하는) 핵산 서열은 CRISPR 발현 및/또는 활성의 microRNA 조절을 위한 microRNA 표적 부위를 포함하도록 조작된다.
I(C)(i)(b)(2). 염기 편집기 페이로드 발현 산물
본 개시내용은 무엇보다도, 염기 편집제 및 이를 암호화하는 핵산을 포함하며, 임의적으로 여기서 염기 편집제 또는 이를 암호화하는 핵산은 아데노바이러스 벡터 또는 게놈과 같은 벡터 또는 게놈에 존재한다. 염기 편집 시스템은 염기 편집 효소 및/또는 적어도 하나의 gRNA를 이의 구성요소로서 포함할 수 있다. 특정한 특정 구현예에서, 본 개시내용의 염기 편집제 및/또는 염기 편집 시스템은 Ad35 또는 Ad5/35 아데노바이러스 벡터에 존재한다. 그러나, 당업자는 본 개시내용의 염기 편집제 및 이를 암호화하는 핵산 서열이 임의의 맥락 또는 형태, 예를 들어, 아데노바이러스 벡터가 아닌 벡터, 예를 들어, 플라스미드로 존재할 수 있음을 이해할 것이다. 본원에 개시된 바와 같은 뉴클레오티드 서열 암호화 염기 편집 시스템은 전형적으로 많은 제한된 용량의 벡터 시스템에 포함하기에 너무 크지만, 아데노바이러스 벡터의 큰 용량은 본 개시내용의 아데노바이러스 벡터 및 게놈에 이러한 서열의 포함을 허용한다. 실제로, 본원의 다른 곳에서 논의된 바와 같이, 아데노바이러스 벡터는 염기 편집 시스템을 암호화하고 하나 이상의 추가적인 코딩 서열을 추가로 암호화하는 페이로드를 포함할 수 있다. 본 개시내용의 염기 편집기를 암호화하는 페이로드를 사용한 유전자 요법을 위한 본원에 개시된 바와 같은 아데노바이러스 벡터 및 게놈의 추가적인 이점은 Ad35 게놈과 같은 아데노바이러스 게놈이 숙주 세포 게놈 내로 자연적으로 통합되지 않아, 염기 편집 시스템의 일시적 발현을 용이하게 한다는 점이며, 예를 들어, 면역원성 및/또는 유전독성을 피하는 것이 바람직할 수 있다.
염기 편집은 게놈 DNA 또는 세포 RNA 내의 염기 또는 염기 쌍을 상이한 염기 또는 염기 쌍으로 전환함으로써 핵산 서열의 선택적 변형을 지칭한다(Rees & Liu, Nature Reviews Genetics, 19:770-788, 2018). DNA 염기 편집기에는 다음과 같은 2 가지 일반적인 클래스가 있다: (i) 구아닌-사이토신 염기 쌍을 티민-아데닌 염기 쌍으로 전환하는 사이토신 염기 편집기(CBE), 및 (ii) 아데닌-티민 염기 쌍을 구아닌 사이토신 염기 쌍으로 전환하는 아데닌 염기 편집기(ABE). 특정 구현예에서, CRISPR 시스템의 구성요소는 다른 효소 또는 이의 생물학적으로 활성인 단편과 조합하여 예를 들어, 돌연변이된 핵산에서 하나 이상의 이중-가닥 파괴를 만들거나, 야기하기나, 또는 생성하지 않고 핵산, 예를 들어, DNA 또는 RNA에 점 돌연변이와 같은 돌연변이를 직접적으로 설치하거나, 야기하거나, 또는 생성한다. 구성요소의 이러한 특정 조합은 염기 편집기로 알려져 있다.
DNA 염기 편집기는 핵염기 데아미나제 효소에 융합된 촉매적으로 기능상실된 뉴클레아제 및, 일부 경우에 DNA 글리코실라제 억제제를 포함할 수 있다. RNA 염기 편집기는 RNA를 변형시키는 염기를 구성요소로 사용하여 유사한 변화를 달성한다.
DNA에서 표적 유전자좌에 결합 시, 가이드 RNA 및 표적 DNA 가닥 사이에 염기 쌍형성은 단일-가닥 DNA의 작은 분절의 대체로 이어진다. 이 단일-가닥 DNA 버블 내의 DNA 염기는 데아미나제 효소에 의해 변형될 수 있다. 특정 구현예에서, 진핵생물 세포에서의 효율을 개선하기 위해, 촉매적으로 기능상실된 뉴클레아제는 또한 비-편집된 DNA 가닥에서 닉을 생성하여, 세포가 편집된 가닥을 주형으로 사용하여 비-편집된 가닥을 복구하도록 유도한다.
CBE의 경우, CRISPR-기반 편집기는 사이토신 데아미나제를 Cas 닉카제, 예를 들어, Cas9 닉카제(nCas9)와 연결함으로써 생성될 수 있다. 일 예를 피하기 위해, nCas9는 단일 가닥을 절단함으로써 표적 DNA에 닉을 생성하여, 이중-가닥 파괴를 필요로 하는 방법과 비교하여 해로운 indel 형성 가능성을 감소시킬 수 있다. DNA와 결합 후, CBE는 표적 사이토신(C)을 우라실(U) 염기로 탈아미노화한다. 이후에 생성된 U-G 쌍은 원래 C-G 쌍을 T-A로 전환하거나 또는 우라실 글리코실라제에 의해 매개된 염기 절제 복구에 의해 원래 C-G로 역전시키는 세포 불일치 복구 기구에 의해 복구된다. 다양한 구현예에서, 우라실 글리코실라제 억제제(UGI), 예를 들어, 페이로드에 존재하는 UGI의 발현은 2차 결과의 발생을 감소시키고 T-A 염기 쌍 형성의 생성을 증가시킨다.
아데노신 염기 편집기(ABE)의 경우, 아데닌 염기 편집을 위해 DNA 상에서 작용할 수 있는 예시적인 아데노신 데아미나제는 DNA를 기질로서 수용하는 돌연변이체 TadA 아데노신 데아미나제(TadA*)를 포함한다. 이. 콜라이(E. coli) TadA는 전형적으로 동종이량체로서 작용하여 전달 RNA(tRNA)에서 아데노신을 탈아미노화한다. TadA* 데아미나제는 표적 'A'에서 'I'(이노신)으로의 전환을 촉매하며, 이는 세포 폴리머라제에 의해 'G'로 처리된다. 후속적으로, 원래 게놈 A-T 염기 쌍은 G-C 쌍으로 전환될 수 있다. 세포의 이노신 절제 복구는 우라실 절제만큼 활성이 아니므로, ABE는 CBE에서 UGI와 같은 임의의 추가적인 억제제 단백질을 필요로 하지 않는다. 일부 구현예에서, 전형적인 ABE는 염기 편집 동안 구조적 역할을 할 수 있는 야생형 이. 콜라이 tRNA-특이적 아데노신 데아미나제(TadA) 단량체, 데옥시아데노신 탈아미노화를 촉매하는 TadA* 돌연변이체 TadA 단량체, 및 Cas9(D10A)와 같은 Cas 닉카제를 포함하는 3 개의 구성요소를 포함할 수 있다. 특정 구현예에서, TadA 및 TadA* 사이에 위치한 링커가 있고, 특정 구현예에서 TadA* 및 Cas 닉카제 사이에 위치한 링커가 있다. 다양한 구현예에서, 하나 또는 두 링커는 적어도 6 개의 아미노산, 예를 들어, 적어도 5, 6, 7, 8, 9, 10, 15, 20, 25, 30, 35, 40, 45, 또는 50 개의 아미노산(예를 들어, 5, 6, 7, 8, 9, 10, 또는 15 개, 아미노산의 하한 및 20, 25, 30, 35, 40, 45, 또는 50 개 아미노산의 상한을 가짐)을 포함한다. 다양한 구현예에서, 하나 또는 두 링커는 32 개의 아미노산을 포함한다. 일부 구현예에서, 하나 또는 두 링커는 (SGGS)2-XTEN-(SGGS)2에 따른 서열, 또는 당업자에게 달리 알려진 서열을 갖는다.
염기 편집기는 하나의 염기 또는 염기 쌍을 또 다른 것으로 직접적으로 전환할 수 있으며, 삽입 및 결실(indel)과 같은 과도한 원치않은 편집 부산물을 생성하지 않고 비-분할 세포에서 점 돌연변이의 효율적인 설치를 가능하게 한다. 예를 들어, 염기 편집기는 10%, 9%, 8%, 7%, 6%, 5.5%, 5%, 4.5%, 4%, 3.5%, 3%, 2.5%, 2%, 1.5%, 1%, 0.5%, 또는 0.1% 미만의 indel을 생성할 수 있다.
DNA 염기 편집기는 이러한 점 돌연변이를 이중 가닥 파괴를 생성하지 않고 비-분할 세포에 삽입할 수 있다. 이중 가닥 파괴의 결여로 인해, 염기 편집기는 삽입 및 결실(indel)과 같은 과도한 원치않은 편집 부산물을 초래하지 않는다. 예를 들어, 염기 편집기는 이중 가닥 파괴에 의존하는 기술과 비교하여 10%, 9%, 8%, 7%, 6%, 5.5%, 5%, 4.5%, 4%, 3.5%, 3%, 2.5%, 2%, 1.5%, 1%, 0.5%, 또는 0.1% 미만의 indel을 생성할 수 있다.
대부분의 염기-편집 시스템의 구성요소는 (1) 표적화된 DNA 결합 단백질, (2) 핵염기 데아미나제 효소, 및 (3) DNA 글리코실라제 억제제를 포함한다.
CRISPR 시스템의 임의의 뉴클레아제는 기능상실되고 염기 편집 시스템 내에서 사용될 수 있다. 예시적인 Cas 뉴클레아제는 Casl, CaslB, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (Csnl 및 Csxl2로도 알려짐), CaslO, Cpfl, C2c3, C2c2 및 C2clCsyl, Csy2, Csy3, Csel, Cse2, Cscl, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmrl, Cmr3, Cmr4, Cmr5, Cmr6, Cpfl, Csbl, Csb2, Csb3, Csxl7, Csxl4, CsxlO, Csxl6, CsaX, Csx3, Csxl, Csxl5, Csf1, Csf2, Csf3, Csf4 및 이의 돌연변이를 포함한다.
특정 구현예는 뉴클레아제-불활성 Cas9(dCas9)를 촉매적으로 기능상실된 뉴클레아제로서 활용한다. 그러나, CRISPR 시스템의 임의의 뉴클레아제(이 중 많은 것이 상기 기재됨)는 기능상실되고 염기 편집 시스템 내에서 사용될 수 있다. 특정 구현예에서, 고충실도의 Cas9 도메인이 선택되며 여기서 Cas9 도메인은 야생형 Cas9 도메인과 비교하여, Cas9 도메인 및 DNA의 당-포스페이트 백본 사이에 감소된 정전기적 상호작용을 나타낸다. 일부 구현예에서, Cas9 도메인(예를 들어, 야생형 Cas9 도메인)은 Cas9 도메인 및 DNA의 당-포스페이트 백본 사이의 회합을 감소시키는 하나 이상의 돌연변이를 포함한다. 고충실도의 Cas9 도메인은 당업자에게 알려져 있다. 예를 들어, 고충실도의 Cas9 도메인은 Kleinstiver, 등, Nature 529, 490-495, 2016; 및 Slaymaker 등, Science 351, 84-88, 2015에 기재되었다.
다른 유전자-편집 시스템의 뉴클레아제가 또한 사용될 수 있다. 예를 들어, 염기-편집 시스템은 아연 핑거 뉴클레아제(ZFN)(Urnov 등, Nat Rev Genet., 11(9):636-46, 2010) 및 전사 활성인자 유사 효과기 뉴클레아제(TALEN)(Joung 등, Nat Rev Mol Cell Biol. 14(1):49-55, 2013)를 활용할 수 있다. DNA-결합 뉴클레아제에 관한 추가적인 정보를 위해, US2018/0312825A1을 참조한다.
특정 구현예에서, 핵염기 데아미나제 효소는 사이티딘 데아미나제 도메인 또는 아데닌 데아미나제 도메인을 포함한다.
특정 구현예는 사이티딘 데아미나제 도메인을 핵염기 데아미나제 효소로서 활용한다. 특정 구현예는 아데닌 데아미나제 도메인을 핵염기 데아미나제 효소로서 활용한다. 추가로, 특정 구현예는 우라실 글리코실라제 억제제(UGI)를 글리코실라제 억제제로서 활용한다. 예를 들어, 특정 구현예에서, dCas9 또는 Cas9 닉카제는 사이티딘 데아미나제 도메인에 융합될 수 있다. 사이티딘 데아미나제 도메인에 융합된 dCas9 또는 Cas9 닉카제는 하나 이상의 UGI 도메인에 융합될 수 있다. 하나 초과의 UGI 도메인이 있는 염기 편집기는 indel을 덜 생성하고 표적 핵산을 더 효율적으로 탈아미노화할 수 있다.
특정 구현예에서, 데아미나제 도메인(사이티딘 및/또는 아데닌)은 촉매적으로 기능상실된 뉴클레아제의 N-말단에 융합된다. 이는 Cas9의 N-말단에 융합된 사이티딘 데아미나제 도메인이 다른 구성과 비교하여 염기-편집 효율이 개선될 수 있기 때문이다. 이러한 구현예에서, 글리코실라제 억제제(예를 들어, UGI 도메인)는 촉매적으로 기능상실된 뉴클레아제의 C-말단에 융합될 수 있다. 다중 글리코실라제 억제제가 사용될 때, 각각은 촉매적으로 기능상실된 뉴클레아제의 C-말단에 융합될 수 있다.
특정 구현예에서, 사이티딘 데아미나제 도메인을 활용하는 CBE는 우라실을 생성하기 위해 사이토신의 외환식 아민을 탈아미노화함으로써 구아닌-사이토신 염기 쌍을 티민-아데닌 염기 쌍으로 전환한다. 사이토신 데아미나제 효소의 예는 APOBEC1, APOBEC3A, APOBEC3G, CDA1, 및 AID를 포함한다. APOBEC1은 특히 단일 가닥 (ss)DNA를 기질로서 수용하지만 이중 가닥 (ds)DNA 상에서 작용할 수 없다.
대부분의 염기-편집 시스템은 또한 의도된 염기 편집을 달리 복구할 수 있는 천연 DNA 복구 메커니즘을 중단시키는 역할을 하는 DNA 글리코실라제 억제제를 포함한다. 특정 구현예에서, DNA 글리코실라제 억제제는 Wang 등(Gene 99, 31-37, 1991)에 기재된 우라실 DNA 글리코실라제 억제제 단백질 (UGI)과 같은 우라실 글리코실라제 억제제를 포함한다.
염기 편집기의 구성요소는 직접적으로(예를 들어, 직접 공유 결합에 의해) 또는 링커를 통해 융합될 수 있다. 예를 들어, 촉매적으로 기능상실된 뉴클레아제는 링커를 통해 데아미나제 효소 및/또는 글리코실라제 억제제에 융합될 수 있다. 다중 글리코실라제 억제제는 또한 링커를 통해 융합될 수 있다. 당업자에 의해 이해되는 바와 같이, 링커는 임의의 펩티드 또는 이의 부분을 연결하는 데 사용될 수 있다.
예시적인 링커는 중합체성 링커(예를 들어, 폴리에틸렌, 폴리에틸렌 글리콜, 폴리아미드, 폴리에스테르); 아미노산 링커; 탄소-질소 결합 아미드 링커; 환형 또는 비환형, 치환 또는 비치환, 분지형 또는 비분지형 지방족 또는 헤테로지방족 링커; 단량체성, 이량체성, 또는 중합체성 아미노알칸산 링커; 아미노알칸산(예를 들어, 글리신, 에탄산, 알라닌, β-알라닌, 3-아미노프로판산, 4-아미노부탄산, 5-펜탄산) 링커; 단량체성, 이량체성, 또는 중합체성 아미노헥산산(Ahx) 링커; 탄소환형 모이어티(예를 들어, 사이클로펜탄, 사이클로헥산) 링커; 아릴 또는 헤테로아릴 모이어티 링커; 및 페닐 고리 링커를 포함한다.
링커는 또한 펩티드에서 링커까지 친핵체(예를 들어, 티올, 아미노)의 부착을 용이하게 하는 기능화된 모이어티를 포함할 수 있다. 임의의 친전자체가 링커의 일부로 사용될 수 있다. 예시적인 친전자체는 활성화된 에스테르, 활성화된 아미드, 마이클(Michael) 수용체, 알킬 할라이드, 아릴 할라이드, 아실 할라이드, 및 이소티오시아네이트를 포함한다.
특정 구현예에서, 링커는 4-100 개의 아미노산 범위의 길이이다. 특정 구현예에서, 링커는 4 개의 아미노산, 9 개의 아미노산, 14 개의 아미노산, 16 개의 아미노산, 32 개의 아미노산, 또는 100 개의 아미노산이다.
표적화된 DNA 결합 단백질을 사이티딘 데아미나제 효소 및 DNA 글리코실라제 억제제(예를 들어, UGI)와 연결함으로써 형성된 수많은 염기-편집(BE) 시스템이 기재되었다. 이러한 복합체는 예를 들어, BE1([APOBEC1-16 아미노산(aa) 링커-Sp dCas9(D10A, H840A)] Komer 등, Nature, 533, 420-424, 2016), BE2([APOBEC1-16aa 링커-Sp dCas9(D10A, H840A)-4aa 링커-UGI] 상기 Komer 등, 2016), BE3([APOBEC1-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] 상기 Komer 등,), HF-BE3([APOBEC1-16aa 링커-HF nCas9(D10A)-4aa 링커-UGI] Rees 등, Nat. Comm un. 8, 15790, 2017), BE4, BE4max([APOBEC1-32aa 링커-Sp nCas9(D10A)-9aa 링커-UGI-9aa 링커-UGI] Koblan 등, Nat. Biotechnol 10.1038/nbt.4172, 2018; Komer 등, Sci. Adv., 3, eaao4774, 2017), BE4-GAM([Gam-16aa 링커-APOBEC1-32aa 링커-Sp nCas9(D10A)-9aa 링커-UGI-9aa 링커-UGI] 상기 Komer 등, 2017), YE1-BE3([APOBEC1(W90Y, R126E)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] Kim 등, Nat. Biotechnol. 35, 475-480, 2017), EE-BE3([APOBEC1(R126E, R132E)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017), YE2-BE3([APOBEC1(W90Y, R132E)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017), YEE-BE3([APOBEC1(W90Y, R126E, R132E)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017), VQR-BE3([APOBEC1-16aa 링커-Sp VQR nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017), VRER-BE3([APOBEC1-16aa 링커-Sp VRER nCas9(D10A)-4aa 링커-UGI] Kim 등, Nat. Biotechnol. 35, 475-480, 2017), Sa-BE3([APOBEC1-16aa 링커-Sa nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017), SA-BE4([APOBEC1-32aa 링커-Sa nCas9(D10A)-9aa 링커-UGI-9aa 링커-UGI] 상기 Komer 등, 2017), SaBE4-Gam([Gam-16aa 링커-APOBEC1-32aa 링커-Sa nCas9(D10A)-9aa 링커-UGI-9aa 링커-UGI] 상기 Komer 등, 2017), SaKKH-BE3([APOBEC1-16aa 링커-Sa KKH nCas9(D10A)-4aa 링커-UGI] 상기 Kim 등, 2017), Cas12a-BE([APOBEC1-16aa 링커-dCas12a-14aa 링커-UGI], Li 등, Nat. Biotechnol. 36, 324-327, 2018), 표적-AID([Sp nCas9(D10A)-100aa 링커-CDA1-9aa 링커-UGI] Nishida 등, Science, 353, 10.1126/science.aaf8729, 2016), 표적-AID-NG([Sp nCas9(D10A)-NG-100aa 링커-CDA1-9aa 링커-UGI] Nishimasu 등, Science, 361(6408): 1259-1262, 2018), xBE3([APOBEC1-16aa 링커-xCas9(D10A)-4aa 링커-UGI] Hu 등, Nature, 556, 57-63, 2018), eA3A-BE3([APOBEC3A(N37G)-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] Gerkhe 등, Nat. Biotechnol., 10.1038/nbt.4199, 2018), A3A-BE3([hAPOBEC3A-16aa 링커-Sp nCas9(D10A)-4aa 링커-UGI] Wang 등, Nat. Biotechnol. 10.1038/nbt.4198, 2018), 및 BE-PLUS([10X GCN4-Sp nCas9(D10A) / ScFv-rAPOBEC1-UGI] Jiang 등, Cell. Res, 10.1038/s41422-018-0052-4, 2018)를 포함한다. 아데닌 데아미나제 염기 편집기를 포함하는 BE 복합체의 추가적인 예를 위해, Rees & Liu Nat. Rev Genet. 19(12): 770-788, 2018 참조.
염기 편집기에 관한 추가적인 정보를 위해, US2018/0312825A1, WO2018/165629A, Urnov 등, Nat Rev Genet. 11(9):636-46, 2010; Joung 등, Nat Rev Mol Cell Biol. 14(1):49-55, 2013; Charpentier 등, Nature.; 495(7439):50-1, 2013; Seo & Kim, Nature Medicine, 24, 1493-1495, 2018, 및 Rees & Liu, Nature Reviews Genetics, 19, 770-78, 2018을 참조하며, 이들 각각은 그 전문이 참조로 포함되고 염기 편집기에 대해 특이적이다. 본 개시내용의 다양한 구현예에서 사용될 수 있는 특정 염기 편집기 작제물은 Zafra 등, Nat Biotech, 36(9):888-893, 2018, 및 Koblan 등, Nat Biotech 36(9):843-846, 2018에 기재되어 있으며, 이들 각각은 염기 편집기 작제물과 특이적으로 관련하여 그 전문이 본원에 참조로 포함된다.
일부 구현예에서 염기 편집기 시스템은 예를 들어, γ-글로빈의 발현을 증가시키기 위해 γ-글로빈을 암호화하는 핵산 서열을 변형시키도록 조작된다. 헤모글로빈의 주요 태아 형태인 헤모글로빈 F(HbF)는 γ-글로빈 폴리펩티드와 α-글로빈 폴리펩티드의 쌍형성에 의해 형성된다. 인간 태아 γ -글로빈 유전자(HBG1 및 HBG2; 진화적 복제에 의해 생성된 2 개의 고도로 상동성인 유전자)는 정상적으로 출생 시 침묵하는 반면, 성인 β-글로빈 유전자 발현(HBB 및 HBD)의 발현은 증가하다. 일생에 걸쳐 태아 γ-글로빈의 발현을 야기하거나 또는 허용하는 돌연변이는 β-글로빈 결칩의 표현형을 개선할 수 있다. 따라서, 태아 γ-글로빈 유전자의 재활성화는 특히 β-글로빈 결핍이 있는 대상체에서 치료적으로 유익할 수 있다. γ-글로빈의 발현을 증가시키는 다양한 돌연변이는 당업계에 알려져 있고 본원에 개시되어 있다(예를 들어, Wienert Trends in Genetics 34(12): 927-940, 2018을 참조하며, γ-글로빈의 발현을 증가시키는 돌연변이와 관련하여 이의 전문이 본원에 참조로 포함되고). 이러한 특정 돌연변이는 HBG1 프로모터 또는 HBG2 프로모터에서 발견된다.
일부 구현예에서, 벡터 또는 게놈은 페이로드가 통합 요소를 포함하고 염기 편집 시스템의 적어도 하나의 구성요소가 페이로드에 존재하지만 통합 요소의 외부(예를 들어, 트랜스포존 도립 반복부에 의해 플랭킹된 전위성 통합 요소를 포함하는 페이로드 단편의 외부 또는 상동 통합을 위한 상동성 아암을 포함하는 페이로드 단편의 외부)에 존재하는 염기 편집 시스템을 포함한다. 페이로드가 전위성 통합 요소를 포함하는 특정한 특정 구현예에서, 전위성 통합 요소가 트랜스포존 도립 반복부에 의해 플랭킹된 경우, 염기 편집 효소 및/또는 염기 편집 시스템의 하나 이상의 gRNA 중 하나 이상은 전위성 통합 요소의 외부의 위치(즉, 내부에 존재하지 않음)에서 페이로드에 존재한다(즉, 트랜스포존 도립 반복부에 의해 플랭킹된 핵산 서열에 존재하지 않음). 페이로드가 전위성 통합 요소를 포함하는 특정한 특정 구현예에서, 전위성 통합 요소가 상동성 아암에 의해 플랭킹된 경우, 염기 편집 효소 및/또는 염기 편집 시스템의 하나 이상의 gRNA 중 하나 이상은 통합 요소의 외부 위치(즉, 내부에 존재하지 않음)에서 페이로드에 존재한다(즉, 상동성 아암에 의해 플랭킹된 핵산 서열에 존재하지 않음). 이러한 시스템에서, 염기 편집 시스템의 발현 및/또는 활성은 일시적이며, 전위성 통합 요소의 해당 전위에서 벡터를 파괴하고 전위성 통합 요소의 외부에 위치한 염기 편집 시스템 구성요소 중 하나 이상의 발현을 감소시키거나 또는 종결시킬 수 있다. (예를 들어, 전위 또는 상동 재조합에 의한) 통합 요소의 통합은 염기 편집 시스템의 발현 및/또는 활성을 불활성화할 수 있기 때문에 염기 편집 시스템을 포함하는 이러한 벡터는 때때로 "자기-불활성화" 염기 편집 시스템 또는 벡터로 지칭될 수 있다. 다양한 구현예에서, 자기-불활성화 염기 편집 시스템은 조합 페이로드에 존재한다.
본 개시내용은 자기-불활성화 염기 편집 시스템 페이로드를 포함하는 아데노바이러스 벡터(예를 들어, HDAd 아데노바이러스 벡터)가 다른 염기 편집 시스템 페이로드와 비교하여 예를 들어, 유전자 요법(예를 들어, 생체내 유전자 요법)에서 증가된 절단 빈도 및/또는 형질도입 및/또는 편집된 표적 세포의 증가된 생존(예를 들어, 형질도입 HSPC의 증가된 생존)을 생성할 수 있음을 포함하며, 여기서 염기 편집 시스템은 통합 요소 내에 완전히 있거나 또는 염기 편집 시스템은 숙주 세포 게놈 내로 통합되지 않지만 발현은 벡터 파괴에 의해 불활성화되지 않는다. 염기 편집 시스템의 자기-불활성화는 염기 편집기 효소 및/또는 gRNA의 발현을 단축시키고, 편집된 세포의 생존을 증가시키고, 장기간 재증식하는 세포의 백분율을 증가시킨다, 예를 들어, HBG1 및/또는 HBG2의 재활성화를 위한 자기-불활성화 염기 편집 시스템을 포함하고 γ-글로빈의 발현을 위한 핵산 서열을 추가로 포함하는 조합 페이로드를 포함하는 HDAd 벡터를 사용한 유전자 요법은 비-불활성화 염기 편집 시스템 또는 γ-글로빈 단독의 발현을 위한 핵산 서열을 포함하는 해당 HDAd 벡터를 형질도입한 후 RBC에서 상당히 더 높은 γ-글로빈을 생성할 수 있다.
본원에는 자기-불활성화 염기 편집 시스템을 포함하는 공여자 벡터를 예를 들어, 통합 요소의 전위를 위한 트랜스포사제를 암호화하는 지지 벡터 또는 게놈과 조합하여 인간 대상체에게 투여하는 방법이 추가로 제공된다. 본 개시내용은 다양한 경우에 공여자 벡터가 지지 벡터의 투여 전에 투여되는 것을 포함하며, 여기서 공여자 벡터의 투여 및 지지 벡터의 투여 사이의 시간 기간은 염기 편집 시스템의 지속기간 및/또는 활성 수준을 조절하는 수단을 제공한다. 예를 들면, 다양한 구현예에서, 지지 벡터는 예를 들어, 공여자 벡터의 투여 후 일정 기간에 대상체에게 투여될 수 있으며 여기서 일정 기간은 적어도 1, 2, 3, 4, 5, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 30, 36, 42, 48, 54, 60, 66, 또는 72, 96, 또는 128 시간이다(예를 들어, 여기서 기간은 1, 2, 3, 4, 5, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 30, 36, 42, 48, 54, 60, 66, 또는 72 시간의 하한 및 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 30, 36, 42, 48, 54, 60, 66, 72, 96, 또는 128 시간의 상한을 갖는다).
일부 구현예에서, 염기 편집 시스템 구성요소를 암호화하는(예를 들어, 염기 편집 효소를 암호화하는) 핵산 서열은 염기 편집기 발현 및/또는 활성의 microRNA 조절을 위한 microRNA 표적 부위를 포함하도록 조작된다.
본 개시내용은 ABE 시스템의 활용 시 문제를 추가로 인식하고 해결하였다. 본 개시내용은 염기 편집기 TadA 및 TadA* 서열의 반복성 및/또는 서열 유사성이 예를 들어, 생체내 유전자 요법을 위해 암호화된 염기 편집 시스템의 발현 및/또는 활성에 대한 이러한 벡터의 효능을 감소시키는 상동 재조합을 초래하 수 있다는 인식을 포함한다. 본 발명자들이 아는 한, 본 개시내용은 예를 들어, 생체내 유전자 요법에서 관찰된 바와 같이 이 문제의 최초 인식을 나타낸다. 문제를 해결하기 위해, TadA 및/또는 TadA*를 변형시켜 유사한 서열 사이에 감소된 상동성을 달성하였다. 다양한 구현예에서, TadA 및 TadA*를 암호화하는 핵산 서열의 5 개의 상응하는 코돈은 상이한 뉴클레오티드 서열을 갖도록 조작되며, 임의적으로 여기서 조작은 TadA 또는 TadA* 뉴클레오티드 서열에서 초기 코돈 서열을 관련 시스템, 예를 들어, 인간에서 코돈 용법에 따라 동일한 아미노산을 암호화하는 상이한 코돈 서열로 대체하는 것을 포함한다. 다양한 구현예에서, 적어도 5, 10, 15, 20, 25, 30, 35, 40, 45, 또는 50 개의 코돈은 TadA 및 TadA*를 각각 암호화하는 핵산 서열 사이에서 상이하도록 조작된다. 예시적인 조작된 서열은 도 132c에 제시되어 있다.
다양한 구현예에서, ABE는 다음 TadA 및 TadA* 서열에 대해 적어도 하나의 서열 변형을 포함하는 TadA 및 TadA* 서열을 포함하며, 이는 예를 들어, ABE를 암호화하는 서열에서 링커에 의해 직접적으로 융합되거나 또는 분리될 수 있다. 다양한 구현예에서 TadA 서열은 하기 TadA 서열과 적어도 80% 동일성(예를 들어, 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성)을 갖는 서열이며 본원에 제공된 임의의 또는 모든 TadA 변형을 포함할 수 있다. 다양한 구현예에서 TadA* 서열은 하기 TadA* 서열과 적어도 80% 동일성(예를 들어, 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성)을 갖는 서열이며 본원에 제공된 임의의 또는 모든 TadA* 변형을 포함할 수 있다. 다양한 구현예에서 본 개시내용의 TadA 및/또는 TadA* 서열은 32 개의 아미노산 링커와 같은 링커를 포함하거나, 또는 포함하지 않을 수 있다. 하기 제공된 TadA 및/또는 TadA* 서열을 포함하는 것들을 포함하는 다양한 서열 및 구현예에서, 서열은 32 개의 아미노산 링커를 암호화하는 96 개의 뉴클레오티드의 3' 서열을 포함할 수 있다. 따라서, 다양한 구현예에서 TadA 서열은 하기 TadA 서열의 뉴클레오티드 1-498(96 개의 3' 뉴클레오티드 제외)과 적어도 80% 동일성(예를 들어, 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성)을 갖는 서열이며 본원에 제공된 임의의 또는 모든 상응하는 TadA 변형을 포함할 수 있다. 또한 따라서, 다양한 구현예에서 TadA* 서열은 하기 TadA* 서열의 뉴클레오티드 1-498(96 개의 3' 뉴클레오티드 제외)와 적어도 80% 동일성(예를 들어, 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성)을 갖는 서열이며 본원에 제공된 임의의 또는 모든 상응하는 TadA* 변형을 포함할 수 있다.
다양한 구현예에서, ABE의 TadA 및/또는 TadA*의 서열은 TadA 및 TadA* 사이(또는 예를 들어, 뉴클레오티드 1 내지 579 또는 1 내지 498을 포함하는 이의 정렬된 부분)의 퍼센트 동일성을 80% 미만(예를 들어, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 또는 40% 미만, 또는 60% 내지 80%, 65% 내지 80%, 70%, 내지 80%, 75% 내지 80%, 60% 내지 75%, 65% 내지 75%, 70% 내지 75%, 60% 내지 70%, 또는 65% 내지 70%인 퍼센트 동일성)으로 감소시키도록 조작된다. 다른 것에 의해 생성된 pCMV-ABEmax 플라스미드(Addgene #112095)에서, 81.6%의 동일성을 갖는 2 개의 594 bp TadA+32aa 반복부 사이에 109 bp 불일치가 있다. 다양한 본 구현예에서 TadA 및/또는 TadA* 변형을 위한 부위는 하기 서열에서 밑줄로 표시되고 하기 표에 기재된 것들을 포함한다. 다양한 구현예에서, TadA* 서열은 TadA* 변형 표(표 11)에 제시된 것들에 상응하는 하나 이상, 또는 모든 변형을 포함한다. 다양한 구현예에서, TadA 서열은 TadA 변형 표(표 10)에 제시된 하나 이상, 또는 모든 변형을 포함하고 TadA* 서열은 TadA* 변형 표(표 11)에 제시된 것들에 상응하는 하나 이상, 또는 모든 변형을 포함한다. 특정한 특정 구현예에서, TadA 서열은 TadA 변형 표(표 10; 서열번호: 280 참조)에 제시된 것들에 상응하는 0, 1, 2, 3, 4, 5, 6, 7, 8. 9. 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 또는 25 개의 변형(예를 들어, 1 내지 5, 5 내지 10, 5 내지 20, 5 내지 25, 10 내지 20, 10 내지 25, 15 내지 20, 15 내지 25, 또는 20 내지 25 개의 변형)을 포함하고 TadA* 서열은 TadA* 변형 표(표 11; 서열번호: 281 참조)에 제시된 것들에 상응하는 0, 1, 2, 3, 4, 5, 6, 7, 8. 9. 10, 11, 12, 13, 14, 15, 또는 16 개의 변형(예를 들어, 1 내지 5, 5 내지 10, 5 내지 16, 또는 10 내지 16 개의 변형)을 포함한다.
당업자가 이해하는 바와 같이, 감소된-동일성 TadA 및 TadA* 서열은 생체내 및 생체외 유전적 조작을 포함하나 이에 제한되지 않는 유전적 조작 분야에서 일반적인 유용성을 갖는다. 감소된 동일성을 갖도록 조작된 TadA 및 TadA* 서열은 또한 예를 들어, 생체내 유전자 요법을 위해 페이로드(예를 들어, 본 개시내용의 페이로드), 예를 들어, Ad35, Ad35++, HDAd35, 또는 HDAd35++ 공여자 벡터 또는 공여자 게놈과 같은 아데노바이러스 벡터 또는 게놈에 포함된다.
표 10: TadA 변형 표
Figure pct00013
표 11: TadA* 변형 표
Figure pct00014
당업자는 TadA 서열 및 TadA* 서열을 포함하는 ABE에 존재하는 TadA 변형 표 및/또는 TadA* 변형 표의 것들에 상응하는 다수의 변형이 적어도 TadA 및 TadA* 뉴클레오티드 서열 사이의 동일성 감소가 임의의 특정 변형을 필요로 하지 않지만 오히려 TadA 및 TadA* 서열 사이의 동일성의 전반적인 변화를 필요로 하는 식별된 문제에 대한 해결책인 한, 선택된 특정 변형의 고려 없이 유의할 수 있음을 추가로 이해할 것이다. 따라서, 본 개시내용은 예시적인 변형을 제공하지만, 임의의 특정 변형의 포함 또는 제외는 본원에 제시된 해결책에 중요하지 않다. 따라서 본 개시내용은 TadA 및 TadA* 변형 표에 제시된 하나 이상의 변형을 포함하고 80% 미만(예를 들어, 80%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 또는 40% 미만)인 TadA 및 TadA* 사이(또는 예를 들어, 뉴클레오티드 1 내지 579를 포함하는 이의 정렬된 부분)의 퍼센트 동일성을 갖는 TadA 및 TadA*의 감소된-동일성 서열을 포함한다.
의심의 여지를 피하기 위해, 제공된 서열은 하기 TadA 및 TadA* 서열의 상응하는 뉴클레오티드 위치에 대한 비교에 의해 본원에 제공된 임의의 TadA 또는 TadA* 서열 변형을 포함하거나 또는 포함하지 않는 것으로 식별될 수 있다. 따라서, 본원에 제공된 임의의 TadA 또는 TadA* 서열 변형의 존재 또는 부재의 결정은 임의의 제공된 서열의 기원 또는 이력에 의존하지 않고 서열 그 자체로부터 단독으로 결정될 수 있다.
당업자는 본 개시내용의 ABE 시스템, 뿐만 아니라 이의 TadA 및 TadA* 서열이 본 명세서에 제시된 본 맥락 또는 임의의 다른 맥락으로 제한되지 않는, 예를 들어, 특정 벡터, 혈청형, 또는 다른 맥락에서 사용하는 것으로 제한되지 않는 일반적인 유용성의 기여를 나타냄을 이해할 것이다. 실제로, 본 개시내용의 서열은 염기 편집 구성요소를 암호화하거나 또는 포함할 수 있는 임의의 실험 시스템에서 생체내, 시험관내, 또는 생체외에서 사용될 수 있다. 서열은 다양한 분자 생물학 적용에서 도구로서 유용하다.
I(C)(i)(c). 작은 RNA 페이로드 발현 산물
작은 RNA는 유전자 발현을 조절하는 데 있어서 역할을 하는 짧은 비-코딩 RNA 분자이다. 특정 구현예에서, 작은 RNA는 200 개 미만의 뉴클레오티드 길이이다. 특정 구현예에서, 작은 RNA는 100 개 미만의 뉴클레오티드 길이이다. 특정 구현예에서, 작은 RNA는 50, 45, 40, 35, 30, 25, 또는 20 개 미만의 뉴클레오티드 길이이다. 특정 구현예에서, 작은 RNA는 20 개 미만의 뉴클레오티드 길이이다. 다양한 구현예에서 작은 RNA는 5, 10, 15, 20, 25, 또는 30 개 뉴클레오티드의 하한 및 20, 25, 30, 35, 40, 45, 50, 75, 또는 100 개 뉴클레오티드의 상한을 갖는 길이를 갖는다. 작은 RNA는 microRNA(miRNA, Piwi-상호작용 RNA(piRNA), 작은 간섭 RNA(siRNA), 작은 핵소체 RNA(snoRNA), tRNA-유래 작은 RNA(tsRNA) 작은 rDNA-유래 RNA(srRNA), 및 작은 핵 RNA를 포함하나 이에 제한되지 않는다. 작은 RNA의 추가적인 클래스는 계속 발견되고 있다.
특정 구현예에서, 표적 mRNA에 상동성이거나 또는 간섭 RNA가 혼성화할 수 있는 간섭 RNA 분자는 RNA 간섭(RNAi)으로 지칭되는 과정인 표적 mRNA 분자의 분해 또는 표적 mRNA의 감소된 번역을 야기할 수 있다(Carthew, Curr. Opin. Cell. Biol. 13: 244-248, 2001). RNAi는 외래 RNA(예를 들어, 바이러스 RNA)를 제거하기 위해 자연적으로 세포에서 발생한다. 일부 경우에, 천연 RNAi는 분해 메커니즘을 다른 유사한 RNA 서열로 지시하는 유리 이중 가닥 RNA(dsRNA)로부터 절단된 단편을 통해 진행된다. 대안적으로, RNAi는 예를 들어, 표적 유전자의 발현을 침묵시키기 위해 제조될 수 있다. 예시적인 RNAi 분자는 작은 헤어핀 RNA(shRNA, 또한 짧은 헤어핀 RNA로도 지칭됨) 및 작은 간섭 RNA(siRNA)를 포함한다.
본 개시내용을 제한하지 않고, 이론에 의해 얽매이지 않고, 자연 및/또는 일부 구현예에서 RNA 간섭은 전형적으로 2-단계 과정이다. 첫번째 단계인 개시 단계에서, 유입 dsRNA는 아마도 dsRNA-특이적 리보뉴클레아제의 리보뉴클레아제(RNase) III 패밀리의 구성원인 Dicer의 작용에 의해 21-23 개 뉴클레오티드(nt) siRNA로 소화되며, 이는 ATP-의존적 방식으로 (직접적으로 또는 이식유전자 또는 바이러스를 통해 도입된) dsRNA를 처리한다(절단한다). 성공적인 절단 사건은 RNA를 19-21 개 염기 쌍(bp) 이중체(siRNA)로 분해하며, 각각은 2-뉴클레오티드 3' 돌출부를 갖는다(Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002; Bernstein, Nature 409:363-366, 2001).
두번째 단계인 효과기 단계에서, siRNA 이중체는 뉴클레아제 복합체에 결합되어 RNA-유도된 침묵 복합체(RISC)를 형성한다. RISC의 활성화를 위해 siRNA 이중체의 ATP-의존적 풀림이 요구된다. 그런 다음 활성 RISC는 염기 쌍형성 상호작용에 의해 상동 전사체를 표적화하고 전형적으로 mRNA를 siRNA의 3' 말단으로부터 12 개의 뉴클레오티드 단편으로 절단한다(Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002; Hammond 등, Nat. Rev. Gen. 2:110-119, 2001; Sharp, Genes. Dev. 15:485-490, 2001). 연구는 각 RISC가 단일 siRNA 및 RNase를 함유함을 나타낸다(Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002).
RNAi의 현저한 효력으로 인해, RNAi 경로 내에서 증폭 단계가 제안되었다. 증폭은 더 많은 siRNA를 생성하는 유입 dsRNA의 카피에 의해, 또는 형성된 siRNA의 복제에 의해 발생할 수 있다. 대안적으로 또는 추가적으로, 증폭은 RISC의 다중 전환 사건에 의해 실행될 수 있다(Hutvagner & Zamore, Curr. Opin. Genet. Dev. 12: 225-232, 2002; Hammond 등, Nat. Rev. Gen. 2:110-119, 2001; Sharp, Genes. Dev. 15:485-490, 2001). 또한 RNAi는 Tuschl(Chem. Biochem. 2: 239-245, 2001); Cullen(Nat. Immunol. 3:597-599, 2002); 및 Brantl(Biochem. Biophys. Act. 1575:15-25, 2002)에 기재되어 있다.
일부 구현예에서, 본 개시내용과 함께 사용하기에 적합한 RNAi 분자의 합성은 다음과 같이 수행될 수 있다. 첫째로, mRNA 서열은 표적화된 이식유전자의 시작 코돈의 하류에서 스캐닝될 수 있다. 각 AA 및 3' 인접 19 개 뉴클레오티드의 발생은 잠재적인 siRNA 표적 부위로서 기록된다. 특정 구현예에서, siRNA 표적 부위는 비번역된 영역(UTR)이 조절 단백질 결합 부위에 더 풍부할 때, 오픈 리딩 프레임으로부터 선택될 수 있다. UTR-결합 단백질 및/또는 번역 개시 복합체는 siRNA 엔도뉴클레아제 복합체의 결합을 방해할 수 있다(Tuschl, Chem. Biochem. 2: 239-245, 2001). 비번역된 영역에서 지시된 siRNA는 또한 글리세르알데하이드 3-포스페이트 데하이드로게나제(GAPDH)에 대해 입증된 바와 같이, 효과적일 수 있음이 이해될 것이며, 여기서5' UTR에서 지시된 siRNA는 세포 GAPDH mRNA에서 90% 감소를 매개하고 단백질 수준을 완전히 폐지하였다. 둘째로, 잠재적인 표적 부위는 미국 국립생물공학정보센터(National Center for Biotechnology Information)(NCBI) 서버에서 이용가능한 Basic Local Alignment Search Tool(BLAST) 소프트웨어와 같은 임의의 서열 정렬 소프트웨어를 사용하여 적절한 게놈 데이터베이스와 비교될 수 있다. 다른 코딩 서열과 상당한 상동성을 나타내는 추정 표적 부위가 필터링될 수 있다.
적격한 표적 서열이 siRNA 합성을 위한 주형으로 선택될 수 있다. 선택된 서열은 G/C 함량이 55% 초과인 것과 비교하여 유전자 침묵을 매개하는 데 더 효과적인 것으로 제시되었을 때 G/C 함량이 낮은 것들을 포함할 수 있다. 여러 표적 부위가 평가를 위한 표적 유전자의 길이에 따라 선택될 수 있다. 선택된 siRNA의 더 나은 평가를 위해, 음성 대조군이 사용될 수 있다. 음성 대조군 siRNA는 siRNA와 동일한 뉴클레오티드 조성물을 포함할 수 있지만 게놈에 대한 상동성이 상당히 결여되어 있다. 따라서, 다른 유전자와 임의의 상당한 상동성을 나타내지 않으면, siRNA의 스크램블된 뉴클레오티드 서열이 사용될 수 있다.
센스 가닥은 선택된 부분의 서열을 기반으로 설계될 수 있다. 안티센스 가닥은 일상적으로 센스 가닥과 동일한 길이이며 상보적 뉴클레오티드를 포함한다. 특정 구현예에서, 가닥은 정렬되거나 또는 어닐링될 때 완전히 상보적이고 말단이 뭉툭해진다. 다른 구현예에서, 가닥은 1-, 2- 또는 3-뉴클레오티드 돌출부가 생성되도록, 즉, 센스 가닥의 3' 단부가 안티센스 가닥의 5' 단부보다 1, 2 또는 3 개의 뉴클레오티드를 추가로 확장하고/하거나 안티센스 가닥의 3' 단부가 센스 가닥의 5' 단부보다 1, 2 또는 3 개의 뉴클레오티드를 추가로 확장하도록 정렬 또는 어닐링된다. 돌출부는 표적 유전자 서열(또는 이의 보체)에 상응하는 뉴클레오티드를 포함할 수 있다. 대안적으로, 돌출부는 데옥시리보뉴클레오티드, 예를 들어 데옥시티민(dT), 또는 뉴클레오티드 유사체, 또는 다른 적합한 비-뉴클레오티드 물질을 포함할 수 있다.
안티센스 가닥의 RISC로의 진입을 용이하게 하기 위해(따라서 표적 절단 및 침묵의 효율을 증가시키거나 또는 개선하기 위해), 센스 가닥의 5' 단부 및 안티센스 가닥의 3' 단부 사이의 염기 쌍 강도는 변경, 예를 들어, 줄어들거나 또는 감소될 수 있다. 특정 구현예에서, 염기 쌍 강도는 제1 또는 안티센스 가닥의 3' 단부 및 제2 또는 센스 가닥의 5' 단부 사이 보다 제1 또는 안티센스 가닥의 5' 단부 및 제2 또는 센스 가닥의 3' 단부 사이의 더 적은 G:C 염기 쌍으로 인해 더 적다. 특정 구현예에서, 염기 쌍 강도는 제1 또는 안티센스 가닥의 5' 단부 및 제2 또는 센스 가닥의 3' 단부 사이의 적어도 하나의 불일치된 염기 쌍으로 인해 더 적다. 바람직하게는, 불일치된 염기 쌍은 G:A, C:A, C:U, G:G, A:A, C:C 및 U:U를 포함하는 군으로부터 선택된다. 또 다른 구현예에서, 염기 쌍 강도는 제1 또는 안티센스 가닥의 5' 단부 및 제2 또는 센스 가닥의 3' 단부 사이의 적어도 하나의 워블(wobble) 염기 쌍, 예를 들어, G:U로 인해 더 적다. 또 다른 구현예에서, 염기 쌍 강도는 드문 뉴클레오티드, 예를 들어, 이노신(I)을 포함하는 적어도 하나의 염기 쌍으로 인해 더 적다. 특정 구현예에서, 염기 쌍은 I:A, I:U 및 I:C를 포함하는 군으로부터 선택된다. 또한 또 다른 구현예에서, 염기 쌍 강도는 변형된 뉴클레오티드를 포함하는 적어도 하나의 염기 쌍으로 인해 더 적다. 특정 구현예에서, 변형된 뉴클레오티드는 예를 들어, 2-아미노-G, 2-아미노-A, 2,6-디아미노-G, 및 2,6-디아미노-A로부터 선택된다.
ShRNA는 헤어핀 루프 구조를 갖는 단일-가닥 폴리뉴클레오티드이다. 단일-가닥 폴리뉴클레오티드는 이중-가닥 영역에서 하나의 가닥의 3' 단부 및 이중-가닥 영역에서 다른 가닥의 5' 단부를 연결하는 루프 분절을 갖는다. 이중-가닥 영역은 표적 서열에 혼성화가능한 제1 서열, 예컨대 이식유전자를 암호화하는 폴리뉴클레오티드, 및 제1 서열에 상보적인 제2 서열로부터 형성되며, 따라서 제1 및 제2 서열은 연결 서열이 단부를 연결하여 헤어핀 루프 구조를 형성하는 이중 가닥 영역을 형성한다. 제1 서열은 이식유전자를 암호화는 폴리뉴클레오티드의 임의의 부분에 혼성화가능할 수 있다. shRNA의 이중 가닥 줄기 도메인은 제한 엔도뉴클레아제 부위를 포함할 수 있다.
shRNA의 전사는 폴리머라제 III(Pol III) 프로모터에서 개시되어 4-5-티민 전사 종결 부위의 위치 2에서 종결되는 것으로 생각된다. 발현 시, shRNA는 3' UU-돌출부가 있는 줄기-루프 구조로 접히는 것으로 생각되며; 후속적으로, 이러한 shRNA의 단부가 처리되어, shRNA를 21-23 개 뉴클레오티드의 siRNA-유사 분자로 전환시킨다(Brummelkamp 등, Science. 296(5567):550-553, 2002; Lee 등, Nature Biotechnol. 20(5):500-505, 2002; Miyagishi & Taira, Nature Biotechnol. 20(5):497-500, 2002; Paddison 등, Genes & Dev. 16(8): 948-958, 2002; Paul 등, Nature Biotechnol. 20(5):505-508, 2002; Sui, Proc. Natl. Acad. Sci. USA. 99(6):5515-5520, 2002; Yu 등, Proc. Natl. Acad. Sci. USA. 99(9):6047-6052, 2002).
shRNA의 줄기-루프 구조는 임의적인 뉴클레오티드 돌출부, 예컨대 2-bp 돌출부, 예를 들어, 3' UU 돌출부를 가질 수 있다. 변경이 있을 수 있지만, 줄기는 전형적으로 15 내지 49, 15 내지 35, 19 내지 35, 21 내지 31 bp, 또는 21 내지 29 bp 범위이고, 루프는 4 내지 30 bp, 예를 들어, 4 내지 23 bp 범위일 수 있다. 특정 구현예에서, shRNA 서열은 45-65 bp; 50-60 bp; 또는 51, 52, 53, 54, 55, 56, 57, 58, 또는 59 bp를 포함한다. 특정 구현예에서, shRNA 서열은 52 또는 55 bp를 포함한다. 특정 구현예에서 siRNA는 15-25 bp를 갖는다. 특정 구현예에서 siRNA는 16, 17, 18, 19, 20, 21, 22, 23, 또는 24 bp를 갖는다. 특정 구현예에서 siRNA는 19 bp를 갖는다. 그러나, 당업자는 16 개 미만의 뉴클레오티드 또는 24 개 초과의 뉴클레오티드 길이를 갖는 siRNA가 또한 RNAi를 매개하는 기능을 할 수 있음을 이해할 것이다. 더 긴 RNAi 제제는 바람직하지 않을 수 있는 특정 포유류 세포에서 인터페론 또는 단백질 키나제 R(PKR) 반응을 도출하는 것으로 입증되었다. 바람직하게는 RNAi 제제는 PKR 반응을 도출하지 않는다(즉, 충분히 짧은 길이의 것이다). 그러나, 더 긴 RNAi 제제는 예를 들어, PKR 반응이 대체 수단에 의해 하향조절되거나 또는 약화되는 상황에서 유용할 수 있다.
작은 RNA가 또한 유전자 발현을 활성화하는 데 사용될 수 있다.
I(C)(i)(d). 조합 페이로드
본 개시내용은 복수의 발현 산물을 암호화하는 페이로드를 포함하는 아데노바이러스 벡터 및 게놈을 포함한다. 복수의 발현 산물을 암호화하는 페이로드는 조합 페이로드로 지칭될 수 있다. 다양한 구현예에서, 조합 페이로드는 제1 발현 산물을 암호화하는 제1 핵산 서열 및 제2 발현 산물을 암호화하는 제2 핵산 서열을 포함할 수 있다. 다양한 구현예에서, 제1 및 제2 발현 산물 각각은 예를 들어, 본원에 개시된 바와 같은 단백질(예를 들어, 치료 단백질, 예를 들어, 대체 효소), 결합 도메인, 항체, CAR, TCR, CRISPR 시스템, 염기 편집기 시스템, 작은 RNA, 및/또는 선택가능한 마커 중 임의의 것으로부터 독립적으로 선택될 수 있다, 예시적인 조합 페이로드가 본원에 개시되어 있다.
당업자는 코딩 서열이 본원에 제공되거나 또는 달리 당업계에 알려진 다양한 프로모터 및/또는 다른 조절 서열 중 임의의 것과의 작동가능한 연결에 의해 제어되고/되거나 발현될 수 있음을 이해할 것이다. 당업자가 인식하고, 본 개시내용에 예시된 바와 같이, 벡터에서 코딩 서열을 제어 및/또는 발현하는 데 이용가능한 서열은 당업계에 알려져 있고 본원에 제공된 것들을 포함한다. 다양한 특정 예에서, 본 개시내용의 페이로드에 존재하는 코딩 서열은 임의적으로 프로모터, 인핸서, 종결 영역, 절연체, 미니-LCR, 종결 신호, 폴리아데닐화 신호, 스플라이싱 신호 등으로부터 선택된 하나 이상의 조절 서열과 작동가능하게 연결될 수 있다.
일부 구현예에서, 조합 페이로드는 CRISPR-연관 RNA-가이드된 엔도뉴클레아제 및 적어도 하나의 가이드 RNA(gRNA)를 포함하는 CRISPR 시스템의 하나 이상, 또는 모든 구성요소를 암호화하며, 임의적으로 여기서 적어도 하나의 gRNA는 1, 2, 3, 4, 또는 5 개의 gRNA, 및 임의적으로 CRISPR 시스템의 부분이 아닌 하나 이상의 추가의 코딩 서열을 포함한다. 예를 들어, CRISPR 시스템의 gRNA는 HBG1 프로모터의 핵산 서열을 표적화하는 gRNA, HBG2 프로모터의 핵산 서열을 표적화하는 gRNA, 및/또는 적혈구 인핸서 bcl11a의 핵산 서열을 표적화하는 gRNA 중 하나 이상, 또는 전부를 포함할 수 있다. 다양한 구현예에서, (i) HBG1 프로모터-표적화된 gRNA는 HBG1 프로모터에서 BCL11A 억제인자 단백질 결합 부위의 불활성화에 의해 HBG1 프로모터에 작동가능하게 연결된 γ-글로빈 코딩 서열의 발현을 증가시키도록 설계되고/되거나, (ii) HBG2 프로모터-표적화된 gRNA는 HBG2 프로모터에서 BCL11A 억제인자 단백질 결합의 불활성화에 의해 HBG2 프로모터에 작동가능하게 연결된 γ-글로빈 코딩 서열의 발현을 증가시키도록 설계되고/되거나, (iii) bcl11a-표적화된 gRNA는 bcl11a 인핸서에 작동가능하게 연결된 γ-글로빈 코딩 서열의 발현을 증가시키도록 설계되며, 여기서 적혈구 bcl11a 인핸서의 변형 및/또는 불활성화는 적혈구 세포에서 감소된 BCL11A 억제인자 단백질 발현을 초래한다. 다양한 구현예에서, CRISPR 시스템을 포함하는 조합 페이로드는 치료 단백질을 암호화하는 핵산을 추가로 포함하며, 임의적으로 여기서 치료 단백질은 γ-글로빈 및 β-글로빈 중 하나 이상으로부터 선택된다. 일부 구현예에서, 치료 단백질은 β-글로빈 프로모터 및/또는 β-글로빈 LCR과 작동가능하게 연결된다.
일부 구현예에서, 조합 페이로드는 염기 편집 효소 및 적어도 하나의 가이드 RNA(gRNA)를 포함하는 염기 편집기 시스템 중 하나 이상, 또는 모든 구성요소를 암호화하며, 임의적으로 여기서 적어도 하나의 gRNA는 1, 2, 3, 4, 또는 5 개의 gRNA, 및 임의적으로 염기 편집기 시스템의 부분이 아닌 하나 이상의 추가의 코딩 서열을 포함한다. 예를 들어, 염기 편집기 시스템의 gRNA는 HBG1 프로모터의 핵산 서열을 표적화하는 gRNA, HBG2 프로모터의 핵산 서열을 표적화하는 gRNA, 및/또는 적혈구 인핸서 bcl11a의 핵산 서열을 표적화하는 gRNA 중 하나 이상, 또는 전부를 포함할 수 있다. 다양한 구현예에서, (i) HBG1 프로모터-표적화된 gRNA는 HBG1 프로모터에서 BCL11A 억제인자 단백질 결합 부위의 불활성화에 의해 HBG1 프로모터에 작동가능하게 연결된 γ-글로빈 코딩 서열의 발현을 증가시키도록 설계되고/되거나, (ii) HBG2 프로모터-표적화된 gRNA는 HBG2 프로모터에서 BCL11A 억제인자 단백질 결합 부위의 불활성화에 의해 HBG2 프로모터에 작동가능하게 연결된 γ-글로빈 코딩 서열의 발현을 증가시키도록 설계되고/되거나, (iii) bcl11a-표적화된 gRNA는 bcl11a 인핸서에 작동가능하게 연결된 γ-글로빈 코딩 서열의 발현을 증가시키도록 설계되며, 여기서 적혈구 bcl11a 인핸서의 변형 및/또는 불활성화는 적혈구 세포에서 감소된 BCL11A 억제인자 단백질 발현을 초래한다. 다양한 구현예에서, 염기 편집기 시스템을 포함하는 조합 페이로드는 치료 단백질을 암호화하는 핵산을 추가로 포함하며, 임의적으로 여기서 치료 단백질은 γ-글로빈 및 β-글로빈 중 하나 이상으로부터 선택된다. 일부 구현예에서, 치료 단백질은 β-글로빈 프로모터 및/또는 β-글로빈 LCR과 작동가능하게 연결된다.
일부 구현예에서, 조합 페이로드는 항체를 암호화하는 핵산 서열을 포함한다. 일부 구현예에서 조합 페이로드는 제1 항체를 암호화하는 제1 핵산 서열 및 제2 항체를 암호화하는 제2 핵산 서열을 포함한다. 일부 구현예에서, 항체(예를 들어, 제1 및/또는 제2 항체)는 scFv이다. 일부 구현예에서 항체는 면역글로불린 중쇄 및 면역글로불린 경쇄를 포함하는 항체이다.
다양한 구현예에서, 조합 페이로드의 페이로드 핵산 서열에 의해 암호화된 적어도 하나의 발현 산물은 선택가능한 마커이다. 다양한 구현예에서, 선택가능한 마커는 MGMTP140K이다.
예시적인 Ad35 페이로드 및 시스템은 다음을 포함한다:
(i) 다양한 구현예에서, Ad35 페이로드는 SB100x에 의한 전위를 위해 트랜스포사제 도립 반복부에 의해 플랭킹된 통합 요소를 포함하고, 트랜스포사제 도립 반복부는 FLPe와 같은 FLP 재조합효소에 의한 재조합을 위해 frt 지시 반복부에 의해 플랭킹된다. 다양한 구현예에서, 통합 요소는 임의적으로 5'에서 3'으로, (a) β-글로빈 미니-LCR, (b) γ-글로빈 코딩 서열이 3'UTR(예를 들어, γ-글로빈 3'UTR)과 작동가능하게 연결된 인간 γ-글로빈 코딩 서열과 작동가능하게 연결된 β-글로빈 프로모터를 포함하며, 여기서 β-글로빈 미니-LCR이 또한 γ-글로빈 코딩 서열과 작동가능하게 연결되는 유전자 (c) cHS4 절연체 서열, 및 (d) MGMTP140K 코딩 서열, 2A 자기-절단 펩티드, GFP 형광 마커 코딩 서열, 및 폴리아데닐화 신호와 작동가능하게 연결된 PGK 프로모터와 같은 프로모터를 포함하는 유전자를 포함하며, 임의적으로 여기서 (a)-(d) 중 임의의 것은 Ad35 페이로드의 2 개의 가닥 중 어느 한 가닥 상에서 5'에서 3' 방향으로 암호화될 수 있다.
다양한 구현예에서, Ad35 페이로드는 통합 요소의 외부 및 재조합효소 부위의 외부에, CRISPR 시스템을 암호화하는 핵산 서열을 추가로 포함한다. 특정한 특정 구현예에서, CRISPR 시스템을 암호화하는 핵산 서열은 임의적으로 5'에서 3'으로, (a) 제1 gRNA가 bcl11a 인핸서를 표적화하는 제1 gRNA-암호화 서열과 작동가능하게 연결된 제1 U6 프로모터를 포함하는 제1 gRNA 유전자, (b) 제2 gRNA가 HBG 프로모터를 표적화하는 제2 gRNA-암호화 서열과 작동가능하게 연결된 제2 U6 프로모터를 포함하는 제2 gRNA 유전자, 및 (c) CRISPR/Cas9 코딩 서열에 작동가능하게 연결된 EF1α 프로모터와 같은 프로모터를 포함하는 CRISPR 효소 유전자를 포함하며, 여기서 CRISPR/Cas9 코딩 서열은 3'UTR/miR 서열 및 폴리아데닐화 신호와 작동가능하게 연결된다. 다양한 구현예에서, CRISPR 시스템은 HBG 프로모터의 적혈구 bcl11a 인핸서 및 BCL11A 결합 부위를 표적화하며, 각각은 γ-글로빈 활성화 또는 재활성화를 야기하는 데 기여한다. 본원에 개시된 바와 같이, CRISPR 시스템은 전위에 의한 공여자 벡터의 절단이 비-통합된 공여자 벡터 핵산의 분해를 초래한다는 점에서 자기-불활성화될 수 있다. 다양한 구현예에서, miR 서열은 HDAd35 공여자 벡터 생산 동안 생산자 세포에서 Cas9 발현을 억제하는 서열일 수 있다(예를 들어, Saydaminova 등, Mol. Ther. Meth. Clin. Dev. 1: 14057, 2015; Li 등, Mol. Ther. Meth. Clin. Dev. 9: 390-401, 2018 참조).
다양한 구현예에서, 본 개시내용의 Ad35 시스템은 Ad35 지지 벡터를 추가로 포함하며, 여기서 지지 벡터는 임의적으로 5'에서 3'으로, (a) FLPe 재조합효소 코딩 서열에 작동가능하게 연결된 EF1α 프로모터를 포함하는 재조합 유전자, 및 (b) SB100x 트랜스포사제 코딩 서열과 작동가능하게 연결된 PGK 프로모터를 포함하는 트랜스포사제 유전자를 포함한다.
다양한 구현예에서 Ad35 페이로드는 Ad35 공여자 벡터 게놈에 존재한다. 다양한 구현예에서 Ad35 공여자 벡터 게놈에 존재하는 Ad35 페이로드는 Ad35 ITR에 의해 플랭킹된다. 다양한 구현예에서, Ad35 공여자 벡터 게놈은 Ad35 공여자 벡터에 존재한다. 다양한 구현예에서, 공여자 벡터는 Ad35 ++ 벡터이다.
다양한 구현예에서 지지 게놈은 Ad35 ITR을 포함한다. 다양한 구현예에서, 지지 게놈은 Ad35 벡터에 존재한다. 다양한 구현예에서, 지지 벡터는 Ad35 ++ 벡터이다.
다양한 구현예에서, Ad35 공여자 벡터는 헬퍼 의존적 공여자 벡터(HDAd35)이다. 이러한 특정 구현예에서, 본 개시내용의 시스템은 HDAd35 공여자 벡터 또는 게놈, 및 Ad35 헬퍼 벡터 또는 게놈을 포함할 수 있고, 다양한 구현예에서 Ad35 지지 벡터를 추가로 포함할 수 있다.
특정 예시적인 구현예는 도 164에 예시되어 있다.
(ii) 다양한 구현예에서, Ad35 페이로드는 표적 세포 게놈과 적어도 80% 동일성(예를 들어, 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%< 또는 100% 동일성)을 갖는, 상동성 아암(예를 들어, 1.8 kb 상동성 아암)에 의해 플랭킹된 통합 요소를 포함한다. 다양한 구현예에서, 통합 요소는 임의적으로 5'에서 3'으로, (a) HS1, HS2, HS3, 및 HS4를 포함하나, HS5를 포함하지 않는 β-글로빈 미니-LCR, (b) γ-글로빈 3'UTR과 작동가능하게 연결된 γ-글로빈 코딩 서열과 작동가능하게 연결된 β-글로빈 프로모터를 포함하며, 여기서 β-글로빈 미니-LCR이 또한 γ-글로빈 코딩 서열에 작동가능하게 연결되는 유전자 (c) cHS4 절연체 서열, 및 (d) 폴리아데닐화 신호와 작동가능하게 연결된 MGMTP140K 코딩 서열과 작동가능하게 연결된 PGK 프로모터를 포함하는 유전자를 포함하며, 임의적으로 여기서 (a)-(d) 중 임의의 것은 Ad35 페이로드의 2 개의 가닥 중 어느 한 가닥 상에서 5'에서 3' 방향으로 암호화될 수 있다.
다양한 구현예에서, Ad35 페이로드는 통합 요소의 외부 및 재조합효소 부위의 외부에, CRISPR 시스템을 암호화하는 핵산 서열을 추가로 포함한다. 특정한 특정 구현예에서, CRISPR 시스템을 암호화하는 핵산 서열은 임의적으로 5'에서 3'으로, (a) sgRNA가 HBG2 프로모터를 표적화하는 sgRNA-암호화 서열과 작동가능하게 연결된 U6 프로모터를 포함하는 sgRNA 유전자, 및 (b) miR 부위, β-글로빈 3'UTR 서열, 및 폴리아데닐화 신호와 작동가능하게 연결된 spCas9 코딩 서열과 작동가능하게 연결된 EF1α 프로모터를 포함하는 CRISPR 효소 유전자를 포함한다. 다양한 구현예에서, CRISPR 시스템은 HBG 프로모터의 BCL11A 결합 부위를 표적화하고 γ-글로빈 활성화 또는 재활성화를 야기할 수 있다. 본원에 개시된 바와 같이, CRISPR 시스템은 AAVS1 CRISPR에 의한 공여자 벡터의 절단이 비-통합된 공여자 벡터 핵산의 분해를 초래한다는 점에서 자기-불활성화될 수 있다. 다양한 구현예에서, miR 서열은 HDAd35 공여자 벡터 생산 동안 생산자 세포에서 Cas9 발현을 억제하는 서열일 수 있다(예를 들어, Saydaminova 등, Mol. Ther. Meth. Clin. Dev. 1: 14057, 2015; Li 등, Mol. Ther. Meth. Clin. Dev. 9: 390-401, 2018 참조).
다양한 구현예에서, 본 개시내용의 Ad35 시스템은 Ad35 지지 벡터를 추가로 포함하며, 여기서 지지 벡터는 임의적으로 5'에서 3'으로, sgAAVS1-rm 코딩 서열에 작동가능하게 연결된 U6 프로모터를 포함한다.
다양한 구현예에서 Ad35 페이로드는 Ad35 공여자 벡터 게놈에 존재한다. 다양한 구현예에서 Ad35 공여자 벡터 게놈에 존재하는 Ad35 페이로드는 Ad35 ITR에 의해 플랭킹된다. 다양한 구현예에서, Ad35 공여자 벡터 게놈은 Ad35 공여자 벡터에 존재한다. 다양한 구현예에서, 공여자 벡터는 Ad35 ++ 벡터이다.
다양한 구현예에서 지지 게놈은 Ad35 ITR을 포함한다. 다양한 구현예에서, 지지 게놈은 Ad35 벡터에 존재한다. 다양한 구현예에서, 지지 벡터는 Ad35 ++ 벡터이다.
다양한 구현예에서, Ad35 공여자 벡터는 헬퍼 의존적 공여자 벡터(HDAd35)이다. 이러한 특정 구현예에서, 본 개시내용의 시스템은 HDAd35 공여자 벡터 또는 게놈, 및 Ad35 헬퍼 벡터 또는 게놈을 포함할 수 있고, 다양한 구현예에서 Ad35 지지 벡터를 추가로 포함할 수 있다.
특정 예시적인 구현예는 도 165에 예시되어 있다.
(iii) 다양한 구현예에서, Ad35 페이로드는 SB100x에 의한 전위를 위해 트랜스포사제 도립 반복부에 의해 플랭킹된 통합 요소를 포함하고, 트랜스포사제 도립 반복부는 FLPe와 같은 FLP 재조합효소에 의한 재조합을 위해 frt 지시 반복부에 의해 플랭킹된다. 다양한 구현예에서, 통합 요소는 임의적으로 5'에서 3'으로, (a) β-글로빈 미니-LCR, (b) γ-글로빈 코딩 서열이 3'UTR(예를 들어, γ-글로빈 3'UTR)과 작동가능하게 연결된 레서스 γ-글로빈 코딩 서열과 작동가능하게 연결된 β-글로빈 프로모터를 포함하며, 여기서, β-글로빈 미니-LCR이 또한 γ-글로빈 코딩 서열과 작동가능하게 연결되는 유전자 (c) cHS4 절연체 서열, 및 (d) 폴리아데닐화 신호와 작동가능하게 연결된 MGMTP140K 코딩 서열과 작동가능하게 연결된 PGK 프로모터를 포함하는 유전자를 포함하며, 임의적으로 여기서 (a)-(d) 중 임의의 것은 Ad35 페이로드의 2 개의 가닥 중 어느 한 가닥 상에서 5'에서 3' 방향으로 암호화될 수 있다.
다양한 구현예에서, Ad35 페이로드는 통합 요소의 외부 및 재조합효소 부위의 외부에, CRISPR 시스템을 암호화하는 핵산 서열을 추가로 포함한다. 특정한 특정 구현예에서, CRISPR 시스템을 암호화하는 핵산 서열은 임의적으로 5'에서 3'으로, (a) gRNA가 HBG 프로모터를 포함하는 gRNA-암호화 서열과 작동가능하게 연결된 U6 프로모터를 포함하는 gRNA 유전자, 및 (b) 3'UTR/miR 서열 및 폴리아데닐화 신호와 작동가능하게 연결된 CRISPR/Cas9 코딩 서열과 작동가능하게 연결된 EF1α 프로모터를 포함하는 CRISPR 효소 유전자를 포함한다. 다양한 구현예에서, CRISPR 시스템은 HBG 프로모터의 BCL11A 결합 부위를 표적화하여, γ-글로빈 활성화 또는 재활성화를 초래할 수 있다. 본원에 개시된 바와 같이, CRISPR 시스템은 전위에 의한 공여자 벡터의 절단이 비-통합된 공여자 벡터 핵산의 분해를 초래한다는 점에서 자기-불활성화될 수 있다. 다양한 구현예에서, miR 서열은 HDAd35 공여자 벡터 생산 동안 생산자 세포에서 Cas9 발현을 억제하는 서열일 수 있다(예를 들어, Saydaminova 등, Mol. Ther. Meth. Clin. Dev. 1: 14057, 2015; Li 등, Mol. Ther. Meth. Clin. Dev. 9: 390-401, 2018 참조).
다양한 구현예에서, 본 개시내용의 Ad35 시스템은 Ad35 지지 벡터를 추가로 포함하며, 여기서 지지 벡터는 임의적으로 5'에서 3'으로, (a) FLPe 재조합효소 코딩 서열과 작동가능하게 연결된 EF1α 프로모터를 포함하는 재조합 유전자, 및 (b) SB100x 트랜스포사제 코딩 서열과 작동가능하게 연결된 PGK 프로모터를 포함하는 트랜스포사제 유전자를 포함한다.
다양한 구현예에서 Ad35 페이로드는 Ad35 공여자 벡터 게놈에 존재한다. 다양한 구현예에서 Ad35 공여자 벡터 게놈에 존재하는 Ad35 페이로드는 A3d5 ITR에 의해 플랭킹된다. 다양한 구현예에서, Ad35 공여자 벡터 게놈은 Ad35 공여자 벡터에 존재한다. 다양한 구현예에서, 공여자 벡터는 Ad35 ++ 벡터이다.
다양한 구현예에서 지지 게놈은 Ad35 ITR을 포함한다. 다양한 구현예에서, 지지 게놈은 Ad35 벡터에 존재한다. 다양한 구현예에서, 지지 벡터는 Ad35 ++ 벡터이다.
다양한 구현예에서, Ad35 공여자 벡터는 헬퍼 의존적 공여자 벡터(HDAd35)이다. 이러한 특정 구현예에서, 본 개시내용의 시스템은 HDAd35 공여자 벡터 또는 게놈, 및 Ad35 헬퍼 벡터 또는 게놈을 포함할 수 있고, 다양한 구현예에서 Ad35 지지 벡터를 추가로 포함할 수 있다.
특정 예시적인 구현예는 도 166에 예시되어 있다.
(iv) 다양한 구현예에서, Ad35 페이로드는 SB100x에 의한 전위를 위해 트랜스포사제 도립 반복부에 의해 플랭킹된 통합 요소를 포함하고, 트랜스포사제 도립 반복부는 FLPe와 같은 FLP 재조합효소에 의한 재조합을 위해 frt 지시 반복부에 의해 플랭킹된다. 다양한 구현예에서, 통합 요소는 임의적으로 5'에서 3'으로, (a) β-글로빈 미니-LCR, (b) γ-글로빈 코딩 서열이 3'UTR(예를 들어, γ-글로빈 3'UTR)과 작동가능하게 연결된 인간 γ-글로빈 코딩 서열과 작동가능하게 연결된 β-글로빈 프로모터를 포함하며, 여기서 β-글로빈 미니-LCR이 또한 γ-글로빈 코딩 서열과 작동가능하게 연결되는 유전자 (c) cHS4 절연체 서열, 및 (d) MGMTP140K 코딩 서열, 2A 자기-절단 펩티드, GFP 형광 마커 코딩 서열, 및 폴리아데닐화 신호와 작동가능하게 연결된 PGK 프로모터와 같은 프로모터를 포함하는 유전자를 포함하며, 임의적으로 여기서 (a)-(d) 중 임의의 것은 Ad35 페이로드의 2 개의 가닥 중 어느 한 가닥 상에서 5'에서 3' 방향으로 암호화될 수 있다.
다양한 구현예에서, Ad35 페이로드는 통합 요소의 외부 및 재조합효소 부위의 외부에, 염기 편집 시스템을 암호화하는 핵산 서열을 추가로 포함한다. 특정한 특정 구현예에서, 염기 편집 시스템을 암호화하는 핵산 서열은 임의적으로 5'에서 3'으로, (a) 제1 gRNA가 bcl11a 인핸서를 표적화하는 제1 gRNA-암호화 서열과 작동가능하게 연결된 제1 U6 프로모터를 포함하는 제1 gRNA 유전자, (b) 제2 gRNA가 HBG 프로모터를 표적화하는 제2 gRNA-암호화 서열과 작동가능하게 연결된 제2 U6 프로모터를 포함하는 제2 gRNA 유전자, 및 (c) 3'UTR/miR 서열 및 폴리아데닐화 신호와 작동가능하게 연결된 염기 편집 효소 코딩 서열과 작동가능하게 연결된 EF1α 프로모터와 같은 프로모터를 포함하는 염기 편집 효소 유전자를 포함한다. 다양한 구현예에서, 염기 편집 시스템은 HBG 프로모터의 적혈구 bcl11a 인핸서 및 BCL11A 결합 부위를 표적화하며, 각각은 γ-글로빈 활성화 또는 재활성화를 야기하는 데 기여한다. 본원에 개시된 바와 같이, 염기 편집 시스템은 전위에 의한 공여자 벡터의 절단이 비-통합된 공여자 벡터 핵산의 분해를 초래한다는 점에서 자기-불활성화될 수 있다. 다양한 구현예에서, miR 서열은 HDAd35 공여자 벡터 생산 동안 생산자 세포에서 Cas9 발현을 억제하는 서열일 수 있다(예를 들어, Saydaminova 등, Mol. Ther. Meth. Clin. Dev. 1: 14057, 2015; Li 등, Mol. Ther. Meth. Clin. Dev. 9: 390-401, 2018 참조).
다양한 구현예에서, 본 개시내용의 Ad35 시스템은 Ad35 지지 벡터를 추가로 포함하며, 여기서 지지 벡터는 임의적으로 5'에서 3'으로, (a) FLPe 재조합효소 코딩 서열과 작동가능하게 연결된 EF1α 프로모터를 포함하는 재조합 유전자, 및 (b) SB100x 트랜스포사제 코딩 서열과 작동가능하게 연결된 PGK 프로모터를 포함하는 트랜스포사제 유전자를 포함한다.
다양한 구현예에서 Ad35 페이로드는 Ad35 공여자 벡터 게놈에 존재한다. 다양한 구현예에서 Ad35 공여자 벡터 게놈에 존재하는 Ad35 페이로드는 Ad35 ITR에 의해 플랭킹된다. 다양한 구현예에서, Ad35 공여자 벡터 게놈은 Ad35 공여자 벡터에 존재한다. 다양한 구현예에서, 공여자 벡터는 Ad35 ++ 벡터이다.
다양한 구현예에서 지지 게놈은 Ad35 ITR을 포함한다. 다양한 구현예에서, 지지 게놈은 Ad35 벡터에 존재한다. 다양한 구현예에서, 지지 벡터는 Ad35 ++ 벡터이다.
다양한 구현예에서, Ad35 공여자 벡터는 헬퍼 의존적 공여자 벡터(HDAd35)이다. 이러한 특정 구현예에서, 본 개시내용의 시스템은 HDAd35 공여자 벡터 또는 게놈, 및 Ad35 헬퍼 벡터 또는 게놈을 포함할 수 있고, 다양한 구현예에서 Ad35 지지 벡터를 추가로 포함할 수 있다.
(v) 다양한 구현예에서, Ad35 페이로드는 SB100x에 의한 전위를 위해 트랜스포사제 도립 반복부에 의해 플랭킹된 통합 요소를 포함하고, 트랜스포사제 도립 반복부는 FLPe와 같은 FLP 재조합효소에 의한 재조합을 위해 frt 지시 반복부에 의해 플랭킹된다. 다양한 구현예에서, 통합 요소는 임의적으로 5'에서 3'으로, (a) β-글로빈 미니-LCR, (b) γ-글로빈 코딩 서열이 3'UTR(예를 들어, γ-글로빈 3'UTR)과 작동가능하게 연결된 레서스 γ-글로빈 코딩 서열과 작동가능하게 연결된 β-글로빈 프로모터를 포함하며, 여기서 β-글로빈 미니-LCR이 또한 γ-글로빈 코딩 서열과 작동가능하게 연결되는 유전자 (c) cHS4 절연체 서열, 및 (d) 폴리아데닐화 신호와 작동가능하게 연결된 MGMTP140K 코딩 서열과 작동가능하게 연결된 PGK 프로모터를 포함하는 유전자를 포함하며, 임의적으로 여기서 (a)-(d) 중 임의의 것은 Ad35 페이로드의 2 개의 가닥 중 어느 한 가닥 상에서 5'에서 3' 방향으로 암호화될 수 있다.
다양한 구현예에서, Ad35 페이로드는 통합 요소의 외부 및 재조합효소 부위의 외부에, 염기 편집 시스템을 암호화하는 핵산 서열을 추가로 포함한다. 특정한 특정 구현예에서, 염기 편집 시스템을 암호화하는 핵산 서열은 임의적으로 5'에서 3'으로, (a) gRNA가 HBG 프로모터를 표적화하는 gRNA-암호화 서열과 작동가능하게 연결된 U6 프로모터를 포함하는 gRNA 유전자, 및 (b) 3'UTR/miR 서열 및 폴리아데닐화 신호와 작동가능하게 연결된 염기 편집 효소 코딩 서열과 작동가능하게 연결된 EF1α 프로모터를 포함하는 염기 편집 효소 유전자를 포함한다. 다양한 구현예에서, 염기 편집 시스템은 HBG 프로모터의 BCL11A 결합 부위를 표적화하며, 이는 γ-글로빈 활성화 또는 재활성화를 초래할 수 있다. 본원에 개시된 바와 같이, 염기 편집 시스템은 전위에 의한 공여자 벡터의 절단이 비-통합된 공여자 벡터 핵산의 분해를 초래한다는 점에서 자기-불활성화될 수 있다. 다양한 구현예에서, miR 서열은 HDAd35 공여자 벡터 생산 동안 생산자 세포에서 Cas9 발현을 억제하는 서열일 수 있다(예를 들어, Saydaminova 등, Mol. Ther. Meth. Clin. Dev. 1: 14057, 2015; Li 등, Mol. Ther. Meth. Clin. Dev. 9: 390-401, 2018 참조).
다양한 구현예에서, 본 개시내용의 Ad35 시스템은 Ad35 지지 벡터를 추가로 포함하며, 여기서 지지 벡터는 임의적으로 5'에서 3'으로, (a) FLPe 재조합효소 코딩 서열과 작동가능하게 연결된 EF1α 프로모터를 포함하는 재조합 유전자, 및 (b) SB100x 트랜스포사제 코딩 서열과 작동가능하게 연결된 PGK 프로모터를 포함하는 트랜스포사제 유전자를 포함한다.
다양한 구현예에서 Ad35 페이로드는 Ad35 공여자 벡터 게놈에 존재한다. 다양한 구현예에서 Ad35 공여자 벡터 게놈에 존재하는 Ad35 페이로드는 Ad35 ITR에 의해 플랭킹된다. 다양한 구현예에서, Ad35 공여자 벡터 게놈은 Ad35 공여자 벡터에 존재한다. 다양한 구현예에서, 공여자 벡터는 Ad35++ 벡터이다.
다양한 구현예에서 지지 게놈은 Ad35 ITR을 포함한다. 다양한 구현예에서, 지지 게놈은 Ad35 벡터에 존재한다. 다양한 구현예에서, 지지 벡터는 Ad35++ 벡터이다.
다양한 구현예에서, Ad35 공여자 벡터는 헬퍼 의존적 공여자 벡터(HDAd35)이다. 이러한 특정 구현예에서, 본 개시내용의 시스템은 HDAd35 공여자 벡터 또는 게놈, 및 Ad35 헬퍼 벡터 또는 게놈을 포함할 수 있고, 다양한 구현예에서 Ad35 지지 벡터를 추가로 포함할 수 있다.
I(C)(ii). 페이로드 조절 서열
I(C)(ii)(a). 프로모터 조절 서열
프로모터는 일반적으로 전사를 개시하기 전에 RNA 폴리머라제가 결합하는 관련 코딩 서열의 상류(5')에 있는 비-코딩 게놈 DNA 서열일 수 있다. 이 결합은 전사가 특이적 전사 개시 부위에서 개시하도록 RNA 폴리머라제를 정렬한다.  프로모터의 뉴클레오티드 서열은  효소의 속성 및 이에 부착되는 다른 관련 단백질 인자 및 RNA 합성률을 결정한다. RNA는 RNA 서열을 암호화된 폴리펩티드의 아미노산 서열 내로 번역하기 위한 주형으로서 역할을 하는 메신저 RNA(mRNA)를 생성하도록 처리된다. 5' 비-번역된 리더 서열은 mRNA의 개시 및 번역에서 역할을 할 수 있는 코딩 서열의 상류에 있는 mRNA 영역이다. 3' 전사 종결/폴리아데닐화 신호는 RNA 합성의 종결 및 3' 단부에 폴리아데닐레이트 뉴클레오티드의 첨가를 야기하도록 식물 세포에서 기능하는 코딩 영역의 하류에 있는 비-번역된 영역이다.
프로모터는 일반적인 프로모터, 조직-특이적 프로모터, 세포-특이적 프로모터, 및/또는 세포질에 특이적인 프로모터를 포함할 수 있다. 프로모터는 강한 프로모터, 약한 프로모터, 구성적 발현 프로모터, 및/또는 유도성(조건부) 프로모터를 포함할 수 있다. 유도성 프로모터는 특정 조건, 신호, 또는 세포 사건에 반응하여 발현을 지시하거나 또는 제어한다. 예를 들어, 프로모터는 프로모터로부터 전사를 실행하기 위해 특정 리간드, 소분자, 전사 인자, 호르몬, 또는 호르몬 단백질을 필요로 하는 유도성 프로모터일 수 있다. 프로모터의 특정 예는 AFP(α-태아단백질) 프로모터, 아밀라제 1C 프로모터, 아쿠아포린-5(AP5) 프로모터, αl -항트립신 프로모터, β-act 프로모터, β-글로빈 프로모터, β-Kin 프로모터, B29 프로모터, CCKAR 프로모터, CD14 프로모터, CD43 프로모터, CD45 프로모터, CD68 프로모터, CEA 프로모터, c-erbB2 프로모터, COX-2 프로모터, CXCR4 프로모터, 데스민 프로모터, E2F-1 프로모터, 인간 신장 인자 lα 프로모터(EFlα), CMV(사이토메갈로바이러스 바이러스) 프로모터, minCMV 프로모터, SV40(시미안 바이러스 40) 급초기 프로모터, EGR1 프로모터, eIF4A1 프로모터, 엘라스타제-1 프로모터, 엔도글린 프로모터, FerH 프로모터, FerL 프로모터, 피브로넥틴 프로모터, Flt-1 프로모터, GAPDH 프로모터, GFAP 프로모터, GPIIb 프로모터, GRP78 프로모터, GRP94 프로모터, HE4 프로모터, hGR1/1 프로모터, hNIS 프로모터, Hsp68 프로모터, Hsp68 최소 프로모터(proHSP68), HSP70 프로모터, HSV-1 바이러스 TK 유전자 프로모터, hTERT 프로모터, ICAM-2 프로모터, 칼리크레인 프로모터, LP 프로모터, 주요 후기 프로모터(MLP), Mb 프로모터, Rho 프로모터, MT(메탈로티오네인) 프로모터, MUC1 프로모터, NphsI 프로모터, OG-2 프로모터, PGK(포스포 글리세레이트 키나제) 프로모터, PGK-1 프로모터, 폴리머라제 III(Pol III) 프로모터, PSA 프로모터, ROSA 프로모터, SP-B 프로모터, 서비빈 프로모터, SYN1 프로모터, SYT8 유전자 프로모터, TRP1 프로모터, Tyr 프로모터, 유비퀴틴 B 프로모터, WASP 프로모터, 및 라우스 육종 바이러스(RSV) 긴-말단 반복부(LTR) 프로모터를 포함한다
프로모터는 천연 프로모터 또는 복합 프로모터로서 수득될 수 있다. 천연 프로모터, 또는 최소 프로모터는 주어진 유전자의 5' 영역으로부터의 뉴클레오티드 서열을 포함하는 프로모터를 지칭한다. 천연 프로모터는 코어 프로모터 및 이의 천연 5'UTR을 포함한다. 특정 구현예에서, 5'UTR은 인트론을 포함한다. 복합 프로모터는 상이한 기원의 프로모터 요소를 조합하거나 또는 원위 인핸서를 동일하거나 또는 상이한 기원의 최소 프로모터와 조합함으로써 유도된 프로모터를 지칭한다.
특정 구현예에서, SV40 프로모터는 서열번호: 80에 제시된 서열을 포함한다. 특정 구현예에서, dESV40 프로모터(인핸서 영역의 결실이 있는 SV40 프로모터)는 서열번호: 81에 제시된 서열을 포함한다. 특정 구현예에서, 인간 텔로머라제 촉매적 서브유닛(hTERT) 프로모터는 서열번호: 82에 제시된 서열을 포함한다. 특정 구현예에서, 슈미츠-루핀(Schmidt-Ruppin) A 균주로부터 유래된 RSV 프로모터는 서열번호: 83에 제시된 서열을 포함한다. 특정 구현예에서, hNIS 프로모터는 서열번호: 84에 제시된 서열을 포함한다. 특정 구현예에서, 인간 글루코코르티코이드 수용체 1A(hGR 1/Ap/e) 프로모터는 서열번호: 85에 제시된 서열을 포함한다.
특정 구현예에서, 프로모터는 야생형 프로모터 서열 및 야생형 프로모터에 비해 특정 위치에서 임의적인 변화(삽입, 점 돌연변이 또는 결실 포함)가 있는 서열을 포함한다. 특정 구현예에서, 프로모터는 20 개 뉴클레오티드 스트레치 당 1 개 변화, 20 개 뉴클레오티드 스트레치 당 2 개 변화, 20 개 뉴클레오티드 스트레치 당 3 개 변화, 20 개 뉴클레오티드 스트레치 당 4 개 변화, 또는 20 개 뉴클레오티드 스트레치 당 5 개 변화를 가짐으로써 자연 발생 프로모터로부터 달라진다. 특정 구현예에서, 천연 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 개의 염기에서 변경될 것이다. 프로모터는  다른 바이러스 서열이 있거나 없이, LTR 서열의 50 개 뉴클레오티드 내지 100, 200, 250 또는 350 개 뉴클레오티드를 포함하는 길이로 달라질 수 있다.
일부 프로모터는 조직 또는 세포에 특이적이고 일부 프로모터는 조직 또는 세포에 비-특이적이다. 포유류 세포의 각 유전자는 고유한 프로모터가 있고 일부 프로모터는 특정 세포 유형에서만 활성화될 수 있다. 비-특이적 프로모터, 또는 유비쿼터스 프로모터는 광범위한 세포, 조직 및 세포 주기에서 프로모터 서열에 작동가능하게 연결된 유전자 또는 뉴클레오티드 서열의 전사 개시를 보조한다. 특정 구현예에서, 프로모터는 비-특이적 프로모터이다. 특정 구현예에서, 비-특이적 프로모터는 CMV 프로모터, RSV 프로모터, SV40 프로모터, 포유류 신장 인자 1α(EF1α) 프로모터, β-act 프로모터, EGR1 프로모터, eIF4A1 프로모터, FerH 프로모터, FerL 프로모터, GAPDH 프로모터, GRP78 프로모터, GRP94 프로모터, HSP70 프로모터, β-Kin 프로모터, PGK-1 프로모터, ROSA 프로모터, 및/또는 유비퀴틴 B 프로모터를 포함한다.
특이적 프로모터는 프로모터 서열에 작동가능하게 연결된 뉴클레오티드 서열의 세포 특이적 발현을 보조한다. 특정 구현예에서, 특이적 프로모터는 B 세포, 단핵구 세포, 백혈구, 대식세포, 췌장 선포 세포, 내피 세포, 성상세포, 및/또는 임의의 다른 세포 유형 또는 세포 주기에서 활성이다. 특정 구현예에서, 프로모터는 특이적 프로모터이다. 특정 구현예에서, SYT8 유전자 프로모터는 인간 섬에서 유전자 발현을 조절한다(Xu, 등, Nat Struct Mol Biol., 2011, 18: 372-378). 특정 구현예에서, 칼리크레인 프로모터 췌관 세포 특이적 타액선에서 유전자 발현을 조절한다. 특정 구현예에서, 아밀라제 1C 프로모터는 선포 세포에서 유전자 발현을 조절한다. 특정 구현예에서, 아쿠아포린-5(AP5) 프로모터는 선포 세포에서 유전자 발현을 조절한다(Zheng and Baum, Methods Mol Biol., 434: 205-219, 2008). 특정 구현예에서, B29 프로모터는 B 세포에서 유전자 발현을 조절한다. 특정 구현예에서, CD14 프로모터는 단핵구 세포에서 유전자 발현을 조절한다. 특정 구현예에서, CD43 프로모터는 백혈구 및 혈소판에서 유전자 발현을 조절한다. 특정 구현예에서, CD45 프로모터는 조혈세포에서 유전자 발현을 조절한다. 특정 구현예에서, CD68 프로모터는 대식세포에서 유전자 발현을 조절한다. 특정 구현예에서, 데스민 프로모터는 근육 세포에서 유전자 발현을 조절한다. 특정 구현예에서, 엘라스타제-1 프로모터는 췌장 선포 세포에서 유전자 발현을 조절한다. 특정 구현예에서, 엔도글린 프로모터는 내피 세포에서 유전자 발현을 조절한다. 특정 구현예에서, 피브로넥틴 프로모터는 분화 세포 또는 치유 조직에서 유전자 발현을 조절한다. 특정 구현예에서, Flt-1 프로모터는 내피 세포에서 유전자 발현을 조절한다. 특정 구현예에서, GFAP 프로모터는 성상세포에서 유전자 발현을 조절한다. 특정 구현예에서, GPIIb 프로모터는 거핵구에서 유전자 발현을 조절한다. 특정 구현예에서, ICAM-2 프로모터는 내피 세포에서 유전자 발현을 조절한다. 특정 구현예에서, Mb 프로모터는 근육에서 유전자 발현을 조절한다. 특정 구현예에서, NphsI 프로모터는 족세포에서 유전자 발현을 조절한다. 특정 구현예에서, OG-2 프로모터는 골모세포, 치아모세포에서 유전자 발현을 조절한다. 특정 구현예에서, SP-B 프로모터는 폐 세포에서 유전자 발현을 조절한다. 특정 구현예에서, SYN1 프로모터는 뉴런에서 유전자 발현을 조절한다. 특정 구현예에서, WASP 프로모터는 조혈 세포에서 유전자 발현을 조절한다.
특정 구현예에서, 프로모터는 종양-특이적 프로모터이다. 특정 구현예에서, AFP 프로모터는 간세포 암종에서 유전자 발현을 조절한다. 특정 구현예에서, CCKAR 프로모터는 췌장암에서 유전자 발현을 조절한다. 특정 구현예에서, CEA 프로모터는 상피암에서 유전자 발현을 조절한다. 특정 구현예에서, c-erbB2 프로모터는 유방암 및 췌장암에서 유전자 발현을 조절한다. 특정 구현예에서, COX-2 프로모터는 종양에서 유전자 발현을 조절한다. 특정 구현예에서, CXCR4 프로모터는 종양에서 유전자 발현을 조절한다. 특정 구현예에서, E2F-1 프로모터는 종양에서 유전자 발현을 조절한다. 특정 구현예에서, HE4 프로모터는 종양에서 유전자 발현을 조절한다. 특정 구현예에서, LP 프로모터는 종양에서 유전자 발현을 조절한다. 특정 구현예에서, MUC1 프로모터는 암종 세포에서 유전자 발현을 조절한다. 특정 구현예에서, PSA 프로모터는 전립선 및 전립선암에서 유전자 발현을 조절한다. 특정 구현예에서, 서비븐 프로모터는 종양에서 유전자 발현을 조절한다. 특정 구현예에서, TRP1 프로모터는 멜라닌세포 및 흑색종에서 유전자 발현을 조절한다. 특정 구현예에서, Tyr 프로모터는 멜라닌세포 및 흑색종에서 유전자 발현을 조절한다.
I(C)(ii)(b). LCR 조절 서열
유전자좌 제어 영역은 염색질 부위에서 조직-특이적 및 카피 수-의존적 방식으로 연결된 유전자의 발현을 생리학적 수준으로 향상시키는 능력에 의해 작동적으로 정의된다. Li 등, Blood, 2002, 100(9): 3077-3086.
β-글로빈 LCR은 적어도 여러 측면에서 적어도 일부 LCR의 예시이다. 예를 들어, 많은 다른 LCR과 마찬가지로, β-글로빈 LCR은 작동가능하게 연결된 유전자 또는 이식유전자의 발현을 향상시키고(예를 들어, 전사 증가, 번역 증가, 및/또는 세포 또는 조직 특이성 증가) LCR의 발현 효과를 매개하기 위해 당업자에 의해 이해되는 DNAse 과민성(HS) 영역을 포함한다. 또한, 많은 다른 LCR과 마찬가지로, β-글로빈 LCR은 예를 들어, β-글로빈 LCR HS 영역(HS1-HS5)의 전부를 포함하거나 또는 β-글로빈 LCR HS 영역(예를 들어, HS1-HS4)의 하위세트를 포함하는 β-글로빈 LCR 서열을 포함하는 핵산에서 활용될 수 있다는 점에서 전체적으로 또는 부분적으로 활용될 수 있다.
염색체 11 상의 호모 사피엔스(Homo sapiens) β-글로빈 영역에 대한 예시적인 핵산 서열은 GenBank 수탁 번호 NG_000007로 제공된다. β-글로빈 긴 LCR은 일부 경우에, 유전자좌의 첫번째(배아) 글로빈 유전자에 대해 6 내지 22 kb 5'에 위치한 서열이거나 또는 이를 포함할 수 있다. β-글로빈 긴 LCR은 5 개의 DNAse I 과민성 부위인 5'HS 1 내지 5를 포함할 수 있다. Li 등, Blood, 2002, 100(9): 3077-3086. NG_000007은 유전자좌 제어 영역 내에서 DNAse I 과민성 부위 HS1, HS2, HS3, 및 HS4를 설명하는 제한 부위의 위치(예를 들어, HS2의 SnaBI 및 BstXI 제한 부위, HS3의 HindIII 및 BamHI 제한 부위, 및 HS4의 BamHI 및 BanII 제한 부위)를 제공하고, 특히 과민성 부위 위치와 관련하여 그 전체가 본원에 참조로 포함된다. HS1의 서열 및 위치는 예를 들어, Pasceri 등, Ann NY Acad. Sci. 850:377-381, 1998; Pasceri 등, Blood. 92:653-663, 1998; 및 Milot 등, Cell. 87:105-114, 1996에 기재되어 있다. 특정 구현예에서, HS2 영역은 유전자좌 제어 영역의 위치 16,671에서 17,058까지 확장된다. HS2의 SnaBI 및 BstXI 제한 부위는 각각 위치 17,093 및 16,240에 위치한다. HS3 영역은 유전자좌 제어 영역의 위치 12,459에서 13,097까지 확장된다. HS3의 BamHI 및 HindIII 제한 부위는 각각 위치 12,065 및 13,360에 위치한다. HS4 영역은 유전자좌 제어 영역의 위치 9,048에서 9,713까지 확장된다. HS4의 BamHI 및 BanII 제한 부위는 각각 위치 8,496 및 9,576에 위치한다.
본원에 개시된 특정 구현예는 β-글로빈 LCR의 미니-부분을 활용한다. 미니-부분은 LCR이 β-글로빈 LCR의 5 개 절편을 모두 포함하지 않는 한, HS1, HS2, HS3, HS4, 및/또는 HS5와 같은 5 개 미만의 HS 영역을 모두 포함한다. 본 개시내용의 실시예 1에서 활용되는 4.3 kb HS1-HS4 LCR은 미니-LCR의 일 예를 제공한다. 다른 미니-LCR은 예를 들어, HS1, HS2, 및 HS3; HS2, HS3, 및 HS4; HS3, HS4, 및 HS5; HS1, HS3, 및 HS5; HS1, HS2, 및 HS5; 및 HS1, HS4, 및 HS5를 포함할 수 있다. 미니-LCR의 추가적인 예에 대해, Sadelain 등, Proc. Nat. Acad. Sci. (USA) 92: 6728-6732, 1995; 및 Lebouich 등, EMBO J. 13: 3065-3076, 1994를 참조한다. 특정 구현예는 β-글로빈 프로모터와 조합하여 미니-β-글로빈 LCR을 활용할 수 있다. 특정 구현예에서, 이 조합은 5.9 kb LCR-프로모터 조합을 산출한다. LCR과 관련하여, "미니" 및 "마이크로"는 본원에서 상호교환가능하게 사용된다.
본원에 개시된 특정 구현예는 유전자좌 제어 영역(LCR)의 긴 부분을 활용한다. 긴 β-글로빈 LCR은 HS1, HS2, HS3, HS4, 및 HS5를 포함할 수 있다. 특정 구현예에서, 긴 LCR은 β-글로빈 LCR의 HS1, HS2, HS3, HS4, 및 HS5를 포함하는 21.5 kb 서열을 포함한다. 긴 β-글로빈 LCR은 β-글로빈 프로모터와 커플링되어 높은 단백질 발현 수준을 구동할 수 있다.
특정 구현예는 GRCh38에 열거된 바와 같이 인간 염색체 11(서열번호: 185)의 긴 β-글로빈 LCR 위치 5292319-5270789(21,531 bp)를 포함할 수 있다. 다양한 구현예에서, 긴 LCR은 18 kb, 18.5 kb, 19 kb, 19.5 kb, 20 kb, 20.5 kb, 21 kb, 21.5 kb, 또는 21.531 kb보다 더 크거나 또는 동일한 총 길이를 가질 수 있다. 다양한 구현예에서, 긴 LCR은 서열번호: 185의 길이의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%보다 더 크거나 또는 동일한 총 길이를 가질 수 있다. 다양한 구현예에서, 긴 LCR은 서열번호: 185의 적어도 18 kb, 18.5 kb, 19 kb, 19.5 kb, 20 kb, 20.5 kb, 21 kb, 또는 21.5 kb를 포함할 수 있다. 본원에 제공된 다양한 구현예 중 임의의 것에서, 긴 LCR은 서열번호: 185의 상응하는 인접한 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 핵산이거나 또는 이를 포함할 수 있다. 본원에 제공된 다양한 구현예 중 임의의 것에서, 긴 LCR은 HS1, HS2, HS3, HS4, 및 HS5를 포함할 수 있다.
다양한 구현예에서, Ad35 벡터 시스템은 예를 들어, 인간 염색체 11의 위치 5228631-5227023(1609 bp) 또는 β-글로빈 프로모터로서 GRCh38에 열거된 바와 같은 5228631-5227018(1614 bp)(서열번호: 186)을 포함하는 전위성 이식유전자 삽입물을 포함할 수 있다. 다양한 구현예에서, β-글로빈 프로모터는 예를 들어, 1.0 kb, 1.1. kb, 1.2 kb, 1.3 kb, 1.4 kb, 1.5 kb, 1.6 kb, 또는 1.609 kb보다 더 크거나 또는 동일한 총 길이를 가질 수 있다. 다양한 구현예에서, β-글로빈 프로모터는 서열번호: 186의 적어도 1.0 kb, 1.1. kb, 1.2 kb, 1.3 kb, 1.4 kb, 1.5 kb, 1.6 kb, 또는 1.609 kb를 포함할 수 있다. 다양한 구현예에서, 전위성 이식유전자 삽입물은 인간 염색체 11의 위치 5228631-5227023(1609 bp)을 포함할 수 있다. 다양한 구현예에서, β-글로빈 프로모터는 예를 들어, 엡실론(HBE1), G-감마(HBG2), A-감마(HBG1), 델타(HBD), 및 베타(HBB) 글로빈 유전자 및/또는 헤모글로빈 β 유전자좌에 존재하는 하나 이상의 유전자(11:5,225,463-5,227,070, 보체) 중 임의의 것을 포함하나 이에 제한되지 않는, β-글로빈 LCR에 의해 발현이 조절되는 유전자의 상류, 예를 들어, 이의 첫번째 코딩 뉴클레오티드의 바로 상류에 있는 핵산 서열의 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1 kb, 1.5 kb, 2 kb, 2.5 kb, 3 kb, 4 kb, 또는 5 kb보다 더 크거나 또는 동일한 총 길이를 포함할 수 있다. 다양한 구현예에서, β-글로빈 프로모터는 예를 들어, 염색체 11 NC_000011.10 위치 5227021의 상류, 예를 들어, 바로 상류에 있는 핵산 서열의 100 bp, 200 bp, 300 bp, 400 bp, 500 bp, 1 kb, 1.5 kb, 2 kb, 2.5 kb, 3 kb, 4 kb, 또는 5 kb보다 더 크거나 또는 동일한 총 길이를 포함할 수 있다. 다양한 구현예에서, β-글로빈 프로모터는 서열번호: 186의 길이의 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%보다 더 크거나 또는 동일한 총 길이를 가질 수 있다. 본원에 제공된 다양한 구현예 중 임의의 것에서, β-글로빈 프로모터는 서열번호: 186의 상응하는 인접합 부분과 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일성을 갖는 서열을 갖는 핵산이거나 또는 이를 포함할 수 있다.
다양한 구현예에서, 긴 β-글로빈 LCR과 같은 β-글로빈 LCR은 적혈구에서 작동가능하게 연결된 코딩 서열의 발현을 야기한다. 다양한 구현예에서, 작동가능하게 연결된 코딩 서열은 또한 본원에 제시되거나 또는 달리 당업계에 알려진 바와 같은 β-글로빈 프로모터와 작동가능하게 연결된다.
면역글로불린 중쇄 유전자좌 B 세포 LCR은 작동가능하게 연결된 코딩 서열의 발현을 향상시키는(예를 들어, 전사 증가, 번역 증가, 및/또는 세포 또는 조직 특이성 증가) 예시적인 LCR이다. 코딩 서열의 발현은 완전한 면역글로불린 중쇄 유전자좌 B 세포 LCR 서열을 포함하고/하거나 이의 발현-조절 단편을 포함하는 면역글로불린 중쇄 유전자좌 B 세포 LCR에 작동가능하게 연결될 때 향상될 수 있다. 면역글로불린 중쇄 유전자좌 B 세포 LCR은 면역글로불린 중쇄 유전자좌 B 세포 LCR의 발현-향상 효과의 적어도 일부를 매개하기 위해 당업자에 의해 이해되는 DNAse 과민성 부위(HS)를 포함한다. 면역글로불린 중쇄 유전자좌 B 세포 LCR은 인핸서-유전자좌 제어 영역(LCR)으로서 기능하는 면역글로불린 중쇄(IgH) 유전자좌의 3'Cα 영역에서 4 개의 DNase I-과민성 부위(HS1, HS2, HS3, 및 HS4)를 포함한다. 따라서, 면역글로불린 중쇄 유전자좌 B 세포 LCR은 HS1-HS4를 모두 포함하는 완전한 면역글로불린 중쇄 유전자좌 B 세포 LCR일 수 있거나, 또는 과민성 부위 HS1-HS4의 하위세트를 포함하는 이의 발현-조절 단편일 수 있다. 이러한 HS 부위는 IgH C 유전자의 10-30 kb에 대해 맵핑되고 일시적 형질감염 검정에서 림프계 세포-특이적 및 발달적으로 조절된 인핸서 요소를 유발할 수 있다. 이 핵산 서열은 버킷(Burkitt) 림프종 및 형질세포종 세포주에서 c-myc 유전자에 연결될 때 유사한 발현 패턴을 지시할 수 있는 것으로 관찰되었다. 버킷 림프종 및 형질세포종에서, B-세포 LCR에 의한 c-myc의 제어는 c-myc 유전자가 IgH 서열과 병치되게 하여, 비정상적인 c-myc 전사를 초래하는 특징적 염색체 전위로 인해 발생한다. B 세포 LCR의 추가적인 설명은 예를 들어, Madisen 등, Mol Cell Biol. 18(11):6281-92, 1998; Giannini 등, J. Immunol. 150:1772-1780, 1993; Madisen & Groudine, Genes Dev. 8:2212-2226, 1994; 및 Michaelson 등, Nucleic Acids Res. 23:975-981, 1995에서 찾을 수 있다.
발현 작제물은 mRNA 전사체, 예를 들어, 절연체, 및/또는 polyA 꼬리의 안정성을 향상시키는 특징을 추가적으로 포함할 수 있다.
I(C)(ii)(c). Micro RNA 부위 조절 서열
다양한 구현예에서, microRNA(또는 miRNA) 제어 시스템은 유전자의 발현이 microRNA 부위(예를 들어, microRNA가 상호작용할 수 있는 핵산 서열)의 존재에 의해 조절되는 방법 또는 조성물을 지칭할 수 있다. 다양한 구현예에서, 본 개시내용은 발현 산물의 발현이 상응하는 miRNA의 존재, 수준, 활성, 및/또는 이와의 접촉에 의해 제어되도록 발현 산물을 암호화하는 핵산 서열이 miRNA 표적 부위에 작동가능하게 연결된 페이로드를 포함하는 Ad35 공여자 벡터를 포함한다. 다양한 구현예에서, miRNA 부위는 miR423-5, miR423-5p, miR42-2, miR181c, miR125a, miR15a, miR187, 및/또는 miR218 중 임의의 것으로부터 선택된 miRNA에 대한 표적 부위이다. 의심의 여지를 피하기 위해 본 개시내용은 예를 들어, 본원에 기재된 바와 같이 miRNA 부위와 작동가능하게 연결된 핵산 서열이 예를 들어, 본원에 제공된 하나 이상의 발현 산물 중 임의의 것을 암호화하는 핵산 서열일 수 있음을 고려한다.
특정 구현예에서, microRNA 제어 시스템은 유전자가 HSPC 예를 들어, 종양 침윤 HSPC와 같은 표적 세포에서 광범위하게 발현되도록 유전자의 발현을 조절하였다. 일부 구현예에서, 관심 단백질 또는 핵산(예를 들어, 항암제 예컨대 CAR, TCR, 항체, 및/또는 체크포인트 억제제, 예를 들어, 체크포인트 억제제인 αPD-L1 항체(예를 들어, αPD-L1γ1 항체))을 암호화하는 핵산(예를 들어, 치료 유전자)은 microRNA 부위, 복수의 동일한 microRNA 부위, 또는 복수의 별개의 microRNA 부위를 포함하거나, 이와 회합되거나, 또는 이와 작동가능하게 연결된다. 당업자는 관심 유전자를 암호화하는 서열을 갖는 핵산 또는 이의 부분과 microRNA 부위를 회합하는 수단 및 기술에 친숙할 것이지만, 특정 비-제한적인 예가 본원에 제공된다. 예를 들어, 관심 유전자(예를 들어, αPD-L1γ1 항체를 암호화하는 서열)는 관심 유전자의 발현이 종양-침윤 백혈구 세포가 아닌 세포에서 발현을 억제하지만, 종양-침윤 백혈구에서 발현을 억제하지 않는 하나 이상의 microRNA 부위의 존재에 의해 조절되도록 핵산에 존재할 수 있다. 특정한 특정 예에서, 관심 유전자(예를 들어, αPD-L1γ1 항체를 암호화하는 서열)는 관심 유전자의 발현이 종양-침윤 백혈구 세포가 아닌 세포에서 발현을 억제하지만, 종양-침윤 백혈구에서 발현을 억제하지 않는 하나 이상의 miR423-5p microRNA 부위의 존재에 의해 조절되도록 핵산에 존재할 수 있다. 다양한 구현예에서, microRNA 제어 시스템은 하나 이상의 microRNA 부위, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개, 또는 그 이상의 microRNA 부위를 포함하거나, 또는 관심 단백질 또는 핵산의 발현이 이에 의해 조절되는 핵산을 포함할 수 있다. 다양한 구현예에서, microRNA 제어 시스템은 하나 이상의 miR423-5p microRNA 부위, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개, 또는 그 이상의 miR423-5p microRNA 부위를 포함하거나, 또는 관심 단백질 또는 핵산의 발현이 이에 의해 조절되는 핵산을 포함할 수 있다. 일부 특정 구현예에서, microRNA 제어 시스템은 αPD-L1γ1 항체를 암호화하고, 하나 이상의 miR423-5p microRNA 부위, 예를 들어, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 개, 또는 그 이상의 miR423-5p microRNA 부위, 예를 들어, miR423-5p microRNA 부위를 포함하거나, 또는 αPD-L1γ1 항체의 발현이 이에 의해 조절되는 핵산을 포함할 수 있다.
다양한 구현예에서, microRNA 부위는 HDAd35 공여자 벡터 생산 동안 생산자 세포에서 작동가능하게 연결된 코딩 서열, 예를 들어, CRISPR 효소, 염기 편집 효소, 또는 gRNA를 암호화하는 코딩 서열의 발현을 억제하는 서열일 수 있다(예를 들어, Saydaminova 등, Mol. Ther. Meth. Clin. Dev. 1: 14057, 2015; Li 등, Mol. Ther. Meth. Clin. Dev. 9: 390-401, 2018 참조).
I(C)(iii). 선택 서열
특정 구현예에서 벡터는 선택 카세트를 포함하는 선택 요소를 포함한다. 특정 구현예에서, 선택 카세트는 프로모터, 선택제에 내성을 추가하거나 또는 부여하는 cDNA, 및 이 독립적인 전사 요소의 전사를 중지시킬 수 있는 poly A 서열을 포함한다.
선택 카세트는 (a) 항생제 또는 다른 독소에 내성을 부여하거나, (b) 영양요구성 결핍을 보완하거나, 또는 (c) 복합 배지로부터 이용가능하지 않은 중요한 영양소, 예를 들어, 바실리(Bacilli)에 대한 D-알라닌 라세마제를 암호화하는 유전자를 공급하는 하나 이상의 단백질을 암호화할 수 있다. 임의의 수의 선택 시스템을 사용하여 형질도입된 세포주를 회수할 수 있다. 특정 구현예에서, 양성 선택 카세트는 네오마이신, 하이그로마이신, 암피실린, 퓨로마이신, 플레오마이신, 제오마이신, 블라스티시딘, 비오마이신에 대한 내성 유전자를 포함한다. 특정 구현예에서, 양성 선택 카세트는 메토트렉세이트에 대한 내성을 제공하는 DHFR(디하이드로폴레이트 환원효소) 유전자, O6BG/BCNU에 대한 내성을 담당하는 MGMTP140K 유전자, HAT 선택 배지에 존재하는 특이적 염기(아미노프테린, 하이포크산틴, 티미딘)의 형질전환을 담당하는 HPRT(하이포크산틴 포스포리보실 트랜스퍼라제) 유전자 및 일부 약물에 관한 해독을 위한 다른 유전자를 포함한다. 특정 구현예에서, 선택제는 네오마이신, 하이그로마이신, 퓨로마이신, 플레오마이신, 제오마이신, 블라스티시딘, 비오마이신, 암피실린, O6BG/BCNU, 메토트렉세이트, 테트라사이클린, 아미노프테린, 하이포크산틴, 티미딘 키나제, DHFR, Gln 합성효소, 또는 ADA를 포함한다.
특정 구현예에서, 음성 선택 카세트는 배양 배지에 존재하는 기질을 유전자를 발현하는 세포에 대한 독성 물질로 형질전환하기 위한 유전자를 포함한다. 이러한 분자는 간시클로비르 또는 FIAU의 존재에 민감한 헤르페스 바이러스(HSV TK)의 키나제 티미딘 유전자인 디프테리아 독소(DTA)의 해독 유전자(Yagi 등, Anal Biochem. 214(1):77-86, 1993; Yanagawa 등, Transgenic Res. 8(3):215-221, 1999)를 포함한다. HPRT 유전자는 또한 6-티오구아닌(6TG)을 배지에 첨가함으로써 음성 선택으로 사용될 수 있고. 모든 양성 및 음성 선택의 경우, poly A 전사 종결 서열은 상이한 기원으로부터 유래되며, 가장 고전적인 것은 SV40 poly A, 또는 진핵생물 유전자 poly A(소 성장 호르몬, 토끼 β-글로빈 등)으로부터 유래되고 있다.
특정 구현예에서, 선택 카세트는 Olszko 등 (Gene Therapy 22: 591-595, 2015)에 기재된 바와 같은 MGMTP140K를 포함한다. 특정 요소에서, 선택제는 O6BG/BCNU를 포함한다.
인간 알킬 구아닌 트랜스퍼라제(hAGT)를 암호화하는 약물 내성 유전자 MGMT는 니트로소우레아 및 테모졸로미드(TMZ)와 같은 알킬화제의 세포독성 효과에 내성을 부여하는 DNA 복구 단백질이다. 6-벤질구아닌(6-BG)은 니트로소우레아 독성을 강화하는 AGT의 억제제이며 이 제제의 세포독성 효과를 강화하기 위해 TMZ와 함께 공동 투여된다. AGT의 변이체를 암호화하는 MGMT의 여러 돌연변이체 형태 6-BG에 의한 불활성화에 고도로 내성이지만 DNA 손상을 복구하는 능력은 유지한다(Maze 등, J. Pharmacol. Exp. Ther. 290: 1467-1474, 1999). MGMTP140K-기반 약물 내성 유전자 요법은 마우스, 개, 레서스 원숭이, 및 인간 세포, 구체적으로 조혈 세포에 화학보호를 부여하는 것으로 제시되었다(Zielske 등, J. Clin. Invest. 112: 1561-1570, 2003; Pollok 등, Hum. Gene Ther. 14: 1703-1714, 2003; Gerull 등, Hum. Gene Ther. 18: 451-456, 2007; Neff 등, Blood 105: 997-1002, 2005; Larochelle 등, J. Clin. Invest. 119: 1952-1963, 2009; Sawai 등, Mol. Ther. 3: 78-87, 2001).
특정 구현예에서, 생체내 선택 카세트와의 조합은 유전자-보정된 세포의 선택적 이점 없이 질환에 대한 주요한 구성요소일 것이다. 예를 들어, SCID 및 일부 다른 면역결핍 및 FA에서, 보정된 세포는 이점이 있으며 치료 유전자를 "약간의" HSPC로 형질도입하는 것만이 치료 효능에 충분하다. 세포가 경쟁적 이점을 입증하지 않는 혈색소병증(즉, 겸상적혈구병 및 지중해빈혈)과 같은 다른 질환의 경우, 유전자 보정된 세포의 생체내 선택은 MGMTP140K와 같은 생체내 선택 카세트와의 조합과 같이, 약간의 형질도입된 HSPC를 선택하여, 유전자 교정된 세포에서 증가를 허용하고 치료 효능을 달성하기 위함이다. 이 접근법은 또한 HSPC가 생체외 유전적 변형보다는 생체내 HIV에 내성을 가짐으로써 HIV에 적용될 수 있다.
I(C)(iv). 스터퍼 서열
특정 구현예에서, 벡터는 스터퍼 서열을 포함한다. 특정 구현예에서, 스터퍼 서열은  게놈을 야생형 길이에 가까운 크기로 만들기 위해 추가될 수 있다. 스터퍼는  길이를 확장하기 위해 의도된 기능적으로 불활성인 서열을 정의하기 위해 의도된 당업계에서 일반적으로 인식되는 용어이다
스터퍼 서열은 벡터의 효율적인 패키징 및 안정성을 달성하기 위해 사용된다. 특정 구현예에서, 스터퍼 서열은 게놈 크기를 야생형 바이러스 게놈 크기의 70% 내지 110%로 만드는 데 사용된다.
스터퍼 서열은 바람직하게는 포유류 기원의 임의의 DNA일 수 있다. 본 발명의 바람직한 구현예에서, 스터퍼 서열은 포유류 기원의 비-코딩 서열, 예를 들어 인트론 단편이다.
스터퍼 서열은 벡터의 크기를 미리 결정된 크기로 유지하는 데 사용될 때, 임의의 비-코딩 코딩 서열 또는 게놈을 분할 또는 비분할 세포에서 안정하게 유지하는 서열일 수 있다. 이들 서열은 다른 바이러스 게놈(예를 들어 엡스타인 바 바이러스) 또는 유기체(예를 들어 효모)로부터 유래될 수 있다. 예를 들어, 이들 서열은  센트로미어 및/또는 텔로미어의 기능적 부분일 수 있다.
I(C)(v). 페이로드 통합 및 지지 벡터
유전자 요법은 종종 원하는 핵산 페이로드를 표적 세포의 게놈 내로 통합하는 데 필요하다. 다양한 시스템은 페이로드를 숙주 또는 표적 세포 게놈 내로 통합하기 위해 다양한 시스템이 설계 및/또는 사용될 수 있다. 이러한 다양한 시스템은 특정 페이로드 서열 특징 및 지지 벡터 및 지지 게놈(지지 게놈) 중 하나 이상을 포함할 수 있다.
페이로드를 숙주 세포 게놈 내로 통합하는 아데노바이러스 벡터를 조작하는 한 가지 수단은 통합 바이러스 하이브리드 벡터을 생성하는 것이었다. 통합 바이러스 하이브리드 벡터는 표적 세포를 효율적으로 형질도입하는 벡터의 유전적 요소를 벡터 페이로드를 안정하게 통합하는 벡터의 유전적 요소와 조합한다. 예를 들어, 아데노바이러스 벡터와 조합하여 사용하기 위한 관심 통합 요소는 박테리오파지 인터그라제 PHiC31, 레트로트랜스포존, 레트로바이러스(예를 들어, LTR-매개 또는 레트로바이러스 통합-매개), 아연-핑거 뉴클레아제, DNA-결합 도메인-레트로바이러스 인터그라제 융합 단백질, AAV(예를 들어, AAV-ITR 또는 AAV-Rep 단백질-매개), 및 잠자는 미녀(SB) 트랜스포사제의 것들이 포함된다.
본원에 기재된 Ad35 벡터는 임의적으로 트랜스포사제 및 트랜스포존을 포함하는 전위성 요소를 포함할 수 있다. 트랜스포사제는 레트로트랜스포존 또는 레트로바이러스 기원의 인터그라제, 뿐만 아니라 전위 가능한 기능적 핵산-단백질 복합체의 구성요소이고 전위를 매개하는 효소를 포함할 수 있다. 전위 반응은 트랜스포존 및 트랜스포사제 또는 인터그라제 효소를 포함한다. 특정 구현예에서, 통합 효율, 통합될 수 있는 DNA 서열 크기, 및 게놈 내로 통합될 수 있는 DNA 서열의 카피 수는 이러한 전위성 요소를 사용함으로써 개선될 수 있다. 트랜스포존은 DNA의 더 큰 분절의 상류 및 하류에 있는 말단 반복부 서열을 갖는 짧은 핵산 서열을 포함한다. 트랜스포사제는 말단 반복부 서열에 결합하고 트랜스포존을 게놈의 또 다른 부분으로 이동시키는 것을 촉매화한다.
인간을 포함하는 척추동물의 게놈 내로 핵산의 삽입을 용이하게 하는 다수의 트랜스포사제가 당업계에 기재되었다. 이러한 트랜스포사제의 예는 잠자는 미녀("SB", 예를 들어, 연어과 어류의 게놈으로부터 유래); 피기백(piggyBac)(예를 들어, 인식목 세포 및/또는 마이오티스 루시푸구스(Myotis lucifugus)로부터 유래); 마리너(Mariner)(예를 들어, 드로소필라(Drosophila)로부터 유래); 개구리 왕자(frog prince)(예를 들어, 라나 피피엔스(Rana pipiens))로부터 유래; Tol1; Tol2(예를 들어, 송사리 어류로부터 유래); TcBuster(예를 들어, 붉은 밀가루갑충 트리볼리움 카스타네움(Tribolium castaneum)으로부터 유래), Helraiser, Himar1, Passport, Minos, Ac/Ds, PIF, Harbinger, Harbinger3-DR, HSmar1, 및 spinON을 포함한다.
피기백(PB) 트랜스포사제는 예를 들어, Fraser 등, Insect Mol. Biol., 1996, 5, 141-51; Mitra 등, EMBO J., 2008, 27, 1097-1109; Ding 등, Cell, 2005, 122, 473-83; 및 미국 특허 번호 6,218,185; 6,551,825; 6,962,810; 7,105,343; 및 7,932,088에 기재된 조밀한 기능적 트랜스포사제 단백질이다. 과활성 피기백 트랜스포사제는 US 10,131,885에 기재되어 있다.
특정 구현예에서, PB 트랜스포사제는 서열번호: 291(GenBank ABS12111.1)에 제시된 바와 같은 서열을 갖는다.
특정 구현예에서, 개구리 왕자 트랜스포사제는 서열번호: 292(GenBank: AAP49009.1)에 제시된 바와 같은 서열을 갖는다. 또한 US2005/0241007을 참조한다.
특정 구현예에서, TcBuster 트랜스포사제는 서열번호: 293(GenBank: ABF20545.1)에 제시된 바와 같은 서열을 갖는다.
특정 구현예에서, Tol2 트랜스포사제는 서열번호: 294(GenBank: BAA87039.1)에 제시된 서열을 갖는다.
DNA 트랜스포존에 대한 추가적인 정보는 예를 들면, Munoz-Lopez & Garcia Perez, Curr Genomics, 11(2):115-128, 2010에서 찾을 수 있다.
잠자는 미녀는 Ivics 등 Cell 91, 501-510, 1997; Izsvak 등, J. Mol. Biol., 302(1):93-102, 2000; Geurts 등, Molecular Therapy, 8(1): 108-117, 2003; Mates 등 Nature Genetics 41:753-761, 2009; 및 미국 특허 번호 6,489,458; 7,148,203; 및 7,160,682; 미국 공개 번호 2011/117072; 2004/077572; 및 2006/252140에 기재되어 있다. 특정 구현예에서, 잠자는 미녀 트랜스포사제 효소는 서열 서열번호: 73을 갖는다. 특정 구현예에서, 과활성 잠자는 미녀(SB100x) 트랜스포사제 효소는 서열 서열번호: 74를 갖는다.
SB 트랜스포사제의 활성을 증가시키기 위해 체계적인 돌연변이생성 연구가 수행되었다. 예를 들어, Yant 등은 알라닌에 대한 SB 트랜스포사제의 N-말단 95 AA의 체계적인 교환을 수행하였다(Mol. Cell Biol. 24: 9239-9247, 2004). 이들 치환 중 10 개는 참조로서 SB10과 비교하여 200-400% 사이의 과활성을 야기하였다. Baus 등(Mol. Therapy 12: 1148-1156, 2005)에 기재된 SB16은 SB10과 비교하여 16-배 활성 증가를 갖는 것으로 보고되었다. 추가적인 과활성 SB 변이체는 Zayed 등 (Molecular Therapy 9(2):292-304, 2004) 및 US 9,840,696에 기재되어 있다.
SB 트랜스포존은 전위하기 위해 원형화될 필요가 있다(Yant 등, Nature Biotechnology, 20: 999-1005, 2002). 또한, 1.9 내지 7.2 kb의 트랜스포존의 경우, 트랜스포존 및 전위 빈도의 길이 사이에 역 선형 관계가 있다. 다시 말해서, SB 트랜스포사제는 더 작은 트랜스포존과 비교하여 더 큰 트랜스포존의 전달을 덜 효율적으로 매개한다(Geurts 등, Mol Ther., 8(1):108-17, 2003).
SB 트랜스포사제는 SB ITR 사이에 위치한 핵산 트랜스포존 페이로드를 전위시킨다. 다양한 SB ITR이 당업계에 알려져 있다. 일부 구현예에서, SB ITR은 트랜스포사제에 대한 인식 신호로서 역할을 하는 32 bp 길이의 불완전한 지시 반복부를 포함하는 230 bp 서열이다. pT, pT2, pT3, pT2B, 및 pT4로 알려진 SB ITR을 포함하는 조작된 SB ITR이 당업계에 알려져 있다. 일부 구현예에서, pT4 ITR은 예를 들어, SB100x 트랜스포사제에 의한 전위를 위해, 예를 들어, 본 개시내용의 트랜스포존 페이로드를 플랭킹하는 데 사용된다.
특정 구현예에서, 잠자는 미녀의 IR(도립 반복부)/DR(지시 반복부) 및 염색체 서열을 암호화하는 서열은 서열번호: 4를 포함한다. 특정 구현예에서, 잠자는 미녀의 IR/DR 및 염색체 서열을 암호화하는 서열은 서열번호: 5를 포함한다. 특정 구현예에서, 잠자는 미녀의 IR/DR 암호화 서열은 서열번호: 295를 포함한다. 특정 구현예에서, 잠자는 미녀의 IR/DR 및 염색체 서열을 암호화하는 서열은 서열번호: 296을 포함한다. 특정 구현예에서, 잠자는 미녀의 IR/DR 및 염색체 서열을 암호화하는 서열은 서열번호: 297을 포함한다. 특정 구현예에서, 잠자는 미녀의 IR/DR을 암호화하는 서열은 서열번호: 298을 포함한다. 특정 구현예에서, 잠자는 미녀의 IR/DR 및 염색체 서열을 암호화하는 서열은 서열번호: 299를 포함한다. 특정 구현예에서, 잠자는 미녀의 IR/DR을 암호화하는 서열은 서열번호: 300을 포함한다.
다양한 구현예에서, Ad35 공여자 벡터 또는 게놈은 β-글로빈 발현 산물 또는 γ-글로빈 발현 산물을 암호화하는 적어도 하나의 코딩 서열을 포함하는 통합 요소를 플랭킹하는 SB100x 트랜스포존 도립 반복부를 포함하는 페이로드를 포함한다.
다양한 구현예에서, 아데노바이러스 전위 시스템은 트랜스포존 도립 반복부에 의해 플랭킹된 통합 요소를 포함하는 Ad35 공여자 벡터 또는 게놈을 포함하고, 아데노바이러스 지지 벡터 또는 지지 게놈을 추가로 포함할 수 있다. 다양한 구현예에서, 지지 벡터는 (i) 아데노바이러스 캡시드; 및 (ii) 통합 요소를 플랭킹하는 도립 반복부에 상응하는 트랜스포사제를 암호화하는 핵산 서열을 포함하는 아데노바이러스 지지 게놈을 포함한다. 따라서, 다양한 구현예에서, 지지 벡터 또는 지지 게놈의 적어도 하나의 기능은 표적 세포에 투여된 공여자 벡터에 존재하는 통합 요소의 전위를 위한 트랜스포사제를 표적 세포에 암호화, 발현, 및/또는 전달할 수 있다. 예를 들면, 일부 구현예에서, Ad35 공여자 벡터 또는 게놈은 β-글로빈 발현 산물 또는 γ-글로빈 발현 산물을 암호화하는 적어도 하나의 코딩 서열을 포함하는 통합 요소를 플랭킹하는 SB100x 트랜스포존 도립 반복부를 포함하고, 지지 벡터 또는 지지 게놈은 SB100x 트랜스포사제를 암호화하는 코딩 서열을 포함한다. 특정 구현예에서, 예를 들어, 통합 요소가 트랜스포존 도립 반복부에 의해 플랭킹되고 트랜스포존 도립 반복부가 재조합효소 지시 반복부에 의해 플랭킹되는 경우 통합 요소는 재조합효소 지시 반복부에 의해 플랭킹된다. 이러한 특정 구현예에서, 지지 벡터 또는 지지 게놈의 적어도 하나의 기능은 표적 세포에 투여된 공여자 벡터에 존재하는 재조합효소 부위의 재조합을 위한 재조합효소를 표적 세포로 암호화, 발현, 및/또는 전달하는 것일 수 있다. 다양한 구현예에서, 지지 벡터 또는 지지 게놈은 표적 세포에 투여된 공여자 벡터에 존재하는 재조합효소의 부위의 재조합을 위해 재조합효소를 표적 세포로 암호화, 발현, 및/또는 전달할 수 있고 또한 표적 세포에 투여된 공여자 벡터에 존재하는 통합 요소의 전위를 위해 트랜스포사제를 표적 세포로 암호화, 발현, 및/또는 전달한다.
본원에 개시된 특정 구현예는 또한 부위-특이적 재조합효소 시스템을 사용한다. 이러한 구현예에서, 적어도 하나의 치료 유전자 이외에도, 트랜스포사제-인식된 도립 반복부를 포함하는 트랜스포존은 또한 적어도 하나의 재조합효소-인식된 부위를 포함한다. 따라서, 특정 구현예에서, 본 개시내용은 또한 다음을 투여하는 것을 포함하는 치료 유전자를 게놈 내로 통합하는 방법을 제공한다: (a) (i) 트랜스포사제에 의해 인식된 도립 반복 서열 및 (ii) 재조합효소-인식 부위에 의해 플랭킹된 치료 유전자를 포함하는 트랜스포존; 및 b) 플라스미드, 에피솜, 또는 이식유전자로부터 치료 유전자를 절제하고 치료 유전자를 게놈 내로 통합하는 역할을 하는 트랜스포사제 및 재조합효소. 일부 구현예에서, (b)의 단백질(들)은 단백질(들)을 암호화하는 핵산으로 투여된다. 일부 구현예에서, (b)의 단백질(들)을 암호화하는 트랜스포존 및 핵산은 별개의 벡터 상에 존재한다. 일부 구현예에서, (b)의 단백질(들)을 암호화하는 트랜스포존 및 핵산은 동일한 벡터 상에 존재한다. 동일한 벡터 상에 존재할 때, (b)의 단백질(들)을 암호화하는 벡터의 부분은 (a)의 트랜스포존을 보유하는 부분의 외부에 위치한다. 다시 말해서, 트랜스포사제 및/또는 재조합효소 암호화 영역은 도립 반복부 및/또는 재조합효소-인식 부위에 의해 플랭킹된 영역 외부에 위치한다. 전술된 방법에서, 트랜스포사제 단백질은 표적 세포 게놈 내로 삽입되는 핵산과 같은 삽입된 핵산을 플랭킹하는 도립 반복부를 인식한다. 재조합효소 및 재조합효소-인식된 부위의 사용은 게놈 내로 추가로 통합될 수 있는 트랜스포존의 크기를 증가시킬 수 있다.
재조합효소 시스템의 예는 Flp/Frt 시스템, Cre/loxP 시스템, Dre/rox 시스템, Vika/vox 시스템, 및 PhiC31 시스템을 포함한다.
Flp/Frt DNA 재조합효소 시스템은 사카로마이세스 세레비지에(Saccharomyces cerevisiae)로부터 단리되었다. Flp/Frt 시스템은 Frt 인식 부위에서 DNA-재조합을 촉매화하는 재조합효소 Flp(플리파제)를 포함한다. 특정 구현예에서, Flp(플리파제)는 서열 서열번호: 75를 포함하고 FRT 인식 부위는 서열번호: 76을 포함한다.
Flp 단백질의 변이체는 서열번호: 77(GenBank: ABD57356.1) 및 서열번호: 78(GenBank: ANW61888.1)을 포함한다.
Cre/loxP 시스템은 예를 들어, EP 02200009B1에 기재되어 있다. Cre는 박테리오파지 P1로부터 단리된 부위-특이적 DNA 재조합효소이다. 특정 구현예에서, Cre는 서열 서열번호: 79를 포함한다.
Cre 단백질의 인식 부위는 loxP 부위(서열번호: 80)인 34 개 염기 쌍의 뉴클레이다. Cre는 13 개 염기 쌍 도립 반복부에 결합하고 스페이서 영역 내에서 가닥 절단 및 재결찰을 촉매화함으로써 34 bp loxP DNA 서열을 재조합한다. 스페이서 영역에서 Cre에 의해 만들어진 엇갈린 DNA 절단은 6 개의 염기 쌍에 의해 분리되어 동일한 중첩 영역을 갖는 재조합 부위로만 재조합을 보장하도록 상동성 센서로서 작용하는 중첩 영역을 제공한다. 또한 사용될 수 있는 lox 인식 부위의 변이체는 lox2272(서열번호: 81); lox511(서열번호: 82); lox66(서열번호: 83); lox71(서열번호: 84); loxM2(서열번호: 85); 및 lox5171(서열번호: 86)을 포함한다.
VCre/VloxP 재조합효소 시스템은 비브리오 플라스미드 p0908로부터 단리되었다. 특정 구현예에서, 이 시스템의 VCre 재조합효소는 서열번호: 87을 포함하고 VloxP 인식 부위는 서열번호: 88을 포함한다.
sCre/SloxP 시스템은 WO 2010/143606에 기재되어 있다. Dre/rox 시스템은 US 7,422,889 및 US 7,915,037B2에 기재되어 있다. 일반적으로 서열 서열번호: 89 및 rox 인식 부위(서열번호: 90)를 갖는 엔테로박테리아(Enterobacteria) 파지 D6으로부터 단리된 Dre 재조합효소를 포함한다.
Vika/vox 시스템은 미국 특허 번호 10,253,332에 기재되어 있다. 추가적으로, PhiC31 재조합효소는 AttB/AttP 결합 부위를 인식한다.
트랜스포존(도립 반복부 및/또는 재조합효소 인식 부위 포함)을 포함하는 벡터 핵산의 양, 및 많은 구현예에서 트랜스포사제 및/또는 재조합효소를 암호화하는 벡터 핵산의 양은 트랜스포존 핵산의 원하는 절제 및 삽입을 표적 세포 게놈 내로 제공하기에 충분한 세포 내로 도입된다. 이와 같이, 도입된 벡터 핵산의 양은 트랜스포사제 활성 및/또는 재조합효소 활성의 충분한 양 및 표적 세포 게놈 내로 삽입되는 것이 바람직한 트랜스포존의 충분한 카피 수를 제공하여야 한다. 특정 구현예는 트랜스포존 대 트랜스포사제/재조합효소를 1:1; 1:2; 또는 1:3 비로 포함한다.
대상 방법은 핵산의 표적 세포 게놈 내로의 안정된 통합을 초래한다. 안정된 통합이란 핵산이 일시적 기간을 초과하여 표적 세포 게놈에 존재하고 염색체 유전적 물질의 일부를 통과시켜 표적 세포의 자손에게 주는 것을 의미한다.
본 개시내용의 실시예 2는 과활성 잠자는 미녀 트랜스포사제가 32.4 kb 트랜스포존을 HSPC의 게놈 내로 통합하는 데 사용될 수 있다는 놀라운 결과를 기재한다. 이러한 구현예는 도 23에 도시된 바와 같이 Flp/Frt 시스템과 조합하여 SBX100의 사용을 포함한다.
이전에 나타낸 바와 같이, 특정 구현예는 상동성 아암을 활용하여 상동성 지시된 복구를 활용하는 유전적 작제물의 표적화된 삽입을 용이하게 한다. 상동성 아암은 절단 부위 및 상동성을 보유하는 게놈 서열 사이의 HDR을 지지하기 위해, 예를 들어, 절단 부위의 50 개 미만의 염기 이내 , 예를 들어, 30 개 염기 이내, 15 개 염기 이내, 10 개 염기 이내, 5 개 염기 이내, 또는 절단 부위를 바로 플랭킹하는, 절단 부위에서 게놈 서열에 충분한 상동성, 예를 들어 절단 부위를 플랭킹하는 뉴클레오티드 서열과 70%, 80%, 85%, 90%, 95%, 또는 100% 상동성을 갖는 임의의 길이일 수 있다. 상동성 아암은 일반적으로 게놈 서열, 예를 들어, 이중 가닥 파괴(DSB)가 발생하는 게놈 영역과 동일하다. 그러나, 나타낸 바와 같이, 절대적인 동일성은 필요하지 않다.
특정 구현예는 상동성-지시된 복구 주형 및 표적화된 게놈 서열 사이에 25, 50, 100, 또는 200 개 뉴클레오티드(nt), 또는 200 nt 초과의 서열 상동성(또는 10 내지 200 개 뉴클레오티드 사이, 또는 그 이상의 임의의 정수 값)을 갖는 상동성 아암을 활용할 수 있다. 특정 구현예에서, 상동성 아암은 40 - 1000 nt 길이이다. 특정 구현예에서, 상동성 아암 500-2500 개 염기 쌍, 700 - 2000 개 염기 쌍, 또는 800 -1800 개 염기 쌍. 특정 구현예에서, 상동성 아암은 적어도 800 개의 염기 쌍 또는 적어도 850 개의 염기 쌍을 포함한다. 상동성 아암의 길이는 또한 대칭적 또는 비대칭적일 수 있다.
특정 구현예는 표적 게놈의 상응하는 단편과 서열 동일성 또는 상동성을 갖는, 적어도 25, 50, 100, 200, 400, 600, 800, 1,000, 1,200, 1,400, 1,600, 1,800, 2,000, 2,500, 또는 3,000 개 뉴클레오티드 또는 그 이상을 각각 포함하는 제1 및/또는 제2 상동성 아암을 활용할 수 있다. 일부 구현예에서, 제1 및/또는 제2 상동성 아암은 각각 25, 50, 100, 200, 400, 600, 800, 1,000, 1,200, 1,400, 1,600, 또는 1,800 개 뉴클레오티드의 하한 및 1,000, 1,200, 1,400, 1,600, 1,800, 2,000, 2,500, 또는 3,000 개 뉴클레오티드의 상한을 갖는 표적 게놈의 상응하는 단편과 서열 동일성 또는 상동성을 갖는 다수의 뉴클레오티드를 포함한다. 일부 구현예에서, 제1 및/또는 제2 상동성 아암은 각각 40 내지 1,000 개의 뉴클레오티드, 500 내지 2,500 개의 뉴클레오티드, 700 내지 2,000 개의 뉴클레오티드, 또는 800 내지 1800 개의 뉴클레오티드이거나, 또는 적어도 800 개 뉴클레오티드 또는 적어도 850 개 뉴클레오티드 길이를 갖는 표적 게놈의 상응하는 단편과 서열 동일성 또는 상동성을 갖는 다수의 뉴클레오티드를 포함한다. 제1 및 제2 상동성 아암은 동일한, 유사한, 또는 상이한 길이를 가질 수 있다.
상동성 아암에 관한 추가적인 정보를 위해, Richardson 등, Nat Biotechnol. 34(3):339-44, 2016 참조.
특정 구현예에서, 유전적 작제물(예를 들어, 세포 내에서 치료 산물의 발현을 야기하는 유전자)은 게놈 안전 항구 내로 정확하게 삽입된다. 게놈 안전 항구 부위는 숙주 세포에 대한 부작용 없이 새롭게 통합된 DNA의 예측가능한 발현을 수용할 수 있는 게놈의 유전자내 또는 유전자외 영역이다. 유용한 안전 항구는 암호화된 단백질의 원하는 수준을 산출하기에 충분한 이식유전자 발현을 허용하여야 한다. 게놈 안전 항구 부위는 또한 세포 기능을 변경시키지 않아야 한다. 게놈 안전 항구 부위를 식별하는 방법은 Sadelain 등, Nature Reviews 12:51-58, 2012; 및 Papapetrou 등, Nat Biotechnol. 29(1):73-8, 2011에 기재되어 있다. 특정 구현예에서, 게놈 안전 항구 부위는 다음 기준 중 하나 이상(1, 2, 3, 4, 또는 5 개)를 충족한다: (i) 임의의 유전자의 5' 단부로부터 적어도 50 kb의 거리, (ii) 임의의 암-관련된 유전자로부터 적어도 300 kb의 거리, (iii) (천연 또는 조작된 뉴클레아제를 사용한 DNA 절단에 의해 측정된) 개방/접근가능한 염색질 구조 내, (iv) 유전자 전사 단위 외부의 위치 및 (v) 게놈의 초보존된 영역(UCR), microRNA 또는 긴 비-코딩 RNA 외부의 위치.
특정 구현예에서, 게놈 안전 항구의 기준을 충족하기 위해, 염색질 부위는 알려진 암유전자로부터 150 kb 초과로 멀리 떨어져 있어야 하고, 알려진 전사 시작 부위로부터 30 kb 초과로 멀리 떨어져 있어야 하고; 코딩 mRNA와 중첩되지 않아야 한다. 특정 구현예에서, 게놈 안전 항구의 기준을 충족하기 위해, 염색질 부위는 알려진 암유전자로부터 200 kb 초과로 멀리 떨어져 있어야 하고, 알려진 전사 시작 부위로부터 40 kb 초과로 멀리 떨어져 있어야 하고; 코딩 mRNA와 중첩되지 않아야 한다. 특정 구현예에서, 게놈 안전 항구의 기준을 충족하기 위해, 염색질 부위는 알려진 암유전자로부터 300 kb 초과로 멀리 떨어져 있어야 하고, 알려진 전사 시작 부위로부터 50 kb 초과로 멀리 떨어져 있어야 하고; 코딩 mRNA와 중첩되지 않아야 한다. 특정 구현예에서, 게놈 안전 항구는 전술한 기준을 충족하고(알려진 전사 시작 부위로부터 150 kb 초과, 200 kb 초과 또는 300 kb 초과로 멀리 떨어져 있고; 코딩 mRNA와 중첩되지 않고, 코딩 mRNA와 중첩하지 않고 알려진 전사 시작 부위로부터 40 kb 초과, 또는 50 kb 초과로 멀리 떨어져 있음) 추가적으로 관련 발견의 신속한 임상 번역을 허용하기 위해 관련 동물 모델의 동물 및 인간 게놈 사이에 100% 상동이다.
특정 구현예에서, 게놈 안전 항구는 본원에 기재된 기준을 충족하고 또한 유전자좌가 주변 유전적 물질에 영향을 미치지 않음을 추가로 입증하는 렌티바이러스 통합의 정방향:역방향의 1:1 비를 입증한다.
특정 게놈 안전 항구 부위는 CCR5, HPRT, AAVS1, Rosa 및 알부민을 포함한다. 또한, 적절한 게놈 안전 항구 통합 부위에 대한 추가적인 정보 및 옵션에 대해 예를 들어, 미국 특허 번호 7,951,925 및 8,110,379; 미국 공개 번호 2008/0159996; 2010/00218264; 2012/0017290; 2011/0265198; 2013/0137104; 2013/0122591; 2013/0177983 및 2013/0177960 참조.
당업계에 알려진 다양한 기술은 게놈 안전 항구와 같은 특이적 게놈 유전자좌에서 통합 요소의 통합을 지시하는 데 사용될 수 있다. 예를 들어 AAV-매개 유전자 표적화, 뿐만 아니라 부위-특이적 엔도뉴클레아제(아연-핑거 뉴클레아제, 메가뉴클레아제, 전사 활성인자-유사 효과기(TALE) 뉴클레아제), 및 CRISPR/Cas 시스템을 사용한 DNA 이중 가닥 파괴의 도입에 의해 향상된 상동 재조합은 게놈 안전 항구와 같은 미리 결정된 게놈 유전자좌에서 외래 DNA의 표적화된 삽입을 매개할 수 있는 모든 도구이다. 면역억제 레지멘은 예를 들어, 미국 가출원 번호 제63/009,218호에 기재되어 있으며, 이는 특히 면역억제 레지멘과 관련하여 그 전문이 본원에 참조로 포함된다.
특정 구현예에서, 게놈 안전 항구와 같은 특이적 게놈 유전자좌에서 통합 요소의 통합은 표적 게놈의 CRISPR 효소-매개 절단을 사용한 상동성-지시된 통합을 포함할 수 있다. CRISPR 효소(예를 들어, Cas9)는 가이드 RNA(gRNA)에 의해 명시된 부위에서 이중 가닥 DNA를 절단한다. 이중 가닥 파괴는 공여자 주형(예컨대 왼쪽 및 오른쪽 상동성 아암을 포함하는 Ad35 페이로드 통합 요소)이 존재할 때 상동성-지시된 복구(HDR)에 의해 복구될 수 있다. 이러한 다양한 방법에서, 통합 요소는 왼쪽 및 오른쪽 상동성 아암(예를 들어, 500-3,000 bp)을 절단된 표적 게놈 내로 삽입하기 위해 포함한다는 점에서 "복구 주형"이다. CRISPR-매개 유전자 삽입은 DNA 주형의 자발적인 재조합과 비교하여 몇 배 더 효율적일 수 있으며, 이는 CRISPR-매개 유전자 삽입이 게놈 편집을 위한 효과적인 도구일 수 있음을 입증한다. 핵산 서열을 명시된 게놈 유전자좌 내로 상동성-지시 통합을 위한 예시적인 방법은 당업계, 예를 들어, Richardson 등 (Nat Biotechnol. 34(3):339-44, 2016)에 알려져 있다.
다양한 구현예에서, 표적 세포 게놈의 게놈 안전 항구에서 삽입을 위한 통합 요소를 포함하는 아데노바이러스 공여자 벡터는 최대 15 kb의 길이를 갖는 핵산 서열의 통합을 유발할 수 있다. 다양한 구현예에서, 게놈 안전 항구에서 표적 세포 게놈 내로의 통합을 위한 통합 요소는 예를 들어, 길이가 1 kb, 2 kb, 3 kb, 4 kb, 또는 5 kb의 하한 및 10 kb, 11 kb, 12 kb, 13 kb, 14 kb, 또는 15 kb의 상한을 갖는 적어도 1 kb, 2 kb, 3 kb, 4 kb, 5 kb, 6 kb, 7 kb, 8 kb, 9 kb, 10 kb, 11 kb, 12 kb, 13 kb, 14 kb, 또는 15 kb의 길이를 가질 수 있다.
II. 표적 세포 집단
다양한 구현예에서, 본 개시내용의 Ad35 공여자 벡터 및 게놈은 본원에 개시된 HSC, T 세포, B 세포, 및 종양 세포를 포함하나 이에 제한되지 않는 임의의 다양한 유형의 표적 세포를 형질도입할 수 있다.
II(A). HSC
특정 구현예에서, 벡터-표적화된 세포 유형은 조혈 줄기 세포(HSC)를 포함한다. HSC는 CD46을 결합함으로써 생체내 유전적 변형을 위해 표적화된다. 나타낸 바와 같이, 본 개시내용 내에서, HSC는 CD46을 결합함으로써 생체내 유전적 변형을 위해 표적화된다. 벡터는 CD46 결합의 특이성 및/또는 강도를 증가시키기 위해 본원에 개시된 돌연변이를 포함할 수 있다. HSC는 또한 다음 마커 프로파일에 의해 식별될 수 있다: CD34+, Lin-CD34+CD38-CD45RA-CD90+CD49f+(HSC1) 및 CD34+CD38-CD45RA-CD90- CD49f+(HSC2). 인간 HSC1은 다음 프로파일에 의해 식별될 수 있다: CD34+/CD38-/CD45RA-/CD90+ 또는 CD34+/CD45RA-/CD90+ 및 마우스 LT-HSC는 Lin-Sca1+ckit+CD150+CD48-Flt3-CD34-에 의해 식별될 수 있다(여기서 Lin은 CD3, Cd4, CD8, CD11b, CD11c, NK1.1, Gr1, 및 TER119를 포함하는 성숙 세포의 임의의 마커의 발현 부재를 나타낸다). 특정 구현예에서, HSC는 CD164+ 프로파일에 의해 식별된다. 특정 구현예에서, HSC는 CD34+/CD164+ 프로파일에 의해 식별된다. HSC 마커 프로파일에 관한 추가적인 정보를 위해, WO2017/218948 참조.
II(B). T 세포
T-세포의 여러 상이한 하위세트가 발견되었으며, 각각은 별개의 기능이 있다. 예를 들어, 대부분의 T-세포는 여러 단백질의 복합체로서 존재하는 T-세포 수용체(TCR)가 있다. 실제 T-세포 수용체는 독립적인 T-세포 수용체 알파 및 베타(TCRα 및 TCRβ) 유전자로부터 생성되고 α- 및 β-TCR 쇄라고 불리는 2 개의 개별 펩티드 쇄로 구성된다.
γδ T-세포는 표면 상에 별개의 T-세포 수용체(TCR)를 보유하는 T-세포의 작은 하위세트를 나타낸다. γδ T-세포에서, TCR은 하나의 γ-쇄 및 하나의 δ-쇄로 구성된다. 이 T-세포 그룹은 αβ T-세포보다 훨씬 덜 일반적이다(총 T-세포의 2%).
CD3은 모든 성숙 T 세포 상에서 발현된다. 활성화된 T-세포는 4-1BB (CD137), CD69, 및 CD25를 발현한다. CD5 및 트랜스페린 수용체는 또한 T-세포 상에서 발현된다.
T-세포는 추가로 헬퍼 세포(CD4+ T-세포) 및 세포독성 T-세포(CTL, CD8+ T-세포)로 분류될 수 있으며, 이는 세포용해성 T-세포를 포함한다. T 헬퍼 세포는 다른 기능 중에서 B 세포의 형질 세포로의 성숙 및 세포독성 T-세포 및 대식세포의 활성화를 포함하는 면역학적 과정에서 다른 백혈구를 보조한다. 이들 세포는 또한 CD4+ T-세포로 알려져 있는데 표면 상에서 CD4 단백질을 발현하기 때문이다. 헬퍼 T-세포는 항원 제시 세포(APC)의 표면 상에서 발현된 MHC 클래스 II 분자에 의해 펩티드 항원과 함께 제시될 때 활성화되게 된다. 일단 활성화되면, 이들은 빠르게 분할되어 활성 면역 반응에서 조절하거나 또는 보조하는 사이토카인이라 불리는 작은 단백질을 분비한다.
세포독성 T-세포는 바이러스로 감염된 세포 및 종양 세포를 파괴하고, 또한 이식 거부에 연루된다. 이들 세포는 또한 CD8+ T-세포로 알려져 있는데 표면 상에서 CD8 당단백질을 발현하기 때문이다. 이들 세포는 신체의 거의 모든 세포의 표면 상에 존재하는 MHC 클래스 I과 회합된 항원에 대한 결합에 의해 표적을 인식한다.
특정 구현예에서, CAR은 세포독성 T-세포에서 발현되도록 유전적으로 변형된다.
본원에 사용된 바와 같은 "중추 기억" T-세포(또는 "TCM")는 이의 표면 상에서 CD62L 또는 CCR7 및 CD45RO를 발현하고, 미처리 세포와 비교하여 CD45RA를 발현하지 않거나 또는 이의 발현이 감소된 항원 경험 CTL을 지칭한다. 특정 구현예에서, 중추 기억 세포는 CD62L, CCR7, CD25, CD127, CD45RO, 및 CD95의 발현에 대해 양성이고, 미처리 세포와 비교하여 CD45RA의 발현이 감소된다.
본원에 사용된 바와 같은 "효과기 기억" T-세포(또는 "TEM")는 중추 기억 세포와 비교하여 이의 표면 상에서 CD62L을 발현하지 않거나 또는 이의 발현이 감소되고 미처리 세포와 비교하여 CD45RA를 발현하지 않거나 또는 이의 발현이 감소된 항원 경험 T-세포를 지칭한다. 특정 구현예에서, 효과기 기억 세포는 미처리 세포 또는 중추 기억 세포와 비교하여 CD62L 및 CCR7의 발현에 대해 음성이고, CD28 및 CD45RA의 가변 발현을 갖는다. 효과기 T-세포는 기억 또는 미처리 T-세포와 비교하여 그랜자임 B 및 퍼포린에 대해 양성이다.
본원에 사용된 바와 같은 "미처리" T-세포는 중추 또는 효과기 기억 세포와 비교하여 CD62L 및 CD45RA를 발현하고 CD45RO를 발현하지 않는 비-항원 경험 T 세포를 지칭한다. 특정 구현예에서, 미처리 CD8+ T 림프구는 CD62L, CCR7, CD28, CD127, 및 CD45RA를 포함하는 미처리 T-세포의 표현형 마커의 발현을 특징으로 한다.
II(C). B 세포
B 세포는 체액 반응의 매개체이며 항원에 특이적인 항체의 생산 및 방출을 담당한다. 여러 유형의 B 세포가 존재하며 이는 핵심 마커를 특징으로 할 수 있다. 일반적으로, 미성숙 B 세포는 CD19, CD20, CD34, CD38, 및 CD45R을 발현하고, 이들이 성숙함에 따라 핵심 발현된 마커는 CD19 및 IgM이다.
II(D). 종양
특정 구현예에서, 벡터는 종양을 표적화할 수 있다. 특정 구현예에서, 종양은 종양 세포 상에 존재하지만 건강한 세포 상에서는 존재하지 않는 수용체를 표적화함으로써 표적화된다. 종양은 αv 인테그린에 결합함으로써 생체내 유전적 변형을 위해 표적화될 수 있다. αv 인테그린은 혈관신생에 중요한 역할을 한다. αvβ3 및 αvβ5 인테그린은 정상 내피 세포에서 부재하거나 또는 낮은 수준으로 발현되지만 종양의 혈관신생 혈관계에서 유도된다(Brooks 등, Cell, 79: 1157-1164, 1994; Hammes 등, Nature Med, 2: 529-533, 1996). 아미노펩티다제 N/CD13은 최근에 NGR 모티프에 대한 혈관신생 수용체로서 식별되었다(Burg 등, Cancer Res, 59:2869-74, 1999). 아미노펩티다제 N/CD13은 암의 혈관신생 혈관 및 다른 혈관신생 조직에서 강하게 발현된다.
특정 구현예에서, 벡터는 암 세포 항원 에피토프를 표적화함으로써 종양을 표적화할 수 있다. 암 세포 항원은 암 세포 또는 종양에 의해 발현된다.
특정 구현예에서, 암 세포 항원 에피토프는 암 세포에 의해 우선적으로 발현된다. "우선적으로 발현된"은 암 세포 항원이 다른 세포 유형과 비교하여 암 세포에 대한 더 높은 수준으로 발견됨을 의미한다. 일부 경우에, 암 항원 에피토프는 표적화된 암 세포 유형에 의해서만 발현된다. 다른 경우에, 암 항원은 비-표적화된 세포보다 적어도 25%, 35%, 45%, 55%, 65%, 75%, 85%, 95%, 96%, 97%, 98%, 99%, 또는 100% 더 많은 표적화된 암 세포 유형 상에서 발현된다.
특정 구현예에서, 암 세포 항원은 암성 및 건강한 조직 상에서 상당히 발현된다. 특정 구현예에서, 상당히 발현된은 이중특이적 항체의 사용이 표적내/암외 독성에 기반한 개발 동안 중단되었음을 의미한다. 특정 구현예에서, 상당히 발현된은 이중특이적 항체의 사용이 표적내/암외 독성에 기반한 잠재적인 부정적인 부작용에 관한 경고를 필요로 함을 의미한다. 일 예로서, 세툭시맙은 피부에서 EGFR 발현으로 인한 것으로 생각되는 여러 피부 발진과 연관된 항-EGFR 항체이다. 또 다른 예는 항-HER2 (ERBB2) 항체인 허셉틴(트라스투주맙)이다. 허셉틴은 심장에서 표적 발현으로 인한 심장독성과 연관되어 있다. 더욱이, CAR-T 세포로 Her2를 표적화하는 것은 폐에서 표적내, 암외 발현으로 인해 환자에게 치명적이었다.
표 12는 특정 암 유형에서 공동 발현될 가능성이 높은 암 항원의 예를 제공한다.
표 12
Figure pct00015
보다 특정 예에서, 암 세포 항원은 다음을 포함한다: 메소텔린, MUC16, FOLR, PD-L1, ROR1, 글리피칸-2(GPC2), 디시알로강글리오시드(GD2), HER2, EGFR, EGFRvIII, CEA, CD56, CLL-1, CD19, CD20, CD123, CD30, CD33(전장), CD33(델타E2 변이체), CD33(C-말단 절두됨), BCMA, IGFR, MUC1, VEGFR, PSMA, PSCA, IL13Ra2, FAP, EpCAM, CD44, CD133, Tro-2, CD200, FLT3, GCC, 및 WT1. 당업자에 의해 이해되는 바와 같이, 표적화된 항원은 신호 펩티드가 결여될 수 있다.
신경 세포 접착 분자 1(NCAM1)로도 알려져 있는 CD56은 세포-세포 및 세포-기질 접착에 수반되는 I형 막 당단백질이다. 이의 세포외 도메인은 N-말단에서 5 개의 IgG-유사 도메인 및 막-근위 영역에서 2 개의 피브로넥틴 III형 도메인을 갖는다.
디시알로강글리오시드 GalAc베타1-4(NeuAc알파2-8NeuAc알파2-3)Gal베타1-4Glc베타1- 1Cer(GD2)은 신경모세포종을 포함하는 다양한 종양에서 발현된다. 디시알로강글리오시드 항원 GD2는 시알산 및 지질 잔기에 의해 플랭킹된 올리고당류의 백본을 포함한다. 예를 들어, Cheresh (Surv. Synth. Pathol. Res. 4:97, 1987) 및 US 5,653,977 참조.
EGFR의 종양 특이적 돌연변이체인 EGFR 변이체 III(EGFRvIII)은 종종 야생형 EGFR 유전자 증폭과 연관된 게놈 재배열의 생성물이다. EGFRvIII은 엑손 2-7의 인프레임 결실에 의해 형성되어, 접합부에서 글리신 치환에 따른 267 개 아미노산의 결실로 이어진다. 절두된 수용체는 리간드에 결합하는 능력을 상실하지만 구성적 키나제 활성을 획득한다. 흥미롭게도, EGFRvIII은 동일한 종양 세포에서 전장 야생형 EGFR과 함께 빈번하게 공동 발현된다. 더욱이, EGFRvIII 발현 세포는 증가된 증식, 침입, 혈관신생 및 세포자멸사에 대한 내성을 나타낸다.
EGFRvIII은 다형성 교모세포종(GBM)에서 가장 흔히 발견된다. GBM의 25-35%는 이 절두된 수용체를 보유하는 것으로 추정된다. 더욱이, 이의 발현은 종종 보다 공격적인 표현형 및 나쁜 예후를 반영한다. GBM 이외에도, EGFRvIII의 발현은 또한 비-소세포 폐암, 두경부암, 유방암, 난소암 및 전립선암과 같은 다른 고형 종양에서 보고되었다. 대조적으로, EGFRvIII은 건강한 조직에서 발현되지 않는다.
특정 구현예에서, 표적화된 암 항원 에피토프는 표적화된 암 세포 또는 종양에 의한 높은 발현 또는 표적화된 암 세포 또는 종양에 의한 낮은 발현을 가질 수 있다. 특정 구현예에서, 높은 발현 및 낮은 발현은 유세포 분석 또는 형광-활성화 세포-분류(FACS)를 사용하여 결정될 수 있다. 유세포 분석의 당업자에 의해 이해되는 바와 같이, "hi", "lo", "+" 및 "-"는 음성 또는 다른 집단에 대한 신호 강도를 지칭한다. 특정 구현예에서, 양성 발현(+)은 마커가 유세포 분석을 사용하여 세포 상에서 검출가능함을 의미한다. 특정 구현예에서, 음성 발현(-)은 마커가 유세포 분석을 사용하여 검출가능하지 않음을 의미한다. 특정 구현예에서, "hi"는 관심 마커의 양성 발현이 형광(예를 들어 FACS 사용)에 의해 측정될 때 발현에 대해 또한 양성인 다른 세포보다 더 밝음을 의미한다. 이러한 구현예에서, 당업자는 밝기가 검출 임계값을 기반으로 함을 인식한다. 일반적으로, 당업자는 먼저 음성 대조군 튜브를 분석하고, FSC 및 SSC에 의해 관심 집단 주위에 게이트(비트맵)를 설정하고 원하는 방출 파장에서 형광에 대한 광전자 증배관 전압 및 이득을 조정하여, 세포의 97%가 음성 대조군이 있는 형광 마커에 대해 염색되지 않은 것으로 보이도록 할 것이다. 일단 이러한 매개변수가 확립되면, 염색된 세포를 분석하고, 염색되지 않은 형광 세포 집단과 비교하여 형광을 기록하였다. 특정 구현예, 및 대표적인 전형적인 FACS 플롯에서, hi는 맨 오른쪽(x 라인) 또는 가장 높은 상단 라인(오른쪽 또는 왼쪽 상단)을 의미하는 반면 lo는 왼쪽 하단 사분면 내 또는 오른쪽 및 왼쪽 사분면 사이의 중간을 의미한다(그러나 음성 집단에 비해 이동됨). 특정 구현예에서, "hi"는 +의 20-배 초과, +의 30-배 초과, +의 40-배 초과, +의 50-배 초과, +의 60-배 초과, +의 70-배 초과, +의 80-배 초과, +의 90-배 초과, +의 100-배 초과, 또는 + 세포에 비해 검출가능한 형광의 증가 이상을 지칭한다. 반대로, "lo"는 "hi"로 정의된 것들의 상호간의 집단을 지칭할 수 있다.
II(E). 다른 표적
HSC, T 세포, B 세포, 및 종양(또는 암 세포) 외에도, 벡터는 박테리아 및 진균에 대한 다른 항원을 표적화할 수 있다.
박테리아를 표적화하는 항원은 예를 들어, 탄저병, 그람-음성균, 클라미디아, 디프테리아, 헬리코박터 파일로리, 결핵균, 백일해 독소, 폐렴구균, 리케차, 포도상구균, 연쇄상구균 및 파상풍으로부터 유래될 수 있다.
박테리아 항원 마커의 특정 예로서, 탄저병 항원은 탄저병 보호 항원을 포함하고; 그람-음성균 항원은 지질다당류를 포함하고; 디프테리아 항원은 디프테리아 독소를 포함하고; 결핵균 항원은 마이콜산, 열 충격 단백질 65(HSP65), 30 kDa 주요 분비 단백질 및 항원 85A를 포함하고; 백일해 독소 항원은 헤마글루티닌, 페르탁틴, FIM2, FIM3 및 아데닐레이트 사이클라제를 포함하고; 폐렴쌍구균 항원은 페렴구균용혈소 및 폐렴쌍구균 캡슐 다당류를 포함하고; 리케차 항원은 rompA를 포함하고; 연쇄상구균 항원은 M 단백질을 포함하고; 파상풍 항원은 파상풍 독소를 포함한다.
진균을 표적화하는 항원은 예를 들어, 칸디다, 콕시디오데스, 크립토코쿠스, 히스토플라스마, 리슈마니어, 말라리아원충, 원생동물, 기생체, 주혈흡충속, 백선, 톡소플라스마, 및 트리파노소마 크루지(Trypanosoma cruzi)로부터 유래될 수 있다.
진균 항원의 특정 예로서, 콕시디오데스 항원은 소구체 항원을 포함하고; 크립토코쿠스 항원은 캡슐 다당류를 포함하고; 히스토플라스마 항원은 열 충격 단백질 60(HSP60)을 포함하고; 리슈마니어 항원은 gp63 및 지질포스포글리칸을 포함하고; 열대열원충 항원은 낭충 표면 항원, 종충 표면 항원, 포자소체 항원, 생식모세포/배우자 표면 항원, 원생동물 및 혈액-단계 항원 pf 155/RESA를 포함하는 다른 기생체 항원을 포함하고; 주혈흡충속 항원은 글루타티온-S-트랜스퍼라제 및 파라마이오신을 포함하고; 백선 진균 항원은 백선균을 포함하고; 톡소플라스마 항원은 SAG-1 및 p30을 포함하고; 트리파노소마 크루지 항원은 75-77 kDa 항원 및 56 kDa 항원을 포함한다.
III. 투여량, 제형, 및 투여
벡터는 세포 또는 동물, 예를 들어, 인간에게 투여하기 위해 약제학적으로 허용되도록 제형화될 수 있다. 벡터는 시험관내, 생체외, 또는 생체내 투여될 수 있다. 본원에 기재된 Ad35 바이러스 벡터 벡터들은 대상체에게 투여하기 위해 제형화될 수 있다. 제형은 치료 유전자("활성 성분") 및 하나 이상의 약제학적으로 허용되는 담체와 연관된 Ad35 바이러스 벡터를 포함한다.
본원에 개시된 바와 같이, 벡터는 당업계에 알려진 임의의 형태일 수 있다. 이러한 형태는 예를 들어, 액체, 반고체 및 고체 투여 형태, 예컨대 액체 용액(예를 들어, 주사가능 및 주입가능 용액), 분산액 또는 현탁액, 정제, 알약, 분말, 리포솜 및 좌제를 포함한다.
임의의 특정 형태의 선택 또는 사용은 부분적으로 의도된 투여 방식 및 치료 적용에 따라 달라질 수 있다. 예를 들어, 전신 또는 국소 전달을 위해 의도된 조성물을 함유하는 조성물은 주사가능 또는 주입가능 용액의 형태일 수 있다. 따라서, 벡터는 비경구 방식(예를 들어, 정맥내, 피하, 복강내, 또는 근육내 주사)에 의한 투여를 위해 제형화될 수 있다. 본원에 사용된 바와 같이, 비경구 투여는 일반적으로 주사에 의한 장관 및 국소 투여 이외의 투여 방식을 지칭하며, 정맥내, 비강내, 안내, 폐, 근육내, 동맥내, 척추강내, 피막내, 안와내, 심장내, 피내, 폐내, 복강내, 기관경유, 피하, 표피하, 관절내, 피막하, 지주막하, 척수내, 경막외, 대뇌내, 두개내, 경동맥내 및 수조내 주사 및 주입을 포함하나 이에 제한되지 않는다. 비경구 투여 경로는 예를 들어, 주사에 의한 투여, 경비 투여, 경폐 투여, 또는 경피 투여일 수 있다. 투여는 정맥내 주사, 근육내 주사, 복강내 주사, 피하 주사에 의한 전신 또는 국소 투여일 수 있다.
다양한 구현예에서, 본 발명의 벡터는 용액, 마이크로에멀젼, 분산액, 리포솜, 또는 고농도에서 안정된 저장에 적합한 다른 정렬된 구조로 제형화될 수 있다. 멸균 주사가능 용액은 필요에 따라, 상기 열거된 성분 중 하나 또는 조합과 함께 적절한 용매에 본원에 기재된 조성물을 필요한 양으로 혼입한 후, 필터 멸균함으로써 제조될 수 있다. 일반적으로, 분산액은 본원에 기재된 조성물을 염기성 분산 매질 및 상기 열거된 것들로부터 필요한 다른 성분을 함유하는 멸균 비히클에 혼입함으로써 제조된다. 멸균 주사가능 용액의 제조를 위한 멸균 분말의 경우, 제조 방법은 본원에 기재된 조성물의 분말 및 이의 이전에 멸균 여과된 용액으로부터 임의의 추가적인 바람직한 성분(하기 참조)를 산출하는 진공 건조 및 동결 건조를 포함한다. 용액의 적절한 유동성은 예를 들어, 레시틴과 같은 코팅의 사용, 분산액의 경우 필요한 입자 크기의 유지 및 계면활성제의 사용에 의해 유지될 수 있다. 주사가능 조성물의 연장된 흡수는 흡수를 지연시키는 시약, 예를 들어, 모노스테아레이트 염, 및 젤라틴을 조성물에 포함함으로써 야기될 수 있다.
벡터는 멸균 용액 또는 물 중 현탁액 또는 또 다른 약제학적으로 허용되는 액체를 포함하는 주사가능 제형 형태로 비경구로 투여될 수 있다. 예를 들어, 벡터는 치료 분자를 약제학적으로 허용되는 비히클 또는 매질, 예컨대 멸균수 및 생리 식염수, 식물성 오일, 유화제, 현탁제, 계면활성제, 안정화제, 향미 부형제, 희석제, 비히클, 보존제, 결합제와 적절하게 조합한 후, 일반적으로 허용되는 약제학적 관행에 필요한 단위 용량 형태로 혼합함으로써 제형화될 수 있다. 약제학적 제제에 포함되는 벡터의 양은 지정된 범위 내에서 적합한 용량이 제공되도록 한다. 유성 액체의 비제한적인 예는 참깨유 및 대두유를 포함하고, 가용화 제제로서 벤질 벤조에이트 또는 벤질 알코올과 조합될 수 있다. 포함될 수 있는 다른 항목은 포스페이트 완충제, 또는 나트륨 아세테이트 완충제와 같은 완충제, 프로카인 하이드로클로라이드와 같은 진정제, 젠질 알코올 또는 페놀과 같은 안정화제, 및 산화방지제이다. 제형화된 주사는 적합한 앰플에 패키징될 수 있다.
다양한 구현예에서, 피하 투여는 주사기, 미리 충전된 주사기, 자동 주사기(예를 들어, 일회용 또는 재사용가능), 펜 주사기, 패치 주사기, 착용가능한 주사기, 피하 주입 세트가 장착된 보행용 주사기 주입 펌프와 같은 장치, 또는 피하 주사를 위한 다른 장치에 의해 달성될 수 있다.
일부 구현예에서, 본원에 기재된 벡터는 국소 투여 방식에 의해 대상체에게 치료적으로 전달될 수 있다. 본원에 사용된 바와 같이, "국소 투여" 또는 "국소 전달"은 혈관계를 통해 의도된 표적 조직 또는 부위에 벡터 또는 벡터를 수송하는 것에 의존하지 않는 전달을 지칭할 수 있다. 예를 들어, 벡터는 조성물 또는 제제의 주사 또는 이식 또는 조성물 또는 제제를 함유하는 장치의 주사 또는 이식에 의해 전달될 수 있다. 특정 구현예에서, 표적 조직 또는 부위 부근에 국소 투여 후, 조성물 또는 제제, 또는 이의 하나 이상의 구성요소는 투여 부위가 아닌 의도된 표적 조직 또는 부위로 확산될 수 있다.
일부 구현예에서, 본원에 제공된 조성물은 단위 투여 형태로 존재하며, 단위 투여 형태는 자기-투여에 적합할 수 있다. 이러한 단위 투여 형태는 용기, 전형적으로, 예를 들어, 바이알, 카트리지, 미리 충전된 주사기 또는 일회용 펜 내에 제공될 수 있다. US 6,302,855에 기재된 투약기 장치와 같은 투약기는 또한 예를 들어, 본원에 기재된 바와 같은 주사 시스템과 함께 사용될 수 있다.
주사에 적합한 벡터 제형의 약제학적 형태는 멸균 수용액 또는 분산액을 포함할 수 있다. 제형은 멸균될 수 있고 주사기의 안팎으로 적절한 흐름을 허용하기 위해 유체여야 한다. 제형은 또한 제조 및 저장 조건 하에 안정될 수 있다. 담체는 예를 들어, 물 및 염수 또는 완충 수용액을 함유하는 용매 또는 분산 매질일 수 있다. 바람직하게는, 등장성 제제, 예를 들어, 당 또는 염화나트륨이 제형에 사용될 수 있다.
게다가, 당업자는 또한 추가적인 전달 방법이 전기천공법, 초음파영동법, 골내 주사 방법을 통하거나 또는 유전자 총을 사용하는 것임을 고려할 수 있다. 벡터는 또한 마이크로칩, 나노-칩 또는 나노입자에 이식될 수 있다.
본원에 기재된 벡터의 적합한 용량은 예를 들어, 치료될 대상체의 연령, 성별, 및 체중, 치료될 병태 또는 질환, 및 사용되는 특정 벡터를 포함하는 다양한 인자에 따라 달라질 수 있다. 대상체에게 투여되는 용량에 영향을 미치는 다른 인자는 예를 들어, 병태 또는 질환의 유형 또는 중증도를 포함한다. 다른 인자는 예를 들어, 대상체에게 동시에 또는 이전에 영향을 미치는 다른 의학적 장애, 대상체의 일반적인 건강, 대상체의 유전적 소인, 식습관, 투여 시간, 배출률, 약물 조합, 및 대상체에게 투여되는 임의의 다른 추가적인 치료제를 포함할 수 있다. 벡터 투여의 적합한 수단은 치료될 병태 또는 질환에 기반하고 대상체의 연령 및 병태에 따라 선택될 수 있다. 투여 용량 및 방법은 환자의 체중, 연령, 병태 등에 따라 달라질 수 있고, 당업자에 의해 필요에 따라 적합하게 선택될 수 있다. 임의의 특정 대상체에 대한 특이적 투여량 및 치료 레지멘은 의사의 판단에 따라 조정될 수 있다.
벡터 용액은 치료 유효량의 본원에 기재된 조성물을 포함할 수 있다. 이러한 유효량은 부분적으로, 투여되는 조성물의 효과, 또는 하나 초과의 제제의 사용되는 경우 조성물 및 하나 이상의 추가적인 활성 제제의 조합 효과에 따라 당업자에 의해 용이하게 결정될 수 있다. 치료 유효량은 조성물의 임의의 독소 또는 유해 효과가 치료적으로 유익한 효과를 능가하는 더 큰 양일 수 있다.
다양한 경우에, 벡터는 약제학적으로 허용되는 담체 또는 부형제를 포함하도록 제형화될 수 있다. 약제학적으로 허용되는 담체의 예는 생리학적으로 호환가능한 임의의 및 모든 용매, 분산 매질, 코팅, 항균제 및 항진균제, 등장성 및 흡수 지연제 등을 포함하나 이에 제한되지 않는다. 본 발명의 조성물은 약제학적으로 허용되는 염, 예를 들어, 산 부가 염 또는 염기 부가 염을 포함할 수 있다.
예시적인 일반적으로 사용되는 약제학적으로 허용되는 담체는 임의의 및 모든 흡수 지연제, 산화방지제, 결합제, 완충제, 증강제 또는 충전제, 킬레이트화제, 코팅제, 붕해제, 분산 매질, 겔, 등장성제, 윤활제, 보존제, 염, 용매 또는 공용매, 안정화제, 계면활성제, 및/또는 전달 비히클을 포함한다.
다양한 구현예에서, 본원에 기재된 바와 같은 벡터를 포함하는 조성물, 예를 들어, 주사용 멸균 제형은 주사용 증류수를 비히클로 사용하여 통상적인 약제학적 관행에 따라 제형화될 수 있다. 예를 들어, 생리 식염수 또는 글루코스 및 다른 보충물 예컨대 D-소르비톨, D-만노스, D-만니톨, 및 염화나트륨을 함유하는 등장성 용액은 임의적으로 적합한 가용화제, 예를 들어, 에탄올과 같은 알코올 및 프로필렌 글리콜 또는 폴리에틸렌 글리콜과 같은 폴리알코올, 및 폴리소르베이트 80™, HCO-50 등과 같은 비이온성 계면활성제와 조합하여, 주사용 수용액으로 사용될 수 있다.
예시적인 산화방지제는 아스코르브산, 메티오닌, 및 비타민 E를 포함한다.
예시적인 완충제는 시트레이트 완충제, 숙시네이트 완충제, 타르트레이트 완충제, 푸마레이트 완충제, 글루코네이트 완충제, 옥살레이트 완충제, 락테이트 완충제, 아세테이트 완충제, 포스페이트 완충제, 히스티딘 완충제, 및/또는 트리메틸아민 염을 포함한다.
예시적인 킬레이트화제는 EDTA이다.
예시적인 등장성제는 3가 또는 그 이상의 당을 포함하는 다가 당 알코올, 예컨대 글리세린, 에리트리톨, 아라비톨, 크실리톨, 소르비톨, 또는 만니톨을 포함한다.
예시적인 보존제는 페놀, 벤질 알코올, 메타-크레졸, 메틸 파라벤, 프로필 파라벤, 옥타데실디메틸벤질 암모늄 클로라이드, 벤잘코늄 할라이드, 헥사메토늄 클로라이드, 알킬 파라벤 예컨대 메틸 또는 프로필 파라벤, 카테콜, 레소르시놀, 사이클로헥사놀, 및 3-펜타놀을 포함한다.
안정화제는 증강제부터 활성 성분을 가용화하거나 또는 변성 또는 용기 벽에 부착을 방지하는 데 도움이 되는 첨가제까지 다양한 기능을 할 수 있는 광범위한 범주의 부형제를 지칭한다. 전형적인 안정화제는 다가 당 알코올; 아미노산, 예컨대 알라닌, 리신, 글리신, 글루타민, 아스파라긴, 히스티딘, 알라닌, 오르니틴, L-류신, 2-페닐알라닌, 글루탐산, 및 트레오닌; 유기 당 또는 당 알코올, 예컨대 락토스, 트레할로스, 스타키오스, 만니톨, 소르비톨, 크실리톨, 리비톨, 마이오이니시톨, 갈락티톨, 글리세롤, 및 사이클리톨, 예컨대 이노시톨; PEG; 아미노산 중합체; 황-함유 환원제, 예컨대 우레아, 글루타티온, 티옥트산, 나트륨 티오글리콜레이트, 티오글리세롤, α-모노티오글리세롤, 및 나트륨 티오술페이트; 저분자량 폴리펩티드(즉, 10 개 미만의 잔기); 단백질 예컨대 인간 혈청 알부민, 소 혈청 알부민, 젤라틴 또는 면역글로불린; 친수성 중합체 예컨대 폴리비닐피롤리돈; 단당류 예컨대 크실로스, 만노스, 프럭토스 및 글루코스; 이당류 예컨대 락토스, 말토스 및 수크로스; 삼당류 예컨대 라피노스, 및 다당류 예컨대 덱스트란을 포함할 수 있다. 안정화제는 전형적으로 치료 중량을 기준으로 0.1 내지 10,000 중량부의 범위로 존재한다.
본원에 개시된 제형은 예를 들어, 주사에 의한 투여를 위해 제형화될 수 있다. 주사를 위해, 제형은 수용액으로, 예컨대 행크스 용액, 링거 용액, 또는 생리 식염수를 포함하는 완충액, 또는 이스코브의 변형된 듀벨코 배지(IMDM)와 같은 배양 배지에서 제형화될 수 있다. 수용액은 현탁제, 안정화제, 및/또는 분산제와 같은 제형화제를 포함할 수 있다. 대안적으로, 제형은 사용 전에 적합한 비히클, 예를 들어, 멸균 무발열원수로 구성하기 위한 동결건조 및/또는 분말 형태일 수 있다.
본원에 개시된 임의의 제형은 유리하게는 투여 이익을 능가하는 상당히 유해하거나, 알레르기성이거나, 또는 다른 불리한 반응을 생성하지 않는 것들을 포함하는 임의의 다른 약제학적으로 허용되는 담체를 포함할 수 있다. 예시적인 약제학적으로 허용되는 담체 및 제형은 Remington's Pharmaceutical Sciences, 18th Ed. Mack Printing Company, 1990에 기재되어 있다. 더욱이, 제형은 US FDA 생물학적 표준 사무국(Office of Biological Standards) 및/또는 다른 관련한 외국 규제 기관에서 요구하는 멸균성, 발열성, 일반적인 안전성, 및 순도 표준을 충족시키도록 제조될 수 있다.
특정 구현예에서, 제형은 제형의 적어도 0.1% w/v 또는 w/w; 제형의 적어도 1% w/v 또는 w/w; 제형의 적어도 10% w/v 또는 w/w; 제형의 적어도 20% w/v 또는 w/w; 제형의 적어도 30% w/v 또는 w/w; 제형의 적어도 40% w/v 또는 w/w; 제형의 적어도 50% w/v 또는 w/w; 제형의 적어도 60% w/v 또는 w/w; 제형의 적어도 70% w/v 또는 w/w; 제형의 적어도 80% w/v 또는 w/w; 제형의 적어도 90% w/v 또는 w/w; 제형의 적어도 95% w/v 또는 w/w; 또는 제형의 적어도 99% w/v 또는 w/w의 활성 성분을 포함한다.
특정 대상체에게 투여되는 Ad35 바이러스 벡터 및, 특정 구현예에서, Ad35 바이러스 벡터 및 동원 인자의 실제 용량 및 양 및 일치하는 동원 절차 및 일정은 예를 들어, 표적; 체중; 병태 유형; 병태 중증도; 알려진 경우 예정된 관련 사건; 이전 또는 동시 치료 개입; 대상체의 특발성; 및 투여 경로를 포함하는 물리적 및 생리학적 인자와 같은 매개변수를 고려하여 의사, 수의사, 또는 연구자에 의해 결정될 수 있다. 또한, 시험관내 및 생체내 검정은 임의적으로 최적의 투여량 범위를 식별하는 것을 돕기 위해 이용될 수 있다.
치료 유전자와 연관된 Ad35 벡터의 치료 유효량은 예를 들어, 1 x 107 내지 50 x 108 감염 단위(IU) 또는 5 x 107 내지 20 x 108 IU 범위의 용량을 포함할 수 있다. 다른 예에서, 용량은 5 x 107 IU, 6 x 107 IU, 7 x 107 IU, 8 x 107 IU, 9 x 107 IU, 1 x 108 IU, 2 x 108 IU, 3 x 108 IU, 4 x 108 IU, 5 x 108 IU, 6 x 108 IU, 7 x 108 IU, 8 x 108 IU, 9 x 108 IU, 10 x 108 IU, 또는 그 이상을 포함할 수 있다. 특정 구현예에서, 치료 유전자와 연관된 Ad35 벡터의 치료 유효량은 4 x 108 IU를 포함한다. 특정 구현예에서, 치료 유전자와 연관된 Ad35 벡터의 치료 유효량은 피하로 또는 정맥내로 투여될 수 있다. 특정 구현예에서, 치료 유전자와 연관된 Ad35 벡터의 치료 유효량은 하나 이상의 동원 인자와 함께 투여 후 투여될 수 있다.
본 개시내용의 다양한 구현예에서, 생체내 유전자 요법은 적어도 하나의 바이러스 유전자 요법 벡터를 적어도 하나의 면역 억제 레지멘과 조합하여 대상체에게 투여하는 것을 포함한다. 지지 벡터인 제2 벡터와 조합된 지지된 바이러스 유전자 요법 벡터인 제1 벡터와 같은 하나 초과의 벡터 종을 포함하는 생체내 유전자 요법에서, 제1 벡터 및 제2 벡터는 단일 제형 또는 투여 형태 또는 2 개의 별개의 제형 또는 투여 형태로 투여될 수 있다. 다양한 구현예에서, 제1 및 제2 벡터는 동시에 또는 상이한 시간에, 예를 들어, 동일한 1 시간 기간 동안 또는 중첩하지 않는 1 시간 기간 동안 투여될 수 있다. 다양한 구현예에서, 제1 및 제2 벡터는 동시에 또는 상이한 시간에, 예를 들어, 동일한 날 또는 상이한 날에 투여될 수 있다. 다양한 구현예에서, 제1 및 제2 벡터는 예를 들어, 투여량이 총 바이러스 입자 수 또는 대상체의 킬로그램 당 바이러스 입자의 수로 측정되는 경우 동일한 투여량 또는 상이한 투여량으로 투여될 수 있다. 다양한 구현예에서, 제1 및 제2 벡터는 미리 정의된 비율로 투여될 수 있다. 다양한 구현예에서, 비율은 2:1 내지 1:2 범위 내, 예를 들어, 1:1이다.
다양한 구현예에서, 벡터는 하루에 단일 총 용량으로 대상체에게 투여된다. 다양한 구현예에서 벡터는 함께 총 용량을 구축하는 2, 3, 4, 또는 그 이상의 단위 용량으로 투여된다. 다양한 구현예에서, 벡터의 1 단위 용량은 1 일, 2 일, 3 일, 4 일, 또는 그 이상의 연속 일 각각에 하루에 대상체에게 투여된다. 다양한 구현예에서, 벡터의 2 단위 용량은 1 일, 2 일, 3 일, 4 일, 또는 그 이상의 연속 일 각각에 하루에 대상체에게 투여된다. 따라서, 다양한 구현예에서, 일일 용량은 하루에 걸쳐 대상체가 받는 벡터의 용량을 지칭할 수 있다. 다양한 구현예에서, 용어 일은 첫번째 달력 날짜의 자정부터 다음 달력 날짜의 자정까지 24 시간 기간과 같은 24 시 기간을 지칭한다.
다양한 구현예에서, 바이러스 유전자 요법 벡터 또는 지지 벡터와 같은 벡터의 단위 용량, 일일 용량, 또는 총 용량, 또는 바이러스 유전자 요법 벡터 및 지지 벡터의 총 조합 용량은 킬로그램 당 적어도 1E8, 5E8, 1E9, 5E9, 1E10, 5E10, 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14, 또는 1E15 바이러스 입자(vp/kg)일 수 있다. 다양한 구현예에서, 바이러스 유전자 요법 벡터 또는 지지 벡터와 같은 벡터의 단위 용량, 일일 용량, 또는 총 용량, 또는 바이러스 유전자 요법 벡터 및 지지 벡터의 총 조합 용량은 1E8, 5E8, 1E9, 5E9, 1E10, 5E10, 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14, 또는 1E15 vp/kg으로부터 선택된 하한 및 1E8, 5E8, 1E9, 5E9, 1E10, 5E10, 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14, 또는 1E15 vp/kg으로부터 선택된 상한을 갖는 범위 내에 속할 수 있다.
다양한 구현예에서, 바이러스 유전자 요법 벡터는 적어도 1E10, 5E10, 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14, 또는 1E15 vp/kg의 단위 용량, 일일 용량, 또는 총 용량으로 투여되고 지지 벡터는 적어도 1E8, 5E8, 1E9, 5E9, 1E10, 5E10, 1E11, 및 5E11 vp/kg의 단위 용량, 일일 용량, 또는 총 용량으로 투여되며, 임의적으로 여기서 바이러스 유전자 요법 벡터의 단위 용량, 일일 용량, 또는 총 용량은 1E10, 5E10, 1E11, 5E11, 1E12, 및 5E12, vp/kg으로부터 선택된 하한 및 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14, 및 1E15 vp/kg으로부터 선택된 상한을 갖는 범위 내에 있고/있거나, 지지 벡터의 단위 용량, 일일 용량, 또는 총 용량은 1E8, 5E8, 1E9, 5E9, 1E10, 및 5E10 vp/kg으로부터 선택된 하한 및 1E9, 5E9, 1E10, 5E10, 1E11, 및 5E11 vp/kg으로부터 선택된 상한을 갖는 범위 내에 있다.
다양한 구현예에서, 지지 벡터는 적어도 1E10, 5E10, 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14, 또는 1E15 vp/kg의 단위 용량, 일일 용량, 또는 총 용량으로 투여되고 지지된 바이러스 유전자 요법 벡터는 적어도 1E8, 5E8, 1E9, 5E9, 1E10, 5E10, 1E11, 및 5E11 vp/kg의 단위 용량, 일일 용량, 또는 총 용량으로 투여되며, 임의적으로 여기서 지지 벡터의 단위 용량, 일일 용량, 또는 총 용량은 1E10, 5E10, 1E11, 5E11, 1E12, 및 5E12, vp/kg으로부터 선택된 하한 및 1E11, 5E11, 1E12, 5E12, 1E13, 5E13, 1E14, 및 1E15 vp/kg으로부터 선택된 상한을 갖는 범위 내에 있고/있거나, 지지된 바이러스 유전자 요법 벡터의 단위 용량, 일일 용량, 또는 총 용량은 1E8, 5E8, 1E9, 5E9, 1E10, 및 5E10 vp/kg으로부터 선택된 하한 및 1E9, 5E9, 1E10, 5E10, 1E11, 및 5E11 vp/kg으로부터 선택된 상한을 갖는 범위 내에 있다. 다양한 구현예에서, 지지된 바이러스 유전자 요법 벡터 및 지지 벡터는 미리 정의된 비율로 투여된다. 다양한 구현예에서, 비율은 2:1 내지 1:2 범위 내, 예를 들어, 1:1이다.
IV. 적용
본원에 제공된 방법 및 조성물은 적어도 부분적으로 생체내 유전자 요법에 사용하기 위해 개시된다. 그러나, 의심의 여지를 피하기 위해, 본 개시내용은 세포 및/또는 조직의 생체외 조작, 뿐만 아니라 연구 목적을 위한 세포 및/또는 조직의 조작을 포함하는 시험관내 사용을 위해 본원에 제공된 조성물 및 방법의 사용을 명시적으로 포함한다. 유전자 요법은 외인성 DNA를 숙주 세포(예컨대 표적 세포) 및/또는 핵산(예컨대 표적 핵산, 예컨대 표적 게놈, 예를 들어, 표적 세포의 게놈) 내로 도입하는 방법에서 본 개시내용의 벡터, 게놈, 또는 시스템의 사용을 포함한다. 본 개시내용은 당업자가 본원에 제공된 다양한 방법 및 조성물이 일반적으로 핵산 페이로드를 대상체, 예를 들어, 숙주 또는 표적 세포 내로 도입하도록 적용가능함을 이해하는 생체내, 시험관내, 및 생체외 요법과 관련한 조성물 및 방법의 설명 및 예시를 포함한다. 이러한 조성물 및 방법은 예를 들어, 유전자 요법에서 일반적으로 유용하기 때문에, 일반적으로 유전자 요법 및 본원에 제공된 것들을 포함하는 특히 다양한 특정 조건에서 모두 도구로서 유용하다.
IV(A). 생체내 유전자 요법
바이러스 벡터를 환자에게 직접 전달하는 것을 포함하는 생체내 유전자 요법을 사용한 치료가 탐구되었다. 생체내 유전자 요법은 임의의 유전자독성 조건화(또는 유전자독성 조건화가 덜 요구될 수 있거나) 또는 생체외 세포 처리를 필요로 하지 않을 수 있기 때문에 매력적인 접근법이며 따라서 백신의 전달을 위해 이미 전 세계적으로 수행되는 것과 유사한 주사를 통해 요법이 투여될 수 있으므로, 개발도상국을 포함하여 전세계적으로 많은 기관에서 채택될 수 있다. 다양한 구현예에서 본 개시내용의 아데노바이러스 벡터를 사용한 생체내 유전자 요법 방법은 (i) 표적 세포 동원, (ii) 면역억제, (iii) 본원에 제공된 벡터, 게놈, 시스템 또는 제형의 투여, 및/또는 (iv) 형질도입된 세포 및/또는 아데노바이러스 벡터 또는 게놈의 페이로드의 통합요소를 통합한 세포의 선택 중 하나 이상의 단계를 포함할 수 있다.
본원에 개시된 아데노바이러스 벡터 제형은 대상체(인간, 수의학 동물(개, 고양이, 파충류, 조류 등), 가축(말, 소, 염소, 돼지, 닭 등), 및 연구 동물(원숭이, 래트, 마우스, 어류 등)을 치료하기 위해 사용될 수 있다. 대상체를 치료하는 것은 치료 유효량의 본 개시내용의 하나 이상의 벡터, 게놈, 또는 시스템을 전달하는 것을 포함한다. 치료 유효량은 유효량, 예방적 치료, 및/또는 치료적 치료를 제공하는 것을 포함한다.
IV(A)i. HSC의 동원
본원에 기재된 벡터는 동원 인자와 함께 투여될 수 있다. 특정 구현예에서, 본원에 기재된 아데노바이러스 벡터 제형은 HSPC 동원과 협력하여 투여될 수 있다. 특정 구현예에서, 아데노바이러스 공여자 벡터의 투여는 하나 이상의 동원 인자의 투여와 동시에 발생한다. 특정 구현예에서, 아데노바이러스 공여자 벡터의 투여는 하나 이상의 동원 인자의 투여 후에 수행된다. 특정 구현예에서, 아데노바이러스 공여자 벡터의 투여는 첫번째 하나 이상의 동원 인자의 투여 후에 수행되고 두번째 하나 이상의 동원 인자의 투여와 동시에 발생한다. HSPC 동원을 위한 제제는 예를 들어, 과립구-콜로니 자극 인자(G-CSF), 과립구 대식세포 콜로니 자극 인자(GM-CSF), AMD3100, SCF, S-CSF, CXCR4 길항제, CXCR2 작용제, 및 Gro-베타(GRO-β)를 포함한다. 다양한 구현예에서, CXCR4 길항제는 AMD3100이고/이거나 CXCR2 작용제는 GRO-β이다.
G-CSF는 HSPC 동원에서의 기능이 과립구 확장의 촉진 및 접착 분자의 프로테아제-의존적 및 독립적 감쇠 및 SDF-1/CXCR4 축의 파괴 둘 다를 포함할 수 있는 사이토카인이다. 특정 구현예에서, 당업자에게 알려진 임의의 상업적으로 이용가능한 형태의 G-CSF, 예를 들어, 필그라스팀(Filgrastim)(Neupogen®, Amgen Inc., 캘리포니아주 사우전드 오크스 소재) 및 PEGy길화 필그라스팀(페그필그라스팀(Pegfilgrastim), NEULASTA®, Amgen Inc., 캘리포니아주 사우전드 오크스 소재)이 본원에 개시된 바와 같은 방법 및 제형에 사용될 수 있다.
GM-CSF는 사이토카인으로 기능하며 대식세포, T 세포, 비만 세포, 자연 살해 세포, 내피 세포, 및 섬유모세포에 의해 자연적으로 분비되는 콜로니-자극 인자 2(CSF2)로도 알려진 단량체성 당단백질이다. 특정 구현예에서, 당업자에게 알려진 임의의 상업적으로 이용가능한 형태의 GM-CSF, 예를 들어, 사르그라모스팀(Sargramostim)(Leukine, Bayer Healthcare Pharmaceuticals, 워싱턴주 시애틀 소재) 및 몰그라모스팀(molgramostim)(Schering-Plough, 뉴저지주 케닐워스 소재)은 본원에 개시된 바와 같은 방법 및 제형에 사용될 수 있다.
비사이클람 클래스의 합성 유기 분자인 AMD3100(MOZOBIL™, PLERIXAFOR™; Sanofi-Aventis, 프랑스 파리 소재)은 케모카인 수용체 길항제이며 CXCR4에 대한 SDF-1 결합을 가역적으로 억제하여, HSPC 동원을 촉진한다. AMD3100은 골수종 및 림프종 환자에서 HSPC 동원을 위해 G-CSF와 조합하여 사용되도록 승인되었다. AMD3100의 구조는 하기와 같다:
Figure pct00016
KIT 리간드, KL, 또는 강철 인자로도 알려져 있는 SCF는 c-kit 수용체(CD117)에 결합하는 사이토카인이다. SCF는 막관통 단백질 및 가용성 단백질 둘 다에 존재할 수 있다. 이 사이토카인은 조혈, 정자생성, 및 멜라닌생성에서 중요한 역할을 한다. 특정 구현예에서, 당업자에게 알려진 임의의 상업적으로 이용가능한 형태의 SCF, 예를 들어, 재조합 인간 SCF(안세스팀(Ancestim), STEMGEN®, Amgen Inc., 캘리포니아주 사우전드 오크스 소재)는 본원에 개시된 바와 같은 방법 및 제형에 사용될 수 있다.
집중적인 골수억제 치료에 사용되는 화학요법은 또한 화학요법-유도된 무형성증에 따른 보상 호중구 생성의 결과로 HSPC를 말초 혈액으로 동원한다. 특정 구현예에서, HSPC의 동원을 위해 사용될 수 있는 화학치료제는 사이클로포스파미드, 에토포시드, 이포스파미드, 시스플라틴, 및 사이타라빈을 포함한다.
세포 동원을 위해 사용될 수 있는 추가적인 제제는 다음을 포함한다: CXCL12/CXCR4 조절인자(예를 들어, CXCR4 길항제: POL6326(Polyphor, 스위스 알슈빌 소재), CXCR4를 가역적으로 억제하는 합성 환형 펩티드; BKT-140(4F-벤조일-TN14003; Biokine Therapeutics, 이스라엘 레호보트 소재); TG-0054(Taigen Biotechnology, 태국 타이베이 소재); SDF-1에 결합하여, CXCR4)에 대한 결합을 억제하는 CXCL12 중화제 NOX-A12(NOXXON Pharma, 독일 베를린 소재); 스핑고신-1-포스페이트(S1P) 작용제(예를 들어, SEW2871, Juarez 등 Blood 119: 707-716, 2012); 혈관 세포 접착 분자-1(VCAM) 또는 매우 후기 항원 4(VLA-4) 억제제(예를 들어, VLA-4의 α4 서브유닛에 대한 재조합 인간화 단클론 항체인 나탈리주맙(Zohren 등 Blood 111: 3893-3895, 2008); VLA-4의 소분자 억제제인 BIO5192(Ramirez 등 Blood 114: 1340-1343, 2009)); 파라갑상선 호르몬(Brunner 등 Exp Hematol. 36: 1157-1166, 2008); 프로테아좀 억제제(예를 들어, 보르테조밉, Ghobadi 등 ASH Annual Meeting Abstracts. p. 583, 2012); CXCR2 수용체에 대한 결합에 의해 호중구의 화학주성 및 활성화를 자극하는 CXC 케모카인 패밀리의 구성원인 Groβ(예를 들어, SB-251353, King 등 Blood 97: 1534-1542, 2001); 저산소증 유도성 인자(HIF)의 안정화(예를 들어, FG-4497, Forristal 등 ASH Annual Meeting Abstracts. p. 216, 2012); α4β1 및 α4β7 인테그린 억제제(α4β1/7)인 피라테그라스트(Kim 등 Blood 128: 2457-2461, 2016); α4β7 인테그린에 대한 인간화 단클론 항체인 베돌리주맙(Vedolizumab)(Rosario 등 Clin Drug Investig 36: 913-923, 2016); 및 인테그린 α9β1/α4β1을 표적화하는 BOP(N-(벤젠술포닐)-L-프롤릴-L-O-(1-피롤리디닐카르보닐) 티로신)(Cao 등 Nat Commun 7: 11007, 2016). HSPC 동원을 위해 사용될 수 있는 추가적인 제제는 예를 들어, Richter R 등 Transfus Med Hemother 44:151-164, 2017, Bendall & Bradstock, Cytokine & Growth Factor Reviews 25: 355-367, 2014, WO 2003043651, WO 2005017160, WO 2011069336, US 5,637,323, US 7,288,521, US 9,782,429, US 2002/0142462, 및 US 2010/02268에 기재되어 있다.
특정 구현예에서, G-CSF의 치료 유효량은 0.1 μg/kg 내지 100 μg/kg을 포함한다. 특정 구현예에서, G-CSF의 치료 유효량은 0.5 μg/kg 내지 50 μg/kg을 포함한다. 특정 구현예에서, G-CSF의 치료 유효량은 0.5 μg/kg, 1 μg/kg, 2 μg/kg, 3 μg/kg, 4 μg/kg, 5 μg/kg, 6 μg/kg, 7 μg/kg, 8 μg/kg, 9 μg/kg, 10 μg/kg, 11 μg/kg, 12 μg/kg, 13 μg/kg, 14 μg/kg, 15 μg/kg, 16 μg/kg, 17 μg/kg, 18 μg/kg, 19 μg/kg, 20 μg/kg, 또는 그 이상을 포함한다. 특정 구현예에서, G-CSF의 치료 유효량은 5 μg/kg을 포함한다. 특정 구현예에서, G-CSF는 피하로 또는 정맥내로 투여될 수 있다. 특정 구현예에서, G-CSF는 1 일, 2 일 연속, 3 일 연속, 4 일 연속, 5 일 연속, 또는 그 이상 동안 투여될 수 있다. 특정 구현예에서, G-CSF는 4 일 연속 동안 투여될 수 있다. 특정 구현예에서, G-CSF는 5 일 연속 동안 투여될 수 있다. 특정 구현예에서, 단일 제제로서, G-CSF는 Ad35 전달 3, 4, 5, 6, 7, 또는 8 일 전에 시작하여, 매일 피하로 10 μg/kg의 용량으로 사용될 수 있다. 특정 구현예에서, G-CSF는 단일 제제로서 투여된 후 또 다른 동원 인자와 동시 투여될 수 있다. 특정 구현예에서, G-CSF는 단일 제제로 투여된 후 AMD3100과 동시 투여될 수 있다. 특정 구현예에서, 치료 프로토콜은 G-CSF가 1 일, 2 일, 3 일, 및 4 일 및 5 일에 투여될 수 있는 경우 5 일 치료를 포함하며, G-CSF 및 AMD3100은 Ad35 투여 6 내지 8 시간 전에 투여된다.
투여될 GM-CSF의 치료 유효량은 예를 들어, 0.1 내지 50 μg/kg 또는 0.5 내지 30 μg/kg 범위의 용량을 포함할 수 있다. 특정 구현예에서, GM-CSF가 투여될 수 있는 용량은 0.5 μg/kg, 1 μg/kg, 2 μg/kg, 3 μg/kg, 4 μg/kg, 5 μg/kg, 6 μg/kg, 7 μg/kg, 8 μg/kg, 9 μg/kg, 10 μg/kg, 11 μg/kg, 12 μg/kg, 13 μg/kg, 14 μg/kg, 15 μg/kg, 16 μg/kg, 17 μg/kg, 18 μg/kg, 19 μg/kg, 20 μg/kg, 또는 그 이상을 포함한다. 특정 구현예에서, GM-CSF는 1 일, 2 일 연속, 3 일 연속, 4 일 연속, 5 일 연속, 또는 그 이상 동안 피하로 투여될 수 있다. 특정 구현예에서, GM-CSF는 피하로 또는 정맥내로 투여될 수 있다. 특정 구현예에서, GM-CSF는 Ad35 전달 3, 4, 5, 6, 7, 또는 8 일 전에 시작하여 매일 피하로 10 μg/kg의 용량으로 투여될 수 있다. 특정 구현예에서, GM-CSF는 단일 제제로서 투여된 후 또 다른 동원 인자와 통시 투여될 수 있다. 특정 구현예에서, GM-CSF는 단일 제제로서 투여된 후 AMD3100과 동시 투여될 수 있다. 특정 구현예에서, 치료 프로토콜은 GM-CSF가 1 일, 2 일, 3 일, 및 4 일 및 5 일에 투여될 수 있는 경우 5 일 치료를 포함하며, GM-CSF 및 AMD3100은 Ad35 투여 6 내지 8 시간 전에 투여된다. 사르그라모스팀에 대한 투약 레지멘은 200 μg/m2, 210 μg/m2, 220 μg/m2, 230 μg/m2, 240 μg/m2, 250 μg/m2, 260 μg/m2, 270 μg/m2, 280 μg/m2, 290 μg/m2, 300 μg/m2, 또는 그 이상을 포함할 수 있다. 특정 구현예에서, 사르그라모스팀은 1 일, 2 일 연속, 3 일 연속, 4 일 연속, 5 일 연속, 또는 그 이상 동안 투여될 수 있다. 특정 구현예에서, 사르그라모스팀은 피하로 또는 정맥내로 투여될 수 있다. 특정 구현예에서, 사르그라모스팀에 대한 투약 레지멘은 250 μg/m2/일 정맥내 또는 피하를 포함할 수 있고 표적화된 세포 양이 말초 혈액에서 도달할 때까지 계속될 수 있거나 또는 5 일 동안 계속될 수 있다. 특정 구현예에서, 사르그라모스팀은 단일 제제로서 투여된 후 또 다른 동원 인자와 동시 투여될 수 있다. 특정 구현예에서, 사르그라모스팀은 단일 제제로서 투여된 후 AMD3100과 동시 투여될 수 있다. 특정 구현예에서, 치료 프로토콜은 사르그라모스팀이 1 일, 2 일, 3 일, 및 4 일 및 5 일에 투여될 수 있는 경우 5 일 치료를 포험마며, 사르그라모스팀 및 AMD3100은 Ad35 투여 6 내지 8 시간 전에 투여된다.
특정 구현예에서, AMD3100의 치료 유효량은 0.1 mg/kg 내지 100 mg/kg을 포함한다. 특정 구현예에서, AMD3100의 치료 유효량은 0.5 mg/kg 내지 50 mg/kg을 포함한다. 특정 구현예에서, AMD3100의 치료 유효량은 0.5 mg/kg, 1 mg/kg, 2 mg/kg, 3 mg/kg, 4 mg/kg, 5 mg/kg, 6 mg/kg, 7 mg/kg, 8 mg/kg, 9 mg/kg, 10 mg/kg, 11 mg/kg, 12 mg/kg, 13 mg/kg, 14 mg/kg, 15 mg/kg, 16 mg/kg, 17 mg/kg, 18 mg/kg, 19 mg/kg, 20 mg/kg, 또는 그 이상을 포함한다. 특정 구현예에서, AMD3100의 치료 유효량은 4 mg/kg을 포함한다. 특정 구현예에서, AMD3100의 치료 유효량은 5 mg/kg을 포함한다. 특정 구현예에서, AMD3100의 치료 유효량은 10 μg/kg 내지 500 μg/kg 또는 50 μg/kg 내지 400 μg/kg을 포함한다. 특정 구현예에서, AMD3100의 치료 유효량은 100 μg/kg, 150 μg/kg, 200 μg/kg, 250 μg/kg, 300 μg/kg, 350 μg/kg, 또는 그 이상을 포함한다. 특정 구현예에서, AMD3100은 피하로 또는 정맥내로 투여될 수 있다. 특정 구현예에서, AMD3100은 Ad35 전달 6 내지 11 시간 전에 160-240 μg/kg으로 피하로 투여될 수 있다. 특정 구현예에서, AMD3100의 치료 유효량은 또 다른 동원 인자의 투여와 동시에 투여될 수 있다. 특정 구현예에서, AMD3100의 치료 유효량은 또 다른 동원 인자의 투여 후에 투여될 수 있다. 특정 구현예에서, AMD3100의 치료 유효량은 G-CSF의 투여 후에 투여될 수 있다. 특정 구현예에서, 치료 프로토콜은 G-CSF가 1 일, 2 일, 3 일, 및 4 일 및 5 일에 투여되는 경우 5-일 치료를 포함하며, G-CSF 및 AMD3100은 Ad35 주사 6 내지 8 시간 전에 투여된다.
투여될 SCF의 치료 유효량은 예를 들어, 0.1 내지 100 μg/kg/일 또는 0.5 내지 50 μg/kg/일 범위의 용량을 포함할 수 있다. 특정 구현예에서, SCF가 투여될 수 있는 용량은 0.5 μg/kg/일, 1 μg/kg/일, 2 μg/kg/일, 3 μg/kg/일, 4 μg/kg/일, 5 μg/kg/일, 6 μg/kg/일, 7 μg/kg/일, 8 μg/kg/일, 9 μg/kg/일, 10 μg/kg/일, 11 μg/kg/일, 12 μg/kg/일, 13 μg/kg/일, 14 μg/kg/일, 15 μg/kg/일, 16 μg/kg/일, 17 μg/kg/일, 18 μg/kg/일, 19 μg/kg/일, 20 μg/kg/일, 21 μg/kg/일, 22 μg/kg/일, 23 μg/kg/일, 24 μg/kg/일, 25 μg/kg/일, 26 μg/kg/일, 27 μg/kg/일, 28 μg/kg/일, 29 μg/kg/일, 30 μg/kg/일, 또는 그 이상을 포함한다. 특정 구현예에서, SCF는 1 일, 2 일 연속, 3 일 연속, 4 일 연속, 5 일 연속, 또는 그 이상 동안 투여될 수 있다. 특정 구현예에서, SCF는 피하로 또는 정맥내로 투여될 수 있다. 특정 구현예에서, SCF는 20 μg/kg/일로 피하로 주사될 수 있다. 특정 구현예에서, SCF는 단일 제제로서 투여된 후 또 다른 동원 인자와 동시 투여될 수 있다. 특정 구현예에서, SCF는 단일 제제로서 투여된 후 AMD3100과 동시 투여될 수 있다. 특정 구현예에서, 치료 프로토콜은 SCF가 1 일, 2 일, 3 일, 4 일 및 5 일에 투여될 수 있는 경우 5 일 치료를 포함하며, SCF 및 AMD3100은 Ad35 투여 6 내지 8 시간 전에 투여된다.
특정 구현예에서, 성장 인자 GM-CSF 및 G-CSF는 골수 틈새에서 HSPC를 말초 순환 혈액에 동원하여 혈액에서 순환하는 HSPC의 분획을 증가시키기 위해 투여될 수 있다. 특정 구현예에서, 동원은 G-CSF/필그라스팀(Amgen) 및/또는 AMD3100(Sigma)의 투여로 달성될 수 있다. 특정 구현예에서, 동원은 GM-CSF/사르그라모스팀(Amgen) 및/또는 AMD3100(Sigma)의 투여로 달성될 수 있다. 특정 구현예에서, 동원은 SCF/안세스팀(Ancestim)(Amgen) 및/또는 AMD3100(Sigma)의 투여로 달성될 수 있다. 특정 구현예에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여에 선행한다. 특정 구현예에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여와 동시에 발생한다. 특정 구현예에서, G-CSF/필그라스팀의 투여는 AMD3100의 투여에 선행한 후, G-CSF/필그라스팀 및 AMD3100이 동시 투여된다. US 20140193376은 S1P 수용체 1(S1PR1) 조절인자 제제와 함께 CXCR4 길항제를 활용하는 동원 프로토콜을 기재한다. US 20110044997은 혈관 내피 성장 인자 수용체(VEGFR) 작용제와 함께 CXCR4 길항제를 활용하는 동원 프로토콜을 기재한다.
Ad35 바이러스 벡터는 HSPC 동원과 협력하여 투여될 수 있는 벡터의 예이다. 특정 구현예에서, Ad35 바이러스 벡터의 투여는 하나 이상의 동원 인자의 투여와 동시에 발생한다. 특정 구현예에서, Ad35 바이러스 벡터의 투여는 하나 이상의 동원 인자의 투여 후에 수행된다. 특정 구현예에서, Ad35 바이러스 벡터의 투여는 첫번째 하나 이상의 동원 인자의 투여 후에 수행되고 두번째 하나 이상의 동원 인자의 투여와 동시에 발생한다.
특정 구현예에서, CD19 면역독소 또는 5-FU와 같은 HSC 강화제는 HSPC를 강화하기 위해 투여될 수 있다. CD19 면역독소는 골수 세포의 30%를 차지하는 모든 CD19 계통 세포를 고갈시키는 데 사용될 수 있다. 고갈은 골수로부터 빠져나가는 것을 부추긴다. HSPC가 증식하도록 강제함으로써(5-FU의 CD19 면역독소를 통해서든, 이는 분화를 자극하고 골수로부터 빠져나가고 말초 혈액 세포에서 이식유전자 마킹을 증가시킨다.
치료 유효량은 주사, 주입, 관류에 의한 것과 같은 임의의 적절한 투여 경로를 통해, 보다 특히 골수, 정맥내, 피내, 동맥내, 결절내, 림프내, 복강내 주사, 주입, 또는 관류 중 하나 이상에 의한 투여에 의해 투여될 수 있다).
IV(A)ii. 면역억제 레지멘
Ad35 바이러스 벡터는 하나 이상의 스테로이드, IL-1 수용체 길항제, 및/또는 IL-6 수용체 길항제 투여를 포함할 수 있는, 하나 이상의 면역억제제 또는 면역억제 레지멘의 투여와 동시에 또는 투여 후에 투여될 수 있다. 이러한 프로토콜은 치료의 잠재적인 부작용을 완화할 수 있다.
IL-1 수용체 길항제는 알려져 있고 ADC-1001(Alligator Bioscience), FX-201(Flexion Therapeutics), Bioasis Technologies로부터 이용가능한 융합 단백질인 GQ-303(Genequine Biotherapeutics GmbH), HL-2351(Handok, Inc.), MBIL-1RA(ProteoThera, Inc.), Anakinra(Pivor Pharmaceuticals), 인간 면역글로빈 G 또는 글로불린 S(GC Pharma)를 포함한다. IL-6 수용체 길항제는 또한 당업계에 알려져 있고 토실리주맙, BCD-089(Biocad), HS-628(Zhejiang Hisun Pharm), 및 APX-007(Apexigen)을 포함한다.
다양한 구현예에서, 면역 억제 레지멘은 또한 적어도 하나의 바이러스 유전자 요법 벡터를 받는 대상체에게 투여되며, 여기서 면역 억제 레지멘은 (i) 대상체에게 제1 용량의 바이러스 유전자 요법 벡터를 투여하기 1 일 이상 전; (ii) 제1 용량의 바이러스 유전자 요법 벡터의 투여와 동일한 날; (iii) 하나 이상의 제2 또는 다른 후속 용량의 바이러스 유전자 요법 벡터의 투여와 동일한 날; 및/또는 (iv) 대상체에게 제1 용량의 바이러스 유전자 요법 벡터의 투여 및 제2 또는 다른 후속 용량의 바이러스 유전자 요법 벡터의 임의의 하나 이상, 또는 전부의 투여 사이에 개입하는 임의의 하나 이상, 또는 모든 일에 대상체에게 적어도 하나의 면역 억제제 투여를 포함한다.
면역억제 레지멘은 예를 들어, 미국 가출원 번호 제63/009,218호에 추가로 기재되어 있으며, 이는 특히 면역억제 레지멘과 관련하여 그 전문이 본원에 참조로 포함된다.
IV(A)iii. 선택
특정 구현예에서, 사용 방법은 교정된 세포가 비-교정된 세포에 비해 선택적 이점을 갖는 병태의 치료를 포함한다. Ad35 바이러스 벡터는 HSPC 동원과 협력하고 생체내 선택 카세트(들)와 상응하는 선택제의 투여 전에 투여될 수 있는 벡터의 예이다. 특정 구현예는 본원에 기재된 Ad35 벡터 및 MGMTP140K 카세트를 포함하는 Ad35의 경우 BCNU 또는 벤질구아닌 및 테모졸로미드 및/또는 항-CD33 카세트를 포함하는 Ad35 벡터의 경우 CD33-표적화 분자의 투여와 동원(예를 들어, 본원에 기재된 동원 프로토콜)을 조합한다.
특정 구현예에서, 생체내 Ad35-매개 유전자 전달(동원이 있거나 또는 없이)은 생체내 선택 마커와 조합될 수 있다. 특정 구현예에서, 생체내 선택 마커는 Olszko 등, Gene Therapy 22: 591-595, 2015에 기재된 바와 같은 MGMTP140K를 포함할 수 있다.
인간 알킬 구아닌 트랜스퍼라제(hAGT)를 암호화하는 약물 내성 유전자 MGMT는 니트로소우레아 및 테모졸로미드(TMZ)와 같은 알킬화제의 세포독성 효과에 내성을 부여하는 DNA 복구 단백질이다. 6-벤질구아닌(6-BG)은 니트로소우레아 독성을 강화하는 AGT의 억제제이며 이 제제의 세포독성 효과를 강화하기 위해 TMZ와 공동 투여된다. AGT의 변이체를 암호화하는 MGMT의 여러 돌연변이체 형태는 6-BG에 의한 불활성화에 고도로 내성이지만, DNA 손상을 복구하는 능력을 유지한다(Maze 등 J. Pharmacol. Exp. Ther. 290: 1467-1474, 1999). MGMTP140K-기반 약물 내성 유전자 요법은 마우스, 개, 레서스 원숭이, 및 인간 세포, 구체적으로 조혈 세포에 화학보호를 부여하는 것으로 나타났다(Zielske 등 J. Clin. Invest. 112: 1561-1570, 2003; Pollok 등 Hum. Gene Ther. 14: 1703-1714, 2003; Gerull 등 Hum. Gene Ther. 18: 451-456, 2007; Neff 등 Blood 105: 997-1002, 2005; Larochelle 등 Clin. Invest. 119: 1952-1963, 2009; Sawai 등 Mol. Ther. 3: 78-87, 2001).
특정 구현예에서, 생체내 선택 마커와의 조합은 유전자-교정된 세포의 선택적 이점 없이 질환에 대한 주요한 구성요소가 될 것이다. 예를 들어, SCID 및 일부 다른 면역결핍 및 FA에서, 교정된 세포는 이점을 가지며 치료 유전자를 "약간의" HSPC 내로 형질도입하는 것만으로도 치료 효능에 충분하다. 세포가 경쟁적 이점을 입증하 않는 혈색소병증(즉, 겸상적혈구병 및 지중해빈혈)과 같은 다른 질환의 경우, MGMTP140K와 같은 생체내 선택 마커와 조합하는 것과 같은 유전자 교정된 세포의 생체내 선택은 약간의 형질도입된 HSPC를 선택하여, 유전자 교정된 세포에서의 증가를 허용하고 치료 효능을 달성하기 위함이다. 이 접근법은 또한 HSPC가 생체외 유전적 변형보다는 생체내에서 HIV에 내성을 가짐으로써 HIV에 적용될 수 있다.
추가적인 접근법이 또한 사용될 수 있다. 예를 들어, 본 개시내용은 유전적으로 변형된 치료 세포에서 CD33 발현을 선택적으로 감소시키는 동시에 치료 유전자를 제공하기 위해 세포를 유전적으로 변형시키는 시스템 및 방법을 활용할 수 있다. 이 방식에서, 유전적으로 변형된 치료 세포는 환자가 받을 수 있는 동시 또는 후속 항-CD33 요법에 의해 해를 입지 않을 것이다. 그러나, 환자에서 기존 CD33-발현 세포 및/또는 유전적 변형이 결여된 투여된 세포는 보호되지 않아, 교정되지 않은 세포에 비해 유전자-교정된 세포에 대한 양성 선택을 초래할 것이다.
특정 구현예에서, 이 접근법은 단일 세포내 전달 비히클에서 치료 유전자 및 CD33 차단 분자를 연결함으로써 달성된다. 특정 구현예에서, 단일 세포내 전달 비히클은 Ad35 바이러스 벡터이다.
특정 구현예에서, CD33 차단 분자는 공통 Ad35 바이러스 벡터 내에 포함됨으로써 치료 유전자와 조합된 shRNA 또는 siRNA CD33 차단 분자이다. 특정 구현예에서, CD33 차단 분자는 서열번호: 187을 포함하는 shRNA 서열 또는 서열번호: 188을 포함하는 서열이다.
CD33-표적화 치료는 항-CD33 항체, 항-CD33 면역독소, 항-CD33 항체-약물 접합체, 항-CD33 항체-방사성 동위원소 접합체, 항-CD33 이중특이적 항체, 항-CD33 BiTE® 항체, 항-CD33 삼중특이적 항체, 및/또는 항-CD33 CAR을 포함한다.
IV(B). 시험관내 및 생체외 유전자 요법
시험관내 유전자 요법은 외인성 DNA를 숙주 세포(예컨대 표적 세포) 및/또는 핵산(예컨대 표적 핵산, 예컨대 표적 게놈) 내로 도입하는 방법에서 본 개시내용의 벡터, 게놈, 또는 시스템의 사용을 포함하며, 여기서 숙주 세포 또는 핵산은 다세포 유기체(예를 들어, 실험실)에 존재하지 않는다. 일부 구현예에서, 표적 세포 또는 핵산은 다세포 유기체, 예컨대 포유동물(예를 들어, 마우스, 래트, 인간, 또는 비-인간 영장류)로부터 유래된다. 다세포 유기체로부터 유래된 세포의 시험관내 조작은 생체외 조작으로 지칭될 수 있고, 생체외 요법에 사용될 수 있다. 다양한 구현예에서, 본 개시내용의 방법 및 조성물은 예를 들어, 본원에 개시된 바와 같이, 제1 다세포 유기체로부터 유래된 표적 세포 또는 핵산을 변형시키기 위해 활용된 다음 조작된 표적 세포 또는 핵산은 예를 들어, 입양 세포 요법의 방법으로 제2 다세포 유기체, 예컨대 포유동물(예를 들어, 마우스, 래트, 인간, 또는 비-인간 영장류)에게 투여된다. 일부 경우에, 제1 및 제2 유기체는 동일한 단일 대상 유기체이다. 물질이 유래된 대상체에게 시험관내 조작된 물질을 되돌리는 것은 자가 요법일 수 있다. 일부 경우에, 제1 및 제2 유기체는 상이한 유기체(예를 들어, 동일한 종의 2 개의 유기체, 예를 들어, 동일한 종의 2 마리의 마우스, 2 마리의 래트, 2 명의 인간, 또는 2 마리의 비-인간 영장류)이다. 제1 대상체로부터 유래된 조작된 물질을 제2 상이한 대상체로 전달하는 것은 동종이계 요법일 수 있다.
생체외 세포 요법은 환자 또는 정상 공여자로부터 줄기, 전구체 또는 분화된 세포의 단리, 유전적 조작이 있거나 또는 없이 생체외에서 단리된 세포의 확장 및 주입된 세포 및/또는 이의 자손의 일시적 또는 안정된 이식을 달성하기 위해 대상체에게 세포의 투여를 포함할 수 있다. 이러한 생체외 접근법은 예를 들어, 유전성, 감염성 또는 신생물성 질환을 치료하거나, 조직을 재생하거나 또는 치료제를 질환 부위에 전달하기 위해 사용될 수 있다. 다양한 생체외 요법에서 대상체를 유전자 전달 벡터에 직접 노출시키기 않고, 형질도입의 표적 세포는 임의의 유전적 조작 전 또는 후에, 효능 및 안전성을 개선하기 위해 선택, 확장, 및/또는, 분화될 수 있다.
생체외 요법은 조혈 줄기 세포(HSC) 이식(HCT)을 포함한다. 자가 HSC 유전자 요법은 혈액 및 면역계의 여러 단일유전자성 질환 뿐만 아니라 저장 장애에 대한 치료 옵션을 나타내고, 이는 선택된 질환 상태에 대한 1차 치료 옵션이 될 수 있다. 또 다른 확립된 세포 및 유전자 요법 적용은 악성종양, 감염 및 자가면역 질환에 대해 사용하기 위한 면역 효과기 및 조절 세포의 힘을 활용하기 위해, 유전적 조작이 있거나 또는 없이 항원 특이성을 재지시하거나 또는 안정성 프로파일을 증가시키는 생체외 확장된 T 세포를 이용하는 입양 면역요법이다. 일부 경우에 유전적 조작에 수반되는 다양한 다른 유형의 체세포 줄기 세포는 표피 및 윤부 줄기 세포, 신경 줄기/전구체 세포(NSPC), 심장 줄기 세포 및 다능성 간질 세포(MSC)를 포함하는 치료 적용에 대한 가능성을 나타내고 있다.
생체외 요법의 적용은 기능장애 세포 계통을 재구축하는 것을 포함한다. 결함성이거나 또는 부재하는 세포 계통을 특징으로 하는 선천적 질환의 경우, 계통은 정상 공여자 또는 결핍을 교정하기 위해 생체외 유전자 전달에 적용된 자가 세포로부터 유래된 기능적 전구체 세포에 의해 재생될 수 있다. 예는 SCID에 의해 제공되며, 여기서 여러 유전자 중 임의의 하나에서 결핍은 성숙 림프 세포의 발달을 차단한다. 숙주에서 다양한 계통의 공여자-유래 기능적 조혈 세포의 생성을 허용할 수 있는 조작되지 않은 정상 공여자 HSC의 이식은 SCID, 뿐만 아니라 혈액 및 면역계에 영향을 미치는 많은 다른 질환에 대한 치료 옵션을 나타낸다. 이식된 조혈 줄기/전구체 세포(HSPC)에서 결핍성 유전자의 기능적 카피를 대체하는 것을 포함할 수 있고, HCT와 유사하게, 기능적 자손의 꾸준한 공급을 제공할 수 있는 자가 HSC 유전자 요법은 이식편대숙주병(GvHD)의 위험 감소, 이식 거부의 위험 감소, 및 이식후 면역억제에 대한 필요성 감소를 포함하는 여러 이점을 가질 수 있다.
생체외 요법의 적용은 치료 유전자 투여량 증가를 포함한다. 일부 적용에서, HSC 유전자 요법은 동종이계 HCT의 치료 효능을 증가시킬 수 있다. 치료 유전자 투여량은 이식된 세포에서 정상 수준 이상으로 조작될 수 있다.
생체외 요법의 적용은 신규 기능을 도입하고 유전자 요법을 표적화하는 것을 포함한다. 생체외 유전자 요법은 고용향 항종양 화학요법 레지멘의 투여를 허용하는 약물 내성을 확립하거나 또는 HIV와 같은 바이러스, 또는 RNA-기반 제제(예를 들어, 리보자임, RNA 유인, 안티센스 RNA, RNA 압타머 및 작은 간섭 RNA) 및 단백질-기반 제제(예를 들어, 병원체의 게놈을 표적화하는 우성-음성 돌연변이체 바이러스 단백질, 융합 억제제 및 조작된 뉴클레아제)를 발현함으로써 다른 병원체로 사전 확립된 감염에 대한 내성을 확립하는 것과 같이, HSC 또는 이의 자손에게 신규 기능을 부여할 수 있다.
생체외 요법의 적용은 면역 반응을 향상시키는 것을 포함한다. 신생물 질환에서, T 세포와 같은 동종이계 적응 면역 세포 유형은 암 세포를 인식하고 사멸시킬 수 있다. 불행히도, 동종반응성 림프구에 의한 건강한 조직의 인식은 또한 해로운 GvHD를 초래할 수 있다. 공여자 림프구에서 자살 유전자의 전달은 독성을 길들이면서 항-종양 잠재력을 활용할 수 있게 한다. 자가 설정에서, 형질전환 또는 감염된 세포에 대해 지시된 특이성이 있는 림프구는 환자의 조직으로부터 단리되고 생체외에서 선택적으로 확장될 수 있다 대안적으로, 이들은 형질전환 또는 감염된 세포를 접할 때 세포의 반응을 촉발하는 합성 또는 키메라 항원 수용체에 대한 유전자의 전달에 의해 생성될 수 있다. 이러한 접근법은 종양 또는 감염에 대한 기본적인 숙주 반응을 강화하거나, 또는 이를 새롭게 유도할 수 있다.
IV(C). 유전자 요법에 의해 치료가능한 병태
적어도 부분적으로 본 개시내용의 아데노바이러스 벡터는 숙주 및/또는 표적 세포의 변형을 위해 생체내, 시험관내, 또는 생체외에서 사용될 수 있고, 추가로 아데노바이러스 벡터는 매우 다양한 발현 산물을 암호화하는 페이로드를 포함할 수 있기 때문에, 본원에 제공되는 다양한 기술은 광범위한 적용가능성을 갖고 매우 다양한 병태를 치료하기 위해 사용될 수 있음이 본 명세서로부터 분명할 것이다. 본 개시내용의 아데노바이러스 벡터, 게놈, 또는 시스템의 투여에 의해 치료가능한 병태의 예는 혈색소병증, 면역결핍, 점 돌연변이 병태, 암, 단백질 결핍, 감염성 질환, 및 염증성 병태를 포함하나 이에 제한되지 않는다.
특정 구현예에서, 본원에 개시된 벡터, 게놈, 시스템 및 제형은 대상체(인간, 수의학 동물(개, 고양이, 파충류, 조류 등), 가축(말, 소, 염소, 돼지, 닭 등), 및 연구 동물(원숭이, 래트, 마우스, 어류 등)을 치료하기 위해 사용될 수 있다. 대상체를 치료하는 것은 치료 유효량을 전달하는 것을 포함한다. 치료 유효량은 유효량, 예방적 치료, 및/또는 치료적 치료를 제공하는 것을 포함한다.
특정 구현예에서, 본원에 개시된 방법 및 제형은 혈액 장애를 치료하는 데 사용될 수 있다. 특정 구현예에서, 제형은 혈우병, 중증 β-지중해빈혈, 다이아몬드 블랙판 빈혈(DBA), 발작성 야간 헤모글로빈뇨증(PNH), 순수 적혈구 무형성증(PRCA), 불응성 빈혈, 중증 재생불량성 빈혈, 및/또는 백혈병, 림프종, 및 골수종과 같은 혈액암을 치료하기 위해 대상체에게 투여된다.
혈색소병증은 불균형 결과를 초래하는 전 세계적인 건강 부담을 나타낸다. 헤모글로빈 단백질 또는 글로빈 유전자 발현에서의 결함은 혈색소병증이라 불리는 질환을 초래할 수 있다. 혈색소병증은 전 세계적으로 가장 흔한 유전 질환 중 하나이다.
매년, 전 세계적으로 110만 명의 신생아가 혈색소병증에 대한 위험이 있으며, 헤모글로빈(Hb) 유전적 변이에 의해 부여된 말라리아 감염에 대한 자연적 내성으로 인해, 말라리아 열대열원충이 만연한 지리학적 영역에서 매 1,000 명마다 신생아 중 25명 정도로 영향을 미친다. 선진국에서, 환자는 만성 수혈로부터 철분 과부하의 위험이 있다. 후진 지역에서, 생존은 상당히 더 낮다. 예를 들어, 아프리카에서, 유아기 사망률은 모든 어린이에서 16%인 것과 비교하여 혈색소병증 환자에서 40%이다.
글로빈 유전자에서 돌연변이는 겸상적혈구병(SCD) 및 헤모글로빈 C, D, 및 E 질환에서과 같이 비정상적인 형태의 헤모그로빈을 생성하거나, 또는 α 또는 β 폴리펩티드의 생산을 감소시키고 따라서 세포에서 글로빈 쇄의 불균형을 초래할 수 있다. 이러한 후자의 병태는 글로빈 쇄가 손상되는 정도에 따라 α- 또는 β-지중해빈혈이라고 불린다. 전 세계 인구의 5%는 단연코 가장 흔한(담체의 40%) b-글로빈(HBB) 유전자(글루타메이트에서 발린으로 전환; 역사적으로 E6V, 동시에 E7V)에서 겸상 세포 돌연변이가 있는 상당한 헤모글로빈 변이체를 가지고 있다. 헤모글로빈 장애의 높은 유병률 및 중증도는 일생동안 환자 관리에 비용이 들기 때문에, 이환된 환자의 삶 뿐만 아니라 건강-관리 시스템에 영향을 미치는 실질적인 부담을 나타낸다.
2 개의 알파(α) 및 2 개의 감마(γ) 쇄를 포함하는 태아(HbF), 및 2 개의 α 및 2 개의 베타(β) 쇄를 포함하는 성체(HbA)의 2 가지 형태의 헤모글로빈이 있다. HbF에서 HbA로의 자연적 전환은 출생 직후 발생하고 마스터 조절인자인 bcl11a를 포함하는 인자에 의해 γ 글로빈 유전자의 전사 억제에 의해 조절된다. 비판적으로, 다양한 임상 관찰은 겸상적혈구병 및 β-지중해빈혈과 같은 β-혈색소병증의 중증도가 HbF의 생산 증가에 의해 개선됨을 입증한다.
특정 구현예에서, 치료적으로 효과적인 치료는 HbF의 발현을 유도 또는 증가시키고/시키거나, 헤모글로빈의 생산을 유도 또는 증가시키고/시키거나 β-글로빈의 생산을 유도 또는 증가시킨다. 특정 구현예에서, 치료적으로 효과적인 치료는 혈액 세포 기능을 개선하고/하거나, 세포의 산소화를 증가시킨다.
다양한 구현예에서, 본 개시내용은 β-글로빈 긴 LCR, β-글로빈 프로모터, 및 혈액 장애의 치료를 위한 단백질 또는 제제를 암호화하는 코딩 핵산 서열을 포함하는 본 개시내용의 아데노바이러스 공여자 벡터를 사용한 혈액 장애의 치료를 포함한다. 다양한 구현예에서, 혈액 장애는 지중해빈혈이고 단백질은 β-글로빈 또는 γ-글로빈 단백질, 또는 달리 부분적으로 또는 완전히 β-글로빈 또는 γ-글기능적으로 대체하는 단백질이다. 다양한 구현예에서, 혈액 장애는 혈우병이고 단백질은 ET3 또는 달리 부분적으로 또는 완전히 인자 VIII을 기능적으로 대체하는 단백질이다. 다양한 구현예에서, 혈액 장애는 겸상 세포 빈혈과 같은 점 돌연변이 질환이고, 제제는 유전자 편집 단백질이다.
ET3은 하기 아미노산 서열을 가질 수 있다: 서열번호 301. 다양한 구현예에서, 인자 VIII 대체 단백질은 서열번호: 301에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 가질 수 있다.
β-글로빈은 하기 아미노산 서열을 가질 수 있다: 서열번호 302. 다양한 구현예에서, β-글로빈 대체 단백질은 서열번호: 302에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 가질 수 있다.
γ-글로빈은 하기 아미노산 서열을 가질 수 있다: 서열번호 303. 다양한 구현예에서, γ-글로빈 대체 단백질은 서열번호: 303에 대해 적어도 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100% 동일성을 갖는 아미노산 서열을 가질 수 있다.
80 개 초과의 1차 면역 결핍 질환이 세계보건기구에 의해 인식되고 있다. 이러한 질환은 일부 경우에, 신체가 감염에 대한 임의의 또는 충분한 항체를 생산할 수 없는 면역계의 본질적인 결함을 특징으로 한다. 다른 경우에, 감염에 싸우는 세포 방어가 적절하게 작동하지 않는다. 전형적으로, 1차 면역 결핍은 선천적 장애이다.
이차성, 또는 후천성 면역 결핍은 선천적 유전 이상의 결과가 아니라, 오히려 면역계가 면역계 외부에 있는 요인에 의해 손상된 개인에서 발생한다. 예는 외상, 바이러스, 화학요법, 독소, 및 오염을 포함한다. 후천성 면역결핍 증후군(AIDS)은 T 림프구의 고갈이 신체를 감염에 싸울 수 없게 만드는 인간 면역결핍 바이러스(HIV)와 같은 바이러스에 의해 유발된 2차 면역 결핍 장애의 예이다.
X-결합 중증 복합 면역결핍(SCID-X1)은 공통 감마 쇄 유전자(γC)의 돌연변이에 의해 유발된 세포성 및 체액성 면역 고갈 둘 다이며, 이는 T 및 자연 살해(NK) 림프구의 부재 및 비기능적 B 림프구의 존재를 초래한다. SCID-X1은 면역계가 예를 들어, 골수 이식(BMT) 또는 유전자 요법을 통해 재구축되지 않는 한 생후 첫 2년 내에 치명적이다.
대부분의 개인은 BMT 또는 비-자가 유전자 요법에 대해 일치된 공여자가 부족하기 때문에, 성숙 T 세포가 고갈된 동일단배체의 모체 골수가 종종 사용되지만; 합병증은 이식편대숙주병(GVHD), 적절한 항체를 생성하지 못해 장기간 면역글로불린 대체 필요, 조혈 줄기 및 전구체 세포(HSPC)의 주입 실패로 인한 T 세포의 후기 손실, 만성 혹, 및 림프구 조절장애를 포함한다.
판코니 빈혈(FA)은 골수 부전으로 이어지는 선천적 혈액 장애이다. 이는 부분적으로 DNA-복구 메커니즘 결핍을 특징으로 한다. FA 환자의 적어도 20%는 급성 골수성 백혈병과 같은 암, 및 피부, 간, 위장관, 및 부인과계의 암으로 발전한다. 피부 및 위장관 종양은 일반적으로 편평세포 암종이다. 암으로 발전하는 환자의 평균 연령은 백혈병의 경우 15 세, 간 종양의 경우 16 세, 및 다른 종양의 경우 23 세이다.
치료 유전자는 특정 구현예에서, 선천적인 병태에 대해 치료적으로 효과적인 반응을 제공하도록 선택될 수 있다. 특정 구현예에서, 병태는 그레이브스병, 류마티스 관절염, 악성 빈혈, 다발성 경화증(MS), 염증성 장 질환, 전신 홍반성 루푸스(SLE), 아데노신 데아미나제 결핍증(ADA-SCID) 또는 중증 복합 면역결핍증(SCID), 비스코트-알드리치 증후군(WAS), 만성 육아종증(CGD), 판코니 빈혈(FA), 바텐병, 부신백질이영양증(ALD) 또는 이염백질이영양증(MLD), 근이영양증, 폐포단백질증(PAP), 피루베이트 키나제 결핍, 슈바크만-다이아몬드-블랙판 빈혈, 선천성 이각화증, 낭포성 섬유증, 파킨슨병, 알츠하이머병, 또는 근위축성 측색 경화증(루게릭병)일 수 있다. 특정 구현예에서, 병태에 따라, 치료 유전자는 단백질을 암호화하는 유전자 및/또는 기능이 중단된 유전자일 수 있다.
특정 구현예에서, 본원에 개시된 방법 및 제형은 암을 치료하는 데 사용될 수 있다. 특정 구현예에서, 제형은 급성 림프모구성 백혈병(ALL), 급성 골수형성 백혈병(AML), 만성 림프구성 백혈병(CLL), 만성 골수형성 백혈병(CML), 만성 골수단핵구 백혈병, 미만성 거대 B-세포 림프종, 여포성 림프종, 호지킨 림프종, 청소년 골수단핵구 백혈병, 다발성 골수종, 골수이형성, 및/또는 비-호지킨 림프종을 치료하기 위해 대상체에게 투여된다.
치료될 수 있는 추가의 예시적인 암은 성상세포종, 비정형 기형 간상소체 종양, 뇌 및 중추신경계(CNS) 암, 유방암, 암육종, 연골육종, 척색종, 맥락총 암종, 맥락총 유두종, 연조직의 투명 세포 육종, 미만성 거대 B-세포 림프종, 뇌실막세포종, 상피양 육종, 생식선외 생식 세포 종양, 신장외 횡문양 종양, 유잉 육종, 위장관 간질 종양, 교모세포종, HBV-유도된 간세포 암종, 두경부암, 신장암, 폐암, 악성 간상소체 종양, 수모세포종, 흑색종, 수막종, 중피종, 다발성 골수종, 신경교 종양, 달리 명시되지 않은(NOS) 육종, 핍지교성상세포종, 희소돌기아교세포종, 골육종, 난소암, 난소 투명 세포 선암종, 난소 자궁내막 선암종, 난소 장액성 선암종, 췌장암, 췌장관 선암종, 췌장 내분비성 종양, 송과체모세포종, 전립선암, 신세포 암종, 신수질 암종, 횡문근육종, 육종, 신경집종, 피부 편평세포 암종, 및 줄기 세포암을 포함한다. 다양한 특정 구현예에서, 암은 난소암이다. 다양한 특정 구현예에서 암은 유방암이다.
특정 구현예에서, 본원에 개시된 방법 및 제형은 점 돌연변이 병태를 치료하는 데 사용될 수 있다. 특정 구현예에서, 제형은 겸상적혈구병, 낭포성 섬유증, 테이삭스병, 및/또는 페닐케톤뇨증을 치료하기 위해 대상체에게 투여된다. 다양한 구현예에서, 본 개시내용의 트랜스포존 페이로드는 핵산 병변의 교정 편집을 위한 CRISPR-Cas를 암호화한다. 다양한 구현예에서, 본 개시내용의 트랜스포존 페이로드는 핵산 병변의 교정 편집을 위한 염기 편집기를 암호화한다.
특정 구현예에서, 본원에 개시된 방법 및 제형은 특정 효소 결핍을 치료하는 데 사용될 수 있다. 특정 구현예에서, 제형은 헐러 증후군, 선택적 IgA 결핍, 고 IgM, IgG 하위클래스 결핍, 니만-픽병, 테이삭스병, 고세병, 파브리병, 크라베병, 포도당혈증, 단풍시럽뇨병, 페닐케톤뇨증, 글리코겐 축적 질환, 프리드라이히 운동실조, 젤웨거 증후군, 부신백질이영양증, 보체 장애, 및/또는 뮤코다당증을 치료하기 위해 대상체에게 투여된다.
치료 유효량은 면역 및 다른 혈액 세포 및/또는 소교 세포에 기능을 제공할 수 있거나 또는 대안적으로 치료된 병태에 따라 림프구 활성화를 억제하고/하거나, 림프구에서 세포자멸사를 유도하고/하거나, 림프구의 다양한 하위세트를 제거하고/하거나, T 세포 활성화를 억제하고/하거나, 자가반응성 T 세포를 제거 또는 억제하고/하거나, Th-2 또는 Th-1 림프구 활성을 억제하고/하거나, IL-1 또는 TNF를 길항하고/하거나, 염증을 감소시키고/시키거나, 자극제에 대한 선택적 내성을 유도하고/하거나, 면역-매개 병태를 감소 또는 제거하고/하거나; 면역-매개 병태의 증상을 감소 또는 제거할 수 있다. 치료 유효량은 또한 기능적 DNA 복구 메커니즘; 계면활성제 단백질 발현; 텔로미어 유지; 리소좀 기능; 지질 또는 아밀로이드와 같은 다른 단백질의 분해를 제공하고/하거나; 리보솜 기능을 허용하고/하거나; 달리 다른 백혈구 유형의 대식세포와 같이 발달하지 않을 성숙 혈액 세포 계통의 발달을 허용할 수 있다.
특정 구현예에서, 본 개시내용의 방법은 이를 필요로 하는 대상체에서 T-세포 매개된 면역 반응을 회복시킬 수 있다. T-세포 매개된 면역 반응의 회복은 흉선 배출 회복 및/또는 정상 T 림프구 발달 회복을 포함할 수 있다
특정 구현예에서, 흉선 배출 회복은 말초 혈액에서 CD45RA를 발현하는 CD3+ T 세포의 빈도를 대조군 집단에서 유래된 참조 수준과 비슷한 수준으로 회복시키는 것을 포함할 수 있다. 특정 구현예에서, 흉선 배출 회복은 106 개의 성숙 T 세포 당 T 세포 수용체 절제 원(TREC)의 수를 대조군 집단에서 유래된 참조 수준과 비슷한 수준으로 회복시키는 것을 포함할 수 있다. 106 개의 성숙 T 세포 당 TREC의 수는 Kennedy 등, Vet Immunol Immunopathol 142: 36-48, 2011에 기재된 바와 같이 결정될 수 있다.
특정 구현예에서, 정상 T 림프구 발달 회복은 CD4+ 세포: CD8+ 세포의 비를 2로 회복시키는 것을 포함한다. 특정 구현예에서, 정상 T 림프구 발달 회복은 순환 T-림프구에서 αβ TCR의 존재를 검출하는 것을 포함한다. 순환 T-림프구에서 αβ TCR의 존재는 예를 들어, TCR의 α 및/또는 β 쇄에 결합하는 항체를 사용한 유세포 분석에 의해 검출될 수 있다. 특정 구현예에서, 정상 T 림프구 발달 회복은 다양한 TCR 레퍼토리의 존재를 대조군 집단에서 유래된 참조 수준과 비슷한 수준으로 검출하는 것을 포함한다. TCR 다양성은 TCRβ 유전자의 가변 영역의 유전적 재배열을 분석하는 TCRVβ 스펙트럼유형화(spectratyping)에 의해 평가될 수 있다. 강력하고 정상적인 스펙트럼유형 프로파일은 TCRVβ 분절의 17 개 패밀리에 걸쳐 크기가 부여된 단편의 가우스(Gaussian) 분포를 특징으로 할 수 있다. 특정 구현예에서, 정상 T 림프구 발달 회복은 T-세포 특이적 신호전달 경로의 회복을 포함한다. T-세포 특이적 신호전달 경로의 회복은 T 세포 미토겐 파이토헤마글루티닌(PHA)에 노출 후 림프구 증식에 의해 평가될 수 있다. 특정 구현예에서, 정상 T 림프구 발달 회복은 백혈구 계수, 호중구 세포 계수, 단핵구 세포 계수, 림프구 세포 계수, 및/또는 혈소판 세포 계수를 대조군 집단에서 유래된 참조 수준과 비슷한 수준으로 회복시키는 것을 포함한다.
특정 구현예에서, 본 개시내용의 방법은 이를 필요로 하는 대상체에서 림프구 재구축의 동역학 및/또는 클론 다양성을 개선할 수 있다. 특정 구현예에서, 림프구 재구축의 동역학 개선은 순환 T 림프구의 수를 대조군 집단에서 유래된 참조 수준의 범위 내로 증가시키는 것을 포함한다. 특정 구현예에서, 림프구 재구축의 동역학 개선은 절대 CD3+ 림프구 계수를 대조군 집단에서 유래된 참조 수준의 범위 내로 증가시키는 것을 포함할 수 있다. 이의 범위는 주어진 매개변수에 대해 정상(즉, 면역 손상되지 않은) 대상체에서 관찰되거나 또는 이에 의해 나타난 값의 범위일 수 있다. 특정 구현예에서, 림프구 재구축의 동역학 개선은 본원에 기재된 요법이 투여되지 않은 이를 필요로 하는 대상체와 비교하여 정상 림프구 계수에 도달하는 데 필요한 시간을 감소시키는 것을 포함할 수 있다. 특정 구현예에서, 림프구 재구축의 동역학 개선은 본원에 기재된 요법이 투여되지 않은 이를 필요로 하는 대상체와 비교하여 유전자 교정된 림프구의 빈도를 증가시키는 것을 포함할 수 있다. 특정 구현예에서, 림프구 재구축의 동역학 개선은 본원에 기재된 유전자 요법이 투여되지 않은 이를 필요로 하는 대상체와 비교하여 대상체에서 유전자 교정된 림프구의 클론 레퍼토리의 다양성을 증가시키는 것을 포함할 수 있다. 유전자 교정된 림프구의 클론 레퍼토리의 다양성 증가는 레트로바이러스 통합 부위(RIS) 분석에 의해 측정된 바와 같은 고유한 (RIS) 클론의 수를 증가시키는 것을 포함할 수 있다.
특정 구현예에서, 본 개시내용의 방법은 이를 필요로 하는 대상체에서 골수 기능을 회복시킬 수 있다. 특정 구현예에서, 골수 기능 회복은 본원에 기재된 요법이 투여되지 않은 이를 필요로 하는 대상체와 비교하여 유전자 교정된 세포로 골수 재증식을 개선하는 것을 포함할 수 있다. 유전자 교정된 세포로 골수 재증식을 개선하는 것은 유전자 교정된 세포의 백분율을 증가시키는 것을 포함할 수 있다. 특정 구현예에서, 세포는 백혈구 및 골수 유래 세포로부터 선택된다. 특정 구현예에서, 유전자 교정된 세포의 백분율은 정량적 실시간 PCR 및 유세포 분석으로부터 선택된 검정을 사용하여 측정될 수 있다.
특정 구현예에서, 본 개시내용의 방법은 이를 필요로 하는 대상체에서 면역화에 대한 1차 및 2차 항체 반응을 정규화할 수 있다. 면역화에 대한 1차 및 2차 항체 반응의 정규화는 항원에 대한 클래스 전환 및 기억 반응에서 기능하는 B-세포 및/또는 T-세포 사이토카인 신호전달 프로그램의 회복을 포함할 수 있다. 면역화에 대한 1차 및 2차 항체 반응의 정규화는 박테리오파지 면역화 검정에 의해 측정될 수 있다. 특정 구현예에서, B-세포 및/또는 T-세포 사이토카인 신호전달 프로그램의 회복은 T-세포 의존적 신생항원 박테리오파지 ΨX174로 면역화 후 검정될 수 있다. 특정 구현예에서, 면역화에 대한 1차 및 2차 항체 반응의 정규화는 이를 필요로 하는 대상체에서 IgA, IgM, 및/또는 IgG의 수준을 대조군 집단에서 유래된 참조 수준과 비슷한 수준으로 증가시키는 것을 포함할 수 있다. 특정 구현예에서, 면역화에 대한 1차 및 2차 항체 반응의 정규화는 이를 필요로 하는 대상체에서 IgA, IgM, 및/또는 IgG의 수준을 본원에 기재된 유전자 요법이 투여되지 않은 이를 필요로 하는 대상체보다 더 큰 수준으로 증가시키는 것을 포함할 수 있다. IgA, IgM, 및/또는 IgG의 수준은 예를 들어, 면역글로불린 테스트에 의해 측정될 수 있다. 특정 구현예에서, 면역글로불린 테스트는 항체 결합 IgG, IgA, IgM, 카파 경쇄, 람다 경쇄, 및/또는 중쇄를 포함한다. 특정 구현예에서, 면역글로불린 테스트는 혈청 단백질 전기영동법, 면역전기영동법, 방사성 면역확산, 혼탁법 및 비탁법을 포함한다. 상업적으로 이용가능한 면역글로불린 테스트 키트는 MININEPH™(Binding Site, 영국 버밍엄 소재), 및 Dako(덴마크 소재) 및 Dade Behring(독일 마르부르크 소재)의 면역글로불린 테스트 시스템을 포함한다. 특정 구현예에서, 면역글로불린 수준을 측정하는 데 사용될 수 있는 샘플은 혈액 샘플, 혈장 샘플, 뇌척수액 샘플, 및 소변 샘플을 포함한다.
특정 구현예에서, 본 개시내용의 방법은 SCID-X1을 치료하는 데 사용될 수 있다. 특정 구현예에서, 본 개시내용의 방법은 SCID(예를 들어, JAK 3 키나제 결핍 SCID, 퓨린 뉴클레오시드 포스포릴라제(PNP) 결핍 SCID, 아데노신 데아미나제(ADA) 결핍 SCID, MHC 클래스 II 결핍 또는 재조합효소 활성화 유전자(RAG) 결핍 SCID)를 치료하는 데 사용될 수 있다. 특정 구현예에서, 치료 효능은 림프구 재구축, 클론 다양성 및 흉선형성 개선, 감염 감소, 및/또는 환자 결과 개선을 통해 관찰될 수 있다. 치료 효능은 또한 체중 증가 및 성장, 위장관 기능 개선(예를 들어, 설사 감소), 상부 호흡기 증상 감소, 구강(칸디다증)의 진균 감염 감소, 폐렴 발병률 및 중증도 감소, 수막염 및 혈류 감염 감소, 및 귀 감염 감소 중 하나 이상을 통해 관찰될 수 있다. 특정 구현예에서, 본 개시내용의 방법으로 SCIDX-1을 치료하는 것은 γC-의존적 신호전달 경로에 대한 기능성 회복을 포함한다. γC-의존적 신호전달 경로의 기능성은 각각 IL-21 및/또는 IL-2로 시험관내 자극 후 효과기 분자 STAT3 및/또는 STAT5의 티로신 인산화를 측정함으로써 검정될 수 있다. STAT3 및/또는 STAT5의 티로신 인산화는 세포내 항체 염색에 의해 측정될 수 있다.
특정 구현예에서, 본 개시내용의 방법은 FA를 치료하는 데 사용될 수 있다. 특정 구현예에서, 치료 효능은 림프구 재구축, 클론 다양성 및 흉선형성 개선, 감염 감소, 및/또는 환자 결과 개선을 통해 관찰될 수 있다. 치료 효능은 또한 체중 증가 및 성장, 위장관 기능 개선(예를 들어, 설사 감소), 상부 호흡기 증상 감소, 구강(칸디다증)의 진균 감염 감소, 폐렴 발병률 및 중증도 감소, 수막염 및 혈류 감염 감소, 및 귀 감염 감소 중 하나 이상을 통해 관찰될 수 있다. 특정 구현예에서, 본 개시내용의 방법으로 FA를 치료하는 것은 미토마이신 C(MMC)에 대한 골수 유래 세포의 내성을 증가시키는 것을 포함한다. 특정 구현예에서, MMC에 대한 골수 유래 세포의 내성은 메틸셀룰로스 및 MMC에서 세포 생존 검정에 의해 측정될 수 있다.
특정 구현예에서, 본 개시내용의 방법은 저감마글로불린혈증을 치료하는 데 사용될 수 있다. 저감마글로불린혈증은 B-림프구 결여에 의해 유발되고 혈액에서 낮은 수준의 항체를 특징으로 한다. 저감마글로불린혈증은 백혈병-관련 면역 기능장애 및 요법-관련 면역억제 둘 다의 결과로 만성 림프구성 백혈병(CLL), 다발성 골수종(MM), 비-호지킨 림프종(NHL) 및 다른 관련 악성종양 환자에서 발생할 수 있다. 이러한 혈액학적 악성종양에 이차적인 후천성 저감마글로불린혈증 환자, 및 HSPC 이식 후 환자는 박테리아 감염에 취약하다. 체액성 면역력의 결핍은 특히 캡슐화된 미생물에 의해 이러한 환자에서 감염-관련된 이환율 및 사망률 위험 증가에 주로 기인한다. 예를 들어, 폐렴연쇄구균, 헤모필루스 인플루엔자(Haemophilus influenzae), 및 스타필로코쿠스 아우레우스, 뿐만 아니라 레지오넬라 및 노카르디아 종(Nocardia spp.)은 CLL 환자에서 폐렴을 유발하는 빈번한 박테리아 병원체이다. 폐포자충(Pneumocystis carinii), 진균, 바이러스, 및 마이코박테리아와 같은 기회 감염이 또한 관찰되었다. 이러한 환자에서 감염의 수 및 중증도는 면역 글로불린의 투여에 의해 상당히 감소될 수 있다(Griffiths 등 Blood 73: 366-368, 1989; Chapel 등 Lancet 343: 1059-1063, 1994).
특정 구현예에서, 제형은 급성 림프모구성 백혈병(ALL), 급성 골수형성 백혈병(AML), 부신백질이영양증, 병인불명 골수성 화생, 무거핵구성/선천성 혈소판감소증, 모세혈관 확장성운동실조, 중증성 β-지중해빈혈, 만성 육아종증, 만성 림프구성 백혈병(CLL), 만성 골수형성 백혈병(CML), 만성 골수단핵구 백혈병, 공통 가변성 면역 결핍증(CVID), 보체 장애, 선천성 무감마글로불린혈증, 다이아몬드 블랙판 증후군, 미만성 거대 B-세포 림프종, 가족성 혈구탐식성 림프조직구증, 여포성 림프종, 호지킨 림프종, 헐러 증후군, 초 IgM, IgG 하위클래스 결핍증, 청소년 골수단핵구 백혈병, 이염백질이영양증, 뮤코다당증, 다발성 골수종, 골수이형성, 비-호지킨 림프종, 발작성 야간 헤모글로빈뇨증(PNH), 항체 결핍된 1차 면역결핍증, 순수 적혈구 무형성증, 불응성 빈혈, 슈와크만-다이아몬드-블랙판(Shwachman-Diamond-Blackfan) 빈혈(DBA), 선택적 IgA 결핍증, 중증 재생불량성 빈혈, 겸상적혈구병, 특이적 항체 결핍증, 비스코트-올드리치 증후군, 및/또는 X-결합 무감마글로불린혈증(XLA)을 치료하기 위해 대상체에게 투여된다.
치료될 수 있는 추가의 예시적인 암은 성상세포종, 비정형 기형 간상소체 종양, 뇌 및 중추신경계(CNS) 암, 유방암, 암육종, 연골육종, 척색종, 맥락총 암종, 맥락총 유두종, 연조직의 투명 세포 육종, 미만성 거대 B-세포 림프종, 뇌실막세포종, 상피양 육종, 생식선외 생식 세포 종양, 신장외 횡문양 종양, 유잉 육종, 위장관 간질 종양, 교모세포종, HBV-유도된 간세포 암종, 두경부암, 신장암, 폐암, 악성 간상소체 종양, 수모세포종, 흑색종, 수막종, 중피종, 다발성 골수종, 신경교 종양, 달리 명시되지 않은(NOS) 육종, 핍지교성상세포종, 희소돌기아교세포종, 골육종, 난소암, 난소 투명 세포 선암종, 난소 자궁내막 선암종, 난소 장액성 선암종, 췌장암, 췌장관 선암종, 췌장 내분비성 종양, 송과체모세포종, 전립선암, 신세포 암종, 신수질 암종, 횡문근육종, 육종, 신경집종, 피부 편평세포 암종, 및 줄기 세포암을 포함한다. 다양한 특정 구현예에서, 암은 난소암이다. 다양한 특정 구현예에서 암은 유방암이다.
암의 맥락에서, 치료 유효량은 종양 세포 수를 감소시키고/시키거나, 전이 수를 감소시키고/시키거나, 종양 부피를 감소시키고/시키거나, 기대 수명을 증가시키고/시키거나, 암 세포의 세포자멸사를 유도하고/하거나, 암 세포 사멸을 유도하고/하거나, 암 세포에서 화학- 또는 방사성민감성을 유도하고/하거나, 암 세포 근처의 혈관형성을 억제하고/하거나, 암 세포 증식을 억제하고/하거나, 종양 성장을 억제하고/하거나, 전이를 예방하고/하거나, 대상체의 수명을 연장하고/하거나, 암-연관 통증을 감소시키고/시키거나, 전이 수를 감소시키고/시키거나, 치료 후 암의 재발 또는 재출현을 감소시킬 수 있다.
특정 구현예는 외상, 바이러스, 화학요법, 독소, 및 오염에 의해 유발된 면역 결핍과 같은 이차성, 또는 후천성 면역 결핍의 치료를 포함한다. 이전에 나타낸 바와 같이, 후천성 면역결핍 증후군(AIDS)은 T 림프구의 고갈이 신체를 감염에 싸울 수 없게 만드는 인간 면역결핍 바이러스(HIV)와 같은 바이러스에 의해 유발된 2차 면역 결핍 장애의 예이다. 따라서, 또 다른 예로서, 유전자는 감염성 질환에 대한 치료적으로 효과적인 반응을 제공하기 위해 선택될 수 있다. 특정 구현예에서, 감염성 질환은 인간 면역결핍 바이러스(HIV)이다. 치료 유전자는 예를 들어, 면역 세포가 HIV 감염에 대한 내성을 갖도록 하거나, 또는 면역 세포가 면역 재구축을 통해 바이러스를 효과적으로 중화할 수 있는 유전자, 면역 세포에 의해 발현되는 단백질을 암호화하는 유전자의 다형성, 환자에서 발현되지 않는 감염과 싸우는 데 유리한 유전자, 감염성 제제, 수용체 또는 공수용체를 암호화하는 유전자; 수용체 또는 공수용체에 대한 리간드를 암호화하는 유전자; 특정 전사 인자의 작용을 차단하기 위해 리보자임, 안티센스 RNA, 작은 간섭 RNA(siRNA) 또는 유인 RNA를 암호화하는 유전자; 우성 음성 바이러스 단백질, 세포내 항체, 인트라킨 및 자살 유전자를 암호화하는 유전자를 포함하는 바이러스 복제에 필수적인 바이러스 및 세포 유전자일 수 있다. 예시적인 치료 유전자 및 유전자 산물은 α2β1; αvβ3; αvβ5; αvβ63; BOB/GPR15; Bonzo/STRL-33/TYMSTR; CCR2; CCR3; CCR5; CCR8; CD4; CD46; CD55; CXCR4; 아미노펩티다제-N; HHV-7; ICAM; ICAM-1; PRR2/HveB; HveA; α-디스트로글리칸; LDLR/α2MR/LRP; PVR; PRR1/HveC; 및 라미닌 수용체를 포함한다. HIV의 치료를 위한 치료 유효량은 예를 들어, HIV에 대한 대상체의 면역력을 증가시키거나, AIDS 또는 HIV와 연관된 증상을 개선하거나, 또는 HIV에 대한 대상체의 선천적 또는 적응 면역 반응을 유도할 수 있다. HIV에 대한 면역 반응은 항체 생산 및 AIDS의 예방의 초래 및/또는 대상체의 AIDS 또는 HIV 감염 증상 개선, 또는 HIV 감염성 및/또는 병독성의 감소 또는 제거를 포함할 수 있다.
특정 구현예, 제형은 암 재발을 예방 또는 지연시키거나 또는 고위험 생식 계열 돌연변이의 보균자에서 암 발병을 예방 또는 지연시키기 위해 대상체에게 투여된다. 특정 구현예에서, 제형은 더 높은 치료 용량의 테모졸로미드(TMZ) 및 벤질구아닌 또는 BCNU를 받기 위해 대상체에게 투여된다. 강한 골수억제성 표적외 효과로 인해, 유효량의 TMZ 및 벤질구아닌을 종양에 전달하는 것은 과제로 남아있다. 환자는 현재 급성 골수성 백혈병(AML), 식도암, 두경부암, 고등급 신경교종, 골수이형성 증후군, 비-소세포 폐암, NSCLC; 불응성 AML, 소세포 폐암, 역형성 성상세포종, 뇌 종양, 유방암(예를 들어, 전이성), 결장직장암(예를 들어, 전이성), 미만성 내재성 뇌간 신경교종, 유잉 육종, 다형성 교모세포종(GBM), 악성 뇌교종, 흑색종, 전이성 악성 흑색종, 재발성 악성 흑색종, 비인두암, 전이성 유방암, 및 소아암과 연관된 치료를 위해 TMZ 및 벤질구아닌을 받을 수 있다.
MGMT 발현 종양이 있는 환자는 MGMTP140K 생체내 선택 카세트와 조합된 활성 성분(예컨대 CAR, TCR, 또는 체크포인트 억제제)과 함께 Ad35 바이러스 벡터의 투여로부터 이익을 얻을 것이다. 생체외 접근법은 이 접근법의 적용가능성을 제시하였다. 특정 구현예에서, TMZ 및 벤질구아닌 또는 BCNU의 치료량은 종양 부담 또는 부피를 감소시키기 위해 투여된다.
특정 구현예에서, 치료 유효량은 면역 및 다른 혈액 세포에 기능을 제공하고/하거나, 면역-매개 병태를 감소 또는 제거하고/하거나; 면역-매개 병태의 증상을 감소 또는 제거할 수 있다.
본원에 기재된 벡터, 동원 인자, 제형, 및 사용 방법에서, 단백질 및/또는 핵산 서열의 변이체가 또한 사용될 수 있다. 변이체는 본원에 기재되거나 또는 개시된 단백질 및 핵산 서열에 대해 적어도 70% 서열 동일성, 80% 서열 동일성, 85% 서열, 90% 서열 동일성, 95% 서열 동일성, 96% 서열 동일성, 97% 서열 동일성, 98% 서열 동일성, 또는 99% 서열 동일성을 갖는 서열을 포함하며 여기서 변이체는 실질적으로 유사하거나 또는 개선된 생물학적 기능을 나타낸다.
본원에 기재된 생체내 유전자 요법 및/또는 HSPC 동원과 연관된 매개변수에 대해 수득된 값은 대조군 집단에서 유래된 참조 수준과 비교될 수 있고, 이 비교는 본원에 기재된 생체내 유전자 요법이 유전자 요법이 투여된 이를 필요로 하는 대상체에 효과적인지를 나타낼 수 있다. 생체내 유전자 요법 및/또는 HSPC 동원과 연관된 매개변수는 예를 들어 다음을 포함할 수 있다: 총 백혈구, 호중구, 단핵구, 림프구, 및/또는 혈소판의 수; 정상 림프구 계수에 도달하는 데 필요한 시간; 퍼센트 CD3+CD45RA+ T 세포; 106 개 세포 당 TREC의 수; CD4+인 세포의 퍼센트; CD8+인 세포의 퍼센트; CD4/CD8의 비; CD3+ T 세포에서 TCRαβ+ 세포의 퍼센트; TCR의 다양성; 유전자 교정된 림프구의 빈도; 유전자 교정된 림프구의 클론 레퍼토리의 다양성; 고유한 RIS 클론의 수; 박테리오파지 주사에 대한 1차 및 2차 항체 반응; 박테리오파지 불활성화 비; 유전자 교정된 세포의 백분율; 면역글로불린 IgA, IgM, 및/또는 IgG의 수준; 미토마이신 C에 대한 골수 유래 세포의 내성; 메틸셀룰로스 및 미토마이신 C에서 살아있는 세포의 퍼센트; γC-의존적 신호전달 경로의 기능성; 및 세포의 IL-21/미토겐 자극에 의한 STAT3의 인산화 퍼센트. 참조 수준은 대조군 집단의 하나 이상의 관련 데이터세트로부터 수득될 수 있다. 본원에 사용된 바와 같은 "데이터세트"는 원하는 조건 하에 샘플(샘플 집단)의 평가로 인한 수치 값 세트이다. 데이터세트의 값은 예를 들어, 샘플로부터 측정치를 실험적으로 수득하고 이러한 측정으로부터 데이터세트를 구축함으로써 수득될 수 있다. 당업자에 의해 이해되는 바와 같이, 참조 수준은 예를 들어, 개별 데이터포인트의 집합; 예를 들어, 평균, 중앙값, 평균의 중앙값 등으로부터 의미있는 집합적 참조 수준에 도달하기 위해 당업계에서 유용하고 알려진 임의의 수학적 또는 통계적 공식을 기반으로 할 수 있다. 대안적으로, 참조 수준 또는 참조 수준을 생성하기 위한 데이터세트는 실험실과 같은 서비스 제공자로부터, 또는 데이터베이스 또는 데이터베이스가 저장된 서버로부터 수득될 수 있다.
데이터세트로부터의 참조 수준은 대조군 집단에서 유래된 이전 측정치로부터 유래될 수 있다. "대조군 집단"은 유사한 명시된 특성의 대상체 또는 샘플의 임의의 그룹화이다. 그룹화는 예를 들어, 임상 매개변수, 임상 평가, 치료 레지멘, 질환 상태, 병태의 중증도 등에 따를 수 있다. 특정 구현예에서, 그룹화는 연령 범위(예를 들어, 0-2 세) 및 면역손상되지 않은 상태에 기반한다. 특정 구현예에서, 정상 대조군 집단은 테스트 대상체에 연령이 일치하고 면역손상되지 않은 개체를 포함한다. 특정 구현예에서, 연령 일치는 상황에 따라 임상적으로 관련되므로, 예를 들어, 0-6 개월; 0-1 년; 0-2 년; 0-3 년; 10-15 년을 포함한다).
특정 구현예에서, 본원에 기재된 생체내 유전자 요법 및/또는 HSPC 동원과 연관된 특정 매개변수의 값에 대한 관련 참조 수준은 본원에 개시된 생체내 유전자 요법이 유전자 요법이 투여된 이를 필요로 하는 대상체에 대해 치료적으로 효과적인지를 결정하기 위해 대조군 집단에서 생체내 유전자 요법 및/또는 HSPC 동원과 연관된 특정한 상응하는 매개변수의 값을 기반으로 수득된다.
특정 구현예에서, 대조군 집단은 건강하고 면역 결핍이 없는 집단을 포함할 수 있다. 특정 구현예에서, 대조군 집단은 면역 결핍이 있고 치료 유효량의 (i) 치료 유전자와 연관된 Ad35 바이러스 벡터를 포함하는 제형; 및 (ii) 동원 인자가 투여되지 않은 집단을 포함할 수 있다. 특정 구현예에서, 대조군 집단은 면역 결핍이 있고 치료 유전자와 연관된 Ad35 바이러스 벡터를 포함하고 동원 인자를 포함하지 않는 제형이 치료 유효량으로 투여된 집단을 포함할 수 있다. 예로서, 관련 참조 수준은 대조군 대상체에서 생체내 유전자 요법 및/또는 HSPC 동원과 연관된 특정 매개변수의 값일 수 있다.
특정 구현예에서, 결론은 샘플 값이 참조 수준과 통계적으로 유의하게 상이하거나 또는 통계적으로 유의하게 상이하지 않은지 여부에 기반하여 도출된다. 측정치는 차이가 우연에만 기반하여 발생할 것으로 예측될 수준 내에 있는 경우 통계적으로 유의하게 상이하지 않다. 대조적으로, 통계적으로 유의한 차이 또는 증가는 우연으로만 발생할 것으로 예상된 것보다 더 큰 것이다. 통계적 유의성 또는 이의 결여는 당업계에 잘 알려진 다양한 방법 중 임의의 것에 의해 결정될 수 있다. 통계적 유의성에 대해 통상적으로 사용되는 측정치의 예는 p-값이다. p-값은 특정 데이터포인트와 동등한 주어진 결과를 수득할 확률을 나타내며, 여기서 데이터포인트는 무작위 우연 단독의 결과이다. 결과는 종종 0.05 보다 작거나 또는 동일한 p-값에서 (무작위 우연이 아니라) 유의한 것으로 간주된다. 특정 구현예에서, 샘플 값은 샘플 값 및 참조 수준이 통계적으로 유의하게 상이하지 않은 경우 정상 대조군 집단에서 유래된 참조 수준과 "비슷하"다.
특정 구현예에서, 본원에 기재된 생체내 유전자 요법 및/또는 HSPC 동원과 관련된 매개변수 및/또는 다른 데이터세트 구성요소에 대해 수득된 값은 선택된 매개변수를 사용한 분석 과정에 적용될 수 있다. 분석 과정의 매개변수는 본원에 개시된 것들 또는 본원에 기재된 지침을 사용하여 유래된 것들일 수 있다. 결과를 생성하는 데 사용되는 분석 과정은 샘플 분류에 유용한 결과를 제공할 수 있는 임의의 유형의 과정, 예를 들어, 수득된 값과 참조 수준의 비교, 선형 알고리즘, 이차 알고리즘, 결정 트리 알고리즘, 또는 투표 알고리즘일 수 있다. 분석 과정은 샘플이 주어진 클래스에 속할 확률을 결정하기 위한 임계값을 설정할 수 있다. 확률은 바람직하게는 적어도 60%, 적어도 70%, 적어도 80%, 적어도 90%, 적어도 95% 또는 그 이상이다.
본원에 기재된 Ad35 벡터는 하기 예시적인 구현예 및 실시예에 기재된 Ad5/Ad35++ 벡터 대신에 활용될 수 있다.
하기 예시적인 구현예 및 실시예(들)는 개시내용의 특정 구현예를 입증하기 위해 포함된다. 당업자는 많은 변화가 본원에 개시된 특이적 구현예로 이루어질 수 있고 개시내용의 사상 및 범위를 벗어나지 않고 여전히 비슷하거나 또는 유사한 결과를 수득할 수 있음을 본 개시내용에 비추어 인식하여야 한다.
V. 예시적인 구현예
예시적인 구현예의 첫번째 세트는 하기를 포함할 수 있다:
1. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 벡터 생산 시스템: 다음을 포함하는 재조합 Ad35 헬퍼 게놈: Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 서열의 적어도 일부에 플랭킹하는 재조합효소 지시 반복부(DR), 및 다음을 포함하는 재조합 헬퍼 의존적 Ad35 공여자 게놈: 5' Ad35 도립된 말단 반복부(ITR); 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열.
2. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 헬퍼 벡터: Ad35 섬유 샤프트; Ad35 섬유 놉; 및 Ad35 패키징 서열의 적어도 일부에 플랭킹하는 재조합효소 지시 반복부(DR)를 포함하는 Ad35 게놈.
3. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 헬퍼 게놈: Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 서열의 적어도 일부에 플랭킹하는 재조합효소 지시 반복부(DR).
4. 하기를 포함하는, 재조합 헬퍼 의존적 아데노바이러스 혈청형 35(Ad35) 공여자 벡터: 다음을 포함하는 핵산 서열: 5' Ad35 도립된 말단 반복부(ITR); 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열, 여기서 게놈은 Ad35 바이러스 구조적 단백질을 암호화하는 핵산 서열을 포함하지 않는 것; 및 Ad35 섬유 샤프트 및/또는 Ad35 섬유 놉.
5. 하기를 포함하는, 재조합 헬퍼 의존적 아데노바이러스 혈청형 35(Ad35) 공여자 게놈: 5' Ad35 도립된 말단 반복부(ITR); 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열, 여기서 Ad35 공여자 게놈은 야생형 Ad35 게놈에 의해 암호화된 발현 산물을 암호화하는 핵산 서열을 포함하지 않는 것.
6. 재조합 헬퍼 의존적 아데노바이러스 혈청형 35(Ad35) 공여자 벡터를 생산하는 방법으로, 상기 방법은 세포의 배양물로부터 재조합 헬퍼 의존적 Ad35 공여자 벡터를 단리하는 단계를 포함하며, 여기서 세포는 Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 서열의 적어도 일부에 플랭킹하는 재조합효소 지시 반복부(DR)를 포함하는 재조합 Ad35 헬퍼 게놈, 및 5' Ad35 도립된 말단 반복부(ITR); 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열을 포함하는 재조합 헬퍼 의존적 Ad35 공여자 게놈을 포함하는 것인, 방법.
7. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 생산 시스템: 다음을 포함하는 재조합 Ad35 헬퍼 게놈: Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 도립된 말단 반복부(ITR)는 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내의 재조합효소 지시 반복부(DR), 및 다음을 포함하는 재조합 Ad35 공여자 게놈:5' Ad35 ITR; 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열.
8. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 헬퍼 벡터: Ad35 섬유 샤프트; Ad35 섬유 놉; 및 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 도립된 말단 반복부(ITR)는 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내의 재조합효소 지시 반복부(DR)를 포함하는 Ad35 게놈.
9. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 헬퍼 게놈: Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 도립된 말단 반복부(ITR)는 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내의 재조합효소 지시 반복부(DR).
10. 재조합 헬퍼 의존적 아데노바이러스 혈청형 35(Ad35) 공여자 벡터를 생산하는 방법으로, 상기 방법은 세포의 배양물로부터 재조합 헬퍼 의존적 Ad35 공여자 벡터를 단리하는 단계를 포함하며, 여기서 세포는 Ad35 섬유 샤프트를 암호화하는 핵산 서열; Ad35 섬유 놉을 암호화하는 핵산 서열; 및 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 도립된 말단 반복부(ITR)는 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내의 재조합효소 지시 반복부(DR)를 포함하는 재조합 Ad35 헬퍼 게놈, 및 5' Ad35 ITR; 3' Ad35 ITR; Ad35 패키징 서열; 및 적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열을 포함하는 재조합 Ad35 공여자 게놈을 포함하는 것인, 방법.
11. 구현예 1-4 또는 6-10 중 어느 한 구현예에 있어서, 상기 Ad35 섬유 놉이 야생형 Ad35 섬유 놉을 포함하거나, 또는 Ad35 섬유 놉이 조작된 Ad35 섬유 놉을 포함하며, 여기서 조작된 섬유 놉은 CD46에 대한 섬유 놉의 친화도를 증가시키는 돌연변이를 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 공여자 벡터, 또는 방법.
12. 구현예 11에 있어서, 상기 돌연변이가 Ile192Val, Asp207Gly(또는 Glu207Gly), Asn217Asp, Thr226Ala, Thr245Ala, Thr254Pro, Ile256Leu, Ile256Val, Arg259Cys, 및 Arg279His로부터 선택된 돌연변이를 포함하거나; 또는 돌연변이 Ile192Val, Asp207Gly(또는 Glu207Gly), Asn217Asp, Thr226Ala, Thr245Ala, Thr254Pro, Ile256Leu, Ile256Val, Arg259Cys, 및 Arg279His 각각을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 공여자 벡터, 또는 방법.
13. 구현예 1, 4-7, 또는 10-12 중 어느 한 구현예에 있어서, 상기 이종 발현 산물이 조절 서열과 작동가능하게 연결된 치료 발현 산물을 포함하며, 임의적으로 여기서 치료 발현 산물은 (a) β-글로빈 단백질 또는 γ-글로빈 단백질; (b) 항체 또는 이의 면역글로불린 쇄로, 임의적으로 여기서 항체는 항-CD33 항체를 포함하는 것; (c) 제1 항체 또는 이의 면역글로불린 쇄 및 제2 항체 또는 이의 면역글로불린 쇄로, 임의적으로 여기서 항체는 항-CD33 항체를 포함하는 것; (d) CRISPR-연관 RNA-가이드된 엔도뉴클레아제 및/또는 가이드 RNA(gRNA)로, 임의적으로 여기서 CRISPR-연관 RNA-가이드된 엔도뉴클레아제는 Cas9 또는 cpf1을 포함하는 것; (e) 염기 편집기 및/또는 gRNA로, 임의적으로 여기서 염기 편집기는 사이토신 염기 편집기(CBE) 또는 아데닌 염기 편집기(ABE)를 포함하며, 임의적으로 여기서 염기 편집기는 기능상실된 Cas9 및 기능상실된 cpf1로부터 선택된 촉매적으로 기능상실된 뉴클레아제를 포함하는 것; (f) 바이러스 감염을 차단하거나 또는 감소시키는 응고 인자 또는 단백질로, 임의적으로 여기서 치료 발현 산물은 인자 VII 대체 단백질 또는 인자 VIII 대체 단백질을 포함하는 것; (g) 체크포인트 억제제; (h) 키메라 항원 수용체 또는 조작된 T 세포 수용체; 또는 (i) γC, JAK3, IL7RA, RAG1, RAG2, DCLRE1C, PRKDC, LIG4, NHEJ1, CD3D, CD3E, CD3Z, CD3G, PTPRC, ZAP70, LCK, AK2, ADA, PNP, WHN, CHD7, ORAI1, STIM1, CORO1A, CIITA, RFXANK, RFX5, RFXAP, RMRP, DKC1, TERT, TINF2, DCLRE1B, SLC46A1, FancA, FancB, FancC, FancD1, FancD2, FancE, FancF, FancG, FancI, FancJ, FancL, FancM, FancN, FancO, FancP, FancQ, FancR, FancS, FancT, FancU, FancV, FancW, 가용성 CD40, CTLA, Fas L, PD-L1에 대한 항체, CD4에 대한 항체, CD5에 대한 항체, CD7에 대한 항체, CD52에 대한 항체, IL-1에 대한 항체, IL-2에 대한 항체, IL-4에 대한 항체, IL-6에 대한 항체, IL-10에 대한 항체, TNF에 대한 항체, 자가반응성 T 세포 상에 특이적으로 존재하는 TCR에 대한 항체, 글로빈 패밀리 유전자, WAS, phox, 디스트로핀, 피루베이트 키나제, CLN3, ABCD1, 아릴술파타제 A, SFTPB, SFTPC, NLX2.1, ABCA3, GATA1, 리보솜 단백질 유전자, TERT, TERC, DKC1, TINF2, CFTR, LRRK2, PARK2, PARK7, PINK1, SNCA, PSEN1, PSEN2, APP, SOD1, TDP43, FUS, 유비퀼린 2, 및/또는 C9ORF72로 이루어진 군으로부터 선택된 단백질로, 임의적으로 여기서 단백질은 FancA 단백질을 포함하는 것을 포함하는, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
14. 구현예 13(d) 또는 13(e)에 있어서, 상기 gRNA가 HBG1, HBG2, 및/또는 적혈구 인핸서 bcl11a의 표적 핵산 서열에 결합하며, 임의적으로 여기서 gRNA는 γ-글로빈의 발현을 증가시키도록 조작되거나; 또는 상기 gRNA가 CD33의 일부를 암호화하는 표적 핵산 서열에 결합하며, 임의적으로 여기서 CD33은 인간 CD33을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
15. 구현예 13에 있어서, 상기 치료 발현 산물이 β-글로빈 단백질 또는 γ-글로빈 단백질; 및 CRISPR-연관 RNA-가이드된 엔도뉴클레아제를 포함하는 CRISPR 시스템; 및 다음 중 1, 2, 또는 3 개를 포함하며: HBG1의 표적 핵산에 결합하는 gRNA; HBG2의 표적 핵산 서열에 결합하는 gRNA; 및/또는 Bcl11a의 표적 핵산 서열에 결합하는 gRNA, 임의적으로 여기서 gRNA는 γ-글로빈의 발현을 증가시키도록 조작되는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
16. 구현예 13에 있어서, 상기 조절 서열(들)이 프로모터를 포함하며, 임의적으로 여기서 프로모터는 β-글로빈 프로모터를 포함하며, 임의적으로 여기서 β-글로빈 프로모터는 약 1.6 kb의 길이를 갖고/갖거나 염색체 11의 위치 5228631-5227023에 따른 핵산을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
17. 구현예 13에 있어서, 상기 조절 서열(들)이 유전자좌 제어 영역(LCR)을 포함하며, 임의적으로 여기서 LCR은 β-글로빈 LCR을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법
18. 구현예 13에 있어서, 상기 β-글로빈 LCR이
HS1, HS2, HS3, 및 HS4를 포함하거나 또는 이로 이루어진 β-글로빈 LCR DNAse I 과민성 부위(HS)를 포함하며, 임의적으로 여기서 β-글로빈 LCR은 약 4.3 kb의 길이를 갖거나;
HS1, HS2, HS3, HS4, 및 HS5를 포함하는 β-글로빈 LCR DNAse I HS를 포함하며, 임의적으로 여기서 β-글로빈 LCR은 약 21.5 kb의 길이를 갖거나; 또는
상기 β-글로빈 LCR이 염색체 11의 위치 5292319-5270789에 따른 서열을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
19. 구현예 13 또는 14에 있어서, 상기 조절 서열(들)이 3'HS1을 포함하며, 임의적으로 여기서 3'HS1은 염색체 11의 위치 5206867-5203839에 따른 서열을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
20. 구현예 13-19 중 어느 한 구현예에 있어서, 상기 조절 서열(들)이 miRNA 결합 부위를 포함하며, 임의적으로 여기서 miRNA 결합 부위는 관심 종에 의해 자연적으로 발현되는 miRNA에 대한 결합 부위를 포함하고/하거나; miRNA는 혈액 및 종양 미세환경 또는 표적 조직에서 차등 점유 프로파일을 입증하며, 임의적으로 여기서 점유 프로파일은 종양 미세환경 또는 표적 조직에서보다 혈액에서 더 높은 것이고/이거나; miRNA 결합 부위는 miR423-5, miR423-5p, miR42-2, miR181c, miR125a, 또는 miR15a 결합 부위를 포함하고/하거나; miRNA 결합 부위는 miR187 또는 miR218 결합 부위를 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
21. 구현예 1, 4-7, 또는 10-21 중 어느 한 구현예에 있어서, 상기 이종 발현 산물을 암호화하는 핵산이 통합 요소를 추가로 포함하는 페이로드의 일부이며, 임의적으로 여기서 통합 요소는 발현 산물을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
22. 구현예 21에 있어서, 상기 통합 요소가 상동 재조합에 의해 표적 게놈 내로 통합을 위해 조작되고, 상기 통합 요소가 표적 게놈의 인접하게 연결된 서열에 상응하는 상동성 아암에 의해 플랭킹되며, 임의적으로 여기서 상동성 아암은 0.8 내지 1.8 kb인 것이고/이거나; 상동성 아암은 염색체 안전 항구 유전자좌에 플랭킹하는 표적 게놈의 핵산 서열에 상동성이며, 임의적으로 여기서 안전 항구 유전자좌는 AAVS1, CCR5, HPRT, 또는 Rosa로부터 선택되는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
23. 구현예 21에 있어서, 상기 통합 요소가 전위에 의해 표적 게놈 내로 통합을 위해 조작되고, 상기 통합 요소가 트랜스포존 도립 반복부(IR)에 의해 플랭킹되며, 임의적으로 여기서 트랜스포존 IR은 재조합효소 DR에 의해 플랭킹되는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
24. 구현예 23에 있어서, 상기 트랜스포존 IR이 잠자는 미녀(SB) IR이며, 임의적으로 여기서 SB IR은 pT4 IR이거나; 또는 트랜스포존 IR이 피기백, 마리너, 개구리 왕자, Tol2, TcBuster, 또는 spinON IR인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
25. 구현예 21-24 중 어느 한 구현예에 있어서, 트랜스포존 IR에 의해 플랭킹된 통합 요소의 전위를 매개하는 트랜스포사제를 암호화하는 핵산을 포함하며, 임의적으로 여기서 트랜스포사제를 암호화하는 핵산은 지지 벡터 또는 지지 벡터 게놈으로 구성되는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
26. 구현예 25에 있어서, 상기 트랜스포사제가 잠자는 미녀, 피기백, 마리너, 개구리 왕자, Tol2, TcBuster, 또는 spinON 트랜스포사제를 포함하며, 임의적으로 여기서 트랜스포사제는 잠자는 미녀 100x(SB100x) 트랜스포사제인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
27. 구현예 25 또는 26에 있어서, 상기 트랜스포사제를 암호화하는 핵산이 PGK 프로모터와 작동가능하게 연결되는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
28. 구현예 1-3 또는 6-27 중 어느 한 구현예에 있어서, 상기 Ad35 패키징 서열의 적어도 일부에 플랭킹되고/되거나 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내에 있고 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 ITR은 방해하지 않는 재조합효소 DR이 FRT, loxP, rox, vox, AttB, 또는 AttP 부위인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
29. 구현예 28에 있어서, 상기 Ad35 패키징 서열의 적어도 일부의 절제를 위한 재조합효소를 암호화하는 핵산이 헬퍼 게놈을 포함하는 세포의 핵산 서열에 의해 암호화되는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
30. 구현예 23-29 중 어느 한 구현예에 있어서, 상기 트랜스포존 IR에 플랭킹하는 재조합효소 DR이 FRT, loxP, rox, vox, AttB, 또는 AttP 부위인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
31. 구현예 21-28 중 어느 한 구현예에 있어서, 상기 통합 요소를 포함하는 핵산의 절제를 위한 재조합효소를 암호화하는 핵산이 지지 벡터 또는 지지 벡터 게놈으로 구성되는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
32. 구현예 29 또는 31에 있어서, 상기 재조합효소가 Flp, Cre, Dre, Vika, 또는 PhiC31 재조합효소를 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
33. 구현예 32에 있어서, 상기 재조합효소를 암호화하는 핵산이 EF1α 프로모터와 작동가능하게 연결되는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
34. 구현예 21-33 중 어느 한 구현예에 있어서, 상기 페이로드가 이종 발현 산물을 포함하는 통합요소를 포함하며, 여기서 이종 발현 산물은 β-글로빈 프로모터 및 β-글로빈 긴 LCR과 작동가능하게 연결된 β-글로빈을 포함하고,
여기서 통합 요소는 SB IR에 의해 플랭킹되며, 여기서 SB IR은 재조합효소 DR에 의해 플랭킹되며, 임의적으로 여기서 재조합효소 DR은 FRT 부위인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
35. 구현예 21-34 중 어느 한 구현예에 있어서, 상기 페이로드가 통합 요소, 및 발현 산물을 암호화하고, 통합 요소로 구성되지 않고, 표적 게놈 내로 통합 효소의 통합에 의해 기능적이지 않게 만들도록 위치하는 조건부로 발현되는 핵산 서열을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
36. 구현예 35에 있어서, 상기 조건부로 발현되는 핵산 서열에 의해 암호화되는 발현 산물이 CRISPR 시스템 구성요소 또는 염기 편집기 시스템 구성요소를 포함하며, 임의적으로 여기서 구성요소는 CRISPR-연관 RNA-가이드된 엔도뉴클레아제, 염기 편집기 효소, 또는 gRNA를 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
37. 구현예 21-36 중 어느 한 구현예에 있어서, 상기 페이로드가 선택 카세트를 포함하며, 임의적으로 여기서 선택 카세트는 통합 요소로 구성되는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
38. 구현예 37에 있어서, 상기 선택 카세트가 mgmtP140K를 암호화하는 핵산 서열을 포함하거나 또는 상기 선택 카세트가 항-CD33 shRNA를 암호화하는 핵산 서열을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
39. 구현예 1-3 또는 6-38 중 어느 한 구현예에 있어서, 상기 재조합효소 DR에 의해 플랭킹된 Ad35 패키징 서열의 적어도 일부가 GenBank 수탁 번호 AX049983에 따른 Ad35 서열의 뉴클레오티드 138-481에 상응하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
40. 구현예 1-3 또는 6-38 중 어느 한 구현예에 있어서, 상기 재조합효소 DR에 의해 플랭킹된 Ad35 패키징 서열의 적어도 일부가 GenBank 수탁 번호 AX049983에 따른 Ad35 서열의 뉴클레오티드 179-344; 뉴클레오티드 366-481; 뉴클레오티드 155-481; 뉴클레오티드 159-480; 뉴클레오티드 159-446; 뉴클레오티드 180-480; 뉴클레오티드 207-480; 뉴클레오티드 140-446; 뉴클레오티드 159-446; 뉴클레오티드 180-446; 뉴클레오티드 202-446; 뉴클레오티드 159-481; 뉴클레오티드 180-384; 뉴클레오티드 180-481; 또는 뉴클레오티드 207-481에 상응하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
41. 구현예 1-3 또는 6-40 중 어느 한 구현예에 있어서, 상기 재조합효소 DR이 LoxP 부위인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
42. 구현예 2, 3, 8, 또는 9 중 어느 한 구현예에 있어서, 상기 Ad35 헬퍼 게놈이 293 T 세포에서 증폭을 위해 Ad5 E4orf6을 포함하는 것인, 헬퍼 벡터 또는 헬퍼 게놈.
43. 구현예 2, 3, 8, 또는 9 중 어느 한 구현예에 있어서, 상기 헬퍼 게놈이 서열번호: 51-65 중 어느 하나에 제시된 바와 같은 서열을 포함하거나 또는 생성하는 것인, 헬퍼 벡터 또는 헬퍼 게놈.
44. 구현예 2-5, 8, 또는 9 중 어느 한 구현예의 헬퍼 벡터, 헬퍼 게놈, 공여자 벡터, 또는 공여자 게놈을 포함하는 세포로, 임의적으로 여기서 세포는 HEK293 세포인, 세포.
45. 구현예 1, 4, 6, 7, 10, 13-27 또는 44 중 어느 한 구현예에 있어서, 공여자 게놈을 포함하는 세포로, 임의적으로 여기서 세포는 적혈구이고, 임의적으로 여기서 세포는 조혈 줄기 세포, T-세포, B-세포, 또는 골수성 세포이고, 임의적으로 여기서 세포는 발현 산물을 분비하는 것인, 세포.
46. 구현예 6 또는 10-41 중 어느 한 구현예에 있어서, 상기 세포가 HEK293 세포인, 방법.
47. 세포를 변형시키는 방법으로, 상기 방법은 구현예 5 또는 11-27 중 어느 한 구현예에 따른 Ad35 공여자 벡터와 세포를 접촉시키는 단계를 포함하는 것인, 방법.
48. 대상체의 세포를 변형시키는 방법으로, 상기 방법은 구현예 5 또는 11-27 중 어느 한 구현예에 따른 Ad35 공여자 벡터를 대상체에게 투여하는 단계를 포함하며, 임의적으로 여기서 방법은 대상체로부터 세포의 단리를 포함하지 않는 것인, 방법.
49. 질환 또는 병태의 치료를 필요로 하는 대상체에서 질환 또는 병태를 치료하는 방법으로, 구현예 5 또는 11-27 중 어느 한 구현예에 따른 Ad35 공여자 벡터를 대상체에게 투여하는 단계를 포함하며, 임의적으로 여기서 투여는 정맥내 투여인, 방법.
50. 구현예 49에 있어서, 상기 방법이 동원제를 대상체에게 투여하는 단계를 포함하며, 임의적으로 여기서 동원제는 과립구-콜로니 자극 인자, GM-CSF, S-CSF, CXCR4 길항제, 및 CXCR2 작용제 중 하나 이상을 포함하며, 임의적으로 여기서 CXCR4 길항제는 AMD3100을 포함하고/하거나 여기서 CXCR2 작용제는 GRO-β를 포함하는 것인, 방법.
51. 구현예 49 또는 50에 있어서, 상기 Ad35 공여자 벡터가 선택 카세트를 포함하며, 임의적으로 여기서 방법은 대상체에게 선택제를 투여하는 단계를 추가로 포함하며, 임의적으로 여기서 선택 카세트는 mgmtP140K를 암호화하고 선택제는 O6BG/BCNU를 포함하는 것인, 방법.
52. 구현예 49-51 중 어느 한 구현예에 있어서, 상기 방법이 면역 억제제를 대상체에게 투여하는 단계를 추가로 포함하며, 임의적으로 여기서 면역 억제 레지멘은 스테로이드, IL-6 수용체 길항제, 및/또는 IL-1R 수용체 길항제를 포함하며, 임의적으로 여기서 스테로이드는 글루코코르티코이드 또는 덱사메타손을 포함하는 것인, 방법.
53. 구현예 49-52 중 어느 한 구현예에 있어서, 상기 Ad35 공여자 벡터가 통합 요소를 포함하고 방법이 CD46을 발현하는 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%, 조혈 줄기 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%, 및/또는 적혈구 Ter119+ 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 이의 통합 요소의 카피의 통합 및/또는 발현을 유발하는 것인, 방법.
54. 구현예 49-53 중 어느 한 구현예에 있어서, 상기 방법이 통합 요소의 적어도 1 개의 카피를 포함하는 표적 세포 게놈에서 통합 요소의 평균 적어도 2 개의 카피 또는 적어도 2.5 개의 카피의 통합을 유발하는 것인, 방법.
55. 구현예 49-54 중 어느 한 구현예에 있어서, 상기 방법이 참조 수준의 적어도 약 20% 또는 참조 수준의 적어도 약 25%인 수준에서 페이로드에 의해 암호화된 발현 산물 또는 이의 통합 요소의 발현을 유발하며, 임의적으로 여기서 참조는 대상체 또는 참조 집단에서 내인성 참조 단백질의 발현인, 방법.
56. 구현예 49-55 중 어느 한 구현예에 있어서, 상기 질환 또는 병태가 혈색소병증, 혈소판 장애, 빈혈, 면역 결핍 응고 인자 결핍, 판코니 빈혈, 알파-1 항트립신 결핍, 겸상 세포 빈혈, 지중해빈혈, 중간형 지중해빈혈, A형 혈우병, B형 혈우병, 폰빌레브란트병, 인자 V 결핍, 인자 VII 결핍, 인자 X 결핍, 인자 XI 결핍, 인자 XII 결핍, 인자 XIII 결핍, 베르나르-술리에 증후군, 그레이 혈소판 증후군, 또는 뮤코다당류축적증을 포함하는 것인, 방법.
57. 구현예 49-56 중 어느 한 구현예에 있어서, 상기 대상체가 암을 앓고 있는 대상체이고 상기 방법이 암을 치료, 예방, 또는 지연시키거나, 또는 암 재발을 지연시키며,
임의적으로 여기서 대상체는 암의 발달과 연관된 하나 이상의 생식 계열 돌연변이의 보균자이며, 임의적으로 여기서 암은 역형성 성상세포종, 유방암, 난소암, 결장직장암, 미만성 내재성 뇌간 신경교종, 유잉 육종, 다형성 교모세포종, 악성 뇌교종, 흑색종, 전이성 악성 흑색종, 비인두암, 또는 소아암을 포함하며, 임의적으로 여기서 대상체는 O6BG, TMZ(테모졸로미드), 및/또는 BCNU(카르무스틴)를 받거나 또는 투여받는 것인, 방법.
58. 구현예 49-57 중 어느 한 구현예에 있어서, 상기 질환 또는 병태가 중간형 지중해빈혈을 포함하며, 임의적으로 여기서 벡터 또는 게놈은 내인성 γ-글로빈의 발현을 증가 또는 재활성화하는 발현 산물(들)로부터 선택된 하나 이상의 발현 산물을 암호화하는 핵산을 포함하며, 임의적으로 여기서 내인성 γ-글로빈의 발현을 증가 또는 재활성화하는 발현 산물(들)은 CRISPR-연관 RNA-가이드된 엔도뉴클레아제 또는 염기 편집기 및 HBG1의 핵산 서열에 결합하고 표적 핵산 서열과 작동가능하게 연결된 코딩 서열로부터 발현을 증가시키도록 조작된 gRNA; HBG2의 핵산 서열에 결합하고 표적 핵산 서열과 작동가능하게 연결된 코딩 서열로부터 발현을 증가시키도록 조작된 gRNA; 및 적혈구 인핸서 bcl11a의 핵산 서열에 결합하고 BCL11A의 발현을 감소시키도록 조작된 gRNA; γ-글로빈; 및 β-글로빈 중 하나 이상을 포함하며, 임의적으로 여기서 방법은 중간형 지중해빈혈의 증상을 감소시키고/시키거나 중간형 지중해빈혈을 치료하고/하거나 HbF를 증가시키는 것인, 방법.
예시적인 구현예의 두번째 세트는 하기를 포함할 수 있다:
1. 조혈 줄기 세포의 생체내 유전자 편집을 위한 CD46을 표적화하는 재조합 혈청형 35 아데노바이러스(Ad35) 벡터.
2. 구현예 1에 있어서, 상기 벡터의 섬유 놉 단백질이 CD46 결합을 증가시키는 돌연변이를 포함하는 것인, 재조합 Ad35 벡터.
3. 구현예 2에 있어서, 상기 섬유 놉 단백질 돌연변이가 Asn217Asp, Thr254Pro, Ile256Leu, Asp207Gly(또는 Glu207Gly), Thr245Ala, Thr226Ala, Ile192Val, Ile256Val, Arg259Cys, 및 Arg279His 중 하나 이상으로부터 선택되는 것인, 재조합 Ad35 벡터.
4. 구현예 2에 있어서, 상기 섬유 놉 단백질 돌연변이가 Asn217Asp, Thr254Pro, Ile256Leu, Asp207Gly(또는 Glu207Gly), Thr245Ala, Thr226Ala, Ile192Val, Ile256Val, Arg259Cys, 및 Arg279His를 포함하는 것인, 재조합 Ad35 벡터.
5. 구현예 2에 있어서, 상기 섬유 놉 단백질 돌연변이가 Asn217Asp, Thr254Pro, Ile256Leu, Asp207Gly(또는 Glu207Gly), Thr245Ala, Thr226Ala, Ile192Val, Ile256Val, Arg259Cys, 및 Arg279His로 이루어지는 것인, 재조합 Ad35 벡터.
6. 구현예 1에 있어서, 생체내 암호화된 유전자의 발현을 조절하는 miRNA 제어 시스템을 포함하는 것인, 재조합 Ad35 벡터.
7. 구현예 6에 있어서, 상기 miRNA 제어 시스템이 혈액 및 종양 미세환경 또는 표적 조직에서 차등 점유 프로파일을 갖는 miRNA 표적 부위로 이루어지는 것인, 재조합 Ad35 벡터.
8. 구현예 7에 있어서, 상기 점유 프로파일이 종양 미세환경 또는 표적 조직에서보다 혈액에서 더 높은 것인, 재조합 Ad35 벡터.
9. 구현예 6에 있어서, 상기 miRNA 표적 부위가 miR423-5, miR423-5p, miR42-2, miR181c, miR125a, 및/또는 miR15a를 포함하는 것인, 재조합 Ad35 벡터.
10. 구현예 6에 있어서, 상기 miRNA 표적 부위가 Cas9의 발현을 제어하는 것인, 재조합 Ad35 벡터.
11. 구현예 6에 있어서, 상기 miRNA 표적 부위가 miR187, 및/또는 miR218을 포함하는 것인, 재조합 Ad35 벡터.
12. 구현예 1에 있어서, DNA 파괴를 매개하고/하거나 내인성 유전자 발현을 활성화시키기 위해 CRISPR 구성요소를 암호화하는 뉴클레오티드를 포함하는 것인, 재조합 Ad35 벡터.
13. 구현예 12에 있어서, 상기 CRISPR 구성요소가 뉴클레아제 및 가이드 RNA를 포함하는 것인, 재조합 Ad35 벡터.
14. 구현예 13에 있어서, 상기 뉴클레아제가 Cas9 또는 cpf1을 포함하는 것인, 재조합 Ad35 벡터.
15. 구현예 12에 있어서, 상기 CRISPR 구성요소가 촉매적으로 기능상실된 뉴클레아제를 포함하는 것인, 재조합 Ad35 벡터.
16. 구현예 15에 있어서, 상기 촉매적으로 기능상실된 뉴클레아제가 기능상실된 Cas9 또는 기능상실된 cpf1을 포함하는 것인, 재조합 Ad35 벡터.
17. 구현예 15에 있어서, 상기 촉매적으로 기능상실된 뉴클레아제가 가이드 RNA 및 사이티딘 또는 아데닌 데아미나제 또는 트랜스아미나제에 융합되는 것인, 재조합 Ad35 벡터.
18. 구현예 13에 있어서, 상기 가이드 RNA가 HBG1 프로모터, HBG2 프로모터, 및/또는 bcl11a 인핸서에 결합하는 것인, 재조합 Ad35 벡터.
19. 구현예 1에 있어서, 양성 선택 마커를 포함하는, 재조합 Ad35 벡터.
20. 구현예 19에 있어서, 상기 양성 선택 마커가 항-CD33 shRNA 카세트 및/또는 MGMTP140K 카세트를 포함하는 것인, 재조합 Ad35 벡터.
21. 구현예 1에 있어서, 상동성 아암을 포함하는, 재조합 Ad35 벡터.
22. 구현예 21에 있어서, 상기 상동성 아암이 0.8 내지 1.8kb인, 재조합 Ad35 벡터.
23. 구현예 21에 있어서, 상기 상동성 아암이 염색체 안전 항구 유전자좌에 특이적인 것인, 재조합 Ad35 벡터.
24. 구현예 23에 있어서, 상기 염색체 안전 항구 유전자좌가 AAVS1, CCR5, HPRT, 또는 Rosa로부터 선택되는 것인, 재조합 Ad35 벡터.
25. 구현예 1에 있어서, 트랜스포사제에 의해 인식되는 도립 반복 서열을 포함하는, 재조합 Ad35 벡터.
26. 구현예 1에 있어서, 트랜스포사제를 암호화하는 뉴클레오티드 서열을 포함하는, 재조합 Ad35 벡터.
27. 구현예 26에 있어서, 상기 트랜스포사제가 잠자는 미녀, 피기백, 마리너, 개구리 왕자, Tol2, TcBuster, 및 spinON을 포함하는 것인, 재조합 Ad35 벡터.
28. 구현예 26에 있어서, 상기 트랜스포사제가 과활성 잠자는 미녀 트랜스포사제 또는 과활성 피기백 트랜스포사제를 포함하는 것인, 재조합 Ad35 벡터.
29. 구현예 28에 있어서, 상기 과활성 잠자는 미녀 트랜스포사제가 SB100X를 포함하는 것인, 재조합 Ad35 벡터.
30. 구현예 26에 있어서, 상기 트랜스포사제를 암호화하는 뉴클레오티드 서열이 PGK 프로모터의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
31. 구현예 1에 있어서, 재조합효소 인식 서열을 포함하는, 재조합 Ad35 벡터.
32. 구현예 31에 있어서, 상기 재조합효소 인식 서열이 Frt, lox, rox, vox, AttB, 또는 AttP를 포함하는 것인, 재조합 Ad35 벡터.
33. 구현예 1에 있어서, 재조합효소를 암호화하는 뉴클레오티드 서열을 포함하는, 재조합 Ad35 벡터.
34. 구현예 33에 있어서, 상기 재조합효소가 Flp, Cre, Dre, Vika, 또는 PhiC31을 포함하는 것인, 재조합 Ad35 벡터.
35. 구현예 33에 있어서, 상기 재조합효소를 암호화하는 뉴클레오티드 서열이 EF1α 프로모터의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
36. 구현예 1-35 중 어느 한 구현예에 있어서, 치료 카세트를 포함하는, 재조합 Ad35 벡터.
37. 구현예 36에 있어서, 상기 치료 카세트가 치료 유전자를 포함하거나 또는 γC, JAK3, IL7RA, RAG1, RAG2, DCLRE1C, PRKDC, LIG4, NHEJ1, CD3D, CD3E, CD3Z, CD3G, PTPRC, ZAP70, LCK, AK2, ADA, PNP, WHN, CHD7, ORAI1, STIM1, CORO1A, CIITA, RFXANK, RFX5, RFXAP, RMRP, DKC1, TERT, TINF2, DCLRE1B, SLC46A1, FancA, FancB, FancC, FancD1(BRCA2), FancD2, FancE, FancF, FancG, FancI, FancJ(BRIP1), FancL, FancM, FancN(PALB2), FancO(RAD51C), FancP(SLX4), FancQ(ERCC4), FancR(RAD51), FancS(BRCA1), FancT(UBE2T), FancU(XRCC2), FancV(MAD2L2), FancW(RFWD3), 가용성 CD40, CTLA, Fas L, PD-L1에 대한 항체, CD4에 대한 항체, CD5에 대한 항체, CD7에 대한 항체, CD52에 대한 항체, IL-1에 대한 항체, IL-2에 대한 항체, IL-4에 대한 항체, IL-6에 대한 항체, IL-10에 대한 항체, TNF에 대한 항체, 자가반응성 T 세포 상에 특이적으로 존재하는 TCR에 대한 항체, 글로빈 패밀리 유전자, WAS, phox, 디스트로핀, 피루베이트 키나제, CLN3, ABCD1, 아릴술파타제 A, SFTPB, SFTPC, NLX2.1, ABCA3, GATA1, 리보솜 단백질 유전자, TERT, TERC, DKC1, TINF2, CFTR, LRRK2, PARK2, PARK7, PINK1, SNCA, PSEN1, PSEN2, APP, SOD1, TDP43, FUS, 유비퀼린 2, 및/또는 C9ORF72로부터 선택된 치료 유전자 산물을 암호화하는 것인, 재조합 Ad35 벡터.
38. 구현예 36에 있어서, 상기 치료 카세트가 공통 감마(γ) 쇄, FancA, γ-글로빈, 및/또는 FVIII을 포함하거나 또는 암호화하는 치료 유전자를 포함하는 것인, 재조합 Ad35 벡터.
39. 구현예 36에 있어서, 상기 치료 카세트가 키메라 항원 수용체, 조작된 T 세포 수용체, 및/또는 치료 항체를 암호화하는 치료 유전자를 포함하는 것인, 재조합 Ad35 벡터.
40. 구현예 38에 있어서, 상기 치료 유전자가 β-글로빈 프로모터의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
41. 구현예 38에 있어서, 상기 치료 유전자가 HS1, HS2, HS3, 및 HS4로 이루어진 DNAse I 과민성 부위(HS)를 포함하는 β-글로빈 유전자좌 제어 영역(LCR)의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
42. 구현예 41에 있어서, 상기 β-글로빈 LCR가 대략 4.3 kb인, 재조합 Ad35 벡터.
43. 구현예 41에 있어서, 상기 치료 유전자가 추가로 β-글로빈 프로모터의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
44. 구현예 43에 있어서, 상기 β-글로빈 프로모터가 대략 1.6 kb인, 재조합 Ad35 벡터.
45. 구현예 44에 있어서, 상기 β-글로빈 프로모터가 염색체 11의 위치 5228631-5227023의 서열을 갖는 것인, 재조합 Ad35 벡터.
46. 구현예 38에 있어서, 상기 치료 유전자가 HS1, HS2, HS3, HS4, 및 HS5를 포함하는 β-글로빈 긴 LCR의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
47. 구현예 46에 있어서, 상기 β-글로빈 긴 LCR이 대략 21.5 kb인, 재조합 Ad35 벡터.
48. 구현예 47에 있어서, 상기 β-글로빈 긴 LCR이 염색체 11의 위치 5292319-5270789의 서열을 갖는 것인, 재조합 Ad35 벡터.
49. 구현예 46에 있어서, 상기 치료 유전자가 추가로 β-글로빈 프로모터의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
50. 구현예 49에 있어서, 상기 β-글로빈 프로모터가 대략 1.6 kb인, 재조합 Ad35 벡터.
51. 구현예 50에 있어서, 상기 β-글로빈 프로모터가 염색체 11의 위치 5228631-5227023의 서열을 갖는 것인, 재조합 Ad35 벡터.
52. 구현예 46에 있어서, 3'HS1을 추가로 포함하는, 재조합 Ad35 벡터.
53. 구현예 52에 있어서, 상기 3'HS1이 염색체 11의 위치 5206867-5203839의 서열을 갖는 것인, 재조합 Ad35 벡터.
54. 구현예 1에 있어서, 적어도 30 kb 트랜스포존을 포함하는, 재조합 Ad35 벡터.
55. 구현예 1에 있어서, 32.4 kb 트랜스포존을 포함하는, 재조합 Ad35 벡터.
56. 구현예 1에 있어서, 헬퍼 바이러스를 사용하여 생성되는, 재조합 Ad35 벡터.
57. 구현예 56에 있어서, 상기 헬퍼 바이러스가 293 T 세포에서 증폭을 위해 Ad5 E4orf6을 포함하는 것인, 재조합 Ad35 벡터.
58. 구현예 56에 있어서, 상기 헬퍼 바이러스가 Ad35 신호전달 서열 및 패키징 서열을 포함하는 것인, 재조합 Ad35 벡터.
59. 구현예 56에 있어서, 상기 헬퍼 바이러스가 바이러스 제조 동안 CRISPR 구성요소의 발현을 방지하기 위해 항-CRISPR(acr) 발현 카세트를 포함하는 것인, 재조합 Ad35 벡터.
60. 구현예 56에 있어서, 상기 헬퍼 벡터가 서열번호: 51-64의 서열을 포함하거나 또는 생성하는 것인, 재조합 Ad35 벡터.
61. 치료 단백질을 발현하도록 유전적으로 변형된 적혈구.
62. 구현예 61에 있어서, 상기 치료 단백질이 바이러스 감염을 차단 또는 감소시키는 응고 인자 또는 단백질을 포함하는, 적혈구.
63. 구현예 61에 있어서, 상기 적혈구가 치료 단백질을 분비하는 것인, 적혈구.
64. 적혈구 bcl11a-인핸서 및 HBG 프로모터 영역을 동시에 표적화함으로써 HbF 재활성화를 증가시키기 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
65. γ-글로빈 유전자 추가 및 내인성 γ-글로빈 유전자 재활성화의 조합을 위한, 구현예 1-63 중 어느 한 구현의 재조합 Ad35 벡터 또는 적혈구의 용도.
66. 생체내 CRISPR 게놈 조작을 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
67. 치료 유전자를 제공하기 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
68. (i) 혈색소병증, (ii) 판코니 빈혈, (iii) 임의적으로 A형 혈우병, B형 혈우병, 또는 폰빌레브란트병으로부터 선택된 응고 인자 결핍, (iv) 혈소판 장애, (v) 빈혈, (vi) 알파-1 항트립신 결핍, 또는 (v) 면역 결핍을 치료하기 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
69. 지중해빈혈을 치료하기 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
70. 암을 치료하거나, 암 재발을 예방 또는 지연시키거나 또는 고위험 생식 계열 돌연변이의 보균자에서 암 발병을 예방 또는 지연시키기 위한 것이며, 임의적으로 여기서 암은 유방암 또는 난소암인, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
71. CRISPR/Cas9의 자기-불활성화를 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
72. 자기-방출 카세트를 갖는 HDAd를 공여자 벡터로서 사용하여 표적화된 통합을 위한, 구현예 1-3 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
73. 구현예 64 - 72 중 어느 한 구현예에 있어서, 동원을 포함하는, 용도.
74. 구현예 49에 있어서, 상기 동원이 Gro-베타, GM-CSF, S-CSF, 및/또는 AMD3100의 투여를 포함하는, 용도.
75. 구현예 64 - 72 중 어느 한 구현예에 있어서, 스테로이드, IL-6 수용체 길항제, 및/또는 IL-1R 수용체 길항제를 Ad35 벡터 및/또는 적혈구를 받는 대상체에게 투여하는 것을 포함하는, 용도.
76. 구현예 75에 있어서, 상기 스테로이드가 글루코코르티코이드를 포함하는 것인, 용도.
77. 구현예 75에 있어서, 상기 스테로이드가 덱사메타손을 포함하는 것인, 용도.
78. 구현예 64-72 중 어느 한 구현예에 있어서, O6BG 및 TMZ(테모졸로미드) 또는 BCNU(카르무스틴)를 Ad35 벡터 및/또는 적혈구를 받는 대상체에게 투여하는 것을 포함하는, 용도.
79. 구현예 78에 있어서, 상기 대상체가 역형성 성상세포종, 유방암, 결장직장암, 미만성 내재성 뇌간 신경교종, 유잉 육종, 다형성 교모세포종(GBM), 악성 뇌교종, 흑색종, 전이성 악성 흑색종, 비인두암, 또는 소아암에 대한 치료로서 O6BG 및 TMZ 또는 BCNU를 받는 것인, 용도.
예시적인 구현예의 세번째 세트는 하기를 포함할 수 있다:
1. 조혈 줄기 세포의 생체내 유전자 편집을 위한 CD46을 표적화하는 재조합 혈청형 35 아데노바이러스(Ad35) 벡터.
2. 구현예 1에 있어서, 상기 벡터의 섬유 놉 단백질이 CD46 결합을 증가시키는 돌연변이를 포함하는 것인, 재조합 Ad35 벡터.
3. 구현예 2에 있어서, 상기 섬유 놉 단백질 돌연변이가 Asn217Asp, Thr254Pro, Ile256Leu, Asp207Gly(또는 Glu207Gly), Thr245Ala, Thr226Ala, Ile192Val, Ile256Val, Arg259Cys, 및 Arg279His 중 하나 이상으로부터 선택되는 것인, 재조합 Ad35 벡터.
4. 구현예 2에 있어서, 상기 섬유 놉 단백질 돌연변이가 Asn217Asp, Thr254Pro, Ile256Leu, Asp207Gly(또는 Glu207Gly), Thr245Ala, Thr226Ala, Ile192Val, Ile256Val, Arg259Cys, 및 Arg279His를 포함하는 것인, 재조합 Ad35 벡터.
5. 구현예 2에 있어서, 상기 섬유 놉 단백질 돌연변이가 Asn217Asp, Thr254Pro, Ile256Leu, Asp207Gly(또는 Glu207Gly), Thr245Ala, Thr226Ala, Ile192Val, Ile256Val, Arg259Cys, 및 Arg279His로 이루어지는 것인, 재조합 Ad35 벡터.
6. 구현예 1에 있어서, 생체내에서 암호화된 유전자의 발현을 조절하는 miRNA 제어 시스템을 포함하는, 재조합 Ad35 벡터.
7. 구현예 6에 있어서, 상기 miRNA 제어 시스템이 혈액 및 종양 미세환경 또는 표적 조직에서 차등 점유 프로파일을 갖는 miRNA 표적 부위로 이루어지는 것인, 재조합 Ad35 벡터.
8. 구현예 7에 있어서, 상기 점유 프로파일이 종양 미세환경 또는 표적 조직에서 보다 혈액에서 더 높은 것인, 재조합 Ad35 벡터.
9. 구현예 6에 있어서, 상기 miRNA 표적 부위가 miR423-5, miR423-5p, miR42-2, miR181c, miR125a, 및/또는 miR15a를 포함하는 것인, 재조합 Ad35 벡터.
10. 구현예 6에 있어서, 상기 miRNA 표적 부위가 Cas9의 발현을 제어하는 것인, 재조합 Ad35 벡터.
11. 구현예 6에 있어서, 상기 miRNA 표적 부위가 miR187, 및/또는 miR218을 포함하는 것인, 재조합 Ad35 벡터.
12. 구현예 1에 있어서, DNA 파괴를 매개하고/하거나 내인성 유전자 발현을 활성화하기 위해 CRISPR 구성요소를 암호화하는 뉴클레오티드를 포함하는, 재조합 Ad35 벡터.
13. 구현예 12에 있어서, 상기 CRISPR 구성요소가 뉴클레아제 및 가이드 RNA를 포함하는 것인, 재조합 Ad35 벡터.
14. 구현예 13에 있어서, 상기 뉴클레아제가 Cas9 또는 cpf1을 포함하는 것인, 재조합 Ad35 벡터.
15. 구현예 12에 있어서, 상기 CRISPR 구성요소가 촉매적으로 기능상실된 뉴클레아제를 포함하는 것인, 재조합 Ad35 벡터.
16. 구현예 15에 있어서, 상기 촉매적으로 기능상실된 뉴클레아제가 기능상실된 Cas9 또는 기능상실된 cpf1을 포함하는 것인, 재조합 Ad35 벡터.
17. 구현예 15에 있어서, 상기 촉매적으로 기능상실된 뉴클레아제가 가이드 RNA 및 사이티딘 또는 아데닌 데아미나제 또는 트랜스아미나제에 융합되는 것인, 재조합 Ad35 벡터.
18. 구현예 13에 있어서, 상기 가이드 RNA가 HBG1, HBG2, 및/또는 Bc11a에 결합하는 것인, 재조합 Ad35 벡터.
19. 구현예 1에 있어서, 양성 선택 마커를 포함하는, 재조합 Ad35 벡터.
20. 구현예 19에 있어서, 상기 양성 선택 마커가 항-CD33 shRNA 카세트 및/또는 MGMTP140k 카세트를 포함하는 것인, 재조합 Ad35 벡터.
21. 구현예 1에 있어서, 상동성 아암을 포함하는, 재조합 Ad35 벡터.
22. 구현예 21에 있어서, 상기 상동성 아암이 0.8 내지 1.8 kb인, 재조합 Ad35 벡터.
23. 구현예 21에 있어서, 상기 상동성 아암이 염색체 안전 항구 유전자좌에 특이적인 것인, 재조합 Ad35 벡터.
24. 구현예 23에 있어서, 상기 염색체 안전 항구 유전자좌가 AAVS1, CCR5, HPRT, 또는 Rosa로부터 선택되는 것인, 재조합 Ad35 벡터.
25. 구현예 1에 있어서, 트랜스포사제에 의해 인식되는 도립 반복 서열을 포함하는, 재조합 Ad35 벡터.
26. 구현예 1에 있어서, 트랜스포사제를 암호화하는 뉴클레오티드 서열을 포함하는, 재조합 Ad35 벡터.
27. 구현예 26에 있어서, 상기 트랜스포사제가 잠자는 미녀, 피기백, 마리너, 개구리 왕자, Tol2, TcBuster, 및 spinON을 포함하는 것인, 재조합 Ad35 벡터.
28. 구현예 26에 있어서, 상기 트랜스포사제가 과활성 잠자는 미녀 트랜스포사제 또는 과활성 피기백 트랜스포사제를 포함하는 것인, 재조합 Ad35 벡터.
29. 구현예 28에 있어서, 상기 과활성 잠자는 미녀 트랜스포사제가 SB100X를 포함하는 것인, 재조합 Ad35 벡터.
30. 구현예 26에 있어서, 상기 트랜스포사제를 암호화하는 뉴클레오티드 서열이 PGK 프로모터의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
31. 구현예 1에 있어서, 재조합효소 인식 서열을 포함하는, 재조합 Ad35 벡터.
32. 구현예 31에 있어서, 상기 재조합효소 인식 서열이 Frt, lox, rox, vox, AttB, 또는 AttP를 포함하는 것인, 재조합 Ad35 벡터.
33. 구현예 1에 있어서, 재조합효소를 암호화하는 뉴클레오티드 서열을 포함하는, 재조합 Ad35 벡터.
34. 구현예 33에 있어서, 상기 재조합효소가 Flp, Cre, Dre, Vika, 또는 PhiC31을 포함하는 것인, 재조합 Ad35 벡터.
35. 구현예 33에 있어서, 상기 재조합효소를 암호화하는 뉴클레오티드 서열이 EF1α 프로모터의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
36. 구현예 1-35 중 어느 한 구현예에 있어서, 치료 카세트를 포함하는, 재조합 Ad35 벡터.
37. 구현예 36에 있어서, 상기 치료 카세트가 치료 유전자를 포함하거나 또는 γC, JAK3, IL7RA, RAG1, RAG2, DCLRE1C, PRKDC, LIG4, NHEJ1, CD3D, CD3E, CD3Z, CD3G, PTPRC, ZAP70, LCK, AK2, ADA, PNP, WHN, CHD7, ORAI1, STIM1, CORO1A, CIITA, RFXANK, RFX5, RFXAP, RMRP, DKC1, TERT, TINF2, DCLRE1B, SLC46A1, FancA, FancB, FancC, FancD1(BRCA2), FancD2, FancE, FancF, FancG, FancI, FancJ(BRIP1), FancL, FancM, FancN(PALB2), FancO(RAD51C), FancP(SLX4), FancQ(ERCC4), FancR(RAD51), FancS(BRCA1), FancT(UBE2T), FancU(XRCC2), FancV(MAD2L2), FancW(RFWD3), 가용성 CD40, CTLA, Fas L, PD-L1에 대한 항체, CD4에 대한 항체, CD5에 대한 항체, CD7에 대한 항체, CD52에 대한 항체, IL-1에 대한 항체, IL-2에 대한 항체, IL-4에 대한 항체, IL-6에 대한 항체, IL-10에 대한 항체, TNF에 대한 항체, 자가반응성 T 세포 상에 특이적으로 존재하는 TCR에 대한 항체, 글로빈 패밀리 유전자, WAS, phox, 디스트로핀, 피루베이트 키나제, CLN3, ABCD1, 아릴술파타제 A, SFTPB, SFTPC, NLX2.1, ABCA3, GATA1, 리보솜 단백질 유전자, TERT, TERC, DKC1, TINF2, CFTR, LRRK2, PARK2, PARK7, PINK1, SNCA, PSEN1, PSEN2, APP, SOD1, TDP43, FUS, 유비퀼린 2, 및/또는 C9ORF72로부터 선택된 치료 유전자 산물을 암호화하는 것인, 재조합 Ad35 벡터.
38. 구현예 36에 있어서, 상기 치료 카세트가 공통 감마(γ) 쇄, FancA, γ-글로빈, 및/또는 FVIII을 포함하거나 또는 암호화하는 치료 유전자를 포함하는 것인, 재조합 Ad35 벡터.
39. 구현예 36에 있어서, 상기 치료 카세트가 키메라 항원 수용체, 조작된 T 세포 수용체, 및/또는 치료 항체를 암호화하는 치료 유전자를 포함하는 것인, 재조합 Ad35 벡터.
40. 구현예 38에 있어서, 상기 치료 유전자가 β-글로빈 프로모터의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
41. 구현예 38에 있어서, 상기 치료 유전자가 HS1, HS2, HS3, 및 HS4로 이루어진 DNAse I 과민성 부위(HS)를 포함하는 β-글로빈 유전자좌 제어 영역(LCR)의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
42. 구현예 41에 있어서, 상기 β-글로빈 LCR이 대략 4.3 kb인, 재조합 Ad35 벡터.
43. 구현예 41에 있어서, 상기 치료 유전자가 추가로 β-글로빈 프로모터의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
44. 구현예 43에 있어서, 상기 β-글로빈 프로모터가 대략 1.6 kb인, 재조합 Ad35 벡터.
45. 구현예 44에 있어서, 상기 β-글로빈 프로모터가 염색체 11의 위치 5228631-5227023의 서열을 갖는 것인, 재조합 Ad35 벡터.
46. 구현예 38에 있어서, 상기 치료 유전자가 HS1, HS2, HS3, HS4, 및 HS5를 포함하는 β-글로빈 긴 LCR의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
47. 구현예 46에 있어서, 상기 β-글로빈 긴 LCR이 대략 21.5 kb인, 재조합 Ad35 벡터.
48. 구현예 47에 있어서, 상기 β-글로빈 긴 LCR이 염색체 11의 위치 5292319-5270789의 서열을 갖는 것인, 재조합 Ad35 벡터.
49. 구현예 46에 있어서, 상기 치료 유전자가 추가로 β-글로빈 프로모터의 전사 제어 하에 있는 것인, 재조합 Ad35 벡터.
50. 구현예 49에 있어서, 상기 β-글로빈 프로모터가 대략 1.6 kb인, 재조합 Ad35 벡터.
51. 구현예 50에 있어서, 상기 β-글로빈 프로모터가 염색체 11의 위치 5228631-5227023의 서열을 갖는 것인, 재조합 Ad35 벡터.
52. 구현예 46에 있어서, 3'HS1을 추가로 포함하는, 재조합 Ad35 벡터.
53. 구현예 52에 있어서, 상기 3'HS1이 염색체 11의 위치 5206867-5203839의 서열을 갖는 것인, 재조합 Ad35 벡터.
54. 구현예 1에 있어서, 적어도 30 kb 트랜스포존을 포함하는, 재조합 Ad35 벡터.
55. 구현예 1에 있어서, 32.4 kb 트랜스포존을 포함하는, 재조합 Ad35 벡터.
56. 구현예 1에 있어서, 헬퍼 바이러스를 사용하여 생성되는, 재조합 Ad35 벡터.
57. 구현예 56에 있어서, 상기 헬퍼 바이러스가 293 T 세포에서 증폭을 위해 Ad5 E4orf6을 포함하는 것인, 재조합 Ad35 벡터.
58. 구현예 56에 있어서, 상기 헬퍼 바이러스가 Ad35 신호전달 서열 및 패키징 신호를 포함하는 것인, 재조합 Ad35 벡터.
59. 구현예 56에 있어서, 상기 헬퍼 바이러스가 바이러스 제조 동안 CRISPR 구성요소의 발현을 방지하기 위해 항-CRISPR(acr) 발현 카세트를 포함하는 것인, 재조합 Ad35 벡터.
60. 구현예 56에 있어서, 상기 헬퍼 벡터가 서열번호: 51-65 중 임의의 하나의 서열을 포함하거나 또는 생성하는 것인, 재조합 Ad35 벡터.
61. 치료 단백질을 발현하기 위해 유전적으로 변형된 적혈구.
62. 구현예 61에 있어서, 상기 치료 단백질이 바이러스 감염을 차단 또는 감소시키는 응고 인자 또는 단백질을 포함하는 것인, 적혈구.
63. 구현예 61에 있어서, 상기 적혈구가 치료 단백질을 분비하는 것인, 적혈구.
64. 적혈구 bcl11a-인핸서 및 HBG 프로모터 영역을 동시에 표적화함으로써 HbF 재활성화를 증가시키기 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
65. γ-글로빈 유전자 추가 및 내인성 γ-글로빈 유전자 재활성화의 조합을 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
66. 생체내 CRISPR 게놈 조작을 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
67. 치료 유전자를 제공하기 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
68. (i) 혈색소병증, (ii) 판코니 빈혈, (iii) 임의적으로 A형 혈우병, B형 혈우병, 또는 폰빌레브란트병으로부터 선택된 응고 인자 결핍, (iv) 혈소판 장애, (v) 빈혈, (vi) 알파-1 항트립신 결핍, 또는 (v) 면역 결핍을 치료하기 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
69. 지중해빈혈을 치료하기 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
70. 암을 치료하거나, 암 재발을 예방 또는 지연시키거나 또는 고위험 생식 계열 돌연변이의 보균자에서 암 발병을 예방 또는 지연시키기 위한 것이며, 임의적으로 여기서 암은 유방암 또는 난소암인, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
71. CRISPR/Cas9의 자기-불활성화를 위한, 구현예 1-63 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
72. 자기-방출 카세트가 있는 HDAd를 공여자 벡터로서 사용하여 표적화된 통합을 위한, 구현예 1-3 중 어느 한 구현예의 재조합 Ad35 벡터 또는 적혈구의 용도.
73. 구현예 64 - 72 중 어느 한 구현예에 있어서, 동원을 포함하는, 용도.
74. 구현예 49에 있어서, 상기 동원이 Gro-베타, GM-CSF, S-CSF, 및/또는 AMD3100의 투여를 포함하는 것인, 용도.
75. 구현예 64 - 72 중 어느 한 구현예에 있어서, 스테로이드, IL-6 수용체 길항제, 및/또는 IL-1R 수용체 길항제를 Ad35 벡터 및/또는 적혈구를 받는 대상체에게 투여하는 것을 포함하는, 용도.
76. 구현예 75에 있어서, 상기 스테로이드가 글루코코르티코이드를 포함하는 것인, 용도.
77. 구현예 75에 있어서, 상기 스테로이드가 덱사메타손을 포함하는 것인, 용도.
78. 구현예 64 - 72 중 어느 한 구현예에 있어서, O6BG 및 TMZ(테모졸로미드) 또는 BCNU(카르무스틴)를 Ad35 벡터 및/또는 적혈구를 받는 대상체에게 투여하는 것을 포함하는, 용도.
79. 구현예 78에 있어서, 상기 대상체가 역형성 성상세포종, 유방암, 결장직장암, 미만성 내재성 뇌간 신경교종, 유잉 육종, 다형성 교모세포종(GBM), 악성 뇌교종, 흑색종, 전이성 악성 흑색종, 비인두암, 또는 소아암에 대한 치료로서 O6BG 및 TMZ 또는 BCNU를 받는 것인, 용도.
VI. 실험 실시예
실시예 1. 생체내 조혈 줄기 세포 유전자 요법은 뮤린 중간형 지중해빈혈을 개선시킨다.
이 실시예는 "건강한" 인간 CD46-유전자이식(CD46tg) 마우스에서 인간 γ-글로빈 유전자를 발현하는 통합 HDAd5/35++ 벡터를 이용하는 생체내 HSPC 유전자 요법 접근법을 예시하며; 개념 증명으로서, 이 접근법은 중간형 지중해빈혈에 대한 마우스 모델(CD46+/+/Hbbth-3 마우스)에서 예시된다. 이는 지중해빈혈에 대한 전통적인 렌티바이러스 벡터 생체외 유전자 요법에 대한 대안을 제공한다. 이 실시예에 함유된 정보 중 적어도 일부는 Wang 등, (J Clin Invest. 129(2):598-615, 2019; e-pub November 13, 2018)에 공개되었다.
지중해빈혈은 전 세계적으로 인간에서 가장 흔한 선천적 질환 중 하나이며(Weatherall, Ann N Y Acad Sci. 1202:17-23, 2010), β-글로빈 쇄 합성이 없거나(β0/β0) 또는 결핍된다(β+/β+). 60,000 명의 어린이가 매년 주요 β-지중해빈혈을 가지고 태어난다. 치료가 없으면, 주요 지중해빈혈이 있는 어린이는 생후 10 년 내지 20 년 내에 사망한다. 헤모글로빈 사량체 형성을 위한 충분한 β-글로빈 쇄 합성이 없으면, 과도한 α-글로빈 쇄는 침전되고 골수에서 후기 적혈구모세포의 조기 사멸을 유발하거나 또는 순환 적혈구의 반감기를 감소시키는 내포물을 형성하여, β-지중해빈혈의 주요 혈액학적 특징인 비효과적인 적혈구생성 및 적혈구 사멸을 일으킨다. 생성된 빈혈은 조혈 구획의 확장을 자극하여, 적혈구 과형성 및 골수외 조혈을 생성한다.
주요 β-지중해빈혈에 대한 주요 치료 양식은 적혈구(RBC)의 평생 수혈 및 과잉 철분을 제거하기 위한 킬레이트화를 사용한 지지적 치유; 또는 동종이계 조혈 줄기/전구체 세포(HSPC)의 이식을 사용한 치유적 치료로 이루어진다. 잘 일치하는 공여자가 없거나 또는 동종이계 HSPC 이식을 겪을 위험이 있는 환자의 경우, 렌티바이러스 벡터 야생형 β-글로빈 또는 태아 γ-글로빈 유전자 요법은 동종이계 이식의 면역학적 위험을 우회하는 치유 가능성이 있다. SIN-렌티바이러스 글로빈 벡터를 사용하여 마이크로-LCR 카세트를 혼입하는 HSPC 유전자 요법은 동물 모델 및 시험관내 환자 세포에서 β-지중해빈혈 및 겸상적혈구병(SCD) 표현형을 구제하였다(Pstaha 등, Curr Gene Ther. 17(5):364-378, 2017). 이에 기반하여, 지중해빈혈 및 SCD에 대한 다수의 임상 시험이 현재 유럽, 아시아, 및 미국에서 진행중이다(Pstaha 등, Curr Gene Ther. 17(5):364-378, 2017, Cavazanna-Calvo 등, Nature. 467(7313):318-322, 2010, Ferarri 등, Hematology/Oncology Clinics of North America: Gene Therapy. 31(5), Thompson 등, N Engl J Med. 378(16):1479-1493, 2018). 지금까지 이들 시험 데이터는 β+ 유전자형이 있는 대부분의 환자에 대한 장기간 수혈 독립성을 입증하지만, β0/β0 지중해빈혈의 치유는 여전히 과제로 남아있다.
고무적인 임상 결과에도 불구하고, 현재 지중해빈혈 유전자 요법 프로토콜은 복잡하며, 백혈구분리반출술, 시험관내 배양, β- 또는 γ-글로빈 발현 카세트를 보유하는 렌티바이러스 벡터를 사용한 형질도입, 및 완전한 골수절제술로 조건화된 환자에게 재이식에 의한 공여자/환자로부터 HSPC의 수집을 수반한다. 기술적 복잡성 이외에도, 이 접근법의 다른 단점은 (a) 조혈 줄기 세포(HSC)의 다능성 및 이의 생착 가능성에 영향을 미칠 수 있는 다중 사이토카인의 존재 하에 배양의 필요성; (b) 혈색소병증 환자와 같이 만성 비악성 질환 및 기존 기관 손상이 있는 환자에서 골수절제술이 상당한 조혈 및 비조혈, 조기 또는 후기 독성과 연관된 중요한 위험 인자를 나타낼 때, 골수절제 레지멘에 대한 요건; 및 (c) 접근법에 대한 비용을 포함한다. 지중해빈혈이 자원 부족 국가에 만연하다는 사실은 더 간단하고 더 값싼 요법 접근법을 요구한다.
백혈구분리반출술, 골수절제술, 및 HSPC 이식 없이 생체내 HSPC 유전자 전달을 위한 최소로 침습적이고 용이하게 번역가능한 접근법이 개발되었다(Richter 등, Blood. 2016;128(18):2206-2217, Richter 등, Hematol Oncol Clin North Am. 31(5):771-785, 2017, Ren 등, Blood. 128(18):2194-219, 2016). 이는 골수에서 말초 혈류 내로 HSPC를 동원하기 위한 G-CSF/AMD3100의 주사 및 통합 헬퍼-의존적 아데노바이러스(HDAd5/35++) 벡터 시스템의 정맥내 주사를 수반한다. HDAd5/35++ 벡터는 원시 HSC 상에서 발현되는 수용체인 인간 CD46을 표적화한다(Richter 등, Blood. 128(18):2206-2217, 2016). HDAd5/35++에서, 섬유 놉 도메인 및 샤프트를 제외한 모든 단백질은 혈청형 5로부터 유래되고; 섬유 놉 도메인 및 샤프트는 혈청형 35로부터 유래되고; CD46에 대한 친화도를 증가시키는 돌연변이는 Ad35 섬유 놉 및 ITR 내로 도입되고(WO 2010/0120541 참조) 패키징 신호는 Ad5로부터 유래된다. HdAd35++에서, 모든 단백질은 혈청형 35로부터 유래되고; CD46에 대한 친화도를 증가시키는 돌연변이는 섬유 놉 및 ITR 내로 도입되고 패키징 신호는 Ad35로부터 유래된다.
이식유전자 통합은 과활성 잠자는 미녀 트랜스포사제(SB100X)에 의해 무작위 패턴으로 달성된다(Mates 등, Nat Genet. 41(6):753-761, 2009). GFP를 리포터 유전자로 사용하는 마우스 모델에서, HSPC가 주변부에서 골수로 되돌아가 다시 형질도입되어, 생체내-형질도입된 마우스 및 2차 수용자에서 장기간 리포터를 지속하고 안정되게 발현함을 입증하였다(Richter 등, Blood. 2016;128(18):2206-2217).
지중해빈혈을 표현형적으로 교정하기 위해 필요한 높은 수준의 이식유전자 마킹을 고려하면, 생체내 HSPC 형질도입 접근법은 MGMTP140K 발현 카세트를 HDAd5/35++ 벡터 내로 삽입함으로서 최적화되었다. 이는 저용량의 메틸화제, 예를 들어, O6-벤질구아닌(O6BG) 및 비스-클로로에틸니트로소우레아(BCNU) 또는 테모졸로미드로 유전자-교정된 전구체의 생체내 선택을 허용한다(Beard 등, J Clin Invest. 120(7):2345-2354, 2010, Larochelle 등, J Clin Invest. 119(7):1952-1963, 2009, Trobridge 등, PLoS One. 7(9):e45173, 2012). 이전에 조합된 생체내 형질도입/선택 접근법은 안전하고 2차 수용체에서 유지되는 수준인 말초 혈액 세포의 최대 80%에서 안정된 GFP 발현을 초래하였음이 제시되었으며, 이는 자기-재생, 다중계통, 장기간 재증식 HSC의 안정된 형질도입을 나타낸다(Wang 등, Mol Ther Methods Clin Dev. 8:52-64, 2018).
본원에서는 "건강한" 인간 CD46-유전자이식(CD46tg) 마우스 및, 개념 증명으로서, 중간형 지중해빈혈에 대한 마우스 모델(CD46+/+/Hbbth-3 마우스)에서 인간 γ-글로빈 유전자를 발현하는 통합 HDAd5/35++ 벡터를 사용하여 생체내 HSPC 유전자 요법 접근법을 테스트하였다.
재료 및 방법 . 시약.  하기 시약을 사용하였다: G-CSF(Neupogen, Amgen), AMD3100(Sigma-Aldrich), 플레릭사포르(Mozobil, Genzyme Corp.), O6-BG 및 BCNU(Sigma-Aldrich), 마이코페놀레이트 모페틸(CellCept Intravenous, Genentech), 라파마이신(Rapamune/Sirolimus, Pfizer), 및 메틸프레드니솔론 (Pfizer).
HDAd 벡터.  트랜스포존 벡터 HDAd-γ-글로빈/mgmt 및 SB100X-발현 인간 배아 신장-293 세포-유래 116 세포의 생성(Palmer 등, Gene Therapy Protocols. Volume 1: Production and In vivo Applications of Gene Transfer Vectors (Methods in Molecular Biology):33-53, 2009)은 이전에 기재되었다(Li 등, Mol Ther Methods Clin Dev. 9:142-152, 2018). 헬퍼 바이러스 오염 수준은 0.05% 미만인 것으로 밝혀졌다. 역가는 6 x 1012 내지 12 x 1012 vp/ml였다. 이 연구에 사용되는 모든 HDAd 벡터는 Ad5 섬유 꼬리, Ad35 섬유 샤프트, 및 친화도-향상된 Ad35++ 섬유 놉으로 구성된 키메라 섬유를 함유한다(Wang 등, J Virol. 82(21):10567-10579, 2008). 모든 HDAd 제제는 1010 vp에서 1 개 미만 카피의 야생형 바이러스를 가졌다(다른 곳에 기재된 프라이머를 사용하여 qPCR에 의해 측정됨; Haeussler 등, PLoS One. 6(8):e23160, 2011).
인간 γ-글로빈 발현을 검출하는 세포내 유세포 분석.  FIX 및 PERM 세포 투과화 키트(Thermo Fisher Scientific)를 사용하였고, 제조업체의 프로토콜에 따랐다. 간단히 말해서, 1 Х 106 개 세포를 100 μl FACS 완충액(1% FCS가 보충된 PBS)에 재현탁하고, 100 μl 시약 A(고정 배지)를 첨가하고 실온에서 2-3 분 동안 배양한 다음, 미리 냉각된 절대 메탄올 1 ml를 첨가하고, 혼합하고, 10 분 동안 암실에서 얼음 위에서 배양하였다. 그런 다음 샘플을 FACS 완충액으로 세척하고 100 μl 시약 B(투과 배지) 및 1 μg γ-글로빈 항체(Santa Cruz Biotechnology, 카탈로그 sc-21756 PE)에 재현탁하고, 실온에서 30 분 동안 배양하였다. 세척 후, 세포를 FACS 완충액에 재현탁하고 분석하였다. 적혈구 및 γ-글로빈 이중 염색을 위해, 세포를 먼저 APC 항-마우스 Ter119 항체(Ter119-APC, BioLegend, 카탈로그 116212)로 염색한 다음, 세척하고 상기 기재된 바와 같은 고정 배지로 고정하였다.
글로빈 HPLC.  개별 글로빈 쇄 수준을 SPD-10AV 다이오드 어레이 검출기 및 LC-10AT 바이너리 펌프가 장착된 Shimadzu Prominence 기기(Shimadzu)에서 정량화하였다. 물/아세토니트릴 중 0.1% 트리플루오로아세트산의 38%-60% 구배 혼합물을 Vydac C4 역상 칼럼(Hichrom)을 사용하여 1 ml/분의 속도로 적용하였다.
실시간 역전사 PCR.  총 RNA를 제조업체의 페놀-클로로포름 추출 방법에 따라 TRIzol™ 시약(Thermo Fisher Scientific, Cat. # 15596026)을 사용하여 50-100 μl 혈액으로부터 추출하였다. QuantiTect 역전사 키트(Qiagen, Cat. # 205311) 및 Power SYBR Green PCR 마스터 믹스(Thermo Fisher Scientific, Cat.# 4367659)를 사용하였다. 실시간 정량적 PCR을 StepOnePlus 실시간 PCR 시스템(Applied Biosystems)에서 수행하였다. 다음 프라이머 쌍을 이 작업에 사용하였다: 마우스 RPL10 정방향(서열번호: 189), 및 역방향(서열번호: 190); 인간 γ-글로빈 정방향(서열번호: 191), 및 역방향(서열번호: 192); 마우스 β-주요 글로빈 정방향(서열번호: 193), 및 역방향(서열번호: 194).
자기 세포 분류.  계통-수임 세포의 고갈을 위해, 마우스 계통 세포 고갈 키트(Miltenyi Biotec, Cat. # 130-090-858)를 제조업체의 지침에 따라 사용하였다. 1차 CD46+/+/Hbbth-3 마우스의 골수로부터의 Ter119+ 세포 또는 2차 C57BL/6 수용자의 조혈 조직으로부터의 CD46+ 세포의 선택을 위해, 인간 항-CD46-PE 1차 항체(Miltenyi Biotec, 카탈로그 130-104-508)로 염색한 후 마우스 항-Ter119 마이크로비드(Miltenyi Biotec, 카탈로그 130-049-901) 또는 항-PE 마이크로비드(Miltenyi Biotec, 카탈로그 130-048-801)를 각각 사용하였다.
동물 연구.  인간 CD46 게놈 유전자좌(CD46tg)에 대해 동형접합성이고 인간에서와 유사한 수준 및 패턴으로 CD46 발현을 제공하는 C57BL/6-기반 유전자이식 마우스는 이전에 기재되었다(Kemper 등, Clin Exp Immunol. 2001;124(2):180-189). CD46tg 마우스는 Roberto Cattaneo, Mayo Clinic(미국 미네소타주 로체스터 소재)에서 제공받았다. HDAd5/35++ 벡터에 의한 감염에 취약한 지중해빈혈 마우스 모델은 암컷 CD46tg 마우스와 수컷 Hbbth-3 마우스(The Jackson Laboratory)를 교배하고 F1과 CD46tg 마우스를 역교배하여, CD46+/+/Hbbth-3 마우스를 생성함으로써 수득하였다. 6 내지 10 주령의 암컷 CD46tg 및 CD46+/+/Hbbth-3 암컷을 생체내 형질도입/선택 연구에 사용하였다. 6 내지 10 주령의 암컷 C57BL/6 마우스를 2차 수용자로서 사용하였다.
CD46tg 마우스의 동원 및 생체내 형질도입.  HSPC를 인간 재조합 G-CSF의 s.c. 주사(하루에 마우스 당 5 μg, 4 일) 이어서 5 일째에 AMD3100의 s.c. 주사(5 mg/kg)에 의해 마우스에 동원하였다. 또한, 동물은 바이러스 주사 16 시간 및 2 시간 전에 덱사메타손(10 mg/kg)을 i.p.로 투여받았다. AMD3100 후 30 및 60 분에, 동물에게 HDAd-γ-글로빈/mgmt 및 HDAd-SB를 주사 당 4 x 1010 vp의 용량으로 안와하정맥총을 통해 i.v. 주사하였다(총 2 회 주사, 30 분 간격). 4 주 후, 마우스에게 O6-BG(15 mg/kg, i.p.)를 2 회, 30 분 간격으로 주사하였다. O6-BG의 두번째 주사 1 시간 후, 마우스에게 BCNU(5 mg/kg, i.p.)를 주사하였다. BCNU 용량을 두번째 및 세번째 주기에 각각 7.5 및 10 mg/kg으로 증가시켰다.
CD46+/+/ Hbbth-3 마우스의 동원 및 생체내 형질도입.  이들 연구에서, 이전에 지중해빈혈 마우스 모델에 대해 기재된 바와 같이(Psatha 등, Hum Gene Ther Methods. 25(6):317-327, 2014), G-CSF 250 μg/kg i.p.(1-6 일) 및 플레릭사포르 5 mg/kg i.p.(이전에 AMD3100; Mozobil, Genzyme Corp.)(5-7 일)를 사용한 7-일 동원 접근법을 적용하였다. 생체내 형질도입을 상기와 같이 수행하였다. 처리 후, 조합된 면역억제를 투여하였다. 17 주차에, 마우스를 O6BG(30 mg/kg, i.p.)를 사용한 4 주기의 생체내 선택에 적용하고 BCNU 용량(5, 7.5, 10, 10 mg/kg)을 용량 사이에 2-주 간격으로 증가시켰다. 면역억제는 마지막 O6-BG/BCNU 용량 후 2 주에 재개하였다.
면역억제.  마이코페놀레이트 모페틸(20 mg/kg/d), 라파마이신(0.2 mg/kg/d), 및 메틸프레드니솔론(20 mg/kg/d)의 1 일 i.p. 주사를 수행하였다.
2차 골수 이식.  수용자는 Jackson Laboratory의 6-8 주령의 암컷 C57BL/6 마우스였다. 이식 당일에, 수용자 마우스를 10 Gy로 조사하였다. 생체내-형질도입된 CD46tg 마우스로부터의 골수 세포를 무균상태로 단리하고, 계통-고갈된 세포를 자기 세포 분류(MACS)를 사용하여 단리하였다. 조사 4 시간 후, 세포를 마우스 당 1 x 106 개 세포로 i.v. 주사하였다. CD46+/+/Hbbth-3 마우스 연구에서, 생체내-형질도입된 CD46+/+/Hbbth-3 마우스로부터의 2Х106 개의 전체 골수 세포를 3 개의 일일 용량 또는 치명적인 TBI(1,000 cGy)로 나눠진 100 mg/kg i.p. 부술판(Busilvex, Pierre Fabre)으로 조건화된 골수하제거된 2차 C57BL/6 수용자에 이식하였다. 20 주차에, 2차 수용자를 희생시키고, 혈액, 골수, 및 비장의 CD46+ 세포를 MACS에 의해 단리하거나, 또는 마우스를 상기 기재된 바와 같이 동원 및 생체내 형질도입에 적용하였다. 모든 2차 수용자는 4 주차에 시작하여 면역억제를 받았다.
조직 분석.  2.5 μm 두께의 비장 및 간 조직 절편을 적어도 24 시간 동안 4% 포름알데하이드에 고정시키고, 탈수화하고, 파라핀에 포매하였다. H&E 염색을 골수외 혈구형성의 조직학적 평가에 사용하였다. 헤모시데린을 Perl의 프러시안 블루(Prussian blue) 염색에 의해 조직 절편에서 검출하였다. 간단히 말해서, 조직 절편을 증류수 증 동일한 부피(2%)의 페로시안화칼륨 및 염산의 혼합물로 처리한 다음 뉴트럴 레드(neutral red)로 대조염색하였다. 비장 크기를 비장 중량(mg) 대 체중(g)의 비로 평가하였다.
혈액 분석 및 골수 사이토스핀.  혈액 샘플을 EDTA-코팅된 튜브에 수집하고, HemaVet 950FS(Drew Scientific) 또는 ProCyteDx(IDEXX) 기계에서 분석을 수행하였다. 말초 혈액 도말을 준비하고 각각 5 및 15 분 동안 May-Grunwald/Giemsa(Merck)로 염색하였다. 골수 세포의 현탁액을 사이토스핀 장치를 사용하여 슬라이드에서 원심분리하고 May-Grunwald/Giemsa로 염색하였다.
통계. 데이터는 평균 ± SEM으로 제시된다. 다중 그룹의 비교를 위해, 다중 비교를 위한 본페로니 사후-테스트와 함께 일원 및 이원 ANOVA를 사용하였다. 1 개의 그룹화 변수에 대한 그룹 간 차이를 독립표본 양측 스튜던트 t 검정에 의해 결정하였다. 비모수 분석을 위해, Kruskal-Wallis 검정을 사용하였다. 통계적 분석은 GraphPad Prism 버전 6.01(GraphPad Software Inc.)을 사용하여 수행하였다. 0.05 미만의 P 값이 유의한 것으로 간주되었다; *P ≤ 0.05, **P ≤ 0.0002, ***P ≤ 0.00003.
동물 연구 승인.  모든 실험은 통제 기관 심의 위원회 및 IACUC의 승인에 따라 수행되었다.
결과 . CD46tg 마우스에서 후속 생체내 선택과 함께 생체내 HSPC 형질도입은 대부분의 말초 RBC에서 안정된 γ-글로빈 발현을 초래한다. 치료용 HDAd5/35++ 벡터는 적혈구에서 효율적인 발현을 위한 5-kb "마이크로" β-글로빈 LCR/β-프로모터의 제어 하에 인간 γ-글로빈 유전자 뿐만 아니라 MGMTP140K 발현 카세트를 함유한다(도 2a, HDAd-γ-글로빈/mgmt). CD46tg 마우스는 인간과 유사한 패턴 및 수준에서 HDAd5/35++ 수용체 CD46을 발현하는 인간 CD46 유전자좌에 대해 동형접합성이고 따라서 생체내 HSPC 형질도입 연구를 위한 모델이다(Richter 등, Blood. 128(18):2206-2217, 2016, Kemper 등, Clin Exp Immunol. 124(2):180-189, 2001). "건강한" CD46tg 마우스에서 이러한 연구의 목표는 마우스 세포 상에서 인간 γ-글로빈의 수준, 동역학, 및 분포 및 접근법의 안전성을 분석하는 것이었다. 동물을 G-CSF/AMD3100으로 동원한 다음 HDAd-γ-글로빈/mgmt 및 SB100X-발현 HDAd-SB 벡터를 정맥내로 주사하였다. 3 주기의 O6BG/BCNU 처리는 벡터 주사 후 4 주에 시작하였고, 마우스를 벡터 주사 후 18 주까지 추적하였다(도 2b). 먼저, RBC에서 인간 γ-글로빈 발현을 분석하였다(도 2c). 생체내 선택 시작 전(형질도입 후 4 주) 수준은 배경보다 단지 미미하게 높았다. γ-글로빈+ 세포의 백분율은 두번째 차례의 선택 후 증가하기 시작하여 세번째 차례 후 80% 초과의 수준에 도달하였다. γ-글로빈-발현 세포의 백분율은 말초 혈액 및 골수에서 비적혈구 Ter119- 세포에 비해 적혈구 Ter119+ 세포에서 7- 내지 10-배 더 높았다(도 2d). HPLC를 사용하여 성체 마우스 α- 및 β-글로빈 쇄와 비교하여 γ-글로빈 단백질의 수준을 측정하였다(도 2e 및 도 3; https://doi.org/10.1172/JCI122836DS1의 보충 자료). 18 주차에, 이들 수준은 성체 마우스 α-글로빈 및 β-주요 글로빈의 10%-15% 및 마우스 β-소수 글로빈의 25%에 도달하였다. 이를 정량적 역전사 PCR(RT-qPCR)에 의해 mRNA 수준에서 확인하였으며, 여기서 인간 γ-글로빈 mRNA는 마우스 β-주요 mRNA의 13%였다(도 2f). 원시 장기간 재증식 HSC가 형질도입되었는지 추가로 입증하기 위해, 생체내-형질도입된/선택된 마우스로부터의 계통-고갈된(Lin-) 골수 세포를 조사된 C57BL/6 마우스에 이식하였다. 말초 혈액, 골수, 및 비장에서 분석된 생착 수준은 95% 초과였고 20 주의 관찰 기간에 걸쳐 안정되었다(도 4a, 4b). 인간 γ-글로빈 수준(마우스 α-글로빈과 비교)은 ("1차") 생체내-형질도입된 마우스(형질도입 후 18 주차에 분석) 및 이식 후 14 및 20 주차에 분석된 2차 수용자에서 유사하였다(도 4c).
생체내 HSPC 형질도입/선택 접근법은 SB100X-매개 무작위 이식유전자 통합 패턴을 바꾸지 않고 조혈을 변경하지 않는다.  하이브리드 트랜스포존/SB100X HDAd5/35++ 시스템을 사용한 생체내 형질도입은 HSPC에서 무작위 이식유전자 통합을 초래하였음이 이전에 제시되었다(Richter 등, Blood. 128(18):2206-2217, 2016). 생체내 선택에서 O6BG/BCNU의 효과를 평가하기 위해, 골수 Lin- 세포에서 이식유전자 통합을 연구 종료 시, 즉, 2차 수용자에서 20 주차에 분석하였다. 선형 증폭-매개 PCR(LAM-PCR) 이어서 심층 서열분석은 마우스 게놈에서 통합 부위의 무작위 분포 패턴을 나타내었다(도 5a). 5 마리 마우스의 풀링된 데이터는 엑손으로 2.23% 통합, 인트론으로 31.58%, 유전자간 영역으로 65.17%, 및 비번역 영역으로 1.04%를 입증하였다(도 5b). 통합의 무작위성 수준은 전체 마우스 게놈의 임의의 주어진 창에서 우선적인 통합 없이 99%였다(도 5c). 이는 생체내 선택 및 2차 수용자에서 세포의 추가 확장이 우세한 통합 부위의 출현을 초래하지 않았음을 나타낸다(도 5d). qPCR을 사용하여 형질도입 및 비-형질도입된 세포를 둘 다 함유하는 집단에서 골수 세포 당 평균 2 개의 γ-글로빈 cDNA 카피를 측정하였다. 그런 다음 통합된 이식유전자 카피 수를 단일-세포 수준에서 정량화하였다. 이를 위해, 18 주차 마우스로부터의 골수 Lin- 세포를 메틸셀룰로스에 플레이팅하고, 개별 전구체 콜로니를 단리하고, 게놈 DNA에 대해 qPCR을 수행하였다. 이식유전자-양성 콜로니에서(n = 113), 콜로니의 86.7%는 2 또는 3 개의 통합된 카피를 가졌다(도 5e 및 도 6). 4 개의 카피를 콜로니의 6.2%에서, 8 개의 카피를 1.78%에서 발견하였다. 콜로니의 0.88%는 13, 10, 7, 6, 또는 5 개의 통합 벡터 카피를 가졌다.
연구 종료 시(18 주) 혈액 세포 계수의 변경은 밝견되지 않았다(도 7a). RBC 매개변수의 분석은 이상을 나타내지 않았다(도 7a-7c). 골수에서 Lin+ 분획의 조성물은 처리 전 마우스 및 처리 후(18 주) 마우스에서 유사하였다(도 7d). Lin-Sca1+cKit+ (LSK) HSPC(도 7d, 마지막 레인) 및 전구체 콜로니-형성 세포(도 7e)의 수준은 또한 두 그룹에서 비슷하였다.
인간 CD46을 발현하고 인간 중간형 지중해빈혈과 유사한 CD46+/+/Hbbth-3 마우스 모델의 생성.  HDAd5/35++ 벡터는 감염을 위해 인간 CD46을 필요로 한다. 생체내 HSPC 형질도입 연구를 위한 지중해빈혈 마우스 모델을 개발하기 위해, CD46tg(CD46+/+) 마우스를 마우스 Hbb-β1 및 -β2 유전자 결실에 대해 이형접합성인 Hbbth-3 마우스와 교배하였다(Yang 등, Proc Natl Acad Sci USA. 92(25):11608-11612, 1995). (동형접합성 상태는 자궁내 또는 출생후 초기에 치명적이다.) Hbbth-3 마우스는 인간 중간형 지중해빈혈과 유사한 생존가능한 형태의 지중해빈혈을 나타낸다. F1 하이브리드 마우스를 CD46+/+ 마우스와 역교배하여 CD46+/+/Hbbth-3 마우스를 생성하였다(도 8). 이들 마우스는 지중해빈혈 표현형을 나타내었다. 모체 CD46tg 마우스와 비교하여, CD46+/+/Hbbth-3 마우스는 상당히 감소된 RBC 수(7.1 ± 0.1 vs. 8.63 ± 0.29 M/μl); 더 낮은 헤모글로빈(9.7 ± 0.18 vs. 13.9 ± 0.63 g/dl), 적혈구용적률(30.7% ± 0.46% vs. 41.7% ± 1.48%), 평균 미립자 헤모글로빈(13.9 ± 0.14 vs. 16.1 ± 0.23 g/dl), 및 평균 미립자 부피(43.03 ± 0.22 vs. 48.35 ± 0.9 fl)를 가졌고; RBC 분포 폭(42.9% ± 0.29% vs. 25.3% ± 0.79%)이 증가하였으며; 명백한 망상적혈구증가증(42.4% ± 1.43% vs. 11.8% ± 3.7%)을 나타내었다(도 9a). 혈액 도말에서 적혈구 형태는 Hbbth-3 마우스 혈액 도말의 형태와 유사하고 CD46tg 마우스의 정상적혈구 외형과 뚜렷하게 대조적인 혈색소 감소증, 다양한 크기 및 모양(부동변형적혈구증가증), 및 세포 단편화를 특징으로 하였다(도 9b). 마찬가지로, CD46+/+/Hbbth-3 마우스로부터의 간 및 비장의 조직학적 분석은 적혈구 전구체 또는 거핵구의 클러스터를 함유하는 골수외 혈구형성의 병소를 보인 반면(도 9c, 하단 왼쪽 및 하단 중간 패널), Perl의 염색은 모체 CD46tg 마우스로부터의 조직 절편에서 골수외 혈구형성 및 철분 축적이 부재하거나 또는 제한된 것(도 9c, 상단 패널)과 대조적으로 뚜렷한 실질 철분 침착을 입증하였다(도 9c, 하단 오른쪽 패널). CD46+/+/Hbbth-3 마우스의 이러한 특성은 인간 질환을 요약하고 후속 실험을 위한 이러한 모델의 타당성을 뒷받침한다. 특히, CD46+/+/Hbbth-3 모델에서 지중해빈혈 표현형은 또한 총 WBC의 상승된 수에 의해 나타낸 바와 같이, 적혈구 계통 이외의 계통에서 정량적 차이를 특징으로 하였다(도 10).
HDAd-γ-글로빈/mgmt 및 HDAd-SB를 사용한 HSPC 생체내 형질도입 이어서 CD46+/+/Hbbth-3 마우스에서 생체내 선택은 γ-글로빈의 높고 안정된 장기간 발현을 초래한다.  생체내 형질도입 접근법이 CD46+/+/Hbbth-3 지중해빈혈 마우스 모델의 특징적인 질환의 매개변수를 개선할 수 있는지를 결정하였다. Hbbth-3 마우스에서 이전에 검증된 변형된 G-CSF/AMD3100 동원 체계(Psatha 등, Hum Gene Ther Methods. 2014;25(6):317-327)는 마지막 플레릭사포르(AMD3100) 주사 1 시간 후(도 11), 즉, HDAd-γ-글로빈/mgmt 및 HDAd-SB가 정맥내로 주사된 시점에 말초 혈액에서 LSK 세포의 높은 수를 산출하였다. 마우스는 인간 γ-글로빈 및 MGMT 단백질에 대한 반응을 피하기 위해 면역억제를 받았다(도 12). 생체외 렌티바이러스 벡터 유전자 요법 후, 유전적으로 교정된 적혈구모세포가 생존 이점이 있고 Hbbth-3 마우스에서 생체내 선택을 겪는다는 보고를 고려하면(Miccio 등, Proc Natl Acad Sci USA 105(30):10547-10552, 2008), 초기에 O6BG/BCNU 처리 없이 연구를 수행하도록 계획하였다. 평균 γ-글로빈+ RBC 백분율은 CD46+/+/Hbbth-3 마우스의 생체내 형질도입 후 8 주차에 31.19% ± 2.7%에 도달하였지만 16 주차에 13.14% ± 0.4%로 감소하였다. 이 시점에, 마우스를 2 개 그룹으로 나누었다. 마우스의 절반을 혈액 및 골수 분석(그룹 1: 생체내 선택 없음) 및 2차 수용자에 대한 공여자로서 사용한 반면, O6BG/BCNU 생체내 선택을 수반하는 다른 그룹(그룹 2: 생체내 선택 있음)으로 연구를 계속하였다(도 12 참조). 16 주차에, 그룹 1은 말초 RBC의 13%에서 γ-글로빈 발현을 나타내었다(도 13a, 13b). 이 수준의 γ-글로빈 마킹은 말초 혈액 망상적혈구의 백분율에서 상당한 감소를 초래하였다(도 13c, 마지막 레인). 그러나, RBC 형태학 및 골수외 혈구형성을 포함하는 다른 RBC 매개변수를 개선하기에 충분하지 않았다(도 13c, 13d). 1차 γ-글로빈 마킹 수준은 이식 전에 부술판으로 골수 조건화된 2차 C57BL/6 수용자에서 20 주에 걸쳐 유지되었다(도 13e, 13f). 이는 장기간-재증식 HSPC가 형질도입되었음을 나타낸다.
그룹 2에서, 4 주기의 생체내 선택은 29 주차에 평균 76%에 도달하는 γ-글로빈+ RBC 백분율에서 6-배 증가를 초래하였다(도 14a). γ-글로빈 발현은 Ter119- 세포와 비교하여 유세포 분석에 의한 게이팅 또는 면역자기적으로 단리된 Ter119+ 적혈구 세포에서 γ-글로빈 발현에 의한 분석에 의해 나타낸 바와 같이 적혈구-특이적이었다(도 14b, 도 14c). 다른 연구와 일치하여(Miccio 등, Proc Natl Acad Sci USA. 105(30):10547-10552, 2008, Zhao 등, Blood. 113(23):5747-5756, 2009), 선택은 골수(또는 비장)을 빠져나가고 핵을 손실하기 전에 (핵형성 및 증식 적혈구) 전구체의 수준에서 발생하였다. 이는 생체내 선택 전에 비해 선택 후 우세하게 발생한 골수 및 비장에서 γ-글로빈+Ter119+ 세포의 증가에 반영된다 (도 14d). 그러나, (제핵 RBC가 우세한) 말초 혈액의 Ter119+ 세포에서 γ-글로빈+ 마킹의 전반적인 증가(도 14b)는 아마도 지중해빈혈 배경에 의해 제공된 "천연" 생체내 선택의 부가적인 효과에 기인할 것이다. HPLC에 의해 측정된 RBC에서 마우스 α-글로빈에 대한 인간 γ-글로빈의 비는 14 주차에 거의 검출불가능한 수준에서 29 주차에 10%로 증가하였다(도 14e 및 15; 기준선(도 15b), 16 주차(도 15c) 및 29 주차(도 15d, 및 CD46tg 대조군(도 15a)에서 CD46+/+/Hbbth-3 마우스 참조). 유사하게, 처리된 마우스의 혈액 세포에서 γ-글로빈 mRNA의 수준은 증가하여, 29 주차에 마우스 β-글로빈 mRNA의 10% 인간 γ-글로빈 mRNA로 번역하였다(도 14f). 생체내 형질도입 후 29 주차에 처리된 CD46+/+/Hbbth-3 마우스에서 세포 당 1.5 개의 γ-글로빈 유전자 카피가 측정되었다(도 16).
생체내 형질도입/선택 후 CD46+/+/Hbbth-3 마우스의 지중해빈혈 표현형의 역전.  마지막 용량의 O6BG/BCNU 처리 6 주 후, CD46+/+/Hbbth-3 마우스를 희생시키고, 분석을 위해 조혈 조직을 수확하였다. 생체내 형질도입 후 29 주차에 혈액학적 매개변수는 기준선에 걸쳐 상당히 개선되었고(도 17a)(RBC: 8.53 ± 0.16 vs. 7.1 ± 0.13 M/μl, P = 0.01; 헤모글로빈: 11.27 ± 0.39 vs. 9.7 ± 0.18 g/dl, P = 0.05; 적혈구용적률: 41.37% ± 0.81% vs. 30.7% ± 0.46%, P = 0.00001; 평균 미립자 부피: 48.63 ± 0.36 vs. 43.5 ± 0.38 fl, P = 0.003; RBC 분포 폭: 39.5% ± 0.8% vs. 43% ± 0.3 %, P = 0.006; 망상적혈구: 31.13% ± 3.17% vs. 42.4% ± 1.43%, P = 0.05), 특이적 적혈구 지수(적혈구용적률 [HCT], RBC, 평균 미립자 부피)에 대해, 수준은 대조군 CD46tg 대응물과 구별하기 어려웠으며, 이는 거의 완전한 표현형 교정을 시사한다. 혈액 도말의 망상적혈구 염색은 γ-글로빈+ RBC의 가장 높은 백분율을 갖는 처리된 CD46+/+/Hbbth-3 마우스에서 망상적혈구의 인상적인 3-배 감소를 입증하였다(도 17b). 처리된 CD46+/+/Hbbth-3 마우스의 말초 혈액 도말에서 지중해빈혈 표현형의 역전을 나타내는 저변색성이고, 고도로 단편화되고 부동변형적혈구증가적인 기준선 RBC를 크기가 덜 변이되고 거의 정색성이고 잘 형상화된 RBC로 대체하였다(도 17c, 상단 패널). 대조군 및 처리된 CD46+/+/Hbbth-3 마우스의 사이토스핀에서 전적혈구모세포 및 호염기성 적혈구모세포의 유병률에 의해 나타낸 CD46+/+/Hbbth-3 마우스의 골수에서 적혈구 계통 성숙의 차단과 대조적으로, 성숙 적혈구모세포가 우세하였고 다염성 및 정염성 적혈구모세포에 의해 나타내었다(도 17c, 중간 패널). 극심한 실질 혈철소증이 미처리 CD46+/+/Hbbth-3 마우스에서 관찰된 반면, CD46tg 및 처리된 CD46+/+/Hbbth-3 마우스에서 제한된 철분 축적만이 검출될 수 있었다(도 17c, 하단 패널). 따라서, 보상 혈구형성의 측정가능한 특징인 비장 크기는 처리된 동물에서 현저하게 감소하였다(도 17d, 17e).
조합된 생체내 형질도입/선택 접근법이 원시 HSC의 유전적 변형을 초래하였는지를 결정하기 위해, 29 주차(형질도입 후)에 수확된 처리된 CD46+/+/Hbbth-3 마우스의 골수 세포를 준치사량의 부술판 처리 또는 치명적 전신 조사(TBI) 후 C57BL/6 2차 수용자에 이식하였다(도 18a, 18b). 예상된 바와 같이, TBI를 받은 마우스에서 생착률은 부술판-처리된 동물에서보다 더 높았지만, 생착 수준으로 조정된 발현 수준은 γ-글로빈+ RBC의 상당히 상이한 빈도를 나타내지 않았다. 이식-유래된 (CD46+) 적혈구의 75% 초과가 2차 이식 후 20 주차에 γ-글로빈+였고 정상 수용자 배경(여기서 HDAd-γ-글로빈/HDAd-SB-형질도입된 CD46+/+/Hbbth-3 HSPC는 선택적 이점이 없음)에서 골수하절제 부술판 조건에 의해 생성된 경쟁 조건 하에 29 주차에 1차 처리된 마우스에서 발견된 것과 유사한 마킹률을 갖는다(도 18c, 18d)는 사실은 접근법이 장기간 재증식 HSC의 유전적 교정을 초래한다는 결론을 추가로 뒷받침한다. 더욱이, 동원 및 생체내 형질도입에 제출된 이식 후 20 주차에 2차, 부술판-조건화된 C57BL/6 수용자는 γ-글로빈-발현 세포의 현저한 강화 및 발현/MFI에서 상당한 증가를 입증하였다(도 18e).
HDAd-γ-글로빈/mgmt 및 HDAd-SB를 사용한 생체내 HSPC 형질도입 이어서 O6-BG/BCNU 생체내 선택의 안정성.  마우스 연구에서, 절차는 잘 용인되었다. 명백한 혈액학적 이상은 관찰되지 않앗다. 희생 시, 마지막 O6-GB/BCNU 용량 후 6 주에, 모든 혈액학적 값은 정상 범위 내에 있었지만, 총 WBC 계수는 생체내 선택 전 수준과 비교하여 더 낮았으며, 이는 WBC, 특히 림프구에 대한 약물 치료의 세포감소 효과를 시사한다(도 19a, 19b). 이 효과는 또한 미처리 또는 선택전 대응물과 비교하여 골수에서 CD3+, CD19+, 및 Gr-1+ 세포의 감소된 빈도를 반영하였다(도 19c). 특히, 최하점(25-27 주; 마지막 O6BG/BCNU 주사 후 2-4 주)에서 조차도, WBC 및 혈소판은 결코 무형성증 수준(즉, 호중구 1,000/μl 미만, 혈소판 20,000/μl 미만)에 도달하지 않았고, WBC는 30 주까지(마지막 O6BG/BCNU 주사 후 7 주) 회복되기 시작하였다. 이는 CD46tg 모델에서, WBC 및 림프구 계수가 마지막 O6BG/BCNU 주사 후 10 주에 전처리 수준으로 되돌아갔다는 관찰과 함께(도 7a), 생체내 선택 약물의 세포감소 효과가 경미하고 일시적임을 시시한다. 중요하게는, LSK 및 Ter119+ 세포의 백분율에서 골수 세포 조성, 뿐만 아니라 골수 세포의 콜로니-형성 가능성은 HSPC의 생체내 형질도입/선택에 의해 영향을 받지 않았다(도 19c, 19d).
논의 . 혈색소병증의 생체외 HSPC 유전자 요법에서 명백한 임상 진행에도 불구하고, 임상적으로 관련된 HSPC 생착률에 도달하기 위한 골수절제 조건화에 대한 필요성은 주요 한계이다. 또한, 기술적 복잡성은 소수의 전문화 및/또는 공인된 센터에서만 이러한 치료의 이행을 허용한다. 개발된 생체내 HSPC 유전자 요법 접근법은 골수절제술 및 HSPC 세포 이식을 필요로 하지 않고 따라서 지중해빈혈에 대한 HSPC 유전자 요법을 더 안전하고 더 접근가능하게 만든다. 접근법의 핵심 아이디어는 골수로부터 HSPC를 동원하는 것이고, 주변부에서 많은 수로 순환하는 동안, 정맥내로 주사된 HSPC-향성 HDAd5/35++ 유전자 전달 벡터 시스템으로 형질도입한다. HDAd5/35++ 벡터 시스템의 신규 특징은 (a) 정맥내 주사 후 비조혈조직의 감염을 피하면서 원시 HSC의 효율적인 형질도입을 허용하는 CD46-친화도-향상된 섬유, (b) 세포 인자와 무관하게 기능하고 유전자에 대한 선호도 없이 무작위 이식유전자 통합을 매개하는 SB100X 트랜스포사제-기반 통합 시스템, 및 (c) 저용량 O6BG/BCNU의 단기간 처리에 의해 형질도입된 원시 HSC의 풀에 영향을 미치지 않고 자손 세포의 선택적 생존 및 확장을 매개하는 MGMTP140K 발현 카세트를 포함한다(Wang 등, Mol Ther Methods. Clin Dev. 8:52-64, 2018). 현재 사용되는 SIN-렌티바이러스(SIN-LV) 벡터로부터 HDAd5/35++ 벡터를 구별하는 추가적인 특징은 이 연구에서 마이크로-LCR/β-프로모터-구동된 γ-글로빈 유전자 및 11.8 kb 크기의 EF1A 프로모터-구동된 MGMT P140K 유전자를 혼입하는 데 사용된 큰(30 kb) 삽입 용량을 포함한다. 또한, HDAd5/35++ 벡터의 생산은 대규모 플라스미드 형질감염을 필요로 하지 않고 스피너 배양 리터 당 3 x 1012 개 초과의 감염성 입자를 산출한다. 특히, 혈색소병증에 대한 임상 연구에 사용되는 SIN-LV 벡터의 수율은 적어도 2 자릿수 이하이다.
생체내 접근법의 효능.  HSPC의 1% 미만의 안정된 형질도입이 상당한 임상적 이익을 제공하는 다른 유전적 질환의 HSPC 유전자 요법과 대조적으로(즉, X-관련 SCID, Cavazzana-Calvo 등, Science. 288(5466):669-672, 2000; ADA-SCID, Gaspar 등, Sci Transl Med. 3(97):97ra80. 2011; 또는 비스코트-알드리치 증후군, Aiuti 등, Science. 341(6148):1233151, 2013), 환자에서 혈색소병증의 표현형 교정은 적어도 20% 교정된 적혈구 전구체를 필요로 한다(Persons 등, Blood. 97(10):3275-3282, 2001, Andreani 등, Blood.; 87(8):3494-3499, 1996, Negre 등, Blood. 117(20):5321-5331, 2011). 혈색소병증에 대한 뮤린 모델에서, 총 α-글로빈 mRNA의 15%에서 γ-글로빈 발현이 요법에 충분하였다(Persons 등, Blood. 2001;97(10):3275-3282, McColl 등, Blood Med. 7:263-274, 2016, Pestina 등, Mol Ther. 17(2):245-252, 2009). 이 연구에서, 생체내 형질도입/선택 후, 골수 적혈구모세포의 60% 초과가 생체내 형질도입된 CD46tg 및 CD46+/+/Hbbth-3 모델에서 γ-글로빈을 발현하였다(도 2c 및 14a). 이는 40%-97% 순환 γ-글로빈-발현 RBC로 번역되었다(도 2d 및 14b). 중요하게도 또한, 두 동물 모델에서, RBC에서 지속된 γ-글로빈 마킹이 2차 수용자에서 입증되었으며, 이는 원시, 장기간 재증식 HSC가 벡터 시스템에 의해 초기에 형질도입되었음을 시사한다.
qPCR 연구는 압도적인 대부분의 골수 세포에서 세포 당 2 내지 3 개의 통합된 이식유전자 카피를 검출하였다. 이전 연구와 일치하여(Zhao 등, Blood. 113(23):5747-5756, 2009, Zielske 등, Mol Ther. 9(6):923-931, 2004), 생체내 선택이 높은 카피 수 클론에 대해 선택되었다는 것은 밝혀지지 않았다. 게놈-와이드 통합 부위 분석을 고려하여, 1,000 개의 원래 형질도입된 HSC를 예상하였다. 마우스가 10,000 내지 20,000 개의 HSC를 갖는다는 것을 고려하면(Abkowitz 등, Blood. 100(7):2665-2667, 2002; Chen 등, Blood. 107(9):3764-3771, 2006), 벡터 시스템이 HSC의 5%-10%를 표적화하였음을 의미할 것이며, 이는 생체내 선택 후 조혈의 다클론 재구축 및 장기간 치료 효과를 위한 견고한 기초가 될 것이다.
중간형 지중해빈혈 모델에서, 거의 완전한 표현형 교정이 달성되었다. 핵심 혈액학적 매개변수(HCT, RBC, 평균 미립자 부피)는 "건강한"(모체 CD46tg) 마우스의 대응물과 구별할 수 없었다. RBC 지수의 교정 정도 및 형태는 개별 마우스에서 γ-글로빈-발현 세포의 수준과 상관관계가 있었다. 말초 RBC 및 적혈구 골수 전구체 세포는 형태학 및 성숙 과정 둘 다에서 건강한 마우스와 유사하였다. 골수외 조혈 및 실질 철분 침착은 퇴화되었고, 비장 크기는 상당히 감소하였다. CD46+/+/Hbbth-3 모델에서 지중해빈혈 표현형은 또한 백혈구증가증/림프구증가증을 특징으로 하였다(도 10). (백혈구증가증/림프구증가증은 또한 종종 비장 절제된 지중해빈혈/겸상적혈구병 환자 또는 기능적 질환 연관 무비증 환자에 존재한다; Brousse 등, Br J Haematol. 166(2):165-176, 2014). 흥미롭게도, CD46++/Hbbth-3 마우스의 WBC 계수는 생체내 형질도입 후 29 주차에 "건강한" CD46tg 마우스의 수준으로 되돌아갔다(도 19a). 이 효과는 접근법에 의한 지중해빈혈 표현형의 역전이 적혈구 구획을 넘어 확장되어, WBC의 정상화, 및 대부분의 경우 전반적인 비장 기능을 초래함을 시사한다.
특히, CD46tg 마우스에서의 연구와 대조적으로, 지중해빈혈 배경의 맥락 및 O6BG/BCNU 처리의 부재 하에, γ-글로빈+ RBC의 13%는 CD46+/+/Hbbth-3 마우스의 말초 혈액에서 순환하였고, 이 수준은 2차 수용자에서 장기간 유지하였다. 이는 γ-글로빈 유전자 발현이 주요 지중해빈혈의 마우스 모델에서 생체외 렌티벡터 HSPC 유전자 요법으로 보고된 것과 유사한 지중해빈혈식 유전적으로 변형된 적혈구 전구체에 생존 이점을 부여하였음을 나타낸다(Micco 등, Proc Natl Acad Sci USA. 105(30):10547-10552, 2008). 그러나, 지중해빈혈 마우스 모델에서 표현형 교정은 O6BG/BCNU 처리를 필요로 하였다. 이는 낮은 글로빈 마킹으로 인해 필요한 경우, 유도성 생체내 선택 시스템이 쉬운 약리학적 개입에 의한 치료 효능의 구제를 허용함을 시사한다.
뮤린 지중해빈혈 모델에서 추가로 γ-글로빈의 수준을 증가시키기 위해, 하기 가능성이 고려될 수 있다: (a) HDAd-SB 대 HDAd-γ-글로빈/mgmt 벡터의 비를 세포 당 통합된 이식유전자 카피의 수를 증가시키기 위해 1:1에서 1:3으로 바꿀 수 있다(Zhang 등, PLoS One. 8(10):e75344, 2013). (b) 또한 이식유전자 통합 위치 효과를 최소화하기 위해 β-글로빈 LCR의 26.1-kb 버전을 사용하여 γ-글로빈 발현을 구동하도록 계획하였다(Wang 등, J Virol. 79(17):10999-11013, 2005). (c) SB100X-기반 γ-글로빈 유전자 추가 시스템 이외에도, HDAd5/35++ 벡터는 γ-글로빈 억제인자 영역을 파괴하고 내인성 γ-글로빈 유전자를 재활성화기 위해 CRISPR/Cas9를 수용할 수 있다(Li 등, Blood. 131(26):2915-2928, 2018).
동원 및 발현으로부터 시간의 관계를 평가하기 위해, HDAd-mgmt/GFP 벡터 + HDAd-SB 벡터를 G-CSF 및 AMD3100으로 동원 후 hCD46tg 마우스에 투여하였다. 혈청 항-HDAd 항체를 도 20a 및 20e에 제시된 바와 같이 측정하였다. GFP를 4 일 또는 4 주 및 동원 후 4 일에 측정하였다(도 20b("B") 및 20c("C")). 동원 및 HDAd 주사의 두번째 차례(첫번째 차례 후 4 주; 도 20d). 결과는 도 20f에 제시된다. 동원의 두번째 차례(도 20d; "D")는 바이러스에 대한 중화 혈청 항체의 발달로 인해 말초 혈액 세포의 형질도입을 초래하지 않았다. 그러나, 2차 이식 수용자에서 생체내 형질도입 연구에서 나타낸 바와 같이(도 18e), 항-HDAd 항체의 발달이 약제학적으로 차단될 수 있는 경우, 두번째 처리는 γ-글로빈+ RBC 및 γ-글로빈 발현 수준/MFI의 백분율을 둘 다 증가시킬 수 있다.
생체내 HSPC 형질도입/선택 접근법의 안전성.  이 접근법은 골수절제술/조건화 및 연관된 독성에 대한 필요성을 폐지하는 반면, 간단한 정맥내 및 피하 물질/벡터 주사에 의해 조건화되지 않은 숙주에서 HSPC를 효과적으로 표적화한다. 중요하게는, 절차는 이 연구에 수반되는 모든 동물에서 잘 용인되었다.
G-CSF/AMD3100(플레릭사포르)에 기반한 HSPC 동원과 관련하여, 접근법은 안전하고 효과적인 것으로 임상적으로 입증되었고 주요 지중해빈혈에 대한 모든 진행중인 실험에서 백혈구분리반출술에 의한 HSPC 동원 및 수집에 정기적으로 사용된다(Psatha 등, Curr Gene Ther. 17(5):364-378, 2017, Karponi 등, Blood. 126(5):616-619, 2015). 이 연구에 사용되는 동원 레지멘에 대한 대안으로서, 다른 접근법은 HSPC의 보다 효율적인 동원을 달성하기 위해 작은 합성 분자에 의한 CXCR4의 연속 차단을 수반할 수 있다(Karpova 등, Blood. 129(21):2939-2949, 2017).
HDAd5/35++ 벡터의 정맥내 주사는 주사 후 3 일차에 CD46tg 마우스에서 동원된 HSPC 및 PBMC 이외의 조직에서 이식유전자 발현을 초래하지 않는다(Richter 등, Blood. 128(18):2206-2217, 2016). 이는 1세대 CD46-표적화 Ad5/35 및 Ad5/11 벡터가 정맥내로 주사된 개코원숭이에서 초기 연구와 일치하였다(Ni 등, Blood. 128(18):2206-2217, 2016). 이 향성에 대한 잠재적인 설명은 CD46 수용체 밀도 및 접근가능성이 비조혈 조직에서 충분히 높지 않아 효율적인 바이러스 형질도입을 허용하지 않는다는 점이다(Richter 등, Blood. 128(18):2206-2217, 2016; Ong 등, Exp Hematol. 34(6):713-720, 2006). 여기서, 세포 당 통합된 이식유전자 카피 수는 트랜스포존 벡터를 사용하여 생체내 형질도입/선택 후 18 주차에 상이한 조직에서 측정되었다(도 21a). 카피 수에 대한 효율은 도 21b 및 21c에 제시된다. 다양한 조직에서 세포 당 통합된 트랜스포존 카피가 제시된다(도 21d). 골수, PBMC, 및 비장에서 카피 수는 2.5였다. 통합된 이식유전자를 또한 간, 폐, 및 장의 게놈 DNA에서 검출하였다. GFP 벡터 시스템을 사용한 이전 연구는 이들 기관에서의 신호가 침윤 혈액 세포 및/또는 거주 대식세포로부터 기원함을 나타내었다(Richter 등, Blood. 2016;128(18):2206-2217).
HDAd 벡터(뿐만 아니라 다른 바이러스 벡터)의 정맥내 주사는 전염증성 사이토카인의 방출과 연관되지만(Atasheva 등, Curr Opin Virol. 21:109-113, 2016, Grieg 등, Mol Ther Methods Clin Dev. 3:16079, 2016), 바이러스 주사(Seregin 등, Mol Ther. 17(4):685-696, 2009) 또는 벡터 용량 분획화(Illingworth 등, Mol Ther Oncolytics. 5:62-74, 2017) 전 날에 글루코코르티코이드를 사용한 전처리에 의해 효율적으로 차단될 수 있다. 정맥내로 주사된 종양용해성 아데노바이러스의 우수한 안전성 프로파일은 CD46-표적화 종양용해성 아데노바이러스를 사용한 시험을 포함하여 수십 개의 임상 시험에서 문서화되었다(Garcia-Carbonero 등, J Immunother Cancer. 5(1):71, 2017).
생체내 선택의 안전성 및 O6BG/BCNU-자극된 증식이 장기간 정지된 HSPC의 저장소를 고갈시킬 수 있다는 우려와 관련하여, 대형-동물 모델을 사용한 연구는 HSPC 소진 또는 우성 클론의 출현 없이 장기간 다중계통 선택에 대한 증거를 제공하였다(Beard 등, J Clin Invest. 120(7):2345-2354, 2010, Neff 등, J Clin Invest. 112(10):1581-1588, 2003). 이러한 모델에서, 조혈 및 골수외 독성 프로파일은 허용가능하였다. 본 연구 및 이전 마우스 연구에서(Wang 등, Mol Ther Methods Clin Dev. 8:52-64, 2018, Li 등, Blood. 131(26):2915-2928, 2018), 생체내 선택은 골수억제 없이 잘 용인되었다. O6BG/BCNU 처리 시 골수 HSPC의 빈도에서 변화는 관찰되지 않았다. WBC, 구체적으로 림프구 계수에서 경미한 감소는 일시적이었다. 생체내 선택된 HSPC의 생존을 초래하는 DNA 복구 과정의 억제제인 O6BG, 및 알킬화제인 BCNU를 사용한 저용량 처리의 3 내지 4 주기는 이론적으로 돌연변이 및 종양형성을 촉발할 수 있다. 이 위험에 대한 논쟁은 이러한 치료를 받았지만 발암 징후를 시사하지 않은 원숭이 및 개의 장기간 추적 연구이다(Beard 등, J Clin Invest. 120(7):2345-2354, 2010, Radke 등, Sci Transl Med. 9(414):eaan1145, 2017, Beard 등, Blood. 113(21):5094-5103, 2009). HSPC에서 이 위험을 평가하려는 시도에서, 시험관내 연구를 MGMTP140K-발현 HDAd 벡터로 형질도입된 CD34+ 세포를 사용하여 수행하고 MGMTP140K 발현에 의해 보호되지 않는 세포의 98%가 사멸된 용량으로 O6BG/BCNU 처리에 적용하였다(도 22a-22c). 약물 노출 후 14 일차에, 미처리 CD34+ 세포 및 처리 생존된 세포의 Illumina 전체 엑솜 서열분석을 분석하였으며, 결과는 하기 표에 제시되어 있다. 약물 처리 생존된 CD34+ 세포 vs 미처리 CD34+ 세포의 전체 엑솜 서열분석. 샘플 서열을 호모 사피엔스 참조 게놈(UCSC hg19)과 비교하였다.
샘플 #1: 미처리 CD34 + 세포
Figure pct00017
샘플 #2: 선택된 CD34 + 세포
Figure pct00018
아미노산 치환이 단백질 기능에 영향을 미치는지를 예측하는 필터로서 Tolerant의 Sorting Intolerant(SIFT; uswest.ensemble.org에서 온라인 이용가능)를 사용하여, 처리된 샘플에서 47,858,908 개의 서열분석된 염기 쌍 당 126 개의 새로운 돌연변이(염기 쌍 당 2.63 x 10-6 개의 돌연변이)를 식별하였다. 필터로서 ClinVar을 사용하여, 잠재적인 병리학적 효과가 있는 6 개의 돌연변이가 발견되었다. 표 11은 염색체 고유 돌연변이가 발견된 것을 요약한다:
표 13
Figure pct00019
O6BG/BCNU 처리가 돌연변이를 유발한다는 발견은 예상되지 못했지만; 엑솜 서열분석 데이터 결과는 불분명하다. 기능 상실 돌연변이체는 인간 집단에서 흔하다. Exome Aggregation Consortium에 의한 최근 분석은 기능 상실 돌연변이가 있는 3,230 개의 유전자를 식별하였으며, 이들 변이체 중 72%는 현재 확립된 인간 질환 표현형이 없다(Lek 등, Nature. 536(7616):285-291, 2016).
SB100X 트랜스포사제 및 Flpe 재조합효소 유전자를 보유하는 HDAd-SB 벡터는 통합되지 않고 세포 분열 동안 손실된다(Li 등, Mol Ther Methods Clin Dev. 9:142-152, 2018). 이전에 공개된 데이터와 일치하여(Li 등, Mol Ther Methods Clin Dev. 9:142-152, 2018), 통합 또는 에피솜 HDAd-SB 벡터는 골수 Lin-세포에서 연구 종료 시 qPCR에 의해 검출가능하지 않았다. SB100X 트랜스포사제는 유전자 내로 또는 근처에 통합에 대한 선호도 없이 무작위 이식유전자 통합을 매개한다(Richter 등, Blood. 128(18):2206-2217, 2016, Zhang 등, PLoS One. 8(10):e75344, 2013). 이 무작위 패턴은 우세한 통합 부위/클론의 출현 없이 생체내 선택 후 유지된다. 이론적으로, 무작위 통합은 활성 유전자 내로 우선적 통합 보다 상대적으로 더 안전하며, 이는 렌티바이러스 또는 AAV 벡터 형질도입 동안 발생한다(Deyle 등, Curr Opin Mol Ther. 11(4):442-447, 2009, Bartholomae 등, Mol Ther. 19(4):703-710, 2011, Schroder 등, Cell. 110(4):521-529, 2002). 특히, β-지중해빈혈에 대한 SIN-LV-기반 임상 시험에서, HMGA2 원종양형성 유전자의 인트론 내로 통합은 1 명의 환자에서 양성 클론 우성을 촉발하였다(Cavazzana-Calvo 등, Nature. 467(7313):318-322, 2010).
SB100X-매개 무작위 이식유전자 통합 및 돌연변이성 선택 약물을 사용한 치료의 조합 효과로부터 잠재적인 종양 형성의 위험을 감소시키기 위해, 벡터 시스템을 제1 위험 인자를 제거하도록 설계하였다. 이는 염색체 안전 항구 부위 내로 표적화된 γ-글로빈 통합을 매개하고 마우스에서 RBC의 70% 초과에서 안정된 γ-글로빈 마킹을 초래하였다(Li 등, 21st Annual American Society of Gene and Cell Therapy Meeting. Abstract 972).
이 접근법의 안전성은 비인간 영장류의 장기간 연구에서 처음으로 명확하게 입증될 수 있다. 이 맥락에서 원숭이 및 개코원숭이 골수 CD34+ 세포는 인간 CD34+ 세포만큼 Ad5/35 벡터에 의해 효율적으로 형질도입됨에 주목할만하고(Tuve 등, J Virol. 80(24):12109-12120, 2006), 원숭이에서 GFP를 발현하는 통합 HDAd5/35++ 벡터에 의해 동원된 CD34+ 세포의 직접 생체내 도입을 입증하였다(Harworth 등, 21st Annual American Society of Gene and Cell Therapy Meeting. Abstract 995).
접근법의 임상 번역에 대하여.  HDAd5/35++ 벡터의 생산은 일상적으로 스피너 배양물 리터 당 5 x 1012 개의 바이러스 입자(vp)를 산출한다. Flexion의 FX201 벡터에 대한 cGMP-등급 HDAd 생산이 확립된다. 정맥내로 주사된 바이러스에 대한 선천적 면역 반응의 약리학적 제어를 위한 프로토콜은 마우스보다 인간에 대해 더 개발되었고 현재 정맥내로 주사된 고용량 rAAV 벡터를 사용한 임상 시험에서 실행되고 있다. 그러나, 대부분의 인간은 Ad5 캡시드 단백질에 대해 지시된 중화 혈청 항체를 가지며, HDAd5/35 벡터, 즉, Ad5 캡시드 단백질 및 키메라 Ad35 섬유를 함유하는 벡터로 생체내 형질도입을 차단할 것이다. 본 개시내용에 기재된 대안은 Ad35로부터 유래된 벡터를 포함한다. Ad35는 혈청 유병률이 7% 미만이고 Ad5와의 교차 반응성이 없는 57 개의 알려진 인간 혈청형 중 가장 희귀한 것 중 하나이다(Vogels 등, J Virol. 77(15):8263-8271, 2003, Abbink 등, J Virol. 81(9):4654-4663, 2007, Kostense 등, AIDS. 18(8):1213-1216, 2004, Flomenberg 등, J Infect Dis. 155(6):1127-1134, 1987, Barouch 등, Vaccine. 29(32):5203-5209, 2011). Ad35는 Ad5보다 면역원성이 적으며(Johnson 등, J Immunol. 188(12):6109-6118, 2012), 이는 부분적으로 Ad35 섬유 놉에 의한 T 세포 활성화의 감쇠에 기인한다(Adams 등, J Gen Virol. 93(pt 6):1339-1344, 2012. Adams 등, Proc Natl Acad Sci USA 108(18):7499-7504, 2011, Shoji 등, PLoS One. 7(1):e30302, 2012). 정맥내 주사 후, 인간 CD46-유전자이식 마우스(Sakurai 등, Gene Ther. 13(14):1118-1126, 2006, Sakurai 등, Mol Ther. 16(4):726-733, 2008) 및 비인간 영장류(Sakurai 등, Mol Ther. 16(4):726-733, 2008)에서 간을 포함하는 조직의 최소 형질도입만이 있다(PCR에 의해서만 검출가능). 1세대 Ad35 벡터는 백신접종 목적을 위해 임상적으로 사용되었다(Baden 등, Ann Intern Med. 164(5):313-322, 2016, Kazmin 등, Proc Natl Acad Sci USA 114(9):2425-2430, 2017). 인간에서 향후 연구를 위해, 벡터는 생체내 HSPC 유전자 요법을 위해 HDAd35++에 기반하여 생성될 것이다.
요약하면, 이는 지중해빈혈에 대한 전통적인 렌티바이러스 벡터 생체외 유전자 요법에 대한 대안을 제공하며, 이는 요법을 단순화하고, 주요 지중해빈혈이 풍토성이고 HSPC 이식이 실행가능하지 않는 자원 부족 지역에 접근가능하게 만들 수 있다.
실시예 2. 29 kb β-글로빈 유전자좌 제어 영역을 사용한 뮤린 지중해빈혈의 생체내 조혈 줄기 세포 유전자 요법
실시예 1은 생체내 변형된 HSPC에서 γ-글로빈 유전자 발현을 구동하는 능력의 상당한 진전을 기재한다. 또한 γ-글로빈 발현 수준을 추가로 증가시키기 위해, β-글로빈 LCR의 더 긴 버전(예를 들어, 26.1 kb)을 사용하여 γ-글로빈 발현을 구동시킬 수 있음을 언급한다. 이 실시예는 추적 분석 결과를 제공한다.
본원에 기재된 바와 같이, 조혈 줄기/전구체 세포(HSPC) 동원 이어서 통합 헬퍼-의존성 아데노바이러스 HDAd5/35++ 벡터의 정맥내 주사는 형질도입된 HSPC의 생체내 선택 후 마우스 모델에서 장기간 재증식 세포의 효율적인 형질도입 및 질환 개선을 초래하였다. HDAd5/35++ 주사와 연관된 급성 선천적 독성은 이 접근법을 임상 번역을 위해 실현가능하게 만드는 적절한 예방에 의해 제어된다. 이는 기술적으로 중요 지중해빈혈 또는 겸상적혈구병의 유전자 요법에 대한 간단한 생체내 HSPC 형질도입 접근법으로 사용될 수 있다. 이러한 질환의 치유는 높은 발현 수준의 치료 단백질(γ- 또는 β-글로빈)을 필요로 하며, 이는 더 큰 조절 요소를 수용하는 것을 허용하지 않는 게놈 크기 제한으로 인해 렌티바이러스 벡터로 달성하기 어렵다. 이 실시예는 HDAd5/35++ 벡터의 35 kb 삽입 용량을 활용하여 총 길이가 29 kb인 β-글로빈 유전자좌의 전사 조절 영역이 HSPC 내로 효율적으로 전달될 수 있음을 입증한다. 생체내 HSPC 형질도입은 적혈구 세포에서 안정된 γ-글로빈 수준을 초래하여 뮤린 중간형 지중해빈혈의 완전한 치유를 부여하였다. 특히, 이는 최소 생체내 HSPC 선택 레지멘으로 달성되었다. 이 연구는 큰 조절 영역을 혼입하는 HDAd5/35++ 벡터가 높은 수준의 이식유전자 발현을 필요로 하는 질환의 유전자 요법에서 과제를 해결할 수 있음을 입증한다.
도입 . 주요 지중해빈혈 및 겸상 세포 빈혈과 같은 혈색소병증의 유전자 요법이 성공하기 위해, 전달된 유전자는 바람직하게는 통합 및 전사 침묵의 위치 효과 없이, 적혈구 세포에서 높은 수준으로 발현된다. β-글로빈 유전자좌 제어 영역(LCR)은 이러한 용도에 유익한 것으로 생각된다. 유전자 요법 적용의 경우, HS1 내지 HS5를 함유하는 β-글로빈 LCR은 유전자이식 마우스에서 시스-연결된 유전자에 대해 높은 수준의 발현을 부여하는 것으로 제시되었다(Grosveld 등, Cell 51: 975-985, 1987). 그러나, 이 버전의 LCR은 렌티바이러스 벡터에서 사용하기에 너무 크고(삽입 용량 8 kb), 따라서 절두된 "미니" 또는 "마이크로" LCR 버전이 개발되었다. 예를 들어, 지중해빈혈 환자에서 진행중인 임상 시험에서 2.7 kb 미니-LCR(HS2-HS4 포함) 및 266 bp β-글로빈 프로모터을 함유하는 렌티바이러스가 사용되고 있다(Negre 등, Curr Gene Ther 15:64-81, 2015). 실시예 1에서, CD46 유전자이식 마우스 또는 CD46/Hbbth3 지중해빈혈 마우스에서 γ-글로빈의 발현을 위한 HS1 내지 HS4 및 β-글로빈 프로모터를 함유하는 5.9 kb β-글로빈 LCR 버전이 이용되었다(Wang 등, J Clin Invest 129:598-615, 2019). 생체내 HSPC 형질도입/선택 접근법을 사용하여, 말초 혈액 적혈구의 거의 100%에서 γ-글로빈 마킹이 달성된 반면, γ-글로빈의 발현 수준은 세포 당 2-3 개 카피의 평균 통합 벡터 카피 수(VCN)를 갖는 성체 마우스 α-글로빈 수준의 10-15%였다.
β00 지중해빈혈 또는 겸상 세포 빈혈의 완전한 치유를 위해, 일반적으로 적혈구 세포에서 20%의 치료 글로빈(γ- 또는 β-글로빈) 발현 수준이 필요하다고 생각된다(Fitzhugh 등, Blood 130:1946-1948, 2017). 이 수준에 도달하는 한 가지 방식은 HSPC 형질도입을 개선하거나 또는 벡터 용량을 증가시킴으로써 VCN을 증가시키는 것이다. 그러나, 이러한 접근법은 역사적으로 적어도 부분적으로 활용된 벡터 시스템의 무작위 통합 패턴으로 인해, 독성 위험을 증가시키는 다른 맥락에서 관찰되었다. 이 실시예에서, 더 강한 전사 요소, 즉 더 긴 LCR 버전은 CD46-유전자이식 마우스의 생체내 HSPC 형질도입 후 RBC에서 γ-글로빈 발현을 증가시키기 위해 활용되었다.
백혈구분리반출술, 골수절제술, 및 HSPC 이식을 필요로 하지 않는 신규 생체내 HSPC 형질도입 접근법이 제공된다(Richter 등, Blood, 128:2206-2217, 2016). 접근법은 생체내 HSPC 형질도입에 적합한 새로운 백터 플랫폼, 즉 헬퍼-의존적, 캡시드-변형된 아데노바이러스 벡터(HDAd5/35++)를 수반한다. 이러한 벡터의 특징은 i.v. 주사 후 비-조혈 조직의 감염을 피하면서 원시 HSC의 효율적인 형질도입을 허용하는 CD46-친화도 향상된 섬유 및 최대 30 kb의 삽입 용량을 포함한다. 제한된 접근가능성으로 인해, 골수에 위치한 HSPC는 벡터가 골수 세포 상에 존재하는 수용체를 표적화하는 경우에도, HDAd5/35++ 벡터를 포함하는 정맥내로 주사된 벡터에 의해 형질도입되지 않을 수 있다(Ni 등, Hum Gene Ther, 16: 664-677, 2005 및 Ni 등, Cancer Gene Ther, 13:1072-1081, 2006). 과립구-콜로니-자극 인자(G-CSF) 및 CXCR4 길항제 AMD3100(MOZOBILTM, PLERIXATM)의 조합은 동물 모델 및 인간에서 원시 전구체 세포를 효율적으로 동원하는 것으로 제시되었다(Fruehauf 등, Cytotherapy, 11: 992-1001, 2009 및 Yannaki 등, Hum Gene Ther, 24: 852-860, 2013). G-CSF/AMD3100을 사용하여 골수에서 말초 혈류로 HSPC를 동원한 후 HDAd5/35++ 벡터를 정맥내 주사하였다. 이는 이전에 인간 CD46 유전자이식 마우스(Richter 등, Blood, 128: 2206-2217, 2016; Li 등, Mol Ther Methods Clin Dev, 9: 390-401, 2018; Li 등, Blood, 131: 2915-2928. 2018; Wang 등, J Clin Invest, 129: 598-615. 2019; Wang 등, Blood Adv, 3: 2883-2894, 2019; 및 Wang 등, Mol Ther Methods Clin Dev, 8: 52-64, 2018), 인간화 마우스(Richter 등, Blood, 128: 2206-2217, 2016) 및 레서스 원숭이(Harworth 등, ASCGT 21th Annual meeting, 2018, DOI: 10.1016/j.ymthe.2018.05.001)에서 제시되었다. 주변부에서 되돌아가 형질도입된 HSPC는 장기간 지속되는 골수로 되돌아간다. 증식 이점 없이, 생체내 형질도입된 HSPC는 골수를 효율적으로 빠져나가지 않고 하류 분화에 기여한다. O6BG/BCNU를 사용한 동물의 단기간 처리는 mgmt P140K 유전자-변형된 HSPC에 대한 증식 자극을 제공하고 이후에 말초 혈액 세포의 80% 초과에서 안정된 이식유전자 발현을 제공한다(Wang 등, Mol Ther Methods Clin Dev, 8: 52-64, 2018).
HD-Ad5/35++ 게놈은 숙주 세포 게놈 내로 통합되지 않고 세포 분열 시 손실된다. 유전자 요법 목적 및 장기간 생체내 형질도입된 HSPC를 추적하기 위해, HD-Ad5/35++ 벡터를 이식유전자 통합을 허용하도록 변형시켰다. 이는 과활성 잠자는 미녀 트랜스포사제 시스템(SB100)을 통합함으로써 수행되었다(Zhang 등, PLoS One, 8: e75344, 2013; Hausl 등, Mol Ther, 18: 1896-1906, 2010; 및 Yant 등, Nat Biotechnol, 20: 999-1005, 2002). 제2 벡터로부터 트랜스로 공동 발현된 트랜스포사제는 이식유전자 카세트에 플랭킹하는 특이적 DNA 서열(도립 반복부; "IR")을 인식하고 염색체 DNA의 TA 디뉴클레오티드 내로의 통합을 촉발한다. 레트로바이러스 통합과 달리, SB100x-매개 통합은 표적화된 유전자의 전사 상태에 의존하지 않는다(Yant 등, Mol Cell Biol, 25: 2085-2094, 2005). 여러 연구는 SB100x-매개 이식유전자 통합이 무작위적이고 원종양형성 유전자의 활성화와 연관되지 않음을 입증하였다(Richter 등, Blood, 128: 2206-2217, 2016; Wang 등, Mol Ther Methods Clin Dev, 8: 52-64, 2018; Zhang 등, PLoS One, 8: e75344, 2013; Hausl 등, Mol Ther, 18: 1896-1906, 2010; 및 Yant 등, Nat Biotechnol, 20: 999-1005, 2002). SB100x-기반 통합 시스템의 이점은 세포의 효율적인 상동 DNA 복구 기구에 의존하지 않는다는 점이다. 후자는 DNA 복구 및 재조합효소의 낮은 활성을 나타내는 HSPC에서 중요하다(Beerman 등, Cell Stem Cell, 15: 37-50, 2014). CD46-유전자이식 마우스(Richter 등, Blood, 128: 2206-2217, 2016; Wang 등, J Clin Invest, 129: 598-615. 2019; Li 등, Mol Ther, 27: 2195-2212, 2019; Li 등, Mol Ther Methods Clin Dev, 9: 142-152, 2018; 및 Wang 등, J Virol, 79: 10999-11013, 2005) 및 인간 CD34+ 세포(Li 등, Mol Ther, 27: 2195-2212, 2019)에서 HDAd35++-트랜스포존 벡터 및 SB100x/Flpe 발현 벡터를 사용한 생체내 HSC 공동-감염은 유전자에 대한 선호도 없이 세포 당 2 개 이식유전자 카피의 무작위 이식유전자 통합을 초래하였음이 입증되었다.
인간 게놈은 일반적으로 루프 형성을 통해 조절 영역(즉, 전사 인자 결합 부위) 사이에 긴 범위 상호작용을 갖는 3-D 구조로 조직화된다. 이러한 상호작용의 대부분은 위상적으로 연관된 도메인(TAD)의 맥락에서 발생한다. TAD는 인핸서가 전사를 제어하기 위해 다른 조절 영역과 상호작용하는 염색체 조직화의 기능적 단위로 간주된다. TAD/LCR 경계 절연은 인핸서 및 프로모터의 검색 공간을 제한하고 원치않은 조절 접촉이 형성되는 것을 방지하는 것으로 생각된다. 이러한 도메인의 양 측면에서 경계는 상이한 포유류 세포 유형 사이에 그리고 심지어 종에 걸쳐 보존된다.
현재 사용되는 렌티바이러스 및 rAAV 유전자 전달 벡터는 작은 인핸서/프로모터만을 수용하여, 종종 이식유전자 발현의 차선적 수준 및 조직 특이성, 이식유전자 침묵, 및 벡터 통합 부위 주위의 조절 영역과의 의도하지 않은 상호작용을 초래할 수 있다. 최악의 경우에 대한 시나리오에서, 후자는 원종양형성 유전자의 활성화로 이어질 수 있다.
유전자 요법의 안전성 및 효능을 증가시키기 위해, TAD는 유전자 추가 전략에 사용되어야 한다. TAD의 중간 크기는 880 kb이다. 고처리량 염색체 형태 캡처 (3C) 검정 및 후속 4C, 5C 및 Hi-C 프로토콜 뿐만 아니라 섬유-Seq 검정의 추가 발전에 따라, 조절 게놈의 심문은 빠른 속도로 진행될 것이고, 유전자 요법 목적을 위해, 중요한 코어 요소만을 함유하는 TAD를 전달할 수 있다. β-글로빈 유전자좌 제어 영역(LCR)은 TAD의 정의 하에 속한다.
캡시드-변형된 HDAd5/35++ 벡터는 생체내 HSPC 유전자 요법에 사용되었다(Li & Lieber, FEBS Lett. 593(24):3623-48, 2019; Richter 등, Blood. 128(18):2206-17, 2016). 접근법은 골수에서 HSPC의 동원을 수반하고, 주변부에서 많은 수로 순환하는 동안, HDAd5/35++ 벡터가 정맥내로 주사된다. 이러한 벡터는 원시 HSPC에서 발현되는 수용체인 CD46을 표적화한다(Richter 등, Blood. 128(18):2206-17, 2016). 형질도입된 HSPC는 장기간 지속되는 경우 골수로 되돌아간다. 무작위 통합은 활성-향상된 잠자는 미녀 트랜스포사제(SB100x)에 의해 매개된다(Boehme 등, Mol Ther Nucleic Acids. 5(7):e337, 2016). 표적화된 통합은 상동성 의존적 DNA 복구를 통해 달성될 수 있다(Li 등, Mol Ther. 27(12):2195-212, 2019). 이 접근법은 뮤린 중간형 지중해빈혈의 개선(Wang 등, J Clin Invest. 129(2):598-615, 2019), 뮤린 혈우병의 교정(Wang 등, Blood Adv. 3(19):2883-94, 2019), 및 자연암의 회귀(Li 등, Cancer Res. 80(3):549-560, 2019)를 초래하였다. 비-인간 영장류에서의 첫번째 데이터는 생체내 HSPC 유전자 요법 접근법이 정맥내 HDAd5/35++ 주사 후 선천적 면역 반응을 억제하기 위해 글루코코르티코이드, IL6- 및 IL1β-수용체 길항제 전처리와 조합될 때 안전함을 나타낸다(Li 등, 23rd Annual ASGCT meeting. 2020; abstract #546). HDAd5/35++ 벡터의 정맥내 주사는 주사 후 3 일차에 CD46tg 마우스에서 동원된 HSPC 및 PBMC 이외의 조직에서 이식유전자 발현을 초래하지 않았다(Richter 등, Blood. 128(18):2206-17, 2016; Wang 등, J Clin Invest. 129(2):598-615, 2019). 이는 최근에 비-인간 영장류에서 확인되었다. 이 향성에 대한 잠재적인 설명은 CD46 수용체 밀도 및 접근가능성이 효율적인 바이러스 형질도입을 허용하기에 비-조혈조직에서 충분히 높지 않다는 것이다(Richter 등, Blood. 128(18):2206-17, 2016; Ni 등, Hum Gene Ther. 16(6):664-77, 2005).
HDAd5/35++ 벡터를 사용한 이전 연구에서, 4.3 kb HS1-HS4 미니-LCR(β-글로빈 유전자좌 제어 영역)은 생체내 HSPC 형질도입 후 인간 γ-글로빈 발현을 구동하기 위해 0.66 kb β-글로빈 프로모터와 조합하여 사용되었다(Wang 등, J Clin Invest. 129(2):598-615, 2019; Ong 등, Exp Hematol. 34(6):713-20, 2006). Hbbth3/CD46+/+ 지중해빈혈 마우스에서, 안정된(8 개월 이상) γ-글로빈 마킹은 말초 혈액 적혈구의 거의 100% 및 거의 완전한 표현형 교정에서 달성되었다(Wang 등, J Clin Invest. 129(2):598-615, 2019). 그러나, γ-글로빈 발현 수준은 세포 당 2 개 카피의 평균 통합 벡터 카피 수(VCN)를 갖는 성체 마우스 α-글로빈의 단지 10-15%였으며, 따라서 주요 지중해빈혈 또는 SCD에 대한 접근법의 임상 번역을 특히 어렵게 만든다. 여기서, HDAd5/35++ 벡터의 큰 용량은 γ-글로빈 발현 카세트를 포함하는 β-글로빈 TAD 코어 요소를 29 kb 길이로 통합하여 완전한 표현형 교정을 달성함으로써 활용되었다.
이 맥락에서, 또 다른 의도는 SB100x 시스템이 32.4 kb 트랜스포존의 효율적인 통합을 매개할 수 있음을 입증하는 것이었다. 플라스미드-기반 SB 시스템을 사용한 연구로부터 SB 통합 활성은 트랜스포존의 길이와 음의 상관관계가 있는 것으로 생각되었다(Li 등, Mol Ther Methods Clin Dev. 9:142-52, 2018; Karsi 등, Mar Biotechnol (NY). 3(3):241-5, 2001). 이를 고려하면, Kay 및 Ehrhardt 그룹에 의해 개발된 첫번째 SB-기반 HDAd 벡터는 상대적으로 작은(4 kb-6 kb) 트랜스포존을 보유하였다(Turchiano 등, PLoS One. 9(11):e112712, 2014; Yant 등, Nat Biotechnol. 20(10):999-1005, 2002).
최근에, HDAd5/35++ 벡터를 사용하여, 생체외 또는 생체내 HSPC 형질도입 후 HSPC에서 10.8 kb(Wang 등, Blood Adv. 3(19):2883-94, 2019) 및 11.8 kb(Wang 등, J Clin Invest. 129(2):598-615, 2019; Ong 등, Exp Hematol. 34(6):713-20, 2006) 트랜스포존의 효율적인 SB100x-매개 통합을 입증하였다. 이 실시예는 HDAd5/35++-기반 SB100x 벡터 시스템이 32.4 kb 트랜스포존을 통합할 수 있다는 증거를 제공한다.
전반적으로, 정상 및 지중해빈혈 마우스에서 이러한 생체내 연구 뿐만 아니라 인간 CD34+ 세포에 대한 시험관내 연구는 HDAd5/35++ 벡터를 함유하는 기재된 긴-LCR이 혈색소병증의 치료를 위한 효율적인 도구일 수 있음을 나타낸다.
재료 및 방법 .
구성요소 위치: HS5→HS1 (21.5kb): Chr11, 5292319→5270789; β-프로모터: chr11, 5228631→5227023; 및 3'HS1: Chr11, 5206867→5203839.
HDAd 벡터: HDAd-SB 및 HDAd-짧은-LCR 벡터의 생성은 이전에 기재되었다(Richter 등, Blood 128: 2206-2217, 2016; Ong 등, Exp Hematol 34(6):713-20, 2006). HDAd-긴-LCR 벡터의 생성을 위해, 상응하는 셔틀 플라스미드는 코스미드 벡터 pWE15를 기반으로 하였다(Stratagene, 캘리포니아주 라호이아 소재). pWE.Ad5-SB-mgmt는 Ad5 5'ITR(뉴클레오티드 1 내지 436) 및 3'ITR(뉴클레오티드 35741 내지 35938), pBS-μLCR-γ-글로빈-mgmt로부터 유래된 구 인간 EF1α 프로모터-mgmtP140K-SV40pA-cHS4 카세트(Wang 등, J Clin Invest 129: 598-615, 2019), SB100x-특이적 IR/DR 부위 및 FRT 부위를 함유한다. pAd.LCR-β-GFP(21.5-kb 인간 β-글로빈 LCR 함유)에서의 GFP-BGHpA 단편(Hudecek 등, Crit Rev Biochem Mol Biol 52(4):355-380, 2017)은 인간 γ-글로빈 유전자 및 이의 3'UTR 영역에 의해 대체되었다(Chr 11:5,247,139 →5,249,804)(pAd-긴-LCR-β-γ-글로빈). 플라스미드 pAd-긴-LCR-β-γ-글로빈은 21.5-kb 인간 β-글로빈 LCR 및 3.0-kb 인간 β-글로빈 3'HS1을 함유한다. LCR-β-γ-글로빈-3'HS1을 함유하는 28.9-kb 단편은 EF1α-mgmt-SV40pA-cHS4의 카세트의 하류를 pWE.Ad5-SB-mgmt 내로 삽입하였다(pWE.Ad5-SB-긴-LCR-γ-글로빈/mgmt). 완전한 긴-LCR-γ-글로빈/mgmt 카세트는 SB100x-특이적 IR/DR 부위 및 FRT 부위에 의해 플랭킹되었다. 생성된 플라스미드를 Gigapack III Plus Packaging Extract(Stratagene, 캘리포니아주 라호이아 소재)를 사용하여 파지 내로 패킹하고 증식시켰다. HD-Ad-긴-LCR-γ-글로빈/mgmt 바이러스를 생성하기 위해, 바이러스 게놈을 116 세포에서 구제를 위한 플라스미드로부터 I-CeuI 소화에 의해 방출하였다. 단일 아미노산 변이가 있는 인간 집단에서 HBG1 유전자에 대한 2 개의 알려진 변이체가 있다(76-이소류신 또는 76-트레오닌). 빈도가 유럽인의 13%에서 동아시아인의 73%까지의 범위인 76-Ile HBG1 변이체가 사용되었다.
HDAd 바이러스를 생성하기 위해, 바이러스 게놈을 Ad5/35++-Acr 헬퍼 바이러스가 있는 116 세포에서 구제하기 위해 FseI 소화에 의해 방출하였다(Palmer 등, Mol Ther 8: 846-852, 2003). 이 헬퍼 바이러스는 Ad5 섬유 꼬리, Ad35 섬유 샤프트, 및 친화도-향상된 Ad35++ 섬유 놉으로 구성된 키메라 섬유를 함유하는 Ad5/35++ 헬퍼 벡터인 AdNG163-5/35++의 유도체이다(Richter 등, Blood 128: 2206-2217, 2016). SpCas9 활성을 억제하는 것으로 최근에 제시된 인간 코돈-최적화된 AcrIIA4-T2A-AcrIIA2 서열을 합성하고(Yang 등, Proc Natl Acad Sci USA. 92(25):11608-12, 1995) 셔틀 플라스미드 pBS-CMV-pA(pBS-CMV-Acr-pA)로 클로닝하였다. 이후에, 2.0-kb CMV-Acr-pA 카세트를 pBS-CMV-Acr-pA로부터 증폭시키고 In-Fusion HD 클로닝 키트(Takara)에 의해 pNG163-2-5/35++의 SwaI 부위 내로 삽입하였다(Richter 등, Blood 128: 2206-2217, 2016). 그런 다음 바이러스 게놈을 PacI 소화에 의해 방출하고 Ad5/35++-Acr 헬퍼 바이러스를 구제하고 293 세포(HEK293)에서 증식시켰다. HDAd-SB의 생성은 이전에 기재되었다(Richter 등, Blood 128: 2206-2217, 2016). 헬퍼 바이러스 오염 수준은 0.05% 미만이었다. 모든 제제는 박테리아 내독소가 없었다.
CD34 + 세포 배양: G-CSF-동원된 성체 공여자로부터의 CD34+ 세포를 동결된 스톡으로부터 회수하고 10% 열-불활성화 FCS, 1% BSA 0.1 mmol/l 2-머캅토에탄올, 4 mmol/l 글루타민 및 페니실린/스트렙토마이신, Flt3 리간드(Flt3L, 25 ng/ml), 인터류킨 3(10 ng/ml), 트롬보포이에틴(TPO)(2 ng/ml), 및 줄기 세포 인자(SCF)(25 ng/ml)가 보충된 Iscove의 변형된 Dulbecco 배지(IMDM)에서 밤새 배양하였다. 유세포 분석은 세포의 98% 초과가 CD34+였음을 입증하였다. 사이토카인 및 성장 인자는 Peprotech(뉴저지주 로키 힐 소재)로부터 수득하였다. CD34+ 세포를 낮은 부착 12 웰 플레이트에서 바이러스로 형질도입하였다.
적혈구 시험관내 분화: 인간 HSPC의 적혈구 세포 내로의 분화를 Douay 등에 기재된 프로토콜에 기반하여 수행하였다(Methods Mol Biol 482: 127-140, 2009). 간단히 말해서, 단계 1에서, 104 개 세포/ml 밀도의 세포를 5% 인간 혈장, 2 IU/ml 헤파린, 10 μg/ml 인슐린, 330 μg/ml 트랜스페린, 1 μM 하이드로코르티손, 100 ng/ml SCF, 5 ng/ml IL-3, 3 U/ml 에리트로포이에틴(Epo), 글루타민, 및 Pen-Strep이 보충된 IMDM에서 7 일 동안 배양하였다. 단계 2에서, 1x105 개 세포/ml 밀도의 세포를 5% 인간 혈장, 2 IU/ml 헤파린, 10 μg/ml 인슐린, 330 μg/ml 트랜스페린, 100 ng/ml SCF, 3 U/ml Epo, 글루타민, 및 Pen/Strep이 보충된 IMDM에서 3 일 동안 배양하였다. 단계 3에서, 1x106 개 세포/ml 세포 밀도의 세포를 5% 인간 혈장, 2 IU/ml 헤파린, 10 μg/ml 인슐린, 330 μg/ml 트랜스페린, 3 U/ml Epo, 글루타민, 및 Pen/Strep이 보충된 IMDM에서 12 일 동안 배양하였다.
형질도입된 CD34+ 세포의 시험관내 선택: 형질도입된 CD34+ 세포를 시험관내 분화 프로토콜의 단계 1 에서 5 일째에 O6BG/BCNU로 선택하였다. 간단히 말해서, CD34+ 세포를 50 μM O6BG와 1 시간 동안 배양한 다음 35 μM BCNU와 추가 2 시간 동안 배양한 다음, 세포를 2 회 세척하고 새로운 단계 1 배지에 재현탁하였다.
Lin - 세포 배양: 계통 음성 세포를 Miltenyi Biotech(독일 베르기슈글라트바흐 소재)의 계통 세포 고갈 키트를 사용하여 MACS에 의해 총 마우스 골수 세포로부터 단리하였다. Lin- 세포를 10% FCS, 10% BSA, Pen-Strep, 글루타민, 10 ng/ml 인간 TPO, 20 ng/ml 마우스 SCF 및 20 ng/ml 인간 Flt-3L이 보충된 IMDM에서 배양하였다.
글로빈 HPLC: 개별 글로빈 쇄 수준을 SPD-10AV 다이오드 어레이 검출기 및 LC-10AT 바이너리 펌프가 장착된 Shimadzu Prominence 기기(Shimadzu, 일본 쿄토 소재)에서 정량화하였다. 물/아세토니트릴 중 0.1% 트리플루오로아세트산의 40%-60% 구배 혼합물을 Vydac C4 역상 칼럼(Hichrom, 영국 소재)을 사용하여 1 mL/분의 속도로 적용하였다. 
유세포 분석: 세포를 1 % FCS가 보충된 PBS에 1x106 개 세포/100 μL로 재현탁하고 얼음 위에서 10 분 동안 FcR 차단 시약(Miltenyi Biotech, 캘리포니아주 오번 소재)과 함께 배양하였다. 다음으로 염색 항체 용액을 106 개 세포 당 100 μL에 첨가하고 암실에서 30 분 동안 얼음 위에서 배양하였다. 배양 후, 세포를 FACS 완충액(PBS, 1% FBS)에서 1 회 세척하였다. 염색 단계를 2차 염색 용액으로 반복하였다. 세척 후, 세포를 FACS 완충액에 재현탁하고 LSRII 유세포 분석기(BD Biosciences, 캘리포니아주 산호세 소재)를 사용하여 분석하였다. 파편을 전방 산란 영역 및 측방 산란 영역 게이트를 사용하여 제외하였다. 그런 다음 단일 세포를 전방 산란 높이 및 전방 산란 폭 게이트를 사용하여 게이팅하였다. 그런 다음 유세포 분석 데이터를 FlowJo(버전 10.0.8, FlowJo, LLC)를 사용하여 분석하였다. LSK 세포의 흐름 분석을 위해, 세포를 비오틴-접합된 계통 검출 칵테일(cat #: 130-092-613; Miltenyi Biotec, 캘리포니아주 샌디에이고 소재) 및 c-Kit(cat #:12-1171-83) 및 Sca-1(cat #: 25-5981-82)에 대한 항체 뿐만 아니라 APC-접합된 스트렙타비딘으로 염색하였다. eBioscience(캘리포니아주 샌디에이고 소재)로부터의 다른 항체는 항-마우스 LY-6A/E(Sca-1)-PE-Cyanine7(클론 D7), 항-마우스 CD117(c-Kit)-PE(클론 2B8), 항-마우스 CD3-APC(클론 17A2; cat #:17-0032-82), 항-마우스 CD19-PE-Cyanine7(클론 eBio1D3; cat #: 25-0193-82), 및 항-마우스 Ly-66 (Gr-1)-PE(클론 RB6-8C5; cat #: 12-5931-82)을 포함하였다. 항-마우스 Ter-119-APC(클론: Ter-119; cat #: 116211)는 Biolegend(캘리포니아주 샌디에이고 소재)로부터 수득하였다.
인간 γ-글로빈 발현을 검출하는 세포내 유세포 분석: FIX & PERMTM(Nordic Immunological Laboratories, 네덜란드 수스테렌 소재) 세포 투과화 키트(Thermo Fisher Scientific, 매사추세츠주 월섬 소재)를 사용하고 제조업체의 프로토콜에 따랐다. 간단히 말해서, 1x106 개 세포를 100 μl FACS 완충액(1% FCS가 보충된 PBS)에 재현탁하고, 100 μl의 시약 A(고정 배지)를 첨가하고 실온에서 2-3 분 동안 배양한 다음, 1 ml 사전-냉각된 절대 메탄올을 첨가하고, 혼합하고 10 분 동안 암실에서 얼음 위에서 배양하였다. 그런 다음 샘플을 FACS 완충액으로 세척하고 100 μl 시약 B(투과 배지) 및 0.3 μg 헤모글로빈 γ 항체(Santa Cruz Biotechnology, 텍사스주 댈러스 소재, cat# sc-21756 PE)에 재현탁하고, 실온에서 30 분 동안 배양하였다. 세척 후, 세포를 FACS 완충액에 재현탁하고 분석하였다. 유세포 분석 게이팅 전략은 도 46에 제시되어 있다.
실시간 역전사 PCR: 총 RNA를 제조업체의 페놀-클로로포름 추출 방법에 따라 TRIzolTM 시약(Thermo Fisher Scientific)을 사용하여 50-100 μl 혈액으로부터 추출하였다. Quantitect 역전사 키트(Qiagen) 및 power SYBRTM green PCR 마스터 믹스(Thermo Fisher Scientific)를 사용하였다. 실시간 정량적 PCR을 StepOnePlus 실시간 PCR 시스템(AB Applied Biosystems)에서 수행하였다. 다음 프라이머 쌍을 사용하였다: 마우스 RPL10(하우스키핑) 정방향(서열번호: 189), 및 역방향(서열번호: 190); 인간 γ-글로빈 정방향(서열번호: 191), 및 역방향(서열번호: 192); 마우스 β-주요 글로빈 정방향(서열번호: 193), 및 역방향(서열번호: 194), 마우스 α 글로빈 정방향(서열번호: 212), 및 역방향(서열번호: 213).
벡터 카피 수의 측정: 골수 세포로부터의 총 DNA를 Quick-DNA 미니프렙 키트(Zymo Research)를 사용하여 추출하였다. HDAd-짧은 LCR-γ-글로빈/mgmt 바이러스로부터 추출된 바이러스 DNA를 연속으로 희석하고 표준 곡선에 사용하였다. qPCR을 StepOnePlus 실시간 PCR 시스템(Applied Biosystems)에서 power SYBR Green PCR 마스터 믹스를 사용하여 삼중으로 수행하였다. 9.6 ng DNA(9600 pg/6 pg/세포 = 1600 개 세포)를 10 μL 반응에 사용하였다. 다음 프라이머 쌍을 사용하였다: 인간 γ-글로빈 정방향(서열번호: 195), 및 역방향(서열번호: 196).
통합 부위 분석. 절차를 설명하기 위해, 도 27을 참조한다. 도 28d에 대한 무작위화 데이터를 포아송(Poisson) 회귀 삽입 모델(PRIM)을 사용하여 생성하여 마우스 참조 게놈(mm9)에서 각 염색체의 길이에 따라 중첩하지 않는 20 킬로염기 창에 대한 예상된 삽입률을 계산하였다. PRIM 알고리즘은 각 창 내에서 TA 디뉴클레오티드의 수, 창이 잔류하는 염색체, 및 고유 삽입의 총 수에 기반하여 통계 모델을 생성하였다. 각 창에 대해, 예상된 삽입 수를 계산하고 관찰된 삽입 수와 비교하여 p-값을 생성하였다. 그런 다음 본페로니-교정(Bonferroni-correction)을 적용하여 삽입된 트랜스포존의 검출을 위한 강화를 나타내는 창을 식별하였다. 그런 다음 TA를 함유하는 참조 게놈으로부터의 무작위 서열을 생성하고, Bowtie2를 사용하여 맵핑하고 실제 통합 데이터에 대해 플롯팅하였다. 계산 및 플롯은 R에서 ggplot2를 사용하여 수행하였다. 도면은 HOMER 및 ChIPseeker를 사용하여 그렸다.
통합 부위 분석(역PCR). 총 골수 세포의 접합부를 변형되어 다른 곳에서 기재된 바와 같은 역PCR에 의해 분석하였다(Hudecek 등, Crit Rev Biochem Mol Biol 52(4):355-80, 2017). 간단히 말해서, 골수 세포로부터의 게놈 DNA를 제조업체의 지침에 따라 Quick-DNA 미니프렙 키트(Zymo Research)에 의해 단리하였다. 5 - 10 μg의 DNA를 SacI로 소화시키고 분자내 반응을 촉진하는 조건 하에 재결찰시켰다. 결찰 혼합물을 페놀/클로로포름 추출 및 에탄올 침전으로 정제한 다음 KOD Hot Start DNA 폴리머라제를 사용하여 중첩 PCR(각 30 주기)에 사용하였다. 다음 프라이머를 사용하였다: EF1α p1 정방향(서열번호: 197) 및 역방향(서열번호: 198); EF1α p2 정방향(서열번호: 199) 및 역방향(서열번호: 200); 3'HS1 p1 정방향(서열번호: 201) 및 역방향(서열번호: 202); 및 3'HS1 p2 정방향(서열번호: 203) 및 역방향(서열번호: 204). 서열번호: 197-204에서, 밑줄 표시된 염기를 하류 클로닝에 사용한다. PCR 앰플리콘을 겔 정제하고, 클로닝하고, 서열분석하고, 정렬시켜 통합 부위를 식별하였다.
RNA-seq 분석 Omega Bioservices(조지아주 노르크로스 소재)에 의해 수행하였다. 데이터를 OnRamp BioInformatics, Inc.(캘리포니아주 샌디에이고 소재)에 의해 개발된 HyperScale 아키텍처를 사용하여 Rosalind(rosalind.onramp.bio/에서 온라인 이용가능)에 의해 분석하였다. 판독물을 cutadapt를 사용하여 트리밍하였다. 품질 점수를 FastQC를 사용하여 평가하였다. 개별 샘플 판독물을 HTseq4를 사용하여 정량화하고 DESeq2 R 라이브러리를 사용하여 상대 Log 발현(RLE)을 통해 정규화하였다. DEseq2를 또한 사용하여 배수 변화 및 p-값을 계산하고 임의의 공변량 교정을 수행하였다. 차등적으로 발현된 유전자의 최종 히트맵을 위한 유전자의 클러스터링을 fpc R 라이브러리를 사용한 PAM(분할적 군집 분석) 방법을 사용하여 수행하였다. Interpro9, NCBI10, MSigDB11,12, REACTOME13, WikiPathways를 포함하는 여러 데이터베이스 소스를 강화 분석을 위해 참조하였다. 강화는 실험과 관련된 배경 유전자 세트와 관련하여 계산하였다.
p-값에 대한 log-스케일 배수 변화를 플롯팅하는 맞춤형 Python 스크립트로 볼케이노 플롯(volcano plot)을 생성하였다.
동물:
연구 승인: 동물을 수반하는 모든 실험은 워싱턴 대학(University of Washington)에 의해 제시된 기관 지침에 따라 수행하였다. 워싱턴 대학은 실험실 동물 관리 국제 평가 및 인증 협회(AALAC) 공인 연구 기관이며 이 대학에서 수행된 모든 살아있는 동물 작업은 실험실 동물 복지국(OLAW) 공중 보건 보증(PHS) 정책, USDA 동물 복지법 및 규정, 실험 동물 관리 및 사용에 대한 지침 및 기관 동물 관리 및 사용 위원회(IACUC) 정책을 따른다. 연구는 워싱턴 대학 IACUC(프로토콜 번호 3108-01)에 의해 승인되었다.
생체외 및 생체내 HSPC 형질도입 연구를 완전한 인간 CD46 유전자좌를 함유하는 C57Bl/6-기반 유전자이식 마우스 모델(hCD46tg)로 수행하였다. 이러한 마우스는 인간과 유사한 패턴 및 수준에서 hCD46을 발현한다(Wang 등, Mol Ther Methods Clin Dev. 8:52-64, 2018).
Hbb th3 /CD46+/+ 마우스의 교배 및 스크리닝: 3 차례의 역교배 후, C46에 대한 Hbbth3 마우스 동형접합성을 gDNA에 대한 PCR(CD46F-5'(서열번호: 205) 및 CD46R 프라이머(서열번호: 206) 사용) 뿐만 아니라 CD46 MFI 측정을 허용하는 유세포 분석에 의해 확인하였다. Hbbth3/CD46+/+ 마우스의 지중해빈혈 표현형을 하기 기재된 바와 같이,
Figure pct00020
염색 후 말초 혈액 도말에 의해 평가하였다.
골수 Lin - 세포 이식: 수용자는 6 - 8 주령의 암컷 C57BL/6 마우스였다. 이식 당일에, 수용자 마우스를 1000 Rad로 조사하였다. 조사 4 시간 후 1x106 개 Lin- 세포를 꼬리 혈관을 통해 정맥내로 주사하였다. 이 프로토콜을 생체외 형질도입 Lin- 세포의 이식 및 2차 수용자로의 이식을 위해 사용하였다.
HSPC 동원 및 생체내 형질도입: 이 절차는 이전에 Richter, 등, (2016) Blood 128: 2206-2217에 기재되었다. HSPC를 인간 재조합 G-CSF의 s.c. 주사(5 μg/마우스/일, 4 일)(Amgen 캘리포니아주 사우전드 오크스 소재) 이어서 5 일째에 AMD3100(5 mg/kg)의 s.c. 주사(Sigma-Aldrich)에 의해 마우스에서 동원하였다. 또한, 동물은 바이러스 주사 16 시간 및 2 시간 전에 덱사메타손(10 mg/kg)을 i.p.로 받았다. AMD3100 후 30 및 60 분에, 동물에게 HDAd 벡터를 주사 당 각 바이러스에 대해 4x1010 vp의 용량으로 안와하정맥총을 통해 정맥내로 주사하였다. 4 주 후, O6BG/BCNU의 생체내 선택을 시작하였다.
2차 골수 이식: 수용자는 Jackson Laboratory로부터 수득한 6 - 8 주령의 암컷 C57BL/6 마우스였다. 이식 당일에, 수용자 마우스를 1000 Rad로 조사하였다. 생체내 형질도입된 CD46tg 마우스로부터의 골수 세포를 무균상태로 단리하고 계통-고갈된 세포를 MACS를 사용하여 단리하였다. 조사 4 시간 후 세포를 마우스 당 1x106 개 세포로 정맥내로 주사하였다. 20 주차에, 2차 수용자를 희생시키고 혈액, 골수 및 비장으로부터 CD46+ 세포를 MACS에 의해 단리하거나 또는 상기 기재된 바와 같이, 동원 및 생체내 형질도입에 적용하였다. 모든 2차 수용자는 4 주차에 시작하여 면역억제를 받았다.
혈액학적 분석: 혈액 샘플을 EDTA-코팅된 튜브에 수집하고, 분석을 HemaVet 950FS(Drew Scientific)에서 수행하였다.
조직 분석: 2.5 μm 두께의 비장 및 간 조직 절편을 적어도 24 시간 동안 4% 포름알데하이드에 고정시키고, 탈수하고 파라핀에 포매하였다. 골수외 혈구형성의 조직학적 평가를 위해 헤마톡실린-에오신 염색을 사용하였다. 헤모시데린은 Perl의 프러시안 블루 염색에 의해 조직 절편에서 검출되었다. 간단히 말해서, 조직 절편을 증류수 중 동일한 부피(2%)의 페로시안화칼륨 및 염산의 혼합물로 처리한 다음 뉴트럴 레드로 대조염색하였다. 세포외 혈구형성 및 혈철소증을 정량화하기 위해, 적어도 3 마리 동물로부터의 5 개의 상이한 조직 절편에서 10 개의 무작위 영역을 마우스 그룹에 대해 맹검이 된 조사자들에 의해 평가하였다. 비장 크기를 비장 중량(mg)/체중(g)의 비로 평가하였다.
혈액 분석 및 골수 사이토스핀: 혈액 샘플을 EDTA-코팅된 튜브에 수집하고 분석을 HemaVet 950FS(Drew Scientific, 코네티컷주 워터베리 소재)에서 수행하였다. 말초 혈액 도말 및 골수 세포 사이토스핀을 각각 5 및 15 분 동안
Figure pct00021
/Giemsa(Merck, 독일 다름슈타트 소재)로 염색하였다. 망상적혈구를 브릴리언트 크레실 블루로 염색하였다. 혈액 도말 시 망상적혈구를 계수한 조사자들은 샘플 그룹 할당에 대해 맹검이었다. 슬라이드에는 동물 번호만이 표시되었다(동물 당 5 개 슬라이드, 5 개의 무작위 1 cm2 절편).
통계적 분석 : 데이터는 평균 ± 평균의 표준 오차(SEM)로 제시된다. 다중 그룹의 비교를 위해, 다중 비교를 위한 본페로니 사후-테스트와 함께 일원 및 이원 분산 분석(ANOVA)을 이용하였다. 하나의 그룹화 변수에 대한 그룹 간의 차이는 독립표본 양측 스튜던트 t 검정에 의해 결정하였다. 비모수 분석을 위해 Kruskal-Wallis 검정을 사용하였다. 통계적 분석은 GraphPad Prism 버전 6.01(GraphPad Software Inc., 캘리포니아주 라호이아 소재)을 사용하여 수행하였다. *p≤0.05, ** p≤00.0001. 0.05 미만의 P 값은 유의한 것으로 간주되었다.
결과 .
정맥내로 주사된 HDAd5/35++ 벡터를 사용한 생체내 형질도입 연구를 위한 모델로서, 완전한 인간 CD46 유전자좌를 함유하고 따라서 인간과 유사한 패턴 및 수준에서 hCD46을 발현하는 유전자이식 마우스를 사용하였다(hCD46tg 마우스) (Kemper, 등, (2001) Clin Exp Immunol 124: 180-189).
긴 β-글로빈 LCR을 함유하는 HDAd5/35++ 벡터. 실시예 1에 기재된 연구에서, 1.6 kb β-글로빈 프로모터에 연결된 4.3 kb 미니 LCR(HS1 내지 HS4의 코어 요소 포함(Lisowski 등, Blood 110: 4175-4178, 2007))의 제어 하에 γ-글로빈을 발현하는 HDAd5/35++ 벡터(도 23, "HDAd-짧은-LCR")(Wang 등, J Clin Invest 129: 598-615, 2019)를 사용하였다(Wang 등, J Clin Invest 129: 598-615, 2019; Li, 등, () Mol Ther Methods Clin Dev 9: 142-152, 2018). 본 실시예에서, γ-글로빈 유전자 발현을 최대화하기 위해 하기 요소를 함유하는 HDAd5/35++ 벡터를 구축하였다: i) 전장 HS5 내지 HS1 영역을 포함하는 21.5 kb LCR, ii) 1.6 kb β-글로빈 프로모터, iii) γ-글로빈 mRNA를 안정화하기 위한 β-글로빈 3'UTR, 및 iv) 3' HS1 영역. 벡터는 HDAd-긴-LCR(도 23, "HDAd-긴-LCR")로 명명하였다. 통합을 매개하기 위해, LCR-벡터를 SB100x/Flpe 발현 HDAd 벡터(도 23, "HDAd-SB")와 조합하여 사용한다. 트랜스포존 벡터(HDAd-짧은-LCR 및 HDAd-긴-LCR)는 Flpe 재조합효소의 존재 하에 이식유전자 카세트의 원형화를 허용하는 SB100x 트랜스포사제 및 frt 부위에 의해 인식된 도립된/지시 반복(IR/DR) 모티프를 함유한다. HDAd-짧은-LCR 및 HDAd-긴-LCR은 둘 다 또한 보편적으로 활성인 EF1α 프로모터의 제어 하에 돌연변이체 O6-메틸구아닌-DNA 메틸트랜스퍼라제(mgmtP140K)에 대한 유전자를 보유하여 저용량 O6BG/BCNU 처리에 의해 안정하게 형질도입된 세포의 선택을 허용하였다(Hausl 등, B. Mol Ther 18(11):1896-906, 2010; Neff 등, J Clin Invest 112(10):1581-8, 2003).
생체외 HSPC 형질도입/이식 연구. 인간에서, CD46은 모든 유핵 세포에서 발현되지만, 마우스에서 상응하는 오솔로그는 고환에서만 존재한다. 정맥내로 주사된 HDAd5/35++ 벡터를 사용한 생체내 형질도입 연구를 위한 모델로서, 완전한 인간 CD46 유전자좌를 함유하고 따라서 인간과 유사한 패턴 및 수준에서 hCD46을 발현하는 유전자이식 마우스를 사용하였다(CD46tg 마우스)(Wang 등, Mol Ther Methods Clin Dev 8:52-64, 2018). 연역적으로, SB100x가 32.4 kb 트랜스포존의 통합을 매개할 수 있는지가 알려져 있지 않았기 때문에, HSPC 형질도입 효능이 제어될 수 있는 설정으로 생체외 HSPC 형질도입 연구를 수행하였다. HSPC에 대해 강화된 세포 분획인 CD46tg 마우스 골수 계통-음성(Lin-) 세포를 HDAd-긴-LCR + HDAd-SB로 생체외 형질도입하였다(도 24a). 그런 다음 생체외 형질도입된 세포를 치명적으로 조사된 C57Bl/6 마우스에 이식하였다. 4 주차에 생착률은 CD46-양성 PBMC를 기반으로 95% 초과였다. 이식 1 개월 후, 마우스를 4 차례의 O6BG/BCNU 처리에 적용하여 통합된 γ-글로빈/mgmt 이식유전자를 갖는 전구체를 선택적으로 확장하였다(도 24a). 생체내 선택의 각 차례마다, γ-글로빈-양성 말초 적혈구(RBC)의 백분율을 증가시켜, 연구 종료 시 95% 초과에 도달하였다(도 24b). 20 주차에, 동물을 희생시키고 골수 단핵 세포(MNC)를 분석하였다. qPCR에 의해 측정된 평균 VCN은 세포 당 2.8 개의 카피였다. γ-글로빈 발현은 유세포 분석에 의해 적혈구 Ter119+ 세포의 85.46(+/-5.9)% 및 비-적혈구(Ter119-) 골수 MNC의 14.54(+/-2.3)%에서 검출되었다(도 24c).
γ-글로빈 발현이 SB100x 통합된 이식유전자로부터 유래되었음을 입증하기 위해, 이식 후 20 주차에 수확된 골수 단핵 세포(MNC)로부터의 게놈 DNA에서 역PCR(iPCR) 분석을 수행하였다. iPCR 프로토콜은 게놈 DNA의 SacI로의 소화, 재결찰/원형화 단계, 중첩 PCR 및 벡터/염색체 접합부의 서열분석을 수반한다(도 24d). (도 24e)는 3 가지 대표적인 PCR 생성물 및 염색체 4, 15, 및 X 상에서 통합 부위의 국소화를 나타낸다. 생성물의 서열분석은 벡터 IR/DR-염색체 접합부에서 TA 디-뉴클레오티드를 포함하는 SB100x 매개 통합에 전형적인 벡터/염색체 접합부를 입증하였다(도 24f). 요약하면, 생체외 HSPC 형질도입 연구에서, 긴 글로빈 LCR은 SB100x 통합된 트랜스포존으로부터 기원하는 높은 수준의 γ-글로빈 발현을 부여하였다.
짧은 LCR vs 긴 LCR를 함유하는 HDAd5/35++ 벡터를 사용한 CD46b 유전자이식 마우스에서 생체내 HSPC 형질도입. HDAd-긴-LCR 및 미니LCR을 함유하는 실시예 1에서 이전에 사용된 벡터(Wang 등, J Clin Invest 129: 598-615, 2019; Li 등, Mol Ther Methods Clin Dev 9: 142-152, 2018)(본원에서 "HDAd-짧은-LCR"로 지칭됨)를 나란히(side-by-side) 비교하였다 (도 23). CD46-유전자이식 마우스를 G-CSF/AMD3100으로 동원하고 정맥내로 벡터를 주사하고, 5 주 후, 생체내 선택에 적용하였다(도 25a). γ-글로빈-양성 적혈구(RBC)의 백분율은 각 차례의 생체내 선택으로 증가하여 20 주차에 두 백터에 대해 95% 초과에 도달하였다(도 25b). 20 주 샘플로부터의 RBC 용해물에 대해 수행된 HPLC는 벡터 사이의 γ-글로빈/성체 마우스 α-글로빈의 백분율에서 유의한 차이를 나타내지 않았다(도 25c). 이는 또한 mRNA 수준에서 반영되었다(도 25d).
qPCR에 의해 20 주차에 측정된 골수 단핵 세포(MNC)에서 벡터 카피 수는 세포 당 2.5 개 카피였고(도 25e) 벡터 사이에 유의한 차이는 없었다. 이는 "긴" 32.4 kb 트랜스포존의 통합이 "짧은" 11.8 kb 트랜스포존의 통합만큼 효율적이었음을 나타낸다. 벡터를 사용한 생체내 HSPC 형질도입 후 32.4 kb 트랜스포존의 SB100x-매개 통합은 대부분의 적혈구 세포에서 γ-글로빈 발현에도 불구하고 혈액학적 이상(20 주)을 유발하지 않았다(도 26b). 세포 골수의 조성물(도 26c) 및 골수 Lin- 세포의 콜로니 형성-가능성(도 26d)은 그룹 사이에 유의하지 않았다.
장기간 재증식 HSPC에서 발생된 생체내 형질도입 및 SB100x-매개 통합을 입증하기 위한 2차 이식에서, 세포 골수의 조성물(도 26c) 및 골수 Lin- 세포의 콜로니 형성-가능성(도 26d)은 그룹 사이에 유의하지 않았다. 이식된 골수 Lin- 세포를 hCD46 이식유전자 없이 치명적으로 조사된 C57Bl/6 마우스로의 생체내 HSPC 형질도입 후 20 주차에 수확하였다). 2차 수용자에서 다중-계통 재구축을 구동하는 이식된 세포의 능력을 16 주 기간에 걸쳐 평가하였다. "1차" 생체내 HSPC 형질도입된 마우스에서와 같이, 골수의 세포 조성물 또는 말초 혈액에서 혈액학적 매개변수에 대한 높은 수준의 글로빈 발현 효과는 관찰되지 않았다.
또한 20 주차에 수확된 골수 Lin- 세포를 사용하여 게놈-와이드 통합 부위 분석을 수행하였다. 이 검정에서, 선형 증폭-매개 PCR(LAM-PCR) 전략은 통합 접합부의 서열분석이 이어진다(도 27). 마우스 게놈에 걸친 통합 부위의 분포는 도 28a에 제시되어 있다. 통합된 이식유전자 카세트를 정확하게 처리하였고, 식별된 IR/DR 염색체 접합부는 TA 디뉴클레오티드를 함유하였다(도 28b). 대부분의 통합은 유전자간 및 인트론 영역 내에 각각 83% 및 17% 빈도로 있었다(도 28c). 통합은 전체 마우스 게놈의 임의의 주어진 창에서 우선적인 통합 없이 무작위였다(도 28d). 원종양형성 유전자 내에서 또는 근처에서 통합은 발견되지 않았다. 이 SB100x-매개 통합 패턴은 이전 연구와 일치한다(Richter 등, Blood 128(18):2206-17, 2016; Neff 등, J Clin Invest 112(10):1581-8, 2003; Kemper 등, Clin Exp Immunol. 124(2):180-9, 2001; Zhang 등, PLoS One 8(10):e75344, 2013; Yant 등, Nat Biotechnol 20(10):999-1005, 2002).
2차 수용자의 분석. 생체내 형질도입이 장기간 재증식 HSPC에서 발생하였음을 입증하기 위해, 생체내 HSPC 형질도입 후 20 주차에 수확된 골수 Lin- 세포를 HDAd-짧은-LCR 및 HDAd-긴-LCR과 함께 치명적으로 조사된 C57Bl/6 마우스(hCD46 이식유전자 없이)에 이식하였다. 2차 수용자에서 다중-계통 재구축을 구동하는 이식된 세포의 능력을 16 주 기간에 걸쳐 평가하였다. PBMC에서 CD46 발현에 기반한 생착률은 95%였고 안정적으로 유지되었다(도 29a). 유세포 분석에 의해 측정된 RBC의 γ-글로빈 마킹은 90 내지 95% 범위에 있었고 안정되었다(도 29b). γ-글로빈+ RBC의 백분율에서 두 벡터 사이에 유의한 차이는 없었다. 평균 통합 벡터 카피 수는 또한 장기간 재증식 세포에서 두 트랜스포존의 통합이 동일하게 효율적이었음을 나타내는 2 개의 벡터 사이에 유의하게 상이하지 않았다(도 29c). 흥미롭게도, 마우스 성체 글로빈 쇄에 대한 γ-글로빈의 백분율은 HDAd-긴-LCR 벡터가 마우스 α-글로빈의 20-25%에 도달하는 경우 시간 경과에 따라 증가하였다(도 29d 및 29e). 대조적으로, HDAd-짧은-LCR 형질도입된 골수 세포의 2차 수용자에서 γ-글로빈/마우스 α-글로빈의 백분율은 증가하지 않았다. γ-글로빈 발현 적혈구 세포의 백분율은 HDAd-긴-LCR에 대해 상당히 더 높았다(도 29f). 더 높은 γ-글로빈 발현 수준을 부여하는 것 외에도, 긴 LCR은 또한 비-적혈구 분획(Ter119-)에 비해 적혈구(Ter119+) 분획에서 γ-글로빈 발현 골수 세포의 상당히 더 높은 백분율에 의해 제시된 바와 같이 더 엄격한 적혈구-특이적 발현을 제공하였다(도 27h). 골수 MNC에서 세포 당 벡터 수 카피는 생체내 HSPC 형질도입 후 16 주차에 수확된 경우 HDAd-짧은-LCR 및 HDAd-긴-LCR 사이에서 통계적으로 유의하지 않았다(도 27i). "1차" 생체내 HSPC 형질도입된 마우스에서와 같이, 골수의 세포 조성 또는 말초 혈액에서 혈액학적 매개변수에 대한 높은 수준의 글로빈 발현 효과는 관찰되지 않았다(도 30a - 30d).
인간 CD34+ 형질도입, 시험관내 선택, 및 적혈구 분화 후 2 개 백터의 비교.
마우스 적혈구 세포와 같은 이종 시스템에서 인간 β-글로빈 LCR의 분획은 LCR 내에 결합하는 전사 인자의 보존 결여로 인해 차선일 수 있다. 따라서 인간 세포에서 시험관내 연구를 수행하였다(도 31a). GCSF-동원된 건강한 공여자로부터 수득된 인간 CD34+ 세포를 4000 vp/세포의 총 MOI, 즉, 대부분의 CD34+ 세포의 형질도입을 부여하는 MOI에서 HDAd-긴-LCR + HDAd-SB 또는 HDAd-짧은-LCR + HDAd-SB로 형질도입하였다(Li 등, Mol Ther Methods Clin Dev 9: 390-401, 2018). 그런 다음 형질도입된 세포를 통합된 이식유전자를 갖는 세포에 대해 적혈구 분화(ED) 및 O6BG/BCNU 선택에 적용하였다. 18 일에 걸쳐 형질도입된 세포의 확장 동안, 대부분의 에피솜 벡터는 손실된다. ED 종료 시, 유세포 분석에 의한 HDAd-긴-LCR + HDAd-SB 설정에 대해 상당히 더 높은 백분율의 γ-글로빈+ 유핵 세포(즉, 핵을 상실한 망상적혈구)가 발견되었다(도 31b). HPLC 분석은 또한 HDAd-긴-LCR + HDAd-SB-형질도입된 세포에서 상당히 더 높은 γ-글로빈 쇄 수준을 입증하였다(도 31c).
중간형 지중해빈혈 γ-글로빈 수준의 마우스 모델에서 HDAd-짧은-LCR vs HDAd-긴-LCR 생체내 HSPC 형질도입 연구 . 이러한 연구를 위해(4 차례 초과) (CD46+/+) 마우스를 마우스 Hbb-베타1 및 -베타2 유전자 결실에 대해 이형접합성인 Hbbth3 마우스와 교배하였다(Yoshida 등, Sci Rep 7:43613, 2017). 생성된 Hbbth3/CD46+/+ 마우스는 중간형 지중해빈혈에 대한 전형적인 표현형을 갖는다(Wang 등, J Clin Invest, 129: 598-615. 2019). Hbbth3/CD46+/+ 마우스를 동원하고, 정맥내로 HDAd-긴-LCR 및 HDAd-짧은-LCR 벡터 시스템을 주사하고, 4 주 후에 생체내 선택에 적용하였다(도 32a 및 32e). 중요하게는, 말초 적혈구의 γ-글로빈 마킹은 생체내 선택의 두번째 주기 후 이미 평균 40%에 도달하였고, 세번째 주기 후에 10 마리 마우스 중 9 마리에서 90% 초과에 도달하였고, HDAd-긴-LCR로 생체내 형질도입 후 12 주 차에 모든 마우스에서 거의 100%를 유지하였다(도 32b 및 32f). 대조적으로, HDAd-짧은-LCR로 형질도입된 마우스의 경우, 7 마리 마우스 중 2 마리의 RBC에서 100% γ-글로빈 마킹에 도달하기 위해 4 회 생체내 선택 주기가 필요하였고 100% 마킹은 형질도입후 16 주차에만 달성되었다. 100% 마킹률에서, 성체 마우스 α-글로빈 쇄보다 인간 γ-글로빈의 백분율(HPLC에 의해 측정)은 두 벡터에 대해 시간 경과에 따라 증가하여(대부분 질환 배경으로 인해) HDAd-긴-LCR 및 HDAd-짧은-LCR로 생체내 형질도입 후 16 주차까지 각각 평균 22%(max: 35%) 및 11%(max: 19%)에 도달하였다(도 32g 및 32h; 21 주 데이터의 경우 도 32c 및 32d). CD46tg 마우스에서 관찰된 것과 유사하게, 골수 단핵 세포의 분석은 두 벡터에 대해 비슷한 VCN을 나타내었고 HDAd-긴-LCR에 대한 적혈구 세포에서 더 높은 글로빈 발현 수준을 나타내었다(도 33). 요약하면, 이들 데이터는 i) 100% 마킹에 도달하기 위해 덜 강력한 생체내 선택을 필요로 하고 ii) RBC에서 γ-글로빈 수준을 달성함으로써 HDAd-짧은-LCR보다 HDAd-긴-LCR의 우수성이 이론적으로 SCD 및 주요 지중해빈혈 환자에서 치유력이 있어야 함을 입증한다.
혈액학적 매개변수의 교정. 표현형 교정은 상이한 시점에서 제시된다. 처리 전 및 긴 LCR로 처리 후 10 주차에 C57BL6 및 Townes SCA 마우스의 정규화된 적혈구 형태를 비교하는 현미경 사진(도 34) 및 처리 전 Townes 마우스, 및 긴 LCR로 처리 후 10 주차에 Townes 마우스에 대해 정규화된 적혈구생성(망상적혈구 계수)을 나타내는 현미경 사진이 제시된다(도 35). 14 주차에, Giemsa 염색 및 May-Grunwald 염색으로 염색된 혈액 세포 형태가 제시된다(도 36a). 처리 후 16 주차에, 마우스를 희생시켰다. 처리된 Hbbth3/CD46+/+ 마우스의 말초 혈액 도말에서 지중해빈형 표현형의 역전을 나타내는, 저변색성의 고도로 단편화된 부동변형적혈구증가적 기준선 RBC를 거의 정색성의 잘 형성된 RBC로 대체하였다(도 37a, 왼쪽 패널, 21 주 데이터의 경우 도 36b 참조). 말초 혈액에서 망상적혈구의 수준은 정상 CD46tg 마우스와 비슷하였다(도 37a, 오른쪽 패널, 또한 도 39 참조). 21 주에 대해 유사한 데이터는 도 36b의 오른쪽 패널에서 찾을 수 있다. 대조군 및 처리된 Hbbth3/CD46+/+ 마우스로부터의 사이토스핀에서, 호염기성 적혈구모세포의 유병률에 의해 나타낸 Hbbth3/CD46+/+ 마우스의 골수에서 적혈구 계통 성숙의 차단과 대조적으로, 골수 사이토스핀에서, 성숙 다염성 및 정염성 적혈구모세포가 우세하였다(도 37b, 21 주 데이터의 경우 도 36c 참조). 긴 LCR, 짧은 LCR, 및 대조군 CD46tg 벡터로 형질도입된 마우스의 정규화된 적혈구 매개변수가 제시된다(도 38). 생체내 형질도입 후 16 주차에 혈액학적 매개변수는 두 벡터에 대한 전처리 매개변수와 비교하여 유의하게 개선되었다(도 38, 39a). 백혈구, 적혈구, MCHC, MCV, 및 RDW-CV의 경우 이들은 CD46tg 대조군과 구별할 수 없었다(도 39a). 그러나, HDAd-짧은-LCR보다 HDAd-긴-LCR 벡터로 처리된 동물에 유리한 상당한 차이가 있으며, 구체적으로, 말초 혈액에서 망상적혈구의 백분율은 미처리, HDAd-짧은-LCR, 및 HDAd-긴-LCR-처리 Hbbth3/CD46+/+ 마우스에 대해 각각 40.9 vs 26.8 vs 9.2%였다(도 38). 또한, 헤모글로빈 수준 및 적혈구용적률은 HDAd-긴-LCR-처리 그룹에서 더 높았다.
골수외 조혈 및 혈철소증의 교정 . 보상 혈구형성의 측정가능한 특성인 비장 크기는 두 벡터로 처리된 동물에서 정상으로 감소되었고, 이에 의해 HDAd-긴-LCR 및 HDAd-짧은-LCR 사이에 유의한 차이는 없었다(도 40a). Hbbth3/CD46+/+ 마우스와 대조적으로, 골수외 적혈구생성의 병소는 HDAd-긴-LCR로 처리 후 비장 및 간 절편에서 관찰되지 않았고 제한된 골수외 적혈구생성만이 HDAd-짧은-LCR-처리된 마우스에서 검출되었다(도 40b). 비장 및 간에서 강렬한 혈철소증은 미처리 Hbbth3/CD46+/+ 마우스에서 우세하였다(도 41, 두번째 패널. 조직의 Perl 염색 후 신호는 CD46tg(도 41, 첫번째 패널( 및 HDAd-긴-LCR 처리된 Hbbth3/CD46+/+ 마우스(도 41, 세번째 패널)에 대해 비교적 낮았던 반면, 비장 조직 cm2 당 2.7(+/-0.8)-배 더 많은 청색 스팟이 HDAd-긴-LCR-처리된 동물보다 HDAd-짧은-LCR에 대해 계수되었다(N=5).
요약하면, HDAd-긴-LCR-처리된 동물에서 망상적혈구, 혈액 매개변수, 세포외 조혈 및 혈철소증은 대조군 CD46tg 마우스와 상당히 상이하지 않았으며, 이는 완전한 표현형 교정을 나타낸다. 또한, HDAd-긴-LCR은 여러 표현형 매개변수에서 지중해빈혈 마우스를 치유하는 데 있어서 HDAd-짧은-LCR보다 우수한 것으로 입증되었으며, 긴-LCR에서 발현된 더 높은 γ-글로빈 수준에 기인할 가능성이 더 높다.
인간 CD34+ 형질도입 및 적혈구 분화 후 2 개 벡터의 비교. 마우스에서 데이터를 통합하기 위해, 인간 세포에서 시험관내 연구를 수행하였다(도 31a). GCSF-동원된 건강한 공여자에서 수득된 인간 CD34+ 세포를 4000 vp/세포의 총 MOI, 즉, 대부분의 CD34+ 세포의 형질도입을 부여하는 MOI에서 HDAd-긴-LCR + HDAd-SB 또는 HDAd-짧은-LCR + HDAd-SB로 형질도입하였다(Yang 등, Proc Natl Acad Sci USA. 92(25):11608-12, 1995). 그런 다음 형질도입된 세포를 통합된 이식유전자를 갖는 세포에 대해 적혈구 분화(ED) 및 O6BG/BCNU 선택에 적용하였다. 18 일에 걸쳐 형질도입된 세포의 확장 동안, 대부분의 에피솜 벡터가 손실된다.
골수를 Hbbth3/CD46tg 마우스의 생체내 HSC 형질도입 후 21 주차에 수확하였다. (도 42a) 골수 MNC에서 세포 당 벡터 카피 수. 두 그룹 사이의 차이는 유의하지 않았지만 더 큰 샘플 크기로 분석하는 경우 유의하게 될 수 있다. (도 42b, 42c) γ-글로빈 발현의 적혈구 특이성. (도 42b) γ-글로빈 발현 적혈구(Ter119+) 및 비-적혈구(Ter119-) 세포의 백분율. *p<0.05. 통계적 분석은 이원 ANOVA를 사용하여 수행하였다.
아데노바이러스 공여자 벡터의 투여 전 CD46tg 및 CD46+/+/Hbbth-3 마우스의 간 및 비장 절편에서 헤마톡실린/에오신 염색에 의한 골수외 혈구형성(도 43). 철분 침착은 Perl 염색에 의해 비장에서 헤모시데린의 세포질 청색 색소로 제시된다.
ED 종료 시, γ-글로빈+ 제핵 세포(즉, 핵이 손실된 망상적혈구)의 상당히 더 높은 백분율이 유세포 분석에 의해 발견되었고(도 31b) 또한 HDAd-짧은-LCR보다 HDAd-긴-LCR 설정에서 HPLC에 의해 상당히 더 높은 γ-글로빈 쇄 수준이 발견되었다(도 31c). 18 일차에 측정된 벡터 카피 수는 두 벡터에 대해 2개였다(도 31d).
요약하면, 마우스를 사용한 생체외 및 생체내 HSPC 형질도입 연구 뿐만 아니라 인간 HSPC를 사용한 시험관내 연구는 혈색소병증의 유전자 요법에 대한 HDAd-긴-LCR의 연관성을 뒷받침한다.
논의 . 이 실시예는 백혈구분리반출술, 골수절제술 및 HSPC 이식을 필요로 하지 않는 생체내 HSPC 유전자 요법 접근법의 임상 개발과 관려된 작업을 기재한다(Richter 등, Blood. 128(18):2206-17, 2016). 이는 특히 고령의 환자 및 동반이환 환자에서 혈색소병증의 생체외 HSPC 유전자 요법에 대한 광범위한 적용에 중요한 장애물이다. 이 접근법의 안전성 및 효능은 여러 뮤린 질환 모델(Wang 등, J Clin Invest. 129(2):598-615, 2019; Wang 등, Blood Adv. 3(19):2883-94, 2019; Li 등, Mol Ther Methods Clin Dev. 9:390-401, 2018) 및, 최근에 비-인간 영장류(Li 등, 23rd Annual ASGCT meeting. 2020; abstract #546)에서 입증되었다. 두 종에서, 정맥내 HDAd5/35++ 주사와 연관된 주요 문제, 즉 급성 선천적 면역 반응은 전염증성 사이토카인을 차단하는 예방적 레지멘에 의해 해결되었다.
생체외 HSPC 유전자 요법 설정에서 주요 지중해빈혈 및 SCD 환자에서 치유적 γ- 또는 β-글로빈 발현 수준에 도달하는 것은 여전히 과제이다. 이는 HSPC 형질도입 과정을 최적화하거나 또는 감염 다중도를 증가시킴으로써 통합된 이식유전자 카피의 수를 증가시키는 접근법을 필요로 한다. 그러나, VCN을 증가시키는 것은 유전독성을 유도하는 위험이 있다. 다른 시도는 글로빈 발현 카세트를 추가로 최적화하는 데 초점을 맞춘다(Li 등, Cancer Res. 80(3):549-60, 2020). 높은-페이로드 용량 HDAd 벡터를 사용하면, 렌티- 및 rAAV 벡터에 대해 설정된 게놈 크기 제한을 넘어설 기회가 있다. 본 연구는 γ-글로빈의 치유적 수준이 총 길이가 29 kb인 β-글로빈 LCR/프로모터 요소를 수용하는 통합 HDAd5/35++ 벡터를 사용한 생체내 HSPC 유전자 요법에 의해 RBC에서 달성될 수 있음을 입증한다.
지중해빈혈 마우스에서, RBC에서 100% γ-글로빈 마킹은 HDAd-짧은-LCR 처리된 동물과 비교하여 HDAd-긴-LCR로 처리된 마우스의 초기 및 더 적은 주기의 O6BG/BCNU 생체내 선택로 달성되었다. 이는 접근법의 임상 번역에 중요하다. O6BG/BCNU 생체내 선택 시스템은 γ-글로빈 양성 RBC 백분율의 제어 증가를 허용하지만, 또한 일시적 백혈구감소증 및 GI-관의 부작용을 유발한다(Wang 등, J Clin Invest. 129(2):598-615, 2019). HDAd-긴-LCR을 사용한 덜 강렬한 생체내 선택의 요건에 대한 잠재적 설명은 긴 LCR이 O6BG/BCNU에 대한 내성을 제공하는 mgmtP140K 유전자의 발현을 구동하는 EF1α 프로모터의 침묵을 방지한다는 것일 수 있다. 이 가설은 골수 MNC에서 mgmt mRNA 수준(VCN으로 정규화됨)이 HDAd-긴-LCR에 대해 상당히 더 높았다는 관찰에 의해 뒷받침된다(도 48).
이 연구는 HDAd-긴-LCR을 사용한 생체내 접근법의 치료 측면에 집중하였지만, 미래에 해결해야 할 다수의 기계적 문제가 남아 있다. 이러한 개방 질문 중 하나는 긴 LCR이 떨어져 있는 이웃 유전자의 전사활성화를 방지하는지 여부이다. 또한, mRNA 수준에서도 반영되는 HDAd-긴-LCR의 더 높은 γ-글로빈 발현 수준이 더 활성인 전사 개시 또는 통합 벡터 카피의 더 적은 침묵, 또는 둘 다에 기인하는지 여부는 완전히 명확하지 않다. HDAd-긴-LCR-처리된 Hbbth3/CD46 마우스에서, 2차 수용자에서 CD46tg 모델에서도 볼 수 있는 현상인 마우스 성체 글로빈 쇄에 대한 γ-글로빈의 백분율이 시간 경과에 따라 증가하였다는 관찰은 구체적으로 장기간 재증식 세포에서 침묵이 시간 경과에 따라 발생하였고 긴-LCR이 이에 대해 보호되었음을 나타낼 수 있다. 통합 벡터 카피 당 더 높은 mgmtP140K mRNA 수준(도 48)은 또한 긴-LCR이 침묵으로부터 보호한다는 가설을 뒷받침한다. 이러한 문제를 해결하기 위해, 추가 연구는 형질도입된 CD34+ 세포 클론에 초점을 맞추고 LAM-PCR/NGS(통합 부위), 염색체 형태 캡처 기술, 및 RNA-Seq를 사용한 게놈-와이드 분석을 포함할 것이다. 이러한 연구에 대한 전제조건은 SB100x 트랜스포사제-매개 이식유전자 통합 및 생체내 선택 과정이 원치않은 게놈 변경/재배열을 촉발하지 않는다는 것이다. 이를 평가하기 위한 시도에서, RNA-Seq를 시험관내에서 SB100x-매개 통합 및 O6BG/BCNU 선택 후 mgtm/GFP 이식유전자를 안정하게 발현하는 인간 CD34+ 세포 상에서 수행하였다(도 47a). 단지 176 개 유전자의 약간 변경된 발현은 우선적으로 히스톤 유전자를 발견하였다(도 47b). 이는 SB100x가 중요한 유전독성을 발휘하지 않음을 나타내며, 또한 통합 부위 분석에서 클론 우성의 부재 및 장기간 연구에서 혈액학적 부작용의 부재에 의해 뒷받침된다.
HDAd5/35++-기반 SB100x 시스템을 사용한 생체내 HSPC 형질도입/선택 후 16 내지 23 주차에 골수 MNC에서 분석된 통합된 이식유전자의 카피 수는 13.8(Wang 등, J Clin Invest. 129(2):598-615, 2019) 내지 32.4 kb 범위의 트랜스포존에 대해 세포 당 2 개 카피였다. 촉매적으로 프라이밍된 트랜스포존/트랜스포사제 복합체를 형성하기 위해, 트랜스포존의 2 개 단부는 트랜스포사제 분자에 의해 물리적으로 매우 가깝게 함께 유지되어야 한다(Uchida 등, Nat Commun. 10(1):4479, 2019). 이러한 제한은 frt 측면을 HDAd 벡터로 통합함으로써 해결되었고 공동 발현된 Flpe 재조합효소에 의해 인식되어 트랜스포존의 원형화로 이어진다(Turchiano 등, PLoS One. 9(11):e112712, 2014). 여기에 보고된 데이터는 이 과정이 HDAd5/35++ 벡터에 의해 운반되는 트랜스포존의 크기에 크게 의존하지 않고 통합을 이룰 수 있음을 시사한다.
이 연구는 확장된 TAD/LCR 코어 요소를 사용하는 것인 치료 이식유전자의 발현 수준을 증가시킴을 입증한다. β-글로빈 LCR은 수십 년 동안 연구되었지만, 다른 유전자/클러스터에 대한 TAD 코어 요소는 덜 특성화되었다. TAD의 중앙 크기는 880 kb이다. 고처리량 염색체 형태 캡처(3C) 검정 및 후속 4C, 5C 및 Hi-C 프로토콜 뿐만 아니라 섬유-Seq 검정의 추가 발전에 따라, 조절 게놈의 심문은 빠른 속도로 진행될 것이고, 유전자 요법 목적을 위해, 중요한 코어 요소만을 함유하는 TAD를 전달할 수 있다(Liu 등, BMC Genomics. 20(1):217, 2019).
요약하면, 현재 실시예는 마우스에서 HSPC의 생체내 형질도입을 위해 HDAd5/35++ 벡터의 맥락에서 더 큰 조절 요소를 이용하는 것이 주요 지중해빈혈 및 겸상 세포 빈혈에 대해 치유적인 것으로 생각된 유전자 발현 임계값을 충족하는 γ-글로빈 수준을 부여하는 벡터를 산출하였음을 나타낸다.
인간 β-글로빈 유전자 클러스터는 염색체 11에 있고
Figure pct00022
100 kb에 걸쳐 있다. β-글로빈 유전자좌는 활성 염색질 hub(ACH)라고 불리는, 시스-조절 요소 및 활성 β-글로빈 유전자로 구성된 적혈구-특이적 공간 구조를 형성하는 것으로 제안되었다(Tolhius 등, Mol Cell, 10:1453-1465, 2002). 코어 ACH는 발달적으로 보존되고 글로빈 LCR이라고 불리는 상류 5' DNAse 과민성 영역 1 내지 5, 및 하류 3'HS1 뿐만 아니라 적혈구-특이적 트랜스작용화 인자로 이루어진다(Kim 등, Mol Cell Biol., 27:4551-65, 2007). 유전자 요법 적용을 위해, HS1 내지 HS5를 함유하는 23 kb β-글로빈 LCR 및 3 kb 3'HS1 영역은 유전자이식 마우스에서 시스-연결된 유전자에에 대한 높은 수준의 적혈구-특이적 위치 독립적 발현을 부여하였음에 유의한다(Grosveld, Cell, 51:975-985, 1987). 이 LCR의 제어 하에 이식유전자를 전달하는 도구는 30+ kb HDAd 벡터와 함께 이용가능하다.
많은 유전적 질환의 교정은 치료 유전자의 높은 수준 및 조직-제한된 발현을 필요로 하며, 이는 LCR을 이용함으로써 달성될 수 있다(Li 등, Blood 100: 3077-3086, 2002). β-주요 지중해빈혈 및 겸상 세포 빈혈의 치유를 위해, HSPC에서 약 20% 유전자 마킹 및 적혈구 세포에서 20% 치료-글로빈 쇄(β- 또는 γ-글로빈) 생산이 필요한 것으로 생각된다(Fitzhugh 등, Blood 130: 1946-1948, 2017). 크기 제한으로 인해, β-글로빈 LCR의 절두된 형태만이 유전자 발현 수준을 교정하기 위한 요건을 충족하기 어렵게 만드는 렌티바이러스 벡터에서 사용될 수 있다(Uchida, 등, Nat Commun 10: 4479, 2019). 렌티바이러스-매개 HSPC 형질도입 후 발현 수준을 증가시키는 전략은 벡터 용량 및 따라서 통합된 이식유전자 카피 수를 증가시키는 것이다. 그러나 이 접근법은 유전독성 및 종양 형성의 위험을 향상시킨다. 다른 시도는 글로빈 발현 카세트를 추가로 최적화하는 것에 초점을 맞춘다(Uchida, 등, (2019) Nat Commun 10: 4479). 삽입 용량이 30 kb인 HDAd 벡터는 후자 개념을 개발하기 위한 이상적인 도구이다. 이 실시예에서, 29 kb γ-글로빈 발현 카세트를 보유하는 HDAd5/35++ 벡터를 생성하고 CD46-유전자이식 마우스에서 시험관내 및 생체내 HSPC 형질도입 후 테스트하였다.
HDAd 벡터 시스템에서, γ-글로빈 카세트의 통합은 SB100x 트랜스포사제에 의해 매개된다. SB/트랜스포존 시스템을 사용한 비-바이러스 유전자 전달은 CD19 CAR T-세포 요법(Kebriaei 등, J Clin Invest 126: 3363-3376, 2016), 연령 관련 황반 변성(Hudecek 등, Crit Rev Biochem Mol Biol 52: 355-380, 2017; Thumann 등, Mol Ther Nucleic Acids 6: 302-314, 2017), 및 알츠하이머병(Eyjolfsdottir 등, Alzheimers Res Ther 8: 30, 2016)에 대해 임상적으로 사용되고 있다. HD-Ad 매개된 SB 유전자 전달은 Kay 및 Ehrhardt 그룹에 의해 개척되었다. 이들의 연구에서, 트랜스포존은 4 kb-6 kb로 상대적으로 작았다(Hausl 등, Mol Ther 18: 1896-1906, 2010; Yant 등, Nat Biotechnol 20: 999-1005, 2002). 현재 실시예는 SB100x가 비슷한 VCN(세포 당 2-3 개 카피)에 기반하여 11.8 kb 트랜스포존과 비슷한 효능으로 32.4 kb 트랜스포존을 통합할 수 있음을 처음으로 입증한다. 그 자체로 이 발견은 SB-매개 통합의 효능이 SB 트랜스포존의 크기와 역으로 상관관계가 있다는 관찰과 모순된다(Karsi 등, Mar Biotechnol (NY) 3: 241-245, 2001). 시스템은 크기 제한으로부터 해제된 것으로 보인다. 먼저, 촉매적으로 프라이밍된 트랜스포존/트랜스포사제 복합체를 형성하기 위해, 트랜스포존의 2개의 단부는 트랜스포사제 분자에 의해 물리적으로 매우 가깝게 함께 유지되어야 한다(Hudecek 등, Crit Rev Biochem Mol Biol 52: 355-380, 2017). 이 제한은 frt 측면을 HDAd 벡터로 통합함으로써 해결되었고 공동 발현된 Flpe 재조합효소에 의해 인식되어 트랜스포존의 원형화로 이어진다(Yant 등, Nat Biotechnol 20: 999-1005, 2002). 큰 작제물의 전위를 제한하는 두번째 메커니즘은 자동-통합, 즉, 트랜스포존 내부의 TA 디뉴클레오티드로의 통합이라 불리는 자살 전위 메커니즘이다(Wang 등, PLoS Genet 10: e1004103, 2014). HDAd-짧은-LCR 및 HDAd-긴-LCR 사이의 VCN에서 보이지 않는 차이는 생체내 선택과 관련될 수 있으며, 특정 수준의 mgmtP140K 발현에 따라, 즉, 임계값 VCN에 도달된 세포의 경우 HSPC 및 전구체에 대해 풍부화된다.
강력한 O6BG/BCNU 생체내 선택 시스템으로 인해, 말초 혈액 적혈구의 거의 100%는 γ-글로빈을 함유하였다. 이 생체내 선택 접근법은 골수에서 세포 조성물에 영향을 미치지 않는 반면, 백혈구감소증을 초래한다. 따라서 세포독성 약물 BCNU를 수반하지 않는 대안적인 접근법에 대한 노력이 집중되고 있다. 특히, 뮤린 지중해빈혈 모델에서의 연구에 의해 뒷받침되는 바와 같이(Wang 등, J Clin Invest 129: 598-615, 2019), 유전자-교정된 HSPC가 교정되지 않은 세포보다 증식 이점이 있을 것이기 때문에 약제학적 생체내 선택은 혈색소병증 환자에서 필요하지 않을 수 있다(Perumbeti 등, Blood 114: 1174-1185, 2009).
1차 동물 및 2차 수용자에서 HDAd-짧은-LCR 및 HDAd-긴-LCR에 대한 비슷한 VCN을 고려하면, RBC 및 골수 적혈구 전구체에서 γ-글로빈 수준(HPLC 및 qRT-PCR에 의해 측정됨)은 긴 LCR을 함유하는 벡터에 대해 상당히 더 높았다. 흥미롭게도, 2 개 벡터 사이의 차이는 2차 수용자에서 더 명백하였다. 이는 형질도입된 장기간 재증식 HSPC로부터 유래된 RBC가 더 높은 γ-글로빈 수준을 갖는다는 것을 암시한다. 또한, HDAd-긴-LCR은 더 강한 적혈구 특이성을 나타내었다. 이러한 효과는 LCR의 염색질 개방 능력으로 인해(Li 등, Blood 100: 3077-3086, 2002) 전사 인자에 대한 더 나은 접근을 초래하는 HDAd-긴 LCR에서 추가적인 LCR 요소, 및/또는 γ-글로빈 유전자의 전사 증가를 초래하는 추가적인 전사 인자의 결합에 기여할 수 있다. LCR의 또 다른 특징은 주목할만하며, 즉, 자율적인 조절 단위로 작용할 수 있는 능력이며, 무작위 통합 후 이웃 유전자의 적은 전사활성화를 암시한다. 이 맥락에서 보다 완전한 LCR 버전을 사용하여 접근법에 대한 잠재적인 유전독성을 감소시킨다.
실시예 3. 내인성 태아 글로빈의 CRISPR-촉발된 재활성화 및 SB100x 트랜스포사제-매개 γ-글로빈 유전자 추가의 조합을 사용한 생체내 HSC 유전자 요법은 마우스 모델에서 겸상적혈구병을 치유한다.
태아 글로빈의 유전적 지속성을 갖는 환자 및, 보다 최근에, 유전자 요법 환자에서, 겸상적혈구병(SCD)의 표현형 교정 정도는 태아 γ-글로빈의 발현 수준과 상관관계가 있다. HDAd5/35++ 벡터를 사용한 생체내 조혈 줄기 세포/전구체(HSPC) 형질도입 후, SB100x 트랜스포사제-매개 γ-글로빈 유전자 추가는 성체 마우스 글로빈의 10-15% γ-글로빈을 달성하여, 중간형 지중해빈혈 마우스 모델에서 유의하지만 불완전한 표현형 교정을 초래하는 것으로 최근에 보고되었다. 또한 CRISPR/Cas9에 의해 γ-글로빈 프로모터 내에서 γ-글로빈 억제인자 결합 부위의 게놈 편집은 내인성 γ-글로빈의 효율적인 재활성화를 초래하는 것으로 제시되었다. 이 실시예는 이러한 2 가지 메커니즘을 조합하여 생체내 HSPC 형질도입 후 γ-글로빈의 치유적 수준을 수득한다.
두 모듈을 함유하는 HDAd5/35++ 아데노바이러스 벡터(HDAd-combo)를 생성하고 "건강한" CD46/β-YAC 마우스 및 SCD 마우스 모델(CD46/Townes)에서 시험관내 및 생체내 HSPC 형질도입 후 테스트하였으며, 여기서 뮤린 α- 및 β-글로빈 유전자를 인간 α-글로빈 및 인간 겸상 βS /태아 γ-글로빈 유전자로 대체하였다. 본 HDAd-combo는 표적 부위 절단 완료 후 Cas9 발현을 감소시키는 자기-활성화 메커니즘을 함유하였다. 이는 생체내에서 상당히 더 높은 절단 빈도를 초래하였으며, 더 나은 생존 CRISPR/Cas9-편집된 HSPC 때문일 가능성이 크다. 중요하게는, γ-글로빈 추가 또는 CRISPR/Cas9 재활성화 단위 단독을 함유하는 HDAd 벡터와 비교하여, HDAd-combo로 형질도입 후 상당히 더 높은 γ-글로빈이 RBC에서 발견되었다. combo 벡터로 CD46/Townes 마우스의 생체내 HSC 형질도입 후 13 주차에, 적혈구에서 γ-글로빈 수준의 수준은 성인 인간 α- 및 βS-쇄 수준의 30%였다. 이는 SCD의 완전한 표현형 교정을 초래하였다.
도입:
SCD 유전자 요법: 겸상적혈구병 및 β-지중해빈혈은 전 세계적으로 가장 흔한 단일유전자성 장애이며, 매년 317,000 명의 영향을 받은 신생아가 태어난다. SCD는 b-글로빈 유전자의 첫번째 엑손(βs 대립유전자) 상의 단일 돌연변이에 의해 유발되어, 결함이 있는 헤모글로빈 사량체의 형성을 초래하여, 낮은 산소 농도에서 중합되어, 적혈구 파괴로 이어진다. SCD는 실질적 이환율, 낮은 삶의 질, 및 기대 수명 단축과 연관된다. SCD의 임상 과정은 태아 γ-글로빈 유전자가 HPFH 특성이 있는 환자에서 볼 수 있는 바와 같이 고도로 발현될 때 개선된다(Conley 등, Blood 21: 261-281, 1963; Stamatoyannopoulos 등, Blood 46: 683-692, 1975). SCD에서, γ-글로빈은 Hb 사량체에 혼입을 위해 겸상 β-글로빈과 경쟁하고 겸상 헤모글로빈(HbS) 중합을 억제함으로써 강력한 겸상 방지 기능을 발휘한다. HbF 수준을 증가시키는 약리학적 치료는 모든 환자에서 동일하게 효과적이지 않다. β-혈색소병증에 대한 유전자 요법의 개발은 일치하는 공여자의 제한된 이용가능성 및 가장 어린 환자에게 HSPC 이식 적용의 좁은 창에 의해 정당화되었다. 현재 SCD 유전자 요법 접근법은 HSPC의 수집, 이들의 시험관내 배양, 온전한 β-글로빈, 겸상 방지 β-글로빈 또는, 태아 γ-글로빈 발현 카세트를 보유하는 렌티바이러스 벡터를 사용한 형질도입, 및 골수-조건화된 환자로 재이식을 수반한다. γ-글로빈 유전자 추가 렌티바이러스 벡터를 사용한 I 상 유전자 요법 시험이 유망하지만, 모든 SCD 증상의 장기간 치유는 아직 달성되지 않았다(Demirci 등, Hum Mol Genet., 2020. doi: 10.1093/hmg/ddaa088). 질환의 치유를 위해, RBC에서 γ-글로빈 수준은 성인 α-글로빈의 적어도 20%이어야 하고, 최적으로, βS 수준은 감소되어야 한다. 이는 전장 글로빈 LCR 또는 다중-양식 게놈 편집 카세트의 사용을 방지하는 삽입 크기 제한으로 인해, 렌티-바이러스 벡터로 달성하기 어렵다(Uchida 등, Nat Commun 10: 4479, 2019).
생체내 HSPC 유전자 요법 - γ-글로빈 유전자 추가: 생체외 HSPC 유전자 요법의 주요 위험은 이식 관련된 이환율이다(Anurathapan 등, Biol Blood Marrow Transplant 20: 2066-2071, 2014; Lucarelli 등, Blood Rev 16: 81-85, 2002; Storb 등, Hematology Am Soc Hematol Educ Program: 372-397, 2003). 또한, 렌티바이러스 벡터의 사용은 이식유전자 발현이 침묵되거나 또는 염색체 원종양형성 유전자가 활성화되는 위험이 있다. 중요하게는, 접근법은 복잡하고, 값이 비싸며, 따라서 SCD가 만연한 제한된 자원을 가진 나라에서 수행하기 어렵다. 간단한 생체내 HSPC 유전자 요법 접근법이 개발되었다. 이는 HSPC를 골수에서 말초 혈류로 동원하기 위한 GCSF/AMD3100의 피하 주사 및 통합 헬퍼-의존적 아데노바이러스 벡터 시스템인 HDAd5/35++ 벡터의 정맥내 주사를 수반한다. 이들 벡터는 30+kb의 삽입 용량을 가지며 원시 HSPC 상에서 발현되는 수용체인 CD46을 표적화한다(Richter 등, Blood 128: 2206-2217, 2016). 정맥내 HDAd5/35++ 주사와 연관된 선천적 독성은 마우스 및 비-인간 영장류에서 글루코코르티코이드, IL6- 및 IL1β-수용체 길항제 전처리에 의해 제어될 수 있다(Li 등, 23rd Annual ASGCT meeting. 2020; abstract #546) 무작위 이식유전자 통합은 활성-향상된 잠자는 미녀 트랜스포사제(SB100x)에 의해 매개된다(Boehme 등, Mol Ther Nucleic Acids 5: e337, 2016). 이 시스템에서, 이식유전자 카세트는 SB100x 트랜스포사제에 의해 인식되는 도립 반복부(IR), 및 Flp 재조합효소의 존재 하에 이식유전자 카세트의 원형화를 허용하는 frt 부위에 의해 플랭킹된다. 제2 벡터인 HDAd-SB는 Flp 재조합효소 및 SB100x를 트랜스로 공급하여 GFP 카세트의 게놈 DNA의 TA 디뉴클레오티드로의 통합을 매개한다(Mates 등, Nat Genet 41: 753-761, 2009). HDAd5/35++ 벡터를 사용한 이전 연구에서, 4.3 kb HS1-HS4 미니-LCR(β-글로빈 유전자좌 제어 영역)을 0.66 kb β-글로빈 프로모터와 조합하여 사용하여 생체내 HSPC 형질도입 후 인간 γ-글로빈 발현을 구동하였다(Wang 등, J Clin Invest 129: 598-615, 2019; Li 등, Mol Ther Methods Clin Dev 9: 142-152, 2018). Hbbth3/CD46+/+ 지중해빈혈 마우스에서, 안정된(8 개월 초과) γ-글로빈 마킹은 말초 혈액 적혈구의 거의 100% 및 거의 완전한 표현형 교정에서 달성되었다(Wang 등, J Clin Invest 129: 598-615, 2019). 그러나, γ-글로빈 발현 수준은 세포 당 2 개 카피의 평균 통합 벡터 카피 수(VCN)를 갖는 성체 마우스 α-글로빈 수준의 단지 10-15%였으며, 따라서 특히 과제인 SCD에 대한 접근법의 임상 번역을 제공한다.
생체내 HSPC 유전자 요법 - 내인성 γ-글로빈의 재활성화: 양성 유전적 상태인 태아 헤모글로빈(HPFH)의 유전적 지속성에서, 돌연변이는 γ에서 β로의 글로빈 전환을 약화시켜, 일생에 걸쳐 높은 태아 글로빈(HbF) 수준을 유발하여 이러한 장애의 임상적 징후를 완화시킨다(Forget, Ann N Y Acad Sci 850: 38-44, 1998). β-글로빈 유전자좌 내에서 큰 결실을 생성하거나(Sankaran, Hematology Am Soc Hematol Educ Program 2011: 459-465, 2011), 또는 HBG 프로모터에 돌연변이를 도입함으로써 HPFH 돌연변이를 다시 일으키려 시도하는 초기 연구는 적혈구 세포에서 HbF의 수준을 증가시킬 수 있다(Wienert 등, Nat Commun 6: 7085, 2015; Traxler 등, Nat Med 22: 987-990, 2016; Lin 등, Blood 130: 284, 2017). 태아 글로빈 억제인자로서 BCL11A의 발견으로, 이러한 시도는 HBG 프로모터 내에서 BCL11A 결합 부위의 표적화된 파괴(Masuda 등, Science 351: 285-289, 2016) 또는 CRISPR/Cas9 또는, 최근에, 염기 편집기(Zeng 등, Nat Med 26: 535-541, 2020)에 의해 BCL11A 발현을 감소시키는 적혈구 bcl11a 인핸서의 파괴(Wu 등, Nat Med 25: 776-783, 2019)를 수반하는 데 더욱 집중하게 되었다. HBG1/HBG2 프로모터 표적화된 CRISPR/Cas9를 이용하여 인간 β-글로빈 유전자좌-유전자이식(β-YAC) 마우스에서 γ-글로빈을 재활성화하였다(Li 등, Blood 131: 2915-2928, 2018). 생체내 HSPC 형질도입 후, HSPC의 2차 이식 후 유지된 성체 마우스의 적혈구에서 인간 β-에서 γ-글로빈 발현으로의 명백한 전환을 초래하는 효율적인 표적 부위 파괴를 입증하였다. 장기간 추적 연구에서, 혈액학적 이상은 검출되지 않았으며, 이는 HBG 프로모터 편집이 조혈에 부정적으로 영향을 미치지 않았음을 나타낸다.
HDAd5/35++ 벡터로부터 CRISPR/Cas9의 발현은 줄기 세포 기능 및 형질도입된 HSPC, 구체적으로 인간 HSPC의 생존을 손상시킬 수 있는 있음이 이전에 보고되었다(Li 등, Mol Ther Methods Clin Dev 9: 390-401, 2018). 따라서, CRISPR/Cas9 발현을 단축하기 위한 접근법이 개발되었다(Li 등, Mol Ther Methods Clin Dev 9: 390-401, 2018; Li 등, Mol Ther 27: 2195-2212, 2019).
여기서, 목표는 β-YAC 마우스 뿐만 아니라 Tim Townes에 의해 개발된 겸상적혈구병의 마우스 모델(hα/hα::βSS)에서 SB100x-매개 γ-글로빈 유전자 추가 및 γ-글로빈의 재활성화를 조합함으로써 생체내 HSPC 형질도입 후 γ-글로빈의 치유적 수준을 달성하는 것이었다(Wu 등, Blood 108: 1183-1188, 2006). 이 모델에서, 뮤린 α-글로빈 유전자를 인간 α-글로빈으로 대체하였고 뮤린 성체 β-글로빈 유전자를 함께 연결된 인간 겸상 βS 태아 γ-글로빈 유전자로 대체하였다. 이 모델은 겸상적혈구병의 주요 표현형 특징을 나타낸다.
재료 및 방법
시약: G-CSF(Neupogen™)(Amgen 캘리포니아주 사우전드 오크스 소재) 및 AMD3100(Sigma-Aldrich, 미주리주 세인트루이스 소재)을 사용하였다. O6-BG 및 BCNU는 Sigma-Aldrich(미주리주 세인트루이스 소재)로부터 수득하였다.
HDAd 벡터: HDAd-CRISPR("cut"), HDAd-SB-추가("add") 및 HDAd-SB는 이전에 기재되었다(Li 등, Blood 131(26):2915-2928, 2018; Wang 등, J Clin Invest 129: 598-615, 2019). pHCA-combo의 클로닝은 3 단계를 수반하였다. 단계 1) HBG1/2 프로모터 영역에서 BCL11A 결합 부위를 표적화하는 sgHBG#2(서열번호: 258)를 합성하고, 어닐링하고 pSPgRNA(Addgene, 매사추세츠주 케임브리지 소재)의 BbsI 부위에 삽입하여, pSP-sgHBG#2를 생성하였다. pSP-sgHBG#2에서 0.4 kb U6-sgHBG#2 단편을 증폭시키고 pBST-sgAAVS1-miR의 BamHI 부위로 클로닝하여(Li 등, Mol Ther 27: 2195-2212, 2019), pBST-sgHBG#2-miR을 수득하였다. 단계 2) 1.5 kb PGK-mgmt-bGHpolyA 단편을 gBlock(IDT, 뉴저지주 뉴어크 소재)으로 합성하고 ClaI-소화된 pBS-LCR-글로빈-mgmt와 결찰시켜(Li 등, Mol Ther 27: 2195-2212, 2019), pBS-LCR-글로빈-PGK-mgmt를 수득하였다. 다음으로, pBS-Frt-IR 영역을 함유하는 4.8 kb 서열을 pBS-FRT-IR-Ef1α-mgmt로부터 증폭시키고(Li 등, Cancer Res 80: 549-560, 2020) EcoRV-KpnI 소화된 pBS-LCR-글로빈-PGK-mgmt와 결찰시켜, pBS-Frt-IR-LCR-글로빈-PGK-mgmt를 야기하였다. 이 단계에서 나중 주입 클로닝을 위한 15 bp 상동성 아암 (HA)을 함유하는 프라이머(Takara, 캘리포니아주 마운틴뷰 소재)를 사용하였다. 2 개의 Frt-IR 구성요소에 플랭킹하는 2 개의 15 bp HA는 PacI 소화 시 노출되어 하기 기재된 변형된 pHCA 작제물을 사용한 재조합을 용이하게 할 수 있다. 단계 3) pHCAS1S-MCS의 5.3 kb XbaI 단편(Li 등, Mol Ther 27: 2195-2212, 2019)을 XbaI 제한에 의해 검출하고 재결찰시켜, pHCAS1S1-MCS를 생성하였다. U6 프로모터에서 시작하여 SV40 polyA 신호 서열까지 7.6 kb CRISPR 카세트를 pBST-sgHBG#2-miR로부터 증폭시키고 pHCAS1S1-MCS의 NheI 부위에 클로닝하여, pHCAS1S1-MCS-sgHBG#2를 형성하였다. 마지막으로, pBS-Frt-IR-LCR-글로빈-PGK-mgmt에서 12.0 kb HA-플랭킹된 글로빈/mgmt 카세트를 PacI 처리에 의해 방출시키고 PacI-소화된 pHCAS1S1-MCS-sgHBG#2와 재조합하여, pHCA-combo를 초래하였다. 최종 작제물을 여러 제한 효소(HindIII, EcoRIPmeI)에 의해 스크리닝하고 이식유전자를 함유하는 전체 영역을 서열분석함으로써 확인하였다.
HDAd5/35++ 벡터의 생산을 위해, 상응하는 플라스미드를 PmeI로 선형화하고 Ad5 섬유 꼬리, Ad35 섬유 샤프트, 및 친화도-향상된 Ad35++ 섬유 놉으로 구성된 키메라 섬유를 함유하는 Ad5/35++ 헬퍼 벡터인 AdNG163-5/35++(Richter 등, Blood 128: 2206-2217, 2016)를 사용하여 116 세포를 구제하였다(Palmer & Ng, Mol Ther 8: 846-852, 2003). HD-Ad5/35++ 벡터를 다른 곳에 상세하게 기재된 바와 같이 116 세포에서 증폭시켰다(Palmer & Ng, Mol Ther 8: 846-852, 2003). 헬퍼 바이러스 오염 수준은 0.05% 미만인 것으로 밝혀졌다. 역가는 2-5x1012 vp/ml였다.
본 실시예의 벡터는 도 101에 예시되어 있고, (i) 트랜스포존에 존재하는 γ-글로빈 이식유전자를 암호화하는 핵산("add") 및 (ii) 트랜스포존에 존재하지 않는, 내인성 γ-글로빈의 발현을 증가시키기 위해 HBG1/2을 표적화하는 CRISPR/Cas9 시스템을 암호화하는 핵산("CRISPR")을 둘 다 포함하는 HDAd 조합 아데노바이러스 벡터를 포함한다(둘은 함께 "조합"을 형성한다). 이중 벡터와 관련한 추가 개시내용에 대해, 또한 도 96, 102, 97a-97d, 98a-98n, 99a-99u를 참조한다).
구체적으로, 도 96은 CRISPR 시스템이 2 개의 상이한 부위(HBG 프로모터 및 적혈구 bcl11a 인핸서)를 표적화하여, 증가된 감마 재활성화로 이어지는 HDAd-TI-combo 벡터의 개략도를 나타낸다. 도 102는 HDAd-combo에서 Flpe 재조합효소와 frt 부위의 상호작용이 어떻게 트랜스포존의 원형화로 이어져, CRISPR 카세트를 함유하는 벡터의 선형 단편을 남기는지를 나타낸다. SB100x/Flpe 시스템을 사용한 이전 연구는 원형화된 트랜스포존이 SB100x에 의해 숙주 게놈 내로 통합되는 동안 이러한 벡터 부분이 빠르게 손실된다는 것을 입증하였다(Yant 등, Nat Biotechnol., 20: 999-1005, 2002). 도 97a는 HDAd-SB 및 HDAd-combo의 공동 감염시, Flpe이 어떻게 발현되고 IR-플랭킹된 트랜스포존을 방출한 다음, SB100x 트랜스포사제에 의해 게놈 내로 통합될 것인지를 나타낸다. 동시에, HBG1 및 bcl11a-E CRISPR은 발현되고 DNA indel을 생성하여 γ-글로빈의 재활성화로 이어질 것이다. 트랜스포존의 Flp-매개 방출 시, CRISPR 카세트는 분해되어, 세포독성을 피할 것이다. CRISPR 시스템은 2 개의 상이한 부위(HBG 프로모터 및 적혈구 bcl11a 인핸서)를 표적화하여, γ 재활성화 증가로 이어진다. 표적화 전략(도 97b), 적혈구 특이적 BCL11A 인핸서(도 97c), 및 HBG 프로모터서의 BCL11A 결합 부위(도 97d)가 또한 제시된다.
이중 CRISPR 벡터 및 γ-글로빈 재활성화는 도 98a-98n에 제시된다. HDAd-Bcl11ae-CRISPR, HDad-HBG-CRISPR, HDAd-Dual-CRISPR, HDAd-스크램블(도 98a) 및 이중 gRNA 벡터에 대한 HD-Ad5/35++ CRISPR 벡터(도 98b)에 대한 벡터 설계가 제시된다. 인간 적혈구 전구체 세포주(HUDEP-2)의 HD-Ad5/35++ CRISPR 형질도입은 도 98c에서 분화 전 및 후로 제시된다. HD-AD5/35++ "Dual" gRNA 벡터는 미처리(UNTR), BCL11A, 또는 HBG 벡터와 비교하여 세포 생존력(도 98d) 또는 증식(도 98e)에 부정적으로 영향을 미치지 않는다. 이중 벡터는 표적 유전자좌(도 98f) Bcl11a 인핸서 및 (도 98g) HBG 프로모터에 대한 단일 gRNA 벡터로 관찰된 것들과 유사한 유사한 편집 수준을 달성한다. 또한, HD-AD5/35++ "Dual" gRNA 벡터는 단일 gRNA 벡터로 관찰된 것들과 유사한 표적 유전자좌의 편집 수준을 달성한다(도 98h). HbF+ 세포의 상당히 더 높은 백분율은 단일 gRNA 벡터와 비교하여 HD-Ad5/35 "Dual" gRNA 벡터로 형질도입된 HUDEP-2 세포에서 유세포 분석에 의해 관찰되었다(도 98i). HPLC에 의해 측정된 전반적인 감마 글로빈 발현은 이중 표적화된 샘플에서 상당히 더 높았다(도 98j). 단일 녹아웃 클론보다 이중 녹아웃 클론에서 상당히 더 큰 태아 글로빈 발현이 관찰되었으며 2 개 돌연변이의 가능한 상승적 효과를 암시하며, 더 높은 감마 발현/세포로 이어진다(도 98k). 도 98l은 말초 혈액 동원된 CD34+ 세포가 HDAd5/35++ CRISPR 벡터로 형질도입되었음을 나타낸다. CRISPR/Cas9 세포독성을 최소화하기 위해, 이어서 세포를 항-Cas9 펩티드를 발현하는 HDAd5/35++ 벡터로 후속적으로 형질도입하였다. 세포를 준-치명적으로 조사된 NSG 마우스 내에 이식하고 분석하였다. 이식 후 10 주차에, HD-Ad5/35 "Dual" gRNA 벡터로 형질도입된 세포는 단일 gRNA 벡터로 형질도입된 세포와 유사한 생착을 나타내었다. 계통 조성은 모든 그룹에서 유사하였다(도 98m). 이중 gRNA 벡터에 의해 형질도입되고 편집된 CD34+ 세포는 NSG 마우스에 효율적으로 주입되었다(도 98n). 또한, 적혈구 분화 후 주입된 이중 표적화된 세포는 상대적으로 더 낮은 편집 수준에도 불구하고, 단일 표적화된 세포와 비교하여, 대조군에 대해 더 높은 수준의 감마 글로빈을 발현하였다(도 9n).
이중 편집된 정상 및 thal CD34+ 세포의 생체외 형질도입에 대한 실험 설계는 도 99a에 제시된다. 정상 CD34+ 세포에 대해 15 일째에 콜로니에서 HBF 발현(도 99b), MFI(도 99c), 및 HBF 발현을 설명하는 유세포 분석 데이터(도 99d)가 제시된다. 정상 CD34+ 세포에 대해 적혈구 분화(ED) 후 HBF 발현(도 99e) 및 MFI(도 99f)가 제시된다. HBG 부위에 대한 TE71(도 99g) 및 BCL11A 부위에 대한 TE71(도 99h)은 정상 CD34+ 세포에서 형질도입(txd) 후 48 시간에 제시된다. EC에서 HBF 발현 및 적혈구 분화를 설명하는 유세포 분석 데이터는 도 99i에서 찾을 수 있다. 도 99j-99u는 Thal CD34+ 세포에서의 결과를 제시한다. 0 일차에 세포의 면역표현형, 형질도입되지 않은 세포 및 CRISPR-Dual로 형질도입된 세포(도 99j) 및 11 일에 걸쳐 형질도입되지 않은 세포 및 CRISPR-Dual로 형질도입된 세포를 비교하는 성장 곡선(도 99k). HBF 발현(도 99l) 및 MFI(도 99m)는 15 일째에 콜로니에서 제시된다. EC에서의 HBF 발현(도 99p), MFI(도 99q), 및 HBF 발현 및 P04 및 P18을 설명하는 유세포 분석 데이터(도 99r)가 또한 제시된다. p04(도 99s) 및 p18(도 99t)에서 HBG 부위 적혈구 분화에 대한 TE71이 제시되는 반면 도 99u는 형질도입 48 시간 후 BCL11A 부위에 대한 TE71을 제시한다.
HUDEP-2 세포/적혈구 분화: HUDEP-2 세포(Kurita 등, PLoS One 8: e59890, 2013)를 100 ng/ml SCF, 3 IU/ml EPO, 10-6 M 덱사메타손 및 1 μg/ml 독시사이클린(DOX)이 보충된 StemSpan SFEM 배지(STEMCELL Technologies)에서 배양하였다. 적혈구 분화를 5% 인간 AB 혈청, 100 ng/ml SCF, 3 IU/ml EPO, 10 μg/ml 인슐린, 330 μg/ml 트랜스페린, 2 U/ml 헤파린 및 1 μg/ml DOX를 함유하는 IMDM 배지에서 6 일 동안 유도하였다.
콜로니-형성 단위(CFU) 검정: 계통 마이너스(Lin-) 세포를 제조업체의 지침에 따라 마우스 계통 세포 고갈 키트(Miltenyi Biotec, 캘리포니아주 샌디에이고 소재)를 사용하여 골수 MNC에서 계통-수임 세포의 고갈에 의해 단리하였다. CFU 검정을 제조업체의 프로토콜에 따라 마우스 완전 배지와 함께 ColonyGEL(Reachbio, 워싱턴주 시애틀 소재)을 사용하여 수행하였다. 콜로니를 플레이팅 10 일 후 점수매겼다.
T7EI 불일치 뉴클레아제 검정: 게놈 DNA를 제공된 프로토콜에 따라 PureLink Genomic DNA 미니 키트(Life Technologies, 캘리포니아주 칼즈배드 소재)를 사용하여 단리하였다(Miller 등, Nat Biotechnol 25: 778-785, 2007). HBG1/2 프로모터의 표적화된 부위를 포함하는 게놈 분절을 다음 PCR 프라이머에 의해 증폭시켰다: HBG1/2 정방향(서열번호: 270), 역방향(서열번호: 271). PCR 생성물을 혼성화하고 37℃에서 20 분 동안 2.5 단위의 T7EI(NEB)로 처리하였다. 소화된 PCR 생성물을 10% TBE PAGE(Bio-Rad)로 분해하고 에티듐 브로마이드로 염색하였다. 100 bp DNA 래더(New England Biolabs)를 사용하였다. 밴드 강도를 ImageJ 소프트웨어를 사용하여 분석하였다. 절단율 % = (1-sqrt(모체 밴드/(모체 밴드 + 절단된 밴드)) x 100%.
유세포 분석: 세포를 1 % FCS가 보충된 PBS에 1x106 개 세포/100 μL로 재현탁하고 얼음 위에서 10 분 동안 FcR 차단 시약(Miltenyi Biotech, 캘리포니아주 오번 소재)과 함께 배양하였다. 다음으로 염색 항체 용액을 106 개 세포 당 100 μL로 첨가하고 암실에서 30 분 동안 얼음 위에서 배양하였다. 배양 후, 세포를 FACS 완충액(PBS, 1% FBS)에서 1 회 세척하였다. 2차 염색을 위해 염색 단계를 2차 염색 용액으로 반복하였다. 세척 후, 세포를 FACS 완충액에 재현탁하고 LSRII 유세포 분석기(BD Biosciences, 캘리포니아주 산호세 소재)를 사용하여 분석하였다. 파편을 전방 산란 영역 및 측방 산란 영역 게이트를 사용하여 제외하였다. 그런 다음 단일 세포를 전방 산란 높이 및 전방 산란 폭 게이트를 사용하여 게이팅하였다. 그런 다음 유세포 분석 데이터를 FlowJo(버전 10.0.8, FlowJo, LLC)를 사용하여 분석하였다. LSK 세포의 흐름 분석을 위해, 세포를 비오틴-접합된 계통 검출 칵테일(Miltenyi Biotec, 캘리포니아주 샌디에이고 소재)(cat #: 130-092-613) 및 c-Kit(cat #:12-1171-83) 및 Sca-1(cat #: 25-5981-82)에 대한 항체 뿐만 아니라 APC-접합된 스트렙타비딘으로 염색하였다. eBioscience(캘리포니아주 샌디에이고 소재)의 다른 항체는 항-마우스 LY-6A/E(Sca-1)-PE-Cyanine7(클론 D7), 항-마우스 CD117(c-Kit)-PE(클론 2B8), 항-마우스 CD3-APC(클론 17A2)(cat #:17-0032-82), 항-마우스 CD19-PE-Cyanine7(클론 eBio1D3)(cat #: 25-0193-82), 및 항-마우스 Ly-66(Gr-1)-PE(클론 RB6-8C5)(cat #: 12-5931-82을 포함하였다. 항-마우스 Ter-119-APC(클론: Ter-119)(cat #: 116211)는 Biolegend(캘리포니아주 샌디에이고 소재)로부터 수득하였다.
인간 γ-글로빈 발현을 검출하는 세포내 유세포 분석: FIX & PERMTM 세포 투과화 키트(Thermo Fisher Scientific)를 사용하고 제조업체의 프로토콜에 따랐다. 간단히 말해서, 1x106 개의 세포를 100 μl FACS 완충액(1% FCS가 보충된 PBS)에 재현탁하고, 100 μl의 시약 A(고정 배지)를 첨가하고 실온에서 2-3 분 동안 배양한 다음, 1 ml 미리 냉각된 절대 메탄올을 첨가하고, 혼합하고 10 분 동안 암실에서 얼음 위에서 배양하였다. 그런 다음 샘플을 FACS 완충액으로 세척하고 100 μl 시약 B(투과 배지) 및 1 μg 헤모글로빈 γ 항체(Santa Cruz Biotechnology, cat# sc-21756 PE)에 재현탁하고, 실온에서 30 분 동안 배양하였다. 세척 후, 세포를 FACS 완충액에 재현탁하고 분석하였다.
글로빈 HPLC: 개별 글로빈 쇄 수준을 SPD-10AV 다이오드 어레이 검출기 및 LC-10AT 바이너리 펌프가 장착된 Shimadzu Prominence 기기에서 정량화하였다(Shimadzu, 일본 쿄토 소재). 폴리펩티드에 대한 Vydac 214TP™ C4 역상 칼럼(214TP54 Column, C4, 300 Å, 5 μm, 4.6 mm i.d. x 250 mm)(Hichrom, 영국 소재)을 사용하였다. 물/아세토니트릴 중 0.1% 트리플루오로아세트산의 40%-60% 구배 혼합물을 1 mL/분의 속도로 적용하였다. 
벡터 카피 수의 측정: 세포 당 아데노바이러스 게놈 카피의 절대 정량화를 위해, 게놈 DNA를 제공된 프로토콜에 따라 PureLink Genomic DNA 미니 키트(Life Technologies)를 사용하여 세포로부터 단리하고, power SYBRTM green PCR 마스터 믹스(Thermo Fisher Scientific)를 사용하여 수행된 qPCR에 대한 주형으로 사용하였다. 다음 프라이머 쌍을 사용하였다: 인간 γ-글로빈 정방향(서열번호: 195), 및 역방향(서열번호: 196); mgmt 정방향(서열번호: 220), 및 역방향(서열번호: 221).
실시간 역전사 PCR: 총 RNA를 5x10^6 개의 분화된 HUDEP-2 세포 또는 100 μl 혈액으로부터 제조업체의 페놀-클로로포름 추출 방법에 따라 TRIzolTM 시약(Thermo Fisher Scientific)을 사용하여 추출하였다. Quantitect 역전사 키트(Qiagen) 및 power SYBRTM green PCR 마스터 믹스(Thermo Fisher Scientific)를 사용하였다. 실시간 정량적 PCR을 StepOnePlus 실시간 PCR 시스템(AB Applied Biosystems)에서 수행하였다. 다음 프라이머 쌍을 사용하였다: 마우스 RPL10(하우스키핑) 정방향(서열번호: 189), 및 역방향(서열번호: 190); 인간 γ-글로빈 정방향(서열번호: 191), 및 역방향(서열번호: 192); 인간 β-글로빈 정방향(서열번호: 216), 및 역방향(서열번호: 217); 마우스 β-주요 글로빈 정방향(서열번호: 193), 및 역방향(서열번호: 194), 마우스 α 글로빈 정방향(서열번호: 212), 및 역방향(서열번호: 213).
Cas9 웨스턴 블롯: 3x106 개의 HUDEP-2 세포를 형질도입 후 다양한 시점에서 수확하고, PBS로 2 회 세척하고, 5% β-머캅토에탄올이 함유된 Laemmli 완충액으로 용해시켰다. 샘플을 95℃에서 5 분 동안 끓이고 13,000 g에서 10 분 동안 원심분리에 의해 정화시켰다. 10 μL의 용해물을 4-15% 프리캐스트 단백질 겔(Bio-Rad)을 사용하여 SDS-PAGE에 의해 분리하였다. 블롯의 Cas9 단백질을 항-Cas9-HRP(클론 7A9-3A3)에 의해 프로빙하였다(Cell Signaling Technology, 매사추세츠주 댄버스 소재). Pierce™ ECL Plus 웨스턴 블롯팅 기질(Thermo Fisher Scientific)로 처리 후 X-선 필름 상에서 화학발광 검출을 수행하였다. Cas9 검출 후, 블롯을 스트립하고 내부 대조군을 위해 Sigma-Aldrich의 항-β-액틴 항체(클론 AC-74)에 의해 다시 프로빙하였다.
동물: 동물을 수반하는 모든 실험은 워싱턴 대학에 의해 제시된 기관 지침에 따라 수행하였다. 워싱턴 대학은 실험실 동물 관리 국제 평가 및 인증 협회(AALAC) 공인 연구 기관이며 이 대학에서 수행된 모든 살아있는 동물 작업은 실험실 동물 복지국(OLAW) 공중 보건 보증(PHS) 정책, USDA 동물 복지법 및 규정, 실험 동물 관리 및 사용에 대한 지침 및 기관 동물 관리 및 사용 위원회(IACUC) 정책을 따른다. 연구는 워싱턴 대학 IACUC(프로토콜 번호 3108-01)에 의해 승인되었다. 인간 CD46 게놈 유전자좌를 함유하고 인간과 유사한 수준 및 패턴에서 CD46 발현을 제공하는 C57Bl/6 기반 유전자이식 마우스(hCD46+/+ 마우스)는 초기에 기재되었다(Kemper 등, Clin Exp Immunol 124: 180-189, 2001). 야생형 248 kb β-글로빈 유전자좌 효모 인공 염색체(β-YAC)를 보유하는 유전자이식 마우스를 사용하였다(Peterson 등, Ann N Y Acad Sci 850: 28-37, 1998). β-YAC 마우스를 인간 CD46+/+ 마우스와 교배시켜 생체내 HSPC 형질도입 연구를 위한 β-YAC+/-/CD46+/+ 마우스를 수득하였다. 다음 프라이머를 마우스의 유전형 분석에 사용하였다: CD46 정방향(서열번호: 233), 및 역방향(서열번호: 234); β-YAC(γ-글로빈 프로모터) 정방향(서열번호: 242), 및 역방향(서열번호: 243).
겸상적혈구병 마우스 모델: Townes 수컷 마우스(Hbb tm2(HBG1,HBB*)Tow 또는 hα/hα::βSS)를 Jackson Laboratory(JAX 스톡 #013071)로부터 수득하고 인간 CD46 유전자이식 암컷 마우스와 교배시켰다. 도 109a에 제시된 바와 같이, 3 차례의 교배 후, CD46, HbS 및 HBA에 대해 동형접합성인 마우스를 수득하고 실험에 사용하였다. 다음 프라이머를 유전형 분석에 사용하였다: HBB 프라이머(서열번호: 246, 251, 및 70), 및 HBA 프라이머(서열번호: 272-274); 및 상기 제시된 바와 같은 CD46 프라이머(서열번호: 233 및 234). PCR 결과는 공급처에 의해 제공된 프로토콜에 따라 해석하였다.
HSPC 동원 및 생체내 형질도입: HSPC를 인간 재조합 G-CSF의 s.c. 주사(5 μg/마우스/일, 4 일) 이어서 5 일째에 AMD3100의 s.c. 주사(5 mg/kg)에 의해 마우스에 동원하였다. 또한, 동물은 바이러스 주사 16 시간 및 2 시간 전에 덱사메타손(10 mg/kg)을 i.p.로 받았다. AMD3100 후 30 및 60 분에, 동물에게 주사 당 4x1010 개 바이러스 입자(vp)의 용량으로 안와하정맥총을 통해 바이러스 벡터를 정맥내로 주사하였다.
생체내 선택: 선택은 형질도입 후 1 주차(Townes 모델) 또는 4 주차(β-YAC 모델)에 시작하였다. 마우스에게 O6-BG(15 mg/kg, IP)를 2 회, 30 분 간격으로 주사하였다. O6-BG의 두번째 주사 1 시간 후에, 마우스에게 5 mg/kg 카르무스틴(BCNU)을 주사하였다(IP). 1 차례의 선택 후 2 및 4 주차에, 각각 7.5 및 10 mg/kg의 BCNU 용량으로 2 차례 이상 수행하였다.
면역억제: 마이코페놀레이트 모페틸(CellCept Intravenous)은 Genentech(오리건주 힐즈버러 소재)에서 수득하였다. 라파마이신(Rapamune/Sirolimus) 및 메틸프레드니솔론은 Pfizer(뉴욕주 뉴욕 소재)에서 수득하였다. 마이코페놀레이트 모페틸(20 mg/kg/일), 라파마이신(0.2 mg/kg/일), 메틸프레드니솔론(20 mg/kg/일)의 일일 복강내 주사를 수행하였다.
2차 골수 이식: 수용자는 Jackson Laboratory에서 수득한 6 - 8 주령의 암컷 C57BL/6 마우스였다. 이식 당일에, 수용자 마우스를 1000 Rad로 조사하였다. 생체내 형질도입된 CD46tg 마우스로부터 골수 세포를 단리된 무균상태로 단리하고 계통-고갈된 세포를 상기 기재된 바와 같이 MACS를 사용하여 단리하였다. 조사 6 시간 후 세포를 마우스 당 1x106 개 세포로 정맥내로 주사하였다. 2차 수용자는 종료점 분석을 위해 이식 후 16 주 동안 유지하였다. 모든 2차 수용자는 4 주차에 시작하여 면역억제를 받았다.
조직 분석: 2.5 μm 두께의 비장 및 간 조직 절편을 적어도 24 시간 동안 4% 포름알데하이드에 고정시키고, 탈수하고 파라핀에 포매하였다. 헤마톡실린-에오신 염색은 골수외 혈구형성의 조직학적 평가를 위해 사용하였다. 헤모시데린을 Perl의 프러시안 블루 염색에 의해 조직 절편에서 검출하였다. 간단히 말해서, 조직 절편을 증류수 중 동일한 부피(2%)의 페로시안화칼륨 및 염산의 혼합물로 처리한 다음 뉴트럴 레드로 대조염색하였다. 비장 크기를 비장 중량(mg)/체중(g)의 비로 평가하였다.
혈액 분석: 혈액 샘플을 EDTA-코팅된 튜브에 수집하고 HemaVet 950FS(Drew Scientific, 코네티컷주 워터베리 소재)에서 분석을 수행하였다. 말초 혈액 도말을 각각 5 및 15 분 동안
Figure pct00023
(Merck, 독일 다름슈타트 소재)로 염색하였다. 망상적혈구를 브릴리언트 크레실 블루로 염색하였다. 혈액 도말에 대한 망상적혈구를 계수한 조사자들은 샘플 그룹 할당에 대해 맹검이었다. 동물 번호만이 슬라이드에 보였다. (동물 당 5 개 슬라이드, 5 개의 무작위 1 cm2 절편)
통계적 분석 : 다중 그룹의 비교를 위해, 다중 비교를 위한 본페로니 사후-테스트와 함께 일원 및 이원 분산 분석(ANOVA)를 이용하였다. 통계적 분석은 GraphPad Prism 버전 6.01(GraphPad Software Inc., 캘리포니아주 라호이아 소재)을 사용하여 수행하였다.
결과 및 논의
γ-글로빈 유전자 추가를 위한 HDAd-combo 벡터 및 γ-글로빈 재-활성화를 위한 자기-불활성화 CRISPR/Cas9: HDAd5/35++ 벡터의 30 kb 삽입 용량은 2 개의 치료 카세트를 1 개의 벡터로 통합하기 위해 활용되었다(도 100, 상부 패널, "HDAd-combo"): i) 인간 γ-글로빈 발현을 구동하기 위해 β-글로빈 프로모터와 조합된 HS1-HS4 미니-LCR로 이루어진 SB100x에 의한 γ-글로빈 유전자 추가용 카세트(Wang 등, J Clin Invest 129: 598-615, 2019). 이 카세트는 저용량 O6BG/BCNU 처리에 의해 안정하게 형질도입된 세포의 선택을 허용하는 보편적으로 활성인 PGK 프로모터의 제어 하에 돌연변이체 O6-메틸구아닌-DNA 메틸트랜스퍼라제(mgmtP140K)에 대한 유전자에 연결된다(Neff 등, J Clin Invest 112: 1581-1588, 2003; Wang 등, Mol Ther Methods Clin Dev 8: 52-64, 2018). ii) IR/frt 플랭킹된 트랜스포존 외부에 위치한 CRISPR/Cas9 발현 카세트인, γ-글로빈/mgmtP140K 트랜스포존 카세트는 frt 부위 및 IR에 의해 플랭킹된다. 이 모듈은 HBG1/2 프로모터 내에서 BCL11A 결합 부위를 표적화하는 U6-프로모터 구동된 sgRNA 및 EF1α 프로모터의 제어 하에 SpCas9로 이루어진다. HDAd combo 및 HDAd-SB의 공동 감염 및 SB100x 및 Flpe 재조합효소의 발현은 IR-플랭킹된 γ-글로빈/mgmtP140K 카세트의 통합을 매개하고 동시에 벡터를 파괴하고 CRISPR/Cas9 발현을 중지시킬 것이다(도 101). CRISPR/Cas9의 이러한 단축된 발현은 게놈- 편집된 세포의 생존 및 장기간 재증식 세포의 백분율을 증가시켜야 한다. 비교를 위해, HDAd5/35++ 벡터는 2 개의 상이한 모듈, HDAd-CRISPR("cut") 및 HDAd-SB-추가("add")를 별도로 함유하는 연구에 포함되었다(도 100, 중간 패널-"HDAd-cut" 및 "HDAd-SB-add").
HUDEP-2 세포에서 벡터 검증: 가설은 BCL11A 및 대부분의 β-글로빈 및, 낮은 수준의 γ-글로빈만을 발현하는 불멸성 인간 조혈 줄기 및 전구체 세포-유래 적혈구 전구체 세포주인 대혈 혈액-혈구 구체(HUDEP-2) 세포에서 처음으로 테스트되었다(Kurita 등, PLoS One 8: e59890, 2013). HUDEP-2 세포는 γ-글로빈 재활성화 연구에 광범위하게 사용되었다(Canver 등, Nature 527: 192-197, 2015). HUDEP-2 세포를 대부분의 세포를 혈질도입하는 MOI에서 HDAd-combo +/- HDAd-SB로 감염시키고 4 일 후, 세포를 초기에 기재된 바와 같이 적혈구 분화 배지에서 8 일 동안 추가로 확장시켰다(Li 등, Mol Ther 27: 2195-2212, 2019). Cas9 웨스턴 블롯 신호는 세포가 분화/확장에 적용되면 급격하게 감소하였으며, 에피솜 HDAd-combo 벡터 카피의 손실로 인할 가능성이 크다(도 103a). HDAd-combo 벡터를 사용하여 제어된 Cas9 발현에 대한 개략도는 도 102에 제시된다. 그러나 Cas9는 12 일의 연구 기간 동안 검출가능하였다. HDAd-SB와의 공동 감염은 Cas9 발현을 35%(Diff d3) 내지 50%(Diff d8)로 감소시켰으며(도 103b), 이는 도 101에 기재된 자기-불활성화 메커니즘의 효과를 나타낸다. 유세포 분석에 의한 γ-글로빈 마킹의 분석(도 103C)은 γ-글로빈 유전자 추가 및 재활성화 모듈의 부가 효과를 시사하였다.
CD46/β-YAC 마우스에서 생체내 HSPC 형질도입. HBG1/2 프로모터를 표적화하는 HDAd5/35++ 벡터를 사용한 생체내 HSPC 형질도입 후 인간 γ-글로빈 재활성화 CD46/β-YAC 마우스가 이전에 입증되었다(Li 등, Blood 131: 2915-2928, 2018). 여기서, 유사한 프로토콜에 따라 새로운 HDAd-combo 벡터를 평가하였다. CD46/ β -YAC 마우스를 G-CSF/AMD3100으로 동원하고, "cut", "add" 및 "combo" 벡터를 정맥내로 주사하고, 4 주 후, 3 차례의 생체내 선택에 적용하였다(도 104a). γ-글로빈-양성 RBC의 백분율은 각 차례의 생체내 선택과 함께 증가하였으며 O6BG/BCNU 주사의 마지막 차례 2 주 후 "combo" 벡터에 대해 95% 초과에 도달하였다(도 104b). "cut" 벡터로의 재활성화는 덜 효율적이고(60%) 동물 사이에 더 가변적이었다. 18 주차에, RBC 용해물을 글로빈 쇄에 대해 HPLC에 의해 분석하였다. 크로마토그램은 인간 β-글로빈, 재활성화된 인간 Gγ/Aγ (HBG1/2) 및 추가된 76-Ile G 변이체에 대한 별개의 피크를 나타낸다(Li 등, Mol Ther Methods Clin Dev 9: 142-152, 2018)(도 104c 왼쪽 패널, 도 105). 특히, Gγ 및 Aγ의 동시 재활성화는 "cut" 벡터로 처리된 마우스의 작은 분획에서만 보였다(도 105). "cut" 및 "combo" 벡터-처리된 마우스의 대부분은 재활성화된 Aγ만을 나타내었으며, HBG1 및 HBG2 프로모터 둘 다에서 CRISPR/Cas9의 동시 절단 결과로서 HBG2 유전자의 결실에 기인할 가능성이 크다(Li 등, Blood 131: 2915-2928, 2018). 도 104c(오른쪽 패널)는 인간 β-글로빈에 대한 γ-글로빈 단백질 수준을 나타낸다. "cut", "add", 및 "combo" 벡터 각각에 대해 평균, 7 %, 11% 및 17% γ-글로빈 단백질이 검출되었다. mRNA 수준에서 유사한 패턴이 보였다(도 104d). "cut" 및 "add" 벡터 사이의 차이는 유의하지 않았지만, "combo" 벡터에 대한 γ-글로빈 수준은 상당히 더 높았다. PBMC 및 골수 MNC에서 18 주차에 측정된 HBG 프로모터 표적 부위의 CRISPR/Cas9-매개 절단의 백분율은 "cut" 벡터와 비교하여 "combo" 벡터에 대해 상당히 더 높았다(도 104e, 도 106). 이는 CRISPR/Cas9 발현 감소로 이어지는 메커니즘, 및, 잠재적으로, 생체내 선택에 의해 확장된 CRISPR-편집된 HSPC의 더 나은 생존으로 인할 가능성이 더 크다. 골수 MNC에서 벡터 카피 수는 "combo" 벡터에 대한 γ-글로빈 수준 증가가 더 나은 형질도입 및 벡터 통합 때문이었다는 점을 제외하고, "add" 및 "combo" 벡터와 비슷하였다(도 104f). 상이한 마우스의 개별 전구체 콜로니에서 분석할 때, VCN은 세포 당 1 내지 6 개 카피 범위였다(도 104g). γ-글로빈 유전자 추가 및 CRISPR 절단-매개 γ-글로빈 재활성화가 장기간 재증식 HSC에서 발생하였음을 입증하기 위해, 골수 Lin- 세포를 이식하고, "cut" 및 "combo" 벡터를 갖는 β-YAC/CD46 마우스의 치명적으로 조사된 C57Bl/6 마우스로의 생체내 HSPC 형질도입 후 18 주차에 수확하였다. 2차 수용자에서 다중-계통 재구축을 구동하는 이식된 세포의 능력을 16 주의 기간에 걸쳐 평가하였다. PBMC에서 CD46 발현에 기반한 생착률은 95%였고 안정하게 유지되었다. 유세포 분석에 의해 측정된 RBC의 γ-글로빈 마킹이 또한 "cut" 및 "combo" 벡터 각각에 대해 16 주차에 70% 및 95% 범위에서 안정하였다(도 107a). HPLC(도 107b) 또는 qRT-PCR(도 107c)에 의해 측정된 γ-글로빈 발현 수준(마우스 β-주요 기준)은 1차 마우스와 비슷하였다. 도 107b는 이식 후 16 주차에 인간 β-글로빈에 대한 γ-글로빈 단백질의 수준을 나타낸다. 도 107c 및 107d는 마우스 β주요-글로빈 및 인간 β-글로빈에 대한 γ-글로빈 단백질의 수준을 나타낸다.
혈액, 비장, 및 골수의 세포 조성물에 대한 HSPC의 유전적 조작 또는 적혈구 세포로부터의 γ-글로빈 발현에 대한 효과는 관찰되지 않았다. 도 107e 형질도입되지 않은 대조군 마우스(채워지지 않은 기호)와 비교하여 "combo" 벡터(채워진 기호)로 형질도입 후 16 주차에 혈액, 비장, 및 골수의 MNC에서 계통-양성 세포 조성. 도 107f는 혈액, 비장, 및 골수에서 세포 당 트랜스포존의 통합된 카피 수를 나타낸다.
SCD(Townes) 마우스에서 생체내 HSPC 형질도입 연구. 이 모델에서, 뮤린 α-글로빈 유전자를 인간 α-글로빈으로 대체하고 뮤린 성체 β-글로빈 유전자를 함께 연결된 인간 겸상 βS 및 태아 γ-글로빈 유전자로 대체하였다. β-글로빈 유전자(HBG1)는 CRISPR/Cas9에 의해 절단된 BCL11A 표적 부위를 함유하는 1400 bp의 5' 플랭킹 서열을 함유한다. 이는 β -글로빈 유전자의 재활성화로 이어져야 한다. Townes 모델의 게놈은 또 다른 SCD 마우스 모델인 Berkeley 모델(Hba0/0 Hbb0/0 Tg(Hu-miniLCRα1GγAγδβS)보다 더 잘 특성화되며, 이는 인간 글로빈 이식유전자의 2 개 초과의 카피를 갖는 것으로 보인다(Paszty 등, Science 278: 876-878, 1997).
HDAd5/35++ HSPC 유전자 요법에 적합한 Townes 모델을 만들기 위해, Townes 마우스를 인간 CD46 유전자이식 마우스와 교배하였다. 3 차례의 역교배 후, 인간 CD46 및 2 개의 인간(α, βS/γ) 글로빈 유전자에 동형접합성인 마우스를 실험에 사용하였다(도 108a). 삼중 동형접합성 CD46/Townes 마우스는 겸상-유사 적혈구(도 108b), 중증 빈혈, 말초 혈액에서 40% 망상적혈구 뿐만 아니라 백혈구증가증 및 혈소판증가증을 나타내었다(도 108c). 후자는 조혈 장애가 적혈구 계통을 넘어 확장됨을 나타낸다. 또 다른 특징적 특성은 골수외 조혈의 결과로서 비장비대였다(도 108d).
CD46/Townes 마우스를 GCSF/AMD3100으로 동원하고 HDAd-combo+HDAd-SB 벡터를 정맥내로 주사하였다. O6BG/BCNU로의 생체내 선택을 형질도입 1 주 후에 시작하고 BCNU 용량을 증가시키면서(5→7.5→10 mg/kg) 4 및 6 주차에 반복하였다. 기준선에서, 평균 5%의 RBC는 낮은 MFI로 γ-글로빈 양성이었으며, 이는 CD46/Townes 마우스에서 태아 글로빈의 불완전한 억제를 나타낸다. 3 차례의 생체내 선택 후, -글로빈-양성 RBC의 백분율은 증가하고 연구 종료까지(생체내 형질도입 후 13 주) 95% 초과에 도달하였다(도 109a). RBC 용해물의 HPLC 분석은 인간 α-글로빈 또는 βS-글로빈의 30%인 γ-글로빈 수준을 나타내었다(도 109b 왼쪽 패널). 추가된 γ-글로빈 및 재활성화된 Aγ에 대한 피크는 명확하게 보였다(도 109b 오른쪽 패널). CD46/β-YAC 모델에서 볼 수 있는 바와 같이, 재활성화된 γ-글로빈은 총 γ-글로빈 수준에 대해 추가된 γ-글로빈보다 적게 기여하였다(도 109c). 유세포 분석에 의해 검출된 기준선 γ-글로빈의 낮은 수준은 HPLC의 검출 한계 미만이었다. RBC에서 글로빈 mRNA의 분석은 HPLC인 단백질 수준에서 보인 값을 반영하였다(도 109d). HDAd-combo 생체내 HSC 유전자 요법 후 γ-글로빈 수준은 "건강한" CD46/β-YAC 마우스에서보다 SCD CD46/Townes 모델에서 더 높았다.
2 가지 의도된 게놈 변형을 13 주의 골수 샘플에서 검출하였다. 세포 당 평균 2.5 개의 통합된 γ-글로빈 유전자가 발견되었다(도 109e). T7EI 검정에 의해 측정된 표적 부위 절단 효율은 총 골수 MNC, Lin- 세포, PBMC, 및 비장세포에서 25-30% 범위로 비슷하였다(도 109f). CD46/Townes HSPC의 안정된 유전적 변형을 나타내기 위해, 생체내 형질도입 후 13 주차에 수확된 Lin- 세포를 2차 치명적으로 조사된 C57Bl/6 수용자에 이식하였다. RBC에서 γ-글로빈 마킹은 성인 인간 글로빈의 30% 수준에서(도 110b) 16 주에 걸쳐 안정되었다(도 110a.
마우스 모델에서 SCD의 표현형 교정: combo 벡터로 생체내 HSPC 형질도입 후 13 주차에, 겸상적혈구병의 표현형 특징을 CD46/Townes 마우스에서 분석하였다. 말초 혈액 도말에 대해 계수된 망상적혈구의 평균 백분율은 모체("건강한") CD46 유전자이식 마우스, 처리 전 CD46/Townes 마우스, 및 처리 후 13 주차의 CD46/Townes 마우스 각각에 대해 5, 39, 및 5%였다(도 111a 및 111c). 처리된 마우스에서, 혈색소감소증, 광범위하게 다양한 크기/형상(겸상 세포) 및 세포 단편화(도 108b 참조)를 특징으로 하는 CD46/Townes 마우스의 혈액 도말에서 적혈구 형태는 CD46 마우스에서 보이는 정상적혈구 적혈구 모양으로 되돌아갔다(도 111b). RBC, WBC, 및 혈소판 계수 뿐만 아니라 적혈구 특징(예를 들어 헤모글로빈 및 적혈구용적률)을 포함하는 혈액학적 매개변수는 CD46 및 처리된 CD46/Townes 마우스에서 유사하였다(도 111c). 마찬가지로, 처리된 CD46/Townes 마우스의 간 및 비장의 조직학적 분석은 실질 철분 침착 및 골수외 혈구형성의 부재를 포함하는 정규화를 나타내었다(도 112a). 처리된 CD46/Townes 마우스에서 보상 혈구형성의 측정가능한 특징인 비장 크기는 모체 CD46 마우스와 비슷하였다(도 112b).
전반적으로, 이들 데이터는 CD46/Townes 마우스에서 겸상적혈구병의 완전한 치유를 나타낸다. 이는 SB100x 트랜스포사제-매개 γ-글로빈 유전자 추가(주요 기여) 및 내인성 γ-글로빈의 CRISPR/Cas9-촉발된 재활성화의 조합에 의해 달성된 높은 γ-글로빈 수준(20% 초과)과 직접적으로 관련된다고 가정된다. 또한, 이러한 결과는 Flpe/SB100x에 의한 Cas9 발현 감소가 HDAd-combo 게놈으로부터 CRISPR/Cas9 발현 카세트의 절제를 매개하여, CRISPR-편집된 HSPCS의 안전성 및 백분율 증가로 이어짐을 입증한다. 이 시스템이 추가 개선은 예를 들어 SCD 돌연변이를 HDAd-combo 벡터 내로 교정하는 Prime Editor를 포함함으로써, RBC에서 βS의 양을 감소시키는 접근법을 포함할 수 있다.
실시예 4. Ad35 벡터 생산
이 실시예는 Ad35 벡터 생산 및 CD34+ 세포의 형질도입에 대한 효능 입증을 기재한다. 상이한 구조를 갖는(상이한 LoxP 배치 포함) 3 개의 예시적인 Ad35 벡터를 생산하였다.
대표적인 Ad5/35 헬퍼 바이러스 게놈의 왼쪽 단부는 도 113에 제시된다. 진회색으로 음영처리된 서열은 천연 Ad5 서열에 상응하며, 즉, 음영처리되지 않거나 또는 연회색으로 강조된 서열은 인위적으도 도입되었다. 연회색으로 강조된 서열은 (연속 반복되는) loxP 서열의 2개 카피이다. "cre 재조합효소" 단백질의 존재 하에, 2 개의 loxP 서열 사이의 뉴클레오티드 서열이 결실된다(loxP의 1 개 카피만 남겨둠). loxP 부위 사이의 Ad5 서열은 아데노바이러스 DNA를 (생산자 세포의 핵 내의) 캡시드로 패키징하는 데 필수적이기 때문에, 이 결실은 패키징에 대한 헬퍼 아데노바이러스 게놈 DNA가 결핍되게 만든다. 결과적으로, 결실 과정의 효율은 패키징된 헬퍼 게놈 DNA(원치않은 헬퍼 바이러스 "오염")의 수준에 직접 영향을 미친다. 상기 관점에서, Ad5 이외의 아데노바이러스 혈청형에 대한 동일한 체계로 번역하기 위해, 하기를 달성하는 것이 바람직하다: 1. loxP 서열 삽입에 의해 플랭킹되고 cre 재조합효소의 존재 하에 결실될 수 있도록 패키징에 필수적인 서열을 식별한다. 이러한 서열의 식별은 서열에 유사성이 거의 없는 경우 간단하지 않다. 2. 천연 DNA 서열에서 loxP 서열의 삽입이 (cre 재조합효소의 부재 하에) 헬퍼 바이러스의 증식 및 패키징에 최소 영향을 미칠 수 있는지를 결정한다. 3. 헬퍼-의존적 아데노바이러스의 생산 동안(즉, 116 세포주와 같은 세포주를 발현하는 cre 재조합효소에서) 패키징 서열의 효율적인 결실을 허용하고 헬퍼 바이러스 패키징을 최소로 유지하는 loxP 서열 사이의 간격을 결정한다.
도 114는 대표적인 Ad5 및 Ad35 패키징 신호(서열번호: 49 및 50)의 정렬을 나타낸다. Ad5의 왼쪽 단부 서열과 Ad35의 정렬은 패키징 신호를 식별하는 데 도움이 된다. 패키징에 중요한 Ad5 서열의 모티프(AI 내지 AV)는 선으로 표시된다(또한 Schmid 등, J Virol., 71(5):3375-4, 1997의 도 1b 참조). 예시적인 loxP 삽입 부위의 위치는 검정색 화살표로 표시된다. 이러한 삽입은 AI 내지 AIV에 플랭킹하고 AV를 파괴한다. Schmid 등에 표시된 바와 같은 추가적인 패키징 신호 AVI 및 AVII은 이 벡터의 E1 결실의 일부로서 Ad5 헬퍼 바이러스에서 결실되었다.
도 115는 Ad35 벡터 pAd35GLN-5E4의 개략도이다. 이는 재조합 기술(PMID: 28538186)을 사용하여 벡터화된 Ad35 게놈(ATCC의 Holden 균주)으로부터 유래된 1세대(E1/E3-결실) Ad35 벡터이다. 그런 다음 이 벡터 플라스미드를 사용하여 loxP 부위를 삽입하였다.
패키징 부위(PS)1 LoxP 삽입 부위는 뉴클레오티드 178 및 344 뒤에 있으며; 이 Ad35 벡터는 서열번호: 286에 예시되어 있다. 이 LoxP 배치는 AI 내지 AIV를 제거하는 것으로 예상된다. AVI 및 AVII을 포함하는 나머지 패키징 신호(344 이후)는 결실되었다(위치 345 내지 3113에서 E1 결실의 일부로서). PS2 LoxP 삽입 부위는 뉴클레오티드 178 및 481 뒤에 있으며; 이 Ad35 벡터는 서열번호: 51에 예시되어 있다. 추가적으로, 뉴클레오티드 179 내지 365는 결실되어, AI 내지 AV가 존재하지 않는다. 나머지 패키징 모티프 AVI 및 AVII은 HDAd 생산 동안 cre 재조합효소에 의해 제거가능하다. E1 결실은 482에서 3113까지이다. PS3 LoxP 삽입 부위는 뉴클레오티드 154 및 481 뒤에 있으며; 이 Ad35 벡터는 서열번호: 52에 예시되어 있다. 이들 3 개 벡터의 패키징 신호 구조는 도 116에 제공된다.
3 개의 조작된 벡터는 구제될 수 있다. 재배열된 loxP 부위를 갖는 바이러스 게놈의 백분율은 PS1, PS2, 및 PS3 각각에 대해 50, 20, 및 60%였다. 재배열은 lox P 부위가 바이러스 복제 및 유전자 발현에 중요하게 영향을 미칠 때 발생한다.
현재 HDAd5/35 플랫폼과 비교하여 이 HDAd35 플랫폼은 도 117에 예시된다. 두 벡터는 CMV-GFP 카세트를 함유한다. Ad35 벡터는 면역원성 Ad5 캡시드 단백질을 함유하지 않는다. 이들 2 개의 벡터는 시험관내에서 CD34+ 세포의 비슷한 형질도입 효율을 나타내었다. 가교 연구는 시험관내에서 CD34+ 세포의 비슷한 형질도입 효율을 나타낸다. G-CSF 동원된 공여자로부터의 말초 CD34+ 세포인 인간 HSC를 HDAd35(Ad35 헬퍼 P-2로 생산) 또는 Ad35으로부터의 섬유가 있는 Ad5 캡시드를 함유하는 키메라 벡터로 MOI 500, 1000, 2000 vp/세포에서 형질도입하였다. GFP-양성 세포의 백분율을 3 개의 독립적인 실험에서 바이러스 첨가 48 시간 후에 측정하였다.
PS2 헬퍼 벡터는 원숭이 연구에 사용하기 위해 다시 제조하였다(도 118에 예시된 바와 같음). 이 버전을 만들기 위해 취해진 조치는 다음과 같다: E1 영역 결실, Loxp에 의해 플랭킹된 돌연변이체 패키징 신호, 돌연변이체 패키징 서열, E3 영역 결실(27435→30540), Ad5E4orf6으로 대체, 스터퍼 DNA 플랭킹 copGFP 카세트 삽입, 및 Ad35K++를 만들기 위해 놉에 돌연변이 도입.
도 119는 돌연변이된 패키징 신호 서열을 나타낸다. 잔기 1 내지 137은 Ad35 ITR이다. 굵은 글씨 글자는 SwaI 부위이고, Loxp 부위는 이탤릭체로 표시되고, 돌연변이된 패키징 신호는 밑줄로 표시된다. 명확성을 위해, 이들 서열은 도 119에 개별적으로 제시된다.
4 개의 Ad35 헬퍼 벡터 패키징 신호 변이체를 만들었다(도 120a). E3 영역(27388 → 30402)을 결실시키고 CMV - eGFP 카세트를 E3 결실, Ad35K++ 내에 위치시키고, eGFP를 copGFP 대신에 사용하였다. 이들 4 개의 패키징 신호 변이체에서 LoxP 부위는 예시된 위치에 있다(도 120a). 4 개의 헬퍼 벡터 모두를 구제할 수 있다.
도 120b는 명시된 LoxP 부위가 있는 8 개의 추가적인 패키징 신호 변이체를 나타내는 개략도이다.
특정 추가적인 헬퍼 벡터 및 패키징 신호 변이체에서, E3 결실의 단축(27609→30402)과 같은 변화가 도 120a의 헬퍼 벡터에서 이루어졌다.
실시예 5. HDAd5/35++ 벡터를 사용한 생체외 및 생체내 조혈 줄기 세포 형질도입 후 AAVS1 유전자이식 마우스에서 표적화된 통합 및 높은 수준의 이식유전자 발현.
이 실시예에 함유된 정보의 적어도 일부는 Li 등(Mol Ther., 27(12): 2195-2212, 2019; e-pub August 19, 2019)에 공개되었다.
환자에서 현재 조혈 줄기 세포 유전자 요법은 유전자 전달을 위해 렌티바이러스 벡터를 사용한다(Nadini, EMBO Mol Med, 11, 2019; Wang 등, Genome Res, 17, 1186-1194, 2007). 렌티바이러스 벡터는 활성적으로 전사되는 유전자에 대한 강한 편향으로 인간 게놈에서 효율적으로 통합된다. 이러한 반-무작위 통합 패턴은 암-관련 유전자를 포함하는 이웃 유전자의 발현을 교란시킬 위험을 수반한다. 따라서 이 분야에서의 주요 목표는 미리 선택된 부위에 이식유전자 통합을 표적화하는 것이다. 인간 게놈 내로의 표적화된 통합을 위한 다수의 "안전 항구"가 제안되었다(예를 들어 AAVS1 및 CCR5)(Papapetrou 등, Nat Biotechnol, 29, 73-78, 2011). 안전 항구 부위에 대한 기준 중에는 다음이 있다: (i) 임의의 유전자의 5' 단부로부터 50 kb 초과의 거리, (ii) 암-관련 유전자로부터 300 kb 초과의 거리, (iii) 임의의 microRNA로부터 300 kb 초과의 거리, (iv) 유전자 전사 단위 외부, 및 (v) 초보존된 영역의 외부. 염색체 19에서 AAVS1 유전자좌는 AAVS1 부위 내에서 특이적 모티프(RBS)를 인식하는 바이러스-암호화된 단백질 Rep 78에 의해 매개되는 통합을 위해 야생형 AAV에 의해 사용된다(Muzyczka, Curr Top Microbiol Immunol, 158, 97-129, 1992, Huser 등, PLoS Pathog, 6, e1000985, 2010). 일부 AAV 혈청형에 대한 검출가능한 항체에 의해 입증되지만, 임의의 식별가능한 병리 없이 인간 집단의 많은 비율이 AAV에 직면하였기 때문에, AAVS1로의 통합은 안전할 수 있는 것으로 결론내렸다(Henckaerts 등, Future Virol, 5, 555-574, 2010). 또한, 이 유전자좌는 CD34+ 및 iPS 세포에서 개방 염색질 형태를 유지하는 DNAse I 과민성 부위 및 절연체를 함유한다(van Rensburg 등, Gene Ther, 20, 201-214, 2013, Lombardo 등, Nat Methods, 8, 861-869, 2011, Ogata 등, J Virol, 77, 9000-9007, 2003). 이는 게놈 편집 도구의 더 나은 접근을 허용하고 다른 한편으로는 높은 수준의 이식유전자 발현을 뒷받침한다(van Rensburg 등, Gene Ther, 20, 201-214, 2013, Voigt 등, J Mol Med, 86, 1205-1219, 2008).
표적화된 이식유전자 통합은 상동성-지시된 복구(HDR)를 통해 달성될 수 있다(Lombardo 등, Nat Med, 20, 1101-1103, 2014). 조작된 부위-특이적 뉴클레아제에 의한 절단 후, DNA 이중 가닥 파괴는 전형적으로 가변 삽입 또는 결실(indel), 또는 HDR로 이어지는 오류가 발생하기 쉬운 DNA 복구 경로인 비-상동 말단 연결(NHEJ)을 통해 해결되며, 이는 상동 공여자 주형을 카피함으로써 DNA를 복구한다. 파괴 부위 주위의 게놈 서열에 상동 DNA에 의해 플랭킹된 외인성 DNA의 전달은 부위-특이적 방식으로 외인성 서열의 혼입으로 이어질 수 있다.
표적화된 통합을 달성하기 위한 현재 접근법은 엔도뉴클레아제-암호화된 mRNA 및 공여자 플라스미드 DNA(Blair 등, J Vis Exp, e53583, 2016, Dreyer 등, Biomaterials, 69, 191-200, 2015; Kuhn 등, Sci Rep, 7, 15195 2017; Li 등, Mol Med Rep, 15, 1313-1318, 2017), 통합-결핍 렌티바이러스 벡터(IDLV)(Lombardo 등, Nat Med, 20, 1101-1103, 2014; Rio 등, EMBO Mol Med, 6, 835-848, 2014) 또는 rAAV6 벡터(De Ravin 등, Nat Biotechnol, 34:424-429, 2016, Hung 등, Mol Ther, 26, 46-467, 2018; Johnson 등, Sci Rep, 8:12144, 2018)를 사용하여 시험관내에서 HSC의 전기전공법에 기반한다. 헬퍼-의존적 아데노바이러스(HDAd5/35++) 벡터는 설계자 인터그라제(Li 등, Blood, 1431, 2915-2928, 2018, Saydaminova 등, Mol Ther Methods Clin Dev, 1, 14057, 2015) 및, 이 연구에서 공여자 주형을 전달하기 위해 개발되었다. HDAd5/35++ 벡터는 원시 HSC 상에서 발현되는 수용체인 인간 CD46을 표적화한다(Richter 등, Blood, 128, 2206-2217, 2016). 게놈을 비-분할 세포의 핵 내로 효율적으로 전달하는 HDAd5/35++ 벡터의 능력은 효율적인 표적화된 통합에 대한 전제 조건인 다량의 공여자 DNA를 허용한다. HDAd5/35++ 및 HDAd35 벡터는 최대 30 bp의 외래 DNA를 전달할 수 있기 때문에, 이들은 주어진 표적 부위에 상동인 공여자 서열의 긴 스트레치를 수용할 수 있다. 이는 상동 재조합에 의해 표적화된 유전자의 효능을 증가시켜야 하며, 상동성 영역의 길이와 직접적으로 상관관계가 있다(Balamotis 등, Virology, 324, 229-237, 2004, Ohbayashi 등, Proc Natl Acad Sci USA, 102, 13628-13633, 2005, Suzuki 등, Proc Natl Acad Sci USA, 105, 13781-13786, 2008). 이러한 벡터는 고수율로 생성하기 쉽고 강한 HSC 향성을 갖기 때문에, 이들은 생체내 HSC 형질도입에 이용되었다(Richter 등, Blood, 128, 2206-2217, 2016). 접근법의 핵심 아이디어는 G-CSF/AMD3100을 사용하여 골수로부터 HSC를 동원하고, 주변부에서 많은 수로 순환하는 동안, 정맥내로 주사된 HDAd5/35++ 벡터로 형질도입하는 것이다. 형질도입된 세포는 장기간 지속되는 경우 골수로 되돌아간다. 접근법의 안전성 및 효능은 이전에 내인성 태아 글로빈의 CRISPR/Cas9-매개 재활성화(Li 등, Blood, 1431, 2915-2928, 2018) 또는 효율적인 무작위 일시적 통합을 매개하는 과활성 잠자는 미녀 트랜스포사제(SB100x)를 사용한 태아 글로빈 유전자 추가(Wang 등, J Clin Invest, 129, 598-615, 2019)에 의해 혈색소병증에 대한 CD46 유전자이식 마우스 모델에서 입증되었다. SB100x-매개 이식유전자 통합은 이론적으로 렌티바이러스 벡터의 준-무작위 통합보다 더 안전하지만, 여전히 이식유전자 침묵, 이웃 유전자에 대한 원치않은 효과, 및 게놈 재배열과 관련한 우려를 일으킨다. 따라서 이 연구의 목표는 AAVS1 내로 표적화된 통합을 위한 HDAd5/35++ -기반 생체내 HSC 형질도입 접근법을 변형하는 것이었다.
인간 AAVS1 유전자좌에 대해 상동인 서열은 설치류에 부재한다(Samulski 등, EMBO J, 10, 3941-3950, 1991). 2 개의 유전자이식 설치류 모델이 이전에 보고되었으며, 이는 래트 또는 마우스 게놈(X-염색체)에서 AAVS1 유전자좌의 3.5-kb 단편(래트에서 머리에서 꼬리까지 7 개 카피)을 함유한다(Rizzuto 등, J Virol, 73, 2517-2526, 1999). 연구는 AAVS1의 개방 염색질 구조가 유전자이식 마우스에서 유지됨을 나타내었다(Young 등, J Virol, 74, 3953-3966, 2000). Jackson Laboratories는 AAVS1 유전자이식 마우스를 배포한다(Bakowska 등, Gene Ther, 10, 1691-1702, 2003). Jackson Labs의 웹사이트는 이러한 마우스가 단일 게놈 부위에 삽입된 8.2 kb 인간 AAVS1 유전자좌 단편의 5 개 카피를 함유함을 언급한다. HDAd5/35++ 벡터를 사용한 형질도입에 적합한 AAVS1 유전자이식 마우스를 만들기 위해, 인간 CD46 유전자좌에 대해 유전자이식된 마우스를 교배하였다(Kemper 등, Clin Exp Immunol, 124, 180-189, 2001). 모든 동물 연구는 AAVS1/CD46+/+ 마우스로 수행하였다.
재료 및 방법.
세포 : G-CSF-동원된 성체 공여자로부터 CD34 + 세포를 수득하였다. 세포를 동결 스톡에서 회수하고 페니실린/스트렙토마이신, Flt3 리간드(Flt3L, 25 ng/ml), 인터류킨 3(10 ng/ml), 트롬보포이에틴(TPO)(2 ng/ml), 및 줄기 세포 인자(SCF)(25 ng/ml)를 함유하는 StemSpan H3000(STEMCELL Technologies, 캐나다 밴쿠버 소재)에서 밤새 배양하였다. 세포를 2000 vp/세포의 MOI에서 HDAd 벡터로 형질도입하고 나타낸 바와 같이 분석하였다. HUDEP-2 세포 . HUDEP-2 세포(Kurita 등, PLoS One, 8, e59890, 2013)를 또한 수득하였다. HUDEP-2 세포를 이전에 기재된 바와 같이 SCF, EPO, 독시사이클린 및 덱사메타손의 존재 하에 배양하였다(Canver 등, Nature, 527, 192-197, 2015). 세포를 500-1000 vp/세포의 MOI에서 HDAd 벡터로 형질도입하고 나타낸 바와 같이 분석하였다.
HDAd5/35++ 벡터: HDAd-SB, HDAd-IR-GFP/mgmt, 및 HDAd-IR-γ-글로빈/mgmt는 이전에 기재되었다(Li 등, Mol Ther Methods Clin Dev, 9, 142-152, 2018, Wang 등, Mol Ther Methods Clin Dev, 8, 52-64, 2018). HDAd-CRISPR 벡터의 클로닝을 위해, 인간 AAVS1 유전자좌를 표적화하는 sgRNA(서열번호: 207)(Mali 등, Science, 339, 823-826, 2013)를 합성하고, 어닐링하고, pSPgRNA(Addgene, 매사추세츠주 케임브리지 소재)의 BbsI 부위로 삽입하여, pSP-sgAAVS1을 생성하였다. pLentiCRISPRv2(Addgene)로부터 증폭된 Cas9 코딩 서열, pSP-sgAAVS1의 BamHI 소화에 의해 방출된 U6sgAAVS1 단편, 및 이전에 기재된 microRNA 표적화 영역(miR-183/218)(Saydaminova 등, Mol Ther Methods Clin Dev, 1, 14057, 2015)을 pBS-T-EF1α의 EcoRV-NotI, BamHINotI 부위에 순차적으로 클로닝하여(Saydaminova 등, Mol Ther Methods Clin Dev, 1, 14057, 2015), pBST-sgAAVS1-miR을 형성하였다. 재조합 아데노바이러스 플라스미드를 수득하기 위해, U6 프로모터에서 시작하여 SV40 polyA 신호 서열까지의 8 kb 카세트를 pBST-sgAAVS1-miR로부터 증폭하고 Gibson 어셈블리(New England Biolabs)에 의해 NheI-XmaI 소화된 pHCA와 결찰시켜(Sandig 등, Proc Natl Acad Sci USA, 97, 1002-1007, 2000), 상응하는 pHCA-sgAAVS1-miR 플라스미드를 생성하였다.
HDAd-GFP-공여자 벡터의 구축을 위해, AAVS1 CRISPR 절단 부위에 바로 플랭킹하는 2 개의 0.8 kb 상동성 아암(HA)을 gBlock(IDT, 캘리포니아주 산호세 소재)으로 합성하였다. PAM 서열이 있는 1 개의 23 bp sgAAVS1은 각각 5'HA의 상류 및 3'HA의 하류에 포함되어, 공여자 카세트의 방출을 매개하였다. EF1α-mgmt-2A-GFP-pA 단편을 GenScript(중국 난징 소재)에 의해 합성하고, 중첩 PCR에 의해 2 개의 5'HA와 결찰시켜, sgAAVS1-5'HA-Ef1α-mgmt-2A-GFP-pA-3'HA-sgAAVS1을 형성한 후 pHCA의 XmaI 부위에 삽입시켜(Sandig 등, Proc Natl Acad Sci USA, 97, 1002-1007, 2000), GFP 공여자 벡터 pHCA-AAVS1-GFP-mgmt를 생성하였다.
HDAd-글로빈-공여자 벡터의 클로닝은 3 단계를 수반하였다. 단계 1) 11.8 kb LCR-글로빈-mgmt 카세트를 EcoRV-KpnI 소화에 의해 pHM5-FR-IR-LCR-글로빈-mgmt로부터 방출하고(Li 등, Mol Ther Methods Clin Dev, 9, 142-152, 2018) pBS-Z로부터 증폭된 2.8 kb 플라스미드 백본과 결찰시켜(Saydaminova 등, Mol Ther Methods Clin Dev, 1, 14057, 2015), pBS-LCR-글로빈-mgmt를 생성하였다. AAVS1 CRISPR 절단 부위에 바로 인접한 2 개의 1.8 kb HA를 PAM 서열이 있는 23 bp sgAAVS1을 함유하는 프라이머를 사용하여 AAVS1-tg 마우스의 골수 세포로부터 단리된 게놈 DNA로부터 PCR 증폭시켰다. 5' 및 3' 측면 HA를 pBS-LCR-글로빈-mgmt의 EcoRVKpnI 부위에 각각 순차적으로 삽입하여, pBS-AAVS1-글로빈-mgmt를 생성하였다. 단계 2) pHCA의 nt1588-12121 영역을 EcoRI 소화에 의해 결실시키고 자기-결찰시켜, pHCAS1을 생성하였다. pHCAS1에서의 원래 PacI 부위를 2 개의 어닐링된 올리고 서열을 삽입하여 파괴하였다. 새로운 PacI 클로닝 부위를 BstBI 부위에 생성하여, pHCAS1-MCS를 수득하였다. 이 클로닝 부위는 2 개의 15 bp 상동 영역이 PacI 소화 시 노출되는 방식으로 설계하였다. pHCAS1-MCS의 크기를 1.5 kb NheI 단편을 제거함으로써 추가로 감소시켜, pHCAS1S-MCS를 생성하였다. 단계 3) 상기 2 개 단계로부터의 2 개의 최종 작제물을 PacI 소화한 후, 생성물을 Gibson 어셈블리에 의해 재조합하여, 글로빈 공여자 벡터 pHCA-AAVS1-글로빈-mgmt를 생성하였다.
HDAd5/35++ 벡터의 생산을 위해, 상응하는 플라스미드를 PmeI로 선형화하고 다른 곳에 상세히 기재된 바와 같이(Palmer 등, Mol Ther, 8, 846-852, 2003) Ad5/35++-Acr 헬퍼 벡터(Li 등, 2018. Blood, 1431, 2915-2928)가 있는 116 세포에서 구제하였다(Palmer 등, Mol Ther, 8, 846-852, 2003). 헬퍼 바이러스 오염 수준은 0.05% 미만인 것으로 밝혀졌다. 역가는 6-12x1012 vp/ml였다. 이 연구에 사용되는 모든 HDAd 벡터는 Ad5 섬유 꼬리, Ad35 섬유 샤프트, 및 친화도-향상된 Ad35++ 섬유 놉으로 구성된 키메라 섬유를 함유한다(Wang 등, J Virol, 82, 10567-10579, 2008).
불일치 민감성 뉴클레아제 검정 T7E1 검정 . 게놈 DNA를 이전에 기재된 바와 같이 단리하였다(Miller 등, Nat Biotechnol, 25, 778-785, 2007). AAVS1 표적 부위를 포함하는 게놈 분절을 다음 프라이머를 사용하여 KOD Hot Start DNA 폴리머라제(MilliporeSigma, 매사추세츠주 버링턴 소재)에 의해 증폭시켰다: AAVS1 정방향(서열번호: 208); 역방향(서열번호: 209). PCR 생성물을 혼성화하고 37℃에서 20 분 동안 2.5 단위의 T7EI(NEB)로 처리하였다. 소화된 PCR 생성물을 6% TBE PAGE(Bio-Rad)에 의해 분해하고 에티듐 브로마이드로 염색하였다. 밴드 강도를 ImageJ 소프트웨어를 사용하여 분석하였다. 절단율 % = (1-sqrt(모체 밴드/(모체 밴드 + 절단된 밴드)))x100%
차세대 서열분석: 삽입/결실(indel)의 심층 서열분석을 위해, 예측된 AAVS1 절단 부위 주위의 250-bp 영역을 증폭시키고 Illumina 시스템을 사용하여 생성물을 서열분석하였다. 게놈 DNA를 이전에 기재된 바와 같이 단리하였다(Saydaminova 등, Mol Ther Methods Clin Dev, 1, 14057, 2015). AAVS1 표적 부위를 수반하는 249 bp 게놈 영역을 다음 프라이머를 사용하여 증폭시켰다: AAVS1 정방향(서열번호: 210); 역방향(서열번호: 211). AMPure XP Beads(Beckman Coulter, 인디애나주 인디애나폴리스 소재)를 사용하여 앰플리콘을 세정한 후, Klenow 단편을 사용하여 dA-테일링을 수행하였다. Illumina-호환성 어댑터를 T4 리가제(New England Biolabs)에 의해 생성물과 결찰시켰다. 고유한 바코드 서열을 PCR에 의해 도입하여 동일한 서열분석 수행 시 다중 샘플을 서열분석하였다. 각 단계는 AMPure XP Beads를 사용한 정제로 이어졌다. 최종 라이브러리를 Qubit(Invitrogen)에 의해 정량화하고 Agilent 2100 Bioanalyzer에서 테스트하여 앰플리콘의 평균 크기를 결정하였다. 앰플리콘을 동일한 몰 농도로 풀링하고 Illumina MiSeq 시스템에서 심층 서열분석하였다. 앰플리콘 당 105 개의 판독물을 생성하여 돌연변이 유형을 적절하게 조사하였다. 서열분석 데이터를 Cas-Analyzer 온라인 툴(available at rgenome.net/cas-analyzer/#!에서 이용가능)을 사용하여 AAVS1 참조 서열에 대해 정렬하였다(Park 등, Bioinformatics, 33, 286-288, 2017, NGS 데이터 분석을 위한 자바스크립트-기반 구현.
유세포 분석: 세포를 FACS 완충액(1 % 열-불활성화 FBS가 보충된 PBS)에 1x106 개 세포/100 μL로 재현탁하고 얼음 위에서 10 분 동안 FcR 차단 시약(Miltenyi Biotech, 캘리포니아주 오번 소재)과 함께 배양하였다. 다음으로 염색 항체 용액을 106 개 세포 당 100 μL로 첨가하고 암실에서 30 분 동안 얼음 위에서 배양하였다. 배양 후, 세포를 FACS 완충액에서 1 회 세척하였다. 2차 염색을 위해 염색 단계를 2차 염색 용액으로 반복하였다. 세척 후, 세포를 FACS 완충액에 재현탁하고 LSRII 유세포 분석기(BD Biosciences, 캘리포니아주 산호세 소재)를 사용하여 분석하였다. 파편을 전방 산란 영역 및 측방 산란 영역 게이트를 사용하여 제외하였다. 그런 다음 단일 세포를 전방 산란 높이 및 전방 산란 폭 게이트를 사용하여 게이팅하였다. 그런 다음 유세포 분석 데이터를 FlowJo(버전 10.0.8, FlowJo, LLC)를 사용하여 분석하였다. LSK 세포의 흐름 분석을 위해, 세포를 비오틴-접합된 계통 검출 칵테일(Miltenyi Biotec, 캘리포니아주 샌디에이고 소재) 및 c-Kit 및 Sca-1에 대한 항체 뿐만 아니라 APC-접합된 스트렙타비딘으로 염색하였다. eBioscience (캘리포니아주 샌디에이고 소재)로부터의 다른 항체는 항-마우스 LY-6A/E(Sca-1)-PE-Cyanine7(클론 D7), 항-마우스 CD117(c-Kit)-PE(클론 2B8), 항-마우스 CD3-APC(클론 17A2), 항-마우스 CD19-PE-Cyanine7(클론 eBio1D3), 및 항-마우스 Ly-66(Gr-1)-PE(클론 RB6-8C5)을 포함하였다. Miltenyi Biotec으로부터의 다른 항체는 항-인간 CD46-APC(클론: REA312)를 포함하였다. 항-마우스 Ter-119-APC(클론: Ter-119)는 BioLegend(캘리포니아주 샌디에이고 소재)로부터 수득하였다.
인간 γ-글로빈의 세포내 염색을 Santa Cruz의 PE-접합된 항-인간 γ-글로빈 항체(클론 51.7)를 사용하여 수행하였다. Invitrogen의 Fix & Perm 세포 투과화 키트를 제조업체의 지침에 따라 사용하였다.
실시간 역전사 PCR : 총 RNA를 TRIzolTM 시약(Thermo Fisher Scientific)을 사용하여 제조업체의 페놀-클로로포름 추출 방법에 따라 50-100 μL 혈액에서 추출한 다음, Qiagen의 Quantitect 역전사 키트를 사용하여 역전사시켜 cDNA를 생성하였다. 키트에 제공된 gDNA 제거 시약으로 RNA 샘플을 처리하여 잠재적인 게놈 DNA 오염을 제거하였다. 비교 실시간 PCR을 Power SYBR Green PCR 마스터 믹스(Applied Biosystems)를 사용하여 수행하고 StepOnePlus 실시간 PCR 시스템(Applied Biosystems)에서 실행하였다. 다음 프라이머 쌍을 사용하였다: 마우스 RPL10(하우스키핑) 정방향(서열번호: 189), 및 역방향(서열번호: 190); 인간 γ-글로빈 정방향(서열번호: 214), 및 역방향(서열번호: 215); 마우스 β-주요 글로빈 정방향(서열번호: 193), 및 역방향(서열번호: 217).
글로빈 HPLC : 개별 글로빈 쇄 수준을 SPD-10AV 다이오드 어레이 검출기 및 LC-10AT 바이너리 펌프가 장착된 Shimadzu Prominence 기기(Shimadzu, 일본 쿄토 소재)에서 정량화하였다. 물/아세토니트릴 중 0.1% 트리플루오로아세트산의 38%-58% 구배 혼합물을 Vydac C4 역상 칼럼(Hichrom, 영국 소재)을 사용하여 1 mL/분의 속도로 적용하였다. 
콜로니 형성 단위 검정 . 2500 개의 Lin- 세포를 ColonyGEL 1202 마우스 완전 배지(ReachBio, 워싱턴주 시애틀 소재)에 삼중으로 플레이팅하고 5 % CO2 및 최대 습도에서 37℃에서 12 일 동안 배양하였다. 콜로니를 Leica MS 5 해부 현미경(Leica Microsystems)을 사용하여 열거하였다. HDAd-GFP-공여자-형질도입된 마우스로부터 유래된 콜로니의 경우, GFP 양성 콜로니로 계수하고, 선별하고 분석하였다.
벡터 카피 수의 측정 : 골수 세포 또는 단일 콜로니의 총 DNA를 PureLink Genomic DNA 미니 키트(Invitrogen)에 의해 추출하였다. HDAd-GFP-공여자 또는 HDAd-글로빈-공여자로부터 추출된 바이러스 DNA를 연속으로 희석하고 표준 곡선으로 사용하였다. qPCR을 StepOnePlus 실시간 PCR 시스템(Applied Biosystems)에서 power SYBR Green PCR 마스터 믹스를 사용하여 이중으로 수행하였다. 5 ng DNA를 10 μL 반응에 사용하였다. 다음 프라이머 쌍을 사용하였다: GFP 정방향(서열번호: 218), 및 역방향(서열번호: 219); 및 mgmt 정방향(서열번호: 220), 및 역방향(서열번호: 221). 인간 γ-글로빈 프라이머는 실시간 역전사 PCR 단락에 기재되었다.
AAVS1 유전자이식 마우스에서 AAVS1 유전자좌의 국소화 . TLA 라이브러리를 이전에 기재된 바와 같이 제조하였다(de Vree 등, Nat Biotechnol, 32, 1019-1025, 2014). 간단히 말해서, 총 골수 세포로부터의 포름알데하이드 가교된 DNA를 NlaIII으로 소화시켰다. 결찰 및 역가교 후, DNA를 정제하였다. 이 생성물을 NspI로 추가로 소화시키고 결찰시켜 2 kb의 원형 키메라 DNA를 수득하였다. 키메라 DNA를 AAVS1 특이적 TLA 프라이머를 사용하여 PCR 증폭시켰다: 정방향(서열번호: 222), 및 역방향(서열번호: 223). PCR 증폭된 생성물로부터의 TLA 라이브러리를 Illumina Nextera XT NGS 키트를 사용하여 제조업체의 프로토콜에 따라 제조하였다. 쌍형성 단부 서열분석을 NovaSeq에서 수행하였다. TLA 프로토콜은 DNA의 재셔플링으로 이어지며, 따라서 판독물을 다음 설정을 사용한 스플릿-판독 인지 정렬기 BWA(Li 등, Bioinformatics, 26, 589-595, 2010)를 사용하여 정렬하였다: 이전에 제안된 바와 같은 bwasw -b 7(github.com/Cergentis/Cergentis_common에서 온라인 참조)(Vain-Hom 등, 2017. Nucleic Acids Res, 45, e62). 이러한 정렬된 bam 파일을 deepTool을 사용하여 RPKM 정규화된 bigwig 파일로 변환하였다(Ramirez 등, Nucleic Acids Res, 42, W187-191, 2014). 게놈 와이드 분포를 WashU 에피게놈 브라우저를 사용하여 시각화하였다(Zhou 등, Nat Methods, 8, 989-990, 2011).
서던 블롯. 마우스 골수의 게놈 DNA를 EcoRI 또는 Blp1로 소화시키고 Prime-It RmT 무작위 프라이머 표지화 키트(Agilent Technologies)를 사용하여 32P로 표지된 AAVS1- 또는 GFP-특이적 프로브와 함께 서던 블롯에 적용하였다. 비-혼입된 32P dCTP를 MicroSpin G25 칼럼(GE Healthcare)을 통해 원심분리에 의해 제거하였다. 혼성화를 PerfectHyb Plus 혼성화 완충액(Sigma)에서 수행하였다. 블롯을 Amersham Hybond-XL 필름(GE Healthcare)에 노출시켰다.
역PCR: 총 골수 세포, 단일 콜로니, HUDEP-2 세포 혼합물 또는 클론에서의 접합부를 변형이 있는 다른 곳에 기재된 바와 같은 역PCR에 의해 분석하였다(Wang 등, J Virol, 79, 10999-11013, 2005). 간단히 말해서, 게놈 DNA를 진탕하면서 밤새 55℃에서 게놈 DNA 용해 완충액(100 mM Tris-Cl(pH 8.0), 50 mM EDTA, 1%(w/v) SDS, 및 400 μg/mL 프로테이나제 K)과 배양한 후, 페놀-클로로포름에 노출시키고, 이소프로판올로 침전시키고, 70% 에탄올로 세척하여 단리하였다. DNA 샘플을 10 mM Tris/HCL 완충액(pH 8.5)에 용해시켰다. 5 μg의 DNA를 5 시간 동안 37℃에서 50 μL 반응물 중 30 U NcoI로 소화시켰다. 열-불활성화 및 정리 후, 소화된 DNA를 분자내 결찰을 위해 밤새 16℃에서 500 μL 반응 완충액 중 2.5 μL T4 리가제(New England Biolabs, M0202L)로 처리하였다. 열-불활성화 및 정리 후, 재결찰된 생성물을 KOD Hot Start DNA 폴리머라제를 사용하여 역PCR에 사용하였다. 다음 프라이머를 사용하였다: EF1α 정방향(서열번호: 224), 및 역방향(서열번호: 225); pA 정방향(서열번호: 226), 및 역방향(서열번호: 227); HS4 정방향(서열번호: 228); 및 역방향(서열번호: 229). Ef1α 및 pA 프라이머 쌍은 GFP 공여자 벡터-처리된 샘플의 5' 및 3' 접합부를 각각 분석하기 위해 사용하였다. HS4 및 EF1α 프라이머 쌍은 글로빈 공여자 벡터-처리된 샘플의 5' 및 3' 접합부를 각각 분석하기 위해 사용하였다. PCR 앰플리콘을 겔 정제하고, 클로닝하고, 서열분석하고, 정렬하여 통합 부위를 식별하였다.
In-Out PCR: 게놈 DNA를 역PCR 섹션에 기재된 바와 같이 추출하였다. 5 ng 게놈 DNA를 25 μl의 반응물에서 KOD Hot Start DNA 폴리머라제에 의한 In-Out PCR용 주형으로 직접 사용하였다. 다음 PCR 프로그램을 사용하였다: 94℃ 2 분; 98℃ 10 초, 66℃ 30 초 및 68℃ 1.5 분으로 5 회 주기; 98℃ 10 초, 63℃ 30 초 및 68℃ 1.5 분으로 5 회 주기; 98℃ 10 초, 60℃ 30 초 및 68℃ 1.5 분으로 15 회 주기; 68℃ 5 분. 사용된 프라이머는 In-Out P1(서열번호: 230), In-Out P2(서열번호: 231), 및 In-Out P3(서열번호: 232)이다. 생성물을 1% 아가로스 겔에 용해하였다. 1 개의 단일 1.6 kb 밴드는 이중대립유전자성 표적화된 통합을 나타내고; 1 개의 1.6 kb 및 1 개의 2.0 kb 밴드는 단일대립유전자성 표적화된 통합을 나타내고; 1 개의 단일 2.0 kb 밴드는 잠재적인 표적외 통합을 나타낸다.
표적외 절단 부위의 인 실리코 예측 : 인간 또는 마우스 게놈에서 AAVS1 가이드 서열의 표적외 부위를 sanger.ac.uk/htgt/wge/find_off_targets_by_seq에서 이용가능한 온라인 툴을 사용하여 예측하였다.
동물 연구: 모든 실험은 통제 기관 심의 위원회 및 IACUC의 승인을 받아 수행하였다. 마우스를 특이적 무병원체 시설에서 수용하였다. AAVS1 유전자이식 마우스(C3; B6-Tg(AAVS1)A1Xob/J)(The Jackson Laboratory)는 Bakowska 등(Gene Ther, 10, 1691-1702, 2003)에 기재된 바와 같이 마우스의 동결보존된 배아로부터 회수하였다. 마우스는 인간 AAVS1 유전자좌에 대해 반접합성이다. AAVS1 유전자이식 마우스를 인간 CD46+/+ 마우스와 교배시켜 생체외 연구를 위한 AAVS1+/-/CD46+/- 마우스 및 생체내 HSC 형질도입 연구를 위한 AAVS1+/-/CD46+/+ 마우스를 수득하였다. 다음 프라이머를 CD46 마우스의 유전형 분석에 사용하였다: 정방향(서열번호: 233), 및 역방향(서열번호: 234). CD46에 동형접합성 또는 이형접합성인 마우스는 유세포 분석에 의해 검출된 PBMC에 대한 CD46 발현의 상이한 강도에 의해 식별하였다. AAVS1 이식유전자의 유전형 분석은 Jackson Labs의 권고된 프로토콜에 따라 PCR에 의해 수행하였다.
골수 Lin - 세포 이식: 수용자는 6 - 8 주령의 암컷 C57BL/6 마우스였다. 이식 당일에, 수용자 마우스를 1000 Rad로 조사하였다. 조사 4 시간 후 1x106 개의 Lin- 세포를 꼬리 정맥을 통해 정맥내로 주사하였다. 이 프로토콜은 생체외 형질도입 Lin- 세포의 이식 및 2차 수용자로의 이식에 사용되었다.
HSC 동원 및 생체내 형질도입 : 이 절차는 이전에 기재되었다(Richter 등, Blood, 128, 2206-2217, 2016). 간단히 말해서, HSC를 인간 재조합 G-CSF의 s.c. 주사(5 μg/마우스/일, 4 일)(Amgen 캘리포니아주 사우전드 오크스 소재) 이어서 5 일째에 AMD3100의 s.c. 주사(5 mg/kg)(Sigma-Aldrich)에 의해 마우스에 동원하였다. 또한, 동물은 바이러스 주사 16 시간 및 2 시간 전에 덱사메타손(10 mg/kg)을 i.p.로 받았다. AMD3100 후 30 및 60 분에, 동물에게 주사 당 각 바이러스에 대해 4x1010 vp의 용량으로 안와하정맥총을 통해 HDAd-CRISPR 및 HDAd-GFP-공여자 또는 HDAd-글로빈-공여자를 정맥내로 주사하였다. 4 주 후, 마우스에게 O6-BG(15 mg/kg, IP)를 2 회, 30 분 간격으로 주사하였다. O6-BG의 두번째 주사 1 시간 후, 마우스에게 BCNU(5 mg/kg, IP)를 주사하였다. BCNU 용량을 두번째 주기에 10 mg/kg로 증가시켰다. BCNU 및 O6-BG는 둘 다 Sigma-Aldrich로부터 수득하였다.
통계적 분석: 다중 그룹의 비교를 위해, 다중 비교를 위한 본페로니 사후-테스트와 함께 일원 및 이원 분산 분석(ANOVA)을 이용하였다. 통계적 분석은 GraphPad Prism 버전 6.01(GraphPad Software Inc., 캘리포니아주 라호이아 소재)을 사용하여 수행하였다.
결과
HDAd-CRISPR 및 HDAd-공여자 벡터의 설계 . CRISPR/Cas9를 발현하는 HDAd5/35++ 벡터를 생성하였다. 벡터는 AAVS1 유전자좌 내에서 ds DNA 파괴를 생성할 수 있다(도 55a). 이전 연구는 이 유전자좌로의 부위-특이적 통합이 1차 인간 세포에서 부작용 없이 강력한 이식유전자 발현을 허용하였음을 입증하였다(Lombadro 등, Nat Methods, 8, 861-869, 2011). 상응하는 HDAd-CRISPR 벡터의 활성을 테스트하기 위해, HSC에 대해 강화된 세포 분획인 인간 CD34+ 세포를 형질도입하였다. 42%의 빈도로 감염 후 3 일차에 AAVS1 부위-특이적 절단은 불일치 민감성 뉴클레아제 검정 T7E1 검정에 의해 입증되었다(도 55b). HDAd-CRISPR 삽입/결실(indel)의 심층 서열분석을 위해, 예측된 AAVS1 절단 부위 주위의 250-bp 영역에서 PCR 증폭을 수행하고 Illumina 시스템을 사용하여 생성물을 서열분석하였다(도 55c). indel의 80%는 1 내지 20 bp 범위의 결실이었고 10%만이 1 내지 2 bp 마이크로-삽입이었다.
HDAd5/35++ 벡터를 공여자 벡터로 사용하였다. 첫번째 HDAd-공여자 벡터는 CRISPR/Cas9 표적 부위에 바로 인접한 영역에 상동인 0.8 kb 길이 영역에 의해 양측에 플랭킹된 GFP 및 mgmtP140K에 대한 발현 카세트를 함유하였다(도 55d). 선형 이중-가닥 아데노바이러스 게놈은 바이러스가 세포에 진입하여 핵으로 전위될 때 생성된 "말단 단백질 - TP"와 공유적으로 연결된다(Shenk, Fields Virology, 2:2111-2148, 1996). 이는 TP가 헬퍼 바이러스 유래인 HDAd5/35++ 게놈의 경우와 동일하다. 공여자에서 유리 DNA 단부의 부재는 HDR을 크게 감소시키는 것으로 생각된다(Cristea 등, Biotechnol Bioeng, 110, 871-880, 2013). AAVS1 CRISPR에 대한 sgRNA 표적 부위는 공여자 이식유전자 카세트를 플랭킹하는 공여자 벡터 내로 혼입되었다(도 55d). 따라서 HDAd-CRISPR 및 HDAd-GFP-공여자의 공동 감염은 염색체 AAVS1 표적 부위에서 dsDNA 파괴를 동시에 생성하고 핵 내부에서 유입 HDAd-공여자 게놈으로부터 공여자 카세트를 방출하여야 한다. 1000 및 2000 vp/세포의 총 MOI에서 감염 후 2 일차에 CD34+ 세포에서 각각 13.2 및 18.1%의 효능을 갖는 공동 감염된 HDAd-GFP-공여자 벡터로부터 공여자 카세트의 IA HDAd-CRISPR-매개 방출이 입증되었다(도 55e). 이 발견은 또한 CRISPR/Cas9가 이중-가닥 선형 아데노바이러스 DNA를 절단할 수 있으며, 항-바이러스 요법에 영향을 미친다는 것을 나타낸다.
시험관내 표적화된 통합. 먼저, HDAd-CRISPR + HDAd-공여자 벡터 시스템을 무작위 통합을 매개하는 SB100x 벡터 시스템과 직접 비교하여 시험관내에서 표적화된 통합에 대해 테스트하였다(도 56a). 인간 적혈구 전구체 세포인 HUDEP-2 세포를 사용하였다. 이 세포주는 이배체이며 단일 콜로니 확장을 허용하여 통합 부위 분석을 용이하게 하는 것을 특징으로 한다. HUDEP-2 세포의 형질도입 후 2 일차에 수행된 GFP 유세포 분석은 유사한 형질도입률을 나타내는 SB100x-매개 및 표적화된 통합 시스템에 대한 GFP-양성 세포의 유사한 백분율을 입증하였다(도 56b, 상부 패널). 2 일차에 GFP 발현은 HDAd-GFP-공여자 단독으로의 형질도입이 유사한 GFP 마킹을 초래할 수 있기 때문에 에피솜 게놈으로부터 유래할 가능성이 있다. 21 일 동안 형질도입된 세포를 배양한 후, 세포 증식으로 인해, 에피솜 게놈은 HDAd-GFP-공여자 단독 설정에서 GFP 발현의 부재를 나타낼 때 사라졌다. 21 일차에, 세포의 4.52% 및 1.82%가 각각 SB100x-매개 및 표적화된 통합 시스템에 대해 GFP-양성이었다(도 56b, 하부 패널). 이는 SB100x 시스템이 더 높은 안정된 형질도입률을 부여함을 시사한다. 그러나, 평균 형광 강도(MFI)에 의해 반영되는 GFP 발현 수준은 HDAd-CRISPR + HDAd-GFP-공여자로 형질도입된 세포에서 21 일차에 세포 집단(도 56c) 및 단일 클론 수준(도 56d) 둘 다에서 더 높았다. 벡터 통합 분석은 단일 클론에서 수행하였다. 이식유전자 카세트에 플랭킹하는 긴 상동성 영역으로 인해, 벡터 통합 부위 분석에 통상적으로 사용되는 도구(예를 들어 LAM-PCR)를 이용하는 것은 가능하지 않았다. 벡터-세포 DNA 접합부의 존재를 입증하기 위해, 4 kb 단편으로 게놈 DNA의 엔토뉴클레아제 절단, 이의 원형화, 및 이식유전자 특이적 프라이머를 사용한 후속 PCR을 수반하는 역PCR(iPCR) 방법을 사용하였다(Wang 등, J Virol, 79, 10999-11013, 2005). 결과는 HDAd-CRISPR + HDAd-GFP-공여자 형질도입된 HUDEP-2 세포로부터 유래된 모든 테스트된 36 개 콜로니가 AAVS1 부위로 통합된 이식유전자를 가짐을 나타내었다(도 57a). 이는 표적화된 통합이 있는 클론에서 균질한 높은 수준의 이식유전자 발현과 일치한다. AAVS1 및 이식유전자 특이적 프라이머를 사용한 In-/out-PCR은 36 개 콜로니 중 3개에서의 통합이 두 대립유전자에서 발생하였고; 36 개 중 31 개가 단일대립유전자성 통합을 가졌고, 2 개가 분명히 연쇄체 통합체를 가짐을 입증하였다(도 57b). 대조적으로, 특이적 유전자좌의 우선적 표적화가 없는 SB100x-매개 무작위 통합(Wang 등, 2019. J Clin Invest, 129, 598-615, Boehme 등, Mol Ther Nucleic Acids, 5, e337, 2016)은 다양한 유전자 침묵 수준을 초래하였다(도 56e). 유사한 수준의 벡터 카피 수를 SB100x 및 표적화된 통합을 갖는 클론에서 검출하였다(도 56f).
요약하면, 시험관내 연구는 HDAd-CRISPR + HDAd-GFP-공여자 시스템이 고효율로 표적화된 통합을 부여하고 SB100x 매개 시스템보다 더 높은 GFP 발현 수준을 초래하였음을 제시하였다. 안정된 통합의 효능은 표적화된 시스템에 대해 40% 더 낮았다.
HDAd-CRISPR + HDAd-GFP-공여자를 사용한 AAVS1/CD46 HSC의 생체외 형질도입 및 치명적으로 조사된 수용자 내로 후속 이식 . 다음으로, 표적화된 통합 시스템을 AAVS1/CD46tg 마우스의 HSC에서 테스트하였다. HSC에 대해 강화된 골수 세포 분획인 계통-음성(Lin-) 세포의 생체외 형질도입 후 표적 부위 절단 빈도는 1000 vp/세포의 MOI에서 HDAd-CRISPR 벡터로 형질도입 후 25%였다(도 58a). 0% 및 50% 절단에서 삽입/결실의 백분율은 도 58b에 제시된다. 예시적인 서열은 도 58c에 제시된다. HDAd-CRISPR 단독, HDAd-GFP-공여자 단독, 및 둘 다의 조합으로 생체외에서 형질도입된 AAVS1/CD46 Lin- 세포를 치명적으로 조사된 C57Bl/6 마우스로 이식한 다음, 16 주 동안 추적하였다(도 59a). PBMC에 대한 인간 CD46 발현에 기반하여 이식된 세포의 생착을 표시된 시점에서 CD46+ PBMC의 퍼센트에 의해 측정하였다. 형질도입된 공여자 세포는 CD46을 발현한 반면(도 60b), 수용자 C57Bl/6 마우스는 발현하지 않았다. PBMC(혈액), 비장, 및 뼈에서 CD46+ 세포의 백분율은 도 60c 및 60d에 제시된다. GFP 마커의 발현을 또한 콜로니 및 풀링된 콜로니 세포에서 분석하였다.
공여자 세포 생착률은 모든 3 가지 설정에 대해 비슷하였으며(도 60) 이는 HDAd-CRISPR 및 HDAd-CRISPR + HDAd-GFP-공여자 벡터에 의해 HSC에 도입된 게놈 변형이 HSC 생물학, 특히 치명적으로 조사된 수용자의 다중계통 재증식에 해로운 효과를 미치지 않았음을 시사한다. 최대 100%에 도달하는 GFP 마킹률은 이식유전자가 안정하게 발현된 HSC/전구체의 3 차례의 O6BG/BCNU 선택 후 PBMC에서 보였다(도 59b, 59c). 선택 전(이식 4 주 후)에, GFP+ PBMC의 백분율은 1.1%였으며, 이는 표적화된 통합이 드문 사건임을 나타낸다. GFP+ PBMC는 HDAd-GFP-공여자 단독으로 형질도입된 Lin- 세포로 이식된 마우스에서 평균 0.2% 미만이었다. 이는 안정된 이식유전자 발현을 달성하기 위해 CRISPR/Cas9-매개 dsDNA 파괴의 필요성에 관해 시사한다. 이식 후 16 주차에 분석된 마우스는 골수, 비장, 및 PBMC에서 분석된 모든 계통에서 GFP 마킹을 제시하였다(도 59d). GFP 마킹률은 2차 이식 수용자에서 16 주 동안 유지되었으며, 이는 원시 HSC가 혈액, 비장, 및 골수를 포함하여(도 61b, 61c), 콜로니 및 풀링된 콜로니 세포에 대해 제시된 바와 같이(도 61d), HDAd-CRISPR + HDAd-GFP-공여자 벡터 시스템으로 유전적으로 변형됨(도 61a)을 입증한다. 인간 CD46+ 세포의 퍼센트 및 혈액, 비장, 및 골수에서의 백분율은 도 61e 및 61f에 추가로 제시된다.
HDAd-CRISPR + HDAd-GFP-공여자를 사용한 AAVS1/CD46tg 마우스의 생체내 HSC 형질도입. AAVS1/CD46-유전자이식 마우스의 생체내 HSC 형질도입을 위해, HSC를 G-CSF/AMD3100의 피하 주사에 의해 골수에서 말초 혈류로 동원하고 정맥내로 전달된 HDAd-CRISPR + HDAd-GFP-공여자 벡터에 의해 생체내에서 형질도입하였다(도 62a). 3 주기의 O6BG/BCNU로 생체내 선택 후, 마우스의 60%는 개별 동물에서 35 내지 95% GFP+ PBMC 범위의 PBMC에서 GFP 발현을 나타내었다(도 62b). 생체내 형질도입 후 16 주차에, 혈액, 비장 및 골수의 단핵 세포에서 유사한 마킹을 보였다(도 62c). 혈액, 비장 및 골수의 CD3+, CD19+, 및 Gr-1+ 계통 세포에서 GFP 마킹을 보였다(도 62d). "반응자"의 골수에서, LSK 세포의 50% 초과(HSC에 대해 강화된 분획)는 GFP-양성이었다(도 62d, 마지막 그룹). 이는 또한 전구체 콜로니를 형성하는 능력인 HSC에 대한 기능적 검정에 의해 반영되었다(도 62e). 또한, 원시의 장기간 재증식 HSC의 형질도입은 2차 수용자에서 제시되었다(표시된 시험에서 GFP+ PBMC의 백분율(도 63a), 혈액, 비장, 및 골수에서 GFP+ 세포의 백분율(도 63b, 63c); 인간 CD46+ 세포의 백분율(도 63d), 및 혈액, 비장, 및 골수에서의 백분율(도 63e) 참조). 생체내 HSC 형질도입/선택 절차는 골수 세포 조성물 및 조혈에 부정적인 영향을 미치지 않았다(도 62f).
HDAd-CRISPR 및 HDAd-글로빈-공여자 벡터의 생체외 및 생체내 HSC 형질도입. HDAd-GFP-공여자 벡터를 사용한 연구는 대부분의 동물에서 안정된 HSC 형질도입을 시사하지만, 더 높은 비율의 반응자가 바람직할 것이다. 이는 HDR-매개 통합의 효능을 증가시킬 필요가 있으며, 상동성 아암의 길이를 증가시킴으로써 달성될 수 있다(Balamotis 등, Virology, 324, 229-237, 2004, Ohbayashi 등, Proc Natl Acad Sci USA, 102, 13628-13633, 2005, Suzuki 등, Proc Natl Acad Sci USA, 105, 13781-13786, 2008). CRISPR/Cas9 절단 부위 주위의 AAVS1 게놈 서열에 상동인 1.8 kb 영역을 갖는 새로운 HDAd-공여자 벡터를 생성하였다(도 64a). 혈색소병증의 유전자 요법에서 적용하기 위해, 미니 γ-글로빈 LCR의 제어 하에 인간 γ-글로빈 유전자(HBG1)를 사용하였다. HDAd-글로빈-공여자 벡터를 생체외 및 생체내 HSC 형질도입 프로토콜 둘 다에서 테스트하였다. 생체외 형질도입 설정에서(도 64b), 모든 마우스가 말초 적혈구(RBC)의 80%에서 γ-글로빈을 발현하는 마우스에 반응하였음을 관찰하였다(도 64c). 혈액 및 골수에서 γ-글로빈-양성 적혈구(Ter119+) 세포의 백분율은 비-적혈구(Ter119-) 세포의 백분율보다 상당히 더 높았다(도 64d). γ-글로빈 MFI에 대한 경우도 동일하였다(도 64e). 이는 미니-LCR이 적혈구 세포에서 우선적 발현을 부여함을 시사한다. 16 주차에, γ-글로빈 수준은 HPLC에 의해 측정된 성체 마우스 γ-글로빈 수준의 20.52(+/-5.66)%(도 64f) 및 qRT-PCR에 의해 22.33(+/-6.21)%(도 64g)였다. SB100x-시스템을 사용한 동일한 레지멘 하에 수행된 이전 연구에서, γ-글로빈 발현 수준은 HPLC에 의해 15.74(+/-2.69)% 및 qRT-PCR에 의해 15.40(+/-9.21)%였다(Li 등, Mol Ther Methods Clin Dev, 9, 142-152, 2018). 이는 γ-글로빈 발현 수준이 SB100x 시스템과 비교하여 표적화된 통합 시스템에 대해 더 높음을 의미한다. 사실, 표적화된 통합 시스템의 경우, β00 지중해빈혈 또는 겸상적혈구병 환자에 대해 성인 글로빈의 20% γ-글로빈으로 생각되는 치유 수준 범위에 있을 것이다(Wang 등,. J Clin Invest, 129, 598-615, 2019). 이전 연구와 일치하게(Wang 등,. J Clin Invest, 129, 598-615, 2019), 16 주차에 게놈 당 2 개의 통합 벡터 카피를 단일 Lin- 세포-유래 콜로니에서 평균으로 측정하였다(도 64h). Lin- 세포의 생체외 HSC 형질도입은 치명적으로 조사된 수용자에서 다중계통 생착 및 완전한 조혈 재구축에 대한 능력에 영향을 미치지 않았다(표시된 시점에서 인간 CD46+ 세포의 백분율(도 65a), 혈액, 비장, 및 골수에서의 백분율(도 65b) 참조). 2차 HSC 이식 수용자의 분석은 HDAd-CRISPR + HDAd-글로빈-공여자 벡터로 생체외 형질도입 이어서 생체내 선택이 장기간 재증식할 수 있는 HSC의 풀에 영향을 미치지 않았음을 나타내었다(RBC에서 인간 γ-글로빈+ 세포의 백분율(도 66a), 인간 CD46+ 세포의 백분율(도 66b), 및 혈액 및 골수에서의 백분율(도 66c) 참조).
HDAd-CRISPR + HDAd-글로빈-공여자 벡터를 사용한 생체내 HSC 형질도입 연구에서(도 67a), 생체내 선택 후, 5 마리 마우스 중 4 마리가 개별 마우스에서 40 내지 97% γ-글로빈+ RBC 범위로 RBC에서 안정된 γ-글로빈 발현을 나타내었다(도 67b). γ-글로빈 발현은 적혈구 세포에서 우선적으로 밝혀졌다(도 67c, 67d). RBC에서 γ-글로빈 발현 수준은 성체 마우스 γ-글로빈 수준에 대해 HPLC에 의해 23.97(+/-7.22)%(도 67e, 67h) 및 qRT-PCR에 의해 24.53(+/-7.34)%(도 67f)였다. 세포 당 벡터 카피 수는 개별 마우스에서 1.5 내지 2.5 개 범위였다(도 67g). 동일한 생체내 HSC 형질도입/선택 설정에서, SB100x 기반 γ-글로빈 벡터를 사용하여, 게놈 당 평균 2 개의 통합 벡터 카피를 갖는 γ-글로빈 수준은 HPLC에 의해 10.5(+/-3.1)% 및 qRT-PCR에 의해 12.17(+/-3.38)%였다(Wang 등, J Clin Invest, 129, 598-615, 2019). 치명적으로 조사된 수용자 내로 HDAd-CRISPR + HDAd-글로빈-공여자를 사용한 생체내 형질도입 후 16 주차에 수확된 골수 Lin- 세포의 이식은 성체 β-글로빈의 평균 24% γ- 수준으로 16 주에 걸쳐 RBC에서 100% 생착 및 안정된 γ-글로빈 발현을 나타내었다(표시된 시점의 PBMC에서 인간 CD46+ 세포의 백분율(도 68a); 표시된 시점의 말초 혈액에서 γ-글로빈+ 세포의 백분율(도 68b); 마우스 β-주요 단백질의 백분율로서 인간 γ-글로빈(도 68c); 및 혈액, 비장, 및 골수에서 백분율(도 68d) 참조).
요약하면, HDAd-CRISPR + HDAd-글로빈-공여자를 사용한 HSC 형질도입 연구는 SB100x-기반 시스템을 사용한 이전 연구에서 달성된 것보다 상당히 더 큰 수준으로 안정된 γ-글로빈 발현을 초래하였다.
AAVS 유전자이식 마우스에서 AAVS1 유전자좌의 국소화 . 통합 부위 분석을 위한 역PCR(iPCR)은 AAVS1/CD46-유전자이식 마우스의 게놈에서 AAVS1 유전자좌 국소화에 대한 지식이 필요하다. 이를 결정하기 위해, 물리적으로 근위 서열의 가교를 수반하는 표적화된 유전자좌 증폭(TLA)/PCR 기술을 사용하였다(de Vree 등, Nat Biotechnol, 32, 1019-1025 2014; 재료 및 방법 참조). 그런 다음 AAVS1/CD46-tg 마우스의 골수 세포에서 수득된 TLA 데이터를 참조 마우스 게놈과 정렬하였다(도 69). TLA 결과는 위치 (Chr14:110443871-110461834)에서 염색체 14에 통합됨을 나타낸다(도 55b). 이 정보를 사용하여, 프라이머를 사용하여 유전자좌를 서열분석하였다(도 70). 왼쪽에서 오른쪽으로 및 오른쪽에서 왼쪽으로 향하는 AAVS1 유전자좌의 반복이 발견되었다. 두 말단 반복부(# 1 및 #5)를 각각 4.5 및 2.8 kb 길이로 절두하였다. 반복부 #5는 완전한 5' 상동성 영역이 결여되었다. 이러한 표적 부위 무리가 통합 부위 분석을 복잡하게 만들었다. HDAd-CRISPR + HDAd-공여자 시스템에 의한 통합에 대한 이론적 결과의 일부는 도 70에 요약되어 있다.
HDAd-CRISPR+HDAd-공여자를 사용한 생체외 및 생체내 HSC 형질도입 후 염색체 통합. 먼저 게놈 서던 블롯을 16 주차에 수확된 골수 세포의 DNA에서 수행하였다. EcoRI-소화된 게놈 DNA와 AAVS1 특이적 프로브의 혼성화는 모든 분석된 마우스에서 AAVS1 유전자좌의 하나(또는 그 이상)의 반복부 내로 공여자 카세트의 통합을 나타내는 3.9 kb-특이적 밴드를 나타내었다(도 71a). Blp1-소화된 DNA와 GFP 프로브의 혼성화는 전장 반복부 #2-4로의 통합을 나타내는 10 마리 마우스 중 5 마리에서 5.8 kb 신호를 초래하였다(도 71b). 5 및 6 kb 신호는 반복부 #1 및 5 각각으로의 통합 결과일 수 있다. 10 마리 마우스 중 2 마리는 여러 AAVS1 모티프 반복부 내로의 통합을 갖는 것으로 나타났다. 이식유전자/염색체 접합부의 존재를 입증하기 위해, iPCR을 마우스의 게놈 DNA에서 수행하였다(도 72a, 72b). 분석된 8 마리 마우스 중 6 마리는 AAVS1 부위로의 HDR-매개 통합과 일치하는 PCR 생성물을 나타내었다(도 72b). 이들 마우스 중 여러 마리는 염색체 5 상의 CRISPR/Cas9 표적외 부위 중 하나로의 통합을 초래하는 추가적인 밴드를 가졌다(도 72b). 접합부로서 ITR을 수반하는 전장 HDAd 게놈의 통합에서 유래된 밴드가 또한 발견되었다. 흥미롭게도, 이러한 통합된 전장 HDAd 게놈은 CRISPR AAVS1 표적 부위를 함유하는 염색체인 염색체 14 상에 있었다(도 72b). 골수 세포의 풀에서 유래된 이러한 결과를 복잡하지 않게 하려는 시도에서, d GFP+ 골수 Lin- 세포를 플레이팅하여 단일 세포에서 유래된 전구체 콜로니를 생성하였다(도 72c). AAVS1로의 HDR-통합에 특이적인 1 개의 밴드만 있는 마우스(예를 들어 마우스 #943)의 콜로니에 대한 분석은 모든 콜로니에서 균일한 신호를 나타낸 반면, 추가적인 표적외 통합을 갖는 마우스(예를 들어 #946)의 콜로니는 키메라 패턴을 나타내었으며: 10 개 콜로니 중 9 개는 표적내 통합만을 가졌고, 1 개 콜로니는 표적내 및 표적외 통합을 둘 다 함유하며, 이는 게놈 당 통합된 이식유전자의 평균 수가 2이기 때문에 가능하다. HDAd-CRISPR 및 HDAd-글로빈-공여자 벡터를 사용한 생체외 및 생체내 형질도입 연구에서 골수 세포의 통합 부위 분석은 유사한 결과를 보였다(도 73a 및 73b는 표적내 통합(도 73a) 및 표적내 및/또는 표적외 통합을 갖는 샘플(도 73b)을 나타낸다). HDAd-CRISPR + HDAd-글로빈-공여자를 사용한 생체외 HSC 형질도입 설정에서, HDAd-GFP-공여자 벡터를 사용한 생체내 HSC 형질도입 연구와 비교하여 표적화된 통합을 갖는 동물의 더 높은 비율이 발견되었다. 이는 더 긴 상동성 영역에 기반한 더 높은 HDR 효능 때문일 수 있다.
전반적으로 이러한 통합 연구는 AAVS1 유전자좌로 표적화된 통합의 높은 빈도를 나타낸다. 통합 분율은 CRISPR 표적외 부위 및 아마도 표적 부위에 함유된 염색체 상의 CRISPR-촉발된 큰 결실을 수반하는 영역으로 발생하였다.
논의. 자기-불활성화 렌티바이러스 벡터는 감마-레트로바이러스 벡터와 대조적으로 임상 HSC 유전자 요법 시험에서 삽입 부위-연관 악성 클론 확장과 연관되지 않았다. 그러나, 이 위험은 비-인간 영장류에서 최근 연구에 나타낸 바와 같이 완전히 제외될 수는 없었다(Espinoza 등, Mol Ther, 6, 1074-1086, 2019). 이론적으로, SB100x에 의해 매개되는 무작위 통합 패턴 및 활성화 유전자 및 프로모터 내로 통합을 위한 선호도 결여는 더 안전해야 하지만 유전독성에 관한 우려가 남아있다. 따라서, 관련 분야의 주요 노력은 AAVS1 부위과 같은 미리 선택된 부위로 표적화된 이식 유전자 통합을 목표로 한다. 인간 HSC에서 아연 핑거 뉴클레아제 mRNA 및 AAV6-매개 공여자 주형 전달은 AAVS1 유전자좌로 50% 초과의 표적화된 통합을 초래하였다(De Ravin 등, Nat Biotechnol, 34, 424-429, 2016).  공여자 주형을 전달하기 위해 AAVS1-특이적 CRISPR/Cas9 RNP 및 AAV6을 이용하는 다른 연구에서, 부위-특이적 통합의 빈도는 25%였다(Johnson 등, 2018. Sci Rep, 8, 12144).  CCR5로의 표적화된 통합에 대해 유사한 비율이 달성되었다(Hung 등, Mol Ther, 26, 456-467, 2018).
AAVS1로의 표적화된 통합을 위한 이 접근법은 다수의 새로운 측면이 있다. (i)  공여자 주형을 전달하기 위한 헬퍼-의존적, 캡시드-변형된 HDAd벡터의 사용. 상응하는 게놈은 두 단부 상에서 바이러스 TP 단백질에 공유적으로 연결된 이중가닥 선형 DNA이다. 단일-가닥 AAV6 공여자 벡터와 대조적으로, 이중-가닥 선형 아데노바이러스 DNA는 HDR에 대한 최적의 주형이 아닌 것으로 생각된다. 이러한 잠재적인 단점을 보완하기 위해, AAVS1 CRISPR/Cas9 절단 부위를 HDAd-공여자 벡터 내로 혼입하여 유리 "재조합원성" DNA 단부를 생성하였다. (ii) HDAd벡터의 삽입 용량은 30 kb이기 때문에 rAAV6 또는 IDLV 벡터의 패키징 용량을 초과하는 상동성 아암을 혼입하는 것이 가능하였다. 이전 연구(Balamotis 등, Virology, 324, 29-237, 2004, Ohbayashi 등, Proc Natl Acad Sci USA, 102, 13628-13633, 2005, 및 Suzuki 등, Proc Natl Acad Sci USA, 105, 13781-13786, 2008) 및 0.8 및 1.8 kb 상동성 영역을 갖는 HDAd-공여자 벡터의 비교는 상동성을 증가시키는 것이 높은 수준의 이식유전자 발현을 갖는 반응자 마우스의 수 뿐만 아니라 표적화된 통합을 갖는 마우스의 분율을 개선시켰음을 시사한다. (iii) 큰 HDAd5/35++ 삽입 용량은 또한 mgmtP140K-기반 생체내 선택 카세트를 공여자 주형에 포함하는 것을 허용하여, 저용량 O6BG/BCNU를 사용한 단기간 치료에 의해 형질도입된 원시 HSC의 풀에 영향을 미치지 않으면서 자손 세포의 선택적 생존 및 확장을 매개한다(Wang 등, Mol Ther Methods Clin Dev, 8, 52-64, 2018). HDR의 낮은 효능 및 결과적으로 HSC에서 표적화된 통합을 고려하면(Genovese 등, Nature, 510, 235-240, 2014), 생체내 HSC 선택은 말초 혈액 세포에서 높은 이식유전자 마킹 수준을 달성하는 데 중요한 것으로 보인다. (iv) 마지막으로, 고수율 HDAd5/35++ 벡터 생산의 용이성 및 원시 HSC에 대한 향성으로 인해, 이들은 동원된 동물에 정맥내 주사를 통한 생체내 HSC 형질도입에 사용될 수 있다. 따라서, 표적화된 이식유전자 통합으로 혈색소병증의 생체내 HSC 유전자 요법의 원리 증명을 수행하는 것이 가능하였다.
안정된 이식유전자(GFP 또는 γ-글로빈) 발현을 달성하기 위해, HDAd-공여자 및 HDAd-CRISPR의 공동 감염이 필수적이었으며, 이는 CRISPR-매개 게놈 DNA 파괴 및, 가장 가능성 있게는 HDAd-공여자 벡터에서 공여자 주형의 방출이 통합을 크게 자극하였음을 시사한다. HDAd-공여자 + HDAd-CRISPR을 사용한 생체내 형질도입 후 HSC로 이식유전자 통합을 위한 지표는 생체내 선택 완료 후 안정된 높은 수준의 이식유전자 발현을 나타낸 마우스의 분율(즉 "반응자")이었다. HDAd-GFP-공여자 + HDAd-CRISPR의 경우 16 개 중 6 개(37.5%) 및 HDAd-글로빈-공여자 + HDAd-CRISPR의 경우 5 개 중 4 개(80%)였다. 특히, 표적화된 통합 빈도가 높은 "반응자" 비율은 생체외 형질도입 설정에서 두 벡터에 대해 100%였다. 이는 표적화된 생체내 HSC 형질도입 접근법에 대한 제한 인자가 HSC 감염의 효능임을 나타낸다. 초기 감염 단계는 이론적으로 최적화된 HSC 동원 레지멘(Psatha 등, Hum Gene Ther Methods, 25, 317-327, 2014) 및 하루 간격으로 2 차례의 HDAd 주사에 의해 개선될 수 있다.
이러한 데이터는 벡터 시스템이 생체외 및 생체내 형질도입 설정에서 HSC의 표적화된 통합을 달성하기 위한 효율적인 도구임을 나타낸다. 이는 대부분 HDAd-공여자 벡터를 비-분할 세포의 핵으로 전달하는 높은 효능, 벡터 백본에서 공여자 카세트를 방출하는 능력, 및 큰 상동성 영역을 혼입하는 HDAd 벡터의 용량 때문일 수 있다.
이 연구에서 중요한 발견은 표적화된 통합 시스템이 시험관내, 생체외, 및 생체내 형질도입 설정에서 SB100x-기반 시스템보다 더 높은 이식유전자 발현 수준을 부여하였다는 점이었다. 이는 특히 성인 글로빈 수준의 20%를 초과하는 수준에서 γ-글로빈을 필요로 하는 혈색소병증(β00 지중해빈혈 및 겸상적혈구병)의 유전자 요법과 관련된다. HDAd-CRISPR + HDAd-글로빈-공여자를 사용하여 생체외 또는 생체내 형질도입된 "반응자" 마우스에서, 이러한 이론적으로 치유 수준이 달성되었다. 이는 SB100x 트랜스포사제 시스템이 γ-글로빈 유전자 추가를 위해 활용된 지중해빈혈 마우스 모델의 이전 연구에 비해 중요한 개선이다(Wang 등, J Clin Invest, 129, 598-615, 2019). 이식유전자 발현에 대한 에피게놈 효과는 HSC(Wang 등, Genome Res, 17, 1186-1194, 2007, Huser 등, PLoS Pathog, 6, e1000985, 2010, van Rensburg 등, Gene Ther, 20, 201-214, 2013) 및 AAVS1 유전자이식 마우스에서 개방 염색질 구성을 유지하는 것으로 알려진 AAVS1 유전자좌로의 통합 후 덜 명백할 수 있다. 한편으로, 무작위 SB100x-매개 통합은 침묵을 겪는 영역으로 이식유전자를 배치하는 것을 제외할 수 없다.
통합 부위 분석은 HUDEP-2 세포의 시험관내 형질도입 후 거의 100% 표적화된 통합 효능을 시사한다. 생체외 및 생체내 HSC 형질도입 연구에서, 게놈 골수 DNA에 대한 서던 블롯 및 iPCR은 둘 다 골수 HSC에서 효율적인 표적화된 통합을 나타내었다. 예를 들어, 통합 접합부의 iPCR은 마우스의 75%에서 표적화된 통합을 입증하였으며, 이러한 마우스 중 대부분은 표적외 통합이 없었다. 이는 단일 CFU에서 유래된 콜로니의 분석에 의해 추가로 확인되었다. 낮은 빈도에서, 통합은 또한 인 실리코 예측된 CRISPR Cas9 표적외 부위 중 2 개에서 발견되었다. 또한, AAVS1 유전자좌를 보유하는 염색체인 염색체 14에서 통합된 전장 HDAd-공여자 게놈이 발견되었다. HDAd ITR은 DNA 파괴가 일어나기 쉽고 이는 DNA 파괴가 발생하는 게놈 부위로 비효율적인 통합을 초래할 수 있음이 이전에 밝혀졌다(Wang 등, J Virol, 79, 10999-11013, 2005, Wang 등, J Virol, 80, 11699-11709, 2006). 표적 부위 주위의 CRISPR/Cas9-유도된 원치않은 큰 결실/전좌(7-8 kb)에 대한 최근 연구를 고려하면(Kosicki 등, Nat Biotechnol, 36, 765-771, 2018), 표적 부위에서 멀리 떨어진 CRISPR-Cas9 DNA 파괴가 완전한 HDAd 게놈의 통합에 연루될 수 있음이 가능하다. 전반적으로, 큰 결실/전좌에 대한 보고서는 CRISPR/Cas9의 안정성에 문제를 제기한다. 반면에, 동물에서 CRISPR/Cas9-매개 생식계열 편집과 연관된 발달 효과는 지금까지 보고되지 않았기 때문에, 이러한 해로운 염색체 변화가 있는 세포가 발달 동안 선택될 가능성이 있다. 이 가설에 대한 뒷받침은 CRISPR Cas9-편집된 HSC가 이식되었고 HBG1/2 영역에서 9 kb 결실이 시간 경과에 따라 PBMC에서 사라졌다는 최근 NHP 연구에서 기인한다(Humbert 등, 23rd Annual Meeting of the ASGCT, abstract # 974, 2019).
이들 연구로부터, AAVS1tg 마우스 모델은 다중 AAVS1 표적 유전자좌의 존재로 인해 CRISPR/Cas9를 수반하는 표적화된 통합 연구에 차선이라는 결론을 내릴 수 있으며, 이 중 일부는 HDAd-공여자 벡터가 있는 상동성 영역을 손실하는 정도로 절두되다. 절두된 AAVS1 유전자좌의 존재는 또한 재배열이 이전에 보고된 바와 같이 AAVS1 유전자이식 마우스에서 발생할 수 있음을 시사한다(Linden 등, Proc Natl Acad Sci USA, 93, 7966-7972, 1996).
실시예 6. 면역 체크포인트 억제제를 사용한 예방적 생체내 조혈 줄기 세포 유전자 요법은 동계 마우스 종양 모델에서 종양 성장을 역전시킨다.
이 실시예에 함유된 정보 중 적어도 일부는 Li 등(Cancer Res. 80(3):549-560, 2020; 2019년 11월 14일 온라인 공개됨)에 공개되었다.
암-연관 생식계열 돌연변이에 대한 집단-와이드 테스트는 난소 및 유방 암종의 1/5 초과가 선천적 위험과 연관되어 있음을 규명하였다. 난관난소절개술 및/또는 유방절제술은 현재 고위험 돌연변이가 있는 여성에게 제공되는 유일한 효과적인 옵션이다. 목표는 선천적 돌연변이의 보균자에 대한 면역-예방을 제공하는 오래 지속되는 접근법을 개발하는 것이다. 이 접근법은 초기 단계에서, 종양이 골수에서 조혈 줄기/전구체 세포(HSPC)를 모집하고 종양-촉진 세포로 분화한다는 사실을 활용한다. 생체내에서 HSPC를 유전적으로 변형하기 위해 기술적으로 간단한 기술이 개발되었다. 기술은 HSPC 동원 및 통합 HDAd5/35++ 벡터의 정맥내 주사를 수반한다. GFP-발현 벡터로의 생체내 HSPC 형질도입 및 후속 동계 종양 세포 이식은 종양 침윤 백혈구에서 80% 초과의 GFP-마킹을 나타내었다. 이식유전자의 발현을 제어하기 위해, HSPC가 종양에 의해 모집되고 분화되는 경우에만 활성화되는 miRNA 조절 시스템이 개발되었다. 면역 체크포인트 억제제 αPD-L1-γ1을 효과기 유전자로 사용하여 접근법을 테스트하였다. 이식된 마우스 유선 암종(MMC) 종양이 있는 생체내 HSPC-형질도입된 마우스에서, 초기 종양 성장 후, 종양은 퇴행하고 관찰 기간 내내 재발하지 않았다. 퇴행은 T-세포 매개되었다. 항-PD-L1 단클론 항체를 사용한 "통상적인" 치료는 유의한 항-종양 효과가 없었으며, 이는 αPD-L1-γ1의 조기 자기-활성화 발현이 MMC 종양에서 면역억제성 환경을 극복할 수 있음을 나타낸다. 접근법의 효능 및 안전성은 예방적 및 치료적 설정 둘 다에서 전형적인 생식 계열 돌연변이가 있는 난소암 모델(ID8 p53-/- brca2-/-)에서 추가로 검증되었다.
재료 및 방법 .
HDAd5/35++ 벡터: HDAd-SB는 Richter 등, Blood. 128: 2206-2217, 2016에 기재되어 있다. 마우스 αPD-L1-γ1 이식유전자는 Engeland 등, Mol Ther. 22: 1949-1959, 2014)에 기재되어 있고; 116 세포에서 HDAd5/35++ 벡터의 생산은 Palmer 등, Methods in Molecular Biology, 33-53, 2009에 기재되어 있다. 헬퍼 바이러스 오염 수준은 0.05% 미만인 것으로 밝혀졌다. 역가는 6-12x1012 vp/ml였다. 이 연구에 사용된 모든 HDAd 벡터는 Ad5 섬유 꼬리, Ad35 섬유 샤프트, 및 친화도-향상된 Ad35++ 섬유 놉으로 구성된 키메라 섬유를 함유한다(Wang 등, J Virol. 82: 10567-10579, 2008). 모든 HDAd 제제는 다른 곳에 기재된 프라이머를 사용하여 qPCR에 의해 측정된 1010 vp에서 1 개 미만의 카피 야생형 바이러스를 가졌다(Haussler 등, PLoS One. 6: e23160, 2011).
HDAd-GFP/mgmt 및 HDAd-αPD-L1γ 1 miR423 벡터의 구축. 단계 1: PGK 프로모터, β-글로빈 3' UTR 및 BGH polyA 단편을 pHCA-HBG-CRISPR/mgmt로부터 PCR 증폭시킨 후(Li 등, Blood. 2018;131: 2915-2928), Gibson 어셈블리(New England Biolabs)에 의해 pBS-Z-Ef1α의 BstBI 부위로 삽입하여(Saydaminova 등, Mol Ther Methods Clin Dev. 1: 14057, 2015), pBS-PGK-3'UTR을 생성하였다. GFP 코딩 서열을 pHM5-frt-IR-EF1α-mgmt-2a-GFP로부터 PCR 증폭시키고(Wang 등, Mol Ther Methods Clin Dev. 8: 52-64, 2018) EcoRI 선형화 pBS-PGK-3'UTR과 결찰시켜, pBS-PGK-GFP를 생성하였다. 단계 2: Ef1α-mgmtP140K-SV40pA-cHS4 절연체 카세트를 pHM5-T/μLCR-γ-글로빈-mgmt-FRT2로부터 증폭시키고(Li 등, Mol Ther Methods Clin Dev 9: 142-152, 2018) PacI-소화된 pHM5-T/μLCR-γ-글로빈-mgmt-FRT2와 결찰시켜, pHM5-FRT-IR-Ef1α-mgmt를 형성하였다. cHS4의 3' 측면에서 BsrGI 부위를 하류 사용을 위해 프라이머에 의해 도입하였다. pHM5-FRT-IR-Ef1α-mgmt의 박테리아 플라스미드 백본을 나중 주입 클로닝을 위한 15 bp 상동성 아암(HA)을 함유하는 프라이머(Takara, 캘리포니아주 마운틴뷰 소재)를 사용하여 pBS-Z-Ef1α로부터 백본으로 전환하여, pBS-FRT-IR-Ef1α-mgmt를 생성하였다. 2 개의 Frt-IR 구성요소에 플랭킹하는 2 개의 15 bp HA는 PacI 소화 시 노출되어 하기 기재된 변형된 pHCA 작제물과의 재조합을 용이하게 할 수 있다. 그런 다음, PGK-GFP-3'UTR-BGHpA 단편을 단계 1의 pBS-PGK-GFP에서 pBS-FRT-IR-Ef1α-mgmt의 BsrGI 부위로 이동시켜, pBS-FRT-IR-GFP/mgmt를 생성하였다. 단계 3: pHCA에서 원래 PacI 부위를 2 개의 어닐링된 올리고 서열을 삽입하여 파괴시켰다. 2 개의 HA와 함께 새로운 PacI 부위를 BstBI 부위에서 생성하였다. 마지막으로, pBS-FRT-IR-GFP/mgmt 및 변형된 pHCA 둘 다의 PacI 소화 후, 생성물을 주입 클로닝에 의해 재조합하여, 후속 바이러스 구제에 사용된 pHCA-FRT-IR-GFP/mgmt를 생성하였다. HDAd-αPD-L1γ1은 GFP 코딩 서열 대신에, 항-PD-L1-γ1 이식유전자가 단계 1 에서 pBS-PGK-3'UTR의 EcoRI에 삽입된 것을 제외하고, 이 실시예에서 다른 곳에 기재된 HDAd-GFP/mgmt와 유사하게 구축하였다. microRNA 조절된 유전자 발현을 위해, 합성된 4 개의 miR423 올리고(정방향(서열번호: 24); 역방향(서열번호: 25))를 어닐링하고 pBS-PGK-3'UTR의 AvrII-XhoI 부위에 삽입하여, pBS-PGK-miR423-3'UTR을 생성한 다음, 항-PD-L1-γ1 삽입에 사용하였다.
HDAd-GFP-423은 4 개의 miR423 표적 부위를 HDAd-GFP/mgmt의 3'UTR에 삽입함으로써 유사한 방식으로 구축하였다.
유세포 분석: 세포를 1 % FCS가 보충된 PBS에 1x106 개 세포/100 μL로 재현탁하고 얼음 위에서 10 분 동안 FcR 차단 시약(Miltenyi Biotech, 캘리포니아주 오번 소재)과 함께 배양하였다. 다음으로 염색 항체 용액을 106 개 세포 당 100 μL로 첨가하고 암실에서 30 분 동안 얼음 위에서 배양하였다. 배양 후, 세포를 FACS 완충액(PBS, 1% FBS)에서 1 회 세척하였다. 2차 염색을 위해 염색 단계를 2차 염색 용액으로 반복하였다. 세척 후, 세포를 FACS 완충액에 재현탁하고 LSRII 유세포 분석기(BD Biosciences, 캘리포니아주 산호세 소재)를 사용하여 분석하였다. 파편은 전방 산란 영역 및 측방 산란 영역 게이트를 사용하여 제외하였다. 그런 다음 단일 세포를 전방 산란 높이 및 전방 산란 폭 게이트를 사용하여 게이팅하였다. 그런 다음 유세포 분석 데이터를 FlowJo(버전 10.0.8, FlowJo, LLC)를 사용하여 분석하였다. 일치된 이소형-대조군을 모든 실험에 포함하였다.
면역표현형에 대한 유세포 분석: 림프구 유세포 분석 패널 8c(CD45-APC/Cy7, 클론 30-F11, cat# 103116; CD3-APC, 클론 17A2, cat# 100236; CD4-PE/Cy7, 클론 GK1.5, cat# 100422; CD8a-PE, 클론 53-6.7, cat# 100708; CD25-BV421, 클론 PC61, cat# 102043; CD19-BV510, 클론 6D5, cat# 115546; 이들 항체는 모두 BioLegend에서 수득함) 및 골수성 패널 9c(CD45-APC/Cy7, 클론 30-F11, BioLegend, cat# 103116; CD11c-APC, 클론 N418, BioLegend, cat# 117310; F4/80-PE, 클론 C1:A3-1, Cedarlane, cat# CL8940PE; MHCII-BV510, 클론 M5/114.15.2, BioLegend, cat# 107635; Siglec F-PerCP, 클론 1RNM44N, eBioscience, cat# 46-1702-82; Ly6C-BV421, 클론 AL-21, BD Biosciences, cat# 562727; CD11b-PE/Cy7, 클론 M1/70, eBioscience, cat# 25-0112-82; Ly6G-BV605, 클론 1A8, BioLegend, cat# 127639)를 사용하였다. 게이팅 전략은 도 76에 제시된다. LSK(계통- /Sca-1+/c-Kit+) 세포는 Richter 등, Blood. 2016;128: 2206-2217에서 이전에 특성화되었다. 다음 항체를 또한 사용하였다: 비오틴-접합된 계통 검출 칵테일(Miltenyi Biotec, 샌디에이고 소재, cat# 130-092-613); 항-마우스 LY-6A/E(Sca-1)-PE-Cyanine7(클론 D7, eBioscience, 샌디에이고 소재, cat# 25-5981-82); 항-마우스 CD117(c-Kit)-PE(클론 2B8, eBioscience, 샌디에이고 소재, cat# 12-1171-83); 항-마우스 CD3-APC(클론 17A2, Invitrogen, 매사추세츠주 월섬 소재, cat# 17-0032-82); 항-마우스 CD19-PE-Cyanine7(클론 eBio1D3, eBioscience, 샌디에이고 소재, cat# 25-0193-82); 항-마우스 Ly-6G(Gr-1)-PE(클론 RB6-8C5, eBioscience, 캘리포니아주 샌디에이고 소재, cat #12-5931-82); 항-인간 CD46-APC(클론 E4.3, BD Pharmingen, 캘리포니아주 샌디에이고 소재, cat# 564253).
IFNγ-유세포 분석: 50 mL 팔콘 튜브에 부착된 70 μm 세포 여과기를 통해 새로 수확된 비장을 통과시켜 비장세포를 단리하였다. 300 x g에서 10 분 동안 원심분리 후, 세포를 1 mL 1 x BD Pharm Lyse™ 용해 용액(BD Pharmingen, 캘리포니아주 샌디에이고 소재, cat# 555899)에 재현탁하고 30 초 동안 배양함으로써 적혈구를 제거하였다. 20 mL RPMI-1640 배지를 첨가하여 용해 반응을 중지시켰다. 원심분리 및 10% 열-불활성화 FBS, 100 단위/ml 페니실린 및 100 mg/ml 스트렙토마이신을 함유하는 RPMI-1640 배지에 재현탁 후, 수득된 비장세포를 5% CO2를 함유하는 가습 인큐베이터의 96-웰 조직 배양 플레이트에 5 x 106 개 세포/ml(200 μl/웰)로 배양하였다. 1 x 세포 자극 칵테일 및 단백질 수송 억제제(eBioscience, 샌디에이고 소재, cat# 00-4975-93)가 세포 내에서 IFN-γ 생산의 유도 및 축적을 위해 배양 배지에 존재하였다. 12 시간 동안 자극 후, 세포를 수집하고, 먼저 상기 기재된 바와 같이 세포 표면 마커로 염색한 다음, 제조업체의 지침에 따라 IFN-γ (BioLegend, 캘리포니아주 샌디에이고 소재, cat# 505842)에 대한 세포내 염색에 적용하였다.
Neu-사량체 유세포 분석: PE-표지된 H-2Dq/RNEU420-429(H-2D(q)PDSLRDLSVF)(서열번호: 290) 사량체를 국립 알레르기 및 전염병 질환 연구소 MHC 사량체 코어 시설(조지아주 애틀랜타 소재)에서 수득하고, 제조업체의 지침에 따라 사용하였다.
유세포 분석, FACS, 및 웨스턴 블롯을 위한 종양-침윤 백혈구의 단리: 종양 부피가 500 mm3에 도달했을 때 마우스를 희생시켰다. 종양을 수확하고, 절단하고 부드럽게 혼합하면서 37℃에서 30 분 동안 5 mL의 RPMI 1640에서 300 U/mL 콜라게나제 I(Sigma-Aldrich, 미주리주 세인트루이스 소재, cat# C0130) 및 1 mg/mL 디스파제 II(Sigma-Aldrich, cat# 4942078001)로 소화시켰다. 소화 후, 2000 U/mL DNase I(Sigma-Aldrich, cat# 260913)을 첨가하여 방출된 DNA를 제거함으로서 점도를 감소시켰다. 소화된 조직을 주사기 플런저를 사용하여 70 μm 세포 여과기를 통해 통과시켜 단일 세포 현탁액을 수득하였다. 이후에, 종양 침윤 백혈구를 마우스 CD45(TIL) 마이크로비드(Miltenyi Biotech, 캘리포니아주 오번 소재, cat# 130-110-618)를 사용하여 단일 세포 현탁액으로부터 정제하였다.
면역형광 연구: 종양 슬라이드를 아세톤/메탄올로 고정시키고(10 분) PBS로 2 회 세척하였다. 슬라이드를 5% 블롯팅 등급 우유(Bio-Rad, 캘리포니아주 에르쿨레스 소재)를 함유하는 PBS를 사용하여 실온에서 20 분 동안 차단한 후 PBS 중 1 차 항체와 함께 실온에서 1 시간 동안 배양하였다. 그런 다음 슬라이드를 PBS로 2 회 세척하고 2차 항체와 함께 실온에서 1 시간 동안 배양한 후 PBS로 3 회 세척하였다. 슬라이드를 PBS로 2 회 세척하고, 형광용 장착 배지(Vector Laboratories 캘리포니아주 벌링게임 소재)로 장착한 다음 형광 현미경을 사용하여 분석하였다. 항-라미닌 다클론(1차) 항체(1:200; #Z0097; Dako, 캘리포니아주 카핀테리아 소재) 및 염소 항-토끼 IgG Alexa Fluor568(2차) 항체(1:200; Molecular Probes, 캘리포니아주 칼즈배드 소재)를 사용하여 라미닌을 검출하였다.
마우스 조직의 면역조직화학: 조직을 10% 포르말린에 고정시키고 헤마톡실린 및 에오신 염색으로 처리하였다. 모든 샘플은 2 명의 숙련된 병리학자에 의해 맹검 방식으로 전형적인 염증 징후에 대해 검사하였다.
T-세포 검정: MMC 세포(Neu-양성) 및 동계 neu/CD46-유전자이식 마우스(Neu-음성)의 비장세포를 20 분 동안 50 mg/m의 최종 농도에서 미토마이신 C로 처리한 다음, 광범위하게 세척하였다. 테스트 동물(HDAd-αPD-L1-γ1 처리) 및 미처리 대조군 동물(미처리)의 비장 세포를 미토마이신 C 처리된 세포와 1:1로 혼합하고 10 U/ml IL-2의 존재 하에 1 일 동안 배양하였다. 대조군 비장세포를 또한 PMA/이오노마이신으로 처리하였다. 상청액의 IFNγ 농도를 IFNγ ELISA(InVitrogen, cat# 88-7214-22)에 의해 측정하였다
MicroRNA 어레이 분석은 UW Functional Genomics, Proteomics & Metabolomics Facility Core using Affymetrix miRNA 4.0 어레이에 의해 수행하였다
실시간 PCR: 총 RNA를 제조업체의 지침에 따라 TRIzoI™(Invitrogen)을 사용하여 종양 침윤 백혈구, PBMC, 비장세포 및 골수 세포로부터 추출한 다음, 역전사시켜 Qiagen의 QuantiTect 역전사 키트(cat# 205311)를 사용하여 cDNA를 생성하였다. 키트에 제공된 gDNA 제거 시약을 사용하여 잠재적인 게놈 DNA 오염을 제거하였다. Power SYBR Green PCR 마스터 믹스(Applied Biosystems)를 사용하여 비교 실시간 PCR을 수행하였다. 다음 프라이머를 사용하였다: 항-마우스 PDL1 정방향(서열번호: 238), 및 역방향(서열번호: 239); 마우스 PPIA 정방향(서열번호: 240), 및 역방향(서열번호: 241); 마우스 RPL10 정방향(서열번호: 189), 및 역방향(서열번호: 190).
마우스 PPIA를 내부 대조군으로 사용하였다. 두번째 내부 대조군 마우스 RPL10이 또한 포함되었고 유사한 결과를 관찰하였다. 결과는 2(-ΔΔCt) 방법에 따라 계산하고 상응하는 종양 샘플의 cDNA 수준을 100%로 설정하여, 상대적 발현의 백분율로 표시하였다.
계통-고갈된(Lin - ) 골수 세포의 단리: 계통-수임 세포의 고갈을 위해, 마우스 계통 세포 고갈 키트(Miltenyi Biotec, 캘리포니아주 샌디에이고 소재)를 제조업체의 지침에 따라 사용하였다.
콜로니 형성 단위 검정. 총 2500 개의 Lin- 세포를 ColonyGEL 1202 마우스 완전 배지(ReachBio, 워싱턴주 시애틀 소재)에 삼중으로 플레이팅하고 5 % CO2 및 최대 습도에서 37 ℃에서 12 일 동안 배양하였다. 콜로니를 Leica MS 5 해부 현미경(Leica Microsystems)을 사용하여 열거하였다.
세포: 마우스 유선 암종(MMC) 세포를 neu/CD46-tg 마우스의 자발적 종양으로부터 확립하였다. MMC 세포 입증을 Neu-특이적 단클론 항체 7.16.4를 사용하여 면역형광에 의해 수행하였다(Knutson 등, Cancer Res. 2004;64: 1146-1151). TC-1 세포는 American Type Culture Collection(ATCC, 버지니아주 머내서스 소재)으로부터 수득하였다. TC-1 세포는 HPV-16 E6 및 E7 단백질을 안정하게 발현하는 불멸성 뮤린 상피 세포이다. C57Bl/6-유래 난소암 ID8 p53-/- brca2-/- 세포는 이전에 기재되었다. Walton 등, Cancer Res. 2016;76: 6118-6129. 이 세포주는 ID8 세포에서 p53brca2의 CRISPR/Cas9 녹아웃에 의해 생성하였다. MMC 및 TC-1 세포를 10% 소태아 혈청, 1 mmol/l 나트륨 피루베이트, 10 mmol/1 HEPES, 2 mmol/l L-글루타민, 100 단위/ml 페니실린 및 100 mg/ml 스트렙토마이신이 보충된 RPMI-1640에서 유지하였다. ID8 p53-/- brca2-/- 세포를 4% 소태아 혈청, 100 μg/mL 페니실린, 100 μg/mL 스트렙토마이신, 및 ITS(5 μg/mL 인슐린, 5 μg/mL 트랜스페린, 및 5 ng/mL 나트륨 셀레나이트)가 보충된 DMEM에서 배양하였다. 마이코플라즈마의 부재를 abm(캐나다 리치먼드(BC) 소재)의 PCR 마이코플라즈마 검출 키트를 사용하여 확인하였다. 증폭을 위해 동결보존된 세포를 해동시키고 4 회 계대하였다.
난소암 생검은 환자를 식별하는 데 도움이 되는 임의의 기밀 정보 없이 대서양 난소암 연구 컨소시엄(POCRC) 시료 보관소에 의해 제공되었다(Fred Hutchinson Cancer Research Center IRB 프로토콜 # 6289). 생검의 종양 조직을 4 mm 조각으로 절개하고 Strauss 등 (PLoS One. 6: e16186, 2011)에 이전에 기재된 바와 같이 콜라게나제/디스파제(Roche)와 함께 37℃에서 2 시간 동안 소화시켰다. 백혈구는 인간 CD45 마이크로비드(Miltenyi Biotech, cat #130-045-801)를 사용하여 자기 활성화된 세포 분류에 의해 단리하였다. 2 개의 고등급 장액성 난소암 생검의 종양-연관 백혈구를 풀링하고 RNA를 LC Sciences, LLC(텟사스주 휴스턴 소재)에 의해 일치하는 PBMC RNA와 비교하여 miRNA-Seq에 의해 분석하였다.
MicroRNA 분석: miRNA-Seq: 작은 RNA 서열분석을 이전에 기재된 바와 같이 수행하였다(Valdmanis 등, Nat Med. 2016;22: 557-562.). RNA를 miRNeasy 미니 키트(Qiagen Cat# 1071023)를 사용하여 추출하였다. 샘플 당 1 μg의 RNA를 ATP의 부재 하에 T4 RNA 리가제 1(New England Biosciences cat# M0204)을 사용하여 3' 보편적인 miRNA 클로닝 링커(New England Biosciences cat# S1315)에 결찰시켰다. 결찰된 샘플을 15% 우레아-폴리아크릴아미드 겔 상에서 실행하였다. 작은 RNA에 상응하는 단편(17-28 nt)을 겔로부터 절단하고, 다시 T4 RNA 리가제 1을 사용하여 5' 바코드에 결찰시켰다. 그런 다음 바코드화 샘플을 다중화하고 Illumina MiSeq 기계에서 서열분석하여 Precision Medicine의 UW Center에서 50 bp 단일-단부 판독물을 수득하였다. 바코드 및 어댑터를 서열에서 프리밍한 후 Bowtie 버전 0.12.7을 사용하여 miRBase 상의 마우스 microRNA에 정렬하여, 2 개의 불일치를 허용하였다(Langmead 등, Genome Biol. 10: R25, 2009).
작은 RNA에 대한 노던 블롯. 이 프로토콜은 Valdmanis 등, Nat Med. 2016;22: 557-562에 기재되어 있다. 다음 32P-γ-ATP 표지된 프로브를 사용하였다: miRNA의 경우 423-5p(서열번호: 235); U6의 경우 snRNA(서열번호: 236). 방사성 RNA 분자량 마커는 Ambion으로부터 수득하였다.
웨스턴 블롯: 조직 용해물을 SDS-PAGE에 의해 분리하고 블롯을 닭 항-HA-태그-HRP(Abcam, ab1190)와 함께 배양하였다. X-선 필름 상에서 화학발광 검출을 Pierce™ ECL Plus 웨스턴 블롯팅 기질(Thermo Fisher Scientific, cat# 34029)로 처리 후 수행하였다.
αPD-L1-γ 1 ELISA: 재조합 마우스 PD-L1 단백질(Sino Biological Inc, cat # 50010-M08H)을 2 μg/ml로 사용하여 ELISA 플레이트를 코팅하였다. 테스트 동물의 혈청을 1:10 희석으로 첨가하고 닭 항-HA-태그-HRP(Abcam, ab1190)를 사용하여 αPD-L1-γ 1 을 측정하였다.
동물 : 동물을 수반하는 모든 실험은 통제 기관 심의 위원회 및 IACUC의 승인을 받아 수행되었다.
hCD46-유전자이식 마우스 : 인간 CD46 게놈 유전자좌를 함유하고 인간과 유사한 수준 및 패턴으로 CD46을 발현하는 C57Bl/6 기반 유전자이식은 Kemper 등 (Clin Exp Immunol. 124: 180-189, 2001)에 기재되어 있다. 이들은 C57Bl/6 유래 TC-1 세포를 사용한 이식 연구에 사용되었다. Neu 유전자이식 마우스: Neu-tg 마우스(균주명: FVB/N-Tg(MMTVneu)202Mul)는 Jackson Laboratory(메인주 바 하버 소재)에서 수득하였다. 이러한 마우스는 마우스 유선 종양 바이러스 프로모터(게놈 당 1 개의 이식유전자 카피)의 제어 하에 돌연변이되지 않은 비활성화된 래트 neu를 보유한다. 생체내 형질도입 연구를 위해, CD46tg 및 neu-tg 마우스를 교배하여 CD46+/+/neu+ 마우스를 수득하였다.
생체내 HSPC 형질도입/선택 : 도 74a 참조.
CD8 세포 고갈 : CD8-T 세포를 200 μg 래트 항-마우스 CD8 IgG(169.4; ATCC)의 복강내 주사를 사용하여 고갈시켰다. 주사를 3 일마다 반복하여 고갈을 유지하였다.
통계 : 생체내 데이터의 통계적 유의성을 Kaplan-Meier 생존 곡선 및 로그-순위 테스트(GraphPad Prism Version 4)에 의해 분석하였다. 시험관내 데이터의 통계적 유의성은 양측 스튜던트 t-검정(Microsoft Excel)에 의해 계산하였다. 0.05 초과의 P 값은 통계적으로 유의하지 않은 것(n.s.)으로 간주된다.
결과 및 논의 .
50 세 이전에 유방암 진단 또는 모든 연령에서 난소암 진단을 받은 적어도 한 명의 직계 가족이 있는 여성은 이제 유전자 검사에 적용된다. 표적화된 포획 및 대량 병렬 게놈 서열분석을 사용하여, 생식 계열 돌연변이를 검출하고 암 발병 위험을 예측하는 일련의 다중 유전자 검사를 확립하였다. 이러한 검사 플랫폼 중에는 BROCA가 있다(Walsh 등, Proc Natl Acad Sci USA. 108: 18032-18037, 2011, Shirts 등, Genet Med. 18: 974-981, 2016). BROCA를 사용하여, 난소 및 유방 암종의 1/5 초과가 선천적 위험과 연관되어 있음을 규명하였다(Tung 등, Cancer. 121: 25-33, 2015). 문제는 고위험 보균자의 예방을 위한 현재 옵션이 지속적으로 개선되는 유전적 진단에 뒤쳐진다는 것이다. 불임, 심혈관 질환, 골다공증, 갱년기 증상, 및 심리적 효과를 포함하는 예방적 난관난소절개술 및 유방절제술의 부작용은 여성의 일생에 걸쳐 예상된다. CA125 및 HE4와 같은 혈청 마커의 사용은 난소암 사망률의 상당한 감소를 나타내지 않았다(Jacobs 등, Lancet. 387: 945-95, 2016). Her2/neu, HIF1α, 또는 MUC1과 같은 종양-연관 항원에 대한 예방적 백신은 모든 종양 세포 상에서 이들 항원의 존재에 의존하고, 항원-손실 돌연변이체의 발달에 의해 애를 먹고 있다(Knutson 등, Cancer Res. 64:1146-1151, 2004).
목표는 종양 재발에 대한 위험이 높은 환자, 및 궁극적으로, 암에 걸리기 쉬운 선천적 돌연변이의 보균자에서 암의 면역-예방을 허용하는 오래 지속되고 기술적으로 간단한 접근법을 개발하는 것이다. 종양 진행 동안, 악성 세포는 HSPC를 활성화하고 동원하는 다수의 특이적 케모카인을 분비하여 혈액 순환에 들어가고 종양-지지 세포로 분화하는 경우 종양으로 국소화하게 한다(Hanahan 등, Cell. 144: 646-674, 2011, Mantovani 등, Trends Immunol. 23: 549- 555, 2002). HSPC-유래 골수성 및 림프성 세포는 예를 들어 장액성 관 상피내 암종(STIC)에서 암 발병 초기 단계에 존재한다(Okla 등, Front Immunol. 10: 691, 2019; Colvin, Front Oncol. 4: 137, 2014; Baert 등, Front Immunol. 10: 1273, 2019). Sarkar 등, Genes Dev. 31: 1109-1121, 2017. 이 접근법은 조혈 줄기 세포의 유전적 변형에 기반한다. 이들 세포는 자기 재생할 수 있기 때문에, 1-회 개입은 평생 치료 효과가 있어야 한다. 백혈구분리반출술, 골수절제술 및 이식 없이 HSPC로의 생체내 유전자 전달을 가능하게 만드는 최소로 침습성이고 비용-효율적인 기술이 개발되었다(Richter 등, Blood. 128: 2206-2217, 2016, Wang 등, J Clin Invest. 129: 598-615, 2019). 이 접근법의 핵심 아이디어는 G-CSF/AMD3100을 사용하여 골수에서 HSPC를 동원하고, 주변부에서 많은 수로 순환하는 동안, 정맥내로 주사된 HSPC-향성 헬퍼-의존적 아데노바이러스 HDAd5/35++ 유전자 전달 벡터 시스템으로 형질도입하는 것이다. 이들 벡터는 원시 조혈 줄기 세포 상에서 발현되는 수용체인 CD46을 사용한다. 형질도입된 세포는 장기간 지속되는 경우 골수로 돌아간다. 이 연구에서 사용된 HDAd5/35++ 벡터 시스템의 새로운 특징은 다음을 포함한다: (i) i.v. 주사(간 포함) 후 비-조혈 조직의 감염을 피하면서 원시 HSPC의 효율적인 형질도입을 허용하는 CD46-친화도 향상된 섬유, (ii) 세포 당 1 내지 2 개의 통합 벡터 카피가 있는 유전자에 대한 선호도 없이 세포 요인과 무관하게 기능하고 무작위 이식유전자 통합을 매개하는 SB100X 트랜스포사제-기반 통합 시스템(도 74a), 및 (iii) 저용량 O6BG/BCNU를 사용한 단기간 치료에 의해 형질도입된 원시 HSPC의 풀에 영향을 미치지 않으면서 자손 세포의 선택적 생존 및 확장을 매개하는 MGMTP140K 발현 카세트(Wang 등, Mol Ther Methods Clin Dev. 8: 52-64, 2018). 혈색소병증에 대한 마우스 모델에서 생체내 HSPC 유전자 요법 방법의 효능 및 안전성이 최근에 입증되었다(Wang 등, J Clin Invest. 129: 598-615, 2019, Li 등, Blood. 131: 2915-2928, 2018). 여기서, 이 접근법은 암 성장을 예방하는 데 사용된다.
생체내 HSPC 형질도입 후 종양-침윤 백혈구에서 GFP 발현. 동계 종양이 있는 2 개의 인간 CD46 유전자이식 마우스 모델을 이용하였다. (CD46은 HDAd5/35++ 벡터를 사용한 HSPC 형질도입이 필요하다). 첫번째 모델은 유방 조직에서 마우스 유선 종양 바이러스 프로모터로부터의 래트 neu를 과발현하는 인간 CD46/래트 neu-유전자이식 마우스를 포함하였다. Neu-tg 마우스는 Treg에 의존하고 유방암 환자에서 관찰된 것과 유사한 Neu에 대한 활성 면역 허용을 발달시킨다(Knuston 등, J Immunol. 177: 84-91, 2006). 마우스 유선 암종 세포(MMC)는 자발적 neu/CD46-유전자이식 마우스 종양으로부터 유래된 Neu-양성 유방암 세포주이다(도 75). HSPC를 neu/CD46 tg 마우스에 동원하고 통합 GFP-발현 HDAd5/35++ 벡터(도 74a)를 주사하였다. 이전 연구와 유사하게(Wang 등, Mol Ther Methods Clin Dev. 8: 52-64, 2018), O6BG/BCNU를 사용한 3 차례의 저용량 처리는 PBMC의 80%에서 안정된 GFP 발현을 초래하였다(도 74). 생체내 HSPC 형질도입 후 17 주차에, 동계 MMC 세포를 유선 지방 패드에 이식하고 종양 성장을 모니터링하였다. 종양이 700 mm의 부피에 도달했을 때(Palmer 등, Methods in Molecular Biology, 2009:33-53), 동물을 희생시키고 GFP 발현을 분석하였다. 골수 세포, 비장세포, PBMC, 및 종양-침윤 백혈구의 80%는 GFP를 발현하였다(도 74b). 종양에서, GFP+ 세포는 종양 기질에서 우세하게 발견되었다(도 74c). 면역표현형은 GFP+ 종양-침윤 세포가 림프구(우세하게는 Treg), 호중구, DC/MDSC, 및 대식세포임을 나타내었다(도 74d, 76). 이 패턴은 말초 혈액(도 74d), 골수 및 비장(도 77)에서 GFP+ 세포와 상이하였으며, 이는 종양이 HSPC를 전문화된 전종양 세포로 활성적으로 분화시킴을 나타낸다. 종양에 대한 생체내 형질도입된 HSPC의 효율적인 모집은 CD46tg 마우스 및 HPV16 E6/E7-양성 마우스 폐암 세포주인 TC-1 세포로 이루어진 두번째 모델에서 추가로 확인되었다(도 78a-78c).
종양-침윤 백혈구에서 miRNA-조절된 이식유전자 발현 . 도 74b 및 도 78c는 GFP(보편적으로 활성인 EF1α 프로모터의 제어 하에)가 종양-침윤 백혈구 뿐만 아니라 골수, 비장, PBMC, 및 상주 대식세포를 포함하는 다른 조직에서도 발현됨을 예시한다. 자가-면역 반응을 최소화하기 위해, 요법 접근법은 치료 이식유전자가 (i) 종양에서 우선적으로 발현되고, (ii) 종양이 발달하기 시작할 때만 자동적으로 활성화되고, (iii) 종양이 사라질 때 중단되는 것을 필요로 한다. 이러한 요건은 miRNA 조절을 통해 충족될 수 있다. 조혈 동안, miRNA 프로파일은 분화 단계 및 세포 계통에 따라 변한다(Chen 등, Science. 2004;303: 83-86). 종양-연관 골수성 세포는 별개의 mRNA 및 miRNA 발현 프로파일을 갖는다(Thorsson 등, Immunity. 48: 812-830 e814, 2018). 마지막으로, 인간의 상이한 종양 유형에서 발견된 골수성 및 림프성 세포에서 miRNA의 보존 정도가 높다 (Thorsson 등, Immunity. 48: 812-830 e814, 2018). 이식유전자 발현의 miRNA 조절 원리는 도 79a에 제시된다. 생체내 HSPC-형질도입된 마우스 모델을 사용하여, 골수, 비장, PBMC, 및 종양으로부터의 GFP+/CD45+ 세포를 분류하고(도 74b, 78c) 이들의 miRNA 발현 프로파일을 분석하였다. 목표는 골수, 혈액 및 비장 세포에서 높은 수준으로 발현되지만, 종양-연관 백혈구에 부재하는 miRNA를 찾는 것이었다. 총 RNA(5 마리의 마우스로부터 풀링됨)를 차세대 miRNA 서열분석에 적용하였다(도 79b, 79c). 상기 기준을 충족하는 일련의 miRNA를 식별하였다. neu/CD46tg-MMC(도 79b) 및 CD46tg-TC-1 모델(도 79c) 둘 다에서 목록의 상위에 있는 miRNA인 miR423-5p에 초점을 맞췄다. miR-423-5p는 인간 및 마우스 사이에 보존되어 있고 따라서 클리닉에 대한 접근법의 추가 개발에 사용될 수 있다. MMC 및 TC-1 종양이 있는 생체내 형질도입된 마우스로부터의 GFP+ 분획에서 miRNA-423-5p의 발현 프로파일을 microRNA 어레이(제시되지 않음) 및 노던 블롯 분석(도 81)에 의해 검증하였다.
miR-423-5p 조절이 또한 인간에서 사용될 수 있는지를 평가하기 위해, 일련의 인간 조직에 걸쳐 microRNA를 평가한 공개된 데이터세트에서 miR-423-5p의 수준을 조사하였다. Ludwig 등, Nucleic Acids Res. 2016;44: 3865-3877. miR-423-5p는 발현된 microRNA의 상위 20%에 있고 골수 및 비장을 포함하는 조직에 걸쳐 균일하게 분포하는 것으로 밝혀졌다(도 82a). 일치하는 PBMC 및 종양 생검을 2 명의 고등급 장액성 난소암 환자로부터 수득하였다. miRNA-Seq를 일치하는 PBMC로부터의 RNA에 비해 종양-침윤(CD45+) 백혈구로부터의 RNA에서 수행하였다(도 82b). 이 분석은 PBMC에서 miR423-5p의 높은 발현 수준 및 종양-침윤 백혈구에서 낮은 발현 수준을 확인하였다. 이러한 데이터는 마우스에서 관찰된 결과가 인간 연구로 번역될 강한 잠재력을 가짐을 입증한다.
HSPC에 대한 HDAd-매개 miR-423 표적 부위 발현의 효과. miRNA-423-5p는 모든 정상 조직에서 발현되고 따라서 유전자 발현의 조절에 수반될 가능성이 가장 높다. "mirtarbase"에서 miR-423-5p에 대한 표적 mRNA의 검색은 사이클린-의존적 키나제 억제제 1A(CDKN1A) mRNA를 1차 표적으로 식별하였다(mirtarbase.mbc.nctu.edu.tw/php/detail.php?mirtid= MIRT000589#target에서 온라인으로 이용가능). 다른 표적 mRNA는 전사 신장 인자 A 유사 1(TCEAL1), bcl2 유사 11(bcl2L11), 및 증식-연관 2G4(PA2G4)를 포함한다. HDAd 벡터로부터 추가된 miR-423-5p 표적 부위의 발현이 CDKN1A의 발현에 영향을 미치는지를 평가하기 위해, GFP 함유 mRNA에 연결된 표적 부위가 있거나 없는 2 개의 HDAd-GFP 벡터를 구축하였다(도 80a). 마우스 및 인간 HSPC, 즉, miR-423-5p 발현 수준이 높은 세포 유형을 대부분의 세포의 형질도입을 초래할 MOI에서 감염시키고(Li 등, Mol Ther. 27(12):2195-2212, 2019) 3 일 후 웨스턴 블롯에 의해 CDKN1A 단백질 수준을 분석하였다(도 80b). 두 세포 유형에서 2 개의 HDAd 벡터 사이의 유의한 차이는 발견되지 않았다. 또한, miR-423-5p 표적 부위 과발현의 해로운 효과가 전구체 콜로니 검정에서 관찰되지 않았다(도 80c). 본원의 다른 곳에 요약된 바와 같이, miR423-5p 표적 부위를 함유하는 요법 벡터를 사용한 생체내 HSPC 형질도입은 조혈에서 이상을 유발하지 않았다. 종합하면, 이는 개시된 miR-423-5p-기반 조절 시스템이 HSPC에서 안전함을 시사한다.
면역-예방 연구. 유전성 유방암 및 난소암에서, 유전적 변이체는 DNA 복구 메커니즘을 방해하여 더 높은 돌연변이 부담 및 신생항원 존재를 초래한다. 이는 종종 비정상적인 카피 수 및 낮은 면역원성을 특징으로 하는 비-유전성 유방암 및 난소암보다 종양을 면역요법으로 더 잘 처리할 수 있게 만든다(Thorsson 등, Immunity. 2018;48: 812-830 e814). 여기서, 체크포인트 억제제 αPD-L1-γ1은 면역치료 이식유전자로서 선택되었다. 이전에, 바이러스 유전자 전달 후 종양내 αPD-L1-γ1 발현은 종양 성장 감쇠를 초래하는 것으로 제시되었다(Engeland 등, Mol Ther. 22: 1949-1959, 2014, Reul 등, Front Oncol. 9: 52, 2019). MMC 세포 배양에서, 강한 PD-L1 발현이 관찰되었으며(도 83a), 이는 MMC 종양을 αPD-L1-γ1 요법에 민감하게 만들어야 한다. miR423-5p 표적 부위의 4 개의 카피를 αPD-L1-γ1 유전자에 연결된 글로빈 3' UTR로 통합하였다(도 83b). 실험 체계는 도 74a에 제시된 것과 동일하였다. 대조군 HDAd-GFP/mgmt 벡터로 생체내 형질도입된 마우스에서, 이식된 MMC 종양은 빠르게 성장하여 종양 세포 이식 후 35 일에 종료점 부피에 도달하였다(도 83c, 왼쪽 패널). αPD-L1-γ1 모델에서, 초기 종양 성장 후, 7 개 종양 중 6 개가 퇴행되고 관찰 기간(100 일) 내에 재발하지 않았다. 처리된 마우스는 첫번째 주사 후 11 주 차에 주어진 또 다른 접종된 MMC 세포를 거부하였다. 항-CD8 mAb 주사에 의한 CD8 세포의 고갈은 치료 효과를 무효화하였다. 항-종양 T-세포 반응을 관찰 기간의 종료 시(100 일) 측정하였다. 유세포 분석에 의한 비장 세포 분석은 상당히 더 높은 백분율의 인터페론-γ (IFNγ)-생산 CD4 및 CD8 세포 뿐만 아니라 Neu-사량체로 양성으로 염색된 더 높은 빈도의 CD8 세포를 나타내었다(도 83d). HDAd-αPD-L1-γ1-처리된 동물로부터의 비장세포는 (Neu-양성) MMC 세포로 자극 시, Neu-음성 세포와 비교하여 30-배 더 큰 IFNγ 분비를 나타내었다(도 83e). 예상된 바와 같이, 미처리 CD46/neu-tg 마우스는 Neu-특이적 T-세포를 보유하였지만, 종양에서 면역억제성 T-세포의 존재로 인해 종양 성장을 제어할 수 없었다(Knutson 등, J Immunol. 2006;177: 84-91).
MMC/neu-유전자이식 마우스 모델에서 αPD-L1-γ 1 발현의 동역학 및 특이성. HDAd-αPDL1γ1miR423-처리된 동물의 별개의 그룹에서, 종양이 줄어들기 시작하기 전에 이식 후 17 일차에 수확하였다. 이들 종양(300-400 mm3)에서, 웨스턴 블롯 분석 8에 의해 PBMC, 골수, 및 비장에서보다 종양에서 10-배 더 높은 수준의 αPD-L1-γ1을 관찰하였다(도 84a). 종양-침윤 백혈구에서 αPD-L1-γ 1 mRNA의 우선적 발현을 qRT-PCR에 의해 확인하였다(도 84b). 이 발현 패턴은 miR-423-조절이 종양-침윤 골수성 및 림프성 세포 이외의 HSPC 자손에서 αPD-L1-γ 1 발현을 억제하였음을 시사하였다. 혈청 αPD-L1-γ 1 은 MMC 세포 주사 후 검출가능하게 되고 종양이 사라지면 감소하였으며, 이는 αPD-L1-γ 1 발현의 기능적 자기조절을 나타내며(도 84b), 즉 이식유전자 발현은 HSPG가 종양-연관 백혈구로 분화된 후에만 시작됨을 나타낸다. MMC 세포 주사 후 2 주부터 시작하여, 털 변색 및 조직의 염증성 침윤에 의해 반영된 자가-면역 반응이 관찰되었다(도 87, 도 87a에서는 마우스를 나타내고 도 87b에서는 신장, 간, 및 폐에서의 샘플을 나타냄). 중요하게는, 종양이 사라지고 4 주 후 희생된 동물에서, 모든 기관의 조직학은 정상으로 돌아왔다. 이러한 관찰은 αPD-L1-γ 1 이 발현되고 혈류로 방출되는 한, 일시적 자가-면역 반응(neu-발현 조직/세포 유형에 대한 것일 가능성이 가장 큼)이 발생할 수 있음을 나타낸다. 특히, miR-423-5p 표적 부위가 없는 HDAd αPD-L1-γ 1 벡터를 사용한 연구는 마지막 O6BG/BCNU 처리 2 주 후 처리된 동물에서 발생하는 20% 초과의 체중 손실로 인해 종료하였다. 이는 조절된 αPD-L1-γ 1 발현에 대한 필요성을 강조한다. 관찰된 자가-면역 반응은 αPD-L1-γ 1 을 종양에 물리적으로 테더링하거나 또는 세포내 면역조절 효과기(예를 들어, 종양-촉진 백혈구를 종양-사멸 세포로 재분극화하는 miRNA)를 사용함으로써 최소화될 수 있다. 추가로, 벡터는 또한 항체(Erbitux)-의존적 세포독성에 의해 형질도입된 모든 세포의 파괴를 허용하는 절두된 EGFR 수용체를 함유할 수 있다(Wang 등, Blood. 2011;118: 1255-1263).
생체내 HSPC αPD-L1-γ 1 유전자 요법 접근법의 효능은 neu-tg/MMC 모델에서, 다른 면역요법 접근법이 종양 재발을 예방하지 못했다는 점을 고려하면 주목할만하다(Knutson 등, Cancer Res. 64:1146-1151, 2004, Burgents 등, J Immunother. 33: 482-491, 2010). 이 맥락에서, 항-마우스 PD-L1 단클론 항체의 4 차례의 복강내 주사는 종양 성장에 유의한 영향을 미치지 않았다(도 88a, 88b). 이러한 데이터는 종양 발달 동안 초기에(HSPC 자손 세포가 종양을 침투하자마자) αPD-L1-γ 1 1의 종양내 발현이 억제인자 및 효과기 면역 세포 사이의 균형을 종양 제거 쪽으로 기울일 수 있음을 나타낸다.
p53 및 brca2 돌연변이가 있는 난소암 모델에서 면역예방 및 요법 연구. C57Bl/6 유래된 뮤린 난소암 ID8 세포는 전형적인 암-연관 생식 계열 돌연변이(brca1, brca2, p53, Nf1, Rb1, Pten...)를 함유하지 않고 복강내 주사 후 종양을 잘 형성하지 않는다. Walton 등, Cancer Res. 76: 6118-6129, 2016. 종양-억제인자 유전자의 CRISPR/Cas9 녹아웃에 의해 생성된 더 새롭게 개선된 ID8-유래 모델에서, 이러한 결핍을 해결한다. Walton 등, Cancer Res. 2016;76: 6118-6129; Walton 등, Sci Rep. 2017;7: 16827. 이러한 모델 중에는 ID8-p53-/--brca2-/- 세포가 있다. 2x106 개의 ID8-p53-/--brca2-/- 세포를 CD46-유전자이식 마우스로 복강내 주사하면 6-8 주 내에 종양 성장 및 복수의 발병(또는 사망)을 초래하였다(도 84c 및 85a). 복강내 종양은 장간막을 따라 광범위하게 퍼져 다른 장기(비장, 간, 림프절)을 침습하였다. 복강내 ID8-p53-/--brca2-/- 종양에서 종양-침윤 백혈구의 면역표현형은 Treg 뿐만 아니라 면역억제성 DC/MDSC 및 TAM의 의 명백한 존재를 나타내었다(도 85b). 종양 침윤 T-세포(TIL), 대식세포(TAM), 및 호중구(TAN)를 복막의 ID8 p53-/- brca2-/- 종양으로부터 단리하고 miRNA-423-5p 수준을 노던 블롯으로 분석하였다. MMC 및 TC-1 모델에서 관찰된 바와 같이, miR-423-5p는 골수 단핵 세포에서 발현되지만 TIL, TAN, 및 TAM)을 포함하는 종양-침윤 백혈구에서 검출가능하지 않았으며, 이는 모든 3 가지 세포 유형이 종양에 의해 특이적으로 재프로그램화되었음을 나타낸다(도 85c).
먼저, ID8-Trp53-/--brca2-/- 모델을 예방적 설정에 사용하였다(도 85d). HDAd-αPDL1γ1miR423 + HDAd-SB 또는 HAd-GFP-miR423 + HDAd-SB(대조군)를 사용한 HSPC 생체내 형질도입/선택 후, ID8-p53-/-brca2-/- 세포를 복강내로 주사하고 혈청 αPDL1γ1 수준 및 이환율 및 복수의 발병을 모니터링하였다. 모든 대조군 마우스는 생체내 형질도입 후 70 일에 종료점에 도달하였지만, 모니터링 기간이 종료될 때(종양 세포 접종 후 11 주) HDAd-αPDL1γ1miR423 + HDAd-SB 처리된 동물의 100%가 생존하였다(도 85e). 6 주차(세포 주사 후)에 상승된 혈청 αPDL1γ1 수준은 종양이 성장하였고 혈청 αPDL1γ1 발현이 활성화되었음을 시사한다(도 85f). 11 주차에, 혈청 αPDL1γ1은 배경 수준으로 돌아갔으며 이는 종양이 제거되었음을 나타낸다. 이 연구에서, 자가-면역 반응의 징후(예를 들어, 털 변색)는 관찰되지 않았으며, 종양 및 정상 조직 사이에 공유되는 항원(예를 들어, Neu)의 부재 때문일 가능성이 가장 크다. 기재된 접근법의 안전성을 평가하는 맥락에서, 또한 HDAd-αPDL1γ1miR423을 사용한 생체내 HSPC 형질도입이 조혈에서 이상을 유발하지 않았음을 제시하였다(도 88c, 88d). 동계 종양 세포가 이식된 마우스에서, PBMC에서 GFP 양성 세포의 백분율을 표시된 시점에서 측정하고, GFP 양성 세포를 miRNAseq에 대해 수확하였다(도 88e). 결과는 관심 발현 패턴을 갖는 miRNA를 식별하였다(도 58e). 종양(TIL), PBMC, 골수, 및 비장에서 PDL1에 대한 웨스턴 블롯은 도 88f에서 mRNA에 대한 발현으로 제시되고 정량화된다. 종양 이식 전 및 이식 후 표시된 시점에서 혈청 αPDLA ELISA OD450이 또한 도 88f에 제시된다. 개략도는 도 88g 및 88h에 제시된다.
예방 접근법은 종양-발달의 극초기 단계에서 자동으로 시작한다는 이점을 갖지만, 고위험 돌연변이를 보유하는 건강한 여성에서 즉시 적용하는 것은 임상 번역에서 규제 장애물에 직면할 가능성이 있을 것이다. 따라서, 보다 현실적인 목표는 이 접근법을 사용하여 1차 요법 후 암 재발을 예방하는 것이다. 이 경우에, 생체내 HSPC 선택은 환자의 화학요법 치료에 직접적으로 포함될 수 있다. 도 86a는 임상 설정에서, 생체내 HSC 형질도입이 어떻게 외과적 종양 감량수술 후 시작하거나, 또는, 수술이 옵션이 아닌 경우 화학요법과 함께 시작함을 나타낸다. O6BG/BCNU 생체내 선택은 화학요법과 조합될 수 있다. 생체내 HSPC 형질도입/선택의 결과로서, 무장된 HSPC는 암이 재발할 때까지 휴면기에 놓여 HSPC 분화 및 효과기 유전자 발현의 활성화를 촉발할 것이다. 이 설정은 또한 종양-특이적 신생-항원 및 종양의 면역-표현형이 외과적 생검의 분석으로부터 알려질 것이라는 이점을 가지며, 이는 적절한 면역요법 효과기 유전자를 선택하게 할 수 있다. 한편으로, "완전히 발달한" 암 특징을 갖는 암의 재발을 예방하는 것(Hanahan 등, Cell. 2011;144: 646-674)은 발달 초기 단계에서 종양을 표적화하는 것보다 더 어렵다.
이러한 "치료적" 설정을 시뮬레이션하기 위해, CD46-유전자이식 마우스에게 먼저 ID8-Trp53-/--brca2-/- 세포를 주사한 후 2 주 후에 생체내 HSPC 형질도입/선택을 하였다(도 86b). 대조군 설정의 모든 마우스(HDAd-GFP-miR423 + HDAd-SB 형질도입된 HSPC)는 종양 세포 주사 후 12 주에 종료점에 도달하였지만, αPDL1-γ1 발현 벡터로 처리된 모든 마우스는 15 주차에 건강하였다(도 86c). 예방 연구에서와 같이, 11 주차에 상승된 혈청 αPDL1-γ1 수준은 종양이 초기에 성장하지만 자기-조절된 αPDL1-γ1 메커니즘이 활성화되면 사라졌음을 시사한다(도 86d). 이러한 데이터는 기재된 접근법이 수술/1차 화학요법 후 암 재발을 예방할 수 있음을 나타낸다.
TC-1(마우스 폐암) 종양(도 78a-81), MMC(마우스 유방암) 종양(도 79a-79c 및 81), 및 ID8-p53-/-/brca2-/-(마우스 난소암 종양)(도 85c)에 존재하는 종양-침윤 백혈구에 대한 mRNA 프로파일링/노던 블롯 분석을 수행하였다. miR423-5p가 검출불가능하지만, 정상 조혈 구획에서 높은 수준으로 존재하는 3 가지 종양 유형 모두에서 발견되었다. 인간 난소암 생검으로부터의 데이터와 함께(도 82a, 82b), 이는 miR423-5p-기반 시스템이 효과기 유전자 발현의 조절을 위해 종에 걸쳐 상이한 종양 유형에 광범위하게 사용될 수 있음을 나타내다.
현재 암 발병의 고위험과 연관된 생식 계열 돌연변이가 있는 여성에게 제공되는 제한된 예방적 옵션, 및 집단-와이드 스크리닝으로 인해 이러한 보균자 수의 증가를 고려하면, 이 생체내 HSPC 유전자 요법 접근법은 주요 의학적 문제를 해결하는 유망한 접근법이다.
실시예 7. 분비된 치료 단백질의 고수준 생산을 위한 공장으로서 적혈구 세포를 사용한 생체내 HSC 유전자 요법.
이 실시예는 생체내 HSC 형질도입/선택 후 적혈구 세포에서 비-적혈구 단백질의 발현 및 성숙 적혈구에서 발현된 단백질의 저장을 나타낸다. 이 시스템을 사용하여 단일 정맥내 개입 후 장기간 치료 교정을 제공할 수 있다. 이 실시예에 함유된 정보의 적어도 일부는 Wang 등 (Blood Adv 3(19): 2883-2894, 2019; e-pub October 4, 2019)에 공개되었다.
인간 성인에서 초 당 240 만개의 새로운 적혈구가 생성된다. 인체 세포의 거의 1/4는 적혈구이다(Pierige 등, Adv Drug Deliv Rev. 60(2):286-295, 2008). 적혈구생성 과정에서 HSC는 공통 골수성 전구체 및 전적혈구모세포를 통해 정염성 적혈구모세포(Wright의 염색에 기반)로 분화한다. 이 단계에서, 핵은 배출되고, 세포는 골수에서 빠져나와 망상적혈구로서 순환계로 들어간다. 성인에서 순환하는 적혈구의 0.5% 내지 2.5%(1x105/μl) 및 유아의 2% 내지 6%가 망상적혈구이다. 망상적혈구는 여전히 mRNA로부터 헤모글로빈을 생성할 수 있다. 1 내지 2 일 후, 이들은 궁극적으로 모든 세포기관을 손실하고 성숙 적혈구가 되며, 더이상 단백질 생합성을 할 수 없다. 열성적인 적혈구 전구체에서 적혈구까지 분화는 7 일이 걸린다. 적혈구의 수명은 120 일이다. 오래되고 죽어가는 적혈구는 비장의 식세포 시스템에 의해 제거된다.
HSC가 열성적인 적혈구 세포로 분화되면, 대량의 α 및 β 글로빈 쇄가 생성된 다음 이후에 적혈구에서 사량체성 헤모글로빈으로 저장된다. 건강한 개인은 혈액 100 ml 당 12 내지 20 그램의 헤모글로빈을 가지며 적혈구 중량의 95%는 헤모글로빈이다(세포 당 270x106 개의 Hb 분자). 이러한 효율적인 생합성에 대한 기초는 높은 수준의 전사 및 효율적으로 번역되는 안정된 mRNA를 허용하는 강한 적혈구 특이적 유전자좌 제어 영역(LCR)이다.
적혈구생성의 엄청난 속도 및 효능 및 헤모글로빈 생산의 강력한 기구를 사용하여 적혈구 전구체 세포로부터 비-적혈구 분비된 단백질을 생산하였다(전적혈구모세포에서 망상적혈구까지의 분화 단계 포함). 이식유전자는 미니-β-글로빈 LCR의 제어 하에 있고 mRNA 안정화를 위해 β-글로빈 유전자의 5'UTR 영역을 함유하였다. 치료 단백질의 장기간 평생 생산을 허용하기 위해, 유전자 전달 벡터는 원시 HSC를 표적화하였다. 생체내 HSC 형질도입 접근법은 골수에서 말초 혈류로의 HSC의 G-CSF/AMD3100-촉발된 동원 및 통합 헬퍼-의존적 아데노바이러스 벡터 시스템의 정맥내 주사를 수반한다. 이식유전자 통합은 과활성 잠자는 미녀 트랜스포사제(SB100x)를 사용하여 (무작위 패턴으로) 달성되지만, 특정 구현예에서, 상동성 지시된 복구를 통해 달성될 수 있다.
적혈구 세포가 혈액 순환으로 분비되는 치료 단백질의 높은 수준의 생산에 사용될 수 있다는 증거 또는 원리로서, 본원에서는 응고 인자 VIII의 생체공학적 형태에 초점을 맞췄다. 연구 결과는 A형 혈우병 치료와 관련이 있다. 최근에, 임상 발전은 B형 혈우병에 대한 간-지시된 인자 IX 유전자 전달을 위한 재조합 아데노-연관 바이러스(rAAV)-기반 유전자 요법을 사용하여 이루어졌다(High 등, Methods Mol Biol. 2011;807:429-457). 전임상 연구는 또한 동물 모델에서 FVIII 발현 rAAV 벡터로 A형 혈우병을 치료하는 실현가능성을 입증하였다(Brown 등, Mol Ther Methods Clin Dev. 1:14036, 2014, Callan 등, PLoS One. 11(3):e0151800, 2016, Greig 등, Hum Gene Ther. 28(5):392-402, 2017). 그러나, 간-지시된 rAAV A형 혈우병 유전자 요법의 광범위한 적용은 여러 장애물에 직면할 수 있다: (i) 간세포에서 rAAV 게놈의 대부분의 에피솜 속성 및 구체적으로 어린이에서 세포 분열로 인한 이들의 손실. (ii) rAAV 벡터 생산에 대한 고비용, (iii) 유전자 침묵 또는 유전독성을 방지하기 위해 종종 요구되는 큰 전사적 조절 요소를 수용할 수 없는 rAAV의 제한된 패키징 용량(Grieger 등, J Virol. 79(15):9933-9944, 2005, Chandler 등, J Clin Invest. 125(2):870-880, 2015), 및 (iv) 구체적으로 바이러스 간염과 같은 기저 간 질환이 있는 환자, 또는 혈우병 환자의 많은 분율을 차지하는 간세포가 활성적으로 분열하는 어린이에서(Nault 등, Mol Cell Oncol. 3(2):e1095271, 2016, Nault 등, Nat Genet. 47(10):1187-1193, 2015), 원종양형성 유전자 부근의 잠재적인 rAAV 통합(Russell 등, Nat Genet. 2015;47(10):1187-1193)으로 인한 종양 형성 위험 증가.
HDAd 벡터를 사용하여 적혈구 세포로부터 FVIII을 발현하는 접근법은 이러한 문제를 해결한다. 이 연구는 미니 LCR의 제어 하에 GFP를 리포터 유전자로 사용하여 생체내 HSC 형질도입/선택 후 적혈구 세포에서 비-적혈구 단백질의 발현 및 성숙 적혈구에서 GFP의 저장을 달성할 가능성이 있음을 나타낸다(도 89a-89h 참조). 그런 다음 "건강한" hCD46 유전자이식 마우스에서 접근법이 항-FVIII 혈장 항체의 존재에도 불구하고 A형 혈우병 마우스 모델에서 생리학적 수준의 FVIII의 생체공학적 형태 및 표현형 교정을 초래함을 입증하였다.
제안된 접근법은 단일 정맥내 개입 후 평생 치료 교정을 제공할 수 있다. 적혈구로의 분화 시 유전자 변형된 HSC의 거대한 증폭 및 이러한 세포의 고효율 단백질 합성 기구는 치유적 수준에서 FVIII 생산에 대한 기초를 생성한다. 또한, HSC의 유일한 분획의 유전적 변형은 이식유전자 산물에 대한 내성을 초래할 수 있다. 생체내 유전자를 HSC로 전달하기 위해 새로 개발된 이러한 접근법은 골수절제술 및 HSC 이식을 필요로 하지 않는다. 이는 골수에서 말초 혈류로 HSC를 동원하기 위한 G-CSF/AMD3100의 주사 및 통합 헬퍼-의존적 아데노바이러스(HDAd) 벡터 시스템의 정맥내 주사를 수반한다(도 90b). HDAd5/35++ 및 HDAd35 벡터는 원시 HSC 상에서 발현되는 수용체인 CD46을 표적화한다. 이식유전자 통합은 과활성 잠자는 미녀 트랜스포사제(SB100x)를 사용하여 (무작위 패턴으로) 달성된다(도 90a). CD46-유전자이식 마우스에서 생체내 HSC 형질도입/선택 후, 생체공학적 인간 인자 VIII 버전(ET3)의 과생리적 혈청 농도 및 활성이 입증되었다(도 90c-90i; 91a-91d; 92a-92g). ET3 유전자는 ET3 발현을 적혈구로 제한하는 미니 β-글로빈 LCR의 제어 하에 있었다. 적혈구 세포로부터 고수준 ET3 생산에도 불구하고, 조혈에 대한 효과는 관찰되지 않았다. 억제 항-ET3 항체의 초기 개발 후, 처리된 마우스의 50%에서 크게 감소된 혈청 항체 수준은 흉선에서 낮은 수준의 ET3 발현 및 내성 발달로 인할 가능성이 가장 크다. CD46-tg/A형 혈우병 마우스로부터 HSC의 생체외 및 생체내 형질도입 및 치명적으로 조사된 A형 혈우병 마우스로의 후속 이식 후, 표현형 교정은 생리학적 인자 VIII 혈청 활성, 정상 aPTT, 및 꼬리 절단 후 정상적인 출혈 시간에 기반하여 달성되었다.
논의. FVIII 이외에도, 다른 분비된 단백질에 대한 이 접근법의 적용은 예를 들어 다음에 사용될 수 있다: (i) 다른 응고 인자, 구체적으로 FXI, FVII(Binny 등, Blood. 119(4):957-966, 2012), 폰빌레브란트 인자(VWF)(De Meyer 등, Arterioscler Thromb Vasc Biol. 28(9):1621-1626, 2008), 뿐만 아니라 희귀 응혈 인자(즉, 인자 I, II, V, X, XI, 또는 XIII); (ii) 폼페병(산 α-글루코시다제), 고세병(글루코레세브로시다제), 파브리병(α-갈락토시다제 A), 및 I형 점액다당류증(α-L-이두로니다제)과 같은 현재 리소좀 축적 질환에 대한 효소 대체 요법(ERT)에 사용되는 효소(교차-교정 메커니즘의 이점을 취함)(Penati 등, J Inherit Metab Dis. 40(4):543-554, 2017); (iii) 면역결핍 예를 들어, SCID-ADA(Cicalese 등, Mol. Ther. 26(3):917-931 2018)(아데노신 데아미나제); (iv) 심혈관 질환, 예를 들어, 가족성 아포지질단백질 E 결핍 및 아테롬성동맥경화증(ApoE)(Wacker 등, Arterioscler Thromb Vasc Biol. 38(1):206-217, 2018); (v) 바이러스 유인 수용체의 발현에 의한 바이러스 감염(예를 들어 HIV의 경우 - 가용성 CD4(Falkenhagen 등, Mol Ther Nucleic Acids. 9:132-144, 2017), 또는 HIV(Kuhlmann 등, Mol Ther. 27(1):164-177, 2019), 만성 HCV(Quadeer 등, Nat Commun. 10(1):2073, 2019), 또는 HBV(Kuciinskaite-Kodze 등, Virus es. 211:209-221, 2016) 감염에 대한 광범위한 중화 항체(bNAb); 및 (vi) 암(예를 들어 단클론 항체(예를 들어 트라스투주맙(Zafir-Laviee 등, J Control Release. 291:80-89, 2018) 또는 체크포인트 억제제(예를 들어 aPDL1(Engeland 등, Mol Ther. 22(11):1949-1959, 2014))의 제어된 발현).
실시예 8. 생체내 HSC 형질도입 후 비-인간 영장류에서 SB100x-매개 유전자 추가 및 내인성 γ-글로빈의 BE-매개 재활성화 둘 다의 검증.
이 실시예는 SB100x-매개 유전자 추가 및 내인성 γ-글로빈의 BE-매개 재활성화가 둘 다 생체내 HSC 형질도입 후 비-인간 영장류에서 효과적임을 검증하는 연구를 기재한다.
유전자 전달 벡터 : 유전자 전달 벡터인 HDAd-combo가 사용될 것이다: 벡터는 다음 이식유전자의 SB100x 트랜스포사제-매개 무작위 게놈 통합을 함유한다: i) 적혈구에서 효율적인 발현을 위한 미니-LCR의 제어 하에 레서스 γ-글로빈 유전자, ii) O6BG/BCNU로 형질도입된 세포의 생체내 선택을 위한 보편적으로 활성인 EF1a 프로모터의 제어 하에 레서스 mgmtP140K, iii) 말초 혈액 T-세포 형질도입 및 벡터 생물분포 연구의 분석을 위한 보편적으로 활성인 EF1a 프로모터의 제어 하에 GFP. 이는 HBG 프로모터에서 BCL11a 억제인자 단백질 결합 부위의 불활성화 및 적혈구 bcl11a 인핸서의 동시 불활성화(이는 적혈구 세포에서 BCL11a 억제인자 단백질 발현 감소를 초래함)를 통해 내인성 γ-글로빈의 재활성화를 위한 아데닌 염기 편집기를 추가로 포함할 것이다. 또한, 염기 편집기 발현 카세트는 iCas-BE의 일시적 발현만을 초래하는 트랜스포존의 Flp 재조합효소 매개된 절제 시 제거될 것이다. 마지막으로, SB100x 트랜스포사제 및 Flp 재조합효소를 함유하는 벡터는 통합되지 않고 HSC 세포 증식 동안 손실될 것이다(도 121).
치료 프로토콜: 이전에 테스트된 HSC 동원 및 O6BG/BCNU 생체내 선택 프로토콜을 사용하여 3 마리의 히말라야 원숭이(Macaca mulatta)로 6-개월 연구가 수행될 것이다(도 122). 프로토콜은 1 마리의 동물을 테스트하는 것으로 시작될 것이다. 연구는 8 주(마지막 생체내 선택 주기의 종료)에 심각한 합병증이 발생하지 않으면 나머지 2 마리 동물에서 반복할 것이다.
동원: 피하로 주어진 GCSF 및 SCF은 5 일 동안 아침에 제공될 것이다(각각 50 μg/kg). 피하로 주어진 GCSF/SCF + AMD3100은 마지막 2 일 동안 오후에 생길 것이다(5 mg/kg).
전처리: 4 mg/kg으로 투여된 덱사메타손은 HDAd5/35++ 주사 16 전에 정맥내로 주어질 것이다. 20 mg/kg으로 투여된 메틸프레드니솔론 및 4 mg/kg으로 투여된 덱사메타손은 정맥내로 주어질 것이지만, 100 mg으로 투여된 아나킨라는 HDAd5/35++ 주사 30 분 전에 피하로 주어질 것이다.
HDAd 주사: 2 차례의 HDAd 주사는 정맥내로 1) -1 일에 저용량(2 mL/분으로 20 mL의 포스페이트 완충된 염수 중 3x1011 vp/kg)로 주어질 것이고, 2) 2 개의 완전 용량(2 mL/분으로 20 mL의 포스페이트 완충된 염수 중 1x1012 vp/kg)은 0 일차에 30 분 간격으로 주어질 것이다.
일시적 면역억제: 면역억제는 O6BG/BCNU의 첫번째 용량(4 주)까지 1 일에 시작하고, 필요한 경우, O6BG/BCNU의 마지막 용량 후 2 주간 계속될 것이다. 면역억제는 0.2 mg/kg/일의 라파마이신, 30 mg/kg/일의 마이코페놀레이트 모페틸, 및 0.25 mg/kg/일의 타크롤리무스를 포함하며, 모두 음식을 통해 경구로 매일 제공될 것이다.
O 6 BG/BCNU를 사용한 생체내 선택: O6BG: 동물은 적어도 30 분에 걸쳐 정맥내로 주입되는 200 mL의 염수 중 120 mg/m2 O6BG를 받을 것이다. BCNU는 O6BG 주입을 시작하고 60 분 후에 투여될 것이다. 그런 다음 동물은 BCNU 투여 6 내지 8 시간 후 적어도 30 분에 걸쳐 정맥내로 200 mL의 염수 중 또 다른 용량의 O6BG를 받을 것이다. 첫번째 처리는 HDAd 주사 4 주 후에 주어지고; 두번째 및 세번째 처리는 γ-글로빈 마킹 및 혈액학에 따라 2 주 간격(임의적)으로 주어질 것이다.
수집할 데이터: 혈액 샘플은 도 122에 나타낸 바와 같이 수집될 것이다. 매일 신체 관찰 및 매주 체중 측정이 수행될 것이다.
혈액 샘플: 2 시간 및 6 시간 혈액 샘플을 위해, 다음 검정이 수행될 것이다: CD34+에서 GFP+ 세포의 백분율 및 CD38-/Cd45RA에서 GFP+ 세포의 퍼센트, CD90+ 세포가 정량화되고, 콜로니 형성 단위 검정을 사용하여 %GFP+ 콜로니의 퍼센트, SDF1-a로의 이동, 및 CXCR4 및/또는 VLA-4의 발현율을 평가할 것이다(예를 들어, 도 93b-93e). 모든 다른 샘플의 경우, 혈액 세포 계수, 화학, c-반응성 단백질, 및 전염증성 사이토카인이 측정될 것이다. γ-글로빈 발현은 유세포 분석(적혈구/비-적혈구 세포)을 통해 측정되는 반면, HPLC 및 qRT-PCR은 사용하여 추가된 γ-글로빈에 대한 재활성화된 γ-글로빈 수준을 측정할 것이다. 사이토스핀은 γ-글로빈 면역형광을 평가하는 데 사용될 것이다. 벡터 카피 수 및 Cas9, SB100x, 및 Flpe mRNA 수준이 측정될 것이다. 백혈구(CD4+, CD8+, CD25, CD45RO, CD45RA, CCR-7, CD62L, FOXP3, 인테그린 αeβ7)에서 GFP 발현이 측정될 것이다.
골수 샘플: 골수 샘플은 4 일째에 수집한 다음 매월 수집될 것이다(도 122 참조). 골수 샘플의 계통 조성물은 유세포 분석에 의해 평가될 것이다. CD34+ 세포의 벡터 카피 수가 또한 측정될 것이다. γ-글로빈은 Ter119+/Ter119- 마커로 분류함으로써 유세포 분석을 사용하여 평가될 것이다. HPLC 및 qRT-PCR을 사용하여 추가된 γ-글로빈에 대한 재활성화된 γ-글로빈 수준이 측정될 것이다. 이러한 분석 외에도, 부검 시, 전체 게놈 서열분석을 CD34+ 세포에서 수행하여 SB100-매개 통합 및 염기 편집기 표적외 효과를 식별할 것이다. RNA 서열분석을 또한 CD34+ 세포에서 수행하여 처리 전 및 처리 후 사이의 mRNA 및 miRNA 프로파일을 비교할 것이다.
부검으로 수득한 조직(생식계열 조직 및 정액 포함): 일상적인 조직학이 수행될 것이고, 벡터 카피 수가 주요 조직 그룹에서 측정될 것이다. γ-글로빈 및 GFP 면역형광이 조직 절편에서 평가될 것이다.
결과: 이 실험은 SB100x-매개 유전자 추가 및 내인성 γ-글로빈의 BE-매개 재활성화 둘 다가 생체내 HSC 형질도입 후 비-인간 영장류에서 효과적임을 검증할 것이다. 벡터는 SCA 환자에서 치유적일 수 있는 적혈구에서 γ-글로빈 발현 수준을 달성함이 입증될 것이다(즉 80% 초과의 γ-글로빈+ RBC 및 성체 레서스 글로빈의 20% 초과의 γ-글로빈 수준). 또한 장기간 혈액학적 부작용의 부재 및 원치않은 게놈 재배열의 부재 및 HSC 전사체의 변화를 입증할 것이다. 마지막으로, 정맥내로 주사된 HDAd5/35++ 벡터가 기억 T-세포를 형질도입함을 입증할 것이다.
실시예 9. 내인성 γ-글로빈 빈 발현의 재-활성화를 위한 염기 편집기를 발현하는 HDAd5/35++ 벡터를 사용한 인간 및 레서스 원숭이 HSC 형질도입.
사이티딘 또는 아데닌 데아미나제 또는 트랜스아미나제에 융합된 불활성 Cas9는 태아 글로빈을 재활성화하는 도구로서 역할을 할 수 있다. 사이티딘 염기 편집기를 발현하는 HDAd 벡터(HDAd-C-BE)를 적혈구 bcl11a 인핸서를 표적화하고 중요한 GATA 결합 모티프를 파괴하는 HDAd-CRISPR/Cas9 벡터와 비교하였다(도 123). 동일한 영역에 대해 야생형 CRISPR을 발현하는 HDAd 벡터를 구축하였다. 두 벡터를 HDAd 형질도입 후, 18 일에 걸쳐 적혈구 분화에 적용된 인간 CD34+ 세포에서 테스트하였다(도 124a). HDAd-wtCRISPR 형질도입된 세포의 경우, 편집된 표적 부위의 백분율의 점진적인 감소가 관찰되었으며, CRISPR-관련된 세포독성 때문일 가능성이 가장 크다(도 124b). 게놈 편집의 효능은 HDAd-C-BE 벡터의 경우 더 낮았지만, 편집률은 안정되게 유지되어, γ-글로빈의 비슷한 재활성화를 초래하였다(도 124c). 이식 후, HDAd-C-BE 형질도입된 CD34+ 세포의 생착은 형질도입되지 않은 대조군 세포만큼 효율적이었다(도 125). 요약하면, 이러한 데이터는 염기-편집기 벡터가 잠재적으로 wtCRISPR-발현 벡터보다 HSC에서 게놈 편집을 위한 더 나은 도구임을 나타낸다. 보다 최근에, HBG1/2 프로모터에서 3 개의 상이한 영역에 대해 아데닌 편집기를 발현하는 HDAd 벡터 시리즈가 개발되었다. γ-글로빈 재활성화는 염기 편집기 벡터로 여러 억제인자 수준을 동시에 표적화함으로서 실질적으로 증가될 수 있을 것으로 예상된다. 이 목표를 향해 적혈구 bcl11a 인핸서(도 126, 상부 패널) 또는 HBG1/2의 BCL11a 단백질 결합 부위(도 126, 하부 패널)를 표적화하는 염기 편집기를 발현하는 HDAd 벡터를 테스트하였다. 시험관내 연구에서 γ-글로빈 재활성화는 두 벡터에 대해 각각 9 및 53%였다.
SCA 마우스 모델(Townes 모델)의 데이터: B6;129-Hbbtm2(HBG1,HBB*)Tow/Hbbtm3(HBG1,HBB)Tow Hbatm1(HBA)Tow/J; hα/hα::βAS, hα/hα::-383 γ-βA/-1400 γ-βS.
마우스는 인간 α-글로빈, γ-글로빈(프로모터를 함유하는 -383 및 -1400 영역 포함), 상응하는 마우스 유전자 대신에 β87-SCA 글로빈을 함유하고 말초 혈액에서 망상적혈구의 40%, 낮은 적혈구용적률, 낮은 헤모글로빈 수준, 및 백혈구증가증(도 127b)을 갖는 심각한 SCA 표현형(도 127a)을 나타낸다. 이러한 마우스를 CD46에 대한 동형접합성 및 3 개의 글로빈 유전자 치환을 달성하도록 번식시켰다(CD46/Townes 마우스). 이전에 개발된 HDAd-HBG-CRISPR 벡터가 CD46/Townes 마우스의 생체내 HSC 형질도입 후 γ-글로빈을 활성화시키는지 여부를 결정하기 위해 테스트하였다(도 128a). O6BG/BCNU 선택 없이, RBC의 γ-글로빈 마킹은 60%에 도달하였으며, 이는 Townes 마우스의 적혈구생성의 기능적 결핍이 게놈-편집된 HSC/ 적혈구 전구체 세포에 대한 강한 증식 자극을 제공함을 나타낸다(도 128b). HDAd-HBG-CRISPR 벡터의 치료 효과는 크게 개선된 적혈구 표현형 및 말초 망상적혈구의 5-배 감소를 반영하였다(도 128c). 이는 이 모델(및 잠재적으로 SCA 환자)의 치유가 O6BG/BCNU 생체내 HSC 선택에 대한 필요성 없이 달성될 수 있음을 나타낸다.
비-인간 영장류(NHP)에서 생체내 HSC 유전자 전달: 이들 데이터는 G-CSF, SCF, 및 AMD3100으로 동원 후 HDAd-GFP 주사를 받은 2 마리의 NHP(돼지꼬리 원숭이(Macaca nemestrina))로부터 수득된다(도 129a; 도 93a; 도 94e-94g). 말초 혈액 샘플을 벡터 주사 직전, 및 벡터 주사 2 및 6 시간 후에 수집하였다. 단리된 CD34+ 세포를 생체외에서 배양하고 콜로니 형성 검정에 플레이팅하였다. 벡터 투여 후 단리된 CD34+ 세포의 평균 3%는 GFP+였으며(도 129b; 도 93b, 93c; 도 94h), 이는 말초 혈액에서 동원된 CD34+ 세포가 HDAd5/35++ 벡터의 단일 정맥내 투여에 의해 형질도입될 수 있음을 시사한다. 이러한 CD34+ 세포가 콜로니-형성 가능성을 유지하는지를 테스트하기 위해, 콜로니 검정을 수행하고, PCR을 통해 GFP 이식유전자를 보유하는 콜로니의 백분율을 결정하였다. 주사 후 시점으로부터 CD34+ 세포에서 유래된 콜로니의 최대 55%가 벡터에 의해 형질도입되었다(도 129c; 도 93d; 또한 도 94i-94m 참조). 마지막으로, 말초 동원 후 골수 구획으로 되돌아가는 생체내 벡터-표적화된 세포의 능력을 테스트하기 위해, 골수 흡인물을 벡터 투여 3 일 후 동물 중 하나로부터 수집하였다. 골수-상주 CD34+ 세포의 3.7% 또는 2.9%는 GFP+였고, 생체내 전달 전 vs 전달 후 수집된 세포에서 콜로니 형성 가능성의 주목할만한 차이는 관찰되지 않았다(도 129d; 도 93e). 이러한 비-인간 영장류 연구(마우스에서보다 10배 더 낮은 벡터 용량으로 수행됨)는 기재된 생체내 전달 접근법이 검증된 전임상 모델에서 실행가능하고 안전함을 입증한다.
실시예 10. 염기 편집기를 사용한 생체내 HSC 유전자 요법은 β-YAC 마우스에서 태아 γ-글로빈의 효율적인 재활성화를 허용한다
이 실시예는 생체내에서 HDAd5/35++ 벡터에 의해 전달된 염기 편집기가 예를 들어, 혈색소병증의 치료를 위해 정확한 게놈 조작을 위한 유용하고 효과적인 전략임을 입증한다.
염기 편집기는 표적화된 게놈 유전자좌에서 정확한 뉴클레오티드 돌연변이를 설치할 수 있고 이중-가닥 DNA 파괴를 피하는 이점을 제시하다. 여기서, 중요한 모티프는 HDAd5/35++ 벡터를 통해 전달된 염기 편집기로 γ-글로빈 재활성화 조절을 표적화하였다. 최적화된 설계를 통해, HBG1/2 프로모터에서 BCL11A 인핸서를 표적화하거나 또는 자연 발생 태아 헤모글로빈의 유전적 지속성(HPFH) 돌연변이를 재생성하는 사이티딘 및 아데닌 염기 편집기(CBE 및 ABE)의 패널은 성공적으로 구제되었다. HUDEP-2 세포에서, 5 개의 테스트된 벡터는 모두 표적 염기 전환을 효율적으로 설치하고 실질적인 γ-글로빈 재활성화로 이어졌다. HBG1/2 프로모터에서 -113A에서 G로의 HPFH 돌연변이에 특이적인 ABE 벡터 HDAd-ABE-sgHBG#2를 사용함으로써 상당한 γ-글로빈 단백질 생산(β-글로빈에 비해 23%)이 관찰되었다. 따라서 이 벡터가 하류 동물 연구에 선택되었다. 248 kb의 인간 β-글로빈 유전자좌를 보유하는 마우스(β-YAC 마우스)를 사용하여 글로빈 전환을 정확하게 반영하였다. FRT 및 트랜스포존 부위에 의해 플랭킹된 EF1α-MGMTP140K 발현 카세트는 형질도입된 세포의 생체내 선택을 허용하는 벡터에 포함되었다. HDAd-ABE-HBG#2 + HDAd-SB로의 생체내 형질도입 및 저용량의 화학선택 후, 말초 적혈구에서 평균 40% 초과의 HbF-양성 세포가 측정되었다. 이는 인간 β-글로빈에 비해 γ-글로빈 생산의 21%에 상응하였다. 총 골수 세포에서 -113 A에서 G로의 전환은 평균 20%였다. 형질도입되지 않은 마우스와 비교하여, 처리 후 혈액학적 매개변수, 적혈구생성 및 골수 세포 조성물에서 변경은 관찰되지 않았으며, 이는 접근법의 우수한 안전성 프로파일을 입증한다. 상위 점수의 잠재적인 표적외 게놈 부위에서 검출가능한 편집은 발견되지 않았다. 골수 계통 마이너스 세포를 형질도입 후 16 주차에 1차 마우스로부터 단리하고 치명적으로 조사된 C57BL/6J 마우스에 주입하였다. HbF-양성 세포의 백분율은 16 주에 걸쳐 2차 수용자에서 유지되었으며, 이는 게놈 편집이 장기간 재증식 마우스 HSC에서 발생하였음을 나타낸다. 관찰은 HDAd5/35++ 벡터에 의해 전달된 염기 편집기가 혈색소병증의 치료를 위한 정확한 생체내 게놈 조작을 위한 유망한 전략을 나타냄을 입증한다.
CRISPR/Cas9와 같은 뉴클레아제에 기반한 게놈 조작 전략은 임상 평가 단계에 들어가는 다중 유전자 요법 연구와 함께 주목할만한 발전을 달성하였다. CRISPR/Cas9-매개 유전자 편집은 고전적인 비-상동 말단 결합(NHEJ)을 포함하는 내인성 복구 메커니즘을 촉발하는 이중-가닥 DNA 파괴(DSB)에 의존한다. 공여자 DNA 주형의 존재 하에, 상동성-지시된 복구(HDR)는 전형적으로 더 낮은 빈도로 발생할 수 있다. 최신 연구는 혈액 장애에 대한 유전적 요법에 중요한 조혈 줄기 및 전구체 세포(HSPC)에서 관심 유전자의 매우 효율적인 파괴를 입증하였다(Martin 등, Cell Stem Cell 24: 821-828.e825, 2019; Wu 등, Nature Medicine 25: 776-783, 2019). 그러나, 연구는 뉴클레아제-유도된 DSB가 원치않은 큰 단편 결실 및 p53-의존적 DNA 손상 반응을 생성함으로써(Haapaniemi 등, Nature Medicine, 24(7):927-903, 2018; Ihry 등, Nature Medicine, 24(7):939-946, 2018; Kosicki 등, Nature Biotechnology 36: 765, 2018) 숙주 세포에 대한 부작용을 유발할 수 있음을 보고하였다(Haapaniemi 등, Nature Medicine, 24(7):927-903, 2018; Ihry 등, Nature Medicine, 24(7):939-946, 2018; Kosicki 등, Nature Biotechnology 36: 765, 2018).
염기 편집기(BE)는 DSB를 생성하지 않으면서 표적화된 게놈 유전자좌에서 정확한 뉴클레오티드 치환을 설치할 수 있다. 이들은 핵염기 데아미나제 효소 및, 일부 경우에, DNA 글리코실라제 억제제에 융합된, DSB를 만들 수 없는 Cas9 닉카제(nCas9)와 같은 촉매적으로 기능상실된 뉴클레아제를 포함한다. 현재, 2 가지 주요 범주인 사이티딘 염기 편집기(CBE) 및 아데닌 염기 편집기(ABE)가 있으며, 이는 nCas9와 커플링된 단일 가이드 RNA(sgRNA)에 의해 지시된 좁은 표적가능한 창(일반적으로 약 5 개 염기 쌍)에서 각각 C > T 및 A > G 전이를 전환시킨다(Gaudelli 등, Nature 551: 464-471, 2017; Komor 등, Nature 533: 420-424, 2016; Nishida 등, Science 353, 2016). CBE 및 ABE 사이의 핵심 차이는 CBE가 사이티딘 데아미나제(예를 들어, APOBEC1)를 함유하고 ABE가 실험실에서 진화된 TadA 데옥시아데노신 데아미나제를 사용하는 데아미나제 영역에 위치한다. 다중 그룹은 다양한 진핵생물 세포에서 효율적인 염기 편집을 보고하였다(Zhang 등, Genome Biology 20: 101, 2019; Chadwick 등, Arterioscler Thromb Vasc Biol 37: 1741-1747, 2017; Zeng 등, Nature Medicine 26: 535-541, 2020; Lim 등, Mol Ther, 82(4):1177-1189, 2020; Gao 등, Nature 553: 217-221, 2018). 인간에서 알려진 모든 병원성 단일 뉴클레오티드 다형성(SNP)의 60%는 현재 BE에 의해 잠재적으로 역전될 수 있는 것으로 예측된다(Rees 등, Nature Reviews Genetics 19: 770-788, 2018).
β-혈색소병증은 주로 β-지중해빈혈 및 겸상적혈구병(SCD)를 포함하는 정상 β글로빈 생산이 부재하거나 또는 겹핍된 유전 질환의 통상적인 그룹이다. 특이적 유전적 결함에 따라, β-지중해빈혈 및 SCD 환자는 다양한 중증도의 질환 징후를 나타낸다. 신생아 스크리닝 및 치료 예방으로 SCD 어린이의 사망률이 크게 감소하였지만, 대부분의 β-주요 지중해빈혈(β0) 및 SCD 환자는 평생 급성 및 만성 합병증으로 고통을 받는다(Ware 등, Lancet 390: 311-323, 2017; Higgs 등, Lancet 379: 373-383, 2012). 그러나, 대부분의 임신 단계 동안 우세하고 일반적으로 출생 직후 침묵하는 태아 헤모글로빈(HbF) 수준이 높은 일부 성인 환자에서, 질환 증상은 현저하게 경미하다. 이러한 태아 헤모글로빈의 유전적 지속성(HPFH) 현상은 HbF의 강한 보호 효과를 입증하고 β-글로빈 장애 환자에 대한 유전적 요법 전략으로서 γ-글로빈의 재활성화에 대한 우수한 근거를 제공한다.
다수의 HPFH 돌연변이가 보고되었다(Orkin & Bauer, Annual Review of Medicine 70: 257-271, 2019 및 Wienert 등, Trends in Genetics: TIG 34: 927-940, 2018에 의해 검토됨). HBG1/2 프로모터에서 약 -150, -175 및 -200 부위에 위치한 HPFH SNP의 3 가지 주요한 클러스터가 있다. 이들 부위에서 HPFH 돌연변이의 도입은 HbF 억제인자(예를 들어, BCL11A 및 ZBTB7A)의 결합 부위를 파괴하거나 또는 활성인자(예를 들어, TAL1 및 KLF1)의 기능 획득 결합 부위를 생성하여, 억제된 HbF 발현으로 이어질 수 있다(Traxler 등, Nature Medicine 22: 987-990, 2016; Martyn 등, Nature Genetics 50: 498-503, 2018). HbF 재활성화는 또한 주요한 HbF 억제인자인 BCL11A과 같은 HbF 조절인자의 발현을 조절함으로써 달성될 수 있다(Sankaran 등, Science 322: 1839-1842, 2008). 직접 BCL11A 녹아웃은 발달적으로 필수적인 역할로 인해 옵션이 아니었지만, 적혈구-특이적 인핸서의 편집에 의한 BCL11A의 부분적 하향조절은 동물 생존력을 유지하면서 효율적인 HbF 유도를 허용한다(Wu 등, Nature Medicine 25: 776-783, 2019; Canver 등, Nature 527: 192-197, 2015). BE:sgRNA 리보뉴클레오단백질(RNP) 전기천공법을 사용하여, 최근 연구는 +58 BCL11A 인핸서의 중요한 모티프를 염기 편집기로 파괴하는 것이 환자-유래된 CD34+ HSPC에서 치료적 HbF 유도로 이어짐을 입증하였다.
생체내 HSC 형질도입에 의한 단순화된 유전자 요법 접근법이 최근에 규명되었다. HSC 향성을 위한 키메라 섬유, 가장 통상적으로 사용되는 이식유전자를 수용하기 위한 32 kb 초과의 페이로드 등을 포함하는 다양한 유리한 특성으로 인해 헬프-의존적 HDAd5/35++ 벡터가 사용되었다. 이 연구에서, 최적화된 설계를 사용하여 BCL11A 인핸서 또는 HBG1/2 프로모터를 표적화하는 BE 벡터의 패널을 성공적으로 생성하였다. 유전자이식 마우스 모델에서, HDAD-ABE 벡터를 사용한 생체내 HSC 염기 편집은 HPFH 돌연변이를 재생성하고 효율적인 HbF 유도로 이어짐이 여기에 제시된다.
재료 및 방법 .
생체내 형질도입 및 선택을 위한 시약: G-CSF(Neupogen™)(Amgen, 캘리포니아주 사우전드 오크스 소재), AMD3100(MilliporeSigma, 매사추세츠주 버링턴 소재) 및 덱사메타손 나트륨 포스페이트(Fresenius Kabi USA, 일리노이주 레이크 주리치 소재)를 사용하였다. O6-벤질구아닌(O6-BG) 및 카르무스틴(BCNU)은 MilliporeSigma로부터 수득하였다.
HDAd 벡터 생성: 하버드의 David R. Liu 실험실에서 개발된 염기 편집 시스템을 사용하였다(Koblan 등, Nature Biotechnology 36: 843-846, 2018). pCMV_AncBE4max 및 pCMV_ABEmax 플라스미드는 Addegene(매사추세츠주 워터타운 소재)으로부터 구입하였다. Addgene으로부터 구입한 다음 플라스미드를 또한 사용하였다: 도 131a 및 131b의 BE4, ABE7.10, pLenti-BE3RA-PGK-Puro 및 pLenti-FNLS-PGK-Puro 및 BE3RA(Zafra 등, Nature Biotechnology 36: 888-893, 2018). 하기 기재된 올리고 및 gBlock은 Integrated DNA Technologies(IDT)(아이오와주 코랄빌 소재)에 의해 합성하고 표 14에 나열하였다.
표 14: 염기 편집기를 위한 가이드 서열.
Figure pct00024
CBE 및 ABE 작제물의 첫번째 버전: 클로닝은 3 단계를 수반하였다. 단계 1) BE4에서 BsmBI 부위는 EagI-NaeI 단편을 gBlock #1로 교체함으로써 파괴하였다. pCMV_AncBE4max에서 BsmBI 부위는 BsmBI-NarI 단편을 gBlock #2로 교체함으로써 파괴하였다. BsmBI sgRNA 클로닝 부위가 있는 pBST-CRISPR이라는 벡터는 주입을 사용하여(Takara, 캘리포니아주 마운틴뷰 소재) 다음 4 개의 단편을 조합함으로써 생성되었다: #3FR을 사용하여 LentiCRISPRv2(Addgene)로부터 증폭된 2.3 kb U6-충전제-gRNA 스캐폴드 단편, 각각 #4FR 및 #5FR을 사용하여 pBST-sgBCL11Ae1로부터 증폭된 1.4 k b 및 1.0 kb 단편(Li 등, Blood 131: 2915-2928, 2018), 및 BsaI-BamHI 소화에 의해 방출된 pBST-sgBCL11Ae1의 9.6 kb 단편. 중간 플라스미드 pBS-U6-Ef1α는 주입을 사용하여 다음 3 개의 단편을 연결함으로써 구성되었다: 각각 프라이머 #6FR 및 #7FR을 사용하여 pBST-CRISPR로부터 증폭된 3.6 kb U6-충전제-스캐폴드-Eflα 서열 및 2.9 kb 벡터 백본, 및 BseRI 클로닝 부위를 함유하는 0.5 kb gBlock(#8). 이 중간체를 BseRI로 소화시키고 EagI-PmeI 처리 후 BE4-ΔBsmBI의 5.5 kb 단편과 재조합하여, pBS-BE4를 생성하였다. 6.6 kb pBS 백본-U6-충전제-gRNA 스캐폴드-Eflα 서열을 #9FR을 사용하여 pBS-BE4로부터 PCR 증폭시킨 후, NotI-AgeI-소화된 pCMV-ABEmax 및 pCMV_AncBE4max-ΔBsmBI를 주입하여, 각각 pBS-AncBE4max 및 pBS-ABEmax를 생성하였다. 다음으로, sgRNA 올리고를 합성하고, 어닐링하고 pBS-BE4, pBS-AncBE4max 및 pBS-ABEmax의 BsmBI 부위로 삽입하여, pBS-ABEmax-sgHBG#2와 같은 일체형 염기 편집 구성요소를 같는 셔터 플라스미드를 생성하였다. 단계 2) PacI 클로닝 부위가 있는 21.0 kb pHCAS3-MCS 벡터를, 스터퍼 DNA를 EcoRI 제한에 의해 줄이고 1.8 kb EcoRI 단편과 재결찰시키는 것을 제외하고 이전에 기재된 것과 유사하게 생성하였다(Li 등, Cancer Res 80: 549-560, 2020). 2.2 kb PGK-MGMTP140K-2A-GFP-bGHpolyA 서열을 #10FR에 의해 pHCA-이중-MGMT-GFP로부터 증폭시키고(Li 등, Blood 131: 2915-2928, 2018) PacI-소화된 pHM5-FRT-IR-Ef1α-GFP와 재조합하여(Richter 등, Blood 128: 2206-2217, 2016), pHM5-FI-PGK-MGMT-GFP를 생성하였다. 이후에, I-CeuIPI-SceI 부위 사이의 단편을 #11FR에 의해 이 작제물로부터 pHCAS3-MCS의 PshAI 부위로 옮기고 주입 클로닝하여, pHCAS3-FI-PGK-MGMT-GFP-MCS를 형성하였다. 단계 3) 단계 1의 셔틀 플라스미드 및 단계 2에서 생성된 벡터를 PacI로 처리하고 재조합하여 pHCA-ABEmax-sgHBG#2-FI-MGMT-GFP와 같은 최종 작제물을 생성하였다. 상이한 sgRNA 서열을 갖는 최종 pHCA 작제물은, 상이한 sgRNA가 단계 1에서 사용되었다는 것을 제외하고 유사하게 생성되었다.
ABE 작제물의 두번째 버전: ABE 작제물의 두번째 버전은 프로모터, 대안적인 코돈 용법 및 miRNA-조절된 유전자 발현에서 첫번째 버전과 상이하다. 클로닝은 또한 3 단계를 수반하였다. 단계 1) miR183/218 표적 서열이 있는 1.5 kb 3' β-글로빈 UTR을 프라이머 #12FR을 사용하여 pBST-sgHBG1-miR로부터 증폭시킨 후(Li 등, Blood 131: 2915-2928, 2018), pBS-ABEmax-sgHBG#2의 NotI-HpaI 부위에 삽입하여, pBS-ABEmax-sgHBG#2-miR을 생성하였다. ABE 작제물의 두번째 버전에 대한 셔틀 플라스미드, 예를 들어, pBS-ABEopti-sgHBG#2-miR은 주입 클로닝에 의해 AscI-EcoRV-소화된 pBS-ABEmax-sgHBG#2-miR과 다음 4 개의 단편을 연결함으로서 수득하였다: #13FR을 사용하여 pHM5-FI-PGK-MGMT-GFP로부터 증폭된 인간 PGK 프로모터, 서열 반복성을 감소시키는 대안적인 코돈 용법을 갖는 2 개의 TadA 유전자를 함유하는 2 개의 gBlock(#14 및 #15), 및 #16FR을 사용하여 pBS-ABEmax-sgHBG#2로부터 증폭된 1.9 kb 서열. 단계 2) pHM-FRT-IR-Ef1α-MGMT(P140K)-2A-GFP-pA의 PshAI-NotI 부위 사이의 SV40 polyA 서열을 bGH polyA 서열(gBlock #17)로 대체하여, pHM-FI-Ef1α-MGMT(P140K)-GFP-bGHpA를 수득하였다. 그런 다음, I-CeuIPI-SceI 부위 사이의 전체 4.9 kb 트랜스포존을 #11FR을 사용하여 pHCAS3-MCS의 PshAI 부위로 전달하여, pHCAS3-FI-Ef1α-MGMT-GFP-MCS를 생성하였다. 단계 3) 단계 1 및 2로부터의 생성된 작제물을 PacI 처리 후 주입 클로닝에 의해 조합하여, pHCA-ABEopti-sgHBG#2-FI-MGMT-GFP를 생성하였다. 상이한 sgRNA 서열을 갖는 최종 pHCA 작제물을 유사하게 생성하였다.
Phusion Hot Start II 고충실도 DNA 폴리머라제를 클로닝에 수반되는 모든 PCR 증폭에 사용하였다. 최종 작제물을 여러 제한 효소(HindIII, EcoRIPmeI)에 의해 스크리닝하고 이식유전자를 함유하는 전체 영역을 서열분석함으로써 확인하였다.
HDAd5/35++ 벡터의 생산을 위해, 상응하는 플라스미드를 PmeI로 선형화하고 Ad5 섬유 꼬리, Ad35 섬유 샤프트, 및 친화도-향상된 Ad35++ 섬유 놉으로 구성된 키메라 섬유를 함유하는 Ad5/35++ 헬퍼 벡터(Richter 등, Blood 128: 2206-2217, 2016)인 AdNG163-5/35++로 116 세포에서 구제하였다(Palmer & Ng, Mol Ther 8: 846-852, 2003). HD-Ad5/35++ 벡터를 다른 곳에 상세히 기재된 바와 같이 116 세포에서 증폭시켰다(Palmer & Ng, Mol Ther 8: 846-852, 2003). 헬퍼 바이러스 오염 수준은 0.05% 미만인 것으로 밝혀졌다. 역가는 2-5x1012 개 바이러스 입자(vp)/mL였다.
세포주의 형질감염: 293FT(Thermo Fisher Scientific) 및 K562 세포를 판매처의 지침에 따라 배양하였다. 6-웰 플레이트에 미리 시딩된 293FT 세포를 제조업체의 프로토콜에 따라 리포펙타민 3000(Thermo Fisher Scientific)을 사용하여 4 μg 플라스미드(3 μg 염기 편집기 또는 CRISPR/Cas9 + 1 μg pSP-sgBCL11AE(Li 등, Mol Ther Methods Clin Dev 9: 390-401, 2018))로 형질감염시켰다. K562 세포를 공급자의 프로토콜에 따라 뉴클레오펙션(카탈로그 # V4XC-2024)(Lonza, 스위스 바젤 소재)을 사용하여 2.66 μg 플라스미드(2 μg 염기 편집기 또는 CRISPR/Cas9 + 0.6 μg pSP-sgBCL11AE)로 형질감염시켰다. 게놈 DNA을 분석을 위해 형질감염 후 4 일째에 단리하였다.
HUDEP-2 세포 및 적혈구 분화: HUDEP-2 세포(Kurita 등, PloS One 8: e59890, 2013)를 100 ng/mL SCF, 3 IU/mL EPO, 10-6 M 덱사메타손 및 1 μg/mL 독시사이클린(DOX)이 공급된 StemSpan SFEM 배지(STEMCELL Technologies)에서 배양하였다. 적혈구 분화를 5% 인간 AB 혈청, 100 ng/mL SCF, 3 IU/mL EPO, 10 μg/mL 인슐린, 330 μg/mL 트랜스페린, 2 U/mL 헤파린 및 1 μg/mL DOX를 함유하는 IMDM에서 6 일 동안 유도하였다.
콜로니-형성 단위(CFU) 검정: 계통 마이너스(Lin-) 세포를 제조업체의 지침에 따라 마우스 계통 세포 고갈 키트(Miltenyi Biotec, 캘리포니아주 샌디에이고 소재)를 사용하여 골수 MNC에서 게통-수임 세포의 고갈에 의해 단리하였다. CFU 검정을 제조업체의 프로토콜에 따라 마우스 완전 배지와 함께 ColonyGEL(Reachbio, 워싱턴주 시애틀 소재)을 사용하여 수행하였다. 콜로니를 플레이팅 후 10 일에 점수매겼다.
T7EI 불일치 뉴클레아제 검정: 게놈 DNA를 제공된 프로토콜에 따라 PureLink Genomic DNA 미니 키트(Life Technologies, 캘리포니아주 칼즈배드 소재)를 사용하여 단리하였다(Miller 등, Nat Biotechnol 25: 778-785, 2007). 적혈구 BCL11A 인핸서의 표적 부위를 포함하는 게놈 분절을 PCR 프라이머에 의해 증폭시켰다: BCL11A 정방향(서열번호: 247) 및 역방향(서열번호: 263). PCR 생성물을 혼성화하고 2.5 단위의 T7EI(New England Biolabs)로 37℃에서 30 분 동안 처리하였다. 소화된 PCR 생성물을 10% TBE PAGE(Bio-Rad)로 분해하고 에티듐 브로마이드로 염색하였다. 100 bp DNA 래더(New England Biolabs)를 사용하였다. 밴드 강도는 ImageJ 소프트웨어를 사용하여 분석하였다. 절단율% = (1-sqrt(모체 밴드/(모체 밴드 + 절단된 밴드)) * 100%.
유세포 분석: 세포를 FACS 완충액(PBS, 1% FBS) 중 1x106 개 세포/100 μL로 재현탁하고 FcR 차단 시약(Miltenyi Biotech, 캘리포니아주 오번 소재)과 함께 얼음 위에서 10 분 동안 배양하였다. 다음으로 염색 항체 용액을 106 개 세포 당 100 μL로 첨가하고 암실에서 30 분 동안 얼음 위에서 배양하였다. 배양 후, 세포를 FACS 완충액에서 1 회 세척하였다. 2차 염색을 위해 염색 단계를 2차 염색 용액으로 반복하였다. 세척 후, 세포를 FACS 완충액에 재현탁하고 LSRII 유세포 분석기(BD Biosciences, 캘리포니아주 산호세 소재)를 사용하여 분석하였다. 파편을 전방 산란 영역 및 측방 산란 영역 게이트를 사용하여 제외하였다. 그런 다음 단일 세포를 전방 산란 높이 및 전방 산란 폭 게이트를 사용하여 게이팅하였다. 그런 다음 유세포 분석 데이터를 FlowJo(버전 10.0.8, FlowJo, LLC)를 사용하여 분석하였다. LSK 세포의 분석을 위해, 세포를 비오틴-접합된 계통 검출 칵테일(카탈로그 # 130-092-613)(Miltenyi Biotec, 캘리포니아주 샌디에이고 소재), c-Kit(클론 2B8, 카탈로그 # 12-1171-83) 및 Sca-1(클론 D7, 카탈로그 # 25-5981-82)에 대한 항체로 염색한 후, APC-접합된 스트렙타비딘(카탈로그 # 17-4317-82)(eBioscience, 캘리포니아주 샌디에이고 소재)으로 2차 염색하였다. eBioscience로부터의 다른 항체는 항-마우스 CD3-APC(클론 17A2)(카탈로그 # 17-0032-82), 항-마우스 CD19-PE-Cyanine7(클론 eBio1D3)(카탈로그 # 25-0193-82), 및 항-마우스 Ly-66(Gr-1)-PE(클론 RB6-8C5)(카탈로그 # 12-5931-82를 포함하였다. 항-마우스 Ter-119-APC(클론 Ter-119)(카탈로그 # 116211)는 Biolegend(캘리포니아주 샌디에이고 소재)로부터 수득하였다.
인간 γ-글로빈 발현을 검출하는 세포내 유세포 분석: FIX & PERMTM 세포 투과화 키트(Thermo Fisher Scientific)를 사용하고 제조업체의 프로토콜에 따랐다. 간단히 말해서, 5x106 개의 HUDEP-2 세포를 100 μL FACS 완충액에 재현탁하였다. 100 μL의 시약 A(고정 배지)를 첨가하고 실온에서 2-3 분 동안 배양하였다. 그런 다음 1 mL 미리 냉각된 절대 메탄올을 첨가하고 10 분 동안 암실에서 얼음 위에서 배양하였다. 그런 다음 샘플을 FACS 완충액으로 세척하고, 0.6 μg 헤모글로빈 γ 항체(클론 51-7, 카탈로그 # sc-21756 PE)(Santa Cruz Biotechnology, 텍사스주 댈러스 소재)를 함유하는 100 μL 시약 B(투과 배지)에 재현탁하고, 실온에서 30 분 동안 배양하였다. 세척 후, 세포를 FACS 완충액에 재현탁하고 분석하였다.
글로빈 HPLC: 개별 글로빈 쇄 수준을 SPD-10AV 다이오드 어레이 검출기 및 LC-10AT 바이너리 펌프가 장착된 Shimadzu Prominence 기기(Shimadzu, 일본 쿄토 소재)로 정량화하였다. 폴리펩티드용 Vydac 214TP™ C4 역상 칼럼(214TP54 Column, C4, 300 Å, 5 μm, 4.6 mm i.d. x 250 mm)(Hichrom, 영국 소재)을 사용하였다. 물/아세토니트릴 중 0.1% 트리플루오로아세트산의 40%-60% 구배 혼합물을 1 mL/분의 속도로 적용하였다. 
벡터 카피 수의 측정: 세포 당 아데노바이러스 게놈 카피의 절대 정량화를 위해, 게놈 DNA를 제공된 프로토콜에 따라 PureLink Genomic DNA 미니 키트(Life Technologies)를 사용하여 세포로부터 단리하고, power SYBRTM green PCR 마스터 믹스(Thermo Fisher Scientific)를 사용하여 수행된 qPCR에 대한 주형으로 사용하였다. 다음 프라이머 쌍을 사용하였다: MGMT 정방향(서열번호: 220), 및 역방향(서열번호: 221).
실시간 역전사 PCR: 총 RNA를 TRIzolTM 시약(Thermo Fisher Scientific)을 사용하여 5x106 개의 분화된 HUDEP-2 세포 또는 100 μL 혈액으로부터 추출한 후 페놀-클로로포름으로 추출하였다. QuantiTect 역전사 키트(Qiagen) 및 power SYBRTM green PCR 마스터 믹스(Thermo Fisher Scientific)를 사용하였다. 실시간 정량적 PCR을 StepOnePlus 실시간 PCR 시스템(AB Applied Biosystems)에서 수행하였다. 다음 프라이머 쌍을 사용하였다: 마우스 RPL10(하우스키핑) 정방향(서열번호: 189), 및 역방향(서열번호: 190); 인간 γ-글로빈 정방향(서열번호: 191), 및 역방향(서열번호: 192); 인간 β-글로빈 정방향(서열번호: 216), 및 역방향(서열번호: 217); 마우스 β-주요 글로빈 정방향(서열번호: 193), 및 역방향(서열번호: 194), 마우스 α 글로빈 정방향(서열번호: 212), 및 역방향(서열번호: 213).
염기 편집의 검출: 게놈 DNA를 상기 기재된 바와 같이 단리하였다. BCL11A 인핸서 및 HBG1/2 프로모터의 표적 부위를 포함하는 게놈 분절을 다음 프라이머를 사용하여 KOD Hot Start DNA 폴리머라제(MilliporeSigma)로 증폭시켰다: HBG1 정방향(서열번호: 31), 역방향(서열번호: 33); HBG2 정방향(서열번호: 69), 역방향(서열번호: 72); 및 상기 제시된 BCL11A 프라이머. 앰플리콘을 NucleoSpin Gel & PCR 정리 키트(Takara)를 사용하여 정제하고 다음 프라이머로 서열분석하였다: HBG1-seq(서열번호: 105); HBG2-seq(서열번호: 237); 및 BCL11A-seq(서열번호: 247). 염기 편집 수준을 EditR 1.0.9를 사용하여 Sanger 서열분석 결과로부터 정량화하였다(Kluesner 등, CRISPR J 1: 239-250, 2018).
동물 연구: 동물을 수반하는 모든 실험은 워싱턴 대학에 의해 제시된 기관 지침에 따라 수행하였다. 워싱턴 대학은 실험실 동물 관리 국제 평가 및 인증 협회(AALAC) 공인 연구 기관이며 이 대학에서 수행된 모든 살아있는 동물 작업은 실험실 동물 복지국(OLAW) 공중 보건 보증(PHS) 정책, USDA 동물 복지법 및 규정, 실험 동물 관리 및 사용에 대한 지침 및 기관 동물 관리 및 사용 위원회(IACUC) 정책을 따른다. 연구는 워싱턴 대학 IACUC(프로토콜 번호 3108-01)에 의해 승인되었다. 인간 CD46 게놈 유전자좌를 함유하고 인간과 유사한 수준 및 패턴으로 CD46 발현을 제공하는 C57BL/6J 기반 유전자이식 마우스(hCD46+/+ 마우스)는 이전에 기재되었다(Kemper 등, Clin Exp Immunol 124: 180-189, 2001). 야생형 248 kb β-글로빈 유전자좌 효모 인공 염색체(β-YAC)를 보유하는 유전자 이식 마우스를 사용하였다(Peterson 등, Ann N Y Acad Sci 850: 28-37, 1998). β-YAC 마우스를 인간 CD46+/+ 마우스와 교배하여 생체내 HSPC 형질도입 연구를 위한 β-YAC+/-/CD46+/+ 마우스를 수득하였다. 다음 프라이머를 마우스의 유전형 분석에 사용하였다: CD46 정방향(서열번호: 233) 및 역방향(서열번호: 234); β-YAC(γ-글로빈 프로모터) 정방향(서열번호: 242) 및 역방향(서열번호: 243).
HSPC 동원 및 생체내 형질도입: HSPC를 인간 재조합 G-CSF의 피하(SC) 주사(5 μg/마우스/일, 4 일) 이어서 5 일째에 AMD3100의 SC 주사(5 mg/kg)에 의해 마우스에 동원하였다. 또한, 동물은 바이러스 주사 16 시간 및 2 시간 전에 덱사메타손(10 mg/kg, IP)을 받았다. AMD3100 후 30 및 60 분에, 동물에게 2 개 용량의 바이러스(4x1010 vp/용량 x 2 회 용량)를 안와하정맥총을 통해 바이러스 벡터로 정맥내로 주사하였다. 염기 편집 및 SB 바이러스를 1:1 비로 공동 전달하였다.
생체내 선택: 선택을 형질도입 후 1 주차(Townes 모델) 또는 4 주차(β-YAC 모델)에 시작하였다. 마우스에게 O6-BG(15 mg/kg, IP)를 2 회, 30 분 간격으로 주사하였다. O6-BG의 두번째 주사 1 시간 후, 마우스에게 5 mg/kg BCNU를 주사하였다(IP). 선택의 첫번째 차례 후 2 및 4 주차에, 2 차례 이상을 각각 7.5 및 10 mg/kg의 BCNU 용량으로 수행하였다.
2차 골수 이식: 수용자는 Jackson Laboratory로부터 수득된 6 - 8 주령의 암컷 C57BL/6J 마우스였다. 이식 당일에, 수용자 마우스를 1000 Rad로 조사하였다. 생체내 형질도입된 CD46tg 마우스로부터 골수 세포를 무균상태로 단리하고 계통-고갈된 세포를 상기 기재된 바와 같이 MACS를 사용하여 단리하였다. 조사 6 시간 후 세포를 마우스 당 1x106 개의 세포로 정맥내로 주사하였다. 2차 수용자를 종료점 분석을 위해 이식 후 16 주 동안 유지하였다.
조직 분석: 2.5 μm 두께의 비장 및 간 조직 절편을 4% 포름알데하이드에 적어도 24 시간 고정시키고, 탈수하고 파라핀에 포매하였다. 헤마톡실린-에오신으로 염색을 골수외 혈구형성의 조직학적 평가를 위해 사용하였다. 헤모시데린을 Perl의 프러시안 블루 염색에 의해 조직 절편에서 검출하였다. 간단히 말해서, 조직 절편을 증류수 중 동일한 부피(2%)의 페로시안화칼륨 및 염산의 혼합물로 처리한 다음 뉴트럴 레드로 대조염색하였다.
혈액 분석: 혈액 샘플을 EDTA-코팅된 튜브에 수집하고 분석을 HemaVet 950FS(Drew Scientific, 코네티컷주 워터베리 소재)에서 수행하였다. 말초 혈액 도말을
Figure pct00025
(Merck, 독일 다름슈타트 소재)로 각각 5 및 15 분 동안 염색하였다. 망상적혈구를 브릴리언트 크레실 블루로 염색하였다. 혈액 도말에 대한 망상적혈구를 계수한 조사자들은 샘플 그룹 할당에 대해 맹검이었다. 슬라이드에는 동물 번호만이 보였다(동물 당 5 개 슬라이드, 5 개의 무작위 1 cm2 절편).
통계적 분석 : 다중 그룹의 비교를 위해, 다중 비교를 위한 본페로니 사후-테스트와 함께 일원 및 이원 분산 분석(ANOVA)을 이용하였다. 통계적 분석은 GraphPad Prism 버전 6.01(GraphPad Software Inc., 캘리포니아주 라호이아 소재)을 사용하여 수행하였다.
결과 . 염기 편집기 및 가이드 RNA의 선택. BE4(Komo 등, Science Advances 3: eaao4774, 2017), AncBE4max(Koblan 등, Nature Biotechnology 36: 843-846, 2018), BE3RA 및 FNLS(Zafra 등, Nature Biotechnology 36: 888-893, 2018)를 포함하는 사이티딘 염기 편집기(CBE)의 다중 버전의 편집 활성을 비교하였다. 염기 편집기(BE)를 보편적인 EF1α 프로모터에 의해 서브클로닝하고 구동시켰다. +58 BCL11A 인핸서 영역에서 GATAA 모티프를 표적화하는 인간 U6 프로모터 하에 가이드 RNA를 발현하는 두번째 플라스미드(Canver 등, Nature 527: 192-197, 2015)를 공동 형질감염에 사용하였다. BE3RA는 293FT 세포에서 더 높은 편집을 나타내었지만(도 131a), AncBE4max 시스템은 절단 검정에 의해 측정된 K562 적혈구 세포에서 가장 높은 활성을 입증하였다(도 131b). 따라서, AncBE4max를 하류 연구에 사용하였다. 아데닌 염기 편집기(ABE)의 경우, David Liu 그룹에 의해 개발된 ABEmax 시스템을 사용하고 AncBE4max에 대한 것과 유사한 접근법을 사용하여 최적화하였다(Koblan 등, Nature Biotechnology 36: 843-846, 2018). 또한 xCas9(3.7)-BE4 및 xCas9(3.7)-ABE(7.10) 편집기를 광범위한 PAM 호환성으로 인해 가이드 서열 스크리닝에 사용하였다(Hu 등, Nature 556: 57-63, 2018).
염기 편집기의 최적의 표적가능한 창은 5' 단부 첫번째 염기를 위치 1로서 계수하는 프로토스페이서의 위치 4-8이다. 단일 가이드 RNA(sgRNA) 서열의 패널을 +58 BCL11A 인핸서에서 GATAA 모티프(sgBCL#1 내지 #6)에 특이적이거나 또는 HBG1/2 프로모터에서 다양한 자연 발행 태아 헤모글로빈의 유전적 지속성(HPFH) 돌연변이(sgHBG#1 내지 #6)를 재생성하도록 설계하였다. 서열 및 이의 특이적 표적 모티프/염기는 표 14에 제시되었다. 가이드 서열을 γ-글로빈 발현을 재활성화하는 효능에 대해 적혈구 전구체 세포주 HUDEP-2 세포(Kurita 등, PloS One 8: e59890, 2013)에서 테스트하였다. 세포를 형질감염 후 4 일차에 적혈구 분화에 넣었다. 모든 12 개의 sgRNA 서열은 CCR5 발현을 표적화하지만 헤모글로빈-관련 유전자는 표적화하지 않는 음성 CBE 대조군과 비교하여 상당한 γ-글로빈 발현을 야기하였다(도 130). sgHBG#2는 분화 후 6 일차에 41% HbF+ 세포를 초래하였다. HBG 프로모터에서 BCL11A 결합 부위를 표적화하는 이전에 기재된 CRISPR 벡터를 양성 대조군으로 사용하고 HbF+ 세포의 84%를 생성하였다(Li 등, Blood 131: 2915-2928, 2018). 따라서, sgBCL#1(CBE), sgHBG#1(CBE), sgHBG#2(ABE) 및 sgHBG#4(ABE)를 활성 뿐만 아니라 표적 부위의 다양성을 고려하여 바이러스 벡터 전달을 위해 선택하였다. 음성 대조군 벡터 sgNeg(CBE) 및 sgHBG#1 및 sgBCL#1을 둘 다 함유하는 벡터(Dual, CBE)를 또한 구축하였다.
BE를 발현하는 헬프-의존적 아데노바이러스 벡터(HDAd)의 생성. 다음으로, 목표는 효율적인 생체내 BE 전달을 위한 바이러스 벡터를 생성하는 것이었다. 필요한 조절 요소를 함유하는 8 kb 초과 크기의 염기 편집기로 인해, 하나의 렌티바이러스 벡터(LV) 또는 아데노 연관 벡터(AAV)에 맞추기가 어렵다. 조혈 줄기 세포(HSC)의 효율적인 형질도입을 위해 HDAd5/35++라고 불리는 변형된 섬유를 갖는 HDAd 벡터를 개발하였다(Li 등, Mol Ther Methods Clin Dev 9: 142-152, 2018). HDAd 벡터는 36 kb 패키징 용량을 수용하여, BE 구성요소를 위한 충분한 공간을 제공할 수 있다. 첫번째 시도에서, BE 효소(CBE의 경우 rAPOBEC1-nCas9-2xUGI 또는 ABE의 경우 2xTadA-nCas9)를 EF1α 프로모터 하에 배치하였다. 인간 U6 프로모터에 의해 구동된 sgRNA를 포함하는 전체 BE 구성요소를 HDAd 벡터 플라스미드 pHCA에 클로닝하였다. FRT 및 트랜스포존 부위에 의해 플랭킹된 MGMT/GFP 카세트를 또한 벡터로 클로닝하여 O6BG/BCNU 처리에 의해 형질도입된 세포의 선택을 용이하게 하였다(도 132a 및 132b). 특히, BE 구성요소를 트랜스포존의 외부에 배치하였다. 이 설계는 i) MGMT/GFP의 통합된 발현을 유지하면서 BE의 일시적 발현을 허용하고; ii) 잠자는 미녀 트랜스포사제를 발현하는 또 다른 벡터(HDAd-SB)와 공동 감염 시 편집 효소의 보다 빠른 분해를 허용한다(벡터 설계의 특정 측면의 추가 논의 및/또는 추가적인 예시를 위해, 실시예 3을 또한 참조한다). 3-리터 스피너 당 수율은 상대적으로 낮았지만(평균 1x1012 개의 바이러스 입자 또는 vp), 4 개의 CBE 벡터를 모두 구제하였다. 이는 뉴클레아제 발현을 조절하는 메커니즘 없이 구제가능하지 않은 HDAd-CRISPR 벡터와 대조적이다(Saydaminova 등, Mol Ther Methods Clin Dev 1: 14057, 2015). 결과는 DSB-무함유 BE 시스템이 CRISPR/Cas9보다 HDAd 생산자 세포에 독성이 적을 수 있음을 시사하였다. ABE 벡터의 경우, 바이러스가 재배열된 것으로 보였고 CsCl 구배를 사용한 초원심분리 후 별개의 HDAd 밴드는 관찰되지 않았다. ABE 및 CBE 벡터 사이의 주요 차이는 데아미나제 영역이므로, ABE 벡터에서 2 개의 TadA-32aa 반복부는 원인 요소였을 가능성이 있었다. 따라서, ABE 벡터의 첫번째 버전에 대해 다음 변형이 이루어졌다: i) 2 개의 TadA-32aa 반복부 사이의 서열 반복성은 대안적인 코돈 용법에 의해 추가로 감소되었다(도 132c); ii) PGK 프로모터를 사용하여 BE 효소를 구동하였다. HSC에서 구성하는 동안(Li 등, Cancer Res 80: 549-560, 2020), PGK 프로모터는 116 생산자 세포에서 Ef1α보다 더 낮은 유전자 발현을 구동하여(Qin 등, PloS One 5: e10611, 2010), 잠재적인 TadA-연관 부작용을 제거한다; iii) miR183/218-기반 유전자 조절 시스템을 활용하여 BE 발현을 추가로 제어하였다(Saydaminova 등, Mol Ther Methods Clin Dev 1: 14057, 2015)(도 133a). 최적화된 설계의 이러한 두번째 버전의 작제물은 정상 수율 범위 내에 있는 3.3x1012 vp/스피너의 평균 수율로 2 개의 HDAd-ABE 바이러스를 성공적으로 구제하였다(도 133b).
다음으로 HDAd 벡터를 HUDEP-2 세포에서 조사하였다. 테스트된 5 개의 벡터는 모두 표적 염기 전환을 효율적으로 설치하고 실질적인 γ-글로빈 재활성화로 이어졌다(도 133 및 도 134). 일시적 형질감염에 의한 스크리닝 데이터와 일치하게, HDAd-ABE-sgHBG#2 벡터는 최고 수준의 HbF+ 세포를 유도하였다(MOI 1000 vp/세포에서 71%). 흥미롭게도, sgBCL#1 및 sgHBG#1 단독은 각각 17% 및 39% HbF+ 세포를 매개하였지만, sgBCL#1 및 sgHBG#1을 동시에 발현하는 이중 표적화 벡터는 sgHBG#2의 수준과 비슷한 수준에서 HbF 유도를 생성하였으며(도 133c), 이는 상승 효과를 나타낸다. 음성 대조군 벡터에 대해 유의한 HbF 유도는 측정되지 않았다. HPLC에 의해 측정된 γ-글로빈 단백질 수준은 유세포 분석 데이터와 일치하였다. 인간 β-글로빈에 비해 인간 γ-글로빈의 23%가 sgHBG#2로 형질도입 후 관찰되었으며, 이는 상당한 전환을 입증한다(도 133e 및 133h). MOI 1000에서, 4 개의 sgRNA에 대한 염기 전환 빈도는 25 - 51% 범위 내에 있었다(도 133d 및 도 134a). sgHBG#2의 경우, 위치 5 및 8에서 각각 40% 및 34% A > G 전환이 검출되었다(도 133d). A8에서 G로의 전환은 -113A > G HPFH 돌연변이를 시뮬레이션하였다(표 14)(Martyn 등, Blood 133(8):852-856, 2019). HBG1HBG2 사이에 상당한 편집 차이는 발견되지 않았다. 단일 세포 유래 클론에서, A5 및 A8 부위에서 단일대립유전자성 편집은 HbF-양성 세포의 100%를 부여하였으며(도 133f 및 133g), 이는 HbF 억제를 조절하는 데 있어서 이들 부위의 중요한 역할을 확인하였다. sgHBG#1 및 sgHBG#4로부터 유래된 클론에서 유사한 결과가 제시되었다. sgBCL#1로 형질도입된 클론에서, BCL11A 인핸서의 GATAA 모티프에서 이중대립유전자성 G > A 돌연변이는 15% HbF-발현 세포를 야기하였다(도 134b 및 134c). 종합하여, 이들 데이터는 BCL11A 인핸서 또는 HBG1/2 프로모터에서 중요한 부위에 특이적인 HDAd-BE 벡터가 HbF 발현을 효율적으로 재활성화할 수 있음을 입증한다.
염기 편집기를 사용한 생체내 형질도입 후 β-YAC 마우스에서 γ-글로빈의 재활성화. HDAd5/35++ 벡터를 사용한 HSC의 생체내 형질도입에 의해 단순화된 유전자 요법 접근법이 달성되었다(Richter 등, Blood 128: 2206-2217, 2016). 따라서, 이러한 신규 생체내 전략법으로 염기 편집의 효능을 조사하였다. 완전한 82 kb β-글로빈 유전자좌를 포함하는 248 kb의 인간 DNA를 함유하는 β-YAC 마우스를 사용하였다(Peterson 등, PNAS USA 90: 7593-7597, 1993). 마우스를 HDAd5/35++ 벡터로의 형질도입을 허용하도록 인간 CD46 유전자이식 마우스와 교배하였다. HDAd-ABE-sgHBG#2는 HUDEP-2 세포에서 γ-글로빈 발현을 유도하는 가장 높은 효능을 인해 선택하였다. G-CSF/플레릭사포르로 동원 후, β-YAC/CD46 마우스에게 HDAd-ABE-sgHBG#2 및 HDAd-SB 벡터를 정맥내로 주사하였다. 형질도입 4 주 후, 마우스를 4 차례의 O6BG/BCNU(O6-벤질구아닌/카르무스틴) 처리에 적용하여 통합된 MGMT-GFP 이식유전자를 갖는 전구체를 선택적으로 확장시켰다(도 135a). 선택 후, PBMC에서 GFP 마킹은 60%에 도달하였다(도 135b 및 135c). 특히, 말초 혈액 세포에서 γ-글로빈 발현은 형질도입 전 1%에서 형질도입 후 16 주차에 평균(n = 9) 43%까지 증가하였으며, 이는 상당한 γ-글로빈 재활성화를 입증한다(도 135d 및 135e). 상이한 마우스 사이에 존재하는 큰 변이는 아마도 MGMT의 더 낮은 발현을 초래할 수 있는 MGMT-2A-GFP의 바이시스트론 설계에 의해 유발되고 따라서 생체내 선택 효능에 영향을 미쳤다. γ-글로빈+ 세포는 주로 골수 샘플의 두 혈액에서 적혈구(RBC) 분획(Ter-119+)에 상주하였다(도 135f). 16 주차에 RBC 용해물에서, 인간 β-글로빈 단백질에 비해 γ-글로빈의 최대 21%가 고성능 액체 크로마토그래피(HPLC)에 의해 측정되었다(도 135g 및 도 136). γ-글로빈 mRNA 발현은 HPLC 데이터와 일치하였다(도 135h). 16 주차에 총 골수 단핵 세포에서, 통합 벡터 카피 수는 세포 당 최대 2.5 개 카피였다(평균 1.4 개)(도 135I).
HBG1/2 프로모터에서 염기 편집을 분석하였다. HBG1HBG2의 A5 및 A8 부위에서 A > G 전환 빈도는 평균 15-30%였다(도 137a-137c). 염기 편집 빈도는 γ-글로빈 발현 수준과 밀접하게 상관관계가 있는 것으로 밝혀졌다(Pearson 검정, R = 0.92, p < 0.001) (도 137d). γ-글로빈 발현이 가장 높은 마우스에서, 82% 표적 염기 전환이 달성되었다(도 137b). 참고로, A5에서의 전환율%은 HBG1HBG2 영역 둘 다의 A8 부위에서보다 약간 더 높은 경향이 있었지만, 통계적 차이는 발견되지 않았다(도 137b). 일부 염기 편집기는 다중 표적이 프로토스페이서에 존재할 때 진행적 편집을 나타내는 것으로 제시되었다. 그러나, A9 부위에서 편집은 발견되지 않았다(도 137a 및 137c). 이는 위치 9가 최적 편집 창 외부에 위치하기 때문이며, 이는 편집 창의 협소함을 입증할 가능성이 있었다.
요약하면, 이들 데이터는 HBG1/2 프로모터에 특이적인 염기 편집기를 사용한 생체내 형질도입 이어서 선택이 β-YAC/CD46 마우스에서 효율적인 표적 염기 전환 및 γ-글로빈 재활성화를 야기함을 입증한다.
생체내 HSC 염기 편집 후 우수한 안전성 프로파일 및 안정된 효능. 16 주차에, 동물을 안락사시키고 조직 샘플을 다중 혈액학 및 조직학 분석에 적용하였다. 백혈구(K/μL), 적혈구(M/μL), Hb(g/dL), MCV(fL), MCHC(g/dL), RDW(%) 및 혈소판(K/μL)을 포함하는 혈액학적 매개변수는 미처리 β-YAC/CD46 마우스의 것과 유사하였다(도 138a 및 138b). 브릴리언트 크레실 블루 염색에 의해 측정된 말초 혈액 내 망상적혈구의 백분율은 처리되지 않은 마우스와 비슷하였다(도 138d). 비장 및 간 절편에서 골수외 적혈구생성의 병소는 관찰되지 않았다. PBMC, 비장 및 골수 단핵 세포에서 세포 조성물은 대조군 마우스와 구별할 수 없는 것으로 입증되었다(도 138c). 게다가, 이전에 보고된 다른 유전자 요법 벡터와 비교하여(Li 등, Blood 131: 2915-2928, 2018; Wang 등, J Clin Invest. 129(2): 598-615, 2018; Li 등, Molecular Therapy 27: 2195-2212, 2019), HDAd-ABE-sgHBG#2는 생체내 형질도입/선택 후 체중, 행동 및 외형의 명백한 변화를 유발하지 않았다.
생체내 형질도입이 장기간 재증식 HSPC에서 발생하였음을 입증하기 위해, 16 주차에 수확된 골수 계통 마이너스(Lin-) 세포를 형질도입 후 치명적으로 조사된 C57BL/6J 마우스(인간 CD46 유전자 없음)에 이식하였다. 2차 수용자에서 다중-계통 재구축을 구동하는 이식된 세포의 능력을 16 주의 기간에 걸쳐 평가하였다. PBMC에서 huCD46 발현에 기반한 생착률은 95% 초과였고 안정되게 유지하였다(도 139a). PMBC의 GFP 마킹은 1차 마우스의 것과 비슷하였다(도 139b). γ-글로빈+ RBC의 퍼센트는 평균 40%였고 안정되었다(도 139c).
이러한 관찰과 함께 생체내 HSC 염기 편집은 전반적으로 안전하였음이 입증되었다. 변형된 HSPC는 장기간 지속되었고 안정된 이식유전자 발현으로 2차 수용자 마우스를 재구축할 수 있었다.
최소 유전자간 결실 및 상위-점수 표적외 부위에서 검출가능하지 않은 편집. DSB-의존적 유전자 편집 전략의 균형은 잠재적인 게놈 큰-단편 결실이다(Kosicki 등, Nature Biotechnology 36: 765, 2018). DSB-생성 뉴클레아제에 의해 HBG1/2 프로모터를 표적화하는 경우, 이 부작용은 HBG1HBG2 영역 사이의 높은 유사성으로 인해 더 유의하게 될 수 있다. 2 개 영역 중 하나에 특이적인 가이드 서열은 또한 다른 하나를 표적화할 수 있다. CRISPR/Cas9를 사용하여 HBG1/2 프로모터에서 BCL11A 결합 부위를 표적화하는 것은 4.9 kb 유전자간 결실을 야기함이 보고되었다(Traxler 등, Nature Medicine 22: 987-990, 2016; Li 등, Blood 131: 2915-2928, 2018). 결과적으로, 전체 HBG2 유전자가 제거된다. 따라서, 반-정량적 PCR에 의한 게놈 결실을 조사하였다(Li 등, Blood 131: 2915-2928, 2018). 2 개의 표적화 부위에 플랭킹하는 한 쌍의 프라이머를 사용하여 9.9 kb 게놈 분절을 증폭시켰다. 4.9 kb 결실의 존재는 추가로 단축된 5.0 kb PCR 앰플리콘을 생성할 것이다. 결실 백분율은 표준 곡선을 확립함으로써 5.0 kb 대 9.9 kb 앰플리콘의 비와 양의 상관관계가 있었다(Li 등, Blood 131: 2915-2928, 2018의 도 7c 참조). 염기 편집기-처리된 마우스에서 평균 4.9 kb 결실은 1% 미만이었던 것으로 밝혀졌다(도 140). 일부 마우스에서, 거의 검출할 수 없었다. 이는 HDAd-HBG-CRISPR 벡터를 사용한 형질도입으로부터 유래된 것보다 상당히 더 낮았다(Li 등, Blood 131: 2915-2928, 2018).
다음으로, 표적외 분석을 수행하여 시스템의 충실도를 조사하였다. 인 실리코 분석은 인간 및 마우스 게놈 둘 다에서 가이드 서열에 대한 2 개 이하의 염기 쌍(bp) 불일치가 있는 잠재적인 표적외 부위가 없음을 나타내었다. 인간 및 마우스에서는 3 bp 불일치가 있는 각각 10 및 2 개의 잠재적인 표적외가 있었다. 이러한 예측된 표적에서 표적외 편집의 가능성은 모든 부위가 프로토스페이서의 PAM-근위 절반에서 적어도 1 bp 불일치를 보유하기 때문에 낮았던 것으로 추측되었다. 4 bp 불일치로 인해, 인간 및 마우스에서 각각 79 및 74 개의 잠재적 표적이 반환되었다. 연구를 마우스에서 수행한 이후, 10 개의 상위-점수의 게놈 부위(2 개는 3 bp 불일치; 7 개는 4 bp 불일치)를 표적내 염기 설치가 가장 높은 마우스로부터 증폭시키고 이어서 Sanger 서열분석하였다. 이들 부위 중 어느 것도 검출가능한 편집을 나타내지 않았다.
종합하면, 이들 데이터는 최소 유전자간 결실 및 생체내 염기 편집 시스템의 높은 충실도에 대한 증거를 제공하였다.
실시예 11. 염기 편집기 구현예에 관한 추가 설명
도 141은 혈액학 분석(도 141a) 및 골수 MNC에서 세포 비교(도 141b)를 포함하는 염기 편집기의 안전성 프로파일을 제시한다. 염기 편집기 BE4-sgBCL11AE1의 활성으로 생성될 것으로 예상되는 편집의 예는 도 142에 제시되어 있다. 도 143은 C에서 T로(상단 이미지) 또는 G에서 A로(하단 이미지) 염기 변환을 수행할 때 염기 편집 효율을 최대화하기 위한 최적의 프로토스페이서 서열 배열을 나타낸다. 도 144는 표적 C가 프로토스페이서의 위치 4 내지 8에 있을 때 C에서 T로의 편집을 위한 벡터를 나타낸다. 도 145는 단일 인접한 작제물을 나타내지만 제시의 용이성만을 위해 2 개의 섹션으로 나눠진 바이러스 gDNA(HBG2-miR, 아데닌 편집기)의 다이어그램을 나타낸다. 도 146은 TadA 및 TadA*의 서열을 나타낸다. Sanger 서열분석을 수행하여 서열의 염기 편집을 확인하였다(도 147). 도 148은 HDAd5/35++_BE4-sgBCL11Ae1-FI-mgmtGFP(041318-1) 바이러스에 의한 염기 편집을 나타내고, 도 149는 표시된 MOI에서 γ-글로빈+ 세포의 백분율을 나타낸다. 도 150은 염기 편집에 의한 HbF의 재활성화를 위한 사이티딘 염기 편집기 및 아데닌 염기 편집기를 나타낸다. 도 151은 예시적인 염기 편집기 및 염기 편집기의 다양한 MOI에서 퍼센트 HbF+ 세포를 나타낸다. 도 152는 HUDEP-2 세포에서 2차 시험의 % HbF+를 나타낸다. 도 153은 단일 세포 유래 클론의 결과를 나타낸다. 도 154a-154s는 개별 단일 세포 유래 클론을 나타내는 데이터를 제시한다. 또한 염기 편집기를 293FT 세포에서 테스트하였다(도 155). 도 156a-156d는 sanger 서열분석 결과를 나타낸다. 또한 염기 편집기를 HUDEP-2 세포에서 테스트하였다(도 157). γ-글로빈의 발현은 도 158에 제시되어 있다. 도 159a-159d는 이용가능한 경우 sanger 서열분석 결과를 나타낸다. 작제물은 도 160에 제시된 바와 같이 Maxi 제조를 위해 선택하였다.
예를 들어, HDAd-AAVS1-CRISPR 또는 HDAd-글로빈-BE4 염기 편집기로 편집된 huCD45+ 세포의 생착은 도 161에 제시되어 있다.
HUDEP-2 세포의 일시적 형질감염(T7EI에 의한 절단)은 도 162에 제시되어 있다.
HbF에 대한 염기 편집 작제물의 비제한적인 예는 (1) pHCA-ABEmax-sgHBG2-miR-FI-mgmtGFP; (2) pHCA-ABEmax-sgHBG4-miR-FI-mgmtGFP; 또는 (3) pHCA-ABEmax-Dual-Skip-miR-FI-mgmtGFP를 포함할 수 있다.
염기 편집기의 적어도 하나의 적용은 이중 염기 편집 벡터를 포함하며, 이 적용은 도 163에 예시되어 있다.
단일 세포 유래 클론에서, 단일대립유전자성 또는 이중대립유전자성 표적 염기 전환은 HbF-양성 세포의 100%를 부여하였다. 혼합된 HUDEP-2 세포의 HBG1/2 프로모터에서 60% -113 A에서 G로의 HPFH 돌연변이를 ABE 벡터 HDAd-ABE-HBG#2를 사용하여 관찰하였다(도 135 참조). 이 벡터는 특정 추가 동물 연구를 위해 선택되었다. 동물 연구를 248 kb의 인간 β-글로빈 유전자좌(β-YAC 마우스)를 보유하고 따라서 글로빈 전환을 정확하게 반영하는 마우스에서 수행하였다(예를 들어, 도 137 참조). FRT 및 트랜스포존 부위에 의해 플랭킹된 EF1α-mgmtP140K 발현 카세트는 형질도입된 세포의 생체내 선택을 허용하기 위해 벡터에 포함되었다(예를 들어, 도 136 참조). HDAd-ABE-HBG#2 + HDAd-SB를 사용한 생체내 형질도입 및 저용량의 O6BG/BCNU로의 선택 후, HbF-양성 세포의 평균 35%가 말초 적혈구에서 측정되었다(도 138). 8 마리 마우스 중 1 마리에서, 거의 완전한 -113 A에서 G로의 전환 및 HbF-양성 세포의 90%가 달성되었다. 혈액 세포 계수의 변이는 발견되지 않았다(도 141). 골수 샘플의 세포 조성물은 형질도입되지 않은 마우스의 것과 비슷하였으며, 이는 우수한 안전성 프로파일을 입증한다(도 141). 골수 계통 마이너스 세포를 형질도입 후 14 주차에 1차 마우스로부터 단리하고 치명적으로 조사된 C57BL/6J 마우스에 주입하였다. HbF-양성 세포의 백분율은 2차 수용자에서 16 주에 걸쳐 유지되었으며 이는 게놈 편집이 장기간 재증식 마우스 HSC에서 발생하였음을 나타낸다. 이러한 관찰은 생체내에서 HDAd5/35++ 벡터에 의해 전달된 염기 편집기가 예를 들어, 혈색소병증의 치료를 위해 정확한 게놈 조작을 위한 전략임을 입증한다.
VII. 마무리 단락
본원에 개시되고 참조된 서열의 변이체가 또한 포함된다. 아미노산 잔기가 생물학적 활성을 제거하지 않으면서 치환, 삽입, 또는 결실될 수 있는지를 결정하는 지침은 DNASTAR™(위스콘신주 매디슨 소재) 소프트웨어와 같이 당업계에 잘 알려진 컴퓨터 프로그램을 사용하여 찾을 수 있다. 바람직하게는, 본원에 개시된 단백질 변이체에서 아미노산 변화는 보존적 아미노산 변화, 즉, 유사하게 하전 또는 비하전된 아미노산의 치환이다. 보존적 아미노산 변화는 측쇄와 관련된 아미노산 패밀리 중 하나의 치환을 수반한다.
펩티드 또는 단백질에서, 아미노산의 적합한 보존적 치환은 당업자에게 알려져 있고 일반적으로 생성된 분자의 생물학적 활성을 변경하지 않으면서 이루어질 수 있다. 당업자는 일반적으로, 폴리펩티드의 비필수 영역에서의 단일 아미노산 치환이 생물학적 활성을 실질적으로 변경하지 않음을 인식한다(예를 들어, Watson 등, Molecular Biology of the Gene, 4th Edition, 1987, The Benjamin/Cummings Pub. Co., p. 224 참조). 자연 발생 아미노산은 일반적으로 다음과 같은 보존적 치환 패밀리로 나눠진다: 그룹 1: 알라닌(Ala), 글리신(Gly), 세린(Ser), 및 트레오닌(Thr); 그룹 2: (산성): 아스파르트산(Asp), 및 글루탐산(Glu); 그룹 3: (산성; 또한 극성, 음으로 하전된 잔기 및 이의 아미드로 분류됨): 아스파라긴(Asn), 글루타민(Gln), Asp, 및 Glu; 그룹 4: Gln 및 Asn; 그룹 5: (염기성; 또한 극성, 양으로 하전된 잔기로 분류됨): 아르기닌(Arg), 리신(Lys), 및 히스티딘(His); 그룹 6 (큰 지방족, 비극성 잔기): 이소류신(Ile), 류신(Leu), 메티오닌(Met), 발린(Val) 및 시스테인(Cys); 그룹 7(비하전된 극성): 티로신(Tyr), Gly, Asn, Gln, Cys, Ser, 및 Thr; 그룹 8(큰 방향족 잔기): 페닐알라닌(Phe), 트립토판(Trp), 및 Tyr; 그룹 9(비-극성): 프롤린(Pro), Ala, Val, Leu, Ile, Phe, Met, 및 Trp; 그룹 11(지방족): Gly, Ala, Val, Leu, 및 Ile; 그룹 10 (작은 지방족, 비극성 또는 약간 극성 잔기): Ala, Ser, Thr, Pro, 및 Gly; 및 그룹 12(황-함유): Met 및 Cys. 추가적인 정보는 Creighton (1984) Proteins, W.H. Freeman and Company에서 찾을 수 있다.
이러한 변화를 만들기 위해, 아미노산의 소수성 지수(hydropathic index)가 고려될 수 있다. 단백질에 대한 상호작용성 생물학적 기능을 부여하는 데 있어서 소수성 아미노산 지수의 중요성은 일반적으로 당업계에서 이해된다(Kyte & Doolittle, J. Mol. Biol. 157(1), 105-32, 1982). 각 아미노산은 소수성 및 전하 특성에 기반하여 소수성 지수가 할당되었다(Kyte and Doolittle, 1982). 이들 값은 다음과 같다: Ile(+4.5); Val(+4.2); Leu(+3.8); Phe(+2.8); Cys(+2.5); Met(+1.9); Ala(+1.8); Gly(-0.4); Thr(-0.7); Ser(-0.8); Trp(-0.9); Tyr(-1.3); Pro(-1.6); His(-3.2); 글루타메이트(-3.5); Gln(-3.5); 아스파르테이트(-3.5); Asn(-3.5); Lys(-3.9); 및 Arg(-4.5).
특정 아미노산은 유사한 소수성 지수 또는 점수를 갖는 다른 아미노산으로 치환될 수 있고 여전히 유사한 생물학적 활성을 갖는 단백질을 초래하며, 즉, 여전히 생물학적 기능적으로 동등한 단백질을 수득할 수 있음이 당업계에 알려져 있다. 이러한 변화를 만드는 데 이어서, 소수성 지수가 ±2 이내인 아미노산의 치환이 바람직하고, ±1 이내의 것이 특히 바람직하고, ±0.5 이내의 것이 더욱 더 특히 바람직하다. 또한 유사 아미노산의 치환이 친수성에 기반하여 효과적으로 이루어질 수 있음이 당업계에서 이해된다.
미국 특허 번호 제4,554,101호에 상세히 기재된 바와 같이, 다음 친수성 값이 아미노산 잔기에 할당되었다: Arg(+3.0); Lys(+3.0); 아스파르테이트(+3.0±1); 글루타메이트(+3.0±1); Ser(+0.3); Asn(+0.2); Gln(+0.2); Gly(0); Thr(-0.4); Pro(-0.5±1); Ala(-0.5); His(-0.5); Cys(-1.0); Met(-1.3); Val(-1.5); Leu(-1.8); Ile(-1.8); Tyr(-2.3); Phe(-2.5); Trp(-3.4). 아미노산은 유사한 친수성 값을 갖는 또 다른 아미노산으로 치환되고 여전히 생물학적으로 동등한 단백질, 특히 면역학적으로 동등한 단백질을 수득할 수 있음이 이해된다. 이러한 변화에서, 친수성 값이 ±2 이내인 아미노산의 치환이 바람직하고, ±1 이내의 것이 특히 바람직하고, ±0.5 이내의 것이 더욱더 특히 바람직하다.
상기 요약된 바와 같이, 아미노산 치환은 아미노산 측쇄 치환기의 상대적 유사성, 예를 들어, 소수성, 친수성, 전하, 크기 등에 기반할 수 있다.
다른 곳에 나타낸 바와 같이, 유전자 서열의 변이체는 코돈 최적화된 변이체, 서열 다형성, 스플라이스 변이체, 및/또는 암호화된 생성물의 기능에 통계적으로 유의한 정도로 영향을 미치지 않는 돌연변이를 포함할 수 있다.
본원에 개시된 단백질, 핵산, 및 유전자 서열의 변이체는 또한 본원에 개시된 단백질, 핵산, 또는 유전자 서열에 대해 적어도 70% 서열 동일성, 80% 서열 동일성, 85% 서열, 90% 서열 동일성, 95% 서열 동일성, 96% 서열 동일성, 97% 서열 동일성, 98% 서열 동일성, 또는 99% 서열 동일성을 갖는 서열을 포함한다.
"% 서열 동일성"은 서열을 비교함으로써 결정된 바와 같은 2 개 이상의 서열 사이의 관계를 지칭한다. 당업계에서, "동일성"은 또한 이러한 서열의 스트링 사이의 일치에 의해 결정된 바와 같은 단백질, 핵산, 또는 유전자 서열 사이의 서열 관련성 정도를 의미한다. "동일성"(종종 "유사성"으로 언급됨)은 다음 문헌에 기재된 것들을 포함하여 알려진 방법에 의해 용이하게 계산될 수 있다: Computational Molecular Biology (Lesk, A. M., ed.) Oxford University Press, NY (1988); Biocomputing: Informatics and Genome Projects (Smith, D. W., ed.) Academic Press, NY (1994); Computer Analysis of Sequence Data, Part I (Griffin, A. M., and Griffin, H. G., eds.) Humana Press, NJ (1994); Sequence Analysis in Molecular Biology (Von Heijne, G., ed.) Academic Press (1987); 및 Sequence Analysis Primer (Gribskov, M. and Devereux, J., eds.) Oxford University Press, NY (1992). 동일성을 결정하는 바람직한 방법은 테스트된 서열 사이의 최고 일치를 제공하도록 설계된다. 동일성 및 유사성을 결정하는 방법은 공개적으로 이용가능한 컴퓨터 프로그램에 의해 성문화된다. 서열 정렬 및 퍼센트 동일성 계산은 LASERGENE 생물정보학 컴퓨터 묶음의 Megalign 프로그램(DNASTAR, Inc., 위스콘신주 매디슨 소재)을 사용하여 수행될 수 있다. 서열의 다중 정렬은 또한 디폴트 매개변수(갭 패널티=10, 갭 길이 패널티=10)에 따른 Clustal 정렬 방법(Higgins and Sharp CABIOS, 5, 151-153 (1989)을 사용하여 수행될 수 있다. 관련 프로그램은 또한 GCG 프로그램 묶음(Wisconsin Package Version 9.0, Genetics Computer Group(GCG), 위스콘신주 매디슨 소재); BLASTP, BLASTN, BLASTX(Altschul, 등, J. Mol. Biol. 215:403-410 (1990); DNASTAR(DNASTAR, Inc., 위스콘신주 매디슨 소재); 및 Smith-Waterman 알고리즘을 포함하는 FASTA 프로그램(Pearson, Comput. Methods Genome Res., [Proc. Int. Symp.] (1994), Meeting Date 1992, 111-20. Editor(s): Suhai, Sandor. Publisher: Plenum, New York, N.Y.을 포함한다. 본 개시내용의 맥락 내에서 서열 분석 소프트웨어가 분석에 사용되는 경우, 분석 결과는 참조된 프로그램의 "디폴트 값"에 기반함이 이해될 것이다. 본원에 사용되는 바와 같은 "디폴트 값"은 처음에 초기화될 때 소프트웨어와 함께 원래 로드되는 임의의 값 또는 매개변수의 세트를 의미할 것이다.
변이체는 또한 엄격한 혼성화 조건 하에 본원에 개시된 서열에 혼성화하고 참조 서열과 동일한 기능을 제공하는 핵산 분자를 포함한다. 예시적인 엄격한 혼성화 조건은 50% 포름아미드, 5XSSC(750 mM NaCl, 75 mM 트리나트륨 시트레이트), 50 mM 나트륨 포스페이트(pH 7.6), 5XDenhardt의 용액, 10% 덱스트란 술페이트, 및 20 μg/ml 변성되고 전단된 연어 정자 DNA를 포함하는 용액에서 42 ℃에서 밤새 배양한 후, 50℃에서 0.1XSSC에서 충전제를 세척하는 것을 포함한다. 혼성화 및 신호 검출의 엄격성에서의 변화는 주로 포름아미드 농도(포름아미드의 백분율이 낮을수록 낮은 엄격도를 초래함); 염 농도, 또는 온도의 조작을 통해 달성된다. 예를 들어, 적당히 높은 엄격도 조건은 6XSSPE(20XSSPE=3M NaCl; 0.2 M NaH2PO4; 0.02 M EDTA, pH 7.4), 0.5% SDS, 30% 포름아미드, 100 μg/ml 연어 정자 차단 DNA를 포함하는 용액에서 37℃에서 밤새 배양한 후; 1XSSPE, 0.1% SDS로 50 ℃에서 세척하는 것을 포함한다. 또한, 심지어 더 낮은 엄격도를 달성하기 위해, 엄격한 혼성화 후 수행되는 세척은 더 높은 염 농도(예를 들어 5XSSC)에서 수행될 수 있다. 상기 조건에서의 변이는 혼성화 실험에서 배경을 억제하는 데 사용되는 대체 차단 시약의 포함 및/또는 치환을 통해 달성될 수 있다. 전형적인 차단 시약은 Denhardt의 시약, BLOTTO, 헤파린, 변성된 연어 정자 DNA, 및 상업적으로 이용가능한 독점 제형을 포함한다. 특이적 차단 시약의 포함은 호환성 문제로 인해, 상기 기재된 혼성화 조건의 변형을 필요로 할 수 있다.
"특이적으로 결합한다"는 (예를 들어, CAR 결합 도메인 또는 나노입자 선택된 세포 표적화 리간드의) 결합 도메인과 이의 동족 결합 분자를 105 M-1 이상의 친화도 또는 Ka(즉, 1/M 단위의 특정 결합 상호작용의 평형 결합 상수)로 회합하지만, 관련 환경 샘플에서 임의의 다른 분자 또는 구성요소와 유의하게 회합하지 않는 것을 지칭한다. "특이적으로 결합한다"는 또한 본원에서 "결합한다"로 지칭된다. 결합 도메인은 "높은 친화도" 또는 "낮은 친화도"로 분류될 수 있다. 특정 구현예에서, "높은 친화도" 결합 도메인은 적어도 107 M-1, 적어도 108 M-1, 적어도 109 M-1, 적어도 1010 M-1, 적어도 1011 M-1, 적어도 1012 M-1, 또는 적어도 1013 M-1의 Ka를 갖는 결합 도메인을 지칭한다. 특정 구현예에서, "낮은 친화도" 결합 도메인은 최대 107 M-1, 최대 106 M-1, 최대 105 M-1의 Ka를 갖는 결합 도메인을 지칭한다. 대안적으로, 친화도는 M 단위(예를 들어, 10-5 M 내지 10-13 M)의 특정 결합 상호작용의 평형 해리 상수(Kd)로서 정의될 수 있다. 특정 구현예에서, 결합 도메인은 야생형(또는 모체) 결합 도메인보다 동족 결합 분자에 더 강한 결합을 갖는 선택된 또는 조작된 결합 도메인을 지칭하는 "향상된 친화도"를 가질 수 있다. 예를 들어, 향상된 친화도는 참조 결합 도메인보다 더 높은 동족 결합 분자에 대한 Ka(평형 결합 상수) 또는 참조 결합 도메인보다 낮은 동족 결합 분자에 대한 Kd(해리 상수), 또는 참조 결합 도메인보다 낮은 동족 결합 분자에 대한 오프레이트(Koff) 때문일 수 있다. 특정 동족 결합 분자에 특이적으로 결합하는 결합 도메인을 검출할 뿐만 아니라 결합 친화성을 결정하기 위해, 웨스턴 블롯, ELISA, 및 BIACORE® 분석과 같은 다양한 검정이 알려져 있다(또한, 예를 들어, Scatchard, 등, 1949, Ann. N.Y. Acad. Sci. 51:660; 및 US 5,283,173, US 5,468,614, 또는 등가물 참조).
달리 표시되지 않는 한, 본 개시내용의 실시는 면역학, 분자 생물학, 미생물학, 세포 생물학 및 재조합 DNA의 통상적인 기술을 이용할 수 있다. 이들 방법은 다음 공개물에 기재되어 있다. 예를 들어, Sambrook, 등, Molecular Cloning: A Laboratory Manual, 2nd Edition (1989); F. M. Ausubel, 등, eds., Current Protocols in Molecular Biology, (1987); the series Methods IN Enzymology (Academic Press, Inc.); M. MacPherson, 등, PCR: A Practical Approach, IRL Press at Oxford University Press (1991); MacPherson 등, eds. PCR 2: Practical Approach, (1995); Harlow and Lane, eds. Antibodies, A Laboratory Manual, (1988); 및 R. I. Freshney, ed. Animal Cell Culture (1987) 참조.
당업자에 의해 이해되는 바와 같이, 본원에 개시된 각 구현예는 특정 언급된 요소, 단계, 성분 또는 구성요소를 포함하거나, 이로 본질적으로 이루어지거나, 또는 이로 이루어질 수 있다. 따라서, 용어 "포함하다" 또는 "포함하는"은 "포함하거나, 이로 이루어지거나, 또는 이로 본질적으로 이루어지는"을 재인용하는 것으로 해석되어야 한다. 전환 용어 "포함하다" 또는 "포함한다"는 명시되지 않은 요소, 단계, 성분, 또는 구성요소를 포함하나 이에 제한되지 않고, 심지어 다량으로 포함하는 것을 허용함을 의미한다. 전환 어구 "로 이루어지는"은 명시되지 않은 임의의 요소, 단계, 성분 또는 구성요소를 제외한다. 전환 어구 "로 본질적으로 이루어진"은 명시된 요소, 단계, 성분 또는 구성요소에 대한 구현예의 범위 및 구현예에 실질적으로 영향을 미치지 않는 것들을 제한한다. 실질적 효과는 본 개시내용에 기재된 관련 실험 방법에 따라 청구된 효과를 수득하는 능력에서 통계적으로 유의한 감소를 야기할 것이다.
달리 표시되지 않는 한, 명세서 및 청구범위에서 사용되는 성분의 양, 분자량과 같은 특성, 반응 조건 등을 나타내는 모든 숫자는 모든 경우에 용어 "약"에 의해 수식되는 것으로 이해되어야 한다. 따라서, 달리 반대로 표시되지 않는 한, 명세서 및 첨부된 청구범위에 제시된 수치 매개변수는 본 발명에 의해 수득하고자 하는 원하는 특성에 따라 달라질 수 있는 근사치이다. 최소한, 및 청구범위의 범위에 대한 등가 원칙의 적용을 제한하려는 시도가 아니라, 각 수치 매개변수는 적어도 보고된 유효 자릿수에 비추어 그리고 반올림 기법을 적용함으로써 해석되어야 한다. 추가로 명확성이 요구되는 경우, 용어 "약" 및 "대략"은 본원에서 상호교환가능하게 사용되며 언급된 수치 값 또는 범위와 함께 사용되는 경우 당업자에 의해 합리적으로 귀속되는 의미를 가지며, 즉, 언급된 값의 ±20%; 언급된 값의 ±19%; 언급된 값의 ±18%; 언급된 값의 ±17%; 언급된 값의 ±16%; 언급된 값의 ±15%; 언급된 값의 ±14%; 언급된 값의 ±13%; 언급된 값의 ±12%; 언급된 값의 ±11%; 언급된 값의 ±10%; 언급된 값의 ±9%; 언급된 값의 ±8%; 언급된 값의 ±7%; 언급된 값의 ±6%; 언급된 값의 ±5%; 언급된 값의 ±4%; 언급된 값의 ±3%; 언급된 값의 ±2%; 또는 언급된 값의 ±1%의 범위 내에서 언급된 값 또는 범위보다 다소 많거나 또는 다소 적은 것을 나타낸다.
본 발명의 넓은 의미를 제시하는 수치 범위 및 매개변수가 근사치임에도 불구하고, 특정 실시예에 제시된 수치 값은 가능한한 정확하게 보고된다. 그러나, 임의의 수치 값은 본질적으로 각각의 테스트 측정에서 발견된 표준 편차에서 반드시 비롯되는 특정 오류를 함유한다.
본원에서 값의 범위에 대한 언급은 단지 범위 내에 속하는 각각의 개별 값을 개별적으로 언급하는 약칭 방법을 제공하는 것으로 의도된다. 본원에 달리 나타낸 바와 같이, 각각의 개별 값은 본원에서 개별적으로 인용된 것처럼 명세서에 포함된다. 본원에 기재된 모든 방법은 본원에 달리 표시되지 않거나 또는 문맥상 달리 명맥하게 모순되지 않는 한 임의의 적합한 순서로 수행될 수 있다. 본원에 제공된 임의의 및 모든 예, 또는 예시적인 언어(예를 들어, "예컨대")의 사용은 단지 본 발명을 더 잘 설명하기 위한 것으로 의도되고 달리 청구된 본 발명의 범위를 제한하지 않는다. 명세서의 어떤 언어도 본 발명의 실시에 필수적인 임의의 청구되지 않은 요소를 나타내는 것으로 해석되어서는 안 된다.
본원에 개시된 본 발명의 대안적인 요소 또는 구현예의 그룹화는 제한으로 해석되어서는 안 된다. 각 그룹 구성원은 개별적으로 또는 본원에서 발견되는 그룹의 다른 구성원 또는 다른 요소와 조합하여 언급되고 청구될 수 있다. 그룹의 하나 이상의 구성원은 편의성 및/또는 특허성의 이유로 그룹에 포함되거나, 또는 그룹으로부터 삭제될 수 있는 것으로 예상된다. 임의의 이러한 포함 또는 결실이 발생할 때, 명세서는 변형된 그룹을 함유하며 따라서 첨부된 청구범위에 사용되는 모든 Markush 그룹의 서면 설명을 충족하는 것으로 간주된다.
본 발명의 특정 구현예는 본 발명을 수행하기 위해 발명자들에게 알려진 최고의 모드를 포함하여 본원에 기재된다. 물론, 이러한 기재된 구현예에 대한 변이는 전술된 설명을 읽을 때 당업자에게 명백하게 될 것이다. 본 발명자들은 당업자가 이러한 변이를 적절하게 이용하기를 기대하고, 본 발명자들은 본 발명이 본원에 구체적으로 기재된 것보다 달리 실시되기를 의도한다. 따라서, 본 발명은 적용가능한 법에 의해 허용되는 바와 같이 여기에 첨부된 청구범위에서 인용된 주제의 모든 변형 및 등가물을 포함한다. 더욱이, 본원에 달리 표시되지 않거나 또는 문맥상 달리 명백하게 모순되지 않는 한, 모든 가능한 변이에서 상기 기재된 요소의 임의의 조합은 본 발명에 포함된다.
또한, 본 명세서에 걸쳐 특허, 인쇄된 간행물, 저널 기사 및 다른 서면 텍스트에 대한 수많은 참조가 이루어졌다(본원에서 참조된 자료). 참조된 자료 각각은 개별적으로 참조된 교시를 위해 그 전체가 본원에 참조로 포함된다. 참조된 자료가 시간 경과에 따라 개정되는 경우(예를 들어, 서열 데이터베이스 항목 등), 해당 참조의 내용은 참조가 본 출원에 대한 우선권 주장에서 출원 시 포함되는 날짜를 기준으로 포함된다.
마지막으로, 본원에 개시된 본 발명의 구현예는 본 발명의 원리를 예시하는 것으로 이해되어야 한다. 이용될 수 있는 다른 변형은 본 발명의 범위 내에 있다. 따라서, 제한되지 않는 예로서, 본 발명의 대안적인 구성이 본원의 교시에 따라 활용될 수 있다. 따라서, 본 발명은 제시되고 기재된 것으로 정확하게 제한되지 않는다.
본원에 제시되는 세부사항은 예로서 그리고 단지 본 발명의 바람직한 구현예의 예시적인 논의를 위한 목적이며 본 발명의 다양한 구현예의 원리 및 개념적 측면의 가장 유용하고 용이하게 이해되는 설명인 것으로 여겨지는 것을 제공하기 위해 제시된다. 이와 관련하여, 본 발명의 기본적인 이해를 위해 필요한 것보다 상세하게 본 발명의 구조적 세부사항을 나타내려는 시도 없이, 설명은 본 발명의 여러 형태가 어떻게 실제로 구현될 수 있는지를 당업자에게 명백하게 하는 도면 및/또는 실시예와 함께 기재되었다.
본 개시내용에 사용되는 정의 및 설명은 실시예에서 달리 명확하고 모호하지 않게 변형되거나 또는 의미의 적용이 임의의 구축을 무의미하거나 또는 본질적으로 무의미하게 만드는 경우 외에는 임의의 미래 구축에서 제어되는 것을 의미하고 의도된다. 용어의 구축이 무의미하거나 또는 본질적으로 무의미하게 만드는 경우에, 정의는 Webster's Dictionary, 3rd Edition 또는 Oxford Dictionary of Biochemistry and Molecular Biology (Eds. Attwood T 등, Oxford University Press, Oxford, 2006)와 같이 당업자에게 알려진 사전에서 취해야 한다.
SEQUENCE LISTING <110> Fred Hutchinson Cancer Research Center University of Washington <120> RECOMBINANT AD35 VECTORS AND RELATED GENE THERAPY IMPROVEMENTS <130> F053-0107PCT/19-132-WO-PCT <150> US 62/869,907 <151> 2019-07-02 <150> US 62/935,507 <151> 2019-11-14 <150> US 63/009,385 <151> 2020-04-13 <160> 325 <170> PatentIn version 3.5 <210> 1 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> 5 end vector sequence, Sleeping Beauty IR/DR sequence, integration junction (chr15, 6805206) <400> 1 ccctgggatt ccccaaggca ggggcgagtc cttttgtatg aattactcaa atcgataact 60 agaaacttaa ttaacaacga gatcttataa tttgcatact tctgcctgct ggggactttc 120 cacaccctag ctgacacaag aatttgaaat acatccacag gtacacctcc aattgactca 180 aatgatgtca attagtctat cataatcttc taaagccatg acatcatttt aactggaatt 240 ttccaagctg tttaaaggca cagtcaactt agtgtatgta aacttctgac ccactggaat 300 tgtgatacag tgaattataa gtgaaataat ctgtctgtaa acaattgttg gaaaaatgac 360 ttgtgtcatg cacaaagtag atgtcctaac tgacttgcca aaactattgt ttgttaacaa 420 gaaatttgtg gagtagttga aaaacgagtt ttaatgactc caacttaagt gtatgtaaac 480 ttccgacttc aactgtaaga atggcccatt catctatagt agcacacaat atttgcattt 540 gtgcgacagt ataagggaca attatgctat caggcatttt tccaaagtga gtaatcgaag 600 tttttatacc tttgtgtgcc atgtttgcta ccatggtggg ataatcttac acgcgttctc 660 gcgaccggcc aggaaagacg caacaaaccg gaatcttctg cggcaaaagc tttattgctt 720 <210> 2 <211> 607 <212> DNA <213> Artificial Sequence <220> <223> 5 end vector sequence, Sleeping Beauty IR/DR sequence, integration junction (chrX, 16897322) <220> <221> misc_feature <222> (594)..(594) <223> n is a, c, g, or t <220> <221> misc_feature <222> (596)..(597) <223> n is a, c, g, or t <220> <221> misc_feature <222> (602)..(602) <223> n is a, c, g, or t <400> 2 tagaaactta attaacaacg agatcttata atttgcatac ttctgcctgc tggggacttt 60 ccacacccta gctgacacaa gaatttgaaa tacatccaca ggtacacctc caattgactc 120 aaatgatgtc aattagtcta tcataatctt ctaaagccat gacatcattt taactggaat 180 tttccaagct gtttaaaggc acagtcaact tagtgtatgt aaacttctga cccactggaa 240 ttgtgataca gtgaattata agtgaaataa tctgtctgta aacaattgtt ggaaaaatga 300 cttgtgtcat gcaaagtaga tgtcctaact gacttgccaa aactattgtt tgttaacaag 360 aaatttgtgg agtagttgaa aaacgagttt taatgactcc aacttaagtg tatgtaaact 420 tccgacttca actgtacaag tagaccaaat atccatatac ataaaagaaa aaaatagaaa 480 aaatttctag tgacagaaaa atgacaaaga acatactgtt tattactact attaagatgt 540 ttgcttccat tacactcata tgagtcatga tattttttct tcattttttt ctantnncac 600 tngaaat 607 <210> 3 <211> 520 <212> DNA <213> Artificial Sequence <220> <223> 3 end vector sequence, Sleeping Beauty IR/DR sequence, integration junction (chr4, 10207667) <400> 3 gttgctagga atgagccaaa ttcatctgta ttaaacagtg ggagcttgtg gaaggctact 60 cgaaatgttt gacccaagtt aaacaattta aaggcaatgc taccaaatac taattgagtg 120 tatgttaact tctgacccac tgggaatgtg atgaaagaaa taaaagctga aatgaatcat 180 tctctctact attattctga tatttcacat tcttaaaata aagtggtgat cctaactgac 240 cttaagacag ggaatcttta ctcggattaa atgtcaggaa ttgtgaaaaa gtgagtttaa 300 atgtatttgg ctaaggtgta tgtaaacttc cgacttcaac tgtatatcct ccccgttgca 360 ccctcttgat gatgctgaga tgaacacaga tgctcactcc ttgagggctc taagcttatg 420 ctgacacaga cacaggtgct cacttctatg aatggcctaa gatttgagga catcatgagg 480 acaagtgtga taaaatcttg gaacaacctc ccagaggtct 520 <210> 4 <211> 74 <212> DNA <213> Artificial Sequence <220> <223> Sleeping beauty IR/DR sequence, integration junction (chr7, 79796094) <400> 4 acttaagtgt atgtaaactt ccgacttcaa ctgtagggta cctgattctc tgggcatctc 60 tgcccactac catg 74 <210> 5 <211> 75 <212> DNA <213> Artificial Sequence <220> <223> Sleeping beauty IR/DR sequence, Integration junction (repeat region) <400> 5 acttaagtgt atgtaaactt ccgacttcaa ctgtaaattt tccacctttt tcagttttcc 60 tcgccatatt tcatg 75 <210> 6 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 6 tgtcccctcc accccacagt ggggccacta gggacaggat tggtgacaga aaagccccat 60 cctt 64 <210> 7 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 7 tgtcccctcc accccacagt gggtgacaga aaagccccat cctt 44 <210> 8 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 8 tgtcccctcc accccacaga ttggtgacag aaaagcccca tcctt 45 <210> 9 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 9 tgtcccctcc accccacagt ggggccacta gggacagaaa agccccatcc tt 52 <210> 10 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 10 tgtcccctcc accccacagt ggggccacta ggtgacagaa aagccccatc ctt 53 <210> 11 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 11 tgtcccctcc accccacagt ggggccacta gggtgacaga aaagccccat cctt 54 <210> 12 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 12 tgtcccctcc accccacagt ggggcaggat tggtgacaga aaagccccat cctt 54 <210> 13 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 13 tgtcccctcc accccacagt ggggccacta ggattggtga cagaaaagcc ccatcctt 58 <210> 14 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 14 tgtcccctcc accccacagt ggggccacta gggattggtg acagaaaagc cccatcctt 59 <210> 15 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 15 tgtcccctcc accccacagt ggggccacta gggacagatt ggtgacagaa aagccccatc 60 ctt 63 <210> 16 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 16 tgtcccctcc accccacagt ggggccacta gggacggatt ggtgacagaa aagccccatc 60 ctt 63 <210> 17 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 17 tgtcccctcc accccacagt ggggccacta gggacagagg attggtgaca gaaaagcccc 60 atcc 64 <210> 18 <211> 64 <212> DNA <213> Artificial Sequence <220> <223> indels from HDAd-CRISPR-transduced CD34+ cells <400> 18 tgtcccctcc accccacagt ggggccacta gggacagcag gattggtgac agaaaagccc 60 catc 64 <210> 19 <211> 80 <212> DNA <213> Mus musculus <400> 19 tgtcccctcc accccacagt ggggccacta gggacaggat tggtgacaga aaagccccat 60 ccttaggcct cctccttcct 80 <210> 20 <211> 73 <212> DNA <213> Mus musculus <400> 20 tgtcccctcc accccacagt ggggccacag gattggtgac agaaaagccc catccttagg 60 cctcctcctt cct 73 <210> 21 <211> 75 <212> DNA <213> Mus musculus <400> 21 tgtcccctcc accccacagt ggggccacta gggacaggtg acagaaaagc cccatcctta 60 ggcctcctcc ttcct 75 <210> 22 <211> 75 <212> DNA <213> Mus musculus <400> 22 tgtcccctcc accccacagt ggggccacta gggacaggtg acagaaaatc cccatcctta 60 ggcctcctcc ttcct 75 <210> 23 <211> 75 <212> DNA <213> Mus musculus <400> 23 tgtcccctcc accccacagt ggggccacta gggattggtg acagaaaagc cccatcctta 60 ggcctcctcc ttcct 75 <210> 24 <211> 110 <212> DNA <213> Artificial Sequence <220> <223> microRNA regulated gene expression forward primer <400> 24 ctaggaaagt ctcgctctct gcccctcatc acaaagtctc gctctctgcc cctcacgata 60 aagtctcgct ctctgcccct cattcaaaag tctcgctctc tgcccctcac 110 <210> 25 <211> 110 <212> DNA <213> Artificial Sequence <220> <223> microRNA regulated gene expression reverse primer <400> 25 tcgagtgagg ggcagagagc gagacttttg aatgaggggc agagagcgag actttatcgt 60 gaggggcaga gagcgagact ttgtgatgag gggcagagag cgagactttc 110 <210> 26 <211> 76 <212> DNA <213> Mus musculus <400> 26 tgtcccctcc accccacagt ggggccacta ggggattggt gacagaaaag ccccatcctt 60 aggcctcctc cttcct 76 <210> 27 <211> 77 <212> DNA <213> Mus musculus <400> 27 tgtcccctcc accccacagt ggggccacta ggaggattgg tgacagaaaa gccccatcct 60 taggcctcct ccttcct 77 <210> 28 <211> 77 <212> DNA <213> Mus musculus <400> 28 tgtcccctcc accccacagt ggggccacta gcaggattgg tgacagaaaa gccccatcct 60 taggcctcct ccttcct 77 <210> 29 <211> 77 <212> DNA <213> Mus musculus <400> 29 tgtcccctcc accccacagt ggggccacta ggcggattgg tgacagaaaa gccccatcct 60 taggcctcct ccttcct 77 <210> 30 <211> 77 <212> DNA <213> Mus musculus <400> 30 tgtcccctcc accccacagt ggggccacta gccggattgg tgacagaaaa gccccatcct 60 taggcctcct ccttcct 77 <210> 31 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> HBG1 forward primer <400> 31 cacactccac acttttttgt ttac 24 <210> 32 <211> 77 <212> DNA <213> Mus musculus <400> 32 tgtcccctcc accccacagt ggggccacta ggagtattgg tgacagaaaa gccccatcct 60 taggcctcct ccttcct 77 <210> 33 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> HBG1 reverse primer <400> 33 aagtgtcttt actgctttta tttgct 26 <210> 34 <211> 77 <212> DNA <213> Mus musculus <400> 34 tgtcccctcc accccacagt ggggccacta ggaggattgg tgacagaaca gccccatcct 60 taggcctcct ccttcct 77 <210> 35 <211> 77 <212> DNA <213> Mus musculus <400> 35 tgtcccctcc accccacagt ggggccacta gcagtattgg tgacagaaaa gccccatcct 60 taggcctcct ccttcct 77 <210> 36 <211> 77 <212> DNA <213> Mus musculus <400> 36 tgtcccctcc accccacagt ggggccacta gcaggattgg tgacagaaca gccccatcct 60 taggcctcct ccttcct 77 <210> 37 <211> 78 <212> DNA <213> Mus musculus <400> 37 tgtcccctcc accccacagt ggggccacta gggacgattg gtgacagaaa agccccatcc 60 ttaggcctcc tccttcct 78 <210> 38 <211> 78 <212> DNA <213> Mus musculus <400> 38 tgtcccctcc accccacagt ggggccacta gggaggattg gtgacagaaa agccccatcc 60 ttaggcctcc tccttcct 78 <210> 39 <211> 78 <212> DNA <213> Mus musculus <400> 39 tgtcccctcc accccacagt ggggccacta ggcaggattg gtgacagaaa agccccatcc 60 ttaggcctcc tccttcct 78 <210> 40 <211> 78 <212> DNA <213> Mus musculus <400> 40 tgtcccctcc accccacagt ggggccacta gggatgattg gtgacagaaa agccccatcc 60 ttaggcctcc tccttcct 78 <210> 41 <211> 78 <212> DNA <213> Mus musculus <400> 41 tgtcccctcc accccacagt ggggccacta gggacgcttg gtgacagaaa agccccatcc 60 ttaggcctcc tccttcct 78 <210> 42 <211> 78 <212> DNA <213> Mus musculus <400> 42 tgtcccctcc accccacagt ggggccacta gggaggcttg gtgacagaaa agccccatcc 60 ttaggcctcc tccttcct 78 <210> 43 <211> 78 <212> DNA <213> Mus musculus <400> 43 tgtcccctcc accccacagt ggggccacta gggacgattg gtgacagaca agccccatcc 60 ttaggcctcc tccttcct 78 <210> 44 <211> 78 <212> DNA <213> Mus musculus <400> 44 tgtcccctcc accccacagt ggggccacta gggaggattg gtgacagaca agccccatcc 60 ttaggcctcc tccttcct 78 <210> 45 <211> 78 <212> DNA <213> Mus musculus <400> 45 tgtcccctcc accccacagt ggggccacta gggacgattg gtgccagaaa agccccatcc 60 ttaggcctcc tccttcct 78 <210> 46 <211> 78 <212> DNA <213> Mus musculus <400> 46 tgtcccctcc accccacagt ggggccacta gggaggattg gtgccagaaa agccccatcc 60 ttaggcctcc tccttcct 78 <210> 47 <211> 79 <212> DNA <213> Mus musculus <400> 47 tgtcccctcc accccacagt ggggccacta gggacagatt ggtgacagaa aagccccatc 60 cttaggcctc ctccttcct 79 <210> 48 <211> 141 <212> DNA <213> Artificial Sequence <220> <223> BCL11A binding site at HBG promoter <400> 48 gggggcccct tccccacact atctcaatgc aaatatctgt ctgaaacggt ccctggctaa 60 actccaccat gggttggcca gscttgcctt gaccaatagc cttgacaagg caaacttgac 120 caatagtctt agagtatcca g 141 <210> 49 <211> 599 <212> DNA <213> Adenovirus serotype 5 <400> 49 catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60 ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120 gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180 gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240 taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300 agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg 360 actttgaccg tttacgtgga gactcgccca ggtgtttttc tcaggtgttt tccgcgttcc 420 gggtcaaagt tggcgtttta ttattatagt cagctgacgt gtagtgtatt tatacccggt 480 gagttcctca agaggccact cttgagtgcc agcgagtaga gttttctcct ccgagccgct 540 ccgacaccgg gactgaaaat gagacatatt atctgccacg gaggtgttat taccgaaga 599 <210> 50 <211> 600 <212> DNA <213> Adenovirus serotype 35 <400> 50 catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60 aaaagtgtgg gccgtgtggt gattggctgt ggggttaacg gttaaaaggg gcggcgcggc 120 cgtgggaaaa tgacgtttta tgggggtgga gtttttttgc aagttgtcgc gggaaatgtt 180 acgcataaaa aggcttcttt tctcacggaa ctacttagtt ttcccacggt atttaacagg 240 aaatgaggta gttttgaccg gatgcaagtg aaaattgctg attttcgcgc gaaaactgaa 300 tgaggaagtg tttttctgaa taatgtggta tttatggcag ggtggagtat ttgttcaggg 360 ccaggtagac tttgacccat tacgtggagg tttcgattac cgtgtttttt acctgaattt 420 ccgcgtaccg tgtcaaagtc ttctgttttt acgtaggtgt cagctgatcg ctagggtatt 480 tatacctcag ggtttgtgtc aagaggccac tcttgagtgc cagcgagaag agttttctcc 540 tctgcgccgg cagtttaata ataaaaaaat gagagatttg cgatttctgc ctcaggaaat 600 <210> 51 <211> 32767 <212> DNA <213> Artificial Sequence <220> <223> Ad35E4PS2/WL-ps2 <220> <221> misc_feature <222> (2582)..(2759) <223> Ad35 1-->178 <220> <221> misc_feature <222> (2768)..(2801) <223> loxP <220> <221> misc_feature <222> (2808)..(2923) <223> Ad35 366-->481 <220> <221> misc_feature <222> (2924)..(2957) <223> loxP <220> <221> misc_feature <222> (2966)..(27288) <223> Ad35 3112-->27435 <220> <221> misc_feature <222> (27343)..(29812) <223> lambda-1 (Complementary) <220> <221> misc_feature <222> (30126)..(30340) <223> BGH polyA <220> <221> misc_feature <222> (30365)..(31030) <223> copGFP (Complementary) <220> <221> misc_feature <222> (31077)..(31729) <223> CMV (Complementary) <220> <221> misc_feature <222> (31781)..(33310) <223> lambda-2 <220> <221> misc_feature <222> (33371)..(34706) <223> Ad35 30544-->31879 <220> <221> misc_feature <222> (34702)..(35816) <223> Ad5E4orf6 <220> <221> misc_feature <222> (35814)..(37636) <223> Ad35 32972-->34794 <400> 51 taaacttggc gcgccctgag tgatttttct ctggtcccgc cgcatccata ccgccagttg 60 tttaccctca caacgttcca gtaaccgggc atgttcatca tcagtaaccc gtatcgtgag 120 catcctctct cgtttcatcg gtatcattac ccccatgaac agaaatcccc cttacacgga 180 ggcatcagtg accaaacagg aaaaaaccgc ccttaacatg gcccgcttta tcagaagcca 240 gacattaacg cttctggaga aactcaacga gctggacgcg gatgaacagg cagacatctg 300 tgaatcgctt cacgaccacg ctgatgagct ttaccgcagc tgcctcgcgc gtttcggtga 360 tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc 420 ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg 480 cgcagccatg acccagtcac gtagcgatag cggagtgtat actggcttaa ctatgcggca 540 tcagagcaga ttgtactgag agtgcaccat atgcggtgtg aaataccgca cagatgcgta 600 aggagaaaat accgcatcag gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 660 gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 720 gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 780 cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 840 aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 900 tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 960 ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 1020 ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 1080 cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 1140 ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 1200 gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 1260 atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 1320 aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 1380 aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 1440 gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 1500 cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 1560 gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 1620 tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 1680 ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 1740 ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 1800 atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 1860 cgcaacgttg ttgccattgc tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct 1920 tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 1980 aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 2040 tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 2100 ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 2160 agttgctctt gcccggcgtc aacacgggat aataccgcgc cacatagcag aactttaaaa 2220 gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 2280 agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 2340 accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 2400 gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 2460 cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 2520 ggggttccgc gcacatttcc ccgaaaagtg ccacctgtct agctacgata tcctgtttaa 2580 acatcatcaa taatatacct tatagatgga atggtgccaa tatgtaaatg aggtgatttt 2640 aaaaagtgtg ggccgtgtgg tgattggctg tggggttaac ggttaaaagg ggcggcgcgg 2700 ccgtgggaaa atgacgtttt atgggggtgg agtttttttg caagttgtcg cgggaaatga 2760 tttaaatata acttcgtata gcatacatta tacgaagtta tggatcctag actttgaccc 2820 attacgtgga ggtttcgatt accgtgtttt ttacctgaat ttccgcgtac cgtgtcaaag 2880 tcttctgttt ttacgtaggt gtcagctgat cgctagggta tttataactt cgtatagcat 2940 acattatacg aagttatatt taaataggaa tgtttatgcc ttaccagtgt aacatgaatc 3000 atgtgaaagt gttgttggaa ccagatgcct tttccagaat gagcctaaca ggaatctttg 3060 acatgaacac gcaaatctgg aagatcctga ggtatgatga tacgagatcg agggtgcgcg 3120 catgcgaatg cggaggcaag catgccaggt tccagccggt gtgtgtagat gtgaccgaag 3180 atctcagacc ggatcatttg gttattgccc gcactggagc agagttcgga tccagtggag 3240 aagaaactga ctaaggtgag tattgggaaa actttggggt gggattttca gatggacaga 3300 ttgagtaaaa atttgttttt tctgtcttgc agctgacatg agtggaaatg cttcttttaa 3360 ggggggagtc ttcagccctt atctgacagg gcgtctccca tcctgggcag gagttcgtca 3420 gaatgttatg ggatctactg tggatggaag acccgttcaa cccgccaatt cttcaacgct 3480 gacctatgct actttaagtt cttcaccttt ggacgcagct gcagccgctg ccgccgcctc 3540 tgtcgccgct aacactgtgc ttggaatggg ttactatgga agcatcgtgg ctaattccac 3600 ttcctctaat aacccttcta cactgactca ggacaagtta cttgtccttt tggcccagct 3660 ggaggctttg acccaacgtc tgggtgaact ttctcagcag gtggccgagt tgcgagtaca 3720 aactgagtct gctgtcggca cggcaaagtc taaataaaaa aaattccaga atcaatgaat 3780 aaataaacga gcttgttgtt gatttaaaat caagtgtttt tatttcattt ttcgcgcacg 3840 gtatgccctg gaccaccgat ctcgatcatt gagaactcgg tggatttttt ccagaatcct 3900 atagaggtgg gattgaatgt ttagatacat gggcattagg ccgtctttgg ggtggagata 3960 gctccattga agggattcat gctccggggt agtgttgtaa atcacccagt cataacaagg 4020 tcgcagtgca tggtgttgca caatatcttt tagaagtagg ctgattgcca cagataagcc 4080 cttggtgtag gtgtttacaa accggttgag ctgggagggg tgcattcgag gtgaaattat 4140 gtgcattttg gattggattt ttaagttggc aatattgccg ccaagatccc gtcttgggtt 4200 catgttatga aggactacca agacggtgta tccggtacat ttaggaaatt tatcgtgcag 4260 cttggatgga aaagcgtgga aaaatttgga gacacccttg tgtcctccga gattttccat 4320 gcactcatcc atgataatag caatggggcc gtgggcagcg gcgcgggcaa acacgttccg 4380 tgggtctgac acatcatagt tatgttcctg agttaaatca tcataagcca ttttaatgaa 4440 tttggggcgg agcgtaccag attggggtat gaatgttcct tcgggccccg gagcatagtt 4500 cccctcacag atttgcattt cccaagcttt cagttctgag ggtggaatca tgtccacctg 4560 gggggctatg aagaacaccg tttcgggggc gggggtgatt agttgggatg atagcaagtt 4620 tctgagcaat tgagatttgc cacatccggt ggggccataa ataattccga ttacaggttg 4680 caggtggtag tttagggaac ggcaactgcc gtcttctcga agcaaggggg ccacctcgtt 4740 catcatttcc cttacatgca tattttcccg caccaaatcc attaggaggc gctctcctcc 4800 tagtgataga agttcttgta gtgaggaaaa gtttttcagc ggttttagac cgtcagccat 4860 gggcattttg gaaagagttt gctgcaaaag ttctagtctg ttccacagtt cagtgatgtg 4920 ttctatggca tctcgatcca gcagacctcc tcgtttcgcg ggtttggacg gctcctggag 4980 tagggtatga gacgatgggc gtccagcgct gccagggttc ggtccttcca gggtctcagt 5040 gttcgagtca gggttgtttc cgtcacagtg aaggggtgtg cgcctgcttg ggcgcttgcc 5100 agggtgcgct tcagactcat tctgctggtg gagaacttct gtcgcttggc gccctgtatg 5160 tcggccaagt agcagtttac catgagttcg tagttgagcg cctcggctgc gtggcctttg 5220 gcgcggagct tacctttgga agttttcttg cataccgggc agtataggca tttcagcgca 5280 tacagcttgg gcgcaaggaa aatggattct ggggagtatg catccgcgcc gcaggaggcg 5340 caaacagttt cacattccac cagccaggtt aaatccggtt cattggggtc aaaaacaagt 5400 tttccgccat attttttgat gcgtttctta cctttggtct ccataagttc gtgtcctcgt 5460 tgagtgacaa acaggctgtc cgtatctccg tagactgatt ttacaggcct cttctccagt 5520 ggagtgcctc ggtcttcttc gtacaggaac tctgaccact ctgatacaaa ggcgcgcgtc 5580 caggccagca caaaggaggc tatgtgggag gggtagcgat cgttgtcaac cagggggtcc 5640 accttttcca aagtatgcaa acacatgtca ccctcttcaa catccaggaa tgtgattggc 5700 ttgtaggtgt atttcacgtg acctggggtc cccgctgggg gggtataaaa gggggcggtt 5760 ctttgctctt cctcactgtc ttccggatcg ctgtccagga acgtcagctg ttggggtagg 5820 tattccctct cgaaggcggg catgacctct gcactcaggt tgtcagtttc taagaacgag 5880 gaggatttga tattgacagt gccggttgag atgcctttca tgaggttttc gtccatttgg 5940 tcagaaaaca caattttttt attgtcaagt ttggtggcaa atgatccata cagggcgttg 6000 gataaaagtt tggcaatgga tcgcatggtt tggttctttt ccttgtccgc gcgctctttg 6060 gcggcgatgt tgagttggac atactcgcgt gccaggcact tccattcggg gaagatagtt 6120 gttaattcat ctggcacgat tctcacttgc caccctcgat tatgcaaggt aattaaatcc 6180 acactggtgg ccacctcgcc tcgaaggggt tcattggtcc aacagagcct acctcctttc 6240 ctagaacaga aagggggaag tgggtctagc ataagttcat cgggagggtc tgcatccatg 6300 gtaaagattc ccggaagtaa atccttatca aaatagctga tgggagtggg gtcatctaag 6360 gccatttgcc attctcgagc tgccagtgcg cgctcatatg ggttaagggg actgccccag 6420 ggcatgggat gggtgagagc agaggcatac atgccacaga tgtcatagac gtagatggga 6480 tcctcaaaga tgcctatgta ggttggatag catcgccccc ctctgatact tgctcgcaca 6540 tagtcatata gttcatgtga tggcgctagc agccccggac ccaagttggt gcgattgggt 6600 ttttctgttc tgtagacgat ctggcgaaag atggcgtgag aattggaaga gatggtgggt 6660 ctttgaaaaa tgttgaaatg ggcatgaggt agacctacag agtctctgac aaagtgggca 6720 taagattctt gaagcttggt taccagttcg gcggtgacaa gtacgtctag ggcgcagtag 6780 tcaagtgttt cttgaatgat gtcataacct ggttggtttt tcttttccca cagttcgcgg 6840 ttgagaaggt attcttcgcg atccttccag tactcttcta gcggaaaccc gtctttgtct 6900 gcacggtaag atcctagcat gtagaactga ttaactgcct tgtaagggca gcagcccttc 6960 tctacgggta gagagtatgc ttgagcagct tttcgtagcg aagcgtgagt aagggcaaag 7020 gtgtctctga ccatgacttt gagaaattgg tatttgaagt ccatgtcgtc acaggctccc 7080 tgttcccaga gttggaagtc tacccgtttc ttgtaggcgg ggttgggcaa agcgaaagta 7140 acatcattga agagaatctt accggctctg ggcataaaat tgcgagtgat gcggaaaggc 7200 tgtggtactt ccgctcgatt gttgatcacc tgggcagcta ggacgatttc gtcgaaaccg 7260 ttgatgttgt gtcctacgat gtataattct atgaaacgcg gcgtgcctct gacgtgaggt 7320 agcttactga gctcatcaaa ggttaggtct gtggggtcag ataaggcgta gtgttcgaga 7380 gcccattcgt gcaggtgagg atttgcatgt aggaatgatg accaaagatc taccgccagt 7440 gctgtttgta actggtcccg atactgacga aaatgccggc caattgccat tttttctgga 7500 gtgacacagt agaaggttct ggggtcttgt tgccatcgat cccacttgag tttaatggct 7560 agatcgtggg ccatgttgac gagacgctct tctcctgaga gtttcatgac cagcatgaaa 7620 ggaactagtt gtttgccaaa ggatcccatc caggtgtaag tttccacatc gtaggtcagg 7680 aagagtcttt ctgtgcgagg atgagagccg atcgggaaga actggatttc ctgccaccag 7740 ttggaggatt ggctgttgat gtgatggaag tagaagtttc tgcggcgcgc cgagcattcg 7800 tgtttgtgct tgtacagacg gccgcagtag tcgcagcgtt gcacgggttg tatctcgtga 7860 atgagctgta cctggcttcc cttgacgaga aatttcagtg ggaagccgag gcctggcgat 7920 tgtatctcgt gctcttctat attcgctgta tcggcctgtt catcttctgt ttcgatggtg 7980 gtcatgctga cgagcccccg cgggaggcaa gtccagacct cggcgcggga ggggcggagc 8040 tgaaggacga gagcgcgcag gctggagctg tccagagtcc tgagacgctg cggactcagg 8100 ttagtaggta gggacagaag attaacttgc atgatctttt ccagggcgtg cgggaggttc 8160 agatggtact tgatttccac aggttcgttt gtagagacgt caatggcttg cagggttccg 8220 tgtcctttgg gcgccactac cgtacctttg ttttttcttt tgatcggtgg tggctctctt 8280 gcttcttgca tgctcagaag cggtgacggg gacgcgcgcc gggcggcagc ggttgttccg 8340 gacccggggg catggctggt agtggcacgt cggcgccgcg cacgggcagg ttctggtatt 8400 gcgctctgag aagacttgcg tgcgccacca cgcgtcgatt gacgtcttgt atctgacgtc 8460 tctgggtgaa agctaccggc cccgtgagct tgaacctgaa agagagttca acagaatcaa 8520 tttcggtatc gttaacggca gcttgtctca gtatttcttg tacgtcacca gagttgtcct 8580 ggtaggcgat ctccgccatg aactgctcga tttcttcctc ctgaagatct ccgcgacccg 8640 ctctttcgac ggtggccgcg aggtcattgg agatacggcc catgagttgg gagaatgcat 8700 tcatgcccgc ctcgttccag acgcggctgt aaaccacggc cccctcggag tctcttgcgc 8760 gcatcaccac ctgagcgagg ttaagctcca cgtgtctggt taagaccgca tagttgcata 8820 ggcgctgaaa aaggtagttg agtgtggtgg caatgtgttc ggcgacgaag aaatacatga 8880 tccatcgtct cagcggcatt tcgctaacat cgcccagagc ttccaagcgc tccatggcct 8940 cgtagaagtc cacggcaaaa ttaaaaaact gggagtttcg cgcggacacg gtcaattcct 9000 cctcgagaag acggatgagt tcggctatgg tggcccgtac ttcgcgttcg aaggctcccg 9060 ggatctcttc ttcctcttct atctcttctt ccactaacat ctcttcttcg tcttcaggcg 9120 ggggcggagg gggcacgcgg cgacgtcgac ggcgcacggg caaacggtcg atgaatcgtt 9180 caatgacctc tccgcggcgg cggcgcatgg tttcagtgac ggcgcggccg ttctcgcgcg 9240 gtcgcagagt aaaaacaccg ccgcgcatct ccttaaagtg gtgactggga ggttctccgt 9300 ttgggaggga gagggcgctg attatacatt ttattaattg gcccgtaggg actgcgcgca 9360 gagatctgat cgtgtcaaga tccacgggat ctgaaaacct ttcgacgaaa gcgtctaacc 9420 agtcacagtc acaaggtagg ctgagtacgg cttcttgtgg gcgggggtgg ttatgtgttc 9480 ggtctgggtc ttctgtttct tcttcatctc gggaaggtga gacgatgctg ctggtgatga 9540 aattaaagta ggcagttcta agacggcgga tggtggcgag gagcaccagg tctttgggtc 9600 cggcttgctg gatacgcagg cgattggcca ttccccaagc attatcctga catctagcaa 9660 gatctttgta gtagtcttgc atgagccgtt ctacgggcac ttcttcctca cccgttctgc 9720 catgcatacg tgtgagtcca aatccgcgca ttggttgtac cagtgccaag tcagctacga 9780 ctctttcggc gaggatggct tgctgtactt gggtaagggt ggcttgaaag tcatcaaaat 9840 ccacaaagcg gtggtaagcc cctgtattaa tggtgtaagc acagttggcc atgactgacc 9900 agttaactgt ctggtgacca gggcgcacga gctcggtgta tttaaggcgc gaataggcgc 9960 gggtgtcaaa gatgtaatcg ttgcaggtgc gcaccagata ctggtaccct ataagaaaat 10020 gcggcggtgg ttggcggtag agaggccatc gttctgtagc tggagcgcca ggggcgaggt 10080 cttccaacat aaggcggtga tagccgtaga tgtacctgga catccaggtg attcctgcgg 10140 cggtagtaga agcccgagga aactcgcgta cgcggttcca aatgttgcgt agcggcatga 10200 agtagttcat tgtaggcacg gtttgaccag tgaggcgcgc gcagtcattg atgctctata 10260 gacacggaga aaatgaaagc gttcagcgac tcgactccgt agcctggagg aacgtgaacg 10320 ggttgggtcg cggtgtaccc cggttcgaga cttgtactcg agccggccgg agccgcggct 10380 aacgtggtat tggcactccc gtctcgaccc agcctacaaa aatccaggat acggaatcga 10440 gtcgttttgc tggtttccga atggcaggga agtgagtcct attttttttt ttttttgccg 10500 ctcagaatgc atcccgtgct gcgacagatg cgcccccaac aacagccccc ctcgcagcag 10560 cagcagcagc aaccacaaaa ggctgtccct gcaactactg caactgccgc cgtgagcggt 10620 gcgggacagc ccgcctatga tctggacttg gaagagggcg aaggactggc acgtctaggt 10680 gcgccttcgc ccgagcggca tccgcgagtt caactgaaaa aagattctcg cgaggcgtat 10740 gtgccccaac agaacctatt tagagacaga agcggcgagg agccggagga gatgcgagct 10800 tcccgcttta acgcgggtcg tgagctgcgt cacggtttgg accgaagacg agtgttgcga 10860 gacgaggatt tcgaagttga tgaagtgaca gggatcagtc ctgccagggc acacgtggct 10920 gcagccaacc ttgtatcggc ttacgagcag acagtaaagg aagagcgtaa cttccaaaag 10980 tcttttaata atcatgtgcg aaccctgatt gcccgcgaag aagttaccct tggtttgatg 11040 catttgtggg atttgatgga agctatcatt cagaacccta ctagcaaacc tctgaccgcc 11100 cagctgtttc tggtggtgca acacagcaga gacaatgagg ctttcagaga ggcgctgctg 11160 aacatcaccg aacccgaggg gagatggttg tatgatctta tcaacattct acagagtatc 11220 atagtgcagg agcggagcct gggcctggcc gagaaggtag ctgccatcaa ttactcggtt 11280 ttgagcttgg gaaaatatta cgctcgcaaa atctacaaga ctccatacgt tcccatagac 11340 aaggaggtga agatagatgg gttctacatg cgcatgacgc tcaaggtctt gaccctgagc 11400 gatgatcttg gggtgtatcg caatgacaga atgcatcgcg cggttagcgc cagcaggagg 11460 cgcgagttaa gcgacaggga actgatgcac agtttgcaaa gagctctgac tggagctgga 11520 accgagggtg agaattactt cgacatggga gctgacttgc agtggcagcc taatcgcagg 11580 gctctgagcg ccgcgacggc aggatgtgag cttccttaca tagaagaggc ggatgaaggc 11640 gaggaggaag agggcgagta cttggaagac tgatggcaca acccgtgttt tttgctagat 11700 ggaacagcaa gcaccggatc ccgcaatgcg ggcggcgctg cagagccagc cgtccggcat 11760 taactcctcg gacgattgga cccaggccat gcaacgtatc atggcgttga cgactcgcaa 11820 ccccgaagcc tttagacagc aaccccaggc caaccgtcta tcggccatca tggaagctgt 11880 agtgccttcc cgatctaatc ccactcatga gaaggtcctg gccatcgtga acgcgttggt 11940 ggagaacaaa gctattcgtc cagatgaggc cggactggta tacaacgctc tcttagaacg 12000 cgtggctcgc tacaacagta gcaatgtgca aaccaatttg gaccgtatga taacagatgt 12060 acgcgaagcc gtgtctcagc gcgaaaggtt ccagcgtgat gccaacctgg gttcgctggt 12120 ggcgttaaat gctttcttga gtactcagcc tgctaatgtg ccgcgtggtc aacaggatta 12180 tactaacttt ttaagtgctt tgagactgat ggtatcagaa gtacctcaga gcgaagtgta 12240 tcagtccggt cctgattact tctttcagac tagcagacag ggcttgcaga cggtaaatct 12300 gagccaagct tttaaaaacc ttaaaggttt gtggggagtg catgccccgg taggagaaag 12360 agcaaccgtg tctagcttgt taactccgaa ctcccgcctg ttattactgt tggtagctcc 12420 tttcaccgac agcggtagca tcgaccgtaa ttcctatttg ggttacctac taaacctgta 12480 tcgcgaagcc atagggcaaa gtcaggtgga cgagcagacc tatcaagaaa ttacccaagt 12540 cagtcgcgct ttgggacagg aagacactgg cagtttggaa gccactctga acttcttgct 12600 taccaatcgg tctcaaaaga tccctcctca atatgctctt actgcggagg aggagaggat 12660 ccttagatat gtgcagcaga gcgtgggatt gtttctgatg caagaggggg caactccgac 12720 tgcagcactg gacatgacag cgcgaaatat ggagcccagc atgtatgcca gtaaccgacc 12780 tttcattaac aaactgctgg actacttgca cagagctgcc gctatgaact ctgattattt 12840 caccaatgcc atcttaaacc cgcactggct gcccccacct ggtttctaca cgggcgaata 12900 tgacatgccc gaccctaatg acggatttct gtgggacgac gtggacagcg atgttttttc 12960 acctctttct gatcatcgca cgtggaaaaa ggaaggcggt gatagaatgc attcttctgc 13020 atcgctgtcc ggggtcatgg gtgctaccgc ggctgagccc gagtctgcaa gtccttttcc 13080 tagtctaccc ttttctctac acagtgtacg tagcagcgaa gtgggtagaa taagtcgccc 13140 gagtttaatg ggcgaagagg agtacctaaa cgattccttg ctcagaccgg caagagaaaa 13200 aaatttccca aacaatggaa tagaaagttt ggtggataaa atgagtagat ggaagactta 13260 tgctcaggat cacagagacg agcctgggat catggggact acaagtagag cgagccgtag 13320 acgccagcgc catgacagac agaggggtct tgtgtgggac gatgaggatt cggccgatga 13380 tagcagcgtg ttggacttgg gtgggagagg aaggggcaac ccgtttgctc atttgcgccc 13440 tcgcttgggt ggtatgttgt gaaaaaaaat aaaaaagaaa aactcaccaa ggccatggcg 13500 acgagcgtac gttcgttctt ctttattatc tgtgtctagt ataatgaggc gagtcgtgct 13560 aggcggagcg gtggtgtatc cggagggtcc tcctccttcg tacgagagcg tgatgcagca 13620 gcagcaggcg acggcggtga tgcaatcccc actggaggct ccctttgtgc ctccgcgata 13680 cctggcacct acggagggca gaaacagcat tcgttactcg gaactggcac ctcagtacga 13740 taccaccagg ttgtatctgg tggacaacaa gtcggcggac attgcttctc tgaactatca 13800 gaatgaccac agcaacttct tgaccacggt ggtgcagaac aatgacttta cccctacgga 13860 agccagcacc cagaccatta actttgatga acgatcgcgg tggggcggtc agctaaagac 13920 catcatgcat actaacatgc caaacgtgaa cgagtatatg tttagtaaca agttcaaagc 13980 gcgtgtgatg gtgtccagaa aacctcccga cggtgctgca gttggggata cttatgatca 14040 caagcaggat attttggaat atgagtggtt cgagtttact ttgccagaag gcaacttttc 14100 agttactatg actattgatt tgatgaacaa tgccatcata gataattact tgaaagtggg 14160 tagacagaat ggagtgcttg aaagtgacat tggtgttaag ttcgacacca ggaacttcaa 14220 gctgggatgg gatcccgaaa ccaagttgat catgcctgga gtgtatacgt atgaagcctt 14280 ccatcctgac attgtcttac tgcctggctg cggagtggat tttaccgaga gtcgtttgag 14340 caaccttctt ggtatcagaa aaaaacagcc atttcaagag ggttttaaga ttttgtatga 14400 agatttagaa ggtggtaata ttccggccct cttggatgta gatgcctatg agaacagtaa 14460 gaaagaacaa aaagccaaaa tagaagctgc tacagctgct gcagaagcta aggcaaacat 14520 agttgccagc gactctacaa gggttgctaa cgctggagag gtcagaggag acaattttgc 14580 gccaacacct gttccgactg cagaatcatt attggccgat gtgtctgaag gaacggacgt 14640 gaaactcact attcaacctg tagaaaaaga tagtaagaat agaagctata atgtgttgga 14700 agacaaaatc aacacagcct atcgcagttg gtatctttcg tacaattatg gcgatcccga 14760 aaaaggagtg cgttcctgga cattgctcac cacctcagat gtcacctgcg gagcagagca 14820 ggtttactgg tcgcttccag acatgatgaa ggatcctgtc actttccgct ccactagaca 14880 agtcagtaac taccctgtgg tgggtgcaga gcttatgccc gtcttctcaa agagcttcta 14940 caacgaacaa gctgtgtact cccagcagct ccgccagtcc acctcgctta cgcacgtctt 15000 caaccgcttt cctgagaacc agattttaat ccgtccgccg gcgcccacca ttaccaccgt 15060 cagtgaaaac gttcctgctc tcacagatca cgggaccctg ccgttgcgca gcagtatccg 15120 gggagtccaa cgtgtgaccg ttactgacgc cagacgccgc acctgtccct acgtgtacaa 15180 ggcactgggc atagtcgcac cgcgcgtcct ttcaagccgc actttctaaa aaaaaaatgt 15240 ccattcttat ctcgcccagt aataacaccg gttggggtct gcgcgctcca agcaagatgt 15300 acggaggcgc acgcaaacgt tctacccaac atcccgtgcg tgttcgcgga cattttcgcg 15360 ctccatgggg tgccctcaag ggccgcactc gcgttcgaac caccgtcgat gatgtaatcg 15420 atcaggtggt tgccgacgcc cgtaattata ctcctactgc gcctacatct actgtggatg 15480 cagttattga cagtgtagtg gctgacgctc gcaactatgc tcgacgtaag agccggcgaa 15540 ggcgcattgc cagacgccac cgagctacca ctgccatgcg agccgcaaga gctctgctac 15600 gaagagctag acgcgtgggg cgaagagcca tgcttagggc ggccagacgt gcagcttcgg 15660 gcgccagcgc cggcaggtcc cgcaggcaag cagccgctgt cgcagcggcg actattgccg 15720 acatggccca atcgcgaaga ggcaatgtat actgggtgcg tgacgctgcc accggtcaac 15780 gtgtacccgt gcgcacccgt ccccctcgca cttagaagat actgagcagt ctccgatgtt 15840 gtgtcccagc ggcgaggatg tccaagcgca aatacaagga agaaatgctg caggttatcg 15900 cacctgaagt ctacggccaa ccgttgaagg atgaaaaaaa accccgcaaa atcaagcggg 15960 ttaaaaagga caaaaaagaa gaggaagatg gcgatgatgg gctggcggag tttgtgcgcg 16020 agtttgcccc acggcgacgc gtgcaatggc gtgggcgcaa agttcgacat gtgttgagac 16080 ctggaacttc ggtggtcttt acacccggcg agcgttcaag cgctactttt aagcgttcct 16140 atgatgaggt gtacggggat gatgatattc ttgagcaggc ggctgaccga ttaggcgagt 16200 ttgcttatgg caagcgtagt agaataactt ccaaggatga gacagtgtca atacccttgg 16260 atcatggaaa tcccacccct agtcttaaac cggtcacttt gcagcaagtg ttacccgtaa 16320 ctccgcgaac aggtgttaaa cgcgaaggtg aagatttgta tcccactatg caactgatgg 16380 tacccaaacg ccagaagttg gaggacgttt tggagaaagt aaaagtggat ccagatattc 16440 aacctgaggt taaagtgaga cccattaagc aggtagcgcc tggtctgggg gtacaaactg 16500 tagacattaa gattcccact gaaagtatgg aagtgcaaac tgaacccgca aagcctactg 16560 ccacctccac tgaagtgcaa acggatccat ggatgcccat gcctattaca actgacgccg 16620 ccggtcccac tcgaagatcc cgacgaaagt acggtccagc aagtctgttg atgcccaatt 16680 atgttgtaca cccatctatt attcctactc ctggttaccg aggcactcgc tactatcgca 16740 gccgaaacag tacctcccgc cgtcgccgca agacacctgc aaatcgcagt cgtcgccgta 16800 gacgcacaag caaaccgact cccggcgccc tggtgcggca agtgtaccgc aatggtagtg 16860 cggaaccttt gacactgccg cgtgcgcgtt accatccgag tatcatcact taatcaatgt 16920 tgccgctgcc tccttgcaga tatggccctc acttgtcgcc ttcgcgttcc catcactggt 16980 taccgaggaa gaaactcgcg ccgtagaaga gggatgttgg gacgcggaat gcgacgctac 17040 aggcgacggc gtgctatccg caagcaattg cggggtggtt ttttaccagc cttaattcca 17100 attatcgctg ctgcaattgg cgcgatacca ggcatagctt ccgtggcggt tcaggcctcg 17160 caacgacatt gacattggaa aaaaaacgta taaataaaaa aaaatacaat ggactctgac 17220 actcctggtc ctgtgactat gttttcttag agatggaaga catcaatttt tcatccttgg 17280 ctccgcgaca cggcacgaag ccgtacatgg gcacctggag cgacatcggc acgagccaac 17340 tgaacggggg cgccttcaat tggagcagta tctggagcgg gcttaaaaat tttggctcaa 17400 ccataaaaac atacgggaac aaagcttgga acagcagtac aggacaggcg cttagaaata 17460 aacttaaaga ccagaacttc caacaaaaag tagtcgatgg gatagcttcc ggcatcaatg 17520 gagtggtaga tttggctaac caggctgtgc agaaaaagat aaacagtcgt ttggacccgc 17580 cgccagcaac cccaggtgaa atgcaagtgg aggaagaaat tcctccgcca gaaaaacgag 17640 gcgacaagcg tccgcgtccc gatttggaag agacgctggt gacgcgcgta gatgaaccgc 17700 cttcttatga ggaagcaacg aagcttggaa tgcccaccac tagaccgata gccccaatgg 17760 ccaccggggt gatgaaacct tctcagttgc atcgacccgt caccttggat ttgccccctc 17820 cccctgctgc tactgctgta cccgcttcta agcctgtcgc tgccccgaaa ccagtcgccg 17880 tagccaggtc acgtcccggg ggcgctcctc gtccaaatgc gcactggcaa aatactctga 17940 acagcatcgt gggtctaggc gtgcaaagtg taaaacgccg tcgctgcttt taattaaata 18000 tggagtagcg cttaacttgc ctatctgtgt atatgtgtca ttacacgccg tcacagcagc 18060 agaggaaaaa aggaagaggt cgtgcgtcga cgctgagtta ctttcaagat ggccacccca 18120 tcgatgctgc cccaatgggc atacatgcac atcgccggac aggatgcttc ggagtacctg 18180 agtccgggtc tggtgcagtt cgcccgcgcc acagacacct acttcaatct gggaaataag 18240 tttagaaatc ccaccgtagc gccgacccac gatgtgacca ccgaccgtag ccagcggctc 18300 atgttgcgct tcgtgcccgt tgaccgggag gacaatacat actcttacaa agtgcggtac 18360 accctggccg tgggcgacaa cagagtgctg gatatggcca gcacgttctt tgacattagg 18420 ggcgtgttgg acagaggtcc cagtttcaaa ccctattctg gtacggctta caactctctg 18480 gctcctaaag gcgctccaaa tgcatctcaa tggattgcaa aaggcgtacc aactgcagca 18540 gccgcaggca atggtgaaga agaacatgaa acagaggaga aaactgctac ttacactttt 18600 gccaatgctc ctgtaaaagc cgaggctcaa attacaaaag agggcttacc aataggtttg 18660 gagatttcag ctgaaaacga atctaaaccc atctatgcag ataaacttta tcagccagaa 18720 cctcaagtgg gagatgaaac ttggactgac ctagacggaa aaaccgaaga gtatggaggc 18780 agggctctaa agcctactac taacatgaaa ccctgttacg ggtcctatgc gaagcctact 18840 aatttaaaag gtggtcaggc aaaaccgaaa aactcggaac cgtcgagtga aaaaattgaa 18900 tatgatattg acatggaatt ttttgataac tcatcgcaaa gaacaaactt cagtcctaaa 18960 attgtcatgt atgcagaaaa tgtaggtttg gaaacgccag acactcatgt agtgtacaaa 19020 cctggaacag aagacacaag ttccgaagct aatttgggac aacagtctat gcccaacaga 19080 cccaactaca ttggcttcag agataacttt attggactca tgtactataa cagtactggt 19140 aacatggggg tgctggctgg tcaagcgtct cagttaaatg cagtggttga cttgcaggac 19200 agaaacacag aactttctta ccaactcttg cttgactctc tgggcgacag aaccagatac 19260 tttagcatgt ggaatcaggc tgtggacagt tatgatcctg atgtacgtgt tattgaaaat 19320 catggtgtgg aagatgaact tcccaactat tgttttccac tggacggcat aggtgttcca 19380 acaaccagtt acaaatcaat agttccaaat ggagaagata ataataattg gaaagaacct 19440 gaagtaaatg gaacaagtga gatcggacag ggtaatttgt ttgccatgga aattaacctt 19500 caagccaatc tatggcgaag tttcctttat tccaatgtgg ctctgtatct cccagactcg 19560 tacaaataca ccccgtccaa tgtcactctt ccagaaaaca aaaacaccta cgactacatg 19620 aacgggcggg tggtgccgcc atctctagta gacacctatg tgaacattgg tgccaggtgg 19680 tctctggatg ccatggacaa tgtcaaccca ttcaaccacc accgtaacgc tggcttgcgt 19740 taccgatcta tgcttctggg taacggacgt tatgtgcctt tccacataca agtgcctcaa 19800 aaattcttcg ctgttaaaaa cctgctgctt ctcccaggct cctacactta tgagtggaac 19860 tttaggaagg atgtgaacat ggttctacag agttccctcg gtaacgacct gcgggtagat 19920 ggcgccagca tcagtttcac gagcatcaac ctctatgcta cttttttccc catggctcac 19980 aacaccgctt ccacccttga agccatgctg cggaatgaca ccaatgatca gtcattcaac 20040 gactacctat ctgcagctaa catgctctac cccattcctg ccaatgcaac caatattccc 20100 atttccattc cttctcgcaa ctgggcggct ttcagaggct ggtcatttac cagactgaaa 20160 accaaagaaa ctccctcttt ggggtctgga tttgacccct actttgtcta ttctggttct 20220 attccctacc tggatggtac cttctacctg aaccacactt ttaagaaggt ttccatcatg 20280 tttgactctt cagtgagctg gcctggaaat gacaggttac tatctcctaa cgaatttgaa 20340 ataaagcgca ctgtggatgg cgaaggctac aacgtagccc aatgcaacat gaccaaagac 20400 tggttcttgg tacagatgct cgccaactac aacatcggct atcagggctt ctacattcca 20460 gaaggataca aagatcgcat gtattcattt ttcagaaact tccagcccat gagcaggcag 20520 gtggttgatg aggtcaatta caaagacttc aaggccgtcg ccatacccta ccaacacaac 20580 aactctggct ttgtgggtta catggctccg accatgcgcc aaggtcaacc ctatcccgct 20640 aactatccct atccactcat tggaacaact gccgtaaata gtgttacgca gaaaaagttc 20700 ttgtgtgaca gaaccatgtg gcgcataccg ttctcgagca acttcatgtc tatgggggcc 20760 cttacagact tgggacagaa tatgctctat gccaactcag ctcatgctct ggacatgacc 20820 tttgaggtgg atcccatgga tgagcccacc ctgctttatc ttctcttcga agttttcgac 20880 gtggtcagag tgcatcagcc acaccgcggc atcatcgagg cagtctacct gcgtacaccg 20940 ttctcggccg gtaacgctac cacgtaagaa gcttcttgct tcttgcaaat agcagctgca 21000 accatggcct gcggatccca aaacggctcc agcgagcaag agctcagagc cattgtccaa 21060 gacctgggtt gcggacccta ttttttggga acctacgata agcgcttccc ggggttcatg 21120 gcccccgata agctcgcctg tgccattgta aatacggccg gacgtgagac ggggggagag 21180 cactggttgg ctttcggttg gaacccacgt tctaacacct gctacctttt tgatcctttt 21240 ggattctcgg atgatcgtct caaacagatt taccagtttg aatatgaggg tctcctgcgc 21300 cgcagcgctc ttgctaccaa ggaccgctgt attacgctgg aaaaatctac ccagaccgtg 21360 cagggccccc gttctgccgc ctgcggactt ttctgctgca tgttccttca cgcctttgtg 21420 cactggcctg accgtcccat ggacggaaac cccaccatga aattgctaac tggagtgcca 21480 aacaacatgc ttcattctcc taaagtccag cccaccctgt gtgacaatca aaaagcactc 21540 taccattttc ttaataccca ttcgccttat tttcgctctc atcgtacaca catcgaaagg 21600 gccactgcgt tcgaccgtat ggatgttcaa taatgactca tgtaaacaac gtgttcaata 21660 aacatcactt tattttttta catgtatcaa ggctctggat tacttattta tttacaagtc 21720 gaatgggttc tgacgagaat cagaatgacc cgcaggcagt gatacgttgc ggaactgata 21780 cttgggttgc cacttgaatt cgggaatcac caacttggga accggtatat cgggcaggat 21840 gtcactccac agctttctgg tcagctgcaa agctccaagc aggtcaggag ccgaaatctt 21900 gaaatcacaa ttaggaccag tgctctgagc gcgagagttg cggtacaccg gattgcagca 21960 ctgaaacacc atcagcgacg gatgtctcac gcttgccagc acggtgggat ctgcaatcat 22020 gcccacatcc agatcttcag cattggcaat gctgaacggg gtcatcttgc aggtctgcct 22080 acccatggcg ggcacccaat taggcttgtg gttgcaatcg cagtgcaggg ggatcagtat 22140 catcttggcc tgatcctgtc tgattcctgg atacacggct ctcatgaaag catcatattg 22200 cttgaaagcc tgctgggctt tactaccctc gggataaaac atcccgcagg acctgctcga 22260 aaactggtta gcctgcacag ccggcatcat tcacacagca gcgggcgtca ttgttggcta 22320 tttgcaccac acttctgccc cagcggtttt gggtgatttt ggttcgctcg ggattctcct 22380 ttaaggctcg ttgtccgttc tcgctggcca catccatctc gataatctgc tccttctgaa 22440 tcataatatt gccatgcagg cacttcagct tgccctcata atcattgcag ccatgaggcc 22500 acaacgcaca gcctgtacat tcccaattat ggtgggcgat ctgagaaaaa gaatgtatca 22560 ttccctgcag aaatcttccc atcatcgtgc tcagtgtctt gtgactagtg aaagttaact 22620 ggatgcctcg gtgctcttcg tttacgtact ggtgacagat gcgcttgtat tgttcgtgtt 22680 gctcaggcat tagtttaaaa caggttctaa gttcgttatc cagcctgtac ttctccatca 22740 gcagacacat cacttccatg cctttctccc aagcagacac caggggcaag ctaatcggat 22800 tcttaacagt gcaggcagca gctcctttag ccagagggtc atctttagcg atcttctcaa 22860 tgcttctttt gccatccttc tcaacgatgc gcacgggcgg gtagctgaaa cccactgcta 22920 caagttgcgc ctcttctctt tcttcttcgc tgtcttgact gatgtcttgc atggggatat 22980 gtttggtctt ccttggcttc tttttggggg gtatcggagg aggaggactg tcgctccgtt 23040 ccggagacag ggaggattgt gacgtttcgc tcaccattac caactgactg tcggtagaag 23100 aacctgaccc cacacggcga caggtgtttt tcttcggggg cagaggtgga ggcgattgcg 23160 aagggctgcg gtccgacctg gaaggcggat gactggcaga accccttccg cgttcggggg 23220 tgtgctccct gtggcggtcg cttaactgat ttccttcgcg gctggccatt gtgttctcct 23280 aggcagagaa acaacagaca tggaaactca gccattgctg tcaacatcgc cacgagtgcc 23340 atcacatctc gtcctcagcg acgaggaaaa ggagcagagc ttaagcattc caccgcccag 23400 tcctgccacc acctctaccc tagaagataa ggaggtcgac gcatctcatg acatgcagaa 23460 taaaaaagcg aaagagtctg agacagacat cgagcaagac ccgggctatg tgacaccggt 23520 ggaacacgag gaagagttga aacgctttct agagagagag gatgaaaact gcccaaaaca 23580 gcgagcagat aactatcacc aagatgctgg aaatagggat cagaacaccg actacctcat 23640 agggcttgac ggggaagacg cgctccttaa acatctagca agacagtcgc tcatagtcaa 23700 ggatgcatta ttggacagaa ctgaagtgcc catcagtgtg gaagagctca gctgcgccta 23760 cgagcttaac cttttttcac ctcgtactcc ccccaaacgt cagccaaacg gcacctgcga 23820 gccaaatcct cgcttaaact tttatccagc ttttgctgtg ccagaagtac tggctaccta 23880 tcacatcttt tttaaaaatc aaaaaattcc agtctcctgc cgcgctaatc gcacccgcgc 23940 cgatgcccta ctcaatctgg gacctggttc acgcttacct gatatagctt ccttggaaga 24000 ggttccaaag atcttcgagg gtctgggcaa taatgagact cgggccgcaa atgctctgca 24060 aaagggagaa aatggcatgg atgagcatca cagcgttctg gtggaattgg aaggcgataa 24120 tgccagactc gcagtactca agcgaagcgt cgaggtcaca cacttcgcat atcccgctgt 24180 caacctgccc cctaaagtca tgacggcggt catggaccag ttactcatta agcgcgcaag 24240 tcccctttca gaagacatgc atgacccaga tgcctgtgat gagggtaaac cagtggtcag 24300 tgatgagcag ctaacccgat ggctgggcac cgactctccc cgggatttgg aagagcgtcg 24360 caagcttatg atggccgtgg tgctggttac cgtagaacta gagtgtctcc gacgtttctt 24420 taccgattca gaaaccttgc gcaaactcga agagaatctg cactacactt ttagacacgg 24480 ctttgtgcgg caggcatgca agatatctaa cgtggaactc accaacctgg tttcctacat 24540 gggtattctg catgagaatc gcctaggaca aagcgtgctg cacagcaccc ttaaggggga 24600 agcccgccgt gattacatcc gcgattgtgt ctatctctac ctgtgccaca cgtggcaaac 24660 cggcatgggt gtatggcagc aatgtttaga agaacagaac ttgaaagagc ttgacaagct 24720 cttacagaaa tctcttaagg ttctgtggac agggttcgac gagcgcaccg tcgcttccga 24780 cctggcagac ctcatcttcc cagagcgtct cagggttact ttgcgaaacg gattgcctga 24840 ctttatgagc cagagcatgc ttaacaattt tcgctctttc atcctggaac gctccggtat 24900 cctgcccgcc acctgctgcg cactgccctc cgactttgtg cctctcacct accgcgagtg 24960 ccccccgccg ctatggagtc actgctacct gttccgtctg gccaactatc tctcctacca 25020 ctcggatgtg atcgaggatg tgagcggaga cggcttgctg gagtgccact gccgctgcaa 25080 tctgtgcacg ccccaccggt ccctagcttg caacccccag ttgatgagcg aaacccagat 25140 aataggcacc tttgaattgc aaggccccag cagccaaggc gatgggtctt ctcctgggca 25200 aagtttaaaa ctgaccccgg gactgtggac ctccgcctac ttgcgcaagt ttgctccgga 25260 agattaccac ccctatgaaa tcaagttcta tgaggaccaa tcacagcctc caaaggccga 25320 actttcggct tgcgtcatca cccagggggc aattctggcc caattgcaag ccatccaaaa 25380 atcccgccaa gaatttctac tgaaaaaggg taagggggtc taccttgacc cccagaccgg 25440 cgaggaactc aacacaaggt tccctcagga tgtcccaacg acgagaaaac aagaagttga 25500 aggtgcagcc gccgccccca gaagatatgg aggaagattg ggacagtcag gcagaggagg 25560 cggaggagga cagtctggag gacagtctgg aggaagacag tttggaggag gaaaacgagg 25620 aggcagagga ggtggaagaa gtaaccgccg acaaacagtt atcctcggct gcggagacaa 25680 gcaacagcgc taccatctcc gctccgagtc gaggaacccg gcggcgtccc agcagtagat 25740 gggacgagac cggacgcttc ccgaacccaa ccagcgcttc caagaccggt aagaaggatc 25800 ggcagggata caagtcctgg cgggggcata agaatgccat catctcctgc ttgcatgagt 25860 gcgggggcaa catatccttc acgcggcgct acttgctatt ccaccatggg gtgaactttc 25920 cgcgcaatgt tttgcattac taccgtcacc tccacagccc ctactatagc cagcaaatcc 25980 cgacagtctc gacagataaa gacagcggcg gcgacctcca acagaaaacc agcagcggca 26040 gttagaaaat acacaacaag tgcagcaaca ggaggattaa agattacagc caacgagcca 26100 gcgcaaaccc gagagttaag aaatcggatc tttccaaccc tgtatgccat cttccagcag 26160 agtcggggtc aagagcagga actgaaaata aaaaaccgat ctctgcgttc gctcaccaga 26220 agttgtttgt atcacaagag cgaagatcaa cttcagcgca ctctcgagga cgccgaggct 26280 ctcttcaaca agtactgcgc gctgactctt aaagagtagg cagcgaccgc gcttattcaa 26340 aaaaggcggg aattacatca tcctcgacat gagtaaagaa attcccacgc cttacatgtg 26400 gagttatcaa ccccaaatgg gattggcagc aggcgcctcc caggactact ccacccgcat 26460 gaattggctc agcgccgggc cttctatgat ttctcgagtt aatgatatac gcgcctaccg 26520 aaaccaaata cttttggaac agtcagctct taccaccacg ccccgccaac accttaatcc 26580 cagaaattgg cccgccgccc tagtgtacca ggaaagtccc gctcccacca ctgtattact 26640 tcctcgagac gcccaggccg aagtccaaat gactaatgca ggtgcgcagt tagctggcgg 26700 ctccacccta tgtcgtcaca ggcctcggca taatataaaa cgcctgatga tcagaggccg 26760 aggtatccag ctcaacgacg agtcggtgag ctctccgctt ggtctacgac cagacggaat 26820 ctttcagatt gccggctgcg ggagatcttc cttcacccct cgtcaggctg ttctgacttt 26880 ggaaagttcg tcttcgcaac cccgctcggg cggaatcggg accgttcaat ttgtagagga 26940 gtttactccc tctgtctact tcaacccctt ctccggatct cctgggcact acccggacga 27000 gttcataccg aacttcgacg cgattagcga gtcagtggac ggctacgatt gatgtctggt 27060 gacgcggctg agctatctcg gctgcgacat ctagaccact gccgccgctt tcgctgcttt 27120 gcccgggaac ttattgagtt catctacttc gaactcccca aggatcaccc tcaaggtccg 27180 gcccacggag tgcggattac tatcgaaggc aaaatagact ctcgcctgca acgaattttc 27240 tcccagcggc ccgtgctgat cgagcgagac cagggaaaca ccacggttag taatcaatta 27300 cggggtcatt agttcatagc ccatatatgg agttgcgatc gctgcgggcc atgtcataca 27360 ccgccttcag agcagccgga cctatctgcc cgttcgtgcc gtcgttgtta atcaccacat 27420 ggttattctg ctcaaacgtc ccggacgcct gcgaccggct gtctgccatg ctgcccggtg 27480 taccgacata accgccggtg gcatagccgc gcatcagccg gtaaagattc cccacgccaa 27540 tccggctggt tgcctccttc gtgaagacaa actcaccacg gtgaacaatc cccgctggct 27600 catatttgcc gccggttccc gtaaatcctc cggttgcaaa atggaatttc gccgcagcgg 27660 cctgaatggc tgtaccgcct gacgcggatg cgccgccacc aacagccccg ccaatggcgc 27720 tgccgatact cccgacaatc cccaccattg cctgcttaag cagaatttct gtcatcatgg 27780 acagcacgga acgggtgaag ctgcgccagt tctgctcact gccggtcagc atcgccgcca 27840 tattctgtgc aataccatca aaggtctgcg tggctgcact ttttacctgc gacatactgt 27900 ccgtggcgct ctcttcccac tcactccagc cggacttcag gcctgccatc cagttcccgc 27960 gaagctggtc ttcagccgcc caggtctttt tctgctctga catgacgtta ttcagcgcca 28020 gcggattatc gccatactgt tccttcaggc gctgttccgt ggcttcccgt tctgcctgcc 28080 ggtcagtcag cccccggctt ttcgcatcaa tggcggcccg ttttgcccgt tgctgctgtg 28140 cgaatttatc cgcctgctgc gccagcgcgt tcaggcgctc ctgatacgta accttgtcgc 28200 caagtgcagc cagctggcgt ttgtactcca gcgtctcatc tttatgcgcc agcagggatt 28260 tctcctgtgc agacagctgg cgacgttgcg ccgcctcctc cagtaccgcg aactgactct 28320 ccgccttcca caaatcccgg cgctgctggc tgattttctc atttgctccg gcatgcttct 28380 ccagcgtccg gagttctgcc tgaagcgtca gcagggcagc atgagcactg tcttcctgac 28440 gatcgcccgc agacaccttc acgctggact gtttcggctt tttcagcgtc gcttcataat 28500 cctttttcgc cgccgccatc agcgtgttgt aatccgcctg caggattttc ccgtctttca 28560 gtgccttgtt cagttcttcc tgacgggcgg tatatttctc cagcggcgtc tgcagccgtt 28620 cgtaagcctt ctgcgcctct tcggtatatt tcagccgtga cgcttcggta tcgctctgct 28680 gctgcgcatt tttgtcctgt tgagtctgct gctcagcctt ctttcgggcg gcttcaagcg 28740 caagacgggc cttttcacga tcatcccagt aacgcgcccg cgcttcatcg ttaacaaaat 28800 aatcatcctt gcgcagattc cagatgtcgt ctgctttctt atacgcagcc tctgccttaa 28860 tcagcatctc ctgcgcggta tcaggacgac caatatccag caccgcatcc cacatggatt 28920 tgaatgcccg cgcagtcctg tctgcccagg tctccagcgt gcccatgttc tctttcaggc 28980 ggcgggtctg gtcatcaaac cctttcgttg cggcctcgtt cgccgcctgc aatgccccgg 29040 cttcatcgcc ggaacgctgc aactgagcaa catacgcaat ctgctccgcc gacacgttat 29100 ggaactggcg agccatcgcc gtcagccccg acgtcgggtc tgtggtcagc ttcccgaagg 29160 cttcagcgac cttgtccacc tccacgccgg atgcagagga gaaacgcgcc acactctggc 29220 tgatggacgc aatctgagcc tcaccgctta cccccgcctt aaccagtgcg ctgagtgact 29280 cgctggtctg gttaaacgtc agccctgccg cctgcccggc tctggacagg accagcatac 29340 gatctgccgt cagtcccgcc tgattgccgg aaaggaccag cgttttgttg aaatcggaca 29400 gggttgagtt gccctgatac caggcatacg ccagcgcacc ggtcgccacc gccagcgagg 29460 tggcccccac catcggcagg gtgatcgcac cggcaagccc cctgaacatg gggatcatcc 29520 cgccgaagga gtccttcacc tgccccccct gttgcagcag gatcagccac ggactttgcc 29580 cgcctgcaag ctgcgtggcc acgtcggtga actgtgcagg cagcatacgc atggcggctt 29640 tatactgccc gacggaaatc cccgctttct gtgcagccag cgcctgtcgg ctcagcgact 29700 gttcaacgac tgccgctgtt tttttcgcat cactttccgt accagaaaaa tgacgcctga 29760 ctctggccat ctgctcgtca aatctggccg catccagact caaatcaacg acgtcgacta 29820 agctctagca tttgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa 29880 gcactaaatc ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg 29940 aacgtggcga gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt 30000 gtagcggtca cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc 30060 gcgtggggat accccctaga gccccagctg gttctttccg cctcagaagc catagagccc 30120 accgcatccc cagcatgcct gctattgtct tcccaatcct cccccttgct gtcctgcccc 30180 accccacccc ccagaataga atgacaccta ctcagacaat gcgatgcaat ttcctcattt 30240 tattaggaaa ggacagtggg agtggcacct tccagggtca aggaaggcac gggggagggg 30300 caaacaacag atggctggca actagaaggc acagtcgagg ctgatcagcg ggtttgctag 30360 cttaggcgaa ggcgatgggg gtcttgaagg cgtgctggta ctccacgatg cccagctcgg 30420 tgttgctgtg cagctcctcc acgcggcgga aggcgaacat ggggcccccg ttctgcagga 30480 tgctggggtg gatggcgctc ttgaagtgca tgtggctgtc caccacgaag ctgtagtagc 30540 cgccgtcgcg caggctgaag gtgcgggcga agctgcccac cagcacgtta tcgcccatgg 30600 ggtgcaggtg ctccacggtg gcgttgctgc ggatgatctt gtcggtgaag atcacgctgt 30660 cctcggggaa gccggtgccc accaccttga agtcgccgat cacgcggccg gcctcgtagc 30720 ggtagctgaa gctcacgtgc agcacgccgc cgtcctcgta cttctcgatg cgggtgttgg 30780 tgtagccgcc gttgttgatg gcgtgcagga aggggttctc gtagccgctg gggtaggtgc 30840 cgaagtggta gaagccgtag cccatcacgt ggctcagcag gtaggggctg aaggtcaggg 30900 cgcctttggt gctcttcatc ttgttggtca tgcggccctg ctcgggggtg ccctctccgc 30960 cgcccaccag ctcgaactcc acgccgttca gggtgccggt gatgcggcac tcgatcttca 31020 tggcgggcat ggtggctagc ctagccagct tgggtctccc tatagtgagt cgtattaatt 31080 tcgataagcc agtaagcagt gggttctcta gttagccaga gagctctgct tatatagacc 31140 tcccaccgta cacgcctacc gcccatttgc gtcaatgggg cggagttgtt acgacatttt 31200 ggaaagtccc gttgattttg gtgccaaaac aaactcccat tgacgtcaat ggggtggaga 31260 cttggaaatc cccgtgagtc aaaccgctat ccacgcccat tgatgtactg ccaaaaccgc 31320 atcaccatgg taatagcgat gactaatacg tagatgtact gccaagtagg aaagtcccat 31380 aaggtcatgt actgggcata atgccaggcg ggccatttac cgtcattgac gtcaataggg 31440 ggcgtacttg gcatatgata cacttgatgt actgccaagt gggcagttta ccgtaaatac 31500 tccacccatt gacgtcaatg gaaagtccct attggcgtta ctatgggaac atacgtcatt 31560 attgacgtca atgggcgggg gtcgttgggc ggtcagccag gcgggccatt taccgtaagt 31620 tatgtaacgc ggaactccat atatgggcta tgaactaatg accccgtaat tgattactat 31680 taataactac aataatcaat gtcaacgcgt atatctggcc cgtacatcgc gaagcagcgc 31740 aaaacgccta accctaagca gattcttcat gcaattaagc ttcgcggtgc ttcttcagta 31800 cgctacggca aatgtcatcg acgtttttat ccggaaactg ctgtctggct ttttttgatt 31860 tcagaattag cctgacgggc aatgctgcga agggcgtttt cctgctgagg tgtcattgaa 31920 caagtcccat gtcggcaagc ataagcacac agaatatgaa gcccgctgcc agaaaaatgc 31980 attccgtggt tgtcatacct ggtttctctc atctgcttct gctttcgcca ccatcatttc 32040 cagcttttgt gaaagggatg cggctaacgt atgaaattct tcgtctgttt ctactggtat 32100 tggcacaaac ctgattccaa tttgagcaag gctatgtgcc atctcgatac tcgttcttaa 32160 ctcaacagaa gatgctttgt gcatacagcc cctcgtttat tatttatctc ctcagccagc 32220 cgctgtgctt tcagtggatt tcggataaca gaaaggccgg gaaataccca gcctcgcttt 32280 gtaacggagt agacgaaagt gattgcgcct acccggatat tatcgtgagg atgcgtcatc 32340 gccattgctc cccaaataca aaaccaattt cagccagtgc ctcgtccatt ttttcgatga 32400 actccggcac gatctcgtca aaactcgcca tgtacttttc atcccgctca atcacgacat 32460 aatgcaggcc ttcacgcttc atacgcgggt catagttggc aaagtaccag gcattttttc 32520 gcgtcaccca catgctgtac tgcacctggg ccatgtaagc tgactttatg gcctcgaaac 32580 caccgagccg gaacttcatg aaatcccggg aggtaaacgg gcatttcagt tcaaggccgt 32640 tgccgtcact gcataaacca tcgggagagc aggcggtacg catactttcg tcgcgataga 32700 tgatcgggga ttcagtaaca ttcacgccgg aagtgaattc aaacagggtt ctggcgtcgt 32760 tctcgta 32767 <210> 52 <211> 32759 <212> DNA <213> Artificial Sequence <220> <223> Ad35E4PS3/WL-ps3 <220> <221> misc_feature <222> (2582)..(2735) <223> Ad35 1-->154 <220> <221> misc_feature <222> (2744)..(2777) <223> loxP <220> <221> misc_feature <222> (2784)..(3110) <223> Ad35 155-->481 <220> <221> misc_feature <222> (3111)..(3144) <223> loxP <220> <221> misc_feature <222> (27530)..(29999) <223> lambda-1 (Complementary) <220> <221> misc_feature <222> (30313)..(30527) <223> BGH polyA <220> <221> misc_feature <222> (30552)..(31217) <223> copGFP (Complementary) <220> <221> misc_feature <222> (31264)..(31916) <223> CMV (Complementary) <220> <221> misc_feature <222> (31968)..(33497) <223> lambda-2 <220> <221> misc_feature <222> (33558)..(34893) <223> Ad35 30544-->31879 <220> <221> misc_feature <222> (34889)..(36003) <223> Ad5E4orf6 <220> <221> misc_feature <222> (36001)..(37823) <223> Ad35 32972-->34794 <400> 52 taaacttggc gcgccctgag tgatttttct ctggtcccgc cgcatccata ccgccagttg 60 tttaccctca caacgttcca gtaaccgggc atgttcatca tcagtaaccc gtatcgtgag 120 catcctctct cgtttcatcg gtatcattac ccccatgaac agaaatcccc cttacacgga 180 ggcatcagtg accaaacagg aaaaaaccgc ccttaacatg gcccgcttta tcagaagcca 240 gacattaacg cttctggaga aactcaacga gctggacgcg gatgaacagg cagacatctg 300 tgaatcgctt cacgaccacg ctgatgagct ttaccgcagc tgcctcgcgc gtttcggtga 360 tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc 420 ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg 480 cgcagccatg acccagtcac gtagcgatag cggagtgtat actggcttaa ctatgcggca 540 tcagagcaga ttgtactgag agtgcaccat atgcggtgtg aaataccgca cagatgcgta 600 aggagaaaat accgcatcag gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 660 gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 720 gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 780 cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 840 aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 900 tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 960 ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 1020 ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 1080 cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 1140 ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 1200 gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 1260 atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 1320 aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 1380 aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 1440 gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 1500 cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 1560 gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 1620 tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 1680 ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 1740 ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 1800 atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 1860 cgcaacgttg ttgccattgc tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct 1920 tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 1980 aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 2040 tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 2100 ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 2160 agttgctctt gcccggcgtc aacacgggat aataccgcgc cacatagcag aactttaaaa 2220 gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 2280 agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 2340 accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 2400 gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 2460 cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 2520 ggggttccgc gcacatttcc ccgaaaagtg ccacctgtct agctacgata tcctgtttaa 2580 acatcatcaa taatatacct tatagatgga atggtgccaa tatgtaaatg aggtgatttt 2640 aaaaagtgtg ggccgtgtgg tgattggctg tggggttaac ggttaaaagg ggcggcgcgg 2700 ccgtgggaaa atgacgtttt atgggggtgg agtttattta aatataactt cgtatagcat 2760 acattatacg aagttatgga tccttttgca agttgtcgcg ggaaatgtta cgcataaaaa 2820 ggcttctttt ctcacggaac tacttagttt tcccacggta tttaacagga aatgaggtag 2880 ttttgaccgg atgcaagtga aaattgctga ttttcgcgcg aaaactgaat gaggaagtgt 2940 ttttctgaat aatgtggtat ttatggcagg gtggagtatt tgttcagggc caggtagact 3000 ttgacccatt acgtggaggt ttcgattacc gtgtttttta cctgaatttc cgcgtaccgt 3060 gtcaaagtct tctgttttta cgtaggtgtc agctgatcgc tagggtattt ataacttcgt 3120 atagcataca ttatacgaag ttatatttaa ataggaatgt ttatgcctta ccagtgtaac 3180 atgaatcatg tgaaagtgtt gttggaacca gatgcctttt ccagaatgag cctaacagga 3240 atctttgaca tgaacacgca aatctggaag atcctgaggt atgatgatac gagatcgagg 3300 gtgcgcgcat gcgaatgcgg aggcaagcat gccaggttcc agccggtgtg tgtagatgtg 3360 accgaagatc tcagaccgga tcatttggtt attgcccgca ctggagcaga gttcggatcc 3420 agtggagaag aaactgacta aggtgagtat tgggaaaact ttggggtggg attttcagat 3480 ggacagattg agtaaaaatt tgttttttct gtcttgcagc tgacatgagt ggaaatgctt 3540 cttttaaggg gggagtcttc agcccttatc tgacagggcg tctcccatcc tgggcaggag 3600 ttcgtcagaa tgttatggga tctactgtgg atggaagacc cgttcaaccc gccaattctt 3660 caacgctgac ctatgctact ttaagttctt cacctttgga cgcagctgca gccgctgccg 3720 ccgcctctgt cgccgctaac actgtgcttg gaatgggtta ctatggaagc atcgtggcta 3780 attccacttc ctctaataac ccttctacac tgactcagga caagttactt gtccttttgg 3840 cccagctgga ggctttgacc caacgtctgg gtgaactttc tcagcaggtg gccgagttgc 3900 gagtacaaac tgagtctgct gtcggcacgg caaagtctaa ataaaaaaaa ttccagaatc 3960 aatgaataaa taaacgagct tgttgttgat ttaaaatcaa gtgtttttat ttcatttttc 4020 gcgcacggta tgccctggac caccgatctc gatcattgag aactcggtgg attttttcca 4080 gaatcctata gaggtgggat tgaatgttta gatacatggg cattaggccg tctttggggt 4140 ggagatagct ccattgaagg gattcatgct ccggggtagt gttgtaaatc acccagtcat 4200 aacaaggtcg cagtgcatgg tgttgcacaa tatcttttag aagtaggctg attgccacag 4260 ataagccctt ggtgtaggtg tttacaaacc ggttgagctg ggaggggtgc attcgaggtg 4320 aaattatgtg cattttggat tggattttta agttggcaat attgccgcca agatcccgtc 4380 ttgggttcat gttatgaagg actaccaaga cggtgtatcc ggtacattta ggaaatttat 4440 cgtgcagctt ggatggaaaa gcgtggaaaa atttggagac acccttgtgt cctccgagat 4500 tttccatgca ctcatccatg ataatagcaa tggggccgtg ggcagcggcg cgggcaaaca 4560 cgttccgtgg gtctgacaca tcatagttat gttcctgagt taaatcatca taagccattt 4620 taatgaattt ggggcggagc gtaccagatt ggggtatgaa tgttccttcg ggccccggag 4680 catagttccc ctcacagatt tgcatttccc aagctttcag ttctgagggt ggaatcatgt 4740 ccacctgggg ggctatgaag aacaccgttt cgggggcggg ggtgattagt tgggatgata 4800 gcaagtttct gagcaattga gatttgccac atccggtggg gccataaata attccgatta 4860 caggttgcag gtggtagttt agggaacggc aactgccgtc ttctcgaagc aagggggcca 4920 cctcgttcat catttccctt acatgcatat tttcccgcac caaatccatt aggaggcgct 4980 ctcctcctag tgatagaagt tcttgtagtg aggaaaagtt tttcagcggt tttagaccgt 5040 cagccatggg cattttggaa agagtttgct gcaaaagttc tagtctgttc cacagttcag 5100 tgatgtgttc tatggcatct cgatccagca gacctcctcg tttcgcgggt ttggacggct 5160 cctggagtag ggtatgagac gatgggcgtc cagcgctgcc agggttcggt ccttccaggg 5220 tctcagtgtt cgagtcaggg ttgtttccgt cacagtgaag gggtgtgcgc ctgcttgggc 5280 gcttgccagg gtgcgcttca gactcattct gctggtggag aacttctgtc gcttggcgcc 5340 ctgtatgtcg gccaagtagc agtttaccat gagttcgtag ttgagcgcct cggctgcgtg 5400 gcctttggcg cggagcttac ctttggaagt tttcttgcat accgggcagt ataggcattt 5460 cagcgcatac agcttgggcg caaggaaaat ggattctggg gagtatgcat ccgcgccgca 5520 ggaggcgcaa acagtttcac attccaccag ccaggttaaa tccggttcat tggggtcaaa 5580 aacaagtttt ccgccatatt ttttgatgcg tttcttacct ttggtctcca taagttcgtg 5640 tcctcgttga gtgacaaaca ggctgtccgt atctccgtag actgatttta caggcctctt 5700 ctccagtgga gtgcctcggt cttcttcgta caggaactct gaccactctg atacaaaggc 5760 gcgcgtccag gccagcacaa aggaggctat gtgggagggg tagcgatcgt tgtcaaccag 5820 ggggtccacc ttttccaaag tatgcaaaca catgtcaccc tcttcaacat ccaggaatgt 5880 gattggcttg taggtgtatt tcacgtgacc tggggtcccc gctggggggg tataaaaggg 5940 ggcggttctt tgctcttcct cactgtcttc cggatcgctg tccaggaacg tcagctgttg 6000 gggtaggtat tccctctcga aggcgggcat gacctctgca ctcaggttgt cagtttctaa 6060 gaacgaggag gatttgatat tgacagtgcc ggttgagatg cctttcatga ggttttcgtc 6120 catttggtca gaaaacacaa tttttttatt gtcaagtttg gtggcaaatg atccatacag 6180 ggcgttggat aaaagtttgg caatggatcg catggtttgg ttcttttcct tgtccgcgcg 6240 ctctttggcg gcgatgttga gttggacata ctcgcgtgcc aggcacttcc attcggggaa 6300 gatagttgtt aattcatctg gcacgattct cacttgccac cctcgattat gcaaggtaat 6360 taaatccaca ctggtggcca cctcgcctcg aaggggttca ttggtccaac agagcctacc 6420 tcctttccta gaacagaaag ggggaagtgg gtctagcata agttcatcgg gagggtctgc 6480 atccatggta aagattcccg gaagtaaatc cttatcaaaa tagctgatgg gagtggggtc 6540 atctaaggcc atttgccatt ctcgagctgc cagtgcgcgc tcatatgggt taaggggact 6600 gccccagggc atgggatggg tgagagcaga ggcatacatg ccacagatgt catagacgta 6660 gatgggatcc tcaaagatgc ctatgtaggt tggatagcat cgcccccctc tgatacttgc 6720 tcgcacatag tcatatagtt catgtgatgg cgctagcagc cccggaccca agttggtgcg 6780 attgggtttt tctgttctgt agacgatctg gcgaaagatg gcgtgagaat tggaagagat 6840 ggtgggtctt tgaaaaatgt tgaaatgggc atgaggtaga cctacagagt ctctgacaaa 6900 gtgggcataa gattcttgaa gcttggttac cagttcggcg gtgacaagta cgtctagggc 6960 gcagtagtca agtgtttctt gaatgatgtc ataacctggt tggtttttct tttcccacag 7020 ttcgcggttg agaaggtatt cttcgcgatc cttccagtac tcttctagcg gaaacccgtc 7080 tttgtctgca cggtaagatc ctagcatgta gaactgatta actgccttgt aagggcagca 7140 gcccttctct acgggtagag agtatgcttg agcagctttt cgtagcgaag cgtgagtaag 7200 ggcaaaggtg tctctgacca tgactttgag aaattggtat ttgaagtcca tgtcgtcaca 7260 ggctccctgt tcccagagtt ggaagtctac ccgtttcttg taggcggggt tgggcaaagc 7320 gaaagtaaca tcattgaaga gaatcttacc ggctctgggc ataaaattgc gagtgatgcg 7380 gaaaggctgt ggtacttccg ctcgattgtt gatcacctgg gcagctagga cgatttcgtc 7440 gaaaccgttg atgttgtgtc ctacgatgta taattctatg aaacgcggcg tgcctctgac 7500 gtgaggtagc ttactgagct catcaaaggt taggtctgtg gggtcagata aggcgtagtg 7560 ttcgagagcc cattcgtgca ggtgaggatt tgcatgtagg aatgatgacc aaagatctac 7620 cgccagtgct gtttgtaact ggtcccgata ctgacgaaaa tgccggccaa ttgccatttt 7680 ttctggagtg acacagtaga aggttctggg gtcttgttgc catcgatccc acttgagttt 7740 aatggctaga tcgtgggcca tgttgacgag acgctcttct cctgagagtt tcatgaccag 7800 catgaaagga actagttgtt tgccaaagga tcccatccag gtgtaagttt ccacatcgta 7860 ggtcaggaag agtctttctg tgcgaggatg agagccgatc gggaagaact ggatttcctg 7920 ccaccagttg gaggattggc tgttgatgtg atggaagtag aagtttctgc ggcgcgccga 7980 gcattcgtgt ttgtgcttgt acagacggcc gcagtagtcg cagcgttgca cgggttgtat 8040 ctcgtgaatg agctgtacct ggcttccctt gacgagaaat ttcagtggga agccgaggcc 8100 tggcgattgt atctcgtgct cttctatatt cgctgtatcg gcctgttcat cttctgtttc 8160 gatggtggtc atgctgacga gcccccgcgg gaggcaagtc cagacctcgg cgcgggaggg 8220 gcggagctga aggacgagag cgcgcaggct ggagctgtcc agagtcctga gacgctgcgg 8280 actcaggtta gtaggtaggg acagaagatt aacttgcatg atcttttcca gggcgtgcgg 8340 gaggttcaga tggtacttga tttccacagg ttcgtttgta gagacgtcaa tggcttgcag 8400 ggttccgtgt cctttgggcg ccactaccgt acctttgttt tttcttttga tcggtggtgg 8460 ctctcttgct tcttgcatgc tcagaagcgg tgacggggac gcgcgccggg cggcagcggt 8520 tgttccggac ccgggggcat ggctggtagt ggcacgtcgg cgccgcgcac gggcaggttc 8580 tggtattgcg ctctgagaag acttgcgtgc gccaccacgc gtcgattgac gtcttgtatc 8640 tgacgtctct gggtgaaagc taccggcccc gtgagcttga acctgaaaga gagttcaaca 8700 gaatcaattt cggtatcgtt aacggcagct tgtctcagta tttcttgtac gtcaccagag 8760 ttgtcctggt aggcgatctc cgccatgaac tgctcgattt cttcctcctg aagatctccg 8820 cgacccgctc tttcgacggt ggccgcgagg tcattggaga tacggcccat gagttgggag 8880 aatgcattca tgcccgcctc gttccagacg cggctgtaaa ccacggcccc ctcggagtct 8940 cttgcgcgca tcaccacctg agcgaggtta agctccacgt gtctggttaa gaccgcatag 9000 ttgcataggc gctgaaaaag gtagttgagt gtggtggcaa tgtgttcggc gacgaagaaa 9060 tacatgatcc atcgtctcag cggcatttcg ctaacatcgc ccagagcttc caagcgctcc 9120 atggcctcgt agaagtccac ggcaaaatta aaaaactggg agtttcgcgc ggacacggtc 9180 aattcctcct cgagaagacg gatgagttcg gctatggtgg cccgtacttc gcgttcgaag 9240 gctcccggga tctcttcttc ctcttctatc tcttcttcca ctaacatctc ttcttcgtct 9300 tcaggcgggg gcggaggggg cacgcggcga cgtcgacggc gcacgggcaa acggtcgatg 9360 aatcgttcaa tgacctctcc gcggcggcgg cgcatggttt cagtgacggc gcggccgttc 9420 tcgcgcggtc gcagagtaaa aacaccgccg cgcatctcct taaagtggtg actgggaggt 9480 tctccgtttg ggagggagag ggcgctgatt atacatttta ttaattggcc cgtagggact 9540 gcgcgcagag atctgatcgt gtcaagatcc acgggatctg aaaacctttc gacgaaagcg 9600 tctaaccagt cacagtcaca aggtaggctg agtacggctt cttgtgggcg ggggtggtta 9660 tgtgttcggt ctgggtcttc tgtttcttct tcatctcggg aaggtgagac gatgctgctg 9720 gtgatgaaat taaagtaggc agttctaaga cggcggatgg tggcgaggag caccaggtct 9780 ttgggtccgg cttgctggat acgcaggcga ttggccattc cccaagcatt atcctgacat 9840 ctagcaagat ctttgtagta gtcttgcatg agccgttcta cgggcacttc ttcctcaccc 9900 gttctgccat gcatacgtgt gagtccaaat ccgcgcattg gttgtaccag tgccaagtca 9960 gctacgactc tttcggcgag gatggcttgc tgtacttggg taagggtggc ttgaaagtca 10020 tcaaaatcca caaagcggtg gtaagcccct gtattaatgg tgtaagcaca gttggccatg 10080 actgaccagt taactgtctg gtgaccaggg cgcacgagct cggtgtattt aaggcgcgaa 10140 taggcgcggg tgtcaaagat gtaatcgttg caggtgcgca ccagatactg gtaccctata 10200 agaaaatgcg gcggtggttg gcggtagaga ggccatcgtt ctgtagctgg agcgccaggg 10260 gcgaggtctt ccaacataag gcggtgatag ccgtagatgt acctggacat ccaggtgatt 10320 cctgcggcgg tagtagaagc ccgaggaaac tcgcgtacgc ggttccaaat gttgcgtagc 10380 ggcatgaagt agttcattgt aggcacggtt tgaccagtga ggcgcgcgca gtcattgatg 10440 ctctatagac acggagaaaa tgaaagcgtt cagcgactcg actccgtagc ctggaggaac 10500 gtgaacgggt tgggtcgcgg tgtaccccgg ttcgagactt gtactcgagc cggccggagc 10560 cgcggctaac gtggtattgg cactcccgtc tcgacccagc ctacaaaaat ccaggatacg 10620 gaatcgagtc gttttgctgg tttccgaatg gcagggaagt gagtcctatt tttttttttt 10680 tttgccgctc agaatgcatc ccgtgctgcg acagatgcgc ccccaacaac agcccccctc 10740 gcagcagcag cagcagcaac cacaaaaggc tgtccctgca actactgcaa ctgccgccgt 10800 gagcggtgcg ggacagcccg cctatgatct ggacttggaa gagggcgaag gactggcacg 10860 tctaggtgcg ccttcgcccg agcggcatcc gcgagttcaa ctgaaaaaag attctcgcga 10920 ggcgtatgtg ccccaacaga acctatttag agacagaagc ggcgaggagc cggaggagat 10980 gcgagcttcc cgctttaacg cgggtcgtga gctgcgtcac ggtttggacc gaagacgagt 11040 gttgcgagac gaggatttcg aagttgatga agtgacaggg atcagtcctg ccagggcaca 11100 cgtggctgca gccaaccttg tatcggctta cgagcagaca gtaaaggaag agcgtaactt 11160 ccaaaagtct tttaataatc atgtgcgaac cctgattgcc cgcgaagaag ttacccttgg 11220 tttgatgcat ttgtgggatt tgatggaagc tatcattcag aaccctacta gcaaacctct 11280 gaccgcccag ctgtttctgg tggtgcaaca cagcagagac aatgaggctt tcagagaggc 11340 gctgctgaac atcaccgaac ccgaggggag atggttgtat gatcttatca acattctaca 11400 gagtatcata gtgcaggagc ggagcctggg cctggccgag aaggtagctg ccatcaatta 11460 ctcggttttg agcttgggaa aatattacgc tcgcaaaatc tacaagactc catacgttcc 11520 catagacaag gaggtgaaga tagatgggtt ctacatgcgc atgacgctca aggtcttgac 11580 cctgagcgat gatcttgggg tgtatcgcaa tgacagaatg catcgcgcgg ttagcgccag 11640 caggaggcgc gagttaagcg acagggaact gatgcacagt ttgcaaagag ctctgactgg 11700 agctggaacc gagggtgaga attacttcga catgggagct gacttgcagt ggcagcctaa 11760 tcgcagggct ctgagcgccg cgacggcagg atgtgagctt ccttacatag aagaggcgga 11820 tgaaggcgag gaggaagagg gcgagtactt ggaagactga tggcacaacc cgtgtttttt 11880 gctagatgga acagcaagca ccggatcccg caatgcgggc ggcgctgcag agccagccgt 11940 ccggcattaa ctcctcggac gattggaccc aggccatgca acgtatcatg gcgttgacga 12000 ctcgcaaccc cgaagccttt agacagcaac cccaggccaa ccgtctatcg gccatcatgg 12060 aagctgtagt gccttcccga tctaatccca ctcatgagaa ggtcctggcc atcgtgaacg 12120 cgttggtgga gaacaaagct attcgtccag atgaggccgg actggtatac aacgctctct 12180 tagaacgcgt ggctcgctac aacagtagca atgtgcaaac caatttggac cgtatgataa 12240 cagatgtacg cgaagccgtg tctcagcgcg aaaggttcca gcgtgatgcc aacctgggtt 12300 cgctggtggc gttaaatgct ttcttgagta ctcagcctgc taatgtgccg cgtggtcaac 12360 aggattatac taacttttta agtgctttga gactgatggt atcagaagta cctcagagcg 12420 aagtgtatca gtccggtcct gattacttct ttcagactag cagacagggc ttgcagacgg 12480 taaatctgag ccaagctttt aaaaacctta aaggtttgtg gggagtgcat gccccggtag 12540 gagaaagagc aaccgtgtct agcttgttaa ctccgaactc ccgcctgtta ttactgttgg 12600 tagctccttt caccgacagc ggtagcatcg accgtaattc ctatttgggt tacctactaa 12660 acctgtatcg cgaagccata gggcaaagtc aggtggacga gcagacctat caagaaatta 12720 cccaagtcag tcgcgctttg ggacaggaag acactggcag tttggaagcc actctgaact 12780 tcttgcttac caatcggtct caaaagatcc ctcctcaata tgctcttact gcggaggagg 12840 agaggatcct tagatatgtg cagcagagcg tgggattgtt tctgatgcaa gagggggcaa 12900 ctccgactgc agcactggac atgacagcgc gaaatatgga gcccagcatg tatgccagta 12960 accgaccttt cattaacaaa ctgctggact acttgcacag agctgccgct atgaactctg 13020 attatttcac caatgccatc ttaaacccgc actggctgcc cccacctggt ttctacacgg 13080 gcgaatatga catgcccgac cctaatgacg gatttctgtg ggacgacgtg gacagcgatg 13140 ttttttcacc tctttctgat catcgcacgt ggaaaaagga aggcggtgat agaatgcatt 13200 cttctgcatc gctgtccggg gtcatgggtg ctaccgcggc tgagcccgag tctgcaagtc 13260 cttttcctag tctacccttt tctctacaca gtgtacgtag cagcgaagtg ggtagaataa 13320 gtcgcccgag tttaatgggc gaagaggagt acctaaacga ttccttgctc agaccggcaa 13380 gagaaaaaaa tttcccaaac aatggaatag aaagtttggt ggataaaatg agtagatgga 13440 agacttatgc tcaggatcac agagacgagc ctgggatcat ggggactaca agtagagcga 13500 gccgtagacg ccagcgccat gacagacaga ggggtcttgt gtgggacgat gaggattcgg 13560 ccgatgatag cagcgtgttg gacttgggtg ggagaggaag gggcaacccg tttgctcatt 13620 tgcgccctcg cttgggtggt atgttgtgaa aaaaaataaa aaagaaaaac tcaccaaggc 13680 catggcgacg agcgtacgtt cgttcttctt tattatctgt gtctagtata atgaggcgag 13740 tcgtgctagg cggagcggtg gtgtatccgg agggtcctcc tccttcgtac gagagcgtga 13800 tgcagcagca gcaggcgacg gcggtgatgc aatccccact ggaggctccc tttgtgcctc 13860 cgcgatacct ggcacctacg gagggcagaa acagcattcg ttactcggaa ctggcacctc 13920 agtacgatac caccaggttg tatctggtgg acaacaagtc ggcggacatt gcttctctga 13980 actatcagaa tgaccacagc aacttcttga ccacggtggt gcagaacaat gactttaccc 14040 ctacggaagc cagcacccag accattaact ttgatgaacg atcgcggtgg ggcggtcagc 14100 taaagaccat catgcatact aacatgccaa acgtgaacga gtatatgttt agtaacaagt 14160 tcaaagcgcg tgtgatggtg tccagaaaac ctcccgacgg tgctgcagtt ggggatactt 14220 atgatcacaa gcaggatatt ttggaatatg agtggttcga gtttactttg ccagaaggca 14280 acttttcagt tactatgact attgatttga tgaacaatgc catcatagat aattacttga 14340 aagtgggtag acagaatgga gtgcttgaaa gtgacattgg tgttaagttc gacaccagga 14400 acttcaagct gggatgggat cccgaaacca agttgatcat gcctggagtg tatacgtatg 14460 aagccttcca tcctgacatt gtcttactgc ctggctgcgg agtggatttt accgagagtc 14520 gtttgagcaa ccttcttggt atcagaaaaa aacagccatt tcaagagggt tttaagattt 14580 tgtatgaaga tttagaaggt ggtaatattc cggccctctt ggatgtagat gcctatgaga 14640 acagtaagaa agaacaaaaa gccaaaatag aagctgctac agctgctgca gaagctaagg 14700 caaacatagt tgccagcgac tctacaaggg ttgctaacgc tggagaggtc agaggagaca 14760 attttgcgcc aacacctgtt ccgactgcag aatcattatt ggccgatgtg tctgaaggaa 14820 cggacgtgaa actcactatt caacctgtag aaaaagatag taagaataga agctataatg 14880 tgttggaaga caaaatcaac acagcctatc gcagttggta tctttcgtac aattatggcg 14940 atcccgaaaa aggagtgcgt tcctggacat tgctcaccac ctcagatgtc acctgcggag 15000 cagagcaggt ttactggtcg cttccagaca tgatgaagga tcctgtcact ttccgctcca 15060 ctagacaagt cagtaactac cctgtggtgg gtgcagagct tatgcccgtc ttctcaaaga 15120 gcttctacaa cgaacaagct gtgtactccc agcagctccg ccagtccacc tcgcttacgc 15180 acgtcttcaa ccgctttcct gagaaccaga ttttaatccg tccgccggcg cccaccatta 15240 ccaccgtcag tgaaaacgtt cctgctctca cagatcacgg gaccctgccg ttgcgcagca 15300 gtatccgggg agtccaacgt gtgaccgtta ctgacgccag acgccgcacc tgtccctacg 15360 tgtacaaggc actgggcata gtcgcaccgc gcgtcctttc aagccgcact ttctaaaaaa 15420 aaaatgtcca ttcttatctc gcccagtaat aacaccggtt ggggtctgcg cgctccaagc 15480 aagatgtacg gaggcgcacg caaacgttct acccaacatc ccgtgcgtgt tcgcggacat 15540 tttcgcgctc catggggtgc cctcaagggc cgcactcgcg ttcgaaccac cgtcgatgat 15600 gtaatcgatc aggtggttgc cgacgcccgt aattatactc ctactgcgcc tacatctact 15660 gtggatgcag ttattgacag tgtagtggct gacgctcgca actatgctcg acgtaagagc 15720 cggcgaaggc gcattgccag acgccaccga gctaccactg ccatgcgagc cgcaagagct 15780 ctgctacgaa gagctagacg cgtggggcga agagccatgc ttagggcggc cagacgtgca 15840 gcttcgggcg ccagcgccgg caggtcccgc aggcaagcag ccgctgtcgc agcggcgact 15900 attgccgaca tggcccaatc gcgaagaggc aatgtatact gggtgcgtga cgctgccacc 15960 ggtcaacgtg tacccgtgcg cacccgtccc cctcgcactt agaagatact gagcagtctc 16020 cgatgttgtg tcccagcggc gaggatgtcc aagcgcaaat acaaggaaga aatgctgcag 16080 gttatcgcac ctgaagtcta cggccaaccg ttgaaggatg aaaaaaaacc ccgcaaaatc 16140 aagcgggtta aaaaggacaa aaaagaagag gaagatggcg atgatgggct ggcggagttt 16200 gtgcgcgagt ttgccccacg gcgacgcgtg caatggcgtg ggcgcaaagt tcgacatgtg 16260 ttgagacctg gaacttcggt ggtctttaca cccggcgagc gttcaagcgc tacttttaag 16320 cgttcctatg atgaggtgta cggggatgat gatattcttg agcaggcggc tgaccgatta 16380 ggcgagtttg cttatggcaa gcgtagtaga ataacttcca aggatgagac agtgtcaata 16440 cccttggatc atggaaatcc cacccctagt cttaaaccgg tcactttgca gcaagtgtta 16500 cccgtaactc cgcgaacagg tgttaaacgc gaaggtgaag atttgtatcc cactatgcaa 16560 ctgatggtac ccaaacgcca gaagttggag gacgttttgg agaaagtaaa agtggatcca 16620 gatattcaac ctgaggttaa agtgagaccc attaagcagg tagcgcctgg tctgggggta 16680 caaactgtag acattaagat tcccactgaa agtatggaag tgcaaactga acccgcaaag 16740 cctactgcca cctccactga agtgcaaacg gatccatgga tgcccatgcc tattacaact 16800 gacgccgccg gtcccactcg aagatcccga cgaaagtacg gtccagcaag tctgttgatg 16860 cccaattatg ttgtacaccc atctattatt cctactcctg gttaccgagg cactcgctac 16920 tatcgcagcc gaaacagtac ctcccgccgt cgccgcaaga cacctgcaaa tcgcagtcgt 16980 cgccgtagac gcacaagcaa accgactccc ggcgccctgg tgcggcaagt gtaccgcaat 17040 ggtagtgcgg aacctttgac actgccgcgt gcgcgttacc atccgagtat catcacttaa 17100 tcaatgttgc cgctgcctcc ttgcagatat ggccctcact tgtcgccttc gcgttcccat 17160 cactggttac cgaggaagaa actcgcgccg tagaagaggg atgttgggac gcggaatgcg 17220 acgctacagg cgacggcgtg ctatccgcaa gcaattgcgg ggtggttttt taccagcctt 17280 aattccaatt atcgctgctg caattggcgc gataccaggc atagcttccg tggcggttca 17340 ggcctcgcaa cgacattgac attggaaaaa aaacgtataa ataaaaaaaa atacaatgga 17400 ctctgacact cctggtcctg tgactatgtt ttcttagaga tggaagacat caatttttca 17460 tccttggctc cgcgacacgg cacgaagccg tacatgggca cctggagcga catcggcacg 17520 agccaactga acgggggcgc cttcaattgg agcagtatct ggagcgggct taaaaatttt 17580 ggctcaacca taaaaacata cgggaacaaa gcttggaaca gcagtacagg acaggcgctt 17640 agaaataaac ttaaagacca gaacttccaa caaaaagtag tcgatgggat agcttccggc 17700 atcaatggag tggtagattt ggctaaccag gctgtgcaga aaaagataaa cagtcgtttg 17760 gacccgccgc cagcaacccc aggtgaaatg caagtggagg aagaaattcc tccgccagaa 17820 aaacgaggcg acaagcgtcc gcgtcccgat ttggaagaga cgctggtgac gcgcgtagat 17880 gaaccgcctt cttatgagga agcaacgaag cttggaatgc ccaccactag accgatagcc 17940 ccaatggcca ccggggtgat gaaaccttct cagttgcatc gacccgtcac cttggatttg 18000 ccccctcccc ctgctgctac tgctgtaccc gcttctaagc ctgtcgctgc cccgaaacca 18060 gtcgccgtag ccaggtcacg tcccgggggc gctcctcgtc caaatgcgca ctggcaaaat 18120 actctgaaca gcatcgtggg tctaggcgtg caaagtgtaa aacgccgtcg ctgcttttaa 18180 ttaaatatgg agtagcgctt aacttgccta tctgtgtata tgtgtcatta cacgccgtca 18240 cagcagcaga ggaaaaaagg aagaggtcgt gcgtcgacgc tgagttactt tcaagatggc 18300 caccccatcg atgctgcccc aatgggcata catgcacatc gccggacagg atgcttcgga 18360 gtacctgagt ccgggtctgg tgcagttcgc ccgcgccaca gacacctact tcaatctggg 18420 aaataagttt agaaatccca ccgtagcgcc gacccacgat gtgaccaccg accgtagcca 18480 gcggctcatg ttgcgcttcg tgcccgttga ccgggaggac aatacatact cttacaaagt 18540 gcggtacacc ctggccgtgg gcgacaacag agtgctggat atggccagca cgttctttga 18600 cattaggggc gtgttggaca gaggtcccag tttcaaaccc tattctggta cggcttacaa 18660 ctctctggct cctaaaggcg ctccaaatgc atctcaatgg attgcaaaag gcgtaccaac 18720 tgcagcagcc gcaggcaatg gtgaagaaga acatgaaaca gaggagaaaa ctgctactta 18780 cacttttgcc aatgctcctg taaaagccga ggctcaaatt acaaaagagg gcttaccaat 18840 aggtttggag atttcagctg aaaacgaatc taaacccatc tatgcagata aactttatca 18900 gccagaacct caagtgggag atgaaacttg gactgaccta gacggaaaaa ccgaagagta 18960 tggaggcagg gctctaaagc ctactactaa catgaaaccc tgttacgggt cctatgcgaa 19020 gcctactaat ttaaaaggtg gtcaggcaaa accgaaaaac tcggaaccgt cgagtgaaaa 19080 aattgaatat gatattgaca tggaattttt tgataactca tcgcaaagaa caaacttcag 19140 tcctaaaatt gtcatgtatg cagaaaatgt aggtttggaa acgccagaca ctcatgtagt 19200 gtacaaacct ggaacagaag acacaagttc cgaagctaat ttgggacaac agtctatgcc 19260 caacagaccc aactacattg gcttcagaga taactttatt ggactcatgt actataacag 19320 tactggtaac atgggggtgc tggctggtca agcgtctcag ttaaatgcag tggttgactt 19380 gcaggacaga aacacagaac tttcttacca actcttgctt gactctctgg gcgacagaac 19440 cagatacttt agcatgtgga atcaggctgt ggacagttat gatcctgatg tacgtgttat 19500 tgaaaatcat ggtgtggaag atgaacttcc caactattgt tttccactgg acggcatagg 19560 tgttccaaca accagttaca aatcaatagt tccaaatgga gaagataata ataattggaa 19620 agaacctgaa gtaaatggaa caagtgagat cggacagggt aatttgtttg ccatggaaat 19680 taaccttcaa gccaatctat ggcgaagttt cctttattcc aatgtggctc tgtatctccc 19740 agactcgtac aaatacaccc cgtccaatgt cactcttcca gaaaacaaaa acacctacga 19800 ctacatgaac gggcgggtgg tgccgccatc tctagtagac acctatgtga acattggtgc 19860 caggtggtct ctggatgcca tggacaatgt caacccattc aaccaccacc gtaacgctgg 19920 cttgcgttac cgatctatgc ttctgggtaa cggacgttat gtgcctttcc acatacaagt 19980 gcctcaaaaa ttcttcgctg ttaaaaacct gctgcttctc ccaggctcct acacttatga 20040 gtggaacttt aggaaggatg tgaacatggt tctacagagt tccctcggta acgacctgcg 20100 ggtagatggc gccagcatca gtttcacgag catcaacctc tatgctactt ttttccccat 20160 ggctcacaac accgcttcca cccttgaagc catgctgcgg aatgacacca atgatcagtc 20220 attcaacgac tacctatctg cagctaacat gctctacccc attcctgcca atgcaaccaa 20280 tattcccatt tccattcctt ctcgcaactg ggcggctttc agaggctggt catttaccag 20340 actgaaaacc aaagaaactc cctctttggg gtctggattt gacccctact ttgtctattc 20400 tggttctatt ccctacctgg atggtacctt ctacctgaac cacactttta agaaggtttc 20460 catcatgttt gactcttcag tgagctggcc tggaaatgac aggttactat ctcctaacga 20520 atttgaaata aagcgcactg tggatggcga aggctacaac gtagcccaat gcaacatgac 20580 caaagactgg ttcttggtac agatgctcgc caactacaac atcggctatc agggcttcta 20640 cattccagaa ggatacaaag atcgcatgta ttcatttttc agaaacttcc agcccatgag 20700 caggcaggtg gttgatgagg tcaattacaa agacttcaag gccgtcgcca taccctacca 20760 acacaacaac tctggctttg tgggttacat ggctccgacc atgcgccaag gtcaacccta 20820 tcccgctaac tatccctatc cactcattgg aacaactgcc gtaaatagtg ttacgcagaa 20880 aaagttcttg tgtgacagaa ccatgtggcg cataccgttc tcgagcaact tcatgtctat 20940 gggggccctt acagacttgg gacagaatat gctctatgcc aactcagctc atgctctgga 21000 catgaccttt gaggtggatc ccatggatga gcccaccctg ctttatcttc tcttcgaagt 21060 tttcgacgtg gtcagagtgc atcagccaca ccgcggcatc atcgaggcag tctacctgcg 21120 tacaccgttc tcggccggta acgctaccac gtaagaagct tcttgcttct tgcaaatagc 21180 agctgcaacc atggcctgcg gatcccaaaa cggctccagc gagcaagagc tcagagccat 21240 tgtccaagac ctgggttgcg gaccctattt tttgggaacc tacgataagc gcttcccggg 21300 gttcatggcc cccgataagc tcgcctgtgc cattgtaaat acggccggac gtgagacggg 21360 gggagagcac tggttggctt tcggttggaa cccacgttct aacacctgct acctttttga 21420 tccttttgga ttctcggatg atcgtctcaa acagatttac cagtttgaat atgagggtct 21480 cctgcgccgc agcgctcttg ctaccaagga ccgctgtatt acgctggaaa aatctaccca 21540 gaccgtgcag ggcccccgtt ctgccgcctg cggacttttc tgctgcatgt tccttcacgc 21600 ctttgtgcac tggcctgacc gtcccatgga cggaaacccc accatgaaat tgctaactgg 21660 agtgccaaac aacatgcttc attctcctaa agtccagccc accctgtgtg acaatcaaaa 21720 agcactctac cattttctta atacccattc gccttatttt cgctctcatc gtacacacat 21780 cgaaagggcc actgcgttcg accgtatgga tgttcaataa tgactcatgt aaacaacgtg 21840 ttcaataaac atcactttat ttttttacat gtatcaaggc tctggattac ttatttattt 21900 acaagtcgaa tgggttctga cgagaatcag aatgacccgc aggcagtgat acgttgcgga 21960 actgatactt gggttgccac ttgaattcgg gaatcaccaa cttgggaacc ggtatatcgg 22020 gcaggatgtc actccacagc tttctggtca gctgcaaagc tccaagcagg tcaggagccg 22080 aaatcttgaa atcacaatta ggaccagtgc tctgagcgcg agagttgcgg tacaccggat 22140 tgcagcactg aaacaccatc agcgacggat gtctcacgct tgccagcacg gtgggatctg 22200 caatcatgcc cacatccaga tcttcagcat tggcaatgct gaacggggtc atcttgcagg 22260 tctgcctacc catggcgggc acccaattag gcttgtggtt gcaatcgcag tgcaggggga 22320 tcagtatcat cttggcctga tcctgtctga ttcctggata cacggctctc atgaaagcat 22380 catattgctt gaaagcctgc tgggctttac taccctcggg ataaaacatc ccgcaggacc 22440 tgctcgaaaa ctggttagcc tgcacagccg gcatcattca cacagcagcg ggcgtcattg 22500 ttggctattt gcaccacact tctgccccag cggttttggg tgattttggt tcgctcggga 22560 ttctccttta aggctcgttg tccgttctcg ctggccacat ccatctcgat aatctgctcc 22620 ttctgaatca taatattgcc atgcaggcac ttcagcttgc cctcataatc attgcagcca 22680 tgaggccaca acgcacagcc tgtacattcc caattatggt gggcgatctg agaaaaagaa 22740 tgtatcattc cctgcagaaa tcttcccatc atcgtgctca gtgtcttgtg actagtgaaa 22800 gttaactgga tgcctcggtg ctcttcgttt acgtactggt gacagatgcg cttgtattgt 22860 tcgtgttgct caggcattag tttaaaacag gttctaagtt cgttatccag cctgtacttc 22920 tccatcagca gacacatcac ttccatgcct ttctcccaag cagacaccag gggcaagcta 22980 atcggattct taacagtgca ggcagcagct cctttagcca gagggtcatc tttagcgatc 23040 ttctcaatgc ttcttttgcc atccttctca acgatgcgca cgggcgggta gctgaaaccc 23100 actgctacaa gttgcgcctc ttctctttct tcttcgctgt cttgactgat gtcttgcatg 23160 gggatatgtt tggtcttcct tggcttcttt ttggggggta tcggaggagg aggactgtcg 23220 ctccgttccg gagacaggga ggattgtgac gtttcgctca ccattaccaa ctgactgtcg 23280 gtagaagaac ctgaccccac acggcgacag gtgtttttct tcgggggcag aggtggaggc 23340 gattgcgaag ggctgcggtc cgacctggaa ggcggatgac tggcagaacc ccttccgcgt 23400 tcgggggtgt gctccctgtg gcggtcgctt aactgatttc cttcgcggct ggccattgtg 23460 ttctcctagg cagagaaaca acagacatgg aaactcagcc attgctgtca acatcgccac 23520 gagtgccatc acatctcgtc ctcagcgacg aggaaaagga gcagagctta agcattccac 23580 cgcccagtcc tgccaccacc tctaccctag aagataagga ggtcgacgca tctcatgaca 23640 tgcagaataa aaaagcgaaa gagtctgaga cagacatcga gcaagacccg ggctatgtga 23700 caccggtgga acacgaggaa gagttgaaac gctttctaga gagagaggat gaaaactgcc 23760 caaaacagcg agcagataac tatcaccaag atgctggaaa tagggatcag aacaccgact 23820 acctcatagg gcttgacggg gaagacgcgc tccttaaaca tctagcaaga cagtcgctca 23880 tagtcaagga tgcattattg gacagaactg aagtgcccat cagtgtggaa gagctcagct 23940 gcgcctacga gcttaacctt ttttcacctc gtactccccc caaacgtcag ccaaacggca 24000 cctgcgagcc aaatcctcgc ttaaactttt atccagcttt tgctgtgcca gaagtactgg 24060 ctacctatca catctttttt aaaaatcaaa aaattccagt ctcctgccgc gctaatcgca 24120 cccgcgccga tgccctactc aatctgggac ctggttcacg cttacctgat atagcttcct 24180 tggaagaggt tccaaagatc ttcgagggtc tgggcaataa tgagactcgg gccgcaaatg 24240 ctctgcaaaa gggagaaaat ggcatggatg agcatcacag cgttctggtg gaattggaag 24300 gcgataatgc cagactcgca gtactcaagc gaagcgtcga ggtcacacac ttcgcatatc 24360 ccgctgtcaa cctgccccct aaagtcatga cggcggtcat ggaccagtta ctcattaagc 24420 gcgcaagtcc cctttcagaa gacatgcatg acccagatgc ctgtgatgag ggtaaaccag 24480 tggtcagtga tgagcagcta acccgatggc tgggcaccga ctctccccgg gatttggaag 24540 agcgtcgcaa gcttatgatg gccgtggtgc tggttaccgt agaactagag tgtctccgac 24600 gtttctttac cgattcagaa accttgcgca aactcgaaga gaatctgcac tacactttta 24660 gacacggctt tgtgcggcag gcatgcaaga tatctaacgt ggaactcacc aacctggttt 24720 cctacatggg tattctgcat gagaatcgcc taggacaaag cgtgctgcac agcaccctta 24780 agggggaagc ccgccgtgat tacatccgcg attgtgtcta tctctacctg tgccacacgt 24840 ggcaaaccgg catgggtgta tggcagcaat gtttagaaga acagaacttg aaagagcttg 24900 acaagctctt acagaaatct cttaaggttc tgtggacagg gttcgacgag cgcaccgtcg 24960 cttccgacct ggcagacctc atcttcccag agcgtctcag ggttactttg cgaaacggat 25020 tgcctgactt tatgagccag agcatgctta acaattttcg ctctttcatc ctggaacgct 25080 ccggtatcct gcccgccacc tgctgcgcac tgccctccga ctttgtgcct ctcacctacc 25140 gcgagtgccc cccgccgcta tggagtcact gctacctgtt ccgtctggcc aactatctct 25200 cctaccactc ggatgtgatc gaggatgtga gcggagacgg cttgctggag tgccactgcc 25260 gctgcaatct gtgcacgccc caccggtccc tagcttgcaa cccccagttg atgagcgaaa 25320 cccagataat aggcaccttt gaattgcaag gccccagcag ccaaggcgat gggtcttctc 25380 ctgggcaaag tttaaaactg accccgggac tgtggacctc cgcctacttg cgcaagtttg 25440 ctccggaaga ttaccacccc tatgaaatca agttctatga ggaccaatca cagcctccaa 25500 aggccgaact ttcggcttgc gtcatcaccc agggggcaat tctggcccaa ttgcaagcca 25560 tccaaaaatc ccgccaagaa tttctactga aaaagggtaa gggggtctac cttgaccccc 25620 agaccggcga ggaactcaac acaaggttcc ctcaggatgt cccaacgacg agaaaacaag 25680 aagttgaagg tgcagccgcc gcccccagaa gatatggagg aagattggga cagtcaggca 25740 gaggaggcgg aggaggacag tctggaggac agtctggagg aagacagttt ggaggaggaa 25800 aacgaggagg cagaggaggt ggaagaagta accgccgaca aacagttatc ctcggctgcg 25860 gagacaagca acagcgctac catctccgct ccgagtcgag gaacccggcg gcgtcccagc 25920 agtagatggg acgagaccgg acgcttcccg aacccaacca gcgcttccaa gaccggtaag 25980 aaggatcggc agggatacaa gtcctggcgg gggcataaga atgccatcat ctcctgcttg 26040 catgagtgcg ggggcaacat atccttcacg cggcgctact tgctattcca ccatggggtg 26100 aactttccgc gcaatgtttt gcattactac cgtcacctcc acagccccta ctatagccag 26160 caaatcccga cagtctcgac agataaagac agcggcggcg acctccaaca gaaaaccagc 26220 agcggcagtt agaaaataca caacaagtgc agcaacagga ggattaaaga ttacagccaa 26280 cgagccagcg caaacccgag agttaagaaa tcggatcttt ccaaccctgt atgccatctt 26340 ccagcagagt cggggtcaag agcaggaact gaaaataaaa aaccgatctc tgcgttcgct 26400 caccagaagt tgtttgtatc acaagagcga agatcaactt cagcgcactc tcgaggacgc 26460 cgaggctctc ttcaacaagt actgcgcgct gactcttaaa gagtaggcag cgaccgcgct 26520 tattcaaaaa aggcgggaat tacatcatcc tcgacatgag taaagaaatt cccacgcctt 26580 acatgtggag ttatcaaccc caaatgggat tggcagcagg cgcctcccag gactactcca 26640 cccgcatgaa ttggctcagc gccgggcctt ctatgatttc tcgagttaat gatatacgcg 26700 cctaccgaaa ccaaatactt ttggaacagt cagctcttac caccacgccc cgccaacacc 26760 ttaatcccag aaattggccc gccgccctag tgtaccagga aagtcccgct cccaccactg 26820 tattacttcc tcgagacgcc caggccgaag tccaaatgac taatgcaggt gcgcagttag 26880 ctggcggctc caccctatgt cgtcacaggc ctcggcataa tataaaacgc ctgatgatca 26940 gaggccgagg tatccagctc aacgacgagt cggtgagctc tccgcttggt ctacgaccag 27000 acggaatctt tcagattgcc ggctgcggga gatcttcctt cacccctcgt caggctgttc 27060 tgactttgga aagttcgtct tcgcaacccc gctcgggcgg aatcgggacc gttcaatttg 27120 tagaggagtt tactccctct gtctacttca accccttctc cggatctcct gggcactacc 27180 cggacgagtt cataccgaac ttcgacgcga ttagcgagtc agtggacggc tacgattgat 27240 gtctggtgac gcggctgagc tatctcggct gcgacatcta gaccactgcc gccgctttcg 27300 ctgctttgcc cgggaactta ttgagttcat ctacttcgaa ctccccaagg atcaccctca 27360 aggtccggcc cacggagtgc ggattactat cgaaggcaaa atagactctc gcctgcaacg 27420 aattttctcc cagcggcccg tgctgatcga gcgagaccag ggaaacacca cggttagtaa 27480 tcaattacgg ggtcattagt tcatagccca tatatggagt tgcgatcgct gcgggccatg 27540 tcatacaccg ccttcagagc agccggacct atctgcccgt tcgtgccgtc gttgttaatc 27600 accacatggt tattctgctc aaacgtcccg gacgcctgcg accggctgtc tgccatgctg 27660 cccggtgtac cgacataacc gccggtggca tagccgcgca tcagccggta aagattcccc 27720 acgccaatcc ggctggttgc ctccttcgtg aagacaaact caccacggtg aacaatcccc 27780 gctggctcat atttgccgcc ggttcccgta aatcctccgg ttgcaaaatg gaatttcgcc 27840 gcagcggcct gaatggctgt accgcctgac gcggatgcgc cgccaccaac agccccgcca 27900 atggcgctgc cgatactccc gacaatcccc accattgcct gcttaagcag aatttctgtc 27960 atcatggaca gcacggaacg ggtgaagctg cgccagttct gctcactgcc ggtcagcatc 28020 gccgccatat tctgtgcaat accatcaaag gtctgcgtgg ctgcactttt tacctgcgac 28080 atactgtccg tggcgctctc ttcccactca ctccagccgg acttcaggcc tgccatccag 28140 ttcccgcgaa gctggtcttc agccgcccag gtctttttct gctctgacat gacgttattc 28200 agcgccagcg gattatcgcc atactgttcc ttcaggcgct gttccgtggc ttcccgttct 28260 gcctgccggt cagtcagccc ccggcttttc gcatcaatgg cggcccgttt tgcccgttgc 28320 tgctgtgcga atttatccgc ctgctgcgcc agcgcgttca ggcgctcctg atacgtaacc 28380 ttgtcgccaa gtgcagccag ctggcgtttg tactccagcg tctcatcttt atgcgccagc 28440 agggatttct cctgtgcaga cagctggcga cgttgcgccg cctcctccag taccgcgaac 28500 tgactctccg ccttccacaa atcccggcgc tgctggctga ttttctcatt tgctccggca 28560 tgcttctcca gcgtccggag ttctgcctga agcgtcagca gggcagcatg agcactgtct 28620 tcctgacgat cgcccgcaga caccttcacg ctggactgtt tcggcttttt cagcgtcgct 28680 tcataatcct ttttcgccgc cgccatcagc gtgttgtaat ccgcctgcag gattttcccg 28740 tctttcagtg ccttgttcag ttcttcctga cgggcggtat atttctccag cggcgtctgc 28800 agccgttcgt aagccttctg cgcctcttcg gtatatttca gccgtgacgc ttcggtatcg 28860 ctctgctgct gcgcattttt gtcctgttga gtctgctgct cagccttctt tcgggcggct 28920 tcaagcgcaa gacgggcctt ttcacgatca tcccagtaac gcgcccgcgc ttcatcgtta 28980 acaaaataat catccttgcg cagattccag atgtcgtctg ctttcttata cgcagcctct 29040 gccttaatca gcatctcctg cgcggtatca ggacgaccaa tatccagcac cgcatcccac 29100 atggatttga atgcccgcgc agtcctgtct gcccaggtct ccagcgtgcc catgttctct 29160 ttcaggcggc gggtctggtc atcaaaccct ttcgttgcgg cctcgttcgc cgcctgcaat 29220 gccccggctt catcgccgga acgctgcaac tgagcaacat acgcaatctg ctccgccgac 29280 acgttatgga actggcgagc catcgccgtc agccccgacg tcgggtctgt ggtcagcttc 29340 ccgaaggctt cagcgacctt gtccacctcc acgccggatg cagaggagaa acgcgccaca 29400 ctctggctga tggacgcaat ctgagcctca ccgcttaccc ccgccttaac cagtgcgctg 29460 agtgactcgc tggtctggtt aaacgtcagc cctgccgcct gcccggctct ggacaggacc 29520 agcatacgat ctgccgtcag tcccgcctga ttgccggaaa ggaccagcgt tttgttgaaa 29580 tcggacaggg ttgagttgcc ctgataccag gcatacgcca gcgcaccggt cgccaccgcc 29640 agcgaggtgg cccccaccat cggcagggtg atcgcaccgg caagccccct gaacatgggg 29700 atcatcccgc cgaaggagtc cttcacctgc cccccctgtt gcagcaggat cagccacgga 29760 ctttgcccgc ctgcaagctg cgtggccacg tcggtgaact gtgcaggcag catacgcatg 29820 gcggctttat actgcccgac ggaaatcccc gctttctgtg cagccagcgc ctgtcggctc 29880 agcgactgtt caacgactgc cgctgttttt ttcgcatcac tttccgtacc agaaaaatga 29940 cgcctgactc tggccatctg ctcgtcaaat ctggccgcat ccagactcaa atcaacgacg 30000 tcgactaagc tctagcattt gtgaaccatc accctaatca agttttttgg ggtcgaggtg 30060 ccgtaaagca ctaaatcgga accctaaagg gagcccccga tttagagctt gacggggaaa 30120 gccggcgaac gtggcgagaa aggaagggaa gaaagcgaaa ggagcgggcg ctagggcgct 30180 ggcaagtgta gcggtcacgc tgcgcgtaac caccacaccc gccgcgctta atgcgccgct 30240 acagggcgcg tggggatacc ccctagagcc ccagctggtt ctttccgcct cagaagccat 30300 agagcccacc gcatccccag catgcctgct attgtcttcc caatcctccc ccttgctgtc 30360 ctgccccacc ccacccccca gaatagaatg acacctactc agacaatgcg atgcaatttc 30420 ctcattttat taggaaagga cagtgggagt ggcaccttcc agggtcaagg aaggcacggg 30480 ggaggggcaa acaacagatg gctggcaact agaaggcaca gtcgaggctg atcagcgggt 30540 ttgctagctt aggcgaaggc gatgggggtc ttgaaggcgt gctggtactc cacgatgccc 30600 agctcggtgt tgctgtgcag ctcctccacg cggcggaagg cgaacatggg gcccccgttc 30660 tgcaggatgc tggggtggat ggcgctcttg aagtgcatgt ggctgtccac cacgaagctg 30720 tagtagccgc cgtcgcgcag gctgaaggtg cgggcgaagc tgcccaccag cacgttatcg 30780 cccatggggt gcaggtgctc cacggtggcg ttgctgcgga tgatcttgtc ggtgaagatc 30840 acgctgtcct cggggaagcc ggtgcccacc accttgaagt cgccgatcac gcggccggcc 30900 tcgtagcggt agctgaagct cacgtgcagc acgccgccgt cctcgtactt ctcgatgcgg 30960 gtgttggtgt agccgccgtt gttgatggcg tgcaggaagg ggttctcgta gccgctgggg 31020 taggtgccga agtggtagaa gccgtagccc atcacgtggc tcagcaggta ggggctgaag 31080 gtcagggcgc ctttggtgct cttcatcttg ttggtcatgc ggccctgctc gggggtgccc 31140 tctccgccgc ccaccagctc gaactccacg ccgttcaggg tgccggtgat gcggcactcg 31200 atcttcatgg cgggcatggt ggctagccta gccagcttgg gtctccctat agtgagtcgt 31260 attaatttcg ataagccagt aagcagtggg ttctctagtt agccagagag ctctgcttat 31320 atagacctcc caccgtacac gcctaccgcc catttgcgtc aatggggcgg agttgttacg 31380 acattttgga aagtcccgtt gattttggtg ccaaaacaaa ctcccattga cgtcaatggg 31440 gtggagactt ggaaatcccc gtgagtcaaa ccgctatcca cgcccattga tgtactgcca 31500 aaaccgcatc accatggtaa tagcgatgac taatacgtag atgtactgcc aagtaggaaa 31560 gtcccataag gtcatgtact gggcataatg ccaggcgggc catttaccgt cattgacgtc 31620 aatagggggc gtacttggca tatgatacac ttgatgtact gccaagtggg cagtttaccg 31680 taaatactcc acccattgac gtcaatggaa agtccctatt ggcgttacta tgggaacata 31740 cgtcattatt gacgtcaatg ggcgggggtc gttgggcggt cagccaggcg ggccatttac 31800 cgtaagttat gtaacgcgga actccatata tgggctatga actaatgacc ccgtaattga 31860 ttactattaa taactacaat aatcaatgtc aacgcgtata tctggcccgt acatcgcgaa 31920 gcagcgcaaa acgcctaacc ctaagcagat tcttcatgca attaagcttc gcggtgcttc 31980 ttcagtacgc tacggcaaat gtcatcgacg tttttatccg gaaactgctg tctggctttt 32040 tttgatttca gaattagcct gacgggcaat gctgcgaagg gcgttttcct gctgaggtgt 32100 cattgaacaa gtcccatgtc ggcaagcata agcacacaga atatgaagcc cgctgccaga 32160 aaaatgcatt ccgtggttgt catacctggt ttctctcatc tgcttctgct ttcgccacca 32220 tcatttccag cttttgtgaa agggatgcgg ctaacgtatg aaattcttcg tctgtttcta 32280 ctggtattgg cacaaacctg attccaattt gagcaaggct atgtgccatc tcgatactcg 32340 ttcttaactc aacagaagat gctttgtgca tacagcccct cgtttattat ttatctcctc 32400 agccagccgc tgtgctttca gtggatttcg gataacagaa aggccgggaa atacccagcc 32460 tcgctttgta acggagtaga cgaaagtgat tgcgcctacc cggatattat cgtgaggatg 32520 cgtcatcgcc attgctcccc aaatacaaaa ccaatttcag ccagtgcctc gtccattttt 32580 tcgatgaact ccggcacgat ctcgtcaaaa ctcgccatgt acttttcatc ccgctcaatc 32640 acgacataat gcaggccttc acgcttcata cgcgggtcat agttggcaaa gtaccaggca 32700 ttttttcgcg tcacccacat gctgtactgc acctgggcca tgtaagctga ctttatggc 32759 <210> 53 <211> 32767 <212> DNA <213> Artificial Sequence <220> <223> pAd35GFP-5E4-CCDb <400> 53 catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60 aaaagtgtgg gccgtgtggt gattggctgt ggggttaacg gttaaaaggg gcggcgcggc 120 cgtgggaaaa tgacgtttta tgggggtgga gtttttttgc aagttgtcgc gggaaatgtt 180 acgcataaaa aggcttcttt tctcacggaa ctacttagtt ttcccacggt atttaacagg 240 aaatgaggta gttttgaccg gatgcaagtg aaaattgctg attttcgcgc gaaaactgaa 300 tgaggaagtg tttttctgaa taatgtggta tttatggcag ggtggagtat ttgttcaggg 360 ccaggtagac tttgacccat tacgtggagg tttcgattac cgtgtttttt acctgaattt 420 ccgcgtaccg tgtcaaagtc ttctgttttt acgtaggtgt cagctgatcg ctagggtatt 480 tgttcaaaaa aaagcccgct cattaggcgg gctgggttat attccccaga acatcaggtt 540 aatggcgttt ttgatgtcat tttcgcggtg gctgagatca gccacttctt ccccgataac 600 ggagaccggc acactggcca tatcggtggt catcatgcgc cagctttcat ccccgatatg 660 caccaccggg taaagttcac gggagacttt atctgacagc agacgtgcac tggccagggg 720 gatcaccatc cgtcgcccgg gcgtgtcaat aatatcactc tgtacatcca caaacagacg 780 ataacggctc tctcttttat aggtgtaaac cttaaactgc ataatctgac ctcctggtta 840 tgtgtgggag ggctaaccat ggatccatgg ttaccaatgc ttaatcagtg aggcacctat 900 ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg tgtagataac 960 tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc gagacccacg 1020 ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg agcgcagaag 1080 tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg aagctagagt 1140 aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctgcag gcatcgtggt 1200 gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat caaggcgagt 1260 tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc cgatcgttgt 1320 cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc ataattctct 1380 tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa ccaagtcatt 1440 ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaacac gggataatac 1500 cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt cggggcgaaa 1560 actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc gtgcacccaa 1620 ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa caggaaggca 1680 aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca tactcttcct 1740 ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat acatatttga 1800 atgtatttag aaaaataaac aaagctacct taagagagtg tcaggaatgt ttatgcctta 1860 ccagtgtaac atgaatcatg tgaaagtgtt gttggaacca gatgcctttt ccagaatgag 1920 cctaacagga atctttgaca tgaacacgca aatctggaag atcctgaggt atgatgatac 1980 gagatcgagg gtgcgcgcat gcgaatgcgg aggcaagcat gccaggttcc agccggtgtg 2040 tgtagatgtg accgaagatc tcagaccgga tcatttggtt attgcccgca ctggagcaga 2100 gttcggatcc agtggagaag aaactgacta aggtgagtat tgggaaaact ttggggtggg 2160 attttcagat ggacagattg agtaaaaatt tgttttttct gtcttgcagc tgacatgagt 2220 ggaaatgctt cttttaaggg gggagtcttc agcccttatc tgacagggcg tctcccatcc 2280 tgggcaggag ttcgtcagaa tgttatggga tctactgtgg atggaagacc cgttcaaccc 2340 gccaattctt caacgctgac ctatgctact ttaagttctt cacctttgga cgcagctgca 2400 gccgctgccg ccgcctctgt cgccgctaac actgtgcttg gaatgggtta ctatggaagc 2460 atcgtggcta attccacttc ctctaataac ccttctacac tgactcagga caagttactt 2520 gtccttttgg cccagctgga ggctttgacc caacgtctgg gtgaactttc tcagcaggtg 2580 gccgagttgc gagtacaaac tgagtctgct gtcggcacgg caaagtctaa ataaaaaaaa 2640 ttccagaatc aatgaataaa taaacgagct tgttgttgat ttaaaatcaa gtgtttttat 2700 ttcatttttc gcgcacggta tgccctggac caccgatctc gatcattgag aactcggtgg 2760 attttttcca gaatcctata gaggtgggat tgaatgttta gatacatggg cattaggccg 2820 tctttggggt ggagatagct ccattgaagg gattcatgct ccggggtagt gttgtaaatc 2880 acccagtcat aacaaggtcg cagtgcatgg tgttgcacaa tatcttttag aagtaggctg 2940 attgccacag ataagccctt ggtgtaggtg tttacaaacc ggttgagctg ggaggggtgc 3000 attcgaggtg aaattatgtg cattttggat tggattttta agttggcaat attgccgcca 3060 agatcccgtc ttgggttcat gttatgaagg actaccaaga cggtgtatcc ggtacattta 3120 ggaaatttat cgtgcagctt ggatggaaaa gcgtggaaaa atttggagac acccttgtgt 3180 cctccgagat tttccatgca ctcatccatg ataatagcaa tggggccgtg ggcagcggcg 3240 cgggcaaaca cgttccgtgg gtctgacaca tcatagttat gttcctgagt taaatcatca 3300 taagccattt taatgaattt ggggcggagc gtaccagatt ggggtatgaa tgttccttcg 3360 ggccccggag catagttccc ctcacagatt tgcatttccc aagctttcag ttctgagggt 3420 ggaatcatgt ccacctgggg ggctatgaag aacaccgttt cgggggcggg ggtgattagt 3480 tgggatgata gcaagtttct gagcaattga gatttgccac atccggtggg gccataaata 3540 attccgatta caggttgcag gtggtagttt agggaacggc aactgccgtc ttctcgaagc 3600 aagggggcca cctcgttcat catttccctt acatgcatat tttcccgcac caaatccatt 3660 aggaggcgct ctcctcctag tgatagaagt tcttgtagtg aggaaaagtt tttcagcggt 3720 tttagaccgt cagccatggg cattttggaa agagtttgct gcaaaagttc tagtctgttc 3780 cacagttcag tgatgtgttc tatggcatct cgatccagca gacctcctcg tttcgcgggt 3840 ttggacggct cctggagtag ggtatgagac gatgggcgtc cagcgctgcc agggttcggt 3900 ccttccaggg tctcagtgtt cgagtcaggg ttgtttccgt cacagtgaag gggtgtgcgc 3960 ctgcttgggc gcttgccagg gtgcgcttca gactcattct gctggtggag aacttctgtc 4020 gcttggcgcc ctgtatgtcg gccaagtagc agtttaccat gagttcgtag ttgagcgcct 4080 cggctgcgtg gcctttggcg cggagcttac ctttggaagt tttcttgcat accgggcagt 4140 ataggcattt cagcgcatac agcttgggcg caaggaaaat ggattctggg gagtatgcat 4200 ccgcgccgca ggaggcgcaa acagtttcac attccaccag ccaggttaaa tccggttcat 4260 tggggtcaaa aacaagtttt ccgccatatt ttttgatgcg tttcttacct ttggtctcca 4320 taagttcgtg tcctcgttga gtgacaaaca ggctgtccgt atctccgtag actgatttta 4380 caggcctctt ctccagtgga gtgcctcggt cttcttcgta caggaactct gaccactctg 4440 atacaaaggc gcgcgtccag gccagcacaa aggaggctat gtgggagggg tagcgatcgt 4500 tgtcaaccag ggggtccacc ttttccaaag tatgcaaaca catgtcaccc tcttcaacat 4560 ccaggaatgt gattggcttg taggtgtatt tcacgtgacc tggggtcccc gctggggggg 4620 tataaaaggg ggcggttctt tgctcttcct cactgtcttc cggatcgctg tccaggaacg 4680 tcagctgttg gggtaggtat tccctctcga aggcgggcat gacctctgca ctcaggttgt 4740 cagtttctaa gaacgaggag gatttgatat tgacagtgcc ggttgagatg cctttcatga 4800 ggttttcgtc catttggtca gaaaacacaa tttttttatt gtcaagtttg gtggcaaatg 4860 atccatacag ggcgttggat aaaagtttgg caatggatcg catggtttgg ttcttttcct 4920 tgtccgcgcg ctctttggcg gcgatgttga gttggacata ctcgcgtgcc aggcacttcc 4980 attcggggaa gatagttgtt aattcatctg gcacgattct cacttgccac cctcgattat 5040 gcaaggtaat taaatccaca ctggtggcca cctcgcctcg aaggggttca ttggtccaac 5100 agagcctacc tcctttccta gaacagaaag ggggaagtgg gtctagcata agttcatcgg 5160 gagggtctgc atccatggta aagattcccg gaagtaaatc cttatcaaaa tagctgatgg 5220 gagtggggtc atctaaggcc atttgccatt ctcgagctgc cagtgcgcgc tcatatgggt 5280 taaggggact gccccagggc atgggatggg tgagagcaga ggcatacatg ccacagatgt 5340 catagacgta gatgggatcc tcaaagatgc ctatgtaggt tggatagcat cgcccccctc 5400 tgatacttgc tcgcacatag tcatatagtt catgtgatgg cgctagcagc cccggaccca 5460 agttggtgcg attgggtttt tctgttctgt agacgatctg gcgaaagatg gcgtgagaat 5520 tggaagagat ggtgggtctt tgaaaaatgt tgaaatgggc atgaggtaga cctacagagt 5580 ctctgacaaa gtgggcataa gattcttgaa gcttggttac cagttcggcg gtgacaagta 5640 cgtctagggc gcagtagtca agtgtttctt gaatgatgtc ataacctggt tggtttttct 5700 tttcccacag ttcgcggttg agaaggtatt cttcgcgatc cttccagtac tcttctagcg 5760 gaaacccgtc tttgtctgca cggtaagatc ctagcatgta gaactgatta actgccttgt 5820 aagggcagca gcccttctct acgggtagag agtatgcttg agcagctttt cgtagcgaag 5880 cgtgagtaag ggcaaaggtg tctctgacca tgactttgag aaattggtat ttgaagtcca 5940 tgtcgtcaca ggctccctgt tcccagagtt ggaagtctac ccgtttcttg taggcggggt 6000 tgggcaaagc gaaagtaaca tcattgaaga gaatcttacc ggctctgggc ataaaattgc 6060 gagtgatgcg gaaaggctgt ggtacttccg ctcgattgtt gatcacctgg gcagctagga 6120 cgatttcgtc gaaaccgttg atgttgtgtc ctacgatgta taattctatg aaacgcggcg 6180 tgcctctgac gtgaggtagc ttactgagct catcaaaggt taggtctgtg gggtcagata 6240 aggcgtagtg ttcgagagcc cattcgtgca ggtgaggatt tgcatgtagg aatgatgacc 6300 aaagatctac cgccagtgct gtttgtaact ggtcccgata ctgacgaaaa tgccggccaa 6360 ttgccatttt ttctggagtg acacagtaga aggttctggg gtcttgttgc catcgatccc 6420 acttgagttt aatggctaga tcgtgggcca tgttgacgag acgctcttct cctgagagtt 6480 tcatgaccag catgaaagga actagttgtt tgccaaagga tcccatccag gtgtaagttt 6540 ccacatcgta ggtcaggaag agtctttctg tgcgaggatg agagccgatc gggaagaact 6600 ggatttcctg ccaccagttg gaggattggc tgttgatgtg atggaagtag aagtttctgc 6660 ggcgcgccga gcattcgtgt ttgtgcttgt acagacggcc gcagtagtcg cagcgttgca 6720 cgggttgtat ctcgtgaatg agctgtacct ggcttccctt gacgagaaat ttcagtggga 6780 agccgaggcc tggcgattgt atctcgtgct cttctatatt cgctgtatcg gcctgttcat 6840 cttctgtttc gatggtggtc atgctgacga gcccccgcgg gaggcaagtc cagacctcgg 6900 cgcgggaggg gcggagctga aggacgagag cgcgcaggct ggagctgtcc agagtcctga 6960 gacgctgcgg actcaggtta gtaggtaggg acagaagatt aacttgcatg atcttttcca 7020 gggcgtgcgg gaggttcaga tggtacttga tttccacagg ttcgtttgta gagacgtcaa 7080 tggcttgcag ggttccgtgt cctttgggcg ccactaccgt acctttgttt tttcttttga 7140 tcggtggtgg ctctcttgct tcttgcatgc tcagaagcgg tgacggggac gcgcgccggg 7200 cggcagcggt tgttccggac ccgggggcat ggctggtagt ggcacgtcgg cgccgcgcac 7260 gggcaggttc tggtattgcg ctctgagaag acttgcgtgc gccaccacgc gtcgattgac 7320 gtcttgtatc tgacgtctct gggtgaaagc taccggcccc gtgagcttga acctgaaaga 7380 gagttcaaca gaatcaattt cggtatcgtt aacggcagct tgtctcagta tttcttgtac 7440 gtcaccagag ttgtcctggt aggcgatctc cgccatgaac tgctcgattt cttcctcctg 7500 aagatctccg cgacccgctc tttcgacggt ggccgcgagg tcattggaga tacggcccat 7560 gagttgggag aatgcattca tgcccgcctc gttccagacg cggctgtaaa ccacggcccc 7620 ctcggagtct cttgcgcgca tcaccacctg agcgaggtta agctccacgt gtctggtgaa 7680 gaccgcatag ttgcataggc gctgaaaaag gtagttgagt gtggtggcaa tgtgttcggc 7740 gacgaagaaa tacatgatcc atcgtctcag cggcatttcg ctaacatcgc ccagagcttc 7800 caagcgctcc atggcctcgt agaagtccac ggcaaaatta aaaaactggg agtttcgcgc 7860 ggacacggtc aattcctcct cgagaagacg gatgagttcg gctatggtgg cccgtacttc 7920 gcgttcgaag gctcccggga tctcttcttc ctcttctatc tcttcttcca ctaacatctc 7980 ttcttcgtct tcaggcgggg gcggaggggg cacgcggcga cgtcgacggc gcacgggcaa 8040 acggtcgatg aatcgttcaa tgacctctcc gcggcggcgg cgcatggttt cagtgacggc 8100 gcggccgttc tcgcgcggtc gcagagtaaa aacaccgccg cgcatctcct taaagtggtg 8160 actgggaggt tctccgtttg ggagggagag ggcgctgatt atacatttta ttaattggcc 8220 cgtagggact gcgcgcagag atctgatcgt gtcaagatcc acgggatctg aaaacctttc 8280 gacgaaagcg tctaaccagt cacagtcaca aggtaggctg agtacggctt cttgtgggcg 8340 ggggtggtta tgtgttcggt ctgggtcttc tgtttcttct tcatctcggg aaggtgagac 8400 gatgctgctg gtgatgaaat taaagtaggc agttctaaga cggcggatgg tggcgaggag 8460 caccaggtct ttgggtccgg cttgctggat acgcaggcga ttggccattc cccaagcatt 8520 atcctgacat ctagcaagat ctttgtagta gtcttgcatg agccgttcta cgggcacttc 8580 ttcctcaccc gttctgccat gcatacgtgt gagtccaaat ccgcgcattg gttgtaccag 8640 tgccaagtca gctacgactc tttcggcgag gatggcttgc tgtacttggg taagggtggc 8700 ttgaaagtca tcaaaatcca caaagcggtg gtaagcccct gtattaatgg tgtaagcaca 8760 gttggccatg actgaccagt taactgtctg gtgaccaggg cgcacgagct cggtgtattt 8820 aaggcgcgaa taggcgcggg tgtcaaagat gtaatcgttg caggtgcgca ccagatactg 8880 gtaccctata agaaaatgcg gcggtggttg gcggtagaga ggccatcgtt ctgtagctgg 8940 agcgccaggg gcgaggtctt ccaacataag gcggtgatag ccgtagatgt acctggacat 9000 ccaggtgatt cctgcggcgg tagtagaagc ccgaggaaac tcgcgtacgc ggttccaaat 9060 gttgcgtagc ggcatgaagt agttcattgt aggcacggtt tgaccagtga ggcgcgcgca 9120 gtcattgatg ctctatagac acggagaaaa tgaaagcgtt cagcgactcg actccgtagc 9180 ctggaggaac gtgaacgggt tgggtcgcgg tgtaccccgg ttcgagactt gtactcgagc 9240 cggccggagc cgcggctaac gtggtattgg cactcccgtc tcgacccagc ctacaaaaat 9300 ccaggatacg gaatcgagtc gttttgctgg tttccgaatg gcagggaagt gagtcctatt 9360 tttttttttt ttgccgctca gatgcatccc gtgctgcgac agatgcgccc ccaacaacag 9420 cccccctcgc agcagcagca gcagcaacca caaaaggctg tccctgcaac tactgcaact 9480 gccgccgtga gcggtgcggg acagcccgcc tatgatctgg acttggaaga gggcgaagga 9540 ctggcacgtc taggtgcgcc ttcgcccgag cggcatccgc gagttcaact gaaaaaagat 9600 tctcgcgagg cgtatgtgcc ccaacagaac ctatttagag acagaagcgg cgaggagccg 9660 gaggagatgc gagcttcccg ctttaacgcg ggtcgtgagc tgcgtcacgg tttggaccga 9720 agacgagtgt tgcgagacga ggatttcgaa gttgatgaag tgacagggat cagtcctgcc 9780 agggcacacg tggctgcagc caaccttgta tcggcttacg agcagacagt aaaggaagag 9840 cgtaacttcc aaaagtcttt taataatcat gtgcgaaccc tgattgcccg cgaagaagtt 9900 acccttggtt tgatgcattt gtgggatttg atggaagcta tcattcagaa ccctactagc 9960 aaacctctga ccgcccagct gtttctggtg gtgcaacaca gcagagacaa tgaggctttc 10020 agagaggcgc tgctgaacat caccgaaccc gaggggagat ggttgtatga tcttatcaac 10080 attctacaga gtatcatagt gcaggagcgg agcctgggcc tggccgagaa ggtagctgcc 10140 atcaattact cggttttgag cttgggaaaa tattacgctc gcaaaatcta caagactcca 10200 tacgttccca tagacaagga ggtgaagata gatgggttct acatgcgcat gacgctcaag 10260 gtcttgaccc tgagcgatga tcttggggtg tatcgcaatg acagaatgca tcgcgcggtt 10320 agcgccagca ggaggcgcga gttaagcgac agggaactga tgcacagttt gcaaagagct 10380 ctgactggag ctggaaccga gggtgagaat tacttcgaca tgggagctga cttgcagtgg 10440 cagcctagtc gcagggctct gagcgccgcg acggcaggat gtgagcttcc ttacatagaa 10500 gaggcggatg aaggcgagga ggaagagggc gagtacttgg aagactgatg gcacaacccg 10560 tgttttttgc tagatggaac agcaagcacc ggatcccgca atgcgggcgg cgctgcagag 10620 ccagccgtcc ggcattaact cctcggacga ttggacccag gccatgcaac gtatcatggc 10680 gttgacgact cgcaaccccg aagcctttag acagcaaccc caggccaacc gtctatcggc 10740 catcatggaa gctgtagtgc cttcccgatc taatcccact catgagaagg tcctggccat 10800 cgtgaacgcg ttggtggaga acaaagctat tcgtccagat gaggccggac tggtatacaa 10860 cgctctctta gaacgcgtgg ctcgctacaa cagtagcaat gtgcaaacca atttggaccg 10920 tatgataaca gatgtacgcg aagccgtgtc tcagcgcgaa aggttccagc gtgatgccaa 10980 cctgggttcg ctggtggcgt taaatgcttt cttgagtact cagcctgcta atgtgccgcg 11040 tggtcaacag gattatacta actttttaag tgctttgaga ctgatggtat cagaagtacc 11100 tcagagcgaa gtgtatcagt ccggtcctga ttacttcttt cagactagca gacagggctt 11160 gcagacggta aatctgagcc aagcttttaa aaaccttaaa ggtttgtggg gagtgcatgc 11220 cccggtagga gaaagagcaa ccgtgtctag cttgttaact ccgaactccc gcctgttatt 11280 actgttggta gctcctttca ccgacagcgg tagcatcgac cgtaattcct atttgggtta 11340 cctactaaac ctgtatcgcg aagccatagg gcaaagtcag gtggacgagc agacctatca 11400 agaaattacc caagtcagtc gcgctttggg acaggaagac actggcagtt tggaagccac 11460 tctgaacttc ttgcttacca atcggtctca aaagatccct cctcaatatg ctcttactgc 11520 ggaggaggag aggatcctta gatatgtgca gcagagcgtg ggattgtttc tgatgcaaga 11580 gggggcaact ccgactgcag cactggacat gacagcgcga aatatggagc ccagcatgta 11640 tgccagtaac cgacctttca ttaacaaact gctggactac ttgcacagag ctgccgctat 11700 gaactctgat tatttcacca atgccatctt aaacccgcac tggctgcccc cacctggttt 11760 ctacacgggc gaatatgaca tgcccgaccc taatgacgga tttctgtggg acgacgtgga 11820 cagcgatgtt ttttcacctc tttctgatca tcgcacgtgg aaaaaggaag gcggtgatag 11880 aatgcattct tctgcatcgc tgtccggggt catgggtgct accgcggctg agcccgagtc 11940 tgcaagtcct tttcctagtc tacccttttc tctacacagt gtacgtagca gcgaagtggg 12000 tagaataagt cgcccgagtt taatgggcga agaggagtac ctaaacgatt ccttgctcag 12060 accggcaaga gaaaaaaatt tcccaaacaa tggaatagaa agtttggtgg ataaaatgag 12120 tagatggaag acttatgctc aggatcacag agacgagcct gggatcatgg ggactacaag 12180 tagagcgagc cgtagacgcc agcgccatga cagacagagg ggtcttgtgt gggacgatga 12240 ggattcggcc gatgatagca gcgtgttgga cttgggtggg agaggaaggg gcaacccgtt 12300 tgctcatttg cgccctcgct tgggtggtat gttgtgaaaa aaaataaaaa agaaaaactc 12360 accaaggcca tggcgacgag cgtacgttcg ttcttcttta ttatctgtgt ctagtataat 12420 gaggcgagtc gtgctaggcg gagcggtggt gtatccggag ggtcctcctc cttcgtacga 12480 gagcgtgatg cagcagcagc aggcgacggc ggtgatgcaa tccccactgg aggctccctt 12540 tgtgcctccg cgatacctgg cacctacgga gggcagaaac agcattcgtt actcggaact 12600 ggcacctcag tacgatacca ccaggttgta tctggtggac aacaagtcgg cggacattgc 12660 ttctctgaac tatcagaatg accacagcaa cttcttgacc acggtggtgc agaacaatga 12720 ctttacccct acggaagcca gcacccagac cattaacttt gatgaacgat cgcggtgggg 12780 cggtcagcta aagaccatca tgcatactaa catgccaaac gtgaacgagt atatgtttag 12840 taacaagttc aaagcgcgtg tgatggtgtc cagaaaacct cccgacggtg ctgcagttgg 12900 ggatacttat gatcacaagc aggatatttt ggaatatgag tggttcgagt ttactttgcc 12960 agaaggcaac ttttcagtta ctatgactat tgatttgatg aacaatgcca tcatagataa 13020 ttacttgaaa gtgggtagac agaatggagt gcttgaaagt gacattggtg ttaagttcga 13080 caccaggaac ttcaagctgg gatgggatcc cgaaaccaag ttgatcatgc ctggagtgta 13140 tacgtatgaa gccttccatc ctgacattgt cttactgcct ggctgcggag tggattttac 13200 cgagagtcgt ttgagcaacc ttcttggtat cagaaaaaaa cagccatttc aagagggttt 13260 taagattttg tatgaagatt tagaaggtgg taatattccg gccctcttgg atgtagatgc 13320 ctatgagaac agtaagaaag aacaaaaagc caaaatagaa gctgctacag ctgctgcaga 13380 agctaaggca aacatagttg ccagcgactc tacaagggtt gctaacgctg gagaggtcag 13440 aggagacaat tttgcgccaa cacctgttcc gactgcagaa tcattattgg ccgatgtgtc 13500 tgaaggaacg gacgtgaaac tcactattca acctgtagaa aaagatagta agaatagaag 13560 ctataatgtg ttggaagaca aaatcaacac agcctatcgc agttggtatc tttcgtacaa 13620 ttatggcgat cccgaaaaag gagtgcgttc ctggacattg ctcaccacct cagatgtcac 13680 ctgcggagca gagcaggttt actggtcgct tccagacatg atgaaggatc ctgtcacttt 13740 ccgctccact agacaagtca gtaactaccc tgtggtgggt gcagagctta tgcccgtctt 13800 ctcaaagagc ttctacaacg aacaagctgt gtactcccag cagctccgcc agtccacctc 13860 gcttacgcac gtcttcaacc gctttcctga gaaccagatt ttaatccgtc cgccggcgcc 13920 caccattacc accgtcagtg aaaacgttcc tgctctcaca gatcacggga ccctgccgtt 13980 gcgcagcagt atccggggag tccaacgtgt gaccgttact gacgccagac gccgcacctg 14040 tccctacgtg tacaaggcac tgggcatagt cgcaccgcgc gtcctttcaa gccgcacttt 14100 ctaaaaaaaa aatgtccatt cttatctcgc ccagtaataa caccggttgg ggtctgcgcg 14160 ctccaagcaa gatgtacgga ggcgcacgca aacgttctac ccaacatccc gtgcgtgttc 14220 gcggacattt tcgcgctcca tggggtgccc tcaagggccg cactcgcgtt cgaaccaccg 14280 tcgatgatgt aatcgatcag gtggttgccg acgcccgtaa ttatactcct actgcgccta 14340 catctactgt ggatgcagtt attgacagtg tagtggctga cgctcgcaac tatgctcgac 14400 gtaagagccg gcgaaggcgc attgccagac gccaccgagc taccactgcc atgcgagccg 14460 caagagctct gctacgaaga gctagacgcg tggggcgaag agccatgctt agggcggcca 14520 gacgtgcagc ttcgggcgcc agcgccggca ggtcccgcag gcaagcagcc gctgtcgcag 14580 cggcgactat tgccgacatg gcccaatcgc gaagaggcaa tgtatactgg gtgcgtgacg 14640 ctgccaccgg tcaacgtgta cccgtgcgca cccgtccccc tcgcacttag aagatactga 14700 gcagtctccg atgttgtgtc ccagcggcga ggatgtccaa gcgcaaatac aaggaagaaa 14760 tgctgcaggt tatcgcacct gaagtctacg gccaaccgtt gaaggatgaa aaaaaacccc 14820 gcaaaatcaa gcgggttaaa aaggacaaaa aagaagagga agatggcgat gatgggctgg 14880 cggagtttgt gcgcgagttt gccccacggc gacgcgtgca atggcgtggg cgcaaagttc 14940 gacatgtgtt gagacctgga acttcggtgg tctttacacc cggcgagcgt tcaagcgcta 15000 cttttaagcg ttcctatgat gaggtgtacg gggatgatga tattcttgag caggcggctg 15060 accgattagg cgagtttgct tatggcaagc gtagtagaat aacttccaag gatgagacag 15120 tgtcaatacc cttggatcat ggaaatccca cccctagtct taaaccggtc actttgcagc 15180 aagtgttacc cgtaactccg cgaacaggtg ttaaacgcga aggtgaagat ttgtatccca 15240 ctatgcaact gatggtaccc aaacgccaga agttggagga cgttttggag aaagtaaaag 15300 tggatccaga tattcaacct gaggttaaag tgagacccat taagcaggta gcgcctggtc 15360 tgggggtaca aactgtagac attaagattc ccactgaaag tatggaagtg caaactgaac 15420 ccgcaaagcc tactgccacc tccactgaag tgcaaacgga tccatggatg cccatgccta 15480 ttacaactga cgccgccggt cccactcgaa gatcccgacg aaagtacggt ccagcaagtc 15540 tgttgatgcc caattatgtt gtacacccat ctattattcc tactcctggt taccgaggca 15600 ctcgctacta tcgcagccga aacagtacct cccgccgtcg ccgcaagaca cctgcaaatc 15660 gcagtcgtcg ccgtagacgc acaagcaaac cgactcccgg cgccctggtg cggcaagtgt 15720 accgcaatgg tagtgcggaa cctttgacac tgccgcgtgc gcgttaccat ccgagtatca 15780 tcacttaatc aatgttgccg ctgcctcctt gcagatatgg ccctcacttg tcgccttcgc 15840 gttcccatca ctggttaccg aggaagaaac tcgcgccgta gaagagggat gttgggacgc 15900 ggaatgcgac gctacaggcg acggcgtgct atccgcaagc aattgcgggg tggtttttta 15960 ccagccttaa ttccaattat cgctgctgca attggcgcga taccaggcat agcttccgtg 16020 gcggttcagg cctcgcaacg acattgacat tggaaaaaaa acgtataaat aaaaaaaaat 16080 acaatggact ctgacactcc tggtcctgtg actatgtttt cttagagatg gaagacatca 16140 atttttcatc cttggctccg cgacacggca cgaagccgta catgggcacc tggagcgaca 16200 tcggcacgag ccaactgaac gggggcgcct tcaattggag cagtatctgg agcgggctta 16260 aaaattttgg ctcaaccata aaaacatacg ggaacaaagc ttggaacagc agtacaggac 16320 aggcgcttag aaataaactt aaagaccaga acttccaaca aaaagtagtc gatgggatag 16380 cttccggcat caatggagtg gtagatttgg ctaaccaggc tgtgcagaaa aagataaaca 16440 gtcgtttgga cccgccgcca gcaaccccag gtgaaatgca agtggaggaa gaaattcctc 16500 cgccagaaaa acgaggcgac aagcgtccgc gtcccgattt ggaagagacg ctggtgacgc 16560 gcgtagatga accgccttct tatgaggaag caacgaagct tggaatgccc accactagac 16620 cgatagcccc aatggccacc ggggtgatga aaccttctca gttgcatcga cccgtcacct 16680 tggatttgcc ccctccccct gctgctactg ctgtacccgc ttctaagcct gtcgctgccc 16740 cgaaaccagt cgccgtagcc aggtcacgtc ccgggggcgc tcctcgtcca aatgcgcact 16800 ggcaaaatac tctgaacagc atcgtgggtc taggcgtgca aagtgtaaaa cgccgtcgct 16860 gcttttaatt aaatatggag tagcgcttaa cttgcctatc tgtgtatatg tgtcattaca 16920 cgccgtcaca gcagcagagg aaaaaaggaa gaggtcgtgc gtcgacgctg agttactttc 16980 aagatggcca ccccatcgat gctgccccaa tgggcataca tgcacatcgc cggacaggat 17040 gcttcggagt acctgagtcc gggtctggtg cagttcgccc gcgccacaga cacctacttc 17100 aatctgggaa ataagtttag aaatcccacc gtagcgccga cccacgatgt gaccaccgac 17160 cgtagccagc ggctcatgtt gcgcttcgtg cccgttgacc gggaggacaa tacatactct 17220 tacaaagtgc ggtacaccct ggccgtgggc gacaacagag tgctggatat ggccagcacg 17280 ttctttgaca ttaggggcgt gttggacaga ggtcccagtt tcaaacccta ttctggtacg 17340 gcttacaact ctctggctcc taaaggcgct ccaaatgcat ctcaatggat tgcaaaaggc 17400 gtaccaactg cagcagccgc aggcaatggt gaagaagaac atgaaacaga ggagaaaact 17460 gctacttaca cttttgccaa tgctcctgta aaagccgagg ctcaaattac aaaagagggc 17520 ttaccaatag gtttggagat ttcagctgaa aacgaatcta aacccatcta tgcagataaa 17580 ctttatcagc cagaacctca agtgggagat gaaacttgga ctgacctaga cggaaaaacc 17640 gaagagtatg gaggcagggc tctaaagcct actactaaca tgaaaccctg ttacgggtcc 17700 tatgcgaagc ctactaattt aaaaggtggt caggcaaaac cgaaaaactc ggaaccgtcg 17760 agtgaaaaaa ttgaatatga tattgacatg gaattttttg ataactcatc gcaaagaaca 17820 aacttcagtc ctaaaattgt catgtatgca gaaaatgtag gtttggaaac gccagacact 17880 catgtagtgt acaaacctgg aacagaagac acaagttccg aagctaattt gggacaacag 17940 tctatgccca acagacccaa ctacattggc ttcagagata actttattgg actcatgtac 18000 tataacagta ctggtaacat gggggtgctg gctggtcaag cgtctcagtt aaatgcagtg 18060 gttgacttgc aggacagaaa cacagaactt tcttaccaac tcttgcttga ctctctgggc 18120 gacagaacca gatactttag catgtggaat caggctgtgg acagttatga tcctgatgta 18180 cgtgttattg aaaatcatgg tgtggaagat gaacttccca actattgttt tccactggac 18240 ggcataggtg ttccaacaac cagttacaaa tcaatagttc caaatggaga agataataat 18300 aattggaaag aacctgaagt aaatggaaca agtgagatcg gacagggtaa tttgtttgcc 18360 atggaaatta accttcaagc caatctatgg cgaagtttcc tttattccaa tgtggctctg 18420 tatctcccag actcgtacaa atacaccccg tccaatgtca ctcttccaga aaacaaaaac 18480 acctacgact acatgaacgg gcgggtggtg ccgccatctc tagtagacac ctatgtgaac 18540 attggtgcca ggtggtctct ggatgccatg gacaatgtca acccattcaa ccaccaccgt 18600 aacgctggct tgcgttaccg atctatgctt ctgggtaacg gacgttatgt gcctttccac 18660 atacaagtgc ctcaaaaatt cttcgctgtt aaaaacctgc tgcttctccc aggctcctac 18720 acttatgagt ggaactttag gaaggatgtg aacatggttc tacagagttc cctcggtaac 18780 gacctgcggg tagatggcgc cagcatcagt ttcacgagca tcaacctcta tgctactttt 18840 ttccccatgg ctcacaacac cgcttccacc cttgaagcca tgctgcggaa tgacaccaat 18900 gatcagtcat tcaacgacta cctatctgca gctaacatgc tctaccccat tcctgccaat 18960 gcaaccaata ttcccatttc cattccttct cgcaactggg cggctttcag aggctggtca 19020 tttaccagac tgaaaaccaa agaaactccc tctttggggt ctggatttga cccctacttt 19080 gtctattctg gttctattcc ctacctggat ggtaccttct acctgaacca cacttttaag 19140 aaggtttcca tcatgtttga ctcttcagtg agctggcctg gaaatgacag gttactatct 19200 cctaacgaat ttgaaataaa gcgcactgtg gatggcgaag gctacaacgt agcccaatgc 19260 aacatgacca aagactggtt cttggtacag atgctcgcca actacaacat cggctatcag 19320 ggcttctaca ttccagaagg atacaaagat cgcatgtatt catttttcag aaacttccag 19380 cccatgagca ggcaggtggt tgatgaggtc aattacaaag acttcaaggc cgtcgccata 19440 ccctaccaac acaacaactc tggctttgtg ggttacatgg ctccgaccat gcgccaaggt 19500 caaccctatc ccgctaacta tccctatcca ctcattggaa caactgccgt aaatagtgtt 19560 acgcagaaaa agttcttgtg tgacagaacc atgtggcgca taccgttctc gagcaacttc 19620 atgtctatgg gggcccttac agacttggga cagaatatgc tctatgccaa ctcagctcat 19680 gctctggaca tgacctttga ggtggatccc atggatgagc ccaccctgct ttatcttctc 19740 ttcgaagttt tcgacgtggt cagagtgcat cagccacacc gcggcatcat cgaggcagtc 19800 tacctgcgta caccgttctc ggccggtaac gctaccacgt aagaagcttc ttgcttcttg 19860 caaatagcag ctgcaaccat ggcctgcgga tcccaaaacg gctccagcga gcaagagctc 19920 agagccattg tccaagacct gggttgcgga ccctattttt tgggaaccta cgataagcgc 19980 ttcccggggt tcatggcccc cgataagctc gcctgtgcca ttgtaaatac ggccggacgt 20040 gagacggggg gagagcactg gttggctttc ggttggaacc cacgttctaa cacctgctac 20100 ctttttgatc cttttggatt ctcggatgat cgtctcaaac agatttacca gtttgaatat 20160 gagggtctcc tgcgccgcag cgctcttgct accaaggacc gctgtattac gctggaaaaa 20220 tctacccaga ccgtgcaggg cccccgttct gccgcctgcg gacttttctg ctgcatgttc 20280 cttcacgcct ttgtgcactg gcctgaccgt cccatggacg gaaaccccac catgaaattg 20340 ctaactggag tgccaaacaa catgcttcat tctcctaaag tccagcccac cctgtgtgac 20400 aatcaaaaag cactctacca ttttcttaat acccattcgc cttattttcg ctctcatcgt 20460 acacacatcg aaagggccac tgcgttcgac cgtatggatg ttcaataatg actcatgtaa 20520 acaacgtgtt caataaacat cactttattt ttttacatgt atcaaggctc tggattactt 20580 atttatttac aagtcgaatg ggttctgacg agaatcagaa tgacccgcag gcagtgatac 20640 gttgcggaac tgatacttgg gttgccactt gaattcggga atcaccaact tgggaaccgg 20700 tatatcgggc aggatgtcac tccacagctt tctggtcagc tgcaaagctc caagcaggtc 20760 aggagccgaa atcttgaaat cacaattagg accagtgctc tgagcgcgag agttgcggta 20820 caccggattg cagcactgaa acaccatcag cgacggatgt ctcacgcttg ccagcacggt 20880 gggatctgca atcatgccca catccagatc ttcagcattg gcaatgctga acggggtcat 20940 cttgcaggtc tgcctaccca tggcgggcac ccaattaggc ttgtggttgc aatcgcagtg 21000 cagggggatc agtatcatct tggcctgatc ctgtctgatt cctggataca cggctctcat 21060 gaaagcatca tattgcttga aagcctgctg ggctttacta ccctcggtat aaaacatccc 21120 gcaggacctg ctcgaaaact ggttagctgc acagccggca tcattcacac agcagcgggc 21180 gtcattgttg gctatttgca ccacacttct gccccagcgg ttttgggtga ttttggttcg 21240 ctcgggattc tcctttaagg ctcgttgtcc gttctcgctg gccacatcca tctcgataat 21300 ctgctccttc tgaatcataa tattgccatg caggcacttc agcttgccct cataatcatt 21360 gcagccatga ggccacaacg cacagcctgt acattcccaa ttatggtggg cgatctgaga 21420 aaaagaatgt atcattccct gcagaaatct tcccatcatc gtgctcagtg tcttgtgact 21480 agtgaaagtt aactggatgc ctcggtgctc ttcgtttacg tactggtgac agatgcgctt 21540 gtattgttcg tgttgctcag gcattagttt aaaacaggtt ctaagttcgt tatccagcct 21600 gtacttctcc atcagcagac acatcacttc catgcctttc tcccaagcag acaccagggg 21660 caagctaatc ggattcttaa cagtgcaggc agcagctcct ttagccagag ggtcatcttt 21720 agcgatcttc tcaatgcttc ttttgccatc cttctcaacg atgcgcacgg gcgggtagct 21780 gaaacccact gctacaagtt gcgcctcttc tctttcttct tcgctgtctt gactgatgtc 21840 ttgcatgggg atatgtttgg tcttccttgg cttctttttg gggggtatcg gaggaggagg 21900 actgtcgctc cgttccggag acagggagga ttgtgacgtt tcgctcacca ttaccaactg 21960 actgtcggta gaagaacctg accccacacg gcgacaggtg tttttcttcg ggggcagagg 22020 tggaggcgat tgcgaagggc tgcggtccga cctggaaggc ggatgactgg cagaacccct 22080 tccgcgttcg ggggtgtgct ccctgtggcg gtcgcttaac tgatttcctt cgcggctggc 22140 cattgtgttc tcctaggcag agaaacaaca gacatggaaa ctcagccatt gctgtcaaca 22200 tcgccacgag tgccatcaca tctcgtcctc agcgacgagg aaaaggagca gagcttaagc 22260 attccaccgc ccagtcctgc caccacctct accctagaag ataaggaggt cgacgcatct 22320 catgacatgc agaataaaaa agcgaaagag tctgagacag acatcgagca agacccgggc 22380 tatgtgacac cggtggaaca cgaggaagag ttgaaacgct ttctagagag agaggatgaa 22440 aactgcccaa aacagcgagc agataactat caccaagatg ctggaaatag ggatcagaac 22500 accgactacc tcatagggct tgacggggaa gacgcgctcc ttaaacatct agcaagacag 22560 tcgctcatag tcaaggatgc attattggac agaactgaag tgcccatcag tgtggaagag 22620 ctcagctgcg cctacgagct taaccttttt tcacctcgta ctccccccaa acgtcagcca 22680 aacggcacct gcgagccaaa tcctcgctta aacttttatc cagcttttgc tgtgccagaa 22740 gtactggcta cctatcacat cttttttaaa aatcaaaaaa ttccagtctc ctgccgcgct 22800 aatcgcaccc gcgccgatgc cctactcaat ctgggacctg gttcacgctt acctgatata 22860 gcttccttgg aagaggttcc aaagatcttc gagggtctgg gcaataatga gactcgggcc 22920 gcaaatgctc tgcaaaaggg agaaaatggc atggatgagc atcacagcgt tctggtggaa 22980 ttggaaggcg ataatgccag actcgcagta ctcaagcgaa gcgtcgaggt cacacacttc 23040 gcatatcccg ctgtcaacct gccccctaaa gtcatgacgg cggtcatgga ccagttactc 23100 attaagcgcg caagtcccct ttcagaagac atgcatgacc cagatgcctg tgatgagggt 23160 aaaccagtgg tcagtgatga gcagctaacc cgatggctgg gcaccgactc tccccgggat 23220 ttggaagagc gtcgcaagct tatgatggcc gtggtgctgg ttaccgtaga actagagtgt 23280 ctccgacgtt tctttaccga ttcagaaacc ttgcgcaaac tcgaagagaa tctgcactac 23340 acttttagac acggctttgt gcggcaggca tgcaagatat ctaacgtgga actcaccaac 23400 ctggtttcct acatgggtat tctgcatgag aatcgcctag gacaaagcgt gctgcacagc 23460 acccttaagg gggaagcccg ccgtgattac atccgcgatt gtgtctatct ctacctgtgc 23520 cacacgtggc aaaccggcat gggtgtatgg cagcaatgtt tagaagaaca gaacttgaaa 23580 gagcttgaca agctcttaca gaaatctctt aaggttctgt ggacagggtt cgacgagcgc 23640 accgtcgctt ccgacctggc agacctcatc ttcccagagc gtctcagggt tactttgcga 23700 aacggattgc ctgactttat gagccagagc atgcttaaca attttcgctc tttcatcctg 23760 gaacgctccg gtatcctgcc cgccacctgc tgcgcactgc cctccgactt tgtgcctctc 23820 acctaccgcg agtgcccccc gccgctatgg agtcactgct acctgttccg tctggccaac 23880 tatctctcct accactcgga tgtgatcgag gatgtgagcg gagacggctt gctggagtgc 23940 cactgccgct gcaatctgtg cacgccccac cggtccctag cttgcaaccc ccagttgatg 24000 agcgaaaccc agataatagg cacctttgaa ttgcaaggcc ccagcagcca aggcgatggg 24060 tcttctcctg ggcaaagttt aaaactgacc ccgggactgt ggacctccgc ctacttgcgc 24120 aagtttgctc cggaagatta ccacccctat gaaatcaagt tctatgagga ccaatcacag 24180 cctccaaagg ccgaactttc ggcttgcgtc atcacccagg gggcaattct ggcccaattg 24240 caagccatcc aaaaatcccg ccaagaattt ctactgaaaa agggtaaggg ggtctacctt 24300 gacccccaga ccggcgagga actcaacaca aggttccctc aggatgtccc aacgacgaga 24360 aaacaagaag ttgaaggtgc agccgccgcc cccagaagat atggaggaag attgggacag 24420 tcaggcagag gaggcggagg aggacagtct ggaggacagt ctggaggaag acagtttgga 24480 ggaggaaaac gaggaggcag aggaggtgga agaagtaacc gccgacaaac agttatcctc 24540 ggctgcggag acaagcaaca gcgctaccat ctccgctccg agtcgaggaa cccggcggcg 24600 tcccagcagt agatgggacg agaccggacg cttcccgaac ccaaccagcg cttccaagac 24660 cggtaagaag gatcggcagg gatacaagtc ctggcggggg cataagaatg ccatcatctc 24720 ctgcttgcat gagtgcgggg gcaacatatc cttcacgcgg cgctacttgc tattccacca 24780 tggggtgaac tttccgcgca atgttttgca ttactaccgt cacctccaca gcccctacta 24840 tagccagcaa atcccgacag tctcgacaga taaagacagc ggcggcgacc tccaacagaa 24900 aaccagcagc ggcagttaga aaatacacaa caagtgcagc aacaggagga ttaaagatta 24960 cagccaacga gccagcgcaa acccgagagt taagaaatcg gatctttcca accctgtatg 25020 ccatcttcca gcagagtcgg ggtcaagagc aggaactgaa aataaaaaac cgatctctgc 25080 gttcgctcac cagaagttgt ttgtatcaca agagcgaaga tcaacttcag cgcactctcg 25140 aggacgccga ggctctcttc aacaagtact gcgcgctgac tcttaaagag taggcagcga 25200 ccgcgcttat tcaaaaaagg cgggaattac atcatcctcg acatgagtaa agaaattccc 25260 acgccttaca tgtggagtta tcaaccccaa atgggattgg cagcaggcgc ctcccaggac 25320 tactccaccc gcatgaattg gctcagcgcc gggccttcta tgatttctcg agttaatgat 25380 atacgcgcct accgaaacca aatacttttg gaacagtcag ctcttaccac cacgccccgc 25440 caacacctta atcccagaaa ttggcccgcc gccctagtgt accaggaaag tcccgctccc 25500 accactgtat tacttcctcg agacgcccag gccgaagtcc aaatgactaa tgcaggtgcg 25560 cagttagctg gcggctccac cctatgtcgt cacaggcctc ggcataatat aaaacgcctg 25620 atgatcagag gccgaggtat ccagctcaac gacgagtcgg tgagctctcc gcttggtcta 25680 cgaccagacg gaatctttca gattgccggc tgcgggagat cttccttcac ccctcgtcag 25740 gctgttctga ctttggaaag ttcgtcttcg caaccccgct cgggcggaat cgggaccgtt 25800 caatttgtag aggagtttac tccctctgtc tacttcaacc ccttctccgg atctcctggg 25860 cactacccgg acgagttcat accgaacttc gacgcgatta gcgagtcagt ggacggctac 25920 gattgatgtc tggtgacgcg gctgagctat ctcggctgcg acatctagac cactgccgcc 25980 gctttcgctg ctttgcccgg gaacttattg agttcatcta cttcgaactc cccaaggatc 26040 accctcaagg tccggcccac ggagtgcgga ttactatcga aggcaaaata gactctcgcc 26100 tgcaacgaat tttctcccag cggcccgtgc tgatcgagcg agaccaggga aacaccacgg 26160 ttagtaatca attacggggt cattagttca tagcccatat atggagttaa cttgtttatt 26220 gcagcttata atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt 26280 ttttcactgc attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgc 26340 tcgaagcggc cggccgcccc gactctagag tcgcggcctc attaggaagt tcctatactt 26400 tctagagaat aggaacttct cagaagaact cgtcaagaag gcgatagaag gcgatgcgct 26460 gcgaatcggg agcggcgata ccgtaaagca cgaggaagcg gtcagcccat tcgccgccaa 26520 gctcttcagc aatatcacgg gtagccaacg ctatgtcctg atagcggtcc gccacaccca 26580 gccggccaca gtcgatgaat ccagaaaagc ggccattttc caccatgata ttcggcaagc 26640 aggcatcgcc atgggtcacg acgagatcct cgccgtcggg catgcgcgcc ttgagcctgg 26700 cgaacagttc ggctggcgcg agcccctgat gctcttcgtc cagatcatcc tgatcgacaa 26760 gaccggcttc catccgagta cgtgctcgct cgatgcgatg tttcgcttgg tggtcgaatg 26820 ggcaggtagc cggatcaagc gtatgcagcc gccgcattgc atcagccatg atggatactt 26880 tctcggcagg agcaaggtga gatgacagga gatcctgccc cggcacttcg cccaatagca 26940 gccagtccct tcccgcttca gtgacaacgt cgagcacagc tgcgcaagga acgcccgtcg 27000 tggccagcca cgatagccgc gctgcctcgt cctgcagttc attcagggca ccggacaggt 27060 cggtcttgac aaaaagaacc gggcgcccct gcgctgacag ccggaacacg gcggcatcag 27120 agcagccgat tgcctgttgt gcccagtcat agccgaatag cctctccacc caagcggccg 27180 gagaacctgc gtgcaatcca tcttgttcaa tggccgatcc cataacaccc cttgtattac 27240 tgtttatgta agcagacagt tttactgttc gtgatgatat atttttatct tgtgcaatgt 27300 aacaggttgt ggccatagcg ggcccgggat tttcctccac gtccccgcat gttagaagac 27360 ttcccctgcc ctcggctctg gaagttccta tactttctag agaataggaa cttcccgcca 27420 gaatgcgttc gcacagccgc cagccggtca ctccgttgat ggttactcgg aacagcaggg 27480 agccgtcggg gttgatcagg cgctcgtcga taattttgtt gccgttccac agggtccctg 27540 ttacagtgat ctttttgccg tcgaacacgg cgatgccttc atacggccgt ccgaaatagt 27600 cgatcatgtt cggcgtaacc ccgtcgatta ccagtgtgcc atagtgcagg atcaccttaa 27660 agtgatgatc atccacaggg tacaccacct taaaaatttt ttcgatctgg cccatttggt 27720 cgccgctcag accttcatac gggatgatga catggatgtc gatcttcagc ccattttcac 27780 cgctcaggac aatcctttgg atcggagtta cggacacccc gagattctga aacaaactgg 27840 acacacctcc ctgttcaagg acttggtcca ggttgtagcc ggctgtctgt cgccagtccc 27900 caacgaaatc ttcgagtgtg aagaccatgg atccgggccc ggggttttct tcaacgtctc 27960 cagcctgctt cagcaggctg aagttagtag ctccgcttcc tcgagctcga gatctggcga 28020 aggcgatggg ggtcttgaag gcgtgctggt actccacgat gcccagctcg gtgttgctgt 28080 gcagctcctc cacgcggcgg aaggcgaaca tggggccccc gttctgcagg atgctggggt 28140 ggatggcgct cttgaagtgc atgtggctgt ccaccacgaa gctgtagtag ccgccgtcgc 28200 gcaggctgaa ggtgcgggcg aagctgccca ccagcacgtt atcgcccatg gggtgcaggt 28260 gctccacggt ggcgttgctg cggatgatct tgtcggtgaa gatcacgctg tcctcgggga 28320 agccggtgcc caccaccttg aagtcgccga tcacgcggcc ggcctcgtag cggtagctga 28380 agctcacgtg cagcacgccg ccgtcctcgt acttctcgat gcgggtgttg gtgtagccgc 28440 cgttgttgat ggcgtgcagg aaggggttct cgtagccgct ggggtaggtg ccgaagtggt 28500 agaagccgta gcccatcacg tggctcagca ggtaggggct gaaggtcagg gcgcctttgg 28560 tgctcttcat cttgttggtc atgcggccct gctcgggggt gccctctccg ccgcccacca 28620 gctcgaactc cacgccgttc agggtgccgg tgatgcggca ctcgatcttc atggcgggca 28680 tggtggcgac cggtagcgct agcggcttcg gtaccacgcg ttcgctcgaa ttaatcaatt 28740 ctttgccaaa atgatgagac agcacaataa ccagcacgtt gcccaggagc tgtaggaaaa 28800 agaagaaggc atgaacatgg ttagcagagg ctctagagcc gccggtcaca cgccagaagc 28860 cgaaccccgc cctgccccgt cccccccgaa ggcagccgtc cccccgcgga cagccccgag 28920 gctggagagg gagaagggga cggcggcgcg gcgacgcacg aaggccctcc ccgcccattt 28980 ccttcctgcc ggggccctcc cggagcccct caaggctttc acgcagccac agaaaagaaa 29040 caagccgtca ttaaaccaag cgctaattac agcccggagg agaagggccg tcccgcccgc 29100 tcacctgtgg gagtaacgcg gtcagtcaga gccggggcgg gcggcgcgag gcggcgcgga 29160 gcggggcacg gggcgaaggc aacgcagcga ctcccgcccg ccgcgcgctt cgctttttat 29220 agggccgccg ccgccgccgc ctcgccataa aaggaaactt tcggagcgcg ccgctctgat 29280 tggctgccgc cgcacctctc cgcctcgccc cgccccgccc ctcgccccgc cccgccccgc 29340 ctggcgcgcg cccccccccc ccccccgccc ccatcgctgc acaaaataat taaaaaataa 29400 ataaatacaa aattgggggt ggggaggggg gggagatggg gagagtgaag cagaacgtgg 29460 ggctcacctc gaccatggta atagcgatga ctaatacgta gatgtactgc caagtaggaa 29520 agtcccataa ggtcatgtac tgggcataat gccaggcggg ccatttaccg tcattgacgt 29580 caataggggg cgtacttggc atatgataca cttgatgtac tgccaagtgg gcagtttacc 29640 gtaaatactc cacccattga cgtcaatgga aagtccctat tggcgttact atgggaacat 29700 acgtcattat tgacgtcaat gggcgggggt cgttgggcgg tcagccaggc gggccattta 29760 ccgtaagtta tgtaacgcgg aacaacaaca attgcattca ttttatgttt caggttcagg 29820 gggaggtgtg gtcctgcgat tccatcgagt gcacctacac cctgctgaag accctatgcg 29880 gcctaagaga cctgctacca atgaattaaa aaaaaatgat taataaaaaa tcacttactt 29940 gaaatcagca ataaggtctc tgttgaaatt ttctcccagc agcacctcac ttccctcttc 30000 ccaactctgg tattctaaac cccgttcagc ggcatacttt ctccatactt taaaggggat 30060 gtcaaatttt agctcctctc ctgtacccac aatcttcatg tctttcttcc cagatgacca 30120 agagagtccg gctcagtgac tccttcaacc ctgtctaccc ctatgaagat gaaagcacct 30180 cccaacaccc ctttataaac ccagggttta tttccccaaa tggcttcaca caaagcccag 30240 acggagttct tactttaaaa tgtttaaccc cactaacaac cacaggcgga tctctacagc 30300 taaaagtggg agggggactt acagtggatg acactgatgg taccttacaa gaaaacatac 30360 gtgctacagc acccattact aaaaataatc actctgtaga actatccatt ggaaatggat 30420 tagaaactca aaacaataaa ctatgtgcca aattgggaaa tgggttaaaa tttaacaacg 30480 gtgacatttg tataaaggat agtattaaca ccttatggac tggaataaac cctccaccta 30540 actgtcaaat tgtggaaaac actaatacaa atgatggcaa acttacttta gtattagtaa 30600 aaaatggagg gcttgttaat ggctacgtgt ctctagttgg tgtatcagac actgtgaacc 30660 aaatgttcac acaaaagaca gcaaacatcc aattaagatt atattttgac tcttctggaa 30720 atctattaac tgaggaatca gacttaaaaa ttccacttaa aaataaatct tctacagcga 30780 ccagtgaaac tgtagccagc agcaaagcct ttatgccaag tactacagct tatcccttca 30840 acaccactac tagggatagt gaaaactaca ttcatggaat atgttactac atgactagtt 30900 atgatagaag tctatttccc ttgaacattt ctataatgct aaacagccgt atgatttctt 30960 ccaatgttgc ctatgccata caatttgaat ggaatctaaa tgcaagtgaa tctccagaaa 31020 gcaacatagc tacgctgacc acatccccct ttttcttttc ttacattaca gaagacgaca 31080 actaaaataa agtttaagtg tttttattta aaatcacaaa attcgagtag ttattttgcc 31140 tccaccttcc catttgacag aatacacagt cctttctccc cggctggcct taaaaagcat 31200 catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc 31260 caaacgctca tcagtgatat taataaactc cccgggcagc tcacttaagt tcatgtcgct 31320 gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgcttaacgg gcggcgaagg 31380 agaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg 31440 ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat 31500 ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc ataaggcgcc ttgtcctccg 31560 ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac 31620 aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac 31680 agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa 31740 cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca 31800 tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac 31860 ctgcccgccg gctatacact gcagggaacc gggactggaa caatgacagt ggagagccca 31920 ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca 31980 cacgtgcata cacttcctca ggattacaag ctcctcccgc gttagaacca tatcccaggg 32040 aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact 32100 cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt 32160 agcgcgggtt tctgtctcaa aaggaggtag acgatcccta ctgtacggag tgcgccgaga 32220 caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcattct 32280 cgtattttgt atagcaaaac gcggccctgg cagaacacac tcttcttcgc cttctatcct 32340 gccgcttagc gtgttccgtg tgatagttca agtacagcca cactcttaag ttggtcaaaa 32400 gaatgctggc ttcagttgta atcaaaactc catcgcatct aattgttctg aggaaatcat 32460 ccacggtagc atatgcaaat cccaaccaag caatgcaact ggattgcgtt tcaagcagga 32520 gaggagaggg aagagacgga agaaccatgt taatttttat tccaaacgat ctcgcagtac 32580 ttcaaattgt agatcgcgca gatggcatct ctcgccccca ctgtgttggt gaaaaagcac 32640 agctaaatca aaagaaatgc gattttcaag gtgctcaacg gtggcttcca acaaagcctc 32700 cacgcgcaca tccaagaaca aaagaatacc aaaagaagga gcattttcta actcctcaat 32760 catcata 32767 <210> 54 <211> 30493 <212> DNA <213> Artificial Sequence <220> <223> pHCA(Ad35) <400> 54 ggccgaagga ttacatgagc ttagaaatgt aattagcata gtgtgtggca tagtgtagat 60 accaaataaa tatgatctct ccttctactc ttgaaaatgc aaacacattc ttggtggtcc 120 taaaatagcc tgtaacatgg tttactcagc agcatttgct attcaaggca gatctgcctt 180 tagtcattgg ctgcgctcct gaacagctgt gtgaaaggct aacttttgta aaccaaatca 240 aaataaaatg cagcaaaaat ttgtcactga aaggaaatcc tcagtatatc cttttatgaa 300 atgaaagatc cctcatccaa acttaacttt tttaaaagtg cgcatttgga gatatagccc 360 tttcttatga atcctaattc aattttggcc ataaacacac gttgatgttc cccaccccaa 420 agcacatagc aacaagagta ggttctatat tgaaaataat gacaatttaa aaacatgtac 480 ttatttcact gtatgtggac agtgtctatg attgcatcat gaagtgtcat ataaccatgt 540 acgtgtacat gagagagaga tagagagaga agtggtaggg tggtggtggt agaggggatg 600 gcgatagtaa tcatggtaat ggtagaggtg atggaggtgg taatgacgga ggtaagggtg 660 gtagtgatga tggtggtggt ggtaatggtg gtggatgtgg tggtggcaat tgggatggtg 720 ggatggtggt agccatggtg atggtggtaa tggtgttgat ttaaagggtg gtggtagtga 780 aggtgagggt agtggtggtg gaggtggtgg tgctggtagc aatagtgatg gtggtgatgg 840 tgttgatgag ggtgttggga tcagggtgag ttcccacagt atatttcatt cttgttgtac 900 cactctgtca acagcaccac tgactgggac agaggaagaa ggcacactct gaatgtgtta 960 ttaacagaaa cctcaaaaca gtctgtctcc ttgtagtcat tcaaaattat ctttttctta 1020 cctggaaaac tgaaactgaa ttaccgggaa aaacacagga gatttttgtt tgttaatatg 1080 ctgccaataa agtaatttta tgtcaaattt aactacagga aagggcaagg cattttctaa 1140 gttccttaga tgtcatgtgg ctaaaaaaaa caaaaggatg gacagcagtt agatactgta 1200 cacttagctg tttgaagcca tatattcaga aagcagatgt tgggagttgg tgtttgagga 1260 ctgatttcct ggaggtattt tatataggcc aagttcattg ttctaaactc taagggcttg 1320 acttgaggga ggaaaagagg caagaacatg tttagttttg ctgacagcat cacatgggca 1380 gccctaaggc tagacaactt tagggcctga agcttattct aggaaagaag cacctacaga 1440 gtggcactgg gctcccctcc actatagaga tgaagtcata tgacagtaaa gggcaggcag 1500 ggctgcctag ggggcccaga actgacactt ccattagaat gagcacaggc cagggagaga 1560 agtggggaac cagagagaag gagctggaat tctagtagga caaacggtaa gtgaacaaca 1620 agaacaagtt aagagtgtgt gcagtattct ttcaaagact gaaaaaatag tgatgtgata 1680 gaatggcagg tggctctgag caggccagga gaaggactgg gggcagagca tcccaggcag 1740 gagggcagca agtgggaagg ccctggggtg gggcttttgg actgttccag tgacgggcag 1800 gcagccagtg tgcctgtcac acaatgcacc agggaagtag tcgtgaattt gcagagggtc 1860 ttgcaggcta tgggaaaggg attggattgt attttgtttg tagggaagcc atcgggggac 1920 ttaagcagag gaaggattgg cttcatctct ttgaaaaagt tctctctgga tgctgatggg 1980 aggagaaatg gaaggaaaag aaacactttt aggggcaaga acttttgaga agggtggaat 2040 tgggagtgtg gagttggggc cagctttggc acaggagggg aagctaaaca cgtggccgca 2100 tgagggcctg taattctacc tgaaatgggt accatttgtt agggtaaaca aatgaaccaa 2160 atgcccagtg atacagacca agtgttggca aacttcttct gtgatggccc aggtagtaaa 2220 tgtctcaggc ttcgcaggcc atgtggtctc tgttgaagct ctgtgtagta gacaatatgt 2280 taatgactgg gcgtgactgt gtgctaataa aagtttattt acaaaaacag cccgtgggct 2340 ggatttagct cacaggctgt agtttgccaa cctctgacct agagcatgaa ctgagcatct 2400 tcttggaggg aaataagttc tttccaagtt gccctcctca cattgcaggg ggccatgtag 2460 gcccattatt cacagaagag tgggtgggca acctttctgg agcagaaaaa cgtaaagatt 2520 tcttccgtag tgcaagtaag gtgaccattt ctaaaccgtg caagtgatcc agcagtccca 2580 aaagttgttt cacttctcat tgtgcgcccg ttctcaggtg ctccgaagct tccagtcctt 2640 tgtagggaca tggatgaaat tggaaatcat cattctcagt aaactatcgc aagaacaaaa 2700 aaccaaacac cgcatattct cactcatagg tgggaattga acaatgagat cacatggaca 2760 cgggaagggg aacatcacat tctggggact gttgtggggt ggggggaggg gggagggata 2820 gcattgggag atatacctaa tgctagatga caagttagtg ggtgcagcgc accagtgtgg 2880 cacatgtata catatgtaac taacctgcac aatgtgcaca tgtaccctaa aacttaaagt 2940 ataataataa aagaaaaaaa aaaagagagg agagaaacat catcccctcc aggataccct 3000 tgggccttgt tcttatagtc ttgtacattg ttgaacaatt tgcatgggct agtggattaa 3060 agcacaccct ccaccctcag gccctcaagg gtctctatga taatacagtc tcaccttcta 3120 ccctttccat caccatccta ggtgctatgg ccaaccttga ggctgccatg ttaggtctat 3180 gcatttccca cctccaccac ataactctct gaaggccagg tagtttccta ttcatcttgg 3240 taaccccaaa gcctcgtgac agggctcagc tggcatctgc ggatgtgaat gaaccattgg 3300 agaaaatggt actctgcaaa taactctgtt attttcccat ttcctgtgta aggcctagag 3360 acaatgactt tttaattgca ccccttcccc tctgtatgac actggccttc tcttgtgtcc 3420 agcaatgtgg gtggcctaga tgatttctaa gggacttctg gccaagatga acagcagctg 3480 catcttactg agcatttact atgtgccata tactcagcca cagctctagg ggcatagaag 3540 caggagctct cagggtcagg gcagtgagtg agcaagcgag cacctatgcc agccctgcct 3600 ctggatgggg acttgagagg gtgatggaag cctgcagcac tggagggagg cagacaaaga 3660 caggcctgtg ctgagggggc ccggagcaag agagagggag gcaatgacag cagagacatg 3720 cctgcgcctt gggtttgagt gcccagtggt caaatccact tccctgtggc tgatgcttgc 3780 ctttctaact ttggaattta ggggttggag atctggtgag aaggtaggag ggagatgagg 3840 aggagaaggg aaaggcagga aggaagggga gggaaaggaa aagcaaaagg ggaggaggaa 3900 ggtttccaac aaattattct atatcaactg cggaaatcaa aatttgttgc ccaaatctta 3960 gaagctcatg tccctcctcc ccagaagtct ggaatgcagc actccagggg tagcttataa 4020 cccaaatatc tatctgtaaa aagagaaaca ttgggctttc gagctgtgga ttctcagtaa 4080 aagcaagagg cctcagccta cacaggccag cccagagttt gaggaacccc aggcccacac 4140 ccacagggct ggcccctggg tctgcatact ccctagaaat gtgcacactt ctgagcctca 4200 actctgtcct ggagtctaac agcatccctc tccttcctgg ggcagttcca cctccagaaa 4260 cctgttacct tgggccttat gtcaaggaaa ctgtgggaaa gagctaggca ggaatgcaga 4320 tgaggccagc atgggctcct aaaagtttag aaataggcag tgtcatgctc ccaggtgcct 4380 gcataaacca gctgaaaaat ggagctcccc tcaccagcac tctcccttca aacagactgt 4440 gatttgcagg tcactggttt accaagccag gctacccagg caggacccag atgccaagcc 4500 cagtggtgtc ctgcaagctg agcagtgctc agttcttgca aaaaaaggtc tgtgtgaagg 4560 caaggcctct gcctggcttc tcaccccagt tgggtgtctg gaacaggaag gagcccttac 4620 tgcagaaaaa ggaggaggga gcaaagggag cgaacagctg cgtgctccat ggggaggatc 4680 cccaaagtag aaaggcgcat acacactgca gcccttgacc cagaatgctc acagctacat 4740 tacagattca ggtctcctca gtgtagtggg gctgctgatg agactgtggc atcctcaggg 4800 gtcaggacac acattttcca tcactcttct gatggcaaaa aacctctgag ccaatgccaa 4860 cctctgatca ttaaaaaaaa gtgctcacag cagtgtgtgg tttaggatca tgccctgtgt 4920 ggtttggaac acgtgcacaa ccacaccttg ttcatcacca tcccagaaac cctgacgcag 4980 gcaaagagca gagttattaa ccctacttta ctgatgtgga tactgaggcc cagaggctca 5040 tgcaagttat caataagtgg cagggacagt tgcctctaga ttaactagcc cctaggatca 5100 cctgggtctt ggaaggggac ccataaacat gagctcccct ctcttggggc cagatttgca 5160 cctgtgccgc gccttcagcc tgcatgaagt aggggctgct ggcaaagact caaagctgta 5220 aatctgggtt ttctcttgag gcttctaagg gagctgtttc gacaactcac tctgttccca 5280 gctggctgcc cctgcatagg gttttaaagc agcctagctt tctgccaggc ttggcagtgg 5340 acaacgctgg tcagaacatc ccagagagct accagaatga agtaagtttg cttctactct 5400 ttacctgttt atgggctgtc tctgccactg gaatgaaagg cactgagaac agtgcctggc 5460 ctgcagaagg ccctggaaat acctgagctc ctaatctggg aataggagta ggaagagctt 5520 tggaggcagg gcacctgagt ttgagatcta caacttcctg cctgtgtgac attgggaaag 5580 tctccatcct ttctgagcct cagtctccac cctggggaag tggaaatatc aatctctgtg 5640 acacagaagc aaatgagcga atgtgcacaa agtaccttgc acaagagaga cgctcaaaca 5700 cttgcctcca ggtttcaccg agaactacag agtaagatag atttgttccc agtggaggaa 5760 gcctgggaat aatttgcccc tagactatga attcctgggg ctcaagatcg agcacagggc 5820 caggcacaca gaagggaccc tggaaatgtg gcaggaggcc agagatagac aggcccttag 5880 agctcatacc catgccctct gacctcaaga agaaagaaac ctgctcaaaa tctcacaaag 5940 agcttgttcc aaccctgaat cgagtctgag gactccttcc tgagtccagc actttttctg 6000 caagaagtat atgcctccaa agctgatggg cgcaaatctt gaaccccgtc acataaacac 6060 aaagggagga ggtgactaga gctcctccta ctggatatgt ctaaggtcac cagtctaaag 6120 aaaagggatg gatagaatga ggccagtatt tttgcagcca tccaaatgtc cacatacgct 6180 gttacactga gggctcctct ctcccccgtc ttcagcccta cttgcattta gaggtgagaa 6240 agatatgggc tgaggggttg tttttcatcg tattgtagat ggaaagcaca ctgcccttgg 6300 ggccatccaa atgtggacct tgatgtagca ccccaccttc tggatggcca tccttctgaa 6360 agtcactgaa tttctcagac tttattctct ttatccataa agaaggagaa taataataat 6420 ccccccaccc tgcccaacca ctgactggtt gggaagctca gaagaaatac tgggcacggc 6480 atcccattgt aatctataga gtgagtcgct tcttaatatt aaatggctga acacagaaga 6540 tgtgcaaaaa gtactgtgtc cccttcctcc tccaactgaa catttcatgc cctttgcacc 6600 ctcattttgt ctaggagctg ccttatgaag ggaataggta cctgctccga gctggaggaa 6660 tctttgccac ttatggtggg gtatggactg agacagagat ggcatgtgac atgcgcactg 6720 agtctcaact ccatgcaggc tctggagcac tctcaaattg gagtactaat gccttttaaa 6780 ttctcacact agcaatcctt tgacctactg atctagggat ctagggaaag aatcgtgatc 6840 ttaacttcaa agggaaggac aaaatgttct gcctcctgtt aaaactccat acactaagtg 6900 cagagactgg atgccttatt aaccttgggt agatgcccaa atgttcaaaa ggtcaaactc 6960 ttctgttccc cagatcgcca gagtcattaa ccagtcacac tattaaatga atgaacagat 7020 gctgaaaagg tacttgcatt actgagattt cttatggtga tggcccctgc ctgatatgta 7080 ttcagcattt tgtagttttc aatgtgcatt agagtatagt ggtgatgaca ttggcctctg 7140 agtttgccac ttcttatatc tgtgactttg gtcaaattgc ttaatctctc tgagtctcgg 7200 tttcctggag ataataatag cttcttcttc ccagggttat catgaggatt acaggagata 7260 atgccccaaa aatgcttagt aaagtgccta gcacctagtc aatgctgaat taaaggtggt 7320 tattcttact tttcgttcat ttgaactttg ttctcaggga gggcaaagga tagacaaagc 7380 cccatagcta gtgaggagta gctgcaagac tagaacccag gtgttctgag ccctagtctt 7440 aggccaagaa caactgttac gtgagatgca cgttttcctt caagggagct cacaattatt 7500 tccatgtaaa ttcaaggact gctaaaagag aactctcctc tgggactgat atcattttat 7560 ttcaagattg atttgaaaca tgttttttgt ttgtttgttt gttttctagg aaagaacaag 7620 agaaccagtc aagctgaatg cctgaagcaa atctctgtta gcgatgtttt caggatgagg 7680 gagagtggtg caagaaacgt gcttccagat gcacatggtt tcctgggact agggttcagg 7740 gtgtcatccc tgggtgttat taagtgtcag aaggagagca aacaagggaa acatctgaga 7800 tccagctaag gctacaccct ggaaatgcaa gcccagctct tgcaaaggac ctcctttggc 7860 cactcacctt ccaggcctta caataacttg tttggactgc aggtttcttg gtggactcac 7920 aggccattct gcttttattt ggtcaacctc agttcacaag cacccagatg ctgagatcct 7980 cagcatgtgc agcagagttt catattagca ctgggtacct ttctgaggct acagggatac 8040 cgtacagcag cacctgtcac gtccagccaa aggagtgggc tctctcaatg tcatccaatg 8100 ctgtttcaac tgtgaagaag accatctgag agagttgctt ttggaggctg aggcaaattt 8160 ttaaaattct ttgttctcct caactggggt gaattcttgg tcttctagga cagcttgaag 8220 ttttagaaag agtcaagcca ctcagaacca acagagaact ctttcagaga acaaggtgtg 8280 gcatagagga ggcagagggc tgatcttgat caaatccaaa gtgtgactct aaagcaatga 8340 atgtgaattt ttggcaaagc ttacaaaggg ctctaaaggc catctgcaaa gagaagccaa 8400 gcctgatcga tgaatcacta gtgcggccgg atatcgatcg gcacgctgtt gattttctca 8460 tagtaaggaa cagtgggccc tttcagtccc acttctgtag tctgtggtac tacaaatggt 8520 gagcccatga tgttgccatt catagggtta ttctccagca gtaatgactg gccagccact 8580 cccatagccg cagggctagg atttattgtc aatggaggga cctgcagttc tgcacaagca 8640 gtactaggat gagcacctgg gcccattgca agggtgacat cttcaaggca aggcctctta 8700 attttattag ggtagccccc atcagccatg tctggaaact ggaagtggtc ttcttcttgt 8760 ctcctcttaa cagttccctg tgaatggaag agaagagaag aggagaagag aggagaggag 8820 aagggaagag aggtgacaca cacacacaca cacacacaca cacacacaga gagagagaga 8880 gagagacaga gagaaagaga gagagagaga gagaggaatt tttataaagg tttggcacat 8940 taaagctaat gaacaggaaa tgtgcatgat aaaacagacc tctcagttta aagacttata 9000 gttgtgaaaa ctataaaata cagcctgtct ttggaaccat agtgcttatt tattcattat 9060 tatgtttcat ctaaactgtc taattacatt tcaaataagg cattatgttg tctgtatact 9120 aaaacgggat agaacgttat tcaaagggta atctgcccac ttcaaggaga gttcaacaaa 9180 actatgcaga agtcactaaa tgaaccatgc tgccaaaggc aggcattgga gagaaaacta 9240 gaagtagcta aatagtttta attctttcct gtctacagac acatagattt taacgaagga 9300 ataccatagt atagaattga acttttaggc tgccttctag tcttggttaa atgcatcagg 9360 ctgcagtggt aaaattgaat acaacagagc ccttacagga aagaagtaga tctggatgtg 9420 ttttcttggg gagctgttta aaatactgtt tttgggaaag cacaagtttc agaacagtca 9480 ttgtaggcat cgtattcatt gttccattta tttttacaca cacacacaca cacacacaca 9540 cacacactct cacacattgc tatgtgtaca caaaaataat ttggaagaac ctatacccaa 9600 caatttggag tggtcattta tttgggatga ctggcaattc cctttctatt ctcttcattt 9660 ctgcttgttt gtctttaacg agaacgactc ataatccaaa aatttaaaaa agtataaagt 9720 tatctaaata agaaattttc ctctgaagat gcatcctcag gttggggaga tattaaacaa 9780 tgagaaaagg ccccaatctg ggatctgaac cttgggggag ctgcccatca tttatagaag 9840 cacagccttt gggaacaaag caaagtcact agcaatgtga gacttcctac tcttcatggc 9900 ttcatacagt catccatcgc tgttgtgtta atgaccatga cctgtatgtt agcaggtaaa 9960 tgggaaagga agtgggggca aaggagtatg tgcaggaatg atcaaaataa ggaaaggaag 10020 agagggatct ggaaatcacc tgaatgccga taggtgaaca ggtagaattc ttttaaagct 10080 tcccccaccc ggtacccccc aaataacccc tttccagctt tggaagtttc actaggacat 10140 acagtgctca tcctctgatg tcaccttaag tttggctctt ctggtttgat gagcttgtag 10200 cccactagga gctcaaggca tgcatggggc cacttgccag cacgatgagg ggcatgactg 10260 tcatggccaa gtgaacatca aagcagatcc ccagggctgt atgtctcagg ccttggtgca 10320 catcagaatc acttagaaac atccacattc ctgggccctc ccaccacaaa ctgacagctt 10380 catccagggt gtggcccagg catcgggagt ttttccaaca gctccatggc tgattctcaa 10440 cagaaaacca ctggcccaga gcaagggtgg aggcagcgtg gcatagggct ctgaccttgg 10500 ccttgccact gaacctctca gagccccagt ttctttatgt gtaaaatgag tgtaattata 10560 gttcttttct catgaaggtg ctctgactat taagtgaaac ggggcacatt gtatgacacc 10620 taatagctcc tcactaactg gtacccggca ttataaaggg caggtatgga agggttctgg 10680 gagtccaata cccttcttaa agacagagag gtctctgaga cccagagagg ggcaggcctt 10740 acccagagtt gctcagccag agggcaacaa ggcccaggtc agatgcaggg cccctccacc 10800 accactcagc tgcctccaga cccactgcct tcgccatgtt gttggtagga cactgcatcg 10860 cccccacaga aggggcttgc caacttgagt gagaggactt gcacacttct ttgacttttc 10920 ttttgagatg cccacaatct gaacaagggc acttcaaggg acagctctgt caccaaactc 10980 atctgaggcc tgaataccat gggtcaggca ggaatgggtt ggagaggtgt agagcaggca 11040 caataagagg gctgaggccc atgcagtcat cagtgcccac tttcccagga gtctgactgg 11100 gcacagcacc catagtgtcc ctgagctggt ccatggagca gctcactaac tgtttggccc 11160 acagcaggtg ctcagtaaat ggcagttgaa cgaatcaatg gacaaaggaa cataaattac 11220 ccaacacaca gggagctcag ccatttactc aatccattat ggagtaacct acaaacaagc 11280 cactgggtcc caaactgaaa ttgtgtctct tctacattct cccaaagaat ccaataggtt 11340 aaaaatagaa atgtatgaaa tagatcaatc agggatgatt gcatgtggat ttgacataag 11400 gatcccctgc agggagtctg agctggcaac agtcaggccc aaagtgctgt ccatgatgtc 11460 tcgaactgca agacagtttt aacaatggcg aagcaatgca gaaccaggca ggccaaggag 11520 ggggtggggg ttggggaaag gaagggaggg aaggggctgt gaggggcaat ggtctggcat 11580 ccctgccacg tgagcctctg aaatttgctg gcagcttcta tgggctccca gagctttcac 11640 ttaattgttg gtctgccact aacctgctgg gagtaaggtg cagggatgga ggaggcaggg 11700 catgaccacc agacactaaa ggtaccagct ggggccactg gcaaagggaa ggaggctgca 11760 cctctcctac atgagagccc gtatacacac accttttcca gcactcatca actgcatccc 11820 aagcaaatgg tccctgatca attccaattc tagaaaccaa ctgactactc aataacaaag 11880 tagatcccag caggccgcca ctgctggagc ggatgccact tttgctatgc caagtctgtg 11940 gctggacagc tgctggcatg tacactcact gactttcata aggatgccta ataaaggggg 12000 caggctcacc tggcttttct caggggtggg gtttggggtg ccgatagagg ctgctgtttt 12060 ggcagagtgg caagctgcaa gcctcttctg agctttcatt tttcaatgga cttcagtgag 12120 aattcacttt gtcagaggcc atgcagctcc atgttttgga tttcatggaa tgagctttca 12180 acagtgagcc tgaagtgccc tggctgaaca gcaagaacac cagccaaccc taaacaaggc 12240 cgaggagagg cggctgtgtt tacacggaag gctcagcctt gctgtaatag cgtctgcctt 12300 caccagacat cagtgaggcg tggaaatcta ttatccagtt aattttgccc ctagataaag 12360 acttgctttc gtgtcttctc tttcacagtc ccatgatctg ttactcatct caactgcgag 12420 aagttggctg ggctttcccc tgtgcccagt gccacactcg tgccttcact gggtcacctg 12480 tgcctgtggc tgatgccgct gaggttttgc ctgcccagac tgggtgtttc tgactaaatc 12540 ccacagccac cattttagat caagggcagg agatagctca ctgctccgga atgacctccc 12600 ctcccagaat cctggtaggg gcggaaggtc cccaaccaag ctcccagccc tttctaaatg 12660 aatctccctg cttcacccat gtgcttttct ccagtctctg cggtcttgat gacagcaggg 12720 tattagtcct agctgtccca cagctcctac ttctttcagg cctctccctg tgacaatcag 12780 tagccactgg caggatttcc tcagagcata tctcgatttg ctttcagaca attagttaaa 12840 aggacactgg accccagacg tcccaactcc cagccagagc cctcacaggc ccggcctttg 12900 gtggtgagga agggggaggg agtgagtgac agtgccctgg catcttttag aaacgaattc 12960 ctttctctcc atacataaat gcctgcagag tcccatttca gaatccggca gacaaagcca 13020 ccaatgtgat ccccatgacc ttataaacat tcattaaaat gcatttcaag gcatgtgatg 13080 gcctccccac cccctagata atgagaaaac aaaggtttct cttctgatag agacaagttc 13140 agctctgaag tcaacattat ttctggttct gtctgaacaa tgacatatgg caactcttcc 13200 ctttctatag ttctagtcca gaatgacaaa aaaggggaaa aatttcttag agaaggtaga 13260 gattatacga atacagtcca tgaaatgagc ataaggagaa taaagaatat aacttatcca 13320 aagaagtctg gcaggctgtt ataaatgctt gattttggac actgtagttg gaggtttaac 13380 atggacacca ataaaaaggt cagcaaaggg tatgcactgt tcctattggg caagaagata 13440 ggaggtcaaa ggtaaccagg aaagataaac tcagggagac ttattttccc tccagagggc 13500 actgggcttg taggccctgg gcaaaattgt caaaaaggtg aaaatcgcct gtggtttatt 13560 tagtctgctc tttcttcact agtgcctcac cagttcagtt caggccaatt tgctagccag 13620 ttctcctagt ctcttccctt acatccatac tccatgaaca actttattca atattgttac 13680 attttccccc tatgaatttt gaggcacctg atgttggcca actaaattag acttcaagcc 13740 ctctgaggac aaggatggcc cccagtagac tatctcagaa gaaagtaatg aagatgtcgt 13800 ggggcatgat ggaggtagct gtagaataga taagaaaata atgtatcagg aatgggtttg 13860 aagagacaaa gagatggggg atggagagaa agagagagag tgagagcgag gaggagagaa 13920 agacagaatg aatatgtttg catttgcaca tgggatcaaa ggaatatccg tgtgtatagt 13980 atcaatgcct gtatttgggg atgtgttatt tacatgttta ttttcagcag aatgtcccag 14040 caaactgaaa ctgatctttc tgtagaacaa acaggatttt gagcatttcc agaattgcaa 14100 gacatgaggc tctggagaat accagggtgg ttgggaatgg cagggaaccc tgaatgctaa 14160 tgctgattgg cttcaagagg agtcagttat gtctcaggag caaatctctg ataatgggtg 14220 gtttggagca agaacctcga cctacaaatc ggggatttat tggtgtccct gattcgccct 14280 gaaccagcac tcgatgcagg cagatgcagg ctgcggtgga ggaaggggcc ctggaatgca 14340 catgagaaga cctgcagtta agtcctagct cctccgtttg ttgtgtggct gtgggcaagc 14400 cactcccctc cctgaagctc aatttcttct tctgtaaaat gggtacttgg cccaccatgt 14460 gtgcttcaca gcattagtga aaggttccac tgtactcact gaggagagca cttggggagc 14520 agtaatcact actgatatca ttctcaaggc cctgtgtctt tgtgttgggc ctctgttgct 14580 ttcttacaaa taaggatgca ttcactagga tagggggatg gagtggaagt agggggaggc 14640 aagcagctta gtcctgacag cactgacctg acagcactga cctgacagcc agggatgctg 14700 tcttggtggc tgagcctgga aactcctgcc tcctgctgct tgccaccacc tgccactctg 14760 aaggctgcca cagtcatcag cctttagcca ccctgacctg agggctgggg cttcaacagg 14820 cttctgccag aactatctga gcagcagcct ggagtggctg gaagtgcact gacaaaggca 14880 gagatgagca aacctgggtg ggcagtgttc tagaactact ttctcctttt ctgtagtgta 14940 gacatgccag ttggaagaac tgacagctct aaggatgatc ctcaacctat agatgtatat 15000 gaatttaatg agctcagaat ttgtattgta ccatctcctg agaagaatca aggtattctg 15060 ccattgaaca agcatttgtt gagagctagc ctctaactcc tagaccgtca gaactgctgg 15120 gcccttcaag acgggctgct cacacccact catgttaagc ctggtgaggc ctgtactctg 15180 ttttcacagg aagaaatcct cacccagtct tccccaaaca cattcccagg ttctgtcatt 15240 agtgggatag agatgattac tgtggggaga agagaaacat ctggatggat ttggtgaggt 15300 tgatctatag aggaagtagg tgctgcctga ggtagctgta atagaagcta aaggtcaaag 15360 gagagggccc tgtcccaatc cagatgactc cacttctgct ggacccaggt tcacaagctt 15420 aatctacatt tcacctaaat ttggctaaca agcccaaaat cacacaggca aagggagaag 15480 tggaggcaga accgaggttg gaggccacca gggccaccgg gcagagatca tttaagccca 15540 accttctcac ttctccctgg gctctgcctc tcttaaagga ccttgtggtg tgacctcttg 15600 taggtccctt tcacactcgg ggcctcagtt tccccactgt aaagtgaatg ggtcccagct 15660 ttggtaagct tatgcttacc tgatgctttc ttcctgggct gctcttgtag agaaaagata 15720 aatcttcttc ctccatccac gagggcttct ttccctgggg gtgagagtag gctgaggaga 15780 gccacttgca cacactctta aagaaagtat tacctgcacc agctcagtga gaggcacaga 15840 tcagactgtt acttgaatca aattatgagc ctccccaaat atatctatga catttaaata 15900 ggggattact tgaacataga ctttgggatc cggtgtggag tgcaggagac tagcaaagtg 15960 aatcctgaga gtagcaggtc tgcacctgtt ggatcgagaa aggcggccta caattctggt 16020 caaatgagct gtgcttattg acatattcta ttagagagta ctaccaggtc accagtcacc 16080 agaaaggctg ccagctctcc aaccacctcc agggaactat cctgaatggg gccttaacaa 16140 gcctaagaga gggttggttt gggtcccaag ccaatatttg ctctgcttta tgtcagtcat 16200 atggaaccca aaccaaccct ctcctatgtg cctcaccagt cggtgcaggg atcccaattt 16260 caagtttggt tttttatggt caaagtccag catagattaa atgaaggggt gtgatgatgg 16320 tgttaaaaga gaactccaga ccagtttaac tcttggacac acatcccatc tcaccatggt 16380 gcttccaacc ttccagagat gatgggctcc tattttctga tgacaaagcc ctccacagga 16440 ttgctgcctg gccatcaggg agtgcctctg taactgaggc tgagatccca ctttcagtcc 16500 tccagctgtg gcccatccct gctccgccca ccgggtatgg cctgtcctag gctcttaggt 16560 atggctgcat tgtgaaatga tggctacaga gctggcatct cctgtagtct ggttcatcta 16620 gtgcactacc tcatagttaa aagaaatctg tttaagccac tgagggtggc tcctagtgcc 16680 aactccaaga acaggaagct tccctttttt gggaggaggg gcagatggta acatggatcg 16740 tccaggtcaa tgggagcagg gcaaccacag taagtactgg acaacaacac aaaactccat 16800 gtgtggcttc catcgagtcc ctctccaatt ggtttggtct tctccgtccc atgcagcact 16860 ttagcaaggg gcctggctga aggctatgaa ttgtgtggag cctcctcatt gcagtctcca 16920 accatctgat gctgggaaaa tgtcaccagg atgcagccat gccgtgtggc caatgaaccg 16980 agaaaacacc ccttttctag aatgctctaa agaggcagaa taatccagag gtgaggaagg 17040 aaatactcca ccagagaccc aggcagttcc tacaaaagcc agactttcct tcacctaggg 17100 agtgacaaga ccagtggaaa acactctcaa gcagtaaccc ccaaatgctc tgcaagccag 17160 tggcgtccag ataccgcaca agcgagtggg ctgtctaatc ccatcatcat gatgtaaata 17220 tctctaggct gccctgggct gtgcctgacc ctgtcttcag ctttccacac ctccacctac 17280 agcccatgca cagaaggacc acccaggaat gctgcaagtg tggcacctcc agggccaccc 17340 agggagaagg agggcagcta tgctggtggc tccaggccca tttggcgggt ggtaccttca 17400 caccacaaag cccaaactga ggccccagat ttggctgatg agggcatatt ggacaggggt 17460 cacttatgct cttccccatt gccacctggc ctctggctac ctggacttgg ctacctgtgg 17520 atcctctcac aggtgccacc atcttggctg agtctccaga tgcgaggtcc ctgaggcagt 17580 ggcaggcttc tcgctaatgc tgatgggatt aggaatggga taggtgggga gggccctgga 17640 ctgggccctg atgagccaag tgggttttta gaggggctac tggtacattt cagggacagg 17700 acatctggta gagctaagct ggggcaataa ggagccactg ctaatctgag agctagaaac 17760 aatcagcttc tgggtcatta ttaattaggg tagtttgggc tgtgtggaag tcacgtacta 17820 tatggggtag ccacagctct ctctacagat aatctctaag acttctgatt gggaccgtgt 17880 gaatgcagta gcaatatctc ttcttactgc caggccctgc cagtcctgcc tccacgccct 17940 ggctggcccc ccttatgatc tgacccatgc caggctgcca tagtatgtta cttctgcatt 18000 agcactcctt gggacctgcc tctccactgt ccctcagact ttaaagaact atacaaaccc 18060 aaggggctct tcccaagaga attgatatga cttgaggtga ttccatttct ggaagtagtc 18120 actccatttt ctgcctcact ctttcagtgc ttcacagagc aggttcgaac gaaggagcca 18180 tccaactaac cgtcatgttc gggcaaccga agaagggagt ggcaggattt cctttggaga 18240 cttctggaat tagacagcag tttaatgcaa gcatctaaat tctcttcctc ccagagtctc 18300 attaaaacta cagtaagagt ttgtgttttg ttttgttttt aaagacaaaa tcccaccagg 18360 atagagagaa taggagagga gataacagca tcataattta tgaaactaaa atgcagatag 18420 accaggatta actgactaca cagcaccaag gaagctgaat cacaagacag cagaggagaa 18480 aactggaaag gatcgtggtc tatacggcag aatcttccca agcctcagga ggaggagctc 18540 tagatgttcc cagatctggg aggtaaagtg gaatgggggg acatggtcag cgtaatgggg 18600 ttgggctgga agctggttaa ggagcaggca gatctctgaa tcccctctct gactctgtgt 18660 ccccaggcat ctgcctgtcc cccaccctgg aagaggtctg gcttgaccct ttgtctggtg 18720 aatttcctgc tctgctttcc tggtcctgct ggccagatca gtggaggcca ctcacttcac 18780 cccacaggga tgttctgtgt tgccctacac ctgggaactg gaggtactgg aggcaggctg 18840 tggtgagctt gaaagcaaaa cacagagggc agtccaatct ctttggccat atttcttctg 18900 catatccaat accatgtcca caactctgct agtgtcctga tggtggtggg ctctacacat 18960 tcccgggaag ctgaaggcag ataatgacca ggacaggtca acctctcttc ttctgaaagc 19020 cttcatctac taatggcctg ggactcttcc cttaaatgct tagattgtgt cttccactaa 19080 ggttttttgc tgttgctgtt gtttgtttgt ttgtttgttt gtttgtttgt tttgagacgg 19140 aatctcactc tgtcgcccag gctggagtgt agtggcacaa tctcagctca ccacaacctt 19200 cacctcctag gttgaaggga ttctcctgcc tcagcctcct gagtagctag gattacaggc 19260 acatgccacc atgcctggct aatttttgta tttttagtag agacaggatt tcgccatgtt 19320 ggccaggctg gtcttgaact cctgacctca ggtgatctgc ctaccttggt ctcccaaagt 19380 gctgggatta ctggtgtgag ccaccacacc cggccaaggt ttttgtttgt ttgtttgttt 19440 gtttgttttg tattgaggca gggtatcact ctggtcaccc aggctggagt gcagtagtgc 19500 aatcacggct cactgaaacc tccacctccc tggcgggctc aggtgatcct gccacctcag 19560 cttcccaggt agctgggact acaggcttgt accaccactc ccagctaatt tttgcgtttt 19620 tagtagagac agggtttccc catgttgccc aggttggtct caaactctgg gctcaagcga 19680 tctgcctgcc tcagcctccc aaagtgctgg gattacaggt gtaagccacc gtacccggcc 19740 ccgccactaa ggttttgaaa atgaagcaat tacaagttta agtctattaa taagtgatga 19800 agctatgtag aaaagcagaa taattatctt ggatcaggaa ggtcacatga ggatctactt 19860 gggggttgtc aatattctat ttcttgacct gatcagtgtt gacagcaggt tttaattttt 19920 tacttctttt tgtttgtttg tttttgagac ggagtcttgc tctgtctccc aggctggagt 19980 gcagtggtat gatctcggct cactgcaacc tccgcctcct gggttcaagc tgttctcctg 20040 cctcagcctc cccagtagct gggattacag gcaggcacca ccacgaccag ctaatttttg 20100 tatttttagt agagactggg tttcaccatc ttggccaggc tggtctcgaa cttctgatct 20160 cgtgatccgc cctccttggc ctcccaaagt gctgggatta caggcttgag ccagcgtgcc 20220 cggcccattt tttacttcct tattaaactg tacatatagg ccttgcacac ttttctgcat 20280 caatgttata ttccacaata aagggaaaag gtatatacac aacttgatac cagtaatgtg 20340 aaacatatat ttctacatag aaaaaaaaat gactgaaata ctgcactcca atgtgttcac 20400 acagtagttg tttctggatt atttatatat taaatgttta tatattgtat tatgccatga 20460 ggtttgtgtt ttctctccac ttttctgcat tttccaagtt tactacaaag agcacatatt 20520 actcttataa tcagaaagtc ataaaatata tttaaaaaga caaaattgaa actaataagg 20580 atcaacacaa aacagatgag ccatctgtgg aaatccgcac agaatactac ctaaagagat 20640 tggtgacgtg catgatctca ctaggatgag cacaaagctt gccagagcct agggtctatt 20700 tctagggttg gctcttggaa gccaggatag ttgttatctc tgggaagagg gaggggcaca 20760 caaggggctt ctaaaacatt ctgaatgttc tatttctgaa cctggttggt gggtacatga 20820 ctgttggttt tattattata tgttttatat actcttccgt atgtatggtg tggattccaa 20880 aaaaagattt cctttagaga aaaccagaat cacataagta gaaaatatgg tgctatgttg 20940 aaggaacaac tcaagtttat ataaaatcat catcatttat aggcttaaaa agttgctttg 21000 gaattttggt ctaactgact tgtcttttct gcagcaaacc acgctccttc tggacgtgct 21060 ccaggcagag gggattaggg tgggttcaag gctgcaagta cctagctcag cacactctct 21120 tcaggggact tagagtttgt ctggtgttgg ctctctgagc tcttgtcagg aatgccgacc 21180 cttccgaggt tcaggatttg aagcctgcct tcccacccca gatttggtcc acacagacac 21240 tcaagtatgt atttcaacta caaatgacct gtactttcct attactcctc tctttcatgg 21300 taacctttct ggtatccttc cttccctaca tttatgggag ggggacatca ttctctgctc 21360 tcctgtcact gaaggctcca ccttctgtct tcttctgacc catctggttt tcctggggcc 21420 acctcctctc cttaccaccc taacgctttt gtaacttgag gagaaatgag agatcaccta 21480 gtcaggtcat cattctctgt agatgaagag gcccaatggt ttgctcaaga attgccaagc 21540 gagttaaaga cagagagtat gagagtcagc aagacctaca gaaagcatct atctgcactg 21600 ttttgcaggg acttagcctt tgtgtgtgga ctcctggaat gccacccact aagaaacatt 21660 gtctgacacc aactccccac ttggtaggtg gggacactga aactcatggc aggaaagggc 21720 cttgccccaa gccagggcag agtgtcactc atcactctca attttcagtc cagggcacct 21780 tgttgtgact atcccaaagg cagccacttt ccctggtctg aaagacctga agagagaaga 21840 gaagagaagg atggaaggca gagtatgcgg ctttgattca tttcctggtg aaaacagatc 21900 tatacgagaa gcaaatttca cgaaagggaa gagaagaaag tgtcccatac gttgctggcc 21960 tgtttcaacc ttgctttgat tcttgctgaa aagggtaccg tgtatttctg agttcaacat 22020 gcagaccagt gttaggaaag ccactgcacc tccactttag cctccagggc tgtgccctgc 22080 aaatggcctg cagccttggt gcctcgctct ccagactgca ttttggaaga tgggacagag 22140 gcttatggaa gcccacatta gaacggggga gcagaatggg tgagatgagg gatccttgat 22200 agtgaaccag atgaaggaat ggtagccaaa tgccaggcct cctttgtggc ttcaatccaa 22260 aggctctgga gcccttccag ggcagaacat caggcatgtt tacccccact gtcctcaaca 22320 gtgacagagg tgcaatcttg ggcagctggc cattttgaaa gcaacctcct taatctcaac 22380 tgggaaggct ccctagcagg acccctgtgt tgcacacctg gaggaagcta gactaaccag 22440 aagctcagca cggttccatc tgggatgccc aggtctgaga cgaaaaaggt aactctcttt 22500 tctgggtcct ggcccagttg tgtctctctc cacctcattc tctgagatgc ctgtctcccc 22560 ttttttgtcc catcaggagg caagagctat cactgggcca gactccacca gaagccaagc 22620 cagcttgtta cccagcttct cagggagcaa agaacagcct tgtttctatc ttatccccac 22680 tgtcccctgc ccctgcccca cctcccagcc attcagcttc tggcttcccc agagctgcct 22740 gcttctttgt ggtcctccat tccttgaaaa gaccttctag tcattagtgt atataaatgg 22800 ccacttagcc cagattacag tgaggtcaac agctggggct ctgagaattg tcacacactg 22860 gcacaggaga ggaggctatt cttccagaga atttggaggg cactcccatc cacttacaac 22920 aaaaagccca tccactgtgc ttggcagtag gtgatctgag aaccaatgga accaggttaa 22980 tcctgtggca ctgttgagtg aggagagcag tggcgggcac tggaaaatat cagagacaag 23040 gcaggagacc tgaaatctag gcttagctcc tcatatactt ggcagctgta tgacctcaga 23100 caaccagtgt tacctctcta agcctcagtt tcctcatgca aaaggagggg gaataacaac 23160 agagcccact gcttgggggt gttgtgagga caggatgaaa aaacaaacag aaatccctca 23220 gtacaggatt cagtgcagtg gacagtcttg caaggtctgg ttcagccctc cacccctacc 23280 ctcaccagta taaagaactc tggcctacaa gtcagatgac ctgagtttta atctcagctt 23340 tgccattagc cgtgtgaact tgagaaagtc cctttccttt ttacatctat tgggatgatc 23400 atgcattttt tgtcctttat tctgttaata tagtgtgtta cattgattgc ttttcataga 23460 ctgaaccagc cttgtattcc agggataaat ctcacttggt catggtgtat aatcctttat 23520 acaaatgttg ctgggttgag tttgctagta ttttgttgaa gatttttatg tcttgattca 23580 taaggaatat tggtgtacct tcccctttta tggccacagt ttccctacaa tgatgtagtc 23640 gaactagaca acctccaata tctttcagta ttcatgtcct ctgattctgt gaaactaaga 23700 aaattaagaa atagtgattc ataggcacaa ggcaggcaaa acttagactc cttgtagaat 23760 aattaggaag ccaaatattc agtgtgctta tttctcaaat aaccttagtt tctccagtct 23820 gccccaactc cgaggcctga atatctctag atgcttatga tggcaactaa agcctaaaag 23880 ctaattcatt ttaaagttct tccaaatgca tagggtttta tttttccaga cctgggttca 23940 gatggggaat ttgacaaaca atggaaaggg ggaaaaacaa caatctaaac actgagtgac 24000 aaagtaacaa agaaatagtc tagctatcag ccagtcaagc cagccttggc tttgctatcc 24060 aaagtagtca gtctaattct accaccagtt tctgttcctg tagctgtcta ctgcctgcca 24120 gggactctgc cttcccaccc acaactacca atggaaggat gtggtgacca taccagtggc 24180 tgctgacatc tcctgccatg ggaagcataa ttgcctccag cagcctcccc cttagatcca 24240 tcatttttgt tgcacttggc ctgggctgta ctcccggcca atgactgaac atggtgagca 24300 tagtaatgca ggcccatttc tgtgaggagc aggactcctc cagtaggtga ctttggctca 24360 aggactctct attggcctgg ttgaactttt cctgaactgt gctactgtct gagactcttc 24420 ttacccaatc ctctttctcg ccccaattgt cacagaccac ctgcattgtg gtctgagtct 24480 ctccccacct tctcttgctc ttccctgttt atctttcaca ggcatttccc ccagtacatt 24540 ccttgaatgt ctaacccgat acgggtgcct gacttttggc agacctaagc agacaaaaag 24600 gagtacttgg ttacctagct cttctttcta ccacaaacat cgagggaacc ctttttccct 24660 cacccctctg ccacaccccc actgccccag tgaacaacca cagagagagc tgtggtataa 24720 tattaggctg gtgcaaaagt aattgcggtt tttgccatta cttttaatgg taaaaaccgc 24780 aattactttt gcacctacct agtatttgtg tccccccaaa ttcatatgtt gaaacctaac 24840 ccacaatatg atgtcattag gaggcaagac cttgaggagg tgattagatg atggggtgga 24900 gctctcctga atgagattag tgcccttata agaagaagcc caaggaagct accttgactc 24960 ttccatcaca tgagaatgca gcaagaaggc accatctact aatcaggaag agagctctca 25020 ccagacactg aatctgccag tgtcttgatc ttgaagttcc cagcctccag aactatgcat 25080 aatgcatttc cattgtctct aagccaccca gcctatggta ttttgtcata gcagcctgaa 25140 ctgactaaga cagtgagcca catgagaagt gccccaaccc ctcccttaag cacttggctc 25200 acagatcagt gggttcattt ctgcctgagt tttattgtta ttctgtagat ttcttgggct 25260 agatatattt ttctgttatt ttccttcttc acctcagtca tgaattggtt gttttaaaaa 25320 agacaatgta agtcatgggg aaactcctga caactctact ctcctagggt tcctgataaa 25380 aggggattca gttgagtcct ctgatggtct ctacctgcca aagtccagca gcccttagca 25440 aacatgctgc tcgtttctgt agagaaggtg ctggtgtccc accatacttc tctctccctc 25500 atgaagggct tgcgacccag caaatgggtg gcttatatgg gtctgtttca aaggaagagc 25560 cagctctggg aagaaaaacg atgagcataa gcataaccta ccactgtgcc tgggaaagca 25620 gacaactttt ttgatgtgtg aatatctaat gagaatggaa tccatcaatt accttaaact 25680 taggcacagt cttcaaattc aatatatgtg ggatatactt ttagtcagtt tgtagacgtt 25740 atttgtaata aataatctgg cttctctaaa gaaattattt taagtgtttg gtttggtttg 25800 atttaatggt aaaattatat ttagtggcag agaattatag caatggtgat aaactataga 25860 gtgtcataag ttcatatctt attctcacat ttgaagctgc ctgcagatgc attcaagatg 25920 cagccagaag tcaggagact caggctgtta tttggagctc atcattttac agccttgctg 25980 gactcccact ttctcagggg aaaaatgtgg tgttgaccca gattagctct ccaggccctg 26040 ctgagttggg cactctgtaa gctggagggt cttctattgt cttcacctaa gtgtcaatca 26100 acaacccaaa tgggcatggg ggaagaggga gctgggccaa tgcccagggt gcctggtaga 26160 gagatacctt gggcactgga aggcaccagc ttcccagaga gaagggggag ggccatgaaa 26220 aagttggctg tagatgccag ggacactggg actctccagc tgtgtgtttg tgtcttctga 26280 agacttatgt ttcattcctt tggagcatgc ataatcatac actgtgggat gtgttatata 26340 gattgcttga tagttcacca ctgtaataaa atactgtgac tggaatctgc tcccagtctg 26400 cctttgatag cacttgtgca acacacattt actgagcatt tacagtgatc caggacctgt 26460 gttgtgaaaa cattgatgga caaggcagat ggtggagcac gtcagtgagg atttttaaca 26520 aaggctggta agtgctataa aggaacattg taggacacta gagaacaaag aacaggagaa 26580 cctgacttag gctggggtgg ggcgttggtt agaggaggct ccttggagga catgaggttt 26640 aagctgtgac ctgaggatga atagatgttg gccaggtgag gttaattaag cttgtcagcc 26700 ttaccagtaa aaaagaaaac ctattaaaaa aaggcttacc agagaaagta cagcgggcac 26760 acaaaccaca agctctaaag tcactctcca acctctccac aatatatata cacaagccct 26820 aaactgacgt aatgggacta aagtgtaaaa aatcccgcca aacccaacac acaccccgaa 26880 actgcgtcac cagggaaaag tacagtttca cttccgcaat cccaacaagc gtcacttcct 26940 ctttctcacg gtacgtcaca tcccattaac ttacaacgtc attttcccac ggccgcgccg 27000 ccccttttaa ccgttaaccc cacagccaat caccacacgg cccacacttt ttaaaatcac 27060 ctcatttaca tattggcacc attccatcta taaggtatat tattgatgat gtttaaacta 27120 cggcccggta cccagctttt gttcccttta gtgagggtta attgcgcgct tggcgtaatc 27180 atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 27240 agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 27300 tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 27360 aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 27420 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 27480 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 27540 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 27600 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 27660 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 27720 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 27780 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 27840 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 27900 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 27960 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 28020 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 28080 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 28140 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 28200 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 28260 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 28320 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 28380 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 28440 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 28500 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 28560 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 28620 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 28680 ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 28740 atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 28800 taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 28860 catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 28920 atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 28980 acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 29040 aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 29100 ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 29160 cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 29220 atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 29280 ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 29340 gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 29400 acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 29460 cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 29520 tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 29580 gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 29640 cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 29700 gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 29760 gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct gcgcaactgt 29820 tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 29880 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 29940 acggccagtg agcgcgcgta atacgactca ctatagggcg aattggagct ccactacgta 30000 gtttaaacat catcaataat ataccttata gatggaatgg tgccaatatg taaatgaggt 30060 gattttaaaa agtgtgggcc gtgtggtgat tggctgtggg gttaacggtt aaaaggggcg 30120 gcgcggccgt gggaaaatga cgttttatgg gggtggagtt tttttgcaag ttgtcgcggg 30180 aaatgttacg cataaaaagg cttcttttct cacggaacta cttagttttc ccacggtatt 30240 taacaggaaa tgaggtagtt ttgaccggat gcaagtgaaa attgctgatt ttcgcgcgaa 30300 aactgaatga ggaagtgttt ttctgaataa tgtggtattt atggcagggt ggagtatttg 30360 ttcagggcca ggtagacttt gacccattac gtggaggttt cgattaccgt gttttttacc 30420 tgaatttccg cgtaccgtgt caaagtcttc tgtttttacg taggtgtcag ctgatcgcta 30480 gggtatttga ttc 30493 <210> 55 <211> 14414 <212> DNA <213> Artificial Sequence <220> <223> pWE15-A2 <400> 55 ccacgacggg cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact 60 ggctgctatt gggcgaagtg ccggggcagg atctcctgtc atctcacctt gctcctgccg 120 agaaagtatc catcatggct gatgcaatgc ggcggctgca tacgcttgat ccggctacct 180 gcccattcga ccaccaagcg aaacatcgca tcgagcgagc acgtactcgg atggaagccg 240 gtcttgtcga tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gccgaactgt 300 tcgccaggct caaggcgcgc atgcccgacg gcgaggatct cgtcgtgacc catggcgatg 360 cctgcttgcc gaatatcatg gtggaaaatg gccgcttttc tggattcatc gactgtggcc 420 ggctgggtgt ggcggaccgc tatcaggaca tagcgttggc tacccgtgat attgctgaag 480 agcttggcgg cgaatgggct gaccgcttcc tcgtgcttta cggtatcgcc gctcccgatt 540 cgcagcgcat cgccttctat cgccttcttg acgagttctt ctgagcggga ctctggggtt 600 cgaaatgacc gaccaagcga cgcccaacct gccatcacga gatttcgatt ccaccgccgc 660 cttctatgaa aggttgggct tcggaatcgt tttccgggac gccggctgga tgatcctcca 720 gcgcggggat ctcatgctgg agttcttcgc ccaccccggg ctcgatcccc tcgcgagttg 780 gttcagctgc tgcctgaggc tggacgacct cgcggagttc taccggcagt gcaaatccgt 840 cggcatccag gaaaccagca gcggctatcc gcgcatccat gcccccgaac tgcaggagtg 900 gggaggcacg atggccgctt tggtccggat ctttgtgaag gaaccttact tctgtggtgt 960 gacataattg gacaaactac ctacagagat ttaaagctct aaggtaaata taaaattttt 1020 aagtgtataa tgtgttaaac tactgattct aattgtttgt gtattttaga ttccaaccta 1080 tggaactgat gaatgggagc agtggtggaa tgcctttaat gaggaaaacc tgttttgctc 1140 agaagaaatg ccatctagtg atgatgaggc tactgctgac tctcaacatt ctactcctcc 1200 aaaaaagaag agaaaggtag aagaccccaa ggactttcct tcagaattgc taagtttttt 1260 gagtcatgct gtgtttagta atagaactct tgcttgcttt gctatttaca ccacaaagga 1320 aaaagctgca ctgctataca agaaaattat ggaaaaatat tctgtaacct ttataagtag 1380 gcataacagt tataatcata acatactgtt ttttcttact ccacacaggc atagagtgtc 1440 tgctattaat aactatgctc aaaaattgtg tacctttagc tttttaattt gtaaaggggt 1500 taataaggaa tatttgatgt atagtgcctt gactagagat cataatcagc cataccacat 1560 ttgtagaggt tttacttgct ttaaaaaacc tcccacacct ccccctgaac ctgaaacata 1620 aaatgaatgc aattgttgtt gttaacttgt ttattgcagc ttataatggt tacaaataaa 1680 gcaatagcat cacaaatttc acaaataaag catttttttc actgcattct agttgtggtt 1740 tgtccaaact catcaatgta tcttatcatg tctggatctg acgggtgcgc atgatcgtgc 1800 tcctgtcgtt gaggacccgg ctaggctggc ggggttgcct tactggttag cagaatgaat 1860 caccgatacg cgagcgaacg tgaagcgact gctgctgcaa aacgtctgcg acctgagcaa 1920 caacatgaat ggtcttcggt ttccgtgttt cgtaaagtct ggaaacgcgg aagtcagcgc 1980 tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta 2040 tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa cgcaggaaag 2100 aacatgtgag caaaaggcca gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 2160 cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 2220 caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 2280 gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 2340 tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 2400 aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 2460 ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 2520 cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 2580 tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc 2640 tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 2700 ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 2760 aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 2820 aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 2880 aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 2940 gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 3000 gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 3060 caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag 3120 ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 3180 attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 3240 ccattgctgc aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 3300 gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 3360 ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 3420 tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 3480 gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 3540 cggcgtcaac acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 3600 gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 3660 tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 3720 ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 3780 gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 3840 tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 3900 catttccccg aaaagtgcca cctgacgtct aagaaaccat tattatcatg acattaacct 3960 ataaaaatag gcgtatcacg aggccctttc gtcttcaaga attcggccgg ccgtttaaac 4020 atctagatgg tacctcatgt ttgaccgctt atcatcgcga taagctttaa tgcggtagtt 4080 tatcacagtt aaattgctaa cgcagtcagg caccgtgtat gaaatctaac aatgcgctca 4140 tcgtcatcct cggcaccgtc accctggatg ctgtaggcat aggcttggtt atgccggtac 4200 tgccgggcct cttgcgggat atcgtccatt ccgacagcat cgccagtcac tatggcgtgc 4260 tactagcgct atatgcgttg atgcaatttc tatgcgcacc cgttctcgga gcactgtccg 4320 accgctttgg ccgccgccca gtcctgctcg cttcgctact tggagccact atcgactacg 4380 cgatcatggc gaccacaccc gtcctgtgga tctgcctcgc tggcctgccg cagttcttca 4440 acctcccggc gcagcttttc gttctcaatt tcagcatccc tttcggcata ccattttatg 4500 acggcggcag agtcataaag cacctcatta cccttgccac cgcctcgcag aacgggcatt 4560 ccctgttcct gccagttctg aatggtacgg atactcgcac cgaaaatgtc agccagctgc 4620 tttttgttga cttccattgt tcattccacg gacaaaaaca gagaaaggaa acgacagagg 4680 ccaaaaagct cgctttcagc acctgtcgtt tcctttcttt tcagagggta ttttaaataa 4740 aaacattaag ttatgacgaa gaagaacgga aacgccttaa accggaaaat tttcataaat 4800 agcgaaaacc cgcgaggtcg ccgccccgta acaaggcgga tcgccggaaa ggacccgcaa 4860 atgataataa ttatcaattg catactatcg acggcactgc tgccagataa caccaccggg 4920 gaaacattcc atcatgatgg ccgtgcggac ataggaagcc agttcatcca tcgctttctt 4980 gtctgctgcc atttgctttg tgacatccag cgccgcacat tcagcagcgt ttttcagcgc 5040 gttttcgatc aacgtttcaa tgttggtatc aacaccaggt ttaactttga acttatcggc 5100 actgacggtt accttgttct gcgctggctc atcacgctgg ataccaaggc tgatgttgta 5160 gatattggtc accggctgag gtgtttcgat tgccgctgcg tggatagcac catttgcgat 5220 agcggcgtcc ttgatgaatg acactccatt gcgaataagt tcgaaggaga cggtgtcacg 5280 aatgcgctgg tccagctcgt cgattgcctt ttgtgcagca gaggtatcaa tctcaacgcc 5340 aagcgtcatc gaagcgcaat attgctgctc accaaaacgc gtattgacca ggtgttcaac 5400 ggcaaatttc tgcccttctg atgtcagaaa ggtaaagtga ttttctttct ggtattcagt 5460 tgctgtgtgt ctggtttcag caaaaccaag ctcgcgcaat tcggctgtgc cagatttaga 5520 aggcagatca ccagacagca acgcgccacg gaaaaacagc gcatacagaa catccgtcgc 5580 cgcgccggac aacgtgataa ttttatgacc catgatttat ttccttttag acgtgagcct 5640 gtcgcacagc aaagccgccg aaagttaacg gtttgcccag gctcacaact gaaagacttt 5700 ctacggtgtg cgcgtgcgat gcgcgtagaa gactgattta tcaacctgtc tttatatcag 5760 gattcattac ctgactattt gtgggtaaag ttcgtagtgc gctgatcgtg caaaatgatt 5820 ttagttggga acagttcgca actctgtccc ataaaaatca gcatattccc atctatccca 5880 tatccagcgc attgaccatc gggatactga agggagattc catcatctct tagaaagatc 5940 accatctctt ttgtttcaat ttgcatatag ctacctggag gatttatgaa tacaaggatt 6000 ttcatggact attaccatga gattgatttt ccatctttat tcgcgagagc agtggaaagc 6060 gatgacgatg tgggtactac attgcgcatt cacctacttt gtgagcgcat ggtcgaagca 6120 tggatatgcg catgctgtga ctgccaagat cctctacgcc ggacgcatcg tggccggcat 6180 caccggcgcc acaggtgcgg ttgctggcgc ctatatcgcc gacatcaccg atggggaaga 6240 tcgggctcgc cacttcgggc tcatgagcgc ttgtttcggc gtgggtatgg tggcaggccc 6300 cgtggccggg ggactgttgg gcgccatctc cttgcatgca ccattccttg cggcggcggt 6360 gctcaacggc ctcaacctac tactgggctg cttcctaatg caggagtcgc ataagggaga 6420 gcgtcgaccg atgcccttga gagccttcaa cccagtcagc tccttccggt gggcgcgggg 6480 catgactatc gtcgccgcac ttatgactgt cttctttatc atgcaactcg taggacaggt 6540 gccggcagcg ctctgggtca ttttcggcga ggaccgcttt cgctggagcg cgacgatgat 6600 cggcctgtcg cttgcggtat tcggaatctt gcacgccctc gctcaagcct tcgtcactgg 6660 tcccgccacc aaacgtttcg gcgagaagca ggccattatc gccggcatgg cggccgacgc 6720 gctgggctac gtcttgctgg cgttcgcgac gcgaggctgg atggccttcc ccattatgat 6780 tcttctcgct tccggcggca tcgggatgcc cgcgttgcag gccatgctgt ccaggcaggt 6840 agatgacgac catcagggac agcttcaagg atcgctcgcg gctcttacca gcctaacttc 6900 gatcattgga ccgctgatcg tcacggcgat ttatgccgcc tcggcgagca catggaacgg 6960 gttggcatgg attgtaggcg ccgccctata ccttgtctgc ctccccgcgt tgcgtcgcgg 7020 tgcatggagc cgggccacct cgacctgaat ggaagccggc ggcacctcgc taacggattc 7080 accactccaa gaattggagc caatcaattc ttgcggagaa ctgtgaatgc gcaaaccaac 7140 ccttggcaga acatatccat cgcgtccgcc atctccagca gccgcacgcg gcgcatctcg 7200 ggcagcgttg ggtcctgcag atccggctgt ggaatgtgtg tcagttaggg tgtggaaagt 7260 ccccaggctc cccagcaggc agaagtatgc aaagcatgca tctcaattag tcagcaacca 7320 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 7380 agtcagcaac catagtcccg cccctaactc cgcccatccc gcccctaact ccgcccagtt 7440 ccgcccattc tccgccccat ggctgactaa ttttttttat ttatgcagag gccgaggccg 7500 cctcggcctc tgagctattc cagaagtagt gaggaggctt ttttggaggc ctaggctttt 7560 gcaaaaagct tcacgctgcc gcaagcactc agggcgcaag ggctgctaaa ggaagcggaa 7620 cacgtagaaa gccagtccgc agaaacggtg ctgaccccgg atgaatgtca gctactgggc 7680 tatctggaca agggaaaacg caagcgcaaa gagaaagcag gtagcttgca gtgggcttac 7740 atggcgatag ctagactggg cggttttatg gacagcaagc gaaccggaat tgccagctgg 7800 ggcgccctct ggtaaggttg ggaagccctg caaagtaaac tggatggctt tcttgccgcc 7860 aaggatctga tggcgcaggg gatcaagatc tgatcaagag acaggatgag gatcgtttcg 7920 catgattgaa caagatggat tgcacgcagg ttctccggcc gcttgggtgg agaggctatt 7980 cggctatgac tgggcacaac agacaatcgg ctgctctgat gccgccgtgt tccggctgtc 8040 agcgcagggg cgcccggttc tttttgtcaa gaccgacctg tccggtgccc tgaatgaact 8100 gcaggacgag gcagcgcggc tatcgtggct ggccaattgc aagccatcaa caaagcccgc 8160 caagagtttc tgctacgaaa gggacggggg gtttacttgg acccccagtc cggcgaggag 8220 ctcaacccaa tccccccgcc gccgcagccc tatcagcagc agccgcgggc ccttgcttcc 8280 caggatggca cccaaaaaga agctgcagct gccgccgcca cccacggacg aggaggaata 8340 ctgggacagt caggcagagg aggttttgga cgaggaggag gaggacatga tggaagactg 8400 ggagagccta gacgaggaag cttccgaggt cgaagaggtg tcagacgaaa caccgtcacc 8460 ctcggtcgca ttcccctcgc cggcgcccca gaaatcggca accggttcca gcatggctac 8520 aacctccgct cctcaggcgc cgccggcact gcccgttcgc cgacccaacc gtagatggga 8580 caccactgga accagggccg gtaagtccaa gcagccgccg ccgttagccc aagagcaaca 8640 acagcgccaa ggctaccgct catggcgcgg gcacaagaac gccatagttg cttgcttgca 8700 agactgtggg ggcaacatct ccttcgcccg ccgctttctt ctctaccatc acggcgtggc 8760 cttcccccgt aacatcctgc attactaccg tcatctctac agcccatact gcaccggcgg 8820 cagcggcagc ggcagcaaca gcagcggcca cacagaagca aaggcgaccg gatagcaaga 8880 ctctgacaaa gcccaagaaa tccacagcgg cggcagcagc aggaggagga gcgctgcgtc 8940 tggcgcccaa cgaacccgta tcgacccgcg agcttagaaa caggattttt cccactctgt 9000 atgctatatt tcaacagagc aggggccaag aacaagagct gaaaataaaa aacaggtctc 9060 tgcgatccct cacccgcagc tgcctgtatc acaaaagcga agatcagctt cggcgcacgc 9120 tggaagacgc ggaggctctc ttcagtaaat actgcgcgct gactcttaag gactagtttc 9180 gcgccctttc tcaaatttaa gcgcgaaaac tacgtcatct ccagcggcca cacccggcgc 9240 cagcacctgt cgtcagcgcc attatgagca aggaaattcc cacgccctac atgtggagtt 9300 accagccaca aatgggactt gcggctggag ctgcccaaga ctactcaacc cgaataaact 9360 acatgagcgc gggaccccac atgatatccc gggtcaacgg aatccgcgcc caccgaaacc 9420 gaattctctt ggaacaggcg gctattacca ccacacctcg taataacctt aatccccgta 9480 gttggcccgc tgccctggtg taccaggaaa gtcccgctcc caccactgtg gtacttccca 9540 gagacgccca ggccgaagtt cagatgacta actcaggggc gcagcttgcg ggcggctttc 9600 gtcacagggt gcggtcgccc gggcagggta taactcacct gacaatcaga gggcgaggta 9660 ttcagctcaa cgacgagtcg gtgagctcct cgcttggtct ccgtccggac gggacatttc 9720 agatcggcgg cgccggccgt ccttcattca cgcctcgtca ggcaatccta actctgcaga 9780 cctcgtcctc tgagccgcgc tctggaggca ttggaactct gcaatttatt gaggagtttg 9840 tgccatcggt ctactttaac cccttctcgg gacctcccgg ccactatccg gatcaattta 9900 ttcctaactt tgacgcggta aaggactcgg cggacggcta cgactgaatg ttaagtggag 9960 aggcagagca actgcgcctg aaacacctgg tccactgtcg ccgccacaag tgctttgccc 10020 gcgactccgg tgagttttgc tactttgaat tgcccgagga tcatatcgag ggcccggcgc 10080 acggcgtccg gcttaccgcc cagggagagc ttgcccgtag cctgattcgg gagtttaccc 10140 agcgccccct gctagttgag cgggacaggg gaccctgtgt tctcactgtg atttgcaact 10200 gtcctaaccc tggattacat caagatcctc tagttaatgg atccaatcga tatcgcgaag 10260 tcgatcgacg gatcgggaga tctcccgatc ccctatggtg cactctcagt acaatctgct 10320 ctgatgccgc atagttaagc cagtatctgc tccctgcttg tgtgttggag gtcgctgagt 10380 agtgcgcgag caaaatttaa gctacaacaa ggcaaggctt gaccgacaat tgcatgaaga 10440 atctgcttag ggttaggcgt tttgcgctgc ttcgcgatgt acgggccaga tatacgcgtt 10500 gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 10560 catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 10620 acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 10680 ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 10740 aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 10800 ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 10860 tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 10920 ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 10980 ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 11040 tgggcggtag gcgtgtacgg tgggaggtct atataagcag agctctctgg ctaactagag 11100 aacccactgc ttactggctt atcgaaatta atacgactca ctatagggag acccaagctg 11160 gctagcgttt aaacttaagc ttcgagctcg gatccaccgg tcgccaccat ggtgagcaag 11220 ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg agctggacgg cgacgtaaac 11280 ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg ccacctacgg caagctgacc 11340 ctgaagttca tctgcaccac cggcaagctg cccgtgccct ggcccaccct cgtgaccacc 11400 ctgacctacg gcgtgcagtg cttcagccgc taccccgacc acatgaagca gcacgacttc 11460 ttcaagtccg ccatgcccga aggctacgtc caggagcgca ccatcttctt caaggacgac 11520 ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg acaccctggt gaaccgcatc 11580 gagctgaagg gcatcgactt caaggaggac ggcaacatcc tggggcacaa gctggagtac 11640 aactacaaca gccacaacgt ctatatcatg gccgacaagc agaagaacgg catcaaggtg 11700 aacttcaaga tccgccacaa catcgaggac ggcagcgtgc agctcgccga ccactaccag 11760 cagaacaccc ccatcggcga cggccccgtg ctgctgcccg acaaccacta cctgagcacc 11820 cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc acatggtcct gctggagttc 11880 gtgaccgccg ccgggatcac tctcggcatg gacgagctgt acaagtaaag cggccgctcg 11940 agtctagagg gcccgtttaa acccgctgat cagcctcgac tgtgccttct agttgccagc 12000 catctgttgt ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg 12060 tcctttccta ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc 12120 tggggggtgg ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg 12180 ctggggatgc ggtgggctct atggcttctg aggcggaaag aaccagctgg ggctctaggg 12240 ggtatcccca cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg gttacgcgca 12300 gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc ttcccttcct 12360 ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc cctttagggt 12420 tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt gatggttcac 12480 atcgaattcc tgcagcccgg gggatccatt aactaataaa aaaaaataat aaagcatcac 12540 ttacttaaaa tcagttagca aatttctgtc cagtttattc agcagcacct ccttgccctc 12600 ctcccagctc tggtattgca gcttcctcct ggctgcaaac tttctccaca atctaaatgg 12660 aatgtcagtt tcctcctgtt cctgtccatc cgcacccact atcttcatgt tgttgcagat 12720 gaagcgcgca agaccgtctg aagatacctt caaccccgtg tatccatatg acacggaaac 12780 cggtcctcca actgtgcctt ttcttactcc tccctttgta tcccccaatg ggtttcaaga 12840 gagtccccct ggagttctta ctttaaaatg tttaacccca ctaacaacca caggcggatc 12900 tctacagcta aaagtgggag ggggacttac agtggatgac actgatggta ccttacaaga 12960 aaacatacgt gctacagcac ccattactaa aaataatcac tctgtagaac tatccattgg 13020 aaatggatta gaaactcaaa acaataaact atgtgccaaa ttgggaaatg ggttaaaatt 13080 taacaacggt gacatttgta taaaggatag tattaacacc ttatggactg gaataaaccc 13140 tccacctaac tgtcaaattg tggaaaacac taatacaaat gatggcaaac ttactttagt 13200 attagtaaaa aacggagggc ttgttaatgg ctacgtgtct ctagttggtg tatcagacac 13260 tgtgaaccaa atgttcacac aaaagacagc aaacatccaa ttaagattat attttgactc 13320 ttctggaaat ctattaactg gagaatcaga cttaaaaatt ccacttaaaa ataaatcttc 13380 tacagcgacc agtgaaactg tagccagcag caaagccttt atgccaagta ctacagctta 13440 tcccttcaac accgctacta gggatagtga aaactacatt catggaatat gttactacat 13500 gactagttat gatagaagtc tatttccctt gaacatttct ataatgctaa acagccgtat 13560 gatttcttcc aatgttgcct atgccataca atttgaatgg aatctaaatg caagtgaatc 13620 tccagaaagc aacatagcta cgctgaccac atcccccttt ttcttttctt acattacaga 13680 agacgacaac taaaatgccc aagaataaag aaagctttgt gttatgtttc aacgtgttta 13740 tttttcaatt gcagaaaatt tcaagtcatt tttcattcag tagtatagcc ccaccaccac 13800 atagcttata cagatcaccg taccttaatc aaactcacag aaccctagta ttcaacctgc 13860 cacctccctc ccaacacaca gagtacacag tcctttctcc ccggctggcc ttaaaaagca 13920 tcatatcatg ggtaacagac atattcttag gtgttatatt ccacacggtt tcctgtcgag 13980 ccaaacgctc atcagtgata ttaataaact ccccgggcag ctcacttaag ttcatgtcgc 14040 tgtccagctg ctgagccaca ggctgctgtc caacttgcgg ttgcttaacg ggcggcgaag 14100 gagaagtcca cgcctacatg ggggtagagt cataatcgtg catcaggata gggcggtggt 14160 gctgcagcag cgcgcgaata aactgctgcc gccgccgctc cgtcctgcag gaatacaaca 14220 tggcagtggt ctcctcagcg atgattcgca ccgcccgcag cataaggcgc cttgtcctcc 14280 gggcacagca gcgcaccctg atctcactta aatcagcaca gtaactgcag cacagcacca 14340 caatattgtt caaaatccca cagtgcaagg cgctgtatcc aaagctcatg gcggggacca 14400 cagaacccac gtgg 14414 <210> 56 <211> 32724 <212> DNA <213> Artificial Sequence <220> <223> PS1 <400> 56 catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60 aaaagtgtgg gccgtgtggt gattggctgt ggggttaacg gttaaaaggg gcggcgcggc 120 cgtgggaaaa tgacgtttta tgggggtgga gtttttttgc aagttgtcgc gggaaatgat 180 aacttcgtat agcatacatt atacgaagtt atttacgcat aaaaaggctt cttttctcac 240 ggaactactt agttttccca cggtatttaa caggaaatga ggtagttttg accggatgca 300 agtgaaaatt gctgattttc gcgcgaaaac tgaatgagga agtgtttttc tgaataatgt 360 ggtatttatg gcagggtgat aacttcgtat agcatacatt atacgaagtt atggaatgtt 420 tatgccttac cagtgtaaca tgaatcatgt gaaagtgttg ttggaaccag atgccttttc 480 cagaatgagc ctaacaggaa tctttgacat gaacacgcaa atctggaaga tcctgaggta 540 tgatgatacg agatcgaggg tgcgcgcatg cgaatgcgga ggcaagcatg ccaggttcca 600 gccggtgtgt gtagatgtga ccgaagatct cagaccggat catttggtta ttgcccgcac 660 tggagcagag ttcggatcca gtggagaaga aactgactaa ggtgagtatt gggaaaactt 720 tggggtggga ttttcagatg gacagattga gtaaaaattt gttttttctg tcttgcagct 780 gacatgagtg gaaatgcttc ttttaagggg ggagtcttca gcccttatct gacagggcgt 840 ctcccatcct gggcaggagt tcgtcagaat gttatgggat ctactgtgga tggaagaccc 900 gttcaacccg ccaattcttc aacgctgacc tatgctactt taagttcttc acctttggac 960 gcagctgcag ccgctgccgc cgcctctgtc gccgctaaca ctgtgcttgg aatgggttac 1020 tatggaagca tcgtggctaa ttccacttcc tctaataacc cttctacact gactcaggac 1080 aagttacttg tccttttggc ccagctggag gctttgaccc aacgtctggg tgaactttct 1140 cagcaggtgg ccgagttgcg agtacaaact gagtctgctg tcggcacggc aaagtctaaa 1200 taaaaaaaat tccagaatca atgaataaat aaacgagctt gttgttgatt taaaatcaag 1260 tgtttttatt tcatttttcg cgcacggtat gccctggacc accgatctcg atcattgaga 1320 actcggtgga ttttttccag aatcctatag aggtgggatt gaatgtttag atacatgggc 1380 attaggccgt ctttggggtg gagatagctc cattgaaggg attcatgctc cggggtagtg 1440 ttgtaaatca cccagtcata acaaggtcgc agtgcatggt gttgcacaat atcttttaga 1500 agtaggctga ttgccacaga taagcccttg gtgtaggtgt ttacaaaccg gttgagctgg 1560 gaggggtgca ttcgaggtga aattatgtgc attttggatt ggatttttaa gttggcaata 1620 ttgccgccaa gatcccgtct tgggttcatg ttatgaagga ctaccaagac ggtgtatccg 1680 gtacatttag gaaatttatc gtgcagcttg gatggaaaag cgtggaaaaa tttggagaca 1740 cccttgtgtc ctccgagatt ttccatgcac tcatccatga taatagcaat ggggccgtgg 1800 gcagcggcgc gggcaaacac gttccgtggg tctgacacat catagttatg ttcctgagtt 1860 aaatcatcat aagccatttt aatgaatttg gggcggagcg taccagattg gggtatgaat 1920 gttccttcgg gccccggagc atagttcccc tcacagattt gcatttccca agctttcagt 1980 tctgagggtg gaatcatgtc cacctggggg gctatgaaga acaccgtttc gggggcgggg 2040 gtgattagtt gggatgatag caagtttctg agcaattgag atttgccaca tccggtgggg 2100 ccataaataa ttccgattac aggttgcagg tggtagttta gggaacggca actgccgtct 2160 tctcgaagca agggggccac ctcgttcatc atttccctta catgcatatt ttcccgcacc 2220 aaatccatta ggaggcgctc tcctcctagt gatagaagtt cttgtagtga ggaaaagttt 2280 ttcagcggtt ttagaccgtc agccatgggc attttggaaa gagtttgctg caaaagttct 2340 agtctgttcc acagttcagt gatgtgttct atggcatctc gatccagcag acctcctcgt 2400 ttcgcgggtt tggacggctc ctggagtagg gtatgagacg atgggcgtcc agcgctgcca 2460 gggttcggtc cttccagggt ctcagtgttc gagtcagggt tgtttccgtc acagtgaagg 2520 ggtgtgcgcc tgcttgggcg cttgccaggg tgcgcttcag actcattctg ctggtggaga 2580 acttctgtcg cttggcgccc tgtatgtcgg ccaagtagca gtttaccatg agttcgtagt 2640 tgagcgcctc ggctgcgtgg cctttggcgc ggagcttacc tttggaagtt ttcttgcata 2700 ccgggcagta taggcatttc agcgcataca gcttgggcgc aaggaaaatg gattctgggg 2760 agtatgcatc cgcgccgcag gaggcgcaaa cagtttcaca ttccaccagc caggttaaat 2820 ccggttcatt ggggtcaaaa acaagttttc cgccatattt tttgatgcgt ttcttacctt 2880 tggtctccat aagttcgtgt cctcgttgag tgacaaacag gctgtccgta tctccgtaga 2940 ctgattttac aggcctcttc tccagtggag tgcctcggtc ttcttcgtac aggaactctg 3000 accactctga tacaaaggcg cgcgtccagg ccagcacaaa ggaggctatg tgggaggggt 3060 agcgatcgtt gtcaaccagg gggtccacct tttccaaagt atgcaaacac atgtcaccct 3120 cttcaacatc caggaatgtg attggcttgt aggtgtattt cacgtgacct ggggtccccg 3180 ctgggggggt ataaaagggg gcggttcttt gctcttcctc actgtcttcc ggatcgctgt 3240 ccaggaacgt cagctgttgg ggtaggtatt ccctctcgaa ggcgggcatg acctctgcac 3300 tcaggttgtc agtttctaag aacgaggagg atttgatatt gacagtgccg gttgagatgc 3360 ctttcatgag gttttcgtcc atttggtcag aaaacacaat ttttttattg tcaagtttgg 3420 tggcaaatga tccatacagg gcgttggata aaagtttggc aatggatcgc atggtttggt 3480 tcttttcctt gtccgcgcgc tctttggcgg cgatgttgag ttggacatac tcgcgtgcca 3540 ggcacttcca ttcggggaag atagttgtta attcatctgg cacgattctc acttgccacc 3600 ctcgattatg caaggtaatt aaatccacac tggtggccac ctcgcctcga aggggttcat 3660 tggtccaaca gagcctacct cctttcctag aacagaaagg gggaagtggg tctagcataa 3720 gttcatcggg agggtctgca tccatggtaa agattcccgg aagtaaatcc ttatcaaaat 3780 agctgatggg agtggggtca tctaaggcca tttgccattc tcgagctgcc agtgcgcgct 3840 catatgggtt aaggggactg ccccagggca tgggatgggt gagagcagag gcatacatgc 3900 cacagatgtc atagacgtag atgggatcct caaagatgcc tatgtaggtt ggatagcatc 3960 gcccccctct gatacttgct cgcacatagt catatagttc atgtgatggc gctagcagcc 4020 ccggacccaa gttggtgcga ttgggttttt ctgttctgta gacgatctgg cgaaagatgg 4080 cgtgagaatt ggaagagatg gtgggtcttt gaaaaatgtt gaaatgggca tgaggtagac 4140 ctacagagtc tctgacaaag tgggcataag attcttgaag cttggttacc agttcggcgg 4200 tgacaagtac gtctagggcg cagtagtcaa gtgtttcttg aatgatgtca taacctggtt 4260 ggtttttctt ttcccacagt tcgcggttga gaaggtattc ttcgcgatcc ttccagtact 4320 cttctagcgg aaacccgtct ttgtctgcac ggtaagatcc tagcatgtag aactgattaa 4380 ctgccttgta agggcagcag cccttctcta cgggtagaga gtatgcttga gcagcttttc 4440 gtagcgaagc gtgagtaagg gcaaaggtgt ctctgaccat gactttgaga aattggtatt 4500 tgaagtccat gtcgtcacag gctccctgtt cccagagttg gaagtctacc cgtttcttgt 4560 aggcggggtt gggcaaagcg aaagtaacat cattgaagag aatcttaccg gctctgggca 4620 taaaattgcg agtgatgcgg aaaggctgtg gtacttccgc tcgattgttg atcacctggg 4680 cagctaggac gatttcgtcg aaaccgttga tgttgtgtcc tacgatgtat aattctatga 4740 aacgcggcgt gcctctgacg tgaggtagct tactgagctc atcaaaggtt aggtctgtgg 4800 ggtcagataa ggcgtagtgt tcgagagccc attcgtgcag gtgaggattt gcatgtagga 4860 atgatgacca aagatctacc gccagtgctg tttgtaactg gtcccgatac tgacgaaaat 4920 gccggccaat tgccattttt tctggagtga cacagtagaa ggttctgggg tcttgttgcc 4980 atcgatccca cttgagttta atggctagat cgtgggccat gttgacgaga cgctcttctc 5040 ctgagagttt catgaccagc atgaaaggaa ctagttgttt gccaaaggat cccatccagg 5100 tgtaagtttc cacatcgtag gtcaggaaga gtctttctgt gcgaggatga gagccgatcg 5160 ggaagaactg gatttcctgc caccagttgg aggattggct gttgatgtga tggaagtaga 5220 agtttctgcg gcgcgccgag cattcgtgtt tgtgcttgta cagacggccg cagtagtcgc 5280 agcgttgcac gggttgtatc tcgtgaatga gctgtacctg gcttcccttg acgagaaatt 5340 tcagtgggaa gccgaggcct ggcgattgta tctcgtgctc ttctatattc gctgtatcgg 5400 cctgttcatc ttctgtttcg atggtggtca tgctgacgag cccccgcggg aggcaagtcc 5460 agacctcggc gcgggagggg cggagctgaa ggacgagagc gcgcaggctg gagctgtcca 5520 gagtcctgag acgctgcgga ctcaggttag taggtaggga cagaagatta acttgcatga 5580 tcttttccag ggcgtgcggg aggttcagat ggtacttgat ttccacaggt tcgtttgtag 5640 agacgtcaat ggcttgcagg gttccgtgtc ctttgggcgc cactaccgta cctttgtttt 5700 ttcttttgat cggtggtggc tctcttgctt cttgcatgct cagaagcggt gacggggacg 5760 cgcgccgggc ggcagcggtt gttccggacc cgggggcatg gctggtagtg gcacgtcggc 5820 gccgcgcacg ggcaggttct ggtattgcgc tctgagaaga cttgcgtgcg ccaccacgcg 5880 tcgattgacg tcttgtatct gacgtctctg ggtgaaagct accggccccg tgagcttgaa 5940 cctgaaagag agttcaacag aatcaatttc ggtatcgtta acggcagctt gtctcagtat 6000 ttcttgtacg tcaccagagt tgtcctggta ggcgatctcc gccatgaact gctcgatttc 6060 ttcctcctga agatctccgc gacccgctct ttcgacggtg gccgcgaggt cattggagat 6120 acggcccatg agttgggaga atgcattcat gcccgcctcg ttccagacgc ggctgtaaac 6180 cacggccccc tcggagtctc ttgcgcgcat caccacctga gcgaggttaa gctccacgtg 6240 tctggtgaag accgcatagt tgcataggcg ctgaaaaagg tagttgagtg tggtggcaat 6300 gtgttcggcg acgaagaaat acatgatcca tcgtctcagc ggcatttcgc taacatcgcc 6360 cagagcttcc aagcgctcca tggcctcgta gaagtccacg gcaaaattaa aaaactggga 6420 gtttcgcgcg gacacggtca attcctcctc gagaagacgg atgagttcgg ctatggtggc 6480 ccgtacttcg cgttcgaagg ctcccgggat ctcttcttcc tcttctatct cttcttccac 6540 taacatctct tcttcgtctt caggcggggg cggagggggc acgcggcgac gtcgacggcg 6600 cacgggcaaa cggtcgatga atcgttcaat gacctctccg cggcggcggc gcatggtttc 6660 agtgacggcg cggccgttct cgcgcggtcg cagagtaaaa acaccgccgc gcatctcctt 6720 aaagtggtga ctgggaggtt ctccgtttgg gagggagagg gcgctgatta tacattttat 6780 taattggccc gtagggactg cgcgcagaga tctgatcgtg tcaagatcca cgggatctga 6840 aaacctttcg acgaaagcgt ctaaccagtc acagtcacaa ggtaggctga gtacggcttc 6900 ttgtgggcgg gggtggttat gtgttcggtc tgggtcttct gtttcttctt catctcggga 6960 aggtgagacg atgctgctgg tgatgaaatt aaagtaggca gttctaagac ggcggatggt 7020 ggcgaggagc accaggtctt tgggtccggc ttgctggata cgcaggcgat tggccattcc 7080 ccaagcatta tcctgacatc tagcaagatc tttgtagtag tcttgcatga gccgttctac 7140 gggcacttct tcctcacccg ttctgccatg catacgtgtg agtccaaatc cgcgcattgg 7200 ttgtaccagt gccaagtcag ctacgactct ttcggcgagg atggcttgct gtacttgggt 7260 aagggtggct tgaaagtcat caaaatccac aaagcggtgg taagcccctg tattaatggt 7320 gtaagcacag ttggccatga ctgaccagtt aactgtctgg tgaccagggc gcacgagctc 7380 ggtgtattta aggcgcgaat aggcgcgggt gtcaaagatg taatcgttgc aggtgcgcac 7440 cagatactgg taccctataa gaaaatgcgg cggtggttgg cggtagagag gccatcgttc 7500 tgtagctgga gcgccagggg cgaggtcttc caacataagg cggtgatagc cgtagatgta 7560 cctggacatc caggtgattc ctgcggcggt agtagaagcc cgaggaaact cgcgtacgcg 7620 gttccaaatg ttgcgtagcg gcatgaagta gttcattgta ggcacggttt gaccagtgag 7680 gcgcgcgcag tcattgatgc tctatagaca cggagaaaat gaaagcgttc agcgactcga 7740 ctccgtagcc tggaggaacg tgaacgggtt gggtcgcggt gtaccccggt tcgagacttg 7800 tactcgagcc ggccggagcc gcggctaacg tggtattggc actcccgtct cgacccagcc 7860 tacaaaaatc caggatacgg aatcgagtcg ttttgctggt ttccgaatgg cagggaagtg 7920 agtcctattt tttttttttt tgccgctcag atgcatcccg tgctgcgaca gatgcgcccc 7980 caacaacagc ccccctcgca gcagcagcag cagcaaccac aaaaggctgt ccctgcaact 8040 actgcaactg ccgccgtgag cggtgcggga cagcccgcct atgatctgga cttggaagag 8100 ggcgaaggac tggcacgtct aggtgcgcct tcgcccgagc ggcatccgcg agttcaactg 8160 aaaaaagatt ctcgcgaggc gtatgtgccc caacagaacc tatttagaga cagaagcggc 8220 gaggagccgg aggagatgcg agcttcccgc tttaacgcgg gtcgtgagct gcgtcacggt 8280 ttggaccgaa gacgagtgtt gcgagacgag gatttcgaag ttgatgaagt gacagggatc 8340 agtcctgcca gggcacacgt ggctgcagcc aaccttgtat cggcttacga gcagacagta 8400 aaggaagagc gtaacttcca aaagtctttt aataatcatg tgcgaaccct gattgcccgc 8460 gaagaagtta cccttggttt gatgcatttg tgggatttga tggaagctat cattcagaac 8520 cctactagca aacctctgac cgcccagctg tttctggtgg tgcaacacag cagagacaat 8580 gaggctttca gagaggcgct gctgaacatc accgaacccg aggggagatg gttgtatgat 8640 cttatcaaca ttctacagag tatcatagtg caggagcgga gcctgggcct ggccgagaag 8700 gtagctgcca tcaattactc ggttttgagc ttgggaaaat attacgctcg caaaatctac 8760 aagactccat acgttcccat agacaaggag gtgaagatag atgggttcta catgcgcatg 8820 acgctcaagg tcttgaccct gagcgatgat cttggggtgt atcgcaatga cagaatgcat 8880 cgcgcggtta gcgccagcag gaggcgcgag ttaagcgaca gggaactgat gcacagtttg 8940 caaagagctc tgactggagc tggaaccgag ggtgagaatt acttcgacat gggagctgac 9000 ttgcagtggc agcctagtcg cagggctctg agcgccgcga cggcaggatg tgagcttcct 9060 tacatagaag aggcggatga aggcgaggag gaagagggcg agtacttgga agactgatgg 9120 cacaacccgt gttttttgct agatggaaca gcaagcaccg gatcccgcaa tgcgggcggc 9180 gctgcagagc cagccgtccg gcattaactc ctcggacgat tggacccagg ccatgcaacg 9240 tatcatggcg ttgacgactc gcaaccccga agcctttaga cagcaacccc aggccaaccg 9300 tctatcggcc atcatggaag ctgtagtgcc ttcccgatct aatcccactc atgagaaggt 9360 cctggccatc gtgaacgcgt tggtggagaa caaagctatt cgtccagatg aggccggact 9420 ggtatacaac gctctcttag aacgcgtggc tcgctacaac agtagcaatg tgcaaaccaa 9480 tttggaccgt atgataacag atgtacgcga agccgtgtct cagcgcgaaa ggttccagcg 9540 tgatgccaac ctgggttcgc tggtggcgtt aaatgctttc ttgagtactc agcctgctaa 9600 tgtgccgcgt ggtcaacagg attatactaa ctttttaagt gctttgagac tgatggtatc 9660 agaagtacct cagagcgaag tgtatcagtc cggtcctgat tacttctttc agactagcag 9720 acagggcttg cagacggtaa atctgagcca agcttttaaa aaccttaaag gtttgtgggg 9780 agtgcatgcc ccggtaggag aaagagcaac cgtgtctagc ttgttaactc cgaactcccg 9840 cctgttatta ctgttggtag ctcctttcac cgacagcggt agcatcgacc gtaattccta 9900 tttgggttac ctactaaacc tgtatcgcga agccataggg caaagtcagg tggacgagca 9960 gacctatcaa gaaattaccc aagtcagtcg cgctttggga caggaagaca ctggcagttt 10020 ggaagccact ctgaacttct tgcttaccaa tcggtctcaa aagatccctc ctcaatatgc 10080 tcttactgcg gaggaggaga ggatccttag atatgtgcag cagagcgtgg gattgtttct 10140 gatgcaagag ggggcaactc cgactgcagc actggacatg acagcgcgaa atatggagcc 10200 cagcatgtat gccagtaacc gacctttcat taacaaactg ctggactact tgcacagagc 10260 tgccgctatg aactctgatt atttcaccaa tgccatctta aacccgcact ggctgccccc 10320 acctggtttc tacacgggcg aatatgacat gcccgaccct aatgacggat ttctgtggga 10380 cgacgtggac agcgatgttt tttcacctct ttctgatcat cgcacgtgga aaaaggaagg 10440 cggtgataga atgcattctt ctgcatcgct gtccggggtc atgggtgcta ccgcggctga 10500 gcccgagtct gcaagtcctt ttcctagtct acccttttct ctacacagtg tacgtagcag 10560 cgaagtgggt agaataagtc gcccgagttt aatgggcgaa gaggagtacc taaacgattc 10620 cttgctcaga ccggcaagag aaaaaaattt cccaaacaat ggaatagaaa gtttggtgga 10680 taaaatgagt agatggaaga cttatgctca ggatcacaga gacgagcctg ggatcatggg 10740 gactacaagt agagcgagcc gtagacgcca gcgccatgac agacagaggg gtcttgtgtg 10800 ggacgatgag gattcggccg atgatagcag cgtgttggac ttgggtggga gaggaagggg 10860 caacccgttt gctcatttgc gccctcgctt gggtggtatg ttgtgaaaaa aaataaaaaa 10920 gaaaaactca ccaaggccat ggcgacgagc gtacgttcgt tcttctttat tatctgtgtc 10980 tagtataatg aggcgagtcg tgctaggcgg agcggtggtg tatccggagg gtcctcctcc 11040 ttcgtacgag agcgtgatgc agcagcagca ggcgacggcg gtgatgcaat ccccactgga 11100 ggctcccttt gtgcctccgc gatacctggc acctacggag ggcagaaaca gcattcgtta 11160 ctcggaactg gcacctcagt acgataccac caggttgtat ctggtggaca acaagtcggc 11220 ggacattgct tctctgaact atcagaatga ccacagcaac ttcttgacca cggtggtgca 11280 gaacaatgac tttaccccta cggaagccag cacccagacc attaactttg atgaacgatc 11340 gcggtggggc ggtcagctaa agaccatcat gcatactaac atgccaaacg tgaacgagta 11400 tatgtttagt aacaagttca aagcgcgtgt gatggtgtcc agaaaacctc ccgacggtgc 11460 tgcagttggg gatacttatg atcacaagca ggatattttg gaatatgagt ggttcgagtt 11520 tactttgcca gaaggcaact tttcagttac tatgactatt gatttgatga acaatgccat 11580 catagataat tacttgaaag tgggtagaca gaatggagtg cttgaaagtg acattggtgt 11640 taagttcgac accaggaact tcaagctggg atgggatccc gaaaccaagt tgatcatgcc 11700 tggagtgtat acgtatgaag ccttccatcc tgacattgtc ttactgcctg gctgcggagt 11760 ggattttacc gagagtcgtt tgagcaacct tcttggtatc agaaaaaaac agccatttca 11820 agagggtttt aagattttgt atgaagattt agaaggtggt aatattccgg ccctcttgga 11880 tgtagatgcc tatgagaaca gtaagaaaga acaaaaagcc aaaatagaag ctgctacagc 11940 tgctgcagaa gctaaggcaa acatagttgc cagcgactct acaagggttg ctaacgctgg 12000 agaggtcaga ggagacaatt ttgcgccaac acctgttccg actgcagaat cattattggc 12060 cgatgtgtct gaaggaacgg acgtgaaact cactattcaa cctgtagaaa aagatagtaa 12120 gaatagaagc tataatgtgt tggaagacaa aatcaacaca gcctatcgca gttggtatct 12180 ttcgtacaat tatggcgatc ccgaaaaagg agtgcgttcc tggacattgc tcaccacctc 12240 agatgtcacc tgcggagcag agcaggttta ctggtcgctt ccagacatga tgaaggatcc 12300 tgtcactttc cgctccacta gacaagtcag taactaccct gtggtgggtg cagagcttat 12360 gcccgtcttc tcaaagagct tctacaacga acaagctgtg tactcccagc agctccgcca 12420 gtccacctcg cttacgcacg tcttcaaccg ctttcctgag aaccagattt taatccgtcc 12480 gccggcgccc accattacca ccgtcagtga aaacgttcct gctctcacag atcacgggac 12540 cctgccgttg cgcagcagta tccggggagt ccaacgtgtg accgttactg acgccagacg 12600 ccgcacctgt ccctacgtgt acaaggcact gggcatagtc gcaccgcgcg tcctttcaag 12660 ccgcactttc taaaaaaaaa atgtccattc ttatctcgcc cagtaataac accggttggg 12720 gtctgcgcgc tccaagcaag atgtacggag gcgcacgcaa acgttctacc caacatcccg 12780 tgcgtgttcg cggacatttt cgcgctccat ggggtgccct caagggccgc actcgcgttc 12840 gaaccaccgt cgatgatgta atcgatcagg tggttgccga cgcccgtaat tatactccta 12900 ctgcgcctac atctactgtg gatgcagtta ttgacagtgt agtggctgac gctcgcaact 12960 atgctcgacg taagagccgg cgaaggcgca ttgccagacg ccaccgagct accactgcca 13020 tgcgagccgc aagagctctg ctacgaagag ctagacgcgt ggggcgaaga gccatgctta 13080 gggcggccag acgtgcagct tcgggcgcca gcgccggcag gtcccgcagg caagcagccg 13140 ctgtcgcagc ggcgactatt gccgacatgg cccaatcgcg aagaggcaat gtatactggg 13200 tgcgtgacgc tgccaccggt caacgtgtac ccgtgcgcac ccgtccccct cgcacttaga 13260 agatactgag cagtctccga tgttgtgtcc cagcggcgag gatgtccaag cgcaaataca 13320 aggaagaaat gctgcaggtt atcgcacctg aagtctacgg ccaaccgttg aaggatgaaa 13380 aaaaaccccg caaaatcaag cgggttaaaa aggacaaaaa agaagaggaa gatggcgatg 13440 atgggctggc ggagtttgtg cgcgagtttg ccccacggcg acgcgtgcaa tggcgtgggc 13500 gcaaagttcg acatgtgttg agacctggaa cttcggtggt ctttacaccc ggcgagcgtt 13560 caagcgctac ttttaagcgt tcctatgatg aggtgtacgg ggatgatgat attcttgagc 13620 aggcggctga ccgattaggc gagtttgctt atggcaagcg tagtagaata acttccaagg 13680 atgagacagt gtcaataccc ttggatcatg gaaatcccac ccctagtctt aaaccggtca 13740 ctttgcagca agtgttaccc gtaactccgc gaacaggtgt taaacgcgaa ggtgaagatt 13800 tgtatcccac tatgcaactg atggtaccca aacgccagaa gttggaggac gttttggaga 13860 aagtaaaagt ggatccagat attcaacctg aggttaaagt gagacccatt aagcaggtag 13920 cgcctggtct gggggtacaa actgtagaca ttaagattcc cactgaaagt atggaagtgc 13980 aaactgaacc cgcaaagcct actgccacct ccactgaagt gcaaacggat ccatggatgc 14040 ccatgcctat tacaactgac gccgccggtc ccactcgaag atcccgacga aagtacggtc 14100 cagcaagtct gttgatgccc aattatgttg tacacccatc tattattcct actcctggtt 14160 accgaggcac tcgctactat cgcagccgaa acagtacctc ccgccgtcgc cgcaagacac 14220 ctgcaaatcg cagtcgtcgc cgtagacgca caagcaaacc gactcccggc gccctggtgc 14280 ggcaagtgta ccgcaatggt agtgcggaac ctttgacact gccgcgtgcg cgttaccatc 14340 cgagtatcat cacttaatca atgttgccgc tgcctccttg cagatatggc cctcacttgt 14400 cgccttcgcg ttcccatcac tggttaccga ggaagaaact cgcgccgtag aagagggatg 14460 ttgggacgcg gaatgcgacg ctacaggcga cggcgtgcta tccgcaagca attgcggggt 14520 ggttttttac cagccttaat tccaattatc gctgctgcaa ttggcgcgat accaggcata 14580 gcttccgtgg cggttcaggc ctcgcaacga cattgacatt ggaaaaaaaa cgtataaata 14640 aaaaaaaata caatggactc tgacactcct ggtcctgtga ctatgttttc ttagagatgg 14700 aagacatcaa tttttcatcc ttggctccgc gacacggcac gaagccgtac atgggcacct 14760 ggagcgacat cggcacgagc caactgaacg ggggcgcctt caattggagc agtatctgga 14820 gcgggcttaa aaattttggc tcaaccataa aaacatacgg gaacaaagct tggaacagca 14880 gtacaggaca ggcgcttaga aataaactta aagaccagaa cttccaacaa aaagtagtcg 14940 atgggatagc ttccggcatc aatggagtgg tagatttggc taaccaggct gtgcagaaaa 15000 agataaacag tcgtttggac ccgccgccag caaccccagg tgaaatgcaa gtggaggaag 15060 aaattcctcc gccagaaaaa cgaggcgaca agcgtccgcg tcccgatttg gaagagacgc 15120 tggtgacgcg cgtagatgaa ccgccttctt atgaggaagc aacgaagctt ggaatgccca 15180 ccactagacc gatagcccca atggccaccg gggtgatgaa accttctcag ttgcatcgac 15240 ccgtcacctt ggatttgccc cctccccctg ctgctactgc tgtacccgct tctaagcctg 15300 tcgctgcccc gaaaccagtc gccgtagcca ggtcacgtcc cgggggcgct cctcgtccaa 15360 atgcgcactg gcaaaatact ctgaacagca tcgtgggtct aggcgtgcaa agtgtaaaac 15420 gccgtcgctg cttttaatta aatatggagt agcgcttaac ttgcctatct gtgtatatgt 15480 gtcattacac gccgtcacag cagcagagga aaaaaggaag aggtcgtgcg tcgacgctga 15540 gttactttca agatggccac cccatcgatg ctgccccaat gggcatacat gcacatcgcc 15600 ggacaggatg cttcggagta cctgagtccg ggtctggtgc agttcgcccg cgccacagac 15660 acctacttca atctgggaaa taagtttaga aatcccaccg tagcgccgac ccacgatgtg 15720 accaccgacc gtagccagcg gctcatgttg cgcttcgtgc ccgttgaccg ggaggacaat 15780 acatactctt acaaagtgcg gtacaccctg gccgtgggcg acaacagagt gctggatatg 15840 gccagcacgt tctttgacat taggggcgtg ttggacagag gtcccagttt caaaccctat 15900 tctggtacgg cttacaactc tctggctcct aaaggcgctc caaatgcatc tcaatggatt 15960 gcaaaaggcg taccaactgc agcagccgca ggcaatggtg aagaagaaca tgaaacagag 16020 gagaaaactg ctacttacac ttttgccaat gctcctgtaa aagccgaggc tcaaattaca 16080 aaagagggct taccaatagg tttggagatt tcagctgaaa acgaatctaa acccatctat 16140 gcagataaac tttatcagcc agaacctcaa gtgggagatg aaacttggac tgacctagac 16200 ggaaaaaccg aagagtatgg aggcagggct ctaaagccta ctactaacat gaaaccctgt 16260 tacgggtcct atgcgaagcc tactaattta aaaggtggtc aggcaaaacc gaaaaactcg 16320 gaaccgtcga gtgaaaaaat tgaatatgat attgacatgg aattttttga taactcatcg 16380 caaagaacaa acttcagtcc taaaattgtc atgtatgcag aaaatgtagg tttggaaacg 16440 ccagacactc atgtagtgta caaacctgga acagaagaca caagttccga agctaatttg 16500 ggacaacagt ctatgcccaa cagacccaac tacattggct tcagagataa ctttattgga 16560 ctcatgtact ataacagtac tggtaacatg ggggtgctgg ctggtcaagc gtctcagtta 16620 aatgcagtgg ttgacttgca ggacagaaac acagaacttt cttaccaact cttgcttgac 16680 tctctgggcg acagaaccag atactttagc atgtggaatc aggctgtgga cagttatgat 16740 cctgatgtac gtgttattga aaatcatggt gtggaagatg aacttcccaa ctattgtttt 16800 ccactggacg gcataggtgt tccaacaacc agttacaaat caatagttcc aaatggagaa 16860 gataataata attggaaaga acctgaagta aatggaacaa gtgagatcgg acagggtaat 16920 ttgtttgcca tggaaattaa ccttcaagcc aatctatggc gaagtttcct ttattccaat 16980 gtggctctgt atctcccaga ctcgtacaaa tacaccccgt ccaatgtcac tcttccagaa 17040 aacaaaaaca cctacgacta catgaacggg cgggtggtgc cgccatctct agtagacacc 17100 tatgtgaaca ttggtgccag gtggtctctg gatgccatgg acaatgtcaa cccattcaac 17160 caccaccgta acgctggctt gcgttaccga tctatgcttc tgggtaacgg acgttatgtg 17220 cctttccaca tacaagtgcc tcaaaaattc ttcgctgtta aaaacctgct gcttctccca 17280 ggctcctaca cttatgagtg gaactttagg aaggatgtga acatggttct acagagttcc 17340 ctcggtaacg acctgcgggt agatggcgcc agcatcagtt tcacgagcat caacctctat 17400 gctacttttt tccccatggc tcacaacacc gcttccaccc ttgaagccat gctgcggaat 17460 gacaccaatg atcagtcatt caacgactac ctatctgcag ctaacatgct ctaccccatt 17520 cctgccaatg caaccaatat tcccatttcc attccttctc gcaactgggc ggctttcaga 17580 ggctggtcat ttaccagact gaaaaccaaa gaaactccct ctttggggtc tggatttgac 17640 ccctactttg tctattctgg ttctattccc tacctggatg gtaccttcta cctgaaccac 17700 acttttaaga aggtttccat catgtttgac tcttcagtga gctggcctgg aaatgacagg 17760 ttactatctc ctaacgaatt tgaaataaag cgcactgtgg atggcgaagg ctacaacgta 17820 gcccaatgca acatgaccaa agactggttc ttggtacaga tgctcgccaa ctacaacatc 17880 ggctatcagg gcttctacat tccagaagga tacaaagatc gcatgtattc atttttcaga 17940 aacttccagc ccatgagcag gcaggtggtt gatgaggtca attacaaaga cttcaaggcc 18000 gtcgccatac cctaccaaca caacaactct ggctttgtgg gttacatggc tccgaccatg 18060 cgccaaggtc aaccctatcc cgctaactat ccctatccac tcattggaac aactgccgta 18120 aatagtgtta cgcagaaaaa gttcttgtgt gacagaacca tgtggcgcat accgttctcg 18180 agcaacttca tgtctatggg ggcccttaca gacttgggac agaatatgct ctatgccaac 18240 tcagctcatg ctctggacat gacctttgag gtggatccca tggatgagcc caccctgctt 18300 tatcttctct tcgaagtttt cgacgtggtc agagtgcatc agccacaccg cggcatcatc 18360 gaggcagtct acctgcgtac accgttctcg gccggtaacg ctaccacgta agaagcttct 18420 tgcttcttgc aaatagcagc tgcaaccatg gcctgcggat cccaaaacgg ctccagcgag 18480 caagagctca gagccattgt ccaagacctg ggttgcggac cctatttttt gggaacctac 18540 gataagcgct tcccggggtt catggccccc gataagctcg cctgtgccat tgtaaatacg 18600 gccggacgtg agacgggggg agagcactgg ttggctttcg gttggaaccc acgttctaac 18660 acctgctacc tttttgatcc ttttggattc tcggatgatc gtctcaaaca gatttaccag 18720 tttgaatatg agggtctcct gcgccgcagc gctcttgcta ccaaggaccg ctgtattacg 18780 ctggaaaaat ctacccagac cgtgcagggc ccccgttctg ccgcctgcgg acttttctgc 18840 tgcatgttcc ttcacgcctt tgtgcactgg cctgaccgtc ccatggacgg aaaccccacc 18900 atgaaattgc taactggagt gccaaacaac atgcttcatt ctcctaaagt ccagcccacc 18960 ctgtgtgaca atcaaaaagc actctaccat tttcttaata cccattcgcc ttattttcgc 19020 tctcatcgta cacacatcga aagggccact gcgttcgacc gtatggatgt tcaataatga 19080 ctcatgtaaa caacgtgttc aataaacatc actttatttt tttacatgta tcaaggctct 19140 ggattactta tttatttaca agtcgaatgg gttctgacga gaatcagaat gacccgcagg 19200 cagtgatacg ttgcggaact gatacttggg ttgccacttg aattcgggaa tcaccaactt 19260 gggaaccggt atatcgggca ggatgtcact ccacagcttt ctggtcagct gcaaagctcc 19320 aagcaggtca ggagccgaaa tcttgaaatc acaattagga ccagtgctct gagcgcgaga 19380 gttgcggtac accggattgc agcactgaaa caccatcagc gacggatgtc tcacgcttgc 19440 cagcacggtg ggatctgcaa tcatgcccac atccagatct tcagcattgg caatgctgaa 19500 cggggtcatc ttgcaggtct gcctacccat ggcgggcacc caattaggct tgtggttgca 19560 atcgcagtgc agggggatca gtatcatctt ggcctgatcc tgtctgattc ctggatacac 19620 ggctctcatg aaagcatcat attgcttgaa agcctgctgg gctttactac cctcggtata 19680 aaacatcccg caggacctgc tcgaaaactg gttagctgca cagccggcat cattcacaca 19740 gcagcgggcg tcattgttgg ctatttgcac cacacttctg ccccagcggt tttgggtgat 19800 tttggttcgc tcgggattct cctttaaggc tcgttgtccg ttctcgctgg ccacatccat 19860 ctcgataatc tgctccttct gaatcataat attgccatgc aggcacttca gcttgccctc 19920 ataatcattg cagccatgag gccacaacgc acagcctgta cattcccaat tatggtgggc 19980 gatctgagaa aaagaatgta tcattccctg cagaaatctt cccatcatcg tgctcagtgt 20040 cttgtgacta gtgaaagtta actggatgcc tcggtgctct tcgtttacgt actggtgaca 20100 gatgcgcttg tattgttcgt gttgctcagg cattagttta aaacaggttc taagttcgtt 20160 atccagcctg tacttctcca tcagcagaca catcacttcc atgcctttct cccaagcaga 20220 caccaggggc aagctaatcg gattcttaac agtgcaggca gcagctcctt tagccagagg 20280 gtcatcttta gcgatcttct caatgcttct tttgccatcc ttctcaacga tgcgcacggg 20340 cgggtagctg aaacccactg ctacaagttg cgcctcttct ctttcttctt cgctgtcttg 20400 actgatgtct tgcatgggga tatgtttggt cttccttggc ttctttttgg ggggtatcgg 20460 aggaggagga ctgtcgctcc gttccggaga cagggaggat tgtgacgttt cgctcaccat 20520 taccaactga ctgtcggtag aagaacctga ccccacacgg cgacaggtgt ttttcttcgg 20580 gggcagaggt ggaggcgatt gcgaagggct gcggtccgac ctggaaggcg gatgactggc 20640 agaacccctt ccgcgttcgg gggtgtgctc cctgtggcgg tcgcttaact gatttccttc 20700 gcggctggcc attgtgttct cctaggcaga gaaacaacag acatggaaac tcagccattg 20760 ctgtcaacat cgccacgagt gccatcacat ctcgtcctca gcgacgagga aaaggagcag 20820 agcttaagca ttccaccgcc cagtcctgcc accacctcta ccctagaaga taaggaggtc 20880 gacgcatctc atgacatgca gaataaaaaa gcgaaagagt ctgagacaga catcgagcaa 20940 gacccgggct atgtgacacc ggtggaacac gaggaagagt tgaaacgctt tctagagaga 21000 gaggatgaaa actgcccaaa acagcgagca gataactatc accaagatgc tggaaatagg 21060 gatcagaaca ccgactacct catagggctt gacggggaag acgcgctcct taaacatcta 21120 gcaagacagt cgctcatagt caaggatgca ttattggaca gaactgaagt gcccatcagt 21180 gtggaagagc tcagctgcgc ctacgagctt aacctttttt cacctcgtac tccccccaaa 21240 cgtcagccaa acggcacctg cgagccaaat cctcgcttaa acttttatcc agcttttgct 21300 gtgccagaag tactggctac ctatcacatc ttttttaaaa atcaaaaaat tccagtctcc 21360 tgccgcgcta atcgcacccg cgccgatgcc ctactcaatc tgggacctgg ttcacgctta 21420 cctgatatag cttccttgga agaggttcca aagatcttcg agggtctggg caataatgag 21480 actcgggccg caaatgctct gcaaaaggga gaaaatggca tggatgagca tcacagcgtt 21540 ctggtggaat tggaaggcga taatgccaga ctcgcagtac tcaagcgaag cgtcgaggtc 21600 acacacttcg catatcccgc tgtcaacctg ccccctaaag tcatgacggc ggtcatggac 21660 cagttactca ttaagcgcgc aagtcccctt tcagaagaca tgcatgaccc agatgcctgt 21720 gatgagggta aaccagtggt cagtgatgag cagctaaccc gatggctggg caccgactct 21780 ccccgggatt tggaagagcg tcgcaagctt atgatggccg tggtgctggt taccgtagaa 21840 ctagagtgtc tccgacgttt ctttaccgat tcagaaacct tgcgcaaact cgaagagaat 21900 ctgcactaca cttttagaca cggctttgtg cggcaggcat gcaagatatc taacgtggaa 21960 ctcaccaacc tggtttccta catgggtatt ctgcatgaga atcgcctagg acaaagcgtg 22020 ctgcacagca cccttaaggg ggaagcccgc cgtgattaca tccgcgattg tgtctatctc 22080 tacctgtgcc acacgtggca aaccggcatg ggtgtatggc agcaatgttt agaagaacag 22140 aacttgaaag agcttgacaa gctcttacag aaatctctta aggttctgtg gacagggttc 22200 gacgagcgca ccgtcgcttc cgacctggca gacctcatct tcccagagcg tctcagggtt 22260 actttgcgaa acggattgcc tgactttatg agccagagca tgcttaacaa ttttcgctct 22320 ttcatcctgg aacgctccgg tatcctgccc gccacctgct gcgcactgcc ctccgacttt 22380 gtgcctctca cctaccgcga gtgccccccg ccgctatgga gtcactgcta cctgttccgt 22440 ctggccaact atctctccta ccactcggat gtgatcgagg atgtgagcgg agacggcttg 22500 ctggagtgcc actgccgctg caatctgtgc acgccccacc ggtccctagc ttgcaacccc 22560 cagttgatga gcgaaaccca gataataggc acctttgaat tgcaaggccc cagcagccaa 22620 ggcgatgggt cttctcctgg gcaaagttta aaactgaccc cgggactgtg gacctccgcc 22680 tacttgcgca agtttgctcc ggaagattac cacccctatg aaatcaagtt ctatgaggac 22740 caatcacagc ctccaaaggc cgaactttcg gcttgcgtca tcacccaggg ggcaattctg 22800 gcccaattgc aagccatcca aaaatcccgc caagaatttc tactgaaaaa gggtaagggg 22860 gtctaccttg acccccagac cggcgaggaa ctcaacacaa ggttccctca ggatgtccca 22920 acgacgagaa aacaagaagt tgaaggtgca gccgccgccc ccagaagata tggaggaaga 22980 ttgggacagt caggcagagg aggcggagga ggacagtctg gaggacagtc tggaggaaga 23040 cagtttggag gaggaaaacg aggaggcaga ggaggtggaa gaagtaaccg ccgacaaaca 23100 gttatcctcg gctgcggaga caagcaacag cgctaccatc tccgctccga gtcgaggaac 23160 ccggcggcgt cccagcagta gatgggacga gaccggacgc ttcccgaacc caaccagcgc 23220 ttccaagacc ggtaagaagg atcggcaggg atacaagtcc tggcgggggc ataagaatgc 23280 catcatctcc tgcttgcatg agtgcggggg caacatatcc ttcacgcggc gctacttgct 23340 attccaccat ggggtgaact ttccgcgcaa tgttttgcat tactaccgtc acctccacag 23400 cccctactat agccagcaaa tcccgacagt ctcgacagat aaagacagcg gcggcgacct 23460 ccaacagaaa accagcagcg gcagttagaa aatacacaac aagtgcagca acaggaggat 23520 taaagattac agccaacgag ccagcgcaaa cccgagagtt aagaaatcgg atctttccaa 23580 ccctgtatgc catcttccag cagagtcggg gtcaagagca ggaactgaaa ataaaaaacc 23640 gatctctgcg ttcgctcacc agaagttgtt tgtatcacaa gagcgaagat caacttcagc 23700 gcactctcga ggacgccgag gctctcttca acaagtactg cgcgctgact cttaaagagt 23760 aggcagcgac cgcgcttatt caaaaaaggc gggaattaca tcatcctcga catgagtaaa 23820 gaaattccca cgccttacat gtggagttat caaccccaaa tgggattggc agcaggcgcc 23880 tcccaggact actccacccg catgaattgg ctcagcgccg ggccttctat gatttctcga 23940 gttaatgata tacgcgccta ccgaaaccaa atacttttgg aacagtcagc tcttaccacc 24000 acgccccgcc aacaccttaa tcccagaaat tggcccgccg ccctagtgta ccaggaaagt 24060 cccgctccca ccactgtatt acttcctcga gacgcccagg ccgaagtcca aatgactaat 24120 gcaggtgcgc agttagctgg cggctccacc ctatgtcgtc acaggcctcg gcataatata 24180 aaacgcctga tgatcagagg ccgaggtatc cagctcaacg acgagtcggt gagctctccg 24240 cttggtctac gaccagacgg aatctttcag attgccggct gcgggagatc ttccttcacc 24300 cctcgtcagg ctgttctgac tttggaaagt tcgtcttcgc aaccccgctc gggcggaatc 24360 gggaccgttc aatttgtaga ggagtttact ccctctgtct acttcaaccc cttctccgga 24420 tctcctgggc actacccgga cgagttcata ccgaacttcg acgcgattag cgagtcagtg 24480 gacggctacg attgatgtct ggtgacgcgg ctgagctatc tcggctgcga catctagacc 24540 actgccgccg ctttcgctgc tttgcccggg aacttattga gttcatctac ttcgaactcc 24600 ccaaggatca ccctcaaggt ccggcccacg gagtgcggat tactatcgaa ggcaaaatag 24660 actctcgcct gcaacgaatt ttctcccagc ggcccgtgct gatcgagcga gaccagggaa 24720 acaccacggt tagtaatcaa ttacggggtc attagttcat agcccatata tggagttaac 24780 ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa tttcacaaat 24840 aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa tgtatcttat 24900 catgtctgct cgaagcggcc ggccgccccg actctagagt cgcggcctca ttaggaagtt 24960 cctatacttt ctagagaata ggaacttctc agaagaactc gtcaagaagg cgatagaagg 25020 cgatgcgctg cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg tcagcccatt 25080 cgccgccaag ctcttcagca atatcacggg tagccaacgc tatgtcctga tagcggtccg 25140 ccacacccag ccggccacag tcgatgaatc cagaaaagcg gccattttcc accatgatat 25200 tcggcaagca ggcatcgcca tgggtcacga cgagatcctc gccgtcgggc atgcgcgcct 25260 tgagcctggc gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc agatcatcct 25320 gatcgacaag accggcttcc atccgagtac gtgctcgctc gatgcgatgt ttcgcttggt 25380 ggtcgaatgg gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca tcagccatga 25440 tggatacttt ctcggcagga gcaaggtgag atgacaggag atcctgcccc ggcacttcgc 25500 ccaatagcag ccagtccctt cccgcttcag tgacaacgtc gagcacagct gcgcaaggaa 25560 cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ctgcagttca ttcagggcac 25620 cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc cggaacacgg 25680 cggcatcaga gcagccgatt gcctgttgtg cccagtcata gccgaatagc ctctccaccc 25740 aagcggccgg agaacctgcg tgcaatccat cttgttcaat ggccgatccc ataacacccc 25800 ttgtattact gtttatgtaa gcagacagtt ttactgttcg tgatgatata tttttatctt 25860 gtgcaatgta acaggttgtg gccatagcgg gcccgggatt ttcctccacg tccccgcatg 25920 ttagaagact tcccctgccc tcggctctgg aagttcctat actttctaga gaataggaac 25980 ttcccgccag aatgcgttcg cacagccgcc agccggtcac tccgttgatg gttactcgga 26040 acagcaggga gccgtcgggg ttgatcaggc gctcgtcgat aattttgttg ccgttccaca 26100 gggtccctgt tacagtgatc tttttgccgt cgaacacggc gatgccttca tacggccgtc 26160 cgaaatagtc gatcatgttc ggcgtaaccc cgtcgattac cagtgtgcca tagtgcagga 26220 tcaccttaaa gtgatgatca tccacagggt acaccacctt aaaaattttt tcgatctggc 26280 ccatttggtc gccgctcaga ccttcatacg ggatgatgac atggatgtcg atcttcagcc 26340 cattttcacc gctcaggaca atcctttgga tcggagttac ggacaccccg agattctgaa 26400 acaaactgga cacacctccc tgttcaagga cttggtccag gttgtagccg gctgtctgtc 26460 gccagtcccc aacgaaatct tcgagtgtga agaccatgga tccgggcccg gggttttctt 26520 caacgtctcc agcctgcttc agcaggctga agttagtagc tccgcttcct cgagctcgag 26580 atctggcgaa ggcgatgggg gtcttgaagg cgtgctggta ctccacgatg cccagctcgg 26640 tgttgctgtg cagctcctcc acgcggcgga aggcgaacat ggggcccccg ttctgcagga 26700 tgctggggtg gatggcgctc ttgaagtgca tgtggctgtc caccacgaag ctgtagtagc 26760 cgccgtcgcg caggctgaag gtgcgggcga agctgcccac cagcacgtta tcgcccatgg 26820 ggtgcaggtg ctccacggtg gcgttgctgc ggatgatctt gtcggtgaag atcacgctgt 26880 cctcggggaa gccggtgccc accaccttga agtcgccgat cacgcggccg gcctcgtagc 26940 ggtagctgaa gctcacgtgc agcacgccgc cgtcctcgta cttctcgatg cgggtgttgg 27000 tgtagccgcc gttgttgatg gcgtgcagga aggggttctc gtagccgctg gggtaggtgc 27060 cgaagtggta gaagccgtag cccatcacgt ggctcagcag gtaggggctg aaggtcaggg 27120 cgcctttggt gctcttcatc ttgttggtca tgcggccctg ctcgggggtg ccctctccgc 27180 cgcccaccag ctcgaactcc acgccgttca gggtgccggt gatgcggcac tcgatcttca 27240 tggcgggcat ggtggcgacc ggtagcgcta gcggcttcgg taccacgcgt tcgctcgaat 27300 taatcaattc tttgccaaaa tgatgagaca gcacaataac cagcacgttg cccaggagct 27360 gtaggaaaaa gaagaaggca tgaacatggt tagcagaggc tctagagccg ccggtcacac 27420 gccagaagcc gaaccccgcc ctgccccgtc ccccccgaag gcagccgtcc ccccgcggac 27480 agccccgagg ctggagaggg agaaggggac ggcggcgcgg cgacgcacga aggccctccc 27540 cgcccatttc cttcctgccg gggccctccc ggagcccctc aaggctttca cgcagccaca 27600 gaaaagaaac aagccgtcat taaaccaagc gctaattaca gcccggagga gaagggccgt 27660 cccgcccgct cacctgtggg agtaacgcgg tcagtcagag ccggggcggg cggcgcgagg 27720 cggcgcggag cggggcacgg ggcgaaggca acgcagcgac tcccgcccgc cgcgcgcttc 27780 gctttttata gggccgccgc cgccgccgcc tcgccataaa aggaaacttt cggagcgcgc 27840 cgctctgatt ggctgccgcc gcacctctcc gcctcgcccc gccccgcccc tcgccccgcc 27900 ccgccccgcc tggcgcgcgc cccccccccc cccccgcccc catcgctgca caaaataatt 27960 aaaaaataaa taaatacaaa attgggggtg gggagggggg ggagatgggg agagtgaagc 28020 agaacgtggg gctcacctcg accatggtaa tagcgatgac taatacgtag atgtactgcc 28080 aagtaggaaa gtcccataag gtcatgtact gggcataatg ccaggcgggc catttaccgt 28140 cattgacgtc aatagggggc gtacttggca tatgatacac ttgatgtact gccaagtggg 28200 cagtttaccg taaatactcc acccattgac gtcaatggaa agtccctatt ggcgttacta 28260 tgggaacata cgtcattatt gacgtcaatg ggcgggggtc gttgggcggt cagccaggcg 28320 ggccatttac cgtaagttat gtaacgcgga acaacaacaa ttgcattcat tttatgtttc 28380 aggttcaggg ggaggtgtgg tcctgcgatt ccatcgagtg cacctacacc ctgctgaaga 28440 ccctatgcgg cctaagagac ctgctaccaa tgaattaaaa aaaaatgatt aataaaaaat 28500 cacttacttg aaatcagcaa taaggtctct gttgaaattt tctcccagca gcacctcact 28560 tccctcttcc caactctggt attctaaacc ccgttcagcg gcatactttc tccatacttt 28620 aaaggggatg tcaaatttta gctcctctcc tgtacccaca atcttcatgt ctttcttccc 28680 agatgaccaa gagagtccgg ctcagtgact ccttcaaccc tgtctacccc tatgaagatg 28740 aaagcacctc ccaacacccc tttataaacc cagggtttat ttccccaaat ggcttcacac 28800 aaagcccaga cggagttctt actttaaaat gtttaacccc actaacaacc acaggcggat 28860 ctctacagct aaaagtggga gggggactta cagtggatga cactgatggt accttacaag 28920 aaaacatacg tgctacagca cccattacta aaaataatca ctctgtagaa ctatccattg 28980 gaaatggatt agaaactcaa aacaataaac tatgtgccaa attgggaaat gggttaaaat 29040 ttaacaacgg tgacatttgt ataaaggata gtattaacac cttatggact ggaataaacc 29100 ctccacctaa ctgtcaaatt gtggaaaaca ctaatacaaa tgatggcaaa cttactttag 29160 tattagtaaa aaatggaggg cttgttaatg gctacgtgtc tctagttggt gtatcagaca 29220 ctgtgaacca aatgttcaca caaaagacag caaacatcca attaagatta tattttgact 29280 cttctggaaa tctattaact gaggaatcag acttaaaaat tccacttaaa aataaatctt 29340 ctacagcgac cagtgaaact gtagccagca gcaaagcctt tatgccaagt actacagctt 29400 atcccttcaa caccactact agggatagtg aaaactacat tcatggaata tgttactaca 29460 tgactagtta tgatagaagt ctatttccct tgaacatttc tataatgcta aacagccgta 29520 tgatttcttc caatgttgcc tatgccatac aatttgaatg gaatctaaat gcaagtgaat 29580 ctccagaaag caacatagct acgctgacca catccccctt tttcttttct tacattacag 29640 aagacgacaa ctaaaataaa gtttaagtgt ttttatttaa aatcacaaaa ttcgagtagt 29700 tattttgcct ccaccttccc atttgacaga atacacagtc ctttctcccc ggctggcctt 29760 aaaaagcatc atatcatggg taacagacat attcttaggt gttatattcc acacggtttc 29820 ctgtcgagcc aaacgctcat cagtgatatt aataaactcc ccgggcagct cacttaagtt 29880 catgtcgctg tccagctgct gagccacagg ctgctgtcca acttgcggtt gcttaacggg 29940 cggcgaagga gaagtccacg cctacatggg ggtagagtca taatcgtgca tcaggatagg 30000 gcggtggtgc tgcagcagcg cgcgaataaa ctgctgccgc cgccgctccg tcctgcagga 30060 atacaacatg gcagtggtct cctcagcgat gattcgcacc gcccgcagca taaggcgcct 30120 tgtcctccgg gcacagcagc gcaccctgat ctcacttaaa tcagcacagt aactgcagca 30180 cagcaccaca atattgttca aaatcccaca gtgcaaggcg ctgtatccaa agctcatggc 30240 ggggaccaca gaacccacgt ggccatcata ccacaagcgc aggtagatta agtggcgacc 30300 cctcataaac acgctggaca taaacattac ctcttttggc atgttgtaat tcaccacctc 30360 ccggtaccat ataaacctct gattaaacat ggcgccatcc accaccatcc taaaccagct 30420 ggccaaaacc tgcccgccgg ctatacactg cagggaaccg ggactggaac aatgacagtg 30480 gagagcccag gactcgtaac catggatcat catgctcgtc atgatatcaa tgttggcaca 30540 acacaggcac acgtgcatac acttcctcag gattacaagc tcctcccgcg ttagaaccat 30600 atcccaggga acaacccatt cctgaatcag cgtaaatccc acactgcagg gaagacctcg 30660 cacgtaactc acgttgtgca ttgtcaaagt gttacattcg ggcagcagcg gatgatcctc 30720 cagtatggta gcgcgggttt ctgtctcaaa aggaggtaga cgatccctac tgtacggagt 30780 gcgccgagac aaccgagatc gtgttggtcg tagtgtcatg ccaaatggaa cgccggacgt 30840 agtcattctc gtattttgta tagcaaaacg cggccctggc agaacacact cttcttcgcc 30900 ttctatcctg ccgcttagcg tgttccgtgt gatagttcaa gtacagccac actcttaagt 30960 tggtcaaaag aatgctggct tcagttgtaa tcaaaactcc atcgcatcta attgttctga 31020 ggaaatcatc cacggtagca tatgcaaatc ccaaccaagc aatgcaactg gattgcgttt 31080 caagcaggag aggagaggga agagacggaa gaaccatgtt aatttttatt ccaaacgatc 31140 tcgcagtact tcaaattgta gatcgcgcag atggcatctc tcgcccccac tgtgttggtg 31200 aaaaagcaca gctaaatcaa aagaaatgcg attttcaagg tgctcaacgg tggcttccaa 31260 caaagcctcc acgcgcacat ccaagaacaa aagaatacca aaagaaggag cattttctaa 31320 ctcctcaatc atcatattac attcctgcac cattcccaga taattttcag ctttccagcc 31380 ttgaattatt cgtgtcagtt cttgtggtaa atccaatcca cacattacaa acaggtcccg 31440 gagggcgccc tccaccacca ttcttaaaca caccctcata atgacaaaat atcttgctcc 31500 tgtgtcacct gtagcgaatt gagaatggca acatcaattg acatgccctt ggctctaagt 31560 tcttctttaa gttctagttg taaaaactct ctcatattat caccaaactg cttagccaga 31620 agccccccgg gaacaagagc aggggacgct acagtgcagt acaagcgcag acctccccaa 31680 ttggctccag caaaaacaag attggaataa gcatattggg aaccaccagt aatatcatcg 31740 aagttgctgg aaatataatc aggcagagtt tcttgtagaa attgaataaa agaaaaattt 31800 gccaaaaaaa cattcaaaac ctctgggatg caaatgcaat aggttaccgc gctgcgctcc 31860 aacattgtta gttttgaatt agtctgcaaa aataaaaaaa aaacaagcgt catatcatag 31920 tagcctgacg aacaggtgga taaatcagtc tttccatcac aagacaagcc acagggtctc 31980 cagctcgacc ctcgtaaaac ctgtcatcgt gattaaacaa cagcaccgaa agttcctcgc 32040 ggtgaccagc atgaataagt cttgatgaag catacaatcc agacatgtta gcatcagtta 32100 aggagaaaaa acagccaaca tagcctttgg gtataattat gcttaatcgt aagtatagca 32160 aagccacccc tcgcggatac aaagtaaaag gcacaggaga ataaaaaata taattatttc 32220 tctgctgctg tttaggcaac gtcgcccccg gtccctctaa atacacatac aaagcctcat 32280 cagccatggc ttaccagaga aagtacagcg ggcacacaaa ccacaagctc taaagtcact 32340 ctccaacctc tccacaatat atatacacaa gccctaaact gacgtaatgg gactaaagtg 32400 taaaaaatcc cgccaaaccc aacacacacc ccgaaactgc gtcaccaggg aaaagtacag 32460 tttcacttcc gcaatcccaa caagcgtcac ttcctctttc tcacggtacg tcacatccca 32520 ttaacttaca acgtcatttt cccacggccg cgccgcccct tttaaccgtt aaccccacag 32580 ccaatcacca cacggcccac actttttaaa atcacctcat ttacatattg gcaccattcc 32640 atctataagg tatattattg atgatggcca agctatttag gtgacactat agaatactca 32700 agctatgcat caagcttggt accg 32724 <210> 57 <211> 32724 <212> DNA <213> Artificial Sequence <220> <223> PS2 <400> 57 catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60 aaaagtgtgg gccgtgtggt gattggctgt ggggttaacg gttaaaaggg gcggcgcggc 120 cgtgggaaaa tgacgtttta tgggggtgga gtttttttgc aagttgtcgc gggaaatgat 180 aacttcgtat agcatacatt atacgaagtt attagacttt gacccattac gtggaggttt 240 cgattaccgt gttttttacc tgaatttccg cgtaccgtgt caaagtcttc tgtttttacg 300 taggtgtcag ctgatcgcta gggtatttat aacttcgtat agcatacatt atacgaagtt 360 atggaatgtt tatgccttac cagtgtaaca tgaatcatgt gaaagtgttg ttggaaccag 420 atgccttttc cagaatgagc ctaacaggaa tctttgacat gaacacgcaa atctggaaga 480 tcctgaggta tgatgatacg agatcgaggg tgcgcgcatg cgaatgcgga ggcaagcatg 540 ccaggttcca gccggtgtgt gtagatgtga ccgaagatct cagaccggat catttggtta 600 ttgcccgcac tggagcagag ttcggatcca gtggagaaga aactgactaa ggtgagtatt 660 gggaaaactt tggggtggga ttttcagatg gacagattga gtaaaaattt gttttttctg 720 tcttgcagct gacatgagtg gaaatgcttc ttttaagggg ggagtcttca gcccttatct 780 gacagggcgt ctcccatcct gggcaggagt tcgtcagaat gttatgggat ctactgtgga 840 tggaagaccc gttcaacccg ccaattcttc aacgctgacc tatgctactt taagttcttc 900 acctttggac gcagctgcag ccgctgccgc cgcctctgtc gccgctaaca ctgtgcttgg 960 aatgggttac tatggaagca tcgtggctaa ttccacttcc tctaataacc cttctacact 1020 gactcaggac aagttacttg tccttttggc ccagctggag gctttgaccc aacgtctggg 1080 tgaactttct cagcaggtgg ccgagttgcg agtacaaact gagtctgctg tcggcacggc 1140 aaagtctaaa taaaaaaaat tccagaatca atgaataaat aaacgagctt gttgttgatt 1200 taaaatcaag tgtttttatt tcatttttcg cgcacggtat gccctggacc accgatctcg 1260 atcattgaga actcggtgga ttttttccag aatcctatag aggtgggatt gaatgtttag 1320 atacatgggc attaggccgt ctttggggtg gagatagctc cattgaaggg attcatgctc 1380 cggggtagtg ttgtaaatca cccagtcata acaaggtcgc agtgcatggt gttgcacaat 1440 atcttttaga agtaggctga ttgccacaga taagcccttg gtgtaggtgt ttacaaaccg 1500 gttgagctgg gaggggtgca ttcgaggtga aattatgtgc attttggatt ggatttttaa 1560 gttggcaata ttgccgccaa gatcccgtct tgggttcatg ttatgaagga ctaccaagac 1620 ggtgtatccg gtacatttag gaaatttatc gtgcagcttg gatggaaaag cgtggaaaaa 1680 tttggagaca cccttgtgtc ctccgagatt ttccatgcac tcatccatga taatagcaat 1740 ggggccgtgg gcagcggcgc gggcaaacac gttccgtggg tctgacacat catagttatg 1800 ttcctgagtt aaatcatcat aagccatttt aatgaatttg gggcggagcg taccagattg 1860 gggtatgaat gttccttcgg gccccggagc atagttcccc tcacagattt gcatttccca 1920 agctttcagt tctgagggtg gaatcatgtc cacctggggg gctatgaaga acaccgtttc 1980 gggggcgggg gtgattagtt gggatgatag caagtttctg agcaattgag atttgccaca 2040 tccggtgggg ccataaataa ttccgattac aggttgcagg tggtagttta gggaacggca 2100 actgccgtct tctcgaagca agggggccac ctcgttcatc atttccctta catgcatatt 2160 ttcccgcacc aaatccatta ggaggcgctc tcctcctagt gatagaagtt cttgtagtga 2220 ggaaaagttt ttcagcggtt ttagaccgtc agccatgggc attttggaaa gagtttgctg 2280 caaaagttct agtctgttcc acagttcagt gatgtgttct atggcatctc gatccagcag 2340 acctcctcgt ttcgcgggtt tggacggctc ctggagtagg gtatgagacg atgggcgtcc 2400 agcgctgcca gggttcggtc cttccagggt ctcagtgttc gagtcagggt tgtttccgtc 2460 acagtgaagg ggtgtgcgcc tgcttgggcg cttgccaggg tgcgcttcag actcattctg 2520 ctggtggaga acttctgtcg cttggcgccc tgtatgtcgg ccaagtagca gtttaccatg 2580 agttcgtagt tgagcgcctc ggctgcgtgg cctttggcgc ggagcttacc tttggaagtt 2640 ttcttgcata ccgggcagta taggcatttc agcgcataca gcttgggcgc aaggaaaatg 2700 gattctgggg agtatgcatc cgcgccgcag gaggcgcaaa cagtttcaca ttccaccagc 2760 caggttaaat ccggttcatt ggggtcaaaa acaagttttc cgccatattt tttgatgcgt 2820 ttcttacctt tggtctccat aagttcgtgt cctcgttgag tgacaaacag gctgtccgta 2880 tctccgtaga ctgattttac aggcctcttc tccagtggag tgcctcggtc ttcttcgtac 2940 aggaactctg accactctga tacaaaggcg cgcgtccagg ccagcacaaa ggaggctatg 3000 tgggaggggt agcgatcgtt gtcaaccagg gggtccacct tttccaaagt atgcaaacac 3060 atgtcaccct cttcaacatc caggaatgtg attggcttgt aggtgtattt cacgtgacct 3120 ggggtccccg ctgggggggt ataaaagggg gcggttcttt gctcttcctc actgtcttcc 3180 ggatcgctgt ccaggaacgt cagctgttgg ggtaggtatt ccctctcgaa ggcgggcatg 3240 acctctgcac tcaggttgtc agtttctaag aacgaggagg atttgatatt gacagtgccg 3300 gttgagatgc ctttcatgag gttttcgtcc atttggtcag aaaacacaat ttttttattg 3360 tcaagtttgg tggcaaatga tccatacagg gcgttggata aaagtttggc aatggatcgc 3420 atggtttggt tcttttcctt gtccgcgcgc tctttggcgg cgatgttgag ttggacatac 3480 tcgcgtgcca ggcacttcca ttcggggaag atagttgtta attcatctgg cacgattctc 3540 acttgccacc ctcgattatg caaggtaatt aaatccacac tggtggccac ctcgcctcga 3600 aggggttcat tggtccaaca gagcctacct cctttcctag aacagaaagg gggaagtggg 3660 tctagcataa gttcatcggg agggtctgca tccatggtaa agattcccgg aagtaaatcc 3720 ttatcaaaat agctgatggg agtggggtca tctaaggcca tttgccattc tcgagctgcc 3780 agtgcgcgct catatgggtt aaggggactg ccccagggca tgggatgggt gagagcagag 3840 gcatacatgc cacagatgtc atagacgtag atgggatcct caaagatgcc tatgtaggtt 3900 ggatagcatc gcccccctct gatacttgct cgcacatagt catatagttc atgtgatggc 3960 gctagcagcc ccggacccaa gttggtgcga ttgggttttt ctgttctgta gacgatctgg 4020 cgaaagatgg cgtgagaatt ggaagagatg gtgggtcttt gaaaaatgtt gaaatgggca 4080 tgaggtagac ctacagagtc tctgacaaag tgggcataag attcttgaag cttggttacc 4140 agttcggcgg tgacaagtac gtctagggcg cagtagtcaa gtgtttcttg aatgatgtca 4200 taacctggtt ggtttttctt ttcccacagt tcgcggttga gaaggtattc ttcgcgatcc 4260 ttccagtact cttctagcgg aaacccgtct ttgtctgcac ggtaagatcc tagcatgtag 4320 aactgattaa ctgccttgta agggcagcag cccttctcta cgggtagaga gtatgcttga 4380 gcagcttttc gtagcgaagc gtgagtaagg gcaaaggtgt ctctgaccat gactttgaga 4440 aattggtatt tgaagtccat gtcgtcacag gctccctgtt cccagagttg gaagtctacc 4500 cgtttcttgt aggcggggtt gggcaaagcg aaagtaacat cattgaagag aatcttaccg 4560 gctctgggca taaaattgcg agtgatgcgg aaaggctgtg gtacttccgc tcgattgttg 4620 atcacctggg cagctaggac gatttcgtcg aaaccgttga tgttgtgtcc tacgatgtat 4680 aattctatga aacgcggcgt gcctctgacg tgaggtagct tactgagctc atcaaaggtt 4740 aggtctgtgg ggtcagataa ggcgtagtgt tcgagagccc attcgtgcag gtgaggattt 4800 gcatgtagga atgatgacca aagatctacc gccagtgctg tttgtaactg gtcccgatac 4860 tgacgaaaat gccggccaat tgccattttt tctggagtga cacagtagaa ggttctgggg 4920 tcttgttgcc atcgatccca cttgagttta atggctagat cgtgggccat gttgacgaga 4980 cgctcttctc ctgagagttt catgaccagc atgaaaggaa ctagttgttt gccaaaggat 5040 cccatccagg tgtaagtttc cacatcgtag gtcaggaaga gtctttctgt gcgaggatga 5100 gagccgatcg ggaagaactg gatttcctgc caccagttgg aggattggct gttgatgtga 5160 tggaagtaga agtttctgcg gcgcgccgag cattcgtgtt tgtgcttgta cagacggccg 5220 cagtagtcgc agcgttgcac gggttgtatc tcgtgaatga gctgtacctg gcttcccttg 5280 acgagaaatt tcagtgggaa gccgaggcct ggcgattgta tctcgtgctc ttctatattc 5340 gctgtatcgg cctgttcatc ttctgtttcg atggtggtca tgctgacgag cccccgcggg 5400 aggcaagtcc agacctcggc gcgggagggg cggagctgaa ggacgagagc gcgcaggctg 5460 gagctgtcca gagtcctgag acgctgcgga ctcaggttag taggtaggga cagaagatta 5520 acttgcatga tcttttccag ggcgtgcggg aggttcagat ggtacttgat ttccacaggt 5580 tcgtttgtag agacgtcaat ggcttgcagg gttccgtgtc ctttgggcgc cactaccgta 5640 cctttgtttt ttcttttgat cggtggtggc tctcttgctt cttgcatgct cagaagcggt 5700 gacggggacg cgcgccgggc ggcagcggtt gttccggacc cgggggcatg gctggtagtg 5760 gcacgtcggc gccgcgcacg ggcaggttct ggtattgcgc tctgagaaga cttgcgtgcg 5820 ccaccacgcg tcgattgacg tcttgtatct gacgtctctg ggtgaaagct accggccccg 5880 tgagcttgaa cctgaaagag agttcaacag aatcaatttc ggtatcgtta acggcagctt 5940 gtctcagtat ttcttgtacg tcaccagagt tgtcctggta ggcgatctcc gccatgaact 6000 gctcgatttc ttcctcctga agatctccgc gacccgctct ttcgacggtg gccgcgaggt 6060 cattggagat acggcccatg agttgggaga atgcattcat gcccgcctcg ttccagacgc 6120 ggctgtaaac cacggccccc tcggagtctc ttgcgcgcat caccacctga gcgaggttaa 6180 gctccacgtg tctggtgaag accgcatagt tgcataggcg ctgaaaaagg tagttgagtg 6240 tggtggcaat gtgttcggcg acgaagaaat acatgatcca tcgtctcagc ggcatttcgc 6300 taacatcgcc cagagcttcc aagcgctcca tggcctcgta gaagtccacg gcaaaattaa 6360 aaaactggga gtttcgcgcg gacacggtca attcctcctc gagaagacgg atgagttcgg 6420 ctatggtggc ccgtacttcg cgttcgaagg ctcccgggat ctcttcttcc tcttctatct 6480 cttcttccac taacatctct tcttcgtctt caggcggggg cggagggggc acgcggcgac 6540 gtcgacggcg cacgggcaaa cggtcgatga atcgttcaat gacctctccg cggcggcggc 6600 gcatggtttc agtgacggcg cggccgttct cgcgcggtcg cagagtaaaa acaccgccgc 6660 gcatctcctt aaagtggtga ctgggaggtt ctccgtttgg gagggagagg gcgctgatta 6720 tacattttat taattggccc gtagggactg cgcgcagaga tctgatcgtg tcaagatcca 6780 cgggatctga aaacctttcg acgaaagcgt ctaaccagtc acagtcacaa ggtaggctga 6840 gtacggcttc ttgtgggcgg gggtggttat gtgttcggtc tgggtcttct gtttcttctt 6900 catctcggga aggtgagacg atgctgctgg tgatgaaatt aaagtaggca gttctaagac 6960 ggcggatggt ggcgaggagc accaggtctt tgggtccggc ttgctggata cgcaggcgat 7020 tggccattcc ccaagcatta tcctgacatc tagcaagatc tttgtagtag tcttgcatga 7080 gccgttctac gggcacttct tcctcacccg ttctgccatg catacgtgtg agtccaaatc 7140 cgcgcattgg ttgtaccagt gccaagtcag ctacgactct ttcggcgagg atggcttgct 7200 gtacttgggt aagggtggct tgaaagtcat caaaatccac aaagcggtgg taagcccctg 7260 tattaatggt gtaagcacag ttggccatga ctgaccagtt aactgtctgg tgaccagggc 7320 gcacgagctc ggtgtattta aggcgcgaat aggcgcgggt gtcaaagatg taatcgttgc 7380 aggtgcgcac cagatactgg taccctataa gaaaatgcgg cggtggttgg cggtagagag 7440 gccatcgttc tgtagctgga gcgccagggg cgaggtcttc caacataagg cggtgatagc 7500 cgtagatgta cctggacatc caggtgattc ctgcggcggt agtagaagcc cgaggaaact 7560 cgcgtacgcg gttccaaatg ttgcgtagcg gcatgaagta gttcattgta ggcacggttt 7620 gaccagtgag gcgcgcgcag tcattgatgc tctatagaca cggagaaaat gaaagcgttc 7680 agcgactcga ctccgtagcc tggaggaacg tgaacgggtt gggtcgcggt gtaccccggt 7740 tcgagacttg tactcgagcc ggccggagcc gcggctaacg tggtattggc actcccgtct 7800 cgacccagcc tacaaaaatc caggatacgg aatcgagtcg ttttgctggt ttccgaatgg 7860 cagggaagtg agtcctattt tttttttttt tgccgctcag atgcatcccg tgctgcgaca 7920 gatgcgcccc caacaacagc ccccctcgca gcagcagcag cagcaaccac aaaaggctgt 7980 ccctgcaact actgcaactg ccgccgtgag cggtgcggga cagcccgcct atgatctgga 8040 cttggaagag ggcgaaggac tggcacgtct aggtgcgcct tcgcccgagc ggcatccgcg 8100 agttcaactg aaaaaagatt ctcgcgaggc gtatgtgccc caacagaacc tatttagaga 8160 cagaagcggc gaggagccgg aggagatgcg agcttcccgc tttaacgcgg gtcgtgagct 8220 gcgtcacggt ttggaccgaa gacgagtgtt gcgagacgag gatttcgaag ttgatgaagt 8280 gacagggatc agtcctgcca gggcacacgt ggctgcagcc aaccttgtat cggcttacga 8340 gcagacagta aaggaagagc gtaacttcca aaagtctttt aataatcatg tgcgaaccct 8400 gattgcccgc gaagaagtta cccttggttt gatgcatttg tgggatttga tggaagctat 8460 cattcagaac cctactagca aacctctgac cgcccagctg tttctggtgg tgcaacacag 8520 cagagacaat gaggctttca gagaggcgct gctgaacatc accgaacccg aggggagatg 8580 gttgtatgat cttatcaaca ttctacagag tatcatagtg caggagcgga gcctgggcct 8640 ggccgagaag gtagctgcca tcaattactc ggttttgagc ttgggaaaat attacgctcg 8700 caaaatctac aagactccat acgttcccat agacaaggag gtgaagatag atgggttcta 8760 catgcgcatg acgctcaagg tcttgaccct gagcgatgat cttggggtgt atcgcaatga 8820 cagaatgcat cgcgcggtta gcgccagcag gaggcgcgag ttaagcgaca gggaactgat 8880 gcacagtttg caaagagctc tgactggagc tggaaccgag ggtgagaatt acttcgacat 8940 gggagctgac ttgcagtggc agcctagtcg cagggctctg agcgccgcga cggcaggatg 9000 tgagcttcct tacatagaag aggcggatga aggcgaggag gaagagggcg agtacttgga 9060 agactgatgg cacaacccgt gttttttgct agatggaaca gcaagcaccg gatcccgcaa 9120 tgcgggcggc gctgcagagc cagccgtccg gcattaactc ctcggacgat tggacccagg 9180 ccatgcaacg tatcatggcg ttgacgactc gcaaccccga agcctttaga cagcaacccc 9240 aggccaaccg tctatcggcc atcatggaag ctgtagtgcc ttcccgatct aatcccactc 9300 atgagaaggt cctggccatc gtgaacgcgt tggtggagaa caaagctatt cgtccagatg 9360 aggccggact ggtatacaac gctctcttag aacgcgtggc tcgctacaac agtagcaatg 9420 tgcaaaccaa tttggaccgt atgataacag atgtacgcga agccgtgtct cagcgcgaaa 9480 ggttccagcg tgatgccaac ctgggttcgc tggtggcgtt aaatgctttc ttgagtactc 9540 agcctgctaa tgtgccgcgt ggtcaacagg attatactaa ctttttaagt gctttgagac 9600 tgatggtatc agaagtacct cagagcgaag tgtatcagtc cggtcctgat tacttctttc 9660 agactagcag acagggcttg cagacggtaa atctgagcca agcttttaaa aaccttaaag 9720 gtttgtgggg agtgcatgcc ccggtaggag aaagagcaac cgtgtctagc ttgttaactc 9780 cgaactcccg cctgttatta ctgttggtag ctcctttcac cgacagcggt agcatcgacc 9840 gtaattccta tttgggttac ctactaaacc tgtatcgcga agccataggg caaagtcagg 9900 tggacgagca gacctatcaa gaaattaccc aagtcagtcg cgctttggga caggaagaca 9960 ctggcagttt ggaagccact ctgaacttct tgcttaccaa tcggtctcaa aagatccctc 10020 ctcaatatgc tcttactgcg gaggaggaga ggatccttag atatgtgcag cagagcgtgg 10080 gattgtttct gatgcaagag ggggcaactc cgactgcagc actggacatg acagcgcgaa 10140 atatggagcc cagcatgtat gccagtaacc gacctttcat taacaaactg ctggactact 10200 tgcacagagc tgccgctatg aactctgatt atttcaccaa tgccatctta aacccgcact 10260 ggctgccccc acctggtttc tacacgggcg aatatgacat gcccgaccct aatgacggat 10320 ttctgtggga cgacgtggac agcgatgttt tttcacctct ttctgatcat cgcacgtgga 10380 aaaaggaagg cggtgataga atgcattctt ctgcatcgct gtccggggtc atgggtgcta 10440 ccgcggctga gcccgagtct gcaagtcctt ttcctagtct acccttttct ctacacagtg 10500 tacgtagcag cgaagtgggt agaataagtc gcccgagttt aatgggcgaa gaggagtacc 10560 taaacgattc cttgctcaga ccggcaagag aaaaaaattt cccaaacaat ggaatagaaa 10620 gtttggtgga taaaatgagt agatggaaga cttatgctca ggatcacaga gacgagcctg 10680 ggatcatggg gactacaagt agagcgagcc gtagacgcca gcgccatgac agacagaggg 10740 gtcttgtgtg ggacgatgag gattcggccg atgatagcag cgtgttggac ttgggtggga 10800 gaggaagggg caacccgttt gctcatttgc gccctcgctt gggtggtatg ttgtgaaaaa 10860 aaataaaaaa gaaaaactca ccaaggccat ggcgacgagc gtacgttcgt tcttctttat 10920 tatctgtgtc tagtataatg aggcgagtcg tgctaggcgg agcggtggtg tatccggagg 10980 gtcctcctcc ttcgtacgag agcgtgatgc agcagcagca ggcgacggcg gtgatgcaat 11040 ccccactgga ggctcccttt gtgcctccgc gatacctggc acctacggag ggcagaaaca 11100 gcattcgtta ctcggaactg gcacctcagt acgataccac caggttgtat ctggtggaca 11160 acaagtcggc ggacattgct tctctgaact atcagaatga ccacagcaac ttcttgacca 11220 cggtggtgca gaacaatgac tttaccccta cggaagccag cacccagacc attaactttg 11280 atgaacgatc gcggtggggc ggtcagctaa agaccatcat gcatactaac atgccaaacg 11340 tgaacgagta tatgtttagt aacaagttca aagcgcgtgt gatggtgtcc agaaaacctc 11400 ccgacggtgc tgcagttggg gatacttatg atcacaagca ggatattttg gaatatgagt 11460 ggttcgagtt tactttgcca gaaggcaact tttcagttac tatgactatt gatttgatga 11520 acaatgccat catagataat tacttgaaag tgggtagaca gaatggagtg cttgaaagtg 11580 acattggtgt taagttcgac accaggaact tcaagctggg atgggatccc gaaaccaagt 11640 tgatcatgcc tggagtgtat acgtatgaag ccttccatcc tgacattgtc ttactgcctg 11700 gctgcggagt ggattttacc gagagtcgtt tgagcaacct tcttggtatc agaaaaaaac 11760 agccatttca agagggtttt aagattttgt atgaagattt agaaggtggt aatattccgg 11820 ccctcttgga tgtagatgcc tatgagaaca gtaagaaaga acaaaaagcc aaaatagaag 11880 ctgctacagc tgctgcagaa gctaaggcaa acatagttgc cagcgactct acaagggttg 11940 ctaacgctgg agaggtcaga ggagacaatt ttgcgccaac acctgttccg actgcagaat 12000 cattattggc cgatgtgtct gaaggaacgg acgtgaaact cactattcaa cctgtagaaa 12060 aagatagtaa gaatagaagc tataatgtgt tggaagacaa aatcaacaca gcctatcgca 12120 gttggtatct ttcgtacaat tatggcgatc ccgaaaaagg agtgcgttcc tggacattgc 12180 tcaccacctc agatgtcacc tgcggagcag agcaggttta ctggtcgctt ccagacatga 12240 tgaaggatcc tgtcactttc cgctccacta gacaagtcag taactaccct gtggtgggtg 12300 cagagcttat gcccgtcttc tcaaagagct tctacaacga acaagctgtg tactcccagc 12360 agctccgcca gtccacctcg cttacgcacg tcttcaaccg ctttcctgag aaccagattt 12420 taatccgtcc gccggcgccc accattacca ccgtcagtga aaacgttcct gctctcacag 12480 atcacgggac cctgccgttg cgcagcagta tccggggagt ccaacgtgtg accgttactg 12540 acgccagacg ccgcacctgt ccctacgtgt acaaggcact gggcatagtc gcaccgcgcg 12600 tcctttcaag ccgcactttc taaaaaaaaa atgtccattc ttatctcgcc cagtaataac 12660 accggttggg gtctgcgcgc tccaagcaag atgtacggag gcgcacgcaa acgttctacc 12720 caacatcccg tgcgtgttcg cggacatttt cgcgctccat ggggtgccct caagggccgc 12780 actcgcgttc gaaccaccgt cgatgatgta atcgatcagg tggttgccga cgcccgtaat 12840 tatactccta ctgcgcctac atctactgtg gatgcagtta ttgacagtgt agtggctgac 12900 gctcgcaact atgctcgacg taagagccgg cgaaggcgca ttgccagacg ccaccgagct 12960 accactgcca tgcgagccgc aagagctctg ctacgaagag ctagacgcgt ggggcgaaga 13020 gccatgctta gggcggccag acgtgcagct tcgggcgcca gcgccggcag gtcccgcagg 13080 caagcagccg ctgtcgcagc ggcgactatt gccgacatgg cccaatcgcg aagaggcaat 13140 gtatactggg tgcgtgacgc tgccaccggt caacgtgtac ccgtgcgcac ccgtccccct 13200 cgcacttaga agatactgag cagtctccga tgttgtgtcc cagcggcgag gatgtccaag 13260 cgcaaataca aggaagaaat gctgcaggtt atcgcacctg aagtctacgg ccaaccgttg 13320 aaggatgaaa aaaaaccccg caaaatcaag cgggttaaaa aggacaaaaa agaagaggaa 13380 gatggcgatg atgggctggc ggagtttgtg cgcgagtttg ccccacggcg acgcgtgcaa 13440 tggcgtgggc gcaaagttcg acatgtgttg agacctggaa cttcggtggt ctttacaccc 13500 ggcgagcgtt caagcgctac ttttaagcgt tcctatgatg aggtgtacgg ggatgatgat 13560 attcttgagc aggcggctga ccgattaggc gagtttgctt atggcaagcg tagtagaata 13620 acttccaagg atgagacagt gtcaataccc ttggatcatg gaaatcccac ccctagtctt 13680 aaaccggtca ctttgcagca agtgttaccc gtaactccgc gaacaggtgt taaacgcgaa 13740 ggtgaagatt tgtatcccac tatgcaactg atggtaccca aacgccagaa gttggaggac 13800 gttttggaga aagtaaaagt ggatccagat attcaacctg aggttaaagt gagacccatt 13860 aagcaggtag cgcctggtct gggggtacaa actgtagaca ttaagattcc cactgaaagt 13920 atggaagtgc aaactgaacc cgcaaagcct actgccacct ccactgaagt gcaaacggat 13980 ccatggatgc ccatgcctat tacaactgac gccgccggtc ccactcgaag atcccgacga 14040 aagtacggtc cagcaagtct gttgatgccc aattatgttg tacacccatc tattattcct 14100 actcctggtt accgaggcac tcgctactat cgcagccgaa acagtacctc ccgccgtcgc 14160 cgcaagacac ctgcaaatcg cagtcgtcgc cgtagacgca caagcaaacc gactcccggc 14220 gccctggtgc ggcaagtgta ccgcaatggt agtgcggaac ctttgacact gccgcgtgcg 14280 cgttaccatc cgagtatcat cacttaatca atgttgccgc tgcctccttg cagatatggc 14340 cctcacttgt cgccttcgcg ttcccatcac tggttaccga ggaagaaact cgcgccgtag 14400 aagagggatg ttgggacgcg gaatgcgacg ctacaggcga cggcgtgcta tccgcaagca 14460 attgcggggt ggttttttac cagccttaat tccaattatc gctgctgcaa ttggcgcgat 14520 accaggcata gcttccgtgg cggttcaggc ctcgcaacga cattgacatt ggaaaaaaaa 14580 cgtataaata aaaaaaaata caatggactc tgacactcct ggtcctgtga ctatgttttc 14640 ttagagatgg aagacatcaa tttttcatcc ttggctccgc gacacggcac gaagccgtac 14700 atgggcacct ggagcgacat cggcacgagc caactgaacg ggggcgcctt caattggagc 14760 agtatctgga gcgggcttaa aaattttggc tcaaccataa aaacatacgg gaacaaagct 14820 tggaacagca gtacaggaca ggcgcttaga aataaactta aagaccagaa cttccaacaa 14880 aaagtagtcg atgggatagc ttccggcatc aatggagtgg tagatttggc taaccaggct 14940 gtgcagaaaa agataaacag tcgtttggac ccgccgccag caaccccagg tgaaatgcaa 15000 gtggaggaag aaattcctcc gccagaaaaa cgaggcgaca agcgtccgcg tcccgatttg 15060 gaagagacgc tggtgacgcg cgtagatgaa ccgccttctt atgaggaagc aacgaagctt 15120 ggaatgccca ccactagacc gatagcccca atggccaccg gggtgatgaa accttctcag 15180 ttgcatcgac ccgtcacctt ggatttgccc cctccccctg ctgctactgc tgtacccgct 15240 tctaagcctg tcgctgcccc gaaaccagtc gccgtagcca ggtcacgtcc cgggggcgct 15300 cctcgtccaa atgcgcactg gcaaaatact ctgaacagca tcgtgggtct aggcgtgcaa 15360 agtgtaaaac gccgtcgctg cttttaatta aatatggagt agcgcttaac ttgcctatct 15420 gtgtatatgt gtcattacac gccgtcacag cagcagagga aaaaaggaag aggtcgtgcg 15480 tcgacgctga gttactttca agatggccac cccatcgatg ctgccccaat gggcatacat 15540 gcacatcgcc ggacaggatg cttcggagta cctgagtccg ggtctggtgc agttcgcccg 15600 cgccacagac acctacttca atctgggaaa taagtttaga aatcccaccg tagcgccgac 15660 ccacgatgtg accaccgacc gtagccagcg gctcatgttg cgcttcgtgc ccgttgaccg 15720 ggaggacaat acatactctt acaaagtgcg gtacaccctg gccgtgggcg acaacagagt 15780 gctggatatg gccagcacgt tctttgacat taggggcgtg ttggacagag gtcccagttt 15840 caaaccctat tctggtacgg cttacaactc tctggctcct aaaggcgctc caaatgcatc 15900 tcaatggatt gcaaaaggcg taccaactgc agcagccgca ggcaatggtg aagaagaaca 15960 tgaaacagag gagaaaactg ctacttacac ttttgccaat gctcctgtaa aagccgaggc 16020 tcaaattaca aaagagggct taccaatagg tttggagatt tcagctgaaa acgaatctaa 16080 acccatctat gcagataaac tttatcagcc agaacctcaa gtgggagatg aaacttggac 16140 tgacctagac ggaaaaaccg aagagtatgg aggcagggct ctaaagccta ctactaacat 16200 gaaaccctgt tacgggtcct atgcgaagcc tactaattta aaaggtggtc aggcaaaacc 16260 gaaaaactcg gaaccgtcga gtgaaaaaat tgaatatgat attgacatgg aattttttga 16320 taactcatcg caaagaacaa acttcagtcc taaaattgtc atgtatgcag aaaatgtagg 16380 tttggaaacg ccagacactc atgtagtgta caaacctgga acagaagaca caagttccga 16440 agctaatttg ggacaacagt ctatgcccaa cagacccaac tacattggct tcagagataa 16500 ctttattgga ctcatgtact ataacagtac tggtaacatg ggggtgctgg ctggtcaagc 16560 gtctcagtta aatgcagtgg ttgacttgca ggacagaaac acagaacttt cttaccaact 16620 cttgcttgac tctctgggcg acagaaccag atactttagc atgtggaatc aggctgtgga 16680 cagttatgat cctgatgtac gtgttattga aaatcatggt gtggaagatg aacttcccaa 16740 ctattgtttt ccactggacg gcataggtgt tccaacaacc agttacaaat caatagttcc 16800 aaatggagaa gataataata attggaaaga acctgaagta aatggaacaa gtgagatcgg 16860 acagggtaat ttgtttgcca tggaaattaa ccttcaagcc aatctatggc gaagtttcct 16920 ttattccaat gtggctctgt atctcccaga ctcgtacaaa tacaccccgt ccaatgtcac 16980 tcttccagaa aacaaaaaca cctacgacta catgaacggg cgggtggtgc cgccatctct 17040 agtagacacc tatgtgaaca ttggtgccag gtggtctctg gatgccatgg acaatgtcaa 17100 cccattcaac caccaccgta acgctggctt gcgttaccga tctatgcttc tgggtaacgg 17160 acgttatgtg cctttccaca tacaagtgcc tcaaaaattc ttcgctgtta aaaacctgct 17220 gcttctccca ggctcctaca cttatgagtg gaactttagg aaggatgtga acatggttct 17280 acagagttcc ctcggtaacg acctgcgggt agatggcgcc agcatcagtt tcacgagcat 17340 caacctctat gctacttttt tccccatggc tcacaacacc gcttccaccc ttgaagccat 17400 gctgcggaat gacaccaatg atcagtcatt caacgactac ctatctgcag ctaacatgct 17460 ctaccccatt cctgccaatg caaccaatat tcccatttcc attccttctc gcaactgggc 17520 ggctttcaga ggctggtcat ttaccagact gaaaaccaaa gaaactccct ctttggggtc 17580 tggatttgac ccctactttg tctattctgg ttctattccc tacctggatg gtaccttcta 17640 cctgaaccac acttttaaga aggtttccat catgtttgac tcttcagtga gctggcctgg 17700 aaatgacagg ttactatctc ctaacgaatt tgaaataaag cgcactgtgg atggcgaagg 17760 ctacaacgta gcccaatgca acatgaccaa agactggttc ttggtacaga tgctcgccaa 17820 ctacaacatc ggctatcagg gcttctacat tccagaagga tacaaagatc gcatgtattc 17880 atttttcaga aacttccagc ccatgagcag gcaggtggtt gatgaggtca attacaaaga 17940 cttcaaggcc gtcgccatac cctaccaaca caacaactct ggctttgtgg gttacatggc 18000 tccgaccatg cgccaaggtc aaccctatcc cgctaactat ccctatccac tcattggaac 18060 aactgccgta aatagtgtta cgcagaaaaa gttcttgtgt gacagaacca tgtggcgcat 18120 accgttctcg agcaacttca tgtctatggg ggcccttaca gacttgggac agaatatgct 18180 ctatgccaac tcagctcatg ctctggacat gacctttgag gtggatccca tggatgagcc 18240 caccctgctt tatcttctct tcgaagtttt cgacgtggtc agagtgcatc agccacaccg 18300 cggcatcatc gaggcagtct acctgcgtac accgttctcg gccggtaacg ctaccacgta 18360 agaagcttct tgcttcttgc aaatagcagc tgcaaccatg gcctgcggat cccaaaacgg 18420 ctccagcgag caagagctca gagccattgt ccaagacctg ggttgcggac cctatttttt 18480 gggaacctac gataagcgct tcccggggtt catggccccc gataagctcg cctgtgccat 18540 tgtaaatacg gccggacgtg agacgggggg agagcactgg ttggctttcg gttggaaccc 18600 acgttctaac acctgctacc tttttgatcc ttttggattc tcggatgatc gtctcaaaca 18660 gatttaccag tttgaatatg agggtctcct gcgccgcagc gctcttgcta ccaaggaccg 18720 ctgtattacg ctggaaaaat ctacccagac cgtgcagggc ccccgttctg ccgcctgcgg 18780 acttttctgc tgcatgttcc ttcacgcctt tgtgcactgg cctgaccgtc ccatggacgg 18840 aaaccccacc atgaaattgc taactggagt gccaaacaac atgcttcatt ctcctaaagt 18900 ccagcccacc ctgtgtgaca atcaaaaagc actctaccat tttcttaata cccattcgcc 18960 ttattttcgc tctcatcgta cacacatcga aagggccact gcgttcgacc gtatggatgt 19020 tcaataatga ctcatgtaaa caacgtgttc aataaacatc actttatttt tttacatgta 19080 tcaaggctct ggattactta tttatttaca agtcgaatgg gttctgacga gaatcagaat 19140 gacccgcagg cagtgatacg ttgcggaact gatacttggg ttgccacttg aattcgggaa 19200 tcaccaactt gggaaccggt atatcgggca ggatgtcact ccacagcttt ctggtcagct 19260 gcaaagctcc aagcaggtca ggagccgaaa tcttgaaatc acaattagga ccagtgctct 19320 gagcgcgaga gttgcggtac accggattgc agcactgaaa caccatcagc gacggatgtc 19380 tcacgcttgc cagcacggtg ggatctgcaa tcatgcccac atccagatct tcagcattgg 19440 caatgctgaa cggggtcatc ttgcaggtct gcctacccat ggcgggcacc caattaggct 19500 tgtggttgca atcgcagtgc agggggatca gtatcatctt ggcctgatcc tgtctgattc 19560 ctggatacac ggctctcatg aaagcatcat attgcttgaa agcctgctgg gctttactac 19620 cctcggtata aaacatcccg caggacctgc tcgaaaactg gttagctgca cagccggcat 19680 cattcacaca gcagcgggcg tcattgttgg ctatttgcac cacacttctg ccccagcggt 19740 tttgggtgat tttggttcgc tcgggattct cctttaaggc tcgttgtccg ttctcgctgg 19800 ccacatccat ctcgataatc tgctccttct gaatcataat attgccatgc aggcacttca 19860 gcttgccctc ataatcattg cagccatgag gccacaacgc acagcctgta cattcccaat 19920 tatggtgggc gatctgagaa aaagaatgta tcattccctg cagaaatctt cccatcatcg 19980 tgctcagtgt cttgtgacta gtgaaagtta actggatgcc tcggtgctct tcgtttacgt 20040 actggtgaca gatgcgcttg tattgttcgt gttgctcagg cattagttta aaacaggttc 20100 taagttcgtt atccagcctg tacttctcca tcagcagaca catcacttcc atgcctttct 20160 cccaagcaga caccaggggc aagctaatcg gattcttaac agtgcaggca gcagctcctt 20220 tagccagagg gtcatcttta gcgatcttct caatgcttct tttgccatcc ttctcaacga 20280 tgcgcacggg cgggtagctg aaacccactg ctacaagttg cgcctcttct ctttcttctt 20340 cgctgtcttg actgatgtct tgcatgggga tatgtttggt cttccttggc ttctttttgg 20400 ggggtatcgg aggaggagga ctgtcgctcc gttccggaga cagggaggat tgtgacgttt 20460 cgctcaccat taccaactga ctgtcggtag aagaacctga ccccacacgg cgacaggtgt 20520 ttttcttcgg gggcagaggt ggaggcgatt gcgaagggct gcggtccgac ctggaaggcg 20580 gatgactggc agaacccctt ccgcgttcgg gggtgtgctc cctgtggcgg tcgcttaact 20640 gatttccttc gcggctggcc attgtgttct cctaggcaga gaaacaacag acatggaaac 20700 tcagccattg ctgtcaacat cgccacgagt gccatcacat ctcgtcctca gcgacgagga 20760 aaaggagcag agcttaagca ttccaccgcc cagtcctgcc accacctcta ccctagaaga 20820 taaggaggtc gacgcatctc atgacatgca gaataaaaaa gcgaaagagt ctgagacaga 20880 catcgagcaa gacccgggct atgtgacacc ggtggaacac gaggaagagt tgaaacgctt 20940 tctagagaga gaggatgaaa actgcccaaa acagcgagca gataactatc accaagatgc 21000 tggaaatagg gatcagaaca ccgactacct catagggctt gacggggaag acgcgctcct 21060 taaacatcta gcaagacagt cgctcatagt caaggatgca ttattggaca gaactgaagt 21120 gcccatcagt gtggaagagc tcagctgcgc ctacgagctt aacctttttt cacctcgtac 21180 tccccccaaa cgtcagccaa acggcacctg cgagccaaat cctcgcttaa acttttatcc 21240 agcttttgct gtgccagaag tactggctac ctatcacatc ttttttaaaa atcaaaaaat 21300 tccagtctcc tgccgcgcta atcgcacccg cgccgatgcc ctactcaatc tgggacctgg 21360 ttcacgctta cctgatatag cttccttgga agaggttcca aagatcttcg agggtctggg 21420 caataatgag actcgggccg caaatgctct gcaaaaggga gaaaatggca tggatgagca 21480 tcacagcgtt ctggtggaat tggaaggcga taatgccaga ctcgcagtac tcaagcgaag 21540 cgtcgaggtc acacacttcg catatcccgc tgtcaacctg ccccctaaag tcatgacggc 21600 ggtcatggac cagttactca ttaagcgcgc aagtcccctt tcagaagaca tgcatgaccc 21660 agatgcctgt gatgagggta aaccagtggt cagtgatgag cagctaaccc gatggctggg 21720 caccgactct ccccgggatt tggaagagcg tcgcaagctt atgatggccg tggtgctggt 21780 taccgtagaa ctagagtgtc tccgacgttt ctttaccgat tcagaaacct tgcgcaaact 21840 cgaagagaat ctgcactaca cttttagaca cggctttgtg cggcaggcat gcaagatatc 21900 taacgtggaa ctcaccaacc tggtttccta catgggtatt ctgcatgaga atcgcctagg 21960 acaaagcgtg ctgcacagca cccttaaggg ggaagcccgc cgtgattaca tccgcgattg 22020 tgtctatctc tacctgtgcc acacgtggca aaccggcatg ggtgtatggc agcaatgttt 22080 agaagaacag aacttgaaag agcttgacaa gctcttacag aaatctctta aggttctgtg 22140 gacagggttc gacgagcgca ccgtcgcttc cgacctggca gacctcatct tcccagagcg 22200 tctcagggtt actttgcgaa acggattgcc tgactttatg agccagagca tgcttaacaa 22260 ttttcgctct ttcatcctgg aacgctccgg tatcctgccc gccacctgct gcgcactgcc 22320 ctccgacttt gtgcctctca cctaccgcga gtgccccccg ccgctatgga gtcactgcta 22380 cctgttccgt ctggccaact atctctccta ccactcggat gtgatcgagg atgtgagcgg 22440 agacggcttg ctggagtgcc actgccgctg caatctgtgc acgccccacc ggtccctagc 22500 ttgcaacccc cagttgatga gcgaaaccca gataataggc acctttgaat tgcaaggccc 22560 cagcagccaa ggcgatgggt cttctcctgg gcaaagttta aaactgaccc cgggactgtg 22620 gacctccgcc tacttgcgca agtttgctcc ggaagattac cacccctatg aaatcaagtt 22680 ctatgaggac caatcacagc ctccaaaggc cgaactttcg gcttgcgtca tcacccaggg 22740 ggcaattctg gcccaattgc aagccatcca aaaatcccgc caagaatttc tactgaaaaa 22800 gggtaagggg gtctaccttg acccccagac cggcgaggaa ctcaacacaa ggttccctca 22860 ggatgtccca acgacgagaa aacaagaagt tgaaggtgca gccgccgccc ccagaagata 22920 tggaggaaga ttgggacagt caggcagagg aggcggagga ggacagtctg gaggacagtc 22980 tggaggaaga cagtttggag gaggaaaacg aggaggcaga ggaggtggaa gaagtaaccg 23040 ccgacaaaca gttatcctcg gctgcggaga caagcaacag cgctaccatc tccgctccga 23100 gtcgaggaac ccggcggcgt cccagcagta gatgggacga gaccggacgc ttcccgaacc 23160 caaccagcgc ttccaagacc ggtaagaagg atcggcaggg atacaagtcc tggcgggggc 23220 ataagaatgc catcatctcc tgcttgcatg agtgcggggg caacatatcc ttcacgcggc 23280 gctacttgct attccaccat ggggtgaact ttccgcgcaa tgttttgcat tactaccgtc 23340 acctccacag cccctactat agccagcaaa tcccgacagt ctcgacagat aaagacagcg 23400 gcggcgacct ccaacagaaa accagcagcg gcagttagaa aatacacaac aagtgcagca 23460 acaggaggat taaagattac agccaacgag ccagcgcaaa cccgagagtt aagaaatcgg 23520 atctttccaa ccctgtatgc catcttccag cagagtcggg gtcaagagca ggaactgaaa 23580 ataaaaaacc gatctctgcg ttcgctcacc agaagttgtt tgtatcacaa gagcgaagat 23640 caacttcagc gcactctcga ggacgccgag gctctcttca acaagtactg cgcgctgact 23700 cttaaagagt aggcagcgac cgcgcttatt caaaaaaggc gggaattaca tcatcctcga 23760 catgagtaaa gaaattccca cgccttacat gtggagttat caaccccaaa tgggattggc 23820 agcaggcgcc tcccaggact actccacccg catgaattgg ctcagcgccg ggccttctat 23880 gatttctcga gttaatgata tacgcgccta ccgaaaccaa atacttttgg aacagtcagc 23940 tcttaccacc acgccccgcc aacaccttaa tcccagaaat tggcccgccg ccctagtgta 24000 ccaggaaagt cccgctccca ccactgtatt acttcctcga gacgcccagg ccgaagtcca 24060 aatgactaat gcaggtgcgc agttagctgg cggctccacc ctatgtcgtc acaggcctcg 24120 gcataatata aaacgcctga tgatcagagg ccgaggtatc cagctcaacg acgagtcggt 24180 gagctctccg cttggtctac gaccagacgg aatctttcag attgccggct gcgggagatc 24240 ttccttcacc cctcgtcagg ctgttctgac tttggaaagt tcgtcttcgc aaccccgctc 24300 gggcggaatc gggaccgttc aatttgtaga ggagtttact ccctctgtct acttcaaccc 24360 cttctccgga tctcctgggc actacccgga cgagttcata ccgaacttcg acgcgattag 24420 cgagtcagtg gacggctacg attgatgtct ggtgacgcgg ctgagctatc tcggctgcga 24480 catctagacc actgccgccg ctttcgctgc tttgcccggg aacttattga gttcatctac 24540 ttcgaactcc ccaaggatca ccctcaaggt ccggcccacg gagtgcggat tactatcgaa 24600 ggcaaaatag actctcgcct gcaacgaatt ttctcccagc ggcccgtgct gatcgagcga 24660 gaccagggaa acaccacggt tagtaatcaa ttacggggtc attagttcat agcccatata 24720 tggagttaac ttgtttattg cagcttataa tggttacaaa taaagcaata gcatcacaaa 24780 tttcacaaat aaagcatttt tttcactgca ttctagttgt ggtttgtcca aactcatcaa 24840 tgtatcttat catgtctgct cgaagcggcc ggccgccccg actctagagt cgcggcctca 24900 ttaggaagtt cctatacttt ctagagaata ggaacttctc agaagaactc gtcaagaagg 24960 cgatagaagg cgatgcgctg cgaatcggga gcggcgatac cgtaaagcac gaggaagcgg 25020 tcagcccatt cgccgccaag ctcttcagca atatcacggg tagccaacgc tatgtcctga 25080 tagcggtccg ccacacccag ccggccacag tcgatgaatc cagaaaagcg gccattttcc 25140 accatgatat tcggcaagca ggcatcgcca tgggtcacga cgagatcctc gccgtcgggc 25200 atgcgcgcct tgagcctggc gaacagttcg gctggcgcga gcccctgatg ctcttcgtcc 25260 agatcatcct gatcgacaag accggcttcc atccgagtac gtgctcgctc gatgcgatgt 25320 ttcgcttggt ggtcgaatgg gcaggtagcc ggatcaagcg tatgcagccg ccgcattgca 25380 tcagccatga tggatacttt ctcggcagga gcaaggtgag atgacaggag atcctgcccc 25440 ggcacttcgc ccaatagcag ccagtccctt cccgcttcag tgacaacgtc gagcacagct 25500 gcgcaaggaa cgcccgtcgt ggccagccac gatagccgcg ctgcctcgtc ctgcagttca 25560 ttcagggcac cggacaggtc ggtcttgaca aaaagaaccg ggcgcccctg cgctgacagc 25620 cggaacacgg cggcatcaga gcagccgatt gcctgttgtg cccagtcata gccgaatagc 25680 ctctccaccc aagcggccgg agaacctgcg tgcaatccat cttgttcaat ggccgatccc 25740 ataacacccc ttgtattact gtttatgtaa gcagacagtt ttactgttcg tgatgatata 25800 tttttatctt gtgcaatgta acaggttgtg gccatagcgg gcccgggatt ttcctccacg 25860 tccccgcatg ttagaagact tcccctgccc tcggctctgg aagttcctat actttctaga 25920 gaataggaac ttcccgccag aatgcgttcg cacagccgcc agccggtcac tccgttgatg 25980 gttactcgga acagcaggga gccgtcgggg ttgatcaggc gctcgtcgat aattttgttg 26040 ccgttccaca gggtccctgt tacagtgatc tttttgccgt cgaacacggc gatgccttca 26100 tacggccgtc cgaaatagtc gatcatgttc ggcgtaaccc cgtcgattac cagtgtgcca 26160 tagtgcagga tcaccttaaa gtgatgatca tccacagggt acaccacctt aaaaattttt 26220 tcgatctggc ccatttggtc gccgctcaga ccttcatacg ggatgatgac atggatgtcg 26280 atcttcagcc cattttcacc gctcaggaca atcctttgga tcggagttac ggacaccccg 26340 agattctgaa acaaactgga cacacctccc tgttcaagga cttggtccag gttgtagccg 26400 gctgtctgtc gccagtcccc aacgaaatct tcgagtgtga agaccatgga tccgggcccg 26460 gggttttctt caacgtctcc agcctgcttc agcaggctga agttagtagc tccgcttcct 26520 cgagctcgag atctggcgaa ggcgatgggg gtcttgaagg cgtgctggta ctccacgatg 26580 cccagctcgg tgttgctgtg cagctcctcc acgcggcgga aggcgaacat ggggcccccg 26640 ttctgcagga tgctggggtg gatggcgctc ttgaagtgca tgtggctgtc caccacgaag 26700 ctgtagtagc cgccgtcgcg caggctgaag gtgcgggcga agctgcccac cagcacgtta 26760 tcgcccatgg ggtgcaggtg ctccacggtg gcgttgctgc ggatgatctt gtcggtgaag 26820 atcacgctgt cctcggggaa gccggtgccc accaccttga agtcgccgat cacgcggccg 26880 gcctcgtagc ggtagctgaa gctcacgtgc agcacgccgc cgtcctcgta cttctcgatg 26940 cgggtgttgg tgtagccgcc gttgttgatg gcgtgcagga aggggttctc gtagccgctg 27000 gggtaggtgc cgaagtggta gaagccgtag cccatcacgt ggctcagcag gtaggggctg 27060 aaggtcaggg cgcctttggt gctcttcatc ttgttggtca tgcggccctg ctcgggggtg 27120 ccctctccgc cgcccaccag ctcgaactcc acgccgttca gggtgccggt gatgcggcac 27180 tcgatcttca tggcgggcat ggtggcgacc ggtagcgcta gcggcttcgg taccacgcgt 27240 tcgctcgaat taatcaattc tttgccaaaa tgatgagaca gcacaataac cagcacgttg 27300 cccaggagct gtaggaaaaa gaagaaggca tgaacatggt tagcagaggc tctagagccg 27360 ccggtcacac gccagaagcc gaaccccgcc ctgccccgtc ccccccgaag gcagccgtcc 27420 ccccgcggac agccccgagg ctggagaggg agaaggggac ggcggcgcgg cgacgcacga 27480 aggccctccc cgcccatttc cttcctgccg gggccctccc ggagcccctc aaggctttca 27540 cgcagccaca gaaaagaaac aagccgtcat taaaccaagc gctaattaca gcccggagga 27600 gaagggccgt cccgcccgct cacctgtggg agtaacgcgg tcagtcagag ccggggcggg 27660 cggcgcgagg cggcgcggag cggggcacgg ggcgaaggca acgcagcgac tcccgcccgc 27720 cgcgcgcttc gctttttata gggccgccgc cgccgccgcc tcgccataaa aggaaacttt 27780 cggagcgcgc cgctctgatt ggctgccgcc gcacctctcc gcctcgcccc gccccgcccc 27840 tcgccccgcc ccgccccgcc tggcgcgcgc cccccccccc cccccgcccc catcgctgca 27900 caaaataatt aaaaaataaa taaatacaaa attgggggtg gggagggggg ggagatgggg 27960 agagtgaagc agaacgtggg gctcacctcg accatggtaa tagcgatgac taatacgtag 28020 atgtactgcc aagtaggaaa gtcccataag gtcatgtact gggcataatg ccaggcgggc 28080 catttaccgt cattgacgtc aatagggggc gtacttggca tatgatacac ttgatgtact 28140 gccaagtggg cagtttaccg taaatactcc acccattgac gtcaatggaa agtccctatt 28200 ggcgttacta tgggaacata cgtcattatt gacgtcaatg ggcgggggtc gttgggcggt 28260 cagccaggcg ggccatttac cgtaagttat gtaacgcgga acaacaacaa ttgcattcat 28320 tttatgtttc aggttcaggg ggaggtgtgg tcctgcgatt ccatcgagtg cacctacacc 28380 ctgctgaaga ccctatgcgg cctaagagac ctgctaccaa tgaattaaaa aaaaatgatt 28440 aataaaaaat cacttacttg aaatcagcaa taaggtctct gttgaaattt tctcccagca 28500 gcacctcact tccctcttcc caactctggt attctaaacc ccgttcagcg gcatactttc 28560 tccatacttt aaaggggatg tcaaatttta gctcctctcc tgtacccaca atcttcatgt 28620 ctttcttccc agatgaccaa gagagtccgg ctcagtgact ccttcaaccc tgtctacccc 28680 tatgaagatg aaagcacctc ccaacacccc tttataaacc cagggtttat ttccccaaat 28740 ggcttcacac aaagcccaga cggagttctt actttaaaat gtttaacccc actaacaacc 28800 acaggcggat ctctacagct aaaagtggga gggggactta cagtggatga cactgatggt 28860 accttacaag aaaacatacg tgctacagca cccattacta aaaataatca ctctgtagaa 28920 ctatccattg gaaatggatt agaaactcaa aacaataaac tatgtgccaa attgggaaat 28980 gggttaaaat ttaacaacgg tgacatttgt ataaaggata gtattaacac cttatggact 29040 ggaataaacc ctccacctaa ctgtcaaatt gtggaaaaca ctaatacaaa tgatggcaaa 29100 cttactttag tattagtaaa aaatggaggg cttgttaatg gctacgtgtc tctagttggt 29160 gtatcagaca ctgtgaacca aatgttcaca caaaagacag caaacatcca attaagatta 29220 tattttgact cttctggaaa tctattaact gaggaatcag acttaaaaat tccacttaaa 29280 aataaatctt ctacagcgac cagtgaaact gtagccagca gcaaagcctt tatgccaagt 29340 actacagctt atcccttcaa caccactact agggatagtg aaaactacat tcatggaata 29400 tgttactaca tgactagtta tgatagaagt ctatttccct tgaacatttc tataatgcta 29460 aacagccgta tgatttcttc caatgttgcc tatgccatac aatttgaatg gaatctaaat 29520 gcaagtgaat ctccagaaag caacatagct acgctgacca catccccctt tttcttttct 29580 tacattacag aagacgacaa ctaaaataaa gtttaagtgt ttttatttaa aatcacaaaa 29640 ttcgagtagt tattttgcct ccaccttccc atttgacaga atacacagtc ctttctcccc 29700 ggctggcctt aaaaagcatc atatcatggg taacagacat attcttaggt gttatattcc 29760 acacggtttc ctgtcgagcc aaacgctcat cagtgatatt aataaactcc ccgggcagct 29820 cacttaagtt catgtcgctg tccagctgct gagccacagg ctgctgtcca acttgcggtt 29880 gcttaacggg cggcgaagga gaagtccacg cctacatggg ggtagagtca taatcgtgca 29940 tcaggatagg gcggtggtgc tgcagcagcg cgcgaataaa ctgctgccgc cgccgctccg 30000 tcctgcagga atacaacatg gcagtggtct cctcagcgat gattcgcacc gcccgcagca 30060 taaggcgcct tgtcctccgg gcacagcagc gcaccctgat ctcacttaaa tcagcacagt 30120 aactgcagca cagcaccaca atattgttca aaatcccaca gtgcaaggcg ctgtatccaa 30180 agctcatggc ggggaccaca gaacccacgt ggccatcata ccacaagcgc aggtagatta 30240 agtggcgacc cctcataaac acgctggaca taaacattac ctcttttggc atgttgtaat 30300 tcaccacctc ccggtaccat ataaacctct gattaaacat ggcgccatcc accaccatcc 30360 taaaccagct ggccaaaacc tgcccgccgg ctatacactg cagggaaccg ggactggaac 30420 aatgacagtg gagagcccag gactcgtaac catggatcat catgctcgtc atgatatcaa 30480 tgttggcaca acacaggcac acgtgcatac acttcctcag gattacaagc tcctcccgcg 30540 ttagaaccat atcccaggga acaacccatt cctgaatcag cgtaaatccc acactgcagg 30600 gaagacctcg cacgtaactc acgttgtgca ttgtcaaagt gttacattcg ggcagcagcg 30660 gatgatcctc cagtatggta gcgcgggttt ctgtctcaaa aggaggtaga cgatccctac 30720 tgtacggagt gcgccgagac aaccgagatc gtgttggtcg tagtgtcatg ccaaatggaa 30780 cgccggacgt agtcattctc gtattttgta tagcaaaacg cggccctggc agaacacact 30840 cttcttcgcc ttctatcctg ccgcttagcg tgttccgtgt gatagttcaa gtacagccac 30900 actcttaagt tggtcaaaag aatgctggct tcagttgtaa tcaaaactcc atcgcatcta 30960 attgttctga ggaaatcatc cacggtagca tatgcaaatc ccaaccaagc aatgcaactg 31020 gattgcgttt caagcaggag aggagaggga agagacggaa gaaccatgtt aatttttatt 31080 ccaaacgatc tcgcagtact tcaaattgta gatcgcgcag atggcatctc tcgcccccac 31140 tgtgttggtg aaaaagcaca gctaaatcaa aagaaatgcg attttcaagg tgctcaacgg 31200 tggcttccaa caaagcctcc acgcgcacat ccaagaacaa aagaatacca aaagaaggag 31260 cattttctaa ctcctcaatc atcatattac attcctgcac cattcccaga taattttcag 31320 ctttccagcc ttgaattatt cgtgtcagtt cttgtggtaa atccaatcca cacattacaa 31380 acaggtcccg gagggcgccc tccaccacca ttcttaaaca caccctcata atgacaaaat 31440 atcttgctcc tgtgtcacct gtagcgaatt gagaatggca acatcaattg acatgccctt 31500 ggctctaagt tcttctttaa gttctagttg taaaaactct ctcatattat caccaaactg 31560 cttagccaga agccccccgg gaacaagagc aggggacgct acagtgcagt acaagcgcag 31620 acctccccaa ttggctccag caaaaacaag attggaataa gcatattggg aaccaccagt 31680 aatatcatcg aagttgctgg aaatataatc aggcagagtt tcttgtagaa attgaataaa 31740 agaaaaattt gccaaaaaaa cattcaaaac ctctgggatg caaatgcaat aggttaccgc 31800 gctgcgctcc aacattgtta gttttgaatt agtctgcaaa aataaaaaaa aaacaagcgt 31860 catatcatag tagcctgacg aacaggtgga taaatcagtc tttccatcac aagacaagcc 31920 acagggtctc cagctcgacc ctcgtaaaac ctgtcatcgt gattaaacaa cagcaccgaa 31980 agttcctcgc ggtgaccagc atgaataagt cttgatgaag catacaatcc agacatgtta 32040 gcatcagtta aggagaaaaa acagccaaca tagcctttgg gtataattat gcttaatcgt 32100 aagtatagca aagccacccc tcgcggatac aaagtaaaag gcacaggaga ataaaaaata 32160 taattatttc tctgctgctg tttaggcaac gtcgcccccg gtccctctaa atacacatac 32220 aaagcctcat cagccatggc ttaccagaga aagtacagcg ggcacacaaa ccacaagctc 32280 taaagtcact ctccaacctc tccacaatat atatacacaa gccctaaact gacgtaatgg 32340 gactaaagtg taaaaaatcc cgccaaaccc aacacacacc ccgaaactgc gtcaccaggg 32400 aaaagtacag tttcacttcc gcaatcccaa caagcgtcac ttcctctttc tcacggtacg 32460 tcacatccca ttaacttaca acgtcatttt cccacggccg cgccgcccct tttaaccgtt 32520 aaccccacag ccaatcacca cacggcccac actttttaaa atcacctcat ttacatattg 32580 gcaccattcc atctataagg tatattattg atgatggcca agctatttag gtgacactat 32640 agaatactca agctatgcat caagcttggt accgagctcg gatccactag taacggccgc 32700 cagtgtgctg gaattcgccc ttgt 32724 <210> 58 <211> 32724 <212> DNA <213> Artificial Sequence <220> <223> PS3 <400> 58 catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60 aaaagtgtgg gccgtgtggt gattggctgt ggggttaacg gttaaaaggg gcggcgcggc 120 cgtgggaaaa tgacgtttta tgggggtgga gtttataact tcgtatagca tacattatac 180 gaagttattt ttgcaagttg tcgcgggaaa tgttacgcat aaaaaggctt cttttctcac 240 ggaactactt agttttccca cggtatttaa caggaaatga ggtagttttg accggatgca 300 agtgaaaatt gctgattttc gcgcgaaaac tgaatgagga agtgtttttc tgaataatgt 360 ggtatttatg gcagggtgga gtatttgttc agggccaggt agactttgac ccattacgtg 420 gaggtttcga ttaccgtgtt ttttacctga atttccgcgt accgtgtcaa agtcttctgt 480 ttttacgtag gtgtcagctg atcgctaggg tatttataac ttcgtatagc atacattata 540 cgaagttatg gaatgtttat gccttaccag tgtaacatga atcatgtgaa agtgttgttg 600 gaaccagatg ccttttccag aatgagccta acaggaatct ttgacatgaa cacgcaaatc 660 tggaagatcc tgaggtatga tgatacgaga tcgagggtgc gcgcatgcga atgcggaggc 720 aagcatgcca ggttccagcc ggtgtgtgta gatgtgaccg aagatctcag accggatcat 780 ttggttattg cccgcactgg agcagagttc ggatccagtg gagaagaaac tgactaaggt 840 gagtattggg aaaactttgg ggtgggattt tcagatggac agattgagta aaaatttgtt 900 ttttctgtct tgcagctgac atgagtggaa atgcttcttt taagggggga gtcttcagcc 960 cttatctgac agggcgtctc ccatcctggg caggagttcg tcagaatgtt atgggatcta 1020 ctgtggatgg aagacccgtt caacccgcca attcttcaac gctgacctat gctactttaa 1080 gttcttcacc tttggacgca gctgcagccg ctgccgccgc ctctgtcgcc gctaacactg 1140 tgcttggaat gggttactat ggaagcatcg tggctaattc cacttcctct aataaccctt 1200 ctacactgac tcaggacaag ttacttgtcc ttttggccca gctggaggct ttgacccaac 1260 gtctgggtga actttctcag caggtggccg agttgcgagt acaaactgag tctgctgtcg 1320 gcacggcaaa gtctaaataa aaaaaattcc agaatcaatg aataaataaa cgagcttgtt 1380 gttgatttaa aatcaagtgt ttttatttca tttttcgcgc acggtatgcc ctggaccacc 1440 gatctcgatc attgagaact cggtggattt tttccagaat cctatagagg tgggattgaa 1500 tgtttagata catgggcatt aggccgtctt tggggtggag atagctccat tgaagggatt 1560 catgctccgg ggtagtgttg taaatcaccc agtcataaca aggtcgcagt gcatggtgtt 1620 gcacaatatc ttttagaagt aggctgattg ccacagataa gcccttggtg taggtgttta 1680 caaaccggtt gagctgggag gggtgcattc gaggtgaaat tatgtgcatt ttggattgga 1740 tttttaagtt ggcaatattg ccgccaagat cccgtcttgg gttcatgtta tgaaggacta 1800 ccaagacggt gtatccggta catttaggaa atttatcgtg cagcttggat ggaaaagcgt 1860 ggaaaaattt ggagacaccc ttgtgtcctc cgagattttc catgcactca tccatgataa 1920 tagcaatggg gccgtgggca gcggcgcggg caaacacgtt ccgtgggtct gacacatcat 1980 agttatgttc ctgagttaaa tcatcataag ccattttaat gaatttgggg cggagcgtac 2040 cagattgggg tatgaatgtt ccttcgggcc ccggagcata gttcccctca cagatttgca 2100 tttcccaagc tttcagttct gagggtggaa tcatgtccac ctggggggct atgaagaaca 2160 ccgtttcggg ggcgggggtg attagttggg atgatagcaa gtttctgagc aattgagatt 2220 tgccacatcc ggtggggcca taaataattc cgattacagg ttgcaggtgg tagtttaggg 2280 aacggcaact gccgtcttct cgaagcaagg gggccacctc gttcatcatt tcccttacat 2340 gcatattttc ccgcaccaaa tccattagga ggcgctctcc tcctagtgat agaagttctt 2400 gtagtgagga aaagtttttc agcggtttta gaccgtcagc catgggcatt ttggaaagag 2460 tttgctgcaa aagttctagt ctgttccaca gttcagtgat gtgttctatg gcatctcgat 2520 ccagcagacc tcctcgtttc gcgggtttgg acggctcctg gagtagggta tgagacgatg 2580 ggcgtccagc gctgccaggg ttcggtcctt ccagggtctc agtgttcgag tcagggttgt 2640 ttccgtcaca gtgaaggggt gtgcgcctgc ttgggcgctt gccagggtgc gcttcagact 2700 cattctgctg gtggagaact tctgtcgctt ggcgccctgt atgtcggcca agtagcagtt 2760 taccatgagt tcgtagttga gcgcctcggc tgcgtggcct ttggcgcgga gcttaccttt 2820 ggaagttttc ttgcataccg ggcagtatag gcatttcagc gcatacagct tgggcgcaag 2880 gaaaatggat tctggggagt atgcatccgc gccgcaggag gcgcaaacag tttcacattc 2940 caccagccag gttaaatccg gttcattggg gtcaaaaaca agttttccgc catatttttt 3000 gatgcgtttc ttacctttgg tctccataag ttcgtgtcct cgttgagtga caaacaggct 3060 gtccgtatct ccgtagactg attttacagg cctcttctcc agtggagtgc ctcggtcttc 3120 ttcgtacagg aactctgacc actctgatac aaaggcgcgc gtccaggcca gcacaaagga 3180 ggctatgtgg gaggggtagc gatcgttgtc aaccaggggg tccacctttt ccaaagtatg 3240 caaacacatg tcaccctctt caacatccag gaatgtgatt ggcttgtagg tgtatttcac 3300 gtgacctggg gtccccgctg ggggggtata aaagggggcg gttctttgct cttcctcact 3360 gtcttccgga tcgctgtcca ggaacgtcag ctgttggggt aggtattccc tctcgaaggc 3420 gggcatgacc tctgcactca ggttgtcagt ttctaagaac gaggaggatt tgatattgac 3480 agtgccggtt gagatgcctt tcatgaggtt ttcgtccatt tggtcagaaa acacaatttt 3540 tttattgtca agtttggtgg caaatgatcc atacagggcg ttggataaaa gtttggcaat 3600 ggatcgcatg gtttggttct tttccttgtc cgcgcgctct ttggcggcga tgttgagttg 3660 gacatactcg cgtgccaggc acttccattc ggggaagata gttgttaatt catctggcac 3720 gattctcact tgccaccctc gattatgcaa ggtaattaaa tccacactgg tggccacctc 3780 gcctcgaagg ggttcattgg tccaacagag cctacctcct ttcctagaac agaaaggggg 3840 aagtgggtct agcataagtt catcgggagg gtctgcatcc atggtaaaga ttcccggaag 3900 taaatcctta tcaaaatagc tgatgggagt ggggtcatct aaggccattt gccattctcg 3960 agctgccagt gcgcgctcat atgggttaag gggactgccc cagggcatgg gatgggtgag 4020 agcagaggca tacatgccac agatgtcata gacgtagatg ggatcctcaa agatgcctat 4080 gtaggttgga tagcatcgcc cccctctgat acttgctcgc acatagtcat atagttcatg 4140 tgatggcgct agcagccccg gacccaagtt ggtgcgattg ggtttttctg ttctgtagac 4200 gatctggcga aagatggcgt gagaattgga agagatggtg ggtctttgaa aaatgttgaa 4260 atgggcatga ggtagaccta cagagtctct gacaaagtgg gcataagatt cttgaagctt 4320 ggttaccagt tcggcggtga caagtacgtc tagggcgcag tagtcaagtg tttcttgaat 4380 gatgtcataa cctggttggt ttttcttttc ccacagttcg cggttgagaa ggtattcttc 4440 gcgatccttc cagtactctt ctagcggaaa cccgtctttg tctgcacggt aagatcctag 4500 catgtagaac tgattaactg ccttgtaagg gcagcagccc ttctctacgg gtagagagta 4560 tgcttgagca gcttttcgta gcgaagcgtg agtaagggca aaggtgtctc tgaccatgac 4620 tttgagaaat tggtatttga agtccatgtc gtcacaggct ccctgttccc agagttggaa 4680 gtctacccgt ttcttgtagg cggggttggg caaagcgaaa gtaacatcat tgaagagaat 4740 cttaccggct ctgggcataa aattgcgagt gatgcggaaa ggctgtggta cttccgctcg 4800 attgttgatc acctgggcag ctaggacgat ttcgtcgaaa ccgttgatgt tgtgtcctac 4860 gatgtataat tctatgaaac gcggcgtgcc tctgacgtga ggtagcttac tgagctcatc 4920 aaaggttagg tctgtggggt cagataaggc gtagtgttcg agagcccatt cgtgcaggtg 4980 aggatttgca tgtaggaatg atgaccaaag atctaccgcc agtgctgttt gtaactggtc 5040 ccgatactga cgaaaatgcc ggccaattgc cattttttct ggagtgacac agtagaaggt 5100 tctggggtct tgttgccatc gatcccactt gagtttaatg gctagatcgt gggccatgtt 5160 gacgagacgc tcttctcctg agagtttcat gaccagcatg aaaggaacta gttgtttgcc 5220 aaaggatccc atccaggtgt aagtttccac atcgtaggtc aggaagagtc tttctgtgcg 5280 aggatgagag ccgatcggga agaactggat ttcctgccac cagttggagg attggctgtt 5340 gatgtgatgg aagtagaagt ttctgcggcg cgccgagcat tcgtgtttgt gcttgtacag 5400 acggccgcag tagtcgcagc gttgcacggg ttgtatctcg tgaatgagct gtacctggct 5460 tcccttgacg agaaatttca gtgggaagcc gaggcctggc gattgtatct cgtgctcttc 5520 tatattcgct gtatcggcct gttcatcttc tgtttcgatg gtggtcatgc tgacgagccc 5580 ccgcgggagg caagtccaga cctcggcgcg ggaggggcgg agctgaagga cgagagcgcg 5640 caggctggag ctgtccagag tcctgagacg ctgcggactc aggttagtag gtagggacag 5700 aagattaact tgcatgatct tttccagggc gtgcgggagg ttcagatggt acttgatttc 5760 cacaggttcg tttgtagaga cgtcaatggc ttgcagggtt ccgtgtcctt tgggcgccac 5820 taccgtacct ttgttttttc ttttgatcgg tggtggctct cttgcttctt gcatgctcag 5880 aagcggtgac ggggacgcgc gccgggcggc agcggttgtt ccggacccgg gggcatggct 5940 ggtagtggca cgtcggcgcc gcgcacgggc aggttctggt attgcgctct gagaagactt 6000 gcgtgcgcca ccacgcgtcg attgacgtct tgtatctgac gtctctgggt gaaagctacc 6060 ggccccgtga gcttgaacct gaaagagagt tcaacagaat caatttcggt atcgttaacg 6120 gcagcttgtc tcagtatttc ttgtacgtca ccagagttgt cctggtaggc gatctccgcc 6180 atgaactgct cgatttcttc ctcctgaaga tctccgcgac ccgctctttc gacggtggcc 6240 gcgaggtcat tggagatacg gcccatgagt tgggagaatg cattcatgcc cgcctcgttc 6300 cagacgcggc tgtaaaccac ggccccctcg gagtctcttg cgcgcatcac cacctgagcg 6360 aggttaagct ccacgtgtct ggtgaagacc gcatagttgc ataggcgctg aaaaaggtag 6420 ttgagtgtgg tggcaatgtg ttcggcgacg aagaaataca tgatccatcg tctcagcggc 6480 atttcgctaa catcgcccag agcttccaag cgctccatgg cctcgtagaa gtccacggca 6540 aaattaaaaa actgggagtt tcgcgcggac acggtcaatt cctcctcgag aagacggatg 6600 agttcggcta tggtggcccg tacttcgcgt tcgaaggctc ccgggatctc ttcttcctct 6660 tctatctctt cttccactaa catctcttct tcgtcttcag gcgggggcgg agggggcacg 6720 cggcgacgtc gacggcgcac gggcaaacgg tcgatgaatc gttcaatgac ctctccgcgg 6780 cggcggcgca tggtttcagt gacggcgcgg ccgttctcgc gcggtcgcag agtaaaaaca 6840 ccgccgcgca tctccttaaa gtggtgactg ggaggttctc cgtttgggag ggagagggcg 6900 ctgattatac attttattaa ttggcccgta gggactgcgc gcagagatct gatcgtgtca 6960 agatccacgg gatctgaaaa cctttcgacg aaagcgtcta accagtcaca gtcacaaggt 7020 aggctgagta cggcttcttg tgggcggggg tggttatgtg ttcggtctgg gtcttctgtt 7080 tcttcttcat ctcgggaagg tgagacgatg ctgctggtga tgaaattaaa gtaggcagtt 7140 ctaagacggc ggatggtggc gaggagcacc aggtctttgg gtccggcttg ctggatacgc 7200 aggcgattgg ccattcccca agcattatcc tgacatctag caagatcttt gtagtagtct 7260 tgcatgagcc gttctacggg cacttcttcc tcacccgttc tgccatgcat acgtgtgagt 7320 ccaaatccgc gcattggttg taccagtgcc aagtcagcta cgactctttc ggcgaggatg 7380 gcttgctgta cttgggtaag ggtggcttga aagtcatcaa aatccacaaa gcggtggtaa 7440 gcccctgtat taatggtgta agcacagttg gccatgactg accagttaac tgtctggtga 7500 ccagggcgca cgagctcggt gtatttaagg cgcgaatagg cgcgggtgtc aaagatgtaa 7560 tcgttgcagg tgcgcaccag atactggtac cctataagaa aatgcggcgg tggttggcgg 7620 tagagaggcc atcgttctgt agctggagcg ccaggggcga ggtcttccaa cataaggcgg 7680 tgatagccgt agatgtacct ggacatccag gtgattcctg cggcggtagt agaagcccga 7740 ggaaactcgc gtacgcggtt ccaaatgttg cgtagcggca tgaagtagtt cattgtaggc 7800 acggtttgac cagtgaggcg cgcgcagtca ttgatgctct atagacacgg agaaaatgaa 7860 agcgttcagc gactcgactc cgtagcctgg aggaacgtga acgggttggg tcgcggtgta 7920 ccccggttcg agacttgtac tcgagccggc cggagccgcg gctaacgtgg tattggcact 7980 cccgtctcga cccagcctac aaaaatccag gatacggaat cgagtcgttt tgctggtttc 8040 cgaatggcag ggaagtgagt cctatttttt ttttttttgc cgctcagatg catcccgtgc 8100 tgcgacagat gcgcccccaa caacagcccc cctcgcagca gcagcagcag caaccacaaa 8160 aggctgtccc tgcaactact gcaactgccg ccgtgagcgg tgcgggacag cccgcctatg 8220 atctggactt ggaagagggc gaaggactgg cacgtctagg tgcgccttcg cccgagcggc 8280 atccgcgagt tcaactgaaa aaagattctc gcgaggcgta tgtgccccaa cagaacctat 8340 ttagagacag aagcggcgag gagccggagg agatgcgagc ttcccgcttt aacgcgggtc 8400 gtgagctgcg tcacggtttg gaccgaagac gagtgttgcg agacgaggat ttcgaagttg 8460 atgaagtgac agggatcagt cctgccaggg cacacgtggc tgcagccaac cttgtatcgg 8520 cttacgagca gacagtaaag gaagagcgta acttccaaaa gtcttttaat aatcatgtgc 8580 gaaccctgat tgcccgcgaa gaagttaccc ttggtttgat gcatttgtgg gatttgatgg 8640 aagctatcat tcagaaccct actagcaaac ctctgaccgc ccagctgttt ctggtggtgc 8700 aacacagcag agacaatgag gctttcagag aggcgctgct gaacatcacc gaacccgagg 8760 ggagatggtt gtatgatctt atcaacattc tacagagtat catagtgcag gagcggagcc 8820 tgggcctggc cgagaaggta gctgccatca attactcggt tttgagcttg ggaaaatatt 8880 acgctcgcaa aatctacaag actccatacg ttcccataga caaggaggtg aagatagatg 8940 ggttctacat gcgcatgacg ctcaaggtct tgaccctgag cgatgatctt ggggtgtatc 9000 gcaatgacag aatgcatcgc gcggttagcg ccagcaggag gcgcgagtta agcgacaggg 9060 aactgatgca cagtttgcaa agagctctga ctggagctgg aaccgagggt gagaattact 9120 tcgacatggg agctgacttg cagtggcagc ctagtcgcag ggctctgagc gccgcgacgg 9180 caggatgtga gcttccttac atagaagagg cggatgaagg cgaggaggaa gagggcgagt 9240 acttggaaga ctgatggcac aacccgtgtt ttttgctaga tggaacagca agcaccggat 9300 cccgcaatgc gggcggcgct gcagagccag ccgtccggca ttaactcctc ggacgattgg 9360 acccaggcca tgcaacgtat catggcgttg acgactcgca accccgaagc ctttagacag 9420 caaccccagg ccaaccgtct atcggccatc atggaagctg tagtgccttc ccgatctaat 9480 cccactcatg agaaggtcct ggccatcgtg aacgcgttgg tggagaacaa agctattcgt 9540 ccagatgagg ccggactggt atacaacgct ctcttagaac gcgtggctcg ctacaacagt 9600 agcaatgtgc aaaccaattt ggaccgtatg ataacagatg tacgcgaagc cgtgtctcag 9660 cgcgaaaggt tccagcgtga tgccaacctg ggttcgctgg tggcgttaaa tgctttcttg 9720 agtactcagc ctgctaatgt gccgcgtggt caacaggatt atactaactt tttaagtgct 9780 ttgagactga tggtatcaga agtacctcag agcgaagtgt atcagtccgg tcctgattac 9840 ttctttcaga ctagcagaca gggcttgcag acggtaaatc tgagccaagc ttttaaaaac 9900 cttaaaggtt tgtggggagt gcatgccccg gtaggagaaa gagcaaccgt gtctagcttg 9960 ttaactccga actcccgcct gttattactg ttggtagctc ctttcaccga cagcggtagc 10020 atcgaccgta attcctattt gggttaccta ctaaacctgt atcgcgaagc catagggcaa 10080 agtcaggtgg acgagcagac ctatcaagaa attacccaag tcagtcgcgc tttgggacag 10140 gaagacactg gcagtttgga agccactctg aacttcttgc ttaccaatcg gtctcaaaag 10200 atccctcctc aatatgctct tactgcggag gaggagagga tccttagata tgtgcagcag 10260 agcgtgggat tgtttctgat gcaagagggg gcaactccga ctgcagcact ggacatgaca 10320 gcgcgaaata tggagcccag catgtatgcc agtaaccgac ctttcattaa caaactgctg 10380 gactacttgc acagagctgc cgctatgaac tctgattatt tcaccaatgc catcttaaac 10440 ccgcactggc tgcccccacc tggtttctac acgggcgaat atgacatgcc cgaccctaat 10500 gacggatttc tgtgggacga cgtggacagc gatgtttttt cacctctttc tgatcatcgc 10560 acgtggaaaa aggaaggcgg tgatagaatg cattcttctg catcgctgtc cggggtcatg 10620 ggtgctaccg cggctgagcc cgagtctgca agtccttttc ctagtctacc cttttctcta 10680 cacagtgtac gtagcagcga agtgggtaga ataagtcgcc cgagtttaat gggcgaagag 10740 gagtacctaa acgattcctt gctcagaccg gcaagagaaa aaaatttccc aaacaatgga 10800 atagaaagtt tggtggataa aatgagtaga tggaagactt atgctcagga tcacagagac 10860 gagcctggga tcatggggac tacaagtaga gcgagccgta gacgccagcg ccatgacaga 10920 cagaggggtc ttgtgtggga cgatgaggat tcggccgatg atagcagcgt gttggacttg 10980 ggtgggagag gaaggggcaa cccgtttgct catttgcgcc ctcgcttggg tggtatgttg 11040 tgaaaaaaaa taaaaaagaa aaactcacca aggccatggc gacgagcgta cgttcgttct 11100 tctttattat ctgtgtctag tataatgagg cgagtcgtgc taggcggagc ggtggtgtat 11160 ccggagggtc ctcctccttc gtacgagagc gtgatgcagc agcagcaggc gacggcggtg 11220 atgcaatccc cactggaggc tccctttgtg cctccgcgat acctggcacc tacggagggc 11280 agaaacagca ttcgttactc ggaactggca cctcagtacg ataccaccag gttgtatctg 11340 gtggacaaca agtcggcgga cattgcttct ctgaactatc agaatgacca cagcaacttc 11400 ttgaccacgg tggtgcagaa caatgacttt acccctacgg aagccagcac ccagaccatt 11460 aactttgatg aacgatcgcg gtggggcggt cagctaaaga ccatcatgca tactaacatg 11520 ccaaacgtga acgagtatat gtttagtaac aagttcaaag cgcgtgtgat ggtgtccaga 11580 aaacctcccg acggtgctgc agttggggat acttatgatc acaagcagga tattttggaa 11640 tatgagtggt tcgagtttac tttgccagaa ggcaactttt cagttactat gactattgat 11700 ttgatgaaca atgccatcat agataattac ttgaaagtgg gtagacagaa tggagtgctt 11760 gaaagtgaca ttggtgttaa gttcgacacc aggaacttca agctgggatg ggatcccgaa 11820 accaagttga tcatgcctgg agtgtatacg tatgaagcct tccatcctga cattgtctta 11880 ctgcctggct gcggagtgga ttttaccgag agtcgtttga gcaaccttct tggtatcaga 11940 aaaaaacagc catttcaaga gggttttaag attttgtatg aagatttaga aggtggtaat 12000 attccggccc tcttggatgt agatgcctat gagaacagta agaaagaaca aaaagccaaa 12060 atagaagctg ctacagctgc tgcagaagct aaggcaaaca tagttgccag cgactctaca 12120 agggttgcta acgctggaga ggtcagagga gacaattttg cgccaacacc tgttccgact 12180 gcagaatcat tattggccga tgtgtctgaa ggaacggacg tgaaactcac tattcaacct 12240 gtagaaaaag atagtaagaa tagaagctat aatgtgttgg aagacaaaat caacacagcc 12300 tatcgcagtt ggtatctttc gtacaattat ggcgatcccg aaaaaggagt gcgttcctgg 12360 acattgctca ccacctcaga tgtcacctgc ggagcagagc aggtttactg gtcgcttcca 12420 gacatgatga aggatcctgt cactttccgc tccactagac aagtcagtaa ctaccctgtg 12480 gtgggtgcag agcttatgcc cgtcttctca aagagcttct acaacgaaca agctgtgtac 12540 tcccagcagc tccgccagtc cacctcgctt acgcacgtct tcaaccgctt tcctgagaac 12600 cagattttaa tccgtccgcc ggcgcccacc attaccaccg tcagtgaaaa cgttcctgct 12660 ctcacagatc acgggaccct gccgttgcgc agcagtatcc ggggagtcca acgtgtgacc 12720 gttactgacg ccagacgccg cacctgtccc tacgtgtaca aggcactggg catagtcgca 12780 ccgcgcgtcc tttcaagccg cactttctaa aaaaaaaatg tccattctta tctcgcccag 12840 taataacacc ggttggggtc tgcgcgctcc aagcaagatg tacggaggcg cacgcaaacg 12900 ttctacccaa catcccgtgc gtgttcgcgg acattttcgc gctccatggg gtgccctcaa 12960 gggccgcact cgcgttcgaa ccaccgtcga tgatgtaatc gatcaggtgg ttgccgacgc 13020 ccgtaattat actcctactg cgcctacatc tactgtggat gcagttattg acagtgtagt 13080 ggctgacgct cgcaactatg ctcgacgtaa gagccggcga aggcgcattg ccagacgcca 13140 ccgagctacc actgccatgc gagccgcaag agctctgcta cgaagagcta gacgcgtggg 13200 gcgaagagcc atgcttaggg cggccagacg tgcagcttcg ggcgccagcg ccggcaggtc 13260 ccgcaggcaa gcagccgctg tcgcagcggc gactattgcc gacatggccc aatcgcgaag 13320 aggcaatgta tactgggtgc gtgacgctgc caccggtcaa cgtgtacccg tgcgcacccg 13380 tccccctcgc acttagaaga tactgagcag tctccgatgt tgtgtcccag cggcgaggat 13440 gtccaagcgc aaatacaagg aagaaatgct gcaggttatc gcacctgaag tctacggcca 13500 accgttgaag gatgaaaaaa aaccccgcaa aatcaagcgg gttaaaaagg acaaaaaaga 13560 agaggaagat ggcgatgatg ggctggcgga gtttgtgcgc gagtttgccc cacggcgacg 13620 cgtgcaatgg cgtgggcgca aagttcgaca tgtgttgaga cctggaactt cggtggtctt 13680 tacacccggc gagcgttcaa gcgctacttt taagcgttcc tatgatgagg tgtacgggga 13740 tgatgatatt cttgagcagg cggctgaccg attaggcgag tttgcttatg gcaagcgtag 13800 tagaataact tccaaggatg agacagtgtc aatacccttg gatcatggaa atcccacccc 13860 tagtcttaaa ccggtcactt tgcagcaagt gttacccgta actccgcgaa caggtgttaa 13920 acgcgaaggt gaagatttgt atcccactat gcaactgatg gtacccaaac gccagaagtt 13980 ggaggacgtt ttggagaaag taaaagtgga tccagatatt caacctgagg ttaaagtgag 14040 acccattaag caggtagcgc ctggtctggg ggtacaaact gtagacatta agattcccac 14100 tgaaagtatg gaagtgcaaa ctgaacccgc aaagcctact gccacctcca ctgaagtgca 14160 aacggatcca tggatgccca tgcctattac aactgacgcc gccggtccca ctcgaagatc 14220 ccgacgaaag tacggtccag caagtctgtt gatgcccaat tatgttgtac acccatctat 14280 tattcctact cctggttacc gaggcactcg ctactatcgc agccgaaaca gtacctcccg 14340 ccgtcgccgc aagacacctg caaatcgcag tcgtcgccgt agacgcacaa gcaaaccgac 14400 tcccggcgcc ctggtgcggc aagtgtaccg caatggtagt gcggaacctt tgacactgcc 14460 gcgtgcgcgt taccatccga gtatcatcac ttaatcaatg ttgccgctgc ctccttgcag 14520 atatggccct cacttgtcgc cttcgcgttc ccatcactgg ttaccgagga agaaactcgc 14580 gccgtagaag agggatgttg ggacgcggaa tgcgacgcta caggcgacgg cgtgctatcc 14640 gcaagcaatt gcggggtggt tttttaccag ccttaattcc aattatcgct gctgcaattg 14700 gcgcgatacc aggcatagct tccgtggcgg ttcaggcctc gcaacgacat tgacattgga 14760 aaaaaaacgt ataaataaaa aaaaatacaa tggactctga cactcctggt cctgtgacta 14820 tgttttctta gagatggaag acatcaattt ttcatccttg gctccgcgac acggcacgaa 14880 gccgtacatg ggcacctgga gcgacatcgg cacgagccaa ctgaacgggg gcgccttcaa 14940 ttggagcagt atctggagcg ggcttaaaaa ttttggctca accataaaaa catacgggaa 15000 caaagcttgg aacagcagta caggacaggc gcttagaaat aaacttaaag accagaactt 15060 ccaacaaaaa gtagtcgatg ggatagcttc cggcatcaat ggagtggtag atttggctaa 15120 ccaggctgtg cagaaaaaga taaacagtcg tttggacccg ccgccagcaa ccccaggtga 15180 aatgcaagtg gaggaagaaa ttcctccgcc agaaaaacga ggcgacaagc gtccgcgtcc 15240 cgatttggaa gagacgctgg tgacgcgcgt agatgaaccg ccttcttatg aggaagcaac 15300 gaagcttgga atgcccacca ctagaccgat agccccaatg gccaccgggg tgatgaaacc 15360 ttctcagttg catcgacccg tcaccttgga tttgccccct ccccctgctg ctactgctgt 15420 acccgcttct aagcctgtcg ctgccccgaa accagtcgcc gtagccaggt cacgtcccgg 15480 gggcgctcct cgtccaaatg cgcactggca aaatactctg aacagcatcg tgggtctagg 15540 cgtgcaaagt gtaaaacgcc gtcgctgctt ttaattaaat atggagtagc gcttaacttg 15600 cctatctgtg tatatgtgtc attacacgcc gtcacagcag cagaggaaaa aaggaagagg 15660 tcgtgcgtcg acgctgagtt actttcaaga tggccacccc atcgatgctg ccccaatggg 15720 catacatgca catcgccgga caggatgctt cggagtacct gagtccgggt ctggtgcagt 15780 tcgcccgcgc cacagacacc tacttcaatc tgggaaataa gtttagaaat cccaccgtag 15840 cgccgaccca cgatgtgacc accgaccgta gccagcggct catgttgcgc ttcgtgcccg 15900 ttgaccggga ggacaataca tactcttaca aagtgcggta caccctggcc gtgggcgaca 15960 acagagtgct ggatatggcc agcacgttct ttgacattag gggcgtgttg gacagaggtc 16020 ccagtttcaa accctattct ggtacggctt acaactctct ggctcctaaa ggcgctccaa 16080 atgcatctca atggattgca aaaggcgtac caactgcagc agccgcaggc aatggtgaag 16140 aagaacatga aacagaggag aaaactgcta cttacacttt tgccaatgct cctgtaaaag 16200 ccgaggctca aattacaaaa gagggcttac caataggttt ggagatttca gctgaaaacg 16260 aatctaaacc catctatgca gataaacttt atcagccaga acctcaagtg ggagatgaaa 16320 cttggactga cctagacgga aaaaccgaag agtatggagg cagggctcta aagcctacta 16380 ctaacatgaa accctgttac gggtcctatg cgaagcctac taatttaaaa ggtggtcagg 16440 caaaaccgaa aaactcggaa ccgtcgagtg aaaaaattga atatgatatt gacatggaat 16500 tttttgataa ctcatcgcaa agaacaaact tcagtcctaa aattgtcatg tatgcagaaa 16560 atgtaggttt ggaaacgcca gacactcatg tagtgtacaa acctggaaca gaagacacaa 16620 gttccgaagc taatttggga caacagtcta tgcccaacag acccaactac attggcttca 16680 gagataactt tattggactc atgtactata acagtactgg taacatgggg gtgctggctg 16740 gtcaagcgtc tcagttaaat gcagtggttg acttgcagga cagaaacaca gaactttctt 16800 accaactctt gcttgactct ctgggcgaca gaaccagata ctttagcatg tggaatcagg 16860 ctgtggacag ttatgatcct gatgtacgtg ttattgaaaa tcatggtgtg gaagatgaac 16920 ttcccaacta ttgttttcca ctggacggca taggtgttcc aacaaccagt tacaaatcaa 16980 tagttccaaa tggagaagat aataataatt ggaaagaacc tgaagtaaat ggaacaagtg 17040 agatcggaca gggtaatttg tttgccatgg aaattaacct tcaagccaat ctatggcgaa 17100 gtttccttta ttccaatgtg gctctgtatc tcccagactc gtacaaatac accccgtcca 17160 atgtcactct tccagaaaac aaaaacacct acgactacat gaacgggcgg gtggtgccgc 17220 catctctagt agacacctat gtgaacattg gtgccaggtg gtctctggat gccatggaca 17280 atgtcaaccc attcaaccac caccgtaacg ctggcttgcg ttaccgatct atgcttctgg 17340 gtaacggacg ttatgtgcct ttccacatac aagtgcctca aaaattcttc gctgttaaaa 17400 acctgctgct tctcccaggc tcctacactt atgagtggaa ctttaggaag gatgtgaaca 17460 tggttctaca gagttccctc ggtaacgacc tgcgggtaga tggcgccagc atcagtttca 17520 cgagcatcaa cctctatgct acttttttcc ccatggctca caacaccgct tccacccttg 17580 aagccatgct gcggaatgac accaatgatc agtcattcaa cgactaccta tctgcagcta 17640 acatgctcta ccccattcct gccaatgcaa ccaatattcc catttccatt ccttctcgca 17700 actgggcggc tttcagaggc tggtcattta ccagactgaa aaccaaagaa actccctctt 17760 tggggtctgg atttgacccc tactttgtct attctggttc tattccctac ctggatggta 17820 ccttctacct gaaccacact tttaagaagg tttccatcat gtttgactct tcagtgagct 17880 ggcctggaaa tgacaggtta ctatctccta acgaatttga aataaagcgc actgtggatg 17940 gcgaaggcta caacgtagcc caatgcaaca tgaccaaaga ctggttcttg gtacagatgc 18000 tcgccaacta caacatcggc tatcagggct tctacattcc agaaggatac aaagatcgca 18060 tgtattcatt tttcagaaac ttccagccca tgagcaggca ggtggttgat gaggtcaatt 18120 acaaagactt caaggccgtc gccataccct accaacacaa caactctggc tttgtgggtt 18180 acatggctcc gaccatgcgc caaggtcaac cctatcccgc taactatccc tatccactca 18240 ttggaacaac tgccgtaaat agtgttacgc agaaaaagtt cttgtgtgac agaaccatgt 18300 ggcgcatacc gttctcgagc aacttcatgt ctatgggggc ccttacagac ttgggacaga 18360 atatgctcta tgccaactca gctcatgctc tggacatgac ctttgaggtg gatcccatgg 18420 atgagcccac cctgctttat cttctcttcg aagttttcga cgtggtcaga gtgcatcagc 18480 cacaccgcgg catcatcgag gcagtctacc tgcgtacacc gttctcggcc ggtaacgcta 18540 ccacgtaaga agcttcttgc ttcttgcaaa tagcagctgc aaccatggcc tgcggatccc 18600 aaaacggctc cagcgagcaa gagctcagag ccattgtcca agacctgggt tgcggaccct 18660 attttttggg aacctacgat aagcgcttcc cggggttcat ggcccccgat aagctcgcct 18720 gtgccattgt aaatacggcc ggacgtgaga cggggggaga gcactggttg gctttcggtt 18780 ggaacccacg ttctaacacc tgctaccttt ttgatccttt tggattctcg gatgatcgtc 18840 tcaaacagat ttaccagttt gaatatgagg gtctcctgcg ccgcagcgct cttgctacca 18900 aggaccgctg tattacgctg gaaaaatcta cccagaccgt gcagggcccc cgttctgccg 18960 cctgcggact tttctgctgc atgttccttc acgcctttgt gcactggcct gaccgtccca 19020 tggacggaaa ccccaccatg aaattgctaa ctggagtgcc aaacaacatg cttcattctc 19080 ctaaagtcca gcccaccctg tgtgacaatc aaaaagcact ctaccatttt cttaataccc 19140 attcgcctta ttttcgctct catcgtacac acatcgaaag ggccactgcg ttcgaccgta 19200 tggatgttca ataatgactc atgtaaacaa cgtgttcaat aaacatcact ttattttttt 19260 acatgtatca aggctctgga ttacttattt atttacaagt cgaatgggtt ctgacgagaa 19320 tcagaatgac ccgcaggcag tgatacgttg cggaactgat acttgggttg ccacttgaat 19380 tcgggaatca ccaacttggg aaccggtata tcgggcagga tgtcactcca cagctttctg 19440 gtcagctgca aagctccaag caggtcagga gccgaaatct tgaaatcaca attaggacca 19500 gtgctctgag cgcgagagtt gcggtacacc ggattgcagc actgaaacac catcagcgac 19560 ggatgtctca cgcttgccag cacggtggga tctgcaatca tgcccacatc cagatcttca 19620 gcattggcaa tgctgaacgg ggtcatcttg caggtctgcc tacccatggc gggcacccaa 19680 ttaggcttgt ggttgcaatc gcagtgcagg gggatcagta tcatcttggc ctgatcctgt 19740 ctgattcctg gatacacggc tctcatgaaa gcatcatatt gcttgaaagc ctgctgggct 19800 ttactaccct cggtataaaa catcccgcag gacctgctcg aaaactggtt agctgcacag 19860 ccggcatcat tcacacagca gcgggcgtca ttgttggcta tttgcaccac acttctgccc 19920 cagcggtttt gggtgatttt ggttcgctcg ggattctcct ttaaggctcg ttgtccgttc 19980 tcgctggcca catccatctc gataatctgc tccttctgaa tcataatatt gccatgcagg 20040 cacttcagct tgccctcata atcattgcag ccatgaggcc acaacgcaca gcctgtacat 20100 tcccaattat ggtgggcgat ctgagaaaaa gaatgtatca ttccctgcag aaatcttccc 20160 atcatcgtgc tcagtgtctt gtgactagtg aaagttaact ggatgcctcg gtgctcttcg 20220 tttacgtact ggtgacagat gcgcttgtat tgttcgtgtt gctcaggcat tagtttaaaa 20280 caggttctaa gttcgttatc cagcctgtac ttctccatca gcagacacat cacttccatg 20340 cctttctccc aagcagacac caggggcaag ctaatcggat tcttaacagt gcaggcagca 20400 gctcctttag ccagagggtc atctttagcg atcttctcaa tgcttctttt gccatccttc 20460 tcaacgatgc gcacgggcgg gtagctgaaa cccactgcta caagttgcgc ctcttctctt 20520 tcttcttcgc tgtcttgact gatgtcttgc atggggatat gtttggtctt ccttggcttc 20580 tttttggggg gtatcggagg aggaggactg tcgctccgtt ccggagacag ggaggattgt 20640 gacgtttcgc tcaccattac caactgactg tcggtagaag aacctgaccc cacacggcga 20700 caggtgtttt tcttcggggg cagaggtgga ggcgattgcg aagggctgcg gtccgacctg 20760 gaaggcggat gactggcaga accccttccg cgttcggggg tgtgctccct gtggcggtcg 20820 cttaactgat ttccttcgcg gctggccatt gtgttctcct aggcagagaa acaacagaca 20880 tggaaactca gccattgctg tcaacatcgc cacgagtgcc atcacatctc gtcctcagcg 20940 acgaggaaaa ggagcagagc ttaagcattc caccgcccag tcctgccacc acctctaccc 21000 tagaagataa ggaggtcgac gcatctcatg acatgcagaa taaaaaagcg aaagagtctg 21060 agacagacat cgagcaagac ccgggctatg tgacaccggt ggaacacgag gaagagttga 21120 aacgctttct agagagagag gatgaaaact gcccaaaaca gcgagcagat aactatcacc 21180 aagatgctgg aaatagggat cagaacaccg actacctcat agggcttgac ggggaagacg 21240 cgctccttaa acatctagca agacagtcgc tcatagtcaa ggatgcatta ttggacagaa 21300 ctgaagtgcc catcagtgtg gaagagctca gctgcgccta cgagcttaac cttttttcac 21360 ctcgtactcc ccccaaacgt cagccaaacg gcacctgcga gccaaatcct cgcttaaact 21420 tttatccagc ttttgctgtg ccagaagtac tggctaccta tcacatcttt tttaaaaatc 21480 aaaaaattcc agtctcctgc cgcgctaatc gcacccgcgc cgatgcccta ctcaatctgg 21540 gacctggttc acgcttacct gatatagctt ccttggaaga ggttccaaag atcttcgagg 21600 gtctgggcaa taatgagact cgggccgcaa atgctctgca aaagggagaa aatggcatgg 21660 atgagcatca cagcgttctg gtggaattgg aaggcgataa tgccagactc gcagtactca 21720 agcgaagcgt cgaggtcaca cacttcgcat atcccgctgt caacctgccc cctaaagtca 21780 tgacggcggt catggaccag ttactcatta agcgcgcaag tcccctttca gaagacatgc 21840 atgacccaga tgcctgtgat gagggtaaac cagtggtcag tgatgagcag ctaacccgat 21900 ggctgggcac cgactctccc cgggatttgg aagagcgtcg caagcttatg atggccgtgg 21960 tgctggttac cgtagaacta gagtgtctcc gacgtttctt taccgattca gaaaccttgc 22020 gcaaactcga agagaatctg cactacactt ttagacacgg ctttgtgcgg caggcatgca 22080 agatatctaa cgtggaactc accaacctgg tttcctacat gggtattctg catgagaatc 22140 gcctaggaca aagcgtgctg cacagcaccc ttaaggggga agcccgccgt gattacatcc 22200 gcgattgtgt ctatctctac ctgtgccaca cgtggcaaac cggcatgggt gtatggcagc 22260 aatgtttaga agaacagaac ttgaaagagc ttgacaagct cttacagaaa tctcttaagg 22320 ttctgtggac agggttcgac gagcgcaccg tcgcttccga cctggcagac ctcatcttcc 22380 cagagcgtct cagggttact ttgcgaaacg gattgcctga ctttatgagc cagagcatgc 22440 ttaacaattt tcgctctttc atcctggaac gctccggtat cctgcccgcc acctgctgcg 22500 cactgccctc cgactttgtg cctctcacct accgcgagtg ccccccgccg ctatggagtc 22560 actgctacct gttccgtctg gccaactatc tctcctacca ctcggatgtg atcgaggatg 22620 tgagcggaga cggcttgctg gagtgccact gccgctgcaa tctgtgcacg ccccaccggt 22680 ccctagcttg caacccccag ttgatgagcg aaacccagat aataggcacc tttgaattgc 22740 aaggccccag cagccaaggc gatgggtctt ctcctgggca aagtttaaaa ctgaccccgg 22800 gactgtggac ctccgcctac ttgcgcaagt ttgctccgga agattaccac ccctatgaaa 22860 tcaagttcta tgaggaccaa tcacagcctc caaaggccga actttcggct tgcgtcatca 22920 cccagggggc aattctggcc caattgcaag ccatccaaaa atcccgccaa gaatttctac 22980 tgaaaaaggg taagggggtc taccttgacc cccagaccgg cgaggaactc aacacaaggt 23040 tccctcagga tgtcccaacg acgagaaaac aagaagttga aggtgcagcc gccgccccca 23100 gaagatatgg aggaagattg ggacagtcag gcagaggagg cggaggagga cagtctggag 23160 gacagtctgg aggaagacag tttggaggag gaaaacgagg aggcagagga ggtggaagaa 23220 gtaaccgccg acaaacagtt atcctcggct gcggagacaa gcaacagcgc taccatctcc 23280 gctccgagtc gaggaacccg gcggcgtccc agcagtagat gggacgagac cggacgcttc 23340 ccgaacccaa ccagcgcttc caagaccggt aagaaggatc ggcagggata caagtcctgg 23400 cgggggcata agaatgccat catctcctgc ttgcatgagt gcgggggcaa catatccttc 23460 acgcggcgct acttgctatt ccaccatggg gtgaactttc cgcgcaatgt tttgcattac 23520 taccgtcacc tccacagccc ctactatagc cagcaaatcc cgacagtctc gacagataaa 23580 gacagcggcg gcgacctcca acagaaaacc agcagcggca gttagaaaat acacaacaag 23640 tgcagcaaca ggaggattaa agattacagc caacgagcca gcgcaaaccc gagagttaag 23700 aaatcggatc tttccaaccc tgtatgccat cttccagcag agtcggggtc aagagcagga 23760 actgaaaata aaaaaccgat ctctgcgttc gctcaccaga agttgtttgt atcacaagag 23820 cgaagatcaa cttcagcgca ctctcgagga cgccgaggct ctcttcaaca agtactgcgc 23880 gctgactctt aaagagtagg cagcgaccgc gcttattcaa aaaaggcggg aattacatca 23940 tcctcgacat gagtaaagaa attcccacgc cttacatgtg gagttatcaa ccccaaatgg 24000 gattggcagc aggcgcctcc caggactact ccacccgcat gaattggctc agcgccgggc 24060 cttctatgat ttctcgagtt aatgatatac gcgcctaccg aaaccaaata cttttggaac 24120 agtcagctct taccaccacg ccccgccaac accttaatcc cagaaattgg cccgccgccc 24180 tagtgtacca ggaaagtccc gctcccacca ctgtattact tcctcgagac gcccaggccg 24240 aagtccaaat gactaatgca ggtgcgcagt tagctggcgg ctccacccta tgtcgtcaca 24300 ggcctcggca taatataaaa cgcctgatga tcagaggccg aggtatccag ctcaacgacg 24360 agtcggtgag ctctccgctt ggtctacgac cagacggaat ctttcagatt gccggctgcg 24420 ggagatcttc cttcacccct cgtcaggctg ttctgacttt ggaaagttcg tcttcgcaac 24480 cccgctcggg cggaatcggg accgttcaat ttgtagagga gtttactccc tctgtctact 24540 tcaacccctt ctccggatct cctgggcact acccggacga gttcataccg aacttcgacg 24600 cgattagcga gtcagtggac ggctacgatt gatgtctggt gacgcggctg agctatctcg 24660 gctgcgacat ctagaccact gccgccgctt tcgctgcttt gcccgggaac ttattgagtt 24720 catctacttc gaactcccca aggatcaccc tcaaggtccg gcccacggag tgcggattac 24780 tatcgaaggc aaaatagact ctcgcctgca acgaattttc tcccagcggc ccgtgctgat 24840 cgagcgagac cagggaaaca ccacggttag taatcaatta cggggtcatt agttcatagc 24900 ccatatatgg agttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca 24960 tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac 25020 tcatcaatgt atcttatcat gtctgctcga agcggccggc cgccccgact ctagagtcgc 25080 ggcctcatta ggaagttcct atactttcta gagaatagga acttctcaga agaactcgtc 25140 aagaaggcga tagaaggcga tgcgctgcga atcgggagcg gcgataccgt aaagcacgag 25200 gaagcggtca gcccattcgc cgccaagctc ttcagcaata tcacgggtag ccaacgctat 25260 gtcctgatag cggtccgcca cacccagccg gccacagtcg atgaatccag aaaagcggcc 25320 attttccacc atgatattcg gcaagcaggc atcgccatgg gtcacgacga gatcctcgcc 25380 gtcgggcatg cgcgccttga gcctggcgaa cagttcggct ggcgcgagcc cctgatgctc 25440 ttcgtccaga tcatcctgat cgacaagacc ggcttccatc cgagtacgtg ctcgctcgat 25500 gcgatgtttc gcttggtggt cgaatgggca ggtagccgga tcaagcgtat gcagccgccg 25560 cattgcatca gccatgatgg atactttctc ggcaggagca aggtgagatg acaggagatc 25620 ctgccccggc acttcgccca atagcagcca gtcccttccc gcttcagtga caacgtcgag 25680 cacagctgcg caaggaacgc ccgtcgtggc cagccacgat agccgcgctg cctcgtcctg 25740 cagttcattc agggcaccgg acaggtcggt cttgacaaaa agaaccgggc gcccctgcgc 25800 tgacagccgg aacacggcgg catcagagca gccgattgcc tgttgtgccc agtcatagcc 25860 gaatagcctc tccacccaag cggccggaga acctgcgtgc aatccatctt gttcaatggc 25920 cgatcccata acaccccttg tattactgtt tatgtaagca gacagtttta ctgttcgtga 25980 tgatatattt ttatcttgtg caatgtaaca ggttgtggcc atagcgggcc cgggattttc 26040 ctccacgtcc ccgcatgtta gaagacttcc cctgccctcg gctctggaag ttcctatact 26100 ttctagagaa taggaacttc ccgccagaat gcgttcgcac agccgccagc cggtcactcc 26160 gttgatggtt actcggaaca gcagggagcc gtcggggttg atcaggcgct cgtcgataat 26220 tttgttgccg ttccacaggg tccctgttac agtgatcttt ttgccgtcga acacggcgat 26280 gccttcatac ggccgtccga aatagtcgat catgttcggc gtaaccccgt cgattaccag 26340 tgtgccatag tgcaggatca ccttaaagtg atgatcatcc acagggtaca ccaccttaaa 26400 aattttttcg atctggccca tttggtcgcc gctcagacct tcatacggga tgatgacatg 26460 gatgtcgatc ttcagcccat tttcaccgct caggacaatc ctttggatcg gagttacgga 26520 caccccgaga ttctgaaaca aactggacac acctccctgt tcaaggactt ggtccaggtt 26580 gtagccggct gtctgtcgcc agtccccaac gaaatcttcg agtgtgaaga ccatggatcc 26640 gggcccgggg ttttcttcaa cgtctccagc ctgcttcagc aggctgaagt tagtagctcc 26700 gcttcctcga gctcgagatc tggcgaaggc gatgggggtc ttgaaggcgt gctggtactc 26760 cacgatgccc agctcggtgt tgctgtgcag ctcctccacg cggcggaagg cgaacatggg 26820 gcccccgttc tgcaggatgc tggggtggat ggcgctcttg aagtgcatgt ggctgtccac 26880 cacgaagctg tagtagccgc cgtcgcgcag gctgaaggtg cgggcgaagc tgcccaccag 26940 cacgttatcg cccatggggt gcaggtgctc cacggtggcg ttgctgcgga tgatcttgtc 27000 ggtgaagatc acgctgtcct cggggaagcc ggtgcccacc accttgaagt cgccgatcac 27060 gcggccggcc tcgtagcggt agctgaagct cacgtgcagc acgccgccgt cctcgtactt 27120 ctcgatgcgg gtgttggtgt agccgccgtt gttgatggcg tgcaggaagg ggttctcgta 27180 gccgctgggg taggtgccga agtggtagaa gccgtagccc atcacgtggc tcagcaggta 27240 ggggctgaag gtcagggcgc ctttggtgct cttcatcttg ttggtcatgc ggccctgctc 27300 gggggtgccc tctccgccgc ccaccagctc gaactccacg ccgttcaggg tgccggtgat 27360 gcggcactcg atcttcatgg cgggcatggt ggcgaccggt agcgctagcg gcttcggtac 27420 cacgcgttcg ctcgaattaa tcaattcttt gccaaaatga tgagacagca caataaccag 27480 cacgttgccc aggagctgta ggaaaaagaa gaaggcatga acatggttag cagaggctct 27540 agagccgccg gtcacacgcc agaagccgaa ccccgccctg ccccgtcccc cccgaaggca 27600 gccgtccccc cgcggacagc cccgaggctg gagagggaga aggggacggc ggcgcggcga 27660 cgcacgaagg ccctccccgc ccatttcctt cctgccgggg ccctcccgga gcccctcaag 27720 gctttcacgc agccacagaa aagaaacaag ccgtcattaa accaagcgct aattacagcc 27780 cggaggagaa gggccgtccc gcccgctcac ctgtgggagt aacgcggtca gtcagagccg 27840 gggcgggcgg cgcgaggcgg cgcggagcgg ggcacggggc gaaggcaacg cagcgactcc 27900 cgcccgccgc gcgcttcgct ttttataggg ccgccgccgc cgccgcctcg ccataaaagg 27960 aaactttcgg agcgcgccgc tctgattggc tgccgccgca cctctccgcc tcgccccgcc 28020 ccgcccctcg ccccgccccg ccccgcctgg cgcgcgcccc cccccccccc ccgcccccat 28080 cgctgcacaa aataattaaa aaataaataa atacaaaatt gggggtgggg agggggggga 28140 gatggggaga gtgaagcaga acgtggggct cacctcgacc atggtaatag cgatgactaa 28200 tacgtagatg tactgccaag taggaaagtc ccataaggtc atgtactggg cataatgcca 28260 ggcgggccat ttaccgtcat tgacgtcaat agggggcgta cttggcatat gatacacttg 28320 atgtactgcc aagtgggcag tttaccgtaa atactccacc cattgacgtc aatggaaagt 28380 ccctattggc gttactatgg gaacatacgt cattattgac gtcaatgggc gggggtcgtt 28440 gggcggtcag ccaggcgggc catttaccgt aagttatgta acgcggaaca acaacaattg 28500 cattcatttt atgtttcagg ttcaggggga ggtgtggtcc tgcgattcca tcgagtgcac 28560 ctacaccctg ctgaagaccc tatgcggcct aagagacctg ctaccaatga attaaaaaaa 28620 aatgattaat aaaaaatcac ttacttgaaa tcagcaataa ggtctctgtt gaaattttct 28680 cccagcagca cctcacttcc ctcttcccaa ctctggtatt ctaaaccccg ttcagcggca 28740 tactttctcc atactttaaa ggggatgtca aattttagct cctctcctgt acccacaatc 28800 ttcatgtctt tcttcccaga tgaccaagag agtccggctc agtgactcct tcaaccctgt 28860 ctacccctat gaagatgaaa gcacctccca acaccccttt ataaacccag ggtttatttc 28920 cccaaatggc ttcacacaaa gcccagacgg agttcttact ttaaaatgtt taaccccact 28980 aacaaccaca ggcggatctc tacagctaaa agtgggaggg ggacttacag tggatgacac 29040 tgatggtacc ttacaagaaa acatacgtgc tacagcaccc attactaaaa ataatcactc 29100 tgtagaacta tccattggaa atggattaga aactcaaaac aataaactat gtgccaaatt 29160 gggaaatggg ttaaaattta acaacggtga catttgtata aaggatagta ttaacacctt 29220 atggactgga ataaaccctc cacctaactg tcaaattgtg gaaaacacta atacaaatga 29280 tggcaaactt actttagtat tagtaaaaaa tggagggctt gttaatggct acgtgtctct 29340 agttggtgta tcagacactg tgaaccaaat gttcacacaa aagacagcaa acatccaatt 29400 aagattatat tttgactctt ctggaaatct attaactgag gaatcagact taaaaattcc 29460 acttaaaaat aaatcttcta cagcgaccag tgaaactgta gccagcagca aagcctttat 29520 gccaagtact acagcttatc ccttcaacac cactactagg gatagtgaaa actacattca 29580 tggaatatgt tactacatga ctagttatga tagaagtcta tttcccttga acatttctat 29640 aatgctaaac agccgtatga tttcttccaa tgttgcctat gccatacaat ttgaatggaa 29700 tctaaatgca agtgaatctc cagaaagcaa catagctacg ctgaccacat cccccttttt 29760 cttttcttac attacagaag acgacaacta aaataaagtt taagtgtttt tatttaaaat 29820 cacaaaattc gagtagttat tttgcctcca ccttcccatt tgacagaata cacagtcctt 29880 tctccccggc tggccttaaa aagcatcata tcatgggtaa cagacatatt cttaggtgtt 29940 atattccaca cggtttcctg tcgagccaaa cgctcatcag tgatattaat aaactccccg 30000 ggcagctcac ttaagttcat gtcgctgtcc agctgctgag ccacaggctg ctgtccaact 30060 tgcggttgct taacgggcgg cgaaggagaa gtccacgcct acatgggggt agagtcataa 30120 tcgtgcatca ggatagggcg gtggtgctgc agcagcgcgc gaataaactg ctgccgccgc 30180 cgctccgtcc tgcaggaata caacatggca gtggtctcct cagcgatgat tcgcaccgcc 30240 cgcagcataa ggcgccttgt cctccgggca cagcagcgca ccctgatctc acttaaatca 30300 gcacagtaac tgcagcacag caccacaata ttgttcaaaa tcccacagtg caaggcgctg 30360 tatccaaagc tcatggcggg gaccacagaa cccacgtggc catcatacca caagcgcagg 30420 tagattaagt ggcgacccct cataaacacg ctggacataa acattacctc ttttggcatg 30480 ttgtaattca ccacctcccg gtaccatata aacctctgat taaacatggc gccatccacc 30540 accatcctaa accagctggc caaaacctgc ccgccggcta tacactgcag ggaaccggga 30600 ctggaacaat gacagtggag agcccaggac tcgtaaccat ggatcatcat gctcgtcatg 30660 atatcaatgt tggcacaaca caggcacacg tgcatacact tcctcaggat tacaagctcc 30720 tcccgcgtta gaaccatatc ccagggaaca acccattcct gaatcagcgt aaatcccaca 30780 ctgcagggaa gacctcgcac gtaactcacg ttgtgcattg tcaaagtgtt acattcgggc 30840 agcagcggat gatcctccag tatggtagcg cgggtttctg tctcaaaagg aggtagacga 30900 tccctactgt acggagtgcg ccgagacaac cgagatcgtg ttggtcgtag tgtcatgcca 30960 aatggaacgc cggacgtagt cattctcgta ttttgtatag caaaacgcgg ccctggcaga 31020 acacactctt cttcgccttc tatcctgccg cttagcgtgt tccgtgtgat agttcaagta 31080 cagccacact cttaagttgg tcaaaagaat gctggcttca gttgtaatca aaactccatc 31140 gcatctaatt gttctgagga aatcatccac ggtagcatat gcaaatccca accaagcaat 31200 gcaactggat tgcgtttcaa gcaggagagg agagggaaga gacggaagaa ccatgttaat 31260 ttttattcca aacgatctcg cagtacttca aattgtagat cgcgcagatg gcatctctcg 31320 cccccactgt gttggtgaaa aagcacagct aaatcaaaag aaatgcgatt ttcaaggtgc 31380 tcaacggtgg cttccaacaa agcctccacg cgcacatcca agaacaaaag aataccaaaa 31440 gaaggagcat tttctaactc ctcaatcatc atattacatt cctgcaccat tcccagataa 31500 ttttcagctt tccagccttg aattattcgt gtcagttctt gtggtaaatc caatccacac 31560 attacaaaca ggtcccggag ggcgccctcc accaccattc ttaaacacac cctcataatg 31620 acaaaatatc ttgctcctgt gtcacctgta gcgaattgag aatggcaaca tcaattgaca 31680 tgcccttggc tctaagttct tctttaagtt ctagttgtaa aaactctctc atattatcac 31740 caaactgctt agccagaagc cccccgggaa caagagcagg ggacgctaca gtgcagtaca 31800 agcgcagacc tccccaattg gctccagcaa aaacaagatt ggaataagca tattgggaac 31860 caccagtaat atcatcgaag ttgctggaaa tataatcagg cagagtttct tgtagaaatt 31920 gaataaaaga aaaatttgcc aaaaaaacat tcaaaacctc tgggatgcaa atgcaatagg 31980 ttaccgcgct gcgctccaac attgttagtt ttgaattagt ctgcaaaaat aaaaaaaaaa 32040 caagcgtcat atcatagtag cctgacgaac aggtggataa atcagtcttt ccatcacaag 32100 acaagccaca gggtctccag ctcgaccctc gtaaaacctg tcatcgtgat taaacaacag 32160 caccgaaagt tcctcgcggt gaccagcatg aataagtctt gatgaagcat acaatccaga 32220 catgttagca tcagttaagg agaaaaaaca gccaacatag cctttgggta taattatgct 32280 taatcgtaag tatagcaaag ccacccctcg cggatacaaa gtaaaaggca caggagaata 32340 aaaaatataa ttatttctct gctgctgttt aggcaacgtc gcccccggtc cctctaaata 32400 cacatacaaa gcctcatcag ccatggctta ccagagaaag tacagcgggc acacaaacca 32460 caagctctaa agtcactctc caacctctcc acaatatata tacacaagcc ctaaactgac 32520 gtaatgggac taaagtgtaa aaaatcccgc caaacccaac acacaccccg aaactgcgtc 32580 accagggaaa agtacagttt cacttccgca atcccaacaa gcgtcacttc ctctttctca 32640 cggtacgtca catcccatta acttacaacg tcattttccc acggccgcgc cgcccctttt 32700 aaccgttaac cccacagcca atca 32724 <210> 59 <211> 32538 <212> DNA <213> Artificial Sequence <220> <223> pHCA-AAVS1-globin-mgmt <400> 59 catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60 ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120 gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180 gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240 taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300 agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg 360 gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc 420 cgggtcaaag ttggcgtttt gattcggccg aaggattaca tgagcttaga aatgtaatta 480 gcatagtgtg tggcatagtg tagataccaa ataaatatga tctctccttc tactcttgaa 540 aatgcaaaca cattcttggt ggtcctaaaa tagcctgtaa catggtttac tcagcagcat 600 ttgctattca aggcagatct gcctttagtc attggctgcg ctcctgaaca gctgtgtgaa 660 aggctaactt ttgtaaacca aatcaaaata aaatgcagca aaaatttgtc actgaaagga 720 aatcctcagt atatcctttt atgaaatgaa agatccctca tccaaactta acttttttaa 780 aagtgcgcat ttggagatat agccctttct tatgaatcct aattcaattt tggccataaa 840 cacacgttga tgttccccac cccaaagcac atagcaacaa gagtaggttc tatattgaaa 900 ataatgacaa tttaaaaaca tgtacttatt tcactgtatg tggacagtgt ctatgattgc 960 atcatgaagt gtcatataac catgtacgtg tacatgagag agagatagag agagaagtgg 1020 tagggtggtg gtggtagagg ggatggcgat agtaatcatg gtaatggtag aggtgatgga 1080 ggtggtaatg acggaggtaa gggtggtagt gatgatggtg gtggtggtaa tggtggtgga 1140 tgtggtggtg gcaattggga tggtgggatg gtggtagcca tggtgatggt ggtaatggtg 1200 ttgatttaaa gggtggtggt agtgaaggtg agggtagtgg tggtggaggt ggtggtgctg 1260 gtagcaatag tgatggtggt gatggtgttg atgagggtgt tgggatcagg gtgagttccc 1320 acagtatatt tcattcttgt tgtaccactc tgtcaacagc accactgact gggacagagg 1380 aagaaggcac actctgaatg tgttattaac agaaacctca aaacagtctg tctccttgta 1440 gtcattcaaa attatctttt tcttacctgg aaaactgaaa ctgaattacc gggaaaaaca 1500 caggagattt ttgtttgtta atatgctgcc aataaagtaa ttttatgtca aatttaacta 1560 caggaaaggg caaggcattt tctaagttcc ttagatgtca tgtggctaaa aaaaacaaaa 1620 ggatggacag cagttagata ctgtacactt agctgtttga agccatatat tcagaaagca 1680 gatgttggga gttggtgttt gaggactgat ttcctggagg tattttatat aggccaagtt 1740 cattgttcta aactctaagg gcttgacttg agggaggaaa agaggcaaga acatgtttag 1800 ttttgctgac agcatcacat gggcagccct aaggctagac aactttaggg cctgaagctt 1860 attctaggaa agaagcacct acagagtggc actgggctcc cctccactat agagatgaag 1920 tcatatgaca gtaaagggca ggcagggctg cctagggggc ccagaactga cacttccatt 1980 agaatgagca caggccaggg agagaagtgg ggaaccagag agaaggagct ggaattcctt 2040 tctctccata cataaatgcc tgcagagtcc catttcagaa tccggcagac aaagccacca 2100 atgtgatccc catgacctta taaacattca ttaaaatgca tttcaaggca tgtgatggcc 2160 tccccacccc ctagataatg agaaaacaaa ggtttctctt ctgatagaga caagttcagc 2220 tctgaagtca acattatttc tggttctgtc tgaacaatga catatggcaa ctcttccctt 2280 tctatagttc tagtccagaa tgacaaaaaa ggggaaaaat ttcttagaga aggtagagat 2340 tatacgaata cagtccatga aatgagcata aggagaataa agaatataac ttatccaaag 2400 aagtctggca ggctgttata aatgcttgat tttggacact gtagttggag gtttaacatg 2460 gacaccaata aaaaggtcag caaagggtat gcactgttcc tattgggcaa gaagatagga 2520 ggtcaaaggt aaccaggaaa gataaactca gggagactta ttttccctcc agagggcact 2580 gggcttgtag gccctgggca aaattgtcaa aaaggtgaaa atcgcctgtg gtttatttag 2640 tctgctcttt cttcactagt gcctcaccag ttcagttcag gccaatttgc tagcctctaa 2700 ctcctagacc gtcagaactg ctgggccctt caagacgggc tgctcacacc cactcatgtt 2760 aagcctggtg aggcctgtac tctgttttca caggaagaaa tcctcaccca gtcttcccca 2820 aacacattcc caggttctgt cattagtggg atagagatga ttactgtggg gagaagagaa 2880 acatctggat ggatttggtg aggttgatct atagaggaag taggtgctgc ctgaggtagc 2940 tgtaatagaa gctaaaggtc aaaggagagg gccctgtccc aatccagatg actccacttc 3000 tgctggaccc aggttcacaa gcttaatcta catttcacct aaatttggct aacaagccca 3060 aaatcacaca ggcaaaggga gaagtggagg cagaaccgag gttggaggcc accagggcca 3120 ccgggcagag atcatttaag cccaaccttc tcacttctcc ctgggctctg cctctcttaa 3180 aggaccttgt ggtgtgacct cttgtaggtc cctttcacac tcggggcctc agtttcccca 3240 ctgtaaagtg aatgggtccc agctttggta agcttatgct tacctgatgc tttcttcctg 3300 ggctgctctt gtagagaaaa gataaatctt cttcctccat ccacgagggc ttctttccct 3360 gggggtgaga gtaggctgag gagagccact tgcacacact cttaaagaaa gtattacctg 3420 caccagctca gtgagaggca cagatcagac tgttacttga atcaaattat gagcctcccc 3480 aaatatatct atgacattta aataggggat tacttgaaca tagactttgg gatccggtgt 3540 ggagtgcagg agactagcaa agtgaatcct gagagtagca ggtctgcacc tgttggatcg 3600 agaaaggcgg cctacaattc tggtcaaatg agctgtgctt attgacatat tctattagag 3660 agtactacca ggtcaccagt caccagaaag gctgccagct ctccaaccac ctccagggaa 3720 ctatcctgaa tggggcctta acaagcctaa gagagggttg gtttgggtcc caagccaata 3780 tttgctctgc tttatgtcag tcatatggaa cccaaaccaa ccctctccta tgtgcctcac 3840 cagtcggtgc agggatccca atttcaagtt tggtttttta tggtcaaagt ccagcataga 3900 ttaaatgaag gggtgtgatg atggtgttaa aagagaactc cagaccagtt taactcttgg 3960 acacacatcc catctcacca tggtgcttcc aaccttccag agatgatggg ctcctatttt 4020 ctgatgacaa agccctccac aggattgctg cctggccatc agggagtgcc tctgtaactg 4080 aggctgagat cccactttca gtcctccagc tgtggcccat ccctgctccg cccaccgggt 4140 atggcctgtc ctaggctctt aggtatggct gcattgtgaa atgatggcta cagagctggc 4200 atctcctgta gtctggttca tctagtgcac tacctcatag ttaaaagaaa tctgtttaag 4260 ccactgaggg tggctcctag tgccaactcc aagaacagga agcttccctt ttttgggagg 4320 aggggcagat ggtaacatgg atcgtccagg tcaatgggag cagggcaacc acagtaagta 4380 ctggacaaca acacaaaact ccatgtgtgg cttccatcga gtccctctcc aattggtttg 4440 gtcttctccg tcccatgcag cactttagca aggggcctgg ctgaaggcta tgaattgtgt 4500 ggagcctcct cattgcagtc tccaaccatc tgatgctggg aaaatgtcac caggatgcag 4560 ccatgccgtg tggccaatga accgagaaaa cacccctttt ctagaatgct ctaaagaggc 4620 agaataatcc agaggtgagg aaggaaatac tccaccagag acccaggcag ttcctacaaa 4680 agccagactt tccttcacct agggagtgac aagaccagtg gaaaacactc tcaagcagta 4740 acccccaaat gctctgcaag ccagtggcgt ccagataccg cacaagcgag tgggctgtct 4800 aatcccatca tcatgatgta aatatctcta ggctgccccg ggctgtgcct gaccctgtct 4860 tcagctttcc acacctccac ctacagccca tgcacagaag gaccacccag gaatgctgca 4920 agtgtggcac ctccagggcc acccagggag aaggagggca gctatgctgg tggctccagg 4980 cccatttggc gggtggtacc ttcacaccac aaagcccaaa ctgaggcccc agatttggct 5040 gatgagggca tattggacag gggtcactta tgctcttccc cattgccacc tggcctctgg 5100 ctacctggac ttggctacct gtggatcctc tcacaggtgc caccatcttg gctgagtctc 5160 cagatgcgag gtccctgagg cagtggcagg cttctcgcta atgctgatgg gattaggaat 5220 gggataggtg gggagggccc tggactgggc cctgatgagc caagtgggtt tttagagggg 5280 ctactggtac atttcaggga caggacatct ggtagagcta agctggggca ataaggagcc 5340 actgctaatc tgagagctag aaacaatcag cttctgggtc attattaatt agggtagttt 5400 gggctgtgtg gaagtcacgt actatatggg gtagccacag ctctctctac agataatctc 5460 taagacttct gattgggacc gtgtgaatgc agtagcaata tctcttctta ctgccaggcc 5520 ctgccagtcc tgcctccacg ccctggctgg ccccccttat gatctgaccc atgccaggct 5580 gccatagtat gttacttctg cattagcact ccttgggacc tgcctctcca ctgtccctca 5640 gactttaaag aactatacaa acccaagggg ctcttcccaa gagaattgat atgacttgag 5700 gtgattccat ttctggaagt agtcactcca ttttctgcct cactctttca gtgcttcaca 5760 gagcaggttc gattaagcac acagattaat ggtaccgggg ccactaggga caggattggg 5820 caccagggac tccagagtcc aggcccaacc cctccccatt caacccagga ggccaggccc 5880 cagcccttcc gccctcagat gaaggagtcc aggcccccag cctctcccca ttcagaccca 5940 ggggtccagg cccagccccg cctccctaag acccagaagt ccaggccccc agcccctcct 6000 ccctcagacc cacgagtcca ggccccagcc cctcctccct cggacccagg agtccaggcc 6060 cccagtccct ccaccctcag acccaggagt ccaggcccca gcccctcctc cctcggaccc 6120 aggagtccag gccccagccc ctcctctctc aaacccagga gcccaggccc ccagctcttc 6180 tctgttcagc cctaagaatc ctggctccag cccctcctac tctagccccc aaccccctag 6240 ccactaaggc aattggggtg caggaatggg ggcagggtac cagcctcacc aagtggttga 6300 taaacccacg tggggtaccc taagaacttg ggaacagcca cagcaggggg gcgatgcttg 6360 gggacctgcc tggagaagga tgcaggacga gaaacacagc cccaggtgga gaaactggcc 6420 gggaatcaag agtcacccag agacagtgac caaccatccc tgttttccta ggactgaggg 6480 tttcagtgct aaaactaggc tgtcctgggc aaacagcata agctggtcac cccacaccca 6540 gacctgaccc aaacccagct cccctgcttc ttggccacgt aacctgagaa gggaatccct 6600 cctctctgaa ccccagccca ccccaatgct ccaggcctcc tgggataccc cgaagagtga 6660 gtttgccaag cagtcacccc acagttggag gagaatccac ccaaaaggca gcctggtaga 6720 cagggctggg gtggcctctc gtggggtcca ggccaagtag gtggcctggg gcctctgggg 6780 gatgcagggg aagggggatg caggggaacg gggatgcagg ggaacggggc tcagtctgaa 6840 gagcagagcc aggaacccct gtagggaagg ggcaggagag ccaggggcat gagatggtgg 6900 acgaggaagg gggacaggga agcctgagcg cctctcctgg gcttgccaag gactcaaacc 6960 cagaagccca gagcagggcc ttagggaagc gggaccctgc tctgggcgga ggaatatgtc 7020 ccagatagca ctggggactc tttaaggaaa gaaggatgga gaaagagaaa gggagtagag 7080 gcggccacga cctggtgaac acctaggacg caccattctc acaaagggag ttttccacac 7140 ggacaccccc ctcctcacca cagccctgcc aggacggggc tggctactgg ccttatctca 7200 caggtaaaac tgacgcacgg aggaacaata taaattgggg actagaaagg tgaagagcca 7260 aagttagaac tcaggaccaa cttattctga ttttgttttt ccaaactgct tctcctcttg 7320 ggaagtgtaa ggaagctgca gcaccaggat cagtgaaacg caccagacgg ccgcgtcaga 7380 gcagctcagg ttctgggaga gggtagcgca gggtggccac tgagaaccgg gcaggtcacg 7440 catccccccc ttccctccca ccccctgcca agctctccct cccaggatcc tctctggctc 7500 catcgtaagc aaaccttaga ggttctggca aggagagaga tggctccagg aaatgggggt 7560 gtgtcaccag ataaggaatc tgcctaacag gaggtggggg ttagacccaa tatcaggaga 7620 ctaggaagga ggaggcctaa ggatggggct tttctgtcag gtaccgtcaa ggctgcagtg 7680 agacatgatc ttgccactgc actccagcct ggacagcaga gtgaaacctt gcctcacgaa 7740 acagaataca aaaacaaaca aacaaaaaac tgctccgcaa tgcgcttcct tgatgctcta 7800 ccacataggt ctgggtactt tgtacacatt atctcattgc tgttcataat tgttagatta 7860 attttgtaat attgatatta ttcctagaaa gctgaggcct caagatgata acttttattt 7920 tctggacttg taatagcttt ctcttgtatt caccatgttg taactttctt agagtagtaa 7980 caatataaag ttattgtgag tttttgcaaa cacagcaaac acaacgaccc atatagacat 8040 tgatgtgaaa ttgtctattg tcaatttatg ggaaaacaag tatgtacttt ttctactaag 8100 ccattgaaac aggaataaca gaacaagatt gaaagaatac attttccgaa attacttgag 8160 tattatacaa agacaagcac gtggacctgg gaggagggtt attgtccatg actggtgtgt 8220 ggagacaaat gcaggtttat aatagatggg atggcatcta gcgcaatgac tttgccatca 8280 cttttagaga gctcttgggg accccagtac acaagagggg acgcagggta tatgtagaca 8340 tctcattctt tttcttagtg tgagaataag aatagccatg acctgagttt atagacaatg 8400 agcccttttc tctctcccac tcagcagcta tgagatggct tgccctgcct ctctactagg 8460 ctgactcact ccaaggccca gcaatgggca gggctctgtc agggctttga tagcactatc 8520 tgcagagcca gggccgagaa ggggtggact ccagagactc tccctcccat tcccgagcag 8580 ggtttgctta tttatgcatt taaatgatat atttatttta aaagaaataa caggagactg 8640 cccagccctg gctgtgacat ggaaactatg tagaatattt tgggttccat ttttttttcc 8700 ttctttcagt tagaggaaaa ggggctcagg atccacttgc ccagtgttct tccttagttc 8760 ctaccttcga ccttgatcct cctttatctt cctgaaccct gctgagatga tctatgtggg 8820 gagaatggct tctttgagaa acatcttctt cgttagtggc ctgcccctca ttcccacttt 8880 aatatccaga atcactataa gaagaatata ataagaggaa taactcttat tataggtaag 8940 ggaaaattaa gaggcatacg tgatgggatg agtaagagag gagagggaag gattaatgga 9000 cgataaaatc tactactatt tgttgagacc ttttatagtc taatcaattt tgctattgtt 9060 ttccatcctc acgctaactc cataaaaaaa cactattatt atctttattt tgccatgaca 9120 agactgagct cagaagagtc aagcatttgc ctaaggtcgg acatgtcaga ggcagtgcca 9180 gacctatgtg agactctgca gctactgctc atgggccctg tgctgcactg atgaggagga 9240 tcagatggat ggggcaatga agcaaaggaa tcattctgtg gataaaggag acagccatga 9300 agaagtctat gactgtaaat ttgggagcag gagtctctaa ggacttggat ttcaaggaat 9360 tttgactcag caaacacaag accctcacgg tgactttgcg agctggtgtg ccagatgtgt 9420 ctatcagagg ttccagggag ggtggggtgg ggtcagggct ggccaccagc tatcagggcc 9480 cagatgggtt ataggctggc aggctcagat aggtggttag gtcaggttgg tggtgctggg 9540 tggagtccat gactcccagg agccaggaga gatagaccat gagtagaggg cagacatggg 9600 aaaggtgggg gaggcacagc atagcagcat ttttcattct actactacat gggactgctc 9660 ccctataccc ccagctaggg gcaagtgcct tgactcctat gttttcagga tcatcatcta 9720 taaagtaaga gtaataattg tgtctatctc atagggttat tatgaggatc aaaggagatg 9780 cacactctct ggaccagtgg cctaacagtt caggacagag ctatgggctt cctatgtatg 9840 ggtcagtggt ctcaatgtag caggcaagtt ccagaagata gcatcaacca ctgttagaga 9900 tatactgcca gtctcagagc ctgatgttaa tttagcaatg ggctgggacc ctcctccagt 9960 agaaccttct aaccagctgc tgcagtcaaa gtcgaatgca gctggttaga ctttttttaa 10020 tgaaagcttg catgcagcac tttgggaggc tgaggtgggt ggactgcttg gagctcagga 10080 gttcaagacc atcttggaca acatggtgat accctgcctc tacaaaaagt acaaaaatta 10140 gcctggcatg gtggtgtgca cctgtaatcc cagctattag ggtggctgag gcaggagaat 10200 tgcttgaacc cgggaggcgg aggttgcagt gagctgagat cgtgccactg cactccagcc 10260 tgggggacag agcacattat aattaactgt tattttttac ttggactctt gtggggaata 10320 agatacatgt tttattctta tttatgattc aagcactgaa aatagtgttt agcatccagc 10380 aggtgcttca aaaccatttg ctgaatgatt actatacttt ttacaagctc agctccctct 10440 atcccttcca gcatcctcat ctctgattaa ataagcttca gtttttcctt agttcctgtt 10500 acatttctgt gtgtctccat tagtgacctc ccatagtcca agcatgagca gttctggcca 10560 ggcccctgtc ggggtcagtg ccccaccccc gccttctggt tctgtgtaac cttctaagca 10620 aaccttctgg ctcaagcaca gcaatgctga gtcatgatga gtcatgctga ggcttagggt 10680 gtgtgcccag atgttctcag cctagagtga tgactcctat ctgggtcccc agcaggatgc 10740 ttacagggca gatggcaaaa aaaaggagaa gctgaccacc tgactaaaac tccacctcaa 10800 acggcatcat aaagaaaatg gatgcctgag acagaatgtg acatattcta gaatatatta 10860 tttcctgaat atatatatat atatacacat ataccatatg aaacacctct aggctataag 10920 gcaacagagc tccttttttt tttttctgtg ctttcctggc tgtccaaatc tctaatgata 10980 agcatacttc tattcaatga gaatattctg taagattata gttaagaatt gtgggagcca 11040 ttccgtctct tatagttaaa tttgagcttc ttttatgatc actgtttttt taatatgctt 11100 taagttctgg ggtacatgtg ccatggtggt ttgctgcacc catcaacccg tcatctacat 11160 taggtatttc tcctaatgct atccttcccc tagcccccca cccccaacag gccccagtgt 11220 gtgatgttcc cctccctgtg tccatggatc actggttttt ttttgttttt tttttttttt 11280 taaagtctca gttaaatttt tggaatgtaa tttattttcc tggtatccta aggacttgca 11340 agttatctgg tcactttagc cctcacgttt tgatgataat cacatatttg taaacacaac 11400 acacacacac acacacacac acatatatat atatataaaa catatatata cataaacaca 11460 cataacatat ttatcgggca tttctgagca actaatcatg caggactctc aaacactaac 11520 ctatagcctt ttctatgtat ctacttgtgt agaaaccaag cgtggggact gagaaggcaa 11580 tagcaggagc attctgactc tcactgcctt tagctaggcc cctccctcat cacagctcag 11640 catagtcctg agctcttatc tatatccaca cacagtttct gacgctgccc agctatcacc 11700 atcccaagtc taaagaaaaa aataatgggt ttgcccatct ctgttgatta gaaaacaaaa 11760 caaaataaaa taagccccta agctcccaga aaacatgact aaaccagcaa gaagaagaaa 11820 atacaatagg tatatgagga gactggtgac actaagtgtc tgaatgaggc ttgagtacag 11880 aaaagaggct ctagcagcat agtggtttag aggagatgtt tctttccttc acagatgcct 11940 tagcctcaat aagcttgcgg ttgtggaagt ttacttgttt atcaccggtg acgtccatga 12000 gcaaattaag aaaaacaaca acaaatgaat gcatatatat gtatatgtat gtgtgtatat 12060 atacacatat atatatatat tttttttctt ttcttaccag aaggttttaa tccaaataag 12120 gagaagatat gcttagaact gaggtagagt tttcatccat tctgtcctgt aagtattttg 12180 catattctgg agacgcagga agagatccat ctacatatcc caaagctgaa ttatggtaga 12240 caaaactctt ccacttttag tgcatcaatt tcttatttgt gtaataagaa aattgggaaa 12300 acgatcttca atatgcttac caagctgtga ttccaaatat tacgtaaata cacttgcaaa 12360 ggaggatgtt tttagtagca atttgtactg atggtatggg gccaagagat atatcttaga 12420 gggagggctg agggtttgaa gtccaactcc taagccagtg ccagaagagc caaggacagg 12480 tacggctgtc atcacttaga cctcaccctg tggagccaca ccctagggtt ggccaatcta 12540 ctcccaggag cagggagggc aggagccagg gctgggcata aaagtcaggg cagagccatc 12600 tattgcttac atttgcttct gacacaactg tgttcactag caacctcaaa cagacaccat 12660 gggtcatttc acagaggagg acaaggctac tatcacaagc ctgtggggca aggtgaatgt 12720 ggaagatgct ggaggagaaa ccctgggaag gtaggctctg gtgaccagga caagggaggg 12780 aaggaaggac cctgtgcctg gcaaaagtcc aggtcgcttc tcaggatttg tggcaccttc 12840 tgactgtcaa actgttcttg tcaatctcac aggctcctgg ttgtctaccc atggacccag 12900 aggttctttg acagctttgg caacctgtcc tctgcctctg ccatcatggg caaccccaaa 12960 gtcaaggcac atggcaagaa ggtgctgact tccttgggag atgccataaa gcacctggat 13020 gatctcaagg gcacctttgc ccagctgagt gaactgcact gtgacaagct gcatgtggat 13080 cctgagaact tcaaggtgag tccaggagat gtttcagccc tgttgccttt agtctcgagg 13140 caacttagac aactgagtat tgatctgagc acagcagggt gtgagctgtt tgaagatact 13200 ggggttgggg gtgaagaaac tgcagaggac taactgggct gagacccagt ggtaatgttt 13260 tagggcctaa ggagcgcctc taaaaatcta gatggacaat tttgactttg agaaaagaga 13320 ggtggaaatg aggaaaatga cttttattag attccagtag aaagaacttt catctttccc 13380 tcatttttgt tcgttttaaa acatctatct ggaggcagga caagtatggt cgttaaaaag 13440 atgcaggcag aaggcatata ttggctcagt caaagtgggg aactttggtg gccaaacata 13500 cattgctaag gctattccta tatcagctgg acacatataa aatgctgcta atgcttcatt 13560 acaaacttat atcctttaat tccagatggg ggcaaagtat gtccaggggt gaggaacaat 13620 tgaaacattt gggctggagt agattttgaa agtcagctct gtgtgtgtgt gtgtgtgcgc 13680 gcgcgcgtgt gtgtgtgtgt gtgtcaacgt gtgtttcttt taacgtcttc agcctacaac 13740 atacagggtt catggtggca agaagatagc aagatttaaa ttatggccag tgactagtgc 13800 ttgaagggga acaactacct gcatttaatg ggaaggcaaa atctcaggct ttgagggaag 13860 ttaacatagg cttgattctg ggtagaagct gggtgtgtag ttatctggag gccaggctgg 13920 agctctcagc tcactatggg ttcatcttta ttgtctcctt tcatctcaac agctcctggg 13980 aaatgtgctg gtgaccgttt tggcaatcca tttcggcaaa gaattcaccc ctgaggtgca 14040 ggcttcctgg cagaagatgg tgactgcagt ggccagtgcc ctgtcctcca gataccactg 14100 agcctcttgc ccatgattca gagctttcaa ggataggctt tattctgcaa gcaattcaaa 14160 taataaatct attctgctga gagatcacac atgattttct tcagctcttt tttttacatc 14220 tttttaaata tatgagccac aaagggttta tattgaggga agtgtgtatg tgtatttctg 14280 catgcctgtt tgtgtttgtg gtgtgtgcat gctcctcatt tatttttata tgagatgtgc 14340 attttgttga gcaaataaaa gcagtaaaga cacttgtaca cgggagttct gcaagtggga 14400 gtaaatggtg taggagaaat ccggtgggaa gaaagacctc tataggacag gacttctcag 14460 aaacagatgt tttggaagag atgggaaaag gttcagtgaa gacctggggg ctggattgat 14520 tgcagctgag tagcaaggat ggttcttaat gaagggaaag tgttccaagc tttaggaatt 14580 caaggtttag tcaggtgtag caattctatt ttattaggag gaatactatt tctaatggca 14640 cttagctttt cacagccctt gtggatgcct aagaaagtga aattaatccc atgccctcaa 14700 gtgtgcagat tggtcacagc atttcaaggg agagacctca ttgtaagact ctgggggagg 14760 tggggactta ggtgtaagaa atgaatcagc agaggctcac aagtcagcat gagcatgtta 14820 tgtctgagaa acagaccagc actgtgagat caaaatgtag tgggaagaat ttgtacaaca 14880 ttaattggaa ggcttactta atggaatttt tgtatagttg gatgttagtg catctctata 14940 agtaagagtt taatatgatg gtgttacgga cctaatgttt gtgtctcctc aaaattcaca 15000 tgctgaatcc ccaactccca actgacctta tctgtggggg aggcttttga aaagtaatta 15060 ggtttagatg agctcataag agcagatccc catcataaaa ttattttcct tatcagaagc 15120 agagagacaa gccatttctc tttcctcccg gtgaggacac agtgagaagt ccgccatctg 15180 caatccagga agagaaccct gaccacgagt cagccttcag aaatgtgaga aaaaactctg 15240 ttgttgaagc cacccagtct tttgtatttt gttatagcac cttgcactga gtaaggcaga 15300 tgaagaagga gaaaaaaata agcttatcga aacgcgtccc catcctcact gactccgtcc 15360 tggagttgga tgagagataa tggccttacg ttgtgccagg ggagggtcgg gctggattta 15420 gcaagattta ccttctccaa agagcggtgc tgcagtggca cagctgccca cggaggtggg 15480 ggggtcaccg tccctggagg tgatgaagaa ctgtggggat gtggcactga gggacatggc 15540 cagtgggcac ggtgggtggg ttggggttgg tcttggggat cttggagggc ttttccagcc 15600 ttcatgattt gacgattgta tgaacatcta catggcaatt ctccagctgc ctgtcccagt 15660 cctactgacc cagctgtatc tctccaggca agctcttcca ccccttctgc ttgcatccag 15720 acaccatcaa acatgcaggc tcagacacag ggaccagcag tgtctgtggc ctttttgtgc 15780 tcctctccat gctgggtttt aacttgctct ttgtccttct atcctatctt cttatcctta 15840 aggctgttct gaacgctgtg acttggagag tgtcccagag ccctcaacac ctgcatgtcc 15900 cacgtccatg ctgtcctgca cttccttatc cccaagatct gcctctccgt gatgcactga 15960 attggcaaac atgtgtcacc ccagaccaac aatgtcacag caaactcccc cttgatagga 16020 caagggggaa tggctttaca ctgagacagg ggaggtttgg gttggatatg aggaggcagt 16080 ttttccccca gagggtggtg acgcactgaa caggttgccc aaggaggctg tggatgcccc 16140 atccctgcag gcattcaagg ccaggctgga tgtggctctg ggcagcctgg gctgctggtt 16200 gatgaccctg cacatagcag ggggttggat ctggatgagc actgtgctcc tttgcaaccc 16260 aggccgttct atgattctgt cattctaaat ctctctttca gcctaaagct ttttccccgt 16320 atccccccag gtgtctgcag gctcaaagag cagcgagaag cgttcagagg aaagcgatcc 16380 cgtgccacct tccccgtgcc cgggctgtcc ccgcacgctg ccggctcggg gatgcggggg 16440 gagcgccgga ccggagcgga gccccgggcg gctcgctgct gccccctagc gggggaggga 16500 cgtaattaca tccctggggg ctttgggggg gggctgtccc tatcgattac tagttttacc 16560 acatttgtag aggttttact tgctttaaaa aacctcccac acctccccct gaacctgaaa 16620 cataaaatga atgcaattgt tgttgttaac ttgtttattg cagcttataa tggttacaaa 16680 taaagcaata gcatcacaaa tttcacaaat aaagcatttt tttcactgca ttctagttgt 16740 ggtttgtcca aactcatcaa tgtatcttat catgtctgct cgaagagcgg ccgcttcagt 16800 ttcggccagc aggcggggag cccgaggtag ctcccgctcc cttgagccag gcccctgcca 16860 gacctgagct ccctcccaag cctggcttcc ccaaccggtg gccttcatgg gccagaagcc 16920 attccttcac ggctagccct ccggagtagt tgcccacggc tccgctgctg cagaccactc 16980 tgtggcacgg gatgaggatc ttgacaggat tgcctctcat ggcgcctccc actgctcgcg 17040 cggctttggg gttgccggcc agggcggcca attgctggta agaaatcact tctccgaatt 17100 tcacaacctt aagcagcttc cataacacct gacgcgtgaa cgactcttgc tggaaaacgg 17160 gatggtgaag cgctggcacg gggaactctt cgatagcctc gggctggtgg aaataggcat 17220 tcagccaggc tgtgcactgc atcaggggct ccggacctcc gagaaccgca gcgggggctg 17280 ggacctccac ggcatcagct gcagacgtcc ccttgcccag gagctttatt tcgtgcagac 17340 cctgctcaca accagacagc tccagcttcc ccaaagggct gtccagtgtg gtgcgtttca 17400 tttcacaatc cttgtccatg gtggcgaccg tctagctcac gacacctgaa atggaagaaa 17460 aaaactttga accactgtct gaggcttgag aatgaaccaa gatccaaact caaaaagggc 17520 aaattccaag gagaattaca tcaagtgcca agctggccta acttcagtct ccacccactc 17580 agtgtgggga aactccatcg cataaaaccc ctccccccaa cctaaagacg acgtactcca 17640 aaagctcgag aactaatcga ggtgcctgga cggcgcccgg tactccgtgg agtcacatga 17700 agcgacggct gaggacggaa aggccctttt cctttgtgtg ggtgactcac ccgcccgctc 17760 tcccgagcgc cgcgtcctcc attttgagct ccctgcagca gggccgggaa gcggccatct 17820 ttccgctcac gcaactggtg ccgaccgggc cagccttgcc gcccagggcg gggcgataca 17880 cggcggcgcg aggccaggca ccagagcagg ccggcgagct tgagactacc cccgtccgat 17940 tctcggtggc cgcgctcgca ggccccgcct cgccgaacat gtgcgctggg acgcacgggc 18000 cccgtcgccg cccgcggccc caaaaaccga aataccagtg tgcagatctt ggcccgcatt 18060 tacaagacta tcttgccaga aaaaaagcgt cgcagcaggt catcaaaaat tttaaatggc 18120 tagagactta tcgaaagcag cgagacaggc gcgaaggtgc caccagattc gcacgcggcg 18180 gccccagcgc ccaggccagg cctcaactca agcacgaggc gaaggggctc cttaagcgca 18240 aggcctcgaa ctctcccacc cacttccaac ccgaagctcg ggatcaagaa tcacgtactg 18300 cagccagggg cgtggaagta attcaaggca cgcaagggcc ataacccgta aagaggccag 18360 gcccgcggga accacacacg gcacttacct gtgttctggc ggcaaacccg ttgcgaaaaa 18420 gaacgttcac ggcgactact gcacttatat acggttctcc cccaccctcg ggaaaaaggc 18480 ggagccagta cacgacatca ctttcccagt ttaccccgcg ccaccttctc taggcaccgg 18540 ttcaattgcc gacccctccc cccaacttct cggggactgt gggcgatgtg cgctctgccc 18600 actgacgggc accggagcct cacgcatgct cttctccacc tcagtgatga cgagagcggg 18660 cgggtgaggg ggcgggaacg cagcgatctc tgggttctac gttagtggga gtttaacgac 18720 ggtccctggg attccccaag gcaggggcga gtccttttgt atgaattact caaatcgata 18780 actagtgata tcctagtggc cccactgtgg ggtggagggg acagataaaa gtacccagaa 18840 ccagagccac attaaccggc cctgggaata taaggtggtc ccagctcggg gacacaggat 18900 ccctggaggc agcaaacatg ctgtcctgaa gtggacatag gggcccgggt tggaggaaga 18960 agactagctg agctctcgga cccctggaag atgccatgac agggggctgg aagagctagc 19020 acagactaga gaggtaaggg gggtagggga gctgcccaaa tgaaaggagt gagaggtgac 19080 ccgaatccac aggagaacgg ggtgtccagg caaagaaagc aagaggatgg agaggtggct 19140 aaagccaggg agacggggta ctttggggtt gtccagaaaa acggtgatga tgcaggccta 19200 caagaagggg aggcgggacg caagggagac atccgtcgga gaaggccatc ctaagaaacg 19260 agagatggca caggccccag aaggagaagg aaaagggaac ccagcgagtg aagacggcat 19320 ggggttgggt gagggaggag agatgcccgg agaggaccca gacacgggga ggatccgctc 19380 agaggacatc acgtggtgca gcgccgagaa ggaagtgctc cggaaagagc atccttgggc 19440 agcaacacag cagagagcaa ggggaagagg gagtggagga agacggaacc tgaaggaggc 19500 ggcagggaag gatctgggcc agccgtagag gtgacccagg ccacaagctg cagacagaaa 19560 gcggcacagg cccaggggag agaatgcagg tcagagaaag caggacctgc ctgggaaggg 19620 gaaacagtgg gccagaggcg gcgcagaagc cagtagagct caaagtggtc cggactcagg 19680 agagagacgg cagcgttaga gggcagagtt ccggcggcac agcaagggca ctcgggggcg 19740 agaggagggc agcgcaaagt gacaatggcc agggccaggc agatagacca gactgagcta 19800 tgggagctgg ctcaggttca ggagagggca gggcagggaa ggagacaaag tccaggaccg 19860 gctggagggg ctcaacatcg gaagagggga agtcgaggga gggatggtaa ggaggactgc 19920 atgggtcagc acaggctgcc aaagccaggg ccagttaaag cgactccaat gcggaagaga 19980 gtaggtcgaa ggggaatggt aaggaggcct ggggcagagt ggtcagcaca gagtggctaa 20040 gcccagggcc agttgaagcg gctccaattc ggaagtgggg tggtcgaagg ggaatggtaa 20100 gggggactgg gacggggtgt cagcataggg tggcaaagcc cagggccagg aacgacgggg 20160 cggatcgaga ctggcaacgg ggaaggagga tgccccaggt ggcgcagcag agggtggacc 20220 tggccccggg agacgccggg cggggggcgc tgacctggtg cagggcgctg ataccgtcgg 20280 cgttggtgga gtccagcacg gcgcgggcgg gcggcggcgc ggcggggtcg agctcggcgc 20340 cggggccagg gtcggcggcg cgcagcatca gacgcgcctc gtccaggtcg ccgcccgcac 20400 aggccgccag gaactcggcg gcgcgctcga agcggacggt gcgggcgcgg cgctctccgg 20460 ggccaggctc ggcgcccgcc cgcgcccccc actgccgcag ctgctcccgt cgccgctccc 20520 gggcagccgc cgccgccgcc cccgggccag ccgccgggcc atcctctccg gacatcgcac 20580 cgcccgcccg cccagcgagc gagcgagcgc cgagccccaa ccgccgccac caccccaatc 20640 ctgtccctag tggccccgat atcattaagt ggcaggatta atcttcgaac gaaggagcca 20700 tccaactaac cgtcatgttc gggcaaccga agaagggagt ggcaggattt cctttggaga 20760 cttctggaat tagacagcag tttaatgcaa gcatctaaat tctcttcctc ccagagtctc 20820 attaaaacta cagtaagagt ttgtgttttg ttttgttttt aaagacaaaa tcccaccagg 20880 atagagagaa taggagagga gataacagca tcataattta tgaaactaaa atgcagatag 20940 accaggatta actgactaca cagcaccaag gaagctgaat cacaagacag cagaggagaa 21000 aactggaaag gatcgtggtc tatacggcag aatcttccca agcctcagga ggaggagctc 21060 tagatgttcc cagatctggg aggtaaagtg gaatgggggg acatggtcag cgtaatgggg 21120 ttgggctgga agctggttaa ggagcaggca gatctctgaa tcccctctct gactctgtgt 21180 ccccaggcat ctgcctgtcc cccaccctgg aagaggtctg gcttgaccct ttgtctggtg 21240 aatttcctgc tctgctttcc tggtcctgct ggccagatca gtggaggcca ctcacttcac 21300 cccacaggga tgttctgtgt tgccctacac ctgggaactg gaggtactgg aggcaggctg 21360 tggtgagctt gaaagcaaaa cacagagggc agtccaatct ctttggccat atttcttctg 21420 catatccaat accatgtcca caactctgct agtgtcctga tggtggtggg ctctacacat 21480 tcccgggaag ctgaaggcag ataatgacca ggacaggtca acctctcttc ttctgaaagc 21540 cttcatctac taatggcctg ggactcttcc cttaaatgct tagattgtgt cttccactaa 21600 ggttttttgc tgttgctgtt gtttgtttgt ttgtttgttt gtttgtttgt tttgagacgg 21660 aatctcactc tgtcgcccag gctggagtgt agtggcacaa tctcagctca ccacaacctt 21720 cacctcctag gttgaaggga ttctcctgcc tcagcctcct gagtagctag gattacaggc 21780 acatgccacc atgcctggct aatttttgta tttttagtag agacaggatt tcgccatgtt 21840 ggccaggctg gtcttgaact cctgacctca ggtgatctgc ctaccttggt ctcccaaagt 21900 gctgggatta ctggtgtgag ccaccacacc cggccaaggt ttttgtttgt ttgtttgttt 21960 gtttgttttg tattgaggca gggtatcact ctggtcaccc aggctggagt gcagtagtgc 22020 aatcacggct cactgaaacc tccacctccc tggcgggctc aggtgatcct gccacctcag 22080 cttcccaggt agctgggact acaggcttgt accaccactc ccagctaatt tttgcgtttt 22140 tagtagagac agggtttccc catgttgccc aggttggtct caaactctgg gctcaagcga 22200 tctgcctgcc tcagcctccc aaagtgctgg gattacaggt gtaagccacc gtacccggcc 22260 ccgccactaa ggttttgaaa atgaagcaat tacaagttta agtctattaa taagtgatga 22320 agctatgtag aaaagcagaa taattatctt ggatcaggaa ggtcacatga ggatctactt 22380 gggggttgtc aatattctat ttcttgacct gatcagtgtt gacagcaggt tttaattttt 22440 tacttctttt tgtttgtttg tttttgagac ggagtcttgc tctgtctccc aggctggagt 22500 gcagtggtat gatctcggct cactgcaacc tccgcctcct gggttcaagc tgttctcctg 22560 cctcagcctc cccagtagct gggattacag gcaggcacca ccacgaccag ctaatttttg 22620 tatttttagt agagactggg tttcaccatc ttggccaggc tggtctcgaa cttctgatct 22680 cgtgatccgc cctccttggc ctcccaaagt gctgggatta caggcttgag ccagcgtgcc 22740 cggcccattt tttacttcct tattaaactg tacatatagg ccttgcacac ttttctgcat 22800 caatgttata ttccacaata aagggaaaag gtatatacac aacttgatac cagtaatgtg 22860 aaacatatat ttctacatag aaaaaaaaat gactgaaata ctgcactcca atgtgttcac 22920 acagtagttg tttctggatt atttatatat taaatgttta tatattgtat tatgccatga 22980 ggtttgtgtt ttctctccac ttttctgcat tttccaagtt tactacaaag agcacatatt 23040 actcttataa tcagaaagtc ataaaatata tttaaaaaga caaaattgaa actaataagg 23100 atcaacacaa aacagatgag ccatctgtgg aaatccgcac agaatactac ctaaagagat 23160 tggtgacgtg catgatctca ctaggatgag cacaaagctt gccagagcct agggtctatt 23220 tctagggttg gctcttggaa gccaggatag ttgttatctc tgggaagagg gaggggcaca 23280 caaggggctt ctaaaacatt ctgaatgttc tatttctgaa cctggttggt gggtacatga 23340 ctgttggttt tattattata tgttttatat actcttccgt atgtatggtg tggattccaa 23400 aaaaagattt cctttagaga aaaccagaat cacataagta gaaaatatgg tgctatgttg 23460 aaggaacaac tcaagtttat ataaaatcat catcatttat aggcttaaaa agttgctttg 23520 gaattttggt ctaactgact tgtcttttct gcagcaaacc acgctccttc tggacgtgct 23580 ccaggcagag gggattaggg tgggttcaag gctgcaagta cctagctcag cacactctct 23640 tcaggggact tagagtttgt ctggtgttgg ctctctgagc tcttgtcagg aatgccgacc 23700 cttccgaggt tcaggatttg aagcctgcct tcccacccca gatttggtcc acacagacac 23760 tcaagtatgt atttcaacta caaatgacct gtactttcct attactcctc tctttcatgg 23820 taacctttct ggtatccttc cttccctaca tttatgggag ggggacatca ttctctgctc 23880 tcctgtcact gaaggctcca ccttctgtct tcttctgacc catctggttt tcctggggcc 23940 acctcctctc cttaccaccc taacgctttt gtaacttgag gagaaatgag agatcaccta 24000 gtcaggtcat cattctctgt agatgaagag gcccaatggt ttgctcaaga attgccaagc 24060 gagttaaaga cagagagtat gagagtcagc aagacctaca gaaagcatct atctgcactg 24120 ttttgcaggg acttagcctt tgtgtgtgga ctcctggaat gccacccact aagaaacatt 24180 gtctgacacc aactccccac ttggtaggtg gggacactga aactcatggc aggaaagggc 24240 cttgccccaa gccagggcag agtgtcactc atcactctca attttcagtc cagggcacct 24300 tgttgtgact atcccaaagg cagccacttt ccctggtctg aaagacctga agagagaaga 24360 gaagagaagg atggaaggca gagtatgcgg ctttgattca tttcctggtg aaaacagatc 24420 tatacgagaa gcaaatttca cgaaagggaa gagaagaaag tgtcccatac gttgctggcc 24480 tgtttcaacc ttgctttgat tcttgctgaa aagggtaccg tgtatttctg agttcaacat 24540 gcagaccagt gttaggaaag ccactgcacc tccactttag cctccagggc tgtgccctgc 24600 aaatggcctg cagccttggt gcctcgctct ccagactgca ttttggaaga tgggacagag 24660 gcttatggaa gcccacatta gaacggggga gcagaatggg tgagatgagg gatccttgat 24720 agtgaaccag atgaaggaat ggtagccaaa tgccaggcct cctttgtggc ttcaatccaa 24780 aggctctgga gcccttccag ggcagaacat caggcatgtt tacccccact gtcctcaaca 24840 gtgacagagg tgcaatcttg ggcagctggc cattttgaaa gcaacctcct taatctcaac 24900 tgggaaggct ccctagcagg acccctgtgt tgcacacctg gaggaagcta gactaaccag 24960 aagctcagca cggttccatc tgggatgccc aggtctgaga cgaaaaaggt aactctcttt 25020 tctgggtcct ggcccagttg tgtctctctc cacctcattc tctgagatgc ctgtctcccc 25080 ttttttgtcc catcaggagg caagagctat cactgggcca gactccacca gaagccaagc 25140 cagcttgtta cccagcttct cagggagcaa agaacagcct tgtttctatc ttatccccac 25200 tgtcccctgc ccctgcccca cctcccagcc attcagcttc tggcttcccc agagctgcct 25260 gcttctttgt ggtcctccat tccttgaaaa gaccttctag tcattagtgt atataaatgg 25320 ccacttagcc cagattacag tgaggtcaac agctggggct ctgagaattg tcacacactg 25380 gcacaggaga ggaggctatt cttccagaga atttggaggg cactcccatc cacttacaac 25440 aaaaagccca tccactgtgc ttggcagtag gtgatctgag aaccaatgga accaggttaa 25500 tcctgtggca ctgttgagtg aggagagcag tggcgggcac tggaaaatat cagagacaag 25560 gcaggagacc tgaaatctag gcttagctcc tcatatactt ggcagctgta tgacctcaga 25620 caaccagtgt tacctctcta agcctcagtt tcctcatgca aaaggagggg gaataacaac 25680 agagcccact gcttgggggt gttgtgagga caggatgaaa aaacaaacag aaatccctca 25740 gtacaggatt cagtgcagtg gacagtcttg caaggtctgg ttcagccctc cacccctacc 25800 ctcaccagta taaagaactc tggcctacaa gtcagatgac ctgagtttta atctcagctt 25860 tgccattagc cgtgtgaact tgagaaagtc cctttccttt ttacatctat tgggatgatc 25920 atgcattttt tgtcctttat tctgttaata tagtgtgtta cattgattgc ttttcataga 25980 ctgaaccagc cttgtattcc agggataaat ctcacttggt catggtgtat aatcctttat 26040 acaaatgttg ctgggttgag tttgctagta ttttgttgaa gatttttatg tcttgattca 26100 taaggaatat tggtgtacct tcccctttta tggccacagt ttccctacaa tgatgtagtc 26160 gaactagaca acctccaata tctttcagta ttcatgtcct ctgattctgt gaaactaaga 26220 aaattaagaa atagtgattc ataggcacaa ggcaggcaaa acttagactc cttgtagaat 26280 aattaggaag ccaaatattc agtgtgctta tttctcaaat aaccttagtt tctccagtct 26340 gccccaactc cgaggcctga atatctctag atgcttatga tggcaactaa agcctaaaag 26400 ctaattcatt ttaaagttct tccaaatgca tagggtttta tttttccaga cctgggttca 26460 gatggggaat ttgacaaaca atggaaaggg ggaaaaacaa caatctaaac actgagtgac 26520 aaagtaacaa agaaatagtc tagctatcag ccagtcaagc cagccttggc tttgctatcc 26580 aaagtagtca gtctaattct accaccagtt tctgttcctg tagctgtcta ctgcctgcca 26640 gggactctgc cttcccaccc acaactacca atggaaggat gtggtgacca taccagtggc 26700 tgctgacatc tcctgccatg ggaagcataa ttgcctccag cagcctcccc cttagatcca 26760 tcatttttgt tgcacttggc ctgggctgta ctcccggcca atgactgaac atggtgagca 26820 tagtaatgca ggcccatttc tgtgaggagc aggactcctc cagtaggtga ctttggctca 26880 aggactctct attggcctgg ttgaactttt cctgaactgt gctactgtct gagactcttc 26940 ttacccaatc ctctttctcg ccccaattgt cacagaccac ctgcattgtg gtctgagtct 27000 ctccccacct tctcttgctc ttccctgttt atctttcaca ggcatttccc ccagtacatt 27060 ccttgaatgt ctaacccgat acgggtgcct gacttttggc agacctaagc agacaaaaag 27120 gagtacttgg ttacctagct cttctttcta ccacaaacat cgagggaacc ctttttccct 27180 cacccctctg ccacaccccc actgccccag tgaacaacca cagagagagc tgtggtataa 27240 tattaggctg gtgcaaaagt aattgcggtt tttgccatta cttttaatgg taaaaaccgc 27300 aattactttt gcacctacct agtatttgtg tccccccaaa ttcatatgtt gaaacctaac 27360 ccacaatatg atgtcattag gaggcaagac cttgaggagg tgattagatg atggggtgga 27420 gctctcctga atgagattag tgcccttata agaagaagcc caaggaagct accttgactc 27480 ttccatcaca tgagaatgca gcaagaaggc accatctact aatcaggaag agagctctca 27540 ccagacactg aatctgccag tgtcttgatc ttgaagttcc cagcctccag aactatgcat 27600 aatgcatttc cattgtctct aagccaccca gcctatggta ttttgtcata gcagcctgaa 27660 ctgactaaga cagtgagcca catgagaagt gccccaaccc ctcccttaag cacttggctc 27720 acagatcagt gggttcattt ctgcctgagt tttattgtta ttctgtagat ttcttgggct 27780 agatatattt ttctgttatt ttccttcttc acctcagtca tgaattggtt gttttaaaaa 27840 agacaatgta agtcatgggg aaactcctga caactctact ctcctagggt tcctgataaa 27900 aggggattca gttgagtcct ctgatggtct ctacctgcca aagtccagca gcccttagca 27960 aacatgctgc tcgtttctgt agagaaggtg ctggtgtccc accatacttc tctctccctc 28020 atgaagggct tgcgacccag caaatgggtg gcttatatgg gtctgtttca aaggaagagc 28080 cagctctggg aagaaaaacg atgagcataa gcataaccta ccactgtgcc tgggaaagca 28140 gacaactttt ttgatgtgtg aatatctaat gagaatggaa tccatcaatt accttaaact 28200 taggcacagt cttcaaattc aatatatgtg ggatatactt ttagtcagtt tgtagacgtt 28260 atttgtaata aataatctgg cttctctaaa gaaattattt taagtgtttg gtttggtttg 28320 atttaatggt aaaattatat ttagtggcag agaattatag caatggtgat aaactataga 28380 gtgtcataag ttcatatctt attctcacat ttgaagctgc ctgcagatgc attcaagatg 28440 cagccagaag tcaggagact caggctgtta tttggagctc atcattttac agccttgctg 28500 gactcccact ttctcagggg aaaaatgtgg tgttgaccca gattagctct ccaggccctg 28560 ctgagttggg cactctgtaa gctggagggt cttctattgt cttcacctaa gtgtcaatca 28620 acaacccaaa tgggcatggg ggaagaggga gctgggccaa tgcccagggt gcctggtaga 28680 gagatacctt gggcactgga aggcaccagc ttcccagaga gaagggggag ggccatgaaa 28740 aagttggctg tagatgccag ggacactggg actctccagc tgtgtgtttg tgtcttctga 28800 agacttatgt ttcattcctt tggagcatgc ataatcatac actgtgggat gtgttatata 28860 gattgcttga tagttcacca ctgtaataaa atactgtgac tggaatctgc tcccagtctg 28920 cctttgatag cacttgtgca acacacattt actgagcatt tacagtgatc caggacctgt 28980 gttgtgaaaa cattgatgga caaggcagat ggtggagcac gtcagtgagg atttttaaca 29040 aaggctggta agtgctataa aggaacattg taggacacta gagaacaaag aacaggagaa 29100 cctgacttag gctggggtgg ggcgttggtt agaggaggct ccttggagga catgaggttt 29160 aagctgtgac ctgaggatga atagatgttg gccaggtgag gttaatctgg ggctcaagat 29220 cgagcattaa gcttgtcagc cttaccagta aaaaagaaaa cctattaaaa aaacaccact 29280 cgacacggca ccagctcaat cagtcacagt gtaaaaaagg gccaagtgca gagcgagtat 29340 atataggact aaaaaatgac gtaacggtta aagtccacaa aaaacaccca gaaaaccgca 29400 cgcgaaccta cgcccagaaa cgaaagccaa aaaacccaca acttcctcaa atcgtcactt 29460 ccgttttccc acgttacgta acttcccatt ttaagaaaac tacaattccc aacacataca 29520 agttactccg ccctaaaacc tacgtcaccc gccccgttcc cacgccccgc gccacgtcac 29580 aaactccacc ccctcattat catattggct tcaatccaaa ataaggtata ttattgatga 29640 tgtttaaact acggcccggt acccagcttt tgttcccttt agtgagggtt aattgcgcgc 29700 ttggcgtaat catggtcata gctgtttcct gtgtgaaatt gttatccgct cacaattcca 29760 cacaacatac gagccggaag cataaagtgt aaagcctggg gtgcctaatg agtgagctaa 29820 ctcacattaa ttgcgttgcg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 29880 ctgcattaat gaatcggcca acgcgcgggg agaggcggtt tgcgtattgg gcgctcttcc 29940 gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 30000 cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 30060 tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 30120 cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 30180 aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 30240 cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 30300 gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 30360 ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 30420 cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 30480 aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 30540 tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 30600 ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 30660 tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 30720 ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 30780 agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 30840 atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 30900 cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 30960 ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 31020 ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 31080 agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 31140 agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc 31200 gtggtgtcac gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg 31260 cgagttacat gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc 31320 gttgtcagaa gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat 31380 tctcttactg tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag 31440 tcattctgag aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat 31500 aataccgcgc cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg 31560 cgaaaactct caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca 31620 cccaactgat cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga 31680 aggcaaaatg ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc 31740 ttcctttttc aatattattg aagcatttat cagggttatt gtctcatgag cggatacata 31800 tttgaatgta tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg 31860 ccacctgacg cgccctgtag cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc 31920 gtgaccgcta cacttgccag cgccctagcg cccgctcctt tcgctttctt cccttccttt 31980 ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc gggggctccc tttagggttc 32040 cgatttagtg ctttacggca cctcgacccc aaaaaacttg attagggtga tggttcacgt 32100 agtgggccat cgccctgata gacggttttt cgccctttga cgttggagtc cacgttcttt 32160 aatagtggac tcttgttcca aactggaaca acactcaacc ctatctcggt ctattctttt 32220 gatttataag ggattttgcc gatttcggcc tattggttaa aaaatgagct gatttaacaa 32280 aaatttaacg cgaattttaa caaaatatta acgcttacaa tttccattcg ccattcaggc 32340 tgcgcaactg ttgggaaggg cgatcggtgc gggcctcttc gctattacgc cagctggcga 32400 aagggggatg tgctgcaagg cgattaagtt gggtaacgcc agggttttcc cagtcacgac 32460 gttgtaaaac gacggccagt gagcgcgcgt aatacgactc actatagggc gaattggagc 32520 tccactacgt agtttaaa 32538 <210> 60 <211> 32699 <212> DNA <213> Artificial Sequence <220> <223> pHCA-Dual2-FI-globin-mgmtGFP <400> 60 ggccgaagga ttacatgagc ttagaaatgt aattagcata gtgtgtggca tagtgtagat 60 accaaataaa tatgatctct ccttctactc ttgaaaatgc aaacacattc ttggtggtcc 120 taaaatagcc tgtaacatgg tttactcagc agcatttgct attcaaggca gatctgcctt 180 tagtcattgg ctgcgctcct gaacagctgt gtgaaaggct aacttttgta aaccaaatca 240 aaataaaatg cagcaaaaat ttgtcactga aaggaaatcc tcagtatatc cttttatgaa 300 atgaaagatc cctcatccaa acttaacttt tttaaaagtg cgcatttgga gatatagccc 360 tttcttatga atcctaattc aattttggcc ataaacacac gttgatgttc cccaccccaa 420 agcacatagc aacaagagta ggttctatat tgaaaataat gacaatttaa aaacatgtac 480 ttatttcact gtatgtggac agtgtctatg attgcatcat gaagtgtcat ataaccatgt 540 acgtgtacat gagagagaga tagagagaga agtggtaggg tggtggtggt agaggggatg 600 gcgatagtaa tcatggtaat ggtagaggtg atggaggtgg taatgacgga ggtaagggtg 660 gtagtgatga tggtggtggt ggtaatggtg gtggatgtgg tggtggcaat tgggatggtg 720 ggatggtggt agccatggtg atggtggtaa tggtgttgat ttaaagggtg gtggtagtga 780 aggtgagggt agtggtggtg gaggtggtgg tgctggtagc aatagtgatg gtggtgatgg 840 tgttgatgag ggtgttggga tcagggtgag ttcccacagt atatttcatt cttgttgtac 900 cactctgtca acagcaccac tgactgggac agaggaagaa ggcacactct gaatgtgtta 960 ttaacagaaa cctcaaaaca gtctgtctcc ttgtagtcat tcaaaattat ctttttctta 1020 cctggaaaac tgaaactgaa ttaccgggaa aaacacagga gatttttgtt tgttaatatg 1080 ctgccaataa agtaatttta tgtcaaattt aactacagga aagggcaagg cattttctaa 1140 gttccttaga tgtcatgtgg ctaaaaaaaa caaaaggatg gacagcagtt agatactgta 1200 cacttagctg tttgaagcca tatattcaga aagcagatgt tgggagttgg tgtttgagga 1260 ctgatttcct ggaggtattt tatataggcc aagttcattg ttctaaactc taagggcttg 1320 acttgaggga ggaaaagagg caagaacatg tttagttttg ctgacagcat cacatgggca 1380 gccctaaggc tagacaactt tagggcctga agcttattct aggaaagaag cacctacaga 1440 gtggcactgg gctcccctcc actatagaga tgaagtcata tgacagtaaa gggcaggcag 1500 ggctgcctag ggggcccaga actgacactt ccattagaat gagcacaggc cagggagaga 1560 agtggggaac cagagagaag gagctggaat tcctttctct ccatacataa atgcctgcag 1620 agtcccattt cagaatccgg cagacaaagc caccaatgtg atccccatga ccttataaac 1680 attcattaaa atgcatttca aggcatgtga tggcctcccc accccctaga taatgagaaa 1740 acaaaggttt ctcttctgat agagacaagt tcagctctga agtcaacatt atttctggtt 1800 ctgtctgaac aatgacatat ggcaactctt ccctttctat agttctagtc cagaatgaca 1860 aaaaagggga aaaatttctt agagaaggta gagattatac gaatacagtc catgaaatga 1920 gcataaggag aataaagaat ataacttatc caaagaagtc tggcaggctg ttataaatgc 1980 ttgattttgg acactgtagt tggaggttta acatggacac caataaaaag gtcagcaaag 2040 ggtatgcact gttcctattg ggcaagaaga taggaggtca aaggtaacca ggaaagataa 2100 actcagggag acttattttc cctccagagg gcactgggct tgtaggccct gggcaaaatt 2160 gtcaaaaagg tgaaaatcgc ctgtggttta tttagtctgc tctttcttca ctagtgcctc 2220 accagttcag ttcaggccaa tttgctagct accacatttg tagaggtttt acttgcttta 2280 aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt 2340 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 2400 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 2460 tatcatgtct gaagctttct aggtattgaa taagaaaaat gaagttaagg tggttgatgg 2520 taacactatg ctaataactg cagagccaga agcaccataa gggacatgat aagggagcca 2580 gcagacctct gatctcttcc tgaatgctaa tcttaaacat cctgaggaag aatgggactt 2640 ccatttgggg tgggcctatg atagggtaat aagacagtag tgaatatcaa gctacaaaaa 2700 gccccctttc aaattcttct cagtcctaac ttttcatact aagcccagtc cttccaaagc 2760 agactgtgaa agagtgatag ttccgggaga ctagcactgc agattccggg tcactgtgag 2820 tgggggaggc agggaagaag ggctcacagg acagtcaaac catgccccct gtttttcctt 2880 cttcaagtag acctctataa gacaacagag acaactaagg ctgagtggcc aggcgaggag 2940 aaaccatctc gccgtaaaac atggaaggaa cacttcaggg gaaaggtggt atctctaagc 3000 aagagaactg agtggagtca aggctgagag atgcaggata agcaaatggg tagtgaaaag 3060 acattcatga ggacagctaa aacaataagt aatgtaaaat acagcatagc aaaactttaa 3120 cctccaaatc aagcctctac ttgaatcctt ttctgaggga tgaataaggc ataggcatca 3180 ggggctgttg ccaatgtgca ttagctgttt gcagcctcac cttctttcat ggagtttaag 3240 atatagtgta ttttcccaag gtttgaacta gctcttcatt tctttatgtt ttaaatgcac 3300 tgacctccca cattcccttt ttagtaaaat attcagaaat aatttaaata catcattgca 3360 atgaaaataa atgtttttta ttaggcagaa tccagatgct caaggccctt cataatatcc 3420 cccagtttag tagttggact tagggaacaa aggaaccttt aatagaaatt ggacagcaag 3480 aaagcgagct tagtgatact tgtgggccag ggcattagcc acaccagcca ccactttctg 3540 ataggcagcc tgcactggtg gggtggcggc cgccctagga ttatggcact ggtagaattc 3600 actacttatg gcactggtag aattcactac ttatggcact ggtagaattc actacttatg 3660 gcactggtag aattcactat cgttgtgctt gatctaacca tgtttcattg tgcttgatct 3720 aaccatgttt cattgtgctt gatctaacca tgtttcattg tgcttgatct aaccatgtat 3780 cgcccggggg cggccgcaca caaaaaacca acacacagat ctaatgaaaa taaagatctt 3840 ttattgaatt cttagctggc ctccaccttt ctcttcttct tggggctgtc gcctcccagc 3900 tgagacaggt cgatccgtgt ctcgtacagg ccggtgatgc tctggtggat cagggtggcg 3960 tccagcacct ctttggtgct ggtgtacctc ttccggtcga tggtggtgtc aaagtacttg 4020 aaggcggcag gggctcccag attggtcagg gtaaacaggt ggatgatatt ctcggcctgc 4080 tctctgatgg gcttatcccg gtgcttgttg taggcggaca gcactttgtc cagattagcg 4140 tcggccagga tcactctctt ggagaactcg ctgatctgct cgatgatctc gtccaggtag 4200 tgcttgtgct gttccacaaa cagctgtttc tgctcattat cctcggggga gcccttcagc 4260 ttctcatagt ggctggccag gtacaggaag ttcacatatt tggagggcag ggccagttcg 4320 tttcccttct gcagttcgcc ggcagaggcc agcattctct tccggccgtt ttccagctcg 4380 aacagggagt acttaggcag cttgatgatc aggtcctttt tcacttcttt gtagcccttg 4440 gcttccagaa agtcgatggg attcttctcg aagctgcttc tttccatgat ggtgatcccc 4500 agcagctctt tcacactctt cagtttcttg gacttgccct tttccacttt ggccaccacc 4560 agcacagaat aggccacggt ggggctgtcg aagccgccgt acttcttagg gtcccagtcc 4620 ttctttctgg cgatcagctt atcgctgttc ctcttgggca ggatagactc tttgctgaag 4680 ccgcctgtct gcacctcggt ctttttcacg atattcactt ggggcatgct cagcactttc 4740 cgcacggtgg caaaatcccg gcccttatcc cacacgatct ccccggtttc gccgtttgtc 4800 tcgatcagag gccgcttccg gatctcgccg ttggccaggg taatctcggt cttgaaaaag 4860 ttcatgatgt tgctgtagaa gaagtacttg gcggtagcct tgccgatttc ctgctcgctc 4920 ttggcgatca tcttccgcac gtcgtacacc ttgtagtcgc cgtacacgaa ctcgctttcc 4980 agcttagggt actttttgat cagggcggtt cccacgacgg cgttcaggta ggcgtcgtgg 5040 gcgtggtggt agttgttgat ctcgcgcact ttgtaaaact ggaaatcctt ccggaaatcg 5100 gacaccagct tggacttcag ggtgatcact ttcacttccc ggatcagctt gtcattctcg 5160 tcgtacttag tgttcatccg ggagtccagg atctgtgcca cgtgctttgt gatctgccgg 5220 gtttccacca gctgtctctt gatgaagccg gccttatcca gttcgctcag gccgcctctc 5280 tcggccttgg tcagattgtc gaactttctc tgggtaatca gcttggcgtt cagcagctgc 5340 cgccagtagt tcttcatctt cttcacgacc tcttcggagg gcacgttgtc gctcttgccc 5400 cggttcttgt cgcttctggt cagcaccttg ttgtcgatgg agtcgtcctt cagaaagctc 5460 tgaggcacga tatggtccac atcgtagtcg gacagccggt tgatgtccag ttcctggtcc 5520 acgtacatat cccgcccatt ctgcaggtag tacaggtaca gcttctcgtt ctgcagctgg 5580 gtgttttcca cggggtgttc tttcaggatc tggctgccca gctctttgat gccctcttcg 5640 atccgcttca ttctctcgcg gctgttcttc tgtcccttct gggtggtctg gttctctctg 5700 gccatttcga tcacgatgtt ctcgggcttg tgccggccca tcactttcac gagctcgtcc 5760 accaccttca ctgtctgcag gatgcccttc ttaatggcgg ggctgccggc cagattggca 5820 atgtgctcgt gcaggctatc gccctggccg gacacctggg ctttctggat gtcctcttta 5880 aaggtcaggc tgtcgtcgtg gatcagctgc atgaagtttc tgttggcgaa gccgtcggac 5940 ttcaggaaat ccaggattgt cttgccggac tgcttgtccc ggatgccgtt gatcagcttc 6000 cggctcagcc tgccccagcc ggtgtatctc cgccgcttca gctgcttcat cactttgtcg 6060 tcgaacaggt gggcataggt tttcagccgt tcctcgatca tctctctgtc ctcaaacagt 6120 gtcagggtca gcacgatatc ttccagaatg tcctcgtttt cctcattgtc caggaagtcc 6180 ttgtccttga taattttcag cagatcgtgg tatgtgccca gggaggcgtt gaaccgatct 6240 tccacgccgg agatttccac ggagtcgaag cactcgattt tcttgaagta gtcctctttc 6300 agctgcttca cggtcacttt ccggttggtc ttgaacagca ggtccacgat ggcctttttc 6360 tgctcgccgc tcaggaaggc gggctttctc attccctcgg tcacgtattt cactttggtc 6420 agctcgttat acacggtgaa gtactcgtac agcaggctgt gcttgggcag caccttctcg 6480 ttgggcaggt tcttatcgaa gttggtcatc cgctcgatga agctctgggc ggaagcgccc 6540 ttgtccacca cttcctcgaa gttccagggg gtgatggttt cctcgctctt tctggtcatc 6600 caggcgaatc tgctgtttcc cctggccaga gggcccacgt agtaggggat gcggaaggtc 6660 aggatcttct cgatcttttc ccggttgtcc ttcaggaatg ggtaaaaatc ttcctgccgc 6720 cgcagaatgg cgtgcagctc tcccaggtgg atctggtggg ggatgctgcc gttgtcgaag 6780 gtccgctgct tccgcagcag gtcctctctg ttcagcttca cgagcagttc ctcggtgccg 6840 tccatctttt ccaggatggg cttgatgaac ttgtagaact cttcctggct ggctccgccg 6900 tcaatgtagc cggcgtagcc gttcttgctc tggtcgaaga aaatctcttt gtacttctca 6960 ggcagctgct gccgcacgag agctttcagc agggtcaggt cctggtggtg ctcgtcgtat 7020 ctcttgatca tagaggcgct caggggggcc ttggtgatct cggtgttcac tctcaggatg 7080 tcgctcagca ggatggcgtc ggacaggttc ttggcggcca gaaacaggtc ggcgtactgg 7140 tcgccgatct gggccagcag gttgtccagg tcgtcgtcgt aggtgtcctt gctcagctgc 7200 agtttggcat cctcggccag gtcgaagttg ctcttgaagt tgggggtcag gcccaggctc 7260 agggcaatca ggttgccgaa caggccattc ttcttctcgc cgggcagctg ggcgatcaga 7320 ttttccagcc gtctgctctt gctcagtctg gcagacagga tggccttggc gtccacgccg 7380 ctggcgttga tggggttttc ctcgaacagc tggttgtagg tctgcaccag ctggatgaac 7440 agcttgtcca cgtcgctgtt gtcggggttc aggtcgccct cgatcaggaa gtggccccgg 7500 aacttgatca tgtgggccag ggccagatag atcagccgca ggtcggcctt gtcggtgctg 7560 tccaccagtt tctttctcag gtggtagatg gtggggtact tctcgtggta ggccacctcg 7620 tccacgatgt tgccgaagat ggggtgccgc tcgtgcttct tatcctcttc caccaggaag 7680 gactcttcca gtctgtggaa gaagctgtcg tccaccttgg ccatctcgtt gctgaagatc 7740 tcttgcagat agcagatccg gttcttccgt ctggtgtatc ttcttctggc ggttctcttc 7800 agccgggtgg cctcggctgt ttcgccgctg tcgaacagca gggctccgat caggttcttc 7860 ttgatgctgt gccggtcggt gttgcccagc accttgaatt tcttgctggg caccttgtac 7920 tcgtcggtga tcacggccca gcccacagag ttggtgccga tgtccaggcc gatgctgtac 7980 ttcttgtcgg acgcttcgac cttgcgcttt ttcttcggcg aagcgtaatc tggaacatcg 8040 tatgggtaca tggtggccct aggatcgatt actagctcac gacacctgaa atggaagaaa 8100 aaaactttga accactgtct gaggcttgag aatgaaccaa gatccaaact caaaaagggc 8160 aaattccaag gagaattaca tcaagtgcca agctggccta acttcagtct ccacccactc 8220 agtgtgggga aactccatcg cataaaaccc ctccccccaa cctaaagacg acgtactcca 8280 aaagctcgag aactaatcga ggtgcctgga cggcgcccgg tactccgtgg agtcacatga 8340 agcgacggct gaggacggaa aggccctttt cctttgtgtg ggtgactcac ccgcccgctc 8400 tcccgagcgc cgcgtcctcc attttgagct ccctgcagca gggccgggaa gcggccatct 8460 ttccgctcac gcaactggtg ccgaccgggc cagccttgcc gcccagggcg gggcgataca 8520 cggcggcgcg aggccaggca ccagagcagg ccggcgagct tgagactacc cccgtccgat 8580 tctcggtggc cgcgctcgca ggccccgcct cgccgaacat gtgcgctggg acgcacgggc 8640 cccgtcgccg cccgcggccc caaaaaccga aataccagtg tgcagatctt ggcccgcatt 8700 tacaagacta tcttgccaga aaaaaagcgt cgcagcaggt catcaaaaat tttaaatggc 8760 tagagactta tcgaaagcag cgagacaggc gcgaaggtgc caccagattc gcacgcggcg 8820 gccccagcgc ccaggccagg cctcaactca agcacgaggc gaaggggctc cttaagcgca 8880 aggcctcgaa ctctcccacc cacttccaac ccgaagctcg ggatcaagaa tcacgtactg 8940 cagccagggg cgtggaagta attcaaggca cgcaagggcc ataacccgta aagaggccag 9000 gcccgcggga accacacacg gcacttacct gtgttctggc ggcaaacccg ttgcgaaaaa 9060 gaacgttcac ggcgactact gcacttatat acggttctcc cccaccctcg ggaaaaaggc 9120 ggagccagta cacgacatca ctttcccagt ttaccccgcg ccaccttctc taggcaccgg 9180 ttcaattgcc gacccctccc cccaacttct cggggactgt gggcgatgtg cgctctgccc 9240 actgacgggc accggagcct cacgcatgct cttctccacc tcagtgatga cgagagcggg 9300 cgggtgaggg ggcgggaacg cagcgatctc tgggttctac gttagtggga gtttaacgac 9360 ggtccctggg attccccaag gcaggggcga gtccttttgt atgaattact caaatcgatt 9420 aggatccggc gcgcccaccg cggaaaaaaa gcaccgactc ggtgccactt tttcaagttg 9480 ataacggact agccttattt taacttgcta tttctagctc taaaacgtga taaaagcaac 9540 tgttagcggt gtttcgtcct ttccacaaga tatataaagc caagaaatcg aaatactttc 9600 aagttacgat aagcatatga tagtccattt taaaacataa ttttaaaact gcaaactacc 9660 caagaaatta ttactttcta cgtcacgtat tttgtactaa tatctttgtg tttacagtca 9720 aattaattcc aattatctct ctaacagcct tgtatcgtat atgcaaatat gaaggaatca 9780 tgggaaatag gccctcggcg cgcccaccgc ggaaaaaaag caccgactcg gtgccacttt 9840 ttcaagttga taacggacta gccttatttt aacttgctat ttctagctct aaaactgacc 9900 aatagccttg acaagcggtg tttcgtcctt tccacaagat atataaagcc aagaaatcga 9960 aatactttca agttacggta agcatatgat agtccatttt aaaacataat tttaaaactg 10020 caaactaccc aagaaattat tactttctac gtcacgtatt ttgtactaat atctttgtgt 10080 ttacagtcaa attaattcta attatctctc taacagcctt gtatcgtata tgcaaatatg 10140 aaggaatcat gggaaatagg ccctcggatc cttaattgct agcgaggcct gtactctgtt 10200 ttcacaggaa gaaatcctca cccagtcttc cccaaacaca ttcccaggtt ctgtcattag 10260 tgggatagag atgattactg tggggagaag agaaacatct ggatggattt ggtgaggttg 10320 atctatagag gaagtaggtg ctgcctgagg tagctgtaat agaagctaaa ggtcaaagga 10380 gagggccctg tcccaatcca gatgactcca cttctgctgg acccaggttc acaagcttaa 10440 tctacatttc acctaaattt ggctaacaag cccaaaatca cacaggcaaa gggagaagtg 10500 gaggcagaac cgaggttgga ggccaccagg gccaccgggc agagatcatt taagcccaac 10560 cttctcactt ctccctgggc tctgcctctc ttaaaggacc ttgtggtgtg acctcttgta 10620 ggtccctttc acactcgggg cctcagtttc cccactgtaa agtgaatggg tcccagcttt 10680 ggtaagctta tgcttacctg atgctttctt cctgggctgc tcttgtagag aaaagataaa 10740 tcttcttcct ccatccacga gggcttcttt ccctgggggt gagagtaggc tgaggagagc 10800 cacttgcaca cactcttaaa gaaagtatta cctgcaccag ctcagtgaga ggcacagatc 10860 agactgttac ttgaatcaaa ttatgagcct ccccaaatat atctatgaca tttaaatagg 10920 ggattacttg aacatagact ttgggatccg gtgtggagtg caggagacta gcaaagtgaa 10980 tcctgagagt agcaggtctg cacctgttgg atcgagaaag gcggcctaca attctggtca 11040 aatgagctgt gcttattgac atattctatt agagagtact accaggtcac cagtcaccag 11100 aaaggctgcc agctctccaa ccacctccag ggaactatcc tgaatggggc cttaacaagc 11160 ctaagagagg gttggtttgg gtcccaagcc aatatttgct ctgctttatg tcagtcatat 11220 ggaacccaaa ccaaccctct cctatgtgcc tcaccagtcg gtgcagggat cccaatttca 11280 agtttggttt tttatggtca aagtccagca tagattaaat gaaggggtgt gatgatggtg 11340 ttaaaagaga actccagacc agtttaactc ttggacacac atcccatctc accatggtgc 11400 ttccaacctt ccagagatga tgggctccta ttttctgatg acaaagccct ccacaggatt 11460 gctgcctggc catcagggag tgcctctgta actgaggctg agatcccact ttcagtcctc 11520 cagctgtggc ccatccctgc tccgcccacc gggtatggcc tgtcctaggc tcttaggtat 11580 ggctgcattg tgaaatgatg gctacagagc tggcatctcc tgtagtctgg ttcatctagt 11640 gcactacctc atagttaaaa gaaatctgtt taagccactg agggtggctc ctagtgccaa 11700 ctccaagaac aggaagcttc ccttttttgg gaggaggggc agatggtaac atggatcgtc 11760 caggtcaatg ggagcagggc aaccacagta agtactggac aacaacacaa aactccatgt 11820 gtggcttcca tcgagtccct ctccaattgg tttggtcttc tccgtcccat gcagcacttt 11880 agcaaggggc ctggctgaag gctatgaatt gtgtggagcc tcctcattgc agtctccaac 11940 catctgatgc tgggaaaatg tcaccaggat gcagccatgc cgtgtggcca atgaaccgag 12000 aaaacacccc ttttctagaa tgctctaaag aggcagaata atccagaggt gaggaaggaa 12060 atactccacc agagacccag gcagttccta caaaagccag actttccttc acctagggag 12120 tgacaagacc agtggaaaac actctcaagc agtaaccccc aaatgctctg caagccagtg 12180 gcgtccagat accgcacaag cgagtgggct gtctaatccc atcatcatga tgtaaatatc 12240 tctaggctgc cccgggctgt gcctgaccct gtcttcagct ttccacacct ccacctacag 12300 cccatgcaca gaaggaccac ccaggaatgc tgcaagtgtg gcacctccag ggccacccag 12360 ggagaaggag ggcagctatg ctggtggctc caggcccatt tggcgggtgg taccttcaca 12420 ccacaaagcc caaactgagg ccccagattt ggctgatgag ggcatattgg acaggggtca 12480 cttatgctct tccccattgc cacctggcct ctggctacct ggacttggct acctgtggat 12540 cctctcacag gtgccaccat cttggctgag tctccagatg cgaggtccct gaggcagtgg 12600 caggcttctc gctaatgctg atgggattag gaatgggata ggtggggagg gccctggact 12660 gggccctgat gagccaagtg ggtttttaga ggggctactg gtacatttca gggacaggac 12720 atctggtaga gctaagctgg ggcaataagg agccactgct aatctgagag ctagaaacaa 12780 tcagcttctg ggtcattatt aattagggta gtttgggctg tgtggaagtc acgtactata 12840 tggggtagcc acagctctct ctacagataa tctctaagac ttctgattgg gaccgtgtga 12900 atgcagtagc aatatctctt cttactgcca ggccctgcca gtcctgcctc cacgccctgg 12960 ctggcccccc ttatgatctg acccatgcca ggctgccata gtatgttact tctgcattag 13020 cactccttgg gacctgcctc tccactgtcc ctcagacttt aaagaactat acaaacccaa 13080 ggggctcttc ccaagagaat tgatatgact tgaggtgatt ccatttctgg aagtagtcac 13140 tccattttct gcctcactct ttcagtgctt cacagagcag gttcgattaa gcacacagat 13200 taattaagca cacagattaa tcgtaactat aacggtccta aggtagcgaa agcttgcatg 13260 cctgcaggtc gactctagag gatcaaacct agccaccgcg gtggcggccg gctagccggc 13320 tagccggcta gccctagaac tagtaacggc cgccagtgtg ctggaattcg gcttgtaagg 13380 taccggtgaa gttcctatac tttctagaga ataggaactt cggaatagga acttctacct 13440 agatgcatgc tcgagcggcc cctacagttg aagtcggaag tttacataca cttaagttgg 13500 agtcattaaa actcgttttt caactactcc acaaatttct tgttaacaaa caatagtttt 13560 ggcaagtcag ttaggacatc tactttgtgc atgacacaag tcatttttcc aacaattgtt 13620 tacagacaga ttatttcact tataattcac tgtatcacaa ttccagtggg tcagaagttt 13680 acatacacta agttgactgt gcctttaaac agcttggaaa attccagaaa atgatgtcat 13740 ggctttagaa gcttctgata gactaattga catcatttga gtcaattgga ggtgtacctg 13800 tggatgtatt tcaaggaatt ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag 13860 gctccccagc aggcagaagt atgcaaagca tgcatatcga tactagttta taagatctcg 13920 agctagggta ccgtcaaggc tgcagtgaga catgatcttg ccactgcact ccagcctgga 13980 cagcagagtg aaaccttgcc tcacgaaaca gaatacaaaa acaaacaaac aaaaaactgc 14040 tccgcaatgc gcttccttga tgctctacca cataggtctg ggtactttgt acacattatc 14100 tcattgctgt tcataattgt tagattaatt ttgtaatatt gatattattc ctagaaagct 14160 gaggcctcaa gatgataact tttattttct ggacttgtaa tagctttctc ttgtattcac 14220 catgttgtaa ctttcttaga gtagtaacaa tataaagtta ttgtgagttt ttgcaaacac 14280 agcaaacaca acgacccata tagacattga tgtgaaattg tctattgtca atttatggga 14340 aaacaagtat gtactttttc tactaagcca ttgaaacagg aataacagaa caagattgaa 14400 agaatacatt ttccgaaatt acttgagtat tatacaaaga caagcacgtg gacctgggag 14460 gagggttatt gtccatgact ggtgtgtgga gacaaatgca ggtttataat agatgggatg 14520 gcatctagcg caatgacttt gccatcactt ttagagagct cttggggacc ccagtacaca 14580 agaggggacg cagggtatat gtagacatct cattcttttt cttagtgtga gaataagaat 14640 agccatgacc tgagtttata gacaatgagc ccttttctct ctcccactca gcagctatga 14700 gatggcttgc cctgcctctc tactaggctg actcactcca aggcccagca atgggcaggg 14760 ctctgtcagg gctttgatag cactatctgc agagccaggg ccgagaaggg gtggactcca 14820 gagactctcc ctcccattcc cgagcagggt ttgcttattt atgcatttaa atgatatatt 14880 tattttaaaa gaaataacag gagactgccc agccctggct gtgacatgga aactatgtag 14940 aatattttgg gttccatttt tttttccttc tttcagttag aggaaaaggg gctcaggatc 15000 cacttgccca gtgttcttcc ttagttccta ccttcgacct tgatcctcct ttatcttcct 15060 gaaccctgct gagatgatct atgtggggag aatggcttct ttgagaaaca tcttcttcgt 15120 tagtggcctg cccctcattc ccactttaat atccagaatc actataagaa gaatataata 15180 agaggaataa ctcttattat aggtaaggga aaattaagag gcatacgtga tgggatgagt 15240 aagagaggag agggaaggat taatggacga taaaatctac tactatttgt tgagaccttt 15300 tatagtctaa tcaattttgc tattgttttc catcctcacg ctaactccat aaaaaaacac 15360 tattattatc tttattttgc catgacaaga ctgagctcag aagagtcaag catttgccta 15420 aggtcggaca tgtcagaggc agtgccagac ctatgtgaga ctctgcagct actgctcatg 15480 ggccctgtgc tgcactgatg aggaggatca gatggatggg gcaatgaagc aaaggaatca 15540 ttctgtggat aaaggagaca gccatgaaga agtctatgac tgtaaatttg ggagcaggag 15600 tctctaagga cttggatttc aaggaatttt gactcagcaa acacaagacc ctcacggtga 15660 ctttgcgagc tggtgtgcca gatgtgtcta tcagaggttc cagggagggt ggggtggggt 15720 cagggctggc caccagctat cagggcccag atgggttata ggctggcagg ctcagatagg 15780 tggttaggtc aggttggtgg tgctgggtgg agtccatgac tcccaggagc caggagagat 15840 agaccatgag tagagggcag acatgggaaa ggtgggggag gcacagcata gcagcatttt 15900 tcattctact actacatggg actgctcccc tataccccca gctaggggca agtgccttga 15960 ctcctatgtt ttcaggatca tcatctataa agtaagagta ataattgtgt ctatctcata 16020 gggttattat gaggatcaaa ggagatgcac actctctgga ccagtggcct aacagttcag 16080 gacagagcta tgggcttcct atgtatgggt cagtggtctc aatgtagcag gcaagttcca 16140 gaagatagca tcaaccactg ttagagatat actgccagtc tcagagcctg atgttaattt 16200 agcaatgggc tgggaccctc ctccagtaga accttctaac cagctgctgc agtcaaagtc 16260 gaatgcagct ggttagactt tttttaatga aagcttgcat gcagcacttt gggaggctga 16320 ggtgggtgga ctgcttggag ctcaggagtt caagaccatc ttggacaaca tggtgatacc 16380 ctgcctctac aaaaagtaca aaaattagcc tggcatggtg gtgtgcacct gtaatcccag 16440 ctattagggt ggctgaggca ggagaattgc ttgaacccgg gaggcggagg ttgcagtgag 16500 ctgagatcgt gccactgcac tccagcctgg gggacagagc acattataat taactgttat 16560 tttttacttg gactcttgtg gggaataaga tacatgtttt attcttattt atgattcaag 16620 cactgaaaat agtgtttagc atccagcagg tgcttcaaaa ccatttgctg aatgattact 16680 atacttttta caagctcagc tccctctatc ccttccagca tcctcatctc tgattaaata 16740 agcttcagtt tttccttagt tcctgttaca tttctgtgtg tctccattag tgacctccca 16800 tagtccaagc atgagcagtt ctggccaggc ccctgtcggg gtcagtgccc cacccccgcc 16860 ttctggttct gtgtaacctt ctaagcaaac cttctggctc aagcacagca atgctgagtc 16920 atgatgagtc atgctgaggc ttagggtgtg tgcccagatg ttctcagcct agagtgatga 16980 ctcctatctg ggtccccagc aggatgctta cagggcagat ggcaaaaaaa aggagaagct 17040 gaccacctga ctaaaactcc acctcaaacg gcatcataaa gaaaatggat gcctgagaca 17100 gaatgtgaca tattctagaa tatattattt cctgaatata tatatatata tacacatata 17160 ccatatgaaa cacctctagg ctataaggca acagagctcc tttttttttt ttctgtgctt 17220 tcctggctgt ccaaatctct aatgataagc atacttctat tcaatgagaa tattctgtaa 17280 gattatagtt aagaattgtg ggagccattc cgtctcttat agttaaattt gagcttcttt 17340 tatgatcact gtttttttaa tatgctttaa gttctggggt acatgtgcca tggtggtttg 17400 ctgcacccat caacccgtca tctacattag gtatttctcc taatgctatc cttcccctag 17460 ccccccaccc ccaacaggcc ccagtgtgtg atgttcccct ccctgtgtcc atggatcact 17520 ggtttttttt tgtttttttt ttttttttaa agtctcagtt aaatttttgg aatgtaattt 17580 attttcctgg tatcctaagg acttgcaagt tatctggtca ctttagccct cacgttttga 17640 tgataatcac atatttgtaa acacaacaca cacacacaca cacacacaca tatatatata 17700 tataaaacat atatatacat aaacacacat aacatattta tcgggcattt ctgagcaact 17760 aatcatgcag gactctcaaa cactaaccta tagccttttc tatgtatcta cttgtgtaga 17820 aaccaagcgt ggggactgag aaggcaatag caggagcatt ctgactctca ctgcctttag 17880 ctaggcccct ccctcatcac agctcagcat agtcctgagc tcttatctat atccacacac 17940 agtttctgac gctgcccagc tatcaccatc ccaagtctaa agaaaaaaat aatgggtttg 18000 cccatctctg ttgattagaa aacaaaacaa aataaaataa gcccctaagc tcccagaaaa 18060 catgactaaa ccagcaagaa gaagaaaata caataggtat atgaggagac tggtgacact 18120 aagtgtctga atgaggcttg agtacagaaa agaggctcta gcagcatagt ggtttagagg 18180 agatgtttct ttccttcaca gatgccttag cctcaataag cttgcggttg tggaagttta 18240 cttgtttatc accggtgacg tccatgagca aattaagaaa aacaacaaca aatgaatgca 18300 tatatatgta tatgtatgtg tgtatatata cacatatata tatatatttt ttttcttttc 18360 ttaccagaag gttttaatcc aaataaggag aagatatgct tagaactgag gtagagtttt 18420 catccattct gtcctgtaag tattttgcat attctggaga cgcaggaaga gatccatcta 18480 catatcccaa agctgaatta tggtagacaa aactcttcca cttttagtgc atcaatttct 18540 tatttgtgta ataagaaaat tgggaaaacg atcttcaata tgcttaccaa gctgtgattc 18600 caaatattac gtaaatacac ttgcaaagga ggatgttttt agtagcaatt tgtactgatg 18660 gtatggggcc aagagatata tcttagaggg agggctgagg gtttgaagtc caactcctaa 18720 gccagtgcca gaagagccaa ggacaggtac ggctgtcatc acttagacct caccctgtgg 18780 agccacaccc tagggttggc caatctactc ccaggagcag ggagggcagg agccagggct 18840 gggcataaaa gtcagggcag agccatctat tgcttacatt tgcttctgac acaactgtgt 18900 tcactagcaa cctcaaacag acaccatggg tcatttcaca gaggaggaca aggctactat 18960 cacaagcctg tggggcaagg tgaatgtgga agatgctgga ggagaaaccc tgggaaggta 19020 ggctctggtg accaggacaa gggagggaag gaaggaccct gtgcctggca aaagtccagg 19080 tcgcttctca ggatttgtgg caccttctga ctgtcaaact gttcttgtca atctcacagg 19140 ctcctggttg tctacccatg gacccagagg ttctttgaca gctttggcaa cctgtcctct 19200 gcctctgcca tcatgggcaa ccccaaagtc aaggcacatg gcaagaaggt gctgacttcc 19260 ttgggagatg ccataaagca cctggatgat ctcaagggca cctttgccca gctgagtgaa 19320 ctgcactgtg acaagctgca tgtggatcct gagaacttca aggtgagtcc aggagatgtt 19380 tcagccctgt tgcctttagt ctcgaggcaa cttagacaac tgagtattga tctgagcaca 19440 gcagggtgtg agctgtttga agatactggg gttgggggtg aagaaactgc agaggactaa 19500 ctgggctgag acccagtggt aatgttttag ggcctaagga gcgcctctaa aaatctagat 19560 ggacaatttt gactttgaga aaagagaggt ggaaatgagg aaaatgactt ttattagatt 19620 ccagtagaaa gaactttcat ctttccctca tttttgttcg ttttaaaaca tctatctgga 19680 ggcaggacaa gtatggtcgt taaaaagatg caggcagaag gcatatattg gctcagtcaa 19740 agtggggaac tttggtggcc aaacatacat tgctaaggct attcctatat cagctggaca 19800 catataaaat gctgctaatg cttcattaca aacttatatc ctttaattcc agatgggggc 19860 aaagtatgtc caggggtgag gaacaattga aacatttggg ctggagtaga ttttgaaagt 19920 cagctctgtg tgtgtgtgtg tgtgcgcgcg cgcgtgtgtg tgtgtgtgtg tcaacgtgtg 19980 tttcttttaa cgtcttcagc ctacaacata cagggttcat ggtggcaaga agatagcaag 20040 atttaaatta tggccagtga ctagtgcttg aaggggaaca actacctgca tttaatggga 20100 aggcaaaatc tcaggctttg agggaagtta acataggctt gattctgggt agaagctggg 20160 tgtgtagtta tctggaggcc aggctggagc tctcagctca ctatgggttc atctttattg 20220 tctcctttca tctcaacagc tcctgggaaa tgtgctggtg accgttttgg caatccattt 20280 cggcaaagaa ttcacccctg aggtgcaggc ttcctggcag aagatggtga ctgcagtggc 20340 cagtgccctg tcctccagat accactgagc ctcttgccca tgattcagag ctttcaagga 20400 taggctttat tctgcaagca attcaaataa taaatctatt ctgctgagag atcacacatg 20460 attttcttca gctctttttt ttacatcttt ttaaatatat gagccacaaa gggtttatat 20520 tgagggaagt gtgtatgtgt atttctgcat gcctgtttgt gtttgtggtg tgtgcatgct 20580 cctcatttat ttttatatga gatgtgcatt ttgttgagca aataaaagca gtaaagacac 20640 ttgtacacgg gagttctgca agtgggagta aatggtgtag gagaaatccg gtgggaagaa 20700 agacctctat aggacaggac ttctcagaaa cagatgtttt ggaagagatg ggaaaaggtt 20760 cagtgaagac ctgggggctg gattgattgc agctgagtag caaggatggt tcttaatgaa 20820 gggaaagtgt tccaagcttt aggaattcaa ggtttagtca ggtgtagcaa ttctatttta 20880 ttaggaggaa tactatttct aatggcactt agcttttcac agcccttgtg gatgcctaag 20940 aaagtgaaat taatcccatg ccctcaagtg tgcagattgg tcacagcatt tcaagggaga 21000 gacctcattg taagactctg ggggaggtgg ggacttaggt gtaagaaatg aatcagcaga 21060 ggctcacaag tcagcatgag catgttatgt ctgagaaaca gaccagcact gtgagatcaa 21120 aatgtagtgg gaagaatttg tacaacatta attggaaggc ttacttaatg gaatttttgt 21180 atagttggat gttagtgcat ctctataagt aagagtttaa tatgatggtg ttacggacct 21240 aatgtttgtg tctcctcaaa attcacatgc tgaatcccca actcccaact gaccttatct 21300 gtgggggagg cttttgaaaa gtaattaggt ttagatgagc tcataagagc agatccccat 21360 cataaaatta ttttccttat cagaagcaga gagacaagcc atttctcttt cctcccggtg 21420 aggacacagt gagaagtccg ccatctgcaa tccaggaaga gaaccctgac cacgagtcag 21480 ccttcagaaa tgtgagaaaa aactctgttg ttgaagccac ccagtctttt gtattttgtt 21540 atagcacctt gcactgagta aggcagatga agaaggagaa aaaaataagc ttatcgaaac 21600 gcgtccccat cctcactgac tccgtcctgg agttggatga gagataatgg ccttacgttg 21660 tgccagggga gggtcgggct ggatttagca agatttacct tctccaaaga gcggtgctgc 21720 agtggcacag ctgcccacgg aggtgggggg gtcaccgtcc ctggaggtga tgaagaactg 21780 tggggatgtg gcactgaggg acatggccag tgggcacggt gggtgggttg gggttggtct 21840 tggggatctt ggagggcttt tccagccttc atgatttgac gattgtatga acatctacat 21900 ggcaattctc cagctgcctg tcccagtcct actgacccag ctgtatctct ccaggcaagc 21960 tcttccaccc cttctgcttg catccagaca ccatcaaaca tgcaggctca gacacaggga 22020 ccagcagtgt ctgtggcctt tttgtgctcc tctccatgct gggttttaac ttgctctttg 22080 tccttctatc ctatcttctt atccttaagg ctgttctgaa cgctgtgact tggagagtgt 22140 cccagagccc tcaacacctg catgtcccac gtccatgctg tcctgcactt ccttatcccc 22200 aagatctgcc tctccgtgat gcactgaatt ggcaaacatg tgtcacccca gaccaacaat 22260 gtcacagcaa actccccctt gataggacaa gggggaatgg ctttacactg agacagggga 22320 ggtttgggtt ggatatgagg aggcagtttt tcccccagag ggtggtgacg cactgaacag 22380 gttgcccaag gaggctgtgg atgccccatc cctgcaggca ttcaaggcca ggctggatgt 22440 ggctctgggc agcctgggct gctggttgat gaccctgcac atagcagggg gttggatctg 22500 gatgagcact gtgctccttt gcaacccagg ccgttctatg attctgtcat tctaaatctc 22560 tctttcagcc taaagctttt tccccgtatc cccccaggtg tctgcaggct caaagagcag 22620 cgagaagcgt tcagaggaaa gcgatcccgt gccaccttcc ccgtgcccgg gctgtccccg 22680 cacgctgccg gctcggggat gcggggggag cgccggaccg gagcggagcc ccgggcggct 22740 cgctgctgcc ccctagcggg ggagggacgt aattacatcc ctgggggctt tggggggggg 22800 ctgtccctat cgattactag tttagccata gagcccaccg catccccagc atgcctgcta 22860 ttgtcttccc aatcctcccc cttgctgtcc tgccccaccc caccccccag aatagaatga 22920 cacctactca gacaatgcga tgcaatttcc tcattttatt aggaaaggac agtgggagtg 22980 gcaccttcca gggtcaagga aggcacgggg gaggggcaaa caacagatgg ctggcaacta 23040 gaaggcacag tcgctcgaag agcggccgct cgctttactt gtacagctcg tccatgccga 23100 gagtgatccc ggcggcggtc acgaactcca gcaggaccat gtgatcgcgc ttctcgttgg 23160 ggtctttgct cagggcggac tgggtgctca ggtagtggtt gtcgggcagc agcacggggc 23220 cgtcgccgat gggggtgttc tgctggtagt ggtcggcgag ctgcacgctg ccgtcctcga 23280 tgttgtggcg gatcttgaag ttcaccttga tgccgttctt ctgcttgtcg gccatgatat 23340 agacgttgtg gctgttgtag ttgtactcca gcttgtgccc caggatgttg ccgtcctcct 23400 tgaagtcgat gcccttcagc tcgatgcggt tcaccagggt gtcgccctcg aacttcacct 23460 cggcgcgggt cttgtagttg ccgtcgtcct tgaagaagat ggtgcgctcc tggacgtagc 23520 cttcgggcat ggcggacttg aagaagtcgt gctgcttcat gtggtcgggg tagcggctga 23580 agcactgcac gccgtaggtc agggtggtca cgagggtggg ccagggcacg ggcagcttgc 23640 cggtggtgca gatgaacttc agggtcagct tgccgtaggt ggcatcgccc tcgccctcgc 23700 cggacacgct gaacttgtgg ccgtttacgt cgccgtccag ctcgaccagg atgggcacca 23760 ccccggtgaa cagctcctcg cccttgctca ccatgggccc tgggttggac tccacgtctc 23820 ccgccaactt gagaaggtca aaattcaaag tctgtttcac ctcgaggttt cggccagcag 23880 gcggggagcc cgaggtagct cccgctccct tgagccaggc ccctgccaga cctgagctcc 23940 ctcccaagcc tggcttcccc aaccggtggc cttcatgggc cagaagccat tccttcacgg 24000 ctagccctcc ggagtagttg cccacggctc cgctgctgca gaccactctg tggcacggga 24060 tgaggatctt gacaggattg cctctcatgg cgcctcccac tgctcgcgcg gctttggggt 24120 tgccggccag ggcggccaat tgctggtaag aaatcacttc tccgaatttc acaaccttaa 24180 gcagcttcca taacacctga cgcgtgaacg actcttgctg gaaaacggga tggtgaagcg 24240 ctggcacggg gaactcttcg atagcctcgg gctggtggaa ataggcattc agccaggctg 24300 tgcactgcat caggggctcc ggacctccga gaaccgcagc gggggctggg acctccacgg 24360 catcagctgc agacgtcccc ttgcccagga gctttatttc gtgcagaccc tgctcacaac 24420 cagacagctc cagcttcccc aaagggctgt ccagtgtggt gcgtttcatt tcacaatcct 24480 tgtccatggt ggccctaggc cctggggaga gaggtcggtg attcggtcaa cgagggagcc 24540 gactgccgac gtgcgctccg gaggcttgca gaatgcggaa caccgcgcgg gcaggaacag 24600 ggcccacact accgccccac accccgcctc ccgcaccgcc ccttcccggc cgctgctctc 24660 ggcgcgcccc gctgagcagc cgctattggc cacagcccat cgcggtcggc gcgctgccat 24720 tgctccctgg cgctgtccgt ctgcgagggt actagtgaga cgtgcggctt ccgtttgtca 24780 cgtccggcac gccgcgaacc gcaaggaacc ttcccgactt aggggcggag caggaagcgt 24840 cgccgggggg cccacaaggg tagcggcgaa gatccgggtg acgctgcgaa cggacgtgaa 24900 gaatgtgcga gacccagggt cggcgccgct gcgtttcccg gaaccacgcc cagagcagcc 24960 gcgtccctgc gcaaacccag ggctgccttg gaaaaggcgc aaccccaacc ccgtggaaat 25020 aaatcgataa ctagtgatat catcatgtct ggatcccatc acaaagctct gacctcaatc 25080 ctatagaaag gaggaatgag ccaaaattca cccaacttat tgtgggaagc ttgtggaagg 25140 ctactcgaaa tgtttgaccc aagttaaaca atttaaaggc aatgctacca aatactaatt 25200 gagtgtatgt taacttctga cccactggga atgtgatgaa agaaataaaa gctgaaatga 25260 atcattctct ctactattat tctgatattt cacattctta aaataaagtg gtgatcctaa 25320 ctgaccttaa gacagggaat ctttactcgg attaaatgtc aggaattgtg aaaaaagtga 25380 gtttaaatgt atttggctaa ggtgtatgta aacttccgac ttcaactgta ggggatcctc 25440 tagggccgcc agtgtgatgg atatctgcag aattcggctt caggtaccgt cgacgatgta 25500 ggtcacggtc tcgaagccgc ggtgcgggtg ccagggcgtg cccttgggct ccccgggcgc 25560 gtactccacc tcacccatct ggtccatcat gatgaacggg tcgaggtggc ggtagttgat 25620 cccggcgaac gcgcggcgca ccgggaagcc ctcgccctcg aaaccgctgg gcgcggtggt 25680 cacggtgagc acgggacgtg cgacggcgtc ggcgggtgcg gatacgcggg gcagcgtcag 25740 cgggttctcg acggtcacgg cgggcatgtc gacaagccga attccagcac actggcggcc 25800 gttactaggt agctagctcg agccttcgaa gatctcctag ggaagttcct atactttcta 25860 gagaatagga acttcggaat aggaacttca ccggtgggtg aaaagccgaa ttctgcagat 25920 atcaagctta tcgataccgt cgacctcgag ggggggcccg gttagatccc cgggtaccga 25980 gctcgaatat ctatgtcggg tgcggagaaa gaggtaatga aatggattaa gtggcaggat 26040 taattaagtg gcaggattaa tcttcgaacg aaggagccat ccaactaacc gtcatgttcg 26100 ggcaaccgaa gaagggagtg gcaggatttc ctttggagac ttctggaatt agacagcagt 26160 ttaatgcaag catctaaatt ctcttcctcc cagagtctca ttaaaactac agtaagagtt 26220 tgtgttttgt tttgttttta aagacaaaat cccaccagga tagagagaat aggagaggag 26280 ataacagcat cataatttat gaaactaaaa tgcagataga ccaggattaa ctgactacac 26340 agcaccaagg aagctgaatc acaagacagc agaggagaaa actggaaagg atcgtggtct 26400 atacggcaga atcttcccaa gcctcaggag gaggagctct agatgcttat gatggcaact 26460 aaagcctaaa agctaattca ttttaaagtt cttccaaatg catagggttt tatttttcca 26520 gacctgggtt cagatgggga atttgacaaa caatggaaag ggggaaaaac aacaatctaa 26580 acactgagtg acaaagtaac aaagaaatag tctagctatc agccagtcaa gccagccttg 26640 gctttgctat ccaaagtagt cagtctaatt ctaccaccag tttctgttcc tgtagctgtc 26700 tactgcctgc cagggactct gccttcccac ccacaactac caatggaagg atgtggtgac 26760 cataccagtg gctgctgaca tctcctgcca tgggaagcat aattgcctcc agcagcctcc 26820 cccttagatc catcattttt gttgcacttg gcctgggctg tactcccggc caatgactga 26880 acatggtgag catagtaatg caggcccatt tctgtgagga gcaggactcc tccagtaggt 26940 gactttggct caaggactct ctattggcct ggttgaactt ttcctgaact gtgctactgt 27000 ctgagactct tcttacccaa tcctctttct cgccccaatt gtcacagacc acctgcattg 27060 tggtctgagt ctctccccac cttctcttgc tcttccctgt ttatctttca caggcatttc 27120 ccccagtaca ttccttgaat gtctaacccg atacgggtgc ctgacttttg gcagacctaa 27180 gcagacaaaa aggagtactt ggttacctag ctcttctttc taccacaaac atcgagggaa 27240 ccctttttcc ctcacccctc tgccacaccc ccactgcccc agtgaacaac cacagagaga 27300 gctgtggtat aatattaggc tggtgcaaaa gtaattgcgg tttttgccat tacttttaat 27360 ggtaaaaacc gcaattactt ttgcacctac ctagtatttg tgtcccccca aattcatatg 27420 ttgaaaccta acccacaata tgatgtcatt aggaggcaag accttgagga ggtgattaga 27480 tgatggggtg gagctctcct gaatgagatt agtgccctta taagaagaag cccaaggaag 27540 ctaccttgac tcttccatca catgagaatg cagcaagaag gcaccatcta ctaatcagga 27600 agagagctct caccagacac tgaatctgcc agtgtcttga tcttgaagtt cccagcctcc 27660 agaactatgc ataatgcatt tccattgtct ctaagccacc cagcctatgg tattttgtca 27720 tagcagcctg aactgactaa gacagtgagc cacatgagaa gtgccccaac ccctccctta 27780 agcacttggc tcacagatca gtgggttcat ttctgcctga gttttattgt tattctgtag 27840 atttcttggg ctagatatat ttttctgtta ttttccttct tcacctcagt catgaattgg 27900 ttgttttaaa aaagacaatg taagtcatgg ggaaactcct gacaactcta ctctcctagg 27960 gttcctgata aaaggggatt cagttgagtc ctctgatggt ctctacctgc caaagtccag 28020 cagcccttag caaacatgct gctcgtttct gtagagaagg tgctggtgtc ccaccatact 28080 tctctctccc tcatgaaggg cttgcgaccc agcaaatggg tggcttatat gggtctgttt 28140 caaaggaaga gccagctctg ggaagaaaaa cgatgagcat aagcataacc taccactgtg 28200 cctgggaaag cagacaactt ttttgatgtg tgaatatcta atgagaatgg aatccatcaa 28260 ttaccttaaa cttaggcaca gtcttcaaat tcaatatatg tgggatatac ttttagtcag 28320 tttgtagacg ttatttgtaa taaataatct ggcttctcta aagaaattat tttaagtgtt 28380 tggtttggtt tgatttaatg gtaaaattat atttagtggc agagaattat agcaatggtg 28440 ataaactata gagtgtcata agttcatatc ttattctcac atttgaagct gcctgcagat 28500 gcattcaaga tgcagccaga agtcaggaga ctcaggctgt tatttggagc tcatcatttt 28560 acagccttgc tggactccca ctttctcagg ggaaaaatgt ggtgttgacc cagattagct 28620 ctccaggccc tgctgagttg ggcactctgt aagctggagg gtcttctatt gtcttcacct 28680 aagtgtcaat caacaaccca aatgggcatg ggggaagagg gagctgggcc aatgcccagg 28740 gtgcctggta gagagatacc ttgggcactg gaaggcacca gcttcccaga gagaaggggg 28800 agggccatga aaaagttggc tgtagatgcc agggacactg ggactctcca gctgtgtgtt 28860 tgtgtcttct gaagacttat gtttcattcc tttggagcat gcataatcat acactgtggg 28920 atgtgttata tagattgctt gatagttcac cactgtaata aaatactgtg actggaatct 28980 gctcccagtc tgcctttgat agcacttgtg caacacacat ttactgagca tttacagtga 29040 tccaggacct gtgttgtgaa aacattgatg gacaaggcag atggtggagc acgtcagtga 29100 ggatttttaa caaaggctgg taagtgctat aaaggaacat tgtaggacac tagagaacaa 29160 agaacaggag aacctgactt aggctggggt ggggcgttgg ttagaggagg ctccttggag 29220 gacatgaggt ttaagctgtg acctgaggat gaatagatgt tggccaggtg aggttaatct 29280 ggggctcaag atcgagcatt aagcttgtca gccttaccag taaaaaagaa aacctattaa 29340 aaaaacacca ctcgacacgg caccagctca atcagtcaca gtgtaaaaaa gggccaagtg 29400 cagagcgagt atatatagga ctaaaaaatg acgtaacggt taaagtccac aaaaaacacc 29460 cagaaaaccg cacgcgaacc tacgcccaga aacgaaagcc aaaaaaccca caacttcctc 29520 aaatcgtcac ttccgttttc ccacgttacg taacttccca ttttaagaaa actacaattc 29580 ccaacacata caagttactc cgccctaaaa cctacgtcac ccgccccgtt cccacgcccc 29640 gcgccacgtc acaaactcca ccccctcatt atcatattgg cttcaatcca aaataaggta 29700 tattattgat gatgtttaaa ctacggcccg gtacccagct tttgttccct ttagtgaggg 29760 ttaattgcgc gcttggcgta atcatggtca tagctgtttc ctgtgtgaaa ttgttatccg 29820 ctcacaattc cacacaacat acgagccgga agcataaagt gtaaagcctg gggtgcctaa 29880 tgagtgagct aactcacatt aattgcgttg cgctcactgc ccgctttcca gtcgggaaac 29940 ctgtcgtgcc agctgcatta atgaatcggc caacgcgcgg ggagaggcgg tttgcgtatt 30000 gggcgctctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg gctgcggcga 30060 gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg ggataacgca 30120 ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg 30180 ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt 30240 cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc 30300 ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct 30360 tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc 30420 gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta 30480 tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca 30540 gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag 30600 tggtggccta actacggcta cactagaagg acagtatttg gtatctgcgc tctgctgaag 30660 ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt 30720 agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa 30780 gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg 30840 attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga 30900 agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta 30960 atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc 31020 cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg 31080 ataccgcgag acccacgctc accggctcca gatttatcag caataaacca gccagccgga 31140 agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt 31200 tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt 31260 gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc 31320 caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc 31380 ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca 31440 gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag 31500 tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg 31560 tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa 31620 cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa 31680 cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga 31740 gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga 31800 atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg 31860 agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt 31920 ccccgaaaag tgccacctga cgcgccctgt agcggcgcat taagcgcggc gggtgtggtg 31980 gttacgcgca gcgtgaccgc tacacttgcc agcgccctag cgcccgctcc tttcgctttc 32040 ttcccttcct ttctcgccac gttcgccggc tttccccgtc aagctctaaa tcgggggctc 32100 cctttagggt tccgatttag tgctttacgg cacctcgacc ccaaaaaact tgattagggt 32160 gatggttcac gtagtgggcc atcgccctga tagacggttt ttcgcccttt gacgttggag 32220 tccacgttct ttaatagtgg actcttgttc caaactggaa caacactcaa ccctatctcg 32280 gtctattctt ttgatttata agggattttg ccgatttcgg cctattggtt aaaaaatgag 32340 ctgatttaac aaaaatttaa cgcgaatttt aacaaaatat taacgcttac aatttccatt 32400 cgccattcag gctgcgcaac tgttgggaag ggcgatcggt gcgggcctct tcgctattac 32460 gccagctggc gaaaggggga tgtgctgcaa ggcgattaag ttgggtaacg ccagggtttt 32520 cccagtcacg acgttgtaaa acgacggcca gtgagcgcgc gtaatacgac tcactatagg 32580 gcgaattgga gctccactac gtagtttaaa catcatcaat aatatacctt attttggatt 32640 gaagccaata tgataatgag ggggtggagt ttgtgacgtg gcgcggggcg tgggaacgg 32699 <210> 61 <211> 32312 <212> DNA <213> Artificial Sequence <220> <223> pHCA-Dual-FI-globin-mgmt <400> 61 ggccgaagga ttacatgagc ttagaaatgt aattagcata gtgtgtggca tagtgtagat 60 accaaataaa tatgatctct ccttctactc ttgaaaatgc aaacacattc ttggtggtcc 120 taaaatagcc tgtaacatgg tttactcagc agcatttgct attcaaggca gatctgcctt 180 tagtcattgg ctgcgctcct gaacagctgt gtgaaaggct aacttttgta aaccaaatca 240 aaataaaatg cagcaaaaat ttgtcactga aaggaaatcc tcagtatatc cttttatgaa 300 atgaaagatc cctcatccaa acttaacttt tttaaaagtg cgcatttgga gatatagccc 360 tttcttatga atcctaattc aattttggcc ataaacacac gttgatgttc cccaccccaa 420 agcacatagc aacaagagta ggttctatat tgaaaataat gacaatttaa aaacatgtac 480 ttatttcact gtatgtggac agtgtctatg attgcatcat gaagtgtcat ataaccatgt 540 acgtgtacat gagagagaga tagagagaga agtggtaggg tggtggtggt agaggggatg 600 gcgatagtaa tcatggtaat ggtagaggtg atggaggtgg taatgacgga ggtaagggtg 660 gtagtgatga tggtggtggt ggtaatggtg gtggatgtgg tggtggcaat tgggatggtg 720 ggatggtggt agccatggtg atggtggtaa tggtgttgat ttaaagggtg gtggtagtga 780 aggtgagggt agtggtggtg gaggtggtgg tgctggtagc aatagtgatg gtggtgatgg 840 tgttgatgag ggtgttggga tcagggtgag ttcccacagt atatttcatt cttgttgtac 900 cactctgtca acagcaccac tgactgggac agaggaagaa ggcacactct gaatgtgtta 960 ttaacagaaa cctcaaaaca gtctgtctcc ttgtagtcat tcaaaattat ctttttctta 1020 cctggaaaac tgaaactgaa ttaccgggaa aaacacagga gatttttgtt tgttaatatg 1080 ctgccaataa agtaatttta tgtcaaattt aactacagga aagggcaagg cattttctaa 1140 gttccttaga tgtcatgtgg ctaaaaaaaa caaaaggatg gacagcagtt agatactgta 1200 cacttagctg tttgaagcca tatattcaga aagcagatgt tgggagttgg tgtttgagga 1260 ctgatttcct ggaggtattt tatataggcc aagttcattg ttctaaactc taagggcttg 1320 acttgaggga ggaaaagagg caagaacatg tttagttttg ctgacagcat cacatgggca 1380 gccctaaggc tagacaactt tagggcctga agcttattct aggaaagaag cacctacaga 1440 gtggcactgg gctcccctcc actatagaga tgaagtcata tgacagtaaa gggcaggcag 1500 ggctgcctag ggggcccaga actgacactt ccattagaat gagcacaggc cagggagaga 1560 agtggggaac cagagagaag gagctggaat tcctttctct ccatacataa atgcctgcag 1620 agtcccattt cagaatccgg cagacaaagc caccaatgtg atccccatga ccttataaac 1680 attcattaaa atgcatttca aggcatgtga tggcctcccc accccctaga taatgagaaa 1740 acaaaggttt ctcttctgat agagacaagt tcagctctga agtcaacatt atttctggtt 1800 ctgtctgaac aatgacatat ggcaactctt ccctttctat agttctagtc cagaatgaca 1860 aaaaagggga aaaatttctt agagaaggta gagattatac gaatacagtc catgaaatga 1920 gcataaggag aataaagaat ataacttatc caaagaagtc tggcaggctg ttataaatgc 1980 ttgattttgg acactgtagt tggaggttta acatggacac caataaaaag gtcagcaaag 2040 ggtatgcact gttcctattg ggcaagaaga taggaggtca aaggtaacca ggaaagataa 2100 actcagggag acttattttc cctccagagg gcactgggct tgtaggccct gggcaaaatt 2160 gtcaaaaagg tgaaaatcgc ctgtggttta tttagtctgc tctttcttca ctagtgcctc 2220 accagttcag ttcaggccaa tttgctagct accacatttg tagaggtttt acttgcttta 2280 aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt 2340 aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca 2400 aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct 2460 tatcatgtct gaagctttct aggtattgaa taagaaaaat gaagttaagg tggttgatgg 2520 taacactatg ctaataactg cagagccaga agcaccataa gggacatgat aagggagcca 2580 gcagacctct gatctcttcc tgaatgctaa tcttaaacat cctgaggaag aatgggactt 2640 ccatttgggg tgggcctatg atagggtaat aagacagtag tgaatatcaa gctacaaaaa 2700 gccccctttc aaattcttct cagtcctaac ttttcatact aagcccagtc cttccaaagc 2760 agactgtgaa agagtgatag ttccgggaga ctagcactgc agattccggg tcactgtgag 2820 tgggggaggc agggaagaag ggctcacagg acagtcaaac catgccccct gtttttcctt 2880 cttcaagtag acctctataa gacaacagag acaactaagg ctgagtggcc aggcgaggag 2940 aaaccatctc gccgtaaaac atggaaggaa cacttcaggg gaaaggtggt atctctaagc 3000 aagagaactg agtggagtca aggctgagag atgcaggata agcaaatggg tagtgaaaag 3060 acattcatga ggacagctaa aacaataagt aatgtaaaat acagcatagc aaaactttaa 3120 cctccaaatc aagcctctac ttgaatcctt ttctgaggga tgaataaggc ataggcatca 3180 ggggctgttg ccaatgtgca ttagctgttt gcagcctcac cttctttcat ggagtttaag 3240 atatagtgta ttttcccaag gtttgaacta gctcttcatt tctttatgtt ttaaatgcac 3300 tgacctccca cattcccttt ttagtaaaat attcagaaat aatttaaata catcattgca 3360 atgaaaataa atgtttttta ttaggcagaa tccagatgct caaggccctt cataatatcc 3420 cccagtttag tagttggact tagggaacaa aggaaccttt aatagaaatt ggacagcaag 3480 aaagcgagct tagtgatact tgtgggccag ggcattagcc acaccagcca ccactttctg 3540 ataggcagcc tgcactggtg gggtggcggc cgccctagga ttatggcact ggtagaattc 3600 actacttatg gcactggtag aattcactac ttatggcact ggtagaattc actacttatg 3660 gcactggtag aattcactat cgttgtgctt gatctaacca tgtttcattg tgcttgatct 3720 aaccatgttt cattgtgctt gatctaacca tgtttcattg tgcttgatct aaccatgtat 3780 cgcccggggg cggccgcaca caaaaaacca acacacagat ctaatgaaaa taaagatctt 3840 ttattgaatt cttagctggc ctccaccttt ctcttcttct tggggctgtc gcctcccagc 3900 tgagacaggt cgatccgtgt ctcgtacagg ccggtgatgc tctggtggat cagggtggcg 3960 tccagcacct ctttggtgct ggtgtacctc ttccggtcga tggtggtgtc aaagtacttg 4020 aaggcggcag gggctcccag attggtcagg gtaaacaggt ggatgatatt ctcggcctgc 4080 tctctgatgg gcttatcccg gtgcttgttg taggcggaca gcactttgtc cagattagcg 4140 tcggccagga tcactctctt ggagaactcg ctgatctgct cgatgatctc gtccaggtag 4200 tgcttgtgct gttccacaaa cagctgtttc tgctcattat cctcggggga gcccttcagc 4260 ttctcatagt ggctggccag gtacaggaag ttcacatatt tggagggcag ggccagttcg 4320 tttcccttct gcagttcgcc ggcagaggcc agcattctct tccggccgtt ttccagctcg 4380 aacagggagt acttaggcag cttgatgatc aggtcctttt tcacttcttt gtagcccttg 4440 gcttccagaa agtcgatggg attcttctcg aagctgcttc tttccatgat ggtgatcccc 4500 agcagctctt tcacactctt cagtttcttg gacttgccct tttccacttt ggccaccacc 4560 agcacagaat aggccacggt ggggctgtcg aagccgccgt acttcttagg gtcccagtcc 4620 ttctttctgg cgatcagctt atcgctgttc ctcttgggca ggatagactc tttgctgaag 4680 ccgcctgtct gcacctcggt ctttttcacg atattcactt ggggcatgct cagcactttc 4740 cgcacggtgg caaaatcccg gcccttatcc cacacgatct ccccggtttc gccgtttgtc 4800 tcgatcagag gccgcttccg gatctcgccg ttggccaggg taatctcggt cttgaaaaag 4860 ttcatgatgt tgctgtagaa gaagtacttg gcggtagcct tgccgatttc ctgctcgctc 4920 ttggcgatca tcttccgcac gtcgtacacc ttgtagtcgc cgtacacgaa ctcgctttcc 4980 agcttagggt actttttgat cagggcggtt cccacgacgg cgttcaggta ggcgtcgtgg 5040 gcgtggtggt agttgttgat ctcgcgcact ttgtaaaact ggaaatcctt ccggaaatcg 5100 gacaccagct tggacttcag ggtgatcact ttcacttccc ggatcagctt gtcattctcg 5160 tcgtacttag tgttcatccg ggagtccagg atctgtgcca cgtgctttgt gatctgccgg 5220 gtttccacca gctgtctctt gatgaagccg gccttatcca gttcgctcag gccgcctctc 5280 tcggccttgg tcagattgtc gaactttctc tgggtaatca gcttggcgtt cagcagctgc 5340 cgccagtagt tcttcatctt cttcacgacc tcttcggagg gcacgttgtc gctcttgccc 5400 cggttcttgt cgcttctggt cagcaccttg ttgtcgatgg agtcgtcctt cagaaagctc 5460 tgaggcacga tatggtccac atcgtagtcg gacagccggt tgatgtccag ttcctggtcc 5520 acgtacatat cccgcccatt ctgcaggtag tacaggtaca gcttctcgtt ctgcagctgg 5580 gtgttttcca cggggtgttc tttcaggatc tggctgccca gctctttgat gccctcttcg 5640 atccgcttca ttctctcgcg gctgttcttc tgtcccttct gggtggtctg gttctctctg 5700 gccatttcga tcacgatgtt ctcgggcttg tgccggccca tcactttcac gagctcgtcc 5760 accaccttca ctgtctgcag gatgcccttc ttaatggcgg ggctgccggc cagattggca 5820 atgtgctcgt gcaggctatc gccctggccg gacacctggg ctttctggat gtcctcttta 5880 aaggtcaggc tgtcgtcgtg gatcagctgc atgaagtttc tgttggcgaa gccgtcggac 5940 ttcaggaaat ccaggattgt cttgccggac tgcttgtccc ggatgccgtt gatcagcttc 6000 cggctcagcc tgccccagcc ggtgtatctc cgccgcttca gctgcttcat cactttgtcg 6060 tcgaacaggt gggcataggt tttcagccgt tcctcgatca tctctctgtc ctcaaacagt 6120 gtcagggtca gcacgatatc ttccagaatg tcctcgtttt cctcattgtc caggaagtcc 6180 ttgtccttga taattttcag cagatcgtgg tatgtgccca gggaggcgtt gaaccgatct 6240 tccacgccgg agatttccac ggagtcgaag cactcgattt tcttgaagta gtcctctttc 6300 agctgcttca cggtcacttt ccggttggtc ttgaacagca ggtccacgat ggcctttttc 6360 tgctcgccgc tcaggaaggc gggctttctc attccctcgg tcacgtattt cactttggtc 6420 agctcgttat acacggtgaa gtactcgtac agcaggctgt gcttgggcag caccttctcg 6480 ttgggcaggt tcttatcgaa gttggtcatc cgctcgatga agctctgggc ggaagcgccc 6540 ttgtccacca cttcctcgaa gttccagggg gtgatggttt cctcgctctt tctggtcatc 6600 caggcgaatc tgctgtttcc cctggccaga gggcccacgt agtaggggat gcggaaggtc 6660 aggatcttct cgatcttttc ccggttgtcc ttcaggaatg ggtaaaaatc ttcctgccgc 6720 cgcagaatgg cgtgcagctc tcccaggtgg atctggtggg ggatgctgcc gttgtcgaag 6780 gtccgctgct tccgcagcag gtcctctctg ttcagcttca cgagcagttc ctcggtgccg 6840 tccatctttt ccaggatggg cttgatgaac ttgtagaact cttcctggct ggctccgccg 6900 tcaatgtagc cggcgtagcc gttcttgctc tggtcgaaga aaatctcttt gtacttctca 6960 ggcagctgct gccgcacgag agctttcagc agggtcaggt cctggtggtg ctcgtcgtat 7020 ctcttgatca tagaggcgct caggggggcc ttggtgatct cggtgttcac tctcaggatg 7080 tcgctcagca ggatggcgtc ggacaggttc ttggcggcca gaaacaggtc ggcgtactgg 7140 tcgccgatct gggccagcag gttgtccagg tcgtcgtcgt aggtgtcctt gctcagctgc 7200 agtttggcat cctcggccag gtcgaagttg ctcttgaagt tgggggtcag gcccaggctc 7260 agggcaatca ggttgccgaa caggccattc ttcttctcgc cgggcagctg ggcgatcaga 7320 ttttccagcc gtctgctctt gctcagtctg gcagacagga tggccttggc gtccacgccg 7380 ctggcgttga tggggttttc ctcgaacagc tggttgtagg tctgcaccag ctggatgaac 7440 agcttgtcca cgtcgctgtt gtcggggttc aggtcgccct cgatcaggaa gtggccccgg 7500 aacttgatca tgtgggccag ggccagatag atcagccgca ggtcggcctt gtcggtgctg 7560 tccaccagtt tctttctcag gtggtagatg gtggggtact tctcgtggta ggccacctcg 7620 tccacgatgt tgccgaagat ggggtgccgc tcgtgcttct tatcctcttc caccaggaag 7680 gactcttcca gtctgtggaa gaagctgtcg tccaccttgg ccatctcgtt gctgaagatc 7740 tcttgcagat agcagatccg gttcttccgt ctggtgtatc ttcttctggc ggttctcttc 7800 agccgggtgg cctcggctgt ttcgccgctg tcgaacagca gggctccgat caggttcttc 7860 ttgatgctgt gccggtcggt gttgcccagc accttgaatt tcttgctggg caccttgtac 7920 tcgtcggtga tcacggccca gcccacagag ttggtgccga tgtccaggcc gatgctgtac 7980 ttcttgtcgg acgcttcgac cttgcgcttt ttcttcggcg aagcgtaatc tggaacatcg 8040 tatgggtaca tggtggccct aggatcgatt actagctcac gacacctgaa atggaagaaa 8100 aaaactttga accactgtct gaggcttgag aatgaaccaa gatccaaact caaaaagggc 8160 aaattccaag gagaattaca tcaagtgcca agctggccta acttcagtct ccacccactc 8220 agtgtgggga aactccatcg cataaaaccc ctccccccaa cctaaagacg acgtactcca 8280 aaagctcgag aactaatcga ggtgcctgga cggcgcccgg tactccgtgg agtcacatga 8340 agcgacggct gaggacggaa aggccctttt cctttgtgtg ggtgactcac ccgcccgctc 8400 tcccgagcgc cgcgtcctcc attttgagct ccctgcagca gggccgggaa gcggccatct 8460 ttccgctcac gcaactggtg ccgaccgggc cagccttgcc gcccagggcg gggcgataca 8520 cggcggcgcg aggccaggca ccagagcagg ccggcgagct tgagactacc cccgtccgat 8580 tctcggtggc cgcgctcgca ggccccgcct cgccgaacat gtgcgctggg acgcacgggc 8640 cccgtcgccg cccgcggccc caaaaaccga aataccagtg tgcagatctt ggcccgcatt 8700 tacaagacta tcttgccaga aaaaaagcgt cgcagcaggt catcaaaaat tttaaatggc 8760 tagagactta tcgaaagcag cgagacaggc gcgaaggtgc caccagattc gcacgcggcg 8820 gccccagcgc ccaggccagg cctcaactca agcacgaggc gaaggggctc cttaagcgca 8880 aggcctcgaa ctctcccacc cacttccaac ccgaagctcg ggatcaagaa tcacgtactg 8940 cagccagggg cgtggaagta attcaaggca cgcaagggcc ataacccgta aagaggccag 9000 gcccgcggga accacacacg gcacttacct gtgttctggc ggcaaacccg ttgcgaaaaa 9060 gaacgttcac ggcgactact gcacttatat acggttctcc cccaccctcg ggaaaaaggc 9120 ggagccagta cacgacatca ctttcccagt ttaccccgcg ccaccttctc taggcaccgg 9180 ttcaattgcc gacccctccc cccaacttct cggggactgt gggcgatgtg cgctctgccc 9240 actgacgggc accggagcct cacgcatgct cttctccacc tcagtgatga cgagagcggg 9300 cgggtgaggg ggcgggaacg cagcgatctc tgggttctac gttagtggga gtttaacgac 9360 ggtccctggg attccccaag gcaggggcga gtccttttgt atgaattact caaatcgatt 9420 aggatccggc gcgcccaccg cggaaaaaaa gcaccgactc ggtgccactt tttcaagttg 9480 ataacggact agccttattt taacttgcta tttctagctc taaaacaacc cttcctggag 9540 cctgtgcggt gtttcgtcct ttccacaaga tatataaagc caagaaatcg aaatactttc 9600 aagttacgat aagcatatga tagtccattt taaaacataa ttttaaaact gcaaactacc 9660 caagaaatta ttactttcta cgtcacgtat tttgtactaa tatctttgtg tttacagtca 9720 aattaattcc aattatctct ctaacagcct tgtatcgtat atgcaaatat gaaggaatca 9780 tgggaaatag gccctcggcg cgcccaccgc ggaaaaaaag caccgactcg gtgccacttt 9840 ttcaagttga taacggacta gccttatttt aacttgctat ttctagctct aaaactgcct 9900 tgaccaatag ccttgcggtg tttcgtcctt tccacaagat atataaagcc aagaaatcga 9960 aatactttca agttacggta agcatatgat agtccatttt aaaacataat tttaaaactg 10020 caaactaccc aagaaattat tactttctac gtcacgtatt ttgtactaat atctttgtgt 10080 ttacagtcaa attaattcta attatctctc taacagcctt gtatcgtata tgcaaatatg 10140 aaggaatcat gggaaatagg ccctcggatc cttaattgct agcctctaac tcctagaccg 10200 tcagaactgc tgggcccttc aagacgggct gctcacaccc actcatgtta agcctggtga 10260 ggcctgtact ctgttttcac aggaagaaat cctcacccag tcttccccaa acacattccc 10320 aggttctgtc attagtggga tagagatgat tactgtgggg agaagagaaa catctggatg 10380 gatttggtga ggttgatcta tagaggaagt aggtgctgcc tgaggtagct gtaatagaag 10440 ctaaaggtca aaggagaggg ccctgtccca atccagatga ctccacttct gctggaccca 10500 ggttcacaag cttaatctac atttcaccta aatttggcta acaagcccaa aatcacacag 10560 gcaaagggag aagtggaggc agaaccgagg ttggaggcca ccagggccac cgggcagaga 10620 tcatttaagc ccaaccttct cacttctccc tgggctctgc ctctcttaaa ggaccttgtg 10680 gtgtgacctc ttgtaggtcc ctttcacact cggggcctca gtttccccac tgtaaagtga 10740 atgggtccca gctttggtaa gcttatgctt acctgatgct ttcttcctgg gctgctcttg 10800 tagagaaaag ataaatcttc ttcctccatc cacgagggct tctttccctg ggggtgagag 10860 taggctgagg agagccactt gcacacactc ttaaagaaag tattacctgc accagctcag 10920 tgagaggcac agatcagact gttacttgaa tcaaattatg agcctcccca aatatatcta 10980 tgacatttaa ataggggatt acttgaacat agactttggg atccggtgtg gagtgcagga 11040 gactagcaaa gtgaatcctg agagtagcag gtctgcacct gttggatcga gaaaggcggc 11100 ctacaattct ggtcaaatga gctgtgctta ttgacatatt ctattagaga gtactaccag 11160 gtcaccagtc accagaaagg ctgccagctc tccaaccacc tccagggaac tatcctgaat 11220 ggggccttaa caagcctaag agagggttgg tttgggtccc aagccaatat ttgctctgct 11280 ttatgtcagt catatggaac ccaaaccaac cctctcctat gtgcctcacc agtcggtgca 11340 gggatcccaa tttcaagttt ggttttttat ggtcaaagtc cagcatagat taaatgaagg 11400 ggtgtgatga tggtgttaaa agagaactcc agaccagttt aactcttgga cacacatccc 11460 atctcaccat ggtgcttcca accttccaga gatgatgggc tcctattttc tgatgacaaa 11520 gccctccaca ggattgctgc ctggccatca gggagtgcct ctgtaactga ggctgagatc 11580 ccactttcag tcctccagct gtggcccatc cctgctccgc ccaccgggta tggcctgtcc 11640 taggctctta ggtatggctg cattgtgaaa tgatggctac agagctggca tctcctgtag 11700 tctggttcat ctagtgcact acctcatagt taaaagaaat ctgtttaagc cactgagggt 11760 ggctcctagt gccaactcca agaacaggaa gcttcccttt tttgggagga ggggcagatg 11820 gtaacatgga tcgtccaggt caatgggagc agggcaacca cagtaagtac tggacaacaa 11880 cacaaaactc catgtgtggc ttccatcgag tccctctcca attggtttgg tcttctccgt 11940 cccatgcagc actttagcaa ggggcctggc tgaaggctat gaattgtgtg gagcctcctc 12000 attgcagtct ccaaccatct gatgctggga aaatgtcacc aggatgcagc catgccgtgt 12060 ggccaatgaa ccgagaaaac accccttttc tagaatgctc taaagaggca gaataatcca 12120 gaggtgagga aggaaatact ccaccagaga cccaggcagt tcctacaaaa gccagacttt 12180 ccttcaccta gggagtgaca agaccagtgg aaaacactct caagcagtaa cccccaaatg 12240 ctctgcaagc cagtggcgtc cagataccgc acaagcgagt gggctgtcta atcccatcat 12300 catgatgtaa atatctctag gctgccccgg gctgtgcctg accctgtctt cagctttcca 12360 cacctccacc tacagcccat gcacagaagg accacccagg aatgctgcaa gtgtggcacc 12420 tccagggcca cccagggaga aggagggcag ctatgctggt ggctccaggc ccatttggcg 12480 ggtggtacct tcacaccaca aagcccaaac tgaggcccca gatttggctg atgagggcat 12540 attggacagg ggtcacttat gctcttcccc attgccacct ggcctctggc tacctggact 12600 tggctacctg tggatcctct cacaggtgcc accatcttgg ctgagtctcc agatgcgagg 12660 tccctgaggc agtggcaggc ttctcgctaa tgctgatggg attaggaatg ggataggtgg 12720 ggagggccct ggactgggcc ctgatgagcc aagtgggttt ttagaggggc tactggtaca 12780 tttcagggac aggacatctg gtagagctaa gctggggcaa taaggagcca ctgctaatct 12840 gagagctaga aacaatcagc ttctgggtca ttattaatta gggtagtttg ggctgtgtgg 12900 aagtcacgta ctatatgggg tagccacagc tctctctaca gataatctct aagacttctg 12960 attgggaccg tgtgaatgca gtagcaatat ctcttcttac tgccaggccc tgccagtcct 13020 gcctccacgc cctggctggc cccccttatg atctgaccca tgccaggctg ccatagtatg 13080 ttacttctgc attagcactc cttgggacct gcctctccac tgtccctcag actttaaaga 13140 actatacaaa cccaaggggc tcttcccaag agaattgata tgacttgagg tgattccatt 13200 tctggaagta gtcactccat tttctgcctc actctttcag tgcttcacag agcaggttcg 13260 attaagcaca cagattaatc gtaactataa cggtcctaag gtagcgaaag cttgcatgcc 13320 tgcaggtcga ctctagagga tcaaacctag ccaccgcggt ggcggccggc tagccggcta 13380 gccggctagc cctagaacta gtaacggccg ccagtgtgct ggaattcggc ttgtaaggta 13440 ccggtgaagt tcctatactt tctagagaat aggaacttcg gaataggaac ttctacctag 13500 atgcatgctc gagcggcccc tacagttgaa gtcggaagtt tacatacact taagttggag 13560 tcattaaaac tcgtttttca actactccac aaatttcttg ttaacaaaca atagttttgg 13620 caagtcagtt aggacatcta ctttgtgcat gacacaagtc atttttccaa caattgttta 13680 cagacagatt atttcactta taattcactg tatcacaatt ccagtgggtc agaagtttac 13740 atacactaag ttgactgtgc ctttaaacag cttggaaaat tccagaaaat gatgtcatgg 13800 ctttagaagc ttctgataga ctaattgaca tcatttgagt caattggagg tgtacctgtg 13860 gatgtatttc aaggaattct gtggaatgtg tgtcagttag ggtgtggaaa gtccccaggc 13920 tccccagcag gcagaagtat gcaaagcatg catatcgata ctagtttata agatctcgag 13980 ctagggtacc gtcaaggctg cagtgagaca tgatcttgcc actgcactcc agcctggaca 14040 gcagagtgaa accttgcctc acgaaacaga atacaaaaac aaacaaacaa aaaactgctc 14100 cgcaatgcgc ttccttgatg ctctaccaca taggtctggg tactttgtac acattatctc 14160 attgctgttc ataattgtta gattaatttt gtaatattga tattattcct agaaagctga 14220 ggcctcaaga tgataacttt tattttctgg acttgtaata gctttctctt gtattcacca 14280 tgttgtaact ttcttagagt agtaacaata taaagttatt gtgagttttt gcaaacacag 14340 caaacacaac gacccatata gacattgatg tgaaattgtc tattgtcaat ttatgggaaa 14400 acaagtatgt actttttcta ctaagccatt gaaacaggaa taacagaaca agattgaaag 14460 aatacatttt ccgaaattac ttgagtatta tacaaagaca agcacgtgga cctgggagga 14520 gggttattgt ccatgactgg tgtgtggaga caaatgcagg tttataatag atgggatggc 14580 atctagcgca atgactttgc catcactttt agagagctct tggggacccc agtacacaag 14640 aggggacgca gggtatatgt agacatctca ttctttttct tagtgtgaga ataagaatag 14700 ccatgacctg agtttataga caatgagccc ttttctctct cccactcagc agctatgaga 14760 tggcttgccc tgcctctcta ctaggctgac tcactccaag gcccagcaat gggcagggct 14820 ctgtcagggc tttgatagca ctatctgcag agccagggcc gagaaggggt ggactccaga 14880 gactctccct cccattcccg agcagggttt gcttatttat gcatttaaat gatatattta 14940 ttttaaaaga aataacagga gactgcccag ccctggctgt gacatggaaa ctatgtagaa 15000 tattttgggt tccatttttt tttccttctt tcagttagag gaaaaggggc tcaggatcca 15060 cttgcccagt gttcttcctt agttcctacc ttcgaccttg atcctccttt atcttcctga 15120 accctgctga gatgatctat gtggggagaa tggcttcttt gagaaacatc ttcttcgtta 15180 gtggcctgcc cctcattccc actttaatat ccagaatcac tataagaaga atataataag 15240 aggaataact cttattatag gtaagggaaa attaagaggc atacgtgatg ggatgagtaa 15300 gagaggagag ggaaggatta atggacgata aaatctacta ctatttgttg agacctttta 15360 tagtctaatc aattttgcta ttgttttcca tcctcacgct aactccataa aaaaacacta 15420 ttattatctt tattttgcca tgacaagact gagctcagaa gagtcaagca tttgcctaag 15480 gtcggacatg tcagaggcag tgccagacct atgtgagact ctgcagctac tgctcatggg 15540 ccctgtgctg cactgatgag gaggatcaga tggatggggc aatgaagcaa aggaatcatt 15600 ctgtggataa aggagacagc catgaagaag tctatgactg taaatttggg agcaggagtc 15660 tctaaggact tggatttcaa ggaattttga ctcagcaaac acaagaccct cacggtgact 15720 ttgcgagctg gtgtgccaga tgtgtctatc agaggttcca gggagggtgg ggtggggtca 15780 gggctggcca ccagctatca gggcccagat gggttatagg ctggcaggct cagataggtg 15840 gttaggtcag gttggtggtg ctgggtggag tccatgactc ccaggagcca ggagagatag 15900 accatgagta gagggcagac atgggaaagg tgggggaggc acagcatagc agcatttttc 15960 attctactac tacatgggac tgctccccta tacccccagc taggggcaag tgccttgact 16020 cctatgtttt caggatcatc atctataaag taagagtaat aattgtgtct atctcatagg 16080 gttattatga ggatcaaagg agatgcacac tctctggacc agtggcctaa cagttcagga 16140 cagagctatg ggcttcctat gtatgggtca gtggtctcaa tgtagcaggc aagttccaga 16200 agatagcatc aaccactgtt agagatatac tgccagtctc agagcctgat gttaatttag 16260 caatgggctg ggaccctcct ccagtagaac cttctaacca gctgctgcag tcaaagtcga 16320 atgcagctgg ttagactttt tttaatgaaa gcttgcatgc agcactttgg gaggctgagg 16380 tgggtggact gcttggagct caggagttca agaccatctt ggacaacatg gtgataccct 16440 gcctctacaa aaagtacaaa aattagcctg gcatggtggt gtgcacctgt aatcccagct 16500 attagggtgg ctgaggcagg agaattgctt gaacccggga ggcggaggtt gcagtgagct 16560 gagatcgtgc cactgcactc cagcctgggg gacagagcac attataatta actgttattt 16620 tttacttgga ctcttgtggg gaataagata catgttttat tcttatttat gattcaagca 16680 ctgaaaatag tgtttagcat ccagcaggtg cttcaaaacc atttgctgaa tgattactat 16740 actttttaca agctcagctc cctctatccc ttccagcatc ctcatctctg attaaataag 16800 cttcagtttt tccttagttc ctgttacatt tctgtgtgtc tccattagtg acctcccata 16860 gtccaagcat gagcagttct ggccaggccc ctgtcggggt cagtgcccca cccccgcctt 16920 ctggttctgt gtaaccttct aagcaaacct tctggctcaa gcacagcaat gctgagtcat 16980 gatgagtcat gctgaggctt agggtgtgtg cccagatgtt ctcagcctag agtgatgact 17040 cctatctggg tccccagcag gatgcttaca gggcagatgg caaaaaaaag gagaagctga 17100 ccacctgact aaaactccac ctcaaacggc atcataaaga aaatggatgc ctgagacaga 17160 atgtgacata ttctagaata tattatttcc tgaatatata tatatatata cacatatacc 17220 atatgaaaca cctctaggct ataaggcaac agagctcctt tttttttttt ctgtgctttc 17280 ctggctgtcc aaatctctaa tgataagcat acttctattc aatgagaata ttctgtaaga 17340 ttatagttaa gaattgtggg agccattccg tctcttatag ttaaatttga gcttctttta 17400 tgatcactgt ttttttaata tgctttaagt tctggggtac atgtgccatg gtggtttgct 17460 gcacccatca acccgtcatc tacattaggt atttctccta atgctatcct tcccctagcc 17520 ccccaccccc aacaggcccc agtgtgtgat gttcccctcc ctgtgtccat ggatcactgg 17580 tttttttttg tttttttttt ttttttaaag tctcagttaa atttttggaa tgtaatttat 17640 tttcctggta tcctaaggac ttgcaagtta tctggtcact ttagccctca cgttttgatg 17700 ataatcacat atttgtaaac acaacacaca cacacacaca cacacacata tatatatata 17760 taaaacatat atatacataa acacacataa catatttatc gggcatttct gagcaactaa 17820 tcatgcagga ctctcaaaca ctaacctata gccttttcta tgtatctact tgtgtagaaa 17880 ccaagcgtgg ggactgagaa ggcaatagca ggagcattct gactctcact gcctttagct 17940 aggcccctcc ctcatcacag ctcagcatag tcctgagctc ttatctatat ccacacacag 18000 tttctgacgc tgcccagcta tcaccatccc aagtctaaag aaaaaaataa tgggtttgcc 18060 catctctgtt gattagaaaa caaaacaaaa taaaataagc ccctaagctc ccagaaaaca 18120 tgactaaacc agcaagaaga agaaaataca ataggtatat gaggagactg gtgacactaa 18180 gtgtctgaat gaggcttgag tacagaaaag aggctctagc agcatagtgg tttagaggag 18240 atgtttcttt ccttcacaga tgccttagcc tcaataagct tgcggttgtg gaagtttact 18300 tgtttatcac cggtgacgtc catgagcaaa ttaagaaaaa caacaacaaa tgaatgcata 18360 tatatgtata tgtatgtgtg tatatataca catatatata tatatttttt ttcttttctt 18420 accagaaggt tttaatccaa ataaggagaa gatatgctta gaactgaggt agagttttca 18480 tccattctgt cctgtaagta ttttgcatat tctggagacg caggaagaga tccatctaca 18540 tatcccaaag ctgaattatg gtagacaaaa ctcttccact tttagtgcat caatttctta 18600 tttgtgtaat aagaaaattg ggaaaacgat cttcaatatg cttaccaagc tgtgattcca 18660 aatattacgt aaatacactt gcaaaggagg atgtttttag tagcaatttg tactgatggt 18720 atggggccaa gagatatatc ttagagggag ggctgagggt ttgaagtcca actcctaagc 18780 cagtgccaga agagccaagg acaggtacgg ctgtcatcac ttagacctca ccctgtggag 18840 ccacacccta gggttggcca atctactccc aggagcaggg agggcaggag ccagggctgg 18900 gcataaaagt cagggcagag ccatctattg cttacatttg cttctgacac aactgtgttc 18960 actagcaacc tcaaacagac accatgggtc atttcacaga ggaggacaag gctactatca 19020 caagcctgtg gggcaaggtg aatgtggaag atgctggagg agaaaccctg ggaaggtagg 19080 ctctggtgac caggacaagg gagggaagga aggaccctgt gcctggcaaa agtccaggtc 19140 gcttctcagg atttgtggca ccttctgact gtcaaactgt tcttgtcaat ctcacaggct 19200 cctggttgtc tacccatgga cccagaggtt ctttgacagc tttggcaacc tgtcctctgc 19260 ctctgccatc atgggcaacc ccaaagtcaa ggcacatggc aagaaggtgc tgacttcctt 19320 gggagatgcc ataaagcacc tggatgatct caagggcacc tttgcccagc tgagtgaact 19380 gcactgtgac aagctgcatg tggatcctga gaacttcaag gtgagtccag gagatgtttc 19440 agccctgttg cctttagtct cgaggcaact tagacaactg agtattgatc tgagcacagc 19500 agggtgtgag ctgtttgaag atactggggt tgggggtgaa gaaactgcag aggactaact 19560 gggctgagac ccagtggtaa tgttttaggg cctaaggagc gcctctaaaa atctagatgg 19620 acaattttga ctttgagaaa agagaggtgg aaatgaggaa aatgactttt attagattcc 19680 agtagaaaga actttcatct ttccctcatt tttgttcgtt ttaaaacatc tatctggagg 19740 caggacaagt atggtcgtta aaaagatgca ggcagaaggc atatattggc tcagtcaaag 19800 tggggaactt tggtggccaa acatacattg ctaaggctat tcctatatca gctggacaca 19860 tataaaatgc tgctaatgct tcattacaaa cttatatcct ttaattccag atgggggcaa 19920 agtatgtcca ggggtgagga acaattgaaa catttgggct ggagtagatt ttgaaagtca 19980 gctctgtgtg tgtgtgtgtg tgcgcgcgcg cgtgtgtgtg tgtgtgtgtc aacgtgtgtt 20040 tcttttaacg tcttcagcct acaacataca gggttcatgg tggcaagaag atagcaagat 20100 ttaaattatg gccagtgact agtgcttgaa ggggaacaac tacctgcatt taatgggaag 20160 gcaaaatctc aggctttgag ggaagttaac ataggcttga ttctgggtag aagctgggtg 20220 tgtagttatc tggaggccag gctggagctc tcagctcact atgggttcat ctttattgtc 20280 tcctttcatc tcaacagctc ctgggaaatg tgctggtgac cgttttggca atccatttcg 20340 gcaaagaatt cacccctgag gtgcaggctt cctggcagaa gatggtgact gcagtggcca 20400 gtgccctgtc ctccagatac cactgagcct cttgcccatg attcagagct ttcaaggata 20460 ggctttattc tgcaagcaat tcaaataata aatctattct gctgagagat cacacatgat 20520 tttcttcagc tctttttttt acatcttttt aaatatatga gccacaaagg gtttatattg 20580 agggaagtgt gtatgtgtat ttctgcatgc ctgtttgtgt ttgtggtgtg tgcatgctcc 20640 tcatttattt ttatatgaga tgtgcatttt gttgagcaaa taaaagcagt aaagacactt 20700 gtacacggga gttctgcaag tgggagtaaa tggtgtagga gaaatccggt gggaagaaag 20760 acctctatag gacaggactt ctcagaaaca gatgttttgg aagagatggg aaaaggttca 20820 gtgaagacct gggggctgga ttgattgcag ctgagtagca aggatggttc ttaatgaagg 20880 gaaagtgttc caagctttag gaattcaagg tttagtcagg tgtagcaatt ctattttatt 20940 aggaggaata ctatttctaa tggcacttag cttttcacag cccttgtgga tgcctaagaa 21000 agtgaaatta atcccatgcc ctcaagtgtg cagattggtc acagcatttc aagggagaga 21060 cctcattgta agactctggg ggaggtgggg acttaggtgt aagaaatgaa tcagcagagg 21120 ctcacaagtc agcatgagca tgttatgtct gagaaacaga ccagcactgt gagatcaaaa 21180 tgtagtggga agaatttgta caacattaat tggaaggctt acttaatgga atttttgtat 21240 agttggatgt tagtgcatct ctataagtaa gagtttaata tgatggtgtt acggacctaa 21300 tgtttgtgtc tcctcaaaat tcacatgctg aatccccaac tcccaactga ccttatctgt 21360 gggggaggct tttgaaaagt aattaggttt agatgagctc ataagagcag atccccatca 21420 taaaattatt ttccttatca gaagcagaga gacaagccat ttctctttcc tcccggtgag 21480 gacacagtga gaagtccgcc atctgcaatc caggaagaga accctgacca cgagtcagcc 21540 ttcagaaatg tgagaaaaaa ctctgttgtt gaagccaccc agtcttttgt attttgttat 21600 agcaccttgc actgagtaag gcagatgaag aaggagaaaa aaataagctt atcgaaacgc 21660 gtccccatcc tcactgactc cgtcctggag ttggatgaga gataatggcc ttacgttgtg 21720 ccaggggagg gtcgggctgg atttagcaag atttaccttc tccaaagagc ggtgctgcag 21780 tggcacagct gcccacggag gtgggggggt caccgtccct ggaggtgatg aagaactgtg 21840 gggatgtggc actgagggac atggccagtg ggcacggtgg gtgggttggg gttggtcttg 21900 gggatcttgg agggcttttc cagccttcat gatttgacga ttgtatgaac atctacatgg 21960 caattctcca gctgcctgtc ccagtcctac tgacccagct gtatctctcc aggcaagctc 22020 ttccacccct tctgcttgca tccagacacc atcaaacatg caggctcaga cacagggacc 22080 agcagtgtct gtggcctttt tgtgctcctc tccatgctgg gttttaactt gctctttgtc 22140 cttctatcct atcttcttat ccttaaggct gttctgaacg ctgtgacttg gagagtgtcc 22200 cagagccctc aacacctgca tgtcccacgt ccatgctgtc ctgcacttcc ttatccccaa 22260 gatctgcctc tccgtgatgc actgaattgg caaacatgtg tcaccccaga ccaacaatgt 22320 cacagcaaac tcccccttga taggacaagg gggaatggct ttacactgag acaggggagg 22380 tttgggttgg atatgaggag gcagtttttc ccccagaggg tggtgacgca ctgaacaggt 22440 tgcccaagga ggctgtggat gccccatccc tgcaggcatt caaggccagg ctggatgtgg 22500 ctctgggcag cctgggctgc tggttgatga ccctgcacat agcagggggt tggatctgga 22560 tgagcactgt gctcctttgc aacccaggcc gttctatgat tctgtcattc taaatctctc 22620 tttcagccta aagctttttc cccgtatccc cccaggtgtc tgcaggctca aagagcagcg 22680 agaagcgttc agaggaaagc gatcccgtgc caccttcccc gtgcccgggc tgtccccgca 22740 cgctgccggc tcggggatgc ggggggagcg ccggaccgga gcggagcccc gggcggctcg 22800 ctgctgcccc ctagcggggg agggacgtaa ttacatccct gggggctttg ggggggggct 22860 gtccctatcg attactagtt tagccataga gcccaccgca tccccagcat gcctgctatt 22920 gtcttcccaa tcctccccct tgctgtcctg ccccacccca ccccccagaa tagaatgaca 22980 cctactcaga caatgcgatg caatttcctc attttattag gaaaggacag tgggagtggc 23040 accttccagg gtcaaggaag gcacggggga ggggcaaaca acagatggct ggcaactaga 23100 aggcacagtc gctcgaagag cggccgctcg cttcagtttc ggccagcagg cggggagccc 23160 gaggtagctc ccgctccctt gagccaggcc cctgccagac ctgagctccc tcccaagcct 23220 ggcttcccca accggtggcc ttcatgggcc agaagccatt ccttcacggc tagccctccg 23280 gagtagttgc ccacggctcc gctgctgcag accactctgt ggcacgggat gaggatcttg 23340 acaggattgc ctctcatggc gcctcccact gctcgcgcgg ctttggggtt gccggccagg 23400 gcggccaatt gctggtaaga aatcacttct ccgaatttca caaccttaag cagcttccat 23460 aacacctgac gcgtgaacga ctcttgctgg aaaacgggat ggtgaagcgc tggcacgggg 23520 aactcttcga tagcctcggg ctggtggaaa taggcattca gccaggctgt gcactgcatc 23580 aggggctccg gacctccgag aaccgcagcg ggggctggga cctccacggc atcagctgca 23640 gacgtcccct tgcccaggag ctttatttcg tgcagaccct gctcacaacc agacagctcc 23700 agcttcccca aagggctgtc cagtgtggtg cgtttcattt cacaatcctt gtccatggtg 23760 gcgaccgtct agcccctggg gagagaggtc ggtgattcgg tcaacgaggg agccgactgc 23820 cgacgtgcgc tccggaggct tgcagaatgc ggaacaccgc gcgggcagga acagggccca 23880 cactaccgcc ccacaccccg cctcccgcac cgccccttcc cggccgctgc tctcggcgcg 23940 ccccgctgag cagccgctat tggccacagc ccatcgcggt cggcgcgctg ccattgctcc 24000 ctggcgctgt ccgtctgcga gggtactagt gagacgtgcg gcttccgttt gtcacgtccg 24060 gcacgccgcg aaccgcaagg aaccttcccg acttaggggc ggagcaggaa gcgtcgccgg 24120 ggggcccaca agggtagcgg cgaagatccg ggtgacgctg cgaacggacg tgaagaatgt 24180 gcgagaccca gggtcggcgc cgctgcgttt cccggaacca cgcccagagc agccgcgtcc 24240 ctgcgcaaac ccagggctgc cttggaaaag gcgcaacccc aaccccgtgg aaataaatcg 24300 ataactagtg atatcatcat gtctggatcc catcacaaag ctctgacctc aatcctatag 24360 aaaggaggaa tgagccaaaa ttcacccaac ttattgtggg aagcttgtgg aaggctactc 24420 gaaatgtttg acccaagtta aacaatttaa aggcaatgct accaaatact aattgagtgt 24480 atgttaactt ctgacccact gggaatgtga tgaaagaaat aaaagctgaa atgaatcatt 24540 ctctctacta ttattctgat atttcacatt cttaaaataa agtggtgatc ctaactgacc 24600 ttaagacagg gaatctttac tcggattaaa tgtcaggaat tgtgaaaaaa gtgagtttaa 24660 atgtatttgg ctaaggtgta tgtaaacttc cgacttcaac tgtaggggat cctctagggc 24720 cgccagtgtg atggatatct gcagaattcg gcttcaggta ccgtcgacga tgtaggtcac 24780 ggtctcgaag ccgcggtgcg ggtgccaggg cgtgcccttg ggctccccgg gcgcgtactc 24840 cacctcaccc atctggtcca tcatgatgaa cgggtcgagg tggcggtagt tgatcccggc 24900 gaacgcgcgg cgcaccggga agccctcgcc ctcgaaaccg ctgggcgcgg tggtcacggt 24960 gagcacggga cgtgcgacgg cgtcggcggg tgcggatacg cggggcagcg tcagcgggtt 25020 ctcgacggtc acggcgggca tgtcgacaag ccgaattcca gcacactggc ggccgttact 25080 aggtagctag ctcgagcctt cgaagatctc ctagggaagt tcctatactt tctagagaat 25140 aggaacttcg gaataggaac ttcaccggtg ggtgaaaagc cgaattctgc agatatcaag 25200 cttatcgata ccgtcgacct cgaggggggg cccggttaga tccccgggta ccgagctcga 25260 atatctatgt cgggtgcgga gaaagaggta atgaaatgga ttaagtggca ggattaatct 25320 tcgaacgaag gagccatcca actaaccgtc atgttcgggc aaccgaagaa gggagtggca 25380 ggatttcctt tggagacttc tggaattaga cagcagttta atgcaagcat ctaaattctc 25440 ttcctcccag agtctcatta aaactacagt aagagtttgt gttttgtttt gtttttaaag 25500 acaaaatccc accaggatag agagaatagg agaggagata acagcatcat aatttatgaa 25560 actaaaatgc agatagacca ggattaactg actacacagc accaaggaag ctgaatcaca 25620 agacagcaga ggagaaaact ggaaaggatc gtggtctata cggcagaatc ttcccaagcc 25680 tcaggaggag gagctctaga tgcttatgat ggcaactaaa gcctaaaagc taattcattt 25740 taaagttctt ccaaatgcat agggttttat ttttccagac ctgggttcag atggggaatt 25800 tgacaaacaa tggaaagggg gaaaaacaac aatctaaaca ctgagtgaca aagtaacaaa 25860 gaaatagtct agctatcagc cagtcaagcc agccttggct ttgctatcca aagtagtcag 25920 tctaattcta ccaccagttt ctgttcctgt agctgtctac tgcctgccag ggactctgcc 25980 ttcccaccca caactaccaa tggaaggatg tggtgaccat accagtggct gctgacatct 26040 cctgccatgg gaagcataat tgcctccagc agcctccccc ttagatccat catttttgtt 26100 gcacttggcc tgggctgtac tcccggccaa tgactgaaca tggtgagcat agtaatgcag 26160 gcccatttct gtgaggagca ggactcctcc agtaggtgac tttggctcaa ggactctcta 26220 ttggcctggt tgaacttttc ctgaactgtg ctactgtctg agactcttct tacccaatcc 26280 tctttctcgc cccaattgtc acagaccacc tgcattgtgg tctgagtctc tccccacctt 26340 ctcttgctct tccctgttta tctttcacag gcatttcccc cagtacattc cttgaatgtc 26400 taacccgata cgggtgcctg acttttggca gacctaagca gacaaaaagg agtacttggt 26460 tacctagctc ttctttctac cacaaacatc gagggaaccc tttttccctc acccctctgc 26520 cacaccccca ctgccccagt gaacaaccac agagagagct gtggtataat attaggctgg 26580 tgcaaaagta attgcggttt ttgccattac ttttaatggt aaaaaccgca attacttttg 26640 cacctaccta gtatttgtgt ccccccaaat tcatatgttg aaacctaacc cacaatatga 26700 tgtcattagg aggcaagacc ttgaggaggt gattagatga tggggtggag ctctcctgaa 26760 tgagattagt gcccttataa gaagaagccc aaggaagcta ccttgactct tccatcacat 26820 gagaatgcag caagaaggca ccatctacta atcaggaaga gagctctcac cagacactga 26880 atctgccagt gtcttgatct tgaagttccc agcctccaga actatgcata atgcatttcc 26940 attgtctcta agccacccag cctatggtat tttgtcatag cagcctgaac tgactaagac 27000 agtgagccac atgagaagtg ccccaacccc tcccttaagc acttggctca cagatcagtg 27060 ggttcatttc tgcctgagtt ttattgttat tctgtagatt tcttgggcta gatatatttt 27120 tctgttattt tccttcttca cctcagtcat gaattggttg ttttaaaaaa gacaatgtaa 27180 gtcatgggga aactcctgac aactctactc tcctagggtt cctgataaaa ggggattcag 27240 ttgagtcctc tgatggtctc tacctgccaa agtccagcag cccttagcaa acatgctgct 27300 cgtttctgta gagaaggtgc tggtgtccca ccatacttct ctctccctca tgaagggctt 27360 gcgacccagc aaatgggtgg cttatatggg tctgtttcaa aggaagagcc agctctggga 27420 agaaaaacga tgagcataag cataacctac cactgtgcct gggaaagcag acaacttttt 27480 tgatgtgtga atatctaatg agaatggaat ccatcaatta ccttaaactt aggcacagtc 27540 ttcaaattca atatatgtgg gatatacttt tagtcagttt gtagacgtta tttgtaataa 27600 ataatctggc ttctctaaag aaattatttt aagtgtttgg tttggtttga tttaatggta 27660 aaattatatt tagtggcaga gaattatagc aatggtgata aactatagag tgtcataagt 27720 tcatatctta ttctcacatt tgaagctgcc tgcagatgca ttcaagatgc agccagaagt 27780 caggagactc aggctgttat ttggagctca tcattttaca gccttgctgg actcccactt 27840 tctcagggga aaaatgtggt gttgacccag attagctctc caggccctgc tgagttgggc 27900 actctgtaag ctggagggtc ttctattgtc ttcacctaag tgtcaatcaa caacccaaat 27960 gggcatgggg gaagagggag ctgggccaat gcccagggtg cctggtagag agataccttg 28020 ggcactggaa ggcaccagct tcccagagag aagggggagg gccatgaaaa agttggctgt 28080 agatgccagg gacactggga ctctccagct gtgtgtttgt gtcttctgaa gacttatgtt 28140 tcattccttt ggagcatgca taatcataca ctgtgggatg tgttatatag attgcttgat 28200 agttcaccac tgtaataaaa tactgtgact ggaatctgct cccagtctgc ctttgatagc 28260 acttgtgcaa cacacattta ctgagcattt acagtgatcc aggacctgtg ttgtgaaaac 28320 attgatggac aaggcagatg gtggagcacg tcagtgagga tttttaacaa aggctggtaa 28380 gtgctataaa ggaacattgt aggacactag agaacaaaga acaggagaac ctgacttagg 28440 ctggggtggg gcgttggtta gaggaggctc cttggaggac atgaggttta agctgtgacc 28500 tgaggatgaa tagatgttgg ccaggtgagg ttaatctggg gctcaagatc gagcattaag 28560 cttgtcagcc ttaccagtaa aaaagaaaac ctattaaaaa aacaccactc gacacggcac 28620 cagctcaatc agtcacagtg taaaaaaggg ccaagtgcag agcgagtata tataggacta 28680 aaaaatgacg taacggttaa agtccacaaa aaacacccag aaaaccgcac gcgaacctac 28740 gcccagaaac gaaagccaaa aaacccacaa cttcctcaaa tcgtcacttc cgttttccca 28800 cgttacgtaa cttcccattt taagaaaact acaattccca acacatacaa gttactccgc 28860 cctaaaacct acgtcacccg ccccgttccc acgccccgcg ccacgtcaca aactccaccc 28920 cctcattatc atattggctt caatccaaaa taaggtatat tattgatgat gtttaaacta 28980 cggcccggta cccagctttt gttcccttta gtgagggtta attgcgcgct tggcgtaatc 29040 atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg 29100 agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat 29160 tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg 29220 aatcggccaa cgcgcgggga gaggcggttt gcgtattggg cgctcttccg cttcctcgct 29280 cactgactcg ctgcgctcgg tcgttcggct gcggcgagcg gtatcagctc actcaaaggc 29340 ggtaatacgg ttatccacag aatcagggga taacgcagga aagaacatgt gagcaaaagg 29400 ccagcaaaag gccaggaacc gtaaaaaggc cgcgttgctg gcgtttttcc ataggctccg 29460 cccccctgac gagcatcaca aaaatcgacg ctcaagtcag aggtggcgaa acccgacagg 29520 actataaaga taccaggcgt ttccccctgg aagctccctc gtgcgctctc ctgttccgac 29580 cctgccgctt accggatacc tgtccgcctt tctcccttcg ggaagcgtgg cgctttctca 29640 tagctcacgc tgtaggtatc tcagttcggt gtaggtcgtt cgctccaagc tgggctgtgt 29700 gcacgaaccc cccgttcagc ccgaccgctg cgccttatcc ggtaactatc gtcttgagtc 29760 caacccggta agacacgact tatcgccact ggcagcagcc actggtaaca ggattagcag 29820 agcgaggtat gtaggcggtg ctacagagtt cttgaagtgg tggcctaact acggctacac 29880 tagaaggaca gtatttggta tctgcgctct gctgaagcca gttaccttcg gaaaaagagt 29940 tggtagctct tgatccggca aacaaaccac cgctggtagc ggtggttttt ttgtttgcaa 30000 gcagcagatt acgcgcagaa aaaaaggatc tcaagaagat cctttgatct tttctacggg 30060 gtctgacgct cagtggaacg aaaactcacg ttaagggatt ttggtcatga gattatcaaa 30120 aaggatcttc acctagatcc ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat 30180 atatgagtaa acttggtctg acagttacca atgcttaatc agtgaggcac ctatctcagc 30240 gatctgtcta tttcgttcat ccatagttgc ctgactcccc gtcgtgtaga taactacgat 30300 acgggagggc ttaccatctg gccccagtgc tgcaatgata ccgcgagacc cacgctcacc 30360 ggctccagat ttatcagcaa taaaccagcc agccggaagg gccgagcgca gaagtggtcc 30420 tgcaacttta tccgcctcca tccagtctat taattgttgc cgggaagcta gagtaagtag 30480 ttcgccagtt aatagtttgc gcaacgttgt tgccattgct acaggcatcg tggtgtcacg 30540 ctcgtcgttt ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg 30600 atcccccatg ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg ttgtcagaag 30660 taagttggcc gcagtgttat cactcatggt tatggcagca ctgcataatt ctcttactgt 30720 catgccatcc gtaagatgct tttctgtgac tggtgagtac tcaaccaagt cattctgaga 30780 atagtgtatg cggcgaccga gttgctcttg cccggcgtca atacgggata ataccgcgcc 30840 acatagcaga actttaaaag tgctcatcat tggaaaacgt tcttcggggc gaaaactctc 30900 aaggatctta ccgctgttga gatccagttc gatgtaaccc actcgtgcac ccaactgatc 30960 ttcagcatct tttactttca ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc 31020 cgcaaaaaag ggaataaggg cgacacggaa atgttgaata ctcatactct tcctttttca 31080 atattattga agcatttatc agggttattg tctcatgagc ggatacatat ttgaatgtat 31140 ttagaaaaat aaacaaatag gggttccgcg cacatttccc cgaaaagtgc cacctgacgc 31200 gccctgtagc ggcgcattaa gcgcggcggg tgtggtggtt acgcgcagcg tgaccgctac 31260 acttgccagc gccctagcgc ccgctccttt cgctttcttc ccttcctttc tcgccacgtt 31320 cgccggcttt ccccgtcaag ctctaaatcg ggggctccct ttagggttcc gatttagtgc 31380 tttacggcac ctcgacccca aaaaacttga ttagggtgat ggttcacgta gtgggccatc 31440 gccctgatag acggtttttc gccctttgac gttggagtcc acgttcttta atagtggact 31500 cttgttccaa actggaacaa cactcaaccc tatctcggtc tattcttttg atttataagg 31560 gattttgccg atttcggcct attggttaaa aaatgagctg atttaacaaa aatttaacgc 31620 gaattttaac aaaatattaa cgcttacaat ttccattcgc cattcaggct gcgcaactgt 31680 tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 31740 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 31800 acggccagtg agcgcgcgta atacgactca ctatagggcg aattggagct ccactacgta 31860 gtttaaacat catcaataat ataccttatt ttggattgaa gccaatatga taatgagggg 31920 gtggagtttg tgacgtggcg cggggcgtgg gaacggggcg ggtgacgtag tagtgtggcg 31980 gaagtgtgat gttgcaagtg tggcggaaca catgtaagcg acggatgtgg caaaagtgac 32040 gtttttggtg tgcgccggtg tacacaggaa gtgacaattt tcgcgcggtt ttaggcggat 32100 gttgtagtaa atttgggcgt aaccgagtaa gatttggcca ttttcgcggg aaaactgaat 32160 aagaggaagt gaaatctgaa taattttgtg ttactcatag cgcgtaatat ttgtctaggg 32220 ccgcggggac tttgaccgtt tacgtggaga ctcgcccagg tgtttttctc aggtgttttc 32280 cgcgttccgg gtcaaagttg gcgttttgat tc 32312 <210> 62 <211> 32670 <212> DNA <213> Artificial Sequence <220> <223> pHCA-sgHBG1-miR <400> 62 ggccgaagga ttacatgagc ttagaaatgt aattagcata gtgtgtggca tagtgtagat 60 accaaataaa tatgatctct ccttctactc ttgaaaatgc aaacacattc ttggtggtcc 120 taaaatagcc tgtaacatgg tttactcagc agcatttgct attcaaggca gatctgcctt 180 tagtcattgg ctgcgctcct gaacagctgt gtgaaaggct aacttttgta aaccaaatca 240 aaataaaatg cagcaaaaat ttgtcactga aaggaaatcc tcagtatatc cttttatgaa 300 atgaaagatc cctcatccaa acttaacttt tttaaaagtg cgcatttgga gatatagccc 360 tttcttatga atcctaattc aattttggcc ataaacacac gttgatgttc cccaccccaa 420 agcacatagc aacaagagta ggttctatat tgaaaataat gacaatttaa aaacatgtac 480 ttatttcact gtatgtggac agtgtctatg attgcatcat gaagtgtcat ataaccatgt 540 acgtgtacat gagagagaga tagagagaga agtggtaggg tggtggtggt agaggggatg 600 gcgatagtaa tcatggtaat ggtagaggtg atggaggtgg taatgacgga ggtaagggtg 660 gtagtgatga tggtggtggt ggtaatggtg gtggatgtgg tggtggcaat tgggatggtg 720 ggatggtggt agccatggtg atggtggtaa tggtgttgat ttaaagggtg gtggtagtga 780 aggtgagggt agtggtggtg gaggtggtgg tgctggtagc aatagtgatg gtggtgatgg 840 tgttgatgag ggtgttggga tcagggtgag ttcccacagt atatttcatt cttgttgtac 900 cactctgtca acagcaccac tgactgggac agaggaagaa ggcacactct gaatgtgtta 960 ttaacagaaa cctcaaaaca gtctgtctcc ttgtagtcat tcaaaattat ctttttctta 1020 cctggaaaac tgaaactgaa ttaccgggaa aaacacagga gatttttgtt tgttaatatg 1080 ctgccaataa agtaatttta tgtcaaattt aactacagga aagggcaagg cattttctaa 1140 gttccttaga tgtcatgtgg ctaaaaaaaa caaaaggatg gacagcagtt agatactgta 1200 cacttagctg tttgaagcca tatattcaga aagcagatgt tgggagttgg tgtttgagga 1260 ctgatttcct ggaggtattt tatataggcc aagttcattg ttctaaactc taagggcttg 1320 acttgaggga ggaaaagagg caagaacatg tttagttttg ctgacagcat cacatgggca 1380 gccctaaggc tagacaactt tagggcctga agcttattct aggaaagaag cacctacaga 1440 gtggcactgg gctcccctcc actatagaga tgaagtcata tgacagtaaa gggcaggcag 1500 ggctgcctag ggggcccaga actgacactt ccattagaat gagcacaggc cagggagaga 1560 agtggggaac cagagagaag gagctggaat tctagtagga caaacggtaa gtgaacaaca 1620 agaacaagtt aagagtgtgt gcagtattct ttcaaagact gaaaaaatag tgatgtgata 1680 gaatggcagg tggctctgag caggccagga gaaggactgg gggcagagca tcccaggcag 1740 gagggcagca agtgggaagg ccctggggtg gggcttttgg actgttccag tgacgggcag 1800 gcagccagtg tgcctgtcac acaatgcacc agggaagtag tcgtgaattt gcagagggtc 1860 ttgcaggcta tgggaaaggg attggattgt attttgtttg tagggaagcc atcgggggac 1920 ttaagcagag gaaggattgg cttcatctct ttgaaaaagt tctctctgga tgctgatggg 1980 aggagaaatg gaaggaaaag aaacactttt aggggcaaga acttttgaga agggtggaat 2040 tgggagtgtg gagttggggc cagctttggc acaggagggg aagctaaaca cgtggccgca 2100 tgagggcctg taattctacc tgaaatgggt accatttgtt agggtaaaca aatgaaccaa 2160 atgcccagtg atacagacca agtgttggca aacttcttct gtgatggccc aggtagtaaa 2220 tgtctcaggc ttcgcaggcc atgtggtctc tgttgaagct ctgtgtagta gacaatatgt 2280 taatgactgg gcgtgactgt gtgctaataa aagtttattt acaaaaacag cccgtgggct 2340 ggatttagct cacaggctgt agtttgccaa cctctgacct agagcatgaa ctgagcatct 2400 tcttggaggg aaataagttc tttccaagtt gccctcctca cattgcaggg ggccatgtag 2460 gcccattatt cacagaagag tgggtgggca acctttctgg agcagaaaaa cgtaaagatt 2520 tcttccgtag tgcaagtaag gtgaccattt ctaaaccgtg caagtgatcc agcagtccca 2580 aaagttgttt cacttctcat tgtgcgcccg ttctcaggtg ctccgaagct tccagtcctt 2640 tgtagggaca tggatgaaat tggaaatcat cattctcagt aaactatcgc aagaacaaaa 2700 aaccaaacac cgcatattct cactcatagg tgggaattga acaatgagat cacatggaca 2760 cgggaagggg aacatcacat tctggggact gttgtggggt ggggggaggg gggagggata 2820 gcattgggag atatacctaa tgctagatga caagttagtg ggtgcagcgc accagtgtgg 2880 cacatgtata catatgtaac taacctgcac aatgtgcaca tgtaccctaa aacttaaagt 2940 ataataataa aagaaaaaaa aaaagagagg agagaaacat catcccctcc aggataccct 3000 tgggccttgt tcttatagtc ttgtacattg ttgaacaatt tgcatgggct agtggattaa 3060 agcacaccct ccaccctcag gccctcaagg gtctctatga taatacagtc tcaccttcta 3120 ccctttccat caccatccta ggtgctatgg ccaaccttga ggctgccatg ttaggtctat 3180 gcatttccca cctccaccac ataactctct gaaggccagg tagtttccta ttcatcttgg 3240 taaccccaaa gcctcgtgac agggctcagc tggcatctgc ggatgtgaat gaaccattgg 3300 agaaaatggt actctgcaaa taactctgtt attttcccat ttcctgtgta aggcctagag 3360 acaatgactt tttaattgca ccccttcccc tctgtatgac actggccttc tcttgtgtcc 3420 agcaatgtgg gtggcctaga tgatttctaa gggacttctg gccaagatga acagcagctg 3480 catcttactg agcatttact atgtgccata tactcagcca cagctctagg ggcatagaag 3540 caggagctct cagggtcagg gcagtgagtg agcaagcgag cacctatgcc agccctgcct 3600 ctggatgggg acttgagagg gtgatggaag cctgcagcac tggagggagg cagacaaaga 3660 caggcctgtg ctgagggggc ccggagcaag agagagggag gcaatgacag cagagacatg 3720 cctgcgcctt gggtttgagt gcccagtggt caaatccact tccctgtggc tgatgcttgc 3780 ctttctaact ttggaattta ggggttggag atctggtgag aaggtaggag ggagatgagg 3840 aggagaaggg aaaggcagga aggaagggga gggaaaggaa aagcaaaagg ggaggaggaa 3900 ggtttccaac aaattattct atatcaactg cggaaatcaa aatttgttgc ccaaatctta 3960 gaagctcatg tccctcctcc ccagaagtct ggaatgcagc actccagggg tagcttataa 4020 cccaaatatc tatctgtaaa aagagaaaca ttgggctttc gagctgtgga ttctcagtaa 4080 aagcaagagg cctcagccta cacaggccag cccagagttt gaggaacccc aggcccacac 4140 ccacagggct ggcccctggg tctgcatact ccctagaaat gtgcacactt ctgagcctca 4200 actctgtcct ggagtctaac agcatccctc tccttcctgg ggcagttcca cctccagaaa 4260 cctgttacct tgggccttat gtcaaggaaa ctgtgggaaa gagctaggca ggaatgcaga 4320 tgaggccagc atgggctcct aaaagtttag aaataggcag tgtcatgctc ccaggtgcct 4380 gcataaacca gctgaaaaat ggagctcccc tcaccagcac tctcccttca aacagactgt 4440 gatttgcagg tcactggttt accaagccag gctacccagg caggacccag atgccaagcc 4500 cagtggtgtc ctgcaagctg agcagtgctc agttcttgca aaaaaaggtc tgtgtgaagg 4560 caaggcctct gcctggcttc tcaccccagt tgggtgtctg gaacaggaag gagcccttac 4620 tgcagaaaaa ggaggaggga gcaaagggag cgaacagctg cgtgctccat ggggaggatc 4680 cccaaagtag aaaggcgcat acacactgca gcccttgacc cagaatgctc acagctacat 4740 tacagattca ggtctcctca gtgtagtggg gctgctgatg agactgtggc atcctcaggg 4800 gtcaggacac acattttcca tcactcttct gatggcaaaa aacctctgag ccaatgccaa 4860 cctctgatca ttaaaaaaaa gtgctcacag cagtgtgtgg tttaggatca tgccctgtgt 4920 ggtttggaac acgtgcacaa ccacaccttg ttcatcacca tcccagaaac cctgacgcag 4980 gcaaagagca gagttattaa ccctacttta ctgatgtgga tactgaggcc cagaggctca 5040 tgcaagttat caataagtgg cagggacagt tgcctctaga ttaactagcc cctaggatca 5100 cctgggtctt ggaaggggac ccataaacat gagctcccct ctcttggggc cagatttgca 5160 cctgtgccgc gccttcagcc tgcatgaagt aggggctgct ggcaaagact caaagctgta 5220 aatctgggtt ttctcttgag gcttctaagg gagctgtttc gacaactcac tctgttccca 5280 gctggctgcc cctgcatagg gttttaaagc agcctagctt tctgccaggc ttggcagtgg 5340 acaacgctgg tcagaacatc ccagagagct accagaatga agtaagtttg cttctactct 5400 ttacctgttt atgggctgtc tctgccactg gaatgaaagg cactgagaac agtgcctggc 5460 ctgcagaagg ccctggaaat acctgagctc ctaatctggg aataggagta ggaagagctt 5520 tggaggcagg gcacctgagt ttgagatcta caacttcctg cctgtgtgac attgggaaag 5580 tctccatcct ttctgagcct cagtctccac cctggggaag tggaaatatc aatctctgtg 5640 acacagaagc aaatgagcga atgtgcacaa agtaccttgc acaagagaga cgctcaaaca 5700 cttgcctcca ggtttcaccg agaactacag agtaagatag atttgttccc agtggaggaa 5760 gcctgggaat aatttgcccc tagactatga attcctgggg ctcaagatcg agcacagggc 5820 caggcacaca gaagggaccc tggaaatgtg gcaggaggcc agagatagac aggcccttag 5880 agctcatacc catgccctct gacctcaaga agaaagaaac ctgctcaaaa tctcacaaag 5940 agcttgttcc aaccctgaat cgagtctgag gactccttcc tgagtccagc actttttctg 6000 caagaagtat atgcctccaa agctgatggg cgcaaatctt gaaccccgtc acataaacac 6060 aaagggagga ggtgactaga gctcctccta ctggatatgt ctaaggtcac cagtctaaag 6120 aaaagggatg gatagaatga ggccagtatt tttgcagcca tccaaatgtc cacatacgct 6180 gttacactga gggctcctct ctcccccgtc ttcagcccta cttgcattta gaggtgagaa 6240 agatatgggc tgaggggttg tttttcatcg tattgtagat ggaaagcaca ctgcccttgg 6300 ggccatccaa atgtggacct tgatgtagca ccccaccttc tggatggcca tccttctgaa 6360 agtcactgaa tttctcagac tttattctct ttatccataa agaaggagaa taataataat 6420 ccccccaccc tgcccaacca ctgactggtt gggaagctca gaagaaatac tgggcacggc 6480 atcccattgt aatctataga gtgagtcgct tcttaatatt aaatggctga acacagaaga 6540 tgtgcaaaaa gtactgtgtc cccttcctcc tccaactgaa catttcatgc cctttgcacc 6600 ctcattttgt ctaggagctg ccttatgaag ggaataggta cctgctccga gctggaggaa 6660 tctttgccac ttatggtggg gtatggactg agacagagat ggcatgtgac atgcgcactg 6720 agtctcaact ccatgcaggc tctggagcac tctcaaattg gagtactaat gccttttaaa 6780 ttctcacact agcaatcctt tgacctactg atctagggat ctagggaaag aatcgtgatc 6840 ttaacttcaa agggaaggac aaaatgttct gcctcctgtt aaaactccat acactaagtg 6900 cagagactgg atgccttatt aaccttgggt agatgcccaa atgttcaaaa ggtcaaactc 6960 ttctgttccc cagatcgcca gagtcattaa ccagtcacac tattaaatga atgaacagat 7020 gctgaaaagg tacttgcatt actgagattt cttatggtga tggcccctgc ctgatatgta 7080 ttcagcattt tgtagttttc aatgtgcatt agagtatagt ggtgatgaca ttggcctctg 7140 agtttgccac ttcttatatc tgtgactttg gtcaaattgc ttaatctctc tgagtctcgg 7200 tttcctggag ataataatag cttcttcttc ccagggttat catgaggatt acaggagata 7260 atgccccaaa aatgcttagt aaagtgccta gcacctagtc aatgctgaat taaaggtggt 7320 tattcttact tttcgttcat ttgaactttg ttctcaggga gggcaaagga tagacaaagc 7380 cccatagcta gtgaggagta gctgcaagac tagaacccag gtgttctgag ccctagtctt 7440 aggccaagaa caactgttac gtgagatgca cgttttcctt caagggagct cacaattatt 7500 tccatgtaaa ttcaaggact gctaaaagag aactctcctc tgggactgat atcattttat 7560 ttcaagattg atttgaaaca tgttttttgt ttgtttgttt gttttctagg aaagaacaag 7620 agaaccagtc aagctgaatg cctgaagcaa atctctgtta gcgatgtttt caggatgagg 7680 gagagtggtg caagaaacgt gcttccagat gcacatggtt tcctgggact agggttcagg 7740 gtgtcatccc tgggtgttat taagtgtcag aaggagagca aacaagggaa acatctgaga 7800 tccagctaag gctacaccct ggaaatgcaa gcccagctct tgcaaaggac ctcctttggc 7860 cactcacctt ccaggcctta caataacttg tttggactgc aggtttcttg gtggactcac 7920 aggccattct gcttttattt ggtcaacctc agttcacaag cacccagatg ctgagatcct 7980 cagcatgtgc agcagagttt catattagca ctgggtacct ttctgaggct acagggatac 8040 cgtacagcag cacctgtcac gtccagccaa aggagtgggc tctctcaatg tcatccaatg 8100 ctgtttcaac tgtgaagaag accatctgag agagttgctt ttggaggctg aggcaaattt 8160 ttaaaattct ttgttctcct caactggggt gaattcttgg tcttctagga cagcttgaag 8220 ttttagaaag agtcaagcca ctcagaacca acagagaact ctttcagaga acaaggtgtg 8280 gcatagagga ggcagagggc tgatcttgat caaatccaaa gtgtgactct aaagcaatga 8340 atgtgaattt ttggcaaagc ttacaaaggg ctctaaaggc catctgcaaa gagaagccaa 8400 gcctgatcga tgaatcacta gtgcggccgg atatcgatcg gcacgctgtt gattttctca 8460 tagtaaggaa cagtgggccc tttcagtccc acttctgtag tctgtggtac tacaaatggt 8520 gagcccatga tgttgccatt catagggtta ttctccagca gtaatgactg gccagccact 8580 cccatagccg cagggctagg atttattgtc aatggaggga cctgcagttc tgcacaagca 8640 gtactaggat gagcacctgg gcccattgca agggtgacat cttcaaggca aggcctctta 8700 attttattag ggtagccccc atcagccatg tctggaaact ggaagtggtc ttcttcttgt 8760 ctcctcttaa cagttccctg tgaatggaag agaagagaag aggagaagag aggagaggag 8820 aagggaagag aggtgacaca cacacacaca cacacacaca cacacacaga gagagagaga 8880 gagagacaga gagaaagaga gagagagaga gagaggaatt tttataaagg tttggcacat 8940 taaagctaat gaacaggaaa tgtgcatgat aaaacagacc tctcagttta aagacttata 9000 gttgtgaaaa ctataaaata cagcctgtct ttggaaccat agtgcttatt tattcattat 9060 tatgtttcat ctaaactgtc taattacatt tcaaataagg cattatgttg tctgtatact 9120 aaaacgggat agaacgttat tcaaagggta atctgcccac ttcaaggaga gttcaacaaa 9180 actatgcaga agtcactaaa tgaaccatgc tgccaaaggc aggcattgga gagaaaacta 9240 gaagtagcta aatagtttta attctttcct gtctacagac acatagattt taacgaagga 9300 ataccatagt atagaattga acttttaggc tgccttctag tcttggttaa atgcatcagg 9360 ctgcagtggt aaaattgaat acaacagagc ccttacagga aagaagtaga tctggatgtg 9420 ttttcttggg gagctgttta aaatactgtt tttgggaaag cacaagtttc agaacagtca 9480 ttgtaggcat cgtattcatt gttccattta tttttacaca cacacacaca cacacacaca 9540 cacacactct cacacattgc tatgtgtaca caaaaataat ttggaagaac ctatacccaa 9600 caatttggag tggtcattta tttgggatga ctggcaattc cctttctatt ctcttcattt 9660 ctgcttgttt gtctttaacg agaacgactc ataatccaaa aatttaaaaa agtataaagt 9720 tatctaaata agaaattttc ctctgaagat gcatcctcag gttggggaga tattaaacaa 9780 tgagaaaagg ccccaatctg ggatctgaac cttgggggag ctgcccatca tttatagaag 9840 cacagccttt gggaacaaag caaagtcact agcaatgtga gacttcctac tcttcatggc 9900 ttcatacagt catccatcgc tgttgtgtta atgaccatga cctgtatgtt agcaggtaaa 9960 tgggaaagga agtgggggca aaggagtatg tgcaggaatg atcaaaataa ggaaaggaag 10020 agagggatct ggaaatcacc tgaatgccga taggtgaaca ggtagaattc ttttaaagct 10080 tcccccaccc ggtacccccc aaataacccc tttccagctt tggaagtttc actaggacat 10140 acagtgctca tcctctgatg tcaccttaag tttggctctt ctggtttgat gagcttgtag 10200 cccactagga gctcaaggca tgcatggggc cacttgccag cacgatgagg ggcatgactg 10260 tcatggccaa gtgaacatca aagcagatcc ccagggctgt atgtctcagg ccttggtgca 10320 catcagaatc acttagaaac atccacattc ctgggccctc ccaccacaaa ctgacagctt 10380 catccagggt gtggcccagg catcgggagt ttttccaaca gctccatggc tgattctcaa 10440 cagaaaacca ctggcccaga gcaagggtgg aggcagcgtg gcatagggct ctgaccttgg 10500 ccttgccact gaacctctca gagccccagt ttctttatgt gtaaaatgag tgtaattata 10560 gttcttttct catgaaggtg ctctgactat taagtgaaac ggggcacatt gtatgacacc 10620 taatagctcc tcactaactg gtacccggca ttataaaggg caggtatgga agggttctgg 10680 gagtccaata cccttcttaa agacagagag gtctctgaga cccagagagg ggcaggcctt 10740 acccagagtt gctcagccag agggcaacaa ggcccaggtc agatgcaggg cccctccacc 10800 accactcagc tgcctccaga cccactgcct tcgccatgtt gttggtagga cactgcatcg 10860 cccccacaga aggggcttgc caacttgagt gagaggactt gcacacttct ttgacttttc 10920 ttttgagatg cccacaatct gaacaagggc acttcaaggg acagctctgt caccaaactc 10980 atctgaggcc tgaataccat gggtcaggca ggaatgggtt ggagaggtgt agagcaggca 11040 caataagagg gctgaggccc atgcagtcat cagtgcccac tttcccagga gtctgactgg 11100 gcacagcacc catagtgtcc ctgagctggt ccatggagca gctcactaac tgtttggccc 11160 acagcaggtg ctcagtaaat ggcagttgaa cgaatcaatg gacaaaggaa cataaattac 11220 ccaacacaca gggagctcag ccatttactc aatccattat ggagtaacct acaaacaagc 11280 cactgggtcc caaactgaaa ttgtgtctct tctacattct cccaaagaat ccaataggtt 11340 aaaaatagaa atgtatgaaa tagatcaatc agggatgatt gcatgtggat ttgacataag 11400 gatcccctgc agggagtctg agctggcaac agtcaggccc aaagtgctgt ccatgatgtc 11460 tcgaactgca agacagtttt aacaatggcg aagcaatgca gaaccaggca ggccaaggag 11520 ggggtggggg ttggggaaag gaagggaggg aaggggctgt gaggggcaat ggtctggcat 11580 ccctgccacg tgagcctctg aaatttgctg gcagcttcta tgggctccca gagctttcac 11640 ttaattgttg gtctgccact aacctgctgg gagtaaggtg cagggatgga ggaggcaggg 11700 catgaccacc agacactaaa ggtaccagct ggggccactg gcaaagggaa ggaggctgca 11760 cctctcctac atgagagccc gtatacacac accttttcca gcactcatca actgcatccc 11820 aagcaaatgg tccctgatca attccaattc tagaaaccaa ctgactactc aataacaaag 11880 tagatcccag caggccgcca ctgctggagc ggatgccact tttgctatgc caagtctgtg 11940 gctggacagc tgctggcatg tacactcact gactttcata aggatgccta ataaaggggg 12000 caggctcacc tggcttttct caggggtggg gtttggggtg ccgatagagg ctgctgtttt 12060 ggcagagtgg caagctgcaa gcctcttctg agctttcatt tttcaatgga cttcagtgag 12120 aattcacttt gtcagaggcc atgcagctcc atgttttgga tttcatggaa tgagctttca 12180 acagtgagcc tgaagtgccc tggctgaaca gcaagaacac cagccaaccc taaacaaggc 12240 cgaggagagg cggctgtgtt tacacggaag gctcagcctt gctgtaatag cgtctgcctt 12300 caccagacat cagtgaggcg tggaaatcta ttatccagtt aattttgccc ctagataaag 12360 acttgctttc gtgtcttctc tttcacagtc ccatgatctg ttactcatct caactgcgag 12420 aagttggctg ggctttcccc tgtgcccagt gccacactcg tgccttcact gggtcacctg 12480 tgcctgtggc tgatgccgct gaggttttgc ctgcccagac tgggtgtttc tgactaaatc 12540 ccacagccac cattttagat caagggcagg agatagctca ctgctccgga atgacctccc 12600 ctcccagaat cctggtaggg gcggaaggtc cccaaccaag ctcccagccc tttctaaatg 12660 aatctccctg cttcacccat gtgcttttct ccagtctctg cggtcttgat gacagcaggg 12720 tattagtcct agctgtccca cagctcctac ttctttcagg cctctccctg tgacaatcag 12780 tagccactgg caggatttcc tcagagcata tctcgatttg ctttcagaca attagttaaa 12840 aggacactgg accccagacg tcccaactcc cagccagagc cctcacaggc ccggcctttg 12900 gtggtgagga agggggaggg agtgagtgac agtgccctgg catcttttag aaacgaattc 12960 ctttctctcc atacataaat gcctgcagag tcccatttca gaatccggca gacaaagcca 13020 ccaatgtgat ccccatgacc ttataaacat tcattaaaat gcatttcaag gcatgtgatg 13080 gcctccccac cccctagata atgagaaaac aaaggtttct cttctgatag agacaagttc 13140 agctctgaag tcaacattat ttctggttct gtctgaacaa tgacatatgg caactcttcc 13200 ctttctatag ttctagtcca gaatgacaaa aaaggggaaa aatttcttag agaaggtaga 13260 gattatacga atacagtcca tgaaatgagc ataaggagaa taaagaatat aacttatcca 13320 aagaagtctg gcaggctgtt ataaatgctt gattttggac actgtagttg gaggtttaac 13380 atggacacca ataaaaaggt cagcaaaggg tatgcactgt tcctattggg caagaagata 13440 ggaggtcaaa ggtaaccagg aaagataaac tcagggagac ttattttccc tccagagggc 13500 actgggcttg taggccctgg gcaaaattgt caaaaaggtg aaaatcgcct gtggtttatt 13560 tagtctgctc tttcttcact agtgcctcac cagttcagtt caggccaatt tgctagctgg 13620 ctccttcgtt aattaaggat ccgagggcct atttcccatg attccttcat atttgcatat 13680 acgatacaag gctgttagag agataattag aattaatttg actgtaaaca caaagatatt 13740 agtacaaaat acgtgacgta gaaagtaata atttcttggg tagtttgcag ttttaaaatt 13800 atgttttaaa atggactatc atatgcttac cgtaacttga aagtatttcg atttcttggc 13860 tttatatatc ttgtggaaag gacgaaacac cgcaaggcta ttggtcaagg cagttttaga 13920 gctagaaata gcaagttaaa ataaggctag tccgttatca acttgaaaaa gtggcaccga 13980 gtcggtgctt tttttccgcg gtgggcgcgc cggatcctaa tcgatttgag taattcatac 14040 aaaaggactc gcccctgcct tggggaatcc cagggaccgt cgttaaactc ccactaacgt 14100 agaacccaga gatcgctgcg ttcccgcccc ctcacccgcc cgctctcgtc atcactgagg 14160 tggagaagag catgcgtgag gctccggtgc ccgtcagtgg gcagagcgca catcgcccac 14220 agtccccgag aagttggggg gaggggtcgg caattgaacc ggtgcctaga gaaggtggcg 14280 cggggtaaac tgggaaagtg atgtcgtgta ctggctccgc ctttttcccg agggtggggg 14340 agaaccgtat ataagtgcag tagtcgccgt gaacgttctt tttcgcaacg ggtttgccgc 14400 cagaacacag gtaagtgccg tgtgtggttc ccgcgggcct ggcctcttta cgggttatgg 14460 cccttgcgtg ccttgaatta cttccacgcc cctggctgca gtacgtgatt cttgatcccg 14520 agcttcgggt tggaagtggg tgggagagtt cgaggccttg cgcttaagga gccccttcgc 14580 ctcgtgcttg agttgaggcc tggcctgggc gctggggccg ccgcgtgcga atctggtggc 14640 accttcgcgc ctgtctcgct gctttcgata agtctctagc catttaaaat ttttgatgac 14700 ctgctgcgac gctttttttc tggcaagata gtcttgtaaa tgcgggccaa gatctgcaca 14760 ctggtatttc ggtttttggg gccgcgggcg gcgacggggc ccgtgcgtcc cagcgcacat 14820 gttcggcgag gcggggcctg cgagcgcggc caccgagaat cggacggggg tagtctcaag 14880 ctcgccggcc tgctctggtg cctggcctcg cgccgccgtg tatcgccccg ccctgggcgg 14940 caaggctggc ccggtcggca ccagttgcgt gagcggaaag atggccgctt cccggccctg 15000 ctgcagggag ctcaaaatgg aggacgcggc gctcgggaga gcgggcgggt gagtcaccca 15060 cacaaaggaa aagggccttt ccgtcctcag ccgtcgcttc atgtgactcc acggagtacc 15120 gggcgccgtc caggcacctc gattagttct cgagcttttg gagtacgtcg tctttaggtt 15180 ggggggaggg gttttatgcg atggagtttc cccacactga gtgggtggag actgaagtta 15240 ggccagcttg gcacttgatg taattctcct tggaatttgc cctttttgag tttggatctt 15300 ggttcattct caagcctcag acagtggttc aaagtttttt tcttccattt caggtgtcgt 15360 gagctagtaa tcgatcctag ggccaccatg tacccatacg atgttccaga ttacgcttcg 15420 ccgaagaaaa agcgcaaggt cgaagcgtcc gacaagaagt acagcatcgg cctggacatc 15480 ggcaccaact ctgtgggctg ggccgtgatc accgacgagt acaaggtgcc cagcaagaaa 15540 ttcaaggtgc tgggcaacac cgaccggcac agcatcaaga agaacctgat cggagccctg 15600 ctgttcgaca gcggcgaaac agccgaggcc acccggctga agagaaccgc cagaagaaga 15660 tacaccagac ggaagaaccg gatctgctat ctgcaagaga tcttcagcaa cgagatggcc 15720 aaggtggacg acagcttctt ccacagactg gaagagtcct tcctggtgga agaggataag 15780 aagcacgagc ggcaccccat cttcggcaac atcgtggacg aggtggccta ccacgagaag 15840 taccccacca tctaccacct gagaaagaaa ctggtggaca gcaccgacaa ggccgacctg 15900 cggctgatct atctggccct ggcccacatg atcaagttcc ggggccactt cctgatcgag 15960 ggcgacctga accccgacaa cagcgacgtg gacaagctgt tcatccagct ggtgcagacc 16020 tacaaccagc tgttcgagga aaaccccatc aacgccagcg gcgtggacgc caaggccatc 16080 ctgtctgcca gactgagcaa gagcagacgg ctggaaaatc tgatcgccca gctgcccggc 16140 gagaagaaga atggcctgtt cggcaacctg attgccctga gcctgggcct gacccccaac 16200 ttcaagagca acttcgacct ggccgaggat gccaaactgc agctgagcaa ggacacctac 16260 gacgacgacc tggacaacct gctggcccag atcggcgacc agtacgccga cctgtttctg 16320 gccgccaaga acctgtccga cgccatcctg ctgagcgaca tcctgagagt gaacaccgag 16380 atcaccaagg cccccctgag cgcctctatg atcaagagat acgacgagca ccaccaggac 16440 ctgaccctgc tgaaagctct cgtgcggcag cagctgcctg agaagtacaa agagattttc 16500 ttcgaccaga gcaagaacgg ctacgccggc tacattgacg gcggagccag ccaggaagag 16560 ttctacaagt tcatcaagcc catcctggaa aagatggacg gcaccgagga actgctcgtg 16620 aagctgaaca gagaggacct gctgcggaag cagcggacct tcgacaacgg cagcatcccc 16680 caccagatcc acctgggaga gctgcacgcc attctgcggc ggcaggaaga tttttaccca 16740 ttcctgaagg acaaccggga aaagatcgag aagatcctga ccttccgcat cccctactac 16800 gtgggccctc tggccagggg aaacagcaga ttcgcctgga tgaccagaaa gagcgaggaa 16860 accatcaccc cctggaactt cgaggaagtg gtggacaagg gcgcttccgc ccagagcttc 16920 atcgagcgga tgaccaactt cgataagaac ctgcccaacg agaaggtgct gcccaagcac 16980 agcctgctgt acgagtactt caccgtgtat aacgagctga ccaaagtgaa atacgtgacc 17040 gagggaatga gaaagcccgc cttcctgagc ggcgagcaga aaaaggccat cgtggacctg 17100 ctgttcaaga ccaaccggaa agtgaccgtg aagcagctga aagaggacta cttcaagaaa 17160 atcgagtgct tcgactccgt ggaaatctcc ggcgtggaag atcggttcaa cgcctccctg 17220 ggcacatacc acgatctgct gaaaattatc aaggacaagg acttcctgga caatgaggaa 17280 aacgaggaca ttctggaaga tatcgtgctg accctgacac tgtttgagga cagagagatg 17340 atcgaggaac ggctgaaaac ctatgcccac ctgttcgacg acaaagtgat gaagcagctg 17400 aagcggcgga gatacaccgg ctggggcagg ctgagccgga agctgatcaa cggcatccgg 17460 gacaagcagt ccggcaagac aatcctggat ttcctgaagt ccgacggctt cgccaacaga 17520 aacttcatgc agctgatcca cgacgacagc ctgaccttta aagaggacat ccagaaagcc 17580 caggtgtccg gccagggcga tagcctgcac gagcacattg ccaatctggc cggcagcccc 17640 gccattaaga agggcatcct gcagacagtg aaggtggtgg acgagctcgt gaaagtgatg 17700 ggccggcaca agcccgagaa catcgtgatc gaaatggcca gagagaacca gaccacccag 17760 aagggacaga agaacagccg cgagagaatg aagcggatcg aagagggcat caaagagctg 17820 ggcagccaga tcctgaaaga acaccccgtg gaaaacaccc agctgcagaa cgagaagctg 17880 tacctgtact acctgcagaa tgggcgggat atgtacgtgg accaggaact ggacatcaac 17940 cggctgtccg actacgatgt ggaccatatc gtgcctcaga gctttctgaa ggacgactcc 18000 atcgacaaca aggtgctgac cagaagcgac aagaaccggg gcaagagcga caacgtgccc 18060 tccgaagagg tcgtgaagaa gatgaagaac tactggcggc agctgctgaa cgccaagctg 18120 attacccaga gaaagttcga caatctgacc aaggccgaga gaggcggcct gagcgaactg 18180 gataaggccg gcttcatcaa gagacagctg gtggaaaccc ggcagatcac aaagcacgtg 18240 gcacagatcc tggactcccg gatgaacact aagtacgacg agaatgacaa gctgatccgg 18300 gaagtgaaag tgatcaccct gaagtccaag ctggtgtccg atttccggaa ggatttccag 18360 ttttacaaag tgcgcgagat caacaactac caccacgccc acgacgccta cctgaacgcc 18420 gtcgtgggaa ccgccctgat caaaaagtac cctaagctgg aaagcgagtt cgtgtacggc 18480 gactacaagg tgtacgacgt gcggaagatg atcgccaaga gcgagcagga aatcggcaag 18540 gctaccgcca agtacttctt ctacagcaac atcatgaact ttttcaagac cgagattacc 18600 ctggccaacg gcgagatccg gaagcggcct ctgatcgaga caaacggcga aaccggggag 18660 atcgtgtggg ataagggccg ggattttgcc accgtgcgga aagtgctgag catgccccaa 18720 gtgaatatcg tgaaaaagac cgaggtgcag acaggcggct tcagcaaaga gtctatcctg 18780 cccaagagga acagcgataa gctgatcgcc agaaagaagg actgggaccc taagaagtac 18840 ggcggcttcg acagccccac cgtggcctat tctgtgctgg tggtggccaa agtggaaaag 18900 ggcaagtcca agaaactgaa gagtgtgaaa gagctgctgg ggatcaccat catggaaaga 18960 agcagcttcg agaagaatcc catcgacttt ctggaagcca agggctacaa agaagtgaaa 19020 aaggacctga tcatcaagct gcctaagtac tccctgttcg agctggaaaa cggccggaag 19080 agaatgctgg cctctgccgg cgaactgcag aagggaaacg aactggccct gccctccaaa 19140 tatgtgaact tcctgtacct ggccagccac tatgagaagc tgaagggctc ccccgaggat 19200 aatgagcaga aacagctgtt tgtggaacag cacaagcact acctggacga gatcatcgag 19260 cagatcagcg agttctccaa gagagtgatc ctggccgacg ctaatctgga caaagtgctg 19320 tccgcctaca acaagcaccg ggataagccc atcagagagc aggccgagaa tatcatccac 19380 ctgtttaccc tgaccaatct gggagcccct gccgccttca agtactttga caccaccatc 19440 gaccggaaga ggtacaccag caccaaagag gtgctggacg ccaccctgat ccaccagagc 19500 atcaccggcc tgtacgagac acggatcgac ctgtctcagc tgggaggcga cagccccaag 19560 aagaagagaa aggtggaggc cagctaagaa ttcaataaaa gatctttatt ttcattagat 19620 ctgtgtgttg gttttttgtg tgcggccgcc cccgggcgat acatggttag atcaagcaca 19680 atgaaacatg gttagatcaa gcacaatgaa acatggttag atcaagcaca atgaaacatg 19740 gttagatcaa gcacaacgat agtgaattct accagtgcca taagtagtga attctaccag 19800 tgccataagt agtgaattct accagtgcca taagtagtga attctaccag tgccataatc 19860 ctagggcggc cgccacccca ccagtgcagg ctgcctatca gaaagtggtg gctggtgtgg 19920 ctaatgccct ggcccacaag tatcactaag ctcgctttct tgctgtccaa tttctattaa 19980 aggttccttt gttccctaag tccaactact aaactggggg atattatgaa gggccttgag 20040 catctggatt ctgcctaata aaaaacattt attttcattg caatgatgta tttaaattat 20100 ttctgaatat tttactaaaa agggaatgtg ggaggtcagt gcatttaaaa cataaagaaa 20160 tgaagagcta gttcaaacct tgggaaaata cactatatct taaactccat gaaagaaggt 20220 gaggctgcaa acagctaatg cacattggca acagcccctg atgcctatgc cttattcatc 20280 cctcagaaaa ggattcaagt agaggcttga tttggaggtt aaagttttgc tatgctgtat 20340 tttacattac ttattgtttt agctgtcctc atgaatgtct tttcactacc catttgctta 20400 tcctgcatct ctcagccttg actccactca gttctcttgc ttagagatac cacctttccc 20460 ctgaagtgtt ccttccatgt tttacggcga gatggtttct cctcgcctgg ccactcagcc 20520 ttagttgtct ctgttgtctt atagaggtct acttgaagaa ggaaaaacag ggggcatggt 20580 ttgactgtcc tgtgagccct tcttccctgc ctcccccact cacagtgacc cggaatctgc 20640 agtgctagtc tcccggaact atcactcttt cacagtctgc tttggaagga ctgggcttag 20700 tatgaaaagt taggactgag aagaatttga aagggggctt tttgtagctt gatattcact 20760 actgtcttat taccctatca taggcccacc ccaaatggaa gtcccattct tcctcaggat 20820 gtttaagatt agcattcagg aagagatcag aggtctgctg gctcccttat catgtccctt 20880 atggtgcttc tggctctgca gttattagca tagtgttacc atcaaccacc ttaacttcat 20940 ttttcttatt caatacctag aaagcttcag acatgataag atacattgat gagtttggac 21000 aaaccacaac tagaatgcag tgaaaaaaat gctttatttg tgaaatttgt gatgctattg 21060 ctttatttgt aaccattata agctgcaata aacaagttaa caacaacaat tgcattcatt 21120 ttatgtttca ggttcagggg gaggtgtggg aggtttttta aagcaagtaa aacctctaca 21180 aatgtggtac ccgggaagct gaaggcagat aatgaccagg acaggtcaac ctctcttctt 21240 ctgaaagcct tcatctacta atggcctggg actcttccct taaatgctta gattgtgtct 21300 tccactaagg ttttttgctg ttgctgttgt ttgtttgttt gtttgtttgt ttgtttgttt 21360 tgagacggaa tctcactctg tcgcccaggc tggagtgtag tggcacaatc tcagctcacc 21420 acaaccttca cctcctaggt tgaagggatt ctcctgcctc agcctcctga gtagctagga 21480 ttacaggcac atgccaccat gcctggctaa tttttgtatt tttagtagag acaggatttc 21540 gccatgttgg ccaggctggt cttgaactcc tgacctcagg tgatctgcct accttggtct 21600 cccaaagtgc tgggattact ggtgtgagcc accacacccg gccaaggttt ttgtttgttt 21660 gtttgtttgt ttgttttgta ttgaggcagg gtatcactct ggtcacccag gctggagtgc 21720 agtagtgcaa tcacggctca ctgaaacctc cacctccctg gcgggctcag gtgatcctgc 21780 cacctcagct tcccaggtag ctgggactac aggcttgtac caccactccc agctaatttt 21840 tgcgttttta gtagagacag ggtttcccca tgttgcccag gttggtctca aactctgggc 21900 tcaagcgatc tgcctgcctc agcctcccaa agtgctggga ttacaggtgt aagccaccgt 21960 acccggcccc gccactaagg ttttgaaaat gaagcaatta caagtttaag tctattaata 22020 agtgatgaag ctatgtagaa aagcagaata attatcttgg atcaggaagg tcacatgagg 22080 atctacttgg gggttgtcaa tattctattt cttgacctga tcagtgttga cagcaggttt 22140 taatttttta cttctttttg tttgtttgtt tttgagacgg agtcttgctc tgtctcccag 22200 gctggagtgc agtggtatga tctcggctca ctgcaacctc cgcctcctgg gttcaagctg 22260 ttctcctgcc tcagcctccc cagtagctgg gattacaggc aggcaccacc acgaccagct 22320 aatttttgta tttttagtag agactgggtt tcaccatctt ggccaggctg gtctcgaact 22380 tctgatctcg tgatccgccc tccttggcct cccaaagtgc tgggattaca ggcttgagcc 22440 agcgtgcccg gcccattttt tacttcctta ttaaactgta catataggcc ttgcacactt 22500 ttctgcatca atgttatatt ccacaataaa gggaaaaggt atatacacaa cttgatacca 22560 gtaatgtgaa acatatattt ctacatagaa aaaaaaatga ctgaaatact gcactccaat 22620 gtgttcacac agtagttgtt tctggattat ttatatatta aatgtttata tattgtatta 22680 tgccatgagg tttgtgtttt ctctccactt ttctgcattt tccaagttta ctacaaagag 22740 cacatattac tcttataatc agaaagtcat aaaatatatt taaaaagaca aaattgaaac 22800 taataaggat caacacaaaa cagatgagcc atctgtggaa atccgcacag aatactacct 22860 aaagagattg gtgacgtgca tgatctcact aggatgagca caaagcttgc cagagcctag 22920 ggtctatttc tagggttggc tcttggaagc caggatagtt gttatctctg ggaagaggga 22980 ggggcacaca aggggcttct aaaacattct gaatgttcta tttctgaacc tggttggtgg 23040 gtacatgact gttggtttta ttattatatg ttttatatac tcttccgtat gtatggtgtg 23100 gattccaaaa aaagatttcc tttagagaaa accagaatca cataagtaga aaatatggtg 23160 ctatgttgaa ggaacaactc aagtttatat aaaatcatca tcatttatag gcttaaaaag 23220 ttgctttgga attttggtct aactgacttg tcttttctgc agcaaaccac gctccttctg 23280 gacgtgctcc aggcagaggg gattagggtg ggttcaaggc tgcaagtacc tagctcagca 23340 cactctcttc aggggactta gagtttgtct ggtgttggct ctctgagctc ttgtcaggaa 23400 tgccgaccct tccgaggttc aggatttgaa gcctgccttc ccaccccaga tttggtccac 23460 acagacactc aagtatgtat ttcaactaca aatgacctgt actttcctat tactcctctc 23520 tttcatggta acctttctgg tatccttcct tccctacatt tatgggaggg ggacatcatt 23580 ctctgctctc ctgtcactga aggctccacc ttctgtcttc ttctgaccca tctggttttc 23640 ctggggccac ctcctctcct taccacccta acgcttttgt aacttgagga gaaatgagag 23700 atcacctagt caggtcatca ttctctgtag atgaagaggc ccaatggttt gctcaagaat 23760 tgccaagcga gttaaagaca gagagtatga gagtcagcaa gacctacaga aagcatctat 23820 ctgcactgtt ttgcagggac ttagcctttg tgtgtggact cctggaatgc cacccactaa 23880 gaaacattgt ctgacaccaa ctccccactt ggtaggtggg gacactgaaa ctcatggcag 23940 gaaagggcct tgccccaagc cagggcagag tgtcactcat cactctcaat tttcagtcca 24000 gggcaccttg ttgtgactat cccaaaggca gccactttcc ctggtctgaa agacctgaag 24060 agagaagaga agagaaggat ggaaggcaga gtatgcggct ttgattcatt tcctggtgaa 24120 aacagatcta tacgagaagc aaatttcacg aaagggaaga gaagaaagtg tcccatacgt 24180 tgctggcctg tttcaacctt gctttgattc ttgctgaaaa gggtaccgtg tatttctgag 24240 ttcaacatgc agaccagtgt taggaaagcc actgcacctc cactttagcc tccagggctg 24300 tgccctgcaa atggcctgca gccttggtgc ctcgctctcc agactgcatt ttggaagatg 24360 ggacagaggc ttatggaagc ccacattaga acgggggagc agaatgggtg agatgaggga 24420 tccttgatag tgaaccagat gaaggaatgg tagccaaatg ccaggcctcc tttgtggctt 24480 caatccaaag gctctggagc ccttccaggg cagaacatca ggcatgttta cccccactgt 24540 cctcaacagt gacagaggtg caatcttggg cagctggcca ttttgaaagc aacctcctta 24600 atctcaactg ggaaggctcc ctagcaggac ccctgtgttg cacacctgga ggaagctaga 24660 ctaaccagaa gctcagcacg gttccatctg ggatgcccag gtctgagacg aaaaaggtaa 24720 ctctcttttc tgggtcctgg cccagttgtg tctctctcca cctcattctc tgagatgcct 24780 gtctcccctt ttttgtccca tcaggaggca agagctatca ctgggccaga ctccaccaga 24840 agccaagcca gcttgttacc cagcttctca gggagcaaag aacagccttg tttctatctt 24900 atccccactg tcccctgccc ctgccccacc tcccagccat tcagcttctg gcttccccag 24960 agctgcctgc ttctttgtgg tcctccattc cttgaaaaga ccttctagtc attagtgtat 25020 ataaatggcc acttagccca gattacagtg aggtcaacag ctggggctct gagaattgtc 25080 acacactggc acaggagagg aggctattct tccagagaat ttggagggca ctcccatcca 25140 cttacaacaa aaagcccatc cactgtgctt ggcagtaggt gatctgagaa ccaatggaac 25200 caggttaatc ctgtggcact gttgagtgag gagagcagtg gcgggcactg gaaaatatca 25260 gagacaaggc aggagacctg aaatctaggc ttagctcctc atatacttgg cagctgtatg 25320 acctcagaca accagtgtta cctctctaag cctcagtttc ctcatgcaaa aggaggggga 25380 ataacaacag agcccactgc ttgggggtgt tgtgaggaca ggatgaaaaa acaaacagaa 25440 atccctcagt acaggattca gtgcagtgga cagtcttgca aggtctggtt cagccctcca 25500 cccctaccct caccagtata aagaactctg gcctacaagt cagatgacct gagttttaat 25560 ctcagctttg ccattagccg tgtgaacttg agaaagtccc tttccttttt acatctattg 25620 ggatgatcat gcattttttg tcctttattc tgttaatata gtgtgttaca ttgattgctt 25680 ttcatagact gaaccagcct tgtattccag ggataaatct cacttggtca tggtgtataa 25740 tcctttatac aaatgttgct gggttgagtt tgctagtatt ttgttgaaga tttttatgtc 25800 ttgattcata aggaatattg gtgtaccttc cccttttatg gccacagttt ccctacaatg 25860 atgtagtcga actagacaac ctccaatatc tttcagtatt catgtcctct gattctgtga 25920 aactaagaaa attaagaaat agtgattcat aggcacaagg caggcaaaac ttagactcct 25980 tgtagaataa ttaggaagcc aaatattcag tgtgcttatt tctcaaataa ccttagtttc 26040 tccagtctgc cccaactccg aggcctgaat atctctagat gcttatgatg gcaactaaag 26100 cctaaaagct aattcatttt aaagttcttc caaatgcata gggttttatt tttccagacc 26160 tgggttcaga tggggaattt gacaaacaat ggaaaggggg aaaaacaaca atctaaacac 26220 tgagtgacaa agtaacaaag aaatagtcta gctatcagcc agtcaagcca gccttggctt 26280 tgctatccaa agtagtcagt ctaattctac caccagtttc tgttcctgta gctgtctact 26340 gcctgccagg gactctgcct tcccacccac aactaccaat ggaaggatgt ggtgaccata 26400 ccagtggctg ctgacatctc ctgccatggg aagcataatt gcctccagca gcctccccct 26460 tagatccatc atttttgttg cacttggcct gggctgtact cccggccaat gactgaacat 26520 ggtgagcata gtaatgcagg cccatttctg tgaggagcag gactcctcca gtaggtgact 26580 ttggctcaag gactctctat tggcctggtt gaacttttcc tgaactgtgc tactgtctga 26640 gactcttctt acccaatcct ctttctcgcc ccaattgtca cagaccacct gcattgtggt 26700 ctgagtctct ccccaccttc tcttgctctt ccctgtttat ctttcacagg catttccccc 26760 agtacattcc ttgaatgtct aacccgatac gggtgcctga cttttggcag acctaagcag 26820 acaaaaagga gtacttggtt acctagctct tctttctacc acaaacatcg agggaaccct 26880 ttttccctca cccctctgcc acacccccac tgccccagtg aacaaccaca gagagagctg 26940 tggtataata ttaggctggt gcaaaagtaa ttgcggtttt tgccattact tttaatggta 27000 aaaaccgcaa ttacttttgc acctacctag tatttgtgtc cccccaaatt catatgttga 27060 aacctaaccc acaatatgat gtcattagga ggcaagacct tgaggaggtg attagatgat 27120 ggggtggagc tctcctgaat gagattagtg cccttataag aagaagccca aggaagctac 27180 cttgactctt ccatcacatg agaatgcagc aagaaggcac catctactaa tcaggaagag 27240 agctctcacc agacactgaa tctgccagtg tcttgatctt gaagttccca gcctccagaa 27300 ctatgcataa tgcatttcca ttgtctctaa gccacccagc ctatggtatt ttgtcatagc 27360 agcctgaact gactaagaca gtgagccaca tgagaagtgc cccaacccct cccttaagca 27420 cttggctcac agatcagtgg gttcatttct gcctgagttt tattgttatt ctgtagattt 27480 cttgggctag atatattttt ctgttatttt ccttcttcac ctcagtcatg aattggttgt 27540 tttaaaaaag acaatgtaag tcatggggaa actcctgaca actctactct cctagggttc 27600 ctgataaaag gggattcagt tgagtcctct gatggtctct acctgccaaa gtccagcagc 27660 ccttagcaaa catgctgctc gtttctgtag agaaggtgct ggtgtcccac catacttctc 27720 tctccctcat gaagggcttg cgacccagca aatgggtggc ttatatgggt ctgtttcaaa 27780 ggaagagcca gctctgggaa gaaaaacgat gagcataagc ataacctacc actgtgcctg 27840 ggaaagcaga caactttttt gatgtgtgaa tatctaatga gaatggaatc catcaattac 27900 cttaaactta ggcacagtct tcaaattcaa tatatgtggg atatactttt agtcagtttg 27960 tagacgttat ttgtaataaa taatctggct tctctaaaga aattatttta agtgtttggt 28020 ttggtttgat ttaatggtaa aattatattt agtggcagag aattatagca atggtgataa 28080 actatagagt gtcataagtt catatcttat tctcacattt gaagctgcct gcagatgcat 28140 tcaagatgca gccagaagtc aggagactca ggctgttatt tggagctcat cattttacag 28200 ccttgctgga ctcccacttt ctcaggggaa aaatgtggtg ttgacccaga ttagctctcc 28260 aggccctgct gagttgggca ctctgtaagc tggagggtct tctattgtct tcacctaagt 28320 gtcaatcaac aacccaaatg ggcatggggg aagagggagc tgggccaatg cccagggtgc 28380 ctggtagaga gataccttgg gcactggaag gcaccagctt cccagagaga agggggaggg 28440 ccatgaaaaa gttggctgta gatgccaggg acactgggac tctccagctg tgtgtttgtg 28500 tcttctgaag acttatgttt cattcctttg gagcatgcat aatcatacac tgtgggatgt 28560 gttatataga ttgcttgata gttcaccact gtaataaaat actgtgactg gaatctgctc 28620 ccagtctgcc tttgatagca cttgtgcaac acacatttac tgagcattta cagtgatcca 28680 ggacctgtgt tgtgaaaaca ttgatggaca aggcagatgg tggagcacgt cagtgaggat 28740 ttttaacaaa ggctggtaag tgctataaag gaacattgta ggacactaga gaacaaagaa 28800 caggagaacc tgacttaggc tggggtgggg cgttggttag aggaggctcc ttggaggaca 28860 tgaggtttaa gctgtgacct gaggatgaat agatgttggc caggtgaggt taattaagct 28920 tgtcagcctt accagtaaaa aagaaaacct attaaaaaaa caccactcga cacggcacca 28980 gctcaatcag tcacagtgta aaaaagggcc aagtgcagag cgagtatata taggactaaa 29040 aaatgacgta acggttaaag tccacaaaaa acacccagaa aaccgcacgc gaacctacgc 29100 ccagaaacga aagccaaaaa acccacaact tcctcaaatc gtcacttccg ttttcccacg 29160 ttacgtaact tcccatttta agaaaactac aattcccaac acatacaagt tactccgccc 29220 taaaacctac gtcacccgcc ccgttcccac gccccgcgcc acgtcacaaa ctccaccccc 29280 tcattatcat attggcttca atccaaaata aggtatatta ttgatgatgt ttaaactacg 29340 gcccggtacc cagcttttgt tccctttagt gagggttaat tgcgcgcttg gcgtaatcat 29400 ggtcatagct gtttcctgtg tgaaattgtt atccgctcac aattccacac aacatacgag 29460 ccggaagcat aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg 29520 cgttgcgctc actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa 29580 tcggccaacg cgcggggaga ggcggtttgc gtattgggcg ctcttccgct tcctcgctca 29640 ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg 29700 taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc 29760 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 29820 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 29880 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 29940 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 30000 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 30060 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 30120 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 30180 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 30240 gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 30300 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 30360 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 30420 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 30480 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 30540 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 30600 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 30660 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg 30720 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 30780 caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 30840 cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 30900 cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 30960 cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 31020 agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 31080 tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 31140 agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 31200 atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 31260 ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 31320 cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 31380 caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 31440 attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 31500 agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgcgc 31560 cctgtagcgg cgcattaagc gcggcgggtg tggtggttac gcgcagcgtg accgctacac 31620 ttgccagcgc cctagcgccc gctcctttcg ctttcttccc ttcctttctc gccacgttcg 31680 ccggctttcc ccgtcaagct ctaaatcggg ggctcccttt agggttccga tttagtgctt 31740 tacggcacct cgaccccaaa aaacttgatt agggtgatgg ttcacgtagt gggccatcgc 31800 cctgatagac ggtttttcgc cctttgacgt tggagtccac gttctttaat agtggactct 31860 tgttccaaac tggaacaaca ctcaacccta tctcggtcta ttcttttgat ttataaggga 31920 ttttgccgat ttcggcctat tggttaaaaa atgagctgat ttaacaaaaa tttaacgcga 31980 attttaacaa aatattaacg cttacaattt ccattcgcca ttcaggctgc gcaactgttg 32040 ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag ggggatgtgc 32100 tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt gtaaaacgac 32160 ggccagtgag cgcgcgtaat acgactcact atagggcgaa ttggagctcc actacgtagt 32220 ttaaacatca tcaataatat accttatttt ggattgaagc caatatgata atgagggggt 32280 ggagtttgtg acgtggcgcg gggcgtggga acggggcggg tgacgtagta gtgtggcgga 32340 agtgtgatgt tgcaagtgtg gcggaacaca tgtaagcgac ggatgtggca aaagtgacgt 32400 ttttggtgtg cgccggtgta cacaggaagt gacaattttc gcgcggtttt aggcggatgt 32460 tgtagtaaat ttgggcgtaa ccgagtaaga tttggccatt ttcgcgggaa aactgaataa 32520 gaggaagtga aatctgaata attttgtgtt actcatagcg cgtaatattt gtctagggcc 32580 gcggggactt tgaccgttta cgtggagact cgcccaggtg tttttctcag gtgttttccg 32640 cgttccgggt caaagttggc gttttgattc 32670 <210> 63 <211> 30655 <212> DNA <213> Artificial Sequence <220> <223> LCR globin vector (Sleeping beauty IR, Beta promoter, human gamma globin, mgmt, Ef1a promoter and Ad5) <400> 63 catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60 ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120 gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180 gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240 taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300 agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg 360 gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc 420 cgggtcaaag ttggcgtttt gattcggccg aaggattaca tgagcttaga aatgtaatta 480 gcatagtgtg tggcatagtg tagataccaa ataaatatga tctctccttc tactcttgaa 540 aatgcaaaca cattcttggt ggtcctaaaa tagcctgtaa catggtttac tcagcagcat 600 ttgctattca aggcagatct gcctttagtc attggctgcg ctcctgaaca gctgtgtgaa 660 aggctaactt ttgtaaacca aatcaaaata aaatgcagca aaaatttgtc actgaaagga 720 aatcctcagt atatcctttt atgaaatgaa agatccctca tccaaactta acttttttaa 780 aagtgcgcat ttggagatat agccctttct tatgaatcct aattcaattt tggccataaa 840 cacacgttga tgttccccac cccaaagcac atagcaacaa gagtaggttc tatattgaaa 900 ataatgacaa tttaaaaaca tgtacttatt tcactgtatg tggacagtgt ctatgattgc 960 atcatgaagt gtcatataac catgtacgtg tacatgagag agagatagag agagaagtgg 1020 tagggtggtg gtggtagagg ggatggcgat agtaatcatg gtaatggtag aggtgatgga 1080 ggtggtaatg acggaggtaa gggtggtagt gatgatggtg gtggtggtaa tggtggtgga 1140 tgtggtggtg gcaattggga tggtgggatg gtggtagcca tggtgatggt ggtaatggtg 1200 ttgatttaaa gggtggtggt agtgaaggtg agggtagtgg tggtggaggt ggtggtgctg 1260 gtagcaatag tgatggtggt gatggtgttg atgagggtgt tgggatcagg gtgagttccc 1320 acagtatatt tcattcttgt tgtaccactc tgtcaacagc accactgact gggacagagg 1380 aagaaggcac actctgaatg tgttattaac agaaacctca aaacagtctg tctccttgta 1440 gtcattcaaa attatctttt tcttacctgg aaaactgaaa ctgaattacc gggaaaaaca 1500 caggagattt ttgtttgtta atatgctgcc aataaagtaa ttttatgtca aatttaacta 1560 caggaaaggg caaggcattt tctaagttcc ttagatgtca tgtggctaaa aaaaacaaaa 1620 ggatggacag cagttagata ctgtacactt agctgtttga agccatatat tcagaaagca 1680 gatgttggga gttggtgttt gaggactgat ttcctggagg tattttatat aggccaagtt 1740 cattgttcta aactctaagg gcttgacttg agggaggaaa agaggcaaga acatgtttag 1800 ttttgctgac agcatcacat gggcagccct aaggctagac aactttaggg cctgaagctt 1860 attctaggaa agaagcacct acagagtggc actgggctcc cctccactat agagatgaag 1920 tcatatgaca gtaaagggca ggcagggctg cctagggggc ccattgaaat tgcggccgca 1980 aataatgggc ccggagcaag agagagggag gcaatgacag cagagacatg cctgcgcctt 2040 gggtttgagt gcccagtggt caaatccact tccctgtggc tgatgcttgc ctttctaact 2100 ttggaattta ggggttggag atctggtgag aaggtaggag ggagatgagg aggagaaggg 2160 aaaggcagga aggaagggga gggaaaggaa aagcaaaagg ggaggaggaa ggtttccaac 2220 aaattattct atatcaactg cggaaatcaa aatttgttgc ccaaatctta gaagctcatg 2280 tccctcctcc ccagaagtct ggaatgcagc actccagggg tagcttataa cccaaatatc 2340 tatctgtaaa aagagaaaca ttgggctttc gagctgtgga ttctcagtaa aagcaagagg 2400 cctcagccta cacaggccag cccagagttt gaggaacccc aggcccacac ccacagggct 2460 ggcccctggg tctgcatact ccctagaaat gtgcacactt ctgagcctca actctgtcct 2520 ggagtctaac agcatccctc tccttcctgg ggcagttcca cctccagaaa cctgttacct 2580 tgggccttat gtcaaggaaa ctgtgggaaa gagctaggca ggaatgcaga tgaggccagc 2640 atgggctcct aaaagtttag aaataggcag tgtcatgctc ccaggtgcct gcataaacca 2700 gctgaaaaat ggagctcccc tcaccagcac tctcccttca aacagactgt gatttgcagg 2760 tcactggttt accaagccag gctacccagg caggacccag atgccaagcc cagtggtgtc 2820 ctgcaagctg agcagtgctc agttcttgca aaaaaaggtc tgtgtgaagg caaggcctct 2880 gcctggcttc tcaccccagt tgggtgtctg gaacaggaag gagcccttac tgcagaaaaa 2940 ggaggaggga gcaaagggag cgaacagctg cgtgctccat ggggaggatc cccaaagtag 3000 aaaggcgcat acacactgca gcccttgacc cagaatgctc acagctacat tacagattca 3060 ggtctcctca gtgtagtggg gctgctgatg agactgtggc atcctcaggg gtcaggacac 3120 acattttcca tcactcttct gatggcaaaa aacctctgag ccaatgccaa cctctgatca 3180 ttaaaaaaaa gtgctcacag cagtgtgtgg tttaggatca tgccctgtgt ggtttggaac 3240 acgtgcacaa ccacaccttg ttcatcacca tcccagaaac cctgacgcag gcaaagagca 3300 gagttattaa ccctacttta ctgatgtgga tactgaggcc cagaggctca tgcaagttat 3360 caataagtgg cagggacagt tgcctctaga ttaactagcc cctaggatca cctgggtctt 3420 ggaaggggac ccataaacat gagctcccct ctcttggggc cagatttgca cctgtgccgc 3480 gccttcagcc tgcatgaagt aggggctgct ggcaaagact caaagctgta aatctgggtt 3540 ttctcttgag gcttctaagg gagctgtttc gacaactcac tctgttccca gctggctgcc 3600 cctgcatagg gttttaaagc agcctagctt tctgccaggc ttggcagtgg acaacgctgg 3660 tcagaacatc ccagagagct accagaatga agtaagtttg cttctactct ttacctgttt 3720 atgggctgtc tctgccactg gaatgaaagg cactgagaac agtgcctggc ctgcagaagg 3780 ccctggaaat acctgagctc ctaatctggg aataggagta ggaagagctt tggaggcagg 3840 gcacctgagt ttgagatcta caacttcctg cctgtgtgac attgggaaag tctccatcct 3900 ttctgagcct cagtctccac cctggggaag tggaaatatc aatctctgtg acacagaagc 3960 aaatgagcga atgtgcacaa agtaccttgc acaagagaga cgctcaaaca cttgcctcca 4020 ggtttcaccg agaactacag agtaagatag atttgttccc agtggaggaa gcctgggaat 4080 aatttgcccc tagactatga attcctgggg ctcaagatcg agcacagggc caggcacaca 4140 gaagggaccc tggaaatgtg gcaggaggcc agagatagac aggcccttag agctcatacc 4200 catgccctct gacctcaaga agaaagaaac ctgctcaaaa tctcacaaag agcttgttcc 4260 aaccctgaat cgagtctgag gactccttcc tgagtccagc actttttctg caagaagtat 4320 atgcctccaa agctgatggg cgcaaatctt gaaccccgtc acataaacac aaagggagga 4380 ggtgactaga gctcctccta ctggatatgt ctaaggtcac cagtctaaag aaaagggatg 4440 gatagaatga ggccagtatt tttgcagcca tccaaatgtc cacatacgct gttacactga 4500 gggctcctct ctcccccgtc ttcagcccta cttgcattta gaggtgagaa agatatgggc 4560 tgaggggttg tttttcatcg tattgtagat ggaaagcaca ctgcccttgg ggccatccaa 4620 atgtggacct tgatgtagca ccccaccttc tggatggcca tccttctgaa agtcactgaa 4680 tttctcagac tttattctct ttatccataa agaaggagaa taataataat ccccccaccc 4740 tgcccaacca ctgactggtt gggaagctca gaagaaatac tgggcacggc atcccattgt 4800 aatctataga gtgagtcgct tcttaatatt aaatggctga acacagaaga tgtgcaaaaa 4860 gtactgtgtc cccttcctcc tccaactgaa catttcatgc cctttgcacc ctcattttgt 4920 ctaggagctg ccttatgaag ggaataggta cctgctccga gctggaggaa tctttgccac 4980 ttatggtggg gtatggactg agacagagat ggcatgtgac atgcgcactg agtctcaact 5040 ccatgcaggc tctggagcac tctcaaattg gagtactaat gccttttaaa ttctcacact 5100 agcaatcctt tgacctactg atctagggat ctagggaaag aatcgtgatc ttaacttcaa 5160 agggaaggac aaaatgttct gcctcctgtt aaaactccat acactaagtg cagagactgg 5220 atgccttatt aaccttgggt agatgcccaa atgttcaaaa ggtcaaactc ttctgttccc 5280 cagatcgcca gagtcattaa ccagtcacac tattaaatga atgaacagat gctgaaaagg 5340 tacttgcatt actgagattt cttatggtga tggcccctgc ctgatatgta ttcagcattt 5400 tgtagttttc aatgtgcatt agagtatagt ggtgatgaca ttggcctctg agtttgccac 5460 ttcttatatc tgtgactttg gtcaaattgc ttaatctctc tgagtctcgg tttcctggag 5520 ataataatag cttcttcttc ccagggttat catgaggatt acaggagata atgccccaaa 5580 aatgcttagt aaagtgccta gcacctagtc aatgctgaat taaaggtggt tattcttact 5640 tttcgttcat ttgaactttg ttctcaggga gggcaaagga tagacaaagc cccatagcta 5700 gtgaggagta gctgcaagac tagaacccag gtgttctgag ccctagtctt aggccaagaa 5760 caactgttac gtgagatgca cgttttcctt caagggagct cacaattatt tccatgtaaa 5820 ttcaaggact gctaaaagag aactctcctc tgggactgat aaacatctag tcgagtatcg 5880 acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtaa ctataacggt 5940 cctaaggtag cgaaagcttg catgcctgca ggtcgactct agaggatcaa acctagccac 6000 cgcggtggcg gccggctagc cggctagccg gctagcccta gaactagtaa cggccgccag 6060 tgtgctggaa ttcggcttgt aaggtaccgg tgaagttcct atactttcta gagaatagga 6120 acttcggaat aggaacttct acctagatgc atgctcgagc ggcccctaca gttgaagtcg 6180 gaagtttaca tacacttaag ttggagtcat taaaactcgt ttttcaacta ctccacaaat 6240 ttcttgttaa caaacaatag ttttggcaag tcagttagga catctacttt gtgcatgaca 6300 caagtcattt ttccaacaat tgtttacaga cagattattt cacttataat tcactgtatc 6360 acaattccag tgggtcagaa gtttacatac actaagttga ctgtgccttt aaacagcttg 6420 gaaaattcca gaaaatgatg tcatggcttt agaagcttct gatagactaa ttgacatcat 6480 ttgagtcaat tggaggtgta cctgtggatg tatttcaagg aattctgtgg aatgtgtgtc 6540 agttagggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcata 6600 tcgatactag tttataagat ctcgagctag cggccgtttg ttaattaagt cgacggtacc 6660 gtcaaggctg cagtgagaca tgatcttgcc actgcactcc agcctggaca gcagagtgaa 6720 accttgcctc acgaaacaga atacaaaaac aaacaaacaa aaaactgctc cgcaatgcgc 6780 ttccttgatg ctctaccaca taggtctggg tactttgtac acattatctc attgctgttc 6840 ataattgtta gattaatttt gtaatattga tattattcct agaaagctga ggcctcaaga 6900 tgataacttt tattttctgg acttgtaata gctttctctt gtattcacca tgttgtaact 6960 ttcttagagt agtaacaata taaagttatt gtgagttttt gcaaacacag caaacacaac 7020 gacccatata gacattgatg tgaaattgtc tattgtcaat ttatgggaaa acaagtatgt 7080 actttttcta ctaagccatt gaaacaggaa taacagaaca agattgaaag aatacatttt 7140 ccgaaattac ttgagtatta tacaaagaca agcacgtgga cctgggagga gggttattgt 7200 ccatgactgg tgtgtggaga caaatgcagg tttataatag atgggatggc atctagcgca 7260 atgactttgc catcactttt agagagctct tggggacccc agtacacaag aggggacgca 7320 gggtatatgt agacatctca ttctttttct tagtgtgaga ataagaatag ccatgacctg 7380 agtttataga caatgagccc ttttctctct cccactcagc agctatgaga tggcttgccc 7440 tgcctctcta ctaggctgac tcactccaag gcccagcaat gggcagggct ctgtcagggc 7500 tttgatagca ctatctgcag agccagggcc gagaaggggt ggactccaga gactctccct 7560 cccattcccg agcagggttt gcttatttat gcatttaaat gatatattta ttttaaaaga 7620 aataacagga gactgcccag ccctggctgt gacatggaaa ctatgtagaa tattttgggt 7680 tccatttttt tttccttctt tcagttagag gaaaaggggc tcaggatcca cttgcccagt 7740 gttcttcctt agttcctacc ttcgaccttg atcctccttt atcttcctga accctgctga 7800 gatgatctat gtggggagaa tggcttcttt gagaaacatc ttcttcgtta gtggcctgcc 7860 cctcattccc actttaatat ccagaatcac tataagaaga atataataag aggaataact 7920 cttattatag gtaagggaaa attaagaggc atacgtgatg ggatgagtaa gagaggagag 7980 ggaaggatta atggacgata aaatctacta ctatttgttg agacctttta tagtctaatc 8040 aattttgcta ttgttttcca tcctcacgct aactccataa aaaaacacta ttattatctt 8100 tattttgcca tgacaagact gagctcagaa gagtcaagca tttgcctaag gtcggacatg 8160 tcagaggcag tgccagacct atgtgagact ctgcagctac tgctcatggg ccctgtgctg 8220 cactgatgag gaggatcaga tggatggggc aatgaagcaa aggaatcatt ctgtggataa 8280 aggagacagc catgaagaag tctatgactg taaatttggg agcaggagtc tctaaggact 8340 tggatttcaa ggaattttga ctcagcaaac acaagaccct cacggtgact ttgcgagctg 8400 gtgtgccaga tgtgtctatc agaggttcca gggagggtgg ggtggggtca gggctggcca 8460 ccagctatca gggcccagat gggttatagg ctggcaggct cagataggtg gttaggtcag 8520 gttggtggtg ctgggtggag tccatgactc ccaggagcca ggagagatag accatgagta 8580 gagggcagac atgggaaagg tgggggaggc acagcatagc agcatttttc attctactac 8640 tacatgggac tgctccccta tacccccagc taggggcaag tgccttgact cctatgtttt 8700 caggatcatc atctataaag taagagtaat aattgtgtct atctcatagg gttattatga 8760 ggatcaaagg agatgcacac tctctggacc agtggcctaa cagttcagga cagagctatg 8820 ggcttcctat gtatgggtca gtggtctcaa tgtagcaggc aagttccaga agatagcatc 8880 aaccactgtt agagatatac tgccagtctc agagcctgat gttaatttag caatgggctg 8940 ggaccctcct ccagtagaac cttctaacca gctgctgcag tcaaagtcga atgcagctgg 9000 ttagactttt tttaatgaaa gcttgcatgc agcactttgg gaggctgagg tgggtggact 9060 gcttggagct caggagttca agaccatctt ggacaacatg gtgataccct gcctctacaa 9120 aaagtacaaa aattagcctg gcatggtggt gtgcacctgt aatcccagct attagggtgg 9180 ctgaggcagg agaattgctt gaacccggga ggcggaggtt gcagtgagct gagatcgtgc 9240 cactgcactc cagcctgggg gacagagcac attataatta actgttattt tttacttgga 9300 ctcttgtggg gaataagata catgttttat tcttatttat gattcaagca ctgaaaatag 9360 tgtttagcat ccagcaggtg cttcaaaacc atttgctgaa tgattactat actttttaca 9420 agctcagctc cctctatccc ttccagcatc ctcatctctg attaaataag cttcagtttt 9480 tccttagttc ctgttacatt tctgtgtgtc tccattagtg acctcccata gtccaagcat 9540 gagcagttct ggccaggccc ctgtcggggt cagtgcccca cccccgcctt ctggttctgt 9600 gtaaccttct aagcaaacct tctggctcaa gcacagcaat gctgagtcat gatgagtcat 9660 gctgaggctt agggtgtgtg cccagatgtt ctcagcctag agtgatgact cctatctggg 9720 tccccagcag gatgcttaca gggcagatgg caaaaaaaag gagaagctga ccacctgact 9780 aaaactccac ctcaaacggc atcataaaga aaatggatgc ctgagacaga atgtgacata 9840 ttctagaata tattatttcc tgaatatata tatatatata cacatatacc atatgaaaca 9900 cctctaggct ataaggcaac agagctcctt tttttttttt ctgtgctttc ctggctgtcc 9960 aaatctctaa tgataagcat acttctattc aatgagaata ttctgtaaga ttatagttaa 10020 gaattgtggg agccattccg tctcttatag ttaaatttga gcttctttta tgatcactgt 10080 ttttttaata tgctttaagt tctggggtac atgtgccatg gtggtttgct gcacccatca 10140 acccgtcatc tacattaggt atttctccta atgctatcct tcccctagcc ccccaccccc 10200 aacaggcccc agtgtgtgat gttcccctcc ctgtgtccat ggatcactgg tttttttttg 10260 tttttttttt ttttttaaag tctcagttaa atttttggaa tgtaatttat tttcctggta 10320 tcctaaggac ttgcaagtta tctggtcact ttagccctca cgttttgatg ataatcacat 10380 atttgtaaac acaacacaca cacacacaca cacacacata tatatatata taaaacatat 10440 atatacataa acacacataa catatttatc gggcatttct gagcaactaa tcatgcagga 10500 ctctcaaaca ctaacctata gccttttcta tgtatctact tgtgtagaaa ccaagcgtgg 10560 ggactgagaa ggcaatagca ggagcattct gactctcact gcctttagct aggcccctcc 10620 ctcatcacag ctcagcatag tcctgagctc ttatctatat ccacacacag tttctgacgc 10680 tgcccagcta tcaccatccc aagtctaaag aaaaaaataa tgggtttgcc catctctgtt 10740 gattagaaaa caaaacaaaa taaaataagc ccctaagctc ccagaaaaca tgactaaacc 10800 agcaagaaga agaaaataca ataggtatat gaggagactg gtgacactaa gtgtctgaat 10860 gaggcttgag tacagaaaag aggctctagc agcatagtgg tttagaggag atgtttcttt 10920 ccttcacaga tgccttagcc tcaataagct tgcggttgtg gaagtttact tgtttatcac 10980 cggtgacgtc catgagcaaa ttaagaaaaa caacaacaaa tgaatgcata tatatgtata 11040 tgtatgtgtg tatatataca catatatata tatatttttt ttcttttctt accagaaggt 11100 tttaatccaa ataaggagaa gatatgctta gaactgaggt agagttttca tccattctgt 11160 cctgtaagta ttttgcatat tctggagacg caggaagaga tccatctaca tatcccaaag 11220 ctgaattatg gtagacaaaa ctcttccact tttagtgcat caatttctta tttgtgtaat 11280 aagaaaattg ggaaaacgat cttcaatatg cttaccaagc tgtgattcca aatattacgt 11340 aaatacactt gcaaaggagg atgtttttag tagcaatttg tactgatggt atggggccaa 11400 gagatatatc ttagagggag ggctgagggt ttgaagtcca actcctaagc cagtgccaga 11460 agagccaagg acaggtacgg ctgtcatcac ttagacctca ccctgtggag ccacacccta 11520 gggttggcca atctactccc aggagcaggg agggcaggag ccagggctgg gcataaaagt 11580 cagggcagag ccatctattg cttacatttg cttctgacac aactgtgttc actagcaacc 11640 tcaaacagac accatgggtc atttcacaga ggaggacaag gctactatca caagcctgtg 11700 gggcaaggtg aatgtggaag atgctggagg agaaaccctg ggaaggtagg ctctggtgac 11760 caggacaagg gagggaagga aggaccctgt gcctggcaaa agtccaggtc gcttctcagg 11820 atttgtggca ccttctgact gtcaaactgt tcttgtcaat ctcacaggct cctggttgtc 11880 tacccatgga cccagaggtt ctttgacagc tttggcaacc tgtcctctgc ctctgccatc 11940 atgggcaacc ccaaagtcaa ggcacatggc aagaaggtgc tgacttcctt gggagatgcc 12000 ataaagcacc tggatgatct caagggcacc tttgcccagc tgagtgaact gcactgtgac 12060 aagctgcatg tggatcctga gaacttcaag gtgagtccag gagatgtttc agccctgttg 12120 cctttagtct cgaggcaact tagacaactg agtattgatc tgagcacagc agggtgtgag 12180 ctgtttgaag atactggggt tgggggtgaa gaaactgcag aggactaact gggctgagac 12240 ccagtggtaa tgttttaggg cctaaggagc gcctctaaaa atctagatgg acaattttga 12300 ctttgagaaa agagaggtgg aaatgaggaa aatgactttt attagattcc agtagaaaga 12360 actttcatct ttccctcatt tttgttcgtt ttaaaacatc tatctggagg caggacaagt 12420 atggtcgtta aaaagatgca ggcagaaggc atatattggc tcagtcaaag tggggaactt 12480 tggtggccaa acatacattg ctaaggctat tcctatatca gctggacaca tataaaatgc 12540 tgctaatgct tcattacaaa cttatatcct ttaattccag atgggggcaa agtatgtcca 12600 ggggtgagga acaattgaaa catttgggct ggagtagatt ttgaaagtca gctctgtgtg 12660 tgtgtgtgtg tgcgcgcgcg cgtgtgtgtg tgtgtgtgtc aacgtgtgtt tcttttaacg 12720 tcttcagcct acaacataca gggttcatgg tggcaagaag atagcaagat ttaaattatg 12780 gccagtgact agtgcttgaa ggggaacaac tacctgcatt taatgggaag gcaaaatctc 12840 aggctttgag ggaagttaac ataggcttga ttctgggtag aagctgggtg tgtagttatc 12900 tggaggccag gctggagctc tcagctcact atgggttcat ctttattgtc tcctttcatc 12960 tcaacagctc ctgggaaatg tgctggtgac cgttttggca atccatttcg gcaaagaatt 13020 cacccctgag gtgcaggctt cctggcagaa gatggtgact gcagtggcca gtgccctgtc 13080 ctccagatac cactgagcct cttgcccatg attcagagct ttcaaggata ggctttattc 13140 tgcaagcaat tcaaataata aatctattct gctgagagat cacacatgat tttcttcagc 13200 tctttttttt acatcttttt aaatatatga gccacaaagg gtttatattg agggaagtgt 13260 gtatgtgtat ttctgcatgc ctgtttgtgt ttgtggtgtg tgcatgctcc tcatttattt 13320 ttatatgaga tgtgcatttt gttgagcaaa taaaagcagt aaagacactt gtacacggga 13380 gttctgcaag tgggagtaaa tggtgtagga gaaatccggt gggaagaaag acctctatag 13440 gacaggactt ctcagaaaca gatgttttgg aagagatggg aaaaggttca gtgaagacct 13500 gggggctgga ttgattgcag ctgagtagca aggatggttc ttaatgaagg gaaagtgttc 13560 caagctttag gaattcaagg tttagtcagg tgtagcaatt ctattttatt aggaggaata 13620 ctatttctaa tggcacttag cttttcacag cccttgtgga tgcctaagaa agtgaaatta 13680 atcccatgcc ctcaagtgtg cagattggtc acagcatttc aagggagaga cctcattgta 13740 agactctggg ggaggtgggg acttaggtgt aagaaatgaa tcagcagagg ctcacaagtc 13800 agcatgagca tgttatgtct gagaaacaga ccagcactgt gagatcaaaa tgtagtggga 13860 agaatttgta caacattaat tggaaggctt acttaatgga atttttgtat agttggatgt 13920 tagtgcatct ctataagtaa gagtttaata tgatggtgtt acggacctaa tgtttgtgtc 13980 tcctcaaaat tcacatgctg aatccccaac tcccaactga ccttatctgt gggggaggct 14040 tttgaaaagt aattaggttt agatgagctc ataagagcag atccccatca taaaattatt 14100 ttccttatca gaagcagaga gacaagccat ttctctttcc tcccggtgag gacacagtga 14160 gaagtccgcc atctgcaatc caggaagaga accctgacca cgagtcagcc ttcagaaatg 14220 tgagaaaaaa ctctgttgtt gaagccaccc agtcttttgt attttgttat agcaccttgc 14280 actgagtaag gcagatgaag aaggagaaaa aaataagctt atcgaaacgc gtccccatcc 14340 tcactgactc cgtcctggag ttggatgaga gataatggcc ttacgttgtg ccaggggagg 14400 gtcgggctgg atttagcaag atttaccttc tccaaagagc ggtgctgcag tggcacagct 14460 gcccacggag gtgggggggt caccgtccct ggaggtgatg aagaactgtg gggatgtggc 14520 actgagggac atggccagtg ggcacggtgg gtgggttggg gttggtcttg gggatcttgg 14580 agggcttttc cagccttcat gatttgacga ttgtatgaac atctacatgg caattctcca 14640 gctgcctgtc ccagtcctac tgacccagct gtatctctcc aggcaagctc ttccacccct 14700 tctgcttgca tccagacacc atcaaacatg caggctcaga cacagggacc agcagtgtct 14760 gtggcctttt tgtgctcctc tccatgctgg gttttaactt gctctttgtc cttctatcct 14820 atcttcttat ccttaaggct gttctgaacg ctgtgacttg gagagtgtcc cagagccctc 14880 aacacctgca tgtcccacgt ccatgctgtc ctgcacttcc ttatccccaa gatctgcctc 14940 tccgtgatgc actgaattgg caaacatgtg tcaccccaga ccaacaatgt cacagcaaac 15000 tcccccttga taggacaagg gggaatggct ttacactgag acaggggagg tttgggttgg 15060 atatgaggag gcagtttttc ccccagaggg tggtgacgca ctgaacaggt tgcccaagga 15120 ggctgtggat gccccatccc tgcaggcatt caaggccagg ctggatgtgg ctctgggcag 15180 cctgggctgc tggttgatga ccctgcacat agcagggggt tggatctgga tgagcactgt 15240 gctcctttgc aacccaggcc gttctatgat tctgtcattc taaatctctc tttcagccta 15300 aagctttttc cccgtatccc cccaggtgtc tgcaggctca aagagcagcg agaagcgttc 15360 agaggaaagc gatcccgtgc caccttcccc gtgcccgggc tgtccccgca cgctgccggc 15420 tcggggatgc ggggggagcg ccggaccgga gcggagcccc gggcggctcg ctgctgcccc 15480 ctagcggggg agggacgtaa ttacatccct gggggctttg ggggggggct gtccctatcg 15540 attactagtt ttaccacatt tgtagaggtt ttacttgctt taaaaaacct cccacacctc 15600 cccctgaacc tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct 15660 tataatggtt acaaataaag caatagcatc acaaatttca caaataaagc atttttttca 15720 ctgcattcta gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgctcgaag 15780 agcggccgct tcagtttcgg ccagcaggcg gggagcccga ggtagctccc gctcccttga 15840 gccaggcccc tgccagacct gagctccctc ccaagcctgg cttccccaac cggtggcctt 15900 catgggccag aagccattcc ttcacggcta gccctccgga gtagttgccc acggctccgc 15960 tgctgcagac cactctgtgg cacgggatga ggatcttgac aggattgcct ctcatggcgc 16020 ctcccactgc tcgcgcggct ttggggttgc cggccagggc ggccaattgc tggtaagaaa 16080 tcacttctcc gaatttcaca accttaagca gcttccataa cacctgacgc gtgaacgact 16140 cttgctggaa aacgggatgg tgaagcgctg gcacggggaa ctcttcgata gcctcgggct 16200 ggtggaaata ggcattcagc caggctgtgc actgcatcag gggctccgga cctccgagaa 16260 ccgcagcggg ggctgggacc tccacggcat cagctgcaga cgtccccttg cccaggagct 16320 ttatttcgtg cagaccctgc tcacaaccag acagctccag cttccccaaa gggctgtcca 16380 gtgtggtgcg tttcatttca caatccttgt ccatggtggc gaccgtctag ctcacgacac 16440 ctgaaatgga agaaaaaaac tttgaaccac tgtctgaggc ttgagaatga accaagatcc 16500 aaactcaaaa agggcaaatt ccaaggagaa ttacatcaag tgccaagctg gcctaacttc 16560 agtctccacc cactcagtgt ggggaaactc catcgcataa aacccctccc cccaacctaa 16620 agacgacgta ctccaaaagc tcgagaacta atcgaggtgc ctggacggcg cccggtactc 16680 cgtggagtca catgaagcga cggctgagga cggaaaggcc cttttccttt gtgtgggtga 16740 ctcacccgcc cgctctcccg agcgccgcgt cctccatttt gagctccctg cagcagggcc 16800 gggaagcggc catctttccg ctcacgcaac tggtgccgac cgggccagcc ttgccgccca 16860 gggcggggcg atacacggcg gcgcgaggcc aggcaccaga gcaggccggc gagcttgaga 16920 ctacccccgt ccgattctcg gtggccgcgc tcgcaggccc cgcctcgccg aacatgtgcg 16980 ctgggacgca cgggccccgt cgccgcccgc ggccccaaaa accgaaatac cagtgtgcag 17040 atcttggccc gcatttacaa gactatcttg ccagaaaaaa agcgtcgcag caggtcatca 17100 aaaattttaa atggctagag acttatcgaa agcagcgaga caggcgcgaa ggtgccacca 17160 gattcgcacg cggcggcccc agcgcccagg ccaggcctca actcaagcac gaggcgaagg 17220 ggctccttaa gcgcaaggcc tcgaactctc ccacccactt ccaacccgaa gctcgggatc 17280 aagaatcacg tactgcagcc aggggcgtgg aagtaattca aggcacgcaa gggccataac 17340 ccgtaaagag gccaggcccg cgggaaccac acacggcact tacctgtgtt ctggcggcaa 17400 acccgttgcg aaaaagaacg ttcacggcga ctactgcact tatatacggt tctcccccac 17460 cctcgggaaa aaggcggagc cagtacacga catcactttc ccagtttacc ccgcgccacc 17520 ttctctaggc accggttcaa ttgccgaccc ctccccccaa cttctcgggg actgtgggcg 17580 atgtgcgctc tgcccactga cgggcaccgg agcctcacgc atgctcttct ccacctcagt 17640 gatgacgaga gcgggcgggt gagggggcgg gaacgcagcg atctctgggt tctacgttag 17700 tgggagttta acgacggtcc ctgggattcc ccaaggcagg ggcgagtcct tttgtatgaa 17760 ttactcaaat cgataactag tgatatctta attaacaaac ggccgctgca ttctagttgt 17820 ggtttgtcca aactcatcaa tgtatcttat catgtctgga tcccatcaca aagctctgac 17880 ctcaatccta tagaaaggag gaatgagcca aaattcaccc aacttattgt gggaagcttg 17940 tggaaggcta ctcgaaatgt ttgacccaag ttaaacaatt taaaggcaat gctaccaaat 18000 actaattgag tgtatgttaa cttctgaccc actgggaatg tgatgaaaga aataaaagct 18060 gaaatgaatc attctctcta ctattattct gatatttcac attcttaaaa taaagtggtg 18120 atcctaactg accttaagac agggaatctt tactcggatt aaatgtcagg aattgtgaaa 18180 aagtgagttt aaatgtattt ggctaaggtg tatgtaaact tccgacttca actgtagggg 18240 atcctctagg gccgccagtg tgatggatat ctgcagaatt cggcttcagg taccgtcgac 18300 gatgtaggtc acggtctcga agccgcggtg cgggtgccag ggcgtgccct tgggctcccc 18360 gggcgcgtac tccacctcac ccatctggtc catcatgatg aacgggtcga ggtggcggta 18420 gttgatcccg gcgaacgcgc ggcgcaccgg gaagccctcg ccctcgaaac cgctgggcgc 18480 ggtggtcacg gtgagcacgg gacgtgcgac ggcgtcggcg ggtgcggata cgcggggcag 18540 cgtcagcggg ttctcgacgg tcacggcggg catgtcgaca agccgaattc cagcacactg 18600 gcggccgtta ctaggtagct agctcgagcc ttcgaagatc tcctagggaa gttcctatac 18660 tttctagaga ataggaactt cggaatagga acttcaccgg tgggtgaaaa gccgaattct 18720 gcagatatca agcttatcga taccgtcgac ctcgaggggg ggcccggtta gatccccggg 18780 taccgagctc gaatatctat gtcgggtgcg gagaaagagg taatgaaatg gcattatggg 18840 tattatgggt ctgcattaac gatagctagc ctctaactcc tagaccgtca gaactgctgg 18900 gcccttcaag acgggctgct cacacccact catgttaagc ctggtgaggc ctgtactctg 18960 ttttcacagg aagaaatcct cacccagtct tccccaaaca cattcccagg ttgtgtcatt 19020 agtgggatag agatgattat tgtggggaga agagaaacat ctggatggat ttggttaggt 19080 tgatctatag aggaagtagg tgctgcctga ggtagctgta atagaagcta aaggtcaaag 19140 gagagggccc tgtcccaatc cagatgactc cacttctgct ggacccaggt tcacaagctt 19200 aatctacatt tcacctaaat ttggctaaca agcccaaaat cacacaggca aagggagaag 19260 tggaggcaga accgaggttg gaggccacca gggccaccgg gcagagatca tttaagccca 19320 accttctcac ttctccctgg gctctgcctc tcttaaagga ccttgtggtg tgacctcttg 19380 taggtccctt tcacactcgg ggcctcagtt tccccactgt aaagtgaatg ggtcccagct 19440 ttggtaagct tatgcttacc tgatgctttc ttcctgggct gctcttgtag agaaaagata 19500 aatcttcttc ctccatccac gagggcttct ttccctgggg gtgagagtag gctgaggaga 19560 gccacttgca cacactctta aagaaagtat tacctgcacc agctcagtga gaggcacaga 19620 tcagactgtt acttgaatca aattatgagc ctccccaaat atatctatga catttaaata 19680 ggggattact tgaacataga ctttgggatc cggtgtggag tgcaggagac tagcaaagtg 19740 aatcctgaga gtagcaggtc tgcacctgtt ggatcgagaa aggcggccta caattctggt 19800 caaatgagct gtgcttattg acatattcta ttagagagta ctaccaggtc accagtcacc 19860 agaaaggctg ccagctctcc aaccacctcc agggaactat cctgaatggg gccttaacaa 19920 gcctaagaga gggttggttt gggtcccaag ccaatatttg ctctgcttta tgtcagtcat 19980 atggaaccca aaccaaccct ctcctatgtg cctcaccagt cggtgcaggg atcccaattt 20040 caagtttggt tttttatggt caaagtccag catagattaa atgaaggggt gtgatgatgg 20100 tgttaaaaga gaactccaga ccagtttaac tcttggacac acatcccatc tcaccatggt 20160 gcttccaacc ttccagagat gatgggctcc tattttctga tgacaaagcc ctccacagga 20220 ttgctgcctg gccatcaggg agtgcctctg taactgaggc tgagatccca ctttcagtcc 20280 tccagctgtg gcccatccct gctccgccca ccgggtatgg cctgtcctag gctcttaggt 20340 atggctgcat tgtgaaatga tggctacaga gctggcatct cctgtagtct ggttcatcta 20400 gtgcactacc tcatagttaa aagaaatctg tttaagccac tgagggtggc tcctagtgcc 20460 aactccaaga acaggaagct tccctttttt gggaggaggg gcagatggta acatggatcg 20520 tccaggtcaa tgggagcagg gcaaccacag taagtactgg acaacaacac aaaactccat 20580 gtgtggcttc catcgagtcc ctctccaatt ggtttggtct tctccgtccc atgcagcact 20640 ttagcaaggg gcctggctga aggctatgaa ttgtgtggag cctcctcatt gcagtctcca 20700 accatctgat gctgggaaaa tgtcaccagg atgcagccat gccgtgtggc caatgaaccg 20760 agaaaacacc ccttttctag aatgctctaa agaggcagaa taatccagag gtgaggaagg 20820 aaatactcca ccagagaccc aggcagttcc tacaaaagcc agactttcct tcacctaggg 20880 agtgacaaga ccagtggaaa acactctcaa gcagtaaccc ccaaatgctc tgcaagccag 20940 tggcgtccag ataccgcaca agcgagtggg ctgtctaatc ccatcatcat gatgtaaata 21000 tctctaggct gccctgggct gtgcctgacc ctgtcttcag ctttccacac ctccacctac 21060 agcccatgca cagaaggacc acccaggaat gctgcaagtg tggcacctcc agggccaccc 21120 agggagaagg agggcagcta tgctggtggc tccaggggtg gtaccttcac accacaaagc 21180 ccaaactgag gccccagatt tggctgatga gggcatattg gacaggggtc acttatgctc 21240 ttccccattg ccacctggcc tctggctacc tggacttggc tacctgtgga tcctctcaca 21300 ggtgccacca tcttggctga gtctccagat gcgaggtccc tgaggcagtg gcaggcttct 21360 cgctaatgct gatgggatta ggaatgggat aggtggggag ggccctggac tgggccctga 21420 tgagccaagt gggtttttag aggggctact ggtacatttc agggacagga catctggtag 21480 agctaagctg gggcaataag gagccactgc taatctgaga gctagaaaca atcagcttct 21540 gggtcattat taattagggt agtttgggct gtgtggaagt cacgtactat atggggtagc 21600 cacagctctc tctacagata atctctaaga cttctgattg ggaccgtgtg aatgcagtag 21660 caatatctct tcttactgcc aggccctgcc agtcctgcct ccacgccctg gctggccccc 21720 cttatgatct gacccatgcc aggctgccat agtatgttac ttctgcatta gcactccttg 21780 ggacctgcct ctccactgtc cctcagactt taaagaacta tacaaaccca aggggctctt 21840 cccaagagaa ttgatatgac ttgaggtgat tccatttctg gaagtagtca ctccattttc 21900 tgcctcactc tttcagtgct tcacagagca ggttcgaacg aaggagccat ccaactaacc 21960 gtcatgttcg ggcaaccgaa gaagggagtg gcaggatttc ctttggagac ttctggaatt 22020 agacagcagt ttaatgcaag catctaaatt ctcttcctcc cagagtctca ttaaaactac 22080 agtaagagtt tgtgttttgt tttgttttta aagacaaaat cccaccagga tagagagaat 22140 aggagaggag ataacagcat cataatttat gaaactaaaa tgcagataga ccaggattaa 22200 ctgactacac agcaccaagg aagctgaatc acaagacagc agaggagaaa actggaaagg 22260 atcgtggtct atacggcaga atcttcccaa gcctcaggag gaggagctct agatgttccc 22320 agatctggga ggtaaagtgg aatgggggga catggtcagc gtaatggggt tgggctggaa 22380 gctggttaag gagcaggcag atctctgaat cccctctctg actctgtgtc cccaggcatc 22440 tgcctgtccc ccaccctgga agaggtctgg cttgaccctt tgtctggtga atttcctgct 22500 ctgctttcct ggtcctgctg gccagatcag tggaggccac tcacttcacc ccacagggat 22560 gttctgtgtt gccctacacc tgggaactgg aggtactgga ggcaggctgt ggtgagcttg 22620 aaagcaaaac acagagggca gtccaatctc tttggccata tttcttctgc atatccaata 22680 ccatgtccac aactctgcta gtgtcctgat ggtggtgggc tctacacatt cccgggaagc 22740 tgaaggcaga taatgaccag gacaggtcaa cctctcttct tctgaaagcc ttcatctact 22800 aatggcctgg gactcttccc ttaaatgctt agattgtgtc ttccactaag gttttttgct 22860 gttgctgttg tttgtttgtt tgtttgtttg tttgtttgtt ttgagacgga atctcactct 22920 gtcgcccagg ctggagtgta gtggcacaat ctcagctcac cacaaccttc acctcctagg 22980 ttgaagggat tctcctgcct cagcctcctg agtagctagg attacaggca catgccacca 23040 tgcctggcta atttttgtat ttttagtaga gacaggattt cgccatgttg gccaggctgg 23100 tcttgaactc ctgacctcag gtgatctgcc taccttggtc tcccaaagtg ctgggattac 23160 tggtgtgagc caccacaccc ggccaaggtt tttgtttgtt tgtttgtttg tttgttttgt 23220 attgaggcag ggtatcactc tggtcaccca ggctggagtg cagtagtgca atcacggctc 23280 actgaaacct ccacctccct ggcgggctca ggtgatcctg ccacctcagc ttcccaggta 23340 gctgggacta caggcttgta ccaccactcc cagctaattt ttgcgttttt agtagagaca 23400 gggtttcccc atgttgccca ggttggtctc aaactctggg ctcaagcgat ctgcctgcct 23460 cagcctccca aagtgctggg attacaggtg taagccaccg tacccggccc cgccactaag 23520 gttttgaaaa tgaagcaatt acaagtttaa gtctattaat aagtgatgaa gctatgtaga 23580 aaagcagaat aattatcttg gatcaggaag gtcacatgag gatctacttg ggggttgtca 23640 atattctatt tcttgacctg atcagtgttg acagcaggtt ttaatttttt acttcttttt 23700 gtttgtttgt ttttgagacg gagtcttgct ctgtctccca ggctggagtg cagtggtatg 23760 atctcggctc actgcaacct ccgcctcctg ggttcaagct gttctcctgc ctcagcctcc 23820 ccagtagctg ggattacagg caggcaccac cacgaccagc taatttttgt atttttagta 23880 gagactgggt ttcaccatct tggccaggct ggtctcgaac ttctgatctc gtgatccgcc 23940 ctccttggcc tcccaaagtg ctgggattac aggcttgagc cagcgtgccc ggcccatttt 24000 ttacttcctt attaaactgt acatataggc cttgcacact tttctgcatc aatgttatat 24060 tccacaataa agggaaaagg tatatacaca acttgatacc agtaatgtga aacatatatt 24120 tctacataga aaaaaaaatg actgaaatac tgcactccaa tgtgttcaca cagtagttgt 24180 ttctggatta tttatatatt aaatgtttat atattgtatt atgccatgag gtttgtgttt 24240 tctctccact tttctgcatt ttccaagttt actacaaaga gcacatatta ctcttataat 24300 cagaaagtca taaaatatat ttaaaaagac aaaattgaaa ctaataagga tcaacacaaa 24360 acagatgagc catctgtgga aatccgcaca gaatactacc taaagagatt ggtgacgtgc 24420 atgatctcac taggatgagc acaaagcttg ccagagccta gggtctattt ctagggttgg 24480 ctcttggaag ccaggatagt tgttatctct gggaagaggg aggggcacac aaggggcttc 24540 taaaacattc tgaatgttct atttctgaac ctggttggtg ggtacatgac tgttggtttt 24600 attattatat gttttatata ctcttccgta tgtatggtgt ggattccaaa aaaagatttc 24660 ctttagagaa aaccagaatc acataagtag aaaatatggt gctatgttga aggaacaact 24720 caagtttata taaaatcatc atcatttata ggcttaaaaa gttgctttgg aattttggtc 24780 taactgactt gtcttttctg cagcaaacca cgctccttct ggacgtgctc caggcagagg 24840 ggattagggt gggttcaagg ctgcaagtac ctagctcagc acactctctt caggggactt 24900 agagtttgtc tggtgttggc tctctgagct cttgtcagga atgccgaccc ttccgaggtt 24960 caggatttga agcctgcctt cccaccccag atttggtcca cacagacact caagtatgta 25020 tttcaactac aaatgacctg tactttccta ttactcctct ctttcatggt aacctttctg 25080 gtatccttcc ttccctacat ttatgggagg gggacatcat tctctgctct cctgtcactg 25140 aaggctccac cttctgtctt cttctgaccc atctggtttt cctggggcca cctcctctcc 25200 ttaccaccct aacgcttttg taacttgagg agaaatgaga gatcacctag tcaggtcatc 25260 attctctgta gatgaagagg cccaatggtt tgctcaagaa ttgccaagcg agttaaagac 25320 agagagtatg agagtcagca agacctacag aaagcatcta tctgcactgt tttgcaggga 25380 cttagccttt gtgtgtggac tcctggaatg ccacccacta agaaacattg tctgacacca 25440 actccccact tggtaggtgg ggacactgaa actcatggca ggaaagggcc ttgccccaag 25500 ccagggcaga gtgtcactca tcactctcaa ttttcagtcc agggcacctt gttgtgacta 25560 tcccaaaggc agccactttc cctggtctga aagacctgaa gagagaagag aagagaagga 25620 tggaaggcag agtatgcggc tttgattcat ttcctggtga aaacagatct atacgagaag 25680 caaatttcac gaaagggaag agaagaaagt gtcccatacg ttgctggcct gtttcaacct 25740 tgctttgatt cttgctgaaa agggtaccgt gtatttctga gttcaacatg cagaccagtg 25800 ttaggaaagc cactgcacct ccactttagc ctccagggct gtgccctgca aatggcctgc 25860 agccttggtg cctcgctctc cagactgcat tttggaagat gggacagagg cttatggaag 25920 cccacattag aacgggggag cagaatgggt gagatgaggg atccttgata gtgaaccaga 25980 tgaaggaatg gtagccaaat gccaggcctc ctttgtggct tcaatccaaa ggctctggag 26040 cccttccagg gcagaacatc aggcatgttt acccccactg tcctcaacag tgacagaggt 26100 gcaatcttgg gcagctggcc attttgaaag caacctcctt aatctcaact gggaaggctc 26160 cctagcagga cccctgtgtt gcacacctgg aggaagctag actaaccaga agctcagcac 26220 ggttccatct gggatgccca ggtctgagac gaaaaaggta actctctttt ctgggtcctg 26280 gcccagttgt gtctctctcc acctcattct ctgagatgcc tgtctcccct tttttgtccc 26340 atcaggaggc aagagctatc actgggccag actccaccag aagccaagcc agcttgttac 26400 ccagcttctc agggagcaaa gaacagcctt gtttctatct tatccccact gtcccctgcc 26460 cctgccccac ctcccagcca ttcagcttct ggcttcccca gagctgcctg cttctttgtg 26520 gtcctccatt ccttgaaaag accttctagt cattagtgta tataaatggc cacttagccc 26580 agattacagt gaggtcaaca gctggggctc tgagaattgt cacacactgg cacaggagag 26640 gaggctattc ttccagagaa tttggagggc actcccatcc acttacaaca aaaagcccat 26700 ccactgtgct tggcagtagg tgatctgaga accaatggaa ccaggttaat cctgtggcac 26760 tgttgagtga ggagagcagt ggcgggcact ggaaaatatc agagacaagg caggagacct 26820 gaaatctagg cttagctcct catatacttg gcagctgtat gacctcagac aaccagtgtt 26880 acctctctaa gcctcagttt cctcatgcaa aaggaggggg aataacaaca gagcccactg 26940 cttgggggtg ttgtgaggac aggatgaaaa aacaaacaga aatccctcag tacaggattc 27000 agtgcagtgg acagtcttgc aaggtctggt tcagccctcc acccctaccc tcaccagtat 27060 aaagaactct ggcctacaag tcagatgacc tgagttttaa tctcagcttt gccattagcc 27120 gtgtgaactt gagaaagtcc ctttcctttt tacatctatt gggatgatca tgcatttttt 27180 gtcctttatt ctgttaatat agtgtgttac attgattgct tttcatagac tgaaccagcc 27240 ttgtattcca gggataaatc tcacttggtc atggtgtata atcctttata caaatgttgc 27300 tgggttgagt ttgctagtat tttgttgaag atttttatgt cttgattcat aaggaatatt 27360 ggtgtacctt ccccttttat ggccacagtt tccctacaat gatgtagtcg aactagacaa 27420 cctccaatat ctttcagtat tcatgtcctc tgattctgtg aaactaagaa aattaagaaa 27480 tagtgattca taggcacaag gcaggcaaaa cttagactcc ttgtagaata attaggaagc 27540 caaatattca gtgtgcttat ttctcaaata accttagttt ctccagtctg ccccaactcc 27600 gaggcctgaa tatctctaga tgcttatgat ggcaactaaa gcctaaaagc taattcattt 27660 taaagttctt ccaaatgcat agggttttat ttttccagac ctgggttcag atggggaatt 27720 tgacaaacaa tggaaagggg gaaaaacaac aatctaaaca ctgagtgaca aagtaacaaa 27780 gaaatagtct agctatcagc cagtcaagcc agccttggct ttgctatcca aagtagtcag 27840 tctaattcta ccaccagttt ctgttcctgt agctgtctac tgcctgccag ggactctgcc 27900 ttcccaccca caactaccaa tggaaggatg tggtgaccat accagtggct gctgacatct 27960 cctgccatgg gaagcataat tgcctccagc agcctccccc ttagatccat catttttgtt 28020 gcacttggcc tgggctgtac tcccggccaa tgactgaaca tggtgagcat agtaatgcag 28080 gcccatttct gtgaggagca ggactcctcc agtaggtgac tttggctcaa ggactctcta 28140 ttggcctggt tgaacttttc ctgaactgtg ctactgtctg agactcttct tacccaatcc 28200 tctttctcgc cccaattgtc acagaccacc tgcattgtgg tctgagtctc tccccacctt 28260 ctcttgctct tccctgttta tctttcacag gcatttcccc cagtacattc cttgaatgtc 28320 taacccgata cgggtgcctg acttttggca gacctaagca gacaaaaagg agtacttggt 28380 tacctagctc ttctttctac cacaaacatc gagggaaccc tttttccctc acccctctgc 28440 cacaccccca ctgccccagt gaacaaccac agagagagct gtggtataat attaggctgg 28500 tgcaaaagta attgcggttt ttgccattac ttttaatggt aaaaaccgca attacttttg 28560 cacctaccta gtatttgtgt ccccccaaat tcatatgttg aaacctaacc cacaatatga 28620 tgtcattagg aggcaagacc ttgaggaggt gattagatga tggggtggag ctctcctgaa 28680 tgagattagt gcccttataa gaagaagccc aaggaagcta ccttgactct tccatcacat 28740 gagaatgcag caagaaggca ccatctacta atcaggaaga gagctctcac cagacactga 28800 atctgccagt gtcttgatct tgaagttccc agcctccaga actatgcata atgcatttcc 28860 attgtctcta agccacccag cctatggtat tttgtcatag cagcctgaac tgactaagac 28920 agtgagccac atgagaagtg ccccaacccc tcccttaagc acttggctca cagatcagtg 28980 ggttcatttc tgcctgagtt ttattgttat tctgtagatt tcttgggcta gatatatttt 29040 tctgttattt tccttcttca cctcagtcat gaattggttg ttttaaaaaa gacaatgtaa 29100 gtcatgggga aactcctgac aactctactc tcctagggtt cctgataaaa ggggattcag 29160 ttgagtcctc tgatggtctc tacctgccaa agtccagcag cccttagcaa acatgctgct 29220 cgtttctgta gagaaggtgc tggtgtccca ccatacttct ctctccctca tgaagggctt 29280 gcgacccagc aaatgggtgg cttatatggg tctgtttcaa aggaagagcc agctctggga 29340 agaaaaacga tgagcataag cataacctac cactgtgcct gggaaagcag acaacttttt 29400 tgatgtgtga atatctaatg agaatggaat ccatcaatta ccttaaactt aggcacagtc 29460 ttcaaattca atatatgtgg gatatacttt tagtcagttt gtagacgtta tttgtaataa 29520 ataatctggc ttctctaaag aaattatttt aagtgtttgg tttggtttga tttaatggta 29580 aaattatatt tagtggcaga gaattatagc aatggtgata aactatagag tgtcataagt 29640 tcatatctta ttctcacatt tgaagctgcc tgcagatgca ttcaagatgc agccagaagt 29700 caggagactc aggctgttat ttggagctca tcattttaca gccttgctgg actcccactt 29760 tctcagggga aaaatgtggt gttgacccag attagctctc caggccctgc tgagttgggc 29820 actctgtaag ctggagggtc ttctattgtc ttcacctaag tgtcaatcaa caacccaaat 29880 gggcatgggg gaagagggag ctgggccaat gcccagggtg cctggtagag agataccttg 29940 ggcactggaa ggcaccagct tcccagagag aagggggagg gccatgaaaa agttggctgt 30000 agatgccagg gacactggga ctctccagct gtgtgtttgt gccttctgaa gacttatgtt 30060 tcattccttt ggagcatgca taatcataca ctgtgggatg tgttatatag attgcttgat 30120 agttcaccac tgtaataaaa tactgtgact ggaatctgct cccagtctgc ctttgatagc 30180 acttgtgcaa cacacattta ctgagcattt acagtgatcc aggacctgtg ttgtgaaaac 30240 attgatggac aaggcagatg gtggagcacg tcagtgagga tttttaacaa aggctggtaa 30300 gtgctataaa ggaacattgt aggacactag agaacaaaga acaggagaac ctgacttagg 30360 ctggggtggg gcgttggtta gaggaggctc cttggaggac atgaggttta agctgtgacc 30420 tgaggatgaa tagatgttgg ccagtgaggt taattaacct caaatcgtca cttccgtttt 30480 cccacgttac gtcacttccc attttaagaa aactacaatt cccaacacat acaagttact 30540 ccgccctaaa acctacgtca cccgccccgt tcccacgccc cgcgccacgt cacaaactcc 30600 accccctcat tatcatattg gcttcaatcc aaaataaggt atattattga tgatg 30655 <210> 64 <211> 32501 <212> DNA <213> Artificial Sequence <220> <223> LCR-F8 (Ad5, Sleeping beauty IR, HS4 to HS1, beta promoter, ET3, mgmt, EF1a promoter, and Ad5) <400> 64 catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60 ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120 gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180 gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag 240 taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga 300 agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg 360 gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc 420 cgggtcaaag ttggcgtttt gattcggccg aaggattaca tgagcttaga aatgtaatta 480 gcatagtgtg tggcatagtg tagataccaa ataaatatga tctctccttc tactcttgaa 540 aatgcaaaca cattcttggt ggtcctaaaa tagcctgtaa catggtttac tcagcagcat 600 ttgctattca aggcagatct gcctttagtc attggctgcg ctcctgaaca gctgtgtgaa 660 aggctaactt ttgtaaacca aatcaaaata aaatgcagca aaaatttgtc actgaaagga 720 aatcctcagt atatcctttt atgaaatgaa agatccctca tccaaactta acttttttaa 780 aagtgcgcat ttggagatat agccctttct tatgaatcct aattcaattt tggccataaa 840 cacacgttga tgttccccac cccaaagcac atagcaacaa gagtaggttc tatattgaaa 900 ataatgacaa tttaaaaaca tgtacttatt tcactgtatg tggacagtgt ctatgattgc 960 atcatgaagt gtcatataac catgtacgtg tacatgagag agagatagag agagaagtgg 1020 tagggtggtg gtggtagagg ggatggcgat agtaatcatg gtaatggtag aggtgatgga 1080 ggtggtaatg acggaggtaa gggtggtagt gatgatggtg gtggtggtaa tggtggtgga 1140 tgtggtggtg gcaattggga tggtgggatg gtggtagcca tggtgatggt ggtaatggtg 1200 ttgatttaaa gggtggtggt agtgaaggtg agggtagtgg tggtggaggt ggtggtgctg 1260 gtagcaatag tgatggtggt gatggtgttg atgagggtgt tgggatcagg gtgagttccc 1320 acagtatatt tcattcttgt tgtaccactc tgtcaacagc accactgact gggacagagg 1380 aagaaggcac actctgaatg tgttattaac agaaacctca aaacagtctg tctccttgta 1440 gtcattcaaa attatctttt tcttacctgg aaaactgaaa ctgaattacc gggaaaaaca 1500 caggagattt ttgtttgtta atatgctgcc aataaagtaa ttttatgtca aatttaacta 1560 caggaaaggg caaggcattt tctaagttcc ttagatgtca tgtggctaaa aaaaacaaaa 1620 ggatggacag cagttagata ctgtacactt agctgtttga agccatatat tcagaaagca 1680 gatgttggga gttggtgttt gaggactgat ttcctggagg tattttatat aggccaagtt 1740 cattgttcta aactctaagg gcttgacttg agggaggaaa agaggcaaga acatgtttag 1800 ttttgctgac agcatcacat gggcagccct aaggctagac aactttaggg cctgaagctt 1860 attctaggaa agaagcacct acagagtggc actgggctcc cctccactat agagatgaag 1920 tcatatgaca gtaaagggca ggcagggctg cctagggggc ccattgaaat tgcggccgca 1980 aataatgggc ccggagcaag agagagggag gcaatgacag cagagacatg cctgcgcctt 2040 gggtttgagt gcccagtggt caaatccact tccctgtggc tgatgcttgc ctttctaact 2100 ttggaattta ggggttggag atctggtgag aaggtaggag ggagatgagg aggagaaggg 2160 aaaggcagga aggaagggga gggaaaggaa aagcaaaagg ggaggaggaa ggtttccaac 2220 aaattattct atatcaactg cggaaatcaa aatttgttgc ccaaatctta gaagctcatg 2280 tccctcctcc ccagaagtct ggaatgcagc actccagggg tagcttataa cccaaatatc 2340 tatctgtaaa aagagaaaca ttgggctttc gagctgtgga ttctcagtaa aagcaagagg 2400 cctcagccta cacaggccag cccagagttt gaggaacccc aggcccacac ccacagggct 2460 ggcccctggg tctgcatact ccctagaaat gtgcacactt ctgagcctca actctgtcct 2520 ggagtctaac agcatccctc tccttcctgg ggcagttcca cctccagaaa cctgttacct 2580 tgggccttat gtcaaggaaa ctgtgggaaa gagctaggca ggaatgcaga tgaggccagc 2640 atgggctcct aaaagtttag aaataggcag tgtcatgctc ccaggtgcct gcataaacca 2700 gctgaaaaat ggagctcccc tcaccagcac tctcccttca aacagactgt gatttgcagg 2760 tcactggttt accaagccag gctacccagg caggacccag atgccaagcc cagtggtgtc 2820 ctgcaagctg agcagtgctc agttcttgca aaaaaaggtc tgtgtgaagg caaggcctct 2880 gcctggcttc tcaccccagt tgggtgtctg gaacaggaag gagcccttac tgcagaaaaa 2940 ggaggaggga gcaaagggag cgaacagctg cgtgctccat ggggaggatc cccaaagtag 3000 aaaggcgcat acacactgca gcccttgacc cagaatgctc acagctacat tacagattca 3060 ggtctcctca gtgtagtggg gctgctgatg agactgtggc atcctcaggg gtcaggacac 3120 acattttcca tcactcttct gatggcaaaa aacctctgag ccaatgccaa cctctgatca 3180 ttaaaaaaaa gtgctcacag cagtgtgtgg tttaggatca tgccctgtgt ggtttggaac 3240 acgtgcacaa ccacaccttg ttcatcacca tcccagaaac cctgacgcag gcaaagagca 3300 gagttattaa ccctacttta ctgatgtgga tactgaggcc cagaggctca tgcaagttat 3360 caataagtgg cagggacagt tgcctctaga ttaactagcc cctaggatca cctgggtctt 3420 ggaaggggac ccataaacat gagctcccct ctcttggggc cagatttgca cctgtgccgc 3480 gccttcagcc tgcatgaagt aggggctgct ggcaaagact caaagctgta aatctgggtt 3540 ttctcttgag gcttctaagg gagctgtttc gacaactcac tctgttccca gctggctgcc 3600 cctgcatagg gttttaaagc agcctagctt tctgccaggc ttggcagtgg acaacgctgg 3660 tcagaacatc ccagagagct accagaatga agtaagtttg cttctactct ttacctgttt 3720 atgggctgtc tctgccactg gaatgaaagg cactgagaac agtgcctggc ctgcagaagg 3780 ccctggaaat acctgagctc ctaatctggg aataggagta ggaagagctt tggaggcagg 3840 gcacctgagt ttgagatcta caacttcctg cctgtgtgac attgggaaag tctccatcct 3900 ttctgagcct cagtctccac cctggggaag tggaaatatc aatctctgtg acacagaagc 3960 aaatgagcga atgtgcacaa agtaccttgc acaagagaga cgctcaaaca cttgcctcca 4020 ggtttcaccg agaactacag agtaagatag atttgttccc agtggaggaa gcctgggaat 4080 aatttgcccc tagactatga attcctgggg ctcaagatcg agcacagggc caggcacaca 4140 gaagggaccc tggaaatgtg gcaggaggcc agagatagac aggcccttag agctcatacc 4200 catgccctct gacctcaaga agaaagaaac ctgctcaaaa tctcacaaag agcttgttcc 4260 aaccctgaat cgagtctgag gactccttcc tgagtccagc actttttctg caagaagtat 4320 atgcctccaa agctgatggg cgcaaatctt gaaccccgtc acataaacac aaagggagga 4380 ggtgactaga gctcctccta ctggatatgt ctaaggtcac cagtctaaag aaaagggatg 4440 gatagaatga ggccagtatt tttgcagcca tccaaatgtc cacatacgct gttacactga 4500 gggctcctct ctcccccgtc ttcagcccta cttgcattta gaggtgagaa agatatgggc 4560 tgaggggttg tttttcatcg tattgtagat ggaaagcaca ctgcccttgg ggccatccaa 4620 atgtggacct tgatgtagca ccccaccttc tggatggcca tccttctgaa agtcactgaa 4680 tttctcagac tttattctct ttatccataa agaaggagaa taataataat ccccccaccc 4740 tgcccaacca ctgactggtt gggaagctca gaagaaatac tgggcacggc atcccattgt 4800 aatctataga gtgagtcgct tcttaatatt aaatggctga acacagaaga tgtgcaaaaa 4860 gtactgtgtc cccttcctcc tccaactgaa catttcatgc cctttgcacc ctcattttgt 4920 ctaggagctg ccttatgaag ggaataggta cctgctccga gctggaggaa tctttgccac 4980 ttatggtggg gtatggactg agacagagat ggcatgtgac atgcgcactg agtctcaact 5040 ccatgcaggc tctggagcac tctcaaattg gagtactaat gccttttaaa ttctcacact 5100 agcaatcctt tgacctactg atctagggat ctagggaaag aatcgtgatc ttaacttcaa 5160 agggaaggac aaaatgttct gcctcctgtt aaaactccat acactaagtg cagagactgg 5220 atgccttatt aaccttgggt agatgcccaa atgttcaaaa ggtcaaactc ttctgttccc 5280 cagatcgcca gagtcattaa ccagtcacac tattaaatga atgaacagat gctgaaaagg 5340 tacttgcatt actgagattt cttatggtga tggcccctgc ctgatatgta ttcagcattt 5400 tgtagttttc aatgtgcatt agagtatagt ggtgatgaca ttggcctctg agtttgccac 5460 ttcttatatc tgtgactttg gtcaaattgc ttaatctctc tgagtctcgg tttcctggag 5520 ataataatag cttcttcttc ccagggttat catgaggatt acaggagata atgccccaaa 5580 aatgcttagt aaagtgccta gcacctagtc aatgctgaat taaaggtggt tattcttact 5640 tttcgttcat ttgaactttg ttctcaggga gggcaaagga tagacaaagc cccatagcta 5700 gtgaggagta gctgcaagac tagaacccag gtgttctgag ccctagtctt aggccaagaa 5760 caactgttac gtgagatgca cgttttcctt caagggagct cacaattatt tccatgtaaa 5820 ttcaaggact gctaaaagag aactctcctc tgggactgat aaacatctag tcgagtatcg 5880 acaaataggg gttccgcgca catttccccg aaaagtgcca cctgacgtaa ctataacggt 5940 cctaaggtag cgaaagcttg catgcctgca ggtcgactct agaggatcaa acctagccac 6000 cgcggtggcg gccggctagc cggctagccg gctagcccta gaactagtaa cggccgccag 6060 tgtgctggaa ttcggcttgt aaggtaccgg tgaagttcct atactttcta gagaatagga 6120 acttcggaat aggaacttct acctagatgc atgctcgagc ggcccctaca gttgaagtcg 6180 gaagtttaca tacacttaag ttggagtcat taaaactcgt ttttcaacta ctccacaaat 6240 ttcttgttaa caaacaatag ttttggcaag tcagttagga catctacttt gtgcatgaca 6300 caagtcattt ttccaacaat tgtttacaga cagattattt cacttataat tcactgtatc 6360 acaattccag tgggtcagaa gtttacatac actaagttga ctgtgccttt aaacagcttg 6420 gaaaattcca gaaaatgatg tcatggcttt agaagcttct gatagactaa ttgacatcat 6480 ttgagtcaat tggaggtgta cctgtggatg tatttcaagg aattctgtgg aatgtgtgtc 6540 agttagggtg tggaaagtcc ccaggctccc cagcaggcag aagtatgcaa agcatgcata 6600 tcgatactag tttataagat ctcgagctag cggccgtttg ttaattaagt cgacggtacc 6660 gtcaaggctg cagtgagaca tgatcttgcc actgcactcc agcctggaca gcagagtgaa 6720 accttgcctc acgaaacaga atacaaaaac aaacaaacaa aaaactgctc cgcaatgcgc 6780 ttccttgatg ctctaccaca taggtctggg tactttgtac acattatctc attgctgttc 6840 ataattgtta gattaatttt gtaatattga tattattcct agaaagctga ggcctcaaga 6900 tgataacttt tattttctgg acttgtaata gctttctctt gtattcacca tgttgtaact 6960 ttcttagagt agtaacaata taaagttatt gtgagttttt gcaaacacag caaacacaac 7020 gacccatata gacattgatg tgaaattgtc tattgtcaat ttatgggaaa acaagtatgt 7080 actttttcta ctaagccatt gaaacaggaa taacagaaca agattgaaag aatacatttt 7140 ccgaaattac ttgagtatta tacaaagaca agcacgtgga cctgggagga gggttattgt 7200 ccatgactgg tgtgtggaga caaatgcagg tttataatag atgggatggc atctagcgca 7260 atgactttgc catcactttt agagagctct tggggacccc agtacacaag aggggacgca 7320 gggtatatgt agacatctca ttctttttct tagtgtgaga ataagaatag ccatgacctg 7380 agtttataga caatgagccc ttttctctct cccactcagc agctatgaga tggcttgccc 7440 tgcctctcta ctaggctgac tcactccaag gcccagcaat gggcagggct ctgtcagggc 7500 tttgatagca ctatctgcag agccagggcc gagaaggggt ggactccaga gactctccct 7560 cccattcccg agcagggttt gcttatttat gcatttaaat gatatattta ttttaaaaga 7620 aataacagga gactgcccag ccctggctgt gacatggaaa ctatgtagaa tattttgggt 7680 tccatttttt tttccttctt tcagttagag gaaaaggggc tcaggatcca cttgcccagt 7740 gttcttcctt agttcctacc ttcgaccttg atcctccttt atcttcctga accctgctga 7800 gatgatctat gtggggagaa tggcttcttt gagaaacatc ttcttcgtta gtggcctgcc 7860 cctcattccc actttaatat ccagaatcac tataagaaga atataataag aggaataact 7920 cttattatag gtaagggaaa attaagaggc atacgtgatg ggatgagtaa gagaggagag 7980 ggaaggatta atggacgata aaatctacta ctatttgttg agacctttta tagtctaatc 8040 aattttgcta ttgttttcca tcctcacgct aactccataa aaaaacacta ttattatctt 8100 tattttgcca tgacaagact gagctcagaa gagtcaagca tttgcctaag gtcggacatg 8160 tcagaggcag tgccagacct atgtgagact ctgcagctac tgctcatggg ccctgtgctg 8220 cactgatgag gaggatcaga tggatggggc aatgaagcaa aggaatcatt ctgtggataa 8280 aggagacagc catgaagaag tctatgactg taaatttggg agcaggagtc tctaaggact 8340 tggatttcaa ggaattttga ctcagcaaac acaagaccct cacggtgact ttgcgagctg 8400 gtgtgccaga tgtgtctatc agaggttcca gggagggtgg ggtggggtca gggctggcca 8460 ccagctatca gggcccagat gggttatagg ctggcaggct cagataggtg gttaggtcag 8520 gttggtggtg ctgggtggag tccatgactc ccaggagcca ggagagatag accatgagta 8580 gagggcagac atgggaaagg tgggggaggc acagcatagc agcatttttc attctactac 8640 tacatgggac tgctccccta tacccccagc taggggcaag tgccttgact cctatgtttt 8700 caggatcatc atctataaag taagagtaat aattgtgtct atctcatagg gttattatga 8760 ggatcaaagg agatgcacac tctctggacc agtggcctaa cagttcagga cagagctatg 8820 ggcttcctat gtatgggtca gtggtctcaa tgtagcaggc aagttccaga agatagcatc 8880 aaccactgtt agagatatac tgccagtctc agagcctgat gttaatttag caatgggctg 8940 ggaccctcct ccagtagaac cttctaacca gctgctgcag tcaaagtcga atgcagctgg 9000 ttagactttt tttaatgaaa gcttgcatgc agcactttgg gaggctgagg tgggtggact 9060 gcttggagct caggagttca agaccatctt ggacaacatg gtgataccct gcctctacaa 9120 aaagtacaaa aattagcctg gcatggtggt gtgcacctgt aatcccagct attagggtgg 9180 ctgaggcagg agaattgctt gaacccggga ggcggaggtt gcagtgagct gagatcgtgc 9240 cactgcactc cagcctgggg gacagagcac attataatta actgttattt tttacttgga 9300 ctcttgtggg gaataagata catgttttat tcttatttat gattcaagca ctgaaaatag 9360 tgtttagcat ccagcaggtg cttcaaaacc atttgctgaa tgattactat actttttaca 9420 agctcagctc cctctatccc ttccagcatc ctcatctctg attaaataag cttcagtttt 9480 tccttagttc ctgttacatt tctgtgtgtc tccattagtg acctcccata gtccaagcat 9540 gagcagttct ggccaggccc ctgtcggggt cagtgcccca cccccgcctt ctggttctgt 9600 gtaaccttct aagcaaacct tctggctcaa gcacagcaat gctgagtcat gatgagtcat 9660 gctgaggctt agggtgtgtg cccagatgtt ctcagcctag agtgatgact cctatctggg 9720 tccccagcag gatgcttaca gggcagatgg caaaaaaaag gagaagctga ccacctgact 9780 aaaactccac ctcaaacggc atcataaaga aaatggatgc ctgagacaga atgtgacata 9840 ttctagaata tattatttcc tgaatatata tatatatata cacatatacc atatgaaaca 9900 cctctaggct ataaggcaac agagctcctt tttttttttt ctgtgctttc ctggctgtcc 9960 aaatctctaa tgataagcat acttctattc aatgagaata ttctgtaaga ttatagttaa 10020 gaattgtggg agccattccg tctcttatag ttaaatttga gcttctttta tgatcactgt 10080 ttttttaata tgctttaagt tctggggtac atgtgccatg gtggtttgct gcacccatca 10140 acccgtcatc tacattaggt atttctccta atgctatcct tcccctagcc ccccaccccc 10200 aacaggcccc agtgtgtgat gttcccctcc ctgtgtccat ggatcactgg tttttttttg 10260 tttttttttt ttttttaaag tctcagttaa atttttggaa tgtaatttat tttcctggta 10320 tcctaaggac ttgcaagtta tctggtcact ttagccctca cgttttgatg ataatcacat 10380 atttgtaaac acaacacaca cacacacaca cacacacata tatatatata taaaacatat 10440 atatacataa acacacataa catatttatc gggcatttct gagcaactaa tcatgcagga 10500 ctctcaaaca ctaacctata gccttttcta tgtatctact tgtgtagaaa ccaagcgtgg 10560 ggactgagaa ggcaatagca ggagcattct gactctcact gcctttagct aggcccctcc 10620 ctcatcacag ctcagcatag tcctgagctc ttatctatat ccacacacag tttctgacgc 10680 tgcccagcta tcaccatccc aagtctaaag aaaaaaataa tgggtttgcc catctctgtt 10740 gattagaaaa caaaacaaaa taaaataagc ccctaagctc ccagaaaaca tgactaaacc 10800 agcaagaaga agaaaataca ataggtatat gaggagactg gtgacactaa gtgtctgaat 10860 gaggcttgag tacagaaaag aggctctagc agcatagtgg tttagaggag atgtttcttt 10920 ccttcacaga tgccttagcc tcaataagct tgcggttgtg gaagtttact tgtttatcac 10980 cggtgacgtc catgagcaaa ttaagaaaaa caacaacaaa tgaatgcata tatatgtata 11040 tgtatgtgtg tatatataca catatatata tatatttttt ttcttttctt accagaaggt 11100 tttaatccaa ataaggagaa gatatgctta gaactgaggt agagttttca tccattctgt 11160 cctgtaagta ttttgcatat tctggagacg caggaagaga tccatctaca tatcccaaag 11220 ctgaattatg gtagacaaaa ctcttccact tttagtgcat caatttctta tttgtgtaat 11280 aagaaaattg ggaaaacgat cttcaatatg cttaccaagc tgtgattcca aatattacgt 11340 aaatacactt gcaaaggagg atgtttttag tagcaatttg tactgatggt atggggccaa 11400 gagatatatc ttagagggag ggctgagggt ttgaagtcca actcctaagc cagtgccaga 11460 agagccaagg acaggtacgg ctgtcatcac ttagacctca ccctgtggag ccacacccta 11520 gggttggcca atctactccc aggagcaggg agggcaggag ccagggctgg gcataaaagt 11580 cagggcagag ccatctattg cttacatttg cttctgacac aactgtgttc actagcaacc 11640 tcaaacagac acctcgagtt tcgattgcta gcttcgaact cgagccacca tgcagctaga 11700 gctctccacc tgtgtctttc tgtgtctctt gccactcggc tttagtgcca tcaggagata 11760 ctacctgggc gcagtggaac tgtcctggga ctaccggcaa agtgaactcc tccgtgagct 11820 gcacgtggac accagatttc ctgctacagc gccaggagct cttccgttgg gcccgtcagt 11880 cctgtacaaa aagactgtgt tcgtagagtt cacggatcaa cttttcagcg ttgccaggcc 11940 caggccacca tggatgggtc tgctgggtcc taccatccag gctgaggttt acgacacggt 12000 ggtcgttacc ctgaagaaca tggcttctca tcccgttagt cttcacgctg tcggcgtctc 12060 cttctggaaa tcttccgaag gcgctgaata tgaggatcac accagccaaa gggagaagga 12120 agacgataaa gtccttcccg gtaaaagcca aacctacgtc tggcaggtcc tgaaagaaaa 12180 tggtccaaca gcctctgacc caccatgtct tacctactca tacctgtctc acgtggacct 12240 ggtgaaagac ctgaattcgg gcctcattgg agccctgctg gtttgtagag aagggagtct 12300 gaccagagaa aggacccaga acctgcacga atttgtacta ctttttgctg tctttgatga 12360 agggaaaagt tggcactcag caagaaatga ctcctggaca cgggccatgg atcccgcacc 12420 tgccagggcc cagcctgcaa tgcacacagt caatggctat gtcaacaggt ctctgccagg 12480 tctgatcgga tgtcataaga aatcagtcta ctggcacgtg attggaatgg gcaccagccc 12540 ggaagtgcac tccatttttc ttgaaggcca cacgtttctc gtgaggcacc atcgccaggc 12600 ttccttggag atctcgccac taactttcct cactgctcag acattcctga tggaccttgg 12660 ccagttccta ctgttttgtc atatctcttc ccaccaccat ggtggcatgg aggctcacgt 12720 cagagtagaa agctgcgccg aggagcccca gctgcggagg aaagctgatg aagaggaaga 12780 ttatgatgac aatttgtacg actcggacat ggacgtggtc cggctcgatg gtgacgacgt 12840 gtctcccttt atccaaatcc gctcagttgc caagaagcat cctaaaactt gggtacatta 12900 cattgctgct gaagaggagg actgggacta tgctccctta gtcctcgccc ccgatgacag 12960 aagttataaa agtcaatatt tgaacaatgg ccctcagcgg attggtagga agtacaaaaa 13020 agtccgattt atggcataca cagatgaaac ctttaagacg cgtgaagcta ttcagcatga 13080 atcaggaatc ttgggacctt tactttatgg ggaagttgga gacacactgt tgattatatt 13140 taagaatcaa gcaagcagac catataacat ctaccctcac ggaatcactg atgtccgtcc 13200 tttgtattca aggagattac caaaaggtgt aaaacatttg aaggattttc caattctgcc 13260 aggagaaata ttcaaatata aatggacagt gactgtagaa gatgggccaa ctaaatcaga 13320 tccgcggtgc ctgacccgct attactctag tttcgttaat atggagagag atctagcttc 13380 aggactcatt ggccctctcc tcatctgcta caaagaatct gtagatcaaa gaggaaacca 13440 gataatgtca gacaagagga atgtcatcct gttttctgta tttgatgaga accgaagctg 13500 gtacctcaca gagaatatac aacgctttct ccccaatcca gctggagtgc agcttgagga 13560 tccagagttc caagcctcca acatcatgca cagcatcaat ggctatgttt ttgatagttt 13620 gcagttgtca gtttgtttgc atgaggtggc atactggtac attctaagca ttggagcaca 13680 gactgacttc ctttctgtct tcttctctgg atataccttc aaacacaaaa tggtctatga 13740 agacacactc accctattcc cattctcagg agaaactgtc ttcatgtcga tggaaaaccc 13800 aggtctatgg attctggggt gccacaactc agactttcgg aacagaggca tgaccgcctt 13860 actgaaggtt tctagttgtg acaagaacac tggtgattat tacgaggaca gttatgaaga 13920 tatttcagca tacttgctga gtaaaaacaa tgccattgaa cctaggagct ttgcccagaa 13980 ttcaagaccc cctagtgcga gcgctccaaa gcctccggtc ctgcgacggc atcagaggga 14040 cataagcctt cctacttttc agccggagga agacaaaatg gactatgatg atatcttctc 14100 aactgaaacg aagggagaag attttgacat ttacggtgag gatgaaaatc aggaccctcg 14160 cagctttcag aagagaaccc gacactattt cattgctgcg gtggagcagc tctgggatta 14220 cgggatgagc gaatcccccc gggcgctaag aaacagggct cagaacggag aggtgcctcg 14280 gttcaagaag gtggtcttcc gggaatttgc tgacggctcc ttcacgcagc cgtcgtaccg 14340 cggggaactc aacaaacact tggggctctt gggaccctac atcagagcgg aagttgaaga 14400 caacatcatg gtaactttca aaaaccaggc gtctcgtccc tattccttct actcgagcct 14460 tatttcttat ccggatgatc aggagcaagg ggcagaacct cgacacaact tcgtccagcc 14520 aaatgaaacc agaacttact tttggaaagt gcagcatcac atggcaccca cagaagacga 14580 gtttgactgc aaagcctggg cctacttttc tgatgttgac ctggaaaaag atgtgcactc 14640 aggcttgatc ggcccccttc tgatctgccg cgccaacacc ctgaacgctg ctcacggtag 14700 acaagtgacc gtgcaagaat ttgctctgtt tttcactatt tttgatgaga caaagagctg 14760 gtacttcact gaaaatgtgg aaaggaactg ccgggccccc tgccatctgc agatggagga 14820 ccccactctg aaagaaaact atcgcttcca tgcaatcaat ggctatgtga tggatacact 14880 ccctggctta gtaatggctc agaatcaaag gatccgatgg tatctgctca gcatgggcag 14940 caatgaaaat atccattcga ttcattttag cggacacgtg ttcagtgtac ggaaaaagga 15000 ggagtataaa atggccgtgt acaatctcta tccgggtgtc tttgagacag tggaaatgct 15060 accgtccaaa gttggaattt ggcgaataga atgcctgatt ggcgagcacc tgcaagctgg 15120 gatgagcacg actttcctgg tgtacagcaa gaagtgtcag actcccctgg gaatggcttc 15180 tggacacatt agagattttc agattacagc ttcaggacaa tatggacagt gggccccaaa 15240 gctggccaga cttcattatt ccggatcaat caatgcctgg agcaccaagg agcccttttc 15300 ttggatcaag gtggatctgt tggcaccaat gattattcac ggcatcaaga cccagggtgc 15360 ccgtcagaag ttctccagcc tctacatctc tcagtttatc atcatgtata gtcttgatgg 15420 gaagaagtgg cagacttatc gaggaaattc cactggaacc ttaatggtct tctttggcaa 15480 tgtggattca tctgggataa aacacaatat ttttaaccct ccaattattg ctcgatacat 15540 ccgtttgcac ccaactcatt atagcattcg cagcactctt cgcatggagt tgatgggctg 15600 tgatttaaat agttgcagca tgccattggg aatggagagt aaagcaatat cagatgcaca 15660 gattactgct tcatcctact ttaccaatat gtttgccacc tggtctcctt caaaagctcg 15720 acttcacctc caagggagga gtaatgcctg gagacctcag gtgaataatc caaaagagtg 15780 gctgcaagtg gacttccaga agacaatgaa agtcacagga gtaactactc agggagtaaa 15840 atctctgctt accagcatgt atgtgaagga gttcctcatc tccagcagtc aagatggcca 15900 tcagtggact ctcttttttc agaatggcaa agtaaaggtt tttcagggaa atcaagactc 15960 cttcacacct gtggtgaact ctctagaccc accgttactg actcgctacc ttcgaattca 16020 cccccagagt tgggtgcacc agattgccct gaggatggag gttctgggct gcgaggcaca 16080 ggacctctac tgagggcggc cgccacccca ccagtgcagg ctgcctatca gaaagtggtg 16140 gctggtgtgg ctaatgccct ggcccacaag tatcactaag ctcgctttct tgctgtccaa 16200 tttctattaa aggttccttt gttccctaag tccaactact aaactggggg atattatgaa 16260 gggccttgag catctggatt ctgcctaata aaaaacattt attttcattg caatgatgta 16320 tttaaattat ttctgaatat tttactaaaa agggaatgtg ggaggtcagt gcatttaaaa 16380 cataaagaaa tgaagagcta gttcaaacct tgggaaaata cactatatct taaactccat 16440 gaaagaaggt gaggctgcaa acagctaatg cacattggca acagcccctg atgcctatgc 16500 cttattcatc cctcagaaaa ggattcaagt agaggcttga tttggaggtt aaagttttgc 16560 tatgctgtat tttacattac ttattgtttt agctgtcctc atgaatgtct tttcactacc 16620 catttgctta tcctgcatct ctcagccttg actccactca gttctcttgc ttagagatac 16680 cacctttccc ctgaagtgtt ccttccatgt tttacggcga gatggtttct cctcgcctgg 16740 ccactcagcc ttagttgtct ctgttgtctt atagaggtct acttgaagaa ggaaaaacag 16800 ggggcatggt ttgactgtcc tgtgagccct tcttccctgc ctcccccact cacagtgacc 16860 cggaatctgc agtgctagtc tcccggaact atcactcttt cacagtctgc tttggaagga 16920 ctgggcttag tatgaaaagt taggactgag aagaatttga aagggggctt tttgtagctt 16980 gatattcact actgtcttat taccctatca taggcccacc ccaaatggaa gtcccattct 17040 tcctcaggat gtttaagatt agcattcagg aagagatcag aggtctgctg gctcccttat 17100 catgtccctt atggtgcttc tggctctgca gttattagca tagtgttacc atcaaccacc 17160 ttaacttcat ttttcttatt caatacctag aaagcttatc gaccccatcc tcactgactc 17220 cgtcctggag ttggatgaga gataatggcc ttacgttgtg ccaggggagg gtcgggctgg 17280 atttagcaag atttaccttc tccaaagagc ggtgctgcag tggcacagct gcccacggag 17340 gtgggggggt caccgtccct ggaggtgatg aagaactgtg gggatgtggc actgagggac 17400 atggccagtg ggcacggtgg gtgggttggg gttggtcttg gggatcttgg agggcttttc 17460 cagccttcat gatttgacga ttgtatgaac atctacatgg caattctcca gctgcctgtc 17520 ccagtcctac tgacccagct gtatctctcc aggcaagctc ttccacccct tctgcttgca 17580 tccagacacc atcaaacatg caggctcaga cacagggacc agcagtgtct gtggcctttt 17640 tgtgctcctc tccatgctgg gttttaactt gctctttgtc cttctatcct atcttcttat 17700 ccttaaggct gttctgaacg ctgtgacttg gagagtgtcc cagagccctc aacacctgca 17760 tgtcccacgt ccatgctgtc ctgcacttcc ttatccccaa gatctgcctc tccgtgatgc 17820 actgaattgg caaacatgtg tcaccccaga ccaacaatgt cacagcaaac tcccccttga 17880 taggacaagg gggaatggct ttacactgag acaggggagg tttgggttgg atatgaggag 17940 gcagtttttc ccccagaggg tggtgacgca ctgaacaggt tgcccaagga ggctgtggat 18000 gccccatccc tgcaggcatt caaggccagg ctggatgtgg ctctgggcag cctgggctgc 18060 tggttgatga ccctgcacat agcagggggt tggatctgga tgagcactgt gctcctttgc 18120 aacccaggcc gttctatgat tctgtcattc taaatctctc tttcagccta aagctttttc 18180 cccgtatccc cccaggtgtc tgcaggctca aagagcagcg agaagcgttc agaggaaagc 18240 gatcccgtgc caccttcccc gtgcccgggc tgtccccgca cgctgccggc tcggggatgc 18300 ggggggagcg ccggaccgga gcggagcccc gggcggctcg ctgctgcccc ctagcggggg 18360 agggacgtaa ttacatccct gggggctttg ggggggggct gtccctatcg attactagtt 18420 ttaccacatt tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc 18480 tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt 18540 acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 18600 gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctgctcgaag agcggccgct 18660 tcagtttcgg ccagcaggcg gggagcccga ggtagctccc gctcccttga gccaggcccc 18720 tgccagacct gagctccctc ccaagcctgg cttccccaac cggtggcctt catgggccag 18780 aagccattcc ttcacggcta gccctccgga gtagttgccc acggctccgc tgctgcagac 18840 cactctgtgg cacgggatga ggatcttgac aggattgcct ctcatggcgc ctcccactgc 18900 tcgcgcggct ttggggttgc cggccagggc ggccaattgc tggtaagaaa tcacttctcc 18960 gaatttcaca accttaagca gcttccataa cacctgacgc gtgaacgact cttgctggaa 19020 aacgggatgg tgaagcgctg gcacggggaa ctcttcgata gcctcgggct ggtggaaata 19080 ggcattcagc caggctgtgc actgcatcag gggctccgga cctccgagaa ccgcagcggg 19140 ggctgggacc tccacggcat cagctgcaga cgtccccttg cccaggagct ttatttcgtg 19200 cagaccctgc tcacaaccag acagctccag cttccccaaa gggctgtcca gtgtggtgcg 19260 tttcatttca caatccttgt ccatggtggc gaccgtctag ctcacgacac ctgaaatgga 19320 agaaaaaaac tttgaaccac tgtctgaggc ttgagaatga accaagatcc aaactcaaaa 19380 agggcaaatt ccaaggagaa ttacatcaag tgccaagctg gcctaacttc agtctccacc 19440 cactcagtgt ggggaaactc catcgcataa aacccctccc cccaacctaa agacgacgta 19500 ctccaaaagc tcgagaacta atcgaggtgc ctggacggcg cccggtactc cgtggagtca 19560 catgaagcga cggctgagga cggaaaggcc cttttccttt gtgtgggtga ctcacccgcc 19620 cgctctcccg agcgccgcgt cctccatttt gagctccctg cagcagggcc gggaagcggc 19680 catctttccg ctcacgcaac tggtgccgac cgggccagcc ttgccgccca gggcggggcg 19740 atacacggcg gcgcgaggcc aggcaccaga gcaggccggc gagcttgaga ctacccccgt 19800 ccgattctcg gtggccgcgc tcgcaggccc cgcctcgccg aacatgtgcg ctgggacgca 19860 cgggccccgt cgccgcccgc ggccccaaaa accgaaatac cagtgtgcag atcttggccc 19920 gcatttacaa gactatcttg ccagaaaaaa agcgtcgcag caggtcatca aaaattttaa 19980 atggctagag acttatcgaa agcagcgaga caggcgcgaa ggtgccacca gattcgcacg 20040 cggcggcccc agcgcccagg ccaggcctca actcaagcac gaggcgaagg ggctccttaa 20100 gcgcaaggcc tcgaactctc ccacccactt ccaacccgaa gctcgggatc aagaatcacg 20160 tactgcagcc aggggcgtgg aagtaattca aggcacgcaa gggccataac ccgtaaagag 20220 gccaggcccg cgggaaccac acacggcact tacctgtgtt ctggcggcaa acccgttgcg 20280 aaaaagaacg ttcacggcga ctactgcact tatatacggt tctcccccac cctcgggaaa 20340 aaggcggagc cagtacacga catcactttc ccagtttacc ccgcgccacc ttctctaggc 20400 accggttcaa ttgccgaccc ctccccccaa cttctcgggg actgtgggcg atgtgcgctc 20460 tgcccactga cgggcaccgg agcctcacgc atgctcttct ccacctcagt gatgacgaga 20520 gcgggcgggt gagggggcgg gaacgcagcg atctctgggt tctacgttag tgggagttta 20580 acgacggtcc ctgggattcc ccaaggcagg ggcgagtcct tttgtatgaa ttactcaact 20640 agtgatatct taattaacaa acggccgctg cattctagtt gtggtttgtc caaactcatc 20700 aatgtatctt atcatgtctg gatcccatca caaagctctg acctcaatcc tatagaaagg 20760 aggaatgagc caaaattcac ccaacttatt gtgggaagct tgtggaaggc tactcgaaat 20820 gtttgaccca agttaaacaa tttaaaggca atgctaccaa atactaattg agtgtatgtt 20880 aacttctgac ccactgggaa tgtgatgaaa gaaataaaag ctgaaatgaa tcattctctc 20940 tactattatt ctgatatttc acattcttaa aataaagtgg tgatcctaac tgaccttaag 21000 acagggaatc tttactcgga ttaaatgtca ggaattgtga aaaagtgagt ttaaatgtat 21060 ttggctaagg tgtatgtaaa cttccgactt caactgtagg ggatcctcta gggccgccag 21120 tgtgatggat atctgcagaa ttcggcttca ggtaccgtcg acgatgtagg tcacggtctc 21180 gaagccgcgg tgcgggtgcc agggcgtgcc cttgggctcc ccgggcgcgt actccacctc 21240 acccatctgg tccatcatga tgaacgggtc gaggtggcgg tagttgatcc cggcgaacgc 21300 gcggcgcacc gggaagccct cgccctcgaa accgctgggc gcggtggtca cggtgagcac 21360 gggacgtgcg acggcgtcgg cgggtgcgga tacgcggggc agcgtcagcg ggttctcgac 21420 ggtcacggcg ggcatgtcga caagccgaat tccagcacac tggcggccgt tactaggtag 21480 ctagctcgag ccttcgaaga tctcctaggg aagttcctat actttctaga gaataggaac 21540 ttcggaatag gaacttcacc ggtgggtgaa aagccgaatt ctgcagatat caagcttatc 21600 gataccgtcg acctcgaggg ggggcccggt tagatccccg ggtaccgagc tcgaattcat 21660 ctatgtcggg tgcggagaaa gaggtaatga aatggcatta tgggtattat gggtctgcat 21720 taacgatagc tagcctctaa ctcctagacc gtcagaactg ctgggccctt caagacgggc 21780 tgctcacacc cactcatgtt aagcctggtg aggcctgtac tctgttttca caggaagaaa 21840 tcctcaccca gtcttcccca aacacattcc caggttgtgt cattagtggg atagagatga 21900 ttattgtggg gagaagagaa acatctggat ggatttggtt aggttgatct atagaggaag 21960 taggtgctgc ctgaggtagc tgtaatagaa gctaaaggtc aaaggagagg gccctgtccc 22020 aatccagatg actccacttc tgctggaccc aggttcacaa gcttaatcta catttcacct 22080 aaatttggct aacaagccca aaatcacaca ggcaaaggga gaagtggagg cagaaccgag 22140 gttggaggcc accagggcca ccgggcagag atcatttaag cccaaccttc tcacttctcc 22200 ctgggctctg cctctcttaa aggaccttgt ggtgtgacct cttgtaggtc cctttcacac 22260 tcggggcctc agtttcccca ctgtaaagtg aatgggtccc agctttggta agcttatgct 22320 tacctgatgc tttcttcctg ggctgctctt gtagagaaaa gataaatctt cttcctccat 22380 ccacgagggc ttctttccct gggggtgaga gtaggctgag gagagccact tgcacacact 22440 cttaaagaaa gtattacctg caccagctca gtgagaggca cagatcagac tgttacttga 22500 atcaaattat gagcctcccc aaatatatct atgacattta aataggggat tacttgaaca 22560 tagactttgg gatccggtgt ggagtgcagg agactagcaa agtgaatcct gagagtagca 22620 ggtctgcacc tgttggatcg agaaaggcgg cctacaattc tggtcaaatg agctgtgctt 22680 attgacatat tctattagag agtactacca ggtcaccagt caccagaaag gctgccagct 22740 ctccaaccac ctccagggaa ctatcctgaa tggggcctta acaagcctaa gagagggttg 22800 gtttgggtcc caagccaata tttgctctgc tttatgtcag tcatatggaa cccaaaccaa 22860 ccctctccta tgtgcctcac cagtcggtgc agggatccca atttcaagtt tggtttttta 22920 tggtcaaagt ccagcataga ttaaatgaag gggtgtgatg atggtgttaa aagagaactc 22980 cagaccagtt taactcttgg acacacatcc catctcacca tggtgcttcc aaccttccag 23040 agatgatggg ctcctatttt ctgatgacaa agccctccac aggattgctg cctggccatc 23100 agggagtgcc tctgtaactg aggctgagat cccactttca gtcctccagc tgtggcccat 23160 ccctgctccg cccaccgggt atggcctgtc ctaggctctt aggtatggct gcattgtgaa 23220 atgatggcta cagagctggc atctcctgta gtctggttca tctagtgcac tacctcatag 23280 ttaaaagaaa tctgtttaag ccactgaggg tggctcctag tgccaactcc aagaacagga 23340 agcttccctt ttttgggagg aggggcagat ggtaacatgg atcgtccagg tcaatgggag 23400 cagggcaacc acagtaagta ctggacaaca acacaaaact ccatgtgtgg cttccatcga 23460 gtccctctcc aattggtttg gtcttctccg tcccatgcag cactttagca aggggcctgg 23520 ctgaaggcta tgaattgtgt ggagcctcct cattgcagtc tccaaccatc tgatgctggg 23580 aaaatgtcac caggatgcag ccatgccgtg tggccaatga accgagaaaa cacccctttt 23640 ctagaatgct ctaaagaggc agaataatcc agaggtgagg aaggaaatac tccaccagag 23700 acccaggcag ttcctacaaa agccagactt tccttcacct agggagtgac aagaccagtg 23760 gaaaacactc tcaagcagta acccccaaat gctctgcaag ccagtggcgt ccagataccg 23820 cacaagcgag tgggctgtct aatcccatca tcatgatgta aatatctcta ggctgccctg 23880 ggctgtgcct gaccctgtct tcagctttcc acacctccac ctacagccca tgcacagaag 23940 gaccacccag gaatgctgca agtgtggcac ctccagggcc acccagggag aaggagggca 24000 gctatgctgg tggctccagg ggtggtacct tcacaccaca aagcccaaac tgaggcccca 24060 gatttggctg atgagggcat attggacagg ggtcacttat gctcttcccc attgccacct 24120 ggcctctggc tacctggact tggctacctg tggatcctct cacaggtgcc accatcttgg 24180 ctgagtctcc agatgcgagg tccctgaggc agtggcaggc ttctcgctaa tgctgatggg 24240 attaggaatg ggataggtgg ggagggccct ggactgggcc ctgatgagcc aagtgggttt 24300 ttagaggggc tactggtaca tttcagggac aggacatctg gtagagctaa gctggggcaa 24360 taaggagcca ctgctaatct gagagctaga aacaatcagc ttctgggtca ttattaatta 24420 gggtagtttg ggctgtgtgg aagtcacgta ctatatgggg tagccacagc tctctctaca 24480 gataatctct aagacttctg attgggaccg tgtgaatgca gtagcaatat ctcttcttac 24540 tgccaggccc tgccagtcct gcctccacgc cctggctggc cccccttatg atctgaccca 24600 tgccaggctg ccatagtatg ttacttctgc attagcactc cttgggacct gcctctccac 24660 tgtccctcag actttaaaga actatacaaa cccaaggggc tcttcccaag agaattgata 24720 tgacttgagg tgattccatt tctggaagta gtcactccat tttctgcctc actctttcag 24780 tgcttcacag agcaggttcg aacgaaggag ccatccaact aaccgtcatg ttcgggcaac 24840 cgaagaaggg agtggcagga tttcctttgg agacttctgg aattagacag cagtttaatg 24900 caagcatcta aattctcttc ctcccagagt ctcattaaaa ctacagtaag agtttgtgtt 24960 ttgttttgtt tttaaagaca aaatcccacc aggatagaga gaataggaga ggagataaca 25020 gcatcataat ttatgaaact aaaatgcaga tagaccagga ttaactgact acacagcacc 25080 aaggaagctg aatcacaaga cagcagagga gaaaactgga aaggatcgtg gtctatacgg 25140 cagaatcttc ccaagcctca ggaggaggag ctctagatgt tcccagatct gggaggtaaa 25200 gtggaatggg gggacatggt cagcgtaatg gggttgggct ggaagctggt taaggagcag 25260 gcagatctct gaatcccctc tctgactctg tgtccccagg catctgcctg tcccccaccc 25320 tggaagaggt ctggcttgac cctttgtctg gtgaatttcc tgctctgctt tcctggtcct 25380 gctggccaga tcagtggagg ccactcactt caccccacag ggatgttctg tgttgcccta 25440 cacctgggaa ctggaggtac tggaggcagg ctgtggtgag cttgaaagca aaacacagag 25500 ggcagtccaa tctctttggc catatttctt ctgcatatcc aataccatgt ccacaactct 25560 gctagtgtcc tgatggtggt gggctctaca cattcccggg aagctgaagg cagataatga 25620 ccaggacagg tcaacctctc ttcttctgaa agccttcatc tactaatggc ctgggactct 25680 tcccttaaat gcttagattg tgtcttccac taaggttttt tgctgttgct gttgtttgtt 25740 tgtttgtttg tttgtttgtt tgttttgaga cggaatctca ctctgtcgcc caggctggag 25800 tgtagtggca caatctcagc tcaccacaac cttcacctcc taggttgaag ggattctcct 25860 gcctcagcct cctgagtagc taggattaca ggcacatgcc accatgcctg gctaattttt 25920 gtatttttag tagagacagg atttcgccat gttggccagg ctggtcttga actcctgacc 25980 tcaggtgatc tgcctacctt ggtctcccaa agtgctggga ttactggtgt gagccaccac 26040 acccggccaa ggtttttgtt tgtttgtttg tttgtttgtt ttgtattgag gcagggtatc 26100 actctggtca cccaggctgg agtgcagtag tgcaatcacg gctcactgaa acctccacct 26160 ccctggcggg ctcaggtgat cctgccacct cagcttccca ggtagctggg actacaggct 26220 tgtaccacca ctcccagcta atttttgcgt ttttagtaga gacagggttt ccccatgttg 26280 cccaggttgg tctcaaactc tgggctcaag cgatctgcct gcctcagcct cccaaagtgc 26340 tgggattaca ggtgtaagcc accgtacccg gccccgccac taaggttttg aaaatgaagc 26400 aattacaagt ttaagtctat taataagtga tgaagctatg tagaaaagca gaataattat 26460 cttggatcag gaaggtcaca tgaggatcta cttgggggtt gtcaatattc tatttcttga 26520 cctgatcagt gttgacagca ggttttaatt ttttacttct ttttgtttgt ttgtttttga 26580 gacggagtct tgctctgtct cccaggctgg agtgcagtgg tatgatctcg gctcactgca 26640 acctccgcct cctgggttca agctgttctc ctgcctcagc ctccccagta gctgggatta 26700 caggcaggca ccaccacgac cagctaattt ttgtattttt agtagagact gggtttcacc 26760 atcttggcca ggctggtctc gaacttctga tctcgtgatc cgccctcctt ggcctcccaa 26820 agtgctggga ttacaggctt gagccagcgt gcccggccca ttttttactt ccttattaaa 26880 ctgtacatat aggccttgca cacttttctg catcaatgtt atattccaca ataaagggaa 26940 aaggtatata cacaacttga taccagtaat gtgaaacata tatttctaca tagaaaaaaa 27000 aatgactgaa atactgcact ccaatgtgtt cacacagtag ttgtttctgg attatttata 27060 tattaaatgt ttatatattg tattatgcca tgaggtttgt gttttctctc cacttttctg 27120 cattttccaa gtttactaca aagagcacat attactctta taatcagaaa gtcataaaat 27180 atatttaaaa agacaaaatt gaaactaata aggatcaaca caaaacagat gagccatctg 27240 tggaaatccg cacagaatac tacctaaaga gattggtgac gtgcatgatc tcactaggat 27300 gagcacaaag cttgccagag cctagggtct atttctaggg ttggctcttg gaagccagga 27360 tagttgttat ctctgggaag agggaggggc acacaagggg cttctaaaac attctgaatg 27420 ttctatttct gaacctggtt ggtgggtaca tgactgttgg ttttattatt atatgtttta 27480 tatactcttc cgtatgtatg gtgtggattc caaaaaaaga tttcctttag agaaaaccag 27540 aatcacataa gtagaaaata tggtgctatg ttgaaggaac aactcaagtt tatataaaat 27600 catcatcatt tataggctta aaaagttgct ttggaatttt ggtctaactg acttgtcttt 27660 tctgcagcaa accacgctcc ttctggacgt gctccaggca gaggggatta gggtgggttc 27720 aaggctgcaa gtacctagct cagcacactc tcttcagggg acttagagtt tgtctggtgt 27780 tggctctctg agctcttgtc aggaatgccg acccttccga ggttcaggat ttgaagcctg 27840 ccttcccacc ccagatttgg tccacacaga cactcaagta tgtatttcaa ctacaaatga 27900 cctgtacttt cctattactc ctctctttca tggtaacctt tctggtatcc ttccttccct 27960 acatttatgg gagggggaca tcattctctg ctctcctgtc actgaaggct ccaccttctg 28020 tcttcttctg acccatctgg ttttcctggg gccacctcct ctccttacca ccctaacgct 28080 tttgtaactt gaggagaaat gagagatcac ctagtcaggt catcattctc tgtagatgaa 28140 gaggcccaat ggtttgctca agaattgcca agcgagttaa agacagagag tatgagagtc 28200 agcaagacct acagaaagca tctatctgca ctgttttgca gggacttagc ctttgtgtgt 28260 ggactcctgg aatgccaccc actaagaaac attgtctgac accaactccc cacttggtag 28320 gtggggacac tgaaactcat ggcaggaaag ggccttgccc caagccaggg cagagtgtca 28380 ctcatcactc tcaattttca gtccagggca ccttgttgtg actatcccaa aggcagccac 28440 tttccctggt ctgaaagacc tgaagagaga agagaagaga aggatggaag gcagagtatg 28500 cggctttgat tcatttcctg gtgaaaacag atctatacga gaagcaaatt tcacgaaagg 28560 gaagagaaga aagtgtccca tacgttgctg gcctgtttca accttgcttt gattcttgct 28620 gaaaagggta ccgtgtattt ctgagttcaa catgcagacc agtgttagga aagccactgc 28680 acctccactt tagcctccag ggctgtgccc tgcaaatggc ctgcagcctt ggtgcctcgc 28740 tctccagact gcattttgga agatgggaca gaggcttatg gaagcccaca ttagaacggg 28800 ggagcagaat gggtgagatg agggatcctt gatagtgaac cagatgaagg aatggtagcc 28860 aaatgccagg cctcctttgt ggcttcaatc caaaggctct ggagcccttc cagggcagaa 28920 catcaggcat gtttaccccc actgtcctca acagtgacag aggtgcaatc ttgggcagct 28980 ggccattttg aaagcaacct ccttaatctc aactgggaag gctccctagc aggacccctg 29040 tgttgcacac ctggaggaag ctagactaac cagaagctca gcacggttcc atctgggatg 29100 cccaggtctg agacgaaaaa ggtaactctc ttttctgggt cctggcccag ttgtgtctct 29160 ctccacctca ttctctgaga tgcctgtctc cccttttttg tcccatcagg aggcaagagc 29220 tatcactggg ccagactcca ccagaagcca agccagcttg ttacccagct tctcagggag 29280 caaagaacag ccttgtttct atcttatccc cactgtcccc tgcccctgcc ccacctccca 29340 gccattcagc ttctggcttc cccagagctg cctgcttctt tgtggtcctc cattccttga 29400 aaagaccttc tagtcattag tgtatataaa tggccactta gcccagatta cagtgaggtc 29460 aacagctggg gctctgagaa ttgtcacaca ctggcacagg agaggaggct attcttccag 29520 agaatttgga gggcactccc atccacttac aacaaaaagc ccatccactg tgcttggcag 29580 taggtgatct gagaaccaat ggaaccaggt taatcctgtg gcactgttga gtgaggagag 29640 cagtggcggg cactggaaaa tatcagagac aaggcaggag acctgaaatc taggcttagc 29700 tcctcatata cttggcagct gtatgacctc agacaaccag tgttacctct ctaagcctca 29760 gtttcctcat gcaaaaggag ggggaataac aacagagccc actgcttggg ggtgttgtga 29820 ggacaggatg aaaaaacaaa cagaaatccc tcagtacagg attcagtgca gtggacagtc 29880 ttgcaaggtc tggttcagcc ctccacccct accctcacca gtataaagaa ctctggccta 29940 caagtcagat gacctgagtt ttaatctcag ctttgccatt agccgtgtga acttgagaaa 30000 gtccctttcc tttttacatc tattgggatg atcatgcatt ttttgtcctt tattctgtta 30060 atatagtgtg ttacattgat tgcttttcat agactgaacc agccttgtat tccagggata 30120 aatctcactt ggtcatggtg tataatcctt tatacaaatg ttgctgggtt gagtttgcta 30180 gtattttgtt gaagattttt atgtcttgat tcataaggaa tattggtgta ccttcccctt 30240 ttatggccac agtttcccta caatgatgta gtcgaactag acaacctcca atatctttca 30300 gtattcatgt cctctgattc tgtgaaacta agaaaattaa gaaatagtga ttcataggca 30360 caaggcaggc aaaacttaga ctccttgtag aataattagg aagccaaata ttcagtgtgc 30420 ttatttctca aataacctta gtttctccag tctgccccaa ctccgaggcc tgaatatctc 30480 tagatgctta tgatggcaac taaagcctaa aagctaattc attttaaagt tcttccaaat 30540 gcatagggtt ttatttttcc agacctgggt tcagatgggg aatttgacaa acaatggaaa 30600 gggggaaaaa caacaatcta aacactgagt gacaaagtaa caaagaaata gtctagctat 30660 cagccagtca agccagcctt ggctttgcta tccaaagtag tcagtctaat tctaccacca 30720 gtttctgttc ctgtagctgt ctactgcctg ccagggactc tgccttccca cccacaacta 30780 ccaatggaag gatgtggtga ccataccagt ggctgctgac atctcctgcc atgggaagca 30840 taattgcctc cagcagcctc ccccttagat ccatcatttt tgttgcactt ggcctgggct 30900 gtactcccgg ccaatgactg aacatggtga gcatagtaat gcaggcccat ttctgtgagg 30960 agcaggactc ctccagtagg tgactttggc tcaaggactc tctattggcc tggttgaact 31020 tttcctgaac tgtgctactg tctgagactc ttcttaccca atcctctttc tcgccccaat 31080 tgtcacagac cacctgcatt gtggtctgag tctctcccca ccttctcttg ctcttccctg 31140 tttatctttc acaggcattt cccccagtac attccttgaa tgtctaaccc gatacgggtg 31200 cctgactttt ggcagaccta agcagacaaa aaggagtact tggttaccta gctcttcttt 31260 ctaccacaaa catcgaggga accctttttc cctcacccct ctgccacacc cccactgccc 31320 cagtgaacaa ccacagagag agctgtggta taatattagg ctggtgcaaa agtaattgcg 31380 gtttttgcca ttacttttaa tggtaaaaac cgcaattact tttgcaccta cctagtattt 31440 gtgtcccccc aaattcatat gttgaaacct aacccacaat atgatgtcat taggaggcaa 31500 gaccttgagg aggtgattag atgatggggt ggagctctcc tgaatgagat tagtgccctt 31560 ataagaagaa gcccaaggaa gctaccttga ctcttccatc acatgagaat gcagcaagaa 31620 ggcaccatct actaatcagg aagagagctc tcaccagaca ctgaatctgc cagtgtcttg 31680 atcttgaagt tcccagcctc cagaactatg cataatgcat ttccattgtc tctaagccac 31740 ccagcctatg gtattttgtc atagcagcct gaactgacta agacagtgag ccacatgaga 31800 agtgccccaa cccctccctt aagcacttgg ctcacagatc agtgggttca tttctgcctg 31860 agttttattg ttattctgta gatttcttgg gctagatata tttttctgtt attttccttc 31920 ttcacctcag tcatgaattg gttgttttaa aaaagacaat gtaagtcatg gggaaactcc 31980 tgacaactct actctcctag ggttcctgat aaaaggggat tcagttgagt cctctgatgg 32040 tctctacctg ccaaagtcca gcagccctta gcaaacatgc tgctcgtttc tgtagagaag 32100 gtgctggtgt cccaccatac ttctctctcc ctcatgaagg gcttgcgacc cagcaaatgg 32160 gtggcttata tgggtctgtt tcaaaggaag agccagctct gggaagaaaa acgatgagca 32220 taagcataac ctaccactgt gcctgggaaa gcagacaact tttttgatgt gtgaatatct 32280 aatgagaatg gaatccatca attaccttaa acttaggcac agtcttcaaa ttcaatatat 32340 gtgggatata cttttagtca gtttgtagac gttatttgta ataaataatc tggcttctct 32400 aaagaaatta ttttaagtgt ttggtttggt ttgatttaat ggtaaaatta tatttagtgg 32460 cagagaatta tagcaatggt gataaactat agagtgtcat a 32501 <210> 65 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> top strand of GATAA motif <400> 65 caaacccttc ctggagcctg tgataaaagc aactgttagc ttgcact 47 <210> 66 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> bottom strand of GATAA motif <400> 66 agtgcaagct aacagttgct tttatcacag gctccaggaa gggtttg 47 <210> 67 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> top strand of disrupted GATAA motif <400> 67 caaacccttc ctggagcctg taataaaagc aactgttagc ttgcact 47 <210> 68 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> bottom strand of distrupted GATAA motif <400> 68 agtgcaagct aacagttgct tttattacag gctccaggaa gggtttg 47 <210> 69 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> HBG2 forward primer <400> 69 tccttctgtc attttgcctc tgtt 24 <210> 70 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HBB primer <400> 70 ttgagcaatg tggacagaga agg 23 <210> 71 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> HDAd-BEHBG-106 <400> 71 ttggccagcc ttgccttgac caatagcctt gacaaggcaa 40 <210> 72 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> HBG2 reverse primer <400> 72 cacttcattg tagttaccgt ggaaaga 27 <210> 73 <211> 340 <212> PRT <213> Artificial Sequence <220> <223> Sleeping Beauty transposase enzyme <400> 73 Met Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Lys Ile Val 1 5 10 15 Asp Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu 20 25 30 Lys Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His 35 40 45 His Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Tyr Leu 50 55 60 Ser Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro 65 70 75 80 Arg Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr 85 90 95 Lys Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu 100 105 110 Lys Gly Arg Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys 115 120 125 Lys Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr 130 135 140 Phe Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe 145 150 155 160 Gly His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys 165 170 175 Lys Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile 180 185 190 Met Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys 195 200 205 Ile Asp Gly Ile Met Arg Lys Glu Asn Tyr Val Asp Ile Leu Lys Gln 210 215 220 His Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val 225 230 235 240 Phe Gln Met Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys 245 250 255 Trp Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser 260 265 270 Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg 275 280 285 Val Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys 290 295 300 Gln Glu Glu Trp Ala Lys Ile His Pro Thr Tyr Cys Gly Lys Leu Val 305 310 315 320 Glu Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn 325 330 335 Ala Thr Lys Tyr 340 <210> 74 <211> 340 <212> PRT <213> Artificial Sequence <220> <223> Hyperactive Sleeping Beauty is SB100X <400> 74 Met Gly Lys Ser Lys Glu Ile Ser Gln Asp Leu Arg Lys Arg Ile Val 1 5 10 15 Asp Leu His Lys Ser Gly Ser Ser Leu Gly Ala Ile Ser Lys Arg Leu 20 25 30 Ala Val Pro Arg Ser Ser Val Gln Thr Ile Val Arg Lys Tyr Lys His 35 40 45 His Gly Thr Thr Gln Pro Ser Tyr Arg Ser Gly Arg Arg Arg Tyr Leu 50 55 60 Ser Pro Arg Asp Glu Arg Thr Leu Val Arg Lys Val Gln Ile Asn Pro 65 70 75 80 Arg Thr Thr Ala Lys Asp Leu Val Lys Met Leu Glu Glu Thr Gly Thr 85 90 95 Lys Val Ser Ile Ser Thr Val Lys Arg Val Leu Tyr Arg His Asn Leu 100 105 110 Lys Gly His Ser Ala Arg Lys Lys Pro Leu Leu Gln Asn Arg His Lys 115 120 125 Lys Ala Arg Leu Arg Phe Ala Thr Ala His Gly Asp Lys Asp Arg Thr 130 135 140 Phe Trp Arg Asn Val Leu Trp Ser Asp Glu Thr Lys Ile Glu Leu Phe 145 150 155 160 Gly His Asn Asp His Arg Tyr Val Trp Arg Lys Lys Gly Glu Ala Cys 165 170 175 Lys Pro Lys Asn Thr Ile Pro Thr Val Lys His Gly Gly Gly Ser Ile 180 185 190 Met Leu Trp Gly Cys Phe Ala Ala Gly Gly Thr Gly Ala Leu His Lys 195 200 205 Ile Asp Gly Ile Met Asp Ala Val Gln Tyr Val Asp Ile Leu Lys Gln 210 215 220 His Leu Lys Thr Ser Val Arg Lys Leu Lys Leu Gly Arg Lys Trp Val 225 230 235 240 Phe Gln His Asp Asn Asp Pro Lys His Thr Ser Lys Val Val Ala Lys 245 250 255 Trp Leu Lys Asp Asn Lys Val Lys Val Leu Glu Trp Pro Ser Gln Ser 260 265 270 Pro Asp Leu Asn Pro Ile Glu Asn Leu Trp Ala Glu Leu Lys Lys Arg 275 280 285 Val Arg Ala Arg Arg Pro Thr Asn Leu Thr Gln Leu His Gln Leu Cys 290 295 300 Gln Glu Glu Trp Ala Lys Ile His Pro Asn Tyr Cys Gly Lys Leu Val 305 310 315 320 Glu Gly Tyr Pro Lys Arg Leu Thr Gln Val Lys Gln Phe Lys Gly Asn 325 330 335 Ala Thr Lys Tyr 340 <210> 75 <211> 423 <212> PRT <213> Artificial Sequence <220> <223> Flp (flippase) <400> 75 Met Pro Gln Phe Gly Ile Leu Cys Lys Thr Pro Pro Lys Val Leu Val 1 5 10 15 Arg Gln Phe Val Glu Arg Phe Glu Arg Pro Ser Gly Glu Lys Ile Ala 20 25 30 Leu Cys Ala Ala Glu Leu Thr Tyr Leu Cys Trp Met Ile Thr His Asn 35 40 45 Gly Thr Ala Ile Lys Arg Ala Thr Phe Met Ser Tyr Asn Thr Ile Ile 50 55 60 Ser Asn Ser Leu Ser Phe Asp Ile Val Asn Lys Ser Leu Gln Phe Lys 65 70 75 80 Tyr Lys Thr Gln Lys Ala Thr Ile Leu Glu Ala Ser Leu Lys Lys Leu 85 90 95 Ile Pro Ala Trp Glu Phe Thr Ile Ile Pro Tyr Tyr Gly Gln Lys His 100 105 110 Gln Ser Asp Ile Thr Asp Ile Val Ser Ser Leu Gln Leu Gln Phe Glu 115 120 125 Ser Ser Glu Glu Ala Asp Lys Gly Asn Ser His Ser Lys Lys Met Leu 130 135 140 Lys Ala Leu Leu Ser Glu Gly Glu Ser Ile Trp Glu Ile Thr Glu Lys 145 150 155 160 Ile Leu Asn Ser Phe Glu Tyr Thr Ser Arg Phe Thr Lys Thr Lys Thr 165 170 175 Leu Tyr Gln Phe Leu Phe Leu Ala Thr Phe Ile Asn Cys Gly Arg Phe 180 185 190 Ser Asp Ile Lys Asn Val Asp Pro Lys Ser Phe Lys Leu Val Gln Asn 195 200 205 Lys Tyr Leu Gly Val Ile Ile Gln Cys Leu Val Thr Glu Thr Lys Thr 210 215 220 Ser Val Ser Arg His Ile Tyr Phe Phe Ser Ala Arg Gly Arg Ile Asp 225 230 235 240 Pro Leu Val Tyr Leu Asp Glu Phe Leu Arg Asn Ser Glu Pro Val Leu 245 250 255 Lys Arg Val Asn Arg Thr Gly Asn Ser Ser Ser Asn Lys Gln Glu Tyr 260 265 270 Gln Leu Leu Lys Asp Asn Leu Val Arg Ser Tyr Asn Lys Ala Leu Lys 275 280 285 Lys Asn Ala Pro Tyr Ser Ile Phe Ala Ile Lys Asn Gly Pro Lys Ser 290 295 300 His Ile Gly Arg His Leu Met Thr Ser Phe Leu Ser Met Lys Gly Leu 305 310 315 320 Thr Glu Leu Thr Asn Val Val Gly Asn Trp Ser Asp Lys Arg Ala Ser 325 330 335 Ala Val Ala Arg Thr Thr Tyr Thr His Gln Ile Thr Ala Ile Pro Asp 340 345 350 His Tyr Phe Ala Leu Val Ser Arg Tyr Tyr Ala Tyr Asp Pro Ile Ser 355 360 365 Lys Glu Met Ile Ala Leu Lys Asp Glu Thr Asn Pro Ile Glu Glu Trp 370 375 380 Gln His Ile Glu Gln Leu Lys Gly Ser Ala Glu Gly Ser Ile Arg Tyr 385 390 395 400 Pro Ala Trp Asn Gly Ile Ile Ser Gln Glu Val Leu Asp Tyr Leu Ser 405 410 415 Ser Tyr Ile Asn Arg Arg Ile 420 <210> 76 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> FRT recognition site <400> 76 gaagttccta tactttctag agaataggaa cttc 34 <210> 77 <211> 374 <212> PRT <213> Artificial Sequence <220> <223> variant of the Flp protein <400> 77 Met Asn Glu Gln Ala Lys Gln Leu Val Ala Val Thr Arg Gln Pro Ala 1 5 10 15 Leu Asn Ala Gly Val Gly Leu Val Leu Ala Gln Leu Ala Glu Val Glu 20 25 30 Ala Arg Gln Ile Pro Gly Ser Leu Ala Glu Ala Arg Ala His Cys Leu 35 40 45 Ala Gln Gly Ala Pro Asp Ile Leu Leu Val Glu Val Glu Asn Pro Gln 50 55 60 Thr Leu Ala Ala Asp Leu Ala Ala Leu Ala Glu Cys Cys Pro Pro Gln 65 70 75 80 Met Arg Leu Val Leu Leu Gly Glu Arg Gly Asp Val Thr Leu Phe Arg 85 90 95 Trp Leu Ile Ser Val Gly Val Asp Asp Tyr Tyr Pro Ala Pro Leu Asp 100 105 110 Pro Asp Ala Leu Arg Thr Gly Leu Leu Arg Leu Leu Gly Val Pro Leu 115 120 125 Val Thr Ser Leu Arg Lys Gly Arg Val Ile Cys Val Val Gly Ala Ala 130 135 140 Gly Gly Val Gly Thr Ser Thr Val Ala Ala Asn Leu Ala Met Ala Leu 145 150 155 160 Ala Asp Gln His His Arg Gln Val Ala Leu Leu Asp Leu Asn Leu His 165 170 175 His Ser Arg His Pro Ile Leu Leu Gly Ser Asp Tyr Ala Pro Pro Gly 180 185 190 Glu Gln Trp Trp Gln Ala Thr Asp Arg Leu Asp Gly Thr Leu Leu Ala 195 200 205 His Thr Ala His Gln Leu Gly Pro Arg Leu Phe Leu Phe Tyr Asp Glu 210 215 220 Gly Gln Glu Leu Val Leu Gly Ala Glu Gln Leu Val Ala Ala Val Asn 225 230 235 240 Val Met Ala Glu His Tyr Ser Thr Leu Ile Ile Asp Val Pro Asp Leu 245 250 255 Arg Thr His Gly Leu Arg Ala Leu Leu Gln Glu Ala Asp Val Val Leu 260 265 270 Trp Leu His Asp Phe Ser Leu Gly Ala Leu Arg Leu Leu Gly Gln Cys 275 280 285 Pro Gln Gly Gly Gln Ala Gln Arg Arg Leu Leu Val Gly Asn His Cys 290 295 300 Arg Gly Lys Glu Gly Arg Val Pro Ala Gln Glu Leu Glu Arg Val Cys 305 310 315 320 Gly Gln Pro His Ala Ala Val Leu Pro Tyr Asp His Gly Val Phe Val 325 330 335 Arg Ala Glu Arg Ala Gly Gln Pro Leu Ile Gln Gln Lys Ser Lys Leu 340 345 350 Ala Arg Ala Leu Thr Leu Leu Ala Gly Glu Leu Val Gly Ala Gln Val 355 360 365 Thr Gly Arg Gly Arg Arg 370 <210> 78 <211> 432 <212> PRT <213> Artificial Sequence <220> <223> variant of the Flp protein <400> 78 Met Ala Pro Lys Lys Lys Arg Lys Val Met Ser Gln Phe Asp Ile Leu 1 5 10 15 Cys Lys Thr Pro Pro Lys Val Leu Val Arg Gln Phe Val Glu Arg Phe 20 25 30 Glu Arg Pro Ser Gly Glu Lys Ile Ala Ser Cys Ala Ala Glu Leu Thr 35 40 45 Tyr Leu Cys Trp Met Ile Thr His Asn Gly Thr Ala Ile Lys Arg Ala 50 55 60 Thr Phe Met Ser Tyr Asn Thr Ile Ile Ser Asn Ser Leu Ser Phe Asp 65 70 75 80 Ile Val Asn Lys Ser Leu Gln Phe Lys Tyr Lys Thr Gln Lys Ala Thr 85 90 95 Ile Leu Glu Ala Ser Leu Lys Lys Leu Ile Pro Ala Trp Glu Phe Thr 100 105 110 Ile Ile Pro Tyr Asn Gly Gln Lys His Gln Ser Asp Ile Thr Asp Ile 115 120 125 Val Ser Ser Leu Gln Leu Gln Phe Glu Ser Ser Glu Glu Ala Asp Lys 130 135 140 Gly Asn Ser His Ser Lys Lys Met Leu Lys Ala Leu Leu Ser Glu Gly 145 150 155 160 Glu Ser Ile Trp Glu Ile Thr Glu Lys Ile Leu Asn Ser Phe Glu Tyr 165 170 175 Thr Ser Arg Phe Thr Lys Thr Lys Thr Leu Tyr Gln Phe Leu Phe Leu 180 185 190 Ala Thr Phe Ile Asn Cys Gly Arg Phe Ser Asp Ile Lys Asn Val Asp 195 200 205 Pro Lys Ser Phe Lys Leu Val Gln Asn Lys Tyr Leu Gly Val Ile Ile 210 215 220 Gln Cys Leu Val Thr Glu Thr Lys Thr Ser Val Ser Arg His Ile Tyr 225 230 235 240 Phe Phe Ser Ala Arg Gly Arg Ile Asp Pro Leu Val Tyr Leu Asp Glu 245 250 255 Phe Leu Arg Asn Ser Glu Pro Val Leu Lys Arg Val Asn Arg Thr Gly 260 265 270 Asn Ser Ser Ser Asn Lys Gln Glu Tyr Gln Leu Leu Lys Asp Asn Leu 275 280 285 Val Arg Ser Tyr Asn Lys Ala Leu Lys Lys Asn Ala Pro Tyr Pro Ile 290 295 300 Phe Ala Ile Lys Asn Gly Pro Lys Ser His Ile Gly Arg His Leu Met 305 310 315 320 Thr Ser Phe Leu Ser Met Lys Gly Leu Thr Glu Leu Thr Asn Val Val 325 330 335 Gly Asn Trp Ser Asp Lys Arg Ala Ser Ala Val Ala Arg Thr Thr Tyr 340 345 350 Thr His Gln Ile Thr Ala Ile Pro Asp His Tyr Phe Ala Leu Val Ser 355 360 365 Arg Tyr Tyr Ala Tyr Asp Pro Ile Ser Lys Glu Met Ile Ala Leu Lys 370 375 380 Asp Glu Thr Asn Pro Ile Glu Glu Trp Gln His Ile Glu Gln Leu Lys 385 390 395 400 Gly Ser Ala Glu Gly Ser Ile Arg Tyr Pro Ala Trp Asn Gly Ile Ile 405 410 415 Ser Gln Glu Val Leu Asp Tyr Leu Ser Ser Tyr Ile Asn Arg Arg Ile 420 425 430 <210> 79 <211> 343 <212> PRT <213> Artificial Sequence <220> <223> Cre <400> 79 Met Ser Asn Leu Leu Thr Val His Gln Asn Leu Pro Ala Leu Pro Val 1 5 10 15 Asp Ala Thr Ser Asp Glu Val Arg Lys Asn Leu Met Asp Met Phe Arg 20 25 30 Asp Arg Gln Ala Phe Ser Glu His Thr Trp Lys Met Leu Leu Ser Val 35 40 45 Cys Arg Ser Trp Ala Ala Trp Cys Lys Leu Asn Asn Arg Lys Trp Phe 50 55 60 Pro Ala Glu Pro Glu Asp Val Arg Asp Tyr Leu Leu Tyr Leu Gln Ala 65 70 75 80 Arg Gly Leu Ala Val Lys Thr Ile Gln Gln His Leu Gly Gln Leu Asn 85 90 95 Met Leu His Arg Arg Ser Gly Leu Pro Arg Pro Ser Asp Ser Asn Ala 100 105 110 Val Ser Leu Val Met Arg Arg Ile Arg Lys Glu Asn Val Asp Ala Gly 115 120 125 Glu Arg Ala Lys Gln Ala Leu Ala Phe Glu Arg Thr Asp Phe Asp Gln 130 135 140 Val Arg Ser Leu Met Glu Asn Ser Asp Arg Cys Gln Asp Ile Arg Asn 145 150 155 160 Leu Ala Phe Leu Gly Ile Ala Tyr Asn Thr Leu Leu Arg Ile Ala Glu 165 170 175 Ile Ala Arg Ile Arg Val Lys Asp Ile Ser Arg Thr Asp Gly Gly Arg 180 185 190 Met Leu Ile His Ile Gly Arg Thr Lys Thr Leu Val Ser Thr Ala Gly 195 200 205 Val Glu Lys Ala Leu Ser Leu Gly Val Thr Lys Leu Val Glu Arg Trp 210 215 220 Ile Ser Val Ser Gly Val Ala Asp Asp Pro Asn Asn Tyr Leu Phe Cys 225 230 235 240 Arg Val Arg Lys Asn Gly Val Ala Ala Pro Ser Ala Thr Ser Gln Leu 245 250 255 Ser Thr Arg Ala Leu Glu Gly Ile Phe Glu Ala Thr His Arg Leu Ile 260 265 270 Tyr Gly Ala Lys Asp Asp Ser Gly Gln Arg Tyr Leu Ala Trp Ser Gly 275 280 285 His Ser Ala Arg Val Gly Ala Ala Arg Asp Met Ala Arg Ala Gly Val 290 295 300 Ser Ile Pro Glu Ile Met Gln Ala Gly Gly Trp Thr Asn Val Asn Ile 305 310 315 320 Val Met Asn Tyr Ile Arg Asn Leu Asp Ser Glu Thr Gly Ala Met Val 325 330 335 Arg Leu Leu Glu Asp Gly Asp 340 <210> 80 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> loxP site <400> 80 ataacttcgt atagcataca ttatacgaag ttat 34 <210> 81 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> lox recognition site (lox2272) <400> 81 ataacttcgt ataaagtatc ctatacgaag ttat 34 <210> 82 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> lox recognition site (lox511) <400> 82 ataacttcgt ataatgtatg ctatacgaag ttat 34 <210> 83 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> lox recognition site (lox66) <400> 83 ataacttcgt atagcataca ttatacgaac ggta 34 <210> 84 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> lox recognition site (lox71 <400> 84 taccgttcgt atagcataca ttatacgaag ttat 34 <210> 85 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> lox recognition site (loxM2) <400> 85 ataacttcgt ataagaaacc atatacgaag ttat 34 <210> 86 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> lox recognition site (lox5171) <400> 86 ataacttcgt ataatgtgta ctatacgaag ttat 34 <210> 87 <211> 380 <212> PRT <213> Vibrio plasmid p0908 <400> 87 Met Ile Glu Asn Gln Leu Ser Leu Leu Gly Asp Phe Ser Gly Val Arg 1 5 10 15 Pro Asp Asp Val Lys Thr Ala Ile Gln Ala Ala Gln Lys Lys Gly Ile 20 25 30 Asn Val Ala Glu Asn Glu Gln Phe Lys Ala Ala Phe Glu His Leu Leu 35 40 45 Asn Glu Phe Lys Lys Arg Glu Glu Arg Tyr Ser Pro Asn Thr Leu Arg 50 55 60 Arg Leu Glu Ser Ala Trp Thr Cys Phe Val Asp Trp Cys Leu Ala Asn 65 70 75 80 His Arg His Ser Leu Pro Ala Thr Pro Asp Thr Val Glu Ala Phe Phe 85 90 95 Ile Glu Arg Ala Glu Glu Leu His Arg Asn Thr Leu Ser Val Tyr Arg 100 105 110 Trp Ala Ile Ser Arg Val His Arg Val Ala Gly Cys Pro Asp Pro Cys 115 120 125 Leu Asp Ile Tyr Val Glu Asp Arg Leu Lys Ala Ile Ala Arg Lys Lys 130 135 140 Val Arg Glu Gly Glu Ala Val Lys Gln Ala Ser Pro Phe Asn Glu Gln 145 150 155 160 His Leu Leu Lys Leu Thr Ser Leu Trp Tyr Arg Ser Asp Lys Leu Leu 165 170 175 Leu Arg Arg Asn Leu Ala Leu Leu Ala Val Ala Tyr Glu Ser Met Leu 180 185 190 Arg Ala Ser Glu Leu Ala Asn Ile Arg Val Ser Asp Met Glu Leu Ala 195 200 205 Gly Asp Gly Thr Ala Ile Leu Thr Ile Pro Ile Thr Lys Thr Asn His 210 215 220 Ser Gly Glu Pro Asp Thr Cys Ile Leu Ser Gln Asp Val Val Ser Leu 225 230 235 240 Leu Met Asp Tyr Thr Glu Ala Gly Lys Leu Asp Met Ser Ser Asp Gly 245 250 255 Phe Leu Phe Val Gly Val Ser Lys His Asn Thr Cys Ile Lys Pro Lys 260 265 270 Lys Asp Lys Gln Thr Gly Glu Val Leu His Lys Pro Ile Thr Thr Lys 275 280 285 Thr Val Glu Gly Val Phe Tyr Ser Ala Trp Glu Thr Leu Asp Leu Gly 290 295 300 Arg Gln Gly Val Lys Pro Phe Thr Ala His Ser Ala Arg Val Gly Ala 305 310 315 320 Ala Gln Asp Leu Leu Lys Lys Gly Tyr Asn Thr Leu Gln Ile Gln Gln 325 330 335 Ser Gly Arg Trp Ser Ser Gly Ala Met Val Ala Arg Tyr Gly Arg Ala 340 345 350 Ile Leu Ala Arg Asp Gly Ala Met Ala His Ser Arg Val Lys Thr Arg 355 360 365 Ser Ala Pro Met Gln Trp Gly Lys Asp Glu Lys Asp 370 375 380 <210> 88 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> VloxP recognition site <400> 88 tcaatttccg agaatgacag ttctcagaaa ttga 34 <210> 89 <211> 342 <212> PRT <213> Enterobacteria phage D6 <400> 89 Met Ser Glu Leu Ile Ile Ser Gly Ser Ser Gly Gly Phe Leu Arg Asn 1 5 10 15 Ile Gly Lys Glu Tyr Gln Glu Ala Ala Glu Asn Phe Met Arg Phe Met 20 25 30 Asn Asp Gln Gly Ala Tyr Ala Pro Asn Thr Leu Arg Asp Leu Arg Leu 35 40 45 Val Phe His Ser Trp Ala Arg Trp Cys His Ala Arg Gln Leu Ala Trp 50 55 60 Phe Pro Ile Ser Pro Glu Met Ala Arg Glu Tyr Phe Leu Gln Leu His 65 70 75 80 Asp Ala Asp Leu Ala Ser Thr Thr Ile Asp Lys His Tyr Ala Met Leu 85 90 95 Asn Met Leu Leu Ser His Cys Gly Leu Pro Pro Leu Ser Asp Asp Lys 100 105 110 Ser Val Ser Leu Ala Met Arg Arg Ile Arg Arg Glu Ala Ala Thr Glu 115 120 125 Lys Gly Glu Arg Thr Gly Gln Ala Ile Pro Leu Arg Trp Asp Asp Leu 130 135 140 Lys Leu Leu Asp Val Leu Leu Ser Arg Ser Glu Arg Leu Val Asp Leu 145 150 155 160 Arg Asn Arg Ala Phe Leu Phe Val Ala Tyr Asn Thr Leu Met Arg Met 165 170 175 Ser Glu Ile Ser Arg Ile Arg Val Gly Asp Leu Asp Gln Thr Gly Asp 180 185 190 Thr Val Thr Leu His Ile Ser His Thr Lys Thr Ile Thr Thr Ala Ala 195 200 205 Gly Leu Asp Lys Val Leu Ser Arg Arg Thr Thr Ala Val Leu Asn Asp 210 215 220 Trp Leu Asp Val Ser Gly Leu Arg Glu His Pro Asp Ala Val Leu Phe 225 230 235 240 Pro Pro Ile His Arg Ser Asn Lys Ala Arg Ile Thr Thr Thr Pro Leu 245 250 255 Thr Ala Pro Ala Met Glu Lys Ile Phe Ser Asp Ala Trp Val Leu Leu 260 265 270 Asn Lys Arg Asp Ala Thr Pro Asn Lys Gly Arg Tyr Arg Thr Trp Thr 275 280 285 Gly His Ser Ala Arg Val Gly Ala Ala Ile Asp Met Ala Glu Lys Gln 290 295 300 Val Ser Met Val Glu Ile Met Gln Glu Gly Thr Trp Lys Lys Pro Glu 305 310 315 320 Thr Leu Met Arg Tyr Leu Arg Arg Gly Gly Val Ser Val Gly Ala Asn 325 330 335 Ser Arg Leu Met Asp Ser 340 <210> 90 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> rox recognition site <400> 90 taactttaaa taattggcat tatttaaagt ta 32 <210> 91 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRL1 <400> 91 Thr Ala Ser Ser Ser Val Asn Tyr Ile His 1 5 10 <210> 92 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRL2 <400> 92 Thr Ser Lys Val Ala Ser 1 5 <210> 93 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRL3 <400> 93 Gln Gln Trp Arg Ser Tyr Pro Leu Thr 1 5 <210> 94 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRH1 <400> 94 Asp Tyr Val Val His 1 5 <210> 95 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRH2 <400> 95 Tyr Ile Asn Pro Tyr Asn Asp Gly Thr Lys Tyr Asn Glu Lys Phe Lys 1 5 10 15 Gly <210> 96 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRH3 <400> 96 Asp Tyr Arg Tyr Glu Val Tyr Gly Met Asp Tyr 1 5 10 <210> 97 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRL1 <400> 97 Arg Ala Ser Glu Val Asp Asn Tyr Gly Ile Ser Phe Met Asn 1 5 10 <210> 98 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRL2 <400> 98 Ala Ala Ser Asn Gln Gly Ser 1 5 <210> 99 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRL3 <400> 99 Gln Gln Ser Lys Glu Val Pro Trp 1 5 <210> 100 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRH1 <400> 100 Asp Tyr Asn Met His 1 5 <210> 101 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRH2 <400> 101 Tyr Ile Tyr Pro Tyr Asn Gly Gly Thr Gly Tyr Asn Gln Lys Phe Lys 1 5 10 15 Ser <210> 102 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific CDRH3 <400> 102 Gly Arg Pro Ala Met Asp Tyr 1 5 <210> 103 <211> 115 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific variable light chain <400> 103 Asp Ile Val Leu Thr Gln Ser Pro Thr Ile Met Ser Ala Ser Pro Gly 1 5 10 15 Glu Arg Val Thr Met Thr Cys Thr Ala Ser Ser Ser Val Asn Tyr Ile 20 25 30 His Trp Tyr Gln Gln Lys Ser Gly Asp Ser Pro Lys Arg Trp Ile Phe 35 40 45 Asp Thr Ser Lys Val Ala Ser Gly Val Pro Ala Arg Phe Ser Gly Ser 50 55 60 Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile Ser Thr Met Glu Ala Glu 65 70 75 80 Asp Ala Ala Thr Tyr Tyr Cys Gln Gln Trp Arg Ser Tyr Pro Leu Thr 85 90 95 Phe Gly Asp Gly Thr Arg Leu Glu Leu Lys Arg Ala Asp Ala Ala Pro 100 105 110 Thr Val Ser 115 <210> 104 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> CD33-specific variable heavy chain <400> 104 Glu Val Lys Leu Gln Glu Ser Gly Pro Glu Leu Val Lys Pro Gly Ala 1 5 10 15 Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Lys Phe Thr Asp Tyr 20 25 30 Val Val His Trp Leu Lys Gln Lys Pro Gly Gln Gly Leu Glu Trp Ile 35 40 45 Gly Tyr Ile Asn Pro Tyr Asn Asp Gly Thr Lys Tyr Asn Glu Lys Phe 50 55 60 Lys Gly Lys Ala Thr Leu Thr Ser Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Glu Val Ser Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Asp Tyr Arg Tyr Glu Val Tyr Gly Met Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Ser Val Thr Val Ser Ser 115 120 <210> 105 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> HBG1-seq primer <400> 105 tttccttaga aaccactgct aactg 25 <210> 106 <211> 115 <212> PRT <213> Artificial Sequence <220> <223> human CD33-specific variable heavy chain <400> 106 Asp Ile Val Leu Thr Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly 1 5 10 15 Glu Lys Val Thr Met Thr Cys Ser Ala Asn Ser Ser Val Ser Tyr Ile 20 25 30 His Trp Tyr Gln Gln Lys Ser Gly Thr Ser Pro Lys Arg Trp Ile Phe 35 40 45 Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Ala Arg Phe Ser Gly Ser 50 55 60 Gly Ser Gly Thr Ser Tyr Ser Leu Thr Ile Ser Thr Met Glu Ala Glu 65 70 75 80 Asp Ala Ala Thr Tyr Tyr Cys Gln Gln Trp Thr Ser His Pro Leu Thr 85 90 95 Phe Gly Thr Gly Thr Lys Leu Gln Leu Lys Arg Ala Asp Ala Ala Pro 100 105 110 Thr Val Ser 115 <210> 107 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> CD33FL-specific CDRL1 <400> 107 Gly Tyr Ala Phe Ser Asn Tyr Trp Met Asn 1 5 10 <210> 108 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> CD33FL-specific CDRL2 <400> 108 Gln Ile Tyr Pro Gly Asn Phe Asn Thr Asp Tyr Asn Gly Gln Phe Lys 1 5 10 15 Gly <210> 109 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> CD33FL-specific CDRL3 <400> 109 Phe Phe Asp Phe Gly Ala Tyr Phe Thr Leu Asp Tyr 1 5 10 <210> 110 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> CD33FL-specific CDRH1 <400> 110 Lys Ala Ser Gln Asp Ile Lys Ser Tyr Leu Ser 1 5 10 <210> 111 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> CD33FL-specific CDRH2 <400> 111 Tyr Ala Thr Thr Leu Ala Asp 1 5 <210> 112 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CD33FL-specific CDRH3 <400> 112 Leu His His Gly Glu Ser Pro Trp Thr 1 5 <210> 113 <211> 234 <212> PRT <213> Artificial Sequence <220> <223> human CD33FL-specific variable light chain <400> 113 Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro 1 5 10 15 Gly Ser Thr Gly Asp Ile Lys Met Thr Gln Ser Pro Ser Ser Ile Tyr 20 25 30 Ala Ser Leu Gly Glu Arg Val Thr Ile Asn Cys Lys Ala Ser Gln Asp 35 40 45 Ile Lys Ser Tyr Leu Ser Trp Tyr Gln Gln Lys Pro Trp Lys Ser Pro 50 55 60 Lys Thr Leu Ile Tyr Tyr Ala Thr Thr Leu Ala Asp Gly Val Pro Ser 65 70 75 80 Arg Phe Ser Gly Ser Gly Ser Gly Gln Asp Tyr Ser Leu Thr Ile Ser 85 90 95 Ser Leu Glu Ser Asp Asp Thr Ala Thr Tyr Tyr Cys Leu His His Gly 100 105 110 Glu Ser Pro Trp Thr Phe Gly Glu Gly Thr Lys Leu Glu Ile Lys Arg 115 120 125 Ala Asp Ala Ala Pro Thr Val Ser Ile Phe Pro Pro Ser Ser Glu Gln 130 135 140 Leu Thr Ser Gly Gly Ala Ser Val Val Cys Phe Leu Asn Asn Phe Tyr 145 150 155 160 Pro Lys Asp Ile Asn Val Lys Trp Lys Ile Asp Gly Ser Glu Arg Gln 165 170 175 Asn Gly Val Leu Asn Ser Trp Thr Asp Gln Asp Ser Lys Asp Ser Thr 180 185 190 Tyr Ser Met Ser Ser Thr Leu Thr Leu Thr Lys Asp Glu Tyr Glu Arg 195 200 205 His Asn Ser Tyr Thr Cys Glu Ala Thr His Lys Thr Ser Thr Ser Pro 210 215 220 Ile Val Lys Ser Phe Asn Arg Asn Glu Cys 225 230 <210> 114 <211> 471 <212> PRT <213> Artificial Sequence <220> <223> human CD33FL-specific variable heavy chain <400> 114 Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro 1 5 10 15 Gly Ser Thr Gly Gln Val Gln Leu Gln Gln Ser Gly Ala Glu Val Val 20 25 30 Lys Pro Gly Ala Ser Val Lys Ile Ser Cys Arg Ala Ser Gly Tyr Ala 35 40 45 Phe Ser Asn Tyr Trp Met Asn Trp Val Lys Gln Arg Pro Gly Lys Gly 50 55 60 Leu Glu Trp Ile Gly Gln Ile Tyr Pro Gly Asn Phe Asn Thr Asp Tyr 65 70 75 80 Asn Gly Gln Phe Lys Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser 85 90 95 Asn Thr Ala Tyr Met Gln Leu Ser Ser Leu Thr Ser Glu Asp Ser Ala 100 105 110 Val Tyr Phe Cys Ala Arg Phe Phe Asp Phe Gly Ala Tyr Phe Thr Leu 115 120 125 Asp Tyr Trp Gly Gln Gly Thr Ser Val Thr Val Ser Ser Ala Lys Thr 130 135 140 Thr Ala Pro Ser Val Tyr Pro Leu Ala Pro Val Cys Gly Asp Thr Thr 145 150 155 160 Gly Ser Ser Val Thr Leu Gly Cys Leu Val Lys Gly Tyr Phe Pro Glu 165 170 175 Pro Val Thr Leu Thr Trp Asn Ser Gly Ser Leu Ser Ser Gly Val His 180 185 190 Thr Phe Pro Ala Val Leu Gln Ser Asp Leu Tyr Thr Leu Ser Ser Ser 195 200 205 Val Thr Val Thr Ser Ser Thr Trp Pro Ser Gln Ser Ile Thr Cys Asn 210 215 220 Val Ala His Pro Ala Ser Ser Thr Lys Val Asp Lys Lys Ile Glu Pro 225 230 235 240 Arg Gly Pro Thr Ile Lys Pro Cys Pro Pro Cys Lys Cys Pro Ala Pro 245 250 255 Asn Leu Leu Gly Gly Pro Ser Val Phe Ile Phe Pro Pro Lys Ile Lys 260 265 270 Asp Val Leu Met Ile Ser Leu Ser Pro Ile Val Thr Cys Val Val Val 275 280 285 Asp Val Ser Glu Asp Asp Pro Asp Val Gln Ile Ser Trp Phe Val Asn 290 295 300 Asn Val Glu Val His Thr Ala Gln Thr Gln Thr His Arg Glu Asp Tyr 305 310 315 320 Asn Ser Thr Leu Arg Val Val Ser Ala Leu Pro Ile Gln His Gln Asp 325 330 335 Trp Met Ser Gly Lys Glu Phe Lys Cys Lys Val Asn Asn Lys Asp Leu 340 345 350 Pro Ala Pro Ile Glu Arg Thr Ile Ser Lys Pro Lys Gly Ser Val Arg 355 360 365 Ala Pro Gln Val Tyr Val Leu Pro Pro Pro Glu Glu Glu Met Thr Lys 370 375 380 Lys Gln Val Thr Leu Thr Cys Met Val Thr Asp Phe Met Pro Glu Asp 385 390 395 400 Ile Tyr Val Glu Trp Thr Asn Asn Gly Lys Thr Glu Leu Asn Tyr Lys 405 410 415 Asn Thr Glu Pro Val Leu Asp Ser Asp Gly Ser Tyr Phe Met Tyr Ser 420 425 430 Lys Leu Arg Val Glu Lys Lys Asn Trp Val Glu Arg Asn Ser Tyr Ser 435 440 445 Cys Ser Val Val His Glu Gly Leu His Asn His His Thr Thr Lys Ser 450 455 460 Phe Ser Arg Thr Pro Gly Lys 465 470 <210> 115 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> CD33 deltaE2-specific CDRL1 <400> 115 Gly Tyr Thr Phe Thr Thr Tyr Trp Met His 1 5 10 <210> 116 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> CD33 deltaE2-specific CDRL2 <400> 116 Ala Ile Tyr Pro Gly Asn Ser Asp Thr Ser Tyr Asn Gln 1 5 10 <210> 117 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> CD33 deltaE2-specific CDRL3 <400> 117 Tyr Asp Gly Tyr His Phe Ile 1 5 <210> 118 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> CD33 deltaE2-specific CDRH1 <400> 118 Arg Ser Ser Gln Ser Leu Leu His Ser Asn Gly Ile Thr Tyr Leu Tyr 1 5 10 15 <210> 119 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> CD33 deltaE2-specific CDRH2 <400> 119 Gln Met Ser Asn Leu Ala Ser 1 5 <210> 120 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> CD33 deltaE2-specific CDRH3 <400> 120 Ala Gln Asn Leu Glu Leu Pro Pro Thr 1 5 <210> 121 <211> 239 <212> PRT <213> Artificial Sequence <220> <223> human CD33 deltaE2-specific variable light chain <400> 121 Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro 1 5 10 15 Gly Ser Thr Gly Asp Ile Val Met Thr Gln Ala Ala Phe Ser Asn Pro 20 25 30 Val Thr Leu Gly Thr Ser Ala Ser Ile Ser Cys Arg Ser Ser Gln Ser 35 40 45 Leu Leu His Ser Asn Gly Ile Thr Tyr Leu Tyr Trp Tyr Leu Gln Lys 50 55 60 Pro Gly Gln Ser Pro Gln Leu Leu Ile Tyr Gln Met Ser Asn Leu Ala 65 70 75 80 Ser Gly Val Pro Asp Arg Phe Ser Ser Ser Gly Ser Gly Thr Asp Phe 85 90 95 Thr Leu Arg Ile Ser Arg Val Glu Ala Glu Asp Val Gly Val Tyr Tyr 100 105 110 Cys Ala Gln Asn Leu Glu Leu Pro Pro Thr Phe Gly Gly Gly Thr Lys 115 120 125 Leu Glu Ile Lys Arg Ala Asp Ala Ala Pro Thr Val Ser Ile Phe Pro 130 135 140 Pro Ser Ser Glu Gln Leu Thr Ser Gly Gly Ala Ser Val Val Cys Phe 145 150 155 160 Leu Asn Asn Phe Tyr Pro Lys Asp Ile Asn Val Lys Trp Lys Ile Asp 165 170 175 Gly Ser Glu Arg Gln Asn Gly Val Leu Asn Ser Trp Thr Asp Gln Asp 180 185 190 Ser Lys Asp Ser Thr Tyr Ser Met Ser Ser Thr Leu Thr Leu Thr Lys 195 200 205 Asp Glu Tyr Glu Arg His Asn Ser Tyr Thr Cys Glu Ala Thr His Lys 210 215 220 Thr Ser Thr Ser Pro Ile Val Lys Ser Phe Asn Arg Asn Glu Cys 225 230 235 <210> 122 <211> 473 <212> PRT <213> Artificial Sequence <220> <223> human CD33 deltaE2-specific variable heavy chain <400> 122 Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro 1 5 10 15 Gly Ser Thr Gly Glu Val Gln Leu Gln Gln Ser Gly Thr Val Leu Ala 20 25 30 Arg Pro Gly Ala Ser Val Lys Met Ser Cys Lys Ala Ser Gly Tyr Thr 35 40 45 Phe Thr Thr Tyr Trp Met His Trp Ile Lys Gln Ser Pro Gly Gln Gly 50 55 60 Leu Glu Trp Ile Gly Ala Ile Tyr Pro Gly Asn Ser Asp Thr Ser Tyr 65 70 75 80 Asn Gln Lys Phe Lys Gly Lys Ala Lys Leu Thr Ala Val Thr Ser Ala 85 90 95 Ser Thr Ala Tyr Met Glu Leu Ser Ser Leu Thr Asn Glu Asp Ser Ala 100 105 110 Val Tyr Tyr Cys Glu Ile Tyr Asp Gly Tyr His Phe Ile Tyr Trp Gly 115 120 125 Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Lys Thr Thr Pro Pro Ser 130 135 140 Val Tyr Pro Leu Ala Pro Gly Cys Gly Asp Thr Thr Gly Ser Ser Val 145 150 155 160 Thr Leu Gly Cys Leu Val Lys Gly Tyr Phe Pro Glu Ser Val Thr Val 165 170 175 Thr Trp Asn Ser Gly Ser Leu Ser Ser Ser Val His Thr Phe Pro Ala 180 185 190 Leu Leu Gln Ser Gly Leu Tyr Thr Met Ser Ser Ser Val Thr Val Pro 195 200 205 Ser Ser Thr Trp Pro Ser Gln Thr Val Thr Cys Ser Val Ala His Pro 210 215 220 Ala Ser Ser Thr Thr Val Asp Lys Lys Leu Glu Pro Ser Gly Pro Ile 225 230 235 240 Ser Thr Ile Asn Pro Cys Pro Pro Cys Lys Glu Cys His Lys Cys Pro 245 250 255 Ala Pro Asn Leu Glu Gly Gly Pro Ser Val Phe Ile Phe Pro Pro Asn 260 265 270 Ile Lys Asp Val Leu Met Ile Ser Leu Thr Pro Lys Val Thr Cys Val 275 280 285 Val Val Asp Val Ser Glu Asp Asp Pro Asp Val Gln Ile Ser Trp Phe 290 295 300 Val Asn Asn Val Glu Val His Thr Ala Gln Thr Gln Thr His Arg Glu 305 310 315 320 Asp Tyr Asn Ser Thr Ile Arg Val Val Ser Thr Leu Pro Ile Gln His 325 330 335 Gln Asp Trp Met Ser Gly Lys Glu Phe Lys Cys Lys Val Asn Asn Lys 340 345 350 Asp Leu Pro Ser Pro Ile Glu Arg Thr Ile Ser Lys Ile Lys Gly Leu 355 360 365 Val Arg Ala Pro Gln Val Tyr Ile Leu Pro Pro Pro Ala Glu Gln Leu 370 375 380 Ser Arg Lys Asp Val Ser Leu Thr Cys Leu Val Val Gly Phe Asn Pro 385 390 395 400 Gly Asp Ile Ser Val Glu Trp Thr Ser Asn Gly His Thr Glu Glu Asn 405 410 415 Tyr Lys Asp Thr Ala Pro Val Leu Asp Ser Asp Gly Ser Tyr Phe Ile 420 425 430 Tyr Ser Lys Leu Asn Met Lys Thr Ser Lys Trp Glu Lys Thr Asp Ser 435 440 445 Phe Ser Cys Asn Val Arg His Glu Gly Leu Lys Asn Tyr Tyr Leu Lys 450 455 460 Lys Thr Ile Ser Arg Ser Pro Gly Lys 465 470 <210> 123 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> HER2-specific CDRL1 <400> 123 Lys Ala Ser Gln Asp Val Ser Ile Gly Val Ala 1 5 10 <210> 124 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> HER2-specific CDRL2 <400> 124 Ala Ser Tyr Arg Tyr Thr 1 5 <210> 125 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> HER2-specific CDRL3 <400> 125 Gln Gln Tyr Tyr Ile Tyr Pro Tyr Thr 1 5 <210> 126 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> HER2-specific CDRH1 <400> 126 Gly Phe Thr Phe Thr Asp Tyr Thr Met Asp 1 5 10 <210> 127 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> HER2-specific CDRH2 <400> 127 Asp Val Asn Pro Asn Ser Gly Gly Ser Ile Tyr Asn Gln Arg Phe Lys 1 5 10 15 <210> 128 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> HER2-specific CDRH3 <400> 128 Leu Gly Pro Ser Phe Tyr Phe Asp Tyr 1 5 <210> 129 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDRL1 <400> 129 Arg Ala Ser Lys Gly Val Ser Thr Ser Gly Tyr Ser Tyr Leu His 1 5 10 15 <210> 130 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDRL2 <400> 130 Leu Ala Ser Tyr Leu Glu Ser 1 5 <210> 131 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDRL3 <400> 131 Gln His Ser Arg Asp Leu Pro Leu Thr 1 5 <210> 132 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDRH1 <400> 132 Asn Tyr Tyr Met Tyr 1 5 <210> 133 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDRH2 <400> 133 Gly Ile Asn Pro Ser Asn Gly Gly Thr Asn Phe Asn Glu Lys Phe Lys 1 5 10 15 Asn <210> 134 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> PD-L1-specific CDRH3 <400> 134 Arg Asp Tyr Arg Phe Asp Met Gly Phe Asp Tyr 1 5 10 <210> 135 <211> 120 <212> PRT <213> Artificial Sequence <220> <223> Avelumab variable heavy chain <400> 135 Glu Val Gln Leu Leu Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Ser Tyr 20 25 30 Ile Met Met Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ser Ser Ile Tyr Pro Ser Gly Gly Ile Thr Phe Tyr Ala Asp Thr Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Ile Lys Leu Gly Thr Val Thr Thr Val Asp Tyr Trp Gly Gln 100 105 110 Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 136 <211> 110 <212> PRT <213> Artificial Sequence <220> <223> Avelumab variable light chain <400> 136 Gln Ser Ala Leu Thr Gln Pro Ala Ser Val Ser Gly Ser Pro Gly Gln 1 5 10 15 Ser Ile Thr Ile Ser Cys Thr Gly Thr Ser Ser Asp Val Gly Gly Tyr 20 25 30 Asn Tyr Val Ser Trp Tyr Gln Gln His Pro Gly Lys Ala Pro Lys Leu 35 40 45 Met Ile Tyr Asp Val Ser Asn Arg Pro Ser Gly Val Ser Asn Arg Phe 50 55 60 Ser Gly Ser Lys Ser Gly Asn Thr Ala Ser Leu Thr Ile Ser Gly Leu 65 70 75 80 Gln Ala Glu Asp Glu Ala Asp Tyr Tyr Cys Ser Ser Tyr Thr Ser Ser 85 90 95 Ser Thr Arg Val Phe Gly Thr Gly Thr Lys Val Thr Val Leu 100 105 110 <210> 137 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDRH1 <400> 137 Ser Gly Phe Thr Phe Ser Ser Tyr Ile Met Met 1 5 10 <210> 138 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDRH2 <400> 138 Ser Ile Tyr Pro Ser Gly Gly Ile Thr Phe Tyr Ala Asp Thr Val Lys 1 5 10 15 Gly <210> 139 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDRH3 <400> 139 Ile Lys Leu Gly Thr Val Thr Thr Val Asp Tyr 1 5 10 <210> 140 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDRL1 <400> 140 Thr Gly Thr Ser Ser Asp Val Gly Gly Tyr Asn Tyr Val Ser 1 5 10 <210> 141 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDRL2 <400> 141 Asp Val Ser Asn Arg Pro Ser 1 5 <210> 142 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Avelumab-specific CDRL3 <400> 142 Ser Ser Tyr Thr Ser Ser Ser Thr Arg Val 1 5 10 <210> 143 <211> 118 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific variable heavy chain <400> 143 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asp Ser 20 25 30 Trp Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Trp Ile Ser Pro Tyr Gly Gly Ser Thr Tyr Tyr Ala Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Arg His Trp Pro Gly Gly Phe Asp Tyr Trp Gly Gln Gly Thr 100 105 110 Leu Val Thr Val Ser Ser 115 <210> 144 <211> 107 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific variable light chain <400> 144 Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly 1 5 10 15 Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Ser Thr Ala 20 25 30 Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile 35 40 45 Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly 50 55 60 Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro 65 70 75 80 Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln Tyr Leu Tyr His Pro Ala 85 90 95 Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 145 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDRH1 <400> 145 Ser Gly Phe Thr Phe Ser Asp Ser Trp Ile His 1 5 10 <210> 146 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDRH2 <400> 146 Trp Ile Ser Pro Tyr Gly Gly Ser Thr Tyr Tyr Ala Asp Ser Val Lys 1 5 10 15 Gly <210> 147 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDRH3 <400> 147 Arg His Trp Pro Gly Gly Phe Asp Tyr 1 5 <210> 148 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDRL1 <400> 148 Arg Ala Ser Gln Asp Val Ser Thr Ala Val Ala 1 5 10 <210> 149 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDRL2 <400> 149 Ser Ala Ser Phe Leu Tyr Ser 1 5 <210> 150 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Atezolizumab-specific CDRL3 <400> 150 Gln Gln Tyr Leu Tyr His Pro Ala Thr 1 5 <210> 151 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific CDRL1 <400> 151 Lys Ala Ser Gln Asp Val Gly Thr Ala Val Asp 1 5 10 <210> 152 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific CDRL2 <400> 152 Trp Ala Ser Thr Arg His Thr 1 5 <210> 153 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific CDRL3 <400> 153 Gln Gln Tyr Asn Ser Tyr Pro Leu Thr 1 5 <210> 154 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific CDRH1 <400> 154 Gly Tyr Thr Phe Thr Glu Tyr Thr Ile His 1 5 10 <210> 155 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific CDRH2 <400> 155 Asn Ile Asn Pro Asn Asn Gly Gly Thr Thr Tyr Asn Gln Lys Phe Glu 1 5 10 15 Asp <210> 156 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> PSMA-specific CDRH3 <400> 156 Gly Trp Asn Phe Asp Tyr 1 5 <210> 157 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> MUC16-specific CDRL1 <400> 157 Ser Glu Asp Ile Tyr Ser Gly 1 5 <210> 158 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> MUC16-specific CDRL3 <400> 158 Gly Tyr Ser Tyr Ser Ser Thr Leu 1 5 <210> 159 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> MUC16-specific CDRH1 <400> 159 Thr Leu Gly Met Gly Val Gly 1 5 <210> 160 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> MUC16-specific CDRH2 <400> 160 His Ile Trp Trp Asp Asp Asp Lys Tyr Tyr Asn Pro Ala Leu Lys Ser 1 5 10 15 <210> 161 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> MUC16-specific CDRH3 <400> 161 Ile Gly Thr Ala Gln Ala Thr Asp Ala Leu Asp Tyr 1 5 10 <210> 162 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific CDRL1 <400> 162 Lys Ala Ser Gln Ser Val Ser Phe Ala Gly Thr Ser Leu Met His 1 5 10 15 <210> 163 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific CDRL2 <400> 163 Arg Ala Ser Asn Leu Glu Ala 1 5 <210> 164 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific CDRL3 <400> 164 Gln Gln Ser Arg Glu Tyr Pro Tyr Thr 1 5 <210> 165 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific CDRH1 <400> 165 Gly Tyr Phe Met Asn 1 5 <210> 166 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific CDRH2 <400> 166 Arg Ile His Pro Tyr Asp Gly Asp Thr Phe Tyr Asn Gln Lys Phe Gln 1 5 10 15 Gly <210> 167 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> FOLR-specific CDRH3 <400> 167 Tyr Asp Gly Ser Arg Ala Met Asp Tyr 1 5 <210> 168 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific variable heavy chain <400> 168 Gln Val Gln Leu Gln Gln Ser Gly Pro Glu Leu Glu Lys Pro Gly Ala 1 5 10 15 Ser Val Lys Ile Ser Cys Lys Ala Ser Gly Tyr Ser Phe Thr Gly Tyr 20 25 30 Thr Met Asn Trp Val Lys Gln Ser His Gly Lys Ser Leu Glu Trp Ile 35 40 45 Gly Leu Ile Thr Pro Tyr Asn Gly Ala Ser Ser Tyr Asn Gln Lys Phe 50 55 60 Arg Gly Lys Ala Thr Leu Thr Val Asp Lys Ser Ser Ser Thr Ala Tyr 65 70 75 80 Met Asp Leu Leu Ser Leu Thr Ser Glu Asp Ser Ala Val Tyr Phe Cys 85 90 95 Ala Arg Gly Gly Tyr Asp Gly Arg Gly Phe Asp Tyr Trp Gly Ser Gly 100 105 110 Thr Pro Val Thr Val Ser Ser 115 <210> 169 <211> 106 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific variable light chain <400> 169 Asp Ile Glu Leu Thr Gln Ser Pro Ala Ile Met Ser Ala Ser Pro Gly 1 5 10 15 Glu Lys Val Thr Met Thr Cys Ser Ala Ser Ser Ser Val Ser Tyr Met 20 25 30 His Trp Tyr Gln Gln Lys Ser Gly Thr Ser Pro Lys Arg Trp Ile Tyr 35 40 45 Asp Thr Ser Lys Leu Ala Ser Gly Val Pro Gly Arg Phe Ser Gly Ser 50 55 60 Gly Ser Gly Asn Ser Tyr Ser Leu Thr Ile Ser Ser Val Glu Ala Glu 65 70 75 80 Asp Asp Ala Thr Tyr Tyr Cys Gln Gln Trp Ser Lys His Pro Leu Thr 85 90 95 Phe Gly Ser Gly Thr Lys Val Glu Ile Lys 100 105 <210> 170 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDRH1 <400> 170 Gly Tyr Ser Phe Thr Gly Tyr Thr Met Asn 1 5 10 <210> 171 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDRH2 <400> 171 Leu Ile Thr Pro Tyr Asn Gly Ala Ser Ser Tyr Asn Gln 1 5 10 <210> 172 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDRH3 <400> 172 Gly Gly Tyr Asp Gly Arg Gly Phe Asp Tyr 1 5 10 <210> 173 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDRL1 <400> 173 Ser Ala Ser Ser Ser Val Ser Tyr Met His 1 5 10 <210> 174 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDRL2 <400> 174 Asp Thr Ser Lys Leu Ala Ser 1 5 <210> 175 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Amatuximab-specific CDRL3 <400> 175 Gln Gln Trp Ser Lys His Pro Leu Thr 1 5 <210> 176 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Nef (66-97) <400> 176 Val Gly Phe Pro Val Thr Pro Gln Val Pro Leu Arg Pro Met Thr Tyr 1 5 10 15 Lys Ala Ala Val Asp Leu Ser His Phe Leu Lys Glu Lys Gly Gly Leu 20 25 30 <210> 177 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Nef (116-145) <400> 177 His Thr Gln Gly Tyr Phe Pro Asp Trp Gln Asn Tyr Thr Pro Gly Pro 1 5 10 15 Gly Val Arg Tyr Pro Leu Thr Phe Gly Trp Leu Tyr Lys Leu 20 25 30 <210> 178 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Gag p17 (17-35) <400> 178 Glu Lys Ile Arg Leu Arg Pro Gly Gly Lys Lys Lys Tyr Lys Leu Lys 1 5 10 15 His Ile Val <210> 179 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Gag p17-p24 (253-284) <400> 179 Asn Pro Pro Ile Pro Val Gly Glu Ile Tyr Lys Arg Trp Ile Ile Leu 1 5 10 15 Gly Leu Asn Lys Ile Val Arg Met Tyr Ser Pro Thr Ser Ile Leu Asp 20 25 30 <210> 180 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Pol 325-355 (RT 158-188) <400> 180 Ala Ile Phe Gln Ser Ser Met Thr Lys Ile Leu Glu Pro Phe Arg Lys 1 5 10 15 Gln Asn Pro Asp Ile Val Ile Tyr Gln Tyr Met Asp Asp Leu Tyr 20 25 30 <210> 181 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> IgG4 linker <400> 181 Glu Ser Lys Tyr Gly Pro Pro Cys Pro Pro Cys 1 5 10 <210> 182 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> CD28 linker <400> 182 Pro Ser Pro Leu Phe Pro Gly Pro Ser Lys Pro 1 5 10 <210> 183 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> spacer <220> <221> MISC_FEATURE <222> (1)..(5) <223> Residues (GGGGS) can be repeated n times, wherein n is an integer including, 1, 2, 3, 4, 5, 6, 7, 8, 9, or more <400> 183 Gly Gly Gly Gly Ser 1 5 <210> 184 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> spacer <220> <221> MISC_FEATURE <222> (1)..(5) <223> (EAAAK) can be repeated n times, wherein n is an integer including 1, 2, 3, 4, 5, 6, 7, 8, 9, or more <400> 184 Glu Ala Ala Ala Lys 1 5 <210> 185 <211> 21531 <212> DNA <213> Homo sapiens <400> 185 gatctctatc ccctcctgtt ttctctacgt tatttatatg ggtatcatca ccatcctgga 60 caacatcagg acagatatcc ctcaccaagc caatgttcct ctctatgttg gctcaaatgt 120 ccttgaactt tcctttcacc accctttcca cagtcaaaag gatattgtag tttaatgcct 180 cagagttcag cttttaagct tctgacaaat tattcttcct ctttaggttc tcctttatgg 240 aatcttctgt actgatggcc atgtccttta actactatgt agatatctgc tactacctgt 300 attatgcctc tacctttatt agcagagtta tctgtactgt tggcatgaca atcatttgtt 360 aatatgactt gcctttcctt tttctgctat tcttgatcaa atggctcctc tttcttgctc 420 ctctcatttc tcctgccttc acttggacgt gcttcacgta gtctgtgctt atgactggat 480 taaaaattga tatggactta tcctaatgtt gttcgtcata atatgggttt tatggtccat 540 tattatttcc tatgcattga tctggagaag gcttcaatcc ttttactctt tgtggaaaat 600 atctgtaaac cttctggttc actctgctat agcaatttca gtttaggcta gtaagcatga 660 ggatgcctcc ttctctgatt tttcccacag tctgttggtc acagaataac ctgagtgatt 720 actgatgaaa gagtgagaat gttattgata gtcacaatga caaaaaacaa acaactacag 780 tcaaaatgtt tctcttttta ttagtggatt atatttcctg acctatatct ggcaggactc 840 tttagagagg tagctgaagc tgctgttatg accactagag ggaagaagat acctgtggag 900 ctaatggtcc aagatggtgg agccccaagc aaggaagttg ttaaggagcc cttttgattg 960 aaggtgggtg cccccacctt acagggacag gacatctgga tactcctccc agtttctcca 1020 gtttcccttt ttcctaatat atctcctgat aaaatgtcta tactcacttc cccatttcta 1080 ataataaagc aaaggctagt tagtaagaca tcaccttgca ttttgaaaat gccatagact 1140 ttcaaaatta tttcatacat cggtctttct ttatttcaag agtccagaaa tggcaacatt 1200 acctttgatt caatgtaatg gaaagagctc tttcaagaga cagagaaaag aataatttaa 1260 tttctttccc cacacctcct tccctgtctc ttaccctatc ttccttcctt ctaccctccc 1320 catttctctc tctcatttct cagaagtata ttttgaaagg attcatagca gacagctaag 1380 gctggttttt tctaagtgaa gaagtgatat tgagaaggta gggttgcatg agccctttca 1440 gttttttagt ttatatacat ctgtattgtt agaatgtttt ataatataaa taaaattatt 1500 tctcagttat atactagcta tgtaacctgt ggatatttcc ttaagtatta caagctatac 1560 ttaactcact tggaaaactc aaataaatac ctgcttcata gttattaata aggattaagt 1620 gagataatgc ccataagatt cctattaata acagataaat acatacacac acacacacat 1680 tgaaaggatt cttactttgt gctaggaact ataataagtt cattgatgca ttatatcatt 1740 aagttctaat ttcaacacta gaaggcaggt attatctaaa tttcatactg gatacctcca 1800 aactcataaa gataattaaa ttgccttttg tcatatattt attcaaaagg gtaaactcaa 1860 actatggctt gtctaatttt atatatcacc ctactgaaca tgaccctatt gtgatatttt 1920 ataaaattat tctcaagtta ttatgaggat gttgaaagac agagaggatg gggtgctatg 1980 ccccaaatca gcctcacaat taagctaagc agctaagagt cttgcagggt agtgtaggga 2040 ccacagggtt aagggggcag tagaattata ctcccacttt agtttcattt caaacaatcc 2100 atacacacac agccctgagc acttacaaat tatactacgc tctatacttt ttgtttaaat 2160 gtataaataa gtggatgaaa gaatagatag atagatagac agatagatga tagatagaat 2220 aaatgcttgc cttcatagct gtctccctac cttgttcaaa atgttcctgt ccagaccaaa 2280 gtaccttgcc ttcacttaag taatcaattc ctaggttata ttctgatgtc aaaggaagtc 2340 aaaagatgtg aaaaacaatt tctgacccac aactcatgct ttgtagatga ctagatcaaa 2400 aaatttcagc catatcttaa cagtgagtga acaggaaatc tcctcttttc cctacatctg 2460 agatcccagc ttctaagacc ttcaattctc actcttgatg caacagacct tggaagcata 2520 caggagagct gaacttggtc aacaaaggag aaaagtttgt tggcctccaa aggcacagct 2580 caaacttttc aagccttctc taatcttaaa ggtaaacaag ggtctcattt ctttgagaac 2640 ttcagggaaa atagacaagg acttgcctgg tgcttttggt aggggagctt gcactttccc 2700 cctttctgga ggaaatattt atccccaggt agttcccttt ttgcaccagt ggttctttga 2760 agagacttcc acctgggaac agttaaacag caactacagg gccttgaact gcacactttc 2820 agtccggtcc tcacagttga aaagacctaa gcttgtgcct gatttaagcc tttttggtca 2880 taaaacattg aattctaatc tccctctcaa ccctacagtc acccatttgg tatattaaag 2940 atgtgttgtc tactgtctag tatccctcaa gtagtgtcag gaattagtca tttaaatagt 3000 ctgcaagcca ggagtggtgg ctcatgtctg taattccagc acttgagagg tagaagtggg 3060 aggactgctt gagctcaaga gtttgatatt atcctggaca acatagcaag acctcgtctc 3120 tacttaaaaa aaaaaaaaaa attagccagg catgtgatgt acacctgtag tcccagctac 3180 tcaggaggcc gaaatgggag gatcccttga gctcaggagg tcaaggctgc agtgagacat 3240 gatcttgcca ctgcactcca gcctggacag cagagtgaaa ccttgcctca cgaaacagaa 3300 tacaaaaaca aacaaacaaa aaactgctcc gcaatgcgct tccttgatgc tctaccacat 3360 aggtctgggt actttgtaca cattatctca ttgctgttca taattgttag attaattttg 3420 taatattgat attattccta gaaagctgag gcctcaagat gataactttt attttctgga 3480 cttgtaatag ctttctcttg tattcaccat gttgtaactt tcttagagta gtaacaatat 3540 aaagttattg tgagtttttg caaacacagc aaacacaacg acccatatag acattgatgt 3600 gaaattgtct attgtcaatt tatgggaaaa caagtatgta ctttttctac taagccattg 3660 aaacaggaat aacagaacaa gattgaaaga atacattttc cgaaattact tgagtattat 3720 acaaagacaa gcacgtggac ctgggaggag ggttattgtc catgactggt gtgtggagac 3780 aaatgcaggt ttataataga tgggatggca tctagcgcaa tgactttgcc atcactttta 3840 gagagctctt ggggacccca gtacacaaga ggggacgcag ggtatatgta gacatctcat 3900 tctttttctt agtgtgagaa taagaatagc catgacctga gtttatagac aatgagccct 3960 tttctctctc ccactcagca gctatgagat ggcttgccct gcctctctac taggctgact 4020 cactccaagg cccagcaatg ggcagggctc tgtcagggct ttgatagcac tatctgcaga 4080 gccagggccg agaaggggtg gactccagag actctccctc ccattcccga gcagggtttg 4140 cttatttatg catttaaatg atatatttat tttaaaagaa ataacaggag actgcccagc 4200 cctggctgtg acatggaaac tatgtagaat attttgggtt ccattttttt ttccttcttt 4260 cagttagagg aaaaggggct cactgcacat acactagaca gaaagtcagg agctttgaat 4320 ccaagcctga tcatttccat gtcatactga gaaagtcccc acccttctct gagcctcagt 4380 ttctcttttt ataagtagga gtctggagta aatgatttcc aatggctctc atttcaatac 4440 aaaatttccg tttattaaat gcatgagctt ctgttactcc aagactgaga aggaaattga 4500 acctgagact cattgactgg caagatgtcc ccagaggctc tcattcagca ataaaattct 4560 caccttcacc caggcccact gagtgtcaga tttgcatgca ctagttcacg tgtgtaaaaa 4620 ggaggatgct tctttccttt gtattctcac atacctttag gaaagaactt agcacccttc 4680 ccacacagcc atcccaataa ctcatttcag tgactcaacc cttgacttta taaaagtctt 4740 gggcagtata gagcagagat taagagtaca gatgctggag ccagaccacc tgagtgatta 4800 gtgactcagt ttctcttagt agttgtatga ctcagtttct tcatctgtaa aatggagggt 4860 tttttaatta gtttgttttt gagaaagggt ctcactctgt cacccaaatg ggagtgtagt 4920 ggcaaaatct cggctcactg caacttgcac ttcccaggct caagcggtcc tcccacctca 4980 acatcctgag tagctggaac cacaggtaca caccaccata cctcgctaat tttttgtatt 5040 tttggtagag atggggtttc acatgttaca caggatggtc tcagactccg gagctcaagc 5100 aatctgccca cctcagcctt ccaaagtgct gggattataa gcatgattac aggagtttta 5160 acaggctcat aagattgttc tgcagcccga gtgagttaat acatgcaaag agtttaaagc 5220 agtgacttat aaatgctaac tactctagaa atgtttgcta gtattttttg tttaactgca 5280 atcattcttg ctgcaggtga aaactagtgt tctgtacttt atgcccattc atctttaact 5340 gtaataataa aaataactga catttattga aggctatcag agactgtaat tagtgctttg 5400 cataattaat catatttaat actcttggat tctttcaggt agatactatt attatcccca 5460 ttttactaca gttaaaaaaa ctacctctca acttgctcaa gcatacactc tcacacacac 5520 aaacataaac tactagcaaa tagtagaatt gagatttggt cctaattatg tctttgctca 5580 ctatccaata aatatttatt gacatgtact tcttggcagt ctgtatgctg gatgctgggg 5640 atacaaagat gtttaaattt aagctccagt ctctgcttcc aaaggcctcc caggccaagt 5700 tatccattca gaaagcattt tttactcttt gcattccact gtttttccta agtgactaaa 5760 aaattacact ttattcgtct gtgtcctgct ctgggatgat agtctgactt tcctaacctg 5820 agcctaacat ccctgacatc aggaaagact acaccatgtg gagaaggggt ggtggttttg 5880 attgctgctg tcttcagtta gatggttaac tttgtgaagt tgaaaactgt ggctctctgg 5940 ttgactgtta gagttctggc acttgtcact atgcctatta tttaacaaat gcatgaatgc 6000 ttcagaatat gggaatatta tcttctggaa tagggaatca agttatatta tgtaacccag 6060 gattagaaga ttcttctgtg tgtaagaatt tcataaacat taagctgtct agcaaaagca 6120 agggcttgga aaatctgtga gctcctcacc atatagaaag cttttaaccc atcattgaat 6180 aaatccctat aggggatttc taccctgagc aaaaggctgg tcttgattaa ttcccaaact 6240 catatagctc tgagaaagtc tatgctgtta acgttttctt gtctgctacc ccatcatatg 6300 cacaacaata aatgcaggcc taggcatgac tgaaggctct ctcataattc ttggttgcat 6360 gaatcagatt atcaacagaa atgttgagac aaactatggg gaagcagggt atgaaagagc 6420 tctgaatgaa atggaaaccg caatgcttcc tgcccattca gggctccagc atgtagaaat 6480 ctggggcttt gtgaagactg gcttaaaatc agaagcccca ttggataaga gtagggaaga 6540 acctagagcc tacgctgagc aggtttcctt catgtgacag ggagcctcct gccccgaact 6600 tccagggatc ctctcttaag tgtttcctgc tggaatctcc tcacttctat ctggaaatgg 6660 tttctccaca gtccagcccc tggctagttg aaagagttac ccatgcagag gccctcctag 6720 catccagaga ctagtgctta gattcctact ttcagcgttg gacaacctgg atccacttgc 6780 ccagtgttct tccttagttc ctaccttcga ccttgatcct cctttatctt cctgaaccct 6840 gctgagatga tctatgtggg gagaatggct tctttgagaa acatcttctt cgttagtggc 6900 ctgcccctca ttcccacttt aatatccaga atcactataa gaagaatata ataagaggaa 6960 taactcttat tataggtaag ggaaaattaa gaggcatacg tgatgggatg agtaagagag 7020 gagagggaag gattaatgga cgataaaatc tactactatt tgttgagacc ttttatagtc 7080 taatcaattt tgctattgtt ttccatcctc acgctaactc cataaaaaaa cactattatt 7140 atctttattt tgccatgaca agactgagct cagaagagtc aagcatttgc ctaaggtcgg 7200 acatgtcaga ggcagtgcca gacctatgtg agactctgca gctactgctc atgggccctg 7260 tgctgcactg atgaggagga tcagatggat ggggcaatga agcaaaggaa tcattctgtg 7320 gataaaggag acagccatga agaagtctat gactgtaaat ttgggagcag gagtctctaa 7380 ggacttggat ttcaaggaat tttgactcag caaacacaag accctcacgg tgactttgcg 7440 agctggtgtg ccagatgtgt ctatcagagg ttccagggag ggtggggtgg ggtcagggct 7500 ggccaccagc tatcagggcc cagatgggtt ataggctggc aggctcagat aggtggttag 7560 gtcaggttgg tggtgctggg tggagtccat gactcccagg agccaggaga gatagaccat 7620 gagtagaggg cagacatggg aaaggtgggg gaggcacagc atagcagcat ttttcattct 7680 actactacat gggactgctc ccctataccc ccagctaggg gcaagtgcct tgactcctat 7740 gttttcagga tcatcatcta taaagtaaga gtaataattg tgtctatctc atagggttat 7800 tatgaggatc aaaggagatg cacactctct ggaccagtgg cctaacagtt caggacagag 7860 ctatgggctt cctatgtatg ggtcagtggt ctcaatgtag caggcaagtt ccagaagata 7920 gcatcaacca ctgttagaga tatactgcca gtctcagagc ctgatgttaa tttagcaatg 7980 ggctgggacc ctcctccagt agaaccttct aaccagctgc tgcagtcaaa gtcgaatgca 8040 gctggttaga ctttttttaa tgaaagctta gctttcatta aagattaagc tcctaagcag 8100 ggcacagatg aaattgtcta acagcaactt tgccatctaa aaaaatctga cttcactgga 8160 aacatggaag cccaaggttc tgaacatgag aaatttttag gaatctgcac aggagttgag 8220 agggaaacaa gatggtgaag ggactagaaa ccacatgaga gacacgagga aatagtgtag 8280 atttaggctg gaggtaaatg aaagagaagt gggaattaat acttactgaa atctttctat 8340 atgtcaggtg ccattttatg atatttaata atctcattac atatggtaat tctgtgagat 8400 atgtattatt gaacatacta taattaatac taatgataag taacacctct tgagtactta 8460 gtatatgcta gaatcaaatt taagtttatc atatgaggcc gggcacggtg gctcatatat 8520 gggattacat gcctgtaatc ccagcacttt gggaggccaa ggcaattgga tcacctgagg 8580 tcaggagttc cagaccagcc tggccaacat ggtgaaaccc cttctctact aaaaaataca 8640 aaaaatcagc caggtgtggt ggcacgcgtc tataatccca gctactcagg aggctgaggc 8700 aggagaatca cttgaaccca ggaggtggag gttgcagtga gctaagattg caccactgca 8760 ctccagccta ggcgacagag tgagactcca tctcaaaaaa aaaaaaagaa gtttattata 8820 tgaattaact tagttttact cacaccaata ctcagaagta gattattacc tcatttattg 8880 atgaggagcc caatgtactt gtagtgtaga tcaacttatt gaaagcacaa gctaataagt 8940 agacaattag taattagaag tcagatggtc tgagctctcc tactgtctac attacatgag 9000 ctcttattaa ctggggactc gaaaatcaaa gacatgaaat aatttgtcca agcttacaga 9060 accaccaagt agtaaggcta ggatgtagac ccagttctgc tacctctgaa gacagtgttt 9120 tttccacagc aaaacacaaa ctcagatatt gtggatgcga gaaattagaa gtagatattc 9180 ctgccctgtg gcccttgctt cttactttta cttcttgtcg attggaagtt gtggtccaag 9240 ccacagttgc agaccatact tcctcaacca taattgcatt tcttcaggaa agtttgaggg 9300 agaaaaaggt aaagaaaaat ttagaaacaa cttcagaata aagagatttt ctcttgggtt 9360 acagagattg tcatatgaca aattataagc agacacttga gaaaactgaa ggcccatgcc 9420 tgcccaaatt accctttgac cccttggtca agctgcaact ttggttaaag ggagtgttta 9480 tgtgttatag tgttcattta ctcttctggt ctaacccatt ggctccgtct tcatcctgca 9540 gtgacctcag tgcctcagaa acatacatat gtttgtctag tttaagtttg tgtgaaattc 9600 taactagcgt caagaactga gggccctaaa ctatgctagg aatagtgctg tggtgctgtg 9660 ataggtacac aagaaatgag aagaaactgc agattctctg catctccctt tgccgggtct 9720 gacaacaaag tttccccaaa ttttaccaat gcaagccatt tctccatatg ctaactactt 9780 taaaatcatt tggggcttca cattgtcttt ctcatctgta aaaagaatgg aagaactcat 9840 tcctacagaa ctccctatgt cttccctgat gggctagagt tcctctttct caaaaattag 9900 ccattattgt atttccttct aagccaaagc tcagaggtct tgtattgccc agtgacatgc 9960 acactggtca aaagtaggct aagtagaagg gtactttcac aggaacagag agcaaaagag 10020 gtgggtgaat gagagggtaa gtgagaaaag acaaatgaga agttacaaca tgatggcttg 10080 ttgtctaaat atctcctagg gaattattgt gagaggtctg aatagtgttg taaaataagc 10140 tgaatctgct gccaacatta acagtcaaga aatacctccg aataactgta cctccaatta 10200 ttctttaagg tagcatgcaa ctgtaatagt tgcatgtata tatttatcat aatactgtaa 10260 cagaaaacac ttactgaata tatactgtgt ccctagttct ttacacaata aactaatctc 10320 atcctcataa ttctattagc taatacatat tatcatccta tatttcagag acttcaagaa 10380 gttaagcaac ttgctcaaga tcatctaaga agtaggtggt atttctgggc tcatttggcc 10440 cctcctaatc tctcatggca acatggctgc ctaaagtgtt gattgcctta attcatcagg 10500 gatgggctca tactcactgc agaccttaac tggcatcctc ttttcttatg tgatctgcct 10560 gaccctagta gacttatgaa atttctgatg agaaaggaga gaggagaaag gcagagctga 10620 ctgtgatgag tgatgaaggt gccttctcat ctgggtacca gtggggcctc taagactaag 10680 tcactctgtc tcactgtgtc ttagccagtt ccttacagct tgccctgatg ggagatagag 10740 aatgggtatc ctccaacaaa aaaataaatt ttcatttctc aaggtccaac ttatgttttc 10800 ttaattttta aaaaaatctt gaccattctc cactctctaa aataatccac agtgagagaa 10860 acattctttt cccccatccc ataaatacct ctattaaata tggaaaatct gggcatggtg 10920 tctcacacct gtaatcccag cactttggga ggctgaggtg ggtggactgc ttggagctca 10980 ggagttcaag accatcttgg acaacatggt gataccctgc ctctacaaaa agtacaaaaa 11040 ttagcctggc atggtggtgt gcacctgtaa tcccagctat tagggtggct gaggcaggag 11100 aattgcttga acccgggagg cggaggttgc agtgagctga gatcgtgcca ctgcactcca 11160 gcctggggga cagagcacat tataattaac tgttattttt tacttggact cttgtgggga 11220 ataagataca tgttttattc ttatttatga ttcaagcact gaaaatagtg tttagcatcc 11280 agcaggtgct tcaaaaccat ttgctgaatg attactatac tttttacaag ctcagctccc 11340 tctatccctt ccagcatcct catctctgat taaataagct tcagtttttc cttagttcct 11400 gttacatttc tgtgtgtctc cattagtgac ctcccatagt ccaagcatga gcagttctgg 11460 ccaggcccct gtcggggtca gtgccccacc cccgccttct ggttctgtgt aaccttctaa 11520 gcaaaccttc tggctcaagc acagcaatgc tgagtcatga tgagtcatgc tgaggcttag 11580 ggtgtgtgcc cagatgttct cagcctagag tgatgactcc tatctgggtc cccagcagga 11640 tgcttacagg gcagatggca aaaaaaagga gaagctgacc acctgactaa aactccacct 11700 caaacggcat cataaagaaa atggatgcct gagacagaat gtgacatatt ctagaatata 11760 ttatttcctg aatatatata tatatataca catatacgta tatatatata tatatatata 11820 tttgttgtta tcaattgcca tagaatgatt agttattgtg aatcaaatat ttatcttgca 11880 ggtggcctct atacctagaa gcggcagaat caggctttat taatacatgt gtatagattt 11940 ttaggatcta tacacatgta ttaatatgaa acaaggatat ggaagaggaa ggcatgaaaa 12000 caggaaaaga aaacaaacct tgtttgccat tttaaggcac ccctggacag ctaggtggca 12060 aaaggcctgt gctgttagag gacacatgct cacatacggg gtcagatctg acttggggtg 12120 ctactgggaa gctctcatct taaggataca tctcaggcca gtcttggtgc attaggaaga 12180 tgtaggcaac tctgatcctg agaggaaaga aacattcctc caggagagct aaaagggttc 12240 acctgtgtgg gtaactgtga aggactacaa gaggatgaaa aacaatgaca gacagacata 12300 atgcttgtgg gagaaaaaac aggaggtcaa ggggatagag aaggcttcca gaagaatggc 12360 tttgaagctg gcttctgtag gagttcacag tggcaaagat gtttcagaaa tgtgacatga 12420 cttaaggaac tatacaaaaa ggaacaaatt taaggagagg cagataaatt agttcaacag 12480 acatgcaagg aattttcaga tgaatgttat gtctccactg agcttcttga ggttagcagc 12540 tgtgagggtt ttgcaggccc aggacccatt acaggacctc acgtatactt gacactgttt 12600 tttgtattca tttgtgaatg aatgacctct tgtcagtcta ctcggtttcg ctgtgaatga 12660 atgatgtctt gtcagcctac ttggtttcgc taagagcaca gagagaagat ttagtgatgc 12720 tatgtaaaaa cttccttttt ggttcaagtg tatgtttgtg atagaaatga agacaggcta 12780 catgatgcat atctaacata aacacaaaca ttaagaaagg aaatcaacct gaagagtatt 12840 tatacagata acaaaataca gagagtgagt taaatgtgta ataactgtgg cacaggctgg 12900 aatatgagcc atttaaatca caaattaatt agaaaaaaaa cagtggggaa aaaattccat 12960 ggatgggtct agaaagacta gcattgtttt aggttgagtg gcagtgttta aagggtgata 13020 tcagactaaa cttgaaatat gtggctaaat aactagaata ctctttattt tttcgtatca 13080 tgaatagcag atatagcttg atggccccat gcttggttta acatccttgc tgttcctgac 13140 atgaaatcct taatttttga caaaggggct attcattttc attttatatt gggcctagaa 13200 attatgtaga tggtcctgag gaaaagttta tagcttgtct atttctctct ctaacatagt 13260 tgtcagcaca atgcctaggc tataggaagt actcaaagct tgttaaattg aattctatcc 13320 ttcttattca attctacaca tggaggaaaa actcatcagg gatggaggca cgcctctaag 13380 gaaggcaggt gtggctctgc agtgtgattg ggtacttgca ggacgaaggg tggggtggga 13440 gtggctaacc ttccattcct agtgcagagg tcacagccta aacatcaaat tccttgaggt 13500 gcggtggctc actcctgtaa tcacagcagt ttgggacgcc aaggtgggca gatcacttga 13560 ggtcaggagt tggacaccag cccagccaac atagtgaaac ctggtctctg cttaaaaata 13620 taaaaattag ctggacgtgg tgacgggagc ctgtaatcca actacttggg aggctgaggc 13680 aggagaatcg cttgaaccgg ggaggtggag tttgcactga gcagagatca tgccattgca 13740 ctccagcctc cagagcgaga ctctgtctaa agaaaaacga aaacaaacaa acaaacaaac 13800 aaacaaaacc catcaaattc cctgaccgaa cagaattctg tctgattgtt ctctgactta 13860 tctaccattt tccctcctta aagaaactgt gaacttcctt cagctagagg ggcctggctc 13920 agaagcctct ggtcagcatc caagaaatac ttgatgtcac tttggctaaa ggtatgatgt 13980 gtagacaagc tccagagatg gtttctcatt tccatatcca cccacccagc tttccaattt 14040 taaagccaat tctgaggtag agactgtgat gaacaaacac cttgacaaaa ttcaacccaa 14100 agactcactt tgcctagctt caaaatcctt actctgacat atactcacag ccagaaatta 14160 gcatgcacta gagtgtgcat gagtgcaaca cacacacaca ccaattccat attctctgtc 14220 agaaaatcct gttggttttt cgtgaaagga tgttttcaga ggctgacccc ttgccttcac 14280 ctccaatgct accactctgg tctaagtcac tgtcaccacc acctaaatta tagctgttga 14340 ctcataacaa tcttcctgct tctaccactg ccccactaca atttcttccc aatatactat 14400 ccaaattagt cttttcaaaa tgtaagtcat atatggtcac ctctttgttc aaagtcttct 14460 gatagtttcc tatatcattt ataataaaac caaatcctta caattctcta caatagttgt 14520 tcatgcatat attatgttta ttacagatac atatatatag ctctcatata aataaatata 14580 tatatttatg tgtatgtgtg tagagtgttt tttcttacaa ctctatgatg taggtattat 14640 tagtgtccca aattttataa tttaggactt ctatgatctc atcttttatt ctccccttca 14700 ccgaatctca tcctacattg gccttattga tattccttga aaattctaag catcttacat 14760 ctttagggta tttacatttg ccattcccta tgccctaaat atttaatcat agtttcatat 14820 aaatgggttc ctcatcatct atgggtactc tctcaggtgt taactttata gtgaggactt 14880 tcctgccata ctacttaaag tagcgatacc ctttcaccct gtcctaatca cactctggcc 14940 ttcatttcag tttttttttt ttctccatag cacctaatct cattggtata taacatgttt 15000 catttgctta tttaatgtca agctctttcc actatcaagt ccatgaaaac aggaacttta 15060 ttcctctatt ctgtttttgt gctgtattct tagcaatttt acaattttga atgaatgaat 15120 gagcagtcaa acacatatac aactataatt aaaaggatgt atgctgacac atccactgct 15180 atgcacacac aaagaaatca gtggagtaga gctggaagtg ctaagcctgc atagagctag 15240 ttagccctcc gcaggcagag ccttgatggg attactgagt tctagaattg gactcatttg 15300 ttttgtaggc tgagatttgc tcttgaaaac ttgttctgac caaaataaaa ggctcaaaag 15360 atgaatatcg aaaccagggt gttttttaca ctggaattta taactagagc actcatgttt 15420 atgtaagcaa ttaattgttt catcagtcag gtaaaagtaa agaaaaactg tgccaaggca 15480 ggtagcctaa tgcaatatgc cactaaagta aacattattt cataggtgtc agatatggct 15540 tattcatcca tcttcatggg aaggatggcc ttggcctgga catcagtgtt atgtgaggtt 15600 caaaacacct ctaggctata aggcaacaga gctccttttt tttttttctg tgctttcctg 15660 gctgtccaaa tctctaatga taagcatact tctattcaat gagaatattc tgtaagatta 15720 tagttaagaa ttgtgggagc cattccgtct cttatagtta aatttgagct tcttttatga 15780 tcactgtttt tttaatatgc tttaagttct ggggtacatg tgccatggtg gtttgctgca 15840 cccatcaacc cgtcatctac attaggtatt tctcctaatg ctatccttcc cctagccccc 15900 cacccccaac aggccccagt gtgtgatgtt cccctccctg tgtccatgga tcactggttt 15960 ttttttgttt tttttttttt tttaaagtct cagttaaatt tttggaatgt aatttatttt 16020 cctggtatcc taggacttgc aagttatctg gtcactttag ccctcacgtt ttgatgataa 16080 tcacatattt gtaaacacaa cacacacaca cacacacaca cacatatata tatatataaa 16140 acatatatat acataaacac acataacata tttatcgggc atttctgagc aactaatcat 16200 gcaggactct caaacactaa cctatagcct tttctatgta tctacttgtg tagaaaccaa 16260 gcgtggggac tgagaaggca atagcaggag cattctgact ctcactgcct ttagctaggc 16320 ccctccctca tcacagctca gcatagtcct gagctcttat ctatatccac acacagtttc 16380 tgacgctgcc cagctatcac catcccaagt ctaaagaaaa aaataatggg tttgcccatc 16440 tctgttgatt agaaaacaaa acaaaataaa ataagcccct aagctcccag aaaacatgac 16500 taaaccagca agaagaagaa aatacaatag gtatatgagg agactggtga cactagtgtc 16560 tgaatgaggc ttgagtacag aaaagaggct ctagcagcat agtggtttag aggagatgtt 16620 tctttccttc acagatgcct tagcctcaat aagcttgcgg ttgtggaagt ttactttcag 16680 aacaaactcc tgtggggcta gaattattga tggctaaaag aagcccgggg gagggaaaaa 16740 tcattcagca tcctcaccct tagtgacaca aaacagaggg ggcctggttt tccatatttc 16800 ctcatgatgg atgatctcgt taatgaaggt ggtctgacga gatcattgct tcttccattt 16860 aagccttgct cacttgccaa tcctcagttt taaccttctc cagagaaata cacatttttt 16920 attcaggaaa catactatgt tatagtttca atactaaata atcaaagtac tgaagatagc 16980 atgcataggc aagaaaaagt ccttagcttt atgttgctgt tgtttcagaa tttaaaaaag 17040 atcaccaagt caaggacttc tcagttctag cactagaggt ggaatcttag catataatca 17100 gaggtttttc aaaatttcta gacataagat tcaaagccct gcacttaaaa tagtctcatt 17160 tgaattaact ctttatataa attgaaagca cattctgaac tacttcagag tattgtttta 17220 tttctatgtt cttagttcat aaatacatta ggcaatgcaa tttaattaaa aaaacccaag 17280 aatttcttag aattttaatc atgaaaataa atgaaggcat ctttacttac tcaaggtccc 17340 aaaaggtcaa agaaaccagg aaagtaaagc tatatttcag cggaaaatgg gatatttatg 17400 agttttctaa gttgacagac tcaagtttta accttcagtg cccatcatgt aggaaagtgt 17460 ggcataactg gctgattctg gctttctact cctttttccc attaaagatc cctcctgctt 17520 aattaacatt cacaagtaac tctggttgta ctttaggcac agtggctccc gaggtcagtc 17580 acacaatagg atgtctgtgc tccaagttgc cagagagaga gattactctt gagaatgagc 17640 ctcagccctg gctcaaactc acctgcaaac ttcgtgagag atgaggcaga ggtacactac 17700 gaaagcaaca gttagaagct aaatgatgag aacacatgga ctcatagagg gaaacaacgc 17760 atactggggc ctatcagagg gtggagggtg agagaaggag aggatcagga aaaatcacta 17820 atggatgcta agcgtaatac ctgagtgatg agatcatcta tacaacaaac ccccttgaca 17880 ttcatttatc tatgtaacaa acctgcacat cctgtacatg tacccctgaa cttaaaataa 17940 aagttgaaaa caagaaagca acagtttgaa cacttgttat ggtctattct ctcattcttt 18000 acaattacac tagaaaatag ccacaggctt cctgcaaggc agccacagaa tttatgactt 18060 gtgatatcca agtcattcct ggataatgca aaatctaaca caaaatctag tagaatcatt 18120 tgcttacatc tatttttgtt ctgagaatat agatttagat acataatgga agcagaataa 18180 tttaaaatct ggctaattta gaatcctaag cagctctttt cctatcagtg gtttacaagc 18240 cttgtttata tttttcctat tttaaaaata aaaataaagt aagttatttg tggtaaagaa 18300 tattcattaa agtatttatt tcttagataa taccatgaaa aacattcagt gaagtgaagg 18360 gcctacttta cttaacaaga atctaattta tataattttt catactaata gcatctaaga 18420 acagtacaat atttgactct tcaggttaaa catatgtcat aaattagcca gaaagattta 18480 agaaaatatt ggatgtttcc ttgtttaaat taggcatctt acagttttta gaatcctgca 18540 tagaacttaa gaaattacaa atgctaaagc aaacccaaac aggcaggaat taatcttcat 18600 cgaatttggg tgtttctttc taaaagtcct ttatacttaa atgtcttaag acatacatag 18660 attttatttt actaatttta attatataga caataaatga atattcttac tgattacttt 18720 ttctgactgt ctaatctttc tgatctatcc tggatggcca taacacttat ctctctgaac 18780 tttgggcttt taatatagga aagaaaagca ataatccatt tttcatggta tctcatatga 18840 taaacaaata aaatgcttaa aaatgagcag gtgaagcaat ttatcttgaa ccaacaagca 18900 tcgaagcaat aatgagactg cccgcagcct acctgacttc tgagtcagga tttataagcc 18960 ttgttactga gacacaaacc tgggcctttc aatgctataa cctttcttga agctcctccc 19020 taccaccttt agccataagg aaacatggaa tgggtcagat ccctggatgc aagccaggtc 19080 tggaaccata ggcagtaagg agagaagaaa atgtgggctc tgcaactggc tccgagggag 19140 caggagagga tcaaccccat actctgaatc taagagaaga ctggtgtcca tactctgaat 19200 gggaagaatg atgggattac ccatagggct tgttttaggg agaaacctgt tctccaaact 19260 cttggccttg agatacctgg tccttattcc ttggactttg gcaatgtctg accctcacat 19320 tcaagttctg aggaagggcc actgccttca tactgtggat ctgtagcaaa ttccccctga 19380 aaacccagag ctgtatctta attggttaaa aaaaattata ttatctcaac gactgttctt 19440 ctctgagtag ccaagctcag cttggttcaa gctacaagca gctgagctgc tttttgtcta 19500 gtcattgttc ttttatttca gtggatcaaa tacgttcttt ccaaacctag gatcttgtct 19560 tcctaggcta tatattttgt cccaggaagt cttaatctgg ggtccacaga acactagggg 19620 gctggtgaag tttatagaaa aaaaatctgt atttttactt acatgtaact gaaatttagc 19680 attttcttct actttgaatg caaaggacaa actagaatga catcatcagt acctattgca 19740 tagttataaa gagaaaccac agatattttc atactacacc ataggtattg cagatctttt 19800 tgtttttgtt tttgtttgag atggagtttc gctcttattg cccaggctgg agtgcagtgg 19860 catgatttcg gctcactgca acctcccctt cctgcattca agcaattctc ctgccttggc 19920 ctcctgagta gctggggatt acaggcacct gccaccatgc cagtctaatt tttgtatttt 19980 tagtagagat ggggtttcgc catgttggcc aggctggtct tgaactcctg acctcagatg 20040 atctgcccgc cttggcctcc tgaagtgctg ggattatagg tgtgagccac cacgcctggc 20100 ccattgcaga tatttttaat tcacatttat ctgcatcact acttggatct taaggtagct 20160 gtagacccaa tcctagatct aatgctttca taaagaagca aatataataa atactatacc 20220 acaaatgtaa tgtttgatgt ctgataatga tatttcagtg taattaaact tagcactcct 20280 atgtatatta tttgatgcaa taaaaacata tttttttagc acttacagtc tgccaaactg 20340 gcctgtgaca caaaaaaagt ttaggaattc ctggttttgt ctgtgttagc caatggttag 20400 aatatatgct cagaaagata ccattggtta atagctaaaa gaaaatggag tagaaattca 20460 gtggcctgga ataataacaa tttgggcagt cattaagtca ggtgaagact tctggaatca 20520 tgggagaaaa gcaagggaga cattcttact tgccacaagt gttttttttt tttttttttt 20580 ttatcacaaa cataagaaaa tataataaat aacaaagtca ggttatagaa gagagaaacg 20640 ctcttagtaa acttggaata tggaatcccc aaaggcactt gacttgggag acaggagcca 20700 tactgctaag tgaaaaagac gaagaacctc tagggcctga acatacagga aattgtagga 20760 acagaaattc ctagatctgg tggggcaagg ggagccatag gagaaagaaa tggtagaaat 20820 ggatggagac ggaggcagag gtgggcagat catgaggtca agagatcgag accatcctgg 20880 caaacatggt gaaatcccgt ctctactaaa aataaaaaaa ttagctgggc atggtggcat 20940 gcgcctgtag tcccagctgc tcgggaggct gaggcaggag aatcgtttga acccaggagg 21000 cgaaggttgc agtgagctga gatagtgcca ttgcactcca gtctggcaac agagtgagac 21060 tccgtctcaa aaaaaaaaaa aaaagaaaga aagaaaagaa aaagaaaaaa gaaaaaataa 21120 atggatgtag aacaagccag aaggaggaac tgggctgggg caatgagatt atggtgatgt 21180 aagggacttt tatagaatta acaatgctgg aatttgtgga actctgcttc tattattccc 21240 ccaatcatta cttctgtcac attgatagtt aaataatttc tgtgaattta ttccttgatt 21300 ctaaaatatg aggataatga caatggtatt ataagggcag attaagtgat atagcatgag 21360 caatattctt caggcacatg gatcgaattg aatacactgt aaatcccaac ttccagtttc 21420 agctctacca agtaaagagc tagcaagtca tcaaaatggg gacatacaga aaaaaaaaag 21480 gacactagag gaataatata ccctgactcc tagcctgatt aatatatcga t 21531 <210> 186 <211> 1614 <212> DNA <213> Homo sapiens <400> 186 gatctctatt tatttagcaa taatagagaa agcatttaag agaataaagc aatggaaata 60 agaaatttgt aaatttcctt ctgataacta gaaatagagg atccagtttc ttttggttaa 120 cctaaatttt atttcatttt attgttttat tttattttat tttattttat tttgtgtaat 180 cgtagtttca gagtgttaga gctgaaagga agaagtagga gaaacatgca aagtaaaagt 240 ataacacttt ccttactaaa ccgacatggg tttccaggta ggggcaggat tcaggatgac 300 tgacagggcc cttagggaac actgagaccc tacgctgacc tcataaatgc ttgctacctt 360 tgctgtttta attacatctt ttaatagcag gaagcagaac tctgcacttc aaaagttttt 420 cctcacctga ggagttaatt tagtacaagg ggaaaaagta cagggggatg ggagaaaggc 480 gatcacgttg ggaagctata gagaaagaag agtaaatttt agtaaaggag gtttaaacaa 540 acaaaatata aagagaaata ggaacttgaa tcaaggaaat gattttaaaa cgcagtattc 600 ttagtggact agaggaaaaa aataatctga gccaagtaga agaccttttc ccctcctacc 660 cctactttct aagtcacaga ggctttttgt tcccccagac actcttgcag attagtccag 720 gcagaaacag ttagatgtcc ccagttaacc tcctatttga caccactgat taccccattg 780 atagtcacac tttgggttgt aagtgacttt ttatttattt gtatttttga ctgcattaag 840 aggtctctag ttttttatct cttgtttccc aaaacctaat aagtaactaa tgcacagagc 900 acattgattt gtatttattc tatttttaga cataatttat tagcatgcat gagcaaatta 960 agaaaaacaa caacaaatga atgcatatat atgtatatgt atgtgtgtat atatacacac 1020 atatatatat atattttttc ttttcttacc agaaggtttt aatccaaata aggagaagat 1080 atgcttagaa ccgaggtaga gttttcatcc attctgtcct gtaagtattt tgcatattct 1140 ggagacgcag gaagagatcc atctacatat cccaaagctg aattatggta gacaaaactc 1200 ttccactttt agtgcatcaa cttcttattt gtgtaataag aaaattggga aaacgatctt 1260 caatatgctt accaagctgt gattccaaat attacgtaaa tacacttgca aaggaggatg 1320 tttttagtag caatttgtac tgatggtatg gggccaagag atatatctta gagggagggc 1380 tgagggtttg aagtccaact cctaagccag tgccagaaga gccaaggaca ggtacggctg 1440 tcatcactta gacctcaccc tgtggagcca caccctaggg ttggccaatc tactcccagg 1500 agcagggagg gcaggagcca gggctgggca taaaagtcag ggcagagcca tctattgctt 1560 acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc atgg 1614 <210> 187 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> CD33 shRNA <400> 187 tgttcatact tctttcggat ttcaagagaa tccgaaagaa gtatgaactt ttttc 55 <210> 188 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> CD33 shRNA <400> 188 tggagagagg aagtaccaaa ttcaagagat ttggtacttc ctctctcctt ttttc 55 <210> 189 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> mouse RPL10 forward primer <400> 189 tgaagacatg gttgctgaga ag 22 <210> 190 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> mouse RPL10 reverse primer <400> 190 gaacgatttg gtagggtata ggag 24 <210> 191 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> human gamma-globin forward primer <400> 191 gtggaagatg ctggaggaga aa 22 <210> 192 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> human gamma-globin reverse primer <400> 192 tgccatgtgc cttgactttg 20 <210> 193 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> mouse beta-major globin forward primer <400> 193 atgccaaagt gaaggcccat 20 <210> 194 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> mouse beta-major globin reverse primer <400> 194 cccagcacaa tcacgatcat 20 <210> 195 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> human gamma-globin forward primer <400> 195 gtgcttgaag gggaacaact ac 22 <210> 196 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> human gamma-globin reverse primer <400> 196 cctggcctcc agataactac ac 22 <210> 197 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> EF1alpha p1 forward primer <400> 197 ccccctcgag gtcgacatgg ctagagactt atcgaaagc 39 <210> 198 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> EF1alpha p1 reverse primer <400> 198 attcgatatc aagctccaag atctgcacac tggtattt 38 <210> 199 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> EF1alpha p2 forward primer <400> 199 ccccctcgag gtcgacgtac acgacatcac tttcccagt 39 <210> 200 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> EF1alpha p2 reverse primer <400> 200 attcgatatc aagctcacac tggtatttcg gtttttg 37 <210> 201 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> 3'HS1 p1 forward primer <400> 201 ccccctcgag gtcgacctac actctcagtc agcctatgga 40 <210> 202 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> 3'HS1 p1 reverse primer <400> 202 attcgatatc aagcttaatc ccaaaaggct gatagtctc 39 <210> 203 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> 3'HS1 p2 forward primer <400> 203 ccccctcgag gtcgacacat ctctcacttt ctcatcacca 40 <210> 204 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> 3'HS1 p2 reverse primer <400> 204 attcgatatc aagctaagta actgggatta caggagcac 39 <210> 205 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> CD46F primer <400> 205 aaagggcaaa taccttaagg ggtg 24 <210> 206 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CD46R primer <400> 206 agcacttcga cctaaaaata gagat 25 <210> 207 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgRNA <400> 207 ggggccacta gggacaggat 20 <210> 208 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> AAVS1 forward primer <400> 208 atctcacagg taaaactgac gcacggagga aca 33 <210> 209 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> AAVS1 reverse primer <400> 209 cgggtcacct ctcactcctt tcatttgggc 30 <210> 210 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> AAVS1 forward primer <400> 210 cggttaatgt ggctctggtt 20 <210> 211 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> AAVS1 reverse primer <400> 211 cctctctggc tccatcgtaa 20 <210> 212 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> mouse alpha globin forward primer <400> 212 ctggggaaga caaaagcaac 20 <210> 213 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> mouse alpha globin reverse primer <400> 213 gccgtggctt acatcaaagt 20 <210> 214 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> human g-globin forward primer <400> 214 ggggcaaggt gaatgtggaa ga 22 <210> 215 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> human g-globin reverse primer <400> 215 catgatggca gaggcagagg ac 22 <210> 216 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> human beta-globin forward primer <400> 216 ctcatggcaa gaaagtgctc g 21 <210> 217 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> human beta-globin reverse primer <400> 217 aattctttgc caaagtgatg gg 22 <210> 218 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> GFP forward primer <400> 218 tcgtgaccac cctgacctac 20 <210> 219 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> GFP reverse primer <400> 219 ggtcttgtag ttgccgtcgt 20 <210> 220 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> mgmt forward primer <400> 220 gctgtctggt tgtgagcagg gtct 24 <210> 221 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> mgmt reverse primer <400> 221 cgggctggtg gaaataggca ttc 23 <210> 222 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> AAVS1 specific TLA forward primer <400> 222 ggttgtccag aaaaacggtg at 22 <210> 223 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> AAVS1 specific TLA reverse primer <400> 223 cctctcactc ctttcatttg gg 22 <210> 224 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> EF1a forward primer <400> 224 aacaaaagct ggttaattaa atcggacggg ggtagtctca ag 42 <210> 225 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> EF1a reverse primer <400> 225 tattgtacca tcttaattaa aggggcgagt ccttttgtat g 41 <210> 226 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> pA forward primer <400> 226 aacaaaagct ggttaattaa tcattttatg tttcaggttc aggggg 46 <210> 227 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> pA reverse primer <400> 227 tattgtacca tcttaattaa atggttacaa ataaagcaat agcatcac 48 <210> 228 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> HS4 forward primer <400> 228 aacaaaagct ggttaattaa gtttttgtat tctgtttcgt gaggca 46 <210> 229 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> HS4 reverse primer <400> 229 tattgtacca tcttaattaa gcatttgcct aaggtcggac at 42 <210> 230 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> In-Out P1 primer <400> 230 ccacacccag acctgaccca aacc 24 <210> 231 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> In-Out P2 primer <400> 231 cgggaaccac acacggcact tacc 24 <210> 232 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> In-Out P3 primer <400> 232 tctaacgctg ccgtctctct cctg 24 <210> 233 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> forward primer for genotyping CD46 mice <400> 233 gccagttcat cttttgactc tattaa 26 <210> 234 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> reverse primer for genotyping CD46 mice <400> 234 aatcacagca atgacccaaa 20 <210> 235 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> 32P-gamma-ATP labeled probes for miRNA 423-5p <400> 235 aaagtctcgc tctctgcccc tca 23 <210> 236 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> 32P-gamma-ATP labeled probes for U6 snRNA <400> 236 gaatttgcgt gtcatccttg cgcaggggcc atgctaa 37 <210> 237 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> HBG2-seq primer <400> 237 cttatttgga aaccaatgct tacta 25 <210> 238 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> anti-mouse PDL1 forward primer <400> 238 ggttcagcct ggtgggtctt tg 22 <210> 239 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> anti-mouse PDL1 reverse primer <400> 239 atctggaggt atgcggtgtt cttc 24 <210> 240 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> mouse PPIA forward primer <400> 240 gcatacaggt cctggcatct 20 <210> 241 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> mouse PPIA reverse primer <400> 241 atccagccat tcagtcttgg 20 <210> 242 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> forward primer for mouse beta-YAC (gamma-globin promoter) <400> 242 aaacggtccc tggctaaact 20 <210> 243 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> reverse primer for mouse beta-YAC (gamma-globin promoter) <400> 243 gctgaagggt gcttcctttt t 21 <210> 244 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgBCL <400> 244 tttatcacag gctccaggaa 20 <210> 245 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgBCL <400> 245 ttttatcaca ggctccagga 20 <210> 246 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> HBB primer <400> 246 atgtcagaag caaatgtgag gagca 25 <210> 247 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> forward BCL11A-seq primer <400> 247 agagagcctt ccgaaagagg 20 <210> 248 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgBCL <400> 248 ctgtgataaa agcaactgtt 20 <210> 249 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgBCL <400> 249 gataaaagca actgttagct 20 <210> 250 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgHBG <400> 250 cttgaccaat agccttgaca 20 <210> 251 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HBB primer <400> 251 aattctggct tatcggaggc aag 23 <210> 252 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgHBG <400> 252 gctattggtc aaggcaaggc 20 <210> 253 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgHBG <400> 253 gtggggaagg ggcccccaag 20 <210> 254 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgHBG <400> 254 ccttccccac actatctcaa 20 <210> 255 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgHBG <400> 255 agatatttgc attgagatag 20 <210> 256 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgHBB_STOP <400> 256 cttgccccac agggcagtaa 20 <210> 257 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgHBB_SKIP <400> 257 agactcaccc tgaagttctc 20 <210> 258 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgHBB_CRISPR <400> 258 cttgtcaagg ctattggtca 20 <210> 259 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> sgNEG <400> 259 ggtgtcgaaa tgagaagaag 20 <210> 260 <211> 594 <212> DNA <213> Artificial Sequence <220> <223> TadAN +32aa <400> 260 tctgaagtcg agttcagcca cgagtattgg atgaggcacg cactgaccct ggcaaaacga 60 gcctgggacg aaagagaagt ccccgtcggc gccgtgctgg tgcacaacaa tcgcgtgatc 120 ggagaaggat ggaacaggcc aatcggacgc cacgacccta ccgcacacgc agagatcatg 180 gcactgaggc agggaggact ggtcatgcag aattatcgcc tgatcgatgc caccctgtat 240 gtgacactgg agccatgcgt gatgtgcgca ggagcaatga tccacagccg gatcggaaga 300 gtggtgttcg gagcacgaga cgccaagacc ggagcagcag gcagcctgat ggatgtgctg 360 caccacccag gcatgaacca ccgggtggag atcacagagg gcatcctggc agacgagtgc 420 gccgccctgc tgagcgattt ctttagaatg aggagacagg agatcaaggc ccagaagaag 480 gcacagagct ccaccgactc tggaggctct agcggaggat cctctggaag cgagacacca 540 ggcacatccg agtccgccac accagagtct tccggcggct cctccggagg atcc 594 <210> 261 <211> 594 <212> DNA <213> Artificial Sequence <220> <223> TadAN+ +32aa <400> 261 tctgaggtgg agttttccca cgagtactgg atgagacatg ccctgaccct ggccaagagg 60 gcacgcgatg agagggaggt gcctgtggga gccgtgctgg tgctgaacaa tagagtgatc 120 ggcgagggct ggaacagagc catcggcctg cacgacccaa cagcccatgc cgaaattatg 180 gccctgagac agggcggcct ggtcatgcag aactacagac tgattgacgc caccctgtac 240 gtgacattcg agccttgcgt gatgtgcgcc ggcgccatga tccactctag gatcggccgc 300 gtggtgtttg gcgtgaggaa tgcaaaaact ggcgccgcag gctctctgat ggacgtgctg 360 cactaccccg gcatgaatca cagagtcgaa attaccgagg gaatcctggc agatgaatgt 420 gccgccctgc tgtgctattt ctttcggatg cctagacagg tgtttaatgc tcagaagaag 480 gcccagagct ccaccgatag tggcggatct agcgggggct cctctggctc tgagacccct 540 ggcacaagcg agagcgcaac acctgaaagc agcgggggca gcagcggggg gagc 594 <210> 262 <211> 600 <212> DNA <213> Artificial Sequence <220> <223> vector <400> 262 catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt 60 ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt 120 gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg 180 gtgtgcgccg gtgtacagcc ctaggataac ttcgtatagc atacattata cgaagttata 240 ctagtacgcc cgggcgtatc gatacgatat cggtccggac aggaagtgac aattttcgcg 300 cggttttagg cggatgttgt agtaaatttg ggcgtaaccg agtaagattt ggccattttc 360 gcgggaaaac tgaataagag gaagtgaaat ctgaataatt ttgtgttact catagcgcgt 420 aatggatccg cgttaaccgg cggccgcatt ctagacggaa ttcataactt cgtatagcat 480 acattatacg aagttatgct agccgaagct tgagctcgtc gagggatctg ggcgtggtta 540 agggtgggaa agaatatata aggtgggggt cttatgtagt tttgtatctg ttttgcagca 600 <210> 263 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> BCL11A-seq reverse primer <400> 263 ggcagctaga caggacttgg 20 <210> 264 <211> 370 <212> DNA <213> Adenovirus serotype 35 <400> 264 catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60 aaaagtgtgg gccgtgtggt gattggctgt ggggttaacg gttaaaaggg gcggcgcggc 120 cgtgggaaaa tgacgttatt taaatataac ttcgtatagc atacattata cgaagttatg 180 aggtagtttt gttcaggggc aagtgaaaat tgacccatta cgcgcgaaaa ctgaatgagg 240 aagtgttttt ctgaataatg tggtatttat ggcagggtgg agtatttgac cggatccagg 300 tagactttgc tgattttcgt ggaggtttat aacttcgtat agcatacatt atacgaagtt 360 atatttaaat 370 <210> 265 <211> 198 <212> PRT <213> Artificial Sequence <220> <223> TadA <400> 265 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Trp Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val His Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Pro Ile 35 40 45 Gly Arg His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Leu Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Ala Arg Asp Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His His Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Ser Asp Phe Phe Arg Met Arg Arg Gln Glu Ile Lys Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly 165 170 175 Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly 180 185 190 Gly Ser Ser Gly Gly Ser 195 <210> 266 <211> 198 <212> PRT <213> Artificial Sequence <220> <223> mutant TadA <400> 266 Ser Glu Val Glu Phe Ser His Glu Tyr Trp Met Arg His Ala Leu Thr 1 5 10 15 Leu Ala Lys Arg Ala Arg Asp Glu Arg Glu Val Pro Val Gly Ala Val 20 25 30 Leu Val Leu Asn Asn Arg Val Ile Gly Glu Gly Trp Asn Arg Ala Ile 35 40 45 Gly Leu His Asp Pro Thr Ala His Ala Glu Ile Met Ala Leu Arg Gln 50 55 60 Gly Gly Leu Val Met Gln Asn Tyr Arg Leu Ile Asp Ala Thr Leu Tyr 65 70 75 80 Val Thr Phe Glu Pro Cys Val Met Cys Ala Gly Ala Met Ile His Ser 85 90 95 Arg Ile Gly Arg Val Val Phe Gly Val Arg Asn Ala Lys Thr Gly Ala 100 105 110 Ala Gly Ser Leu Met Asp Val Leu His Tyr Pro Gly Met Asn His Arg 115 120 125 Val Glu Ile Thr Glu Gly Ile Leu Ala Asp Glu Cys Ala Ala Leu Leu 130 135 140 Cys Tyr Phe Phe Arg Met Pro Arg Gln Val Phe Asn Ala Gln Lys Lys 145 150 155 160 Ala Gln Ser Ser Thr Asp Ser Gly Gly Ser Ser Gly Gly Ser Ser Gly 165 170 175 Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Ser Gly 180 185 190 Gly Ser Ser Gly Gly Ser 195 <210> 267 <211> 594 <212> DNA <213> Artificial Sequence <220> <223> TadA <400> 267 tctgaagtcg agtttagcca cgagtattgg atgaggcacg cactgaccct ggcaaagcga 60 gcatgggatg aaagagaagt ccccgtgggc gccgtgctgg tgcacaacaa tagagtgatc 120 ggagagggat ggaacaggcc aatcggccgc cacgacccta ccgcacacgc agagatcatg 180 gcactgaggc agggaggcct ggtcatgcag aattaccgcc tgatcgatgc caccctgtat 240 gtgacactgg agccatgcgt gatgtgcgca ggagcaatga tccacagcag gatcggaaga 300 gtggtgttcg gagcacggga cgccaagacc ggcgcagcag gctccctgat ggatgtgctg 360 caccaccccg gcatgaacca ccgggtggag atcacagagg gaatcctggc agacgagtgc 420 gccgccctgc tgagcgattt ctttagaatg cggagacagg agatcaaggc ccagaagaag 480 gcacagagct ccaccgactc tggaggatct agcggaggat cctctggaag cgagacacca 540 ggcacaagcg agtccgccac accagagagc tccggcggct cctccggagg atcc 594 <210> 268 <211> 594 <212> DNA <213> Artificial Sequence <220> <223> mutant TadA <400> 268 tctgaggtgg agttttccca cgagtactgg atgagacatg ccctgaccct ggccaagagg 60 gcacgcgatg agagggaggt gcctgtggga gccgtgctgg tgctgaacaa tagagtgatc 120 ggcgagggct ggaacagagc catcggcctg cacgacccaa cagcccatgc cgaaattatg 180 gccctgagga agggaggcct ggtcatgcag aactacagac tgattgacgc caccctgtac 240 gtgacattcg agccttgcgt gatgtgcgcc ggcgccatga tccactctag gatcggccgc 300 gtggtgtttg gcgtgaggaa cgcaaaaacc ggcgccgcag gctccctgat ggacgtgctg 360 cactaccccg gcatgaatca ccgcgtcgaa attaccgagg gaatcctggc agatgaatgt 420 gccgccctgc tgtgctattt ctttcggatg cctagacagg tgttcaatgc tcagaagaag 480 gcccagagct ccaccgactc cggaggatct agcggcggat cctctggctc tgagacacct 540 ggcacaagcg agagcgcaac acctgaaagc agcgggggca gcagcggggg gtca 594 <210> 269 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> wildtype and edited sequence <400> 269 tttatcacag gctccaggaa ggg 23 <210> 270 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> HBG1/2 forward primer <400> 270 cagggtttct cctccagcat cttccacat 29 <210> 271 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> HBG1/2 reverse primer <400> 271 agcagcagta tcctcttggg g 21 <210> 272 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> HBA primer <400> 272 tcctgcaggg tgaggaagga agg 23 <210> 273 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> HBA primer <400> 273 tctatgcaca tcaattagca gaggc 25 <210> 274 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> HBA primer <400> 274 ccccaaggca ctccagggac atag 24 <210> 275 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgBCL11Ae <400> 275 ttttatcaca ggctccagga agg 23 <210> 276 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgHBG <400> 276 cttgaccaat agccttgaca agg 23 <210> 277 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgHBG <400> 277 gctattggtc aaggcaaggc tgg 23 <210> 278 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> sgHBG <400> 278 gtggggaagg ggcccccaag agg 23 <210> 279 <211> 444 <212> DNA <213> Artificial Sequence <220> <223> dual base editing vector <400> 279 atggtgcatc tgactcctga ggagaagtct gccgttactg ccctgtgggg caaggtgaac 60 gtggatgaag ttggtggtga ggccctgggc aggctgctgg tggtctaccc ttggacccag 120 aggttctttg agtcctttgg ggatctgtcc actcctgatg ctgttatggg caaccctaag 180 gtgaaggctc atggcaagaa agtgctcggt gcctttagtg atggcctggc tcacctggac 240 aacctcaagg gcacctttgc cacactgagt gagctgcact gtgacaagct gcacgtggat 300 cctgagaact tcaggctcct gggcaacgtg ctggtctgtg tgctggccca tcactttggc 360 aaagaattca ccccaccagt gcaggctgcc tatcagaaag tggtggctgg tgtggctaat 420 gccctggccc acaagtatca ctaa 444 <210> 280 <211> 594 <212> DNA <213> Artificial Sequence <220> <223> TadA <220> <221> misc_feature <222> (15)..(15) <223> site for modification <220> <221> misc_feature <222> (57)..(57) <223> site for modification <220> <221> misc_feature <222> (63)..(63) <223> site for modification <220> <221> misc_feature <222> (69)..(69) <223> site for modification <220> <221> misc_feature <222> (87)..(87) <223> site for modification <220> <221> misc_feature <222> (112)..(112) <223> site for modification <220> <221> misc_feature <222> (114)..(114) <223> site for modification <220> <221> misc_feature <222> (126)..(126) <223> site for modification <220> <221> misc_feature <222> (147)..(147) <223> site for modification <220> <221> misc_feature <222> (198)..(198) <223> site for modification <220> <221> misc_feature <222> (216)..(216) <223> site for modification <220> <221> misc_feature <222> (289)..(289) <223> site for modification <220> <221> misc_feature <222> (318)..(318) <223> site for modification <220> <221> misc_feature <222> (333)..(333) <223> site for modification <220> <221> misc_feature <222> (343)..(343) <223> site for modification <220> <221> misc_feature <222> (344)..(344) <223> site for modification <220> <221> misc_feature <222> (369)..(369) <223> site for modification <220> <221> misc_feature <222> (402)..(402) <223> site for modification <220> <221> misc_feature <222> (451)..(451) <223> site for modification <220> <221> misc_feature <222> (507)..(507) <223> site for modification <220> <221> misc_feature <222> (547)..(547) <223> site for modification <220> <221> misc_feature <222> (548)..(548) <223> site for modification <220> <221> misc_feature <222> (568)..(568) <223> site for modification <220> <221> misc_feature <222> (569)..(569) <223> site for modification <220> <221> misc_feature <222> (570)..(570) <223> site for modification <400> 280 tctgaagtcg agtttagcca cgagtattgg atgaggcacg cactgaccct ggcaaagcga 60 gcatgggatg aaagagaagt ccccgtgggc gccgtgctgg tgcacaacaa tagagtgatc 120 ggagagggat ggaacaggcc aatcggccgc cacgacccta ccgcacacgc agagatcatg 180 gcactgaggc agggaggcct ggtcatgcag aattaccgcc tgatcgatgc caccctgtat 240 gtgacactgg agccatgcgt gatgtgcgca ggagcaatga tccacagcag gatcggaaga 300 gtggtgttcg gagcacggga cgccaagacc ggcgcagcag gctccctgat ggatgtgctg 360 caccaccccg gcatgaacca ccgggtggag atcacagagg gaatcctggc agacgagtgc 420 gccgccctgc tgagcgattt ctttagaatg cggagacagg agatcaaggc ccagaagaag 480 gcacagagct ccaccgactc tggaggatct agcggaggat cctctggaag cgagacacca 540 ggcacaagcg agtccgccac accagagagc tccggcggct cctccggagg atcc 594 <210> 281 <211> 594 <212> DNA <213> Artificial Sequence <220> <223> mutant TadA <220> <221> misc_feature <222> (321)..(321) <223> site for modification <220> <221> misc_feature <222> (330)..(330) <223> site for modification <220> <221> misc_feature <222> (345)..(345) <223> site for modification <220> <221> misc_feature <222> (382)..(382) <223> site for modification <220> <221> misc_feature <222> (384)..(384) <223> site for modification <220> <221> misc_feature <222> (465)..(465) <223> site for modification <220> <221> misc_feature <222> (498)..(498) <223> site for modification <220> <221> misc_feature <222> (499)..(499) <223> site for modification <220> <221> misc_feature <222> (500)..(500) <223> site for modification <220> <221> misc_feature <222> (501)..(501) <223> site for modification <220> <221> misc_feature <222> (504)..(504) <223> site for modification <220> <221> misc_feature <222> (516)..(516) <223> site for modification <220> <221> misc_feature <222> (537)..(537) <223> site for modification <220> <221> misc_feature <222> (592)..(592) <223> site for modification <220> <221> misc_feature <222> (593)..(593) <223> site for modification <220> <221> misc_feature <222> (594)..(594) <223> site for modification <400> 281 tctgaggtgg agttttccca cgagtactgg atgagacatg ccctgaccct ggccaagagg 60 gcacgcgatg agagggaggt gcctgtggga gccgtgctgg tgctgaacaa tagagtgatc 120 ggcgagggct ggaacagagc catcggcctg cacgacccaa cagcccatgc cgcaattatg 180 gccctgagac agggcggcct ggtcatgcag aactacagac tgattgacgc caccctgtac 240 gtgacattcg agccttgcgt gatgtgcgcc ggcgccatga tccactctag gatcggccgc 300 gtggtgtttg gcgtgaggaa cgcaaaaacc ggcgccgcag gctccctgat ggacgtgctg 360 cactaccccg gcatgaatca ccgcgtcgaa attaccgagg gaatcctggc agatgaatgt 420 gccgccctgc tgtgctattt ctttcggatg cctagacagg tgttcaatgc tcagaagaag 480 gcccagagct ccaccgactc cggaggatct agcggaggct cctctggctc tgagacacct 540 ggcacaagcg agagcgcaac acctgaaagc agcgggggca gcagcggggg gtca 594 <210> 282 <400> 282 000 <210> 283 <400> 283 000 <210> 284 <400> 284 000 <210> 285 <400> 285 000 <210> 286 <211> 32767 <212> DNA <213> Artificial Sequence <220> <223> WL-PS1 <220> <221> misc_feature <222> (2582)..(2759) <223> 1-->178 <220> <221> misc_feature <222> (2768)..(2801) <223> loxP <220> <221> misc_feature <222> (2808)..(2973) <223> 179-->344 <220> <221> misc_feature <222> (2974)..(3007) <223> loxP <220> <221> misc_feature <222> (3016)..(27338) <223> 3112-->27435 <220> <221> misc_feature <222> (27393)..(29862) <223> lambda-1 (Complementary) <220> <221> misc_feature <222> (30176)..(30390) <223> BGH polyA <220> <221> misc_feature <222> (30415)..(31080) <223> copGFP (Complementary) <220> <221> misc_feature <222> (31127)..(31779) <223> CMV (Complementary) <220> <221> misc_feature <222> (31831)..(33360) <223> lambda-2 <220> <221> misc_feature <222> (34752)..(35866) <223> Ad5E4orf6 <220> <221> misc_feature <222> (35864)..(37686) <223> 32972-->34794 <220> <221> misc_feature <222> (334221)..(34756) <223> 30544-->31879 <400> 286 taaacttggc gcgccctgag tgatttttct ctggtcccgc cgcatccata ccgccagttg 60 tttaccctca caacgttcca gtaaccgggc atgttcatca tcagtaaccc gtatcgtgag 120 catcctctct cgtttcatcg gtatcattac ccccatgaac agaaatcccc cttacacgga 180 ggcatcagtg accaaacagg aaaaaaccgc ccttaacatg gcccgcttta tcagaagcca 240 gacattaacg cttctggaga aactcaacga gctggacgcg gatgaacagg cagacatctg 300 tgaatcgctt cacgaccacg ctgatgagct ttaccgcagc tgcctcgcgc gtttcggtga 360 tgacggtgaa aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc 420 ggatgccggg agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg 480 cgcagccatg acccagtcac gtagcgatag cggagtgtat actggcttaa ctatgcggca 540 tcagagcaga ttgtactgag agtgcaccat atgcggtgtg aaataccgca cagatgcgta 600 aggagaaaat accgcatcag gcgctcttcc gcttcctcgc tcactgactc gctgcgctcg 660 gtcgttcggc tgcggcgagc ggtatcagct cactcaaagg cggtaatacg gttatccaca 720 gaatcagggg ataacgcagg aaagaacatg tgagcaaaag gccagcaaaa ggccaggaac 780 cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc gcccccctga cgagcatcac 840 aaaaatcgac gctcaagtca gaggtggcga aacccgacag gactataaag ataccaggcg 900 tttccccctg gaagctccct cgtgcgctct cctgttccga ccctgccgct taccggatac 960 ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc atagctcacg ctgtaggtat 1020 ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg tgcacgaacc ccccgttcag 1080 cccgaccgct gcgccttatc cggtaactat cgtcttgagt ccaacccggt aagacacgac 1140 ttatcgccac tggcagcagc cactggtaac aggattagca gagcgaggta tgtaggcggt 1200 gctacagagt tcttgaagtg gtggcctaac tacggctaca ctagaaggac agtatttggt 1260 atctgcgctc tgctgaagcc agttaccttc ggaaaaagag ttggtagctc ttgatccggc 1320 aaacaaacca ccgctggtag cggtggtttt tttgtttgca agcagcagat tacgcgcaga 1380 aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg ggtctgacgc tcagtggaac 1440 gaaaactcac gttaagggat tttggtcatg agattatcaa aaaggatctt cacctagatc 1500 cttttaaatt aaaaatgaag ttttaaatca atctaaagta tatatgagta aacttggtct 1560 gacagttacc aatgcttaat cagtgaggca cctatctcag cgatctgtct atttcgttca 1620 tccatagttg cctgactccc cgtcgtgtag ataactacga tacgggaggg cttaccatct 1680 ggccccagtg ctgcaatgat accgcgagac ccacgctcac cggctccaga tttatcagca 1740 ataaaccagc cagccggaag ggccgagcgc agaagtggtc ctgcaacttt atccgcctcc 1800 atccagtcta ttaattgttg ccgggaagct agagtaagta gttcgccagt taatagtttg 1860 cgcaacgttg ttgccattgc tgcaggcatc gtggtgtcac gctcgtcgtt tggtatggct 1920 tcattcagct ccggttccca acgatcaagg cgagttacat gatcccccat gttgtgcaaa 1980 aaagcggtta gctccttcgg tcctccgatc gttgtcagaa gtaagttggc cgcagtgtta 2040 tcactcatgg ttatggcagc actgcataat tctcttactg tcatgccatc cgtaagatgc 2100 ttttctgtga ctggtgagta ctcaaccaag tcattctgag aatagtgtat gcggcgaccg 2160 agttgctctt gcccggcgtc aacacgggat aataccgcgc cacatagcag aactttaaaa 2220 gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct caaggatctt accgctgttg 2280 agatccagtt cgatgtaacc cactcgtgca cccaactgat cttcagcatc ttttactttc 2340 accagcgttt ctgggtgagc aaaaacagga aggcaaaatg ccgcaaaaaa gggaataagg 2400 gcgacacgga aatgttgaat actcatactc ttcctttttc aatattattg aagcatttat 2460 cagggttatt gtctcatgag cggatacata tttgaatgta tttagaaaaa taaacaaata 2520 ggggttccgc gcacatttcc ccgaaaagtg ccacctgtct agctacgata tcctgtttaa 2580 acatcatcaa taatatacct tatagatgga atggtgccaa tatgtaaatg aggtgatttt 2640 aaaaagtgtg ggccgtgtgg tgattggctg tggggttaac ggttaaaagg ggcggcgcgg 2700 ccgtgggaaa atgacgtttt atgggggtgg agtttttttg caagttgtcg cgggaaatga 2760 tttaaatata acttcgtata gcatacatta tacgaagtta tggatcctta cgcataaaaa 2820 ggcttctttt ctcacggaac tacttagttt tcccacggta tttaacagga aatgaggtag 2880 ttttgaccgg atgcaagtga aaattgctga ttttcgcgcg aaaactgaat gaggaagtgt 2940 ttttctgaat aatgtggtat ttatggcagg gtgataactt cgtatagcat acattatacg 3000 aagttatatt taaataggaa tgtttatgcc ttaccagtgt aacatgaatc atgtgaaagt 3060 gttgttggaa ccagatgcct tttccagaat gagcctaaca ggaatctttg acatgaacac 3120 gcaaatctgg aagatcctga ggtatgatga tacgagatcg agggtgcgcg catgcgaatg 3180 cggaggcaag catgccaggt tccagccggt gtgtgtagat gtgaccgaag atctcagacc 3240 ggatcatttg gttattgccc gcactggagc agagttcgga tccagtggag aagaaactga 3300 ctaaggtgag tattgggaaa actttggggt gggattttca gatggacaga ttgagtaaaa 3360 atttgttttt tctgtcttgc agctgacatg agtggaaatg cttcttttaa ggggggagtc 3420 ttcagccctt atctgacagg gcgtctccca tcctgggcag gagttcgtca gaatgttatg 3480 ggatctactg tggatggaag acccgttcaa cccgccaatt cttcaacgct gacctatgct 3540 actttaagtt cttcaccttt ggacgcagct gcagccgctg ccgccgcctc tgtcgccgct 3600 aacactgtgc ttggaatggg ttactatgga agcatcgtgg ctaattccac ttcctctaat 3660 aacccttcta cactgactca ggacaagtta cttgtccttt tggcccagct ggaggctttg 3720 acccaacgtc tgggtgaact ttctcagcag gtggccgagt tgcgagtaca aactgagtct 3780 gctgtcggca cggcaaagtc taaataaaaa aaattccaga atcaatgaat aaataaacga 3840 gcttgttgtt gatttaaaat caagtgtttt tatttcattt ttcgcgcacg gtatgccctg 3900 gaccaccgat ctcgatcatt gagaactcgg tggatttttt ccagaatcct atagaggtgg 3960 gattgaatgt ttagatacat gggcattagg ccgtctttgg ggtggagata gctccattga 4020 agggattcat gctccggggt agtgttgtaa atcacccagt cataacaagg tcgcagtgca 4080 tggtgttgca caatatcttt tagaagtagg ctgattgcca cagataagcc cttggtgtag 4140 gtgtttacaa accggttgag ctgggagggg tgcattcgag gtgaaattat gtgcattttg 4200 gattggattt ttaagttggc aatattgccg ccaagatccc gtcttgggtt catgttatga 4260 aggactacca agacggtgta tccggtacat ttaggaaatt tatcgtgcag cttggatgga 4320 aaagcgtgga aaaatttgga gacacccttg tgtcctccga gattttccat gcactcatcc 4380 atgataatag caatggggcc gtgggcagcg gcgcgggcaa acacgttccg tgggtctgac 4440 acatcatagt tatgttcctg agttaaatca tcataagcca ttttaatgaa tttggggcgg 4500 agcgtaccag attggggtat gaatgttcct tcgggccccg gagcatagtt cccctcacag 4560 atttgcattt cccaagcttt cagttctgag ggtggaatca tgtccacctg gggggctatg 4620 aagaacaccg tttcgggggc gggggtgatt agttgggatg atagcaagtt tctgagcaat 4680 tgagatttgc cacatccggt ggggccataa ataattccga ttacaggttg caggtggtag 4740 tttagggaac ggcaactgcc gtcttctcga agcaaggggg ccacctcgtt catcatttcc 4800 cttacatgca tattttcccg caccaaatcc attaggaggc gctctcctcc tagtgataga 4860 agttcttgta gtgaggaaaa gtttttcagc ggttttagac cgtcagccat gggcattttg 4920 gaaagagttt gctgcaaaag ttctagtctg ttccacagtt cagtgatgtg ttctatggca 4980 tctcgatcca gcagacctcc tcgtttcgcg ggtttggacg gctcctggag tagggtatga 5040 gacgatgggc gtccagcgct gccagggttc ggtccttcca gggtctcagt gttcgagtca 5100 gggttgtttc cgtcacagtg aaggggtgtg cgcctgcttg ggcgcttgcc agggtgcgct 5160 tcagactcat tctgctggtg gagaacttct gtcgcttggc gccctgtatg tcggccaagt 5220 agcagtttac catgagttcg tagttgagcg cctcggctgc gtggcctttg gcgcggagct 5280 tacctttgga agttttcttg cataccgggc agtataggca tttcagcgca tacagcttgg 5340 gcgcaaggaa aatggattct ggggagtatg catccgcgcc gcaggaggcg caaacagttt 5400 cacattccac cagccaggtt aaatccggtt cattggggtc aaaaacaagt tttccgccat 5460 attttttgat gcgtttctta cctttggtct ccataagttc gtgtcctcgt tgagtgacaa 5520 acaggctgtc cgtatctccg tagactgatt ttacaggcct cttctccagt ggagtgcctc 5580 ggtcttcttc gtacaggaac tctgaccact ctgatacaaa ggcgcgcgtc caggccagca 5640 caaaggaggc tatgtgggag gggtagcgat cgttgtcaac cagggggtcc accttttcca 5700 aagtatgcaa acacatgtca ccctcttcaa catccaggaa tgtgattggc ttgtaggtgt 5760 atttcacgtg acctggggtc cccgctgggg gggtataaaa gggggcggtt ctttgctctt 5820 cctcactgtc ttccggatcg ctgtccagga acgtcagctg ttggggtagg tattccctct 5880 cgaaggcggg catgacctct gcactcaggt tgtcagtttc taagaacgag gaggatttga 5940 tattgacagt gccggttgag atgcctttca tgaggttttc gtccatttgg tcagaaaaca 6000 caattttttt attgtcaagt ttggtggcaa atgatccata cagggcgttg gataaaagtt 6060 tggcaatgga tcgcatggtt tggttctttt ccttgtccgc gcgctctttg gcggcgatgt 6120 tgagttggac atactcgcgt gccaggcact tccattcggg gaagatagtt gttaattcat 6180 ctggcacgat tctcacttgc caccctcgat tatgcaaggt aattaaatcc acactggtgg 6240 ccacctcgcc tcgaaggggt tcattggtcc aacagagcct acctcctttc ctagaacaga 6300 aagggggaag tgggtctagc ataagttcat cgggagggtc tgcatccatg gtaaagattc 6360 ccggaagtaa atccttatca aaatagctga tgggagtggg gtcatctaag gccatttgcc 6420 attctcgagc tgccagtgcg cgctcatatg ggttaagggg actgccccag ggcatgggat 6480 gggtgagagc agaggcatac atgccacaga tgtcatagac gtagatggga tcctcaaaga 6540 tgcctatgta ggttggatag catcgccccc ctctgatact tgctcgcaca tagtcatata 6600 gttcatgtga tggcgctagc agccccggac ccaagttggt gcgattgggt ttttctgttc 6660 tgtagacgat ctggcgaaag atggcgtgag aattggaaga gatggtgggt ctttgaaaaa 6720 tgttgaaatg ggcatgaggt agacctacag agtctctgac aaagtgggca taagattctt 6780 gaagcttggt taccagttcg gcggtgacaa gtacgtctag ggcgcagtag tcaagtgttt 6840 cttgaatgat gtcataacct ggttggtttt tcttttccca cagttcgcgg ttgagaaggt 6900 attcttcgcg atccttccag tactcttcta gcggaaaccc gtctttgtct gcacggtaag 6960 atcctagcat gtagaactga ttaactgcct tgtaagggca gcagcccttc tctacgggta 7020 gagagtatgc ttgagcagct tttcgtagcg aagcgtgagt aagggcaaag gtgtctctga 7080 ccatgacttt gagaaattgg tatttgaagt ccatgtcgtc acaggctccc tgttcccaga 7140 gttggaagtc tacccgtttc ttgtaggcgg ggttgggcaa agcgaaagta acatcattga 7200 agagaatctt accggctctg ggcataaaat tgcgagtgat gcggaaaggc tgtggtactt 7260 ccgctcgatt gttgatcacc tgggcagcta ggacgatttc gtcgaaaccg ttgatgttgt 7320 gtcctacgat gtataattct atgaaacgcg gcgtgcctct gacgtgaggt agcttactga 7380 gctcatcaaa ggttaggtct gtggggtcag ataaggcgta gtgttcgaga gcccattcgt 7440 gcaggtgagg atttgcatgt aggaatgatg accaaagatc taccgccagt gctgtttgta 7500 actggtcccg atactgacga aaatgccggc caattgccat tttttctgga gtgacacagt 7560 agaaggttct ggggtcttgt tgccatcgat cccacttgag tttaatggct agatcgtggg 7620 ccatgttgac gagacgctct tctcctgaga gtttcatgac cagcatgaaa ggaactagtt 7680 gtttgccaaa ggatcccatc caggtgtaag tttccacatc gtaggtcagg aagagtcttt 7740 ctgtgcgagg atgagagccg atcgggaaga actggatttc ctgccaccag ttggaggatt 7800 ggctgttgat gtgatggaag tagaagtttc tgcggcgcgc cgagcattcg tgtttgtgct 7860 tgtacagacg gccgcagtag tcgcagcgtt gcacgggttg tatctcgtga atgagctgta 7920 cctggcttcc cttgacgaga aatttcagtg ggaagccgag gcctggcgat tgtatctcgt 7980 gctcttctat attcgctgta tcggcctgtt catcttctgt ttcgatggtg gtcatgctga 8040 cgagcccccg cgggaggcaa gtccagacct cggcgcggga ggggcggagc tgaaggacga 8100 gagcgcgcag gctggagctg tccagagtcc tgagacgctg cggactcagg ttagtaggta 8160 gggacagaag attaacttgc atgatctttt ccagggcgtg cgggaggttc agatggtact 8220 tgatttccac aggttcgttt gtagagacgt caatggcttg cagggttccg tgtcctttgg 8280 gcgccactac cgtacctttg ttttttcttt tgatcggtgg tggctctctt gcttcttgca 8340 tgctcagaag cggtgacggg gacgcgcgcc gggcggcagc ggttgttccg gacccggggg 8400 catggctggt agtggcacgt cggcgccgcg cacgggcagg ttctggtatt gcgctctgag 8460 aagacttgcg tgcgccacca cgcgtcgatt gacgtcttgt atctgacgtc tctgggtgaa 8520 agctaccggc cccgtgagct tgaacctgaa agagagttca acagaatcaa tttcggtatc 8580 gttaacggca gcttgtctca gtatttcttg tacgtcacca gagttgtcct ggtaggcgat 8640 ctccgccatg aactgctcga tttcttcctc ctgaagatct ccgcgacccg ctctttcgac 8700 ggtggccgcg aggtcattgg agatacggcc catgagttgg gagaatgcat tcatgcccgc 8760 ctcgttccag acgcggctgt aaaccacggc cccctcggag tctcttgcgc gcatcaccac 8820 ctgagcgagg ttaagctcca cgtgtctggt taagaccgca tagttgcata ggcgctgaaa 8880 aaggtagttg agtgtggtgg caatgtgttc ggcgacgaag aaatacatga tccatcgtct 8940 cagcggcatt tcgctaacat cgcccagagc ttccaagcgc tccatggcct cgtagaagtc 9000 cacggcaaaa ttaaaaaact gggagtttcg cgcggacacg gtcaattcct cctcgagaag 9060 acggatgagt tcggctatgg tggcccgtac ttcgcgttcg aaggctcccg ggatctcttc 9120 ttcctcttct atctcttctt ccactaacat ctcttcttcg tcttcaggcg ggggcggagg 9180 gggcacgcgg cgacgtcgac ggcgcacggg caaacggtcg atgaatcgtt caatgacctc 9240 tccgcggcgg cggcgcatgg tttcagtgac ggcgcggccg ttctcgcgcg gtcgcagagt 9300 aaaaacaccg ccgcgcatct ccttaaagtg gtgactggga ggttctccgt ttgggaggga 9360 gagggcgctg attatacatt ttattaattg gcccgtaggg actgcgcgca gagatctgat 9420 cgtgtcaaga tccacgggat ctgaaaacct ttcgacgaaa gcgtctaacc agtcacagtc 9480 acaaggtagg ctgagtacgg cttcttgtgg gcgggggtgg ttatgtgttc ggtctgggtc 9540 ttctgtttct tcttcatctc gggaaggtga gacgatgctg ctggtgatga aattaaagta 9600 ggcagttcta agacggcgga tggtggcgag gagcaccagg tctttgggtc cggcttgctg 9660 gatacgcagg cgattggcca ttccccaagc attatcctga catctagcaa gatctttgta 9720 gtagtcttgc atgagccgtt ctacgggcac ttcttcctca cccgttctgc catgcatacg 9780 tgtgagtcca aatccgcgca ttggttgtac cagtgccaag tcagctacga ctctttcggc 9840 gaggatggct tgctgtactt gggtaagggt ggcttgaaag tcatcaaaat ccacaaagcg 9900 gtggtaagcc cctgtattaa tggtgtaagc acagttggcc atgactgacc agttaactgt 9960 ctggtgacca gggcgcacga gctcggtgta tttaaggcgc gaataggcgc gggtgtcaaa 10020 gatgtaatcg ttgcaggtgc gcaccagata ctggtaccct ataagaaaat gcggcggtgg 10080 ttggcggtag agaggccatc gttctgtagc tggagcgcca ggggcgaggt cttccaacat 10140 aaggcggtga tagccgtaga tgtacctgga catccaggtg attcctgcgg cggtagtaga 10200 agcccgagga aactcgcgta cgcggttcca aatgttgcgt agcggcatga agtagttcat 10260 tgtaggcacg gtttgaccag tgaggcgcgc gcagtcattg atgctctata gacacggaga 10320 aaatgaaagc gttcagcgac tcgactccgt agcctggagg aacgtgaacg ggttgggtcg 10380 cggtgtaccc cggttcgaga cttgtactcg agccggccgg agccgcggct aacgtggtat 10440 tggcactccc gtctcgaccc agcctacaaa aatccaggat acggaatcga gtcgttttgc 10500 tggtttccga atggcaggga agtgagtcct attttttttt ttttttgccg ctcagaatgc 10560 atcccgtgct gcgacagatg cgcccccaac aacagccccc ctcgcagcag cagcagcagc 10620 aaccacaaaa ggctgtccct gcaactactg caactgccgc cgtgagcggt gcgggacagc 10680 ccgcctatga tctggacttg gaagagggcg aaggactggc acgtctaggt gcgccttcgc 10740 ccgagcggca tccgcgagtt caactgaaaa aagattctcg cgaggcgtat gtgccccaac 10800 agaacctatt tagagacaga agcggcgagg agccggagga gatgcgagct tcccgcttta 10860 acgcgggtcg tgagctgcgt cacggtttgg accgaagacg agtgttgcga gacgaggatt 10920 tcgaagttga tgaagtgaca gggatcagtc ctgccagggc acacgtggct gcagccaacc 10980 ttgtatcggc ttacgagcag acagtaaagg aagagcgtaa cttccaaaag tcttttaata 11040 atcatgtgcg aaccctgatt gcccgcgaag aagttaccct tggtttgatg catttgtggg 11100 atttgatgga agctatcatt cagaacccta ctagcaaacc tctgaccgcc cagctgtttc 11160 tggtggtgca acacagcaga gacaatgagg ctttcagaga ggcgctgctg aacatcaccg 11220 aacccgaggg gagatggttg tatgatctta tcaacattct acagagtatc atagtgcagg 11280 agcggagcct gggcctggcc gagaaggtag ctgccatcaa ttactcggtt ttgagcttgg 11340 gaaaatatta cgctcgcaaa atctacaaga ctccatacgt tcccatagac aaggaggtga 11400 agatagatgg gttctacatg cgcatgacgc tcaaggtctt gaccctgagc gatgatcttg 11460 gggtgtatcg caatgacaga atgcatcgcg cggttagcgc cagcaggagg cgcgagttaa 11520 gcgacaggga actgatgcac agtttgcaaa gagctctgac tggagctgga accgagggtg 11580 agaattactt cgacatggga gctgacttgc agtggcagcc taatcgcagg gctctgagcg 11640 ccgcgacggc aggatgtgag cttccttaca tagaagaggc ggatgaaggc gaggaggaag 11700 agggcgagta cttggaagac tgatggcaca acccgtgttt tttgctagat ggaacagcaa 11760 gcaccggatc ccgcaatgcg ggcggcgctg cagagccagc cgtccggcat taactcctcg 11820 gacgattgga cccaggccat gcaacgtatc atggcgttga cgactcgcaa ccccgaagcc 11880 tttagacagc aaccccaggc caaccgtcta tcggccatca tggaagctgt agtgccttcc 11940 cgatctaatc ccactcatga gaaggtcctg gccatcgtga acgcgttggt ggagaacaaa 12000 gctattcgtc cagatgaggc cggactggta tacaacgctc tcttagaacg cgtggctcgc 12060 tacaacagta gcaatgtgca aaccaatttg gaccgtatga taacagatgt acgcgaagcc 12120 gtgtctcagc gcgaaaggtt ccagcgtgat gccaacctgg gttcgctggt ggcgttaaat 12180 gctttcttga gtactcagcc tgctaatgtg ccgcgtggtc aacaggatta tactaacttt 12240 ttaagtgctt tgagactgat ggtatcagaa gtacctcaga gcgaagtgta tcagtccggt 12300 cctgattact tctttcagac tagcagacag ggcttgcaga cggtaaatct gagccaagct 12360 tttaaaaacc ttaaaggttt gtggggagtg catgccccgg taggagaaag agcaaccgtg 12420 tctagcttgt taactccgaa ctcccgcctg ttattactgt tggtagctcc tttcaccgac 12480 agcggtagca tcgaccgtaa ttcctatttg ggttacctac taaacctgta tcgcgaagcc 12540 atagggcaaa gtcaggtgga cgagcagacc tatcaagaaa ttacccaagt cagtcgcgct 12600 ttgggacagg aagacactgg cagtttggaa gccactctga acttcttgct taccaatcgg 12660 tctcaaaaga tccctcctca atatgctctt actgcggagg aggagaggat ccttagatat 12720 gtgcagcaga gcgtgggatt gtttctgatg caagaggggg caactccgac tgcagcactg 12780 gacatgacag cgcgaaatat ggagcccagc atgtatgcca gtaaccgacc tttcattaac 12840 aaactgctgg actacttgca cagagctgcc gctatgaact ctgattattt caccaatgcc 12900 atcttaaacc cgcactggct gcccccacct ggtttctaca cgggcgaata tgacatgccc 12960 gaccctaatg acggatttct gtgggacgac gtggacagcg atgttttttc acctctttct 13020 gatcatcgca cgtggaaaaa ggaaggcggt gatagaatgc attcttctgc atcgctgtcc 13080 ggggtcatgg gtgctaccgc ggctgagccc gagtctgcaa gtccttttcc tagtctaccc 13140 ttttctctac acagtgtacg tagcagcgaa gtgggtagaa taagtcgccc gagtttaatg 13200 ggcgaagagg agtacctaaa cgattccttg ctcagaccgg caagagaaaa aaatttccca 13260 aacaatggaa tagaaagttt ggtggataaa atgagtagat ggaagactta tgctcaggat 13320 cacagagacg agcctgggat catggggact acaagtagag cgagccgtag acgccagcgc 13380 catgacagac agaggggtct tgtgtgggac gatgaggatt cggccgatga tagcagcgtg 13440 ttggacttgg gtgggagagg aaggggcaac ccgtttgctc atttgcgccc tcgcttgggt 13500 ggtatgttgt gaaaaaaaat aaaaaagaaa aactcaccaa ggccatggcg acgagcgtac 13560 gttcgttctt ctttattatc tgtgtctagt ataatgaggc gagtcgtgct aggcggagcg 13620 gtggtgtatc cggagggtcc tcctccttcg tacgagagcg tgatgcagca gcagcaggcg 13680 acggcggtga tgcaatcccc actggaggct ccctttgtgc ctccgcgata cctggcacct 13740 acggagggca gaaacagcat tcgttactcg gaactggcac ctcagtacga taccaccagg 13800 ttgtatctgg tggacaacaa gtcggcggac attgcttctc tgaactatca gaatgaccac 13860 agcaacttct tgaccacggt ggtgcagaac aatgacttta cccctacgga agccagcacc 13920 cagaccatta actttgatga acgatcgcgg tggggcggtc agctaaagac catcatgcat 13980 actaacatgc caaacgtgaa cgagtatatg tttagtaaca agttcaaagc gcgtgtgatg 14040 gtgtccagaa aacctcccga cggtgctgca gttggggata cttatgatca caagcaggat 14100 attttggaat atgagtggtt cgagtttact ttgccagaag gcaacttttc agttactatg 14160 actattgatt tgatgaacaa tgccatcata gataattact tgaaagtggg tagacagaat 14220 ggagtgcttg aaagtgacat tggtgttaag ttcgacacca ggaacttcaa gctgggatgg 14280 gatcccgaaa ccaagttgat catgcctgga gtgtatacgt atgaagcctt ccatcctgac 14340 attgtcttac tgcctggctg cggagtggat tttaccgaga gtcgtttgag caaccttctt 14400 ggtatcagaa aaaaacagcc atttcaagag ggttttaaga ttttgtatga agatttagaa 14460 ggtggtaata ttccggccct cttggatgta gatgcctatg agaacagtaa gaaagaacaa 14520 aaagccaaaa tagaagctgc tacagctgct gcagaagcta aggcaaacat agttgccagc 14580 gactctacaa gggttgctaa cgctggagag gtcagaggag acaattttgc gccaacacct 14640 gttccgactg cagaatcatt attggccgat gtgtctgaag gaacggacgt gaaactcact 14700 attcaacctg tagaaaaaga tagtaagaat agaagctata atgtgttgga agacaaaatc 14760 aacacagcct atcgcagttg gtatctttcg tacaattatg gcgatcccga aaaaggagtg 14820 cgttcctgga cattgctcac cacctcagat gtcacctgcg gagcagagca ggtttactgg 14880 tcgcttccag acatgatgaa ggatcctgtc actttccgct ccactagaca agtcagtaac 14940 taccctgtgg tgggtgcaga gcttatgccc gtcttctcaa agagcttcta caacgaacaa 15000 gctgtgtact cccagcagct ccgccagtcc acctcgctta cgcacgtctt caaccgcttt 15060 cctgagaacc agattttaat ccgtccgccg gcgcccacca ttaccaccgt cagtgaaaac 15120 gttcctgctc tcacagatca cgggaccctg ccgttgcgca gcagtatccg gggagtccaa 15180 cgtgtgaccg ttactgacgc cagacgccgc acctgtccct acgtgtacaa ggcactgggc 15240 atagtcgcac cgcgcgtcct ttcaagccgc actttctaaa aaaaaaatgt ccattcttat 15300 ctcgcccagt aataacaccg gttggggtct gcgcgctcca agcaagatgt acggaggcgc 15360 acgcaaacgt tctacccaac atcccgtgcg tgttcgcgga cattttcgcg ctccatgggg 15420 tgccctcaag ggccgcactc gcgttcgaac caccgtcgat gatgtaatcg atcaggtggt 15480 tgccgacgcc cgtaattata ctcctactgc gcctacatct actgtggatg cagttattga 15540 cagtgtagtg gctgacgctc gcaactatgc tcgacgtaag agccggcgaa ggcgcattgc 15600 cagacgccac cgagctacca ctgccatgcg agccgcaaga gctctgctac gaagagctag 15660 acgcgtgggg cgaagagcca tgcttagggc ggccagacgt gcagcttcgg gcgccagcgc 15720 cggcaggtcc cgcaggcaag cagccgctgt cgcagcggcg actattgccg acatggccca 15780 atcgcgaaga ggcaatgtat actgggtgcg tgacgctgcc accggtcaac gtgtacccgt 15840 gcgcacccgt ccccctcgca cttagaagat actgagcagt ctccgatgtt gtgtcccagc 15900 ggcgaggatg tccaagcgca aatacaagga agaaatgctg caggttatcg cacctgaagt 15960 ctacggccaa ccgttgaagg atgaaaaaaa accccgcaaa atcaagcggg ttaaaaagga 16020 caaaaaagaa gaggaagatg gcgatgatgg gctggcggag tttgtgcgcg agtttgcccc 16080 acggcgacgc gtgcaatggc gtgggcgcaa agttcgacat gtgttgagac ctggaacttc 16140 ggtggtcttt acacccggcg agcgttcaag cgctactttt aagcgttcct atgatgaggt 16200 gtacggggat gatgatattc ttgagcaggc ggctgaccga ttaggcgagt ttgcttatgg 16260 caagcgtagt agaataactt ccaaggatga gacagtgtca atacccttgg atcatggaaa 16320 tcccacccct agtcttaaac cggtcacttt gcagcaagtg ttacccgtaa ctccgcgaac 16380 aggtgttaaa cgcgaaggtg aagatttgta tcccactatg caactgatgg tacccaaacg 16440 ccagaagttg gaggacgttt tggagaaagt aaaagtggat ccagatattc aacctgaggt 16500 taaagtgaga cccattaagc aggtagcgcc tggtctgggg gtacaaactg tagacattaa 16560 gattcccact gaaagtatgg aagtgcaaac tgaacccgca aagcctactg ccacctccac 16620 tgaagtgcaa acggatccat ggatgcccat gcctattaca actgacgccg ccggtcccac 16680 tcgaagatcc cgacgaaagt acggtccagc aagtctgttg atgcccaatt atgttgtaca 16740 cccatctatt attcctactc ctggttaccg aggcactcgc tactatcgca gccgaaacag 16800 tacctcccgc cgtcgccgca agacacctgc aaatcgcagt cgtcgccgta gacgcacaag 16860 caaaccgact cccggcgccc tggtgcggca agtgtaccgc aatggtagtg cggaaccttt 16920 gacactgccg cgtgcgcgtt accatccgag tatcatcact taatcaatgt tgccgctgcc 16980 tccttgcaga tatggccctc acttgtcgcc ttcgcgttcc catcactggt taccgaggaa 17040 gaaactcgcg ccgtagaaga gggatgttgg gacgcggaat gcgacgctac aggcgacggc 17100 gtgctatccg caagcaattg cggggtggtt ttttaccagc cttaattcca attatcgctg 17160 ctgcaattgg cgcgatacca ggcatagctt ccgtggcggt tcaggcctcg caacgacatt 17220 gacattggaa aaaaaacgta taaataaaaa aaaatacaat ggactctgac actcctggtc 17280 ctgtgactat gttttcttag agatggaaga catcaatttt tcatccttgg ctccgcgaca 17340 cggcacgaag ccgtacatgg gcacctggag cgacatcggc acgagccaac tgaacggggg 17400 cgccttcaat tggagcagta tctggagcgg gcttaaaaat tttggctcaa ccataaaaac 17460 atacgggaac aaagcttgga acagcagtac aggacaggcg cttagaaata aacttaaaga 17520 ccagaacttc caacaaaaag tagtcgatgg gatagcttcc ggcatcaatg gagtggtaga 17580 tttggctaac caggctgtgc agaaaaagat aaacagtcgt ttggacccgc cgccagcaac 17640 cccaggtgaa atgcaagtgg aggaagaaat tcctccgcca gaaaaacgag gcgacaagcg 17700 tccgcgtccc gatttggaag agacgctggt gacgcgcgta gatgaaccgc cttcttatga 17760 ggaagcaacg aagcttggaa tgcccaccac tagaccgata gccccaatgg ccaccggggt 17820 gatgaaacct tctcagttgc atcgacccgt caccttggat ttgccccctc cccctgctgc 17880 tactgctgta cccgcttcta agcctgtcgc tgccccgaaa ccagtcgccg tagccaggtc 17940 acgtcccggg ggcgctcctc gtccaaatgc gcactggcaa aatactctga acagcatcgt 18000 gggtctaggc gtgcaaagtg taaaacgccg tcgctgcttt taattaaata tggagtagcg 18060 cttaacttgc ctatctgtgt atatgtgtca ttacacgccg tcacagcagc agaggaaaaa 18120 aggaagaggt cgtgcgtcga cgctgagtta ctttcaagat ggccacccca tcgatgctgc 18180 cccaatgggc atacatgcac atcgccggac aggatgcttc ggagtacctg agtccgggtc 18240 tggtgcagtt cgcccgcgcc acagacacct acttcaatct gggaaataag tttagaaatc 18300 ccaccgtagc gccgacccac gatgtgacca ccgaccgtag ccagcggctc atgttgcgct 18360 tcgtgcccgt tgaccgggag gacaatacat actcttacaa agtgcggtac accctggccg 18420 tgggcgacaa cagagtgctg gatatggcca gcacgttctt tgacattagg ggcgtgttgg 18480 acagaggtcc cagtttcaaa ccctattctg gtacggctta caactctctg gctcctaaag 18540 gcgctccaaa tgcatctcaa tggattgcaa aaggcgtacc aactgcagca gccgcaggca 18600 atggtgaaga agaacatgaa acagaggaga aaactgctac ttacactttt gccaatgctc 18660 ctgtaaaagc cgaggctcaa attacaaaag agggcttacc aataggtttg gagatttcag 18720 ctgaaaacga atctaaaccc atctatgcag ataaacttta tcagccagaa cctcaagtgg 18780 gagatgaaac ttggactgac ctagacggaa aaaccgaaga gtatggaggc agggctctaa 18840 agcctactac taacatgaaa ccctgttacg ggtcctatgc gaagcctact aatttaaaag 18900 gtggtcaggc aaaaccgaaa aactcggaac cgtcgagtga aaaaattgaa tatgatattg 18960 acatggaatt ttttgataac tcatcgcaaa gaacaaactt cagtcctaaa attgtcatgt 19020 atgcagaaaa tgtaggtttg gaaacgccag acactcatgt agtgtacaaa cctggaacag 19080 aagacacaag ttccgaagct aatttgggac aacagtctat gcccaacaga cccaactaca 19140 ttggcttcag agataacttt attggactca tgtactataa cagtactggt aacatggggg 19200 tgctggctgg tcaagcgtct cagttaaatg cagtggttga cttgcaggac agaaacacag 19260 aactttctta ccaactcttg cttgactctc tgggcgacag aaccagatac tttagcatgt 19320 ggaatcaggc tgtggacagt tatgatcctg atgtacgtgt tattgaaaat catggtgtgg 19380 aagatgaact tcccaactat tgttttccac tggacggcat aggtgttcca acaaccagtt 19440 acaaatcaat agttccaaat ggagaagata ataataattg gaaagaacct gaagtaaatg 19500 gaacaagtga gatcggacag ggtaatttgt ttgccatgga aattaacctt caagccaatc 19560 tatggcgaag tttcctttat tccaatgtgg ctctgtatct cccagactcg tacaaataca 19620 ccccgtccaa tgtcactctt ccagaaaaca aaaacaccta cgactacatg aacgggcggg 19680 tggtgccgcc atctctagta gacacctatg tgaacattgg tgccaggtgg tctctggatg 19740 ccatggacaa tgtcaaccca ttcaaccacc accgtaacgc tggcttgcgt taccgatcta 19800 tgcttctggg taacggacgt tatgtgcctt tccacataca agtgcctcaa aaattcttcg 19860 ctgttaaaaa cctgctgctt ctcccaggct cctacactta tgagtggaac tttaggaagg 19920 atgtgaacat ggttctacag agttccctcg gtaacgacct gcgggtagat ggcgccagca 19980 tcagtttcac gagcatcaac ctctatgcta cttttttccc catggctcac aacaccgctt 20040 ccacccttga agccatgctg cggaatgaca ccaatgatca gtcattcaac gactacctat 20100 ctgcagctaa catgctctac cccattcctg ccaatgcaac caatattccc atttccattc 20160 cttctcgcaa ctgggcggct ttcagaggct ggtcatttac cagactgaaa accaaagaaa 20220 ctccctcttt ggggtctgga tttgacccct actttgtcta ttctggttct attccctacc 20280 tggatggtac cttctacctg aaccacactt ttaagaaggt ttccatcatg tttgactctt 20340 cagtgagctg gcctggaaat gacaggttac tatctcctaa cgaatttgaa ataaagcgca 20400 ctgtggatgg cgaaggctac aacgtagccc aatgcaacat gaccaaagac tggttcttgg 20460 tacagatgct cgccaactac aacatcggct atcagggctt ctacattcca gaaggataca 20520 aagatcgcat gtattcattt ttcagaaact tccagcccat gagcaggcag gtggttgatg 20580 aggtcaatta caaagacttc aaggccgtcg ccatacccta ccaacacaac aactctggct 20640 ttgtgggtta catggctccg accatgcgcc aaggtcaacc ctatcccgct aactatccct 20700 atccactcat tggaacaact gccgtaaata gtgttacgca gaaaaagttc ttgtgtgaca 20760 gaaccatgtg gcgcataccg ttctcgagca acttcatgtc tatgggggcc cttacagact 20820 tgggacagaa tatgctctat gccaactcag ctcatgctct ggacatgacc tttgaggtgg 20880 atcccatgga tgagcccacc ctgctttatc ttctcttcga agttttcgac gtggtcagag 20940 tgcatcagcc acaccgcggc atcatcgagg cagtctacct gcgtacaccg ttctcggccg 21000 gtaacgctac cacgtaagaa gcttcttgct tcttgcaaat agcagctgca accatggcct 21060 gcggatccca aaacggctcc agcgagcaag agctcagagc cattgtccaa gacctgggtt 21120 gcggacccta ttttttggga acctacgata agcgcttccc ggggttcatg gcccccgata 21180 agctcgcctg tgccattgta aatacggccg gacgtgagac ggggggagag cactggttgg 21240 ctttcggttg gaacccacgt tctaacacct gctacctttt tgatcctttt ggattctcgg 21300 atgatcgtct caaacagatt taccagtttg aatatgaggg tctcctgcgc cgcagcgctc 21360 ttgctaccaa ggaccgctgt attacgctgg aaaaatctac ccagaccgtg cagggccccc 21420 gttctgccgc ctgcggactt ttctgctgca tgttccttca cgcctttgtg cactggcctg 21480 accgtcccat ggacggaaac cccaccatga aattgctaac tggagtgcca aacaacatgc 21540 ttcattctcc taaagtccag cccaccctgt gtgacaatca aaaagcactc taccattttc 21600 ttaataccca ttcgccttat tttcgctctc atcgtacaca catcgaaagg gccactgcgt 21660 tcgaccgtat ggatgttcaa taatgactca tgtaaacaac gtgttcaata aacatcactt 21720 tattttttta catgtatcaa ggctctggat tacttattta tttacaagtc gaatgggttc 21780 tgacgagaat cagaatgacc cgcaggcagt gatacgttgc ggaactgata cttgggttgc 21840 cacttgaatt cgggaatcac caacttggga accggtatat cgggcaggat gtcactccac 21900 agctttctgg tcagctgcaa agctccaagc aggtcaggag ccgaaatctt gaaatcacaa 21960 ttaggaccag tgctctgagc gcgagagttg cggtacaccg gattgcagca ctgaaacacc 22020 atcagcgacg gatgtctcac gcttgccagc acggtgggat ctgcaatcat gcccacatcc 22080 agatcttcag cattggcaat gctgaacggg gtcatcttgc aggtctgcct acccatggcg 22140 ggcacccaat taggcttgtg gttgcaatcg cagtgcaggg ggatcagtat catcttggcc 22200 tgatcctgtc tgattcctgg atacacggct ctcatgaaag catcatattg cttgaaagcc 22260 tgctgggctt tactaccctc gggataaaac atcccgcagg acctgctcga aaactggtta 22320 gcctgcacag ccggcatcat tcacacagca gcgggcgtca ttgttggcta tttgcaccac 22380 acttctgccc cagcggtttt gggtgatttt ggttcgctcg ggattctcct ttaaggctcg 22440 ttgtccgttc tcgctggcca catccatctc gataatctgc tccttctgaa tcataatatt 22500 gccatgcagg cacttcagct tgccctcata atcattgcag ccatgaggcc acaacgcaca 22560 gcctgtacat tcccaattat ggtgggcgat ctgagaaaaa gaatgtatca ttccctgcag 22620 aaatcttccc atcatcgtgc tcagtgtctt gtgactagtg aaagttaact ggatgcctcg 22680 gtgctcttcg tttacgtact ggtgacagat gcgcttgtat tgttcgtgtt gctcaggcat 22740 tagtttaaaa caggttctaa gttcgttatc cagcctgtac ttctccatca gcagacacat 22800 cacttccatg cctttctccc aagcagacac caggggcaag ctaatcggat tcttaacagt 22860 gcaggcagca gctcctttag ccagagggtc atctttagcg atcttctcaa tgcttctttt 22920 gccatccttc tcaacgatgc gcacgggcgg gtagctgaaa cccactgcta caagttgcgc 22980 ctcttctctt tcttcttcgc tgtcttgact gatgtcttgc atggggatat gtttggtctt 23040 ccttggcttc tttttggggg gtatcggagg aggaggactg tcgctccgtt ccggagacag 23100 ggaggattgt gacgtttcgc tcaccattac caactgactg tcggtagaag aacctgaccc 23160 cacacggcga caggtgtttt tcttcggggg cagaggtgga ggcgattgcg aagggctgcg 23220 gtccgacctg gaaggcggat gactggcaga accccttccg cgttcggggg tgtgctccct 23280 gtggcggtcg cttaactgat ttccttcgcg gctggccatt gtgttctcct aggcagagaa 23340 acaacagaca tggaaactca gccattgctg tcaacatcgc cacgagtgcc atcacatctc 23400 gtcctcagcg acgaggaaaa ggagcagagc ttaagcattc caccgcccag tcctgccacc 23460 acctctaccc tagaagataa ggaggtcgac gcatctcatg acatgcagaa taaaaaagcg 23520 aaagagtctg agacagacat cgagcaagac ccgggctatg tgacaccggt ggaacacgag 23580 gaagagttga aacgctttct agagagagag gatgaaaact gcccaaaaca gcgagcagat 23640 aactatcacc aagatgctgg aaatagggat cagaacaccg actacctcat agggcttgac 23700 ggggaagacg cgctccttaa acatctagca agacagtcgc tcatagtcaa ggatgcatta 23760 ttggacagaa ctgaagtgcc catcagtgtg gaagagctca gctgcgccta cgagcttaac 23820 cttttttcac ctcgtactcc ccccaaacgt cagccaaacg gcacctgcga gccaaatcct 23880 cgcttaaact tttatccagc ttttgctgtg ccagaagtac tggctaccta tcacatcttt 23940 tttaaaaatc aaaaaattcc agtctcctgc cgcgctaatc gcacccgcgc cgatgcccta 24000 ctcaatctgg gacctggttc acgcttacct gatatagctt ccttggaaga ggttccaaag 24060 atcttcgagg gtctgggcaa taatgagact cgggccgcaa atgctctgca aaagggagaa 24120 aatggcatgg atgagcatca cagcgttctg gtggaattgg aaggcgataa tgccagactc 24180 gcagtactca agcgaagcgt cgaggtcaca cacttcgcat atcccgctgt caacctgccc 24240 cctaaagtca tgacggcggt catggaccag ttactcatta agcgcgcaag tcccctttca 24300 gaagacatgc atgacccaga tgcctgtgat gagggtaaac cagtggtcag tgatgagcag 24360 ctaacccgat ggctgggcac cgactctccc cgggatttgg aagagcgtcg caagcttatg 24420 atggccgtgg tgctggttac cgtagaacta gagtgtctcc gacgtttctt taccgattca 24480 gaaaccttgc gcaaactcga agagaatctg cactacactt ttagacacgg ctttgtgcgg 24540 caggcatgca agatatctaa cgtggaactc accaacctgg tttcctacat gggtattctg 24600 catgagaatc gcctaggaca aagcgtgctg cacagcaccc ttaaggggga agcccgccgt 24660 gattacatcc gcgattgtgt ctatctctac ctgtgccaca cgtggcaaac cggcatgggt 24720 gtatggcagc aatgtttaga agaacagaac ttgaaagagc ttgacaagct cttacagaaa 24780 tctcttaagg ttctgtggac agggttcgac gagcgcaccg tcgcttccga cctggcagac 24840 ctcatcttcc cagagcgtct cagggttact ttgcgaaacg gattgcctga ctttatgagc 24900 cagagcatgc ttaacaattt tcgctctttc atcctggaac gctccggtat cctgcccgcc 24960 acctgctgcg cactgccctc cgactttgtg cctctcacct accgcgagtg ccccccgccg 25020 ctatggagtc actgctacct gttccgtctg gccaactatc tctcctacca ctcggatgtg 25080 atcgaggatg tgagcggaga cggcttgctg gagtgccact gccgctgcaa tctgtgcacg 25140 ccccaccggt ccctagcttg caacccccag ttgatgagcg aaacccagat aataggcacc 25200 tttgaattgc aaggccccag cagccaaggc gatgggtctt ctcctgggca aagtttaaaa 25260 ctgaccccgg gactgtggac ctccgcctac ttgcgcaagt ttgctccgga agattaccac 25320 ccctatgaaa tcaagttcta tgaggaccaa tcacagcctc caaaggccga actttcggct 25380 tgcgtcatca cccagggggc aattctggcc caattgcaag ccatccaaaa atcccgccaa 25440 gaatttctac tgaaaaaggg taagggggtc taccttgacc cccagaccgg cgaggaactc 25500 aacacaaggt tccctcagga tgtcccaacg acgagaaaac aagaagttga aggtgcagcc 25560 gccgccccca gaagatatgg aggaagattg ggacagtcag gcagaggagg cggaggagga 25620 cagtctggag gacagtctgg aggaagacag tttggaggag gaaaacgagg aggcagagga 25680 ggtggaagaa gtaaccgccg acaaacagtt atcctcggct gcggagacaa gcaacagcgc 25740 taccatctcc gctccgagtc gaggaacccg gcggcgtccc agcagtagat gggacgagac 25800 cggacgcttc ccgaacccaa ccagcgcttc caagaccggt aagaaggatc ggcagggata 25860 caagtcctgg cgggggcata agaatgccat catctcctgc ttgcatgagt gcgggggcaa 25920 catatccttc acgcggcgct acttgctatt ccaccatggg gtgaactttc cgcgcaatgt 25980 tttgcattac taccgtcacc tccacagccc ctactatagc cagcaaatcc cgacagtctc 26040 gacagataaa gacagcggcg gcgacctcca acagaaaacc agcagcggca gttagaaaat 26100 acacaacaag tgcagcaaca ggaggattaa agattacagc caacgagcca gcgcaaaccc 26160 gagagttaag aaatcggatc tttccaaccc tgtatgccat cttccagcag agtcggggtc 26220 aagagcagga actgaaaata aaaaaccgat ctctgcgttc gctcaccaga agttgtttgt 26280 atcacaagag cgaagatcaa cttcagcgca ctctcgagga cgccgaggct ctcttcaaca 26340 agtactgcgc gctgactctt aaagagtagg cagcgaccgc gcttattcaa aaaaggcggg 26400 aattacatca tcctcgacat gagtaaagaa attcccacgc cttacatgtg gagttatcaa 26460 ccccaaatgg gattggcagc aggcgcctcc caggactact ccacccgcat gaattggctc 26520 agcgccgggc cttctatgat ttctcgagtt aatgatatac gcgcctaccg aaaccaaata 26580 cttttggaac agtcagctct taccaccacg ccccgccaac accttaatcc cagaaattgg 26640 cccgccgccc tagtgtacca ggaaagtccc gctcccacca ctgtattact tcctcgagac 26700 gcccaggccg aagtccaaat gactaatgca ggtgcgcagt tagctggcgg ctccacccta 26760 tgtcgtcaca ggcctcggca taatataaaa cgcctgatga tcagaggccg aggtatccag 26820 ctcaacgacg agtcggtgag ctctccgctt ggtctacgac cagacggaat ctttcagatt 26880 gccggctgcg ggagatcttc cttcacccct cgtcaggctg ttctgacttt ggaaagttcg 26940 tcttcgcaac cccgctcggg cggaatcggg accgttcaat ttgtagagga gtttactccc 27000 tctgtctact tcaacccctt ctccggatct cctgggcact acccggacga gttcataccg 27060 aacttcgacg cgattagcga gtcagtggac ggctacgatt gatgtctggt gacgcggctg 27120 agctatctcg gctgcgacat ctagaccact gccgccgctt tcgctgcttt gcccgggaac 27180 ttattgagtt catctacttc gaactcccca aggatcaccc tcaaggtccg gcccacggag 27240 tgcggattac tatcgaaggc aaaatagact ctcgcctgca acgaattttc tcccagcggc 27300 ccgtgctgat cgagcgagac cagggaaaca ccacggttag taatcaatta cggggtcatt 27360 agttcatagc ccatatatgg agttgcgatc gctgcgggcc atgtcataca ccgccttcag 27420 agcagccgga cctatctgcc cgttcgtgcc gtcgttgtta atcaccacat ggttattctg 27480 ctcaaacgtc ccggacgcct gcgaccggct gtctgccatg ctgcccggtg taccgacata 27540 accgccggtg gcatagccgc gcatcagccg gtaaagattc cccacgccaa tccggctggt 27600 tgcctccttc gtgaagacaa actcaccacg gtgaacaatc cccgctggct catatttgcc 27660 gccggttccc gtaaatcctc cggttgcaaa atggaatttc gccgcagcgg cctgaatggc 27720 tgtaccgcct gacgcggatg cgccgccacc aacagccccg ccaatggcgc tgccgatact 27780 cccgacaatc cccaccattg cctgcttaag cagaatttct gtcatcatgg acagcacgga 27840 acgggtgaag ctgcgccagt tctgctcact gccggtcagc atcgccgcca tattctgtgc 27900 aataccatca aaggtctgcg tggctgcact ttttacctgc gacatactgt ccgtggcgct 27960 ctcttcccac tcactccagc cggacttcag gcctgccatc cagttcccgc gaagctggtc 28020 ttcagccgcc caggtctttt tctgctctga catgacgtta ttcagcgcca gcggattatc 28080 gccatactgt tccttcaggc gctgttccgt ggcttcccgt tctgcctgcc ggtcagtcag 28140 cccccggctt ttcgcatcaa tggcggcccg ttttgcccgt tgctgctgtg cgaatttatc 28200 cgcctgctgc gccagcgcgt tcaggcgctc ctgatacgta accttgtcgc caagtgcagc 28260 cagctggcgt ttgtactcca gcgtctcatc tttatgcgcc agcagggatt tctcctgtgc 28320 agacagctgg cgacgttgcg ccgcctcctc cagtaccgcg aactgactct ccgccttcca 28380 caaatcccgg cgctgctggc tgattttctc atttgctccg gcatgcttct ccagcgtccg 28440 gagttctgcc tgaagcgtca gcagggcagc atgagcactg tcttcctgac gatcgcccgc 28500 agacaccttc acgctggact gtttcggctt tttcagcgtc gcttcataat cctttttcgc 28560 cgccgccatc agcgtgttgt aatccgcctg caggattttc ccgtctttca gtgccttgtt 28620 cagttcttcc tgacgggcgg tatatttctc cagcggcgtc tgcagccgtt cgtaagcctt 28680 ctgcgcctct tcggtatatt tcagccgtga cgcttcggta tcgctctgct gctgcgcatt 28740 tttgtcctgt tgagtctgct gctcagcctt ctttcgggcg gcttcaagcg caagacgggc 28800 cttttcacga tcatcccagt aacgcgcccg cgcttcatcg ttaacaaaat aatcatcctt 28860 gcgcagattc cagatgtcgt ctgctttctt atacgcagcc tctgccttaa tcagcatctc 28920 ctgcgcggta tcaggacgac caatatccag caccgcatcc cacatggatt tgaatgcccg 28980 cgcagtcctg tctgcccagg tctccagcgt gcccatgttc tctttcaggc ggcgggtctg 29040 gtcatcaaac cctttcgttg cggcctcgtt cgccgcctgc aatgccccgg cttcatcgcc 29100 ggaacgctgc aactgagcaa catacgcaat ctgctccgcc gacacgttat ggaactggcg 29160 agccatcgcc gtcagccccg acgtcgggtc tgtggtcagc ttcccgaagg cttcagcgac 29220 cttgtccacc tccacgccgg atgcagagga gaaacgcgcc acactctggc tgatggacgc 29280 aatctgagcc tcaccgctta cccccgcctt aaccagtgcg ctgagtgact cgctggtctg 29340 gttaaacgtc agccctgccg cctgcccggc tctggacagg accagcatac gatctgccgt 29400 cagtcccgcc tgattgccgg aaaggaccag cgttttgttg aaatcggaca gggttgagtt 29460 gccctgatac caggcatacg ccagcgcacc ggtcgccacc gccagcgagg tggcccccac 29520 catcggcagg gtgatcgcac cggcaagccc cctgaacatg gggatcatcc cgccgaagga 29580 gtccttcacc tgccccccct gttgcagcag gatcagccac ggactttgcc cgcctgcaag 29640 ctgcgtggcc acgtcggtga actgtgcagg cagcatacgc atggcggctt tatactgccc 29700 gacggaaatc cccgctttct gtgcagccag cgcctgtcgg ctcagcgact gttcaacgac 29760 tgccgctgtt tttttcgcat cactttccgt accagaaaaa tgacgcctga ctctggccat 29820 ctgctcgtca aatctggccg catccagact caaatcaacg acgtcgacta agctctagca 29880 tttgtgaacc atcaccctaa tcaagttttt tggggtcgag gtgccgtaaa gcactaaatc 29940 ggaaccctaa agggagcccc cgatttagag cttgacgggg aaagccggcg aacgtggcga 30000 gaaaggaagg gaagaaagcg aaaggagcgg gcgctagggc gctggcaagt gtagcggtca 30060 cgctgcgcgt aaccaccaca cccgccgcgc ttaatgcgcc gctacagggc gcgtggggat 30120 accccctaga gccccagctg gttctttccg cctcagaagc catagagccc accgcatccc 30180 cagcatgcct gctattgtct tcccaatcct cccccttgct gtcctgcccc accccacccc 30240 ccagaataga atgacaccta ctcagacaat gcgatgcaat ttcctcattt tattaggaaa 30300 ggacagtggg agtggcacct tccagggtca aggaaggcac gggggagggg caaacaacag 30360 atggctggca actagaaggc acagtcgagg ctgatcagcg ggtttgctag cttaggcgaa 30420 ggcgatgggg gtcttgaagg cgtgctggta ctccacgatg cccagctcgg tgttgctgtg 30480 cagctcctcc acgcggcgga aggcgaacat ggggcccccg ttctgcagga tgctggggtg 30540 gatggcgctc ttgaagtgca tgtggctgtc caccacgaag ctgtagtagc cgccgtcgcg 30600 caggctgaag gtgcgggcga agctgcccac cagcacgtta tcgcccatgg ggtgcaggtg 30660 ctccacggtg gcgttgctgc ggatgatctt gtcggtgaag atcacgctgt cctcggggaa 30720 gccggtgccc accaccttga agtcgccgat cacgcggccg gcctcgtagc ggtagctgaa 30780 gctcacgtgc agcacgccgc cgtcctcgta cttctcgatg cgggtgttgg tgtagccgcc 30840 gttgttgatg gcgtgcagga aggggttctc gtagccgctg gggtaggtgc cgaagtggta 30900 gaagccgtag cccatcacgt ggctcagcag gtaggggctg aaggtcaggg cgcctttggt 30960 gctcttcatc ttgttggtca tgcggccctg ctcgggggtg ccctctccgc cgcccaccag 31020 ctcgaactcc acgccgttca gggtgccggt gatgcggcac tcgatcttca tggcgggcat 31080 ggtggctagc ctagccagct tgggtctccc tatagtgagt cgtattaatt tcgataagcc 31140 agtaagcagt gggttctcta gttagccaga gagctctgct tatatagacc tcccaccgta 31200 cacgcctacc gcccatttgc gtcaatgggg cggagttgtt acgacatttt ggaaagtccc 31260 gttgattttg gtgccaaaac aaactcccat tgacgtcaat ggggtggaga cttggaaatc 31320 cccgtgagtc aaaccgctat ccacgcccat tgatgtactg ccaaaaccgc atcaccatgg 31380 taatagcgat gactaatacg tagatgtact gccaagtagg aaagtcccat aaggtcatgt 31440 actgggcata atgccaggcg ggccatttac cgtcattgac gtcaataggg ggcgtacttg 31500 gcatatgata cacttgatgt actgccaagt gggcagttta ccgtaaatac tccacccatt 31560 gacgtcaatg gaaagtccct attggcgtta ctatgggaac atacgtcatt attgacgtca 31620 atgggcgggg gtcgttgggc ggtcagccag gcgggccatt taccgtaagt tatgtaacgc 31680 ggaactccat atatgggcta tgaactaatg accccgtaat tgattactat taataactac 31740 aataatcaat gtcaacgcgt atatctggcc cgtacatcgc gaagcagcgc aaaacgccta 31800 accctaagca gattcttcat gcaattaagc ttcgcggtgc ttcttcagta cgctacggca 31860 aatgtcatcg acgtttttat ccggaaactg ctgtctggct ttttttgatt tcagaattag 31920 cctgacgggc aatgctgcga agggcgtttt cctgctgagg tgtcattgaa caagtcccat 31980 gtcggcaagc ataagcacac agaatatgaa gcccgctgcc agaaaaatgc attccgtggt 32040 tgtcatacct ggtttctctc atctgcttct gctttcgcca ccatcatttc cagcttttgt 32100 gaaagggatg cggctaacgt atgaaattct tcgtctgttt ctactggtat tggcacaaac 32160 ctgattccaa tttgagcaag gctatgtgcc atctcgatac tcgttcttaa ctcaacagaa 32220 gatgctttgt gcatacagcc cctcgtttat tatttatctc ctcagccagc cgctgtgctt 32280 tcagtggatt tcggataaca gaaaggccgg gaaataccca gcctcgcttt gtaacggagt 32340 agacgaaagt gattgcgcct acccggatat tatcgtgagg atgcgtcatc gccattgctc 32400 cccaaataca aaaccaattt cagccagtgc ctcgtccatt ttttcgatga actccggcac 32460 gatctcgtca aaactcgcca tgtacttttc atcccgctca atcacgacat aatgcaggcc 32520 ttcacgcttc atacgcgggt catagttggc aaagtaccag gcattttttc gcgtcaccca 32580 catgctgtac tgcacctggg ccatgtaagc tgactttatg gcctcgaaac caccgagccg 32640 gaacttcatg aaatcccggg aggtaaacgg gcatttcagt tcaaggccgt tgccgtcact 32700 gcataaacca tcgggagagc aggcggtacg catactttcg tcgcgataga tgatcgggga 32760 ttcagta 32767 <210> 287 <211> 3030 <212> DNA <213> Homo sapiens <400> 287 ccaggctcca ttattgatat agtcatgatc tcctctgttg gggatgaagt aggcaaattt 60 gaggcactaa tttacttctc acattctttt cttgaacaga aagatagaac tggaaattaa 120 tagtagtata taaattcaaa attttagctt taataacatt taatcagaca taaataatta 180 tggtaatgtg aatttcaata aataaatttt agttctaata taagtgtaac tgtgtaatat 240 tcatactttt tctgaaggct ttactaattt gatatggcat tactttttta ttgctgccaa 300 aactattctt attccactgt gtggtgatga gaaagtgaga gatgttctgg agatggtgat 360 tatagatagc ttccctgaag ccatagtaac cccctggaga aaaattggac ctggagtcta 420 gcagcctagg tatgggtact cgatttctta gaaagccttt acaatttcct ttatcttaaa 480 aataagggta ttgaagtaga attctagaat tttcagagga caacttaaaa tatgtgtaat 540 agttttaatt atttatcctc ataaatttaa ctgttcattt taatatattt aaggatgaat 600 tttttaaaaa gttgatttca taaaaacggg aatagaaaga tggttccata ggctgactga 660 gagtgtagag gagggatggg aagggaaaga agttgatctt cagttagact agaggaataa 720 gttttagtga tctctcacac tgcatagtga acacagttaa taatatatta tgtatttaaa 780 ttaaaaattg ctaaaaaata aatattttat gttctcacca caaaaaaagt tggaaggtga 840 ttcatatgct aattagcttg atagactctc tctacaatgt atatatagat caaacatcac 900 attgtatccc ataacatatt atatatatta tatatttata ttatatatta ttattgtatc 960 cattaatata tgcacttatt atttgccagg caaataaaaa atgtttttaa aatataaatt 1020 tatttgtaac ctccttttac ttttctgctt ggttttcttc tttcattcag tgtttaccag 1080 tttcttatag ttaattttat tttaagctgt ctcacatttt ctgaagaaaa gggaacatat 1140 taaagccaac aaaacaaata cactatcttg catgagatga tttatgtcat ggtacaatca 1200 aatgctataa atcttataaa aacttctcaa atggttagat ggctacagtt gaacagatgg 1260 accatgtcat atatttttta taatgcttct aaggtatggc taatttttaa aaaatatttt 1320 agtaatgatg ggaatattat ttatagaaat cttataaaat atataatgaa atatgtaata 1380 aagtctagat aaatgtgtat atacataata tatatttatt acataatata taatatataa 1440 tgtatattta tatattacat gcattatata ttaaatataa tacattttat atattatata 1500 ttaaaatatg taataatatg ttattaaata tatacaataa tctattacat tttatgctta 1560 tataatatat aataaatata tagtatataa taaatataca ctatatattt gtatctatat 1620 atgtttataa agtcattcct ctaattaggt cataaccatt caggtaaact ggaaatttaa 1680 gcctacttca ggtttgtggt aaatagattc tctctgaact agcatattca gaatcattaa 1740 acagtcagtt ctttggacaa gtcttataga atgttcttac ctcttcagcc atcccaagac 1800 tcttgagggc ctgacctcgc ttacactaaa gcagatctgc cttatgcatc actgaagtag 1860 ggagggaaga aagtttgatg aactacttct gacccctagt ggtgtccaga aaagaccatt 1920 aaaggaatga cctttaaagg atggacatac aattttttgt ccaaggcagg acatgtgtgg 1980 gtgtctttca gtaattatgt tctaagaaca gcaaaaactc cactgccttg gcaaatagga 2040 atgttttagt tctatagaat tataaagaag ctgtctttta aacacaatat actttctcta 2100 tgtctttgga acaatgacta ttggtcatta ccctatttta aagtaagcaa gtaatcacac 2160 agggaattat tctgaaaaga cagaaaaaaa aaaaaaacca agagatttct gcatatgtag 2220 gtcagtttta atcagagggc atcagaaaag actcctgaaa gaatgacctg gttattataa 2280 tcacagattt gctttccaag tcaacattcc agacagtgct cagaggggat acgaaaaccc 2340 ttttatttct ccagactcaa attcactgct atttgtcttc tctatttatt ttattatagg 2400 cattgttctg gttgctggga actcagactg agataccata cactgactct cagatagcat 2460 aacacaacat gatgtcttgg aaaactgtaa atctttttgt tttttaaata caggtggagc 2520 atctggcaca cctgacatat tgatcttgtt tttctttaaa tcttcattta tttaccttat 2580 caaaactatg ctctttcatc ctacctttca aaacatattt taaaaaatcc tccaacatgt 2640 attttgctct ggtaatccca aaaggctgat agtctctatg gtggcaacat ggataatact 2700 gttccccatc tagatggtct catttcttct gtatctagtc tgaagaagcc tgaatgaaag 2760 tagattttta agctttgtag ctagtctgaa gcctttgtag tcagtctgaa gaaacctgca 2820 tgaaaataga tttttttttt cctttgggac agagtcttgc tctgtcgccc agactggagt 2880 gcaatggcgc gatctcggct cactgcaact tccacctccc aggatcaagc aattctcctg 2940 cctcagtctc ccaagtaact gggattacag gagcacactg ccatgcccag ctaattattt 3000 tttgtgtttt agtagagaca gggtttcacc 3030 <210> 288 <211> 29986 <212> DNA <213> Artificial Sequence <220> <223> HDAd35-T4-Ef1a-mgmt-mCherry <220> <221> misc_feature <222> (1)..(481) <223> Ad35 5'end <220> <221> misc_feature <222> (14126)..(14159) <223> FRT (Complementary) <220> <221> misc_feature <222> (14220)..(14463) <223> pT4 LIR <220> <221> misc_feature <222> (14478)..(15812) <223> Ef1a promoter <220> <221> misc_feature <222> (15830)..(16450) <223> mgmt <220> <221> misc_feature <222> (16451)..(16522) <223> 2A <220> <221> misc_feature <222> (16526)..(17230) <223> mCherry <220> <221> misc_feature <222> (17259)..(17380) <223> SV40 pA <220> <221> misc_feature <222> (17491)..(17756) <223> pT4 RIR <220> <221> misc_feature <222> (17863)..(17896) <223> FRT (Complementary) <220> <221> misc_feature <222> (29579)..(29986) <223> Ad35 3'end <400> 288 catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60 aaaagtgtgg gccgtgtggt gattggctgt ggggttaacg gttaaaaggg gcggcgcggc 120 cgtgggaaaa tgacgtttta tgggggtgga gtttttttgc aagttgtcgc gggaaatgtt 180 acgcataaaa aggcttcttt tctcacggaa ctacttagtt ttcccacggt atttaacagg 240 aaatgaggta gttttgaccg gatgcaagtg aaaattgctg attttcgcgc gaaaactgaa 300 tgaggaagtg tttttctgaa taatgtggta tttatggcag ggtggagtat ttgttcaggg 360 ccaggtagac tttgacccat tacgtggagg tttcgattac cgtgtttttt acctgaattt 420 ccgcgtaccg tgtcaaagtc ttctgttttt acgtaggtgt cagctgatcg ctagggtatt 480 taccggtatt caaggattac atgagcttag aaatgtaatt agcatagtgt gtggcatagt 540 gtagatacca aataaatatg atctctcctt ctactcttga aaatgcaaac acattcttgg 600 tggtcctaaa atagcctgta acatggttta ctcagcagca tttgctattc aaggcagatc 660 tgcctttagt cattggctgc gctcctgaac agctgtgtga aaggctaact tttgtaaacc 720 aaatcaaaat aaaatgcagc aaaaatttgt cactgaaagg aaatcctcag tatatccttt 780 tatgaaatga aagatccctc atccaaactt aactttttta aaagtgcgca tttggagata 840 tagccctttc ttatgaatcc taattcaatt ttggccataa acacacgttg atgttcccca 900 ccccaaagca catagcaaca agagtaggtt ctatattgaa aataatgaca atttaaaaac 960 atgtacttat ttcactgtat gtggacagtg tctatgattg catcatgaag tgtcatataa 1020 ccatgtacgt gtacatgaga gagagataga gagagaagtg gtagggtggt ggtggtagag 1080 gggatggcga tagtaatcat ggtaatggta gaggtgatgg aggtggtaat gacggaggta 1140 agggtggtag tgatgatggt ggtggtggta atggtggtgg atgtggtggt ggcaattggg 1200 atggtgggat ggtggtagcc atggtgatgg tggtaatggt gttgatttaa agggtggtgg 1260 tagtgaaggt gagggtagtg gtggtggagg tggtggtgct ggtagcaata gtgatggtgg 1320 tgatggtgtt gatgagggtg ttgggatcag ggtgagttcc cacagtatat ttcattcttg 1380 ttgtaccact ctgtcaacag caccactgac tgggacagag gaagaaggca cactctgaat 1440 gtgttattaa cagaaacctc aaaacagtct gtctccttgt agtcattcaa aattatcttt 1500 ttcttacctg gaaaactgaa actgaattac cgggaaaaac acaggagatt tttgtttgtt 1560 aatatgctgc caataaagta attttatgtc aaatttaact acaggaaagg gcaaggcatt 1620 ttctaagttc cttagatgtc atgtggctaa aaaaaacaaa aggatggaca gcagttagat 1680 actgtacact tagctgtttg aagccatata ttcagaaagc agatgttggg agttggtgtt 1740 tgaggactga tttcctggag gtattttata taggccaagt tcattgttct aaactctaag 1800 ggcttgactt gagggaggaa aagaggcaag aacatgttta gttttgctga cagcatcaca 1860 tgggcagccc taaggctaga caactttagg gcctgaagct tattctagga aagaagcacc 1920 tacagagtgg cactgggctc ccctccacta tagagatgaa gtcatatgac agtaaagggc 1980 aggcagggct gcctaggggg cccagaactg acacttccat tagaatgagc acaggccagg 2040 gagagaagtg gggaaccaga gagaaggagc tggaattcta gtaggacaaa cggtaagtga 2100 acaacaagaa caagttaaga gtgtgtgcag tattctttca aagactgaaa aaatagtgat 2160 gtgatagaat ggcaggtggc tctgagcagg ccaggagaag gactgggggc agagcatccc 2220 aggcaggagg gcagcaagtg ggaaggccct ggggtggggc ttttggactg ttccagtgac 2280 gggcaggcag ccagtgtgcc tgtcacacaa tgcaccaggg aagtagtcgt gaatttgcag 2340 agggtcttgc aggctatggg aaagggattg gattgtattt tgtttgtagg gaagccatcg 2400 ggggacttaa gcagaggaag gattggcttc atctctttga aaaagttctc tctggatgct 2460 gatgggagga gaaatggaag gaaaagaaac acttttaggg gcaagaactt ttgagaaggg 2520 tggaattggg agtgtggagt tggggccagc tttggcacag gaggggaagc taaacacgtg 2580 gccgcatgag ggcctgtaat tctacctgaa atgggtacca tttgttaggg taaacaaatg 2640 aaccaaatgc ccagtgatac agaccaagtg ttggcaaact tcttctgtga tggcccaggt 2700 agtaaatgtc tcaggcttcg caggccatgt ggtctctgtt gaagctctgt gtagtagaca 2760 atatgttaat gactgggcgt gactgtgtgc taataaaagt ttatttacaa aaacagcccg 2820 tgggctggat ttagctcaca ggctgtagtt tgccaacctc tgacctagag catgaactga 2880 gcatcttctt ggagggaaat aagttctttc caagttgccc tcctcacatt gcagggggcc 2940 atgtaggccc attattcaca gaagagtggg tgggcaacct ttctggagca gaaaaacgta 3000 aagatttctt ccgtagtgca agtaaggtga ccatttctaa accgtgcaag tgatccagca 3060 gtcccaaaag ttgtttcact tctcattgtg cgcccgttct caggtgctcc gaagcttcca 3120 gtcctttgta gggacatgga tgaaattgga aatcatcatt ctcagtaaac tatcgcaaga 3180 acaaaaaacc aaacaccgca tattctcact cataggtggg aattgaacaa tgagatcaca 3240 tggacacggg aaggggaaca tcacattctg gggactgttg tggggtgggg ggagggggga 3300 gggatagcat tgggagatat acctaatgct agatgacaag ttagtgggtg cagcgcacca 3360 gtgtggcaca tgtatacata tgtaactaac ctgcacaatg tgcacatgta ccctaaaact 3420 taaagtataa taataaaaga aaaaaaaaaa gagaggagag aaacatcatc ccctccagga 3480 tacccttggg ccttgttctt atagtcttgt acattgttga acaatttgca tgggctagtg 3540 gattaaagca caccctccac cctcaggccc tcaagggtct ctatgataat acagtctcac 3600 cttctaccct ttccatcacc atcctaggtg ctatggccaa ccttgaggct gccatgttag 3660 gtctatgcat ttcccacctc caccacataa ctctctgaag gccaggtagt ttcctattca 3720 tcttggtaac cccaaagcct cgtgacaggg ctcagctggc atctgcggat gtgaatgaac 3780 cattggagaa aatggtactc tgcaaataac tctgttattt tcccatttcc tgtgtaaggc 3840 ctagagacaa tgacttttta attgcacccc ttcccctctg tatgacactg gccttctctt 3900 gtgtccagca atgtgggtgg cctagatgat ttctaaggga cttctggcca agatgaacag 3960 cagctgcatc ttactgagca tttactatgt gccatatact cagccacagc tctaggggca 4020 tagaagcagg agctctcagg gtcagggcag tgagtgagca agcgagcacc tatgccagcc 4080 ctgcctctgg atggggactt gagagggtga tggaagcctg cagcactgga gggaggcaga 4140 caaagacagg cctgtgctga gggggcccgg agcaagagag agggaggcaa tgacagcaga 4200 gacatgcctg cgccttgggt ttgagtgccc agtggtcaaa tccacttccc tgtggctgat 4260 gcttgccttt ctaactttgg aatttagggg ttggagatct ggtgagaagg taggagggag 4320 atgaggagga gaagggaaag gcaggaagga aggggaggga aaggaaaagc aaaaggggag 4380 gaggaaggtt tccaacaaat tattctatat caactgcgga aatcaaaatt tgttgcccaa 4440 atcttagaag ctcatgtccc tcctccccag aagtctggaa tgcagcactc caggggtagc 4500 ttataaccca aatatctatc tgtaaaaaga gaaacattgg gctttcgagc tgtggattct 4560 cagtaaaagc aagaggcctc agcctacaca ggccagccca gagtttgagg aaccccaggc 4620 ccacacccac agggctggcc cctgggtctg catactccct agaaatgtgc acacttctga 4680 gcctcaactc tgtcctggag tctaacagca tccctctcct tcctggggca gttccacctc 4740 cagaaacctg ttaccttggg ccttatgtca aggaaactgt gggaaagagc taggcaggaa 4800 tgcagatgag gccagcatgg gctcctaaaa gtttagaaat aggcagtgtc atgctcccag 4860 gtgcctgcat aaaccagctg aaaaatggag ctcccctcac cagcactctc ccttcaaaca 4920 gactgtgatt tgcaggtcac tggtttacca agccaggcta cccaggcagg acccagatgc 4980 caagcccagt ggtgtcctgc aagctgagca gtgctcagtt cttgcaaaaa aaggtctgtg 5040 tgaaggcaag gcctctgcct ggcttctcac cccagttggg tgtctggaac aggaaggagc 5100 ccttactgca gaaaaaggag gagggagcaa agggagcgaa cagctgcgtg ctccatgggg 5160 aggatcccca aagtagaaag gcgcatacac actgcagccc ttgacccaga atgctcacag 5220 ctacattaca gattcaggtc tcctcagtgt agtggggctg ctgatgagac tgtggcatcc 5280 tcaggggtca ggacacacat tttccatcac tcttctgatg gcaaaaaacc tctgagccaa 5340 tgccaacctc tgatcattaa aaaaaagtgc tcacagcagt gtgtggttta ggatcatgcc 5400 ctgtgtggtt tggaacacgt gcacaaccac accttgttca tcaccatccc agaaaccctg 5460 acgcaggcaa agagcagagt tattaaccct actttactga tgtggatact gaggcccaga 5520 ggctcatgca agttatcaat aagtggcagg gacagttgcc tctagattaa ctagccccta 5580 ggatcacctg ggtcttggaa ggggacccat aaacatgagc tcccctctct tggggccaga 5640 tttgcacctg tgccgcgcct tcagcctgca tgaagtaggg gctgctggca aagactcaaa 5700 gctgtaaatc tgggttttct cttgaggctt ctaagggagc tgtttcgaca actcactctg 5760 ttcccagctg gctgcccctg catagggttt taaagcagcc tagctttctg ccaggcttgg 5820 cagtggacaa cgctggtcag aacatcccag agagctacca gaatgaagta agtttgcttc 5880 tactctttac ctgtttatgg gctgtctctg ccactggaat gaaaggcact gagaacagtg 5940 cctggcctgc agaaggccct ggaaatacct gagctcctaa tctgggaata ggagtaggaa 6000 gagctttgga ggcagggcac ctgagtttga gatctacaac ttcctgcctg tgtgacattg 6060 ggaaagtctc catcctttct gagcctcagt ctccaccctg gggaagtgga aatatcaatc 6120 tctgtgacac agaagcaaat gagcgaatgt gcacaaagta ccttgcacaa gagagacgct 6180 caaacacttg cctccaggtt tcaccgagaa ctacagagta agatagattt gttcccagtg 6240 gaggaagcct gggaataatt tgcccctaga ctatgaattc ctggggctca agatcgagca 6300 cagggccagg cacacagaag ggaccctgga aatgtggcag gaggccagag atagacaggc 6360 ccttagagct catacccatg ccctctgacc tcaagaagaa agaaacctgc tcaaaatctc 6420 acaaagagct tgttccaacc ctgaatcgag tctgaggact ccttcctgag tccagcactt 6480 tttctgcaag aagtatatgc ctccaaagct gatgggcgca aatcttgaac cccgtcacat 6540 aaacacaaag ggaggaggtg actagagctc ctcctactgg atatgtctaa ggtcaccagt 6600 ctaaagaaaa gggatggata gaatgaggcc agtatttttg cagccatcca aatgtccaca 6660 tacgctgtta cactgagggc tcctctctcc cccgtcttca gccctacttg catttagagg 6720 tgagaaagat atgggctgag gggttgtttt tcatcgtatt gtagatggaa agcacactgc 6780 ccttggggcc atccaaatgt ggaccttgat gtagcacccc accttctgga tggccatcct 6840 tctgaaagtc actgaatttc tcagacttta ttctctttat ccataaagaa ggagaataat 6900 aataatcccc ccaccctgcc caaccactga ctggttggga agctcagaag aaatactggg 6960 cacggcatcc cattgtaatc tatagagtga gtcgcttctt aatattaaat ggctgaacac 7020 agaagatgtg caaaaagtac tgtgtcccct tcctcctcca actgaacatt tcatgccctt 7080 tgcaccctca ttttgtctag gagctgcctt atgaagggaa taggtacctg ctccgagctg 7140 gaggaatctt tgccacttat ggtggggtat ggactgagac agagatggca tgtgacatgc 7200 gcactgagtc tcaactccat gcaggctctg gagcactctc aaattggagt actaatgcct 7260 tttaaattct cacactagca atcctttgac ctactgatct agggatctag ggaaagaatc 7320 gtgatcttaa cttcaaaggg aaggacaaaa tgttctgcct cctgttaaaa ctccatacac 7380 taagtgcaga gactggatgc cttattaacc ttgggtagat gcccaaatgt tcaaaaggtc 7440 aaactcttct gttccccaga tcgccagagt cattaaccag tcacactatt aaatgaatga 7500 acagatgctg aaaaggtact tgcattactg agatttctta tggtgatggc ccctgcctga 7560 tatgtattca gcattttgta gttttcaatg tgcattagag tatagtggtg atgacattgg 7620 cctctgagtt tgccacttct tatatctgtg actttggtca aattgcttaa tctctctgag 7680 tctcggtttc ctggagataa taatagcttc ttcttcccag ggttatcatg aggattacag 7740 gagataatgc cccaaaaatg cttagtaaag tgcctagcac ctagtcaatg ctgaattaaa 7800 ggtggttatt cttacttttc gttcatttga actttgttct cagggagggc aaaggataga 7860 caaagcccca tagctagtga ggagtagctg caagactaga acccaggtgt tctgagccct 7920 agtcttaggc caagaacaac tgttacgtga gatgcacgtt ttccttcaag ggagctcaca 7980 attatttcca tgtaaattca aggactgcta aaagagaact ctcctctggg actgatatca 8040 ttttatttca agattgattt gaaacatgtt ttttgtttgt ttgtttgttt tctaggaaag 8100 aacaagagaa ccagttaagc tgaatgcctg aagcaaatcc ctgttagcga tgttttcagg 8160 atgagggaga gtggtgcaag aaacgtgctt ccagatgcac atggtttcct gggactaggg 8220 ttcagggtgt catccctggg tgttattaag tgtcagaagg agagcaaaca agggaaacat 8280 ctgagatcca gctaaggcta caccctggaa atgcaagccc agctcttgca aaggacctcc 8340 tttggccact caccttccag gccttacaat aacttgtttg gactgcaggt ttcttggtgg 8400 actcacaggc cattctgctt ttatttggtc aacctcagtt cacaagcacc cagatgctga 8460 gatcctcagc atgtgcagca gagtttcata ttagcactgg gtacctttct gaggctacag 8520 ggataccgta cagcagcacc tgtcacgtcc agccaaagga gtgggctctc tcaatgtcat 8580 ccaatgctgt ttcaactgtg aagaagacca tctgagagag ttgcttttgg aggctgaggc 8640 aaatttttaa aattctttgt tctcctcaac tggggtgaat tcttggtctt ctaggacagc 8700 ttgaagtttt agaaagagtc aagccactca gaaccaacag agaactcttt cagagaacaa 8760 ggtgtggcat agaggaggca gagggctgat cttgatcaaa tccaaagtgt gactctaaag 8820 caatgaatgt gaatttttgg caaagcttac aaagggctct aaaggccatc tgcaaagaga 8880 agccaagcct gatcgatgaa tcactagtgc ggccggatat cgatcggcac gctgttgatt 8940 ttctcatagt aaggaacagt gggccctttc agtcccactt ctgtagtctg tggtactaca 9000 aatggtgagc ccatgatgtt gccattcata gggttattct ccagcagtaa tgactggcca 9060 gccactccca tagccgcggg gctaggattt attgtcaatg gagggacctg cagttctgca 9120 caagcagtac taggatgagc acctgggccc attgcaaggg tgacatcttc aaggcaaggc 9180 ctcttaattt tattagggta gcccccatca gccatgtctg gaaactggaa gtggtcttct 9240 tcttgtctcc tcttaacagt tccctgtgaa tggaagagaa gagaggagga gaagagagga 9300 gaggagaagg gaagagaggt gacacacaca cacacacaca cacacacaca cacagagaga 9360 gagagagaga gacagagaga aagagagaga gagagagaga ggaattttta taaaggtttg 9420 gcacattaaa gctaatgaac aggaaatgtg catgataaaa cagacctctc agtttaaaga 9480 cttatagttg tgaaaactat aaaatacagc ctgtctttgg aaccatagtg cttatttatt 9540 cattattatg tttcatctaa actgtctaat tacatttcaa ataaggcatt atgttgtctg 9600 tatactaaaa cgggatagaa cgttattcaa agggtaatct gcccacttca aggagagttc 9660 aacaaaacta tgcagaagtc actaaatgaa ccatgctgcc aaaggcaggc attggagaga 9720 aaactagaag tagctaaata gttttaattc tttcctgtct acagacacat agattttaac 9780 gaaggaatac catagtatag aattgaactt ttaggctgcc ttctagtctt ggttaaatgc 9840 atcaggctgc agtggtaaaa ttgaatacaa cagagccctt acaggaaaga agtagatctg 9900 gatgtgtttt cttggggagc tgtttaaaat actgtttttg ggaaagcaca agtttcagaa 9960 cagtcattgt aggcatcgta ttcattgttc catttatttt tacacacaca cacacacaca 10020 cacacacaca cactctcaca cattgctatg tgtacacaaa aataatttgg aagaacctat 10080 acccaacaat ttggagtggt catttatttg ggatgactgg caattccctt tctattctct 10140 tcatttctgc ttgtttgtct ttaacgagaa cgactcataa tccaaaaatt taaaaaagta 10200 taaagttatc taaataagaa attttcctct gaagatgcat cctcaggttg gggagatatt 10260 aaacaatgag aaaaggcccc aatctgggat ctgaaccttg ggggagctgc ccatcattta 10320 tagaagcaca gcctttggga acaaagcaaa gtcactagca atgtgagact tcctactctt 10380 catggcttca tacagtcatc catcgctgtt gtgttaatga ccatgacctg tatgttagca 10440 ggtaaatggg aaaggaagtg ggggcaaagg agtatgtgca ggaatgatca aaataaggaa 10500 aggaagagag ggatctggaa atcacctgaa tgccgatagg tgaacaggta gaattctttt 10560 aaagcttccc ccacccggta ccccccaaat aacccctttc cagctttgga agtttcacta 10620 ggacatacag tgctcatcct ctgatgtcac cttaagtttg gctcttctgg tttgatgagc 10680 ttgtagccca ctaggagctc aaggcatgca tggggccact tgccagcacg atgaggggca 10740 tgactgtcat ggccaagtga acatcaaagc agatccccag ggctgtatgt ctcaggcctt 10800 ggtgcacatc agaatcactt agaaacatcc acattcctgg gccctcccac cacaaactga 10860 cagcttcatc cagggtgtgg cccaggcatc gggagttttt ccaacagctc catggctgat 10920 tctcaacaga aaaccactgg cccagagcaa gggtggaggc agcgtggcat agggctctga 10980 ccttggcctt gccactgaac ctctcagagc cccagtttct ttatgtgtaa aatgagtgta 11040 attatagttc ttttctcatg aaggtgctct gactattaag tgaaacgggg cacattgtat 11100 gacacctaat agctcctcac taactggtac ccggcattat aaagggcagg tatggaaggg 11160 ttctgggagt ccaataccct tcttaaagac agagaggtct ctgagaccca gagaggggca 11220 ggccttaccc agagttgctc agccagaggg caacaaggcc caggtcagat gcagggcccc 11280 tccaccacca ctcagctgcc tccagaccca ctgccttcgc catgttgttg gtaggacact 11340 gcatcgcccc cacagaaggg gcttgccaac ttgagtgaga ggacttgcac acttctttga 11400 cttttctttt gagatgccca caatctgaac aagggcactt caagggacag ctctgtcacc 11460 aaactcatct gaggcctgaa taccatgggt caggcaggaa tgggttggag aggtgtagag 11520 caggcacaat aagagggctg aggcccatgc agtcatcagt gcccactttc ccaggagtct 11580 gactgggcac agcacccata gtgtccctga gctggtccat ggagcagctc actaactgtt 11640 tggcccacag caggtgctca gtaaatggca gttgaacgaa tcaatggaca aaggaacata 11700 aattacccaa cacacaggga gctcagccat ttactcaatc cattatggag taacctacaa 11760 acaagccact gggtcccaaa ctgaaattgt gtctcttcta cattctccca aagaatccaa 11820 taggttaaaa atagaaatgt atgaaataga tcaatcaggg atgattgcat gtggatttga 11880 cataaggatc ccctgcaggg agtctgagct ggcaacagtc aggcccaaag tgctgtccat 11940 gatgtctcga actgcaagac agttttaaca atggcgaagc aatgcagaac caggcaggcc 12000 aaggaggggg tgggggttgg ggaaaggaag ggagggaagg ggctgtgagg ggcaatggtc 12060 tggcatccct gccacgtgag cctctgaaat ttgctggcag cttctatggg ctcccagagc 12120 tttcacttaa ttgttggtct gccactaacc tgctgggagt aaggtgcagg gatggaggag 12180 gcagggcatg accaccagac actaaaggta ccagctgggg ccactggcaa agggaaggag 12240 gctgcacctc tcctacatga gagcccgtat acacacacct tttccagcac tcatcaactg 12300 catcccaagc aaatggtccc tgatcaattc caattctaga aaccaactga ctactcaata 12360 acaaagtaga tcccagcagg ccgccactgc tggagcggat gccacttttg ctatgccaag 12420 tctgtggctg gacagctgct ggcatgtaca ctcactgact ttcataagga tgcctaataa 12480 agggggcagg ctcacctggc ttttctcagg ggtggggttt ggggtgccga tagaggctgc 12540 tgttttggca gagtggcaag ctgcaagcct cttctgagct ttcatttttc aatggacttc 12600 agtgagaatt cactttgtca gaggccatgc agctccatgt tttggatttc atggaatgag 12660 ctttcaacag tgagcctgaa gtgccctggc tgaacagcaa gaacaccagc caaccctaaa 12720 caaggccgag gagaggcggc tgtgtttaca cggaaggctc agccttgctg taatagcgtc 12780 tgccttcacc agacatcagt gaggcgtgga aatctattat ccagttaatt ttgcccctag 12840 ataaagactt gctttcgtgt cttctctttc acagtcccat gatctgttac tcatctcaac 12900 tgcgagaagt tggctgggct ttcccctgtg cccagtgcca cactcgtgcc ttcactgggt 12960 cacctgtgcc tgtggctgat gccgctgagg ttttgcctgc ccagactggg tgtttctgac 13020 taaatcccac agccaccatt ttagatcaag ggcaggagat agctcactgc tccggaatga 13080 cctcccctcc cagaatcctg gtaggggcgg aaggtcccca accaagctcc cagccctttc 13140 taaatgaatc tccctgcttc acccatgtgc ttttctccag tctctgcggt cttgatgaca 13200 gcagggtatt agtcctagct gtcccacagc tcctacttct ttcaggcctc tccctgtgac 13260 aatcagtagc cactggcagg atttcctcag agcatatctc gatttgcttt cagacaatta 13320 gttaaaagga cactggaccc cagacgtccc aactcccagc cagagccctc acaggcccgg 13380 cctttggtgg tgaggaaggg ggagggagtg agtgacagtg ccctggcatc ttttagaaac 13440 gaattccttt ctctccatac ataaatgcct gcagagtccc atttcagaat ccggcagaca 13500 aagccaccaa tgtgatcccc atgaccttat aaacattcat taaaatgcat ttcaaggcat 13560 gtgatggcct ccccaccccc tagataatga gaaaacaaag gtttctcttc tgatagagac 13620 aagttcagct ctgaagtcaa cattatttct ggttctgtct gaacaatgac atatggcaac 13680 tcttcccttt ctatagttct agtccagaat gacaaaaaag gggaaaaatt tcttagagaa 13740 ggtagagatt atacgaatac agtccatgaa atgagcataa ggagaataaa gaatataact 13800 tatccaaaga agtctggcag gctgttataa atgcttgatt ttggacactg tagttggagg 13860 tttaacatgg acaccaataa aaaggtcagc aaagggtatg cactgttcct attgggcaag 13920 aagataggag gtcaaaggta accaggaaag ataaactcag ggagacttat tttccctcca 13980 gagggcactg ggcttgtagg ccctgggcaa aattgtcaaa aaggtgaaaa tcgcctgtgg 14040 tttatttagt ctgctctttc ttcactagtg cctcaccagt tcagttcagg ccaatttgct 14100 agaaggtagc gaacgatcga ccggtgaagt tcctatactt tctagagaat aggaacttcg 14160 gaataggaac ttctacctag atgcatgctc agagcggccc ctagctagcg tttaaaacct 14220 acagttgaag tcggaagttt acatacactt aagttggagt cattaaaact cgtttttcaa 14280 ctactccaca aatttcttgt taacaaacaa tagttttggc aagtcagtta ggacatctac 14340 tttgtgcatg acacaagtca tttttccaac aattgtttac agacagatta tttcacttat 14400 aattcactgt atcacaattc cagtgggtca gaagtgtaca tacacgcgct tgactgtgcc 14460 tttaagcttt taattaagag taattcatac aaaaggactc gcccctgcct tggggaatcc 14520 cagggaccgt cgttaaactc ccactaacgt agaacccaga gatcgctgcg ttcccgcccc 14580 ctcacccgcc cgctctcgtc atcactgagg tggagaagag catgcgtgag gctccggtgc 14640 ccgtcagtgg gcagagcgca catcgcccac agtccccgag aagttggggg gaggggtcgg 14700 caattgaacc ggtgcctaga gaaggtggcg cggggtaaac tgggaaagtg atgtcgtgta 14760 ctggctccgc ctttttcccg agggtggggg agaaccgtat ataagtgcag tagtcgccgt 14820 gaacgttctt tttcgcaacg ggtttgccgc cagaacacag gtaagtgccg tgtgtggttc 14880 ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg ccttgaatta cttccacgcc 14940 cctggctgca gtacgtgatt cttgatcccg agcttcgggt tggaagtggg tgggagagtt 15000 cgaggccttg cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc tggcctgggc 15060 gctggggccg ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct gctttcgata 15120 agtctctagc catttaaaat ttttgatgac ctgctgcgac gctttttttc tggcaagata 15180 gtcttgtaaa tgcgggccaa gatctgcaca ctggtatttc ggtttttggg gccgcgggcg 15240 gcgacggggc ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg cgagcgcggc 15300 caccgagaat cggacggggg tagtctcaag ctcgccggcc tgctctggtg cctggcctcg 15360 cgccgccgtg tatcgccccg ccctgggcgg caaggctggc ccggtcggca ccagttgcgt 15420 gagcggaaag atggccgctt cccggccctg ctgcagggag ctcaaaatgg aggacgcggc 15480 gctcgggaga gcgggcgggt gagtcaccca cacaaaggaa aagggccttt ccgtcctcag 15540 ccgtcgcttc atgtgactcc acggagtacc gggcgccgtc caggcacctc gattagttct 15600 cgagcttttg gagtacgtcg tctttaggtt ggggggaggg gttttatgcg atggagtttc 15660 cccacactga gtgggtggag actgaagtta ggccagcttg gcacttgatg taattctcct 15720 tggaatttgc cctttttgag tttggatctt ggttcattct caagcctcag acagtggttc 15780 aaagtttttt tcttccattt caggtgtcgt gagaattcga tatcccacca tggacaagga 15840 ttgtgaaatg aaacgcacca cactggacag ccctttgggg aagctggagc tgtctggttg 15900 tgagcagggt ctgcacgaaa taaagctcct gggcaagggg acgtctgcag ctgatgccgt 15960 ggaggtccca gcccccgctg cggttctcgg aggtccggag cccctgatgc agtgcacagc 16020 ctggctgaat gcctatttcc accagcccga ggctatcgaa gagttccccg tgccagcgct 16080 tcaccatccc gttttccagc aagagtcgtt cacgcgtcag gtgttatgga agctgcttaa 16140 ggttgtgaaa ttcggagaag tgatttctta ccagcaattg gccgccctgg ccggcaaccc 16200 caaagccgcg cgagcagtgg gaggcgccat gagaggcaat cctgtcaaga tcctcatccc 16260 gtgccacaga gtggtctgca gcagcggagc cgtgggcaac tactccggag ggctagccgt 16320 gaaggaatgg cttctggccc atgaaggcca ccggttgggg aagccaggct tgggagggag 16380 ctcaggtctg gcaggggcct ggctcaaggg agcgggagct acctcgggct ccccgcctgc 16440 tggccgaaac ctcgaggtga aacagacttt gaattttgac cttctcaagt tggcgggaga 16500 cgtggagtcc aacccagggc ccatggtgag caagggcgag gaggataaca tggccatcat 16560 caaggagttc atgcgcttca aggtgcacat ggagggctcc gtgaacggcc acgagttcga 16620 gatcgagggc gagggcgagg gccgccccta cgagggcacc cagaccgcca agctgaaggt 16680 gaccaagggt ggccccctgc ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg 16740 ctccaaggcc tacgtgaagc accccgccga catccccgac tacttgaagc tgtccttccc 16800 cgagggcttc aagtgggagc gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac 16860 ccaggactcc tccctgcagg acggcgagtt catctacaag gtgaagctgc gcggcaccaa 16920 cttcccctcc gacggccccg taatgcagaa gaagaccatg ggctgggagg cctcctccga 16980 gcggatgtac cccgaggacg gcgccctgaa gggcgagatc aagcagaggc tgaagctgaa 17040 ggacggcggc cactacgacg ctgaggtcaa gaccacctac aaggccaaga agcccgtgca 17100 gctgcccggc gcctacaacg tcaacatcaa gttggacatc acctcccaca acgaggacta 17160 caccatcgtg gaacagtacg aacgcgccga gggccgccac tccaccggcg gcatggacga 17220 gctgtacaag taggcggccg ctcttcgagc agatatcata agatacattg atgagtttgg 17280 acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt gtgatgctat 17340 tgctttattt gtaaccatta taagctgcaa taaacaagtt acgttaacaa caacaattgc 17400 attcatttta tgtttcaggt tcagggggag gtgtgggagg ttttttaaag caagtaaaac 17460 ctctacaaat gtggtattaa ttaaagatct ttaaacaatt taaaggcaat gctaccaaat 17520 actaagcgcg tgtatgtaca cttctgaccc actgggaatg tgatgaaaga aataaaagct 17580 gaaatgaatc attctctcta ctattattct gatatttcac attcttaaaa taaagtggtg 17640 atcctaactg accttaagac agggaatctt tactcggatt aaatgtcagg aattgtgaaa 17700 aagtgagttt aaatgtattt ggctaaggtg tatgtaaact tccgacttca actgtagttt 17760 aaaacgggcc cgtagtctag ggccgccagt gtgatggagt tcggcttcag gtacagcaca 17820 ctggcggccg ttactaggta gctagagcct tcagactcta gggaagttcc tatactttct 17880 agagaatagg aacttcggaa taggaacttc acccatggcg atcgctagcc tctaactcct 17940 agaccgtcag aactgctggg cccttcaaga cgggctgctc acacccactc atgttaagcc 18000 tggtgaggcc tgtactctgt tttcacagga agaaatcctc acccagtctt ccccaaacac 18060 attcccaggt tgtgtcatta gtgggataga gatgattatt gtggggagaa gagaaacatc 18120 tggatggatt tggtgaggtt gatctataga ggaagtaggt gctgcctgag gtagctgtaa 18180 tagaagctaa aggtcaaagg agagggccct gtcccaatcc agatgactcc acttctgctg 18240 gacccaggtt cacaagctta atctacattt cacctaaatt tggctaacaa gcccaaaatc 18300 acacaggcaa agggagaagt ggaggcagaa ccgaggttgg aggccaccag ggccaccggg 18360 cagagatcat ttaagcccaa ccttctcact tctccctggg ctctgcctct cttaaaggac 18420 cttgtggtgt gacctcttgt aggtcccttt cacactcggg gcctcagttt ccccactgta 18480 aagtgaatgg gtcccagctt tggtaagctt atgcttacct gatgctttct tcctgggctg 18540 ctcttgtaga gaaaagataa atcttcttcc tccatccacg agggctcctt tccctggggg 18600 tgagagtagg ctgaggagag ccacttgcac acacccttaa agaaagtatt acctgcacca 18660 gctcagtgag aggcacagat cagactgtta cttgaatcaa attatgagcc tccccaaata 18720 tatctatgac atttaaatag gggattactt gaacatagac tgtgggatcc ggtgtggagt 18780 gcgggagact agcaaagtga atcctgagag tagcaggtct gcacctgttg gatcgagaaa 18840 ggcggcctac aattctggtc aaatgagctg tgcttattga catattctat tagagagtac 18900 taccaggtca ccagtcacca gaaaggctgc cagctctcca accacctcca gggaactatc 18960 ctgaatgggg ccttaacaag tctaagagag ggttggtttg ggtcccaagc caatatttgc 19020 tctgctttat gtcagtcata tggaacccaa accaaccctc tcctatgtgc ctcaccagtc 19080 ggtgcaggga tcccaatttc aagtttggtt ttttatggtc aaagtccagc atagattaaa 19140 tgaaggggtg tgatgatggt gttaaaagag aactccagac cagtttaact cttggacaca 19200 catcccatct caccatggtg cttccaacct tccagagatg atgggctcct attttctgat 19260 gacaaagccc tccacaggat tgctgcctgg ccatcaggga gtgcctctgt aactgaggct 19320 gagatcccac tttcagtcct ccagctgtgg cccatccctg ctccgcccac cgggtatggc 19380 ctgtcctagg ctcttaggta tggctgcatt gtgaaatgat ggctacagag ctggcatctc 19440 ctgtagtctg gttcatctag tgcactacct catagttaaa agaaatctgt ttaagccact 19500 gagggtggct cctagtgcca actccaagaa caggaagctt cccttttttg ggaggagggg 19560 cagatggtaa catggatcgt ccaggtcaat gggagcaggg caaccacagt aagtactgga 19620 caacaacaca aaactccatg tgtggcttcc atcgagtccc tctccaattg gtttggtctt 19680 ctccgtccca tgcagcactt tagcaagggg cctggctgaa ggctatgaat tgtgtggagc 19740 ctcctcattg cagtctccaa ccatctgatg ctgggaaaat gtcaccagga tgcagccatg 19800 ccgtgtggcc aatgaaccga gaaaacaccc cttttctaga atgctctaaa gaggcagaat 19860 aatccagagg tgaggaagga aatactccac cagagaccca ggcagttcct acaaaagcca 19920 gactttcctt cacctaggga gtgacaagac cagtggaaaa cactctcaag cagtaacccc 19980 caaatgctct gcaagccagt ggcgtccaga taccgcacaa gcgagtgggc tgtctaatcc 20040 catcatcatg atgtaaatat ctctaggctg ccctgggctg tgcctgaccc tgtcttcagc 20100 tttccacacc tccacctaca gcccatgcac agaaggacca cccaggaatg ctgcaagtgt 20160 ggcacctcca gggccaccca gggagaagga gggcagctat gctggtggct ccaggcccat 20220 ttggcgggtg gtaccttcac accacaaagc ccaaactgag gccccagatt tggctgatga 20280 gggcatattg gacaggggtc acttatgctc ttccccattg ccacctggcc tctggctacc 20340 tggacttggc tacctgtgga tcctctcaca ggtgccacca tcttggctga gtctccagat 20400 gcgaggtccc tgaggcagtg gcgggcttct cgctaatgct gatgggatta ggaatgggat 20460 aggtggggag ggccctggac tgggccctga tgagccaagt gggtttttag aggggctact 20520 ggtacatttc agggacagga catctggtag agctaagctg gggcaataag gagccactgc 20580 taatctgaga gctagaaaca atcagcttct gggtcattat taattagggt agtttgggct 20640 gtgtggaagt cacgtactat atggggtagc cacagctctc tctacagata atctctaaga 20700 cttctgattg ggactgtgtg aatgcagtag caatatctct tcttactgcc aggccctgcc 20760 agtcctgcct ccacgccctg gctggccccc cttatgatct gacccatgcc aggctgccat 20820 agtatgttac ttctgcatta gcactccttg ggacctgcct ctccactgtc cctcagactt 20880 taaagaacta tacaaaccca aggggctctt cccaagagaa ttgatatgac ttgaggtgat 20940 tccatttctg gaagtagtca ctccattttc tgcctcactc tttcagtgct tcacagagca 21000 ggttcgaacg aaggagccat ccaactaacc gtcatgttcg ggcaaccgaa gaagggagtg 21060 gcaggatttc ctttggagac ttctggaatt agacagcagt ttaatgcaag catctaaatt 21120 ctctccctcc cagagtctca ttaaaactac agtaagagtt tgtgttttgt tttgttttta 21180 aagacaaaat cccaccagga tagagagaat aggagaggag ataacagcat cataatttat 21240 gaaactaaaa tgcagataga ccaggattaa ctgactacac agcaccaagg aagctgaatc 21300 acaagacagc agaggagaaa actggaaagg atcgtggtct atacggcaga atcttcccaa 21360 gcctcaggag gaggagctct agatgttccc agatctggga ggtaaagtgg aatgggggga 21420 catggtcagc gtaatggggt tgggctggaa gcaggttaag gagcaggcag atctctgaat 21480 cccctctctg actctgtgtc cccaggcatc tgcctgtccc ccaccctgga agaggtctgg 21540 cttgaccctt tgtctggtga atttcctgct ctgctttcct ggtcctgctg gccggatcag 21600 tggaggccac tcacttcacc ccacagggat gttctgtgtt gccctacacc tgggaactgg 21660 aggtactgga ggcaggctgt ggtgagcttg aaagcaaaac acagagggca gtccaatctc 21720 tttggccata tttcttctgc atatccaata ccatgtccac aactctgcta gtgtcctgat 21780 ggtggtgggc tctacacatt cccgggaagc tgaaggcaga taatgaccag gacaggtcaa 21840 cctctcttct tctgaaagcc ttcatctact aatggcctgg gactcttccc ttaaatgctt 21900 agattgtgtc ttccactaag gttttttgct gttgctgttg tttgtttgtt tgtttgtttg 21960 tttgtttgtt tgttttgaga cggaatctca ctctgtcgcc caggctggag tgtagtggca 22020 caatctcagc tcaccacaac cttcacctcc taggttgaag gggttctcct gcctcagcct 22080 cctgtgtagc taggattaca ggcacatgcc accatgcctg gctaattttt gtatttttgg 22140 tagagacagg atttcgccat gttggccagg ctggtcttga actcctgacc tcaggtgatc 22200 tgcctacctt ggtctcccaa agtgctggga ttacaggtgt gagccaccac acccggccaa 22260 ggtttttgtt tgtttgtttg tttgtttgtt tgttttgtat tgaggcaggg tatcactctg 22320 gtcacccagg ctggagtgca gtagtgcaat cacggctcac tgaaacctcc acctccctgg 22380 cgggctcagg tgatcctgcc acctcagctt cccaggtagc tgggactaca ggcttgtacc 22440 accactccca gctaattttt gcgtttttag tagagacagg gtttccccat gttgcccagg 22500 ttggtctcaa actctgggct caagcgatct gcctgcctca gcctcccaaa gtgctgggat 22560 tacaggtgta agccaccgta cccggccccg ccactaaggt tttgaaaatg aagcaattac 22620 aagtttaagt ctattaataa gtgatgaagc catgtagaaa agcagaataa ttatcttgga 22680 tcaggaaggt cacatgagga tctacttggg ggttgtcaat attctatttc ttgacctgat 22740 cagtgttgac agcaggtttt aattttttac ttctttttgt ttgtttgttt ttgagacgga 22800 gtcttgctct gtctcccagg ctggagtgca gtggtatgat ctcggctcac tgcaacctcc 22860 gcctcctggg ttcaagctgt tctcctgcct cagcctcccc agtagctggg attacaggca 22920 ggcaccacca cgaccagcta atttttgtat ttttagtaga gactgggttt caccatcttg 22980 gccaggctgg tctcgaactt ctgatctcgt gatccgccct ccttggcctc ccaaagtgct 23040 gggattacag gcttgagcca gcgtgcccgg cccatttttt acttccttat taaactgtac 23100 atataggcct tgcacacttt tctgcatcaa tgttatattc cacaataaag ggaaaaggta 23160 tatacacaac ttgataccag taatgtgaaa catatatttc tacatagaaa aaaaaatgac 23220 tgaaatactg cactccaatg tgttcacaca gtagttgttt ctggattatt tatatattaa 23280 atgtttatat attgtattat gccatgaggt ttgtgttttc tctccacttt tctgcatttt 23340 ccaagtttac tacaaagagc acatattact cttataatca gaaagtcata aaatatattt 23400 aaaaagacaa aattgaaact aataaggatc aacacaaaac agatgagcca tctgtggaaa 23460 tccgcacaga atactaccta aagagattgg tgacgtgcat gatctcacta ggatgagcac 23520 aaagcttgcc agagcctagg gtctatttct agggttggct cttggaagcc aggatagttg 23580 ttatctctgg gaagagggag gggcacacaa ggggcttcta aaacattctg aatgttctat 23640 ttctgaacct ggttggtggg tacatgactg ttggttttat tattatatgt tttatatact 23700 cttccgtatg tatggtgtgg attccaaaaa aagatttcct ttagagaaaa ccagaatcac 23760 ataagtagaa aatatggtgc tatgttgaag gaacaactca agtttatata aaatcatcat 23820 catttatagg cttaaaaagt tgctttggaa ttttggtcta actgacttgt cttttctgca 23880 gcaaaccacg ctccttctgg acgtgctcca ggcagagggg attagggtgg gttcaaggct 23940 gcaagtacct agctcagcac actctcttca ggggacttag agtttgtctg gtgttggctc 24000 tctgagctct tgtcaggaat gccgaccctt ccgaggttca ggatttgaag cctgccttcc 24060 caccccagat ttggtccaca cagacactca agtatgtatt tcaactacaa atgacctgta 24120 ctttcctatt actcctctct ttcatggtaa cctttctggt atccttcctt ccctacattt 24180 atgggagggg gacatcattc tctgctctcc tgtcactgaa ggctccacct tctgtcttct 24240 tctgacccat ctggttttcc tggggccacc tcctctcctt accaccctaa cgcttttgta 24300 acttgaggag aaatgagaga tcacctagtc aggtcatcat tctctgtaga tgaagaggcc 24360 caatggtttg ctcaagaatt gccaagcgag ttaaagacag agagtatgag agtcagcaag 24420 acctacagaa agcatctatc tgcactgttt tgcagggact tagcctttgt gtgtggactc 24480 ctggaatgcc acccactaag aaacattgtc tgacaccaac tccccacttg gtaggtgggg 24540 acactgaaac tcatggcagg aaagggcctt gccccaagcc agggcagagt gtcactcatc 24600 actctcaatt ttcagtccag ggcaccttgt tgtgactatc ccaaaggcag ccactttccc 24660 tggtctgaaa gacctgaaga gagaagagaa gagaaggatg gaaggcagag tatgcggctt 24720 tgattcattt cctggtgaaa acagatctat acgagaagca aatttcacga aagggaagag 24780 aagaaagtgt cccatacgtt gctggcctgt ttcaaccttg ctttgattct tgctgaaaag 24840 ggtaccgtgt atttctgagt tcaacatgca gaccagtgtt aggaaagcca ctgcacctcc 24900 actttagcct ccagggctgt gccctgcaaa tggcctgcag ccttggtgcc tcgctctcca 24960 gactgcattt tggaagatgg gacagaggct tatggaagcc cacattagaa cgggggagca 25020 gaatgggtga gatgagggat ccttgatagt gaaccagatg aaggaatggt agccaaatgc 25080 caggcctcct ttgtggcttc aatccaaagg ctctggagcc cttccagggc agaacatcag 25140 gcatgtttac ccccactgtc ctcaacagtg acagaggtgc aatcttgggc agctggccat 25200 tttgaaagca acctccttaa tctcaactgg gaaggctccc tagcaggacc cctgtgttgc 25260 acacctggag gaagctagac taaccagaag ctcagcacgg ttccatctgg gatgcccagg 25320 tctgagacga aaaaggtaac tctcttttct gggtcctggc ccagttgtgt ctctctccac 25380 ctcattctct gagatgcctg tctccccttt tttgtcccat caggaggcaa gagctatcac 25440 tgggccagac tccaccagaa gccaagccag cttgttaccc agcttctcag ggagcaaaga 25500 acagccttgt ttctatctta tccccactgt cccctgcccc tgccccacct cccagccatt 25560 cagcttctgg cttccccaga gctgcctgct tctttgtggt cctccattcc ttgaaaagac 25620 cttctagtca ttagtgtata taaatggcca cttagcccag attacagtga ggtcaacagc 25680 tggggctctg agaattgtca cacactggca caggagagga ggctattctt ccagagaatt 25740 tggagggcac tcccatccac ttacaacaaa aagcccatcc actgtgcttg gcagtaggtg 25800 atctgagaac caatggaacc aggttaatcc tgtggcactg ttgagtgagg agagcagtgg 25860 cgggcactgg aaaatatcag agacaaggca ggagacctga aatctaggct tagctcctca 25920 tatacttggc agctgtatga cctcagacaa ccagtgttac ctctctaagc ctcagtttcc 25980 tcatgcaaaa ggagggggaa taacaacaga gcccactgct tgggggtgtt gtgaggacag 26040 gatgaaaaaa caaacagaaa tccctcagta caggattcag tgcagtggac agtcttgcaa 26100 ggtctggttc agccctccac ccctaccctc accagtataa agaactctgg cctacaagtc 26160 agatgacctg agttttaatc tcagctttgc cattagccgt gtgaacttga gaaagtccct 26220 ttccttttta catctattgg gatgatcatg cattttttgt cctttattct gttaatatag 26280 tgtgttacat tgattgcttt tcatagactg aaccagcctt gtattccagg gataaatctc 26340 acttggtcat ggtgtataat cctttataca aatgttgctg ggttgagttt gctagtattt 26400 tgttgaagat ttttatgtct tgattcataa ggaatattgg tgtaccttcc ccttttatgg 26460 ccacagtttc cctacaatga tgtagtcgaa ctagacaacc tccaatatct ttcagtattc 26520 atgtcctctg attctgtgaa actaagaaaa ttaagaaata gtgattcata ggcacaaggc 26580 aggcaaaact tagactcctt gtagaataat taggaagcca aatattcagt gtgcttattt 26640 ctcaaataac cttagtttct ccagtctgcc ccaactccga ggcctgaata tctctagatg 26700 cttatgatgg caactaaagc ctaaaagcta attcatttta aagttcttcc aaatgcatag 26760 ggttttattt ttccagacct gggttcagat ggggaatttg acaaacaatg gaaaggggga 26820 aaaacaacaa tctaaacact gagtgacaaa gtaacaaaga aatagtctag ctatcagcca 26880 gtcaagccag ccttggcttt gctatccaaa gtagtcagtc taattctacc accagtttct 26940 gttcctgtag ctgtctactg cctgccaggg actctgcctt cccacccaca actaccaatg 27000 gaaggatgtg gtgaccatac cagtggctgc tgacatctcc tgccatggga agcataattg 27060 cctccagcag cctccccctt agatccatca tttttgttgc acttggcctg ggctgtactc 27120 ccggccaatg actgaacatg gtgagcatag taatgcaggc ccatttctgt gaggagcagg 27180 actcctccag taggtgactt tggctcaagg actctctatt ggcctggttg aacttttcct 27240 gaactgtgct actgtctgag actcttctta cccaatcctc tttctcgccc caattgtcac 27300 agaccacctg cattgtggtc tgagtctctc cccaccttct cttgctcttc cctgtttatc 27360 tttcacaggc atttccccca gtacattcct tgaatgtcta acccgatacg ggtgcctgac 27420 ttttggcaga cctaagcaga caaaaaggag tacttggtta cctagctctt ctttctacca 27480 caaacatcga gggaaccctt tttccctcac ccctctgcca cacccccact gccccagtga 27540 acaaccacag agagagctgt ggtataatat taggctggtg caaaagtaat tgcggttttt 27600 gccattactt ttaatggtaa aaaccgcaat tacttttgca cctacctagt atttgtgtcc 27660 ccccaaattc atatgttgaa acctaaccca caatatgatg tcattaggag gcaagacctt 27720 gaggaggtga ttagatgatg gggtggagct ctcctgaatg agattagtgc ccttataaga 27780 agaagcccaa ggaagctacc ttgactcttc catcacatga gaatgcagca agaaggcacc 27840 atctactaat caggaagaga gctctcacca gacactgaat ctgccagtgt cttgatcttg 27900 aagttcccag cctccagaac tatgcataat gcatttccat tgtctctaag ccacccagcc 27960 tatggtattt tgtcatagca gcctgaactg actaagacag tgagccacat gagaagtgcc 28020 ccaacccctc ccttaagcac ttggctcaca gatcagtggg ttcatttctg cctgagtttt 28080 attgttattc tgtagatttc ttgggctaga tatatttttc tgttattttc cttcttcacc 28140 tcagtcatga attggttgtt ttaaaaaaga caatgtaagt catggggaaa ctcctgacaa 28200 ctctactctc ctagggttcc tgataaaagg ggattcagtt gagtcctctg atggtctcta 28260 cctgccaaag tccagcagcc cttagcaaac atgctgctcg tttctgtaga gaaggtgctg 28320 gtgtcccacc atacttctct ctccctcatg aagggcttgc gacccagcaa atgggtggct 28380 tatatgggtc tgtttcaaag gaagagccag ctctgggaag aaaaacgatg agcataagca 28440 taacctacca ctgtgcctgg gaaagcagac aacttttttg atgtgtgaat atctaatgag 28500 aatggaatcc atcaattacc ttaaacttag gcacagtctt caaattcaat atatgtggga 28560 tatactttta gtcagtttgt agacgttatt tgtaataaat aatctggctt ctctaaagaa 28620 attattttaa gtgtttggtt tggtttgatt taatggtaaa attatattta gtggcagaga 28680 attatagcaa tggtgataaa ctatagagtg tcataagttc atatcttatt ctcacatttg 28740 aagctgcctg cagatgcatt caagatgcag ccagaagtca ggagactcag gctgttattt 28800 ggagctcatc attttacagc cttgctggac tcccactttc tcaggggaaa aatgtggtgt 28860 tgacccagat tagctctcca ggccctgctg agttgggcac tctgtaagct ggagggtctt 28920 ctattgtctt cacctaagtg tcaatcaaca acccaaatgg gcatggggga agagggagct 28980 gggccaatgc ccagggtgcc tggtagagag ataccttggg cactggaagg caccagcttc 29040 ccagagagaa gggggagggc catgaaaaag ttggctgtag atgccaggga cactgggact 29100 ctccagctgt gtgtttgtgt cttctgaaga cttatgtttc attcctttgg agcatgcata 29160 atcatacact gtgggatgtg ttatatagat tgcttgatag ttcaccactg taataaaata 29220 ctgtgactgg aatctgctcc cagtctgcct ttgatagcac ttgtgcaaca cacatttact 29280 gagcatttac agtgatccag gacctgtgtt gtgaaaacat tgatggacaa ggcagatggt 29340 ggagcacgtc agtgaggatt tttaacaaag gctggtaagt gctataaagg aacattgtag 29400 gacactagag aacaaagaac aggagaacct gacttaggct ggggtggggc gttggttaga 29460 ggaggctcct tggaggacat gaggtttaag ctgtgacctg aggatgaata gatgttggcc 29520 aggtgaggta ccggtatttg tcagccttac cagtaaaaaa gaaaacctat taaaaaaaaa 29580 atacacatac aaagcctcat cagccatggc ttaccagaga aagtacagcg ggcacacaaa 29640 ccacaagctc taaagtcact ctccaacctc tccacaatat atatacacaa gccctaaact 29700 gacgtaatgg gactaaagtg taaaaaatcc cgccaaaccc aacacacacc ccgaaactgc 29760 gtcaccaggg aaaagtacag tttcacttcc gcaatcccaa caagcgtcac ttcctctttc 29820 tcacggtacg tcacatccca ttaacttaca acgtcatttt cccacggccg cgccgcccct 29880 tttaaccgtt aaccccacag ccaatcacca cacggcccac actttttaaa atcacctcat 29940 ttacatattg gcaccattcc atctataagg tatattattg atgatg 29986 <210> 289 <211> 30158 <212> DNA <213> Artificial Sequence <220> <223> HDAd35-T4-Ef1a-SB100-Flpe <220> <221> misc_feature <222> (1)..(481) <223> Ad35 5'end <220> <221> misc_feature <222> (14103)..(14614) <223> pgk <220> <221> misc_feature <222> (14763)..(15785) <223> SB100 <220> <221> misc_feature <222> (15811)..(16128) <223> BGH pA <220> <221> misc_feature <222> (16088)..(16376) <223> beta globin pA (Complementary) <220> <221> misc_feature <222> (16488)..(17759) <223> Flpe (Complementary) <220> <221> misc_feature <222> (17780)..(18895) <223> EF1a (Complementary) <220> <221> misc_feature <222> (29751)..(30158) <223> Ad35 3'end <400> 289 catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60 aaaagtgtgg gccgtgtggt gattggctgt ggggttaacg gttaaaaggg gcggcgcggc 120 cgtgggaaaa tgacgtttta tgggggtgga gtttttttgc aagttgtcgc gggaaatgtt 180 acgcataaaa aggcttcttt tctcacggaa ctacttagtt ttcccacggt atttaacagg 240 aaatgaggta gttttgaccg gatgcaagtg aaaattgctg attttcgcgc gaaaactgaa 300 tgaggaagtg tttttctgaa taatgtggta tttatggcag ggtggagtat ttgttcaggg 360 ccaggtagac tttgacccat tacgtggagg tttcgattac cgtgtttttt acctgaattt 420 ccgcgtaccg tgtcaaagtc ttctgttttt acgtaggtgt cagctgatcg ctagggtatt 480 taccggtatt caaggattac atgagcttag aaatgtaatt agcatagtgt gtggcatagt 540 gtagatacca aataaatatg atctctcctt ctactcttga aaatgcaaac acattcttgg 600 tggtcctaaa atagcctgta acatggttta ctcagcagca tttgctattc aaggcagatc 660 tgcctttagt cattggctgc gctcctgaac agctgtgtga aaggctaact tttgtaaacc 720 aaatcaaaat aaaatgcagc aaaaatttgt cactgaaagg aaatcctcag tatatccttt 780 tatgaaatga aagatccctc atccaaactt aactttttta aaagtgcgca tttggagata 840 tagccctttc ttatgaatcc taattcaatt ttggccataa acacacgttg atgttcccca 900 ccccaaagca catagcaaca agagtaggtt ctatattgaa aataatgaca atttaaaaac 960 atgtacttat ttcactgtat gtggacagtg tctatgattg catcatgaag tgtcatataa 1020 ccatgtacgt gtacatgaga gagagataga gagagaagtg gtagggtggt ggtggtagag 1080 gggatggcga tagtaatcat ggtaatggta gaggtgatgg aggtggtaat gacggaggta 1140 agggtggtag tgatgatggt ggtggtggta atggtggtgg atgtggtggt ggcaattggg 1200 atggtgggat ggtggtagcc atggtgatgg tggtaatggt gttgatttaa agggtggtgg 1260 tagtgaaggt gagggtagtg gtggtggagg tggtggtgct ggtagcaata gtgatggtgg 1320 tgatggtgtt gatgagggtg ttgggatcag ggtgagttcc cacagtatat ttcattcttg 1380 ttgtaccact ctgtcaacag caccactgac tgggacagag gaagaaggca cactctgaat 1440 gtgttattaa cagaaacctc aaaacagtct gtctccttgt agtcattcaa aattatcttt 1500 ttcttacctg gaaaactgaa actgaattac cgggaaaaac acaggagatt tttgtttgtt 1560 aatatgctgc caataaagta attttatgtc aaatttaact acaggaaagg gcaaggcatt 1620 ttctaagttc cttagatgtc atgtggctaa aaaaaacaaa aggatggaca gcagttagat 1680 actgtacact tagctgtttg aagccatata ttcagaaagc agatgttggg agttggtgtt 1740 tgaggactga tttcctggag gtattttata taggccaagt tcattgttct aaactctaag 1800 ggcttgactt gagggaggaa aagaggcaag aacatgttta gttttgctga cagcatcaca 1860 tgggcagccc taaggctaga caactttagg gcctgaagct tattctagga aagaagcacc 1920 tacagagtgg cactgggctc ccctccacta tagagatgaa gtcatatgac agtaaagggc 1980 aggcagggct gcctaggggg cccagaactg acacttccat tagaatgagc acaggccagg 2040 gagagaagtg gggaaccaga gagaaggagc tggaattcta gtaggacaaa cggtaagtga 2100 acaacaagaa caagttaaga gtgtgtgcag tattctttca aagactgaaa aaatagtgat 2160 gtgatagaat ggcaggtggc tctgagcagg ccaggagaag gactgggggc agagcatccc 2220 aggcaggagg gcagcaagtg ggaaggccct ggggtggggc ttttggactg ttccagtgac 2280 gggcaggcag ccagtgtgcc tgtcacacaa tgcaccaggg aagtagtcgt gaatttgcag 2340 agggtcttgc aggctatggg aaagggattg gattgtattt tgtttgtagg gaagccatcg 2400 ggggacttaa gcagaggaag gattggcttc atctctttga aaaagttctc tctggatgct 2460 gatgggagga gaaatggaag gaaaagaaac acttttaggg gcaagaactt ttgagaaggg 2520 tggaattggg agtgtggagt tggggccagc tttggcacag gaggggaagc taaacacgtg 2580 gccgcatgag ggcctgtaat tctacctgaa atgggtacca tttgttaggg taaacaaatg 2640 aaccaaatgc ccagtgatac agaccaagtg ttggcaaact tcttctgtga tggcccaggt 2700 agtaaatgtc tcaggcttcg caggccatgt ggtctctgtt gaagctctgt gtagtagaca 2760 atatgttaat gactgggcgt gactgtgtgc taataaaagt ttatttacaa aaacagcccg 2820 tgggctggat ttagctcaca ggctgtagtt tgccaacctc tgacctagag catgaactga 2880 gcatcttctt ggagggaaat aagttctttc caagttgccc tcctcacatt gcagggggcc 2940 atgtaggccc attattcaca gaagagtggg tgggcaacct ttctggagca gaaaaacgta 3000 aagatttctt ccgtagtgca agtaaggtga ccatttctaa accgtgcaag tgatccagca 3060 gtcccaaaag ttgtttcact tctcattgtg cgcccgttct caggtgctcc gaagcttcca 3120 gtcctttgta gggacatgga tgaaattgga aatcatcatt ctcagtaaac tatcgcaaga 3180 acaaaaaacc aaacaccgca tattctcact cataggtggg aattgaacaa tgagatcaca 3240 tggacacggg aaggggaaca tcacattctg gggactgttg tggggtgggg ggagggggga 3300 gggatagcat tgggagatat acctaatgct agatgacaag ttagtgggtg cagcgcacca 3360 gtgtggcaca tgtatacata tgtaactaac ctgcacaatg tgcacatgta ccctaaaact 3420 taaagtataa taataaaaga aaaaaaaaaa gagaggagag aaacatcatc ccctccagga 3480 tacccttggg ccttgttctt atagtcttgt acattgttga acaatttgca tgggctagtg 3540 gattaaagca caccctccac cctcaggccc tcaagggtct ctatgataat acagtctcac 3600 cttctaccct ttccatcacc atcctaggtg ctatggccaa ccttgaggct gccatgttag 3660 gtctatgcat ttcccacctc caccacataa ctctctgaag gccaggtagt ttcctattca 3720 tcttggtaac cccaaagcct cgtgacaggg ctcagctggc atctgcggat gtgaatgaac 3780 cattggagaa aatggtactc tgcaaataac tctgttattt tcccatttcc tgtgtaaggc 3840 ctagagacaa tgacttttta attgcacccc ttcccctctg tatgacactg gccttctctt 3900 gtgtccagca atgtgggtgg cctagatgat ttctaaggga cttctggcca agatgaacag 3960 cagctgcatc ttactgagca tttactatgt gccatatact cagccacagc tctaggggca 4020 tagaagcagg agctctcagg gtcagggcag tgagtgagca agcgagcacc tatgccagcc 4080 ctgcctctgg atggggactt gagagggtga tggaagcctg cagcactgga gggaggcaga 4140 caaagacagg cctgtgctga gggggcccgg agcaagagag agggaggcaa tgacagcaga 4200 gacatgcctg cgccttgggt ttgagtgccc agtggtcaaa tccacttccc tgtggctgat 4260 gcttgccttt ctaactttgg aatttagggg ttggagatct ggtgagaagg taggagggag 4320 atgaggagga gaagggaaag gcaggaagga aggggaggga aaggaaaagc aaaaggggag 4380 gaggaaggtt tccaacaaat tattctatat caactgcgga aatcaaaatt tgttgcccaa 4440 atcttagaag ctcatgtccc tcctccccag aagtctggaa tgcagcactc caggggtagc 4500 ttataaccca aatatctatc tgtaaaaaga gaaacattgg gctttcgagc tgtggattct 4560 cagtaaaagc aagaggcctc agcctacaca ggccagccca gagtttgagg aaccccaggc 4620 ccacacccac agggctggcc cctgggtctg catactccct agaaatgtgc acacttctga 4680 gcctcaactc tgtcctggag tctaacagca tccctctcct tcctggggca gttccacctc 4740 cagaaacctg ttaccttggg ccttatgtca aggaaactgt gggaaagagc taggcaggaa 4800 tgcagatgag gccagcatgg gctcctaaaa gtttagaaat aggcagtgtc atgctcccag 4860 gtgcctgcat aaaccagctg aaaaatggag ctcccctcac cagcactctc ccttcaaaca 4920 gactgtgatt tgcaggtcac tggtttacca agccaggcta cccaggcagg acccagatgc 4980 caagcccagt ggtgtcctgc aagctgagca gtgctcagtt cttgcaaaaa aaggtctgtg 5040 tgaaggcaag gcctctgcct ggcttctcac cccagttggg tgtctggaac aggaaggagc 5100 ccttactgca gaaaaaggag gagggagcaa agggagcgaa cagctgcgtg ctccatgggg 5160 aggatcccca aagtagaaag gcgcatacac actgcagccc ttgacccaga atgctcacag 5220 ctacattaca gattcaggtc tcctcagtgt agtggggctg ctgatgagac tgtggcatcc 5280 tcaggggtca ggacacacat tttccatcac tcttctgatg gcaaaaaacc tctgagccaa 5340 tgccaacctc tgatcattaa aaaaaagtgc tcacagcagt gtgtggttta ggatcatgcc 5400 ctgtgtggtt tggaacacgt gcacaaccac accttgttca tcaccatccc agaaaccctg 5460 acgcaggcaa agagcagagt tattaaccct actttactga tgtggatact gaggcccaga 5520 ggctcatgca agttatcaat aagtggcagg gacagttgcc tctagattaa ctagccccta 5580 ggatcacctg ggtcttggaa ggggacccat aaacatgagc tcccctctct tggggccaga 5640 tttgcacctg tgccgcgcct tcagcctgca tgaagtaggg gctgctggca aagactcaaa 5700 gctgtaaatc tgggttttct cttgaggctt ctaagggagc tgtttcgaca actcactctg 5760 ttcccagctg gctgcccctg catagggttt taaagcagcc tagctttctg ccaggcttgg 5820 cagtggacaa cgctggtcag aacatcccag agagctacca gaatgaagta agtttgcttc 5880 tactctttac ctgtttatgg gctgtctctg ccactggaat gaaaggcact gagaacagtg 5940 cctggcctgc agaaggccct ggaaatacct gagctcctaa tctgggaata ggagtaggaa 6000 gagctttgga ggcagggcac ctgagtttga gatctacaac ttcctgcctg tgtgacattg 6060 ggaaagtctc catcctttct gagcctcagt ctccaccctg gggaagtgga aatatcaatc 6120 tctgtgacac agaagcaaat gagcgaatgt gcacaaagta ccttgcacaa gagagacgct 6180 caaacacttg cctccaggtt tcaccgagaa ctacagagta agatagattt gttcccagtg 6240 gaggaagcct gggaataatt tgcccctaga ctatgaattc ctggggctca agatcgagca 6300 cagggccagg cacacagaag ggaccctgga aatgtggcag gaggccagag atagacaggc 6360 ccttagagct catacccatg ccctctgacc tcaagaagaa agaaacctgc tcaaaatctc 6420 acaaagagct tgttccaacc ctgaatcgag tctgaggact ccttcctgag tccagcactt 6480 tttctgcaag aagtatatgc ctccaaagct gatgggcgca aatcttgaac cccgtcacat 6540 aaacacaaag ggaggaggtg actagagctc ctcctactgg atatgtctaa ggtcaccagt 6600 ctaaagaaaa gggatggata gaatgaggcc agtatttttg cagccatcca aatgtccaca 6660 tacgctgtta cactgagggc tcctctctcc cccgtcttca gccctacttg catttagagg 6720 tgagaaagat atgggctgag gggttgtttt tcatcgtatt gtagatggaa agcacactgc 6780 ccttggggcc atccaaatgt ggaccttgat gtagcacccc accttctgga tggccatcct 6840 tctgaaagtc actgaatttc tcagacttta ttctctttat ccataaagaa ggagaataat 6900 aataatcccc ccaccctgcc caaccactga ctggttggga agctcagaag aaatactggg 6960 cacggcatcc cattgtaatc tatagagtga gtcgcttctt aatattaaat ggctgaacac 7020 agaagatgtg caaaaagtac tgtgtcccct tcctcctcca actgaacatt tcatgccctt 7080 tgcaccctca ttttgtctag gagctgcctt atgaagggaa taggtacctg ctccgagctg 7140 gaggaatctt tgccacttat ggtggggtat ggactgagac agagatggca tgtgacatgc 7200 gcactgagtc tcaactccat gcaggctctg gagcactctc aaattggagt actaatgcct 7260 tttaaattct cacactagca atcctttgac ctactgatct agggatctag ggaaagaatc 7320 gtgatcttaa cttcaaaggg aaggacaaaa tgttctgcct cctgttaaaa ctccatacac 7380 taagtgcaga gactggatgc cttattaacc ttgggtagat gcccaaatgt tcaaaaggtc 7440 aaactcttct gttccccaga tcgccagagt cattaaccag tcacactatt aaatgaatga 7500 acagatgctg aaaaggtact tgcattactg agatttctta tggtgatggc ccctgcctga 7560 tatgtattca gcattttgta gttttcaatg tgcattagag tatagtggtg atgacattgg 7620 cctctgagtt tgccacttct tatatctgtg actttggtca aattgcttaa tctctctgag 7680 tctcggtttc ctggagataa taatagcttc ttcttcccag ggttatcatg aggattacag 7740 gagataatgc cccaaaaatg cttagtaaag tgcctagcac ctagtcaatg ctgaattaaa 7800 ggtggttatt cttacttttc gttcatttga actttgttct cagggagggc aaaggataga 7860 caaagcccca tagctagtga ggagtagctg caagactaga acccaggtgt tctgagccct 7920 agtcttaggc caagaacaac tgttacgtga gatgcacgtt ttccttcaag ggagctcaca 7980 attatttcca tgtaaattca aggactgcta aaagagaact ctcctctggg actgatatca 8040 ttttatttca agattgattt gaaacatgtt ttttgtttgt ttgtttgttt tctaggaaag 8100 aacaagagaa ccagttaagc tgaatgcctg aagcaaatcc ctgttagcga tgttttcagg 8160 atgagggaga gtggtgcaag aaacgtgctt ccagatgcac atggtttcct gggactaggg 8220 ttcagggtgt catccctggg tgttattaag tgtcagaagg agagcaaaca agggaaacat 8280 ctgagatcca gctaaggcta caccctggaa atgcaagccc agctcttgca aaggacctcc 8340 tttggccact caccttccag gccttacaat aacttgtttg gactgcaggt ttcttggtgg 8400 actcacaggc cattctgctt ttatttggtc aacctcagtt cacaagcacc cagatgctga 8460 gatcctcagc atgtgcagca gagtttcata ttagcactgg gtacctttct gaggctacag 8520 ggataccgta cagcagcacc tgtcacgtcc agccaaagga gtgggctctc tcaatgtcat 8580 ccaatgctgt ttcaactgtg aagaagacca tctgagagag ttgcttttgg aggctgaggc 8640 aaatttttaa aattctttgt tctcctcaac tggggtgaat tcttggtctt ctaggacagc 8700 ttgaagtttt agaaagagtc aagccactca gaaccaacag agaactcttt cagagaacaa 8760 ggtgtggcat agaggaggca gagggctgat cttgatcaaa tccaaagtgt gactctaaag 8820 caatgaatgt gaatttttgg caaagcttac aaagggctct aaaggccatc tgcaaagaga 8880 agccaagcct gatcgatgaa tcactagtgc ggccggatat cgatcggcac gctgttgatt 8940 ttctcatagt aaggaacagt gggccctttc agtcccactt ctgtagtctg tggtactaca 9000 aatggtgagc ccatgatgtt gccattcata gggttattct ccagcagtaa tgactggcca 9060 gccactccca tagccgcggg gctaggattt attgtcaatg gagggacctg cagttctgca 9120 caagcagtac taggatgagc acctgggccc attgcaaggg tgacatcttc aaggcaaggc 9180 ctcttaattt tattagggta gcccccatca gccatgtctg gaaactggaa gtggtcttct 9240 tcttgtctcc tcttaacagt tccctgtgaa tggaagagaa gagaggagga gaagagagga 9300 gaggagaagg gaagagaggt gacacacaca cacacacaca cacacacaca cacagagaga 9360 gagagagaga gacagagaga aagagagaga gagagagaga ggaattttta taaaggtttg 9420 gcacattaaa gctaatgaac aggaaatgtg catgataaaa cagacctctc agtttaaaga 9480 cttatagttg tgaaaactat aaaatacagc ctgtctttgg aaccatagtg cttatttatt 9540 cattattatg tttcatctaa actgtctaat tacatttcaa ataaggcatt atgttgtctg 9600 tatactaaaa cgggatagaa cgttattcaa agggtaatct gcccacttca aggagagttc 9660 aacaaaacta tgcagaagtc actaaatgaa ccatgctgcc aaaggcaggc attggagaga 9720 aaactagaag tagctaaata gttttaattc tttcctgtct acagacacat agattttaac 9780 gaaggaatac catagtatag aattgaactt ttaggctgcc ttctagtctt ggttaaatgc 9840 atcaggctgc agtggtaaaa ttgaatacaa cagagccctt acaggaaaga agtagatctg 9900 gatgtgtttt cttggggagc tgtttaaaat actgtttttg ggaaagcaca agtttcagaa 9960 cagtcattgt aggcatcgta ttcattgttc catttatttt tacacacaca cacacacaca 10020 cacacacaca cactctcaca cattgctatg tgtacacaaa aataatttgg aagaacctat 10080 acccaacaat ttggagtggt catttatttg ggatgactgg caattccctt tctattctct 10140 tcatttctgc ttgtttgtct ttaacgagaa cgactcataa tccaaaaatt taaaaaagta 10200 taaagttatc taaataagaa attttcctct gaagatgcat cctcaggttg gggagatatt 10260 aaacaatgag aaaaggcccc aatctgggat ctgaaccttg ggggagctgc ccatcattta 10320 tagaagcaca gcctttggga acaaagcaaa gtcactagca atgtgagact tcctactctt 10380 catggcttca tacagtcatc catcgctgtt gtgttaatga ccatgacctg tatgttagca 10440 ggtaaatggg aaaggaagtg ggggcaaagg agtatgtgca ggaatgatca aaataaggaa 10500 aggaagagag ggatctggaa atcacctgaa tgccgatagg tgaacaggta gaattctttt 10560 aaagcttccc ccacccggta ccccccaaat aacccctttc cagctttgga agtttcacta 10620 ggacatacag tgctcatcct ctgatgtcac cttaagtttg gctcttctgg tttgatgagc 10680 ttgtagccca ctaggagctc aaggcatgca tggggccact tgccagcacg atgaggggca 10740 tgactgtcat ggccaagtga acatcaaagc agatccccag ggctgtatgt ctcaggcctt 10800 ggtgcacatc agaatcactt agaaacatcc acattcctgg gccctcccac cacaaactga 10860 cagcttcatc cagggtgtgg cccaggcatc gggagttttt ccaacagctc catggctgat 10920 tctcaacaga aaaccactgg cccagagcaa gggtggaggc agcgtggcat agggctctga 10980 ccttggcctt gccactgaac ctctcagagc cccagtttct ttatgtgtaa aatgagtgta 11040 attatagttc ttttctcatg aaggtgctct gactattaag tgaaacgggg cacattgtat 11100 gacacctaat agctcctcac taactggtac ccggcattat aaagggcagg tatggaaggg 11160 ttctgggagt ccaataccct tcttaaagac agagaggtct ctgagaccca gagaggggca 11220 ggccttaccc agagttgctc agccagaggg caacaaggcc caggtcagat gcagggcccc 11280 tccaccacca ctcagctgcc tccagaccca ctgccttcgc catgttgttg gtaggacact 11340 gcatcgcccc cacagaaggg gcttgccaac ttgagtgaga ggacttgcac acttctttga 11400 cttttctttt gagatgccca caatctgaac aagggcactt caagggacag ctctgtcacc 11460 aaactcatct gaggcctgaa taccatgggt caggcaggaa tgggttggag aggtgtagag 11520 caggcacaat aagagggctg aggcccatgc agtcatcagt gcccactttc ccaggagtct 11580 gactgggcac agcacccata gtgtccctga gctggtccat ggagcagctc actaactgtt 11640 tggcccacag caggtgctca gtaaatggca gttgaacgaa tcaatggaca aaggaacata 11700 aattacccaa cacacaggga gctcagccat ttactcaatc cattatggag taacctacaa 11760 acaagccact gggtcccaaa ctgaaattgt gtctcttcta cattctccca aagaatccaa 11820 taggttaaaa atagaaatgt atgaaataga tcaatcaggg atgattgcat gtggatttga 11880 cataaggatc ccctgcaggg agtctgagct ggcaacagtc aggcccaaag tgctgtccat 11940 gatgtctcga actgcaagac agttttaaca atggcgaagc aatgcagaac caggcaggcc 12000 aaggaggggg tgggggttgg ggaaaggaag ggagggaagg ggctgtgagg ggcaatggtc 12060 tggcatccct gccacgtgag cctctgaaat ttgctggcag cttctatggg ctcccagagc 12120 tttcacttaa ttgttggtct gccactaacc tgctgggagt aaggtgcagg gatggaggag 12180 gcagggcatg accaccagac actaaaggta ccagctgggg ccactggcaa agggaaggag 12240 gctgcacctc tcctacatga gagcccgtat acacacacct tttccagcac tcatcaactg 12300 catcccaagc aaatggtccc tgatcaattc caattctaga aaccaactga ctactcaata 12360 acaaagtaga tcccagcagg ccgccactgc tggagcggat gccacttttg ctatgccaag 12420 tctgtggctg gacagctgct ggcatgtaca ctcactgact ttcataagga tgcctaataa 12480 agggggcagg ctcacctggc ttttctcagg ggtggggttt ggggtgccga tagaggctgc 12540 tgttttggca gagtggcaag ctgcaagcct cttctgagct ttcatttttc aatggacttc 12600 agtgagaatt cactttgtca gaggccatgc agctccatgt tttggatttc atggaatgag 12660 ctttcaacag tgagcctgaa gtgccctggc tgaacagcaa gaacaccagc caaccctaaa 12720 caaggccgag gagaggcggc tgtgtttaca cggaaggctc agccttgctg taatagcgtc 12780 tgccttcacc agacatcagt gaggcgtgga aatctattat ccagttaatt ttgcccctag 12840 ataaagactt gctttcgtgt cttctctttc acagtcccat gatctgttac tcatctcaac 12900 tgcgagaagt tggctgggct ttcccctgtg cccagtgcca cactcgtgcc ttcactgggt 12960 cacctgtgcc tgtggctgat gccgctgagg ttttgcctgc ccagactggg tgtttctgac 13020 taaatcccac agccaccatt ttagatcaag ggcaggagat agctcactgc tccggaatga 13080 cctcccctcc cagaatcctg gtaggggcgg aaggtcccca accaagctcc cagccctttc 13140 taaatgaatc tccctgcttc acccatgtgc ttttctccag tctctgcggt cttgatgaca 13200 gcagggtatt agtcctagct gtcccacagc tcctacttct ttcaggcctc tccctgtgac 13260 aatcagtagc cactggcagg atttcctcag agcatatctc gatttgcttt cagacaatta 13320 gttaaaagga cactggaccc cagacgtccc aactcccagc cagagccctc acaggcccgg 13380 cctttggtgg tgaggaaggg ggagggagtg agtgacagtg ccctggcatc ttttagaaac 13440 gaattccttt ctctccatac ataaatgcct gcagagtccc atttcagaat ccggcagaca 13500 aagccaccaa tgtgatcccc atgaccttat aaacattcat taaaatgcat ttcaaggcat 13560 gtgatggcct ccccaccccc tagataatga gaaaacaaag gtttctcttc tgatagagac 13620 aagttcagct ctgaagtcaa cattatttct ggttctgtct gaacaatgac atatggcaac 13680 tcttcccttt ctatagttct agtccagaat gacaaaaaag gggaaaaatt tcttagagaa 13740 ggtagagatt atacgaatac agtccatgaa atgagcataa ggagaataaa gaatataact 13800 tatccaaaga agtctggcag gctgttataa atgcttgatt ttggacactg tagttggagg 13860 tttaacatgg acaccaataa aaaggtcagc aaagggtatg cactgttcct attgggcaag 13920 aagataggag gtcaaaggta accaggaaag ataaactcag ggagacttat tttccctcca 13980 gagggcactg ggcttgtagg ccctgggcaa aattgtcaaa aaggtgaaaa tcgcctgtgg 14040 tttatttagt ctgctctttc ttcactagtg cctcaccagt tcagttcagg ccaatttgct 14100 aggaattcta ccgggtaggg gaggcgcttt cccaaggcag tctggagcat gcgctttagc 14160 agccccgctg ggcacttggc gctacacaag tggcctctgg cctcgcacac attccacatc 14220 caccggtagg cgccaaccgg ctccgttctt tggtggcccc ttcgcgccac cttctactcc 14280 tcccctagtc aggaagttcc cccccgcccc gcagctcgcg tcgtgcagga cgtgacaaat 14340 ggaagtagca cgtctcacta gtctcgtgca gatggacagc accgctgagc aatggaagcg 14400 ggtaggcctt tggggcagcg gccaatagca gctttgctcc ttcgctttct gggctcagag 14460 gctgggaagg ggtgggtccg ggggcgggct caggggcggg ctcaggggcg gggcgggcgc 14520 ccgaaggtcc tccggaggcc cggcattctg cacgcttcaa aagcgcacgt ctgccgcgct 14580 gttctcctct tcctcatctc cgggcctttc gaccgttgat ccggtggtgg tgcaaatcaa 14640 agaactgctc ctcagtggat gttgccttta cttctaggcc tgtacggaag tgttacttct 14700 gctctaaaag ctgcggaatt gtacccgcgg aattaatacg actcactata gggactagta 14760 ccatgggaaa atcaaaagaa atcagccaag acctcagaaa aagaattgta gacctccaca 14820 agtctggttc atccttggga gcaatttcca aacgcctggc ggtaccacgt tcatctgtac 14880 aaacaatagt acgcaagtat aaacaccatg ggaccacgca gccgtcatac cgctcaggaa 14940 ggagacgcgt tctgtctcct agagatgaac gtactttggt gcgaaaagtg caaatcaatc 15000 ccagaacaac agcaaaggac cttgtgaaga tgctggagga aacaggtaca aaagtatcta 15060 tatccacagt aaaacgagtc ctatatcgac ataacctgaa aggccactca gcaaggaaga 15120 agccactgct ccaaaaccga cataagaaag ccagactacg gtttgcaact gcacatgggg 15180 acaaagatcg tactttttgg agaaatgtcc tctggtctga tgaaacaaaa atagaactgt 15240 ttggccataa tgaccatcgt tatgtttgga ggaagaaggg ggaggcttgc aagccgaaga 15300 acaccatccc aaccgtgaag cacgggggtg gcagcatcat gttgtggggg tgctttgctg 15360 caggagggac tggtgcactt cacaaaatag atggcatcat ggacgcggtg cagtatgtgg 15420 atatattgaa gcaacatctc aagacatcag tcaggaagtt aaagcttggt cgcaaatggg 15480 tcttccaaca cgacaatgac cccaagcata cttccaaagt tgtggcaaaa tggcttaagg 15540 acaacaaagt caaggtattg gagtggccat cacaaagccc tgacctcaat cctatagaaa 15600 atttgtgggc agaactgaaa aagcgtgtgc gagcaaggag gcctacaaac ctgactcagt 15660 tacaccagct ctgtcaggag gaatgggcca aaattcaccc aaattattgt gggaagcttg 15720 tggaaggcta cccgaaacgt ttgacccaag ttaaacaatt taaaggcaat gctaccaaat 15780 actaggggcc ctaaccgcgg ggatcaacgc ctagagctcg ctgatcagcc tcgactgtgc 15840 cttctagttg ccagccatct gttgtttgcc cctcccccgt gccttccttg accctggaag 15900 gtgccactcc cactgtcctt tcctaataaa atgaggaaat tgcatcgcat tgtctgagta 15960 ggtgtcattc tattctgggg ggtggggtgg ggcaggacag caagggggag gattgggaag 16020 acaatagcag gcatgctggg gatgcggtgg gctctatggc ttctgaggcg gaaagaacca 16080 gctgggggtt acctactttc tttatgtttt aaatgcactg acctcccaca ttcccttttt 16140 agtaaaatat tcagaaataa tttaaataca tcattgcaat gaaaataaat gttttttatt 16200 aggcagaatc cagatgctca aggcccttca taatatcccc cagtttagta gttggactta 16260 gggaacaaag gaacctttaa tagaaattgg acagcaagaa agcgagatta gatccctatt 16320 atttttgaca ccagacaagt tggtaatggt agcgaccggc gctcagttgg aattcgctag 16380 ccgcacatac agctcactgt tcacgtcgca cctatatctg cgtgttgcct gtatatatat 16440 atacatgaga agaacggcat agtgcgtgtt tatgcttaaa tgcgtactta tatgcgtcta 16500 tttatgtagg atgaaaggta gtctagtacc tcctgtgata ttatcccatt ccatgcgggg 16560 tatcgtatgc ttccttcagc actacccttt agctgttcta tatgctgcca ctcctcaatt 16620 ggattagtct catccttcaa tgctatcatt tcctttgata ttggatcata tgcatagtac 16680 cgagaaacta gtgcgaagta gtgatcaggt attgctgtta tctgatgagt atacgttgtc 16740 ctggccacgg cagaagcacg cttatcgctc caatttccca caacattagt caactccgtt 16800 aggcccttca ttgacagaaa tgaggtcatc aaatgtcttc caatgtgaga ttttgggcca 16860 ttctttatag caaagattgg ataaggcgca tttttcttca aagccttgtt gtacgatctg 16920 actaagttat cttttaataa ttggtattcc tgtttgttgc ttgaagaatt gccggtccta 16980 tttactcgtt ttaggactgg ttcagaattc ctcaaaaatt catccaaata tacaagtgga 17040 tcgatcctac cccttgcgct aaagaagtat atgtgcctac taacgcttgt ctttgtctct 17100 gtcactaaac actggattat tactcccaga tacttatttt ggactaattt aaatgatttc 17160 ggatcaacgt tcttaatatc gctgaatctt ccacaattga tgaaagtagc taggaagagg 17220 aattggtata aagtttttgt ttttgtaaat ctcgaggtat actcaaacga atttagtatt 17280 ttctcagtga tctcccagat gctttcaccc tcacttagaa gtgctttaag cattttttta 17340 ctgtggctat ttcccttatc tgcttcttcc gatgattcga actgtaattg caaactactt 17400 acaatatcag tgatatcaga ttgatgtttt tgtccattgt aaggaataat tgtaaattcc 17460 caagcaggaa ttaatttctt taatgaggct tccagaattg ttgctttttg cgtcttgtat 17520 ttaaactgga gtgatttgtt gacaatatcg aaactcagcg aattgcttat gatagtatta 17580 tagctcatga atgtggctct cttgattgct gttccgttat gagtaatcat ccaacataaa 17640 taggttagtt cagcagcaca tgatgctatt ttttcccctg aaggtctttc aaacctttcc 17700 acaaactgac gaaccaggac cttaggtggt gttttacata atatatcaaa ttgtggcatg 17760 gtggaagctt ggcatgggaa ttcctcacga cacctgaaat ggaagaaaaa aactttgaac 17820 cactgtctga ggcttgagaa tgaaccaaga tccaaactca aaaagggcaa attccaagga 17880 gaattacatc aagtgccaag ctggcctaac ttcagtctcc acccactcag tgtggggaaa 17940 ctccatcgca taaaacccct ccccccaacc taaagacgac gtactccaaa agctcgagaa 18000 ctaatcgagg tgcctggacg gcgcccggta ctccgtggag tcacatgaag cgacggctga 18060 ggacggaaag gcccttttcc tttgtgtggg tgactcaccc gcccgctctc ccgagcgccg 18120 cgtcctccat tttgagctcc ctgcagcagg gccgggaagc ggccatcttt ccgctcacgc 18180 aactggtgcc gaccgggcca gccttgccgc ccagggcggg gcgatacacg gcggcgcgag 18240 gccaggcacc agagcaggcc ggccagcttg agactacccc cgtccgattc tcggtggccg 18300 cgctcgcagg ccccgcctcg ccgaacatgt gcgctgggac gcacgggccc cgtcgccgcc 18360 cgcggcccca aaaaccgaaa taccagtgtg cagatcttgg cccgcattta caagactatc 18420 ttgccagaaa aaaagcgtcg cagcaggtca tcaaaaattt taaatggcta gagacttatc 18480 gaaagcagcg agacaggcgc gaaggtgcca ccagattcgc acgcggcggc cccagcgccc 18540 aggccaggcc tcaactcaag cacgaggcga aggggctcct taagcgcaag gcctcgaact 18600 ctcccaccca cttccaaccc gaagctcggg atcaagaatc acgtactgca gccaggggcg 18660 tggaagtaat tcaaggcacg caagggccat aacccgtaaa gaggccaggc ccgcgggaac 18720 cacacacggc acttacctgt gttctggcgg caaacccgtt gcgaaaaaga acgttcacgg 18780 cgactactgc acttatatac ggttctcccc caccctcggg aaaaaggcgg agccagtaca 18840 cgacatcact ttcccagttt accccgcgcc accttctcta ggcaccggtt caattctagt 18900 atcgataaat aggggattac ttgaacatag actgtgggat ccggtgtgga gtgcgggaga 18960 ctagcaaagt gaatcctgag agtagcaggt ctgcacctgt tggatcgaga aaggcggcct 19020 acaattctgg tcaaatgagc tgtgcttatt gacatattct attagagagt actaccaggt 19080 caccagtcac cagaaaggct gccagctctc caaccacctc cagggaacta tcctgaatgg 19140 ggccttaaca agtctaagag agggttggtt tgggtcccaa gccaatattt gctctgcttt 19200 atgtcagtca tatggaaccc aaaccaaccc tctcctatgt gcctcaccag tcggtgcagg 19260 gatcccaatt tcaagtttgg ttttttatgg tcaaagtcca gcatagatta aatgaagggg 19320 tgtgatgatg gtgttaaaag agaactccag accagtttaa ctcttggaca cacatcccat 19380 ctcaccatgg tgcttccaac cttccagaga tgatgggctc ctattttctg atgacaaagc 19440 cctccacagg attgctgcct ggccatcagg gagtgcctct gtaactgagg ctgagatccc 19500 actttcagtc ctccagctgt ggcccatccc tgctccgccc accgggtatg gcctgtccta 19560 ggctcttagg tatggctgca ttgtgaaatg atggctacag agctggcatc tcctgtagtc 19620 tggttcatct agtgcactac ctcatagtta aaagaaatct gtttaagcca ctgagggtgg 19680 ctcctagtgc caactccaag aacaggaagc ttcccttttt tgggaggagg ggcagatggt 19740 aacatggatc gtccaggtca atgggagcag ggcaaccaca gtaagtactg gacaacaaca 19800 caaaactcca tgtgtggctt ccatcgagtc cctctccaat tggtttggtc ttctccgtcc 19860 catgcagcac tttagcaagg ggcctggctg aaggctatga attgtgtgga gcctcctcat 19920 tgcagtctcc aaccatctga tgctgggaaa atgtcaccag gatgcagcca tgccgtgtgg 19980 ccaatgaacc gagaaaacac cccttttcta gaatgctcta aagaggcaga ataatccaga 20040 ggtgaggaag gaaatactcc accagagacc caggcagttc ctacaaaagc cagactttcc 20100 ttcacctagg gagtgacaag accagtggaa aacactctca agcagtaacc cccaaatgct 20160 ctgcaagcca gtggcgtcca gataccgcac aagcgagtgg gctgtctaat cccatcatca 20220 tgatgtaaat atctctaggc tgccctgggc tgtgcctgac cctgtcttca gctttccaca 20280 cctccaccta cagcccatgc acagaaggac cacccaggaa tgctgcaagt gtggcacctc 20340 cagggccacc cagggagaag gagggcagct atgctggtgg ctccaggccc atttggcggg 20400 tggtaccttc acaccacaaa gcccaaactg aggccccaga tttggctgat gagggcatat 20460 tggacagggg tcacttatgc tcttccccat tgccacctgg cctctggcta cctggacttg 20520 gctacctgtg gatcctctca caggtgccac catcttggct gagtctccag atgcgaggtc 20580 cctgaggcag tggcgggctt ctcgctaatg ctgatgggat taggaatggg ataggtgggg 20640 agggccctgg actgggccct gatgagccaa gtgggttttt agaggggcta ctggtacatt 20700 tcagggacag gacatctggt agagctaagc tggggcaata aggagccact gctaatctga 20760 gagctagaaa caatcagctt ctgggtcatt attaattagg gtagtttggg ctgtgtggaa 20820 gtcacgtact atatggggta gccacagctc tctctacaga taatctctaa gacttctgat 20880 tgggactgtg tgaatgcagt agcaatatct cttcttactg ccaggccctg ccagtcctgc 20940 ctccacgccc tggctggccc cccttatgat ctgacccatg ccaggctgcc atagtatgtt 21000 acttctgcat tagcactcct tgggacctgc ctctccactg tccctcagac tttaaagaac 21060 tatacaaacc caaggggctc ttcccaagag aattgatatg acttgaggtg attccatttc 21120 tggaagtagt cactccattt tctgcctcac tctttcagtg cttcacagag caggttcgaa 21180 cgaaggagcc atccaactaa ccgtcatgtt cgggcaaccg aagaagggag tggcaggatt 21240 tcctttggag acttctggaa ttagacagca gtttaatgca agcatctaaa ttctctccct 21300 cccagagtct cattaaaact acagtaagag tttgtgtttt gttttgtttt taaagacaaa 21360 atcccaccag gatagagaga ataggagagg agataacagc atcataattt atgaaactaa 21420 aatgcagata gaccaggatt aactgactac acagcaccaa ggaagctgaa tcacaagaca 21480 gcagaggaga aaactggaaa ggatcgtggt ctatacggca gaatcttccc aagcctcagg 21540 aggaggagct ctagatgttc ccagatctgg gaggtaaagt ggaatggggg gacatggtca 21600 gcgtaatggg gttgggctgg aagcaggtta aggagcaggc agatctctga atcccctctc 21660 tgactctgtg tccccaggca tctgcctgtc ccccaccctg gaagaggtct ggcttgaccc 21720 tttgtctggt gaatttcctg ctctgctttc ctggtcctgc tggccggatc agtggaggcc 21780 actcacttca ccccacaggg atgttctgtg ttgccctaca cctgggaact ggaggtactg 21840 gaggcaggct gtggtgagct tgaaagcaaa acacagaggg cagtccaatc tctttggcca 21900 tatttcttct gcatatccaa taccatgtcc acaactctgc tagtgtcctg atggtggtgg 21960 gctctacaca ttcccgggaa gctgaaggca gataatgacc aggacaggtc aacctctctt 22020 cttctgaaag ccttcatcta ctaatggcct gggactcttc ccttaaatgc ttagattgtg 22080 tcttccacta aggttttttg ctgttgctgt tgtttgtttg tttgtttgtt tgtttgtttg 22140 tttgttttga gacggaatct cactctgtcg cccaggctgg agtgtagtgg cacaatctca 22200 gctcaccaca accttcacct cctaggttga aggggttctc ctgcctcagc ctcctgtgta 22260 gctaggatta caggcacatg ccaccatgcc tggctaattt ttgtattttt ggtagagaca 22320 ggatttcgcc atgttggcca ggctggtctt gaactcctga cctcaggtga tctgcctacc 22380 ttggtctccc aaagtgctgg gattacaggt gtgagccacc acacccggcc aaggtttttg 22440 tttgtttgtt tgtttgtttg tttgttttgt attgaggcag ggtatcactc tggtcaccca 22500 ggctggagtg cagtagtgca atcacggctc actgaaacct ccacctccct ggcgggctca 22560 ggtgatcctg ccacctcagc ttcccaggta gctgggacta caggcttgta ccaccactcc 22620 cagctaattt ttgcgttttt agtagagaca gggtttcccc atgttgccca ggttggtctc 22680 aaactctggg ctcaagcgat ctgcctgcct cagcctccca aagtgctggg attacaggtg 22740 taagccaccg tacccggccc cgccactaag gttttgaaaa tgaagcaatt acaagtttaa 22800 gtctattaat aagtgatgaa gccatgtaga aaagcagaat aattatcttg gatcaggaag 22860 gtcacatgag gatctacttg ggggttgtca atattctatt tcttgacctg atcagtgttg 22920 acagcaggtt ttaatttttt acttcttttt gtttgtttgt ttttgagacg gagtcttgct 22980 ctgtctccca ggctggagtg cagtggtatg atctcggctc actgcaacct ccgcctcctg 23040 ggttcaagct gttctcctgc ctcagcctcc ccagtagctg ggattacagg caggcaccac 23100 cacgaccagc taatttttgt atttttagta gagactgggt ttcaccatct tggccaggct 23160 ggtctcgaac ttctgatctc gtgatccgcc ctccttggcc tcccaaagtg ctgggattac 23220 aggcttgagc cagcgtgccc ggcccatttt ttacttcctt attaaactgt acatataggc 23280 cttgcacact tttctgcatc aatgttatat tccacaataa agggaaaagg tatatacaca 23340 acttgatacc agtaatgtga aacatatatt tctacataga aaaaaaaatg actgaaatac 23400 tgcactccaa tgtgttcaca cagtagttgt ttctggatta tttatatatt aaatgtttat 23460 atattgtatt atgccatgag gtttgtgttt tctctccact tttctgcatt ttccaagttt 23520 actacaaaga gcacatatta ctcttataat cagaaagtca taaaatatat ttaaaaagac 23580 aaaattgaaa ctaataagga tcaacacaaa acagatgagc catctgtgga aatccgcaca 23640 gaatactacc taaagagatt ggtgacgtgc atgatctcac taggatgagc acaaagcttg 23700 ccagagccta gggtctattt ctagggttgg ctcttggaag ccaggatagt tgttatctct 23760 gggaagaggg aggggcacac aaggggcttc taaaacattc tgaatgttct atttctgaac 23820 ctggttggtg ggtacatgac tgttggtttt attattatat gttttatata ctcttccgta 23880 tgtatggtgt ggattccaaa aaaagatttc ctttagagaa aaccagaatc acataagtag 23940 aaaatatggt gctatgttga aggaacaact caagtttata taaaatcatc atcatttata 24000 ggcttaaaaa gttgctttgg aattttggtc taactgactt gtcttttctg cagcaaacca 24060 cgctccttct ggacgtgctc caggcagagg ggattagggt gggttcaagg ctgcaagtac 24120 ctagctcagc acactctctt caggggactt agagtttgtc tggtgttggc tctctgagct 24180 cttgtcagga atgccgaccc ttccgaggtt caggatttga agcctgcctt cccaccccag 24240 atttggtcca cacagacact caagtatgta tttcaactac aaatgacctg tactttccta 24300 ttactcctct ctttcatggt aacctttctg gtatccttcc ttccctacat ttatgggagg 24360 gggacatcat tctctgctct cctgtcactg aaggctccac cttctgtctt cttctgaccc 24420 atctggtttt cctggggcca cctcctctcc ttaccaccct aacgcttttg taacttgagg 24480 agaaatgaga gatcacctag tcaggtcatc attctctgta gatgaagagg cccaatggtt 24540 tgctcaagaa ttgccaagcg agttaaagac agagagtatg agagtcagca agacctacag 24600 aaagcatcta tctgcactgt tttgcaggga cttagccttt gtgtgtggac tcctggaatg 24660 ccacccacta agaaacattg tctgacacca actccccact tggtaggtgg ggacactgaa 24720 actcatggca ggaaagggcc ttgccccaag ccagggcaga gtgtcactca tcactctcaa 24780 ttttcagtcc agggcacctt gttgtgacta tcccaaaggc agccactttc cctggtctga 24840 aagacctgaa gagagaagag aagagaagga tggaaggcag agtatgcggc tttgattcat 24900 ttcctggtga aaacagatct atacgagaag caaatttcac gaaagggaag agaagaaagt 24960 gtcccatacg ttgctggcct gtttcaacct tgctttgatt cttgctgaaa agggtaccgt 25020 gtatttctga gttcaacatg cagaccagtg ttaggaaagc cactgcacct ccactttagc 25080 ctccagggct gtgccctgca aatggcctgc agccttggtg cctcgctctc cagactgcat 25140 tttggaagat gggacagagg cttatggaag cccacattag aacgggggag cagaatgggt 25200 gagatgaggg atccttgata gtgaaccaga tgaaggaatg gtagccaaat gccaggcctc 25260 ctttgtggct tcaatccaaa ggctctggag cccttccagg gcagaacatc aggcatgttt 25320 acccccactg tcctcaacag tgacagaggt gcaatcttgg gcagctggcc attttgaaag 25380 caacctcctt aatctcaact gggaaggctc cctagcagga cccctgtgtt gcacacctgg 25440 aggaagctag actaaccaga agctcagcac ggttccatct gggatgccca ggtctgagac 25500 gaaaaaggta actctctttt ctgggtcctg gcccagttgt gtctctctcc acctcattct 25560 ctgagatgcc tgtctcccct tttttgtccc atcaggaggc aagagctatc actgggccag 25620 actccaccag aagccaagcc agcttgttac ccagcttctc agggagcaaa gaacagcctt 25680 gtttctatct tatccccact gtcccctgcc cctgccccac ctcccagcca ttcagcttct 25740 ggcttcccca gagctgcctg cttctttgtg gtcctccatt ccttgaaaag accttctagt 25800 cattagtgta tataaatggc cacttagccc agattacagt gaggtcaaca gctggggctc 25860 tgagaattgt cacacactgg cacaggagag gaggctattc ttccagagaa tttggagggc 25920 actcccatcc acttacaaca aaaagcccat ccactgtgct tggcagtagg tgatctgaga 25980 accaatggaa ccaggttaat cctgtggcac tgttgagtga ggagagcagt ggcgggcact 26040 ggaaaatatc agagacaagg caggagacct gaaatctagg cttagctcct catatacttg 26100 gcagctgtat gacctcagac aaccagtgtt acctctctaa gcctcagttt cctcatgcaa 26160 aaggaggggg aataacaaca gagcccactg cttgggggtg ttgtgaggac aggatgaaaa 26220 aacaaacaga aatccctcag tacaggattc agtgcagtgg acagtcttgc aaggtctggt 26280 tcagccctcc acccctaccc tcaccagtat aaagaactct ggcctacaag tcagatgacc 26340 tgagttttaa tctcagcttt gccattagcc gtgtgaactt gagaaagtcc ctttcctttt 26400 tacatctatt gggatgatca tgcatttttt gtcctttatt ctgttaatat agtgtgttac 26460 attgattgct tttcatagac tgaaccagcc ttgtattcca gggataaatc tcacttggtc 26520 atggtgtata atcctttata caaatgttgc tgggttgagt ttgctagtat tttgttgaag 26580 atttttatgt cttgattcat aaggaatatt ggtgtacctt ccccttttat ggccacagtt 26640 tccctacaat gatgtagtcg aactagacaa cctccaatat ctttcagtat tcatgtcctc 26700 tgattctgtg aaactaagaa aattaagaaa tagtgattca taggcacaag gcaggcaaaa 26760 cttagactcc ttgtagaata attaggaagc caaatattca gtgtgcttat ttctcaaata 26820 accttagttt ctccagtctg ccccaactcc gaggcctgaa tatctctaga tgcttatgat 26880 ggcaactaaa gcctaaaagc taattcattt taaagttctt ccaaatgcat agggttttat 26940 ttttccagac ctgggttcag atggggaatt tgacaaacaa tggaaagggg gaaaaacaac 27000 aatctaaaca ctgagtgaca aagtaacaaa gaaatagtct agctatcagc cagtcaagcc 27060 agccttggct ttgctatcca aagtagtcag tctaattcta ccaccagttt ctgttcctgt 27120 agctgtctac tgcctgccag ggactctgcc ttcccaccca caactaccaa tggaaggatg 27180 tggtgaccat accagtggct gctgacatct cctgccatgg gaagcataat tgcctccagc 27240 agcctccccc ttagatccat catttttgtt gcacttggcc tgggctgtac tcccggccaa 27300 tgactgaaca tggtgagcat agtaatgcag gcccatttct gtgaggagca ggactcctcc 27360 agtaggtgac tttggctcaa ggactctcta ttggcctggt tgaacttttc ctgaactgtg 27420 ctactgtctg agactcttct tacccaatcc tctttctcgc cccaattgtc acagaccacc 27480 tgcattgtgg tctgagtctc tccccacctt ctcttgctct tccctgttta tctttcacag 27540 gcatttcccc cagtacattc cttgaatgtc taacccgata cgggtgcctg acttttggca 27600 gacctaagca gacaaaaagg agtacttggt tacctagctc ttctttctac cacaaacatc 27660 gagggaaccc tttttccctc acccctctgc cacaccccca ctgccccagt gaacaaccac 27720 agagagagct gtggtataat attaggctgg tgcaaaagta attgcggttt ttgccattac 27780 ttttaatggt aaaaaccgca attacttttg cacctaccta gtatttgtgt ccccccaaat 27840 tcatatgttg aaacctaacc cacaatatga tgtcattagg aggcaagacc ttgaggaggt 27900 gattagatga tggggtggag ctctcctgaa tgagattagt gcccttataa gaagaagccc 27960 aaggaagcta ccttgactct tccatcacat gagaatgcag caagaaggca ccatctacta 28020 atcaggaaga gagctctcac cagacactga atctgccagt gtcttgatct tgaagttccc 28080 agcctccaga actatgcata atgcatttcc attgtctcta agccacccag cctatggtat 28140 tttgtcatag cagcctgaac tgactaagac agtgagccac atgagaagtg ccccaacccc 28200 tcccttaagc acttggctca cagatcagtg ggttcatttc tgcctgagtt ttattgttat 28260 tctgtagatt tcttgggcta gatatatttt tctgttattt tccttcttca cctcagtcat 28320 gaattggttg ttttaaaaaa gacaatgtaa gtcatgggga aactcctgac aactctactc 28380 tcctagggtt cctgataaaa ggggattcag ttgagtcctc tgatggtctc tacctgccaa 28440 agtccagcag cccttagcaa acatgctgct cgtttctgta gagaaggtgc tggtgtccca 28500 ccatacttct ctctccctca tgaagggctt gcgacccagc aaatgggtgg cttatatggg 28560 tctgtttcaa aggaagagcc agctctggga agaaaaacga tgagcataag cataacctac 28620 cactgtgcct gggaaagcag acaacttttt tgatgtgtga atatctaatg agaatggaat 28680 ccatcaatta ccttaaactt aggcacagtc ttcaaattca atatatgtgg gatatacttt 28740 tagtcagttt gtagacgtta tttgtaataa ataatctggc ttctctaaag aaattatttt 28800 aagtgtttgg tttggtttga tttaatggta aaattatatt tagtggcaga gaattatagc 28860 aatggtgata aactatagag tgtcataagt tcatatctta ttctcacatt tgaagctgcc 28920 tgcagatgca ttcaagatgc agccagaagt caggagactc aggctgttat ttggagctca 28980 tcattttaca gccttgctgg actcccactt tctcagggga aaaatgtggt gttgacccag 29040 attagctctc caggccctgc tgagttgggc actctgtaag ctggagggtc ttctattgtc 29100 ttcacctaag tgtcaatcaa caacccaaat gggcatgggg gaagagggag ctgggccaat 29160 gcccagggtg cctggtagag agataccttg ggcactggaa ggcaccagct tcccagagag 29220 aagggggagg gccatgaaaa agttggctgt agatgccagg gacactggga ctctccagct 29280 gtgtgtttgt gtcttctgaa gacttatgtt tcattccttt ggagcatgca taatcataca 29340 ctgtgggatg tgttatatag attgcttgat agttcaccac tgtaataaaa tactgtgact 29400 ggaatctgct cccagtctgc ctttgatagc acttgtgcaa cacacattta ctgagcattt 29460 acagtgatcc aggacctgtg ttgtgaaaac attgatggac aaggcagatg gtggagcacg 29520 tcagtgagga tttttaacaa aggctggtaa gtgctataaa ggaacattgt aggacactag 29580 agaacaaaga acaggagaac ctgacttagg ctggggtggg gcgttggtta gaggaggctc 29640 cttggaggac atgaggttta agctgtgacc tgaggatgaa tagatgttgg ccaggtgagg 29700 taccggtatt tgtcagcctt accagtaaaa aagaaaacct attaaaaaaa aaatacacat 29760 acaaagcctc atcagccatg gcttaccaga gaaagtacag cgggcacaca aaccacaagc 29820 tctaaagtca ctctccaacc tctccacaat atatatacac aagccctaaa ctgacgtaat 29880 gggactaaag tgtaaaaaat cccgccaaac ccaacacaca ccccgaaact gcgtcaccag 29940 ggaaaagtac agtttcactt ccgcaatccc aacaagcgtc acttcctctt tctcacggta 30000 cgtcacatcc cattaactta caacgtcatt ttcccacggc cgcgccgccc cttttaaccg 30060 ttaaccccac agccaatcac cacacggccc acacttttta aaatcacctc atttacatat 30120 tggcaccatt ccatctataa ggtatattat tgatgatg 30158 <210> 290 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> PE-labeled H-2Dq/RNEU420429 (H-2D(q) <400> 290 Pro Asp Ser Leu Arg Asp Leu Ser Val Phe 1 5 10 <210> 291 <211> 594 <212> PRT <213> Trichoplusia ni <400> 291 Met Gly Ser Ser Leu Asp Asp Glu His Ile Leu Ser Ala Leu Leu Gln 1 5 10 15 Ser Asp Asp Glu Leu Val Gly Glu Asp Ser Asp Ser Glu Ile Ser Asp 20 25 30 His Val Ser Glu Asp Asp Val Gln Ser Asp Thr Glu Glu Ala Phe Ile 35 40 45 Asp Glu Val His Glu Val Gln Pro Thr Ser Ser Gly Ser Glu Ile Leu 50 55 60 Asp Glu Gln Asn Val Ile Glu Gln Pro Gly Ser Ser Leu Ala Ser Asn 65 70 75 80 Arg Ile Leu Thr Leu Pro Gln Arg Thr Ile Arg Gly Lys Asn Lys His 85 90 95 Cys Trp Ser Thr Ser Lys Ser Thr Arg Arg Ser Arg Val Ser Ala Leu 100 105 110 Asn Ile Val Arg Ser Gln Arg Gly Pro Thr Arg Met Cys Arg Asn Ile 115 120 125 Tyr Asp Pro Leu Leu Cys Phe Lys Leu Phe Phe Thr Asp Glu Ile Ile 130 135 140 Ser Glu Ile Val Lys Trp Thr Asn Ala Glu Ile Ser Leu Lys Arg Arg 145 150 155 160 Glu Ser Met Thr Gly Ala Thr Phe Arg Asp Thr Asn Glu Asp Glu Ile 165 170 175 Tyr Ala Phe Phe Gly Ile Leu Val Met Thr Ala Val Arg Lys Asp Asn 180 185 190 His Met Ser Thr Asp Asp Leu Phe Asp Arg Ser Leu Ser Met Val Tyr 195 200 205 Val Ser Val Met Ser Arg Asp Arg Phe Asp Phe Leu Ile Arg Cys Leu 210 215 220 Arg Met Asp Asp Lys Ser Ile Arg Pro Thr Leu Arg Glu Asn Asp Val 225 230 235 240 Phe Thr Pro Val Arg Lys Ile Trp Asp Leu Phe Ile His Gln Cys Ile 245 250 255 Gln Asn Tyr Thr Pro Gly Ala His Leu Thr Ile Asp Glu Gln Leu Leu 260 265 270 Gly Phe Arg Gly Arg Cys Pro Phe Arg Met Tyr Ile Pro Asn Lys Pro 275 280 285 Ser Lys Tyr Gly Ile Lys Ile Leu Met Met Cys Asp Ser Gly Thr Lys 290 295 300 Tyr Met Ile Asn Gly Met Pro Tyr Leu Gly Arg Gly Thr Gln Thr Asn 305 310 315 320 Gly Val Pro Leu Gly Glu Tyr Tyr Val Lys Glu Leu Ser Lys Pro Val 325 330 335 His Gly Ser Cys Arg Asn Ile Thr Cys Asp Asn Trp Phe Thr Ser Ile 340 345 350 Pro Leu Ala Lys Asn Leu Leu Gln Glu Pro Tyr Lys Leu Thr Ile Val 355 360 365 Gly Thr Val Arg Ser Asn Lys Arg Glu Ile Pro Glu Val Leu Lys Asn 370 375 380 Ser Arg Ser Arg Pro Val Gly Thr Ser Met Phe Cys Phe Asp Gly Pro 385 390 395 400 Leu Thr Leu Val Ser Tyr Lys Pro Lys Pro Ala Lys Met Val Tyr Leu 405 410 415 Leu Ser Ser Cys Asp Glu Asp Ala Ser Ile Asn Glu Ser Thr Gly Lys 420 425 430 Pro Gln Met Val Met Tyr Tyr Asn Gln Thr Lys Gly Gly Val Asp Thr 435 440 445 Leu Asp Gln Met Cys Ser Val Met Thr Cys Ser Arg Lys Thr Asn Arg 450 455 460 Trp Pro Met Ala Leu Leu Tyr Gly Met Ile Asn Ile Ala Cys Ile Asn 465 470 475 480 Ser Phe Ile Ile Tyr Ser His Asn Val Ser Ser Lys Gly Glu Lys Val 485 490 495 Gln Ser Arg Lys Lys Phe Met Arg Asn Leu Tyr Met Ser Leu Thr Ser 500 505 510 Ser Phe Met Arg Lys Arg Leu Glu Ala Pro Thr Leu Lys Arg Tyr Leu 515 520 525 Arg Asp Asn Ile Ser Asn Ile Leu Pro Asn Glu Val Pro Gly Thr Ser 530 535 540 Asp Asp Ser Thr Glu Glu Pro Val Met Lys Lys Arg Thr Tyr Cys Thr 545 550 555 560 Tyr Cys Pro Ser Lys Ile Arg Arg Lys Ala Asn Ala Ser Cys Lys Lys 565 570 575 Cys Lys Lys Val Ile Cys Arg Glu His Asn Ile Asp Met Cys Gln Ser 580 585 590 Cys Phe <210> 292 <211> 340 <212> PRT <213> Rana pipiens <400> 292 Met Pro Arg Pro Lys Glu Ile Gln Glu Gln Leu Arg Lys Lys Val Ile 1 5 10 15 Glu Ile Tyr Gln Ser Gly Lys Gly Tyr Lys Ala Ile Ser Lys Ala Leu 20 25 30 Gly Ile Gln Arg Thr Thr Val Arg Ala Ile Ile His Lys Trp Arg Arg 35 40 45 His Gly Thr Val Val Asn Leu Pro Arg Ser Gly Arg Pro Pro Lys Ile 50 55 60 Thr Pro Arg Ala Gln Arg Arg Leu Ile Gln Glu Val Thr Lys Asp Pro 65 70 75 80 Thr Thr Thr Ser Lys Glu Leu Gln Ala Ser Leu Ala Ser Val Lys Val 85 90 95 Ser Val His Ala Ser Thr Ile Arg Lys Arg Leu Gly Lys Asn Gly Leu 100 105 110 His Gly Arg Val Pro Arg Arg Lys Pro Leu Leu Ser Lys Lys Asn Ile 115 120 125 Lys Ala Arg Leu Asn Phe Ser Thr Thr His Leu Asp Asp Pro Gln Asp 130 135 140 Phe Trp Asp Asn Ile Leu Trp Thr Asp Glu Thr Lys Val Glu Leu Phe 145 150 155 160 Gly Arg Cys Val Ser Lys Tyr Ile Trp Arg Arg Arg Asn Thr Ala Phe 165 170 175 His Lys Lys Asn Ile Ile Pro Thr Val Lys Tyr Gly Gly Gly Ser Val 180 185 190 Met Val Trp Gly Cys Phe Ala Ala Ser Gly Pro Gly Arg Leu Ala Val 195 200 205 Ile Lys Gly Thr Met Asn Ser Ala Val Tyr Gln Glu Ile Leu Lys Glu 210 215 220 Asn Val Arg Pro Ser Val Arg Val Leu Lys Leu Lys Arg Thr Trp Val 225 230 235 240 Leu Gln Gln Asp Asn Asp Pro Lys His Thr Ser Lys Ser Thr Thr Glu 245 250 255 Trp Leu Lys Lys Asn Lys Met Lys Thr Leu Glu Trp Pro Ser Gln Ser 260 265 270 Pro Asp Leu Asn Pro Ile Glu Met Leu Trp Tyr Asp Leu Lys Lys Ala 275 280 285 Val His Ala Arg Lys Pro Ser Asn Val Thr Glu Leu Gly Gln Phe Cys 290 295 300 Lys Asp Glu Trp Ala Lys Ile Pro Pro Gly Arg Cys Lys Ser Leu Ile 305 310 315 320 Ala Arg Tyr Arg Lys Arg Leu Val Ala Val Val Ala Ala Lys Gly Gly 325 330 335 Pro Thr Ser Tyr 340 <210> 293 <211> 636 <212> PRT <213> Tribolium castaneum <400> 293 Met Met Leu Asn Trp Leu Lys Ser Gly Lys Leu Glu Ser Gln Ser Gln 1 5 10 15 Glu Gln Ser Ser Cys Tyr Leu Glu Asn Ser Asn Cys Leu Pro Pro Thr 20 25 30 Leu Asp Ser Thr Asp Ile Ile Gly Glu Glu Asn Lys Ala Gly Thr Thr 35 40 45 Ser Arg Lys Lys Arg Lys Tyr Asp Glu Asp Tyr Leu Asn Phe Gly Phe 50 55 60 Thr Trp Thr Gly Asp Lys Asp Glu Pro Asn Gly Leu Cys Val Ile Cys 65 70 75 80 Glu Gln Val Val Asn Asn Ser Ser Leu Asn Pro Ala Lys Leu Lys Arg 85 90 95 His Leu Asp Thr Lys His Pro Thr Leu Lys Gly Lys Ser Glu Tyr Phe 100 105 110 Lys Arg Lys Cys Asn Glu Leu Asn Gln Lys Lys His Thr Phe Glu Arg 115 120 125 Tyr Val Arg Asp Asp Asn Lys Asn Leu Leu Lys Ala Ser Tyr Leu Val 130 135 140 Ser Leu Arg Ile Ala Lys Gln Gly Glu Ala Tyr Thr Ile Ala Glu Lys 145 150 155 160 Leu Ile Lys Pro Cys Thr Lys Asp Leu Thr Thr Cys Val Phe Gly Glu 165 170 175 Lys Phe Ala Ser Lys Val Asp Leu Val Pro Leu Ser Asp Thr Thr Ile 180 185 190 Ser Arg Arg Ile Glu Asp Met Ser Tyr Phe Cys Glu Ala Val Leu Val 195 200 205 Asn Arg Leu Lys Asn Ala Lys Cys Gly Phe Thr Leu Gln Met Asp Glu 210 215 220 Ser Thr Asp Val Ala Gly Leu Ala Ile Leu Leu Val Phe Val Arg Tyr 225 230 235 240 Ile His Glu Ser Ser Phe Glu Glu Asp Met Leu Phe Cys Lys Ala Leu 245 250 255 Pro Thr Gln Thr Thr Gly Glu Glu Ile Phe Asn Leu Leu Asn Ala Tyr 260 265 270 Phe Glu Lys His Ser Ile Pro Trp Asn Leu Cys Tyr His Ile Cys Thr 275 280 285 Asp Gly Ala Lys Ala Met Val Gly Val Ile Lys Gly Val Ile Ala Arg 290 295 300 Ile Lys Lys Leu Val Pro Asp Ile Lys Ala Ser His Cys Cys Leu His 305 310 315 320 Arg His Ala Leu Ala Val Lys Arg Ile Pro Asn Ala Leu His Glu Val 325 330 335 Leu Asn Asp Ala Val Lys Met Ile Asn Phe Ile Lys Ser Arg Pro Leu 340 345 350 Asn Ala Arg Val Phe Ala Leu Leu Cys Asp Asp Leu Gly Ser Leu His 355 360 365 Lys Asn Leu Leu Leu His Thr Glu Val Arg Trp Leu Ser Arg Gly Lys 370 375 380 Val Leu Thr Arg Phe Trp Glu Leu Arg Asp Glu Ile Arg Ile Phe Phe 385 390 395 400 Asn Glu Arg Glu Phe Ala Gly Lys Leu Asn Asp Thr Ser Trp Leu Gln 405 410 415 Asn Leu Ala Tyr Ile Ala Asp Ile Phe Ser Tyr Leu Asn Glu Val Asn 420 425 430 Leu Ser Leu Gln Gly Pro Asn Ser Thr Ile Phe Lys Val Asn Ser Arg 435 440 445 Ile Asn Ser Ile Lys Ser Lys Leu Lys Leu Trp Glu Glu Cys Ile Thr 450 455 460 Lys Asn Asn Thr Glu Cys Phe Ala Asn Leu Asn Asp Phe Leu Glu Thr 465 470 475 480 Ser Asn Thr Ala Leu Asp Pro Asn Leu Lys Ser Asn Ile Leu Glu His 485 490 495 Leu Asn Gly Leu Lys Asn Thr Phe Leu Glu Tyr Phe Pro Pro Thr Cys 500 505 510 Asn Asn Ile Ser Trp Val Glu Asn Pro Phe Asn Glu Cys Gly Asn Val 515 520 525 Asp Thr Leu Pro Ile Lys Glu Arg Glu Gln Leu Ile Asp Ile Arg Thr 530 535 540 Asp Thr Thr Leu Lys Ser Ser Phe Val Pro Asp Gly Ile Gly Pro Phe 545 550 555 560 Trp Ile Lys Leu Met Asp Glu Phe Pro Glu Ile Ser Lys Arg Ala Val 565 570 575 Lys Glu Leu Met Pro Phe Val Thr Thr Tyr Leu Cys Glu Lys Ser Phe 580 585 590 Ser Val Tyr Val Ala Thr Lys Thr Lys Tyr Arg Asn Arg Leu Asp Ala 595 600 605 Glu Asp Asp Met Arg Leu Gln Leu Thr Thr Ile His Pro Asp Ile Asp 610 615 620 Asn Leu Cys Asn Asn Lys Gln Ala Gln Lys Ser His 625 630 635 <210> 294 <211> 649 <212> PRT <213> Oryzias latipes <400> 294 Met Glu Glu Val Cys Asp Ser Ser Ala Ala Ala Ser Ser Thr Val Gln 1 5 10 15 Asn Gln Pro Gln Asp Gln Glu His Pro Trp Pro Tyr Leu Arg Glu Phe 20 25 30 Phe Ser Leu Ser Gly Val Asn Lys Asp Ser Phe Lys Met Lys Cys Val 35 40 45 Leu Cys Leu Pro Leu Asn Lys Glu Ile Ser Ala Phe Lys Ser Ser Pro 50 55 60 Ser Asn Leu Arg Lys His Ile Glu Arg Met His Pro Asn Tyr Leu Lys 65 70 75 80 Asn Tyr Ser Lys Leu Thr Ala Gln Lys Arg Lys Ile Gly Thr Ser Thr 85 90 95 His Ala Ser Ser Ser Lys Gln Leu Lys Val Asp Ser Val Phe Pro Val 100 105 110 Lys His Val Ser Pro Val Thr Val Asn Lys Ala Ile Leu Arg Tyr Ile 115 120 125 Ile Gln Gly Leu His Pro Phe Ser Thr Val Asp Leu Pro Ser Phe Lys 130 135 140 Glu Leu Ile Ser Thr Leu Gln Pro Gly Ile Ser Val Ile Thr Arg Pro 145 150 155 160 Thr Leu Arg Ser Lys Ile Ala Glu Ala Ala Leu Ile Met Lys Gln Lys 165 170 175 Val Thr Ala Ala Met Ser Glu Val Glu Trp Ile Ala Thr Thr Thr Asp 180 185 190 Cys Trp Thr Ala Arg Arg Lys Ser Phe Ile Gly Val Thr Ala His Trp 195 200 205 Ile Asn Pro Gly Ser Leu Glu Arg His Ser Ala Ala Leu Ala Cys Lys 210 215 220 Arg Leu Met Gly Ser His Thr Phe Glu Val Leu Ala Ser Ala Met Asn 225 230 235 240 Asp Ile His Ser Glu Tyr Glu Ile Arg Asp Lys Val Val Cys Thr Thr 245 250 255 Thr Asp Ser Gly Ser Asn Phe Met Lys Ala Phe Arg Val Phe Gly Val 260 265 270 Glu Asn Asn Asp Ile Glu Thr Glu Ala Arg Arg Cys Glu Ser Asp Asp 275 280 285 Thr Asp Ser Glu Gly Cys Gly Glu Gly Ser Asp Gly Val Glu Phe Gln 290 295 300 Asp Ala Ser Arg Val Leu Asp Gln Asp Asp Gly Phe Glu Phe Gln Leu 305 310 315 320 Pro Lys His Gln Lys Cys Ala Cys His Leu Leu Asn Leu Val Ser Ser 325 330 335 Val Asp Ala Gln Lys Ala Leu Ser Asn Glu His Tyr Lys Lys Leu Tyr 340 345 350 Arg Ser Val Phe Gly Lys Cys Gln Ala Leu Trp Asn Lys Ser Ser Arg 355 360 365 Ser Ala Leu Ala Ala Glu Ala Val Glu Ser Glu Ser Arg Leu Gln Leu 370 375 380 Leu Arg Pro Asn Gln Thr Arg Trp Asn Ser Thr Phe Met Ala Val Asp 385 390 395 400 Arg Ile Leu Gln Ile Cys Lys Glu Ala Gly Glu Gly Ala Leu Arg Asn 405 410 415 Ile Cys Thr Ser Leu Glu Val Pro Met Phe Asn Pro Ala Glu Met Leu 420 425 430 Phe Leu Thr Glu Trp Ala Asn Thr Met Arg Pro Val Ala Lys Val Leu 435 440 445 Asp Ile Leu Gln Ala Glu Thr Asn Thr Gln Leu Gly Trp Leu Leu Pro 450 455 460 Ser Val His Gln Leu Ser Leu Lys Leu Gln Arg Leu His His Ser Leu 465 470 475 480 Arg Tyr Cys Asp Pro Leu Val Asp Ala Leu Gln Gln Gly Ile Gln Thr 485 490 495 Arg Phe Lys His Met Phe Glu Asp Pro Glu Ile Ile Ala Ala Ala Ile 500 505 510 Leu Leu Pro Lys Phe Arg Thr Ser Trp Thr Asn Asp Glu Thr Ile Ile 515 520 525 Lys Arg Gly Met Asp Tyr Ile Arg Val His Leu Glu Pro Leu Asp His 530 535 540 Lys Lys Glu Leu Ala Asn Ser Ser Ser Asp Asp Glu Asp Phe Phe Ala 545 550 555 560 Ser Leu Lys Pro Thr Thr His Glu Ala Ser Lys Glu Leu Asp Gly Tyr 565 570 575 Leu Ala Cys Val Ser Asp Thr Arg Glu Ser Leu Leu Thr Phe Pro Ala 580 585 590 Ile Cys Ser Leu Ser Ile Lys Thr Asn Thr Pro Leu Pro Ala Ser Ala 595 600 605 Ala Cys Glu Arg Leu Phe Ser Thr Ala Gly Leu Leu Phe Ser Pro Lys 610 615 620 Arg Ala Arg Leu Asp Thr Asn Asn Phe Glu Asn Gln Leu Leu Leu Lys 625 630 635 640 Leu Asn Leu Arg Phe Tyr Asn Phe Glu 645 <210> 295 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> IR/DR encoding sequence Sleeping Beauty <400> 295 acttaagtgt atgtaaactt ccgacttcaa ctg 33 <210> 296 <211> 370 <212> DNA <213> Artificial Sequence <220> <223> IR/DR and chromosomal sequence Sleeping Beauty <400> 296 cagtcaactt agtgtatgta aacttctgac ccactggaat tgtgatacag tgaattataa 60 gtgaaataat ctgtctgtaa acaattgttg gaaaaatgac ttgtgtcatg cacaaagtag 120 atgtcctaac tgacttgcca aaactattgt ttgttaacaa gaaatttgtg gagtagttga 180 aaaacgagtt ttaatgactc caacttaagt gtatgtaaac ttccgacttc aactgtaaga 240 atggcccatt catctatagt agcacacaat atttgcattt gtgcgacagt ataagggaca 300 attatgctat caggcatttt tccaaagtga gtaatcgaag tttttatacc tttgtgtgcc 360 atgtttgcta 370 <210> 297 <211> 369 <212> DNA <213> Artificial Sequence <220> <223> IR/DR and chromosomal sequence Sleeping Beauty <400> 297 cagtcaactt agtgtatgta aacttctgac ccactggaat tgtgatacag tgaattataa 60 gtgaaataat ctgtctgtaa acaattgttg gaaaaatgac ttgtgtcatg cacaaagtag 120 atgtcctaac tgacttgcca aaactattgt ttgttaacaa gaaatttgtg gagtagttga 180 aaaacgagtt ttaatgactc caacttaagt gtatgtaaac ttccgacttc aactgtacaa 240 gtagaccaaa tatccatata cataaaagaa aaaaatagaa aaaatttcta gtgacagaaa 300 aatgacaaag aacatactgc tttattacta ctattaagat gtttgcttcc attacactca 360 tatgagtca 369 <210> 298 <211> 227 <212> DNA <213> Artificial Sequence <220> <223> IR/DR of Sleeping Beauty <400> 298 ttagtgtatg taaacttctg acccactgga attgtgatac agtgaattat aagtgaaata 60 atctgtctgt aaacaattgt tggaaaaatg acttgtgtca tgcacaaagt agatgtccta 120 actgacttgc caaaactatt gtttgttaac aagaaatttg tggagtagtt gaaaaacgag 180 ttttaatgac tccaacttaa gtgtatgtaa acttccgact tcaactg 227 <210> 299 <211> 371 <212> DNA <213> Artificial Sequence <220> <223> IR/DR and chromosomal sequence Sleeping Beauty <400> 299 caacttgagt gtatgttaac ttctgaccca ctgggaatgt gatgaaagaa ataaaagctg 60 aaatgaatca ttctctctac tattattctg atatttcaca ttcttaaaat aaagtggtga 120 tcctaactga ccttaagaca gggaatcttt actcggatta aatgtcagga attgtgaaaa 180 agtgagttta aatgtatttg gctaaggtgt atgtaaactt ccgacttcaa ctgtatatcc 240 tccccgttgc accctcttga tgatgctgag atgaacacag atgctcactc cttgagggct 300 ctaagcttat gctgacacag acacaggtgc tcacttctat gaatggccta agatttgagg 360 acatcatgag g 371 <210> 300 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> IR/DR of Sleeping Beauty <400> 300 ttgagtgtat gttaacttct gacccactgg gaatgtgatg aaagaaataa aagctgaaat 60 gaatcattct ctctactatt attctgatat ttcacattct taaaataaag tggtgatcct 120 aactgacctt aagacaggga atctttactc ggattaaatg tcaggaattg tgaaaaagtg 180 agtttaaatg tatttggcta aggtgtatgt aaacttccga cttcaactg 229 <210> 301 <211> 1468 <212> PRT <213> Artificial Sequence <220> <223> ET3 <400> 301 Met Gln Leu Glu Leu Ser Thr Cys Val Phe Leu Cys Leu Leu Pro Leu 1 5 10 15 Gly Phe Ser Ala Ile Arg Arg Tyr Tyr Leu Gly Ala Val Glu Leu Ser 20 25 30 Trp Asp Tyr Arg Gln Ser Glu Leu Leu Arg Glu Leu His Val Asp Thr 35 40 45 Arg Phe Pro Ala Thr Ala Pro Gly Ala Leu Pro Leu Gly Pro Ser Val 50 55 60 Leu Tyr Lys Lys Thr Val Phe Val Glu Phe Thr Asp Gln Leu Phe Ser 65 70 75 80 Val Ala Arg Pro Arg Pro Pro Trp Met Gly Leu Leu Gly Pro Thr Ile 85 90 95 Gln Ala Glu Val Tyr Asp Thr Val Val Val Thr Leu Lys Asn Met Ala 100 105 110 Ser His Pro Val Ser Leu His Ala Val Gly Val Ser Phe Trp Lys Ser 115 120 125 Ser Glu Gly Ala Glu Tyr Glu Asp His Thr Ser Gln Arg Glu Lys Glu 130 135 140 Asp Asp Lys Val Leu Pro Gly Lys Ser Gln Thr Tyr Val Trp Gln Val 145 150 155 160 Leu Lys Glu Asn Gly Pro Thr Ala Ser Asp Pro Pro Cys Leu Thr Tyr 165 170 175 Ser Tyr Leu Ser His Val Asp Leu Val Lys Asp Leu Asn Ser Gly Leu 180 185 190 Ile Gly Ala Leu Leu Val Cys Arg Glu Gly Ser Leu Thr Arg Glu Arg 195 200 205 Thr Gln Asn Leu His Glu Phe Val Leu Leu Phe Ala Val Phe Asp Glu 210 215 220 Gly Lys Ser Trp His Ser Ala Arg Asn Asp Ser Trp Thr Arg Ala Met 225 230 235 240 Asp Pro Ala Pro Ala Arg Ala Gln Pro Ala Met His Thr Val Asn Gly 245 250 255 Tyr Val Asn Arg Ser Leu Pro Gly Leu Ile Gly Cys His Lys Lys Ser 260 265 270 Val Tyr Trp His Val Ile Gly Met Gly Thr Ser Pro Glu Val His Ser 275 280 285 Ile Phe Leu Glu Gly His Thr Phe Leu Val Arg His His Arg Gln Ala 290 295 300 Ser Leu Glu Ile Ser Pro Leu Thr Phe Leu Thr Ala Gln Thr Phe Leu 305 310 315 320 Met Asp Leu Gly Gln Phe Leu Leu Phe Cys His Ile Ser Ser His His 325 330 335 His Gly Gly Met Glu Ala His Val Arg Val Glu Ser Cys Ala Glu Glu 340 345 350 Pro Gln Leu Arg Arg Lys Ala Asp Glu Glu Glu Asp Tyr Asp Asp Asn 355 360 365 Leu Tyr Asp Ser Asp Met Asp Val Val Arg Leu Asp Gly Asp Asp Val 370 375 380 Ser Pro Phe Ile Gln Ile Arg Ser Val Ala Lys Lys His Pro Lys Thr 385 390 395 400 Trp Val His Tyr Ile Ala Ala Glu Glu Glu Asp Trp Asp Tyr Ala Pro 405 410 415 Leu Val Leu Ala Pro Asp Asp Arg Ser Tyr Lys Ser Gln Tyr Leu Asn 420 425 430 Asn Gly Pro Gln Arg Ile Gly Arg Lys Tyr Lys Lys Val Arg Phe Met 435 440 445 Ala Tyr Thr Asp Glu Thr Phe Lys Thr Arg Glu Ala Ile Gln His Glu 450 455 460 Ser Gly Ile Leu Gly Pro Leu Leu Tyr Gly Glu Val Gly Asp Thr Leu 465 470 475 480 Leu Ile Ile Phe Lys Asn Gln Ala Ser Arg Pro Tyr Asn Ile Tyr Pro 485 490 495 His Gly Ile Thr Asp Val Arg Pro Leu Tyr Ser Arg Arg Leu Pro Lys 500 505 510 Gly Val Lys His Leu Lys Asp Phe Pro Ile Leu Pro Gly Glu Ile Phe 515 520 525 Lys Tyr Lys Trp Thr Val Thr Val Glu Asp Gly Pro Thr Lys Ser Asp 530 535 540 Pro Arg Cys Leu Thr Arg Tyr Tyr Ser Ser Phe Val Asn Met Glu Arg 545 550 555 560 Asp Leu Ala Ser Gly Leu Ile Gly Pro Leu Leu Ile Cys Tyr Lys Glu 565 570 575 Ser Val Asp Gln Arg Gly Asn Gln Ile Met Ser Asp Lys Arg Asn Val 580 585 590 Ile Leu Phe Ser Val Phe Asp Glu Asn Arg Ser Trp Tyr Leu Thr Glu 595 600 605 Asn Ile Gln Arg Phe Leu Pro Asn Pro Ala Gly Val Gln Leu Glu Asp 610 615 620 Pro Glu Phe Gln Ala Ser Asn Ile Met His Ser Ile Asn Gly Tyr Val 625 630 635 640 Phe Asp Ser Leu Gln Leu Ser Val Cys Leu His Glu Val Ala Tyr Trp 645 650 655 Tyr Ile Leu Ser Ile Gly Ala Gln Thr Asp Phe Leu Ser Val Phe Phe 660 665 670 Ser Gly Tyr Thr Phe Lys His Lys Met Val Tyr Glu Asp Thr Leu Thr 675 680 685 Leu Phe Pro Phe Ser Gly Glu Thr Val Phe Met Ser Met Glu Asn Pro 690 695 700 Gly Leu Trp Ile Leu Gly Cys His Asn Ser Asp Phe Arg Asn Arg Gly 705 710 715 720 Met Thr Ala Leu Leu Lys Val Ser Ser Cys Asp Lys Asn Thr Gly Asp 725 730 735 Tyr Tyr Glu Asp Ser Tyr Glu Asp Ile Ser Ala Tyr Leu Leu Ser Lys 740 745 750 Asn Asn Ala Ile Glu Pro Arg Ser Phe Ala Gln Asn Ser Arg Pro Pro 755 760 765 Ser Ala Ser Ala Pro Lys Pro Pro Val Leu Arg Arg His Gln Arg Asp 770 775 780 Ile Ser Leu Pro Thr Phe Gln Pro Glu Glu Asp Lys Met Asp Tyr Asp 785 790 795 800 Asp Ile Phe Ser Thr Glu Thr Lys Gly Glu Asp Phe Asp Ile Tyr Gly 805 810 815 Glu Asp Glu Asn Gln Asp Pro Arg Ser Phe Gln Lys Arg Thr Arg His 820 825 830 Tyr Phe Ile Ala Ala Val Glu Gln Leu Trp Asp Tyr Gly Met Ser Glu 835 840 845 Ser Pro Arg Ala Leu Arg Asn Arg Ala Gln Asn Gly Glu Val Pro Arg 850 855 860 Phe Lys Lys Val Val Phe Arg Glu Phe Ala Asp Gly Ser Phe Thr Gln 865 870 875 880 Pro Ser Tyr Arg Gly Glu Leu Asn Lys His Leu Gly Leu Leu Gly Pro 885 890 895 Tyr Ile Arg Ala Glu Val Glu Asp Asn Ile Met Val Thr Phe Lys Asn 900 905 910 Gln Ala Ser Arg Pro Tyr Ser Phe Tyr Ser Ser Leu Ile Ser Tyr Pro 915 920 925 Asp Asp Gln Glu Gln Gly Ala Glu Pro Arg His Asn Phe Val Gln Pro 930 935 940 Asn Glu Thr Arg Thr Tyr Phe Trp Lys Val Gln His His Met Ala Pro 945 950 955 960 Thr Glu Asp Glu Phe Asp Cys Lys Ala Trp Ala Tyr Phe Ser Asp Val 965 970 975 Asp Leu Glu Lys Asp Val His Ser Gly Leu Ile Gly Pro Leu Leu Ile 980 985 990 Cys Arg Ala Asn Thr Leu Asn Ala Ala His Gly Arg Gln Val Thr Val 995 1000 1005 Gln Glu Phe Ala Leu Phe Phe Thr Ile Phe Asp Glu Thr Lys Ser 1010 1015 1020 Trp Tyr Phe Thr Glu Asn Val Glu Arg Asn Cys Arg Ala Pro Cys 1025 1030 1035 His Leu Gln Met Glu Asp Pro Thr Leu Lys Glu Asn Tyr Arg Phe 1040 1045 1050 His Ala Ile Asn Gly Tyr Val Met Asp Thr Leu Pro Gly Leu Val 1055 1060 1065 Met Ala Gln Asn Gln Arg Ile Arg Trp Tyr Leu Leu Ser Met Gly 1070 1075 1080 Ser Asn Glu Asn Ile His Ser Ile His Phe Ser Gly His Val Phe 1085 1090 1095 Ser Val Arg Lys Lys Glu Glu Tyr Lys Met Ala Val Tyr Asn Leu 1100 1105 1110 Tyr Pro Gly Val Phe Glu Thr Val Glu Met Leu Pro Ser Lys Val 1115 1120 1125 Gly Ile Trp Arg Ile Glu Cys Leu Ile Gly Glu His Leu Gln Ala 1130 1135 1140 Gly Met Ser Thr Thr Phe Leu Val Tyr Ser Lys Lys Cys Gln Thr 1145 1150 1155 Pro Leu Gly Met Ala Ser Gly His Ile Arg Asp Phe Gln Ile Thr 1160 1165 1170 Ala Ser Gly Gln Tyr Gly Gln Trp Ala Pro Lys Leu Ala Arg Leu 1175 1180 1185 His Tyr Ser Gly Ser Ile Asn Ala Trp Ser Thr Lys Glu Pro Phe 1190 1195 1200 Ser Trp Ile Lys Val Asp Leu Leu Ala Pro Met Ile Ile His Gly 1205 1210 1215 Ile Lys Thr Gln Gly Ala Arg Gln Lys Phe Ser Ser Leu Tyr Ile 1220 1225 1230 Ser Gln Phe Ile Ile Met Tyr Ser Leu Asp Gly Lys Lys Trp Gln 1235 1240 1245 Thr Tyr Arg Gly Asn Ser Thr Gly Thr Leu Met Val Phe Phe Gly 1250 1255 1260 Asn Val Asp Ser Ser Gly Ile Lys His Asn Ile Phe Asn Pro Pro 1265 1270 1275 Ile Ile Ala Arg Tyr Ile Arg Leu His Pro Thr His Tyr Ser Ile 1280 1285 1290 Arg Ser Thr Leu Arg Met Glu Leu Met Gly Cys Asp Leu Asn Ser 1295 1300 1305 Cys Ser Met Pro Leu Gly Met Glu Ser Lys Ala Ile Ser Asp Ala 1310 1315 1320 Gln Ile Thr Ala Ser Ser Tyr Phe Thr Asn Met Phe Ala Thr Trp 1325 1330 1335 Ser Pro Ser Lys Ala Arg Leu His Leu Gln Gly Arg Ser Asn Ala 1340 1345 1350 Trp Arg Pro Gln Val Asn Asn Pro Lys Glu Trp Leu Gln Val Asp 1355 1360 1365 Phe Gln Lys Thr Met Lys Val Thr Gly Val Thr Thr Gln Gly Val 1370 1375 1380 Lys Ser Leu Leu Thr Ser Met Tyr Val Lys Glu Phe Leu Ile Ser 1385 1390 1395 Ser Ser Gln Asp Gly His Gln Trp Thr Leu Phe Phe Gln Asn Gly 1400 1405 1410 Lys Val Lys Val Phe Gln Gly Asn Gln Asp Ser Phe Thr Pro Val 1415 1420 1425 Val Asn Ser Leu Asp Pro Pro Leu Leu Thr Arg Tyr Leu Arg Ile 1430 1435 1440 His Pro Gln Ser Trp Val His Gln Ile Ala Leu Arg Met Glu Val 1445 1450 1455 Leu Gly Cys Glu Ala Gln Asp Leu Tyr Val 1460 1465 <210> 302 <211> 147 <212> PRT <213> Homo sapiens <400> 302 Met Val His Leu Thr Pro Glu Glu Lys Ser Ala Val Thr Ala Leu Trp 1 5 10 15 Gly Lys Val Asn Val Asp Glu Val Gly Gly Glu Ala Leu Gly Arg Leu 20 25 30 Leu Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Glu Ser Phe Gly Asp 35 40 45 Leu Ser Thr Pro Asp Ala Val Met Gly Asn Pro Lys Val Lys Ala His 50 55 60 Gly Lys Lys Val Leu Gly Ala Phe Ser Asp Gly Leu Ala His Leu Asp 65 70 75 80 Asn Leu Lys Gly Thr Phe Ala Thr Leu Ser Glu Leu His Cys Asp Lys 85 90 95 Leu His Val Asp Pro Glu Asn Phe Arg Leu Leu Gly Asn Val Leu Val 100 105 110 Cys Val Leu Ala His His Phe Gly Lys Glu Phe Thr Pro Pro Val Gln 115 120 125 Ala Ala Tyr Gln Lys Val Val Ala Gly Val Ala Asn Ala Leu Ala His 130 135 140 Lys Tyr His 145 <210> 303 <211> 147 <212> PRT <213> Homo sapiens <400> 303 Met Gly His Phe Thr Glu Glu Asp Lys Ala Thr Ile Thr Ser Leu Trp 1 5 10 15 Gly Lys Val Asn Val Glu Asp Ala Gly Gly Glu Thr Leu Gly Arg Leu 20 25 30 Leu Val Val Tyr Pro Trp Thr Gln Arg Phe Phe Asp Ser Phe Gly Asn 35 40 45 Leu Ser Ser Ala Ser Ala Ile Met Gly Asn Pro Lys Val Lys Ala His 50 55 60 Gly Lys Lys Val Leu Thr Ser Leu Gly Asp Ala Thr Lys His Leu Asp 65 70 75 80 Asp Leu Lys Gly Thr Phe Ala Gln Leu Ser Glu Leu His Cys Asp Lys 85 90 95 Leu His Val Asp Pro Glu Asn Phe Lys Leu Leu Gly Asn Val Leu Val 100 105 110 Thr Val Leu Ala Ile His Phe Gly Lys Glu Phe Thr Pro Glu Val Gln 115 120 125 Ala Ser Trp Gln Lys Met Val Thr Ala Val Ala Ser Ala Leu Ser Ser 130 135 140 Arg Tyr His 145 <210> 304 <211> 29230 <212> DNA <213> Artificial Sequence <220> <223> HDAd35-T4-Ef1a-mgmt <220> <221> misc_feature <222> (1)..(481) <223> Ad35 5'end <220> <221> misc_feature <222> (14126)..(14159) <223> FRT (Complementary) <220> <221> misc_feature <222> (14220)..(14463) <223> pT4 LIR <220> <221> misc_feature <222> (14491)..(15825) <223> EF1a <220> <221> misc_feature <222> (15843)..(16466) <223> mgmt <220> <221> misc_feature <222> (16484)..(16705) <223> pA <220> <221> misc_feature <222> (16735)..(17000) <223> pT4 RIR <220> <221> misc_feature <222> (17107)..(17140) <223> FRT (Complementary) <220> <221> misc_feature <222> (28823)..(29230) <223> Ad35 3'end <400> 304 catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60 aaaagtgtgg gccgtgtggt gattggctgt ggggttaacg gttaaaaggg gcggcgcggc 120 cgtgggaaaa tgacgtttta tgggggtgga gtttttttgc aagttgtcgc gggaaatgtt 180 acgcataaaa aggcttcttt tctcacggaa ctacttagtt ttcccacggt atttaacagg 240 aaatgaggta gttttgaccg gatgcaagtg aaaattgctg attttcgcgc gaaaactgaa 300 tgaggaagtg tttttctgaa taatgtggta tttatggcag ggtggagtat ttgttcaggg 360 ccaggtagac tttgacccat tacgtggagg tttcgattac cgtgtttttt acctgaattt 420 ccgcgtaccg tgtcaaagtc ttctgttttt acgtaggtgt cagctgatcg ctagggtatt 480 taccggtatt caaggattac atgagcttag aaatgtaatt agcatagtgt gtggcatagt 540 gtagatacca aataaatatg atctctcctt ctactcttga aaatgcaaac acattcttgg 600 tggtcctaaa atagcctgta acatggttta ctcagcagca tttgctattc aaggcagatc 660 tgcctttagt cattggctgc gctcctgaac agctgtgtga aaggctaact tttgtaaacc 720 aaatcaaaat aaaatgcagc aaaaatttgt cactgaaagg aaatcctcag tatatccttt 780 tatgaaatga aagatccctc atccaaactt aactttttta aaagtgcgca tttggagata 840 tagccctttc ttatgaatcc taattcaatt ttggccataa acacacgttg atgttcccca 900 ccccaaagca catagcaaca agagtaggtt ctatattgaa aataatgaca atttaaaaac 960 atgtacttat ttcactgtat gtggacagtg tctatgattg catcatgaag tgtcatataa 1020 ccatgtacgt gtacatgaga gagagataga gagagaagtg gtagggtggt ggtggtagag 1080 gggatggcga tagtaatcat ggtaatggta gaggtgatgg aggtggtaat gacggaggta 1140 agggtggtag tgatgatggt ggtggtggta atggtggtgg atgtggtggt ggcaattggg 1200 atggtgggat ggtggtagcc atggtgatgg tggtaatggt gttgatttaa agggtggtgg 1260 tagtgaaggt gagggtagtg gtggtggagg tggtggtgct ggtagcaata gtgatggtgg 1320 tgatggtgtt gatgagggtg ttgggatcag ggtgagttcc cacagtatat ttcattcttg 1380 ttgtaccact ctgtcaacag caccactgac tgggacagag gaagaaggca cactctgaat 1440 gtgttattaa cagaaacctc aaaacagtct gtctccttgt agtcattcaa aattatcttt 1500 ttcttacctg gaaaactgaa actgaattac cgggaaaaac acaggagatt tttgtttgtt 1560 aatatgctgc caataaagta attttatgtc aaatttaact acaggaaagg gcaaggcatt 1620 ttctaagttc cttagatgtc atgtggctaa aaaaaacaaa aggatggaca gcagttagat 1680 actgtacact tagctgtttg aagccatata ttcagaaagc agatgttggg agttggtgtt 1740 tgaggactga tttcctggag gtattttata taggccaagt tcattgttct aaactctaag 1800 ggcttgactt gagggaggaa aagaggcaag aacatgttta gttttgctga cagcatcaca 1860 tgggcagccc taaggctaga caactttagg gcctgaagct tattctagga aagaagcacc 1920 tacagagtgg cactgggctc ccctccacta tagagatgaa gtcatatgac agtaaagggc 1980 aggcagggct gcctaggggg cccagaactg acacttccat tagaatgagc acaggccagg 2040 gagagaagtg gggaaccaga gagaaggagc tggaattcta gtaggacaaa cggtaagtga 2100 acaacaagaa caagttaaga gtgtgtgcag tattctttca aagactgaaa aaatagtgat 2160 gtgatagaat ggcaggtggc tctgagcagg ccaggagaag gactgggggc agagcatccc 2220 aggcaggagg gcagcaagtg ggaaggccct ggggtggggc ttttggactg ttccagtgac 2280 gggcaggcag ccagtgtgcc tgtcacacaa tgcaccaggg aagtagtcgt gaatttgcag 2340 agggtcttgc aggctatggg aaagggattg gattgtattt tgtttgtagg gaagccatcg 2400 ggggacttaa gcagaggaag gattggcttc atctctttga aaaagttctc tctggatgct 2460 gatgggagga gaaatggaag gaaaagaaac acttttaggg gcaagaactt ttgagaaggg 2520 tggaattggg agtgtggagt tggggccagc tttggcacag gaggggaagc taaacacgtg 2580 gccgcatgag ggcctgtaat tctacctgaa atgggtacca tttgttaggg taaacaaatg 2640 aaccaaatgc ccagtgatac agaccaagtg ttggcaaact tcttctgtga tggcccaggt 2700 agtaaatgtc tcaggcttcg caggccatgt ggtctctgtt gaagctctgt gtagtagaca 2760 atatgttaat gactgggcgt gactgtgtgc taataaaagt ttatttacaa aaacagcccg 2820 tgggctggat ttagctcaca ggctgtagtt tgccaacctc tgacctagag catgaactga 2880 gcatcttctt ggagggaaat aagttctttc caagttgccc tcctcacatt gcagggggcc 2940 atgtaggccc attattcaca gaagagtggg tgggcaacct ttctggagca gaaaaacgta 3000 aagatttctt ccgtagtgca agtaaggtga ccatttctaa accgtgcaag tgatccagca 3060 gtcccaaaag ttgtttcact tctcattgtg cgcccgttct caggtgctcc gaagcttcca 3120 gtcctttgta gggacatgga tgaaattgga aatcatcatt ctcagtaaac tatcgcaaga 3180 acaaaaaacc aaacaccgca tattctcact cataggtggg aattgaacaa tgagatcaca 3240 tggacacggg aaggggaaca tcacattctg gggactgttg tggggtgggg ggagggggga 3300 gggatagcat tgggagatat acctaatgct agatgacaag ttagtgggtg cagcgcacca 3360 gtgtggcaca tgtatacata tgtaactaac ctgcacaatg tgcacatgta ccctaaaact 3420 taaagtataa taataaaaga aaaaaaaaaa gagaggagag aaacatcatc ccctccagga 3480 tacccttggg ccttgttctt atagtcttgt acattgttga acaatttgca tgggctagtg 3540 gattaaagca caccctccac cctcaggccc tcaagggtct ctatgataat acagtctcac 3600 cttctaccct ttccatcacc atcctaggtg ctatggccaa ccttgaggct gccatgttag 3660 gtctatgcat ttcccacctc caccacataa ctctctgaag gccaggtagt ttcctattca 3720 tcttggtaac cccaaagcct cgtgacaggg ctcagctggc atctgcggat gtgaatgaac 3780 cattggagaa aatggtactc tgcaaataac tctgttattt tcccatttcc tgtgtaaggc 3840 ctagagacaa tgacttttta attgcacccc ttcccctctg tatgacactg gccttctctt 3900 gtgtccagca atgtgggtgg cctagatgat ttctaaggga cttctggcca agatgaacag 3960 cagctgcatc ttactgagca tttactatgt gccatatact cagccacagc tctaggggca 4020 tagaagcagg agctctcagg gtcagggcag tgagtgagca agcgagcacc tatgccagcc 4080 ctgcctctgg atggggactt gagagggtga tggaagcctg cagcactgga gggaggcaga 4140 caaagacagg cctgtgctga gggggcccgg agcaagagag agggaggcaa tgacagcaga 4200 gacatgcctg cgccttgggt ttgagtgccc agtggtcaaa tccacttccc tgtggctgat 4260 gcttgccttt ctaactttgg aatttagggg ttggagatct ggtgagaagg taggagggag 4320 atgaggagga gaagggaaag gcaggaagga aggggaggga aaggaaaagc aaaaggggag 4380 gaggaaggtt tccaacaaat tattctatat caactgcgga aatcaaaatt tgttgcccaa 4440 atcttagaag ctcatgtccc tcctccccag aagtctggaa tgcagcactc caggggtagc 4500 ttataaccca aatatctatc tgtaaaaaga gaaacattgg gctttcgagc tgtggattct 4560 cagtaaaagc aagaggcctc agcctacaca ggccagccca gagtttgagg aaccccaggc 4620 ccacacccac agggctggcc cctgggtctg catactccct agaaatgtgc acacttctga 4680 gcctcaactc tgtcctggag tctaacagca tccctctcct tcctggggca gttccacctc 4740 cagaaacctg ttaccttggg ccttatgtca aggaaactgt gggaaagagc taggcaggaa 4800 tgcagatgag gccagcatgg gctcctaaaa gtttagaaat aggcagtgtc atgctcccag 4860 gtgcctgcat aaaccagctg aaaaatggag ctcccctcac cagcactctc ccttcaaaca 4920 gactgtgatt tgcaggtcac tggtttacca agccaggcta cccaggcagg acccagatgc 4980 caagcccagt ggtgtcctgc aagctgagca gtgctcagtt cttgcaaaaa aaggtctgtg 5040 tgaaggcaag gcctctgcct ggcttctcac cccagttggg tgtctggaac aggaaggagc 5100 ccttactgca gaaaaaggag gagggagcaa agggagcgaa cagctgcgtg ctccatgggg 5160 aggatcccca aagtagaaag gcgcatacac actgcagccc ttgacccaga atgctcacag 5220 ctacattaca gattcaggtc tcctcagtgt agtggggctg ctgatgagac tgtggcatcc 5280 tcaggggtca ggacacacat tttccatcac tcttctgatg gcaaaaaacc tctgagccaa 5340 tgccaacctc tgatcattaa aaaaaagtgc tcacagcagt gtgtggttta ggatcatgcc 5400 ctgtgtggtt tggaacacgt gcacaaccac accttgttca tcaccatccc agaaaccctg 5460 acgcaggcaa agagcagagt tattaaccct actttactga tgtggatact gaggcccaga 5520 ggctcatgca agttatcaat aagtggcagg gacagttgcc tctagattaa ctagccccta 5580 ggatcacctg ggtcttggaa ggggacccat aaacatgagc tcccctctct tggggccaga 5640 tttgcacctg tgccgcgcct tcagcctgca tgaagtaggg gctgctggca aagactcaaa 5700 gctgtaaatc tgggttttct cttgaggctt ctaagggagc tgtttcgaca actcactctg 5760 ttcccagctg gctgcccctg catagggttt taaagcagcc tagctttctg ccaggcttgg 5820 cagtggacaa cgctggtcag aacatcccag agagctacca gaatgaagta agtttgcttc 5880 tactctttac ctgtttatgg gctgtctctg ccactggaat gaaaggcact gagaacagtg 5940 cctggcctgc agaaggccct ggaaatacct gagctcctaa tctgggaata ggagtaggaa 6000 gagctttgga ggcagggcac ctgagtttga gatctacaac ttcctgcctg tgtgacattg 6060 ggaaagtctc catcctttct gagcctcagt ctccaccctg gggaagtgga aatatcaatc 6120 tctgtgacac agaagcaaat gagcgaatgt gcacaaagta ccttgcacaa gagagacgct 6180 caaacacttg cctccaggtt tcaccgagaa ctacagagta agatagattt gttcccagtg 6240 gaggaagcct gggaataatt tgcccctaga ctatgaattc ctggggctca agatcgagca 6300 cagggccagg cacacagaag ggaccctgga aatgtggcag gaggccagag atagacaggc 6360 ccttagagct catacccatg ccctctgacc tcaagaagaa agaaacctgc tcaaaatctc 6420 acaaagagct tgttccaacc ctgaatcgag tctgaggact ccttcctgag tccagcactt 6480 tttctgcaag aagtatatgc ctccaaagct gatgggcgca aatcttgaac cccgtcacat 6540 aaacacaaag ggaggaggtg actagagctc ctcctactgg atatgtctaa ggtcaccagt 6600 ctaaagaaaa gggatggata gaatgaggcc agtatttttg cagccatcca aatgtccaca 6660 tacgctgtta cactgagggc tcctctctcc cccgtcttca gccctacttg catttagagg 6720 tgagaaagat atgggctgag gggttgtttt tcatcgtatt gtagatggaa agcacactgc 6780 ccttggggcc atccaaatgt ggaccttgat gtagcacccc accttctgga tggccatcct 6840 tctgaaagtc actgaatttc tcagacttta ttctctttat ccataaagaa ggagaataat 6900 aataatcccc ccaccctgcc caaccactga ctggttggga agctcagaag aaatactggg 6960 cacggcatcc cattgtaatc tatagagtga gtcgcttctt aatattaaat ggctgaacac 7020 agaagatgtg caaaaagtac tgtgtcccct tcctcctcca actgaacatt tcatgccctt 7080 tgcaccctca ttttgtctag gagctgcctt atgaagggaa taggtacctg ctccgagctg 7140 gaggaatctt tgccacttat ggtggggtat ggactgagac agagatggca tgtgacatgc 7200 gcactgagtc tcaactccat gcaggctctg gagcactctc aaattggagt actaatgcct 7260 tttaaattct cacactagca atcctttgac ctactgatct agggatctag ggaaagaatc 7320 gtgatcttaa cttcaaaggg aaggacaaaa tgttctgcct cctgttaaaa ctccatacac 7380 taagtgcaga gactggatgc cttattaacc ttgggtagat gcccaaatgt tcaaaaggtc 7440 aaactcttct gttccccaga tcgccagagt cattaaccag tcacactatt aaatgaatga 7500 acagatgctg aaaaggtact tgcattactg agatttctta tggtgatggc ccctgcctga 7560 tatgtattca gcattttgta gttttcaatg tgcattagag tatagtggtg atgacattgg 7620 cctctgagtt tgccacttct tatatctgtg actttggtca aattgcttaa tctctctgag 7680 tctcggtttc ctggagataa taatagcttc ttcttcccag ggttatcatg aggattacag 7740 gagataatgc cccaaaaatg cttagtaaag tgcctagcac ctagtcaatg ctgaattaaa 7800 ggtggttatt cttacttttc gttcatttga actttgttct cagggagggc aaaggataga 7860 caaagcccca tagctagtga ggagtagctg caagactaga acccaggtgt tctgagccct 7920 agtcttaggc caagaacaac tgttacgtga gatgcacgtt ttccttcaag ggagctcaca 7980 attatttcca tgtaaattca aggactgcta aaagagaact ctcctctggg actgatatca 8040 ttttatttca agattgattt gaaacatgtt ttttgtttgt ttgtttgttt tctaggaaag 8100 aacaagagaa ccagttaagc tgaatgcctg aagcaaatcc ctgttagcga tgttttcagg 8160 atgagggaga gtggtgcaag aaacgtgctt ccagatgcac atggtttcct gggactaggg 8220 ttcagggtgt catccctggg tgttattaag tgtcagaagg agagcaaaca agggaaacat 8280 ctgagatcca gctaaggcta caccctggaa atgcaagccc agctcttgca aaggacctcc 8340 tttggccact caccttccag gccttacaat aacttgtttg gactgcaggt ttcttggtgg 8400 actcacaggc cattctgctt ttatttggtc aacctcagtt cacaagcacc cagatgctga 8460 gatcctcagc atgtgcagca gagtttcata ttagcactgg gtacctttct gaggctacag 8520 ggataccgta cagcagcacc tgtcacgtcc agccaaagga gtgggctctc tcaatgtcat 8580 ccaatgctgt ttcaactgtg aagaagacca tctgagagag ttgcttttgg aggctgaggc 8640 aaatttttaa aattctttgt tctcctcaac tggggtgaat tcttggtctt ctaggacagc 8700 ttgaagtttt agaaagagtc aagccactca gaaccaacag agaactcttt cagagaacaa 8760 ggtgtggcat agaggaggca gagggctgat cttgatcaaa tccaaagtgt gactctaaag 8820 caatgaatgt gaatttttgg caaagcttac aaagggctct aaaggccatc tgcaaagaga 8880 agccaagcct gatcgatgaa tcactagtgc ggccggatat cgatcggcac gctgttgatt 8940 ttctcatagt aaggaacagt gggccctttc agtcccactt ctgtagtctg tggtactaca 9000 aatggtgagc ccatgatgtt gccattcata gggttattct ccagcagtaa tgactggcca 9060 gccactccca tagccgcggg gctaggattt attgtcaatg gagggacctg cagttctgca 9120 caagcagtac taggatgagc acctgggccc attgcaaggg tgacatcttc aaggcaaggc 9180 ctcttaattt tattagggta gcccccatca gccatgtctg gaaactggaa gtggtcttct 9240 tcttgtctcc tcttaacagt tccctgtgaa tggaagagaa gagaggagga gaagagagga 9300 gaggagaagg gaagagaggt gacacacaca cacacacaca cacacacaca cacagagaga 9360 gagagagaga gacagagaga aagagagaga gagagagaga ggaattttta taaaggtttg 9420 gcacattaaa gctaatgaac aggaaatgtg catgataaaa cagacctctc agtttaaaga 9480 cttatagttg tgaaaactat aaaatacagc ctgtctttgg aaccatagtg cttatttatt 9540 cattattatg tttcatctaa actgtctaat tacatttcaa ataaggcatt atgttgtctg 9600 tatactaaaa cgggatagaa cgttattcaa agggtaatct gcccacttca aggagagttc 9660 aacaaaacta tgcagaagtc actaaatgaa ccatgctgcc aaaggcaggc attggagaga 9720 aaactagaag tagctaaata gttttaattc tttcctgtct acagacacat agattttaac 9780 gaaggaatac catagtatag aattgaactt ttaggctgcc ttctagtctt ggttaaatgc 9840 atcaggctgc agtggtaaaa ttgaatacaa cagagccctt acaggaaaga agtagatctg 9900 gatgtgtttt cttggggagc tgtttaaaat actgtttttg ggaaagcaca agtttcagaa 9960 cagtcattgt aggcatcgta ttcattgttc catttatttt tacacacaca cacacacaca 10020 cacacacaca cactctcaca cattgctatg tgtacacaaa aataatttgg aagaacctat 10080 acccaacaat ttggagtggt catttatttg ggatgactgg caattccctt tctattctct 10140 tcatttctgc ttgtttgtct ttaacgagaa cgactcataa tccaaaaatt taaaaaagta 10200 taaagttatc taaataagaa attttcctct gaagatgcat cctcaggttg gggagatatt 10260 aaacaatgag aaaaggcccc aatctgggat ctgaaccttg ggggagctgc ccatcattta 10320 tagaagcaca gcctttggga acaaagcaaa gtcactagca atgtgagact tcctactctt 10380 catggcttca tacagtcatc catcgctgtt gtgttaatga ccatgacctg tatgttagca 10440 ggtaaatggg aaaggaagtg ggggcaaagg agtatgtgca ggaatgatca aaataaggaa 10500 aggaagagag ggatctggaa atcacctgaa tgccgatagg tgaacaggta gaattctttt 10560 aaagcttccc ccacccggta ccccccaaat aacccctttc cagctttgga agtttcacta 10620 ggacatacag tgctcatcct ctgatgtcac cttaagtttg gctcttctgg tttgatgagc 10680 ttgtagccca ctaggagctc aaggcatgca tggggccact tgccagcacg atgaggggca 10740 tgactgtcat ggccaagtga acatcaaagc agatccccag ggctgtatgt ctcaggcctt 10800 ggtgcacatc agaatcactt agaaacatcc acattcctgg gccctcccac cacaaactga 10860 cagcttcatc cagggtgtgg cccaggcatc gggagttttt ccaacagctc catggctgat 10920 tctcaacaga aaaccactgg cccagagcaa gggtggaggc agcgtggcat agggctctga 10980 ccttggcctt gccactgaac ctctcagagc cccagtttct ttatgtgtaa aatgagtgta 11040 attatagttc ttttctcatg aaggtgctct gactattaag tgaaacgggg cacattgtat 11100 gacacctaat agctcctcac taactggtac ccggcattat aaagggcagg tatggaaggg 11160 ttctgggagt ccaataccct tcttaaagac agagaggtct ctgagaccca gagaggggca 11220 ggccttaccc agagttgctc agccagaggg caacaaggcc caggtcagat gcagggcccc 11280 tccaccacca ctcagctgcc tccagaccca ctgccttcgc catgttgttg gtaggacact 11340 gcatcgcccc cacagaaggg gcttgccaac ttgagtgaga ggacttgcac acttctttga 11400 cttttctttt gagatgccca caatctgaac aagggcactt caagggacag ctctgtcacc 11460 aaactcatct gaggcctgaa taccatgggt caggcaggaa tgggttggag aggtgtagag 11520 caggcacaat aagagggctg aggcccatgc agtcatcagt gcccactttc ccaggagtct 11580 gactgggcac agcacccata gtgtccctga gctggtccat ggagcagctc actaactgtt 11640 tggcccacag caggtgctca gtaaatggca gttgaacgaa tcaatggaca aaggaacata 11700 aattacccaa cacacaggga gctcagccat ttactcaatc cattatggag taacctacaa 11760 acaagccact gggtcccaaa ctgaaattgt gtctcttcta cattctccca aagaatccaa 11820 taggttaaaa atagaaatgt atgaaataga tcaatcaggg atgattgcat gtggatttga 11880 cataaggatc ccctgcaggg agtctgagct ggcaacagtc aggcccaaag tgctgtccat 11940 gatgtctcga actgcaagac agttttaaca atggcgaagc aatgcagaac caggcaggcc 12000 aaggaggggg tgggggttgg ggaaaggaag ggagggaagg ggctgtgagg ggcaatggtc 12060 tggcatccct gccacgtgag cctctgaaat ttgctggcag cttctatggg ctcccagagc 12120 tttcacttaa ttgttggtct gccactaacc tgctgggagt aaggtgcagg gatggaggag 12180 gcagggcatg accaccagac actaaaggta ccagctgggg ccactggcaa agggaaggag 12240 gctgcacctc tcctacatga gagcccgtat acacacacct tttccagcac tcatcaactg 12300 catcccaagc aaatggtccc tgatcaattc caattctaga aaccaactga ctactcaata 12360 acaaagtaga tcccagcagg ccgccactgc tggagcggat gccacttttg ctatgccaag 12420 tctgtggctg gacagctgct ggcatgtaca ctcactgact ttcataagga tgcctaataa 12480 agggggcagg ctcacctggc ttttctcagg ggtggggttt ggggtgccga tagaggctgc 12540 tgttttggca gagtggcaag ctgcaagcct cttctgagct ttcatttttc aatggacttc 12600 agtgagaatt cactttgtca gaggccatgc agctccatgt tttggatttc atggaatgag 12660 ctttcaacag tgagcctgaa gtgccctggc tgaacagcaa gaacaccagc caaccctaaa 12720 caaggccgag gagaggcggc tgtgtttaca cggaaggctc agccttgctg taatagcgtc 12780 tgccttcacc agacatcagt gaggcgtgga aatctattat ccagttaatt ttgcccctag 12840 ataaagactt gctttcgtgt cttctctttc acagtcccat gatctgttac tcatctcaac 12900 tgcgagaagt tggctgggct ttcccctgtg cccagtgcca cactcgtgcc ttcactgggt 12960 cacctgtgcc tgtggctgat gccgctgagg ttttgcctgc ccagactggg tgtttctgac 13020 taaatcccac agccaccatt ttagatcaag ggcaggagat agctcactgc tccggaatga 13080 cctcccctcc cagaatcctg gtaggggcgg aaggtcccca accaagctcc cagccctttc 13140 taaatgaatc tccctgcttc acccatgtgc ttttctccag tctctgcggt cttgatgaca 13200 gcagggtatt agtcctagct gtcccacagc tcctacttct ttcaggcctc tccctgtgac 13260 aatcagtagc cactggcagg atttcctcag agcatatctc gatttgcttt cagacaatta 13320 gttaaaagga cactggaccc cagacgtccc aactcccagc cagagccctc acaggcccgg 13380 cctttggtgg tgaggaaggg ggagggagtg agtgacagtg ccctggcatc ttttagaaac 13440 gaattccttt ctctccatac ataaatgcct gcagagtccc atttcagaat ccggcagaca 13500 aagccaccaa tgtgatcccc atgaccttat aaacattcat taaaatgcat ttcaaggcat 13560 gtgatggcct ccccaccccc tagataatga gaaaacaaag gtttctcttc tgatagagac 13620 aagttcagct ctgaagtcaa cattatttct ggttctgtct gaacaatgac atatggcaac 13680 tcttcccttt ctatagttct agtccagaat gacaaaaaag gggaaaaatt tcttagagaa 13740 ggtagagatt atacgaatac agtccatgaa atgagcataa ggagaataaa gaatataact 13800 tatccaaaga agtctggcag gctgttataa atgcttgatt ttggacactg tagttggagg 13860 tttaacatgg acaccaataa aaaggtcagc aaagggtatg cactgttcct attgggcaag 13920 aagataggag gtcaaaggta accaggaaag ataaactcag ggagacttat tttccctcca 13980 gagggcactg ggcttgtagg ccctgggcaa aattgtcaaa aaggtgaaaa tcgcctgtgg 14040 tttatttagt ctgctctttc ttcactagtg cctcaccagt tcagttcagg ccaatttgct 14100 agaaggtagc gaacgatcga ccggtgaagt tcctatactt tctagagaat aggaacttcg 14160 gaataggaac ttctacctag atgcatgctc agagcggccc ctagctagcg tttaaaacct 14220 acagttgaag tcggaagttt acatacactt aagttggagt cattaaaact cgtttttcaa 14280 ctactccaca aatttcttgt taacaaacaa tagttttggc aagtcagtta ggacatctac 14340 tttgtgcatg acacaagtca tttttccaac aattgtttac agacagatta tttcacttat 14400 aattcactgt atcacaattc cagtgggtca gaagtgtaca tacacgcgct tgactgtgcc 14460 tttaagcttt taattaatgg atcactagtt gagtaattca tacaaaagga ctcgcccctg 14520 ccttggggaa tcccagggac cgtcgttaaa ctcccactaa cgtagaaccc agagatcgct 14580 gcgttcccgc cccctcaccc gcccgctctc gtcatcactg aggtggagaa gagcatgcgt 14640 gaggctccgg tgcccgtcag tgggcagagc gcacatcgcc cacagtcccc gagaagttgg 14700 ggggaggggt cggcaattga accggtgcct agagaaggtg gcgcggggta aactgggaaa 14760 gtgatgtcgt gtactggctc cgcctttttc ccgagggtgg gggagaaccg tatataagtg 14820 cagtagtcgc cgtgaacgtt ctttttcgca acgggtttgc cgccagaaca caggtaagtg 14880 ccgtgtgtgg ttcccgcggg cctggcctct ttacgggtta tggcccttgc gtgccttgaa 14940 ttacttccac gcccctggct gcagtacgtg attcttgatc ccgagcttcg ggttggaagt 15000 gggtgggaga gttcgaggcc ttgcgcttaa ggagcccctt cgcctcgtgc ttgagttgag 15060 gcctggcctg ggcgctgggg ccgccgcgtg cgaatctggt ggcaccttcg cgcctgtctc 15120 gctgctttcg ataagtctct agccatttaa aatttttgat gacctgctgc gacgcttttt 15180 ttctggcaag atagtcttgt aaatgcgggc caagatctgc acactggtat ttcggttttt 15240 ggggccgcgg gcggcgacgg ggcccgtgcg tcccagcgca catgttcggc gaggcggggc 15300 ctgcgagcgc ggccaccgag aatcggacgg gggtagtctc aagctcgccg gcctgctctg 15360 gtgcctggcc tcgcgccgcc gtgtatcgcc ccgccctggg cggcaaggct ggcccggtcg 15420 gcaccagttg cgtgagcgga aagatggccg cttcccggcc ctgctgcagg gagctcaaaa 15480 tggaggacgc ggcgctcggg agagcgggcg ggtgagtcac ccacacaaag gaaaagggcc 15540 tttccgtcct cagccgtcgc ttcatgtgac tccacggagt accgggcgcc gtccaggcac 15600 ctcgattagt tctcgagctt ttggagtacg tcgtctttag gttgggggga ggggttttat 15660 gcgatggagt ttccccacac tgagtgggtg gagactgaag ttaggccagc ttggcacttg 15720 atgtaattct ccttggaatt tgcccttttt gagtttggat cttggttcat tctcaagcct 15780 cagacagtgg ttcaaagttt ttttcttcca tttcaggtgt cgtgagctag acggtcgcca 15840 ccatggacaa ggattgtgaa atgaaacgca ccacactgga cagccctttg gggaagctgg 15900 agctgtctgg ttgtgagcag ggtctgcacg aaataaagct cctgggcaag gggacgtctg 15960 cagctgatgc cgtggaggtc ccagcccccg ctgcggttct cggaggtccg gagcccctga 16020 tgcagtgcac agcctggctg aatgcctatt tccaccagcc cgaggctatc gaagagttcc 16080 ccgtgccagc gcttcaccat cccgttttcc agcaagagtc gttcacgcgt caggtgttat 16140 ggaagctgct taaggttgtg aaattcggag aagtgatttc ttaccagcaa ttggccgccc 16200 tggccggcaa ccccaaagcc gcgcgagcag tgggaggcgc catgagaggc aatcctgtca 16260 agatcctcat cccgtgccac agagtggtct gcagcagcgg agccgtgggc aactactccg 16320 gagggctagc cgtgaaggaa tggcttctgg cccatgaagg ccaccggttg gggaagccag 16380 gcttgggagg gagctcaggt ctggcagggg cctggctcaa gggagcggga gctacctcgg 16440 gctccccgcc tgctggccga aactgaagcg gccgctcttc gagcagacat gataagatac 16500 attgatgagt ttggacaaac cacaactaga atgcagtgaa aaaaatgctt tatttgtgaa 16560 atttgtgatg ctattgcttt atttgtaacc attataagct gcaataaaca agttaacaac 16620 aacaattgca ttcattttat gtttcaggtt cagggggagg tgtgggaggt tttttaaagc 16680 aagtaaaacc tctacaaatg tggtaaaact agtaatcgat ttaattaaag atctttaaac 16740 aatttaaagg caatgctacc aaatactaag cgcgtgtatg tacacttctg acccactggg 16800 aatgtgatga aagaaataaa agctgaaatg aatcattctc tctactatta ttctgatatt 16860 tcacattctt aaaataaagt ggtgatccta actgacctta agacagggaa tctttactcg 16920 gattaaatgt caggaattgt gaaaaagtga gtttaaatgt atttggctaa ggtgtatgta 16980 aacttccgac ttcaactgta gtttaaaacg ggcccgtagt ctagggccgc cagtgtgatg 17040 gagttcggct tcaggtacag cacactggcg gccgttacta ggtagctaga gccttcagac 17100 tctagggaag ttcctatact ttctagagaa taggaacttc ggaataggaa cttcacccat 17160 ggcgatcgct agcctctaac tcctagaccg tcagaactgc tgggcccttc aagacgggct 17220 gctcacaccc actcatgtta agcctggtga ggcctgtact ctgttttcac aggaagaaat 17280 cctcacccag tcttccccaa acacattccc aggttgtgtc attagtggga tagagatgat 17340 tattgtgggg agaagagaaa catctggatg gatttggtga ggttgatcta tagaggaagt 17400 aggtgctgcc tgaggtagct gtaatagaag ctaaaggtca aaggagaggg ccctgtccca 17460 atccagatga ctccacttct gctggaccca ggttcacaag cttaatctac atttcaccta 17520 aatttggcta acaagcccaa aatcacacag gcaaagggag aagtggaggc agaaccgagg 17580 ttggaggcca ccagggccac cgggcagaga tcatttaagc ccaaccttct cacttctccc 17640 tgggctctgc ctctcttaaa ggaccttgtg gtgtgacctc ttgtaggtcc ctttcacact 17700 cggggcctca gtttccccac tgtaaagtga atgggtccca gctttggtaa gcttatgctt 17760 acctgatgct ttcttcctgg gctgctcttg tagagaaaag ataaatcttc ttcctccatc 17820 cacgagggct cctttccctg ggggtgagag taggctgagg agagccactt gcacacaccc 17880 ttaaagaaag tattacctgc accagctcag tgagaggcac agatcagact gttacttgaa 17940 tcaaattatg agcctcccca aatatatcta tgacatttaa ataggggatt acttgaacat 18000 agactgtggg atccggtgtg gagtgcggga gactagcaaa gtgaatcctg agagtagcag 18060 gtctgcacct gttggatcga gaaaggcggc ctacaattct ggtcaaatga gctgtgctta 18120 ttgacatatt ctattagaga gtactaccag gtcaccagtc accagaaagg ctgccagctc 18180 tccaaccacc tccagggaac tatcctgaat ggggccttaa caagtctaag agagggttgg 18240 tttgggtccc aagccaatat ttgctctgct ttatgtcagt catatggaac ccaaaccaac 18300 cctctcctat gtgcctcacc agtcggtgca gggatcccaa tttcaagttt ggttttttat 18360 ggtcaaagtc cagcatagat taaatgaagg ggtgtgatga tggtgttaaa agagaactcc 18420 agaccagttt aactcttgga cacacatccc atctcaccat ggtgcttcca accttccaga 18480 gatgatgggc tcctattttc tgatgacaaa gccctccaca ggattgctgc ctggccatca 18540 gggagtgcct ctgtaactga ggctgagatc ccactttcag tcctccagct gtggcccatc 18600 cctgctccgc ccaccgggta tggcctgtcc taggctctta ggtatggctg cattgtgaaa 18660 tgatggctac agagctggca tctcctgtag tctggttcat ctagtgcact acctcatagt 18720 taaaagaaat ctgtttaagc cactgagggt ggctcctagt gccaactcca agaacaggaa 18780 gcttcccttt tttgggagga ggggcagatg gtaacatgga tcgtccaggt caatgggagc 18840 agggcaacca cagtaagtac tggacaacaa cacaaaactc catgtgtggc ttccatcgag 18900 tccctctcca attggtttgg tcttctccgt cccatgcagc actttagcaa ggggcctggc 18960 tgaaggctat gaattgtgtg gagcctcctc attgcagtct ccaaccatct gatgctggga 19020 aaatgtcacc aggatgcagc catgccgtgt ggccaatgaa ccgagaaaac accccttttc 19080 tagaatgctc taaagaggca gaataatcca gaggtgagga aggaaatact ccaccagaga 19140 cccaggcagt tcctacaaaa gccagacttt ccttcaccta gggagtgaca agaccagtgg 19200 aaaacactct caagcagtaa cccccaaatg ctctgcaagc cagtggcgtc cagataccgc 19260 acaagcgagt gggctgtcta atcccatcat catgatgtaa atatctctag gctgccctgg 19320 gctgtgcctg accctgtctt cagctttcca cacctccacc tacagcccat gcacagaagg 19380 accacccagg aatgctgcaa gtgtggcacc tccagggcca cccagggaga aggagggcag 19440 ctatgctggt ggctccaggc ccatttggcg ggtggtacct tcacaccaca aagcccaaac 19500 tgaggcccca gatttggctg atgagggcat attggacagg ggtcacttat gctcttcccc 19560 attgccacct ggcctctggc tacctggact tggctacctg tggatcctct cacaggtgcc 19620 accatcttgg ctgagtctcc agatgcgagg tccctgaggc agtggcgggc ttctcgctaa 19680 tgctgatggg attaggaatg ggataggtgg ggagggccct ggactgggcc ctgatgagcc 19740 aagtgggttt ttagaggggc tactggtaca tttcagggac aggacatctg gtagagctaa 19800 gctggggcaa taaggagcca ctgctaatct gagagctaga aacaatcagc ttctgggtca 19860 ttattaatta gggtagtttg ggctgtgtgg aagtcacgta ctatatgggg tagccacagc 19920 tctctctaca gataatctct aagacttctg attgggactg tgtgaatgca gtagcaatat 19980 ctcttcttac tgccaggccc tgccagtcct gcctccacgc cctggctggc cccccttatg 20040 atctgaccca tgccaggctg ccatagtatg ttacttctgc attagcactc cttgggacct 20100 gcctctccac tgtccctcag actttaaaga actatacaaa cccaaggggc tcttcccaag 20160 agaattgata tgacttgagg tgattccatt tctggaagta gtcactccat tttctgcctc 20220 actctttcag tgcttcacag agcaggttcg aacgaaggag ccatccaact aaccgtcatg 20280 ttcgggcaac cgaagaaggg agtggcagga tttcctttgg agacttctgg aattagacag 20340 cagtttaatg caagcatcta aattctctcc ctcccagagt ctcattaaaa ctacagtaag 20400 agtttgtgtt ttgttttgtt tttaaagaca aaatcccacc aggatagaga gaataggaga 20460 ggagataaca gcatcataat ttatgaaact aaaatgcaga tagaccagga ttaactgact 20520 acacagcacc aaggaagctg aatcacaaga cagcagagga gaaaactgga aaggatcgtg 20580 gtctatacgg cagaatcttc ccaagcctca ggaggaggag ctctagatgt tcccagatct 20640 gggaggtaaa gtggaatggg gggacatggt cagcgtaatg gggttgggct ggaagcaggt 20700 taaggagcag gcagatctct gaatcccctc tctgactctg tgtccccagg catctgcctg 20760 tcccccaccc tggaagaggt ctggcttgac cctttgtctg gtgaatttcc tgctctgctt 20820 tcctggtcct gctggccgga tcagtggagg ccactcactt caccccacag ggatgttctg 20880 tgttgcccta cacctgggaa ctggaggtac tggaggcagg ctgtggtgag cttgaaagca 20940 aaacacagag ggcagtccaa tctctttggc catatttctt ctgcatatcc aataccatgt 21000 ccacaactct gctagtgtcc tgatggtggt gggctctaca cattcccggg aagctgaagg 21060 cagataatga ccaggacagg tcaacctctc ttcttctgaa agccttcatc tactaatggc 21120 ctgggactct tcccttaaat gcttagattg tgtcttccac taaggttttt tgctgttgct 21180 gttgtttgtt tgtttgtttg tttgtttgtt tgtttgtttt gagacggaat ctcactctgt 21240 cgcccaggct ggagtgtagt ggcacaatct cagctcacca caaccttcac ctcctaggtt 21300 gaaggggttc tcctgcctca gcctcctgtg tagctaggat tacaggcaca tgccaccatg 21360 cctggctaat ttttgtattt ttggtagaga caggatttcg ccatgttggc caggctggtc 21420 ttgaactcct gacctcaggt gatctgccta ccttggtctc ccaaagtgct gggattacag 21480 gtgtgagcca ccacacccgg ccaaggtttt tgtttgtttg tttgtttgtt tgtttgtttt 21540 gtattgaggc agggtatcac tctggtcacc caggctggag tgcagtagtg caatcacggc 21600 tcactgaaac ctccacctcc ctggcgggct caggtgatcc tgccacctca gcttcccagg 21660 tagctgggac tacaggcttg taccaccact cccagctaat ttttgcgttt ttagtagaga 21720 cagggtttcc ccatgttgcc caggttggtc tcaaactctg ggctcaagcg atctgcctgc 21780 ctcagcctcc caaagtgctg ggattacagg tgtaagccac cgtacccggc cccgccacta 21840 aggttttgaa aatgaagcaa ttacaagttt aagtctatta ataagtgatg aagccatgta 21900 gaaaagcaga ataattatct tggatcagga aggtcacatg aggatctact tgggggttgt 21960 caatattcta tttcttgacc tgatcagtgt tgacagcagg ttttaatttt ttacttcttt 22020 ttgtttgttt gtttttgaga cggagtcttg ctctgtctcc caggctggag tgcagtggta 22080 tgatctcggc tcactgcaac ctccgcctcc tgggttcaag ctgttctcct gcctcagcct 22140 ccccagtagc tgggattaca ggcaggcacc accacgacca gctaattttt gtatttttag 22200 tagagactgg gtttcaccat cttggccagg ctggtctcga acttctgatc tcgtgatccg 22260 ccctccttgg cctcccaaag tgctgggatt acaggcttga gccagcgtgc ccggcccatt 22320 ttttacttcc ttattaaact gtacatatag gccttgcaca cttttctgca tcaatgttat 22380 attccacaat aaagggaaaa ggtatataca caacttgata ccagtaatgt gaaacatata 22440 tttctacata gaaaaaaaaa tgactgaaat actgcactcc aatgtgttca cacagtagtt 22500 gtttctggat tatttatata ttaaatgttt atatattgta ttatgccatg aggtttgtgt 22560 tttctctcca cttttctgca ttttccaagt ttactacaaa gagcacatat tactcttata 22620 atcagaaagt cataaaatat atttaaaaag acaaaattga aactaataag gatcaacaca 22680 aaacagatga gccatctgtg gaaatccgca cagaatacta cctaaagaga ttggtgacgt 22740 gcatgatctc actaggatga gcacaaagct tgccagagcc tagggtctat ttctagggtt 22800 ggctcttgga agccaggata gttgttatct ctgggaagag ggaggggcac acaaggggct 22860 tctaaaacat tctgaatgtt ctatttctga acctggttgg tgggtacatg actgttggtt 22920 ttattattat atgttttata tactcttccg tatgtatggt gtggattcca aaaaaagatt 22980 tcctttagag aaaaccagaa tcacataagt agaaaatatg gtgctatgtt gaaggaacaa 23040 ctcaagttta tataaaatca tcatcattta taggcttaaa aagttgcttt ggaattttgg 23100 tctaactgac ttgtcttttc tgcagcaaac cacgctcctt ctggacgtgc tccaggcaga 23160 ggggattagg gtgggttcaa ggctgcaagt acctagctca gcacactctc ttcaggggac 23220 ttagagtttg tctggtgttg gctctctgag ctcttgtcag gaatgccgac ccttccgagg 23280 ttcaggattt gaagcctgcc ttcccacccc agatttggtc cacacagaca ctcaagtatg 23340 tatttcaact acaaatgacc tgtactttcc tattactcct ctctttcatg gtaacctttc 23400 tggtatcctt ccttccctac atttatggga gggggacatc attctctgct ctcctgtcac 23460 tgaaggctcc accttctgtc ttcttctgac ccatctggtt ttcctggggc cacctcctct 23520 ccttaccacc ctaacgcttt tgtaacttga ggagaaatga gagatcacct agtcaggtca 23580 tcattctctg tagatgaaga ggcccaatgg tttgctcaag aattgccaag cgagttaaag 23640 acagagagta tgagagtcag caagacctac agaaagcatc tatctgcact gttttgcagg 23700 gacttagcct ttgtgtgtgg actcctggaa tgccacccac taagaaacat tgtctgacac 23760 caactcccca cttggtaggt ggggacactg aaactcatgg caggaaaggg ccttgcccca 23820 agccagggca gagtgtcact catcactctc aattttcagt ccagggcacc ttgttgtgac 23880 tatcccaaag gcagccactt tccctggtct gaaagacctg aagagagaag agaagagaag 23940 gatggaaggc agagtatgcg gctttgattc atttcctggt gaaaacagat ctatacgaga 24000 agcaaatttc acgaaaggga agagaagaaa gtgtcccata cgttgctggc ctgtttcaac 24060 cttgctttga ttcttgctga aaagggtacc gtgtatttct gagttcaaca tgcagaccag 24120 tgttaggaaa gccactgcac ctccacttta gcctccaggg ctgtgccctg caaatggcct 24180 gcagccttgg tgcctcgctc tccagactgc attttggaag atgggacaga ggcttatgga 24240 agcccacatt agaacggggg agcagaatgg gtgagatgag ggatccttga tagtgaacca 24300 gatgaaggaa tggtagccaa atgccaggcc tcctttgtgg cttcaatcca aaggctctgg 24360 agcccttcca gggcagaaca tcaggcatgt ttacccccac tgtcctcaac agtgacagag 24420 gtgcaatctt gggcagctgg ccattttgaa agcaacctcc ttaatctcaa ctgggaaggc 24480 tccctagcag gacccctgtg ttgcacacct ggaggaagct agactaacca gaagctcagc 24540 acggttccat ctgggatgcc caggtctgag acgaaaaagg taactctctt ttctgggtcc 24600 tggcccagtt gtgtctctct ccacctcatt ctctgagatg cctgtctccc cttttttgtc 24660 ccatcaggag gcaagagcta tcactgggcc agactccacc agaagccaag ccagcttgtt 24720 acccagcttc tcagggagca aagaacagcc ttgtttctat cttatcccca ctgtcccctg 24780 cccctgcccc acctcccagc cattcagctt ctggcttccc cagagctgcc tgcttctttg 24840 tggtcctcca ttccttgaaa agaccttcta gtcattagtg tatataaatg gccacttagc 24900 ccagattaca gtgaggtcaa cagctggggc tctgagaatt gtcacacact ggcacaggag 24960 aggaggctat tcttccagag aatttggagg gcactcccat ccacttacaa caaaaagccc 25020 atccactgtg cttggcagta ggtgatctga gaaccaatgg aaccaggtta atcctgtggc 25080 actgttgagt gaggagagca gtggcgggca ctggaaaata tcagagacaa ggcaggagac 25140 ctgaaatcta ggcttagctc ctcatatact tggcagctgt atgacctcag acaaccagtg 25200 ttacctctct aagcctcagt ttcctcatgc aaaaggaggg ggaataacaa cagagcccac 25260 tgcttggggg tgttgtgagg acaggatgaa aaaacaaaca gaaatccctc agtacaggat 25320 tcagtgcagt ggacagtctt gcaaggtctg gttcagccct ccacccctac cctcaccagt 25380 ataaagaact ctggcctaca agtcagatga cctgagtttt aatctcagct ttgccattag 25440 ccgtgtgaac ttgagaaagt ccctttcctt tttacatcta ttgggatgat catgcatttt 25500 ttgtccttta ttctgttaat atagtgtgtt acattgattg cttttcatag actgaaccag 25560 ccttgtattc cagggataaa tctcacttgg tcatggtgta taatccttta tacaaatgtt 25620 gctgggttga gtttgctagt attttgttga agatttttat gtcttgattc ataaggaata 25680 ttggtgtacc ttcccctttt atggccacag tttccctaca atgatgtagt cgaactagac 25740 aacctccaat atctttcagt attcatgtcc tctgattctg tgaaactaag aaaattaaga 25800 aatagtgatt cataggcaca aggcaggcaa aacttagact ccttgtagaa taattaggaa 25860 gccaaatatt cagtgtgctt atttctcaaa taaccttagt ttctccagtc tgccccaact 25920 ccgaggcctg aatatctcta gatgcttatg atggcaacta aagcctaaaa gctaattcat 25980 tttaaagttc ttccaaatgc atagggtttt atttttccag acctgggttc agatggggaa 26040 tttgacaaac aatggaaagg gggaaaaaca acaatctaaa cactgagtga caaagtaaca 26100 aagaaatagt ctagctatca gccagtcaag ccagccttgg ctttgctatc caaagtagtc 26160 agtctaattc taccaccagt ttctgttcct gtagctgtct actgcctgcc agggactctg 26220 ccttcccacc cacaactacc aatggaagga tgtggtgacc ataccagtgg ctgctgacat 26280 ctcctgccat gggaagcata attgcctcca gcagcctccc ccttagatcc atcatttttg 26340 ttgcacttgg cctgggctgt actcccggcc aatgactgaa catggtgagc atagtaatgc 26400 aggcccattt ctgtgaggag caggactcct ccagtaggtg actttggctc aaggactctc 26460 tattggcctg gttgaacttt tcctgaactg tgctactgtc tgagactctt cttacccaat 26520 cctctttctc gccccaattg tcacagacca cctgcattgt ggtctgagtc tctccccacc 26580 ttctcttgct cttccctgtt tatctttcac aggcatttcc cccagtacat tccttgaatg 26640 tctaacccga tacgggtgcc tgacttttgg cagacctaag cagacaaaaa ggagtacttg 26700 gttacctagc tcttctttct accacaaaca tcgagggaac cctttttccc tcacccctct 26760 gccacacccc cactgcccca gtgaacaacc acagagagag ctgtggtata atattaggct 26820 ggtgcaaaag taattgcggt ttttgccatt acttttaatg gtaaaaaccg caattacttt 26880 tgcacctacc tagtatttgt gtccccccaa attcatatgt tgaaacctaa cccacaatat 26940 gatgtcatta ggaggcaaga ccttgaggag gtgattagat gatggggtgg agctctcctg 27000 aatgagatta gtgcccttat aagaagaagc ccaaggaagc taccttgact cttccatcac 27060 atgagaatgc agcaagaagg caccatctac taatcaggaa gagagctctc accagacact 27120 gaatctgcca gtgtcttgat cttgaagttc ccagcctcca gaactatgca taatgcattt 27180 ccattgtctc taagccaccc agcctatggt attttgtcat agcagcctga actgactaag 27240 acagtgagcc acatgagaag tgccccaacc cctcccttaa gcacttggct cacagatcag 27300 tgggttcatt tctgcctgag ttttattgtt attctgtaga tttcttgggc tagatatatt 27360 tttctgttat tttccttctt cacctcagtc atgaattggt tgttttaaaa aagacaatgt 27420 aagtcatggg gaaactcctg acaactctac tctcctaggg ttcctgataa aaggggattc 27480 agttgagtcc tctgatggtc tctacctgcc aaagtccagc agcccttagc aaacatgctg 27540 ctcgtttctg tagagaaggt gctggtgtcc caccatactt ctctctccct catgaagggc 27600 ttgcgaccca gcaaatgggt ggcttatatg ggtctgtttc aaaggaagag ccagctctgg 27660 gaagaaaaac gatgagcata agcataacct accactgtgc ctgggaaagc agacaacttt 27720 tttgatgtgt gaatatctaa tgagaatgga atccatcaat taccttaaac ttaggcacag 27780 tcttcaaatt caatatatgt gggatatact tttagtcagt ttgtagacgt tatttgtaat 27840 aaataatctg gcttctctaa agaaattatt ttaagtgttt ggtttggttt gatttaatgg 27900 taaaattata tttagtggca gagaattata gcaatggtga taaactatag agtgtcataa 27960 gttcatatct tattctcaca tttgaagctg cctgcagatg cattcaagat gcagccagaa 28020 gtcaggagac tcaggctgtt atttggagct catcatttta cagccttgct ggactcccac 28080 tttctcaggg gaaaaatgtg gtgttgaccc agattagctc tccaggccct gctgagttgg 28140 gcactctgta agctggaggg tcttctattg tcttcaccta agtgtcaatc aacaacccaa 28200 atgggcatgg gggaagaggg agctgggcca atgcccaggg tgcctggtag agagatacct 28260 tgggcactgg aaggcaccag cttcccagag agaaggggga gggccatgaa aaagttggct 28320 gtagatgcca gggacactgg gactctccag ctgtgtgttt gtgtcttctg aagacttatg 28380 tttcattcct ttggagcatg cataatcata cactgtggga tgtgttatat agattgcttg 28440 atagttcacc actgtaataa aatactgtga ctggaatctg ctcccagtct gcctttgata 28500 gcacttgtgc aacacacatt tactgagcat ttacagtgat ccaggacctg tgttgtgaaa 28560 acattgatgg acaaggcaga tggtggagca cgtcagtgag gatttttaac aaaggctggt 28620 aagtgctata aaggaacatt gtaggacact agagaacaaa gaacaggaga acctgactta 28680 ggctggggtg gggcgttggt tagaggaggc tccttggagg acatgaggtt taagctgtga 28740 cctgaggatg aatagatgtt ggccaggtga ggtaccggta tttgtcagcc ttaccagtaa 28800 aaaagaaaac ctattaaaaa aaaaatacac atacaaagcc tcatcagcca tggcttacca 28860 gagaaagtac agcgggcaca caaaccacaa gctctaaagt cactctccaa cctctccaca 28920 atatatatac acaagcccta aactgacgta atgggactaa agtgtaaaaa atcccgccaa 28980 acccaacaca caccccgaaa ctgcgtcacc agggaaaagt acagtttcac ttccgcaatc 29040 ccaacaagcg tcacttcctc tttctcacgg tacgtcacat cccattaact tacaacgtca 29100 ttttcccacg gccgcgccgc cccttttaac cgttaacccc acagccaatc accacacggc 29160 ccacactttt taaaatcacc tcatttacat attggcacca ttccatctat aaggtatatt 29220 attgatgatg 29230 <210> 305 <211> 29996 <212> DNA <213> Artificial Sequence <220> <223> HDAd35-T4-Ef1a-mgmt-GFP <220> <221> misc_feature <222> (1)..(481) <223> Ad35 5'end <220> <221> misc_feature <222> (14126)..(14159) <223> FRT (Complementary) <220> <221> misc_feature <222> (14220)..(14463) <223> pT4 LIR <220> <221> misc_feature <222> (14478)..(15812) <223> Ef1a promoter <220> <221> misc_feature <222> (15830)..(16450) <223> mgmt <220> <221> misc_feature <222> (16451)..(16522) <223> 2A <220> <221> misc_feature <222> (16523)..(17242) <223> GFP <220> <221> misc_feature <222> (17269)..(17390) <223> SV40pA <220> <221> misc_feature <222> (17501)..(17766) <223> pT4 RIR <220> <221> misc_feature <222> (17873)..(17906) <223> FRT (Complementary) <220> <221> misc_feature <222> (29589)..(29996) <223> Ad35 3'end <400> 305 catcatcaat aatatacctt atagatggaa tggtgccaat atgtaaatga ggtgatttta 60 aaaagtgtgg gccgtgtggt gattggctgt ggggttaacg gttaaaaggg gcggcgcggc 120 cgtgggaaaa tgacgtttta tgggggtgga gtttttttgc aagttgtcgc gggaaatgtt 180 acgcataaaa aggcttcttt tctcacggaa ctacttagtt ttcccacggt atttaacagg 240 aaatgaggta gttttgaccg gatgcaagtg aaaattgctg attttcgcgc gaaaactgaa 300 tgaggaagtg tttttctgaa taatgtggta tttatggcag ggtggagtat ttgttcaggg 360 ccaggtagac tttgacccat tacgtggagg tttcgattac cgtgtttttt acctgaattt 420 ccgcgtaccg tgtcaaagtc ttctgttttt acgtaggtgt cagctgatcg ctagggtatt 480 taccggtatt caaggattac atgagcttag aaatgtaatt agcatagtgt gtggcatagt 540 gtagatacca aataaatatg atctctcctt ctactcttga aaatgcaaac acattcttgg 600 tggtcctaaa atagcctgta acatggttta ctcagcagca tttgctattc aaggcagatc 660 tgcctttagt cattggctgc gctcctgaac agctgtgtga aaggctaact tttgtaaacc 720 aaatcaaaat aaaatgcagc aaaaatttgt cactgaaagg aaatcctcag tatatccttt 780 tatgaaatga aagatccctc atccaaactt aactttttta aaagtgcgca tttggagata 840 tagccctttc ttatgaatcc taattcaatt ttggccataa acacacgttg atgttcccca 900 ccccaaagca catagcaaca agagtaggtt ctatattgaa aataatgaca atttaaaaac 960 atgtacttat ttcactgtat gtggacagtg tctatgattg catcatgaag tgtcatataa 1020 ccatgtacgt gtacatgaga gagagataga gagagaagtg gtagggtggt ggtggtagag 1080 gggatggcga tagtaatcat ggtaatggta gaggtgatgg aggtggtaat gacggaggta 1140 agggtggtag tgatgatggt ggtggtggta atggtggtgg atgtggtggt ggcaattggg 1200 atggtgggat ggtggtagcc atggtgatgg tggtaatggt gttgatttaa agggtggtgg 1260 tagtgaaggt gagggtagtg gtggtggagg tggtggtgct ggtagcaata gtgatggtgg 1320 tgatggtgtt gatgagggtg ttgggatcag ggtgagttcc cacagtatat ttcattcttg 1380 ttgtaccact ctgtcaacag caccactgac tgggacagag gaagaaggca cactctgaat 1440 gtgttattaa cagaaacctc aaaacagtct gtctccttgt agtcattcaa aattatcttt 1500 ttcttacctg gaaaactgaa actgaattac cgggaaaaac acaggagatt tttgtttgtt 1560 aatatgctgc caataaagta attttatgtc aaatttaact acaggaaagg gcaaggcatt 1620 ttctaagttc cttagatgtc atgtggctaa aaaaaacaaa aggatggaca gcagttagat 1680 actgtacact tagctgtttg aagccatata ttcagaaagc agatgttggg agttggtgtt 1740 tgaggactga tttcctggag gtattttata taggccaagt tcattgttct aaactctaag 1800 ggcttgactt gagggaggaa aagaggcaag aacatgttta gttttgctga cagcatcaca 1860 tgggcagccc taaggctaga caactttagg gcctgaagct tattctagga aagaagcacc 1920 tacagagtgg cactgggctc ccctccacta tagagatgaa gtcatatgac agtaaagggc 1980 aggcagggct gcctaggggg cccagaactg acacttccat tagaatgagc acaggccagg 2040 gagagaagtg gggaaccaga gagaaggagc tggaattcta gtaggacaaa cggtaagtga 2100 acaacaagaa caagttaaga gtgtgtgcag tattctttca aagactgaaa aaatagtgat 2160 gtgatagaat ggcaggtggc tctgagcagg ccaggagaag gactgggggc agagcatccc 2220 aggcaggagg gcagcaagtg ggaaggccct ggggtggggc ttttggactg ttccagtgac 2280 gggcaggcag ccagtgtgcc tgtcacacaa tgcaccaggg aagtagtcgt gaatttgcag 2340 agggtcttgc aggctatggg aaagggattg gattgtattt tgtttgtagg gaagccatcg 2400 ggggacttaa gcagaggaag gattggcttc atctctttga aaaagttctc tctggatgct 2460 gatgggagga gaaatggaag gaaaagaaac acttttaggg gcaagaactt ttgagaaggg 2520 tggaattggg agtgtggagt tggggccagc tttggcacag gaggggaagc taaacacgtg 2580 gccgcatgag ggcctgtaat tctacctgaa atgggtacca tttgttaggg taaacaaatg 2640 aaccaaatgc ccagtgatac agaccaagtg ttggcaaact tcttctgtga tggcccaggt 2700 agtaaatgtc tcaggcttcg caggccatgt ggtctctgtt gaagctctgt gtagtagaca 2760 atatgttaat gactgggcgt gactgtgtgc taataaaagt ttatttacaa aaacagcccg 2820 tgggctggat ttagctcaca ggctgtagtt tgccaacctc tgacctagag catgaactga 2880 gcatcttctt ggagggaaat aagttctttc caagttgccc tcctcacatt gcagggggcc 2940 atgtaggccc attattcaca gaagagtggg tgggcaacct ttctggagca gaaaaacgta 3000 aagatttctt ccgtagtgca agtaaggtga ccatttctaa accgtgcaag tgatccagca 3060 gtcccaaaag ttgtttcact tctcattgtg cgcccgttct caggtgctcc gaagcttcca 3120 gtcctttgta gggacatgga tgaaattgga aatcatcatt ctcagtaaac tatcgcaaga 3180 acaaaaaacc aaacaccgca tattctcact cataggtggg aattgaacaa tgagatcaca 3240 tggacacggg aaggggaaca tcacattctg gggactgttg tggggtgggg ggagggggga 3300 gggatagcat tgggagatat acctaatgct agatgacaag ttagtgggtg cagcgcacca 3360 gtgtggcaca tgtatacata tgtaactaac ctgcacaatg tgcacatgta ccctaaaact 3420 taaagtataa taataaaaga aaaaaaaaaa gagaggagag aaacatcatc ccctccagga 3480 tacccttggg ccttgttctt atagtcttgt acattgttga acaatttgca tgggctagtg 3540 gattaaagca caccctccac cctcaggccc tcaagggtct ctatgataat acagtctcac 3600 cttctaccct ttccatcacc atcctaggtg ctatggccaa ccttgaggct gccatgttag 3660 gtctatgcat ttcccacctc caccacataa ctctctgaag gccaggtagt ttcctattca 3720 tcttggtaac cccaaagcct cgtgacaggg ctcagctggc atctgcggat gtgaatgaac 3780 cattggagaa aatggtactc tgcaaataac tctgttattt tcccatttcc tgtgtaaggc 3840 ctagagacaa tgacttttta attgcacccc ttcccctctg tatgacactg gccttctctt 3900 gtgtccagca atgtgggtgg cctagatgat ttctaaggga cttctggcca agatgaacag 3960 cagctgcatc ttactgagca tttactatgt gccatatact cagccacagc tctaggggca 4020 tagaagcagg agctctcagg gtcagggcag tgagtgagca agcgagcacc tatgccagcc 4080 ctgcctctgg atggggactt gagagggtga tggaagcctg cagcactgga gggaggcaga 4140 caaagacagg cctgtgctga gggggcccgg agcaagagag agggaggcaa tgacagcaga 4200 gacatgcctg cgccttgggt ttgagtgccc agtggtcaaa tccacttccc tgtggctgat 4260 gcttgccttt ctaactttgg aatttagggg ttggagatct ggtgagaagg taggagggag 4320 atgaggagga gaagggaaag gcaggaagga aggggaggga aaggaaaagc aaaaggggag 4380 gaggaaggtt tccaacaaat tattctatat caactgcgga aatcaaaatt tgttgcccaa 4440 atcttagaag ctcatgtccc tcctccccag aagtctggaa tgcagcactc caggggtagc 4500 ttataaccca aatatctatc tgtaaaaaga gaaacattgg gctttcgagc tgtggattct 4560 cagtaaaagc aagaggcctc agcctacaca ggccagccca gagtttgagg aaccccaggc 4620 ccacacccac agggctggcc cctgggtctg catactccct agaaatgtgc acacttctga 4680 gcctcaactc tgtcctggag tctaacagca tccctctcct tcctggggca gttccacctc 4740 cagaaacctg ttaccttggg ccttatgtca aggaaactgt gggaaagagc taggcaggaa 4800 tgcagatgag gccagcatgg gctcctaaaa gtttagaaat aggcagtgtc atgctcccag 4860 gtgcctgcat aaaccagctg aaaaatggag ctcccctcac cagcactctc ccttcaaaca 4920 gactgtgatt tgcaggtcac tggtttacca agccaggcta cccaggcagg acccagatgc 4980 caagcccagt ggtgtcctgc aagctgagca gtgctcagtt cttgcaaaaa aaggtctgtg 5040 tgaaggcaag gcctctgcct ggcttctcac cccagttggg tgtctggaac aggaaggagc 5100 ccttactgca gaaaaaggag gagggagcaa agggagcgaa cagctgcgtg ctccatgggg 5160 aggatcccca aagtagaaag gcgcatacac actgcagccc ttgacccaga atgctcacag 5220 ctacattaca gattcaggtc tcctcagtgt agtggggctg ctgatgagac tgtggcatcc 5280 tcaggggtca ggacacacat tttccatcac tcttctgatg gcaaaaaacc tctgagccaa 5340 tgccaacctc tgatcattaa aaaaaagtgc tcacagcagt gtgtggttta ggatcatgcc 5400 ctgtgtggtt tggaacacgt gcacaaccac accttgttca tcaccatccc agaaaccctg 5460 acgcaggcaa agagcagagt tattaaccct actttactga tgtggatact gaggcccaga 5520 ggctcatgca agttatcaat aagtggcagg gacagttgcc tctagattaa ctagccccta 5580 ggatcacctg ggtcttggaa ggggacccat aaacatgagc tcccctctct tggggccaga 5640 tttgcacctg tgccgcgcct tcagcctgca tgaagtaggg gctgctggca aagactcaaa 5700 gctgtaaatc tgggttttct cttgaggctt ctaagggagc tgtttcgaca actcactctg 5760 ttcccagctg gctgcccctg catagggttt taaagcagcc tagctttctg ccaggcttgg 5820 cagtggacaa cgctggtcag aacatcccag agagctacca gaatgaagta agtttgcttc 5880 tactctttac ctgtttatgg gctgtctctg ccactggaat gaaaggcact gagaacagtg 5940 cctggcctgc agaaggccct ggaaatacct gagctcctaa tctgggaata ggagtaggaa 6000 gagctttgga ggcagggcac ctgagtttga gatctacaac ttcctgcctg tgtgacattg 6060 ggaaagtctc catcctttct gagcctcagt ctccaccctg gggaagtgga aatatcaatc 6120 tctgtgacac agaagcaaat gagcgaatgt gcacaaagta ccttgcacaa gagagacgct 6180 caaacacttg cctccaggtt tcaccgagaa ctacagagta agatagattt gttcccagtg 6240 gaggaagcct gggaataatt tgcccctaga ctatgaattc ctggggctca agatcgagca 6300 cagggccagg cacacagaag ggaccctgga aatgtggcag gaggccagag atagacaggc 6360 ccttagagct catacccatg ccctctgacc tcaagaagaa agaaacctgc tcaaaatctc 6420 acaaagagct tgttccaacc ctgaatcgag tctgaggact ccttcctgag tccagcactt 6480 tttctgcaag aagtatatgc ctccaaagct gatgggcgca aatcttgaac cccgtcacat 6540 aaacacaaag ggaggaggtg actagagctc ctcctactgg atatgtctaa ggtcaccagt 6600 ctaaagaaaa gggatggata gaatgaggcc agtatttttg cagccatcca aatgtccaca 6660 tacgctgtta cactgagggc tcctctctcc cccgtcttca gccctacttg catttagagg 6720 tgagaaagat atgggctgag gggttgtttt tcatcgtatt gtagatggaa agcacactgc 6780 ccttggggcc atccaaatgt ggaccttgat gtagcacccc accttctgga tggccatcct 6840 tctgaaagtc actgaatttc tcagacttta ttctctttat ccataaagaa ggagaataat 6900 aataatcccc ccaccctgcc caaccactga ctggttggga agctcagaag aaatactggg 6960 cacggcatcc cattgtaatc tatagagtga gtcgcttctt aatattaaat ggctgaacac 7020 agaagatgtg caaaaagtac tgtgtcccct tcctcctcca actgaacatt tcatgccctt 7080 tgcaccctca ttttgtctag gagctgcctt atgaagggaa taggtacctg ctccgagctg 7140 gaggaatctt tgccacttat ggtggggtat ggactgagac agagatggca tgtgacatgc 7200 gcactgagtc tcaactccat gcaggctctg gagcactctc aaattggagt actaatgcct 7260 tttaaattct cacactagca atcctttgac ctactgatct agggatctag ggaaagaatc 7320 gtgatcttaa cttcaaaggg aaggacaaaa tgttctgcct cctgttaaaa ctccatacac 7380 taagtgcaga gactggatgc cttattaacc ttgggtagat gcccaaatgt tcaaaaggtc 7440 aaactcttct gttccccaga tcgccagagt cattaaccag tcacactatt aaatgaatga 7500 acagatgctg aaaaggtact tgcattactg agatttctta tggtgatggc ccctgcctga 7560 tatgtattca gcattttgta gttttcaatg tgcattagag tatagtggtg atgacattgg 7620 cctctgagtt tgccacttct tatatctgtg actttggtca aattgcttaa tctctctgag 7680 tctcggtttc ctggagataa taatagcttc ttcttcccag ggttatcatg aggattacag 7740 gagataatgc cccaaaaatg cttagtaaag tgcctagcac ctagtcaatg ctgaattaaa 7800 ggtggttatt cttacttttc gttcatttga actttgttct cagggagggc aaaggataga 7860 caaagcccca tagctagtga ggagtagctg caagactaga acccaggtgt tctgagccct 7920 agtcttaggc caagaacaac tgttacgtga gatgcacgtt ttccttcaag ggagctcaca 7980 attatttcca tgtaaattca aggactgcta aaagagaact ctcctctggg actgatatca 8040 ttttatttca agattgattt gaaacatgtt ttttgtttgt ttgtttgttt tctaggaaag 8100 aacaagagaa ccagttaagc tgaatgcctg aagcaaatcc ctgttagcga tgttttcagg 8160 atgagggaga gtggtgcaag aaacgtgctt ccagatgcac atggtttcct gggactaggg 8220 ttcagggtgt catccctggg tgttattaag tgtcagaagg agagcaaaca agggaaacat 8280 ctgagatcca gctaaggcta caccctggaa atgcaagccc agctcttgca aaggacctcc 8340 tttggccact caccttccag gccttacaat aacttgtttg gactgcaggt ttcttggtgg 8400 actcacaggc cattctgctt ttatttggtc aacctcagtt cacaagcacc cagatgctga 8460 gatcctcagc atgtgcagca gagtttcata ttagcactgg gtacctttct gaggctacag 8520 ggataccgta cagcagcacc tgtcacgtcc agccaaagga gtgggctctc tcaatgtcat 8580 ccaatgctgt ttcaactgtg aagaagacca tctgagagag ttgcttttgg aggctgaggc 8640 aaatttttaa aattctttgt tctcctcaac tggggtgaat tcttggtctt ctaggacagc 8700 ttgaagtttt agaaagagtc aagccactca gaaccaacag agaactcttt cagagaacaa 8760 ggtgtggcat agaggaggca gagggctgat cttgatcaaa tccaaagtgt gactctaaag 8820 caatgaatgt gaatttttgg caaagcttac aaagggctct aaaggccatc tgcaaagaga 8880 agccaagcct gatcgatgaa tcactagtgc ggccggatat cgatcggcac gctgttgatt 8940 ttctcatagt aaggaacagt gggccctttc agtcccactt ctgtagtctg tggtactaca 9000 aatggtgagc ccatgatgtt gccattcata gggttattct ccagcagtaa tgactggcca 9060 gccactccca tagccgcggg gctaggattt attgtcaatg gagggacctg cagttctgca 9120 caagcagtac taggatgagc acctgggccc attgcaaggg tgacatcttc aaggcaaggc 9180 ctcttaattt tattagggta gcccccatca gccatgtctg gaaactggaa gtggtcttct 9240 tcttgtctcc tcttaacagt tccctgtgaa tggaagagaa gagaggagga gaagagagga 9300 gaggagaagg gaagagaggt gacacacaca cacacacaca cacacacaca cacagagaga 9360 gagagagaga gacagagaga aagagagaga gagagagaga ggaattttta taaaggtttg 9420 gcacattaaa gctaatgaac aggaaatgtg catgataaaa cagacctctc agtttaaaga 9480 cttatagttg tgaaaactat aaaatacagc ctgtctttgg aaccatagtg cttatttatt 9540 cattattatg tttcatctaa actgtctaat tacatttcaa ataaggcatt atgttgtctg 9600 tatactaaaa cgggatagaa cgttattcaa agggtaatct gcccacttca aggagagttc 9660 aacaaaacta tgcagaagtc actaaatgaa ccatgctgcc aaaggcaggc attggagaga 9720 aaactagaag tagctaaata gttttaattc tttcctgtct acagacacat agattttaac 9780 gaaggaatac catagtatag aattgaactt ttaggctgcc ttctagtctt ggttaaatgc 9840 atcaggctgc agtggtaaaa ttgaatacaa cagagccctt acaggaaaga agtagatctg 9900 gatgtgtttt cttggggagc tgtttaaaat actgtttttg ggaaagcaca agtttcagaa 9960 cagtcattgt aggcatcgta ttcattgttc catttatttt tacacacaca cacacacaca 10020 cacacacaca cactctcaca cattgctatg tgtacacaaa aataatttgg aagaacctat 10080 acccaacaat ttggagtggt catttatttg ggatgactgg caattccctt tctattctct 10140 tcatttctgc ttgtttgtct ttaacgagaa cgactcataa tccaaaaatt taaaaaagta 10200 taaagttatc taaataagaa attttcctct gaagatgcat cctcaggttg gggagatatt 10260 aaacaatgag aaaaggcccc aatctgggat ctgaaccttg ggggagctgc ccatcattta 10320 tagaagcaca gcctttggga acaaagcaaa gtcactagca atgtgagact tcctactctt 10380 catggcttca tacagtcatc catcgctgtt gtgttaatga ccatgacctg tatgttagca 10440 ggtaaatggg aaaggaagtg ggggcaaagg agtatgtgca ggaatgatca aaataaggaa 10500 aggaagagag ggatctggaa atcacctgaa tgccgatagg tgaacaggta gaattctttt 10560 aaagcttccc ccacccggta ccccccaaat aacccctttc cagctttgga agtttcacta 10620 ggacatacag tgctcatcct ctgatgtcac cttaagtttg gctcttctgg tttgatgagc 10680 ttgtagccca ctaggagctc aaggcatgca tggggccact tgccagcacg atgaggggca 10740 tgactgtcat ggccaagtga acatcaaagc agatccccag ggctgtatgt ctcaggcctt 10800 ggtgcacatc agaatcactt agaaacatcc acattcctgg gccctcccac cacaaactga 10860 cagcttcatc cagggtgtgg cccaggcatc gggagttttt ccaacagctc catggctgat 10920 tctcaacaga aaaccactgg cccagagcaa gggtggaggc agcgtggcat agggctctga 10980 ccttggcctt gccactgaac ctctcagagc cccagtttct ttatgtgtaa aatgagtgta 11040 attatagttc ttttctcatg aaggtgctct gactattaag tgaaacgggg cacattgtat 11100 gacacctaat agctcctcac taactggtac ccggcattat aaagggcagg tatggaaggg 11160 ttctgggagt ccaataccct tcttaaagac agagaggtct ctgagaccca gagaggggca 11220 ggccttaccc agagttgctc agccagaggg caacaaggcc caggtcagat gcagggcccc 11280 tccaccacca ctcagctgcc tccagaccca ctgccttcgc catgttgttg gtaggacact 11340 gcatcgcccc cacagaaggg gcttgccaac ttgagtgaga ggacttgcac acttctttga 11400 cttttctttt gagatgccca caatctgaac aagggcactt caagggacag ctctgtcacc 11460 aaactcatct gaggcctgaa taccatgggt caggcaggaa tgggttggag aggtgtagag 11520 caggcacaat aagagggctg aggcccatgc agtcatcagt gcccactttc ccaggagtct 11580 gactgggcac agcacccata gtgtccctga gctggtccat ggagcagctc actaactgtt 11640 tggcccacag caggtgctca gtaaatggca gttgaacgaa tcaatggaca aaggaacata 11700 aattacccaa cacacaggga gctcagccat ttactcaatc cattatggag taacctacaa 11760 acaagccact gggtcccaaa ctgaaattgt gtctcttcta cattctccca aagaatccaa 11820 taggttaaaa atagaaatgt atgaaataga tcaatcaggg atgattgcat gtggatttga 11880 cataaggatc ccctgcaggg agtctgagct ggcaacagtc aggcccaaag tgctgtccat 11940 gatgtctcga actgcaagac agttttaaca atggcgaagc aatgcagaac caggcaggcc 12000 aaggaggggg tgggggttgg ggaaaggaag ggagggaagg ggctgtgagg ggcaatggtc 12060 tggcatccct gccacgtgag cctctgaaat ttgctggcag cttctatggg ctcccagagc 12120 tttcacttaa ttgttggtct gccactaacc tgctgggagt aaggtgcagg gatggaggag 12180 gcagggcatg accaccagac actaaaggta ccagctgggg ccactggcaa agggaaggag 12240 gctgcacctc tcctacatga gagcccgtat acacacacct tttccagcac tcatcaactg 12300 catcccaagc aaatggtccc tgatcaattc caattctaga aaccaactga ctactcaata 12360 acaaagtaga tcccagcagg ccgccactgc tggagcggat gccacttttg ctatgccaag 12420 tctgtggctg gacagctgct ggcatgtaca ctcactgact ttcataagga tgcctaataa 12480 agggggcagg ctcacctggc ttttctcagg ggtggggttt ggggtgccga tagaggctgc 12540 tgttttggca gagtggcaag ctgcaagcct cttctgagct ttcatttttc aatggacttc 12600 agtgagaatt cactttgtca gaggccatgc agctccatgt tttggatttc atggaatgag 12660 ctttcaacag tgagcctgaa gtgccctggc tgaacagcaa gaacaccagc caaccctaaa 12720 caaggccgag gagaggcggc tgtgtttaca cggaaggctc agccttgctg taatagcgtc 12780 tgccttcacc agacatcagt gaggcgtgga aatctattat ccagttaatt ttgcccctag 12840 ataaagactt gctttcgtgt cttctctttc acagtcccat gatctgttac tcatctcaac 12900 tgcgagaagt tggctgggct ttcccctgtg cccagtgcca cactcgtgcc ttcactgggt 12960 cacctgtgcc tgtggctgat gccgctgagg ttttgcctgc ccagactggg tgtttctgac 13020 taaatcccac agccaccatt ttagatcaag ggcaggagat agctcactgc tccggaatga 13080 cctcccctcc cagaatcctg gtaggggcgg aaggtcccca accaagctcc cagccctttc 13140 taaatgaatc tccctgcttc acccatgtgc ttttctccag tctctgcggt cttgatgaca 13200 gcagggtatt agtcctagct gtcccacagc tcctacttct ttcaggcctc tccctgtgac 13260 aatcagtagc cactggcagg atttcctcag agcatatctc gatttgcttt cagacaatta 13320 gttaaaagga cactggaccc cagacgtccc aactcccagc cagagccctc acaggcccgg 13380 cctttggtgg tgaggaaggg ggagggagtg agtgacagtg ccctggcatc ttttagaaac 13440 gaattccttt ctctccatac ataaatgcct gcagagtccc atttcagaat ccggcagaca 13500 aagccaccaa tgtgatcccc atgaccttat aaacattcat taaaatgcat ttcaaggcat 13560 gtgatggcct ccccaccccc tagataatga gaaaacaaag gtttctcttc tgatagagac 13620 aagttcagct ctgaagtcaa cattatttct ggttctgtct gaacaatgac atatggcaac 13680 tcttcccttt ctatagttct agtccagaat gacaaaaaag gggaaaaatt tcttagagaa 13740 ggtagagatt atacgaatac agtccatgaa atgagcataa ggagaataaa gaatataact 13800 tatccaaaga agtctggcag gctgttataa atgcttgatt ttggacactg tagttggagg 13860 tttaacatgg acaccaataa aaaggtcagc aaagggtatg cactgttcct attgggcaag 13920 aagataggag gtcaaaggta accaggaaag ataaactcag ggagacttat tttccctcca 13980 gagggcactg ggcttgtagg ccctgggcaa aattgtcaaa aaggtgaaaa tcgcctgtgg 14040 tttatttagt ctgctctttc ttcactagtg cctcaccagt tcagttcagg ccaatttgct 14100 agaaggtagc gaacgatcga ccggtgaagt tcctatactt tctagagaat aggaacttcg 14160 gaataggaac ttctacctag atgcatgctc agagcggccc ctagctagcg tttaaaacct 14220 acagttgaag tcggaagttt acatacactt aagttggagt cattaaaact cgtttttcaa 14280 ctactccaca aatttcttgt taacaaacaa tagttttggc aagtcagtta ggacatctac 14340 tttgtgcatg acacaagtca tttttccaac aattgtttac agacagatta tttcacttat 14400 aattcactgt atcacaattc cagtgggtca gaagtgtaca tacacgcgct tgactgtgcc 14460 tttaagcttt taattaagag taattcatac aaaaggactc gcccctgcct tggggaatcc 14520 cagggaccgt cgttaaactc ccactaacgt agaacccaga gatcgctgcg ttcccgcccc 14580 ctcacccgcc cgctctcgtc atcactgagg tggagaagag catgcgtgag gctccggtgc 14640 ccgtcagtgg gcagagcgca catcgcccac agtccccgag aagttggggg gaggggtcgg 14700 caattgaacc ggtgcctaga gaaggtggcg cggggtaaac tgggaaagtg atgtcgtgta 14760 ctggctccgc ctttttcccg agggtggggg agaaccgtat ataagtgcag tagtcgccgt 14820 gaacgttctt tttcgcaacg ggtttgccgc cagaacacag gtaagtgccg tgtgtggttc 14880 ccgcgggcct ggcctcttta cgggttatgg cccttgcgtg ccttgaatta cttccacgcc 14940 cctggctgca gtacgtgatt cttgatcccg agcttcgggt tggaagtggg tgggagagtt 15000 cgaggccttg cgcttaagga gccccttcgc ctcgtgcttg agttgaggcc tggcctgggc 15060 gctggggccg ccgcgtgcga atctggtggc accttcgcgc ctgtctcgct gctttcgata 15120 agtctctagc catttaaaat ttttgatgac ctgctgcgac gctttttttc tggcaagata 15180 gtcttgtaaa tgcgggccaa gatctgcaca ctggtatttc ggtttttggg gccgcgggcg 15240 gcgacggggc ccgtgcgtcc cagcgcacat gttcggcgag gcggggcctg cgagcgcggc 15300 caccgagaat cggacggggg tagtctcaag ctcgccggcc tgctctggtg cctggcctcg 15360 cgccgccgtg tatcgccccg ccctgggcgg caaggctggc ccggtcggca ccagttgcgt 15420 gagcggaaag atggccgctt cccggccctg ctgcagggag ctcaaaatgg aggacgcggc 15480 gctcgggaga gcgggcgggt gagtcaccca cacaaaggaa aagggccttt ccgtcctcag 15540 ccgtcgcttc atgtgactcc acggagtacc gggcgccgtc caggcacctc gattagttct 15600 cgagcttttg gagtacgtcg tctttaggtt ggggggaggg gttttatgcg atggagtttc 15660 cccacactga gtgggtggag actgaagtta ggccagcttg gcacttgatg taattctcct 15720 tggaatttgc cctttttgag tttggatctt ggttcattct caagcctcag acagtggttc 15780 aaagtttttt tcttccattt caggtgtcgt gagaattcga tatcccacca tggacaagga 15840 ttgtgaaatg aaacgcacca cactggacag ccctttgggg aagctggagc tgtctggttg 15900 tgagcagggt ctgcacgaaa taaagctcct gggcaagggg acgtctgcag ctgatgccgt 15960 ggaggtccca gcccccgctg cggttctcgg aggtccggag cccctgatgc agtgcacagc 16020 ctggctgaat gcctatttcc accagcccga ggctatcgaa gagttccccg tgccagcgct 16080 tcaccatccc gttttccagc aagagtcgtt cacgcgtcag gtgttatgga agctgcttaa 16140 ggttgtgaaa ttcggagaag tgatttctta ccagcaattg gccgccctgg ccggcaaccc 16200 caaagccgcg cgagcagtgg gaggcgccat gagaggcaat cctgtcaaga tcctcatccc 16260 gtgccacaga gtggtctgca gcagcggagc cgtgggcaac tactccggag ggctagccgt 16320 gaaggaatgg cttctggccc atgaaggcca ccggttgggg aagccaggct tgggagggag 16380 ctcaggtctg gcaggggcct ggctcaaggg agcgggagct acctcgggct ccccgcctgc 16440 tggccgaaac ctcgaggtga aacagacttt gaattttgac cttctcaagt tggcgggaga 16500 cgtggagtcc aacccagggc ccatggtgag caagggcgag gagctgttca ccggggtggt 16560 gcccatcctg gtcgagctgg acggcgacgt aaacggccac aagttcagcg tgtccggcga 16620 gggcgagggc gatgccacct acggcaagct gaccctgaag ttcatctgca ccaccggcaa 16680 gctgcccgtg ccctggccca ccctcgtgac caccctgacc tacggcgtgc agtgcttcag 16740 ccgctacccc gaccacatga agcagcacga cttcttcaag tccgccatgc ccgaaggcta 16800 cgtccaggag cgcaccatct tcttcaagga cgacggcaac tacaagaccc gcgccgaggt 16860 gaagttcgag ggcgacaccc tggtgaaccg catcgagctg aagggcatcg acttcaagga 16920 ggacggcaac atcctggggc acaagctgga gtacaactac aacagccaca acgtctatat 16980 catggccgac aagcagaaga acggcatcaa ggtgaacttc aagatccgcc acaacatcga 17040 ggacggcagc gtgcagctcg ccgaccacta ccagcagaac acccccatcg gcgacggccc 17100 cgtgctgctg cccgacaacc actacctgag cacccagtcc gccctgagca aagaccccaa 17160 cgagaagcgc gatcacatgg tcctgctgga gttcgtgacc gccgccggga tcactctcgg 17220 catggacgag ctgtacaagt aaagcggccg ctcttcgagc agatatcata agatacattg 17280 atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 17340 gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt acgttaacaa 17400 caacaattgc attcatttta tgtttcaggt tcagggggag gtgtgggagg ttttttaaag 17460 caagtaaaac ctctacaaat gtggtattaa ttaaagatct ttaaacaatt taaaggcaat 17520 gctaccaaat actaagcgcg tgtatgtaca cttctgaccc actgggaatg tgatgaaaga 17580 aataaaagct gaaatgaatc attctctcta ctattattct gatatttcac attcttaaaa 17640 taaagtggtg atcctaactg accttaagac agggaatctt tactcggatt aaatgtcagg 17700 aattgtgaaa aagtgagttt aaatgtattt ggctaaggtg tatgtaaact tccgacttca 17760 actgtagttt aaaacgggcc cgtagtctag ggccgccagt gtgatggagt tcggcttcag 17820 gtacagcaca ctggcggccg ttactaggta gctagagcct tcagactcta gggaagttcc 17880 tatactttct agagaatagg aacttcggaa taggaacttc acccatggcg atcgctagcc 17940 tctaactcct agaccgtcag aactgctggg cccttcaaga cgggctgctc acacccactc 18000 atgttaagcc tggtgaggcc tgtactctgt tttcacagga agaaatcctc acccagtctt 18060 ccccaaacac attcccaggt tgtgtcatta gtgggataga gatgattatt gtggggagaa 18120 gagaaacatc tggatggatt tggtgaggtt gatctataga ggaagtaggt gctgcctgag 18180 gtagctgtaa tagaagctaa aggtcaaagg agagggccct gtcccaatcc agatgactcc 18240 acttctgctg gacccaggtt cacaagctta atctacattt cacctaaatt tggctaacaa 18300 gcccaaaatc acacaggcaa agggagaagt ggaggcagaa ccgaggttgg aggccaccag 18360 ggccaccggg cagagatcat ttaagcccaa ccttctcact tctccctggg ctctgcctct 18420 cttaaaggac cttgtggtgt gacctcttgt aggtcccttt cacactcggg gcctcagttt 18480 ccccactgta aagtgaatgg gtcccagctt tggtaagctt atgcttacct gatgctttct 18540 tcctgggctg ctcttgtaga gaaaagataa atcttcttcc tccatccacg agggctcctt 18600 tccctggggg tgagagtagg ctgaggagag ccacttgcac acacccttaa agaaagtatt 18660 acctgcacca gctcagtgag aggcacagat cagactgtta cttgaatcaa attatgagcc 18720 tccccaaata tatctatgac atttaaatag gggattactt gaacatagac tgtgggatcc 18780 ggtgtggagt gcgggagact agcaaagtga atcctgagag tagcaggtct gcacctgttg 18840 gatcgagaaa ggcggcctac aattctggtc aaatgagctg tgcttattga catattctat 18900 tagagagtac taccaggtca ccagtcacca gaaaggctgc cagctctcca accacctcca 18960 gggaactatc ctgaatgggg ccttaacaag tctaagagag ggttggtttg ggtcccaagc 19020 caatatttgc tctgctttat gtcagtcata tggaacccaa accaaccctc tcctatgtgc 19080 ctcaccagtc ggtgcaggga tcccaatttc aagtttggtt ttttatggtc aaagtccagc 19140 atagattaaa tgaaggggtg tgatgatggt gttaaaagag aactccagac cagtttaact 19200 cttggacaca catcccatct caccatggtg cttccaacct tccagagatg atgggctcct 19260 attttctgat gacaaagccc tccacaggat tgctgcctgg ccatcaggga gtgcctctgt 19320 aactgaggct gagatcccac tttcagtcct ccagctgtgg cccatccctg ctccgcccac 19380 cgggtatggc ctgtcctagg ctcttaggta tggctgcatt gtgaaatgat ggctacagag 19440 ctggcatctc ctgtagtctg gttcatctag tgcactacct catagttaaa agaaatctgt 19500 ttaagccact gagggtggct cctagtgcca actccaagaa caggaagctt cccttttttg 19560 ggaggagggg cagatggtaa catggatcgt ccaggtcaat gggagcaggg caaccacagt 19620 aagtactgga caacaacaca aaactccatg tgtggcttcc atcgagtccc tctccaattg 19680 gtttggtctt ctccgtccca tgcagcactt tagcaagggg cctggctgaa ggctatgaat 19740 tgtgtggagc ctcctcattg cagtctccaa ccatctgatg ctgggaaaat gtcaccagga 19800 tgcagccatg ccgtgtggcc aatgaaccga gaaaacaccc cttttctaga atgctctaaa 19860 gaggcagaat aatccagagg tgaggaagga aatactccac cagagaccca ggcagttcct 19920 acaaaagcca gactttcctt cacctaggga gtgacaagac cagtggaaaa cactctcaag 19980 cagtaacccc caaatgctct gcaagccagt ggcgtccaga taccgcacaa gcgagtgggc 20040 tgtctaatcc catcatcatg atgtaaatat ctctaggctg ccctgggctg tgcctgaccc 20100 tgtcttcagc tttccacacc tccacctaca gcccatgcac agaaggacca cccaggaatg 20160 ctgcaagtgt ggcacctcca gggccaccca gggagaagga gggcagctat gctggtggct 20220 ccaggcccat ttggcgggtg gtaccttcac accacaaagc ccaaactgag gccccagatt 20280 tggctgatga gggcatattg gacaggggtc acttatgctc ttccccattg ccacctggcc 20340 tctggctacc tggacttggc tacctgtgga tcctctcaca ggtgccacca tcttggctga 20400 gtctccagat gcgaggtccc tgaggcagtg gcgggcttct cgctaatgct gatgggatta 20460 ggaatgggat aggtggggag ggccctggac tgggccctga tgagccaagt gggtttttag 20520 aggggctact ggtacatttc agggacagga catctggtag agctaagctg gggcaataag 20580 gagccactgc taatctgaga gctagaaaca atcagcttct gggtcattat taattagggt 20640 agtttgggct gtgtggaagt cacgtactat atggggtagc cacagctctc tctacagata 20700 atctctaaga cttctgattg ggactgtgtg aatgcagtag caatatctct tcttactgcc 20760 aggccctgcc agtcctgcct ccacgccctg gctggccccc cttatgatct gacccatgcc 20820 aggctgccat agtatgttac ttctgcatta gcactccttg ggacctgcct ctccactgtc 20880 cctcagactt taaagaacta tacaaaccca aggggctctt cccaagagaa ttgatatgac 20940 ttgaggtgat tccatttctg gaagtagtca ctccattttc tgcctcactc tttcagtgct 21000 tcacagagca ggttcgaacg aaggagccat ccaactaacc gtcatgttcg ggcaaccgaa 21060 gaagggagtg gcaggatttc ctttggagac ttctggaatt agacagcagt ttaatgcaag 21120 catctaaatt ctctccctcc cagagtctca ttaaaactac agtaagagtt tgtgttttgt 21180 tttgttttta aagacaaaat cccaccagga tagagagaat aggagaggag ataacagcat 21240 cataatttat gaaactaaaa tgcagataga ccaggattaa ctgactacac agcaccaagg 21300 aagctgaatc acaagacagc agaggagaaa actggaaagg atcgtggtct atacggcaga 21360 atcttcccaa gcctcaggag gaggagctct agatgttccc agatctggga ggtaaagtgg 21420 aatgggggga catggtcagc gtaatggggt tgggctggaa gcaggttaag gagcaggcag 21480 atctctgaat cccctctctg actctgtgtc cccaggcatc tgcctgtccc ccaccctgga 21540 agaggtctgg cttgaccctt tgtctggtga atttcctgct ctgctttcct ggtcctgctg 21600 gccggatcag tggaggccac tcacttcacc ccacagggat gttctgtgtt gccctacacc 21660 tgggaactgg aggtactgga ggcaggctgt ggtgagcttg aaagcaaaac acagagggca 21720 gtccaatctc tttggccata tttcttctgc atatccaata ccatgtccac aactctgcta 21780 gtgtcctgat ggtggtgggc tctacacatt cccgggaagc tgaaggcaga taatgaccag 21840 gacaggtcaa cctctcttct tctgaaagcc ttcatctact aatggcctgg gactcttccc 21900 ttaaatgctt agattgtgtc ttccactaag gttttttgct gttgctgttg tttgtttgtt 21960 tgtttgtttg tttgtttgtt tgttttgaga cggaatctca ctctgtcgcc caggctggag 22020 tgtagtggca caatctcagc tcaccacaac cttcacctcc taggttgaag gggttctcct 22080 gcctcagcct cctgtgtagc taggattaca ggcacatgcc accatgcctg gctaattttt 22140 gtatttttgg tagagacagg atttcgccat gttggccagg ctggtcttga actcctgacc 22200 tcaggtgatc tgcctacctt ggtctcccaa agtgctggga ttacaggtgt gagccaccac 22260 acccggccaa ggtttttgtt tgtttgtttg tttgtttgtt tgttttgtat tgaggcaggg 22320 tatcactctg gtcacccagg ctggagtgca gtagtgcaat cacggctcac tgaaacctcc 22380 acctccctgg cgggctcagg tgatcctgcc acctcagctt cccaggtagc tgggactaca 22440 ggcttgtacc accactccca gctaattttt gcgtttttag tagagacagg gtttccccat 22500 gttgcccagg ttggtctcaa actctgggct caagcgatct gcctgcctca gcctcccaaa 22560 gtgctgggat tacaggtgta agccaccgta cccggccccg ccactaaggt tttgaaaatg 22620 aagcaattac aagtttaagt ctattaataa gtgatgaagc catgtagaaa agcagaataa 22680 ttatcttgga tcaggaaggt cacatgagga tctacttggg ggttgtcaat attctatttc 22740 ttgacctgat cagtgttgac agcaggtttt aattttttac ttctttttgt ttgtttgttt 22800 ttgagacgga gtcttgctct gtctcccagg ctggagtgca gtggtatgat ctcggctcac 22860 tgcaacctcc gcctcctggg ttcaagctgt tctcctgcct cagcctcccc agtagctggg 22920 attacaggca ggcaccacca cgaccagcta atttttgtat ttttagtaga gactgggttt 22980 caccatcttg gccaggctgg tctcgaactt ctgatctcgt gatccgccct ccttggcctc 23040 ccaaagtgct gggattacag gcttgagcca gcgtgcccgg cccatttttt acttccttat 23100 taaactgtac atataggcct tgcacacttt tctgcatcaa tgttatattc cacaataaag 23160 ggaaaaggta tatacacaac ttgataccag taatgtgaaa catatatttc tacatagaaa 23220 aaaaaatgac tgaaatactg cactccaatg tgttcacaca gtagttgttt ctggattatt 23280 tatatattaa atgtttatat attgtattat gccatgaggt ttgtgttttc tctccacttt 23340 tctgcatttt ccaagtttac tacaaagagc acatattact cttataatca gaaagtcata 23400 aaatatattt aaaaagacaa aattgaaact aataaggatc aacacaaaac agatgagcca 23460 tctgtggaaa tccgcacaga atactaccta aagagattgg tgacgtgcat gatctcacta 23520 ggatgagcac aaagcttgcc agagcctagg gtctatttct agggttggct cttggaagcc 23580 aggatagttg ttatctctgg gaagagggag gggcacacaa ggggcttcta aaacattctg 23640 aatgttctat ttctgaacct ggttggtggg tacatgactg ttggttttat tattatatgt 23700 tttatatact cttccgtatg tatggtgtgg attccaaaaa aagatttcct ttagagaaaa 23760 ccagaatcac ataagtagaa aatatggtgc tatgttgaag gaacaactca agtttatata 23820 aaatcatcat catttatagg cttaaaaagt tgctttggaa ttttggtcta actgacttgt 23880 cttttctgca gcaaaccacg ctccttctgg acgtgctcca ggcagagggg attagggtgg 23940 gttcaaggct gcaagtacct agctcagcac actctcttca ggggacttag agtttgtctg 24000 gtgttggctc tctgagctct tgtcaggaat gccgaccctt ccgaggttca ggatttgaag 24060 cctgccttcc caccccagat ttggtccaca cagacactca agtatgtatt tcaactacaa 24120 atgacctgta ctttcctatt actcctctct ttcatggtaa cctttctggt atccttcctt 24180 ccctacattt atgggagggg gacatcattc tctgctctcc tgtcactgaa ggctccacct 24240 tctgtcttct tctgacccat ctggttttcc tggggccacc tcctctcctt accaccctaa 24300 cgcttttgta acttgaggag aaatgagaga tcacctagtc aggtcatcat tctctgtaga 24360 tgaagaggcc caatggtttg ctcaagaatt gccaagcgag ttaaagacag agagtatgag 24420 agtcagcaag acctacagaa agcatctatc tgcactgttt tgcagggact tagcctttgt 24480 gtgtggactc ctggaatgcc acccactaag aaacattgtc tgacaccaac tccccacttg 24540 gtaggtgggg acactgaaac tcatggcagg aaagggcctt gccccaagcc agggcagagt 24600 gtcactcatc actctcaatt ttcagtccag ggcaccttgt tgtgactatc ccaaaggcag 24660 ccactttccc tggtctgaaa gacctgaaga gagaagagaa gagaaggatg gaaggcagag 24720 tatgcggctt tgattcattt cctggtgaaa acagatctat acgagaagca aatttcacga 24780 aagggaagag aagaaagtgt cccatacgtt gctggcctgt ttcaaccttg ctttgattct 24840 tgctgaaaag ggtaccgtgt atttctgagt tcaacatgca gaccagtgtt aggaaagcca 24900 ctgcacctcc actttagcct ccagggctgt gccctgcaaa tggcctgcag ccttggtgcc 24960 tcgctctcca gactgcattt tggaagatgg gacagaggct tatggaagcc cacattagaa 25020 cgggggagca gaatgggtga gatgagggat ccttgatagt gaaccagatg aaggaatggt 25080 agccaaatgc caggcctcct ttgtggcttc aatccaaagg ctctggagcc cttccagggc 25140 agaacatcag gcatgtttac ccccactgtc ctcaacagtg acagaggtgc aatcttgggc 25200 agctggccat tttgaaagca acctccttaa tctcaactgg gaaggctccc tagcaggacc 25260 cctgtgttgc acacctggag gaagctagac taaccagaag ctcagcacgg ttccatctgg 25320 gatgcccagg tctgagacga aaaaggtaac tctcttttct gggtcctggc ccagttgtgt 25380 ctctctccac ctcattctct gagatgcctg tctccccttt tttgtcccat caggaggcaa 25440 gagctatcac tgggccagac tccaccagaa gccaagccag cttgttaccc agcttctcag 25500 ggagcaaaga acagccttgt ttctatctta tccccactgt cccctgcccc tgccccacct 25560 cccagccatt cagcttctgg cttccccaga gctgcctgct tctttgtggt cctccattcc 25620 ttgaaaagac cttctagtca ttagtgtata taaatggcca cttagcccag attacagtga 25680 ggtcaacagc tggggctctg agaattgtca cacactggca caggagagga ggctattctt 25740 ccagagaatt tggagggcac tcccatccac ttacaacaaa aagcccatcc actgtgcttg 25800 gcagtaggtg atctgagaac caatggaacc aggttaatcc tgtggcactg ttgagtgagg 25860 agagcagtgg cgggcactgg aaaatatcag agacaaggca ggagacctga aatctaggct 25920 tagctcctca tatacttggc agctgtatga cctcagacaa ccagtgttac ctctctaagc 25980 ctcagtttcc tcatgcaaaa ggagggggaa taacaacaga gcccactgct tgggggtgtt 26040 gtgaggacag gatgaaaaaa caaacagaaa tccctcagta caggattcag tgcagtggac 26100 agtcttgcaa ggtctggttc agccctccac ccctaccctc accagtataa agaactctgg 26160 cctacaagtc agatgacctg agttttaatc tcagctttgc cattagccgt gtgaacttga 26220 gaaagtccct ttccttttta catctattgg gatgatcatg cattttttgt cctttattct 26280 gttaatatag tgtgttacat tgattgcttt tcatagactg aaccagcctt gtattccagg 26340 gataaatctc acttggtcat ggtgtataat cctttataca aatgttgctg ggttgagttt 26400 gctagtattt tgttgaagat ttttatgtct tgattcataa ggaatattgg tgtaccttcc 26460 ccttttatgg ccacagtttc cctacaatga tgtagtcgaa ctagacaacc tccaatatct 26520 ttcagtattc atgtcctctg attctgtgaa actaagaaaa ttaagaaata gtgattcata 26580 ggcacaaggc aggcaaaact tagactcctt gtagaataat taggaagcca aatattcagt 26640 gtgcttattt ctcaaataac cttagtttct ccagtctgcc ccaactccga ggcctgaata 26700 tctctagatg cttatgatgg caactaaagc ctaaaagcta attcatttta aagttcttcc 26760 aaatgcatag ggttttattt ttccagacct gggttcagat ggggaatttg acaaacaatg 26820 gaaaggggga aaaacaacaa tctaaacact gagtgacaaa gtaacaaaga aatagtctag 26880 ctatcagcca gtcaagccag ccttggcttt gctatccaaa gtagtcagtc taattctacc 26940 accagtttct gttcctgtag ctgtctactg cctgccaggg actctgcctt cccacccaca 27000 actaccaatg gaaggatgtg gtgaccatac cagtggctgc tgacatctcc tgccatggga 27060 agcataattg cctccagcag cctccccctt agatccatca tttttgttgc acttggcctg 27120 ggctgtactc ccggccaatg actgaacatg gtgagcatag taatgcaggc ccatttctgt 27180 gaggagcagg actcctccag taggtgactt tggctcaagg actctctatt ggcctggttg 27240 aacttttcct gaactgtgct actgtctgag actcttctta cccaatcctc tttctcgccc 27300 caattgtcac agaccacctg cattgtggtc tgagtctctc cccaccttct cttgctcttc 27360 cctgtttatc tttcacaggc atttccccca gtacattcct tgaatgtcta acccgatacg 27420 ggtgcctgac ttttggcaga cctaagcaga caaaaaggag tacttggtta cctagctctt 27480 ctttctacca caaacatcga gggaaccctt tttccctcac ccctctgcca cacccccact 27540 gccccagtga acaaccacag agagagctgt ggtataatat taggctggtg caaaagtaat 27600 tgcggttttt gccattactt ttaatggtaa aaaccgcaat tacttttgca cctacctagt 27660 atttgtgtcc ccccaaattc atatgttgaa acctaaccca caatatgatg tcattaggag 27720 gcaagacctt gaggaggtga ttagatgatg gggtggagct ctcctgaatg agattagtgc 27780 ccttataaga agaagcccaa ggaagctacc ttgactcttc catcacatga gaatgcagca 27840 agaaggcacc atctactaat caggaagaga gctctcacca gacactgaat ctgccagtgt 27900 cttgatcttg aagttcccag cctccagaac tatgcataat gcatttccat tgtctctaag 27960 ccacccagcc tatggtattt tgtcatagca gcctgaactg actaagacag tgagccacat 28020 gagaagtgcc ccaacccctc ccttaagcac ttggctcaca gatcagtggg ttcatttctg 28080 cctgagtttt attgttattc tgtagatttc ttgggctaga tatatttttc tgttattttc 28140 cttcttcacc tcagtcatga attggttgtt ttaaaaaaga caatgtaagt catggggaaa 28200 ctcctgacaa ctctactctc ctagggttcc tgataaaagg ggattcagtt gagtcctctg 28260 atggtctcta cctgccaaag tccagcagcc cttagcaaac atgctgctcg tttctgtaga 28320 gaaggtgctg gtgtcccacc atacttctct ctccctcatg aagggcttgc gacccagcaa 28380 atgggtggct tatatgggtc tgtttcaaag gaagagccag ctctgggaag aaaaacgatg 28440 agcataagca taacctacca ctgtgcctgg gaaagcagac aacttttttg atgtgtgaat 28500 atctaatgag aatggaatcc atcaattacc ttaaacttag gcacagtctt caaattcaat 28560 atatgtggga tatactttta gtcagtttgt agacgttatt tgtaataaat aatctggctt 28620 ctctaaagaa attattttaa gtgtttggtt tggtttgatt taatggtaaa attatattta 28680 gtggcagaga attatagcaa tggtgataaa ctatagagtg tcataagttc atatcttatt 28740 ctcacatttg aagctgcctg cagatgcatt caagatgcag ccagaagtca ggagactcag 28800 gctgttattt ggagctcatc attttacagc cttgctggac tcccactttc tcaggggaaa 28860 aatgtggtgt tgacccagat tagctctcca ggccctgctg agttgggcac tctgtaagct 28920 ggagggtctt ctattgtctt cacctaagtg tcaatcaaca acccaaatgg gcatggggga 28980 agagggagct gggccaatgc ccagggtgcc tggtagagag ataccttggg cactggaagg 29040 caccagcttc ccagagagaa gggggagggc catgaaaaag ttggctgtag atgccaggga 29100 cactgggact ctccagctgt gtgtttgtgt cttctgaaga cttatgtttc attcctttgg 29160 agcatgcata atcatacact gtgggatgtg ttatatagat tgcttgatag ttcaccactg 29220 taataaaata ctgtgactgg aatctgctcc cagtctgcct ttgatagcac ttgtgcaaca 29280 cacatttact gagcatttac agtgatccag gacctgtgtt gtgaaaacat tgatggacaa 29340 ggcagatggt ggagcacgtc agtgaggatt tttaacaaag gctggtaagt gctataaagg 29400 aacattgtag gacactagag aacaaagaac aggagaacct gacttaggct ggggtggggc 29460 gttggttaga ggaggctcct tggaggacat gaggtttaag ctgtgacctg aggatgaata 29520 gatgttggcc aggtgaggta ccggtatttg tcagccttac cagtaaaaaa gaaaacctat 29580 taaaaaaaaa atacacatac aaagcctcat cagccatggc ttaccagaga aagtacagcg 29640 ggcacacaaa ccacaagctc taaagtcact ctccaacctc tccacaatat atatacacaa 29700 gccctaaact gacgtaatgg gactaaagtg taaaaaatcc cgccaaaccc aacacacacc 29760 ccgaaactgc gtcaccaggg aaaagtacag tttcacttcc gcaatcccaa caagcgtcac 29820 ttcctctttc tcacggtacg tcacatccca ttaacttaca acgtcatttt cccacggccg 29880 cgccgcccct tttaaccgtt aaccccacag ccaatcacca cacggcccac actttttaaa 29940 atcacctcat ttacatattg gcaccattcc atctataagg tatattattg atgatg 29996 <210> 306 <400> 306 000 <210> 307 <400> 307 000 <210> 308 <400> 308 000 <210> 309 <400> 309 000 <210> 310 <400> 310 000 <210> 311 <400> 311 000 <210> 312 <400> 312 000 <210> 313 <400> 313 000 <210> 314 <400> 314 000 <210> 315 <400> 315 000 <210> 316 <400> 316 000 <210> 317 <400> 317 000 <210> 318 <400> 318 000 <210> 319 <400> 319 000 <210> 320 <211> 348 <212> DNA <213> Artificial Sequence <220> <223> SV40 promoter <400> 320 ggtgtggaaa gtccccaggc tccccagcag gcagaagtat gcaaagcatg catctcaatt 60 agtcagcaac caggtgtgga aagtccccag gctccccagc aggcagaagt atgcaaagca 120 tgcatctcaa ttagtcagca accatagtcc cgcccctaac tccgcccatc ccgcccctaa 180 ctccgcccag ttccgcccat tctccgcccc atggctgact aatttttttt atttatgcag 240 aggccgaggc cgcctctgcc tctgagctat tccagaagta gtgaggaggc ttttttggag 300 gcctaggctt ttgcaaaaag ctcccgggag cttgtatatc cattttcg 348 <210> 321 <211> 206 <212> DNA <213> Artificial Sequence <220> <223> dESV40 promoter <400> 321 gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc atcccgcccc 60 taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt tttatttatg 120 cagaggccga ggccgcctcg gcctctgagc tattccagaa gtagtgagga ggcttttttg 180 gaggcctagg cttttgcaaa aagctt 206 <210> 322 <211> 463 <212> DNA <213> Homo sapiens <400> 322 ttggcccctc cctcgggtta ccccacagcc taggccgatt cgacctctct ccgctggggc 60 cctcgctggc gtccctgcac cctgggagcg cgagcggcgc gcgggcgggg aagcgcggcc 120 cagacccccg ggtccgcccg gagcagctgc gctgtcgggg ccaggccggg ctcccagtgg 180 attcgcgggc acagacgccc aggaccgcgc tccccacgtg gcggagggac tggggacccg 240 ggcacccgtc ctgccccttc accttccagc tccgcctcct ccgcgcggac cccgccccgt 300 cccgacccct cccgggtccc cggcccagcc ccctccgggc cctcccagcc cctccccttc 360 ctttaccgcg gccccgccct ctcctcgcgg cgcgagtttc aggcagcgct gcgtcctgct 420 gcgcacgtgg gaagccctgg ccccggccac ccccgccaga tct 463 <210> 323 <211> 648 <212> DNA <213> Schmidt-Ruppin A strain <400> 323 acgcgtcatg tttgacagct tatcatcgca gatccgtatg gtgcactctc agtacaatct 60 gctctgatgc cgcatagtta agccagtatc tgctccctgc ttgtgtgttg gaggtcgctg 120 agtagtgcgc gagcaaaatt taagctacaa caaggcaagg cttgaccgac aattgcatga 180 agaatctgct tagggttagg cgttttgcgc tgcttcgcga tgtacgggcc agatattcgc 240 gtatctgagg ggactagggt gtgtttaggc gaaaagcggg gcttcggttg tacgcggtta 300 ggagtcccct caggatatag tagtttcgct tttgcatagg gagggggaaa tgtagtctta 360 tgcaatactc ttgtagtctt gcaacatggt aacgatgagt tagcaacatg ccttacaagg 420 agagaaaaag caccgtgcat gccgattggt ggaagtaagg tggtacgatc gtgccttatt 480 aggaaggcaa cagacgggtc tgacatggat tggacgaacc actaaattcc gcattgcaga 540 gatattgtat ttaagtgcct agctcgatac aataaacgcc atttgaccat tcaccacatt 600 ggtgtgcacc tccaagctgg gtaccagctg ctagcaagct tgagatct 648 <210> 324 <211> 1740 <212> DNA <213> Homo sapiens <400> 324 gagtagctgg gattacaggc atgtgccacc acgcctcgct aatattagta tttttcatac 60 agacaagatc tcactatgtt gctcagggta gtctcgaatt ctgggactca aatgatcctc 120 ccacttcagc ctcccaaagt gctgggatta caggcataag ccatcatgcc cggcctctga 180 cgctgtttct ttcaaccccc aggatttcag attccaccag cttatggaga agggaaccaa 240 gttcgagatg cgtgattgcc cagaaagttg gaggctgagc tgagacttga acccagagac 300 cagaacctcc agaggtcaaa gtcctcctcc tgggtccccc agagaagggc cctgagatga 360 cagctcgttg gtcctcatgg aagcgtgacc cccccagtag actttctccc acacccaacc 420 ttggtttcct catctatatg atagggacaa gccagactct acctccctgg tggtcatggt 480 ctccgcttat tcgggttcat aaccttaaag gcccctcgca ccacctcagt gagccattta 540 tgcctggcac agggccaact ctcagtgcat atctgcaaag gaaccaatga atgagtgaat 600 gaagtgacaa atgaataaag gaataaatga atgaggcact tatcatgtac caggctttcg 660 ttaccacgtc ccatttattc ctctgaggca gggtctattt tatccttgtt acagatgggg 720 aaactaaggc ccagggagga gcaaagtctt ccccaagtat gtacccactc agaacttgag 780 ctctgaatgt ctcccaccca gcttagccca agagcggggt tcagtgatgc ccacccccta 840 aggctctaga gaaagggggt aggcccacat gccagtttgg gggtggtaaa gccaggtaag 900 ttttctttat gggtcccctg aaaccctgaa agtgaacccc agtcctgcat gaaagtgagc 960 tccccatagc tcaaggtatt caagcacaat acggctttga gtgctgaagc aggctgtgca 1020 ggcttggata gtgacatgcc ctctctgagc ctcaatttcc ccacctgtca acagcagaca 1080 gtgacagctg tgatcagggg atcacagtgc atggggatgg gtgggtgcat ggggatggag 1140 gggcatttgg gagccctccc cgataccacc ccctgcagcc acccagatag cctgtcctgg 1200 cctgtctgtc ccagtccagg gctgaaaggg tgcgggtcct gcccgcccct aggtctggag 1260 gcggagtcgc ggtgacccgg gagcccaata aatctgcaac ccacaatcac gagctgctcc 1320 cgtaagcccc aaggcgacct ccagctgtca gcgctgagca cagcgcccag ggagagggac 1380 agacagccgg ctgcatggga cagcggaacc cagagtgaga ggggaggtgg caggacagac 1440 agacagcagg ggcggacgca gagacagaca gcggggacag ggaggccgac acggacatcg 1500 acagcccata gattcctaac ccagggagcc ccggcccctc tcgccgcttc ccaccccaga 1560 cggagcgggg acaggctgcc gagcatcctc ccacccgccc tccccgtcct gcctcctcgg 1620 cccctgccag cttcccccgc ttgagcacgc agggcgtccg aggacgcgct gggcctccgc 1680 acccgccctc atggaggccg tggagaccgg ggaacggccc accttcggag cctgggacta 1740 <210> 325 <211> 1075 <212> DNA <213> Homo sapiens <400> 325 attagagatt gtaaattggg ctctgagctt cctaccaaca aaagcacaaa ggaaaatatg 60 atcactggta ttaaaaaaaa acacctatgg tttccaaaag attaaaacaa accagcagtt 120 ttatagaagc taacactaaa atctaaagga actacgttct atggagccac ttaatatgga 180 taaacacttt gacaatattc tttcaacaac tacagtaaca agtttcttag agtccatttc 240 tttttacatc cataatgaat tgtaaatctt ttctacttct taagtaaaac atcaccactt 300 aattctggta acttttccat attaactttt tagaacaatt gcaaacgtac cataaatgat 360 tgttgtcaca gtggtaacta tttgaccctg actgttattt tgtatatagc agcttttaaa 420 ataaaaaggc aacaagtttc taggcgtaat ttccacagat cttttatgta aaacaatgac 480 atcctttgca acttctgcca tttaatctat ctcaagcaag ctctctggaa acaaatctat 540 ttgaaagatt ctattgtaat tagaaatcag ggtaactgaa tgcactagat gaaaaccttc 600 tgactggggc caatgaagtc aataaagtca aaactgctgt gaatgctcaa ctgtctgcag 660 atcagatgtc ttgggatgga atccgttctc gaggccacca tcattaatat caatttggcc 720 atgtaataca agcctcactt gttccactgt tacaaatgtg cttaaaactg agctcattta 780 caatccaaat acatatgtag gatggtaacc aaggcatcac actaatttag gtattatgtt 840 ttagggggaa caaaaggtat gttaatattt tattcatctc caaattaact ataaattgtg 900 cattcttgca tagatcctcc ttgggaatga gaaattagga aaatccagtt gttaaaatga 960 atgcctaaaa tcaaaataaa atttgttttt ctggcacctg cttgatgaca cagactaata 1020 accaatgaca aaattccctt gaacccaagt tttcatttcc tcctattgtg tggtc 1075

Claims (58)

  1. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 벡터 생산 시스템:
    다음을 포함하는 재조합 Ad35 헬퍼 게놈:
    Ad35 섬유 샤프트를 암호화하는 핵산 서열;
    Ad35 섬유 놉을 암호화하는 핵산 서열; 및
    Ad35 패키징 서열의 적어도 일부에 플랭킹하는 재조합효소 지시 반복부(DR), 및
    다음을 포함하는 재조합 헬퍼 의존적 Ad35 공여자 게놈:
    5' Ad35 도립된 말단 반복부(ITR);
    3' Ad35 ITR;
    Ad35 패키징 서열; 및
    적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열.
  2. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 헬퍼 벡터:
    Ad35 섬유 샤프트;
    Ad35 섬유 놉; 및
    Ad35 패키징 서열의 적어도 일부에 플랭킹하는 재조합효소 지시 반복부(DR)를 포함하는 Ad35 게놈.
  3. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 헬퍼 게놈:
    Ad35 섬유 샤프트를 암호화하는 핵산 서열;
    Ad35 섬유 놉을 암호화하는 핵산 서열; 및
    Ad35 패키징 서열의 적어도 일부에 플랭킹하는 재조합효소 지시 반복부(DR).
  4. 하기를 포함하는, 재조합 헬퍼 의존적 아데노바이러스 혈청형 35(Ad35) 공여자 벡터:
    다음을 포함하는 핵산 서열:
    5' Ad35 도립된 말단 반복부(ITR);
    3' Ad35 ITR;
    Ad35 패키징 서열; 및
    적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열로, 여기서 게놈은 Ad35 바이러스 구조적 단백질을 암호화하는 핵산 서열을 포함하지 않는 것인 핵산 서열; 및
    Ad35 섬유 샤프트 및/또는 Ad35 섬유 놉.
  5. 5' Ad35 도립된 말단 반복부(ITR);
    3' Ad35 ITR;
    Ad35 패키징 서열; 및
    적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열
    을 포함하는 재조합 헬퍼 의존적 아데노바이러스 혈청형 35(Ad35) 공여자 게놈이며, 여기서 Ad35 공여자 게놈은 야생형 Ad35 게놈에 의해 암호화된 발현 산물을 암호화하는 핵산 서열을 포함하지 않는 것인, 재조합 헬퍼 의존적 Ad35 공여자 게놈.
  6. 재조합 헬퍼 의존적 아데노바이러스 혈청형 35(Ad35) 공여자 벡터를 생산하는 방법으로, 상기 방법은 세포의 배양물로부터 재조합 헬퍼 의존적 Ad35 공여자 벡터를 단리하는 단계를 포함하며, 여기서 세포는 하기를 포함하는 것인, 방법:
    다음을 포함하는 재조합 Ad35 헬퍼 게놈:
    Ad35 섬유 샤프트를 암호화하는 핵산 서열;
    Ad35 섬유 놉을 암호화하는 핵산 서열; 및
    Ad35 패키징 서열의 적어도 일부에 플랭킹하는 재조합효소 지시 반복부(DR) 및
    다음을 포함하는 재조합 헬퍼 의존적 Ad35 공여자 게놈:
    5' Ad35 도립된 말단 반복부(ITR);
    3' Ad35 ITR;
    Ad35 패키징 서열; 및
    적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열.
  7. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 생산 시스템:
    다음을 포함하는 재조합 Ad35 헬퍼 게놈:
    Ad35 섬유 샤프트를 암호화하는 핵산 서열;
    Ad35 섬유 놉을 암호화하는 핵산 서열; 및
    Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 도립된 말단 반복부(ITR)는 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내의 재조합효소 지시 반복부(DR), 및
    다음을 포함하는 재조합 Ad35 공여자 게놈:
    5' Ad35 ITR;
    3' Ad35 ITR;
    Ad35 패키징 서열; 및
    적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열.
  8. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 헬퍼 벡터:
    Ad35 섬유 샤프트;
    Ad35 섬유 놉; 및
    Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 도립된 말단 반복부(ITR)는 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내의 재조합효소 지시 반복부(DR)를 포함하는 Ad35 게놈.
  9. 하기를 포함하는, 재조합 아데노바이러스 혈청형 35(Ad35) 헬퍼 게놈:
    Ad35 섬유 샤프트를 암호화하는 핵산 서열;
    Ad35 섬유 놉을 암호화하는 핵산 서열; 및
    Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 도립된 말단 반복부(ITR)는 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내의 재조합효소 지시 반복부(DR).
  10. 재조합 헬퍼 의존적 아데노바이러스 혈청형 35(Ad35) 공여자 벡터를 생산하는 방법으로, 상기 방법은 세포의 배양물로부터 재조합 헬퍼 의존적 Ad35 공여자 벡터를 단리하는 단계를 포함하며, 여기서 세포는 하기를 포함하는 것인, 방법:
    다음을 포함하는 재조합 Ad35 헬퍼 게놈:
    Ad35 섬유 샤프트를 암호화하는 핵산 서열;
    Ad35 섬유 놉을 암호화하는 핵산 서열; 및
    Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 도립된 말단 반복부(ITR)는 방해하지 않는 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내의 재조합효소 지시 반복부(DR), 및
    다음을 포함하는 재조합 Ad35 공여자 게놈:
    5' Ad35 ITR;
    3' Ad35 ITR;
    Ad35 패키징 서열; 및
    적어도 하나의 이종 발현 산물을 암호화하는 핵산 서열.
  11. 제1항 내지 제4항 및 제6항 내지 제10항 중 어느 한 항에 있어서,
    상기 Ad35 섬유 놉이 야생형 Ad35 섬유 놉이거나, 또는
    상기 Ad35 섬유 놉이 조작된 Ad35 섬유 놉이며, 여기서 조작된 섬유 놉은 CD46에 대한 섬유 놉의 친화도를 증가시키는 돌연변이를 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 공여자 벡터, 또는 방법.
  12. 제11항에 있어서, 상기 돌연변이가
    Ile192Val, Asp207Gly(또는 Glu207Gly), Asn217Asp, Thr226Ala, Thr245Ala, Thr254Pro, Ile256Leu, Ile256Val, Arg259Cys, 및 Arg279His로부터 선택된 돌연변이를 포함하거나; 또는 돌연변이 Ile192Val, Asp207Gly(또는 Glu207Gly), Asn217Asp, Thr226Ala, Thr245Ala, Thr254Pro, Ile256Leu, Ile256Val, Arg259Cys, 및 Arg279His 각각을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 공여자 벡터, 또는 방법.
  13. 제1항, 제4항 내지 제7항, 및 제10항 중 어느 한 항에 있어서, 상기 이종 발현 산물이 조절 서열과 작동가능하게 연결된 치료 발현 산물을 포함하며, 임의적으로 여기서 치료 발현 산물은 하기를 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법:
    (a) β-글로빈 단백질 또는 γ-글로빈 단백질;
    (b) 항체 또는 이의 면역글로불린 쇄로, 임의적으로 여기서 항체는 항-CD33 항체인 것;
    (c) 제1 항체 또는 이의 면역글로불린 쇄 및 제2 항체 또는 이의 면역글로불린 쇄로, 임의적으로 여기서 항체는 항-CD33 항체인 것;
    (d) CRISPR-연관 RNA-가이드된 엔도뉴클레아제 및/또는 가이드 RNA(gRNA)로, 임의적으로 여기서 CRISPR-연관 RNA-가이드된 엔도뉴클레아제는 Cas9 또는 cpf1을 포함하는 것;
    (e) 염기 편집기 및/또는 gRNA로, 임의적으로 여기서 염기 편집기는 사이토신 염기 편집기(CBE) 또는 아데닌 염기 편집기(ABE)이며, 임의적으로 여기서 염기 편집기는 기능상실된 Cas9 및 기능상실된 cpf1로부터 선택된 촉매적으로 기능상실된 뉴클레아제를 포함하는 것;
    (f) 바이러스 감염을 차단 또는 감소시키는 응고 인자 또는 단백질로, 임의적으로 여기서 치료 발현 산물은 인자 VII 대체 단백질 또는 인자 VIII 대체 단백질을 포함하는 것;
    (g) 체크포인트 억제제;
    (h) 키메라 항원 수용체 또는 조작된 T 세포 수용체; 또는
    (i) γC, JAK3, IL7RA, RAG1, RAG2, DCLRE1C, PRKDC, LIG4, NHEJ1, CD3D, CD3E, CD3Z, CD3G, PTPRC, ZAP70, LCK, AK2, ADA, PNP, WHN, CHD7, ORAI1, STIM1, CORO1A, CIITA, RFXANK, RFX5, RFXAP, RMRP, DKC1, TERT, TINF2, DCLRE1B, SLC46A1, FancA, FancB, FancC, FancD1, FancD2, FancE, FancF, FancG, FancI, FancJ, FancL, FancM, FancN, FancO, FancP, FancQ, FancR, FancS, FancT, FancU, FancV, FancW, 가용성 CD40, CTLA, Fas L, PD-L1에 대한 항체, CD4에 대한 항체, CD5에 대한 항체, CD7에 대한 항체, CD52에 대한 항체, IL-1에 대한 항체, IL-2에 대한 항체, IL-4에 대한 항체, IL-6에 대한 항체, IL-10에 대한 항체, TNF에 대한 항체, 자가반응성 T 세포 상에 특이적으로 존재하는 TCR에 대한 항체, 글로빈 패밀리 유전자, WAS, phox, 디스트로핀, 피루베이트 키나제, CLN3, ABCD1, 아릴술파타제 A, SFTPB, SFTPC, NLX2.1, ABCA3, GATA1, 리보솜 단백질 유전자, TERT, TERC, DKC1, TINF2, CFTR, LRRK2, PARK2, PARK7, PINK1, SNCA, PSEN1, PSEN2, APP, SOD1, TDP43, FUS, 유비퀼린 2, 및/또는 C9ORF72로 이루어진 군으로부터 선택된 단백질로, 임의적으로 여기서 단백질은 FancA 단백질인 것.
  14. 제13항에 있어서, (d) 또는 (e)에서
    상기 gRNA가 HBG1, HBG2, 및/또는 적혈구 인핸서 bcl11a의 표적 핵산 서열에 결합하며, 임의적으로 여기서 gRNA는 γ-글로빈의 발현을 증가시키도록 조작되는 것이거나; 또는
    상기 gRNA가 CD33의 일부를 암호화하는 표적 핵산 서열에 결합하며, 임의적으로 여기서 CD33은 인간 CD33인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  15. 제13항에 있어서, 상기 치료 발현 산물이 하기를 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법:
    β-글로빈 단백질 또는 γ-글로빈 단백질; 및
    CRISPR-연관 RNA-가이드된 엔도뉴클레아제; 및 하기 중 1, 2, 또는 3 개를 포함하는 CRISPR 시스템:
    HBG1의 표적 핵산 서열에 결합하는 gRNA;
    HBG2의 표적 핵산 서열에 결합하는 gRNA; 및/또는
    Bcl11a의 표적 핵산 서열에 결합하는 gRNA로,
    임의적으로 여기서 gRNA는 γ-글로빈의 발현을 증가시키도록 조작되는 것.
  16. 제13항에 있어서, 상기 조절 서열(들)이 프로모터를 포함하며, 임의적으로 여기서 프로모터는 β-글로빈 프로모터이며, 임의적으로 여기서 β-글로빈 프로모터는 약 1.6 kb 길이이고/이거나 염색체 11의 위치 5228631-5227023에 따른 핵산을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  17. 제13항에 있어서, 상기 조절 서열(들)이 유전자좌 제어 영역(LCR)을 포함하며, 임의적으로 여기서 LCR은 β-글로빈 LCR인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  18. 제13항에 있어서, 상기 β-글로빈 LCR이
    HS1, HS2, HS3, 및 HS4를 포함하거나 또는 이로 이루어지는 β-글로빈 LCR DNAse I 과민성 부위(HS)를 포함하며, 임의적으로 여기서 β-글로빈 LCR은 약 4.3 kb의 길이를 갖는 것이거나;
    HS1, HS2, HS3, HS4, 및 HS5를 포함하는 β-글로빈 LCR DNAse I HS를 포함하며, 임의적으로 여기서 β-글로빈 LCR은 약 21.5 kb의 길이를 갖는 것이거나; 또는
    상기 β-글로빈 LCR이 염색체 11의 위치 5292319-5270789에 따른 서열을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  19. 제13항 또는 제14항에 있어서, 상기 조절 서열(들)이 3'HS1을 포함하며, 임의적으로 여기서 3'HS1은 염색체 11의 위치 5206867-5203839에 따른 서열을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  20. 제13항에 있어서, 상기 조절 서열(들)이 miRNA 결합 부위를 포함하며, 임의적으로 여기서
    상기 miRNA 결합 부위는 관심 종에 의해 자연적으로 발현되는 miRNA에 대한 결합 부위이고/이거나;
    상기 miRNA는 혈액 및 종양 미세환경 또는 표적 조직에서 차등 점유 프로파일을 입증하며, 임의적으로 여기서 점유 프로파일은 종양 미세환경 또는 표적 조직에서보다 혈액에서 더 높은 것이고/이거나;
    상기 miRNA 결합 부위는 miR423-5, miR423-5p, miR42-2, miR181c, miR125a, 또는 miR15a 결합 부위를 포함하고/하거나;
    상기 miRNA 결합 부위는 miR187 또는 miR218 결합 부위를 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  21. 제1항, 제4항 내지 제7항, 및 제10항 중 어느 한 항에 있어서, 상기 이종 발현 산물을 암호화하는 핵산이 통합 요소를 추가로 포함하는 페이로드의 부분이며, 임의적으로 여기서 통합 요소는 발현 산물을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  22. 제21항에 있어서, 상기 통합 요소가 상동 재조합에 의한 표적 게놈으로의 통합을 위해 조작되고, 상기 통합 요소가 표적 게놈의 인접하게 연결된 서열에 상응하는 상동성 아암에 의해 플랭킹되며, 임의적으로 여기서
    상동성 아암은 0.8 및 1.8 kb 사이인 것이고/이거나;
    상동성 아암은 염색체 안전 항구 유전자좌에 플랭킹되는 표적 게놈의 핵산 서열에 상동이며, 임의적으로 여기서 안전 항구 유전자좌는 AAVS1, CCR5, HPRT, 또는 Rosa로부터 선택되는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  23. 제21항에 있어서, 상기 통합 요소가 전위에 의한 표적 게놈으로의 통합을 위해 조작되고, 상기 통합 요소가 트랜스포존 도립 반복부(IR)에 의해 플랭킹되며, 임의적으로 여기서 트랜스포존 IR은 재조합효소 DR에 의해 플랭킹되는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  24. 제23항에 있어서,
    상기 트랜스포존 IR이 잠자는 미녀(SB) IR이며, 임의적으로 여기서 SB IR은 pT4 IR이거나;
    상기 트랜스포존 IR이 피기백, 마리너, 개구리 왕자, Tol2, TcBuster, 또는 spinON IR인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  25. 제21항에 있어서, 트랜스포존 IR에 의해 플랭킹되는 통합 요소의 전위를 매개하는 트랜스포사제를 암호화하는 핵산을 포함하며, 임의적으로 여기서 트랜스포사제를 암호화하는 핵산은 지지 벡터 또는 지지 벡터 게놈으로 구성되는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  26. 제25항에 있어서, 상기 트랜스포사제가 잠자는 미녀, 피기백, 마리너, 개구리 왕자, Tol2, TcBuster, 또는 spinON 트랜스포사제이며, 임의적으로 여기서 트랜스포사제는 잠자는 미녀 100x(SB100x) 트랜스포사제인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  27. 제25항 또는 제26항에 있어서, 상기 트랜스포사제를 암호화하는 핵산이 PGK 프로모터와 작동가능하게 연결되는 것인, 재조합 Ad35 벡터 생산 시스템, 공여자 게놈, 공여자 벡터, 또는 방법.
  28. 제1항 내지 제3항 및 제6항 내지 제10항 중 어느 한 항에 있어서, 상기 Ad35 패키징 서열의 적어도 일부에 플랭킹하고/하거나 Ad35 게놈의 5' 단부의 550 개 뉴클레오티드 내에 있고 Ad35 패키징 신호를 기능적으로 방해하지만 5' Ad35 ITR은 방해하지 않는 재조합효소 DR이 FRT, loxP, rox, vox, AttB, 또는 AttP 부위인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  29. 제28항에 있어서, 상기 Ad35 패키징 서열의 적어도 일부의 절제를 위한 재조합효소를 암호화하는 핵산이 헬퍼 게놈을 포함하는 세포의 핵산 서열에 의해 암호화되는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  30. 제23항에 있어서, 상기 트랜스포존 IR에 플랭킹되는 재조합효소 DR이 FRT, loxP, rox, vox, AttB, 또는 AttP 부위인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  31. 제21항에 있어서, 상기 통합 요소를 포함하는 핵산의 절제를 위한 재조합효소를 암호화하는 핵산이 지지 벡터 또는 지지 벡터 게놈으로 구성되는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  32. 제29항 또는 제31항에 있어서, 상기 재조합효소가 Flp, Cre, Dre, Vika, 또는 PhiC31 재조합효소인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  33. 제32항에 있어서, 상기 재조합효소를 암호화하는 핵산이 EF1α 프로모터와 작동가능하게 연결되는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  34. 제21항에 있어서,
    상기 페이로드가 이종 발현 산물을 포함하는 통합 요소를 포함하고,
    상기 이종 발현 산물이 β-글로빈 프로모터 및 β-글로빈 긴 LCR와 작동가능하게 연결된 β-글로빈 단백질을 포함하고,
    상기 통합 요소가 SB IR에 의해 플랭킹되고,
    상기 SB IR이 재조합효소 DR에 의해 플랭킹되며, 임의적으로 여기서 재조합효소 DR은 FRT 부위인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  35. 제21항에 있어서, 상기 페이로드가 하기를 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법:
    통합 요소, 및
    발현 산물을 암호화하고, 통합 요소로 구성되지 않고, 통합 요소의 표적 게놈으로의 통합에 의해 기능적이지 않게 만들도록 배치되는, 조건부로 발현되는 핵산 서열.
  36. 제35항에 있어서, 상기 조건부로 발현되는 핵산 서열에 의해 암호화되는 발현 산물이 CRISPR 시스템 구성요소 또는 염기 편집기 시스템 구성요소를 포함하며, 임의적으로 여기서 구성요소는 CRISPR-연관 RNA-가이드된 엔도뉴클레아제, 염기 편집기 효소, 또는 gRNA인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  37. 제21항에 있어서, 상기 페이로드가 선택 카세트를 포함하며, 임의적으로 여기서 선택 카세트는 통합 요소로 구성되는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  38. 제37항에 있어서, 상기 선택 카세트가 mgmtP140K를 암호화하는 핵산 서열을 포함하거나 또는 상기 선택 카세트가 항-CD33 shRNA를 암호화하는 핵산 서열을 포함하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  39. 제1항 내지 제3항 및 제6항 내지 제10항 중 어느 한 항에 있어서, 상기 재조합효소 DR에 의해 플랭킹된 Ad35 패키징 서열의 적어도 일부가 GenBank 수탁 번호 AX049983에 따른 Ad35 서열의 뉴클레오티드 138-481에 상응하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  40. 제1항 내지 제3항 및 제6항 내지 제10항 중 어느 한 항에 있어서, 상기 재조합효소 DR에 의해 플랭킹된 Ad35 패키징 서열의 적어도 일부가 GenBank 수탁 번호 AX049983에 따른 Ad35 서열의 뉴클레오티드 179-344; 뉴클레오티드 366-481; 뉴클레오티드 155-481; 뉴클레오티드 159-480; 뉴클레오티드 159-446; 뉴클레오티드 180-480; 뉴클레오티드 207-480; 뉴클레오티드 140-446; 뉴클레오티드 159-446; 뉴클레오티드 180-446; 뉴클레오티드 202-446; 뉴클레오티드 159-481; 뉴클레오티드 180-384; 뉴클레오티드 180-481; 또는 뉴클레오티드 207-481에 상응하는 것인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  41. 제1항 내지 제3항 및 제6항 내지 제10항 중 어느 한 항에 있어서, 상기 재조합효소 DR이 LoxP 부위인, 재조합 Ad35 벡터 생산 시스템, 헬퍼 벡터, 헬퍼 게놈, 또는 방법.
  42. 제2항, 제3항, 제8항 및 제9항 중 어느 한 항에 있어서, 상기 Ad35 헬퍼 게놈이 293 T 세포에서 증폭을 위해 Ad5 E4orf6을 포함하는 것인, 헬퍼 벡터 또는 헬퍼 게놈.
  43. 제2항, 제3항, 제8항, 및 제9항 중 어느 한 항에 있어서, 상기 헬퍼 게놈이 서열번호: 51-65 중 임의의 하나에 제시된 바와 같은 서열을 포함하거나 또는 생성하는 것인, 헬퍼 벡터 또는 헬퍼 게놈.
  44. 제2항 내지 제5항, 제8항, 및 제9항 중 어느 한 항의 헬퍼 벡터, 헬퍼 게놈, 공여자 벡터, 또는 공여자 게놈을 포함하는 세포로, 임의적으로 여기서 세포는 HEK293 세포인, 세포.
  45. 제1항, 제4항, 제6항, 제7항, 제10항, 제13항 내지 제27항 및 제44항 중 어느 한 항의 공여자 게놈을 포함하는 세포로, 임의적으로 여기서 세포는 적혈구이고, 임의적으로 여기서 세포는 조혈 줄기 세포, T-세포, B-세포, 또는 골수성 세포이고, 임의적으로 여기서 세포는 발현 산물을 분비하는 것인, 세포.
  46. 제6항 또는 제10항에 있어서, 상기 세포가 HEK293 세포인, 방법.
  47. 세포를 변형시키는 방법으로, 상기 방법은 세포를 제5항 및 제11항 내지 제27항 중 어느 한 항에 따른 Ad35 공여자 벡터와 접촉시키는 단계를 포함하는 것인, 방법.
  48. 대상체의 세포를 변형시키는 방법으로, 상기 방법은 제5항 및 제11항 내지 제27항 중 어느 한 항에 따른 Ad35 공여자 벡터를 대상체에게 투여하는 단계를 포함하며, 임의적으로 여기서 방법은 대상체로부터 세포의 단리를 포함하지 않는 것인, 방법.
  49. 질환 또는 병태의 치료를 필요로 하는 대상체에서 질환 또는 병태를 치료하는 방법으로, 상기 방법은 제5항 및 제11항 내지 제27항 중 어느 한 항에 따른 Ad35 공여자 벡터를 대상체에게 투여하는 단계를 포함하며, 임의적으로 여기서 투여는 정맥내 투여인, 방법.
  50. 제49항에 있어서, 상기 방법이 동원제를 대상체에게 투여하는 단계를 포함하며, 임의적으로 여기서 동원제는 과립구-콜로니 자극 인자, GM-CSF, S-CSF, CXCR4 길항제, 및 CXCR2 작용제 중 하나 이상을 포함하며, 임의적으로 여기서 CXCR4 길항제는 AMD3100이고/이거나 여기서 CXCR2 작용제는 GRO-β인, 방법.
  51. 제49항 또는 제50항에 있어서, 상기 Ad35 공여자 벡터가 선택 카세트를 포함하며, 임의적으로 여기서 방법은 선택제를 대상체에게 투여하는 단계를 추가로 포함하며, 임의적으로 여기서 선택 카세트는 mgmtP140K를 암호화하고 선택제는 O6BG/BCNU인, 방법.
  52. 제49항에 있어서, 상기 방법이 면역 억제제를 대상체에게 투여하는 단계를 추가로 포함하며, 임의적으로 여기서 면역 억제 레지멘은 스테로이드, IL-6 수용체 길항제, 및/또는 IL-1R 수용체 길항제를 포함하며, 임의적으로 여기서 스테로이드는 글루코코르티코이드 또는 덱사메타손을 포함하는 것인, 방법.
  53. 제49항에 있어서, 상기 Ad35 공여자 벡터가 통합 요소를 포함하고 방법이 CD46을 발현하는 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%, 조혈 줄기 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%, 및/또는 적혈구 Ter119+ 세포의 적어도 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 또는 95%에서 이의 통합 요소 카피의 통합 및/또는 발현을 유발하는 것인, 방법.
  54. 제49항에 있어서, 상기 방법이 통합 요소의 적어도 1 개 카피를 포함하는 표적 세포 게놈에서 통합 요소의 평균 적어도 2 개 카피 또는 적어도 2.5 개 카피의 통합을 유발하는 것인, 방법.
  55. 제49항에 있어서, 상기 방법이 페이로드 또는 이의 통합 요소에 의해 암호화된 발현 산물의 발현을 참조 수준의 적어도 약 20% 또는 참조 수준의 적어도 약 25%인 수준에서 유발하며, 임의적으로 여기서 참조는 대상체 또는 참조 집단에서 내인성 참조 단백질의 발현인, 방법.
  56. 제49항에 있어서, 상기 질환 또는 병태가 혈색소병증, 혈소판 장애, 빈혈, 면역 결핍 응고 인자 결핍, 판코니 빈혈, 알파-1 항트립신 결핍, 겸상 세포 빈혈, 지중해빈혈, 중간형 지중해빈혈, A형 혈우병, B형 혈우병, 폰빌레브란트병, 인자 V 결핍, 인자 VII 결핍, 인자 X 결핍, 인자 XI 결핍, 인자 XII 결핍, 인자 XIII 결핍, 베르나르-술리에 증후군, 그레이 혈소판 증후군, 또는 뮤코다당류축적증인, 방법.
  57. 제49항에 있어서, 상기 대상체가 암을 앓고 있는 대상체이고 상기 방법이 암을 치료, 예방, 또는 지연시키거나, 또는 암 재발을 지연시키며,
    임의적으로 여기서 대상체는 암 발병과 연관된 하나 이상의 생식 계열 돌연변이의 보균자이고,
    임의적으로 여기서 암은 역형성 성상세포종, 유방암, 난소암, 결장직장암, 미만성 내재성 뇌간 신경교종, 유잉 육종, 다형성 교모세포종, 악성 뇌교종, 흑색종, 전이성 악성 흑색종, 비인두암, 또는 소아암이고,
    임의적으로 여기서 대상체에게 O6BG, TMZ(테모졸로미드), 및/또는 BCNU(카르무스틴)를 제공하거나 또는 투여하는 것인, 방법.
  58. 제49항에 있어서, 상기 질환 또는 병태가 중간형 지중해빈혈이며, 임의적으로 여기서 벡터 또는 게놈은 하기로부터 선택된 하나 이상의 발현 산물을 암호화하는 핵산을 포함하는 것이며, 임의적으로 여기서 방법은 중간형 지중해빈혈의 증상을 감소시키고/시키거나 중간형 지중해빈혈을 치료하고/하거나 HbF를 증가시키는 것인, 방법:
    내인성 γ-글로빈의 발현을 증가시키거나 또는 재활성화하는 발현 산물(들)로, 임의적으로 여기서 내인성 γ-글로빈의 발현을 증가시키거나 또는 재활성화하는 발현 산물(들)은 CRISPR-연관 RNA-가이드된 엔도뉴클레아제 또는 염기 편집기 및 다음 중 하나 이상을 포함하는 것:
    HBG1의 핵산 서열에 결합하고 표적 핵산 서열과 작동가능하게 연결된 코딩 서열로부터 발현을 증가시키도록 조작된 gRNA;
    HBG2의 핵산 서열에 결합하고 표적 핵산 서열과 작동가능하게 연결된 코딩 서열로부터 발현을 증가시키도록 조작된 gRNA; 및
    적혈구 인핸서 bcl11a의 핵산 서열에 결합하고 BCL11A 발현을 감소시키도록 조작된 gRNA;
    γ-글로빈; 및
    β-글로빈.
KR1020227003415A 2019-07-02 2020-07-02 재조합 ad35 벡터 및 관련 유전자 요법 개선 KR20220038362A (ko)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962869907P 2019-07-02 2019-07-02
US62/869,907 2019-07-02
US201962935507P 2019-11-14 2019-11-14
US62/935,507 2019-11-14
US202063009385P 2020-04-13 2020-04-13
US63/009,385 2020-04-13
PCT/US2020/040756 WO2021003432A1 (en) 2019-07-02 2020-07-02 Recombinant ad35 vectors and related gene therapy improvements

Publications (1)

Publication Number Publication Date
KR20220038362A true KR20220038362A (ko) 2022-03-28

Family

ID=71729006

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020227003415A KR20220038362A (ko) 2019-07-02 2020-07-02 재조합 ad35 벡터 및 관련 유전자 요법 개선

Country Status (12)

Country Link
US (1) US20220257796A1 (ko)
EP (1) EP3994270A1 (ko)
JP (1) JP2022539248A (ko)
KR (1) KR20220038362A (ko)
CN (1) CN114729383A (ko)
AU (1) AU2020298572A1 (ko)
BR (1) BR112021026832A2 (ko)
CA (1) CA3138188A1 (ko)
IL (1) IL289518A (ko)
MX (1) MX2021015433A (ko)
SG (1) SG11202111943UA (ko)
WO (1) WO2021003432A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2022220203A1 (en) * 2021-02-11 2023-08-24 Koninklijke Nederlandse Akademie Van Wetenschappen Curing disease by transcription regulatory gene editing
CA3218362A1 (en) * 2021-04-27 2022-11-03 Novartis Ag Viral vector production system
WO2022236174A1 (en) * 2021-05-07 2022-11-10 Washington University In situ car-t therapies, vectors and methods therefor
GB202111195D0 (en) * 2021-08-03 2021-09-15 Cergentis B V Method for targeted sequencing
CN113755447B (zh) * 2021-09-23 2022-04-29 云舟生物科技(广州)股份有限公司 一种用于生产腺病毒的293a细胞株及其制备与应用
WO2023150393A2 (en) 2022-02-07 2023-08-10 Ensoma, Inc. Inhibitor-resistant mgmt modifications and modification of mgmt-encoding nucleic acids
WO2024006319A1 (en) * 2022-06-29 2024-01-04 Ensoma, Inc. Adenoviral helper vectors
CN116751799B (zh) * 2023-06-14 2024-01-26 江南大学 一种多位点双重碱基编辑器及其应用

Family Cites Families (157)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1999A (en) 1841-03-12 Improvement in seed-planters
US4554101A (en) 1981-01-09 1985-11-19 New York Blood Center, Inc. Identification and preparation of epitopes on antigens and allergens on the basis of hydrophilicity
CA1293460C (en) 1985-10-07 1991-12-24 Brian Lee Sauer Site-specific recombination of dna in yeast
US5225539A (en) 1986-03-27 1993-07-06 Medical Research Council Recombinant altered antibodies and methods of making altered antibodies
GB8607679D0 (en) 1986-03-27 1986-04-30 Winter G P Recombinant dna product
US5530101A (en) 1988-12-28 1996-06-25 Protein Design Labs, Inc. Humanized immunoglobulins
US6291158B1 (en) 1989-05-16 2001-09-18 Scripps Research Institute Method for tapping the immunological repertoire
US6291161B1 (en) 1989-05-16 2001-09-18 Scripps Research Institute Method for tapping the immunological repertiore
GB8928874D0 (en) 1989-12-21 1990-02-28 Celltech Ltd Humanised antibodies
EP0519596B1 (en) 1991-05-17 2005-02-23 Merck & Co. Inc. A method for reducing the immunogenicity of antibody variable domains
EP0590058B1 (en) 1991-06-14 2003-11-26 Genentech, Inc. HUMANIZED Heregulin ANTIBODy
US5851795A (en) 1991-06-27 1998-12-22 Bristol-Myers Squibb Company Soluble CTLA4 molecules and uses thereof
ES2136092T3 (es) 1991-09-23 1999-11-16 Medical Res Council Procedimientos para la produccion de anticuerpos humanizados.
CA2103887C (en) 1991-12-13 2005-08-30 Gary M. Studnicka Methods and materials for preparation of modified antibody variable domains and therapeutic uses thereof
GB9203459D0 (en) 1992-02-19 1992-04-08 Scotgen Ltd Antibodies with germ-line variable regions
US5639641A (en) 1992-09-09 1997-06-17 Immunogen Inc. Resurfacing of rodent antibodies
US5653977A (en) 1993-09-09 1997-08-05 Uab Research Foundation Anti-idiotypic antibody that mimics the GD2 antigen
EP1489097B1 (en) 1994-01-11 2011-10-19 Dyax Corporation Inhibitors of human plasmin derived from kunitz domains and nucleic acids encoding the same
US5637323A (en) 1994-11-16 1997-06-10 The United States Of America As Represented By The Department Of Health And Human Services Method of mobilizing pluripotential hematopoietic stem cells with IL-7
GB9424449D0 (en) 1994-12-02 1995-01-18 Wellcome Found Antibodies
US5731168A (en) 1995-03-01 1998-03-24 Genentech, Inc. Method for making heteromultimeric polypeptides
US5811097A (en) 1995-07-25 1998-09-22 The Regents Of The University Of California Blockade of T lymphocyte down-regulation associated with CTLA-4 signaling
US6051227A (en) 1995-07-25 2000-04-18 The Regents Of The University Of California, Office Of Technology Transfer Blockade of T lymphocyte down-regulation associated with CTLA-4 signaling
US5855887A (en) 1995-07-25 1999-01-05 The Regents Of The University Of California Blockade of lymphocyte down-regulation associated with CTLA-4 signaling
US6218185B1 (en) 1996-04-19 2001-04-17 The United States Of America As Represented By The Secretary Of Agriculture Piggybac transposon-based genetic transformation system for insects
AU745049B2 (en) 1997-03-11 2002-03-07 Regents Of The University Of Minnesota DNA-based transposon system for the introduction of nucleic acid into DNA of a cell
JP2001523958A (ja) 1997-03-21 2001-11-27 ブライハム アンド ウィミンズ ホスピタル,インコーポレイテッド 免疫療法のctla−4結合ペプチド
US20020142462A1 (en) 1997-11-26 2002-10-03 Ildstad Suzanne T. Methods for mobilizing hematopoietic facilitating cells and hematopoietic stem cells into the peripheral blood
AUPP221098A0 (en) 1998-03-06 1998-04-02 Diatech Pty Ltd V-like domain binding molecules
US6302855B1 (en) 1998-05-20 2001-10-16 Novo Nordisk A/S Medical apparatus for use by a patient for medical self treatment of diabetes
AU770718B2 (en) 1998-06-05 2004-02-26 Mayo Foundation For Medical Education And Research Use of genetically engineered antibodies to CD38 to treat multiple myeloma
US7160682B2 (en) 1998-11-13 2007-01-09 Regents Of The University Of Minnesota Nucleic acid transfer vector for the introduction of nucleic acid into the DNA of a cell
US6682736B1 (en) 1998-12-23 2004-01-27 Abgenix, Inc. Human monoclonal antibodies to CTLA-4
CN1328571B (zh) 1998-12-23 2016-08-31 辉瑞大药厂 抗ctla-4的人单克隆抗体
US7109003B2 (en) 1998-12-23 2006-09-19 Abgenix, Inc. Methods for expressing and recovering human monoclonal antibodies to CTLA-4
EE05673B1 (et) 1999-08-17 2013-08-15 Biogen, Inc. BAFF-retseptor (BCMA), immunoregulatoorne agens
WO2001014424A2 (en) 1999-08-24 2001-03-01 Medarex, Inc. Human ctla-4 antibodies and their uses
US7605238B2 (en) 1999-08-24 2009-10-20 Medarex, Inc. Human CTLA-4 antibodies and their uses
AU2001233027A1 (en) 2000-01-27 2001-08-07 Genetics Institute, Llc Antibodies against ctla4 (cd152), conjugates comprising same, and uses thereof
US7288521B2 (en) 2000-04-06 2007-10-30 Franco Wayne P Growth factor therapy mobilization of stem cells into the peripheral blood
US8771663B2 (en) 2000-04-18 2014-07-08 Gentium Spa Formulation having mobilising activity
US6962810B2 (en) 2000-10-31 2005-11-08 University Of Notre Dame Du Lac Methods and compositions for transposition using minimal segments of the eukaryotic transformation vector piggyBac
US7105343B1 (en) 2000-10-31 2006-09-12 University Of Notre Dame Du Lac Methods and compositions for transposition using minimal segments of the eukaryotic transformation vector Piggybac
CN1294148C (zh) 2001-04-11 2007-01-10 中国科学院遗传与发育生物学研究所 环状单链三特异抗体
WO2003042402A2 (en) 2001-11-13 2003-05-22 Dana-Farber Cancer Institute, Inc. Agents that modulate immune cell activation and methods of use thereof
KR100704158B1 (ko) 2001-11-19 2007-04-05 교와 핫꼬 고교 가부시끼가이샤 다분화능 줄기세포를 조직으로부터 말초혈로 동원하는약제
AU2003231048A1 (en) 2002-04-22 2003-11-03 Regents Of The University Of Minnesota Transposon system and methods of use
DE10224242A1 (de) 2002-05-29 2003-12-11 Max Delbrueck Centrum Frog Prince, ein Transposonvektor für den Gentransfer bei Wirbeltieren
KR101348472B1 (ko) 2002-10-17 2014-01-07 젠맵 에이/에스 Cd20에 대한 인간 모노클로날 항체
CN1753912B (zh) 2002-12-23 2011-11-02 惠氏公司 抗pd-1抗体及其用途
US7709610B2 (en) 2003-05-08 2010-05-04 Facet Biotech Corporation Therapeutic use of anti-CS1 antibodies
JP5026072B2 (ja) 2003-07-01 2012-09-12 イミューノメディクス、インコーポレイテッド 二重特異性抗体の多価キャリヤー
EP1656156A2 (en) 2003-08-13 2006-05-17 Children's Hospital Medical Center Mobilization of hematopoietic cells
ES2458636T3 (es) 2003-08-18 2014-05-06 Medimmune, Llc Humanización de anticuerpos
WO2005035575A2 (en) 2003-08-22 2005-04-21 Medimmune, Inc. Humanization of antibodies
BRPI0507489A (pt) 2004-02-06 2007-07-10 Morphosys Ag anticorpos humanos de anti-cd38 e para os seus usos
US8361794B2 (en) 2004-06-29 2013-01-29 Immunocore Limited Cells expressing a modified T cell receptor
EP1786918A4 (en) 2004-07-17 2009-02-11 Imclone Systems Inc NEW BISPECIFIC ANTIBODY TETRAVALENT
US7422889B2 (en) 2004-10-29 2008-09-09 Stowers Institute For Medical Research Dre recombinase and recombinase systems employing Dre recombinase
EA018897B1 (ru) 2005-01-05 2013-11-29 Ф-Стар Биотехнологише Форшунгс- Унд Энтвиклунгсгез.М.Б.Х. Молекулы иммуноглобулина, содержащие модифицированные участки структурных петель, обладающие свойством связывания, и способ их получения
GB0504767D0 (en) 2005-03-08 2005-04-13 Ares Trading Sa Lipocalin protein
US7932088B1 (en) 2005-04-25 2011-04-26 University Of Notre Dame Du Lac High efficiency transformation of Plasmodium falciparum by the lepidopteran transposon, piggyBac
US20060252140A1 (en) 2005-04-29 2006-11-09 Yant Stephen R Development of a transposon system for site-specific DNA integration in mammalian cells
CN105315373B (zh) 2005-05-09 2018-11-09 小野药品工业株式会社 程序性死亡-1(pd-1)的人单克隆抗体及使用抗pd-1抗体来治疗癌症的方法
KR101607288B1 (ko) 2005-07-01 2016-04-05 이. 알. 스퀴부 앤드 선즈, 엘.엘.씨. 예정 사멸 리간드 1 (피디-엘1)에 대한 인간 모노클로날 항체
MY169746A (en) 2005-08-19 2019-05-14 Abbvie Inc Dual variable domain immunoglobulin and uses thereof
EP1829895A1 (en) 2006-03-03 2007-09-05 f-star Biotechnologische Forschungs- und Entwicklungsges.m.b.H. Bispecific molecule binding TLR9 and CD32 and comprising a T cell epitope for treatment of allergies
EP2019839B1 (en) 2006-05-25 2011-12-07 Sangamo BioSciences, Inc. Methods and compositions for gene inactivation
WO2008045437A2 (en) 2006-10-09 2008-04-17 The General Hospital Corporation Chimeric t-cell receptors and t-cells targeting egfrviii on tumors
EP1914242A1 (en) 2006-10-19 2008-04-23 Sanofi-Aventis Novel anti-CD38 antibodies for the treatment of cancer
CN101012463A (zh) * 2007-01-19 2007-08-08 安徽医科大学 HDAd/F载体及制备方法和用途
CA2684378C (en) 2007-04-26 2016-11-29 Sangamo Biosciences, Inc. Targeted integration into the ppp1r12c locus
KR101562580B1 (ko) 2007-06-18 2015-10-22 머크 샤프 앤 도메 비.브이. 사람 프로그램된 사멸 수용체 pd-1에 대한 항체
JP5726522B2 (ja) 2007-07-04 2015-06-03 マックス−デルブリュック−ツェントルム フューア モレキュラーレ メディツィン トランスポゾンシステム−スリーピングビューティーのトランスポザーゼタンパク質の機能亢進性バリアント
JP4435811B2 (ja) 2007-07-06 2010-03-24 シャープ株式会社 画像通信装置
EP2198022B1 (en) 2007-09-24 2024-03-06 University Of Zurich Designed armadillo repeat proteins
WO2009074807A2 (en) 2007-12-12 2009-06-18 Imperial Innovations Limited Methods
WO2009114335A2 (en) 2008-03-12 2009-09-17 Merck & Co., Inc. Pd-1 binding proteins
US8552154B2 (en) 2008-09-26 2013-10-08 Emory University Anti-PD-L1 antibodies and uses therefor
WO2010051391A1 (en) 2008-10-31 2010-05-06 Facet Biotech Corporation Use of anti-cs1 antibodies for treatment of rare lymphomas
CA2745031C (en) 2008-12-04 2018-08-14 Sangamo Biosciences, Inc. Genome editing in rats using zinc-finger nucleases
SG196798A1 (en) 2008-12-09 2014-02-13 Genentech Inc Anti-pd-l1 antibodies and their use to enhance t-cell function
EP3192811A1 (en) 2009-02-09 2017-07-19 Université d'Aix-Marseille Pd-1 antibodies and pd-l1 antibodies and uses thereof
WO2010099296A1 (en) 2009-02-26 2010-09-02 Transposagen Biopharmaceuticals, Inc. Hyperactive piggybac transposases
US8753639B2 (en) 2009-03-31 2014-06-17 University Of Washington Through Its Center For Commercialization Compositions and methods for modulating the activity of complement regulatory proteins on target cells
US8647623B2 (en) 2009-04-10 2014-02-11 Kyowa Hakko Kirin Co., Ltd Method for treatment of blood tumor using anti-TIM-3 antibody
JP5336592B2 (ja) 2009-06-08 2013-11-06 公益財団法人かずさDna研究所 新規な部位特異的組換え酵素とその認識配列を用いた部位特異的組換え方法
DE102009045006A1 (de) 2009-09-25 2011-04-14 Technische Universität Dresden Anti-CD33 Antikörper und ihre Anwendung zum Immunotargeting bei der Behandlung von CD33-assoziierten Erkrankungen
EP2504028A4 (en) 2009-11-24 2014-04-09 Amplimmune Inc SIMULTANEOUS INHIBITION OF PD-L1 / PD-L2
CN101716167B (zh) 2009-12-08 2011-12-28 中国人民解放军军事医学科学院野战输血研究所 一类饱和胺类化合物在制备外周血造血干细胞动员药物中的应用
WO2011082400A2 (en) 2010-01-04 2011-07-07 President And Fellows Of Harvard College Modulators of immunoinhibitory receptor pd-1, and methods of use thereof
WO2011139335A1 (en) 2010-04-26 2011-11-10 Sangamo Biosciences, Inc. Genome editing of a rosa locus using zinc-finger nucleases
US8793650B2 (en) 2010-06-11 2014-07-29 Microsoft Corporation Dynamic web application notifications including task bar overlays
CA2814155C (en) 2010-06-11 2019-10-22 Kyowa Hakko Kirin Co., Ltd. Anti-tim-3 antibody
WO2011159877A2 (en) 2010-06-18 2011-12-22 The Brigham And Women's Hospital, Inc. Bi-specific antibodies against tim-3 and pd-1 for immunotherapy in chronic immune conditions
US8907053B2 (en) 2010-06-25 2014-12-09 Aurigene Discovery Technologies Limited Immunosuppression modulating compounds
NZ612512A (en) 2010-12-09 2015-03-27 Univ Pennsylvania Use of chimeric antigen receptor-modified t cells to treat cancer
PT3459560T (pt) 2011-04-08 2021-05-24 Us Health Recetores de antigénio quimérico variante iii de recetor de fator de crescimento antiepidérmico e utilização dos mesmos para o tratamento de cancro
US9763980B2 (en) 2011-06-16 2017-09-19 Children's Medical Center Corporation Combined chemical modification of sphingosine-1-phosphate (S1P) and CXCR4 signalling pathways for hematopoietic stem cell (HSC) mobilization and engraftment
US8841418B2 (en) 2011-07-01 2014-09-23 Cellerant Therapeutics, Inc. Antibodies that specifically bind to TIM3
US9150847B2 (en) 2011-09-21 2015-10-06 Sangamo Biosciences, Inc. Methods and compositions for regulation of transgene expression
JP6188703B2 (ja) 2011-10-27 2017-08-30 サンガモ セラピューティクス, インコーポレイテッド Hprt遺伝子座を修飾するための方法および組成物
EP2690177B1 (en) 2012-07-24 2014-12-03 Technische Universität Dresden Protein with recombinase activity for site-specific DNA-recombination
KR20230065381A (ko) 2012-07-25 2023-05-11 더 브로드 인스티튜트, 인코퍼레이티드 유도 dna 결합 단백질 및 게놈 교란 도구 및 이의 적용
CA3177394A1 (en) 2012-08-20 2014-02-27 Fred Hutchinson Cancer Center Method and compositions for cellular immunotherapy
PT2893004T (pt) 2012-09-04 2019-01-21 Cellectis Recetor de antígeno quimérico de cadeia múltipla e utilizações do mesmo
EP2914628A1 (en) 2012-11-01 2015-09-09 Max-Delbrück-Centrum für Molekulare Medizin An antibody that binds cd269 (bcma) suitable for use in the treatment of plasma cell diseases such as multiple myeloma and autoimmune diseases
EP3045537A1 (en) 2012-12-12 2016-07-20 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
EP2931898B1 (en) 2012-12-12 2016-03-09 The Broad Institute, Inc. Engineering and optimization of systems, methods and compositions for sequence manipulation with functional domains
ES2701749T3 (es) 2012-12-12 2019-02-25 Broad Inst Inc Métodos, modelos, sistemas y aparatos para identificar secuencias diana para enzimas Cas o sistemas CRISPR-Cas para secuencias diana y transmitir resultados de los mismos
WO2014093694A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Crispr-cas nickase systems, methods and compositions for sequence manipulation in eukaryotes
EP4299741A3 (en) 2012-12-12 2024-02-28 The Broad Institute, Inc. Delivery, engineering and optimization of systems, methods and compositions for sequence manipulation and therapeutic applications
WO2014093635A1 (en) 2012-12-12 2014-06-19 The Broad Institute, Inc. Engineering and optimization of improved systems, methods and enzyme compositions for sequence manipulation
CN113528577A (zh) 2012-12-12 2021-10-22 布罗德研究所有限公司 用于序列操纵的系统、方法和优化的指导组合物的工程化
EP2931899A1 (en) 2012-12-12 2015-10-21 The Broad Institute, Inc. Functional genomics using crispr-cas systems, compositions, methods, knock out libraries and applications thereof
US8697359B1 (en) 2012-12-12 2014-04-15 The Broad Institute, Inc. CRISPR-Cas systems and methods for altering expression of gene products
CN114634950A (zh) 2012-12-12 2022-06-17 布罗德研究所有限公司 用于序列操纵的crispr-cas组分系统、方法以及组合物
KR20150131208A (ko) 2013-03-13 2015-11-24 이미지냅 인코포레이티드 Cd8에의 항원 결합 구조체들
US11332719B2 (en) 2013-03-15 2022-05-17 The Broad Institute, Inc. Recombinant virus and preparations thereof
BR112015027567B1 (pt) 2013-05-03 2024-02-20 Ohio State Innovation Foundation Polipeptídeo, sequência de ácido nucleico isolada, vetor, método de obtenção de célula, uso de uma célula
BR112015031611A2 (pt) 2013-06-17 2017-12-12 Massachusetts Inst Technology aplicação, manipulação e otimização de sistemas, métodos e composições para direcionamento e modelação de doenças e distúrbios de células pós-mitóticas
MX2015017313A (es) 2013-06-17 2016-11-25 Broad Inst Inc Suministro, uso y aplicaciones terapéuticas de los sistemas y composiciones crispr-cas, para actuar sobre trastornos y enfermedades utilizando componentes víricos.
EP4245853A3 (en) 2013-06-17 2023-10-18 The Broad Institute, Inc. Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation
WO2014204727A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions methods, screens and applications thereof
EP3011031B1 (en) 2013-06-17 2020-09-30 The Broad Institute Inc. Delivery and use of the crispr-cas systems, vectors and compositions for hepatic targeting and therapy
WO2014204723A1 (en) 2013-06-17 2014-12-24 The Broad Institute Inc. Oncogenic models based on delivery and use of the crispr-cas systems, vectors and compositions
DK3011029T3 (da) 2013-06-17 2020-03-16 Broad Inst Inc Administration, modificering og optimering af tandem-guidesystemer, fremgangsmåder og sammensætninger til sekvensmanipulering
WO2015065964A1 (en) 2013-10-28 2015-05-07 The Broad Institute Inc. Functional genomics using crispr-cas systems, compositions, methods, screens and applications thereof
JP6793547B2 (ja) 2013-12-12 2020-12-02 ザ・ブロード・インスティテュート・インコーポレイテッド 最適化機能CRISPR−Cas系による配列操作のための系、方法および組成物
EP4219699A1 (en) 2013-12-12 2023-08-02 The Broad Institute, Inc. Engineering of systems, methods and optimized guide compositions with new architectures for sequence manipulation
ES2765481T3 (es) 2013-12-12 2020-06-09 Broad Inst Inc Administración, uso y aplicaciones terapéuticas de los sistemas crispr-cas y composiciones para la edición genómica
KR20160097327A (ko) 2013-12-12 2016-08-17 더 브로드 인스티튜트, 인코퍼레이티드 유전자 산물, 구조 정보 및 유도성 모듈형 cas 효소의 발현의 변경을 위한 crispr-cas 시스템 및 방법
BR112016013547A2 (pt) 2013-12-12 2017-10-03 Broad Inst Inc Composições e métodos de uso de sistemas crispr-cas em distúrbios de repetições de nucleotídeos
JP2017501149A (ja) 2013-12-12 2017-01-12 ザ・ブロード・インスティテュート・インコーポレイテッド 粒子送達構成成分を用いた障害及び疾患の標的化のためのcrispr−cas系及び組成物の送達、使用及び治療適用
JP2017527256A (ja) 2013-12-12 2017-09-21 ザ・ブロード・インスティテュート・インコーポレイテッド HBV及びウイルス性疾患及び障害のためのCRISPR−Cas系及び組成物の送達、使用及び治療適用
WO2015089364A1 (en) 2013-12-12 2015-06-18 The Broad Institute Inc. Crystal structure of a crispr-cas system, and uses thereof
US20170037431A1 (en) * 2014-05-01 2017-02-09 University Of Washington In vivo Gene Engineering with Adenoviral Vectors
EP3172237A2 (en) 2014-07-21 2017-05-31 Novartis AG Treatment of cancer using humanized anti-bcma chimeric antigen receptor
EP3227324A4 (en) 2014-12-05 2018-08-29 Memorial Sloan Kettering Cancer Center Antibodies targeting g-protein coupled receptor and methods of use
GB201503742D0 (en) 2015-03-05 2015-04-22 Ucl Business Plc Chimeric antigen receptor
SG10201914069SA (en) 2015-05-18 2020-03-30 Tcr2 Therapeutics Inc Compositions and methods for tcr reprogramming using fusion proteins
US9790490B2 (en) 2015-06-18 2017-10-17 The Broad Institute Inc. CRISPR enzymes and systems
US20190225955A1 (en) 2015-10-23 2019-07-25 President And Fellows Of Harvard College Evolved cas9 proteins for gene editing
US20190233814A1 (en) 2015-12-18 2019-08-01 The Broad Institute, Inc. Novel crispr enzymes and systems
EP3405570A1 (en) 2016-01-22 2018-11-28 The Broad Institute, Inc. Crystal structure of crispr cpf1
AU2017240150C1 (en) 2016-04-01 2022-10-27 Kite Pharma, Inc. BCMA binding molecules and methods of use thereof
CR20210084A (es) 2016-04-01 2021-03-26 Amgen Inc Receptores quiméricos y métodos de uso de los mismos (divisional 2018-0480)
BR112018070073A2 (pt) 2016-04-01 2019-02-12 Kite Pharma, Inc. receptores de antígeno quimérico e célula t e métodos de uso
SG10202010311SA (en) 2016-04-19 2020-11-27 Broad Inst Inc Novel Crispr Enzymes and Systems
WO2017189901A1 (en) * 2016-04-27 2017-11-02 Baylor College Of Medicine Silencing transgene expression during vector production
US20190345450A1 (en) 2016-06-17 2019-11-14 Fred Hutchinson Cancer Research Center Strategies to assess and/or produce cell populations with predictive engraftment potential
TWI781108B (zh) 2016-07-20 2022-10-21 比利時商健生藥品公司 抗gprc5d抗體、結合gprc5d與cd3之雙特異性抗原結合分子及其用途
CA3031414A1 (en) 2016-07-26 2018-02-01 The General Hospital Corporation Variants of crispr from prevotella and francisella 1 (cpf1)
AU2017306432A1 (en) 2016-08-02 2019-03-21 TCR2 Therapeutics Inc. Compositions and methods for TCR reprogramming using fusion proteins
TWI695010B (zh) 2016-09-28 2020-06-01 美商凱特製藥公司 抗原結合分子類和使用彼等之方法
EP3445787B1 (en) 2016-10-07 2020-12-02 TCR2 Therapeutics Inc. Compositions and methods for t-cell receptors reprogramming using fusion proteins
EP3592777A1 (en) 2017-03-10 2020-01-15 President and Fellows of Harvard College Cytosine to guanine base editor

Also Published As

Publication number Publication date
AU2020298572A1 (en) 2021-11-18
EP3994270A1 (en) 2022-05-11
IL289518A (en) 2022-03-01
JP2022539248A (ja) 2022-09-07
US20220257796A1 (en) 2022-08-18
WO2021003432A1 (en) 2021-01-07
MX2021015433A (es) 2022-06-08
CN114729383A (zh) 2022-07-08
BR112021026832A2 (pt) 2022-05-10
CA3138188A1 (en) 2021-01-07
SG11202111943UA (en) 2021-11-29

Similar Documents

Publication Publication Date Title
KR20220038362A (ko) 재조합 ad35 벡터 및 관련 유전자 요법 개선
AU2019203955B2 (en) Multipartite signaling proteins and uses thereof
ES2819976T5 (es) Composiciones y usos médicos para la reprogramación de TCR con proteínas de fusión
KR20210143230A (ko) 뉴클레오티드 서열을 편집하기 위한 방법 및 조성물
KR20230019843A (ko) 표적 이중 가닥 뉴클레오티드 서열의 두 가닥의 동시 편집을 위한 방법 및 조성물
KR102049161B1 (ko) 치료적 단백질을 조건부로 발현하는 벡터,상기 벡터를 포함하는 숙주 세포 및 이의 용도
KR101629071B1 (ko) 다수의 면역조절자를 발현하는 조작된 세포 및 그 용도
CN113271955A (zh) 用于细胞介导的溶瘤病毒疗法的增强的系统
AU2022200903B2 (en) Engineered Cascade components and Cascade complexes
KR20210143897A (ko) 오리지아스로부터의 트랜스포사제를 이용한 핵산 작제물의 진핵세포로의 통합
BRPI0613784A2 (pt) expressão de gene múltipla incluindo constructos sorf e métodos com poliproteìnas, pro-proteìnas e proteólise
KR20220090512A (ko) 액체암의 치료를 위한 조성물 및 방법
KR20200126997A (ko) 인간 대상체에서의 비-노화-관련 청각 손상의 치료를 위한 조성물 및 방법
KR20220098384A (ko) 폼페병 및 리소좀 장애를 치료하기 위한 간-특이적 프로모터를 포함하는 치료적 아데노-관련 바이러스
KR20220002609A (ko) 포유동물 세포의 특성을 변경하기 위한 인공 마이크로-rna 및 이들 생성물의 조성물을 사용한 포유동물 세포의 변형
CN114502731A (zh) 基于转座子的免疫细胞的修饰
KR20230066000A (ko) 면역자극성 박테리아-기초 백신, 치료제, 및 rna 전달 플랫폼
KR20200095462A (ko) Hbb 유전자 기능 회복을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법
KR20230029603A (ko) 필수 유전자 녹-인에 의한 선택
KR20230031929A (ko) 고릴라 아데노바이러스 핵산 서열 및 아미노산 서열, 이들을 함유하는 벡터, 및 이의 용도
CN115768901A (zh) 腺病毒的大负载整合
KR20200127170A (ko) Pah 유전자 기능 복원을 위한 아데노-연관 바이러스 조성물 및 이의 사용 방법
KR20220157944A (ko) 인간 대상체에서 비-연령-연관 청각 장애를 치료하기 위한 조성물 및 방법
KR20240037185A (ko) 키메라 공동자극 수용체, 케모카인 수용체, 및 세포 면역치료에서의 이의 용도
KR20240035382A (ko) 아데노바이러스 유전자 요법 벡터

Legal Events

Date Code Title Description
N231 Notification of change of applicant