KR20220161297A

KR20220161297A - 신규 세포주

Info

Publication number: KR20220161297A
Application number: KR1020227032424A
Authority: KR
Inventors: 플레시스 다비드 요하네스 프랑수아 두; 안가쿠수마
Original assignee: 유니큐어 바이오파마 비.브이.
Priority date: 2020-04-02
Filing date: 2021-04-02
Publication date: 2022-12-06
Also published as: EP4127146A1; AU2021249483A1; CA3169017A1; US20230265381A1; JP2023519138A; CN115867647A; WO2021198510A1

Abstract

본 발명은 파르보바이러스 유전자 치료요법 벡터의 생산을 위한 곤충 세포주에 관한 것이다. 특히, 본 발명은 이의 게놈 내로 통합된 바이러스 레플리카제 단백질에 대한 발현 작제물을 지닌 안정한 곤충 세포주에 관한 것이며, 이러한 세포주는 이종 파르보바이러스-관련 단백질 및 벡터를 고 수율의, 풍부하고, 확장가능한 생산을 허용한다.

Description

신규 세포주

발명의 분야

본 발명은 의약, 분자 생물학, 및 유전자 치료요법의 분야에 관한 것이다. 본 발명은 세포 내에서의 단백질의 생산에 관한 것이고, 이에 의해 반복된 불완전한 팔린드롬성/상동성 반복 서열(repeated imperfect palindromic/homologous repeat sequence)이 바큘로바이러스 벡터(baculoviral vector) 내에서 사용된다. 특히, 본 발명은 유전자 치료요법에서 사용될 수 있는 파르보바이러스(parvoviral) 벡터(parvoviral vector)의 생산, 및, 파르보바이러스 벡터의 생산성을 증가시키는 바이러스 레플리카제(viral replicase; Rep) 단백질의 발현에 있어서의 개선에 관한 것이다.

바큘로바이러스 발현 시스템은 진핵성 클로닝(eukaryotic cloning) 및 발현 벡터로서의 이의 용도에 대해 잘 알려져 있다(King, L. A., and R. D. Possee, 1992, "The baculovirus expression system", Chapman and Hall, United Kingdom; O'Reilly, D. R., et al., 1992. Baculovirus Expression Vectors: A Laboratory Manual. New York: W. H. Freeman). 바큘로바이러스 발현 시스템의 장점은 다른 것들 중에서도, 발현된 단백질이 거의 항상 가용성이고, 정확하게 폴딩(folding)되며 생물학적으로 활성이라는 것이다. 추가의 장점은 높은 단백질 발현 수준, 보다 신속한 생산, 거대 단백질의 발현에 대한 적합성 및 대규모 생산에 대한 적합성을 포함한다. 그러나, 곤충 세포 생물반응기 속에서 바큘로바이러스 시스템을 사용한 이종 단백질의 대규모 또는 연속 생산 동안, 계대배양 효과로서 또한 알려진, 생산 수준의 불안정성이 주요 장애물이다. 이러한 효과는 적어도 부분적으로는 바큘로바이러스 DNA내 반복된 상동성 서열 사이에서의 재조합에 기인한다.

바큘로바이러스 발현 시스템은 또한 재조합 아데노-관련 바이러스(adeno-associated virus; AAV) 벡터의 생산에 성공적으로 사용되어 왔다(Urabe et al., 2002, Hum. Gene Ther. 13: 1935-1943; US 6,723,551 및 US 20040197895). AAV는 사람 유전자 치료요법을 위해 가장 촉망되는 바이러스 벡터 중 하나로 고려될 수 있다. AAV는 분열하는 사람 세포 뿐만 아니라 분열하지 않는 사람 세포를 효율적으로 감염시키는 능력을 가지며, 심지어 AAV가 많은 사람에 존재한다해도 이는 어떠한 질환과 관련되어 있지 않다. 이러한 장점의 측면에서, 재조합 아데노-관련 바이러스(recombinant adeno-associated virus; rAAV)는 혈우병 B(hemophilia B), 악성 흑색종(malignant melanoma), 낭성 섬유증(cystic fibrosis), 과지방단백혈증 제I형(hyperlipoproteinemia type I) 및 다른 질환을 포함하는 다양한 유전자 치료요법 임상 시험에서 평가중에 있다.

AAV의 대규모 생산을 위해, 포유동물 생산 시스템은, 특히 규모 확장이 많은 생물반응기 공간을 요구할 것이므로, 아주 적합하지 않은 것으로 밝혀졌다. AAV에 대한 포유동물 생산 시스템의 규모 확장에서 이러한 문제를 해결하기 위하여, 문헌(참고: Urabe et al. (2002, 상기 참고))는 곤충 세포 내에서 AAV 생산 시스템을 개발하였다. 곤중 체포 내에서 AAV의 생산을 가능하도록 하기 위하여, 3개의 AAV 캡시드 단백질(VP1, VP2 및 VP3)의 정확한 화학량론을 달성하기 위하여 일부 변형이 요구되었으며, 이는 2개의 스플라이스 수용체 부위(splice acceptor site)의 교호적인 사용의 조합 및 곤충 세포에 의해 정밀하게 재생되지 않는 VP2에 대한 ACG 개시 코돈의 준최적 활용(suboptimal utilization)에 의존한다. 곤충 세포내에서 캡시드 단백질의 정확한 화학량론을 모사하기 위하여, 문헌(참고: Urabe et al. (2002, 상기 참고)은 스플라이싱을 요구하지 않고 모든 3개의 VP 단백질을 발현할 수 있는 단일의 폴리시스트론성 전령(polycistronic messenger)으로 전사되는 작제물을 사용하여 여기서 대부분의 상부 개시인자 코돈(upstream initiator codon)은 준최적(suboptimal) 개시인자 코돈 ACG로 대체된다. 제WO2007/046703호는 곤충 세포 내에서 생산된 바와 같은 AAV 캡시드 단백질의 화학량론의 추가의 최적화에 의해 달성된 바큘로바이러스-생산된 rAAV 캡시드 단백질의 감염성의 추가의 개선을 개시하고 있다.

문헌(참고: Urabe et al. (2002, 상기 참고))에서 초기 개발된 바와 같은, AAV 바큘로바이러스 발현 시스템에서 AAV Rep 단백질의 발현을 위해, 각각 별개의 바큘로바이러스 프로모터(baculobviaral promoter), 각각 △IE1 및 polH 프로모터 각각의 제어 하에서, 2개의 별개의 Rep 발현 단위(Rep78에 대해 1개 및 Rep52에 대해 1개)를 지닌 재조합 바큘로바이러스 작제물이 사용된다. 그러나, 코흘브렌너(Kohlbrenner) 등의 문헌(2005, Mol. Ther. 12: 1217-25; WO 2005/072364)은 우라베(Urabe) 등에 의해 사용된 바와 같은 2개의 Rep 단백질의 발현을 위해 바큘로바이러스 작제물이 고유의 불안정성을 겪음을 보고하였다. 우라베의 원래의 벡터 내 2개의 Rep 유전자의 팔린드롬성 배향을 분할하고 Rep52 및 Rep78을 발현하기 위한 2개의 별개의 바큘로바이러스 벡터를 설계함으로써, 문헌(참고: Kohlbrenner et al. (2005, 상기 참고)은 벡터의 계대배양 안정성을 증가시켰다. 그러나, 적어도 5개의 계배배양에 걸쳐 곤충 세포 내에서 2개의 별개의 바큘로바이러스-Rep 작제물로부터의 Rep78 및 Rep52의 일관된 발현에도 불구하고, rAAV 벡터 수율은 문헌(참고: Urabe et al. (2002, 상기 참고))에서 설계된 원래의 바큘로바이러스-Rep 작제물과 비교하여 5 내지 10배 더 낮다.

출원 제WO2007/148971호에서 본 발명자는 Rep78 및 Rep52 단백질에 대한 단일 코딩 서열(coding sequence)을 사용함으로써 곤충 세포 내에서 rAAV 벡터 생산의 안정성을 유의적으로 개선시켰고 여기서 준최적 개시인자 코돈은 스캐닝 리보솜(scanning ribosome)에 의해 부분적으로 스킵(skip)된 Rep78 단백질에 대해 사용되어 해독(translation) 개시가 Rep52 단백질의 개시 코돈에서 추가로 하부에서 발생하도록 한다. 제WO 2009/014445호에서는 곤충 세포 내에서 rAAV 벡터의 안정성을 Rep52 및 Rep78에 대한 별개의 발현 카세트를 사용함으로써 다시 추가로 개선시켰으며, 여기서 반복된 코딩 서열은 코돈 편향(codon bias)에서 상이하여 상동 재조합(homologous recombination)을 감소시킨다.

국제 특허원 제WO 2007/084773호는 곤충 세포 내에서 rAAV 생산 방법을 개시하고 있으며, 여기서 감염성 바이러스 입자의 생산은 VP2 및 VP3에 대해 VP1을 보충함으로써 증가된다. 보충은 곤충 세포 내로 VP1, VP2 및 VP3를 발현하는 뉴클레오타이드 서열을 포함하는 캡시드 벡터를 도입하고 추가로 동일한 캡시드 벡터 상에 또는 상이한 벡터 상에 존재할 수 있는, VP1을 발현하는 곤충 세포 뉴클레오타이드 서열을 곤충 세포 내로 도입함으로써 시행될 수 있다.

2009년에, 아슬라니디(Aslanidi) 등의 문헌(Proc Natl Acad Sci U S A. 2009;106(13):5059-64)에서는 AAV ITR 및 목적한 전이유전자(transgene)(Trans)를 지닌 바큘로바이러스(Bac)의 단일 접종시 세포 당 10⁵개의 게놈 카피(GC)에서 AAV를 생산할 수 있는 Sf9-기반 Rep-Cap 패키징 세포주(packaging cell line)를 생성하였다. OneBac 플랫폼(platform)으로서 지칭된 이러한 시스템은 AAV 생산의 규모 확장을 위해 적합한 것으로 고려되었다(Mietzsch, et al., 2014; Mietzsch, et al., 2017). 그러나, 문헌(참고: Mietzsch et al. (2015))에서는 이러한 플랫폼을 추가로 최적화하여 낮은 숙주-DNA 거짓 패키징(false packaging)을 지닌 다수의 AAV 혈청형을 생산하였다. 최근의 연구에서 문헌(참고: Wu et al. (2019))은 OneBac 플랫폼이 보다 더 다용도일 수 있고 패키징 Rep Sf9 세포 내에서 통합된 유도성 Rep 유전자를 유지하면서 바큘로바이러스 벡터 게놈 내부에 Cap 유전자를 ITR-전이유전자-ITR(Cap-Trans)와 함께 융합시킴으로써 유연성(flexible)이 될 수 있음을 입증하였다. 모든 이러한 실험은 OneBac 플랫폼의 가치 및 동시에 개선의 필수성 및 가능성을 입증하였다.

따라서, 특히 공정 견고성(robustness)과 관련된 제한을 극복하기 위하여, 세포 내에서 파르보바이러스 벡터의 대규모(상업적) 생산에서 추가의 개선이 여전이 요구되고 있다. 따라서 본 발명의 목적은 이종의 파르보바이러스-관련 단백질 및 벡터의 고-수율의, 강력한, 및 확장가능한 생산을 허용하는 수단 및 방법을 제공하는 것이다.

발명의 요약

제1 양태에서, 본 발명은 i) 세포 내에서의 해독(translation)이 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나를 생산하는, mRNA를 암호화(encoding)하는 뉴클레오타이드 서열에 작동 가능하게 연결된(operably linked) 제1의 프로모터; ii) 세포 내에서의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제2의 프로모터; 및 iii) 제1 및 제2의 프로모터에 작동 가능하게 연결된 적어도 하나의 인핸서(enhancer)를 포함하는, 세포의 게놈 내로 통합된 곤충 세포에 관한 것이고, 여기서 적어도 하나의 인핸서 성분은 전사 트랜스레귤레이터(transcriptional transregulator)에 의존적이고, 여기서 전사 트랜스레귤레이터의 세포 내로의 도입은 제1 및 제2의 프로모터로부터의 전사를 유도한다. 바람직하게는 본 발명의 곤충 세포 내에서, 제1 및 제2의 프로모터는 바큘로바이러스 프로모터이고, 전사 트랜스레귤레이터는 바큘로바이러스 이미이어트-얼리 단백질(immediate-early protein; IE1) 또는 이의 스플라이스 변이체(splice variant; IE0)이고 전사 트랜스레귤레이터-의존적인 인핸서 성분은 바큘로바이러스 상동성 영역(homologous region; hr) 인핸서 성분이고, 여기서 바람직하게는 바큘로바이러스는 오토그라파 칼리포르니카(Autographa californica) 다중캡시드(multicapsid) 뉴클레오폴리헤드로바이러스이다. 바람직하게는, 본 발명의 곤충 세포에서, hr 인핸서 성분은 hr2-0.9 이외의 hr 인핸서 성분이고, 여기서 바람직하게는 hr 인핸서 성분은 바람직하게는 hr 28-mer 서열 CTTTACGAGTAGAATTCTACGCGTAAAA (서열 번호: 32)의 적어도 하나의 카피 및/또는 적어도 20, 21, 22, 23, 24, 25, 26, 또는 27 뉴클레오타이드의 서열이 서열 CTTTACGAGTAGAATTCTACGCGTAAAA(서열 번호: 32)와 동일하고 바큘로바이러스 IE1 단백질에 결합하는 서열의 적어도 하나의 카피(one copy of a of a sequence)를 포함하고, 여기서 hr 인핸서 성분은, polH 프로모터에 작동 가능하게 연결된 리포터 유전자(reporter gene)를 포함하는 발현 카세트(expression cassette)에 작동 가능하게 연결된 경우, a) 비-유도 조건(non-inducing condition) 하에서, hr 인핸서 성분을 지닌 발현 카세트는 hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트 보다는 리포터 전사체를 거의 생산하지 않거나, hr 인핸서 성분을 지닌 카세트는 hr4b 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체 양의 1.1, 1.2, 1.5, 2, 5 또는 10배(factor) 미만을 생산하고; b) 유도 조건 하에서, hr 인핸서 성분을 지닌 발현 카세트는 hr4b 또는 hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체의 양의 적어도 50, 60, 70, 80, 90 또는 100%를 생산하고, 보다 바람직하게는, hr 인핸서 성분은 hr1, hr3, hr4b 및 hr5로 이루어진 그룹으로부터 선택되고, 이 중 hr4b 및 hr5가 바람직하고, 이중 hr4b가 가장 바람직하다.

본 발명에 따른 곤충 세포에서, 제1 및 제2의 프로모터는 바람직하게는 별개이고, 여기서 보다 바람직하게는 제1의 프로모터는 지연된 얼리 바큘로바이러스 프로모터(delayed early baculoviral promoter)이고 제2의 프로모터는 레이트 또는 베리 레이트 바큘로바이러스 프로모터(late or very late baculoviral promoter)이고, 가장 바람직하게는 제1의 프로모터는 39k 프로모터이고 제2의 프로모터는 polH, p10, p6.9 및 pSel120 프로모터로 이루어진 그룹으로부터 선택된다.

본 발명의 곤충 세포의 바람직한 구현예에서, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나 및 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나는 적어도 90% 동일한 일반적인 아미노산 서열을 가지지만, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에 대해 mRNA일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대해 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 95, 90, 85, 80, 75, 70, 65 또는 60% 미만의 서열 동일성(sequence identity)을 갖고, 여기서 바람직하게는 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에 대한 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 내 코돈 사용(codon usage)은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대한 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 내 코돈 사용보다 곤충 세포의 코돈 사용 편향(codon usage bias)에 대해 보다 더 적응된다.

본 발명의 곤충 세포의 다른 바람직한 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대한 mRNA를 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 감소된 정상 상태 수준(steady state level)에 영향을 미치는 변형을 포함하고, 바람직하게는 파르보바이러스 Rep78 및 68 단백질 중 적어도 하나는 준최적 해독 개시 코돈으로 출발하는 개방 판독 프레임(open reading frame)을 포함하고, 여기서 보다 바람직하게는, 준최적 해독 개시 코돈은 ACG, CTG, TTG, GTG 및 ATT로부터 선택되고, 이중 ACG가 가장 바람직하다.

바람직하게는 본 발명에 따른 곤충 세포 내에서, 제1 및 제2의 프로모터는 전사의 반대 방향으로 세포의 게놈 내에 통합되고 여기서 적어도 하나의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재하고, 여기서 보다 바람직하게는 2개의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재한다.

본 발명에 따른 곤충 세포는 또한 바람직하게는: a) 곤충 세포 내에서 발현을 위한 제3의 프로모터에 작동 가능하게 연결된 파르보바이러스 캡시드 단백질 암호화 서열을 포함하는 뉴클레오타이드 서열; b) 적어도 하나의 파르보바이러스 역위된 말단 반복 서열(parvovirus inverted terminal repeat sequence)에 의해 플랭킹(flanking)되는 전이유전자를 포함하는 뉴클레오타이드 서열; 및 c) 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 뉴클레오타이드 서열을 포함하고, 여기서 바람직하게는, a) 및 b) 중 적어도 하나의 뉴클레오타이드 서열은 바큘로바이러스 벡터 내에 포함되고, 여기서, 보다 바람직하게는 a), b) 및 c) 중 적어도 하나의 뉴클레오타이드 서열은 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 바큘로바이러스 벡터 내에 포함된다. 바람직한 구현예에서, 제1의 프로모터는 제3의 프로모터 앞에서 활성이다.

본 발명에 따른 곤충 세포의 바람직한 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나, 파르보바이러스 VP1, VP2, 및 VP3 캡시드 단백질 및 적어도 하나의 파르보바이러스 역위된 말단 반복체 서열은 아데노 관련 바이러스(adeno associated virus; AAV)로부터 유래된다.

본 발명에 따른 곤충 세포의 바람직한 구현예에서, 바람직한 cap-암호화 서열은 적어도 CAP AAV2/5(서열 번호: 29) 또는 AAV5(서열 번호: 30)를 포함한다.

제2의 양태에서, 본 발명은 a) 상기 정의된 바와 같은 곤충 세포를 배양하는 단계; b) a)에서 배양된 세포에 본원의 상기에 정의된 바와 같은 뉴클레오타이드 서열을 제공하는 단계; 및, c) 재조합 파르보바이러스 비리온(virion)을 회수하는 단계를 포함하는, 재조합 파르보바이러스 비리온을 생산하는 방법에 관한 것이다. 바람직하게는 본 발명의 방법에서, 단계 c)에서 재조합 파르보바이러스 비리온의 회수는 고정된 항-파르보바이러스 항체, 바람직하게는 단일 쇄 카멜리드 항체(camelid antibody) 또는 이의 단편을 사용한 비리온의 친화성-정제(affinity-purification), 및 30 내지 70 nm의 공칭 공극 크기(nominal pore size)를 지닌 필터(filter) 위에서의 여과 중 적어도 하나를 포함한다.

제3의 양태에서, 본 발명은 적어도 본원의 상기에 정의된 바와 같은 곤충 세포 및 본원의 상기에 정의된 바와 같은 바큘로바이러스 벡터 및/또는 뉴클레오타이드 서열을 포함하는 부분의 키트(kit of parts)에 관한 것이다.

발명의 설명

정의

달리 정의하지 않는 한, 본원에 사용된 기술적 및 과학적 용어는 본 개시내용이 속한 분야의 통상의 기술자에 의해 일반적으로 이해된 바와 동일한 의미를 갖는다. 당해 분야의 숙련가는 본원에 기술된 것과 유사하거나 동일한 많은 방법 및 물질을 인식할 것이며, 이는 본 발명의 실시에 사용될 수 있다. 더욱이, 본 발명은 어떠한 방식으로도 이러한 방법에 한정되지 않는다.

이러한 문서 및 이의 청구범위에서, 동사 "포함하는" 및 이의 활용은 이러한 단어를 수반하는 항목이 포함됨을 의미하는 이의 비-제한적인 의미로 사용되지만, 구체적으로 언급되지 않은 항목이 배제되지는 않는다. 또한, 단수 형태("a" 또는 "an")에 의한 성분에 대한 참고는, 문맥이 성분 중 하나 또는 하나 만이 존재함을 명확하게 요구하지 않는 한, 성분 중 하나 이상이 존재할 가능성을 배제하지 않는다. 따라서, 단수 형태("a" 또는 "an")는 일반적으로 "적어도 하나"를 의미한다.

본원에 사용된 바와 같은 용어 "및/또는"은 기술된 경우 중 하나 이상이 단독으로 또는 기술된 경우 중 적어도 하나와 함께 기술된 경우의 모두를 사용할 때까지 발생할 수 있음을 아타낸다.

본원에 사용된 바와 같은, "적어도" 특수한 값은 특수한 값 또는 그 이상을 의미한다. 예를 들면, "적어도 2"는 "2 이상"과 동일한, 즉, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, ... , 등인 것으로 이해된다.

단어 "약" 또는 "대략"은 수치 값과 함께 사용되는 경우(예컨대, 약 10), 바람직하게는 값이 주어진 값(10) 이상 또는 값의 0.1% 미만일 수 있음을 의미한다.

본원에 사용된 바와 같은, "유효량"은 제제의 양이 치료되지 않은 환자와 관련하여 질환의 증상을 개선시키는데 요구되는 제제의 양을 의미한다. 예를 들면, 암의 치료학적 치료를 위해 본 발명을 실시하는데 사용된 활성제(들)의 유효량은 투여 방식, 체중, 및 대상체의 일반적인 건강에 따라 변한다. 궁극적으로, 주치의 또는 수의사는 적절한 양 및 투여량 요법을 결정할 것이다. 이러한 양은 킬로그램 당 게놈 카피(GC/kg)로서 측정될 수 있는 "유효한" 양으로 지칭된다. 따라서, 현재의 개시내용의 문맥에서, 질환 또는 상태"에 대해 효과적인" 약물의 투여와 관련하여, 임상적으로 적절한 방식의 투여는 환자의 적어도 통계적으로 유의적인 분획에 대해 유리한 효과, 예를 들면, 증상의 개선, 적어도 하나의 질환 신호 또는 증상에서 치유, 감소, 삶의 연장, 삶의 질의 개선, 또는 특수한 유형의 질환 또는 상태를 치료하는 것에 친숙한 의사 박사에 의해 긍정적인 것으로 일반적으로 인식된 다른 효과를 생성함을 나타낸다.

본 문서에 기술된 바와 같은 의약으로부터의 물질의 사용은 의약의 제조시 상기 물질의 사용으로서 또한 해석될 수 있다. 유사하게, 물질이 치료를 위해 또는 의약으로서 사용될 때는 언제는지, 이는 또한 치료용 의약의 제조를 위해 사용될 수 있다. 본원에 기술된 의약으로서 사용하기 위한 생성물은 치료 방법에서 사용될 수 있고, 여기서 이러한 치료 방법은 사용을 위한 생성물의 투여를 포함한다.

용어 "상동성(homology)", "서열 동일성(sequence identity)" 등은 본원에서 상호교환적으로 사용된다. 서열 동일성은 서열을 비교함으로서 측정한 것으로서, 본원에서 2개 이상의 아미노산(폴리펩타이드 또는 단백질) 서열 또는 2개 이상의 핵산(폴리뉴클레오타이드) 서열 사이의 관계로서 정의된다. 당해 분야에서, "동일성"은 또한 이러한 서열의 스트링(string) 사이의 매치에 의해 측정된 것으로서, 경우가 존재할 경우, 아미노산 또는 핵산 서열 사이의 서열 관련성 정도를 의미한다. 2개의 아미노산 서열 사이의 "유사성"은 하나의 펩타이드의 아미노산 서열 및 이의 보존된 아미노산 치환체를 제2의 폴리펩타이드의 서열과 비교함으로써 측정된다. "동일성" 및 "유사성"은 공지된 방법에 의해 용이하게 계산될 수 있다.

"서열 동일성" 및 "서열 유사성"은 2개의 서열의 길이에 따라, 전반적이거나 국부적인 정렬 알고리즘을 사용하여 2개의 펩타이드 또는 2개의 뉴클레오타이드 서열의 정렬에 의해 측정할 수 있다. 유사한 길이의 서열은 바람직하게는 임의로 전체 길이에 걸쳐 서열을 정렬하는 전반적인 정렬 알고리즘(예컨대, Needleman Wunsch)을 사용하여 정렬되지만, 실질적으로 상이한 길이의 서열은 바람직하게는 국부 정렬 알고리즘(예컨대, Smith Waterman)을 사용하여 정렬된다. 서열이(예를 들면 디폴트 매개변수(default parameter)를 사용하여 프로그램 GAP 또는 BESTFIT에 의해 임의로 정렬된 경우) 서열 동일성의 적어도 특정의 최소 퍼센트를 공유하는 경우(하기 정의된 바와 같이), 이후에 "실질적으로 동일한" 또는 "필수적으로 유사한" 것으로 지칭될 수 있다. GAP은 Needleman 및 Wunsch 전반적인 정렬 알고리즘을 사용하여 이의 전체 길이(전체 길이)에 걸쳐 2개의 서열을 정렬하여, 매치의 수를 극대화하고 갭의 수를 최소화한다. 전반적인 정렬을 적합하게 사용하여 2개의 서열이 유사한 길이를 갖는 경우 서열 동일성을 측정한다. 일반적으로, GAP 디폴트 매개변수를 사용하여, 갭 창조 패널티(gap creation penalty)는 50(뉴클레오타이드)/8(단백질)이고 갭 연장 패널티(gap extension penalty)는 3(뉴클레오타이드)/2(단백질)이다. 뉴클레오타이드의 경우 사용된 디폴트 점수매김 매트릭스(default scoring matrix)는 nwsgapdna이고 단백질의 경우 디폴트 점수매김 매트릭스는 Blosum62이다(Henikoff & Henikoff, 1992, PNAS 89, 915-919). 서열 정렬 및 서열 동일성 퍼센트에 대한 점수는 컴퓨터 프로그램, 예를 들면, 미국 캘리포니아주 92121-3752, 샌 디에고, 스크란톤 로드 9685에 소재하는 Accelrys Inc.로부터 이용가능한 GCG Wisconsisn Package, 버젼 10.3을 사용하거나, 개방 소프 소프트웨어(open source software), 예를 들면, 프로그램 "니들(needle)"(전반적인 Needleman Wunsch 알고리즘 사용) 또는 상기 GAP에 대해서와 동일한 매개변수, 또는 디폴트 셋팅('티들' 및 '워터'의 경우 둘 다 및 단백질 및 DNA 정렬'에 대해 둘 다, 디폴트 Gap 개방 패널티(Gap opening penalty)는 10.0이고 디폴티 갭 연장 패널티는0.5이고; 디폴트 점수매김 매트릭스(default scoring matrices)는 단백질의 경우 Blossum62이고 DNA의 경우 DNAFull이다)을 사용하는 "워터(water)"(국부 Smith Waterman 알고리즘 사용)를 EmbossWIN 버젼 2.10.0을 사용하여 측정할 수 있다. 서열이 실질적으로 상이한 전체 길이를 갖는 경우, 국부 알고리즘, 예를 들면, Smith Waterman 알고리즘을 사용하는 것이 바람직하다.

대안적으로, 유사성 또는 동일성 퍼센트는 FASTA, BLAST와 같은 알고리즘을 사용하여, 공공의 데이타베이스에 대해 조사함으로써 측정할 수 있다. 따라서, 본 발명의 핵산 및 단백질 서열은 또한 "질의 서열(query sequence)"로서 사용하여 공공의 데이타베이스에 대한 조사를 수행함으로써, 예를 들면, 다른 계열 구성원 또는 관련된 서열을 확인할 수 있다. 이러한 조사는 문헌: Altschul, et al. (1990) J. Mol. Biol. 215:403―10의 BLASTn 및 BLASTx 프로그램(버젼 2.0)을 사용하여 수행할 수 있다. BLAST 뉴클레오타이드 조사는 NBLAST 프로그램, 점수 = 100, 단어길이(wordlength) = 12를 사용하여 수행함으로써 본 발명의 옥시도리덕타제 핵산에 대해 상동성인 뉴클레오타이드 서열을 수득할 수 있다. BLAST 단백질 조사는 BLASTx 프로그램, 점수 = 50, 단어길이 = 3을 사용하여 수행함으로써 본 발명의 단백질 분자에 대해 상동성인 아미노산을 수득할 수 있다. 비교 목적을 위한 갭화된 정렬(gapped alignment)을 수득하기 위해, 갭화된(Gapped) BLAST를 문헌: Altschul et al., (1997) Nucleic Acids Res. 25(17): 3389-3402에 기술된 바와 같이 활용할 수 있다. BLAST 및 갭화된 BLAST 프로그램을 활용하는 경우, 각각의 프로그램(예컨대, BLASTx 및 BLASTn)의 디폴트 매개변수를 사용할 수 있다. http://www.ncbi.nlm.nih.gov/에서의 생명과학 정보를 위한 국립 센터(National Center for Biotechnology Information)를 참고한다.

본원에 사용된 바와 같은, 용어 "선택적으로 하이브리드화하는", "선택적으로 하이브리드화하다" 및 유사한 용어는 서로에 대해 적어도 66%, 적어도 70%, 적어도 75%, 적어도 80%, 보다 바람직하게는 적어도 85%, 심지어 보다 바람직하게는 적어도 90%, 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 98% 또는 보다 바람직하게는 적어도 99% 상동성인 뉴클레오타이드 서열이 전형적으로 서로에 대해 하이브리드화되어 남아있는 하에서, 하이브리드화 및 세척 조건을 기술하기 위해 의도된다. 즉, 다시 말해서, 이러한 하이브리드화 서열은 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65, 적어도 70%, 적어도 75%, 적어도 80%, 보다 바람직하게는 적어도 85%, 심지어 보다 바람직하게는 적어도 90%, 보다 바람직하게는 적어도 95%, 보다 바람직하게는 적어도 98% 또는 보다 바람직하게는 적어도 99%의 서열 동일성을 공유한다.

이러한 하이브리드화 조건의 바람직한, 비-제한적 예는 약 45℃에서 6X 염화나트륨/시트르산나트륨(SSC) 속에서 하이브리드화에 이어 1X SSC, 0.1% SDS 속에서 50℃, 바람직하게는 약 55℃ 까지, 바람직하게는 약 60℃ 및 심지어 보다 바람직하게는 약 65℃에서 1회 이상의 세척이다.

고도로 엄격한 조건(highly stringent condition)은 예를 들면, 5x SSC/5x 덴하르트 용액(Denhardt's solution)/1.0% SDS 속에서 약 68℃에서 하이브리드화 및 실온에서 0.2x SSC/0.1% SDS 속에서 세척을 포함한다. 대안적으로, 세척은 42℃에서 수행될 수 있다.

숙련가는 어느 조건을 엄격한 및 고도로 엄격한 하이브리드화 조건에 적용하는지를 알 것이다. 이러한 조건에 대한 추가의 안내는 당해 분야에서, 예를 들면, 문헌: Sambrook et al., 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, N.Y.; 및 Ausubel et al. (eds.), Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3^rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York 1995, Current Protocols in Molecular Biology, (John Wiley & Sons, N.Y.)에서 용이하게 이용가능하다.

물론, 폴리 A 서열(예를 들면, mRNA의 3' 말단 폴리(A) 트랙(tract)), 또는 T(또는 U) 잔기의 상보성 스트레치(complementary stretch)에만 하이브리드화하는 폴리뉴클레오타이드는 폴리(A) 스트레치 또는 이의 보체(즉, 실질적으로 임의의 이중-가닥 cDNA 클론)을 함유하는 임의의 핵산에 하이브리드화할 수 있으므로, 이는 본 발명의 핵산의 부위에 대해 특이적으로 하이브리드화하는데 사용된 본 발명의 폴리뉴클레오타이드 내에 포함되지 않을 수 있다.

"핵산 작제물" 또는 "핵산 벡터"는 본원에서 재조합 DNA 기술의 사용으로부터 야기되는 사람이 제조한 핵산 분자를 의미하는 것으로 본원에서 이해된다. 따라서, 용어 "핵산 작제물"은, 핵산 작제물이 천연적으로 존재하는 핵산 분자(중 일부)를 포함하지 않을 수 있다고 해도, 천연적으로 존재하는 핵산 분자를 포함하지 않는다. "벡터"는 외인성 핵산 서열(즉, DNA 또는 RNA)을 숙주 세포 내로 전달하기 위해 공급되는 핵산 작제물(전형적으로 DNA 또는 RNA)이다. 벡터는 바람직하게는 자가 복제 및 숙주 세포의 게놈 내로의 통합 중 적어도 하나에 의해 숙주 내에서 유지된다. 용어 "발현 벡터" 또는 "발현 작제물"은 이러한 서열과 상용성인 숙주 세포 또는 숙주 유기체 내에서 유전자의 발현에 영향을 미칠 수 있는 뉴클레오타이드 서열을 지칭한다. 이러한 발현 벡터는 전형적으로 발현될 생성물을 암호화하는 서열의 발현에 영향을 미칠 수 있는 기능성 단위인 적어도 하나의 "발현 카세트"를 포함하고, 여기서 코딩 서열은 적합한 발현 제어 서열과 작동가능하게 연결되어 있다. 이는 적어도 적합한 전사 조절 서열 및 임의로, 3' 전사 종결 신호를 포함한다. 발현에 영향을 미치는데 필수적이거나 도움이 되는 추가의 인자, 예를 들면, 발현 인핸서 성분이 또한 존재할 수 있다. 발현 벡터는 적합한 숙주 세포 내로 도입될 것이고 숙주 세포의 시험관 내 세포 배양물 속에서 암호화 서열의 발현에 영향을 미칠 수 있다. 바람직한 발현 벡터는 바이러서 단백질 및/또는 핵산, 특히 재조합 AAV 단백질 및/또는 핵산의 발현에 적합할 것이다.

본원에 사용된 바와 같은, 용어 "프로모터" 또는 "전사 조절 서열"은 하나 이상의 암호화 서열의 전사를 제어하는 기능을 하는 핵산을 지칭하고, 코딩 서열의 전사 개시 부위의 전사 방향과 관련하여 상부에 위치하고, 및 DNA-의존성 RNA 폴리머라제, 전사 개시 부위 및 임의의 다른 DNA 서열, 예를 들면, 그러나 이에 한정되지 않는 전사 인자 억제 부위, 리프레서(repressor) 및 활성인자 단백질 결합 부위, 및 당해 분야의 숙련가에게 프로모터로부터 전사의 양을 직접 또는 간접적으로 조절하기 위해 작용하는 것으로 알려진 뉴클레오타이드의 임의의 다른 서열의 존재에 의해 구조적으로 확인된다. "구성적" 프로모터는 가장 생리학적 및 발달 조건 하에서 대부분의 조직 속에서 활성인 프로모터이다. "유도성" 프로모터는 예컨대, 화학 유도인자 또는 생물학적 실체의 적용에 의해 생리학적으로 또는 발달적으로 조절되는 프로모터이다.

용어 "리포터(reporter)"는 주로 가시성 마커(visible marker), 예를 들면, 녹색 형광 단백질(GFP) 또는 루시퍼라제를 지칭하기 위해 주로 사용되지만, 마커와 상호교환적으로 사용될 수 있다.

용어 "단백질" 또는 "폴리펩타이드"는 상호교환적으로 사용되며 구체적인 작용 방식, 크기, 3-차원 구조 또는 기원을 참고하지 않고, 아미노산 쇄로 이루어진 분자를 지칭한다.

용어 "유전자"는 적합한 조절 영역(예컨대, 프로모터)에 작동 가능하게 연결된, 세포 내 RNA 분자(예컨대, mRNA) 내로 전사되는, 영역(전사된 영역)을 포함하는 DNA 단편을 의미한다. 유전자는 일반적으로 수개의 작동 가능하게 연결된 단편, 예를 들면, 프로모터, 5' 리더 서열, 암호화 서열 및 폴리아데닐화 부위를 포함하는 3'-해독되지 않은 서열(3'-말단)을 포함할 것이다. "유전자의 발현"은 적절한 조절 영역, 특히 프로모터에 작동 가능하게 연결된 DNA 영역이 RNA 내로 전사되고, 이는 생물학적으로 활성인, 즉, 생물학적으로 활성인 단백질 또는 펩타이드로 해독될 수 있는 공정을 지칭한다.

용어 "상동성"은 주어진(재조합) 핵산 또는 폴리펩타이드 분자와 주어진 숙주 유기체 또는 숙주 세포 사이에서의 관계를 나타내는데 사용되는 경우, 천연에서 핵산 또는 폴리펩타이드 분자가 동일한 종, 바람직하게는 동일한 다양성 또는 균주의 숙주 세포 또는 유기체에 의해 생산되는 것을 의미하는 것으로 이해된다. 숙주 세포에 대해 상동성인 경우, 폴리펩타이드를 암호화하는 핵산 서열은 전형적으로(그러나 필수적이지 않게) 다른 (이종) 프로모터 서열 및, 적용가능한 경우, 이의 천연 환경에서보다 다른 (이종) 분비 신호 서열 및/또는 터미네이터 서열(terminator sequence)에 작동 가능하게 연결될 것이다. 이러한 문맥에서, "상동성" 서열 성분 만의 사용은 "자가-클로닝된(self-cloned)" 유전적으로 변형된 유기체(GMO's)(자가-클로닝은 본원에서 유럽 지침 98/81/EC 부록 II(European Directive 98/81/EC Annex II)에서와 같이 정의된다)의 작제를 허용한다. 2개의 핵산 서열의 관계를 나타내기 위해 사용된 경우 용어 "상동성"은 하나의 단일 가닥 핵산 서열이 상보성 단일 가닥 핵산 서열에 하이브리드화될 수 있음을 의미한다. 하이브리드화 정도는 서열과 하이브리드화 조건, 예를 들면, 이후 논의되는 바와 같은 온도 및 염 농도 사이의 동일성의 양을 포함하는 다수의 인자의 의존할 수 있다.

용어 "이종" 및 "외인성"은 핵산(DNA 또는 RNA) 또는 단백질과 관련하여 사용되는 경우 이것이 존재하는 유기체, 세포, 게놈 또는 DNA 또는 RNA 서열의 부분으로서 천연적으로 발생하지 않거나, 이것이 천연에서 발견된 것과는 상이한 세포 또는 게놈 또는 DNA 또는 RNA 서열 내 위치 또는 위치들에서 발견된 핵산 또는 단백질을 지칭한다. 이종 및 외인성 핵산 또는 단백질은 이들이 도입되지만 다른 세포로부터 수득되거나 합성적으로 또는 재조합적으로 생산된 세포에 대해 내인성이 아니다. 일반적으로, 필수적이지는 않지만, 이러한 핵산은 DNA가 전사 또는 발현되는 세포에 의해 일반적으로 생산되지 않는 단백질, 즉, 외인성 단백질을 암호화한다. 이종/외인성 핵산 및 단백질은 또한 외부(foreign) 핵산 또는 단백질로서 지칭될 수 있다. 당해 분야의 숙련가가 이것이 발현된 세포에 대해 외부인 것으로 인식할 수 있는 임의의 핵산 또는 단백질은 본원에서 용어 이종 또는 외인성 핵산 또는 단백질에 의해 포함된다. 용어 이종 및 외인성은 또한 핵산 또는 아미노산 서열의 비-천연 조합, 즉, 조합된 서열 중 적어도 2개가 서로에 대해 외부인 조합에 적용된다.

본원에 사용된 바와 같은, 용어 "비-천연적으로 발생하는"은 유기체에 대해 참고하여 사용된 경우 유기체가 참고된 종의 천연적으로 발생하는 균주, 예를 들면, 지칭된 종의 야생형 균주에서 일반적으로 발견되지 않는 적어도 하나의 유전적 대체를 가지는 것을 의미한다. 유전적 변경은 예를 들면, 단백질 또는 효소를 암호화하는 발현가능한 핵산, 다른 핵산 첨가, 핵산 결실, 핵산 치환, 또는 유기체의 유전 물질의 다른 기능적 파괴를 도입하는 변형을 포함한다. 이러한 변형은, 예를 들면, 참고된 종에 대한 이종 또는 동종 폴리펩타이드에 대한 코딩 영역 및 이의 기능적 단편을 포함한다. 추가의 변형은 예를 들면, 변형이 유전자 또는 오페론의 발현을 변경시키는 비-코딩 조절 영역을 포함한다. 효소 또는 이의 기능성 단편을 암호화하는 핵산 분자에 대한 유전적 변형은 이의 천연적으로 발생하는 상태로부터 변경된 비-천연적으로 발생하는 유기체에게 생화학적 반응 능력 또는 물질대사 경로 능력을 부여할 수 있다.

본원에 사용된 바와 같은, 용어 "작동 가능하게 연결된"은 기능적 관계인 폴리뉴클레오타이드(또는 폴리펩타이드) 성분의 연결을 지칭한다. 핵산은 이것이 다른 핵산 서열과 기능적 관계로 위치하는 경우 "작동 가능하게 연결"된다. 예를 들면, 전사 조절 서열은 이것이 코딩 서열의 전사에 영향을 미치는 경우 코딩 서열에 작동 가능하게 연결된다. 작동 가능하게 연결된은, 연결되는 DNA 서열이 전형적으로 연속적이며, 필수적으로 2개의 단백질 암호화 영역을 결합시키는 경우 연속적이고 개방 프레임(reading frame) 내에 존재한다.

발현 제어 서열은 발현 제어 서열이 뉴클레오타이드 서열의 전사 및또는 해독을 제어하고 조절하는 경우 뉴클레오타이드 서열에 "작동 가능하게 연결"된다. 따라서, 발현 제어 서열은 프로모터, 인핸서, 내부 리보솜 도입 부위(internal ribosome entry site; IRES), 전사 터미네이터(transcription terminator), 단백질-암호화 유전자 앞의 출발 코돈, 인트론에 대한 스플라이싱 신호, 및 정지 코돈을 포함할 수 있다.

용어 "발현 제어 서열"은 최소로, 이의 존재가 발현에 영향을 미치는 것으로 지정된 서열을 포함하는 것으로 의도되며, 또한 추가의 유리한 구성성분을 포함할 수 있다. 예를 들면, 리더 서열 및 융합 파트너 서열은 발현 제어 서열이다. 이러한 용어는 또한 핵산 서열의 설계를 포함함으로써, 프레임 내부 및 외부의 바람직하지 않은, 잠재적인 개시 코돈이 서열로부터 제거되도록 한다. 이는 또한 핵산 서열의 설계를 포함함으로써 바람직하지 않은 잠재적인 스플라이스 부위가 제거되도록 한다. 이는 폴리A 테일의 추가를 지시하는 서열 또는 폴리아데닐화 서열(pA), 즉, 폴리A 서열로서 지칭된 서열인, mRNA의 3'-말단에서 아데닌 잔기의 스트링을 포함한다. 이는 또한 mRNA 안정성을 향상시키기 위해 설계될 수 있다. 전사 및 해독 안정성에 영향을 미치는 발현 제어 서열, 예컨대, 프로모터 뿐만 아니라 해독에 영향을 미치는 서열, 예컨대, 코작 서열(Kozak sequence)도 곤충 세포 내에서 알려져 있다. 발현 제어 서열은 이것이 작동 가능하게 연결됨으로써 보다 적은 발현 수준 또는 보다 높은 발현 수준이 달성되도록 하는 뉴클레오타이드 서열을 조절하는 특성을 가질 수 있다.

발명의 상세한 설명

본 발명자는 재조합 파르보바이러스 벡터의 생산을 위한 개선된 패키징 곤충 세포주 및 벡터 시스템을 개발하기 위해 설정되었다. 특히, 본 발명자는 유도된 조건 하에서 강력한 발현을 유지하면서 유도되지 않은 조건 하에서 리키 발현(leaky expression)을 감소시키기 위한 수단을 제공함으로써 곤충 세포주 내에서 안정하게 통합된 Rep 유전자의 유도성 발현의 개선된 제어를 갖는다. 이러한 곤충 세포는 또한 iRep 세포, 또는 단순히 iRep로 지칭된다. 또한 본 발명자는 다양한 바르보바이러스, 예컨대, AAV, 구조적 또는 비-구조적 단백질 중에서 발현 역학 및 비(ratio)를 최적화시킴으로써, 특히 바큘로바이러스 및 곤충 세포 플랫폼을 사용한 생산 플랫폼으로부터 벡터 산출량의 풍부성, 수율 및 품질을 추가로 개선시켰다.

벡터 품질은 전체 비리온(full virion)대 빈 비리온(empty virion) 사이의 비와 강력하게 관련되어 있으며, 이는 벡터 자체의 효능에 기여한다. 용어 "전체 비리온"은 역위된 말단 반복체(ITR) 서열에 의해 플랭킹되는 전이유전자 DNA를 캡슐화하는 파르보바이러스 구조적 캡시드 단백질(VP1, VP2 및 VP3)를 포함하는 비리온 입자를 지칭한다. 용어 "빈 비리온"은 파르보바이러스 게놈 물질을 포함하지 않는 비리온 입자를 지칭한다. 본 발명의 바람직한 구현예에서, 전체 비리온 대 빈 비리온의 비는 적어도 1:50, 보다 바람직하게는 적어도 1:10, 또는 적어도 1:5, 또는 적어도 1:2 및 심지어 보다 바람직하게는 적어도 1:1이다. 심지어 보다 바람직하게는, 빈 비리온은 검출될 수 없고, 가장 바람직하게는 빈 비리온은 존재하지 않는다. 비리온 당 하나 만의 게놈 카피가 존재할 것이므로, 당해 분야의 숙련가는 예를 들면, 유전자 카피 수를 조립된 AAV 캡시드 수를 지닌 전체 입자로 나눔으로써, 전체 비리온 대 빈 비리온 비(또는 전체의 조립된 캡시드:게놈 카피 수)를 측정하는 방법을 알 것이다. 당해 분야의 숙련가는 이러한 비를 측정하는 방법을 알 것이다. 예를 들면, 빈 비리온 대 전체 캡시드의 비는 게놈 종의 양(즉, 게놈 카피 수)를 전체 파르보바이러스 입자의 양(즉, 파르보바이러스 입자의 수)로 나눔으로써 측정할 수 있고, 여기서 ml 당 게놈 카피의 양은 정량적 PCR에 의해 측정되며 ml 당 전체 파르보바이러스 입자의 양은 예컨대, Progen으로부터의 효소 면역검정(enzyme immunoassay)으로 측정된다.

곤충 세포

일 양태에서, 세포의 게놈 내로: i) 이의 해독이 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 만을 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제1의 프로모터; ii) 세포 내에서 이의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나 만을 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제2의 프로모터; 및 iii) 제1 및 제2의 프로모터에 작동 가능하게 연결된 적어도 하나의 인핸서 성분을 통합시킨 곤충 세포가 제공되며, 여기서 적어도 하나의 인핸서 성분은 전사 트랜스레귤레이터에 의존적이고, 여기서 바람직하게는 전사 트랜스레귤레이터의 세포 내로의 도입은 제1 및 제2의 프로모터로부터의 전사를 유도한다.

곤충 세포는 이종 단백질의 생산에 적합한 임의의 세포일 수 있다. 바람직하게는 곤충 세포는 바큘로바이러스 벡터의 복제를 허용하며 배양물 속에서 유지될 수 있다. 보다 바람직하게는 곤충 세포는 또한 재조합 파르보바이러스 벡터, 예를 들면, rAAV 벡터의 복제를 허용한다. 예를 들면, 사용된 세포주는 스포도프테라 프루기페르다(Spodoptera frugiperda), 드로소필라(Drosophila) 세포주, 또는 모기 세포 주, 예컨대, 아에데스 알보픽투스(Aedes albopictus) 유래된 세포주로부터 유래될 수 있다. 바람직한 곤충 세포 또는 세포주는 바큘로바이러스 감염에 민감한 곤충 종으로부터의 세포, 예를 들면, 예컨대, S2(CRL-1963, ATCC), Se301, SeIZD2109, SeUCR1, Sf9, Sf900+, Sf21, BTI-TN-5B1-4, MG-1, Tn368, HzAm1, Ha2302, Hz2E5, 하이 파이브(High Five)(Invitrogen, 미국 캘리포니아주 소재) 및 expresSF+^®(US 6,103,526; Protein Sciences Corp., 미국 코넷티컷주 소재)로부터 유래된 세포이다.

당해 분야의 통상의 숙련가는 뉴클레오타이드 서열을 곤충 게놈 내로 안정하게 도입시키는 방법 및 이러한 뉴클레오타이드 서열을 게놈 내에서 갖는 세포를 확인하는 방법을 알고 있다. 게놈 내로의 도입은 예를 들면, 곤충 게놈의 영역에 대해 고도로 상동성인 뉴클레오타이드 서열을 포함하는 벡터의 사용에 의해 보조될 수 있다. 특정 서열, 예를 들면, 트랜스포손(transposon)의 사용은 뉴클레오타이드 서열을 게놈 내로 도입시키는 다른 방법이다. 게놈 내로의 혼입은 하나 또는 하나 이상의 단계를 통할 수 있다. 용어 "통합된"에 대한 참고는 당해 분야의 숙련가에게 또한 "안정하게 통합된"을 의미하는 것으로 알려질 것이다.

배양물 속에서 곤충 세포에 대한 성장 조건, 및 배양물 속의 곤충 세포 내에서 이종 생성물의 생산은 당해 분야에 잘 공지되어 있고, 예컨대, 곤충 세포의 분자 가공에 있어서 상기 인용된 참고 문헌(또한 제WO2007/046703호)에 기술되어 있다.

"곤충 세포-상용성 벡터" 또는 "벡터"는 곤충 또는 곤충 세포를 생산적 형질전환 또는 형질감염시킬 수 있는 분자인 것으로 이해된다. 예시적인 생물학적 벡터는 플라스미드, 선형 핵산 분자, 및 재조합 바이러스를 포함한다. 곤충 세포-양립성인 한, 어떠한 벡터도 사용할 수 있다. 벡터는 곤충 세포 게놈 내로 통합될 수 있지만, 곤충 세포 내에서 벡터의 존재는 영구적일 필요가 없으며 일시적인 에피솜 벡터가 또한 포함된다. 벡터는 예를 들면, 세포의 화학적 처리, 전기천공, 또는 감염에 의해 알려진 임의의 수단으로 도입될 수 있다. 바람직한 구현예에서, 벡터는 바큘로바이러스, 바이러스 벡터, 또는 플라스미드이다. 보다 바람직한 구현예에서, 벡터는 바큘로바이러스인데, 즉, 핵산 작제물은 바큘로바이러스-발현 벡터이다. 바큘로바이러스-발현 벡터 및 이의 사용 방법은 예를 들면, 문헌: Summers and Smith, 1986, "A Manual of Methods for Vaculovirus Vectors and Insect Culture Procedures", Texas Agricultural Experimental Station Bull. No. 7555, College Station, Tex.; Luckow, 1991, In Prokop et al., "Cloning and Expression of Heterologous Genes in Insect Cells with Vaculovirus Vectors' Recombinant DNA Technology 및 Applications", 97-152; King and Possee, 1992, "The Vaculovirus expression system", Chapman and Hall, United Kingdom; O'Reilly, Miller, and Luckow, 1992, "Vaculovirus Expression Vectors: A Laboratory Manual", New York; Freeman and Richardson, 1995, "Vaculovirus Expression Protocols", Methods in Molecular Biology, volume 39; US 4,745,051; US2003148506; 및 WO 03/074714에 기술되어 있다.

재조합 파르보바이러스(rAAV) 벡터의 생산을 위해 곤충 세포 내에서 사용된 핵산 작제물의 수는 본 발명에서 제한되지 않는다. 예를 들면, 1, 2, 3개 이상의 별개의 작제물을 사용하여 본 발명의 방법에 따라 곤충 세포 내에서 rAAV를 생산할 수 있다. 2개의 작제물을 사용한 경우, 하나의 작제물은 적어도 하나의 파르보바이러스 ITR 서열에 의해 플랭킹되는 전이유전자를 포함하는 뉴클레오타이드 서열을 포함할 수 있고 이후 다른 작제물은 Rep 및 Cap 단백질 각각에 대한 발현 카세트를 포함할 수 있다. 3개의 작제물을 사용하는 경우, 하나의 작제물은 적어도 하나의 파르보바이러스 ITR 서열에 의해 플랭킹되는 전이유전자를 포함하는 뉴클레오타이드 서열을 포함할 수 있고, 다른 작제물은 Cap 단백질에 대한 발현 카세트를 포함할 수 있고 여전히 다른 작제물은 Rep 단백질에 대한 하나 이상의 발현 카세트, 에컨대, 하나는 임의로 코돈 최적화, AT-최적화 또는 GC-최적화된, Rep 78 및 52 단백질 각각에 대한 것인 하나 이상의 발현 카세트를 포함함으로써, 본원에서 이후 기술된 바와 같은 재조합을 최소화하거나 방지할 수 있다. 본원에 의해, 핵산 작제물 중 적어도 일부, 바람직하게는 Rep 단백질에 대한 하나 이상의 발현 카세트를 포함하는 것은 곤충 세포의 게놈 내로 안정하게 통합될 수 있음이 이해된다.

본 발명의 발명자는 유도성 곤충 세포 발현 벡터의 설계(예컨대, Rep 단백질의 발현을 위한, 예를 들면, iRep)를 2개 방식으로 추가로 최적화하였다. 우선, AAV 유전자 발현을 조절하는데 있어서 대안의 바큘로바이러스 프로모터의 사용을 시험하였다. 지금까지, 폴리헤드론 프로모터(polH)가 AAV 생산에서, BEV 설정에서 가장 집중적으로 연구되었다(van Oers, M. M., et al., 2015). 대안적인 레이트 프로모터(late promoter), 예를 들면 p10이 polH를 지닌 숙주 인자를 공유하는 것으로 보고되었지만(Ghosh, S., et al., 1998), 다른 바큘로바이러스 프로모터가 상이한 유도 강도 및 일시적인 프로파일을 나타내는 것으로 보고되었다(Dong, Z. Q. et al., 2018; Lin, C. H & Jarvis, D. L., 2013; Martinez-Solis, M., et al., 2016). 그럼에도 불구하고, 곤충 세포 내에서 AAV 생산을 위한 잠재적인 사용은 지금까지 보고되지 않았다. 둘째로, 유도성 발현에서 보다 엄격한 조절이 본 연구에서 탐구되고 있다. 이는, Rep 단백질이 숙주 세포에 대해 독성일 수 있어서 발현의 제어가 요구되므로, 예컨대, AAV Rep의 유도성 발현을 위해 바람직할 수 있다. polH와 함께 바큘로바이러스 상동성 영역(hr) 2 또는 hr2.09 인핸서 서열의 사용은 유도성 OneBac 플랫폼을 위한 디폴트 분자 설계가 되었다(Aslanidi, G., et al. 상기 참고). 여기서, 본 발명자는 다른 바큘로바이러스 hr 인핸서 서열과 함께 대안의 바큘로바이러스 프로모터의 잠재적인 용도를 시험하였다. 또한 상이한 분자 구조에서, 상이한 바큘로바이러스 프로모터 및 인핸서를 연구함으로써, 본 발명자는 AAV 유전자(Cap, Rep)의 발현을 최적화시켜 고 역가를 지닌 고 품질의 AAV 배치를 수득하는 안정하고 풍부한 AAV 생산 플랫폼을 수득하였다.

이러한 접근법은, 유사하거나 명백한 발현 강도 및 야생형(wt)의 단일- 또는 분할-카세트 AAV Rep, 또는 다른 AAV 유전자 발현을 조절하는 유도성 발현 작제물을 유리하게 생성하는 일시적인 프로파일을 사용하여, 대안적이고 비-보존적인 바큘로바이러스 프로모터(p10, 39k, p6.9, pSel120)의 채택을 포함한다. 이는 이후에 재조합 바큘로바이러스 트랜스활성화시 시스:트랜스 프로모터 경쟁하는 경향이 없는 유도성 플라스미드 벡터 작제물의 생산을 가능하도록 할 것이다. 또한, 이는 거의 리키(leaky)하지 않는/리키하지 않는 바큘로바이러스 hr 인핸서를 사용하여 유도성 플라스미드 벡터 작제물의 보다 엄격한 조절을 가능하도록 할 것이다.

본 발명의 추가의 이점은 OneBac 및 곤충 세포 플랫폼보다 개선된 AAV 생산 수율 및 품질; 유도되지 않는 경우 실제로 사일런트(silent)함으로써, 스위치 "오프"된 경우, 보다 생존성이고 안정한 AAV 패키징 세포를 허용하는, 독성 AAV 유전자의 발현을 피하도록 하는 유도성 프로모터의 제공; 및 유도성 플라스미드 벡터 내로 분할-카세트 Rep AAV 설계의 채택을 포함한다.

프로모터

본원에 사용된 바와 같은, 용어 "프로모터" 또는 "전사 조절 서열"은 하나 이상의 암호화 서열의 전사를 제어하도록 작용하고, 암호화 서열의 전사 개시 부위의 방향과 관련하여 상부에 위치하며, DNA-의존성 RNA 폴리머라제에 대한 결합 부위, 전사 개시 부위 및 다른 DNA 서열, 예를 들면, 그러나 이에 한정되지 않는 전사 인자 결합 부위, 리프레서 및 활성인자 단백질 결합 부위, 및 당해 분야의 기술자에게 프로모터로부터 전사의 양을 조절하기 위해 직접 또는 간접적으로 작용하는 것으로 알려진 뉴클레오타이드의 임의의 다른 서열에 의해 구조적으로 확인된 핵산 단편을 지칭한다. "구성적" 프로모터는 가장 생리학적 및 발달 조건 하에서 대부분의 조직 속에서 활성인 프로모터이다. "유도성" 프로모터는 예컨대, 화학적 인핸서의 적용에 의해 생리적으로 또는 발달적으로 조절되는 프로모터이다. "조직 특이적인" 프로모터는 특정 유형의 조직 또는 세포에서만 활성이다. "크립틱 프로모터(cryptic promoter)"는 활성화될 수 있는 후성적으로 사일런스된 프로모터(epigenetically silenced promoter)이다.

바람직한 구현예에서, Rep78 대 Rep52 단백질의 발현 비는: (a) 예컨대, 리포터 유전자 발현(예컨대, 루시퍼라제 또는 SEAP), 또는 노던 블롯(northern blot) 또는 웨스턴 블롯(western blot)에 의해 측정된 것으로서, 제1의 프로모터보다 더 강력한 제2의 프로모터; (b) 제1의 발현 카세트와 비교하여 제2의 발현 카세트의 상부에서 뉴클레오타이드 스페이서 이상 및/또는 보다 강력한 인핸서 성분의 존재; (c) Rep 78 단백질을 암호화하는 뉴클레오타이드 서열과 비교하여 보다 더 높은 코돈 채택 지수(codon adaptation index)를 갖는 파르보바이러스 Rep52 단백질을 코딩하는 뉴클레오타이드 서열; (d) 파르보바이러스 Rep 단백질의 온도 최적화; 및 (e) 상응하는 야생형 Rep 단백질과 비교하여 아미노산 서열내 하나 이상의 변경을 지닌 변이체 Rep 단백질 여기서 하나 이상의 아미노산 변경은 곤충 세포 내에서 증가된 AAV 생산을 검출함으로써 평가된 것으로서 Rep 기능의 활성에서의 증가를 야기한다. 곤충 세포 내에서 증가된 AAV 생산을 검출함으로써 평가된 것으로서 Rep 기능의 증가된 활성을 지닌 변이체 Rep 단백질의 생성, 선택 및/또는 스크리닝 방법은 포유동물 세포 내에서 AAV 생산과 관련하여 증가된 기능을 지닌 변이체 Rep 단백질을 수득하기 위해 제US20030134351호에 기술된 방법의 곤충 세포에 대해 적응시켜 수득될 수 있다. 상응하는 야생형 Rep 단백질과 비교하여 아미노산 서열 내 하나 이상의 변경을 지닌 변이체 Rep 단백질은 본원에서 상응하는 야생형 Rep 단백질의 아미노산 서열과 비교하여 변이체 아미노산 서열 내 하나 이상의 아미노산 치환, 삽입 및/또는 결실을 지닌 Rep 단백질을 포함하는 것으로 이해된다.

제1의 프로모터보다 더 강력한 제2의 프로모터는 Rep52 단백질을 코딩하는 추가의 Mrna 분자가 Rep78 단백질을 코딩하는 mRNA 분자보다 더 발현됨을 의미한다. Rep52 단백질의 발현은 이후 Rep78 단백질의 발현과 비교하여 증가될 것이므로, 동일하게 강력한 프로모터를 사용할 수 있다. 프로모터의 강도는 본 발명의 방법에서 사용된 조건 하에서 수득된 발현에 의해 측정될 수 있다.

일 구현예에서, 제1 및 제2의 프로모터는 바큘로바이러스 프로모터이다. 일 구현예에서, 제1 및 제2의 프로모터는 별개이다. 일 구현예에서, 제1의 프로모터는 지연된 얼리 바큘로바이러스 프로모터, 예를 들면, 39k 프로모터이다. 일 구현예에서, 제2의 프로모터는 레이트 또는 베리 레이트 바큘로바이러스 프로모터, 예를 들면, polH, p10, p6.9 및 pSel120 프로모터이다. 결과적으로, 일 구현예에서, 제1의 프로모터는 지연된 얼리 바큘로바이러스 프로모터이고 제2의 프로모터는 레이트 또는 베리 레이트 바큘로바이러스 프로모터이다. 따라서, 일 구현예에서, 제1의 프로모터는 39k 프로모터이고 제2의 프로모터는 p10, p6.9 및 pSel120 프로모터로 이루어진 그룹으로부터 선택된다.

일 구현예에서, 제1 및 제2의 프로모터는 반대의 전사 방향으로 세포 게놈 내에 통합된다.

후술된 바와 같이, 완전한 파르보바이러스 유전자 치료요법 벡터 비리온의 생산을 위해, 세포는 바람직하게는 곤충 세포 내에서 발현을 위한 제3의 프로모터에 작동 가능하게 연결된 서열을 코딩하는 파르보바이러스 캡시드 단백질을 포함하는 뉴클레오타이드 서열을 포함하는 발현 카세트를 추가로 포함한다. 일 구현예에서, 제1, 제2 및 제3의 프로모터는 바큘로바이러스 프로모터이다. 일 구현예에서, 제1 및 제2 및 제3의 프로모터는 별개이다. 일 구현예에서, 제1의 프로모터는 지연된 얼리 바큘로바이러스 프로모터, 예를 들면, 39k 프로모터이다. 일 구현예에서, 제2의 프로모터는 레이트 또는 베리 얼리 바큘로바이러스 프로모터, 예를 들면, polH, p10, p6.9 및 pSel120 프로모터이다. 결과적으로, 일 구현예에서, 제1의 프로모터는 지연된 얼리 바큘로바이러스 프로모터이고 제2의 프로모터는 레이트 또는 베리 레이트 바큘로바이러스 프로모터이다. 따라서, 일 구현예에서, 제1의 프로모터는 39k 프로모터이고 제2의 프로모터는 polH, p10, p6.9 및 pSel120 프로모터로 이루어진 그룹으로부터 선택된다. 일 구현예에서, 제1의 프로모터는 제3의 프로모터 앞에서 활성이다.

인핸서

"인핸서 성분" 또는 "인핸서"는 프로모터와는 반대로, 프로모터 활성을 지니지 않고, 일반적으로 프로모터와 관련하여 이의 위치와 관계없이(즉, 프로모터의 상부 또는 하부에서) 일반적으로 작용할 수 있는 프로모터의 활성을 향상시키는(즉, 프로모터의 하부의 서열의 전사율을 증가시키는) 서열을 정의함을 의미한다. 인핸서 성분은 당해 분야에 잘 알려져 이다. 본 발명에 사용될 수 있는 인핸서 성분(또는 이의 부분)의 비-제한적 예는 곤충 세포 내에서 발견된 바큘로바이러스 인핸서 및 인핸서 성분을 포함한다. 인핸서 성분이 이것이 작동 가능하게 연결된 프로모터에 대해 유전자의 mRNA 발현을 인핸서 성분의 부재하에서 유전자의 mRNA 발현과 비교하여 적어도 25%, 보다 바람직하게는 적어도 50%, 심지어 보다 바람직하게는 적어도 100%, 및 가장 바람직하게는 적어도 200%까지 증가시키는 것이 바람직하다. mRNA 발현은 예를 들면, 정량적 RT-PCR에 의해 측정될 수 있다.

여기서 파르보바이러스 Rep 단백질의 발현을 향상시키는 인핸서 성분을 사용하는 것이 바람직하다. 바람직한 구현예에서, 세포 내에서 이의 해독이 파르보바이러스 Rep 단백질을 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 본원에 정의된 바와 같은 (제1 및/또는 제2의) 프로모터에 작동 가능하게 연결된 적어도 하나의 인핸서 성분은 전사 트랜스레귤레이터에 의존적인 인핸서 성분이다. 전사 트랜스레귤레이터-의존성 인핸서 성분은 본원에서 트랜스로 제공된 전사 트랜스레귤레이터 단백질에 의해 결합된 경우 이에 작동 가능하게 연결된 프로모터의 전사를 활성화시키는 인핸서 성분으로서 이해된다.

따라서, 추가의 바람직한 구현예에서, 전사 트랜스레귤레이터-의존성 인핸서 성분은 적어도 하나의 바큘로바이러스 인핸서 성분 및/또는 적어도 하나의 엑다이손 반응성 성분(ecdysone responsive element)을 포함한다. 바람직하게는 전사 트랜스레귤레이터는 바큘로바이러스 이미디어트-얼리 단백질(IE1) 또는 이의 스플라이스 변이체(IE0)이고 전사 트랜스레귤레이터-의존성 인핸서 성분은 바큘로바이러스 상동성 영역(hr) 인핸서 성분이고, 여기서 바람직하게는 바큘로바이러스는 오토그라파 캘리포니카(Autographa californica) 다중캡시드 뉴클레오폴리헤드론바이러스이다. IE1은 바큘로바이러스 얼리 유전자 프로모터를 트랜스활성화시키고 플라스미드 형질감염 검정에서 레이트 유전자 발현을 뒷받침하는 고도로 보존된, 67-kDa DNA 결합 단백질이다(참고: 예컨대, Olson et al., 2002, J Virol., 76:9505-9515). AcMNPV IE1은 프로모터 트랜스활성화 및 DNA 결합에 기여하는 분리가능한 도메인을 지닌다. 이러한 582개-잔기의 인단백질의 N-말단 1/2은 잔기 8 내지 118번 및 168 내지 222번으로부터의 전사 조절 도메인을 함유한다. IE1은 AcMNPV 게놈 전체에 분산된 것으로 밝혀진 다중 상동성 영역(hrs) 내 반복된 서열을 구성하는 28-bp 불완전한 팔린드롬(palindrome)(28-mer)에 결합한다. hr 28-mer는 IE1-매개된 인핸서 및 오리진(origin)-특이적인 복제 기능에 요구되는 최소의 서열 모티프이다.

일 구현예에서, hr 인핸서 성분은 hr2-0.9 이외의 hr 인핸서 성분이다(US 2012/100606 A1). 추가의 구현예에서, hr 인핸서 성분은 hr1, hr3, hr4b 및 hr5로 이루어진 그룹으로부터 선택되고, 이중에서 hr4b 및 hr5가 바람직하고, 이중에서hr4b가 가장 바람직하다. 대안의 구현예에서, hr 인핸서 성분은 변이체 hr 인핸서 성분, 예를 들면, 비-천연적으로 발생하는 설계된 성분이다. 변이체 hr 인핸서 성분은 바람직하게는 hr 28-mer 서열 CTTTACGAGTAGAATTCTACGCGTAAAA(서열 번호: 32)의 적어도 하나의 카피 및/또는 적어도 18, 20, 21, 22, 23, 24, 25, 26, 또는 27개의 뉴클레오타이드의 서열이 서열 CTTTACGAGTAGAATTCTACGCGTAAAA(서열 번호: 32)와 동일하고 바람직하게는 바큘로바이러스 IE1 단백질, 보다 바람직하게는 AcMNPV IE1 단백질에 결합한 이의 서열의 적어도 하나의 카피를 포함한다. 변이체 hr 인핸서 성분은 또한 바람직하게는 변이체 성분이 polH 프로모터에 작동 가능하게 연결된 리포터 유전자를 포함하는 발현 카세트에 작동 가능하게 연결된 경우, a) 비-유도 조건 하에서, 변이체 성분을 지닌 카세트가 변이체 성분 대신에 hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트보다 적은 리포터 전사체를 생산하거나, 변이체 성분을 지닌 카세트가 변이체 성분 대신에 hr4b 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체의 양의 1.1, 1.2, 1.5, 2, 5 또는 10배 미만으로 생산하고; b) 유도 조건 하에서, 변이체 성분을 지닌 카세트가 변이체 성분 대신에 hr4b 또는 the hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체의 양의 적어도 50, 60, 70, 80, 90 또는 100%를 생산한다는 점에서 기능적으로 정의된다. 비-유도 조건은 IE1 단백질이, 카세트가 시험되는 세포 내에 존재하지 않는 조건으로서 이해되며, 유도 조건은 충분한 IE1 단백질이 존재하여 hr4b 또는 the hr2-0.9 성분을 포함하는 참고 카세트를 지닌 최대의 리포터 발현을 수득하는 조건인 것으로 이해된다. 바큘로바이러스 IE1 단백질에 대한 변이체 hr 인핸서 성분의 결합은 예컨대, 문헌: Rodems and Friesen (J Virol. 1995; 69(9):5368-75)에 기술된 바와 같은 이동성 쉬프트 검정(mobility shift assay)을 사용하여 검정할 수 있다.

일 구현예에서, 적어도 하나의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재한다. 결과적으로, 일 구현예에서, 제1 및 제2의 프로모터는 전사의 반대 방향으로 세포 게놈내에 통합되며 적어도 하나의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재한다. 추가의 구현예에서, 2개의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재한다. 유도를 위해 Bac polH Cap Trans를 사용하는 경우, 비교적 보다 약한 트랜스활성화 프로파일이 i) 사용된 2개의 polH 프로모터 사이의 시스:트랜스 프로모터 경쟁(Bac polH Cap Trans 내에서 Cap에 대해 및 발현 플라스미드 내에서 Rep에 대해) 및 ii) 리키하지 않지만 hr4b과 같은 비교적 더 약한 hr의 채택으로 인하여 관찰된다. 일 구현예에서, 이러한 비-리키 발현 플랫폼의 사용, 예를 들면, hr4b와 같은 비교적 보다 약한 hr의 사용이 존재한다. 추가의 구현예에서, Bac polH Cap Trans의 사용과의 양립성이 존재한다. 여전히 추가의 구현예에서, hr4b 인핸서는 p10 프로모터와 조합된다. 이러한 조합은 강력한 야생형 ATG 출발 코돈을 지닌 단일-카세트 AAV2 Rep를 조절하도록 제조될 수 있다.

레플리카제(Rep) 단백질

파르바이러스, 특히 AAV, 레플리카제는 rep 유전자에 의해 암호화된 비-구조 단백질이다. 야생형 파르바이러스에서 rep 유전자는 내부 P19 프로모터로 인하여, 상이한 길이의 2개의 오버랩핑된 전령 리보핵산(mRNA)를 생산한다. 이러한 mRNA 각각은 스플라이싱되거나 되지 않음으로써 궁극적으로 4개의 Rep 단백질, Rep78, Rep68, Rep52 및 Rep40을 생성하거나 생성하지 않을 수 있다. Rep78/68 및 Rep52/40은 ITR-의존성 AAV 게놈 또는 전이유전자 복제 및 바이러스 입자 조립에 중요하다. Rep78/68은 바이러스 복제 개시인자 단백질로서 공급되며 바이러스 게놈에 대한 레플리카제로서 작용한다(Chejanovsky and Carter,　J Virol.,　1990, 64:1764-1770;　Hong et al.,　Proc Natl Acad Sci USA,　1992, 89:4673-4677; Ni., et al.,　J Virol.,　1994, 68:1128-1138). Rep52/40 단백질은 3' 내지 5' 극성을 지닌 DNA 헬리카제이고 빈 캡시드 내로 바이러스 DNA의 패키징 동안 중요한 역할을 하고, 여기서 이는 패키징 모터 복합체의 부분인 것으로 고려된다(Smith and Kotin, J. Virol., 1998, 4874 - 4881; King, et al., EMBO J., 2001, 20:3282-3291). 곤충 세포 플랫폼에서 바큘로바이러스 벡터로부터 AAV를 생산하기 위하여, Rep68 및 Rep40 둘 다의 존재는 전제조건이 아니다(Urabe, et al., 2002).

파르보바이러스 Rep 단백질을 암호화하는 뉴클레오타이드 서열은 함께 요구되거나 곤충 세포 내에서 파르보바이러스 벡터에 대해 충분한 2개의 비-구조적 Rep 단백질, Rep 78 및 Rep52 중 적어도 하나를 암호화하는 뉴클레오타이드 서열로서 이해된다. 파르보바이러스 뉴클레오타이드 서열은 바람직하게는 아데노바이러스, 보다 바람직하게는 사람 또는 시미안 아데노-관련 바이러스(AAV)로부터 유래되고 가장 바람직하게는 일반적으로 사람을 감염시키는 AAV(예컨대, 혈청형 1, 2, 3A, 3B, 4, 5, 6, 8 및 9) 또는 영장류를 감염시키는 AAV(예컨대, 혈청형 1 및 4)로부터 유래된다. 파르보바이러스 Rep 단백질을 암호화하는 뉴클레오타이드 서열의 예는 서열 번호: 37로 제공되며(참고: 본원에 참고로 포함된, 제WO 2009/104964호의 서열 번호: 5), 이는 Rep 단백질을 암호화하는 AAV 혈청형-2 서열 게놈을 나타낸다. Rep78 코딩 서열은 뉴클레오타이드 11 내지 1876번을 포함하고 Rep52 암호화 서열은 뉴클레오타이드 683 내지 1876번을 포함하며, 이는 또한 서열 번호: 37 및 39(참고: 본원에 참고로 포함된 제WO 2009/104964호의 서열 번호: 5 및 7)로 별도로 나타낸다. Rep78 및 Rep52 단백질의 정확한 분자량 뿐만 아니라, 해독 개시 코돈의 정확한 위치는 상이한 아데노바이러스 사이에서 상이할 수 있음이 이해된다. 그러나, 당해 분야의 숙련가는 AAV-2보다는 다른 파르보바이러스로부터의 뉴클레오타이드 서열내 상응하는 위치를 확인하는 방법을 알 것이다.

본 발명에 따라서, 세포는 바람직하게는 이의 게놈 내로 통합된 파르보바이러스 Rep 단백질의 발현을 위한 적어도 제1 및 제2의 발현 카세트를 포함하는 제1의 핵산 작제물을 포함한다.

제1의 발현 카세트는 mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제1의 프로모터를 포함하고, 이의 해독은 세포 내에서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나를 생산한다. 곤충 세포 내에서 이의 해독이 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나를 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열은: a) 서열 번호: 40(본원에 참고로 포함된 제WO 2009/104964호의 서열 번호: 8)의 아미노산 서열과 적어도 50, 60, 70, 80, 88, 89, 90, 95, 97, 98, 또는 99% 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드를 암호화하고; b) 서열 번호: 39의 11 내지 1876번 위치의 뉴클레오타이드 서열과 적어도 50, 60, 70, 80, 81, 82, 85, 90, 95, 97, 98, 또는 99%의 서열 동일성을 가지고; c) 이의 상보성 가닥이 (a) 또는 (b)의 핵산 분자 서열에 하이브리드화하는 뉴클레오타이드 서열; 및 d) 이의 서열이 유전 코드의 축퇴성(degeneracy)으로 인하여 (c)의 핵산 분자의 서열과는 상이한 뉴클레오타이드 서열로서 정의될 수 있다. 바람직하게는, 뉴클레오타이드 서열은 mRNA를 암호화하고, 이의 해독은 곤충 세포 내에서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 만을 생산한다. 곤충 세포 내에서 mRNA의 해독은 일반적으로 적어도 파르보바이러스 Rep 78 단백질 만을 생산할 것이고 파르보바이러스 Rep 68 단백질을 생산할 필요가 없음이 이해된다. 뉴클레오타이드 서열이 mRNA를 암호화하지만, 이의 해독은 곤충 세포 내에서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 만을 생산하고(및 파르보바이러스 Rep 52 및 40 단백질은 생산하지 않음), 이는 뉴클레오타이드 서열이 곤충 세포 내에서 활성이고 이의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 생산하는, 추가의 mRNA를 생산하는 내부 내인성 파르보바이러스 P19 프로모터를 포함함이 추가로 이해된다. 바람직한 구현예에서, 이의 해독이 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 만을 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열은 더욱이 파르보바이러스 P19 프로모터를 포함하고, 이는 바람직하게는 곤충 세포 내에서 완전하거나 적어도 활성이다.

제2의 발현 카세트는 세포 내에서 이의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 생산하는 mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제2의 프로모터를 포함한다. 곤충 세포 내에서 이의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 생산하는 mRNA를 암호화하는 뉴클레오타이드 서열은: a) 서열 번호: 38(참고: 본원에 참고로 포함된 제WO 2009/104964호의 서열 번호: 6)의 아미노산 서열과 적어도 50, 60, 70, 80, 88, 89, 90, 95, 97, 98, 또는 99% 서열 동일성을 갖고; b) 서열 번호: 33 내지 37(참고: 본원에 참고로 포함된 제WO 2009/104964호의 서열 번호: 1 내지 5) 및 서열 번호: 15의 뉴클레오타이드 서열(이중 서열 번호: 15가 바람직하다)과 적어도 50, 60, 70, 80, 81, 82, 85, 90, 95, 97, 98, 또는 99% 서열 동일성을 갖는 뉴클레오타이드 서열; c) (a) 또는 (b)의 핵산 분자 서열에 하이브리드화하는 이의 보체 가닥; 및, d) 이의 서열이 유전 코드의 축퇴로 인하여 (c)의 핵산 분자의 서열과는 상이한 뉴클레오타이드 서열로서 정의될 수 있다. 바람직하게는, 뉴클레오타이드 서열은 mRNA를 암호화하고, 곤충 세포 내에서 이의 해독은 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나 만을 생산한다. 이에 의해 파르보바이러스 Rep 52 및/또는 40 단백질을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및/또는 68 단백질을 또한 암호화하는 보다 큰 코딩 서열의 부분이 아님이 이해된다. 바람직하게는 세포 내에서 이의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나 만을 생산하는 뉴클레오타이드 서열은 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 해독 개시 코돈으로부터 가장 C-말단 아미노산까지의 아미노산 서열로 이루어진 개방 판독 프레임을 포함하고, 보다 바람직하게는, 개방 판독 프레임은 mRNA를 암호화하는 뉴클레오타이드 서열 내에 포함된 유일한 개방 판독 프레임이다. 곤충 세포 내에서 mRNA의 해독은 일반적으로 적어도 파르보바이러스 Rep 52 단백질 만을 생산할 것이고 파르보바이러스 Rep 40 단백질을 생산할 필요가 없을 것임이 추가로 이해된다.

바람직하게는, 뉴클레오타이드 서열은 이것이 바이러스 복제 개시인자 단백질, 바이러스 게놈의 레플리카제, DNA 헬리카제의 요구된 활성 및 곤충 세포 내에서 파르보바이러스 벡터 생산에 충분한, 상술한 바와 같은 바이러스 DNA의 빈 캡시드내로의 패키징을 갖는다는 의미에서 기능적으로 활성인 파르보바이러스 Rep 단백질을 암호화한다.

일 구현예에서, Rep78 및 Rep52 해독 개시 부위 이외에, Rep 단백질 코딩 서열 내 가능한 거짓 해독 개시 부위가 제거된다. 일 구현예에서, 곤충 세포 내에서 인식될 수 있는 추정의 스플라이스 부위는 Rep 단백질 암호화 서열로부터 제거된다. 이러한 부위의 제거는 당해 분야의 숙련가에 의해 잘 이해될 것이다.

바람직한 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나는 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 제2의 아미노산으로부터 가장 C-말단 아미노산까지의 아미노산 서열을 포함하는 일반적인 아미노산 서열을 포함하고, 여기서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질의 적어도 하나의 일반적인 아미노산 서열은 적어도 90, 91, 92, 93, 94, 95, 96, 97, 98, 99 또는 100% 동일하고, 여기서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 90, 89, 88, 87, 86, 85, 84, 83, 82, 81, 80, 79, 78, 77, 76, 75, 74, 73, 72, 71, 70, 69, 68, 67, 66, 60% 미만으로 동일하다.

추가의 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 52 및 40 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 비교하여 세포에 대해 개선된 코돈 사용 편향(codon usage bias)을 갖는다. 그러나, 바람직하게는, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 비교하여 세포에 대해 개선된 코돈 사용 편향을 갖는다.

숙주 세포의 코돈 사용에 대한 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열의 적응성(adaptiveness)은 코돈 적응 지수(codon adaptation index; CAI)로 나타낼 수 있다. 바람직하게는 코돈 사용은 곤충 세포에 대해 적응되며 여기서 일반적인 아미노산 서열을 지닌 Rep 단백질이 발현된다. 일반적으로 이는 스포도프테라(Spodoptera) 속의 세포, 보다 바람직하게는 스포토프테라 프루기페르다(Spodoptera frugiperda) 세포일 것이다. 따라서, 코돈 사용은 바람직하게는 스포토프테라 프루기페르다(Spodoptera frugiperda) 또는 오토그파파 캘리포르니카 뉴클레오폴리헤드로바이러스(Autographa californica nucleopolyhedrovirus; AcMNPV) 감염된 세포에 대해 적응된다. 코돈 적응 지수는 본원에서 고도로 발현된 유전자의 코돈 사용을 향한 유전자의 코돈 사용의 상대적인 적응성의 척도로서 정의된다. 각각의 코돈의 상대적인 적응성(relative adaptiveness; w)은 동일한 아미노산에 대한 가장 풍부한 코돈의 사용에 대한 각각의 코돈의 사용의 비이다. CAI 지수는 이러한 상대적인 적응성 값의 기하 평균으로 정의된다. 동일하지 않은 코돈 및 종결 코돈(유전 코드에 의존함)은 배제된다. CAI 값은 0 내지 1의 범위이고, 보다 높은 값은 가장 풍부한 코돈의 보다 높은 비율을 나타낸다(Sharp and Li, 1987, Nucleic Acids Research 15: 1281-1295; 또한 문헌: Kim et al., Gene. 1997, 25 199:293-301; zur Megede et al., Journal of Virology, 2000, 74: 2628-2635을 참조한다).

바람직하게는, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에서 일반적인 아미노산 서열을 코딩하는 뉴클레오타이드 서열 사이의 코돈 적응 지수에서의 차이는 적어도 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7 또는 0.8이고, 이에 의해 보다 바람직하게는, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에서 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열의 CAI는 적어도 0.5, 0.6, 0.7, 0.8, 0.9 또는 1.0이다.

따라서, 대안적인 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나는, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 제2의 아미노산으로부터 가장 C-말단 아미노산까지의 아미노산 서열을 포함하는 일반적인 아미노산 서열을 포함하고, 여기서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 일반적인 아미노산 서열은 적어도 90% 동일하고, 여기서 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 90% 미만으로 동일하고, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 52 및 40 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 비교하여 세포에 대해 개선된 코돈 사용 편향을 갖거나, 여기서 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 비교하여 세포에 대해 개선된 코돈 사용 편향을 갖고, 여기서 바람직하게는, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나 및 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 암호화하는 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 사이의 코돈 적응 지수에서의 차이는 적어도 0.2이다. 바람직한 구현예에서, 곤충 세포에 대해 개선된 코돈 사용 편향을 지닌 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나의 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 코돈의 적어도 80, 85, 90, 95, 96, 97, 98, 99 또는 100%가 서열 번호: 15에서의 코돈과 동일한 이의 뉴클레오타이드 서열을 갖는다.

파르보바이러스 Rep 단백질의 온도 최적화는 곤충 세포가 성장하고 Rep가 기능화되는 온도 둘 다와 관련하여 최적 조건을 사용하는 것을 지칭한다. Rep 단백질은 예를 들면, 37℃에서 최적으로 활성일 수 있지만, 곤충 세포는 28℃에서 최적으로 성장할 수 있다. Rep 단백질이 활성이고 곤충 세포가 성장하는 온도는 30℃일 수 있다. 바람직한 구현예에서, 최적화된 온도는 27, 28, 29, 30, 31, 32, 33, 34 또는 35℃ 이상 및/또는 37, 36, 35, 34, 33, 32, 31, 30 또는 29℃ 미만이다.

일 구현예에서, 세포 내에서 제1 및 제2의 발현 카세트를 최적화하여 (곤충) 세포 내에서 Rep78 대 Rep52의 바람직한 몰 비를 수득한다. 바람직하게는, 세포 내에서 제1 및 제2의 발현 카세트의 조합은 (곤충) 세포 내에서 1:10 내지 10:1, 1:5 내지 5:1, 또는 1:3 내지 3:1의 범위의 Rep78 대 Rep52의 몰 비를 생산한다. 보다 바람직하게는, 제1의 핵산 작제물은 적어도 1:2, 1:3, 1:5 또는 1:10인 Rep78 대 Rep52의 몰 비를 생산한다. Rep78 및 Rep52의 몰 비는 웨스턴 블롯팅의 수단으로, 바람직하게는 Rep78 및 Rep52 둘 다의 일반적인 에피토프를 인식하는 모노클로날 항체를 사용하거나, 예컨대, 마우스 항-Rep 항체(303.9, Progen, 독일; 1:50의 희석)를 사용함으로써 측정할 수 있다.

Rep78 대 Rep52의 바람직한 몰 비는 본원에서 상기 추가로 기술된 각각 제1 및 제2의 발현 카세트에서 프로모터를 선택함으로써 수득될 수 있다. 대안적으로 또는 함께, Rep78 대 Rep52의 바람직한 몰 비는 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 정체 상 수준을 감소시키기 위한 수단을 사용하여 수득할 수 있다.

따라서, 일 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대한 mRNA를 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 감소된 정체 상 수준에 영향을 미치는 변형을 포함한다. 감소된 정체 상 조건은 예를 들면, 조절 성분 또는 상부 프로모터를 절두(truncation)하고(Urabe et al., supra, Dong et al., supra), 단백질 분해 신호 펩타이드, 예를 들면, PEST 또는 우비퀴틴화 펩타이드 서열을 가하고, 출발 코돈을 보다 준최적인 것으로 대체하거나, 제WO 2008/024998호에 기술된 바와 같은 인공 인트론을 도입함으로써 달성할 수 있다.

바람직한 구현예에서, 파르보바이러스 Rep78 및 68 단백질 중 적어도 하나를 암호화하는 뉴클레오타이드 서열은 준최적 해독 개시 코돈으로 출발하는 개방 판독 프레임을 포함한다. 준최적 개시 코돈은 바람직하게는 부분적인 엑손 스키핑(partial exon skipping)에 영향을 미치는 개시 코돈이다. 부분적인 엑손 스키핑은 본원에서 적어도 리보솜의 부분이 Rep78 단백질의 준최적 개시 코돈에서 해독을 개시하지 않지만 개시 코돈 추가의 하부에서 개시할 수 있음으로써, 바람직하게는 (제1)의 개시 코돈 추가의 하부가 Rep52 단백질의 개시 코돈인 것으로 이해된다. 대안적으로, 파르보바이러스 Rep78 및 68 단백질 중 적어도 하나를 암호화하는 뉴클레오타이드 서열은 준최적 해독 개시 코돈으로 출발하는 개방 판독 프레임을 포함하고 개시 코돈 추가의 하부를 가지지 않는다. 준최적 개시 코돈은 바람직하게는 곤충 세포 내에서 뉴클레오타이드 서열의 발현시 부분적인 엑손 스키핑에 영향을 미친다. 바람직하게는, 중최적 개시 코돈은 곤충 세포 내에서 부분적인 엑손 스키핑에 영향을 미침으로써 곤충 세포 내에서 1:10 내지 10:1, 1:5 내지 5:1, 또는 1:3 내지 3:1의 범위의 Rep78 대 Rep52의 몰 비를 생산하도록 한다. Rep78 및 Rep52의 몰 비는 웨스턴 블롯팅의 수단으로, 바람직하게는 Rep78 및 Rep52 둘 다의 일반적인 에피토프를 인식하는 모노클로날 항체를 사용하거나, 또는 예컨대, 마우스 항-Rep 항체(303.9, Progen, 독일; 1:50의 희석)를 사용하여 측정할 수 있다.

본원에서 용어 "준최적 개시 코돈"은 트리-뉴클레오타이드 개시 코돈 자체를 지칭할 뿐 아니라, 이의 내용도 지칭한다. 따라서, 준최적 개시 코돈은 준최적 내용, 예컨대, 비-코작 내용에서 "최적의" ATG 코돈으로 이루어질 수 있다. 그러나, 트리-뉴클레오타이드 개시 코돈 자체가 준최적인, 즉, ATG가 아닌 준최적 개시 코돈이 보다 바람직하다. 본원에서 준최적은 코돈이 정상의 ATG 코돈과 비교하여 달리 동일한 내용에서 해독 개시에 거의 효과적이지 않음을 의미하는 것으로 이해된다. 바람직하게는, 준최적 코돈의 효능은 달리 동일한 내용에서 정상의 ATG 코돈의 효능의 90, 80, 60, 40 또는 20% 미만이다. 해독 개시의 상대적인 효능을 비교하기 위한 방법은 숙련가에게 공지되어 있다. 바람직한 준최적 개시 코돈은 ACG, TTG, CTG, 및 GTG로부터 선택될 수 있다. ACG가 보다 바람직하다. 파르보바이러스 Rep 단백질을 암호화하는 뉴클레오타이드 서열은 본원에서 Rep78 및 Rep52 단백질과 같이 곤충 세포 내에서 파르보바이러스 벡터 생산에 요구되고 충분한 비-구조적 Rep 단백질을 암호화하는 뉴클레오타이드 서열로서 이해된다.

캡시드 단백질

완전한 파르보바이러스 유전자 치료요법 벡터 비리온의 생산을 위해, 세포는 바람직하게는 곤충 세포 내에서 발현을 위해 제3의 프로모터에 작동 가능하게 연결된 파르보바이러스 캡시드 단백질 코딩 서열을 포함하는 뉴클레오타이드 서열을 포함하는 추가의 (제3의) 발현 카세트를 추가로 포함한다.

파르보바이러스 캡시드(Cap) 단백질을 암호화하는 뉴클레오타이드 서열은 본원에서 3개의 파르보바이러스 캡시드 단백질, VP1, -2 및 -3 중 하나 이상을 암호화하는 뉴클레오타이드 서열을 포함하는 것으로 이해된다. 파르보바이러스 뉴클레오타이드 서열은 바람직하게는 데펜도바이러스(dependovirus)로부터, 보다 바람직하게는 사람 또는 시미안 아데노-관련 바이러스(simian adeno-associated virus; AAV) 및 가장 바람직하게는 일반적으로 사람을 감염시키는 AAV(예컨대, 혈청형 1, 2, 3A, 3B, 4, 5, 6, 7, 8, 9, 10, 11, 12 또는 13) 또는 영장류를 감염시키는 AAV(예컨대, 혈청형 1 및 4)로부터 유래되고, 이의 뉴클레오타이드 및 아미노산 서열은 이의 전문이 본원에 참고로 포함된 문헌: Lubelski et al. US2017356008에 나타나 있다. 따라서, 본 발명에 따른 핵산 작제물은 문헌: Lubelski et al. US2017356008에 개시된 바와 같은 AAV 캡시드 단백질에 대한 전체 개방 판독 프레임을 포함할 수 있다. 대안적으로, 서열은 인공일 수 있는데, 예를 들면, 서열을 하이브리드 형태일 수 있거나 예를 들면, AcmNPv 또는 스포도프테라 프루기페르다(Spodoptera frugiperda)의 코돈 사용에 의해서와 같이 코돈 최적화될 수 있다. 예를 들면, 캡시드 서열은 AAV1의 VP2 및 VP3 서열로 구성될 수 있는 반면, VP1 서열의 나머지는 AAV5이다. 바람직한 캡시드 단백질은 AAV5 또는 AAV2/5 하이브리드, 바람직하게는 (본 출원에서 서열 번호: 30 및 29 각각) 또는 AAV8, 바람직하게는 서열 번호: 41(참고: Lubelski et al. US2017356008에서 서열 번호: 28)이다. 따라서, 바람직한 구현예에서, AAV 캡시드 단백질은 본 발명에 따라서 변형된 AAV 혈청형 5, 하이드리드 혈청형 2/5 또는 AAV 혈청형 8 캡시드 단백질이다. 보다 바람직하게는, AAV 캡시드 단백질은 본 발명에 따라 변형된 AAV 혈청형 5 캡시드 단백질이다. 보다 바람직하게는, 캡-코딩 서열은 적어도 CAP AAV2/5(서열 번호: 29) 및 AAV5(서열 번호: 30)이다. 캡시드 단백질의 정확한 분자량 뿐만 아니라 해독 개시 코돈의 정확한 위치는 상이한 파르보바이러스 사이에서 상이할 수 있다. 그러나, 숙련가는 AAV5이외의 다른 파르보바이러스로부터의 뉴클레오타이드 서열 내 상응하는 위치를 확인하는 방법을 알 것이다. 대안적으로, AAV 캡시드 단백질 암호화 서열은 예를 들면, 지시된 진화 실험의 결과로서 인공 서열이다. 이는 DNA 셔플링(shuffling), 오류 유발(error prone) PCR, 생물정보학 합리적 설계(bioinformatics rational design), 부위 포화된 돌연변이유발을 통해 캡시드 라이브러리의 생성을 포함할 수 있다. 수득되는 캡시드는 기존의 혈청형을 기반으로 하지만 이러한 캡시드의 특징을 개선시키는 다양한 아미노산 또는 뉴클레오타이드 변화를 함유한다. 수득되는 캡시드는 기존의 혈청형, "셔플드 캡시드(shuffled capsid)"의 다양한 부분의 조합일 수 있거나, 그룹내에서 조직화되거나 유전자 또는 단백질의 전체 길이에 걸쳐 확산된, 하나 이상의 아미노산 또는 뉴클레오타이드의 완전히 신규한 변화, 즉, 첨가, 결실 또는 치환을 함유한다. 참고: 예를 들면, 본원에 참고로 포함된 문헌: Schaffer and Maheshri; Proceedings of the 26th Annual International Conference of the IEEE EMBS San Francisco, CA, USA; September 1-5, 2004, pages 3520-3523; Asuri et al., 2012, Molecular Therapy 20(2):329-3389; Lisowski et al., 2014, Nature 506(7488):382-386.

본 발명의 바람직한 구현예에서, VP1 캡시드 단백질을 암호화하는 개방 판독 프레임은 ACG, ATT, ATA, AGA, AGG, AAA, CTG, CTT, CTC, CTA, CGA, CGC, TTG, TAG 및 GTG로 이루어진 그룹으로부터 선택된 비-표준의 해독 개시 코돈으로 출발한다. 바람직하게는, 비-표준의 해독 개시 코돈은 GTG, CTG, ACG, 및 TTG으로 이루어진 그룹으로부터 선택되고, 보다 바람직하게는 비-표준의 해독 개시 코돈은 CTG이다.

AAV 캡시드 단백질의 발현을 위한 본 발명의 뉴클레오타이드 서열은 또한 바람직하게는 VP1의 개방 판독 프레임의 12번 뉴클레오타이드 위치에서 G, 21번 뉴클레오타이드 위치에서 A, 및 24번 뉴클레오타이드 위치에서 C 중에서 선택된 AAV VP1 캡시드 단백질을 암호화하는 뉴클레오타이드 서열의 적어도 하나의 변형을 포함하고, 여기서 뉴클레오타이드 위치는 야생형 뉴클레오타이드 서열의 뉴클레오타이드 위치에 상응한다. 본원에서 "잠재적인/가능한 거짓 출발 부위(potential/possible false start site)" 또는 "잠재적인/가능한 거짓 해독 개시 코돈(potential/possible false translation initiation codon)"은 본원에서 캡시드 단백질(들)의 코딩 서열 내에 위치한 프레임 내 ATG 코돈을 의미하는 것으로 이해된다. 다른 혈청형의 VP1 코딩 서열 내 해독을 위한 가능한 거짓 출발 부위의 제거는 곤충 세포내에서 인식될 수 있는 추정의 스플라이스 부위의 제거일 수 있으므로, 당해 분야의 숙련가에 의해 잘 이해될 것이다. 예를 들면, 뉴클레오타이드 T는 거짓 ATG 코돈이 생기게 하지 않으므로, 12번 위치에서 뉴클레오타이드의 변형은 재조합 AAV5에 요구되지 않는다. 파르보바이러스 캡시드 단백질을 암호화하는 뉴클레오타이드 서열의 구체적인 예는 서열 번호: 44, 45 및 46에서 제공된다. 본 발명의 파르보바이러스 Cap 및/또는 Rep 단백질을 암호화하는 뉴클레오타이드 서열은 또한 중간의(moderate), 또는 바람직하게는 엄격한 하이브리드화 조건(stringent hybridisation condition) 하에서 서열 번호: 44, 45, 46 및 33 내지 37의 뉴클레오타이드 서열과 하이브리드화하는 이의 능력에 의해 정의될 수 있다.

캡시드 단백질 코딩 서열은 다양한 형태로 존재할 수 있다. 예컨대, 캡시드 단백질 VP1, -2 및 -3 각각에 대한 별개의 암호화 서열을 사용할 수 있고, 이에 의해 각각의 암호화 서열은 곤충 세포 내에서 발현을 위해 발현 제어 서열에 작동 가능하게 연결된다. 그러나, 보다 바람직하게는, 제3의 발현 카세트는 파르보바이러스(AAV) VP1, VP2, 및 VP3 캡시드 단백질 중 모두 3개를 암호화하는 단일의 개방 판독 프레임을 포함하는 뉴클레오타이드 서열을 포함하고, 여기서 VP1 캡시드 단백질의 해독을 위한 개시 코돈은 예컨대, 문헌: Urabe et al., (2002, 상기 참고) 및 제 WO2007/046703호에 기술된 ATG가 아닌 준최적 개시 코돈이다. VP1 캡시드 단백질에 대한 준최적 개시 코돈은 Rep78 단백질에 대해 상기 정의된 바와 같을 수 있다. VP1 캡시드 단백질에 대한 보다 바람직한 준최적 개시 코돈은 ACG, TTG, CTG 및 GTG로부터 선택될 수 있고, 이중에서 CTG 및 GTG가 가장 바람직하다.

대안적인 구현예에서, 제2의 발현 카세트는 파르보바이러스(AAV) VP1, VP2, 및 VP3 캡시드 단백질 중 모드 3개를 암호화하는 단일 개방 판독 프레임을 포함하는 뉴클레오타이드 서열을 포함하고, 여기서 VP1 캡시드 단백질의 해독을 위한 개시 코돈은 ATG이고 여기서 뉴클레오타이드 서열 내에 암호화된 것으로서 VP1 캡시드 단백질을 코딩하는 mRNA는 VP1 캡시드 단백질(제WO2019/016349호에 기술된 바와 같은)의 개방 판독 프레임과는 프레임 외부에 있는 대안의 출발 코돈을 포함한다. 바람직하게는, 대안의 출발 코돈은 CTG, ATG, ACG, TTG, GTG, CTC 및 CTT로 이루어진 그룹으로부터 선택되고, 이 중 ATG가 바람직하다. 바람직하게는, AAV 캡시드 단백질은 AAV5 혈청형 캡시드 단백질이다. 바람직하게는 당해 구현예에서, 뉴클레오타이드 서열은 VP1에 대한 상기 ATG 해독 개시 코돈을 포함하는 대안의 출발 코돈으로부터 출발하는 대안의 개방 판독 프레임을 포함하고, 이에 의해 바람직하게는, 대안의 출발 코돈을 수반하는 대안의 개방 판독 프레임은 20개 이하의 아미노산의 펩타이드를 암호화한다.

캡시드 단백질의 발현을 위한 제2의 발현 카세트 속에 포함된 뉴클레오타이드 서열은 제WO2007/046703호에 기술된 바와 같은 하나 이상의 변형을 추가로 포함할 수 있다. VP 및 비리온의 수율을 증가시킬 수 있거나 다른 목적한 효과, 예를 들면, 변경된 향성(tropism)을 가지거나 비리온의 항원성을 감소시킬 수 있는 VP 코딩 영역의 다양한 추가의 변형은 숙련가에게 공지되어 있다.

일 구현예에서, VP1의 발현은 VP2 및 VP3의 발현과 비교하여 증가된다. VP1 발현은 VP1을 보충하거나, 제WO 2007/084773호에 기술된 바와 같이 VP1에 대한 뉴클레오타이드 서열을 포함하는 단일 벡터의 곤충 세포 내로 도입시킴에 의해 증가될 수 있다.

전형적으로, 본 발명의 방법에서, 적어도 하나의 개방 판독 프레임은 VP1, VP2 및 VP3 캡시드 단백질을 암호화하는 뉴클레오타이드 서열을 포함하거나 적어도 하나의 개방 판독 프레임은 Rep78 및 Rep68 단백질 중 적어도 하나를 암호화하는 뉴클레오타이드 서열을 포함한다. 일 구현예에서, VP1, VP2 및 VP3 캡시드 단백질 또는 Rep78 및 Rep68 단백질 중 적어도 하나를 암호화하는 뉴클레오타이드 서열을 포함하는 개방 판독 프레임을 포함하는 적어도 하나의 개방 판독 프레임은 인공 인트론(또는 인공 인트론으로부터 유래된 서열)을 포함하지 않는다. 즉 다시 말해서, Rep 또는 VP 단백질을 암호화하는데 사용된 적어도 개방 판독 프레임은 인공 인트론을 포함하지 않을 것이다. 인공 인트론은 아데노-관련 바이러스 Rep 또는 Cap 서열내에서 천연적으로 발생하지 않는 인트론, 예를 들면, 가공되어 곤충 세포 내에서 기능적 스플라이싱을 허용하는 인트론을 의미한다. 따라서, 이러한 문맥에서 인공 인트론은 야생형 곤충 세포 인트론을 포함한다. 본 발명의 발현 카세트는 천연의 절두된(truncated) 인트론 서열(천연적으로는 아데노-관련 바이러스내에서 천연적으로 발생하는 서열을 의미한다)을 포함하고 - 이러한 서열은 본원에 정의된 바와 같은 인공 인트론의 의미 내에 속하는 것으로 의도되지 않는다.

본 발명에서, 하나의 가능성은 VP1, VP2 및 VP3 캡시드 단백질을 암호화하는 뉴클레오타이드 서열을 포함하는 개방 판독 프레임 및/또는 Rep78 및 Rep68 단백질 중 적어도 하나를 암호화하는 뉴클레오타이드 서열을 포함하는 개방 판독 프레임이 인공 인트론을 포함하지 않는다는 것이다.

바람직하게는 AAV 캡시드 단백질을 암호화하는 본 발명의 뉴클레오타이드 서열은 곤충 세포 내에서 발현을 위한 발현 제어 서열에 작동 가능하게 연결된다. 이러한 발현 제어 서열은 적어도 곤충 세포 내에서 활성인 프로모터를 포함할 것이다. AAV 캡시드 단백질을 암호화하는 본 발명의 뉴클레오타이드 서열의 전사에 적합한 프로모터는 예컨대, 폴리헤드론 프로모터(polH), 예를 들면, 서열 번호: 42의 polH 프로모터 및 서열 번호: 43의 이의 단축된 버젼(참고: 문헌: Lubelski et al. US2017356008에서 서열 번호: 53 및 서열 번호: 54의 이의 단축된 버젼)이다. 그러나, 곤충 세포에서 활성이고 본 발명에 따라 선택될 수 있는 다른 프로모터, 예컨대, 폴리헤드린(polH) 프로모터, p10 프로모터, p35 프로모터, 4xHsp27 EcRE+최소 Hsp70 프로모터, 델타E1 프로모터, E1 프로모터 또는 IE-1 프로모터 및 상기 참고문헌에 기술된 추가의 프로모터는 당해 분야에 공지되어 있다.

바이러스 벡터

본 발명은 포유동물 세포, 바람직하게는 사람 세포 내에서 도입 및/또는 발현을 위한 벡터로서 사용하기 위한 파르보바이러스, 특히 데펜도바이러스, 예를 들면, 감염성 사람 또는 시미안 AAV, 및 이의 구성성분(예컨대, 파르보바이러스 게놈)의 용도에 관한 것이다. 특히, 본 발명은 곤충 세포 내에서 생산시 이러한 파르보바이러스 벡터의 생산성에서의 개선에 관한 것이다.

"파르보바이러스 벡터"는 생체 내(in vivo), 생체 외(ex vivo) 또는 시험관 내(in vitro)에서, 숙주 세포 내로 전달될 폴리뉴클레오타이드를 포함하는 재조합적으로 생산된 파르보바이러스 또는 파르보바이러스 입자로서 정의된다. 파르보바이러스 벡터의 예는 예컨대, 아데노-관련 바이러스 벡터를 포함한다. 여기서, 파르보바이러스 벡터 작제물은 바이러스 게놈 또는 이의 부분, 및 전이유전자를 포함하는 폴리뉴클레오타이드에 관한 것이다. 파르보비리다에 계열의 바이러스는 작은 DNA 바이러스이다. 파르보비리다에 계열은 2개의 서브계열: 척추동물을 감염시키는 파르보비리나에, 및 곤충을 포함하는, 척추동물을 감염시키는 덴소비리나에 사이에서 나뉠 수 있다. 서브계열 피리보비리다에의 구성원은 본원에서 파르보바이러스로서 지칭되며 데펜도바이러스 속을 포함한다. 이의 게놈 명칭으로부터 유추될 수 있는 바와 같이, 데펜도바이러스의 구성원은, 이들이 일반적으로 헬퍼 바이러스, 예를 들면, 세포 배양물 속에서 생산성 감염을 위해 아데노바이러스 또는 헤르페스 바이러스를 사용한 공감염(coinfection)을 필요로 한다는 점에서 유일하다. 데펜도바이러스의 속은 AAV를 포함하고, 이는 일반적으로 사람(예컨대, 혈청형 1, 2, 3A, 3B, 4, 5, 6, 7, 8, 9, 10, 11, 12 및 13) 또는 영장류(예컨대, 혈청형 1 및 4)를 감염시키는 AAV, 및 다른 온혈 동물(예컨대, 소과, 개과, 말과, 및 양과 아데노-관련 바이러스)를 감염시키는 관련된 바이러스를 포함한다. 파르보바이러스 및 파르보비리다에의 다른 구성원에 대한 추가의 정보는 문헌: Kenneth I. Berns, "Parvoviridae: The Viruses and Their Replication," Chapter 69 in Fields Virology (3d Ed. 1996)에 기술되어 있다. 편의상, 본 발명은 AAV를 참고로 추가로 예시되고 본원에 기술된다. 그러나, 본 발명은 AAV에 한정되지 않지만 다른 파르보바이러스에 동등하게 적용될 수 있음이 이해된다.

모든 공지된 AAV 혈청형의 게놈 조직화(genomic organization)는 매우 유사하다. AAV의 게놈은 길이가 약 5,000개 뉴클레오타이드(nt) 미만인 선형의, 단일 가닥 DNA 분자이다. 역위된 말단 반복체(inverted terminal repeat; ITR)는 비-구조적 복제(Rep) 단백질 및 구조 바이러스 입자(VP) 단백질에 대한 유일한 코딩 뉴클레오타이드 서열을 플랭킹한다. VP 단백질(VP1, -2 및 -3)은 캡시드를 형성한다. 말단 145 nt ITR은 자가-상보성이고 구조화되어 T-형 헤어핀(T-shaped hairpin)을 형성하는 효과적으로 안정한 분자간 듀플렉스(duplex)가 형성될 수 있다. 이러한 헤어핀 구조는 바이러스 DNA 복제를 위한 오리진(origin)으로서 기능하여, 세포 DNA 폴리머라제 복합체에 대한 프라이머로서 제공된다. 포유동물 세포 내에서 야생형(wt) AAV 감염 후 Rep 유전자(즉, Rep78 및 Rep52)는 P5 프로모터 및 P19 프로모터 각각으로부터 발현되고, Rep 단백질 둘 다는 바이러스 게놈의 복제 및 패키징에서 기능을 갖는다. Rep ORF 내 스플라이싱 현상(splicing event)은 실제로 4개의 Rep 단백질(즉, Rep78, Rep68, Rep52 및 Rep40)의 발현을 야기한다. 그러나, 포유동물 세포 내에서, Rep78 및 Rep52 단백질을 암호화하는, 스플라이싱되지 않은 mRNA는 AAV 벡터 생산에 충분한 것으로 밝혀졌다. 또한, 곤충 세포 내에서 Rep78 및 Rep52 단백질은 AAV 벡터 생산에 충분한다. 3개의 캡시드 단백질, VP1, VP2 및 VP3은 p40 프로모터로부터 단일의 VP 판독 프레임으로부터 발현된다. 포유동물 세포 내에서 wtAAV 감염은 2개의 스플라이스 수용체 부위의 대안의 사용의 조합시 캡시드 단백질 생산 및 VP2에 대한 ACG 개시 코돈의 준최적 활용에 의존한다.

본원에서 "재조합 파르보바이러스 또는 AAV 벡터"(또는 "rAAV 벡터")는 적어도 하나의 파르보바이러스 또는 AAV 역위된 말단 반복체 서열(ITR)에 의해 플랭킹되는 하나 이상의 목적한 폴리뉴클레오타이드, 목적한 유전자 또는 "전이유전자"를 포함하는 벡터를 지칭한다. 바람직하게는, 전이유전자(들)은 전이유전자(들)의 각각의 측면 상의 하나인, ITR에 의해 플랭킹된다. 이러한 rAAV 벡터는 복제될 수 있고 AAV rep 및 cap 유전자 생성물(즉, AAV Rep 및 Cap 단백질)을 발현하는 곤충 숙주 세포 내에 존재하는 경우 감염성 바이러스 임자로 복제되고 패키징될 수 있다. rAAV 벡터가 보다 큰 핵산 작제물(즉, 염색체 또는 클로닝 또는 형질감염을 위해 사용된 플라스미드 또는 바큘로바이러스와 같은 다른 벡터 내) 내로 혼입된 다음, rAAV 벡터는 AAV 패키징 기능 및 필수적인 헬퍼 기능의 존재하에서 복제 및 캡시드화에 의해 "구조(rescue)"될 수 있는 "프로-벡터"로서 전형적으로 지칭된다.

본 발명은 곤충 세포 내에서 재조합 파르보바이러스(rAAV) 벡터를 포함하는 재조합 파르보바이러스(rAAV) 비리온을 생산하는 방법에 관한 것이다. 일 구현예에서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나, 파르보바이러스 VP1, VP2, 및 VP3 캡시드 단백질 및 적어도 하나의 파르보바이러스 역위 말단 반복체 서열은 아데노 관련 바이러스(AAV)로부터 유래된다. 바람직하게는, 뉴클레오타이드 서열은 동일한 혈청형의 것이다. 보다 바람직하게는, 뉴클레오타이드 서열은 이들이 코돈 최적화되거나, AT-최적화되거나 GC-최적화되어 재조합을 최소화하거나 방지할 수 있다는 점에서 서로 상이하다. 바람직하게는, 파르보바이러스 Rep 단백질의 일반적인 아미노산 서열을 코딩하는 제1 및 제2의 뉴클레오타이드 서열 내 차이는: a) 파르보바이러스 Rep 일반적인 아미노산 서열을 암호화하는 제1의 뉴클레오타이드 서열의 코돈 편향을 변화시키는 방법; b) 파르보바이러스 Rep 일반적인 아미노산 서열을 암호화하는 제2의 뉴클레오타이드 서열의 코돈 편향을 변화시키는 방법; c) 일반적인 아미노산 서열을 암호화하는 제1의 뉴클레오타이드 서열의 GC-함량을 변화시키는 방법; 및 d) 일반적인 아미노산 서열을 암호화하는 제2의 뉴클레오타이드 서열의 GC-함량을 변화시키는 방법 중 하나 이상에 의해 극대화된다(즉, 뉴클레오타이드 동일성은 최소화된다). 코돈 최적화는 코돈 사용 데이타베이스(참고: 예컨대, http://www.kazusa.or.jp/codon/)에서 발견될 수 있는, 본 발명의 방법에서 사용된 곤충 세포, 바람직하게는 스포도프테라 프루기페르다(Spodoptera frugiperda)의 코돈 사용을 기반으로 수행될 수 있다. 코돈 최적화에 적합한 컴퓨터 프로그램은 숙련가에게 이용가능하다(참고: 예컨대, Jayaraj et al., 2005, Nucl. Acids Res. 33(9):3011-3016; 및 인터넷). 대안적으로, 최적화는 동일한 코돈 사용 데이타베이스를 사용하여 수동으로 수행할 수 있다.

전이유전자

일 구현예에서, 세포는 a) 곤충 세포내에서 발현시키기 위한 제3의 프로모터에 작동 가능하게 연결된 파르보바이러스 캡시드 단백질 코딩 서열을 포함하는 뉴클레오타이드 서열; b) 적어도 하나의 파르보바이러스 역위된 말단 반복체 서열에 의해 플랭킹되는 전이유전자를 포함하는 뉴클레오타이드; 및, c) 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 뉴클레오타이드 서열을 추가로 포함한다.

추가의 구현예에서, a) 및 b) 중 적어도 하나의 뉴클레오타이드 서열은 바큘로바이러스 벡터 내에 포함되고, 여기서, 바람직하게는 a), b) 및 c) 중 적어도 하나의 뉴클레오타이드 서열은 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 바큘로바이러스 벡터 내에 포함된다.

본 발명의 문맥에서 "적어도 하나의 파르보바이러스 역위된 말단 반복체 뉴클레오타이드 서열"은 "A", "B", 및 "C" 영역으로서 또한 지칭된 가장 상보성인, 대칭적으로 정렬된 서열을 포함하는 팔린드롬 서열(palindromic sequence)을 의미하는 것으로 이해된다. ITR은 복제 오리진으로서, 복제시 "시스" 역활을 갖는, 즉, 예컨대, Rep 78(또는 Rep68)과 같은 트랜스 작용 복제 단백질에 대한 인식 부위인, 부위로서 기능하며, 이는 팔린드롬 및 팔린드롬에 대해 내부의 구체적인 서열을 인식한다. ITR 서열의 대칭에 대한 하나의 예외는 ITR의 "D" 영역이다. 이는 유일하다(하나의 ITR 내에 보체를 가지지 않는다). 단일 가닥 DNA의 니킹(nicking)은 A와 D 영역 사이의 접합부에서 발생한다. 이는 새로운 DNA 합성이 개시되는 영역이다. D 영역은 일반적으로 팔린드롬의 한쪽 측면에 있으며 핵산 복제 단계에 대한 방향성을 제공한다. 포유동물 세포 내에서 복제하는 파르보바이러스는 전형적으로 2개의 ITR 서열을 갖는다. 그러나, ITR을 가공하여 A 영역과 D 영역의 가닥 둘 다에서의 결합 부위가 팔린드롬의 각각의 측면 하나에, 대칭적으로 위치한다. 이중-가닥 환형 DNA 주형(예컨대, 플라스미드)에서, Rep78- 또는 Rep68-관련 핵산 복제는 이후 양 방향에서 진행하고 단일의 ITR은 환형 벡터의 파르보바이러스 복제에 충분하다. 따라서, 하나의 ITR 뉴클레오타이드 서열을 본 발명의 문맥에서 사용할 수 있다. 그러나, 바람직하게는, 2개 또는 다른 짝수의 정규 ITR을 사용한다. 가장 바람직하게는, 2개의 ITR 서열이 사용된다. 바람직한 파르보바이러스 ITR은 AAV ITR이다. 보다 바람직하게는 AAV2 ITR이 사용된다. 안전성 이유를 위해, 제2의 AAV의 존재 하에서 세포 내로 초기 도입 후 추가로 계대배양할 수 없는 재조합 파르보바이러스(rAAV) 벡터를 작제하는 것이 바람직할 수 있다. 수용체에서 바람직하지 않은 벡터 증식을 제한하기 위한 이러한 안전성 메카니즘은 제US2003148506호에 기술된 바와 같은 키메라 ITR을 지닌 rAAV를 사용하여 제공할 수 있다.

본원에서 다른 성분(들)에 의해 플랭킹되는 서열과 관련하여 용어 "플랭킹되는"은 플랭킹 성분 상부 및/또는 하부, 즉, 서열과 관련하여 5' 및/또는 3' 중 하나 이상의 존재를 나타낸다.용어 "플랭킹되는"은 서열이 필수적으로 연속적임을 나타내는 것으로 의도되지 않는다. 예를 들면, 전이유전자 및 플랭킹 성분을 암호화하는 핵산 사이에 개재 서열(intervening sequence)이 존재할 수 있다. 2개의 다른 성분(예컨대, ITR)에 의해 "플랭킹"된 서열은 하나의 성분이 서열에 대해 5'에 위치하고 다른 것이 서열에 대해 3'에 위치하지만; 이들 사이에 개재 서열이 존재할 수 있음을 나타내지만; 이들 사이에 개재 서열이 존재할 수 있다. 바람직한 구현예에서, (i)의 뉴클레오타이드 서열은 파르보바이러스 역위된 말단 반복체 뉴클레오타이드 서열에 의해 어느 하나의 측면에서 플랭킹된다.

본 발명의 구현예에서, 적어도 하나의 파르보바이러스 IRT 서열에 의해 플랭킹된 전이유전자를 포함하는(목적한 유전자 생성물을 암호화하거나 목적한 유전자를 표적화하는 뉴클레오타이드 서열을 포함하는) 뉴클레오타이드 서열은 바람직하게는 곤충 세포 내에서 생산된 재조합 파르보바이러스(rAAV) 벡터내로 혼입된다. 바람직하게는, 전이유전자는 포유동물 세포 내에서 발현시키기 위한 목적한 유전자 생성물을 암호화한다. 바람직하게는, 전이유전자는 포유동물 세포 내에서 상기 목적한 유전자를 사일런싱하기 위한 목적한 유전자를 표적화하는 적어도 하나의 뉴클레오타이드 서열을 포함한다. 바람직하게는, 전이유전자를 포함하는 뉴클레오타이드 서열은 2개의 파르보바이러스(AAV) ITR 뉴클레오타이드 서열에 의해 플랭킹되고 여기서 전이유전자는 2개의 파르보바이러스(AAV) ITR 뉴클레오타이드 서열 사이에 위치한다. 바람직하게는, 목적한 유전자 생성물을 암호화하거나(포유동물 세포 내에서 발현시키기 위한) 목적한 유전자를 표적화하는 뉴클레오타이드 서열을 포함하는(포유동물 세포 내에서 목적한 유전자를 사일런싱하기 위한) 뉴클레오타이드 서열은 2개의 정규 ITR 사이에 위치하거나, 2개의 D 영역을 지닌 가공된 ITR의 한쪽 측면에 위치한 경우 곤충 세포 내에서 생산된 재조합 파르보바이러스(rAAV) 벡터 내로 혼입될 것이다.

곤충 세포 내에서 재조합 AAV 비리온의 생산을 위해 본 발명에서 사용될 수 있는 AAV 서열은 임의의 AAV 혈청형의 게놈으로부터 유래될 수 있다. 일반적으로, AAV 혈청형은 아미노산 및 핵산 수준에서 유의적인 상동성의 게놈 서열을 가지며, 유전 기능의 동일한 세트를 제공하고, 필수적으로 생리학적으로 및 기능적으로 등가인 비리온을 생산하며, 실제로 동일한 메카니즘에 의해 복제 및 조립된다. 다양한 AAV 혈청형의 게놈 서열 및 게놈 유사성의 고찰을 위해 예컨대, GenBank 수탁 번호 U89790; GenBank 수탁 번호 J01901; GenBank 수탁 번호 AF043303; GenBank 수탁 번호 AF085716; Chlorini et al. (1997, J. Vir. 71: 6823-33); Srivastava et al. (1983, J. Vir. 45:555-64); Chlorini et al. (1999, J. Vir. 73:1309-1319); Rutledge et al. (1998, J. Vir. 72:309-319); 및 Wu et al. (2000, J. Vir. 74: 8635-47)를 참고한다. 임의의 AAV 혈청형은 본 발명의 문맥에서 사용하기 위한 AAV 뉴클레오타이드 서열의 공급원으로서 제공될 수 있다. 바람직하게는 본 발명의 문맥에서 사용하기 위한 AAV ITR 서열은 AAV1, AAV2, AAV4 및/또는 AAV7로부터 유래된다. 유사하게, Rep(Rep78/68 및 Rep52/40) 암호화서열은 바람직하게는 AAV1, AAV2, AAV4 및/또는 AAV7로부터 유래된다. 그러나, 본 발명의 문맥에서 사용하기 위한 VP1, VP2, 및 VP3 캡시드 단백질을 암호화하는 서열은 임의의 공지된 42개의 혈청형으로부터, 보다 바람직하게는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8. AAV9, AAV10, AAV11, AAV12 또는 AAV13으로부터 또는 예컨대, 캡시드 셔플링 기술 및 AAV 캡시드 라이브러리에 의해 수득된 새로이 개발된 AAV-유사 입자로부터, 또는 새로이 및 합성적으로 설계되거나, 개발되거나 포괄된 캡시드, 예를 들면, Anc-80 캡시드로부터 취할 수 있다.

AAV Rep 및 ITR 서열은 대부분의 혈청형 중에서 특히 보존된다. 다양한 AAV 혈청형의 Rep78 단백질은 예컨대, 89% 이상 동일하고 AAV2, AAV3A, AAV3B, 및 AAV6 사이에서 게놈 수준에서 전체 뉴클레오타이드 서열 동일성은 대략 82%이다(Bantel-Schaal et al., 1999, J. Virol., 73(2):939-947). 더욱이, 많은 AAV 혈청형의 Rep 서열 및 ITR은 포유동물 세포 내에서 AAV 입자의 생산시 다른 혈청형으로부터의 상응하는 서열을 효율적으로 교차-보충(즉, 기능적으로 치환)하는 것으로 알려져 있다. 제US2003148506호는 AAV Rep 및 ITR 서열이 곤충 세포 내에서 다른 AAV Rep 및 ITR 서열과 효율적으로 교차-보충(cross-complementing)함을 보고한다.

또한 VP 단백질로서 알려진, AAV 캡시드 단백질은 AAV 비리온의 세포 편향을 결정하는 것으로 알려져 있다. VP 단백질-암호화 서열은 상이한 AAV 혈청형 중에서 Rep 단백질 및 유전자보다 유의적으로 거의 보존되지 않는다. 다른 혈청형의 상응하는 서열을 교차-보충하는 Rep 및 ITR 서열의 능력은 혈청형(예컨대, AAV3)의 캡시드 단백질 및 다른 AAV 혈청형(예컨대, AAV2)의 Rep 및/또는 ITR 서열을 포함하는 슈도형 rAAV 입자의 생산을 허용한다. 이런 슈도형 rAAV 입자는 본 발명의 일부이다.

변형된 "AAV" 서열은 또한 예컨대, 곤충 세포 내에서 rAAV 벡터의 생산을 위해, 본 발명의 문맥에서 사용될 수 있다. 이러한 변형된 서열은 예컨대, 야생형 AAV ITR, Rep, 또는 VP 서열 대신에 사용될 수 있는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV10, AAV11, AAV12 또는 AAV13 ITR, Rep, 또는 VP에 대해 적어도 약 70%, 적어도 약 75%, 적어도 약 80%, 적어도 약 85%, 적어도 약 90%, 적어도 약 95% 이상의 뉴클레오타이드 및/또는 아미노산 서열 동일성(예컨대, 75 내지 99% 뉴클레오타이드 서열 동일성을 갖는 서열)을 갖는 서열을 포함한다.

많은 측면에서 다른 AAV 혈청형과 유사하지만, AAV5는 다른 사람 및 시미안(simian) 혈청형보다 더 다른 사람 및 시미안 AAV 혈청형과는 상이하다. 이러한 측면에서, rAAV5의 생산은 곤충 세포 내에서 다른 혈청형의 생산과는 상이할 수 있다. 본 발명의 방법을 사용하여 rAAV5를 생산하는 경우, 종합적으로, 하나 이상의 작제물, AAV5 ITR을 포함하는 뉴클레오타이드 서열의 경우에, 뉴클레오타이드 서열이 AAV5 Rep 암호화 서열을 포함하는 것이 바람직하다(즉, 뉴클레오타이드 서열은 AAV5 Rep78을 포함한다). 이러한 ITR 및 Rep 서열은 경우에 따라 변형되어 곤충 세포 내에서 rAAV5 또는 슈도형 rAAV5 벡터의 효율적인 생산을 수득할 수 있다. 예컨대, Rep 서열의 출발 코돈은 변형될 수 있고/있거나, VP 스플라이스 부위는 변형되거나 제거될 수 있고/있거나 VP1 출발 코돈 및 근처 뉴클레오타이드는 변형되어 곤충 세포 내에서 rAAV5 벡터의 생산을 개선시킬 수 있다.

바람직한 구현예에서, 본 발명의 곤충 세포는 적어도 하나의 파르보바이러스 ITR 서열에 의해 플랭킹되는 전이유전자를 포함하는 뉴클레오타이드 서열을 추가로 포함한다. 따라서, 바람직하게는 뉴클레오타이드 서열은 적어도 하나의 AAV ITR 및 목적한 유전자 생성물을 암호화하는 적어도 하나의 뉴클레오타이드 서열(바람직하게는 포유동물 세포 내에서 발현시키기 위한) 또는 목적한 유전자를 표적화하는 뉴클레오타이드 서열(바람직하게는 포유동물 세포 내에서 상기 목적한 유전자를 사일런싱하기 위한)을 포함함으로써, 바람직하게는 목적한 유전자 생성물을 암호화하거나 목적한 유전자를 표적화하는 적어도 하나의 뉴클레오타이드 서열은 곤충 세포 내에서 생산된 AAV의 게놈 내로 혼입된다. 바람직하게는, 목적한 유전자 생성물을 암호화하는 적어도 하나의 뉴클레오타이드 서열은 포유동물 세포 내에서 발현을 위한 서열이다. 바람직하게는, 목적한 유전자를 표적화하는 적어도 하나의 뉴클레오타이드 서열은 포유동물 세포내에서 상기 목적한 유전자를 사일런싱하기 위한 서열이고, 바람직하게는, 뉴클레오타이드 서열은 2개의 AAV ITR 뉴클레오타이드 서열을 포함하고 여기서 목적한 유전자를 암호화하거나 목적한 유전자를 표적화하는 적어도 하나의 뉴클레오타이드 서열은 2개의 AAV ITR 뉴클레오타이드 서열 사이에 위치한다. 바람직하게는, 복적한 유전자 생성물을 암호화하는 뉴클레오타이드 서열(포유동물 세포 내에서 발현시키기 위한) 또는 목적한 유전자를 표적화하는 뉴클레오타이드 서열(포유동물 세포 내에서 상기 목적한 유전자를 사일런싱하기 위한)은 이것이 2개의 정규 ITR 사이에 위치하거나 2개의 D 영역을 지닌 가공된 ITR의 어느 한쪽 측면에 위치하는 경우 곤충 세포 내에서 생산된 AAV 게놈 내로 혼입될 것이다. 따라서, 바람직한 구현예에서, 본 발명은 본 발명에 따른 곤충 세포를 제공하고, 여기서 뉴클레오타이드 서열은 2개의 AAV ITR 뉴클레오타이드 서열을 포함하고, 여기서 목적한 유전자 생성물을 암호화하는 적어도 하나의 뉴클레오타이드 서열 또는 목적한 유전자를 표적화하는 적어도 하나의 뉴클레오타이드 서열은 2개의 AAV ITR 뉴클레오타이드 서열 사이에 위치한다.

전형적으로, ITR 및 프로모터 & 폴리아데닐화 서열을 포함하는 전이유전자는 길이가 5,000개 미만의 뉴클레오타이드(nt)이다. 다른 구현예에서, 너무 큰 DNA 분자, 즉, 길이가 5,000개 nt 이상인 분자는 본 발명에 의해 기술된 AAV 벡터를 사용함으로써 시험관 내에서 또는 생체 내에서 발현될 수 있다. 너무 큰 DNA는 여기서 5.5 kbp의 최대 AAV 패키딩 한계를 초과하는 DNA로 이해된다. 따라서, AAV 벡터의 생성은 또한 실현가능한 5.0 kb 보다 큰 게놈에 의해 일반적으로 암호화된 재조합 단백질을 생산할 수 있다.

따라서 본원에서 상기 정의된 바와 같은 전이유전자를 포함하는 뉴클레오타이드 서열은 목적한 유전자 생성물을 암호화하는 뉴클레오타이드 서열(포유동물 세포 내에서 발현시키기 위해) 또는 목적한 유전자를 표적화하는 뉴클레오타이드 서열(포유동물 세포 내에서 상기 목적한 유전자를 사일런싱하기 위해)을 포함하고, 이것이 곤충 세포내에서 복제된 재조합 파르보바이러스(rAAV) 벡터 내로 혼입되도록 위치할 수 있다. 본 발명의 문맥에서, "목적한 유전자 생성물"이 발현되거나 사일런싱되는 특히 바람직한 포유동물 세포는 사람 세포인 것으로 이해된다. 임의의 뉴클레오타이드 서열은 본 발명에 따라서 생산된 재조합 파르보바이러스(rAAV) 벡터로 형질감염된 포유동물 세포 내에서 이후 발현을 위해 혼입될 수 있다. 뉴클레오타이드 서열은 예컨대, 단백질을 암호화할 수 있거나 이는 RNAi 제제, 즉, 예컨대, shRNA(짧은 헤어핀RNA) 또는 siRNA(짧은 방해 RNA)와 같은 RNA 방해할 수 있는 RNA 분자를 발현할 수 있다. "siRNA"는 포유동물 세포 내에서 독성이 아닌 짧은 길이의 이중-가닥 RNA인 짧은 방해 RNA를 의미한다(Elbashir et al., 2001, Nature 411: 494-98; Caplen et al., 2001, Proc. Natl. Acad. Sci. USA 98: 9742-47). 바람직한 구현예에서, 전이유전자를 포함하는 뉴클레오타이드 서열은 2개의 코딩 뉴클레오타이드 서열을 포함할 수 있고, 각각은 포유동물 세포 내에서 발현시키기 위한 하나의 목적한 유전자 생성물을 암호화한다. 목적한 생성물을 암호화하는 2개의 뉴클레오타이드 서열 각각은 이것이 곤충 세포 내에서 복제된 재조합 파르보바이러스(rAAV) 내로 혼입되도록 위치한다.

포유동물 세포 내에서 발현시키기 위한 목적한 생성물은 치료학적 유전자 생성물일 수 있다. 치료학적 유전자 생성물은 표적 세포 내에서 발현된 경우, 목적한 치료학적 효과를 제공하는 폴리펩타이드, 또는 RNA 분자(si/sh/miRNA), 또는 다른 유전자일 수 있다. 목적한 치료학적 효과는 예를 들면, 목적하지 않은 활성(예컨대, VEGF)의 절제(ablation), 유전자 결함의 보충, 질환을 유발하는 유전자의 사일런싱, 효소 활성 또는 임의의 다른 질환-개실 효과에서 결함의 회복일 수 있다. 치료학적 폴리펩타이드 유전자 생성물의 예는 성장 인자, 응고 캐스케이드의 부분을 형성하는 인자, 효소, 지단백질, 사이토킨, 신경영양 인자, 호르몬 및 치료학적 면역글로불린 및 이의 변이체를 포함하나, 이에 한정되지 않는다. 치료학적 RNA 분자 생성물의 예는 스플라이싱 질환(silencing disease), 예를 들면, 그러나 이에 한정되지 않는 폴리글루타민 질환(polyglutamine disease), 이상지질혈증(dyslipidaemia) 또는 근위축성 측색 경화증(amyotrophic lateral sclerosis; ALS)에서 효과적인 miRNA를 포함한다.

본 발명에 따라 생산된 재조합 파르보바이러스(rAAV) 벡터를 사용하여 치료할 수 있는 질환은 일반적으로 유전적 원인 또는 기반을 갖는 것 이외에는, 특별히 제한되지 않는다. 예를 들면, 개시된 벡터로 치료될 수 있는 질환은 급성 간헐 포르피린증(acute intermittent porphyria; AIP), 노화 관련 황반 변성(age-related macular degeneration), 알츠하이머 질환(Alzheimer's disease), 관절염(arthritis), 배턴 질환(Batten disease), 캐너번 질환(Canavan disease), 시투룰린혈증 제1형(Citrullinemia type 1), 크리글러 나자르 질환(Crigler Najjar), 울혈성 심부전(congestive heart failure), 낭성 섬유증(cystic fibrosis), 뒤센느 근위축증(Duchene muscular dystrophy), 이상지질혈증(dyslipidemia), 글리코겐 저장 질환 제I형(glycogen storage disease type I; GSD-I), 혈우병(hemophilia) A, 혈우병 B, 유전성 폐기종(hereditary emphysema), 동질접합체적 가족성 고콜레스테롤혈증(homozygous familial hypercholesterolemia; HoFH), 헌팅톤 질환(Huntington's disease; HD), 레베르 선천성 흑암시(Leber's congenital amaurosis), 메틸말론 아카데미아(methylmalonic academia), 오르니틴 트랜스카바밀라제 결핍증(ornithine transcarbamylase deficiency; OTC), 파킨슨 질환(Parkinson's disease), 페닐케톤뇨증(phenylketonuria; PKU), 척수성 근위축(spinal muscular atrophy), 마비(paralysis), 윌슨 질환(Wilson disease), 간질(epilepsy), 폼페 질환(Pompe disease), 근위축성 측색 경화증(amyotrophic lateral sclerosis; ALS), 테이-새크스 질환(Tay-Sachs disease), 고옥살산뇨(hyperoxaluria) 9PH-1), 척수소뇌실조증 제1형(spinocerebellar ataxia type 1; SCA-1), SCA-3, u-디스트로핀(dystrophin), 가우처 제II형 또는 제III형(Gaucher's types II or III), 부정맥유발성 우심실 형성이상(arrhythmogenic right ventricular cardiomyopathy; ARVC), 파브리 질환(Fabry disease), 가족성 지중해열(familial Mediterranean fever; FMF), 프로피온산 혈증(proprionic acidemia), 취약 X 증후군(fragile X syndrome), 레트 증후군(Rett syndrome), 니만-피크 질환(Niemann-Pick disease) 및 크라베 질환(Krabbe disease)을 포함하나, 이에 한정되지 않는다. 발현될 치료학적 유전자 생성물의 예는 N-아세틸글루코스아미니다제, 알파(NaGLU), Treg167, Treg289, EPO, IGF, IFN, GDNF, FOXP3, 인자 VIII, 인자 IX 및 인슐린을 포함한다.

대안적으로 또는, 또한 다른 유전자 생성물로서, 본원의 상기 정의한 바와 같은 전이유전자를 포함하는 뉴클레오타이드 서열은 세포 형질전환 및 발현을 평가하기 위한 선택 마커 단백질로서 제공되는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 추가로 포함할 수 있다. 이러한 목적에 적합한 마커 단백질은 예컨대, 형광성 단백질 GFP, 및 선택가능한 마커 유전자 HSV 티미딘 키나제(HAT 배지에서 선택을 위해), 세균 하이그로마이신 B 포스포트랜스퍼라제(하이드로마이신 B에서 선택을 위해), Tn5 아미노글리코시드 포스포트랜스퍼라제(G418에서 선택을 위해), 및 디하이드로폴레이트 리덕타제(DHFR)(메토트렉세이트 상에서 선택을 위해), CD20, 저 친화성 신경 성장 유전자이다. 이러한 마커 유전자를 수득하기 위한 공급원 및 이의 사용 방법은 문헌(Sambrook and Russel, 상기 참고)에서 제공된다. 본원의 상기에 정의된 바와 같은 전이유전자를 포함하는 뉴클레오타이드 서열은 필요한 경우, 본 발명의 재조합 파르보바이러스(rAAV) 벡터로 형질도입된 세포로부터 대상체를 치유하도록 하는 안전 보장 메카니즘(fail-safe mechanism)으로서 제공될 수 있는 폴리펩타이드를 암호화하는 뉴클레오타이드 서열을 추가로 포함할 수 있다. 자살 유전자(suicide gene)로서 흔히 지칭되는 이러한 뉴클레오타이드 서열은 전구약물(prodrug)을 단백질이 발현되는 유전자전이 세포를 사멸시킬 수 있는 독성 물질로 전환시킬 수 있는 단백질을 암호화한다. 이러한 자살 유전자의 적합한 예는, 예컨대, 이. 콜라이 사이토신 데아미나제 유전자 또는 헤르페스 단성 바이러스(Herpes Simplex Virus), 사이토메갈로바이러스(Cytomegalovirus) 및 바르셀라-조스타 바이러스(Varicella-Zoster virus)로부터의 티미딘 키나제 유전자 중 하나를 포함하고, 여기서 간시클로비르(ganciclovir)는 대상체 내에서 유전자이식 세포를 사멸시키는 전구약물로서 사용될 수 있다(참고: 예컨대, Clair et al., 1987, Antimicrob. Agents Chemother. 31: 844-849).

포유동물 세포 내에서 발현시키기 위한, 본원의 상기에 정의된 바와 같은 전이유전자를 포함하는 뉴클레오타이드 서열은 또한 바람직하게는 적어도 하나의 포유동물 세포-얄립성 발현 제어 서열, 예컨대, 목적한 유전자 생성물을 코딩하는 서열에 작동 가능하게 연결된 프로모터를 포함한다. 많은 이러한 프로모터는 당해 분야에 공지되어 있다(참고: Sambrook and Russel, 2001, 상기 참고). 많은 세포형에서 광범위하게 발현된 구성적 프로모터, 예를 들어, CMV 프로모터를 사용할 수 있다. 그러나, 유도성의 조직-특이적이거나, 세포-특이적이거나, 세포 주기-특이적인 프로모터가 보다 바람직할 것이다. 예를 들면, 간-특이적인 발현(제PCT/EP2019/081743호에 기술된 바와 같이)의 경우 프로모터는 α1-항-트립신 프로모터, 갑상선 호르몬-결합 글로빈 프로모터, 알부민 프로모터, LPS(티록신-결합 글로빈) 프로모터, HCR-ApoCII 하이브리드 프로모터, HCR-hAAT 하이브리드 프로모터 및 아포지단백질 E 프로모터, LP1, HLP, 최소 TTR 프로모터, FVIII 프로모터, 하이페론 인핸서, ealb-hAAT로부터 선택될 수 있다. 다른 예는 종양-선택적인, 및, 특히 신경 세포 종양-선택적인 발현을 위한 E2F 프로모터(Parr et al., 1997, Nat. Med. 3:1145-9) 또는 단핵 혈액 세포에서 사용하기 위한 IL-2 프로모터(Hagenbaugh et al., 1997, J Exp Med; 185: 2101-10)를 포함한다.

곤충 세포 내에서 적절한 발현을 위한, 상기 정의된 바와 같은 뉴클레오타이드 서열, 예컨대, 야생형 파르보바이러스 서열의 다양한 변형은 예컨대, 문헌: Sambrook and Russell (2001) "Molecular Cloning: A Laboratory Manual (3rd edition), Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, New York에 기술된 바와 같은 잘-공지된 유전 가공 기술을 적용함으로써 달성된다. 암호화 영역의 다양한 추가의 변형은 암호화 단백질의 수율을 증가시킬 수 있는 당해 분야의 숙련가에게 알려져 있다. 이러한 변형은 본 발명의 영역 내에 있다.

AAV

본 발명의 재조합 파르보바이러스(rAAV) 벡터에서 포유동물 세포 내에서 발현을 위한 전이유전자 또는 목적한 유전자 생성물을 암호화하는 적어도 하나의 뉴클레오타이드 서열(들)은 바람직하게는 적어도 하나의 포유동물 세포-양립성 발현 제어 서열, 예컨대, 프로모터에 작동 가능하게 연결되어 있다. 상기 논의된 바와 같이, 많은 이러한 프로모터는 당해 분야에 공지되어 있다.

AAV는 다수의 포유동물 세포를 감염시킬 수 있다. 예컨대, 문헌: Tratschin et al. (1985, Mol. Cell Biol. 5:3251-3260) 및 Grimm et al. (1999, Hum. Gene Ther. 10:2445-2450)를 참고한다. 그러나, 사람 AAV 활액 섬유아세포의 형질도입은 유사한 쥐 세포(murine cell)에서보다 유의적으로 보다 효율적이고(Jennings et al., Arthritis Res, 3:1 (2001), AAV의 세포 향성은 혈청형 중에서 상이하다. 예컨대, 문헌: Davidson et al. (2000, Proc. Natl. Acad. Sci. USA, 97:3428-3432)를 참고하며, 이는 포유동물 CNS 세포 향성 및 형질도입 효능과 관련하여 AAV2, AAV4, 및 AAV5 중에서의 차이를 논의하고 있다. 바람직한 구현예에서, 본 발명의 숙주 세포는 파르보바이러스 비리온에 의해 감염될 수 있는 임의의 포유동물 세포, 예를 들면, 그러나 이에 한정되지 않는 근육 세포, 간 세포, 신경 세포, 교질 세포 및 상피 세포이다. 바람직한 구현예에서, 본 발명의 숙주 세포는 사람 세포이다.

방법

추가의 양태에서, 본 발명은 재조합 파르보바이러스 비리온을 생산하는 방법을 제공한다. 방법은 바람직하게는 a) 본원에 정의된 바와 같은 곤충 세포를 배양하는 단계; b) a)에서 배양된 세포에 본원에 정의된 바와 같은 뉴클레오타이드 서열을 제공하는 단계; 및 c) 재조합 파르보바이러스 비리온을 회수하는 단계를 포함한다. 일 구현예에서, a)에서 세포 배양은 본원에 정의된 바와 같은 뉴클레오타이드 서열로 또한 감염된 것으로 알려진, 형질감염된다.

회수는 바람직하게는 항-AAV 항체, 바람직하게는 고정된 항체를 사용하여 재조함 파르보바이러스(rAAV) 벡터(를 포함하는 비리온)의 친화성-정제의 단계를 포함한다. 항-AAV 항체는 바람직하게는 모노클로날 항체이다. 특히 적합한 항체는 예컨대, 카멜(camel) 또는 라마(llama)로부터 수득가능한 것으로서 단일 쇄 카멜리드 항체 또는 이의 단편이다(참고: 예컨대, Muyldermans, 2001, Biotechnol. 74: 277-302). rAAV의 친화성-정제를 위한 항체는 AAV 캡시드 단백질 상의 에피토프에 특이적으로 결합하는 항체이고, 이에 의해, 바람직하게는 에피토프는 하나 이상의 AAV 혈청형의 캡시드 단백질 상에 존재하는 에피토프이다. 예컨대, 항체는 AAV2 캡시드에 대한 특이적인 결합을 기반으로 상승되거나 선택될 수 있지만 동시에 또한 이는 AAV1, AAV3 및 AAV5 캡시드에 특이적으로 결합할 수 있다.

추가의 구현예에서, 여기서 단계 c)에서 재조합 파르보바이러스 비리온의 회수는 고정된 항-파르보바이러스 항체, 바람직하게는 단일 쇄 카멜리드 항체 또는 이의 단편을 사용한 비리온의 친화성-정제, 및 공칭 공극 크기가 30 내지 70 m인 필터 위에서 여과 중 적어도 하나를 포함한다.

따라서, 일 구현예에서 본 발명은 세포 내에서 재조합 파르보바이러스 비리온을 생산하는 방법을 제공한다. 방법은 바람직하게는: a) 본원에 정의된 바와 같은 곤충 세포를 배양하는 단계; b) a)에서 배양된 세포를 본원에 정의된 바와 같은 뉴클레오타이드 서열로 감염시키는 단계; 및, c) 재조합 파르보바이러스 비리온을 회수하는 단계를 포함하고 여기서 단계 b)에서 재조합 파르보바이러스 비리온의 회수는 고정된 항-파르보바이러스 항체, 바람직하게는 단일 쇄 카멜리드 항체 또는 이의 단편을 사용한 비리온의 친화성-정제, 또는 공칭 공극 크기가 30 내지 70 nm인 필터 위에서의 여과 중 적어도 하나를 포함한다.

추가의 양태에서, 본 발명은 본 발명의 상술한 방법에서 생산된 파르보바이러스 비리온의 배치에 관한 것이다. "파르보바이러스 비리온의 배치"는 임의로 곤충 세포의 용기 당 본원에서 동일한 생산 라운드에서 생산된 모든 파르보바이러스 비리온으로서 정의된다. 바람직한 구현예에서, 본 발명의 파르보바이러스 비리온의 배치는 상술한 바와 같은 전체 비리온(full virion):총 비리온(total virion) 비 및/또는 상술한 바와 같은 전체 비리온:빈(empty) 비를 포함한다.

키트

추가의 양태에서, 본 발명은 적어도 본원에 정의된 바와 같은 곤충 세포 및 본원에 정의된 바와 같은 바큘로바이러스 벡터 및/또는 뉴클레오타이드 서열을 포함하는 부분의 키트를 제공한다.

도 1. (A) 리포터 또는 pCLD 발현 작제물을 포함하는 일시적인 형질감염 및 바큘로바이러스 트랜스활성화 연구의 개략적 표시. 루시퍼라제 활성은 나노-루시퍼라제 리포토 연구를 위해 측정되었고 웨스턴 블롯을 수행하여 pCLD 작제물로부터 Rep 발현을 측정하였다. GSG-P2A는 자가-절단 펩타이드(Wang et al., 2015)이다. (B) 감염 후 48시간 째에 상이한 바큘로바이러스 트랜스활성화의 영향 하에서 나타낸 조절 성분을 지닌 나타낸 pCLD로부터의 AAV Rep 단백질의 발현 프로파일. T: Bac Trans. CT: Bac polH Cap Trans. C: Bac polH Cap. (C) 나타낸 바큘로바이러스 트랜스활성화시 나타낸 프로모터에 의해 조절된 리포터 유전자 발현(나노-루시퍼라제)의 역학 및 강도. 발광성의 척도인, 상대적인 루시퍼라제 단위(relative luciferase unit: RLU)를 30 μl의 샘플 용적에서 측정하였다. 모의(Mock)(원): 동일한 용적의 신선한 배지로 접종됨. Bac Trans(사각형): AAV ITR-전이유전자-ITR 만을 지닌 재조합 바큘로바이러스. Bac polH Cap Trans (triangles): polH 조절된 AAV Cap 유전자 및 ITR-전이유전자-ITR을 지닌 재조합 바큘로바이러스. Bac polH Cap: polH 조절된 AAV2 Cap 유전자 만을 지닌 재조합 바큘로바이러스. 각각의 데이타 점은 독립된 실험 복제물을 나타낸다.
도 2. (A) 곤충 세포 내에서 상이한 상동성 반복체(hr) 성분의 인핵서 활성을 비교하기 위해 사용된 리포터 작제물의 분자 설계. polH 프로모터를 대표적인 프로모터로서 선택하였다. (B) 바큘로바이러스 게놈 내 모든 hr 서열의 뉴클레오타이드 유사성의 퍼센트. (C 및 D) 나타낸 바큘로바이러스 트랜스활성화시 나타낸 hr 인핸서에 의해 조절된 리포터 유전자의 역학 및 강도. 상대적인 루시퍼라제 단위(relative luciferase unit; RLU)를 30 μl의 샘플 용적에서 측정하였다. 각각의 ㅈㅁ은 독립된 실험의 복제물을 나타낸다. (E) AAV Rep 발현에서 상이한 hrs의 인핸서 활성을 비교하기 위한 pCLD의 분자 설계. (F) 감염 후 48시간 째에 상이한 hr 인핸서의 영향 하에서 AAV Rep 단백질의 발현 프로파일. T: Bac Trans.
도 3. (A) Bac polH Cap Trans 트랜스활성화시 관찰된 시스:트랜스 프로모터를 최소화하는 유도성의 단일-Rep 카세트 플라스미드 벡터의 대안적인 분자 설계. (B) 나타낸 바큘로바이러스 트랜스활성화 후 48시간 째에 거의 리키하지 않은(less leaky) hr4b 인핸서 및 보다 강력한 ATG와 함께 나타낸 프로모터의 제어 하에서 AAV Rep 단백질의 발현 프로파일. T: Bac Trans. CT: Bac polH Cap Trans.
도 4. (A) 나타낸 바큘로바이러스 트랜스활성화시 대안의 바큘로바이러스 프로모터에 의해 조절된 리포터 유전자 발현의 역학 및 강도. (B) 39k 프로모터에 대한 대안의 또는 준최적 출발 코돈을 특성화하는데 사용된 리포터 작제물의 분자 설계. hr2.09 인핸서를 대표적인 인핸서로서 선택하였다. (C) 나타낸 바큘로바이러스 트랜스활성화에 의해 나타낸 대안의 출발 코돈을 지닌 리포터 유전자 발현의 역학 및 강도. (D) 39k 프로모터 및 ACG 출발 코돈의 조절 하에서 AAV Rep 발현 프로파일을 관찰하기 위한 pCLD 작제물의 분자 설계 또는 (E) 인공 인트론 내에서 추가의 프로모터 성분 하에서. 나타낸 바큘로바이러스 트랜스활성화시 나타낸 단일-Rep 카세트 pCLD로부터 AAV Rep 단백질의 웨스턴 블롯. 상대적인 루시퍼라제 단위(RLU)를 30 μl의 샘플 용적으로 측정하였다. 각각의 데이타 점은 별개의 실험 복제물(replicate)을 나타낸다.
도 5. (A) 코돈 최적화된 AAV2 Rep의 뉴클레오타이드 유사성의 퍼센트. (B) 나타낸 조절 성분을 지닌 유도성 분할-Rep 카세트 플라스미드 벡터의 분자 설계. (C) 나타낸 바큘로바이러스 트랜스활성화시 분할-Rep 카세트 플라스미드 벡터의 발현 프로파일. ((+) 및 우측 화살표): 전방 배향. ((-) 및 좌측 화살표): 역-보충된 배향. T: Bac Trans. CT: Bac polH Cap Trans.
도 6. (A) 일시적인 AAV 생산 실험 설정의 개략도. (B 및 C) 나타낸 pCLD 형질감염 및 바큘로바이러스 트랜스활성화를 사용한 일시적인 AAV 생산 후 3일 때에 수거한 조 분해물 완충제(crude lysate buffer: CLB) 중 뉴클레아제 내성 AAV 입자의 게놈 카피 역가(GC/ml). Bac Cap5 FIX(원): polH 조절된 AAV Cap5 유전자 및 ITR-FIX-ITR을 지닌 재조합 바큘로바이러스. Bac Cap2/5 나노-루시퍼라제(삼각형): nano-luciferase (triangles): polH 조절된 AAV Cap2/5(AAV2/5) 유전자 및 ITR-분비된-Nano-Luc-ITR을 지닌 재조합 바큘로바이러스. (D 및 E) 일시적인 AAV 생산 실험으로부터의 AAV Rep 역학 및 발현 프로파일. 각각의 기호는 AAV 배치 생산의 별개의 복제물을 나타낸다.
도 7. (A) AVB 정제된 AAV2/5 나노-루시퍼라제의 VP1:2:3 프로파일 (B) Huh7 세포내에서 설정된 AAV 효능 검정의 개략도. 일시적인 AAV 생산으로부터 생산된 AVB 정제된 AAV2/5 입자를 표준화하고 세포 당 10⁵또는10⁴개의 GC 용량에서 Huh7 세포를 접종하는데 사용하였다. 감염 후 3일째에(days post infection)(d.p.i), AAV2/5 입자 형질도입의 효능을 상층액 내로 분비된 나노-루시퍼라제 활성(상대적인 루시퍼라제 단위/RLU)로 측정하였다. (C) 나타낸 Rep 플라스미드 벡터(pCLD)를 사용하여 일시적인 AAV 생산으로부터 생산된 정제된 AAV의 효능 비교. Bac Rep183: BEV 유래된 AAV 물질. 각각의 기호는 AAV 배치 생산의 별개의 복제물을 나타낸다.
도 8. (A) 변성된 포름알데하이드 아가로스 겔 상에서 나타낸 pCLD 일시적인 형질감염 실험으로부터 생산된 AAV 배치로부터 추출된, AAV DNA 벡터 게놈의 분자 분석. FIX 및 나노-루시퍼라제 벡터 게놈에 대한 전체 ITR - 전이유전자 - ITR 크기는 각각 2.5 kb 및 2 kb이었다. 검정색 화살표: FIX 또는 나노-루시퍼라제 벡터 게놈의 이량체 복제 형태. 백색 화살표: 단량체 복제형. m: 스마트 DNA 레더(smart DNA ladder). High/low exp: 총 조립된 AAV5 캡시드/GC 역가 방법을 기반으로 (B) 이론적인 AAV 총:전체 비(TF) 동안 겔 노출. 총 조립된 캡시드의 수는 AVB 정제된 AAV 입자에서 ELISA 분석을 수행함으로써 측정하였다. GC 역가는 또한 동일한 AVB 정제된 입자로부터 수득하였다.
도 9. (A) 신규의 안정한 iRep expresSf+ 세포주의 생성의 개략도. (B) 조 분해 완충제(CLB) 속에서 및 나타낸 iRep 세포주 및 바큘로바이러스 트랜스활성화를 사용한 일시적인 AAV 생산 후 3일째에 수거된 뉴클레아제 내성 AAV 입자의 게놈 카피 역가(GC/ml) 및 생산성(GC/도입 세포(input cell)). 각각의 기호는 AAV 배치 생산의 별개의 복제물을 나타낸다. (C) 일시적인 AAV 생산 실험으로부터의 AAV Rep 역학 및 발현 프로파일.
도 10. (A) 나타낸 바와 같은 iRep 세포주로부터 생산된 ABV 정제된 AAV2/5 sNano-Luc의 Vp1:2:3 프로파일. (B) Huh7 세포 내에서 정제된 AAV 입자의 효능 비교. 3-ple Bac: 3개의 Bac 생산 플랫폼으로부터 생산된 AAV 물질 및 Bac Rep: 야생형 ExpresSf+ 세포 내에서 Bac Cap Trans 및 Bac Rep 조합으로부터 생산된 AAV 물질.
도 11. (A) 입자 품질 연구 및 공급 방법을 위한 AAV5 FIX 정제된 물질의 목록. iRep 세포주를 야생형 ExpresSf+ 세포 및 Bac Rep의 사용으로 대체하여 AAV 물질을 생산하였다 (B) 변성하는 포름알데하이드 아가로스 겔 상에서, AAV 물질로부터 추출된 AAV DNA 벡터 게놈의 분자 분석. FIX 벡터 게놈에 대한 전체 ITR - 전이유전자 - ITR 크기는 2.5 kb이다. 검정색 및 백색 화살표: FIX의 이량체 단량체 복제형. (C) 총 조립된 AAV5 캡시드/GC 역가 방법을 기반으로 한 이론적인 AAV 총:전체 비(TF). 총 조립된 캡시드는 정제된 AAV 입자에서의 분석을 기반으로 HPLC를 수행함으로써 측정하였다. GC 역가는 또한 동일한 입자로부터 수득하였다. (D) 정제된 AAV 물질에서 잔류 Bac DNA 오염의 정량화. 결과는 1 x 10¹³개의 AAV GC 당 Bac DNA의 비로 나타낸다.
도 12. 본 연구에 사용된 플라스미드의 물리적 맵(map): A) pCLD 046; B) pCLD 050; C) pCLD 051; D) pCLD 052; E) pCLD 053; 및 F) pCLD 054).
도 13. 합성 hr 서열을 포함하는, 모든 바큘로바이러스 hr 서열의 뉴클레오타이드 정렬 및 크기. 선은 나타낸 hr 서열을 나타낸다.
도 14. A) 내지 R): 야생형 Rep52, Rep183 Rep52(제WO2009/014445호에 기술된 바와 같음) 및 극도의-코돈-최적화된 Rep52 코딩 서열(서열 번호: 15)의 암호화 서열의 뉴클레오타이드 정렬.
도 15. (A) iRep 안정한 세포 혼주물(cell pool)의 확인을 위한 실험 설정 개략도. 황색은 1L의 진탕 플라스크 속에서 예비-배양 계대배양물을 나타낸다(계대배양 0-3). 녹색은 2L STR에서 씨드 무리 생산(seed train production)을 나타낸다(계대배양 4 내지 9). 적색은 2L STR로부터 계대배양 5, 7, 및 9에서 iRep 안정한 세포 혼주물을 사용하여 바큘로바이러스 Bac Cap5 FIX 계대배양 5로 형질감염시킴에 의한 1L들이 진탕 플라스크 속에서 AAV 생산 현상을 나타낸다. (B) iRep 안정한 혼주물의 확인을 위한 시각표. 괄호 안의 숫자는 형질감염에 사용된 iRep 안정한 혼주물 세포의 생성을 나타내었다. (C) Bac Cap5 FIX (P5)로 형질감염한 후 48 및 72시간 째에 계대배양 5, 7, 및 9에서 iRep 안정한 혼주물 세포 속에서 Rep 78 및 Rep 52의 발현. (D) Bac Cap5 FIX (P5)로 형질감염 후 72시간째의 결과로서 FCLB 내 전이유전자 FIX의 게놈 카피. MOI는 iRep 안정한 혼주물 세포의 형질감염에 사용된 Bac Cap5 FIX P5의 용적 비를 나타낸다. 괄호 안의 숫자는 형질감염을 위해 사용된 iRep 안정한 혼주물 세포의 계대배양 수를 나타낸다.

실시예

물질 및 방법

세포 배양

Huh7 세포를 37℃, 5% CO2에서 10%(v/v) 태아 소 혈청(fetal bovine serum; FBS)이 보충된 둘베코 변형된 이글 배지(Dulbecco's modified Eagle's medium)(DMEM, Invitrogen) 속에 유지시켰다. Sf9 및 ExpresSf+ 세포를 진탕 플라스크 속에서 Sf-900 II SFM(Gibco) 속에서 28℃, 135 rpm에서 유지시켰다. Sf9 세포의 경우에, 배양된 세포에 10% FBS(Gibco)를 보충하였다.

유도성 발현 플라스미드 및 재조합 바큘로바이러스 작제(construction)

모든 유도성 발현 플라스미드 시리즈(pCLDs) 및 나노-루시퍼라제 리포터 작제물을 GeneArt 유전자 합성 서비스(ThermoFisher)를 사용하여 생성시켰다. ITR-전이유전자-ITR 단독(Bac Trans) 또는 AAV Cap 발현 카세트 단독(Bac polH Cap2/5; Urabe, M. et al., 2006) 또는 AAV Cap 발현 카세트 및 ITR-전이유전자-ITR(Bac polH Cap5 - 사람 인자 IX 또는 Bac polH Cap2/5 - 분비된 나노-루시퍼라제 [나노-루시퍼라제])를 포함하는 재조합 바큘로바이러스를 생성시키기 위하여, Sf9 세포를 pVD-ITR-전이유전자-ITR(SEAP 전이유전자)(서열 번호: 01) 또는 pVD-polH-Cap(polH Cap2)(서열 번호: 02) 또는 pVD-polH-Cap-ITR-전이유전자-ITR(polH Cap Trans)(Cap5 FIX: 서열 번호: 03, Cap2/5 나노-루시퍼라제: 서열 번호: 29)로 형질감염시키고 셀펙틴(Cellfectine) II 시약을 사용하여 바큘로바이러스 게놈을 선형화하였다. 이후에, 양성 세포 플라크를 점착하여 배양시킨 Sf9 세포로 이전시켰다. 형질감염 후 72시간 째에, Sf9 세포로부터 감염된 상층액을 추가로 계대배양하고 계대배양 4(P4)에 도달할 때까지 ExpresSf+ 세포 속에서 증폭시켰다. 재조합 현상 및 게놈 안정성을 분석한 후, 선택된 재조합 바큘로바이러스로부터의 P4 물질을 분취량으로서 액체 질소 속에 저장하고 특성화 실험 전에 P5 작업 종자 바이러스에 단독으로 새로이 증폭시켰다. AAV2 Rep(Bac Rep183)(서열 번호: 04)를 발현하는 바큘로바이러스를 앞서 설명한 바와 같이 생성시켰다(Urabe, M. et al., 2006). 이러한 Bac Rep183은 또한 분할-카세트 AAV Rep, 또는 분할 Rep로 지칭된다.

AAV 벡터 생산

AAV 변이체는 일시적으로 형질감염된 ExpresSF+ 곤충 세포를 나타낸 AAV Cap 및 전이유전자를 포함하는 새로이 증폭시킨 재조합 바큘로바이러스 스톡(P4→P5)으로 형질감염시켜 생성하였다(Urabe, M. et al., 2002). 28℃에서 72시간 항온처리한 후, 세포를 1% 트리톤(Triton) X-100으로 1시간 동안 분해하였다. 게놈 DNA를 1시간 동안 37℃에서 벤조노나제((Merck) 처리를 통해 분해하고, 세포 부스러기를 15분 동안 1900 Xg에서 원심분리함으로써 제거하였다. 투명하게된 분해물을 정제 시작까지 4℃에서 저장하고, DNase-내성 AAV 입자 역가를 나타낸 전이유전자의 프로모터 영역에 대해 지시된 프라이머 및 프로브를 사용한 정량적 폴리머라제 쇄 반응(qPCR)을 사용하여 측정하였다(참고: 표 1). AAV 벡터를 정제하기 위하여, 투명해진 분해물을 AVB 세파로즈(GE Healthcare)를 사용하여 정제하였다. 정제된 바이러스 역가를 이후에 qPCR로 측정하였다.

[표 1]

일시적인 형질감염 및 발현 분석

단백질 발현을 분석하기 위하여, ExpresSf+　세포를 부착하여 씨딩하고 1 pg의 유도성 나노-루시퍼라제 리포터 또는 Rep 유전자를 암호화하는 플라스미드 DNA로 형질감염시켰다. Cellfectin II 시약(Invitrogen)을 형질감염을 위해 사용하였다. 형질감염 후 1일째에, 1% (v/v) 말기 농도에서 나타낸 P5 바큘로바이러스를 접종하였다.

SDS-페이지(page) 및 웨스턴 블롯

웨스턴 블롯 분석을 RIPA 완충제(Sigma Aldrich) + 프로테아제 억제제 칵테일(protease inhibitor cocktail)(Roche)로 형질감염 후 48시간째에 분해한 형질감염된 세포로부터의 세포 분해물로 수행하였다. 세포 분해물을 동일한 용적의 미니-프로테안 프레캐스트(mini-protean precast) 4 내지 12% 비스-트리스 폴리아크릴아미드 겔(BioRad)에 로딩하였다. 이후에, 겔을 트랜스-블롯 터보 전달 시스템(trans-blot turbo transfer system)(BioRad)을 사용하여 즉석용 PVDF 막 내로 블롯팅하였다. 이후에, 막을 α-AAV2-Rep(Progen, 독일)와 함께 항온처리한 후, 서양 고추냉이 퍼옥시다제(horseradish peroxidase)(HRP)(Sigma-Aldrich)에 커플링된 2차 항체와 함께 항온처리하였다. 결합된 항체를 ECL 검출 시스템(Thermo Pierce)으로 검출하고 케미독 영상화기(Chemidoc imager)(BioRad)를 통해 영상화하였다. VP 단백질 영상화를 위해, 정제된 AAV 입자의 단백질 조성물을 mini-protean stain-free® 프로캐스트(precast) 4 내지 12% 비스-트리스 폴리아크릴아미드 겔(BioRad) 상에서 전기영동으로 측정하였다. 이후에, 겔을 케이독 영상화기로 넣고 영상을 영상 랩 소프트웨어(image lab software)(BioRad)로 분석하였다.

시험관 내 효능

Huh7 세포를 상이한 MOI(GC/세포)에서 전이유전자로서 분비된 나노-루시퍼라제를 발현하는 AAV 변이체로 형질감염시켰다. 야생형 아데노바이러스(MOI 30)를 사용한 공-감염을 수행하여 제2의 가닥 합성을 자극시켰다. 감염 출발 후 48시간 째에, 분비된 나노-루시퍼라제 발현을 상층액 속에서 검정 키트 및 1초의 통합 시간으로 글로막스 발광기(Glomax luminometer)(Promega)를 사용하여 상층액 속에서 측정하였다.

게놈성 AAV DNA를 사용한 포름알데하이드 겔 전기영동

게놈성 AAV DNA를 정제된 AAV 배치로부터 PCR 정제 뉴클레오스핀 키트(Nucleospin kit)(Machery Nagel)를 사용하여 분리하였다. 전기영동 전에, 500 ng의 AAV 게놈 DNA를 10분 동안 95℃에서 포름알데하이드 로딩 완충제(1ml 20x MOPS, 3.6ml 37% 포름알데하이드, 2ml의 67% 슈크로스 중 5mg/ml 오렌지(Orange) G, MQ를 사용하여 10ml 까지) 속에서 변성시키고 즉시 빙상에 두었다. 다음에, 샘플을 6.6% 포름알데하이드가 보충된 1x MOPS 완충제(40mM MOPS, 10 mM NaAc, 1mM EDTA, pH=8.0) 속에 제조된 1% 아가로스 겔 위에서 이동시켰다. 이후에, 샘플을 2시간 동안 100 볼트에서 6.6% 포름알데하이드 이동 완충제가 보충된 1x MOPS 완충제 속에서 이동시켰다. 이동 후, DNA를 SYBR Gold(Thermofisher)로 염색시키고 밴드를 Chemidoc 터치 영상화기(touch imager)(Biorad)로 가시화하였다.

가상적인 총:전체 비 측정

생산에 대한 가상적인 총 대 전체 비(total to full ratio)(T/F)를 조립된 캡시드의 총 양을 각각의 AVB 정제된 AAV 물질의 GC 양(qPCR로 측정)으로 나누어 계산하였다. 총 캡시드 또는 총 입자를 측정하기 위하여, ELISA 또는 HPLC 기반 분석을 수행하였다. AAV 역가 ELISA 키트(Progen, 독일)를 사용하여 총 비리온을 정량하고 AAV5의 빈 캡시드를 조립하였다. 포획-항체는 조립되지 않거나 개개 캡시드 VP 단백질 상에 존재하지 않는 구조적 에피토프를 검출한다. AVB 정제된 AAV 물질을 키트 검정 완충제 속에서 1000 내지 2000배로 희석하였다. 실험은 키트 프로토콜에 따라 수행하였다.

크기 배제 크로마토그래피를 또한 사용하여 총 AAV5 입자 함량을 측정하였다. 당해 방법은 BioBasic SEC-1000 컬럼을 사용하는 HPLC 시스템을 사용하며, 이는 AAV와 같은 보다 큰 입자를 분리하기 위한 이의 능력에 대해 선택된다. AAV 입자를 214 nm의 흡광도에서 측정한다. 공지된 총 입자 함량(초기 참고 표준에 대해 입증됨)을 지닌 AAV5-기반 생성물인, 작업 표준(working standard; WS)을 사용하여 교정곡선(총 입자 농도 대 피크 면??)을 생성하였다. 피크를 통합하고 케미스테이션-소프트웨어(Chemstation-software)를 사용하여 정량화하였다. AAV5 샘플을 당해 교정 곡선에 대해 정량화한다.

잔류 바큘로바이러스 DNA 정량화

잔류 바큘로바이러스 DNA는 AAV 약물 기질- 및 약물 생성물 제제 속에 공던-관련 불순물소서 존재한다. 잔류 바큘로바이러스 DNA 수준은 qPCR로 바큘로바이러스 게놈 내 대표적인 영역(HR3 인핸서 영역에 근접함)에 대해 특이적인 프라이머 세트를 사용하여 qPCR로 평가한다.

AAV2 Rep의 유도성 발현을 지닌 ExpresSf+ 안정한 세포(iRep Sf+ 세포)의 생성

모든 세포를 지닌 모 ExpresSf+ 세포를 플라스미드 DNA 형질감염 1일 전에 1회 계대배양하였다. 형질감염 일에, 모 세포를 새로이 예비-가온된 Sf-900 II 배지를 사용하여 1.5Х10⁶개의 세포/ml의 밀도로 희석시킨 다음 세포를 씨딩할 때까지 진탕기 항온처리기 속에 다시 두었다. 1 ml의 염수 용액 중 DNA(1 pg dna/세포):리포솜(Cellfectine II) 복합체를 제조하였다. 복합체 형성을 위해 기다리는 동안, 희석된 세포를 취하고 전체 1 ml의 복합체 용적을 세포의 상단에 125 ml의 진탕 플라스크 속에서 서서히 점적함으로써 가한 후 온화하게 스월링(swirling)시켜 균질화하고 28℃, 135 rpm에서, CO₂의 부재 하에 진탕 항온처리기 속에서 5시간 항온처리하였다. 5시간 후, 다른 9 ml의 신선한 Sf-900 II 배지를 가하고 형질감염된 세포를 추가로 항온처리하였다. 3일 후, 세포를 원심분리로 회전 침강(spin down)시키고, 오래된 배지는 경사제거로 버리고 신선한 Sf-900 II 배지로 대체하여 전체 세포 펠렛을 5Х10⁵개의 세포/ml의 최종 세포 밀도로 희석하였다. 블라스티시딘 항생제 선택 압력을 세포 현탁액에 25 μg/ml의 말기 농도에서 가하였다. 세포 생존능이 90% 초과에 도달한 후(± 3주 이내), 안정하게 형질감염된 세포를 정상적으로 그러나 블라스티시딘 선택 압력의 연속적인 존재하에 계대배양하였다. 세포 생존능이 >95%이고 2배 시간이 ± 24 내지 26시간 이하가 되자 마자, 세포 혼주물 뱅킹(cell pool banking)을 안정한 세포 혼주물 당 적어도 30개의 동결튜브(cryotube)로 수행한다.

순차적인 배치 반응기(SBR) 연구를 위해 설정된 iRep 안정한 혼주물 예비-배양

iRep 052(iRep) 안정한 혼주물 세포의 예비-배양물(P0-P3)을 진탕 플라스크 속에서 일반적으로 생산하였다. 1.5 L의 신선한 SF900 II 배지(Thermo Fisher Scientific)를 2L 들이의 STR 내로 가하고 28.0℃까지의 온도로 평형화시켰다. 생물반응기의 DO 센서 및 세포 밀도 프로브(Incyte Arc, Hamilton)를 예비-가온 배지로 재-교정하였다. 진탕 플라스크로부터의 P4 예비-배양물을 혼주하고 생존하는 세포 밀도(viable cell density: VCD)에 대해 NucleoCounter NC-100을 사용하여 GEN-SOP-0031 - Operation of BucleoCounter NC-100에 따라 측정하였다. 혼주된 P3 배양물의 계산된 농도 및 추가의 신선한 배지 SF900II 배지(Thermo Fisher Scientific)의 계산된 용적을 2L의 생물반응기(UniVessel® SU, Sartorius)에 0.5e6 VC/mL의 최종의 생존하는 세포 밀도에서 2L의 최종 작업 용적을 사용하여 이전시켰다. 배양을 반응기 용기 주변의 열-매트(thermo-mat)에 의해 유지된 28℃의 온도에서 수행하였다. 압축된 공기를 반응기 속에 분당 5 큐빅 센티미터(cubic centimeters per minute; ccm)의 유동 속도에서 및 분 당 0.30 리터(1pm)의 공기 오버레이(air overlay)로 연속적으로 가스처리하였다. 용존 산소 농도 및 pH를 온라인으로 빌트-인 전기화학 센서 인터페이스(built-in electrochemical sensor interface)로 측정하였다. 반응기의 산소 공급을 교반기의 캐스케이드 제어와 함께 반응기에 가스처리 산소의 캐스케이드 제어에 의해 30% 포화도의 용존 산소에서 유지시켰다(표 2). 온도 및 산소 제어기에 대해 2L 생물반응기의 비례적, 통합적 및 유도적(PID) 설정의 획득을 (표 3)에 나타내었다. 배양물의 세포 밀도는 온-라인으로 배양 동안 세포 밀도 프로브로 측정하였다.

48 내지 72 시간 배양 후 및 P4 예비배양의 VCD에 따라, 예비-배양물 P4의 계산된 용적을 생물반응기의 바닥으로부터 빼내고, 신선한 SF900± 배지(Thermo Fisher Scientific)의 계산된 용적을 2L의 최종 작업 용적에서 0.5e6 VC/mL의 최종 생존 세포 밀도까지 폐수 펌프에 의해 생물반응기에 후속적으로 가하였다. SBR의 이러한 충전 및 배수 주기를 9까지의 계대배양 수의 세포 배양까지 반복하였다.

[표 2]

[표 3]

결과

실시예 1: 유도성 플라스미드 벡터 내 대안의 레이트(late) 바큘로바리러스 p10 프로모터의 사용은 재조합 바큘로바이러스 내에서 polH 프로모터의 혼입에 의해 유발된 시스:트랜스 경쟁을 개선(ameliorating)시킨다.

재조합 프로모터로서 레이트 프로모터, 특히 polH(서열 번호: 25)의 사용은 BEV 시스템 내에서 재조합 유전자의 발현을 조절하기 위한 보존적 전략이 되었다. 따라서, 동일한 전략이 또한 일반적으로 사용되며 AAV 생산을 위해 BEV 시스템(Urabe, M. et al., 2002)을 사용하여 최적화하였다. 유사한 전략을 또한 첫번째의 안정하고 유도성인 AAV 패키징 세포의 생성시 시행하였다(Aslanidi, G., et al., 2009, 상기 참고). 이러한 안정한 세포를 생성하기 위해, hr2.09 및 레이트 polH 프로모터에 의해 조절된 AAV 단일-카세트 Rep 및 Cap 발현 플라스미드를 사용하여 숙주 곤충 세포 게놈 내로 안정하게 통합시켰다. 흥미롭게도, 문헌(Wu et al. (상기 참고)은 AAV Cap 발현을 패키징 숙주 세포 대신에 재조합 바큘로바이러스에 의해 구동되도록 함으로써 유연성이 증가된 AAV 패키징 세포의 차세대 생성을 최근 입증하였다(Wu, Y. et al. 2019). 그럼에도 불구하고, 재조합 바큘로바이러스 게놈 내 보존적인 레이트 프로모터, 특히 polH의 사용이 전사활성화 동안 통합된 발현 플라스미드 내 동일한 프로모터와 상호작용하거나 심지어 방해하는지의 여부는 명확하지 않다. 이를 설명하기 위해, 유도성 발현 플라스미드 벡터(pCLD 002)(서열 번호: 05)를 약독화된(attenuated) ACG 출발 코돈을 지닌 전체-길이의 AAV2 Rep와 조합된 상부 hr2.09 인핸서를 사용하여 설계하였다(서열 번호: 18)(Hermens, W. T. J. M. C., et al., 2009). 이러한 pCLD 002를 ExpresSf+ 세포 내로 일시적으로 형질감염시킨 다음(도 1a) 상이한 재조합 바큘로바이러스의 접종을 통해 트랜스활성화시켰다. 흥미롭게도, AAV2 Rep78의 발현은 트랜스활성화를 Bac Trans를 사용하여 수행한 경우에만 관찰될 수 있었다(도 1b). 다른 바큘로바이러스, Bac polH Cap 및 Bac polH Cap Trans 둘 다는, AAV2 Rep52의 발현 만을 유도하였고, 이는 Rep78 및 Rep52의 발현이 단일의 AAV Rep 카세트 설계 내에서 상이하게 조절됨을 제시한다. 이러한 발견을 확인하기 위하여, 나노-루시퍼라제 리포터 작제물을 보존적 레이트 프로모터(polH 또는 p10(서열 번호: 22))와 조합된 상부 hr2.09 인핸서를 사용하여 설계하고, 이미 기술한 바와 유사한 실험을 수행하였다(도 1a). 이러한 접근법을 사용하여, 본 발명자는 재조합 보존적 레이트 프로모터의 존재(Bac polH Cap Trans) 또는 부재(Bac Trans) 하에서, 상이한 재조합 바큘로바이러스의 접종에 의한 트랜스활성화시 리포터 유도 프로파일을 우추하였다(도 1a). 재조합 바큘로바이러스 사이에 감염성에서 차이가 없었음을 입증하기 위하여, 천연의 AAV2 프로모터(p5, p19, 및 p40)를 또한 시험하였다. 샘플을 Bac Trans 또는 Bac polH Cap Trans(도 1c, 사각형 대 삼각형)로 접종한 경우 3개의 AAV 프로모터의 유도 프로파일에서 유의적인 차이가 관찰되지 않았으며, 이는 이러한 재조합 바큘로바이러스 사이에서 유사한 감염성이 있었음을 나타낸다. 흥미롭게도, 본 발명자는 나노-루시퍼라제를 감염 후 24시간으로서 조기에, polH 및 p10으로 조절한 경우 Bac Trans 트랜스활성화시 리포터의 보다 강력한 유도를 주목하였다. 동일한 시점에서, Bac polH Cap Trans에 의한 트랜스활성화는 Bac Trans와 비교하여 ±10(polH) 및 ±5-배(p10) 더 낮은 리포터 유전자 발현을 입증하였다. 보다 늦은 시점에, Bac polH Cap Trans 또는 Bac Trans 사이의 유도에서의 차이는 거의 없게 되었다. 더욱이, p10 프로모터 리포터는 Bac polH Cap Trans 트랜스활성화시 polH와 비교하여 약간 보다 더 강력한 상향조절(±2배)을 나타내었다(도 1c). pCLD 002 및 리포터 작제물 연구로부터의 결과는 발현 플라스미드 벡터 내 polH 프로모터와 트랜스활성화 동안 재조합 바큘로바이러스 사이에, 상호작용 또는 경쟁이 존재함을 나타낸다. 놀랍게도, 발현 플라스미드 벡터 내 대안의 레이트 p10 프로모터의 삽입은 트랜스활성화 경쟁을 개선시킬 수 있다.

실시예 2: 대안적인 바큘로바이러스 hr 인핸서의 사용은 기본 유전자 발현을 감소시키고 바큘로바이러스 트랜스활성화가능한 플라스미드 벡터 내 강력한 조절을 전달한다.

다양한 바큘로바이러스 hr 서열은 전사 인핸서 활성을 지닌 것으로 입증되었다(Bleckmann, M. et al. 2016; Rodems, S. M. & Friesen, P. D., 1993; Venkaiah, B., et al., 2004). 다양한 바큘로바이러스 프로모터와 함께, 이러한 hr 기능을 탐구하여 곤충 세포 내에서 재조합 발현 플라스미드를 생성하였다. 유사한 전략을 또한 사용하여 바큘로바이러스 트랜스활성화가능한 AAV 유전자 발현 플라스미드 벡터를 생성하였다. 보다 정밀하도록 하기 위한 hr2, 또는 hr2.09의 사용은 재조합 바큘로바이러스를 사용한 트랜스활성화 시 플라스미드 벡터로부터 AAV Rep 및 Cap 발현 둘 다를 강력하게 향상시키는 것으로 밝혀졌다(Aslanidi, G., et al., 2009, supra). 유전자 발현의 총 상실을 트랜스활성화에 대한 이의 존재의 필요성을 나타내는 hr 서열의 부재하에서 관찰하였다. hr 내에서 IE-1 DNA 결합 부위 서열(CNNGTAGAATTCTACNNG)의 존재는 이의 인핸서 기능에 관여하는 것이 알려져 있다(Olson, V. A., et al., 2003). 본 실시예에서, hr2/hr2.09(7x IE-1 DNA 결합 부위를 가짐) 및 참고 프로모터로서 polH와 조합된 다른 것(즉, hr1 [서열 번호: 26], hr3 [서열 번호: 27], hr4b [4x IE-1 DNA 결합 부위, 서열 번호: 19] 및 hr5 [6x IE-1 DNA 결합 부위, 서열 번호: 20])의 인핸서 능력을 상이한 재조합 바큘로바이러스를 사용한 트랜스활성화시 나노-루시퍼라제 리포터 작제물을 사용하여 프로파일링하였다(도 1a & 2a). 이러한 hr 인핸서는 IE-1 DNA 결합 부위의 간헐적인 존재에도 불구하고, 서로 각각의 것들 중에서 유의적인 뉴클레오타이드 차이를 갖는다(도 2b). 본 발명자는 모든 hr 서열이, 활성도의 차이에도 불구하고, 이의 방향성(directionality)에 상관없이, 바큘로바이러스를 사용한 트랜스활성화시 프로모터 활성를 향상시켰다는 것을 알 수 있었다(도 2c). 흥미롭게도, 8 IE-1 DNA 결합 부위를 갖도록 가공된 합성 hr은 hr3과 함께 7개 부위 만을 갖는 hr2.09 이상으로 프로모터 발현을 향상시키는데 실패하였다. 이는 앞서 추정한 바와 같이 결합 부위의 양이 인핸서 강도와 관련되지 않음을 입증한다(Aslanidi et al., 2009, supra). 이러한 실험을 통해, hr2.09는 최고의 향상 기능을 나타내고, 이후에 극소수의 i3-1 결합 성분을 지닌 하나의 가장짧은 hr 서열인, hr4b임이 여전히 관찰되었다.(도 2b 및 13). 그러나, 리키 발현의 일부 정도가 또한 다른 hr 서열과 비교하여 모의(mock) 처리된 hr2.09 샘플로부터 관찰될 수 있었다(도 2c 및 d). hr2.09에 대해 관찰된 이러한 리키 발현은, 이를 매우 독성인, 단백질, 예를 들면 AAV Rep를 조절하는데 사용하는 경우 특히 쟁점을 가질 수 있다. AAV Rep 발현에서 이러한 명백한 hr 인핸서를 비교하기 위하여, 몇가지 플라스미드 벡터(pCLDs)를 제조하고 바큘로바이러스 트랜스활성화시 발현 조절에 대해 시험하였다(도 1a 및 2e). 실제로, 웨스턴 블롯 결과로부터(도 2f), 모든 hr 인핸서를 사용하여 AAV2 Rep 상향조절에서 polH 기능을 향상시킬 수 있었다. 흥미롭게도, hr2.09 > hr4b > hr5의 명백한 발현 강도는 AAV2 Rep78에서만 유의적으로 관찰될 수 있었지만 보다 작은 Rep52 발현에서는 관찰될 수 없었다. 이는 단일의 AAV Rep 카세트 내 명백한 조절 시스템의 존재를 나타내며, 여기서 천연의 내인성 AAV p19 프로모터는 임의의 hr의 존재하에서 기능적이고 바큘로바이러스 첨가에 상관없이 유도성이다. 루시퍼라제 활성을 측정하는 경우 관찰되었던, hr2.09의 리키 발현은 루시퍼라제 활성을 측정하는 경우 관찰괴었지만, 웨스턴 블롯에 의해서는 관찰되지 않았고, 나노-루시퍼라제 리포터 검정과 비교하여 이러한 방법을 사용한 민감성으로서 이미 유의적으로 약독화된 ACG-Rep78 버젼의 사용은 올바른 관철 결과를 생성하기 위한 주요 쟁점일 수 있었다. 따라서, 대안의 hr 인핸서, 특히 비교적 보다 더 약한 hr, 예를 들면, hr4b 및 hr5의 사용은 hr2.09를 사용한 유도성 AAV 유전자 발현 플라스미드 벡터의 리키 발현 쟁점을 극복하는데 사용될 수 있다.

실시예 3: 비-리키 hr 인핸서, 레이트 프로모터 p10, 및 강력한 ATG 출발 코돈의 사용은 재조합 polH 프로모터를 지닌 바큘로바이러스에 의해 유도성인 최적의 단일-카세트 Rep 설계를 전달한다.

앞서의 실시예에 나타낸 바와 같이, 약독화된 ACG 출발 코돈과 함께 polH 프로모터의 사용은 Bac Trans를 사용한 트랜스활성화시 외견상으로 정상의 Rep 발현 비(낮은 Rep78 및 높은 Rep52)를 가져올 수 있다(Urabe et al., 2006; Hermens et al., 2007). 그러나, 유도를 위해 Bac polH Cap Trans를 사용하는 경우 비교적 보다 약한 트랜스활성화 프로파일이 i) 사용된 2개의 polH 프로모터 사이의 시스:트랜스 프로모터 경쟁(Bac polH Cap Trans에서 Cap에 대해 및 발현 플라스미드에서 Rep에 대해) 및 ii) 비-리키이지만 비교적 보다 약한 hr, 예를 들면, hr4b의 채택으로 인해 관찰된다. Bac polH Cap Trans의 사용과 여전히 상용성인 비-리키 발현 플랫폼을 생성하기 위하여, hr4b 인핸서를 p10 프로모터와 조합하여 강력한 야생형 ATG 출발 코돈을 지닌 단일-카세트 AAV2 Rep를 조절하였다(도 3a 및 9)(서열 번호: 06, 서열 번호: 17). 재조합 바큘로바이러스 접종에 의한 트랜스활성화 동안 시스:트랜스 프로모터 경쟁의 감소를 비교하고 확인하기 위하여, 보존적 polH 프로모터를 지닌 플라스미드 벡터를 생성시켜다(도 3a, pCLD 047)(서열 번호: 07). 이러한 발현 플라스미드를 형질감염시키고 앞서의 실험 설계에 따라 트랜스활성화시켰다(도 1a). pCLD 015(서열 번호: 08) 웨스턴 블롯 결과로 부터 알 수 있는 바와 같이, p10 및 내인성 AAV p19 프로모터 둘 다는 이의 트랜스활성화 동안 hr 인핸서의 존재를 필요로 함이 밝혀졌다. Bac Trans 트랜스활성화와 함께 이러한 작제물(pCLD 046 및 047 둘 다)의 사용은 아마도 강한 ATG 출발 코돈의 채택으로 인하여, 준최적 AAV Rep 발현 비(너무 높은 Rep78)를 생성하였다. 그러나, Bac polH Cap Trans 트랜스활성화 시, Rep78의 적절한 발현 및 전체 Rep 비는 p10 프로모터를 사용하여 도달할 수 있지만, polH를 사용하여서는 도달되지 않는다. 흥미롭게도, 트랜스활성화에 사용된 바큘로바이러스에 상관없이 Rep52의 발현에서 차이가 없었고, 이는 앞서 보고된 결과와 일치하게 단일-카세트 AAV Rep 내 상부 프로모터 대 내인성 AAV p19 프로모터 사이의 명백한 조절을 입증한다(도 1b).

실시예 4: 분할-카세트 AAV Rep 설계를 유도적으로 조절하기 위한 대안의 바큘로바이러스 프로모터와 함께 비-리키 hr 인핸서의 사용

앞서의 실시예에 나타낸 바와 같이, 바큘로바이러스 게놈(즉, Bac polH Cap Trans) 내 재조합 프로모터의 사용은 시스:트랜스 프로모터 경쟁으로 인하여 리포터 유전자의 상이한 발현 프로파일을 유발한다. 이는 특히 2개의 polH 프로모터의 사용을 내포하므로, 유도성 발현 플라스미드에 대한 AAV2 분할 Rep-카세트를 채택하는 경우에, 문제가 될 수 있다. BEV 분할-카세트 Rep(Bac Rep183) 내에서, Rep78 및 Rep52의 발현은 절두된 이미디어트 얼리 IE-1 프로모터(△IE-1) 및 레이트 polH 프로모터 각각의 조절 하에 속한다(Urabe, M. et al., 2002; Hermens et al., 2007; Hermens et al., 2009). 바큘로바이러스 트랜스활성화가능한 플라스미드 벡터에 대해 이러한 설계를 채택하려는 노력은 아마도 △IE-1 프로모터의 구성적 특성 및 시험한 설계에서 polH 프로모터의 시스:트랜스 경쟁으로 인하여, 성공적이지 않은 결과로 이미 시도되었다(Aslanidi, G., et al., 2009). 분할-카세트 Rep는 이것이 수득될 수 있는 보다 우수한 AAV 품질로 인하여 BEV 플랫폼에서 기본적인 AAV Rep 카세트 설계가 되었다(Urabe, M. et al., 2002; Hermens, W. T. J. M. C., 2009). 분할-카세트 Rep의 우수성은 아마도 가능한 발현 강도 및 이러한 설계가 제공하는 일시적인 제어에 기인한다. 대조적으로, 단일-카세트 Rep 설계는 보다 강직하고 트랜스활성화시 작은 Rep52의 발현은 감염 동안 이른 시점으로 이의 일시적인 발현을 제한하는 내인성 AAV p19 프로모터(도 2e & 3b)에 의해 편향적으로 조절되는 것으로 알려져 있다(도 1c). 더욱이, 프로모터 리포터 연구를 검토할 때(도 1c), AAV p19 프로모터는 장기간 이동시, 숙주 세포에 대해 독성이 되는 Rep52의 구성적인 낮은 발현을 야기하는 비교적 리키한 것으로 밝혀졌다. 이는 거의 리키하지 않은 hr 인핸서의 채택에도 불구하고 거의 이상적이지 않은 단일-카세트 Rep 플라스미드 벡터를 제조할 수 있다.

본 연구에서, △IE-1 프로모터의 구성적 발현 프로파일의 챌린지를 극복하기 위하여, 지연된 얼리 39k 프로모터(서열 번호: 21)(Dong, Z. Q. et al., 2018; Lin, C. H. & Jarvis, D. L., 2013)를 Rep78 발현을 조절하기 위한 대안으로서 사용하였다. 39k 프로모터의 발현 프로파일은 바튤로바이러스 트랜스활성화 후 3 내지 6시간 째로 조기에 활성인 것으로 관찰되어, 이는 △IE-1 일시적인 모사체로서 사용될 매력적인 대안이 되도록 하였다(도 4a). 그럼에도 불구하고, 39k 프로모터 조절로부터 발현 강도는 특히 보다 늦은 시점에서 △IE-1와 비교하여 비교적 더 높았고(도 4a), 본 발명자는 다른 루시퍼라제 리포터 검정을 수행하여(도 4b) △IE-1-조절된 발현 수준을 모사하기 위한 39k-조절된 유전자 발현에 대한 준최적 출발 코돈을 사용하는 것과 같은 대안에 대해 스크리닝하였다. 도 4c로부터 알 수 있는 바와 같이, ATG 출발 코돈을 준최적 ACG 코돈으로 대체하는 것은 △IE-1와 비교적 유사한 수준까지의 39k 프로모터 강도를 조율 강하할 수 있다. 이러한 준최적 ACG 코돈을 사용하여, 나타낸 pCLD를 설계하여(도 4d) 전체 길이의 AAV2 Rep에서 39k 프로모터 - ACG 조합의 강도 및 발현 프로파일을 시험하였다. 나타낸 바큘로바이러스 트랜스활성화시(도 4d), AAV2 Rep78의 발현은 hr2.09가 여전히 존재하는 pCLD 020(서열 번호: 09)에 대해서만 검출될 수 있었고, 이는 39k 프로모터가 여전히 hr 인핸서 의존성 프로모터임을 나타낸다. 그러나, Rep78의 발현 수준은 여전히 너무 높고 Rep78:Rep52 사이의 비는 이상(ideal)과는 떨어져 있다. 비교적 강한 hr2.09의 혼입은 관찰된 결과를 유발하는 것으로 예측되었다.

이를 피하기 위하여, Rep78의 발현 카세트는 인핸서를 비교적 보다 약한, hr4b로 변화시켜 개선시킨 반면, Rep52는 이를 앞서 나타낸 바와 같이(Chen, 2008) 인공 인트론 내부의 추가의 강력한 레이트 프로모터로 조절함으로써 향상시켰다. polH 프로모터와 최소 시스-트랜스 경쟁을 지닌 수개의 레이트 프로모터를 시험한다(도 4e). 흥미롭게도, 강력한 hr2.09 인핸서의 존재에도 불구하고, 인트론성 프로모터로서 polH를 놓는 것은 Bac polH Cap Trans로 트랜스활성화하는 경우 Rep52 발현을 개시하는데 실패하였다. Rep52 발현은 인트론성 프로모터를 p10 또는 p6.9로 대체함으로써만 복구될 수 있었다(도 4e). 이러한 결과는 특정의 바큘로바이러스 프로모터 사이의 시스-트랜스 프로모터 경쟁의 존재 및 프로모터 스위칭이 이러한 쟁점을 약화시킬 수 있었음을 확인한다. 그러나, Rep52의 수준은 보다 약한 hr4b 인핸서의 공유된 사용으로 인해 아마도 유발된 바와 같이 비교적 약하게 남아있다.

이를 다루기 위하여, 수개의 분할-카세트(split-cassette) AAV2 Rep 작제물(pCLD 050 - 054, 도 12)(서열 번호: 10 내지 14)을 설계하고 대안의 보다 약하고 여전히 비-리키한 hr 인핸서를 혼입함으로써 클로닝하여 Rep78 발현을 추가로 감소시켰다. 인핸서 활성은 양방향인 것으로 알려져 있으므로(도 2c), 본 발명자는 단일 hr4b의 능력을 시험하고 이를 hr4b-hr5 조합과 비교하였다(도 5b). 최종적으로, 바큘로바이러스 레이트 프로모터의 조절 하에서 코돈 최적화된 Rep52 유전자의 다른 카피(서열 번호: 15)(도 5a 및 11)를 시스로(in cis)로 가하여 Rep52 발현을 강화하였다(도 5b). 수개의 비-보존적 바큘로바이러스 레이트 프로모터, 예를 들면, p6.9(서열 번호: 23), 및 pSel120(서열 번호: 24)(Lin, C. H. & Jarvis, D. L., 2013; Martinez-Solis, M., et al., 2016)의 발현 역학 및 강도를, 바큘로바이러스 트랜스활성화시 루시퍼라제 리포터 검정을 사용하여 프로파일링하여 Rep52의 예외적인 카피를 조절하는 레이트 프로모터로서 이의 불능을 관찰하였다. 흥미롭게도, 모든 이러한 비-보존적 바큘로바이러스 프로모터는 거의 유사한 효능으로 Bac Trans 및 Bac polH Cap Trans에 의해 트랜스활성화될 수 있다(도 4a). 최대 차이는 48 h.p.i.에서 대략 ±4배 더 낮은 효능에서 p6.9 프로모터의 Bac polH Cap Trans 트랜스활성화를 사용하여서만 관찰될 수 있었고, 이는 보다 이른 p10 프로모터보다 여전히 보다 더 강력하였다(도 4a 및 1c). Bac polH Cap Trans를 사용한 pSel120의 트랜스활성화는 매우 늦은 시점(71 h.p.i)에서 최고의 발현을 갖는 것으로 밝혀졌다. 시스-트랜스-경쟁이 없는/-거의 없는 프로모터(p10, p6.9, 또는 pSel120)의 혼입은 유도성 분할-Rep 카세트의 대안을 수개 설계하는 것이 가능할 수 있다(도 5b). 이러한 작제물을 시험하기 위하여, 이러한 신규 플라스미드(pCLD 050 내지 054) 각각을 형질감염시키고, 나타낸 바큘로바이러스 트랜스활성화시 AAV2 Rep 발현을 웨스턴 블롯으로 측정하였다(도 5c). 예측한 바와 같이, 39k 프로모터의 사용은 hr 인핸서 및/또는 재조합 바큘로바이러스의 선택과는 상관없이 유동성 Rep78 발현을 야기하였다(도 5c). 모든 이러한 작제물로부터의 Rep52가 레이트 프로모터와는 상관없이 임의의 바큘로바이러스에 의해 트랜스활성화될 수 있지만, 명백한 일반적인 발현 강도가 Bac Trans와 polH Cap Trans 사이에서(도 5c), 특히 도 1b 및 3b에 나타낸 앞서의 결과와 일치하는 p10 조절된 작제물(pCLD 052)의 경우 관찰될 수 있었다. 대안의 레이트 p6.9 및 pSel120 프로모터의 사용은 Bac polH Cap Trans에 의한 Rep52 트랜스활성화시 시스:트랜스 프로모터 경쟁 쟁점을 추가로 개선시킬 수 있었다. 전반적으로, 이러한 결과는 정확한 시점 및 강도 둘 다에서 AAV 유전자의 발현을 위한 유도성 AAV 분할 Rep 설계 내에서 대안의 바큘로바이러스 프로모터의 잠재적인 사용을 나타내었다. 추가로, 나타낸 실시예는 발현 플라스미드와 동일한 프로모터를 지닌 재조합 바큘로바이러스에 의한 트랜스활성화 동안 관찰된 시스:트랜스 프로모터 경쟁에 대한 가능한 해결책을 제공한다.

실시예 5: 재조합 polH 프로모터를 지닌 바큘로바이러스의 단일 접종과 함께 신규의 유도성 분할-Rep 카세트는 고 품질 AAV 입자를 생산하기 위해 사용될 수 있다

신규한 유도성 플라스미드 벡터, pCLD 046 및 pCLD 050 내지 054가 완전한 AAV 입자를 생산하는데 사용될 수 있는지의 여부를 관찰하기 위해, 작은 일시적인 AAV 생산 실험을 ExpresSf+ 세포 내에서 수행하였다(도 6a). 상이한 AAV Cap 혈청형 및 전이유전자를 암호화하는 상이한 Bac polH Cap Trans 바이러스를 트랜스활성화제로서 사용하였다(도 6a에 나타냄). 벤치마크로서, pCLD 011을 문헌(Aslanidi et al. (상기 참고)) 설계에 따라 제조하였다(도 4a, pCLD 011 (서열 번호: 16)). 이러한 작제물은 Bac Cap Trans 설계와 양립성인 것으로 보고되었지만, 리키하지만 강력한 hr2.09 인핸서가 여전히 존재한다(Wu, Y., et al., 2019). 전반적으로, 유도성 단일(pCLD 046) 및 분할-카세트 Rep(pCLD 050 내지 054) 플라스미드 벡터 둘 다를 사용한 일시적인 AAV 생산은 조 분해물 완충제(crude lysate buffer; CLB) 속에서 ±5 x 1010 GC/ml의 평균 게놈 카피(GC) 역가를 지닌 수개의 생산 배치로부터 DNase-내성 AAV 임자의 유의적인 배출량을 일관되게 수득하였다. 이러한 역가는 벤치마크 작제물, pCLD 011의 역가와 동등하였다(도 6b 및 c). 흥미롭게도, AAV Rep의 발현 프로파일, 특히 Rep78의 일시적인 발현은 벤치마크 pCLD 011 사이에서 상이하였다(도 6d 및 e).

AAV 입자의 품질 매개변수를 관찰하기 위하여, 작은 생산으로부터의 물질을 사용하여 ABV 정제를 수행하고(도 4d) 분석하였다. 흥미롭게도, 정제된 AAV 물질로부터 캡시드 비(VP1:2:3 비)는 또한 서로 비교가능하였다(도 7a). 최종적으로, 표적 세포(Huh7)를 형질도입시키기 위한 AAV 입자의 효능을 분할-카세트 AAV Rep(Bac Rep183)을 지닌 BEV를 사용하여 나타낸 프로토콜(도 7b)에 따라 생산된 AAV 입자에 대해 비교하였다. 이러한 결과로부터, 다른 소스 AAV 입자 중에서 효능 차이가 존재하였음이 관찰될 수 있다(도 7c). 흥미롭게도, 유도성 분할-카세트 Rep 플라스미드 벡터로부터, 특히 pCLD 052 및 053 작제물로부터 생산된 AAV 입자는 단일-Rep 카세트 Rep(pCLD 011 및 046) 유래된 물질보다 더 높은 효능을 나타내었다. 효능은 심지어 거의 풍부하지 않은 BEV 생산된 물질을 사용하여 유사한 수준에 도달할 수 있었다.

AAV 입자 품질에서 이러한 신규한 유도성 플라스미드 벡터의 영향을 추가로 연구하기 위하여, 가장 우수한 효능 검정 결과를 지닌 AAV 입자에서의 AAV 벡터 DNA 분석을 포름아데하이드 아가로스 겔 분석을 사용하여 수행하였다. 특히 분할-Rep 카세트를 사용하여 생산된, BEV 유래된 AAV는 아마도 벡터 DNA의 다량체 형태의 높은 패키징 속도로 인하여, 보다 신속한 시작(onset) 및 보다 높은 효능을 나타낸다(Urabe, M., et al., 2006). 이러한 다량체 형태는 유전자 발현 이전에 속도-제한 단일 가닥(rate-limiting single-stranded)(ssDNA)을 dsDNA 형성으로 우회하는 이중 가닥 DNA(dsDNA)를 모사할 수 있다(McCarty, D. M., 2008). 본 연구에서, AAV5 FIX- 및 AAV2/5 나노-루시퍼라제 벡터 게놈의 예측된 크기는 각각 2.5 kb 및 2 kb이다. pCLD 046 또는 단일-카세트-Rep 생산된 AAV 벡터 게놈의 대부분은 도 8a로부터 알 수 있는 바와 같이 단일-가닥 단량체이다. 그러나, 2 또는 2.5-kb 단일-가닥 벡터 게놈 외에, pCLD 052 및 053을 사용하여 생산된 AAV 입자로부터 추출된 DNA는 4.7 kb의 최대 AAV 패키징 능력에서 정확하게 컷-오프 크기(cut-off size)를 지닌 추가의 단량체성 게놈을 함유하였다(도 8a). 이러한 결과는 pCLD 052 및 053이 다량체성 벡턱 게놈의 패키징시 분할-카세트 Rep를 지닌 BEV의 성능을 정확하게 모사할 수 있고, 이는 시험관 내 효능 검정 결과와 관련되어 있음을 추가로 입증하였다. 최종적으로, 단일-Rep 카세트에 걸쳐 분할 Rep-카세트의 우수성을 입증하기 위하여, 본 발명자는 나타낸 pCLD를 사용하여 생산된 정제된 AAV 물질에서 헤드 대 헤드 가상(head to head hypothetical) T/F 비교를 수행하였다(도 8b). 여기서, 본 발명자는 분할-Rep 카세트 설계가 또한 보다 낮은 T/F 값을 지닌 AAV를 생산하는 경향을 가짐을 알 수 있었고, 이는 전체 입자의 보다 높은 함량 및 설계(pCLD 052 및 053)의 우수성을 나타낸다.

일반적으로, 시스:트랜스 경쟁이 거의 없는 대안의 바큘로바이러스 프로모터(39k, p10, p6.9, 및 pSel120)와 함께 대안의 및 비-리키 hr 인핸서의 조합을 실행하여 Bac polH Cap Trans로 트랜스활성화시킬 수 있는 신규한 유도성 분할-Rep 카세트 플라스미드 벡터를 생성시킬 수 있다. 이러한 벡터, 특히, pCLD 052 및 053은 차세대의 안정한 패키징 곤충 세포주를 생성하는데 매우 유용하다.

실시예 6: 신규한 안정한 rAAV 패키징 세포의 생성

본 발명자가 AAV를 생산하기 위해 단일 바큘로바이러스 접종 만을 요구할 수 있는 안정한 세포주/혼주물을 생성할 수 있는지를 알기 위하여, 본 발명자는 물질 및 방법 단락에서 상세한 단계 또는 도 9a의 너트쉘(nutshell)에서 알 수 있는 바와 같이 일시적인 형질감염 연구(pCLD 046, 052, 및 053)에서 사용된 선택된 유도성 AAV-Rep 플라스미들을 사용한 안정한 세포주 생성을 수행하였다. 생성된 신규 세포주는 다음에 곤충 유도성 Rep 세포주 또는 iRep 세포주(iRep 046, iRep 052, 및 iRep 053)로 불릴 수 있다. AAV가 안정한 iRep 세포주로부터 생산될 수 있는지를 시험하기 위하여, 세포를 야생형 ExpresSf+ 세포와 유사하게 일반적으로 확장시키고, Bac polH Cap Trans(Bac Cap5 FIX 또는 Bac Cap2/5 sNano-Luc)로 감염시키고 CLB를 수거하여 DNase-내성 AAV 입자 GC 농도를 측정하였다. 관측될 수 있는 바와 같이, iRep 세포주는, 유도성 Rep 설계와 상관없이, AAV의 유형에 의존하여 세포당 ±1 x 10¹¹개의 GC/ml 역가에 이르거나 1 x 10⁵개의 GC 생산성 보다 더 높은 비교적 풍부한 AAV 입자를 생산할 수 있었다(도 9b). 흥미롭게도 안정한 iRep 세포주로부터 AAV Rep 발현 프로파일은 또한 일시적인 형질감염 결과로부터 알 수 있는 프로파일과 일치하였다(도 6e 및 9c). AAV 입자 기능성 및 품빌을 추가로 점검하기 위하여, AVB 정제를 수행하고 분석하였다. 흥미롭게도, 일시적인 형질감염 결과와 유사하게, 정제된 대표적인 AAV2/5 물질로부터의 캡시드 비(VP1:2:3 비)는 각각의 다른 것과 비교가능하였다(도 10a). 최종적으로, 표적 세포(Huh7)를 형질도입하는 AAV 입자의 효능을 분할-카세트 AAV Rep(Bac Rep183)을 지닌 BEV를 사용하여 나타낸 프로토콜(도 7b)에 따라 생산한 AAV 입자에 대해 비교하였다. 결과로부터, 유사한 편향을 지닌 상이한 소스의 AAV 입자(도 10b) 중에서 효능 차이가 존재하였음의 관찰될 수 있고 이는 일시적인 형질감염 결과를 입증한다(도 7c).

입자 품질을 추가로 분석하기 위하여, 신규한 iRep 세포주로부터 생산된 AVB 정제된 물질(BBNE)을 다른 방법, 예를 들면, 이중 또는 이중 bac 접종 방법과 비교하였다(도 11a). 일시적인 형질감염 결과(도 8a)와 유사하게, 패키지된 AAV DNA의 단량체-이량체 패턴은 iRep 052 및 053 세포주로부터 생산된 물질에서만 관찰될 수 있었지만 bac 접종 접근법과는 상관없이 iRep 046에서는 관찰되지 않았다(도 11b). 그러나, 이론적 T/F 및 바큘로바이러스 게놈 DNA 오염 분석으로부터의 추가의 결과는 캡시드 및 전이유전자를 지닌 bac가 단일 접종된 iRep 052 세포주 만이 AAV 입자를 비교적 탁월한 품질로 가장 일관된 방식으로 생산할 수 있었음을 나타내었다(도 11c 및 d).

실시예 7: 선택된 iRep 052 세포주를 사용한 순차적인 배치 반응기(Sequential batches reactor; SBR) 연구

통합된 Rep 유전자를 지닌 신규한 세포주의 생성을 향한 중간 단계로서, 모 세포주를 AAV Rep 카세트를 수반한, DNA 플라스미드 pCLD-052로 모 세포주의 형질감염에 의해 iRep Express SF+의 폴리클로날 배양물을 생성시킬 필요가 있었다. 이러한 안정한 세포 혼주물 속에서 통합된 Rep 유전자의 안정성 및 발현을 평가하기 위하여, 본 발명자는 순차적인 배치 반응기(sequential batches reactor; SBR) 속에서 세포 배양물을 확장시키고 1L 진탕 플라스크 속에서 상이한 세포 계대배양시 Rep 유전자 발현을 점검하였다. SBR은 충전 및 제거가 생물반응기 속에서 순차적으로 발생하는 반복적인 배치 공정이다. 본 발명자는 진탕 플라스크 속에서 수동의 매일 전달에 걸쳐 SBR 시스템을 사용하여 보다 우수한 재생산성 및 보다 일관된 결과를 제공하는 배양 조건 표준화(예컨대, 산소 공급)을 허용하고, 세포가 생산 조건을 경험할 조건을 모사하였다.

본 발명자는 먼저 1L 진탕 플라스크 속에 세포 해동물(P0)로부터의 안정한 세포 혼주물을 세포 계대배양 3(P3)까지 성장시킨 다음 세포 계대배양 4(P4)로부터 계대배양 9(P9)까지 세포 혼주물을 2L 생물반응기 속에서 SBR 시스템을 통해 계대배양하였다(도 15a). 씨드 트레인 생산(seed train production)은 총 5주가 걸렸다(도 15b). 본 발명자는 AAV Cap 유전자 및 AAV-ITR에 의한 인자 IX(FIX) 전이유전자 플랭크에 대한 발현 카세트를 지닌, 바큘로바이러스 Bac Cap5 FIX를 사용한 형질감염으로 AAV 생산을 위한 계대배양 5, 7, 및 9에서 안정한 혼주물을 사용하였다(도 15a). 계대배양 5, 7, 및 9에서 안정한 혼주물은 500L, 2000L, 및 10000L 이상의 공정에서 씨드 트레인 생산과 동등하다. 이러한 문서의 목적은 2L 공정을 기술하여 iRep Express Sf+ 안정한 세포 혼주물 속에서 통합된 Rep 유전자의 발현 및 안정성을 입증하는 것이며, 여기서, 본 발명자는 또한 Bac Cap5 FIX를 사용한 형질감염 후 72시간째에 여과된 조 분해된 벌크(filtered crude lysed bulk; FCLB)로부터 전이유전자의 게놈 카피를 측정하였다.

폴리클로날(polyclonal) 배양물인 iRep 안정한 혼주물의 안정성을 입증하기 위하여, 본 발명자는 웨스턴 블롯으로 계대배양 5, 7, 및 9에서 배양물의 통합된 Rep 유전자의 발현을 점검하였다(도 15c). iRep 안정한 혼주물 속에서 통합된 Rep 유전자(Rep78 및 Rep52)의 발현은 hr2.09 및 바큘로바이러스 Bac Cap5 FIX의 프로모터에 의해 조절되므로, 본 발명자는 1L 플라스크 속에서 별개로 계대배양 5, 7 및 9에서의 iRep 안정한 혼주물 배양물을 바큘로바이러스 Bac Cap5 FIX(계대배양 5)로 형질감염시켜 iRep 안정한 혼주물 속의 통합된 Rep 유전자의 발현을 활성화시켰다. 세포 분해물 샘플을 진탕 플라스크로부터 바큘로바이러스 Bac Cap5 FIX(P5)의 형질감염 후 48 및 72시간 째에 취하였다. 도 15에 나타낸 바와 같이, 본 발명자는 세포 계대배양 5, 7 및 9에서 iRep 안정한 혼주물 세포 계대배양 속의 Rep78 및 Rep52의 발현을 확인하였고, 여기서 명백한 단백질 생성물 Rep78 및 Rep 52가 세포 분해물의 각각의 단백질 추출물 샘플로부터 관찰되었다(사선 박스, 도 15c). 20세대(계대배양 9) 후, 통합된 Rep 유전자의 발현은 안정하에 남았다. 모든 단백질 추출물로부터, 단백질 Eep52로부터의 면역신호의 강도는 단백질 Rep 72보다 더 높았다. Rep78 및 Rep52의 이러한 발현 비는 정상의 AAV2 Rep 발현 비(낮은 Rep78 및 높은 Rep52)와 상응하였다.

단일 바큘로바이러스 형질감염((UnoBac 플랫폼)을 사용한 iRep 안정한 혼주물의 AAV 생산을 추가로 확인하기 위하여, 본 발명자는 또한 계대배양 5, 7 및 9에서 iRep 안정한 혼주물 세포를 사용한 바큘로바이러스 Bac Cap5 FIX(P5)의 형질감염으로부터 FCLB내 인자 IX(FIX)의 게놈 카피(GC)를 측정하였다(도 15d). FIX는 혈우병의 대체 치료요법에서 사용되었고 바큘로바이러스 Bac Cap5 FIX의 재조합 Cap-Trans-카세트 속에 포함된다. iRep 안정한 혼주물 속에서 통합된 Rep78 및 Rep52의 발현은 Bac Cap5 FIX내에서 Cap-Trans 카세트의 얼리 및 레이트 polH 프로모터 각각에 의해 트랜스활성화된다. Cap 및 전이유전자의 캐스케이드(cascade) 발현으로, 당해 경우 FIX에서, 형질감염 동안, iRep 안정한 혼주물은 AAV2 캡슐화된 FIX를 생서하였다. 도 15d에 나타낸 바와 같이, 모든 FCLB 샘플 속에서 평균 GC 역가는 모두 1e11 GC /mL를 초과하였다. 상이한 계대배양에서 GC 역가(FIX)는 정상 상태로 남았고, 이는 iRep 안정한 혼주물 속의 통합된 Rep 유전자 카세트의 안정성을 입증한다. 이는 또한 UnoBac 시스템에 의한 AAV의 규모확장된(up-scaling) 생산을 위한 iRep 세포주의 사용 가능성을 제공한다.

참고문헌

SEQUENCE LISTING <110> uniQure biopharma B.V. <120> Novel Cell Line <130> P6090147PCT <150> EP 20167817.4 <151> 2020-04-02 <160> 55 <170> PatentIn version 3.5 <210> 1 <211> 12538 <212> DNA <213> Artificial Sequence <220> <223> Bac Trans <400> 1 cgggcgctag ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg 60 cgcttaatgc gccgctacag ggcgcgtcca ttcgccattc aggctgcgca actgttggga 120 agggcgatcg gtgcgggcct cttcgctatt acgccaggct gcaggggggg ggggggggtt 180 ggccactccc tctctgcgcg ctcgctcgct cactgaggcc gggcgaccaa aggtcgcccg 240 acgcccgggc tttgcccggg cggcctcagt gagcgagcga gcgcgcagag agggagtggc 300 caactccatc actaggggtt cctcagatct gaattcggta cccgttacat aacttacggt 360 aaatggcccg cctggctgac cgcccaacga cccccgccca ttgacgtcaa tagtaacgcc 420 aatagggact ttccattgac gtcaatgggt ggagtattta cggtaaactg cccacttggc 480 agtacatcaa gtgtatcata tgccaagtac gccccctatt gacgtcaatg acggtaaatg 540 gcccgcctgg cattgtgccc agtacatgac cttatgggac tttcctactt ggcagtacat 600 ctacgtatta gtcatcgcta ttaccatggt gatgcggttt tggcagtaca tcaatgggcg 660 tggatagcgg tttgactcac ggggatttcc aagtctccac cccattgacg tcaatgggag 720 tttgttttgg caccaaaatc aacgggactt tccaaaatgt cgtaacaact ccgccccatt 780 gacgcaaatg ggcggtaggc gtgtacggtg ggaggtctat ataagcagag ctcgtttagt 840 gaaccgtcag atcgcctgga gacgccatcc acgctgtttt gacctccata gaagacaccg 900 ggaccgatcc agcctccgga ctctagagga tccggtactc gataatacga ctcactatag 960 ggagacccaa gcttgatccc ccctcttcct cctcctcaag ggaaagctgc ccacttctag 1020 ctgccctgcc atccccttta aagggcgact tgctcagcgc caaaccgcgg ctccagccct 1080 ctccagcctc cggctcagcc ggctcatcag tcggtcaatt cgcccaccat gctgctgctg 1140 ctgctgctgc tgggcctgag gctacagctc tccctgggca tcatcccagt tgaggaggag 1200 aacccggact tctggaaccg cgaggcagcc gaggccctgg gtgccgccaa gaagctgcag 1260 cctgcacaga cagccgccaa gaacctcatc atcttcctgg gcgatgggat gggggtgtct 1320 acggtgacag ctgccaggat cctaaaaggg cagaagaagg acaaactggg gcctgagata 1380 cccctggcca tggaccgctt cccatatgtg gctctgtcca agacatacaa tgtagacaaa 1440 catgtgccag acagtggagc cacagccacg gcctacctgt gcggggtcaa gggcaacttc 1500 cagaccattg gcttgagtgc agccgcccgc tttaaccagt gcaacacgac acgcggcaac 1560 gaggtcatct ccgtgatgaa tcgggccaag aaagcaggga agtcagtggg agtggtaacc 1620 accacacgag tgcagcacgc ctcgccagcc ggcacctacg cccacacggt gaaccgcaac 1680 tggtactcgg acgccgacgt gcctgcctcg gcccgccagg aggggtgcca ggacatcgct 1740 acgcagctca tctccaacat ggacattgac gtgatcctag gtggaggccg aaagtacatg 1800 tttcgcatgg gaaccccaga ccctgagtac ccagatgact acagccaagg tgggaccagg 1860 ctggacggga agaatctggt gcaggaatgg ctggcgaagc gccagggtgc ccggtatgtg 1920 tggaaccgca ctgagctcat gcaggcttcc ctggacccgt ctgtgaccca tctcatgggt 1980 ctctttgagc ctggagacat gaaatacgag atccaccgag actccacact ggacccctcc 2040 ctgatggaga tgacagaggc tgccctgcgc ctgctgagca ggaacccccg cggcttcttc 2100 ctcttcgtgg agggtggtcg catcgaccat ggtcatcatg aaagcagggc ttaccgggca 2160 ctgactgaga cgatcatgtt cgacgacgcc attgagaggg cgggccagct caccagcgag 2220 gaggacacgc tgagcctcgt cactgccgac cactcccacg tcttctcctt cggaggctac 2280 cccctgcgag ggagctccat cttcgggctg gcccctggca aggcccggga caggaaggcc 2340 tacacggtcc tcctatacgg aaacggtcca ggctatgtgc tcaaggacgg cgcccggccg 2400 gatgttaccg agagcgagag cgggagcccc gagtatcggc agcagtcagc agtgcccctg 2460 gacgaagaga cccacgcagg cgaggacgtg gcggtgttcg cgcgcggccc gcaggcgcac 2520 ctggttcacg gcgtgcagga gcagaccttc atagcgcacg tcatggcctt cgccgcctgc 2580 ctggagccct acaccgcctg cgacctggcg ccccccgccg gcaccaccga cgccgcgcac 2640 ccgggttact ctagagtcgg ggcggccggc cgcttcgagc agacatgata agatacattg 2700 atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2760 gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt gtccgtgttg 2820 cttggtcttc acctgtgcag aattgcgaac catggattca tcgacggtac cgcgggccct 2880 cgactagagc tcgctgatca gcctcgactg tgccttctag ttgccagcca tctgttgttt 2940 gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac tcccactgtc ctttcctaat 3000 aaaatgagga aattgcatcg cattgtctga gtaggtgtca ttctattctg gggggtgggg 3060 tggggcagga cagcaagggg gaggattggg aagacaatag caggcatgct ggggagagat 3120 ctgaggaacc cctagtgatg gagttggcca ctccctctct gcgcgctcgc tcgctcactg 3180 aggccgcccg ggcaaagccc gggcgtcggg cgacctttgg tcgcccggcc tcagtgagcg 3240 agcgagcgcg cagagaggga gtggccaact ccatcactag gggttccccc tgcagcctgc 3300 attaatgaat cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt 3360 cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg gcgagggggg taccagatcc 3420 catgggagct ctgcagaatt ctctagaggc ctcgcgagat cttaattaat taagtaccga 3480 ctctgctgaa gaggaggaaa ttctccttga agtttccctg gtgttcaaag taaaggagtt 3540 tgcaccagac gcacctctgt tcactggtcc ggcgtattaa aacacgatac attgttatta 3600 gtacatttat taagcgctag attctgtgcg ttgttgattt acagacaatt gttgtacgta 3660 ttttaataat tcattaaatt tataatcttt agggtggtat gttagagcga aaatcaaatg 3720 attttcagcg tctttatatc tgaatttaaa tattaaatcc tcaatagatt tgtaaaatag 3780 gtttcgatta gtttcaaaca agggttgttt ttccgaaccg atggctggac tatctaatgg 3840 attttcgctc aacgccacaa aacttgccaa atcttgtagc agcaatctag ctttgtcgat 3900 attcgtttgt gttttgtttt gtaataaagg ttcgacgtcg ttcaaaatat tatgcgcttt 3960 tgtatttctt tcatcactgt cgttagtgta caattgactc gacgtaaaca cgttaaataa 4020 agcttggaca tatttaacat cgggcgtgtt agctttatta ggccgattat cgtcgtcgtc 4080 ccaaccctcg tcgttagaag ttgcttccga agacgatttt gccatagcca cacgacgcct 4140 attaattgtg tcggctaaca cgtccgcgat caaatttgta gttgagcttt ttggaattat 4200 ttctgattgc gggcgttttt gggcgggttt caatctaact gtgcccgatt ttaattcaga 4260 caacacgtta gaaagcgatg gtgcaggcgg tggtaacatt tcagacggca aatctactaa 4320 tggcggcggt ggtggagctg atgataaatc taccatcggt ggaggcgcag gcggggctgg 4380 cggcggaggc ggaggcggag gtggtggcgg tgatgcagac ggcggtttag gctcaaatgt 4440 ctctttaggc aacacagtcg gcacctcaac tattgtactg gtttcgggcg ccgtttttgg 4500 tttgaccggt ctgagacgag tgcgattttt ttcgtttcta atagcttcca acaattgttg 4560 tctgtcgtct aaaggtgcag cgggttgagg ttccgtcggc attggtggag cgggcggcaa 4620 ttcagacatc gatggtggtg gtggtggtgg aggcgctgga atgttaggca cgggagaagg 4680 tggtggcggc ggtgccgccg gtataatttg ttctggttta gtttgttcgc gcacgattgt 4740 gggcaccggc gcaggcgccg ctggctgcac aacggaaggt cgtctgcttc gaggcagcgc 4800 ttggggtggt ggcaattcaa tattataatt ggaatacaaa tcgtaaaaat ctgctataag 4860 cattgtaatt tcgctatcgt ttaccgtgcc gatatttaac aaccgctcaa tgtaagcaat 4920 tgtattgtaa agagattgtc tcaagctcgg atcccgcacg ccgataacaa gccttttcat 4980 ttttactaca gcattgtagt ggcgagacac ttcgctgtcg tcgacgtaca tgtatgcttt 5040 gttgtcaaaa acgtcgttgg caagctttaa aatatttaaa agaacatctc tgttcagcac 5100 cactgtgttg tcgtaaatgt tgtttttgat aatttgcgct tccgcagtat cgacacgttc 5160 aaaaaattga tgcgcatcaa ttttgttgtt cctattattg aataaataag attgtacaga 5220 ttcatatcta cgattcgtca tggccaccac aaatgctacg ctgcaaacgc tggtacaatt 5280 ttacgaaaac tgcaaaaacg tcaaaactcg gtataaaata atcaacgggc gctttggcaa 5340 aatatctatt ttatcgcaca agcccactag caaattgtat ttgcagaaaa caatttcggc 5400 gcacaatttt aacgctgacg aaataaaagt tcaccagtta atgagcgacc acccaaattt 5460 tataaaaatc tattttaatc acggttccat caacaaccaa gtgatcgtga tggactacat 5520 tgactgtccc gatttatttg aaacactaca aattaaaggc gagctttcgt accaacttgt 5580 tagcaatatt attagacagc tgtgtgaagc gctcaacgat ttgcacaagc acaatttcat 5640 acacaacgac ataaaactcg aaaatgtctt atatttcgaa gcacttgatc gcgtgtatgt 5700 ttgcgattac ggattgtgca aacacgaaaa ctcacttagc gtgcacgacg gcacgttgga 5760 gtattttagt ccggaaaaaa ttcgacacac aactatgcac gtttcgtttg actggtacgc 5820 ggcgtgttaa catacaagtt gctaaccggc ggccgacacc catttgaaaa aagcgaagac 5880 gaaatgttgg acttgaatag catgaagcgt cgtcagcaat acaatgacat tggcgtttta 5940 aaacacgttc gtaacgttaa cgctcgtgac tttgtgtact gcctaacaag atacaacata 6000 gattgtagac tcacaaatta caaacaaatt ataaaacatg agtttttgtc gtaaaaatgc 6060 cacttgtttt acgagtagaa ttcgtaatca tggtcatagc tgtttcctgt gtgaaattgt 6120 tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt 6180 gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg 6240 ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg 6300 cgtattgggc gctcttccgc ttcctcgctc actgactcgc tgcgctcggt cgttcggctg 6360 cggcgagcgg tatcagctca ctcaaaggcg gtaatacggt tatccacaga atcaggggat 6420 aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc 6480 gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc 6540 tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga 6600 agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt 6660 ctcccttcgg gaagcgtggc gctttctcat agctcacgct gtaggtatct cagttcggtg 6720 taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc 6780 gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg 6840 gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc 6900 ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg 6960 ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc 7020 gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagaaa aaaaggatct 7080 caagaagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt 7140 taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa 7200 aaatgaagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa 7260 tgcttaatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc 7320 tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct 7380 gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca 7440 gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt 7500 aattgttgcc gggaagctag agtaagtagt tcgccagtta atagtttgcg caacgttgtt 7560 gccattgcta caggcatcgt ggtgtcacgc tcgtcgtttg gtatggcttc attcagctcc 7620 ggttcccaac gatcaaggcg agttacatga tcccccatgt tgtgcaaaaa agcggttagc 7680 tccttcggtc ctccgatcgt tgtcagaagt aagttggccg cagtgttatc actcatggtt 7740 atggcagcac tgcataattc tcttactgtc atgccatccg taagatgctt ttctgtgact 7800 ggtgagtact caaccaagtc attctgagaa tagtgtatgc ggcgaccgag ttgctcttgc 7860 ccggcgtcaa tacgggataa taccgcgcca catagcagaa ctttaaaagt gctcatcatt 7920 ggaaaacgtt cttcggggcg aaaactctca aggatcttac cgctgttgag atccagttcg 7980 atgtaaccca ctcgtgcacc caactgatct tcagcatctt ttactttcac cagcgtttct 8040 gggtgagcaa aaacaggaag gcaaaatgcc gcaaaaaagg gaataagggc gacacggaaa 8100 tgttgaatac tcatactctt cctttttcaa tattattgaa gcatttatca gggttattgt 8160 ctcatgagcg gatacatatt tgaatgtatt tagaaaaata aacaaatagg ggttccgcgc 8220 acatttcccc gaaaagtgcc acctgacgtc taagaaacca ttattatcat gacattaacc 8280 tataaaaata ggcgtatcac gaggcccttt cgtctcgcgc gtttcggtga tgacggtgaa 8340 aacctctgac acatgcagct cccggagacg gtcacagctt gtctgtaagc ggatgccggg 8400 agcagacaag cccgtcaggg cgcgtcagcg ggtgttggcg ggtgtcgggg ctggcttaac 8460 tatgcggcat cagagcagat tgtactgaga gtgcaccata tgcggtgtga aataccgcac 8520 agatgcgtaa ggagaaaata ccgcatcagg cgccattcgc cattcaggct gcgcaactgt 8580 tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 8640 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 8700 accgagttgt ttgcgtacgt gactagcgaa gaagatgtgt ggaccgcaga acagatagta 8760 aaacaaaacc ctagtattgg agcaataatc gatttaacca acacgtctaa atattatgat 8820 ggtgtgcatt ttttgcgggc gggcctgtta tacaaaaaaa ttcaagtacc tggccagact 8880 ttgccgcctg aaagcatagt tcaagaattt attgacacgg taaaagaatt tacagaaaag 8940 tgtcccggca tgttggtggg cgtgcactgc acacacggta ttaatcgcac cggttacatg 9000 gtgtgcagat atttaatgca caccctgggt attgcgccgc aggaagccat agatagattc 9060 gaaaaagcca gaggtcacaa aattgaaaga caaaattacg ttcaagattt attaatttaa 9120 ttaatattat ttgcattctt taacaaatac tttatcctat tttcaaattg ttgcgcttct 9180 tccagcgaac caaaactatg cttcgcttgc tccgtttagc ttgtagccga tcagtggcgt 9240 tgttccaatc gacggtagga ttaggccgga tattctccac cacaatgttg gcaacgttga 9300 tgttacgttt atgcttttgg ttttccacgt acgtcttttg gccggtaata gccgtaaacg 9360 tagtgccgtc gcgcgtcacg cacaacaccg gatgtttgcg cttgtccgcg gggtattgaa 9420 ccgcgcgatc cgacaaatcc accactttgg caactaaatc ggtgacctgc gcgtcttttt 9480 tctgcattat ttcgtctttc ttttgcatgg tttcctggaa gccggtgtac atgcggttta 9540 gatcagtcat gacgcgcgtg acctgcaaat ctttggcctc gatctgcttg tccttgatgg 9600 caacgatgcg ttcaataaac tcttgttttt taacaagttc ctcggttttt tgcgccacca 9660 ccgcttgcag cgcgtttgtg tgctcggtga atgtcgcaat cagcttagtc accaactgtt 9720 tgctctcctc ctcccgttgt ttgatcgcgg gatcgtactt gccggtgcag agcacttgag 9780 gaattacttc ttctaaaagc cattcttgta attctatggc gtaaggcaat ttggacttca 9840 taatcagctg aatcacgccg gatttagtaa tgagcactgt atgcggctgc aaatacagcg 9900 ggtcgcccct tttcacgacg ctgttagagg tagggccccc attttggatg gtctgctcaa 9960 ataacgattt gtatttattg tctacatgaa cacgtatagc tttatcacaa actgtatatt 10020 ttaaactgtt agcgacgtcc ttggccacga accggacctg ttggtcgcgc tctagcacgt 10080 accgcaggtt gaacgtatct tctccaaatt taaattctcc aattttaacg cgagccattt 10140 tgatacacgt gtgtcgattt tgcaacaact attgtttttt aacgcaaact aaacttattg 10200 tggtaagcaa taattaaata tgggggaaca tgcgccgcta caacactcgt cgttatgaac 10260 gcagacggcg ccggtctcgg cgcaagcggc taaaacgtgt tgcgcgttca acgcggcaaa 10320 catcgcaaaa gccaatagta cagttttgat ttgcatatta acggcgattt tttaaattat 10380 cttatttaat aaatagttat gacgcctaca actccccgcc cgcgttgact cgctgcacct 10440 cgagcagttc gttgacgcct tcctccgtgt ggccgaacac gtcgagcggg tggtcgatga 10500 ccagcggcgt gccgcacgcg acgcacaagt atctgtacac cgaatgatcg tcgggcgaag 10560 gcacgtcggc ctccaagtgg caatattggc aaattcgaaa atatatacag ttgggttgtt 10620 tgcgcatatc tatcgtggcg ttgggcatgt acgtccgaac gttgatttgc atgcaagccg 10680 aaattaaatc attgcgatta gtgcgattaa aacgttgtac atcctcgctt ttaatcatgc 10740 cgtcgattaa atcgcgcaat cgagtcaagt gatcaaagtg tggaataatg ttttctttgt 10800 attcccgagt caagcgcagc gcgtatttta acaaactagc catcttgtaa gttagtttca 10860 tttaatgcaa ctttatccaa taatatatta tgtatcgcac gtcaagaatt aacaatgcgc 10920 ccgttgtcgc atctcaacac gactatgata gagatcaaat aaagcgcgaa ttaaatagct 10980 tgcgacgcaa cgtgcacgat ctgtgcacgc gttccggcac gagctttgat tgtaataagt 11040 ttttacgaag cgatgacatg acccccgtag tgacaacgat cacgcccaaa agaactgccg 11100 actacaaaat taccgagtat gtcggtgacg ttaaaactat taagccatcc aatcgaccgt 11160 tagtcgaatc aggaccgctg gtgcgagaag ccgcgaagta tggcgaatgc atcgtataac 11220 gtgtggagtc cgctcattag agcgtcatgt ttagacaaga aagctacata tttaattgat 11280 cccgatgatt ttattgataa attgacccta actccataca cggtattcta caatggcggg 11340 gttttggtca aaatttccgg actgcgattg tacatgctgt taacggctcc gcccactatt 11400 aatgaaatta aaaattccaa ttttaaaaaa cgcagcaaga gaaacatttg tatgaaagaa 11460 tgcgtagaag gaaagaaaaa tgtcgtcgac atgctgaaca acaagattaa tatgcctccg 11520 tgtataaaaa aaatattgaa cgatttgaaa gaaaacaatg taccgcgcgg cggtatgtac 11580 aggaagaggt ttatactaaa ctgttacatt gcaaacgtgg tttcgtgtgc caagtgtgaa 11640 aaccgatgtt taatcaaggc tctgacgcat ttctacaacc acgactccaa gtgtgtgggt 11700 gaagtcatgc atcttttaat caaatcccaa gatgtgtata aaccaccaaa ctgccaaaaa 11760 atgaaaactg tcgacaagct ctgtccgttt gctggcaact gcaagggtct caatcctatt 11820 tgtaattatt gaataataaa acaattataa atgctaaatt tgttttttat taacgataca 11880 aaccaaacgc aacaagaaca tttgtagtat tatctataat tgaaaacgcg tagttataat 11940 cgctgaggta atatttaaaa tcattttcaa atgattcaca gttaatttgc gacaatataa 12000 ttttattttc acataaacta gacgccttgt cgtcttcttc ttcgtattcc ttctcttttt 12060 catttttctc ctcataaaaa ttaacatagt tattatcgta tccatatatg tatctatcgt 12120 atagagtaaa ttttttgttg tcataaatat atatgtcttt tttaatgggg tgtatagtac 12180 cgctgcgcat agtttttctg taatttacaa cagtgctatt ttctggtagt tcttcggagt 12240 gtgttgcttt aattattaaa tttatataat caatgaattt gggatcgtcg gttttgtaca 12300 atatgttgcc ggcatagtac gcagcttctt ctagttcaat tacaccattt tttagcagca 12360 ccggattaac ataactttcc aaaatgttgt acgaaccgtt aaacaaaaac agttcacctc 12420 ccttttctat actattgtct gcgagcagtt gtttgttgtt aaaaataaca gccattgtaa 12480 tgagacgcac aaactaatat cacaaactgg aaatgtctat caatatatag ttgctgat 12538 <210> 2 <211> 11544 <212> DNA <213> Artificial Sequence <220> <223> Bac polH Cap2/5 <400> 2 ttaacgatac aaaccaaacg caacaagaac atttgtagta ttatctataa ttgaaaacgc 60 gtagttataa tcgctgaggt aatatttaaa atcattttca aatgattcac agttaatttg 120 cgacaatata attttatttt cacataaact agacgccttg tcgtcttctt cttcgtattc 180 cttctctttt tcatttttct cctcataaaa attaacatag ttattatcgt atccatatat 240 gtatctatcg tatagagtaa attttttgtt gtcataaata tatatgtctt ttttaatggg 300 gtgtatagta ccgctgcgca tagtttttct gtaatttaca acagtgctat tttctggtag 360 ttcttcggag tgtgttgctt taattattaa atttatataa tcaatgaatt tgggatcgtc 420 ggttttgtac aatatgttgc cggcatagta cgcagcttct tctagttcaa ttacaccatt 480 ttttagcagc accggattaa cataactttc caaaatgttg tacgaaccgt taaacaaaaa 540 cagttcacct cccttttcta tactattgtc tgcgagcagt tgtttgttgt taaaaataac 600 agccatcatg gagatctgag ctcggcgcgt gtaatgagac gcacaaacta atatcacaaa 660 ctggaaatgt ctatcaatat atagttgctg atgtaccgca tgctatgcat cagctgctag 720 tactccggaa tattaataga tcatggagat aattaaaatg ataaccatct cgcaaataaa 780 taagtatttt actgttttcg taacagtttt gtaataaaaa aacctataaa tagaccggag 840 tagtcatacc gtcccaccat cgggcgcgga tcgtaccggg cccaagcttg ccgccaccct 900 ggctgccgat ggttatctac ccgattggct cgaggacact ctctctgaag gaataagaca 960 gtggtggaag ctcaaacctg gcccaccacc accaaagccc gcagagcggc ataaggacga 1020 cagcaggggt cttgtgcttc ctgggtacaa gtacctcgga cccttcaacg gactcgacaa 1080 gggagagccg gtcaacgagg cagacgccgc ggccctcgag cacgacaaag cctacgaccg 1140 gcagctcgac agcggagaca acccgtacct caagtacaac cacgccgacg cggagtttca 1200 ggagcgcctt aaagaagata cgtcttttgg gggcaacctc ggacgagcag tcttccaggc 1260 gaaaaagagg gttcttgaac ctctgggcct ggttgaggaa cctgttaaga cggctccggg 1320 aaaaaagagg ccggtagagc actctcctgt ggagccagac tcctcctcgg gaaccggaaa 1380 ggcgggccag cagcctgcaa gaaaaagatt gaattttggt cagactggag acgcagactc 1440 agtacctgac ccccagcctc tcggacagcc accagcagcc ccctctggtc tgggaactaa 1500 tacgatggct acaggcagtg gcgcaccaat ggcagacaat aacgagggcg ccgacggagt 1560 gggtaattcc tcgggaaatt ggcattgcga ttccacatgg atgggcgaca gagtcatcac 1620 caccagcacc cgaacctggg ccctgcccac ctacaacaac cacctctaca aacaaatttc 1680 cagccaatca ggagcctcga acgacaatca ctactttggc tacagcaccc cttgggggta 1740 ttttgacttc aacagattcc actgccactt ttcaccacgt gactggcaaa gactcatcaa 1800 caacaactgg ggattccgac ccaagagact caacttcaag ctctttaaca ttcaagtcaa 1860 agaggtcacg cagaatgacg gtacgacgac gattgccaat aaccttacca gcacggttca 1920 ggtgtttact gactcggagt accagctccc gtacgtcctc ggctcggcgc atcaaggatg 1980 cctcccgccg ttcccagcag acgtcttcat ggtgccacag tatggatacc tcaccctgaa 2040 caacgggagt caggcagtag gacgctcttc attttactgc ctggagtact ttccttctca 2100 gatgctgcgt accggaaaca actttacctt cagctacact tttgaggacg ttcctttcca 2160 cagcagctac gctcacagcc agagtctgga ccgtctcatg aatcctctca tcgaccagta 2220 cctgtattac ttgagcagaa caaacactcc aagtggaacc accacgcagt caaggcttca 2280 gttttctcag gccggagcga gtgacattcg ggaccagtct aggaactggc ttcctggacc 2340 ctgttaccgc cagcagcgag tatcaaagac atctgcggat aacaacaaca gtgaatactc 2400 gtggactgga gctaccaagt accacctcaa tggcagagac tctctggtga atccgggccc 2460 ggccatggca agccacaagg acgatgaaga aaagtttttt cctcagagcg gggttctcat 2520 ctttgggaag caaggctcag agaaaacaaa tgtggacatt gaaaaggtca tgattacaga 2580 cgaagaggaa atcaggacaa ccaatcccgt ggctacggag cagtatggtt ctgtatctac 2640 caacctccag agaggcaaca gacaagcagc taccgcagat gtcaacacac aaggcgttct 2700 tccaggcatg gtctggcagg acagagatgt gtaccttcag gggcccatct gggcaaagat 2760 tccacacacg gacggacatt ttcacccctc tcccctcatg ggtggattcg gacttaaaca 2820 ccctcctcca cagattctca tcaagaacac cccggtacct gcgaatcctt cgaccacctt 2880 cagtgcggca aagtttgctt ccttcatcac acagtactcc acgggacagg tcagcgtgga 2940 gatcgagtgg gagctgcaga aggaaaacag caaacgctgg aatcccgaaa ttcagtacac 3000 ttccaactac aacaagtctg ttaatgtgga ctttactgtg gacactaatg gcgtgtattc 3060 agagcctcgc cccattggca ccagatacct gactcgtaat ctgtaagatc ataatcagcc 3120 ataccacatt tgtagaggtt ttacttgctt taaaaaacct cccacacctc cccctgaacc 3180 tgaaacataa aatgaatgca attgttgttg ttaacttgtt tattgcagct tataatggtt 3240 acaaataaag caatagcatc acaaatttca caaataaagc atttttttca ctgcattcta 3300 gttgtggttt gtccaaactc atcaatgtat cttatcatgt ctggatcggc cgccccgggg 3360 gtaccgactc tgctgaagag gaggaaattc tccttgaagt ttccctggtg ttcaaagtaa 3420 aggagtttgc accagacgca cctctgttca ctggtccggc gtattaaaac acgatacatt 3480 gttattagta catttattaa gcgctagatt ctgtgcgttg ttgatttaca gacaattgtt 3540 gtacgtattt taataattca ttaaatttat aatctttagg gtggtatgtt agagcgaaaa 3600 tcaaatgatt ttcagcgtct ttatatctga atttaaatat taaatcctca atagatttgt 3660 aaaataggtt tcgattagtt tcaaacaagg gttgtttttc cgaaccgatg gctggactat 3720 ctaatggatt ttcgctcaac gccacaaaac ttgccaaatc ttgtagcagc aatctagctt 3780 tgtcgatatt cgtttgtgtt ttgttttgta ataaaggttc gacgtcgttc aaaatattat 3840 gcgcttttgt atttctttca tcactgtcgt tagtgtacaa ttgactcgac gtaaacacgt 3900 taaataaagc ttggacatat ttaacatcgg gcgtgttagc tttattaggc cgattatcgt 3960 cgtcgtccca accctcgtcg ttagaagttg cttccgaaga cgattttgcc atagccacac 4020 gacgcctatt aattgtgtcg gctaacacgt ccgcgatcaa atttgtagtt gagctttttg 4080 gaattatttc tgattgcggg cgtttttggg cgggtttcaa tctaactgtg cccgatttta 4140 attcagacaa cacgttagaa agcgatggtg caggcggtgg taacatttca gacggcaaat 4200 ctactaatgg cggcggtggt ggagctgatg ataaatctac catcggtgga ggcgcaggcg 4260 gggctggcgg cggaggcgga ggcggaggtg gtggcggtga tgcagacggc ggtttaggct 4320 caaatgtctc tttaggcaac acagtcggca cctcaactat tgtactggtt tcgggcgccg 4380 tttttggttt gaccggtctg agacgagtgc gatttttttc gtttctaata gcttccaaca 4440 attgttgtct gtcgtctaaa ggtgcagcgg gttgaggttc cgtcggcatt ggtggagcgg 4500 gcggcaattc agacatcgat ggtggtggtg gtggtggagg cgctggaatg ttaggcacgg 4560 gagaaggtgg tggcggcggt gccgccggta taatttgttc tggtttagtt tgttcgcgca 4620 cgattgtggg caccggcgca ggcgccgctg gctgcacaac ggaaggtcgt ctgcttcgag 4680 gcagcgcttg gggtggtggc aattcaatat tataattgga atacaaatcg taaaaatctg 4740 ctataagcat tgtaatttcg ctatcgttta ccgtgccgat atttaacaac cgctcaatgt 4800 aagcaattgt attgtaaaga gattgtctca agctcggatc ccgcacgccg ataacaagcc 4860 ttttcatttt tactacagca ttgtagtggc gagacacttc gctgtcgtcg acgtacatgt 4920 atgctttgtt gtcaaaaacg tcgttggcaa gctttaaaat atttaaaaga acatctctgt 4980 tcagcaccac tgtgttgtcg taaatgttgt ttttgataat ttgcgcttcc gcagtatcga 5040 cacgttcaaa aaattgatgc gcatcaattt tgttgttcct attattgaat aaataagatt 5100 gtacagattc atatctacga ttcgtcatgg ccaccacaaa tgctacgctg caaacgctgg 5160 tacaatttta cgaaaactgc aaaaacgtca aaactcggta taaaataatc aacgggcgct 5220 ttggcaaaat atctatttta tcgcacaagc ccactagcaa attgtatttg cagaaaacaa 5280 tttcggcgca caattttaac gctgacgaaa taaaagttca ccagttaatg agcgaccacc 5340 caaattttat aaaaatctat tttaatcacg gttccatcaa caaccaagtg atcgtgatgg 5400 actacattga ctgtcccgat ttatttgaaa cactacaaat taaaggcgag ctttcgtacc 5460 aacttgttag caatattatt agacagctgt gtgaagcgct caacgatttg cacaagcaca 5520 atttcataca caacgacata aaactcgaaa atgtcttata tttcgaagca cttgatcgcg 5580 tgtatgtttg cgattacgga ttgtgcaaac acgaaaactc acttagcgtg cacgacggca 5640 cgttggagta ttttagtccg gaaaaaattc gacacacaac tatgcacgtt tcgtttgact 5700 ggtacgccgt cgaattcact ggccgtcgtt ttacaacgtc gtgactggga aaaccctggc 5760 gttacccaac ttaatcgcct tgcagcacat ccccctttcg ccagctggcg taatagcgaa 5820 gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc tgaatggcga atggcgcctg 5880 atgcggtatt ttctccttac gcatctgtgc ggtatttcac accgcatatg gtgcactctc 5940 agtacaatct gctctgatgc cgcatagtta agccagcccc gacacccgcc aacacccgct 6000 gacgcgccct gacgggcttg tctgctcccg gcatccgctt acagacaagc tgtgaccgtc 6060 tccgggagct gcatgtgtca gaggttttca ccgtcatcac cgaaacgcgc gagacgaaag 6120 ggcctcgtga tacgcctatt tttataggtt aatgtcatga taataatggt ttcttagacg 6180 tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta tttgtttatt tttctaaata 6240 cattcaaata tgtatccgct catgagacaa taaccctgat aaatgcttca ataatattga 6300 aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc ttattccctt ttttgcggca 6360 ttttgccttc ctgtttttgc tcacccagaa acgctggtga aagtaaaaga tgctgaagat 6420 cagttgggtg cacgagtggg ttacatcgaa ctggatctca acagcggtaa gatccttgag 6480 agttttcgcc ccgaagaacg ttttccaatg atgagcactt ttaaagttct gctatgtggc 6540 gcggtattat cccgtattga cgccgggcaa gagcaactcg gtcgccgcat acactattct 6600 cagaatgact tggttgagta ctcaccagtc acagaaaagc atcttacgga tggcatgaca 6660 gtaagagaat tatgcagtgc tgccataacc atgagtgata acactgcggc caacttactt 6720 ctgacaacga tcggaggacc gaaggagcta accgcttttt tgcacaacat gggggatcat 6780 gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag ccataccaaa cgacgagcgt 6840 gacaccacga tgcctgtagc aatggcaaca acgttgcgca aactattaac tggcgaacta 6900 cttactctag cttcccggca acaattaata gactggatgg aggcggataa agttgcagga 6960 ccacttctgc gctcggccct tccggctggc tggtttattg ctgataaatc tggagccggt 7020 gagcgtgggt ctcgcggtat cattgcagca ctggggccag atggtaagcc ctcccgtatc 7080 gtagttatct acacgacggg gagtcaggca actatggatg aacgaaatag acagatcgct 7140 gagataggtg cctcactgat taagcattgg taactgtcag accaagttta ctcatatata 7200 ctttagattg atttaaaact tcatttttaa tttaaaagga tctaggtgaa gatccttttt 7260 gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 7320 gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 7380 caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 7440 ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt tcttctagtg 7500 tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 7560 ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 7620 tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 7680 cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 7740 gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 7800 ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 7860 gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 7920 agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 7980 tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 8040 tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 8100 gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc ccgcgcgttg gccgattcat 8160 taatgcagct ggcacgacag gtttcccgac tggaaagcgg gcagtgagcg caacgcaatt 8220 aatgtgagtt agctcactca ttaggcaccc caggctttac actttatgct tccggctcgt 8280 atgttgtgtg gaattgtgag cggataacaa tttcacacag gaaacagcta tgaccatgat 8340 tacgccaagc ttgcatgcct gcaggtcgac tctagaccga gttgtttgcg tacgtgacta 8400 gcgaagaaga tgtgtggacc gcagaacaga tagtaaaaca aaaccctagt attggagcaa 8460 taatcgattt aaccaacacg tctaaatatt atgatggtgt gcattttttg cgggcgggcc 8520 tgttatacaa aaaaattcaa gtacctggcc agactttgcc gcctgaaagc atagttcaag 8580 aatttattga cacggtaaaa gaatttacag aaaagtgtcc cggcatgttg gtgggcgtgc 8640 actgcacaca cggtattaat cgcaccggtt acatggtgtg cagatattta atgcacaccc 8700 tgggtattgc gccgcaggaa gccatagata gattcgaaaa agccagaggt cacaaaattg 8760 aaagacaaaa ttacgttcaa gatttattaa tttaattaat attatttgca ttctttaaca 8820 aatactttat cctattttca aattgttgcg cttcttccag cgaaccaaaa ctatgcttcg 8880 cttgctccgt ttagcttgta gccgatcagt ggcgttgttc caatcgacgg taggattagg 8940 ccggatattc tccaccacaa tgttggcaac gttgatgtta cgtttatgct tttggttttc 9000 cacgtacgtc ttttggccgg taatagccgt aaacgtagtg ccgtcgcgcg tcacgcacaa 9060 caccggatgt ttgcgcttgt ccgcggggta ttgaaccgcg cgatccgaca aatccaccac 9120 tttggcaact aaatcggtga cctgcgcgtc ttttttctgc attatttcgt ctttcttttg 9180 catggtttcc tggaagccgg tgtacatgcg gtttagatca gtcatgacgc gcgtgacctg 9240 caaatctttg gcctcgatct gcttgtcctt gatggcaacg atgcgttcaa taaactcttg 9300 ttttttaaca agttcctcgg ttttttgcgc caccaccgct tgcagcgcgt ttgtgtgctc 9360 ggtgaatgtc gcaatcagct tagtcaccaa ctgtttgctc tcctcctccc gttgtttgat 9420 cgcgggatcg tacttgccgg tgcagagcac ttgaggaatt acttcttcta aaagccattc 9480 ttgtaattct atggcgtaag gcaatttgga cttcataatc agctgaatca cgccggattt 9540 agtaatgagc actgtatgcg gctgcaaata cagcgggtcg ccccttttca cgacgctgtt 9600 agaggtaggg cccccatttt ggatggtctg ctcaaataac gatttgtatt tattgtctac 9660 atgaacacgt atagctttat cacaaactgt atattttaaa ctgttagcga cgtccttggc 9720 cacgaaccgg acctgttggt cgcgctctag cacgtaccgc aggttgaacg tatcttctcc 9780 aaatttaaat tctccaattt taacgcgagc cattttgata cacgtgtgtc gattttgcaa 9840 caactattgt tttttaacgc aaactaaact tattgtggta agcaataatt aaatatgggg 9900 gaacatgcgc cgctacaaca ctcgtcgtta tgaacgcaga cggcgccggt ctcggcgcaa 9960 gcggctaaaa cgtgttgcgc gttcaacgcg gcaaacatcg caaaagccaa tagtacagtt 10020 ttgatttgca tattaacggc gattttttaa attatcttat ttaataaata gttatgacgc 10080 ctacaactcc ccgcccgcgt tgactcgctg cacctcgagc agttcgttga cgccttcctc 10140 cgtgtggccg aacacgtcga gcgggtggtc gatgaccagc ggcgtgccgc acgcgacgca 10200 caagtatctg tacaccgaat gatcgtcggg cgaaggcacg tcggcctcca agtggcaata 10260 ttggcaaatt cgaaaatata tacagttggg ttgtttgcgc atatctatcg tggcgttggg 10320 catgtacgtc cgaacgttga tttgcatgca agccgaaatt aaatcattgc gattagtgcg 10380 attaaaacgt tgtacatcct cgcttttaat catgccgtcg attaaatcgc gcaatcgagt 10440 caagtgatca aagtgtggaa taatgttttc tttgtattcc cgagtcaagc gcagcgcgta 10500 ttttaacaaa ctagccatct tgtaagttag tttcatttaa tgcaacttta tccaataata 10560 tattatgtat cgcacgtcaa gaattaacaa tgcgcccgtt gtcgcatctc aacacgacta 10620 tgatagagat caaataaagc gcgaattaaa tagcttgcga cgcaacgtgc acgatctgtg 10680 cacgcgttcc ggcacgagct ttgattgtaa taagttttta cgaagcgatg acatgacccc 10740 cgtagtgaca acgatcacgc ccaaaagaac tgccgactac aaaattaccg agtatgtcgg 10800 tgacgttaaa actattaagc catccaatcg accgttagtc gaatcaggac cgctggtgcg 10860 agaagccgcg aagtatggcg aatgcatcgt ataacgtgtg gagtccgctc attagagcgt 10920 catgtttaga caagaaagct acatatttaa ttgatcccga tgattttatt gataaattga 10980 ccctaactcc atacacggta ttctacaatg gcggggtttt ggtcaaaatt tccggactgc 11040 gattgtacat gctgttaacg gctccgccca ctattaatga aattaaaaat tccaatttta 11100 aaaaacgcag caagagaaac atttgtatga aagaatgcgt agaaggaaag aaaaatgtcg 11160 tcgacatgct gaacaacaag attaatatgc ctccgtgtat aaaaaaaata ttgaacgatt 11220 tgaaagaaaa caatgtaccg cgcggcggta tgtacaggaa gaggtttata ctaaactgtt 11280 acattgcaaa cgtggtttcg tgtgccaagt gtgaaaaccg atgtttaatc aaggctctga 11340 cgcatttcta caaccacgac tccaagtgtg tgggtgaagt catgcatctt ttaatcaaat 11400 cccaagatgt gtataaacca ccaaactgcc aaaaaatgaa aactgtcgac aagctctgtc 11460 cgtttgctgg caactgcaag ggtctcaatc ctatttgtaa ttattgaata ataaaacaat 11520 tataaatgct aaatttgttt ttta 11544 <210> 3 <211> 14299 <212> DNA <213> Artificial Sequence <220> <223> Bac polH Cap5 - human Factor IX <400> 3 tgtaatgaga cgcacaaact aatatcacaa actggaaatg tctatcaata tatagttgct 60 gatgtaccgc agcatgctat gcatcagctg ctagtactcc ggaatattaa tagatcatgg 120 agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt ttcgtaacag 180 ttttgtaata aaaaaaccta taaatagacc ggagtagtca taccgtccca ccatcgggcg 240 cggatcgtac cgggcccaag cttcctgtta agacggcttc ttttgttgat cacccacccg 300 attggttgga agaagttggt gaaggtcttc gcgagttttt gggccttgaa gcgggcccac 360 cgaaaccaaa acccaatcag cagcatcaag atcaagcccg tggtcttgtg ctgcctggtt 420 ataactatct cggacccgga aacggtctcg atcgaggaga gcctgtcaac agggcagacg 480 aggtcgcgcg agagcacgac atctcgtaca acgagcagct tgaggcggga gacaacccct 540 acctcaagta caaccacgcg gacgccgagt ttcaggagaa gctcgccgac gacacatcct 600 tcgggggaaa cctcggaaag gcagtctttc aggccaagaa aagggttctc gaaccttttg 660 gcctggttga agagggtgct aagacggccc ctaccggaaa gcggatagac gaccactttc 720 caaaaagaaa gaaggctcgg accgaagagg actccaagcc ttccacctcg tcagacgccg 780 aagctggacc cagcggatcc cagcagctgc aaatcccagc ccaaccagcc tcaagtttgg 840 gagctgatac aatgtctgcg ggaggtggcg gcccattggg cgacaataac caaggtgccg 900 atggagtggg caatgcctcg ggagattggc attgcgattc cacgtggatg ggggacagag 960 tcgtcaccaa gtccacccga acctgggtgc tgcccagcta caacaaccac cagtaccgag 1020 agatcaaaag cggctccgtc gacggaagca acgccaacgc ctactttgga tacagcaccc 1080 cctgggggta ctttgacttt aaccgcttcc acagccactg gagcccccga gactggcaaa 1140 gactcatcaa caactactgg ggcttcagac cccggtccct cagagtcaaa atcttcaaca 1200 ttcaagtcaa agaggtcacg gtgcaggact ccaccaccac catcgccaac aacctcacct 1260 ccaccgtcca agtgtttacg gacgacgact accagctgcc ctacgtcgtc ggcaacggga 1320 ccgagggatg cctgccggcc ttccctccgc aggtctttac gctgccgcag tacggttacg 1380 cgacgctgaa ccgcgacaac acagaaaatc ccaccgagag gagcagcttc ttctgcctag 1440 agtactttcc cagcaagatg ctgagaacgg gcaacaactt tgagtttacc tacaactttg 1500 aggaggtgcc cttccactcc agcttcgctc ccagtcagaa cctcttcaag ctggccaacc 1560 cgctggtgga ccagtacttg taccgcttcg tgagcacaaa taacactggc ggagtccagt 1620 tcaacaagaa cctggccggg agatacgcca acacctacaa aaactggttc ccggggccca 1680 tgggccgaac ccagggctgg aacctgggct ccggggtcaa ccgcgccagt gtcagcgcct 1740 tcgccacgac caataggatg gagctcgagg gcgcgagtta ccaggtgccc ccgcagccga 1800 acggcatgac caacaacctc cagggcagca acacctatgc cctggagaac actatgatct 1860 tcaacagcca gccggcgaac ccgggcacca ccgccacgta cctcgagggc aacatgctca 1920 tcaccagcga gagcgagacg cagccggtga accgcgtggc gtacaacgtc ggcgggcaga 1980 tggccaccaa caaccagagc tccaccactg cccccgcgac cggcacgtac aacctccagg 2040 aaatcgtgcc cggcagcgtg tggatggaga gggacgtgta cctccaagga cccatctggg 2100 ccaagatccc agagacgggg gcgcactttc acccctctcc ggccatgggc ggattcggac 2160 tcaaacaccc accgcccatg atgctcatca agaacacgcc tgtgcccgga aatatcacca 2220 gcttctcgga cgtgcccgtc agcagcttca tcacccagta cagcaccggg caggtcaccg 2280 tggagatgga gtgggagctc aagaaggaaa actccaagag gtggaaccca gagatccagt 2340 acacaaacaa ctacaacgac ccccagtttg tggactttgc cccggacagc accggggaat 2400 acagaaccac cagacctatc ggaacccgat accttacccg acccctttaa tctagagcct 2460 gcagtctcga caagctagct tgtcgagaag tactagagga tcataatcag ccataccaca 2520 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 2580 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 2640 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 2700 ttgtccaaac tcatcaatgt atcttatcat gtctggatct gatcactgct tgagcctagg 2760 ggggtaccag atcccatggg agctctgcag aattctctag aggcctcgcg agatcgatct 2820 agaaagcttc ccggggggat ctgggccact ccctctctgc gcgctcgctc gctcactgag 2880 gccgcccggg caaagcccgg gcgtcgggcg acctttggtc gcccggcctc agtgagcgag 2940 cgagcgcgca gagagggagt ggccaactcc atcactaggg gttcctggag gggtggagtc 3000 gtgaccccta aaatgggcaa acattgcaag cagcaaacag caaacacaca gccctccctg 3060 cctgctgacc ttggagctgg ggcagaggtc agagacctct ctgggcccat gccacctcca 3120 acatccactc gaccccttgg aatttcggtg gagaggagca gaggttgtcc tggcgtggtt 3180 taggtagtgt gagaggggaa tgactccttt cggtaagtgc agtggaagct gtacactgcc 3240 caggcaaagc gtccgggcag cgtaggcggg cgactcagat cccagccagt ggacttagcc 3300 cctgtttgct cctccgataa ctggggtgac cttggttaat attcaccagc agcctccccc 3360 gttgcccctc tggatccact gcttaaatac ggacgaggac agggccctgt ctcctcagct 3420 tcaggcacca ccactgacct gggacagtga atccggactc taaggtaaat ataaaatttt 3480 taagtgtata atgtgttaaa ctactgattc taattgtttc tctcttttag attccaacct 3540 ttggaactga attctagacc accatgcaga gggtgaacat gatcatggct gagagccctg 3600 gcctgatcac catctgcctg ctgggctacc tgctgtctgc tgagtgcact gtgttcctgg 3660 accatgagaa tgccaacaag atcctgaaca ggcccaagag atacaactct ggcaagctgg 3720 aggagtttgt gcagggcaac ctggagaggg agtgcatgga ggagaagtgc agctttgagg 3780 aggccaggga ggtgtttgag aacactgaga ggaccactga gttctggaag cagtatgtgg 3840 atggggacca gtgtgagagc aacccctgcc tgaatggggg cagctgcaag gatgacatca 3900 acagctatga gtgctggtgc ccctttggct ttgagggcaa gaactgtgag ctggatgtga 3960 cctgcaacat caagaatggc agatgtgagc agttctgcaa gaactctgct gacaacaagg 4020 tggtgtgcag ctgcactgag ggctacaggc tggctgagaa ccagaagagc tgtgagcctg 4080 ctgtgccatt cccatgtggc agagtgtctg tgagccagac cagcaagctg accagggctg 4140 aggctgtgtt ccctgatgtg gactatgtga acagcactga ggctgaaacc atcctggaca 4200 acatcaccca gagcacccag agcttcaatg acttcaccag ggtggtgggg ggggaggatg 4260 ccaagcctgg ccagttcccc tggcaagtgg tgctgaatgg caaggtggat gccttctgtg 4320 ggggcagcat tgtgaatgag aagtggattg tgactgctgc ccactgtgtg gagactgggg 4380 tgaagatcac tgtggtggct ggggagcaca acattgagga gactgagcac actgagcaga 4440 agaggaatgt gatcaggatc atcccccacc acaactacaa tgctgccatc aacaagtaca 4500 accatgacat tgccctgctg gagctggatg agcccctggt gctgaacagc tatgtgaccc 4560 ccatctgcat tgctgacaag gagtacacca acatcttcct gaagtttggc tctggctatg 4620 tgtctggctg gggcagggtg ttccacaagg gcaggtctgc cctggtgctg cagtacctga 4680 gggtgcccct ggtggacagg gccacctgcc tgctgagcac caagttcacc atctacaaca 4740 acatgttctg tgctggcttc catgaggggg gcagggacag ctgccagggg gactctgggg 4800 gcccccatgt gactgaggtg gagggcacca gcttcctgac tggcatcatc agctgggggg 4860 aggagtgtgc catgaagggc aagtatggca tctacaccaa agtctccaga tatgtgaact 4920 ggatcaagga gaagaccaag ctgacctgac tcgatgcttt atttgtgaaa tttgtgatgc 4980 tattgcttta tttgtaacca ttataagctg caataaacaa gttaacaaca acaattgcat 5040 tcattttatg tttcaggttc agggggaggt gtgggaggtt ttttaaacta ggtcacgact 5100 ccacccctcc aggaacccct agtgatggag ttggccactc cctctctgcg cgctcgctcg 5160 ctcactgagg ccgggcgacc aaaggtcgcc cgacgcccgg gctttgcccg ggcggcctca 5220 gtgagcgagc gagcgcgcag agagggagtg gcccagatcc ccccgggaag ctttctagat 5280 cgatcttaat taattaagta ccgactctgc tgaagaggag gaaattctcc ttgaagtttc 5340 cctggtgttc aaagtaaagg agtttgcacc agacgcacct ctgttcactg gtccggcgta 5400 ttaaaacacg atacattgtt attagtacat ttattaagcg ctagattctg tgcgttgttg 5460 atttacagac aattgttgta cgtattttaa taattcatta aatttataat ctttagggtg 5520 gtatgttaga gcgaaaatca aatgattttc agcgtcttta tatctgaatt taaatattaa 5580 atcctcaata gatttgtaaa ataggtttcg attagtttca aacaagggtt gtttttccga 5640 accgatggct ggactatcta atggattttc gctcaacgcc acaaaacttg ccaaatcttg 5700 tagcagcaat ctagctttgt cgatattcgt ttgtgttttg ttttgtaata aaggttcgac 5760 gtcgttcaaa atattatgcg cttttgtatt tctttcatca ctgtcgttag tgtacaattg 5820 actcgacgta aacacgttaa ataaagcttg gacatattta acatcgggcg tgttagcttt 5880 attaggccga ttatcgtcgt cgtcccaacc ctcgtcgtta gaagttgctt ccgaagacga 5940 ttttgccata gccacacgac gcctattaat tgtgtcggct aacacgtccg cgatcaaatt 6000 tgtagttgag ctttttggaa ttatttctga ttgcgggcgt ttttgggcgg gtttcaatct 6060 aactgtgccc gattttaatt cagacaacac gttagaaagc gatggtgcag gcggtggtaa 6120 catttcagac ggcaaatcta ctaatggcgg cggtggtgga gctgatgata aatctaccat 6180 cggtggaggc gcaggcgggg ctggcggcgg aggcggaggc ggaggtggtg gcggtgatgc 6240 agacggcggt ttaggctcaa atgtctcttt aggcaacaca gtcggcacct caactattgt 6300 actggtttcg ggcgccgttt ttggtttgac cggtctgaga cgagtgcgat ttttttcgtt 6360 tctaatagct tccaacaatt gttgtctgtc gtctaaaggt gcagcgggtt gaggttccgt 6420 cggcattggt ggagcgggcg gcaattcaga catcgatggt ggtggtggtg gtggaggcgc 6480 tggaatgtta ggcacgggag aaggtggtgg cggcggtgcc gccggtataa tttgttctgg 6540 tttagtttgt tcgcgcacga ttgtgggcac cggcgcaggc gccgctggct gcacaacgga 6600 aggtcgtctg cttcgaggca gcgcttgggg tggtggcaat tcaatattat aattggaata 6660 caaatcgtaa aaatctgcta taagcattgt aatttcgcta tcgtttaccg tgccgatatt 6720 taacaaccgc tcaatgtaag caattgtatt gtaaagagat tgtctcaagc tcggatcccg 6780 cacgccgata acaagccttt tcatttttac tacagcattg tagtggcgag acacttcgct 6840 gtcgtcgacg tacatgtatg ctttgttgtc aaaaacgtcg ttggcaagct ttaaaatatt 6900 taaaagaaca tctctgttca gcaccactgt gttgtcgtaa atgttgtttt tgataatttg 6960 cgcttccgca gtatcgacac gttcaaaaaa ttgatgcgca tcaattttgt tgttcctatt 7020 attgaataaa taagattgta cagattcata tctacgattc gtcatggcca ccacaaatgc 7080 tacgctgcaa acgctggtac aattttacga aaactgcaaa aacgtcaaaa ctcggtataa 7140 aataatcaac gggcgctttg gcaaaatatc tattttatcg cacaagccca ctagcaaatt 7200 gtatttgcag aaaacaattt cggcgcacaa ttttaacgct gacgaaataa aagttcacca 7260 gttaatgagc gaccacccaa attttataaa aatctatttt aatcacggtt ccatcaacaa 7320 ccaagtgatc gtgatggact acattgactg tcccgattta tttgaaacac tacaaattaa 7380 aggcgagctt tcgtaccaac ttgttagcaa tattattaga cagctgtgtg aagcgctcaa 7440 cgatttgcac aagcacaatt tcatacacaa cgacataaaa ctcgaaaatg tcttatattt 7500 cgaagcactt gatcgcgtgt atgtttgcga ttacggattg tgcaaacacg aaaactcact 7560 tagcgtgcac gacggcacgt tggagtattt tagtccggaa aaaattcgac acacaactat 7620 gcacgtttcg tttgactggt acgcggcgtg ttaacataca agttgctaac cggcggccga 7680 cacccatttg aaaaaagcga agacgaaatg ttggacttga atagcatgaa gcgtcgtcag 7740 caatacaatg acattggcgt tttaaaacac gttcgtaacg ttaacgctcg tgactttgtg 7800 tactgcctaa caagatacaa catagattgt agactcacaa attacaaaca aattataaaa 7860 catgagtttt tgtcgtaaaa atgccacttg ttttacgagt agaattcgta atcatggtca 7920 tagctgtttc ctgtgtgaaa ttgttatccg ctcacaattc cacacaacat acgagccgga 7980 agcataaagt gtaaagcctg gggtgcctaa tgagtgagct aactcacatt aattgcgttg 8040 cgctcactgc ccgctttcca gtcgggaaac ctgtcgtgcc agctgcatta atgaatcggc 8100 caacgcgcgg ggagaggcgg tttgcgtatt gggcgctctt ccgcttcctc gctcactgac 8160 tcgctgcgct cggtcgttcg gctgcggcga gcggtatcag ctcactcaaa ggcggtaata 8220 cggttatcca cagaatcagg ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa 8280 aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct 8340 gacgagcatc acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa 8400 agataccagg cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg 8460 cttaccggat acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca 8520 cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa 8580 ccccccgttc agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg 8640 gtaagacacg acttatcgcc actggcagca gccactggta acaggattag cagagcgagg 8700 tatgtaggcg gtgctacaga gttcttgaag tggtggccta actacggcta cactagaagg 8760 acagtatttg gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc 8820 tcttgatccg gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag 8880 attacgcgca gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac 8940 gctcagtgga acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc 9000 ttcacctaga tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag 9060 taaacttggt ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt 9120 ctatttcgtt catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag 9180 ggcttaccat ctggccccag tgctgcaatg ataccgcgag acccacgctc accggctcca 9240 gatttatcag caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact 9300 ttatccgcct ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca 9360 gttaatagtt tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg 9420 tttggtatgg cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc 9480 atgttgtgca aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg 9540 gccgcagtgt tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca 9600 tccgtaagat gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt 9660 atgcggcgac cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc 9720 agaactttaa aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc 9780 ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca 9840 tcttttactt tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa 9900 aagggaataa gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat 9960 tgaagcattt atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa 10020 aataaacaaa taggggttcc gcgcacattt ccccgaaaag tgccacctga cgtctaagaa 10080 accattatta tcatgacatt aacctataaa aataggcgta tcacgaggcc ctttcgtctc 10140 gcgcgtttcg gtgatgacgg tgaaaacctc tgacacatgc agctcccgga gacggtcaca 10200 gcttgtctgt aagcggatgc cgggagcaga caagcccgtc agggcgcgtc agcgggtgtt 10260 ggcgggtgtc ggggctggct taactatgcg gcatcagagc agattgtact gagagtgcac 10320 catatgcggt gtgaaatacc gcacagatgc gtaaggagaa aataccgcat caggcgccat 10380 tcgccattca ggctgcgcaa ctgttgggaa gggcgatcgg tgcgggcctc ttcgctatta 10440 cgccagctgg cgaaaggggg atgtgctgca aggcgattaa gttgggtaac gccagggttt 10500 tcccagtcac gacgttgtaa aacgaccgag ttgtttgcgt acgtgactag cgaagaagat 10560 gtgtggaccg cagaacagat agtaaaacaa aaccctagta ttggagcaat aatcgattta 10620 accaacacgt ctaaatatta tgatggtgtg cattttttgc gggcgggcct gttatacaaa 10680 aaaattcaag tacctggcca gactttgccg cctgaaagca tagttcaaga atttattgac 10740 acggtaaaag aatttacaga aaagtgtccc ggcatgttgg tgggcgtgca ctgcacacac 10800 ggtattaatc gcaccggtta catggtgtgc agatatttaa tgcacaccct gggtattgcg 10860 ccgcaggaag ccatagatag attcgaaaaa gccagaggtc acaaaattga aagacaaaat 10920 tacgttcaag atttattaat ttaattaata ttatttgcat tctttaacaa atactttatc 10980 ctattttcaa attgttgcgc ttcttccagc gaaccaaaac tatgcttcgc ttgctccgtt 11040 tagcttgtag ccgatcagtg gcgttgttcc aatcgacggt aggattaggc cggatattct 11100 ccaccacaat gttggcaacg ttgatgttac gtttatgctt ttggttttcc acgtacgtct 11160 tttggccggt aatagccgta aacgtagtgc cgtcgcgcgt cacgcacaac accggatgtt 11220 tgcgcttgtc cgcggggtat tgaaccgcgc gatccgacaa atccaccact ttggcaacta 11280 aatcggtgac ctgcgcgtct tttttctgca ttatttcgtc tttcttttgc atggtttcct 11340 ggaagccggt gtacatgcgg tttagatcag tcatgacgcg cgtgacctgc aaatctttgg 11400 cctcgatctg cttgtccttg atggcaacga tgcgttcaat aaactcttgt tttttaacaa 11460 gttcctcggt tttttgcgcc accaccgctt gcagcgcgtt tgtgtgctcg gtgaatgtcg 11520 caatcagctt agtcaccaac tgtttgctct cctcctcccg ttgtttgatc gcgggatcgt 11580 acttgccggt gcagagcact tgaggaatta cttcttctaa aagccattct tgtaattcta 11640 tggcgtaagg caatttggac ttcataatca gctgaatcac gccggattta gtaatgagca 11700 ctgtatgcgg ctgcaaatac agcgggtcgc cccttttcac gacgctgtta gaggtagggc 11760 ccccattttg gatggtctgc tcaaataacg atttgtattt attgtctaca tgaacacgta 11820 tagctttatc acaaactgta tattttaaac tgttagcgac gtccttggcc acgaaccgga 11880 cctgttggtc gcgctctagc acgtaccgca ggttgaacgt atcttctcca aatttaaatt 11940 ctccaatttt aacgcgagcc attttgatac acgtgtgtcg attttgcaac aactattgtt 12000 ttttaacgca aactaaactt attgtggtaa gcaataatta aatatggggg aacatgcgcc 12060 gctacaacac tcgtcgttat gaacgcagac ggcgccggtc tcggcgcaag cggctaaaac 12120 gtgttgcgcg ttcaacgcgg caaacatcgc aaaagccaat agtacagttt tgatttgcat 12180 attaacggcg attttttaaa ttatcttatt taataaatag ttatgacgcc tacaactccc 12240 cgcccgcgtt gactcgctgc acctcgagca gttcgttgac gccttcctcc gtgtggccga 12300 acacgtcgag cgggtggtcg atgaccagcg gcgtgccgca cgcgacgcac aagtatctgt 12360 acaccgaatg atcgtcgggc gaaggcacgt cggcctccaa gtggcaatat tggcaaattc 12420 gaaaatatat acagttgggt tgtttgcgca tatctatcgt ggcgttgggc atgtacgtcc 12480 gaacgttgat ttgcatgcaa gccgaaatta aatcattgcg attagtgcga ttaaaacgtt 12540 gtacatcctc gcttttaatc atgccgtcga ttaaatcgcg caatcgagtc aagtgatcaa 12600 agtgtggaat aatgttttct ttgtattccc gagtcaagcg cagcgcgtat tttaacaaac 12660 tagccatctt gtaagttagt ttcatttaat gcaactttat ccaataatat attatgtatc 12720 gcacgtcaag aattaacaat gcgcccgttg tcgcatctca acacgactat gatagagatc 12780 aaataaagcg cgaattaaat agcttgcgac gcaacgtgca cgatctgtgc acgcgttccg 12840 gcacgagctt tgattgtaat aagtttttac gaagcgatga catgaccccc gtagtgacaa 12900 cgatcacgcc caaaagaact gccgactaca aaattaccga gtatgtcggt gacgttaaaa 12960 ctattaagcc atccaatcga ccgttagtcg aatcaggacc gctggtgcga gaagccgcga 13020 agtatggcga atgcatcgta taacgtgtgg agtccgctca ttagagcgtc atgtttagac 13080 aagaaagcta catatttaat tgatcccgat gattttattg ataaattgac cctaactcca 13140 tacacggtat tctacaatgg cggggttttg gtcaaaattt ccggactgcg attgtacatg 13200 ctgttaacgg ctccgcccac tattaatgaa attaaaaatt ccaattttaa aaaacgcagc 13260 aagagaaaca tttgtatgaa agaatgcgta gaaggaaaga aaaatgtcgt cgacatgctg 13320 aacaacaaga ttaatatgcc tccgtgtata aaaaaaatat tgaacgattt gaaagaaaac 13380 aatgtaccgc gcggcggtat gtacaggaag aggtttatac taaactgtta cattgcaaac 13440 gtggtttcgt gtgccaagtg tgaaaaccga tgtttaatca aggctctgac gcatttctac 13500 aaccacgact ccaagtgtgt gggtgaagtc atgcatcttt taatcaaatc ccaagatgtg 13560 tataaaccac caaactgcca aaaaatgaaa actgtcgaca agctctgtcc gtttgctggc 13620 aactgcaagg gtctcaatcc tatttgtaat tattgaataa taaaacaatt ataaatgcta 13680 aatttgtttt ttattaacga tacaaaccaa acgcaacaag aacatttgta gtattatcta 13740 taattgaaaa cgcgtagtta taatcgctga ggtaatattt aaaatcattt tcaaatgatt 13800 cacagttaat ttgcgacaat ataattttat tttcacataa actagacgcc ttgtcgtctt 13860 cttcttcgta ttccttctct ttttcatttt tctcctcata aaaattaaca tagttattat 13920 cgtatccata tatgtatcta tcgtatagag taaatttttt gttgtcataa atatatatgt 13980 cttttttaat ggggtgtata gtaccgctgc gcatagtttt tctgtaattt acaacagtgc 14040 tattttctgg tagttcttcg gagtgtgttg ctttaattat taaatttata taatcaatga 14100 atttgggatc gtcggttttg tacaatatgt tgccggcata gtacgcagct tcttctagtt 14160 caattacacc attttttagc agcaccggat taacataact ttccaaaatg ttgtacgaac 14220 cgttaaacaa aaacagttca cctccctttt ctatactatt gtctgcgagc agttgtttgt 14280 tgttaaaaat aacagccat 14299 <210> 4 <211> 13365 <212> DNA <213> Artificial Sequence <220> <223> Bac Rep183 <400> 4 accgctgcgc atagtttttc tgtaatttac aacagtgcta ttttctggta gttcttcgga 60 gtgtgttgct ttaattatta aatttatata atcaatgaat ttgggatcgt cggttttgta 120 caatatgttg ccggcatagt acgcagcttc ttctagttca attacaccat tttttagcag 180 caccggatta acataacttt ccaaaatgtt gtacgaaccg ttaaacaaaa acagttcacc 240 tcccttttct atactattgt ctgcgagcag ttgtttgttg ttaaaaataa cagccattgt 300 aatgagacgc acaaactaat atcacaaact ggaaatgtct atcaatatat agttgctgat 360 gtacccgtag tggctatggc agggcttgcc gccccgacgt tggctgcgag ccctgggcct 420 tcacccgaac ttgggggttg gggtggggaa aaggaagaaa cgcgggcgta ttggtcccaa 480 tggggtctcg gtggggtatc gacagagtgc cagccctggg accgaacccc gcgtttatga 540 acaaacgacc caacacccgt gcgttttatt ctgtcttttt attgccgtca tagcgcgggt 600 tccttccggt attgtctcct tccgtgtttc agttagcctc ccccatctcc cggtaccgca 660 tgctatgcat cagtcgagat taccctgtta tccctaccag tgtgttggat ttattgttca 720 aagatacagt catccaaatc cacattaacc agatcgcagg cagtacaagc gtctggcact 780 tttcccatga tatgatgaat atagcataat ttttgatacg ccttttttac gacagaaacg 840 ggttgagatt ctgacaccgg aaagcattct aaacagtctt tctggccgtg agtgaaacag 900 atattactat tctgattcat tctctcacat tgtctgcagg gaaacaacat taagttcatg 960 cctacgtgac gagaacattt gttttggtag cggtctgcgt agtttatcga agcttccgca 1020 tctgacgtgc ttggctgcgc aaccgattct ctcactcgtt tgggctcact tatatctgca 1080 tcactcgggg cgggtctttt cttagcacca ccttttttga cgtaaaattc atgttccact 1140 tcaacaacgt gatcctttgc ccaacgaaag aagtctttga cttcttgttt tgttaccttg 1200 ccaaaatcat gatccagtcg gcgcgtcaat tcaaatttga acattcggtc ttgcaacggt 1260 tgttggtgtt cgaatgtcgt actgttaccg tcaatcacgg cgcacatgtt cgtgttgctt 1320 gtaacgatca ccggtgtcgg gtctatctgc gcagagcttt tgcatttctg gtctacgcgc 1380 actttgctgc ctcctaaaat tgctttggcc gactccacga ctttagcggt cattttgcct 1440 tcctcccacc aaataaccat cttgtcgaca cagtcgttga atggaaagtt ctcattggtc 1500 cagttaacgc agccataaaa aggtacagtg tgggctatgg cctccgctat gtttgttttt 1560 cccgtagttg caggtccaaa caaccaaatg gtgtttcttt tgccaaactt tttcgtcgcc 1620 cagcccaaaa atacggaagc cgcatattga ggatcgtagc cgtttaactc caaaatctta 1680 tagatgcgat tgctggaaat gtcttccacg ggttgctggc ccaccaggta gtcgggggcg 1740 gttttagtca ggctcataat cttgcccgca ttgtccaagg cagctttgat ttggctacgc 1800 gagttggatg ccgcattaaa cgagatgtat gaggcttgat cttcttgtat ccattgcttc 1860 tccgaggtaa tacccttgtc caccaaccaa ccgaccaatt ccatggcgac cgagatccgc 1920 gcccgatggt gggacggtat gaataatccg gaatatttat aggttttttt attacaaaac 1980 tgttacgaaa acagtaaaat acttatttat ttgcgagatg gttatcattt taattatctc 2040 catgatctat taatattccg gagtactgct agcaccatgg atcccggtcc gaagcgcgcg 2100 gaattcaaag gcctacgtcg acgagctcac tagtcgcggc cgatctaata aacgataacg 2160 ccgggtggcg tgaggcatgt aaaaggttac atcattatct tgttcgccat ccggttggta 2220 taaatagacg ttcatgttgg tttttgtttc agttgcaagt tggctgcggc gcgcgcagca 2280 cctttgcggc catctgcaga attcgccctt gttactcttc agccatggcg gggttttacg 2340 agattgtgat taaggtcccc agcgaccttg acgagcatct gcccggcatt tctgacagct 2400 ttgtgaactg ggtggccgag aaggaatggg agttgccgcc agattctgac atggatctga 2460 atctgattga gcaggcaccc ctgaccgtgg ccgagaagct gcagcgcgac tttctgacgg 2520 aatggcgccg tgtgagtaag gccccggagg cccttttctt tgtgcaattt gagaagggag 2580 agagctactt ccacatgcac gtgctcgtgg aaaccaccgg ggtgaaatcc atggttttgg 2640 gacgtttcct gagtcagatt cgcgaaaaac tgattcagag aatttaccgc gggatcgagc 2700 cgactttgcc aaactggttc gcggtcacaa agaccagaaa tggcgccgga ggcgggaaca 2760 aggtggtgga tgagtgctac atccccaatt acttgctccc caaaacccag cctgagctcc 2820 agtgggcgtg gactaatatg gaacagtatt taagcgcctg tttgaatctc acggagcgta 2880 aacggttggt ggcgcagcat ctgacgcacg tgtcgcagac gcaggagcag aacaaagaga 2940 atcagaatcc caattctgat gcgccggtga tcagatcaaa aacttcagcc aggtacatgg 3000 agctggtcgg gtggctcgtg gacaagggga ttacctcgga gaagcagtgg atccaggagg 3060 accaggcctc atacatctcc ttcaatgcgg cctccaactc gcggtcccaa atcaaggctg 3120 ccttggacaa tgcgggaaag attatgagcc tgactaaaac cgcccccgac tacctggtgg 3180 gccagcagcc cgtggaggac atttccagca atcggattta taaaattttg gaactaaacg 3240 ggtacgatcc ccaatatgcg gcttccgtct ttctgggatg ggccacgaaa aagttcggca 3300 agaggaacac catctggctg tttgggcctg caactaccgg gaagaccaac atcgcggagg 3360 ccatagccca cactgtgccc ttctacgggt gcgtaaactg gaccaatgag aactttccct 3420 tcaacgactg tgtcgacaag atggtgatct ggtgggagga ggggaagatg accgccaagg 3480 tcgtggagtc ggccaaagcc attctcggag gaagcaaggt gcgcgtggac cagaaatgca 3540 agtcctcggc ccagatagac ccgactcccg tgatcgtcac ctccaacacc aacatgtgcg 3600 ccgtgattga cgggaactca acgaccttcg aacaccagca gccgttgcaa gaccggatgt 3660 tcaaatttga actcacccgc cgtctggatc atgactttgg gaaggtcacc aagcaggaag 3720 tcaaagactt tttccggtgg gcaaaggatc acgtggttga ggtggagcat gaattctacg 3780 tcaaaaaggg tggagccaag aaaagacccg cccccagtga cgcagatata agtgagccca 3840 aacgggtgcg cgagtcagtt gcgcagccat cgacgtcaga cgcggaagct tcgatcaact 3900 acgcagacag gtaccaaaac aaatgttctc gtcacgtggg catgaatctg atgctgtttc 3960 cctgcagaca atgcgagaga atgaatcaga attcaaatat ctgcttcact cacggacaga 4020 aagactgttt agagtgcttt cccgtgtcag aatctcaacc cgtttctgtc gtcaaaaagg 4080 cgtatcagaa actgtgctac attcatcata tcatgggaaa ggtgccagac gcttgcactg 4140 cctgcgatct ggtcaatgtg gatttggatg actgcatctt tgaacaataa atgatttaaa 4200 tcaggtatgg ctgccgatgg ttatcttcca gattggctcg aggacactct ctctgatgaa 4260 gagtaactaa gggcgaattc cagcacactg gcggccgtta ctaggtagct gagcgggccg 4320 ctttcgaatc tagagcctgc agtctcgaca agcttgtcga gaagtactag aggatcataa 4380 tcagccatac cacatttgta gaggttttac ttgctttaaa aaacctccca cacctccccc 4440 tgaacctgaa acataaaatg aatgcaattg ttgttgttaa cttgtttatt gcagcttata 4500 atggttacaa ataaagcaat agcatcacaa atttcacaaa taaagcattt ttttcactgc 4560 attctagttg tggtttgtcc aaactcatca atgtatctta tcatgtctgg atctgatcac 4620 tgcttgagcc tagaggcctc gcgagatctt aattaattaa gtaccgactc tgctgaagag 4680 gaggaaattc tccttgaagt ttccctggtg ttcaaagtaa aggagtttgc accagacgca 4740 cctctgttca ctggtccggc gtattaaaac acgatacatt gttattagta catttattaa 4800 gcgctagatt ctgtgcgttg ttgatttaca gacaattgtt gtacgtattt taataattca 4860 ttaaatttat aatctttagg gtggtatgtt agagcgaaaa tcaaatgatt ttcagcgtct 4920 ttatatctga atttaaatat taaatcctca atagatttgt aaaataggtt tcgattagtt 4980 tcaaacaagg gttgtttttc cgaaccgatg gctggactat ctaatggatt ttcgctcaac 5040 gccacaaaac ttgccaaatc ttgtagcagc aatctagctt tgtcgatatt cgtttgtgtt 5100 ttgttttgta ataaaggttc gacgtcgttc aaaatattat gcgcttttgt atttctttca 5160 tcactgtcgt tagtgtacaa ttgactcgac gtaaacacgt taaataaagc ttggacatat 5220 ttaacatcgg gcgtgttagc tttattaggc cgattatcgt cgtcgtccca accctcgtcg 5280 ttagaagttg cttccgaaga cgattttgcc atagccacac gacgcctatt aattgtgtcg 5340 gctaacacgt ccgcgatcaa atttgtagtt gagctttttg gaattatttc tgattgcggg 5400 cgtttttggg cgggtttcaa tctaactgtg cccgatttta attcagacaa cacgttagaa 5460 agcgatggtg caggcggtgg taacatttca gacggcaaat ctactaatgg cggcggtggt 5520 ggagctgatg ataaatctac catcggtgga ggcgcaggcg gggctggcgg cggaggcgga 5580 ggcggaggtg gtggcggtga tgcagacggc ggtttaggct caaatgtctc tttaggcaac 5640 acagtcggca cctcaactat tgtactggtt tcgggcgccg tttttggttt gaccggtctg 5700 agacgagtgc gatttttttc gtttctaata gcttccaaca attgttgtct gtcgtctaaa 5760 ggtgcagcgg gttgaggttc cgtcggcatt ggtggagcgg gcggcaattc agacatcgat 5820 ggtggtggtg gtggtggagg cgctggaatg ttaggcacgg gagaaggtgg tggcggcggt 5880 gccgccggta taatttgttc tggtttagtt tgttcgcgca cgattgtggg caccggcgca 5940 ggcgccgctg gctgcacaac ggaaggtcgt ctgcttcgag gcagcgcttg gggtggtggc 6000 aattcaatat tataattgga atacaaatcg taaaaatctg ctataagcat tgtaatttcg 6060 ctatcgttta ccgtgccgat atttaacaac cgctcaatgt aagcaattgt attgtaaaga 6120 gattgtctca agctcggatc ccgcacgccg ataacaagcc ttttcatttt tactacagca 6180 ttgtagtggc gagacacttc gctgtcgtcg acgtacatgt atgctttgtt gtcaaaaacg 6240 tcgttggcaa gctttaaaat atttaaaaga acatctctgt tcagcaccac tgtgttgtcg 6300 taaatgttgt ttttgataat ttgcgcttcc gcagtatcga cacgttcaaa aaattgatgc 6360 gcatcaattt tgttgttcct attattgaat aaataagatt gtacagattc atatctacga 6420 ttcgtcatgg ccaccacaaa tgctacgctg caaacgctgg tacaatttta cgaaaactgc 6480 aaaaacgtca aaactcggta taaaataatc aacgggcgct ttggcaaaat atctatttta 6540 tcgcacaagc ccactagcaa attgtatttg cagaaaacaa tttcggcgca caattttaac 6600 gctgacgaaa taaaagttca ccagttaatg agcgaccacc caaattttat aaaaatctat 6660 tttaatcacg gttccatcaa caaccaagtg atcgtgatgg actacattga ctgtcccgat 6720 ttatttgaaa cactacaaat taaaggcgag ctttcgtacc aacttgttag caatattatt 6780 agacagctgt gtgaagcgct caacgatttg cacaagcaca atttcataca caacgacata 6840 aaactcgaaa atgtcttata tttcgaagca cttgatcgcg tgtatgtttg cgattacgga 6900 ttgtgcaaac acgaaaactc acttagcgtg cacgacggca cgttggagta ttttagtccg 6960 gaaaaaattc gacacacaac tatgcacgtt tcgtttgact ggtacgcggc gtgttaacat 7020 acaagttgct aaccggcggc cgacacccat ttgaaaaaag cgaagacgaa atgttggact 7080 tgaatagcat gaagcgtcgt cagcaataca atgacattgg cgttttaaaa cacgttcgta 7140 acgttaacgc tcgtgacttt gtgtactgcc taacaagata caacatagat tgtagactca 7200 caaattacaa acaaattata aaacatgagt ttttgtcgta aaaatgccac ttgttttacg 7260 agtagaattc gtaatcatgg tcatagctgt ttcctgtgtg aaattgttat ccgctcacaa 7320 ttccacacaa catacgagcc ggaagcataa agtgtaaagc ctggggtgcc taatgagtga 7380 gctaactcac attaattgcg ttgcgctcac tgcccgcttt ccagtcggga aacctgtcgt 7440 gccagctgca ttaatgaatc ggccaacgcg cggggagagg cggtttgcgt attgggcgct 7500 cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg cgagcggtat 7560 cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac gcaggaaaga 7620 acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 7680 ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 7740 ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 7800 gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 7860 gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 7920 ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 7980 actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 8040 gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 8100 ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg aagccagtta 8160 ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 8220 gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 8280 tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 8340 tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 8400 aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 8460 aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg 8520 tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 8580 gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 8640 agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 8700 aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 8760 gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 8820 caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 8880 cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 8940 ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 9000 ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 9060 gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 9120 cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 9180 gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 9240 caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 9300 tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat 9360 acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa 9420 aagtgccacc tgacgtctaa gaaaccatta ttatcatgac attaacctat aaaaataggc 9480 gtatcacgag gccctttcgt ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca 9540 tgcagctccc ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc 9600 gtcagggcgc gtcagcgggt gttggcgggt gtcggggctg gcttaactat gcggcatcag 9660 agcagattgt actgagagtg caccatatgc ggtgtgaaat accgcacaga tgcgtaagga 9720 gaaaataccg catcaggcgc cattcgccat tcaggctgcg caactgttgg gaagggcgat 9780 cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 9840 taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacc gagttgtttg 9900 cgtacgtgac tagcgaagaa gatgtgtgga ccgcagaaca gatagtaaaa caaaacccta 9960 gtattggagc aataatcgat ttaaccaaca cgtctaaata ttatgatggt gtgcattttt 10020 tgcgggcggg cctgttatac aaaaaaattc aagtacctgg ccagactttg ccgcctgaaa 10080 gcatagttca agaatttatt gacacggtaa aagaatttac agaaaagtgt cccggcatgt 10140 tggtgggcgt gcactgcaca cacggtatta atcgcaccgg ttacatggtg tgcagatatt 10200 taatgcacac cctgggtatt gcgccgcagg aagccataga tagattcgaa aaagccagag 10260 gtcacaaaat tgaaagacaa aattacgttc aagatttatt aatttaatta atattatttg 10320 cattctttaa caaatacttt atcctatttt caaattgttg cgcttcttcc agcgaaccaa 10380 aactatgctt cgcttgctcc gtttagcttg tagccgatca gtggcgttgt tccaatcgac 10440 ggtaggatta ggccggatat tctccaccac aatgttggca acgttgatgt tacgtttatg 10500 cttttggttt tccacgtacg tcttttggcc ggtaatagcc gtaaacgtag tgccgtcgcg 10560 cgtcacgcac aacaccggat gtttgcgctt gtccgcgggg tattgaaccg cgcgatccga 10620 caaatccacc actttggcaa ctaaatcggt gacctgcgcg tcttttttct gcattatttc 10680 gtctttcttt tgcatggttt cctggaagcc ggtgtacatg cggtttagat cagtcatgac 10740 gcgcgtgacc tgcaaatctt tggcctcgat ctgcttgtcc ttgatggcaa cgatgcgttc 10800 aataaactct tgttttttaa caagttcctc ggttttttgc gccaccaccg cttgcagcgc 10860 gtttgtgtgc tcggtgaatg tcgcaatcag cttagtcacc aactgtttgc tctcctcctc 10920 ccgttgtttg atcgcgggat cgtacttgcc ggtgcagagc acttgaggaa ttacttcttc 10980 taaaagccat tcttgtaatt ctatggcgta aggcaatttg gacttcataa tcagctgaat 11040 cacgccggat ttagtaatga gcactgtatg cggctgcaaa tacagcgggt cgcccctttt 11100 cacgacgctg ttagaggtag ggcccccatt ttggatggtc tgctcaaata acgatttgta 11160 tttattgtct acatgaacac gtatagcttt atcacaaact gtatatttta aactgttagc 11220 gacgtccttg gccacgaacc ggacctgttg gtcgcgctct agcacgtacc gcaggttgaa 11280 cgtatcttct ccaaatttaa attctccaat tttaacgcga gccattttga tacacgtgtg 11340 tcgattttgc aacaactatt gttttttaac gcaaactaaa cttattgtgg taagcaataa 11400 ttaaatatgg gggaacatgc gccgctacaa cactcgtcgt tatgaacgca gacggcgccg 11460 gtctcggcgc aagcggctaa aacgtgttgc gcgttcaacg cggcaaacat cgcaaaagcc 11520 aatagtacag ttttgatttg catattaacg gcgatttttt aaattatctt atttaataaa 11580 tagttatgac gcctacaact ccccgcccgc gttgactcgc tgcacctcga gcagttcgtt 11640 gacgccttcc tccgtgtggc cgaacacgtc gagcgggtgg tcgatgacca gcggcgtgcc 11700 gcacgcgacg cacaagtatc tgtacaccga atgatcgtcg ggcgaaggca cgtcggcctc 11760 caagtggcaa tattggcaaa ttcgaaaata tatacagttg ggttgtttgc gcatatctat 11820 cgtggcgttg ggcatgtacg tccgaacgtt gatttgcatg caagccgaaa ttaaatcatt 11880 gcgattagtg cgattaaaac gttgtacatc ctcgctttta atcatgccgt cgattaaatc 11940 gcgcaatcga gtcaagtgat caaagtgtgg aataatgttt tctttgtatt cccgagtcaa 12000 gcgcagcgcg tattttaaca aactagccat cttgtaagtt agtttcattt aatgcaactt 12060 tatccaataa tatattatgt atcgcacgtc aagaattaac aatgcgcccg ttgtcgcatc 12120 tcaacacgac tatgatagag atcaaataaa gcgcgaatta aatagcttgc gacgcaacgt 12180 gcacgatctg tgcacgcgtt ccggcacgag ctttgattgt aataagtttt tacgaagcga 12240 tgacatgacc cccgtagtga caacgatcac gcccaaaaga actgccgact acaaaattac 12300 cgagtatgtc ggtgacgtta aaactattaa gccatccaat cgaccgttag tcgaatcagg 12360 accgctggtg cgagaagccg cgaagtatgg cgaatgcatc gtataacgtg tggagtccgc 12420 tcattagagc gtcatgttta gacaagaaag ctacatattt aattgatccc gatgatttta 12480 ttgataaatt gaccctaact ccatacacgg tattctacaa tggcggggtt ttggtcaaaa 12540 tttccggact gcgattgtac atgctgttaa cggctccgcc cactattaat gaaattaaaa 12600 attccaattt taaaaaacgc agcaagagaa acatttgtat gaaagaatgc gtagaaggaa 12660 agaaaaatgt cgtcgacatg ctgaacaaca agattaatat gcctccgtgt ataaaaaaaa 12720 tattgaacga tttgaaagaa aacaatgtac cgcgcggcgg tatgtacagg aagaggttta 12780 tactaaactg ttacattgca aacgtggttt cgtgtgccaa gtgtgaaaac cgatgtttaa 12840 tcaaggctct gacgcatttc tacaaccacg actccaagtg tgtgggtgaa gtcatgcatc 12900 ttttaatcaa atcccaagat gtgtataaac caccaaactg ccaaaaaatg aaaactgtcg 12960 acaagctctg tccgtttgct ggcaactgca agggtctcaa tcctatttgt aattattgaa 13020 taataaaaca attataaatg ctaaatttgt tttttattaa cgatacaaac caaacgcaac 13080 aagaacattt gtagtattat ctataattga aaacgcgtag ttataatcgc tgaggtaata 13140 tttaaaatca ttttcaaatg attcacagtt aatttgcgac aatataattt tattttcaca 13200 taaactagac gccttgtcgt cttcttcttc gtattccttc tctttttcat ttttctcctc 13260 ataaaaatta acatagttat tatcgtatcc atatatgtat ctatcgtata gagtaaattt 13320 tttgttgtca taaatatata tgtctttttt aatggggtgt atagt 13365 <210> 5 <211> 7311 <212> DNA <213> Artificial Sequence <220> <223> pCLD 002 <400> 5 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600 gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660 caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720 acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780 agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840 gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900 tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960 gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020 gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080 accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140 accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200 gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260 tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320 cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380 gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440 ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500 actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560 gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620 tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680 gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatttggc 1740 cgcgaattca ctagtgattg cggaataatt gccatatgta aatgatgtca tcgttctaac 1800 tcgctttacg agtagaattc tacgtgtaaa acataatcaa gagatgatgt catttgtttt 1860 tcaaaactga actcaagaaa tgatgtcatt tgtttttcaa aactgaactg gctttacgag 1920 cagaattcta cttgtaacgc atgatcaagg gatgatgtca tttgtttttt aaaattgaac 1980 tggctttacg agtagaattc tacttgtaaa acacaatcga gagatgatgt catattttgc 2040 acacggctct aattaaactc gctttacgag taaaattcta cttgtaacgc atgatcaagg 2100 gatgatgtca ttggatgagt catttgtttt tcaaaactaa actcgcttta cgagtagaat 2160 tctacttgta aaacacaatc aagggatgat gtcattatac aaatgatgtc atttgttttt 2220 caaaactaaa ctcgctttac gggtagaatt ctacttgtaa aacacaatcg agggatgatg 2280 tcatccttta cacatgatta taaacgtgtt tatgtatgac tcatttgttt ttcaaaacta 2340 aactcgcttt acgagtagaa ttctacttgt aacgcacgat caagggatga tgtcatttat 2400 ttgtgcaaag ctgatgtcat cttttgcaca cgattataaa cacaatcaaa taatgactca 2460 tttgttttca aaactgaact cgctttacga gtagaattct acttgtaaaa cacaatcaag 2520 ggatgatgtc attttaaaaa tgatgtcatt tgtttttcaa aactaaactc gctttacgag 2580 tagaattcta cgtgtaaaac acaatcaagg gatgatgtca tttactaaaa taaaataatt 2640 atttaaataa aaatgttttt attgtaaaat acacattgat tacacgtgac aatcgaattc 2700 ccgcttgcta gcttcttaag ttagatcttt atgcatttcg gagcgagacc atcatggaga 2760 taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc gtaacagttt 2820 tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca tcgggcgcgg 2880 atcccggtcc gaagcgcgcg gaattcaaag gcctacgtcg acgagctcac tagtaacggc 2940 cgccagtgtg ctggaattcg cccttcgcgg atcctgttaa gacggcgggg ttctacgaga 3000 ttgtgattaa ggtccccagc gaccttgacg agcatctgcc cggcatttct gacagctttg 3060 tgaactgggt ggccgagaag gaatgggagt tgccgccaga ttctgacatg gatctgaatc 3120 tgattgagca ggcacccctg accgtggccg agaagctgca gcgcgacttt ctgacggaat 3180 ggcgccgtgt gagtaaggcc ccggaggccc ttttctttgt gcaatttgag aagggagaga 3240 gctacttcca catgcacgtg ctcgtggaaa ccaccggggt gaaatccatg gttttgggac 3300 gtttcctgag tcagattcgc gaaaaactga ttcagagaat ttaccgcggg atcgagccga 3360 ctttgccaaa ctggttcgcg gtcacaaaga ccagaaatgg cgccggaggc gggaacaagg 3420 tggtggatga gtgctacatc cccaattact tgctccccaa aacccagcct gagctccagt 3480 gggcgtggac taatatggaa cagtatttaa gcgcctgttt gaatctcacg gagcgtaaac 3540 ggttggtggc gcagcatctg acgcacgtgt cgcagacgca ggagcagaac aaagagaatc 3600 agaatcccaa ttctgatgcg ccggtgatca gatcaaaaac ttcagccagg tacatggagc 3660 tggtcgggtg gctcgtggac aaggggatta cctcggagaa gcagtggatc caggaggacc 3720 aggcctcata catctccttc aatgcggcct ccaactcgcg gtcccaaatc aaggctgcct 3780 tggacaatgc gggaaagatt atgagcctga ctaaaaccgc ccccgactac ctggtgggcc 3840 agcagcccgt ggaggacatt tccagcaatc ggatttataa aattttggaa ctaaacgggt 3900 acgatcccca atatgcggct tccgtctttc tgggatgggc cacgaaaaag ttcggcaaga 3960 ggaacaccat ctggctgttt gggcctgcaa ctaccgggaa gaccaacatc gcggaggcca 4020 tagcccacac tgtgcccttc tacgggtgcg taaactggac caatgagaac tttcccttca 4080 acgactgtgt cgacaagatg gtgatctggt gggaggaggg gaagatgacc gccaaggtcg 4140 tggagtcggc caaagccatt ctcggaggaa gcaaggtgcg cgtggaccag aaatgcaagt 4200 cctcggccca gatagacccg actcccgtga tcgtcacctc caacaccaac atgtgcgccg 4260 tgattgacgg gaactcaacg accttcgaac accagcagcc gttgcaagac cggatgttca 4320 aatttgaact cacccgccgt ctggatcatg actttgggaa ggtcaccaag caggaagtca 4380 aagacttttt ccggtgggca aaggatcacg tggttgaggt ggagcatgaa ttctacgtca 4440 aaaagggtgg agccaagaaa agacccgccc ccagtgacgc agatataagt gagcccaaac 4500 gggtgcgcga gtcagttgcg cagccatcga cgtcagacgc ggaagcttcg atcaactacg 4560 cagacaggta ccaaaacaaa tgttctcgtc acgtgggcat gaatctgatg ctgtttccct 4620 gcagacaatg cgagagaatg aatcagaatt caaatatctg cttcactcac ggacagaaag 4680 actgtttaga gtgctttccc gtgtcagaat ctcaacccgt ttctgtcgtc aaaaaggcgt 4740 atcagaaact gtgctacatt catcatatca tgggaaaggt gccagacgct tgcactgcct 4800 gcgatctggt caatgtggat ttggatgact gcatctttga acaataaatg atttaaatca 4860 ggtatggctg ccgatggtta tcttccagat tggctcgagg acactctctc tgatgaagag 4920 taactaaggg cgaattccag cacactggcg gccgttacta ggtagctgag cgggccgctt 4980 tcgaatctag agcctgcagt ctcgacaagc ttgtcgagaa gtactagagg atcataatca 5040 gccataccac atttgtagag gttttacttg ctttaaaaaa cctcccacac ctccccctga 5100 acctgaaaca taaaatgaat gcaattgttg ttgttaactt gtttattgca gcttataatg 5160 gttacaaata aagcaatagc atcacaaatt tcacaaataa agcatttttt tcactgcatt 5220 ctagttgtgg tttgtccaaa ctcatcaatg tatcttatca tgtctggatc ggtctcacca 5280 tgcgtacagc ttgacgcgtg cgtaataact tcgtataatg tatgctatac gaagttatac 5340 tgggcctcat gggccttccg ctcactgccc gctttccagt cgggaaacct gtcgtgccag 5400 ctgcattaac atggtcatag ctgtttcctt gcgtattggg cgctctccgc ttcctcgctc 5460 actgactcgc tgcgctcggt cgttcgggta aagcctgggg tgcctaatga gcaaaaggcc 5520 agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc 5580 cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac 5640 tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc 5700 tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcata 5760 gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc 5820 acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca 5880 acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag 5940 cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta 6000 gaagaacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg 6060 gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt gtttgcaagc 6120 agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt tctacggggt 6180 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa 6240 ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat 6300 atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga 6360 tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac 6420 gggagggctt accatctggc cccagtgctg caatgatacc gcgagaacca cgctcaccgg 6480 ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg 6540 caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga gtaagtagtt 6600 cgccagttaa tagtttgcgc aacgttgttg ccattgctac aggcatcgtg gtgtcacgct 6660 cgtcgtttgg tatggcttca ttcagctccg gttcccaacg atcaaggcga gttacatgat 6720 cccccatgtt gtgcaaaaaa gcggttagct ccttcggtcc tccgatcgtt gtcagaagta 6780 agttggccgc agtgttatca ctcatggtta tggcagcact gcataattct cttactgtca 6840 tgccatccgt aagatgcttt tctgtgactg gtgagtactc aaccaagtca ttctgagaat 6900 agtgtatgcg gcgaccgagt tgctcttgcc cggcgtcaat acgggataat accgcgccac 6960 atagcagaac tttaaaagtg ctcatcattg gaaaacgttc ttcggggcga aaactctcaa 7020 ggatcttacc gctgttgaga tccagttcga tgtaacccac tcgtgcaccc aactgatctt 7080 cagcatcttt tactttcacc agcgtttctg ggtgagcaaa aacaggaagg caaaatgccg 7140 caaaaaaggg aataagggcg acacggaaat gttgaatact catactcttc ctttttcaat 7200 attattgaag catttatcag ggttattgtc tcatgagcgg atacatattt gaatgtattt 7260 agaaaaataa acaaataggg gttccgcgca catttccccg aaaagtgcca c 7311 <210> 6 <211> 7640 <212> DNA <213> Artificial Sequence <220> <223> pCLD 046 <400> 6 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg tctcaggctt aattaatgat 600 gcgatcgccg ttacacgttt atgcgggccg aggcacatgc ggcaggatga cggtccatac 660 cagattcctg ggcacaactc atcggcaacg ttccatcgtc ctgctcctcc acctcgggcg 720 ggaagccatg gctcagtttt ttatagagct catccattcc gagtgttata cctgccgctg 780 tcacaaattc aagcagcacc atgtggtcgc gtttctcgtt cggatccttt gacagttttg 840 attggtatga caaatagtga ttatctggga gcaggactgg tccatctcct ataggggtgt 900 tttgttgata atgatcggca agttgcacgc taccgtcctc tatgttgtgg cgaatcttga 960 aatttacctt tataccgttt ttctgcttgt ctgccataat atagacgttg tgcgagttat 1020 aattgtattc caacttgtgt cccaatatgt ttccatcttc tttgaagtct atgcctttaa 1080 gctcaatacg attcaccaat gtatcgccct cgaacttcac ttcagcccta gtcttataat 1140 taccatcatc cttaaaaaaa atggttcttt cttggacgta accttctggc atcgccgatt 1200 tgaaaaagtc atgttgtttc atgtgatccg ggtagcgagc aaagcactgg agaccgtatc 1260 caaacgtcgt tacgagggta ggccagggca ctggcaattt gcccgtggta cagataaact 1320 tgagggtcag ctttccataa gtagcatcac cttctccctc gcctgacacg ctgaacttgt 1380 gaccattaac gtcgccgtcc agctccacca agataggcac tacaccagtg aaaagctcct 1440 cgcccttcga cactggaccc gggttttctt cgacatcgcc tgcttgtttg agaagtgaaa 1500 agtttgtagc acccgatccg ccttcccaaa cgtaacccga tggcaagagt tcccttattc 1560 ccactgcagt gggctggccg tcgctatcct tgacgatggc tttaatacca gggtgaagat 1620 ccaagagcac ttggcggcac ctaccgcacg gagaaagtat tcctctattc tcgttaccaa 1680 tagccactat gcaagtcaag ttgcctgccg cagccgccgc tgctgttccc aggacgacga 1740 gttcggcgca tggtcctccc gtaaagtggt acacgttgac tccggtgaag atacgtccat 1800 ccgaagacaa tgcggcgctt gcaacactat aatcctctga aataggaatt gagtttatgg 1860 ttgcagtagc acgctcaatc agtgtgctct cttcttgaga cagcggtttc gccatggtgg 1920 cgaccggtag cctcgagtac cggatcctct agcggccgaa cagatgctgt tcaactgtgt 1980 ttaccagatc gttgcgggct gtatttatag gcgcgataag cgggacgggc gcctcgtgtc 2040 cggtcacgcg catgagataa cgcgcggctg atatggaggc gcgtcctgtt ccgataagga 2100 gttgcgtccg gctgcggtta gcaacacagg aagctggcgt cctgtcacga taagacaaca 2160 ctcgtccggt ccgataatgt gattcgtacg tgacaggacg cgacccgata aggccggcct 2220 acgtgactgc cgacacgtac ttttttgcac tgcaaaaagg ttcaatgtgt ggtagtgtat 2280 ttggagcgta tacaacggtg tagactattt atgtaaaata gtctacgaaa cgtagagttt 2340 gtactatgta tgggcccgcg tgcaaaagcg tgtttttttg cagtgcaaaa aagttggtgg 2400 tggggaggcc accgagtata aaggtgcttg ttggcaaaca tgaaaacaca gttcaacaga 2460 attgttgttg aagcaacatt agcaccatac attgtttatc atcatgaata acttcgtata 2520 atgtatgcta tacgaagtta tttgcggccg cttgatatct tcctgcaggt tatcgatttg 2580 ctttacgagt agaattttac ttgtaaaaca caatcaagaa atgatgtcat ttttgtacgt 2640 gattataaac atgtttaaac atggtacatt gaacttaatt tttgcaagtt gataaacatg 2700 attaatgtac gactcatttg tttgtgcaag ttgataaacg tgattaatat atgactcata 2760 tgtttgtgca aaaatgatgt catcgtacaa actcgcttta cgagtagaat tctacttgta 2820 acgcatgatc aagggatgat gtcatttgtt tttttaaaat tcaactcgct ttacgagtag 2880 aattctactt gtaaaacaca atcgagggat gatgtcattt gtagaatgat gtcatttgtt 2940 tttcaaaacc gaactcgctt tacgagtaga attctacttg taacgcaaga tcggtggatg 3000 atgtcatttt aaaaatgatg tcatcgtaca aactcgcttt acgagtagaa ttctacgtgt 3060 aaaacttgct agcttcttaa gttagatctt tatgcattac ggacctttaa ttcaacccaa 3120 cacaatatat tatagttaaa taagaattat tatcaaatca tttgtatatt aattaaaata 3180 ctatactgta aattacattt tatttacaat cactcgacga agacttgatc acccctagat 3240 tcgaaagcgg cccgctcact agtaacggcc gccagtgtgc tggaattcgc ccttcgcgga 3300 tcctgttaag atggcggggt tctacgagat tgtgattaag gtccccagcg accttgacga 3360 gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 3420 gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 3480 gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 3540 tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 3600 caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 3660 tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 3720 cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 3780 gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 3840 cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 3900 gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 3960 atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 4020 ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 4080 caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 4140 taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 4200 gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 4260 gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 4320 taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 4380 aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 4440 ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 4500 caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 4560 cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 4620 ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 4680 ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 4740 ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 4800 cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 4860 gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 4920 cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 4980 aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 5040 tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 5100 gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 5160 catctttgaa caataaatga tttaaatcag gtatggctgc cgatggttat cttccagatt 5220 ggctcgagga cactctctct gatgaagagt aactaagggc gaattccagc acactggcgg 5280 ccgttactag gtagctgagc gggccgcttt cgaatctaga gcctgcagtc tcgacaagct 5340 tgtcgagaag tactagagga tcataatcag ccataccaca tttgtagagg ttttacttgc 5400 tttaaaaaac ctcccacacc tccccctgaa cctgaaacat aaaatgaatg caattgttgt 5460 tgttaacttg tttattgcag cttataatgg ttacaaataa agcaatagca tcacaaattt 5520 cacaaataaa gcattttttt cactgcattc tagttgtggt ttgtccaaac tcatcaatgt 5580 atcttatcat gtctggatcg gtctcaccat gcgtacagct tgacgcgtgc gtaataactt 5640 cgtataatgt atgctatacg aagttatact gggcctcatg ggccttccgc tcactgcccg 5700 ctttccagtc gggaaacctg tcgtgccagc tgcattaaca tggtcatagc tgtttccttg 5760 cgtattgggc gctctccgct tcctcgctca ctgactcgct gcgctcggtc gttcgggtaa 5820 agcctggggt gcctaatgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 5880 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 5940 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 6000 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 6060 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 6120 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 6180 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 6240 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 6300 gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 6360 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 6420 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 6480 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 6540 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 6600 atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 6660 cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 6720 actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 6780 aatgataccg cgagaaccac gctcaccggc tccagattta tcagcaataa accagccagc 6840 cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 6900 ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 6960 cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 7020 ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 7080 cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 7140 ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 7200 tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 7260 ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 7320 aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 7380 gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 7440 gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 7500 ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 7560 catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 7620 atttccccga aaagtgccac 7640 <210> 7 <211> 7569 <212> DNA <213> Artificial Sequence <220> <223> pCLD 047 <400> 7 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg tctcaggctt aattaatgat 600 gcgatcgccg ttacacgttt atgcgggccg aggcacatgc ggcaggatga cggtccatac 660 cagattcctg ggcacaactc atcggcaacg ttccatcgtc ctgctcctcc acctcgggcg 720 ggaagccatg gctcagtttt ttatagagct catccattcc gagtgttata cctgccgctg 780 tcacaaattc aagcagcacc atgtggtcgc gtttctcgtt cggatccttt gacagttttg 840 attggtatga caaatagtga ttatctggga gcaggactgg tccatctcct ataggggtgt 900 tttgttgata atgatcggca agttgcacgc taccgtcctc tatgttgtgg cgaatcttga 960 aatttacctt tataccgttt ttctgcttgt ctgccataat atagacgttg tgcgagttat 1020 aattgtattc caacttgtgt cccaatatgt ttccatcttc tttgaagtct atgcctttaa 1080 gctcaatacg attcaccaat gtatcgccct cgaacttcac ttcagcccta gtcttataat 1140 taccatcatc cttaaaaaaa atggttcttt cttggacgta accttctggc atcgccgatt 1200 tgaaaaagtc atgttgtttc atgtgatccg ggtagcgagc aaagcactgg agaccgtatc 1260 caaacgtcgt tacgagggta ggccagggca ctggcaattt gcccgtggta cagataaact 1320 tgagggtcag ctttccataa gtagcatcac cttctccctc gcctgacacg ctgaacttgt 1380 gaccattaac gtcgccgtcc agctccacca agataggcac tacaccagtg aaaagctcct 1440 cgcccttcga cactggaccc gggttttctt cgacatcgcc tgcttgtttg agaagtgaaa 1500 agtttgtagc acccgatccg ccttcccaaa cgtaacccga tggcaagagt tcccttattc 1560 ccactgcagt gggctggccg tcgctatcct tgacgatggc tttaatacca gggtgaagat 1620 ccaagagcac ttggcggcac ctaccgcacg gagaaagtat tcctctattc tcgttaccaa 1680 tagccactat gcaagtcaag ttgcctgccg cagccgccgc tgctgttccc aggacgacga 1740 gttcggcgca tggtcctccc gtaaagtggt acacgttgac tccggtgaag atacgtccat 1800 ccgaagacaa tgcggcgctt gcaacactat aatcctctga aataggaatt gagtttatgg 1860 ttgcagtagc acgctcaatc agtgtgctct cttcttgaga cagcggtttc gccatggtgg 1920 cgaccggtag cctcgagtac cggatcctct agcggccgaa cagatgctgt tcaactgtgt 1980 ttaccagatc gttgcgggct gtatttatag gcgcgataag cgggacgggc gcctcgtgtc 2040 cggtcacgcg catgagataa cgcgcggctg atatggaggc gcgtcctgtt ccgataagga 2100 gttgcgtccg gctgcggtta gcaacacagg aagctggcgt cctgtcacga taagacaaca 2160 ctcgtccggt ccgataatgt gattcgtacg tgacaggacg cgacccgata aggccggcct 2220 acgtgactgc cgacacgtac ttttttgcac tgcaaaaagg ttcaatgtgt ggtagtgtat 2280 ttggagcgta tacaacggtg tagactattt atgtaaaata gtctacgaaa cgtagagttt 2340 gtactatgta tgggcccgcg tgcaaaagcg tgtttttttg cagtgcaaaa aagttggtgg 2400 tggggaggcc accgagtata aaggtgcttg ttggcaaaca tgaaaacaca gttcaacaga 2460 attgttgttg aagcaacatt agcaccatac attgtttatc atcatgaata acttcgtata 2520 atgtatgcta tacgaagtta tttgcggccg cttgatatct tcctgcaggt tatcgatttg 2580 ctttacgagt agaattttac ttgtaaaaca caatcaagaa atgatgtcat ttttgtacgt 2640 gattataaac atgtttaaac atggtacatt gaacttaatt tttgcaagtt gataaacatg 2700 attaatgtac gactcatttg tttgtgcaag ttgataaacg tgattaatat atgactcata 2760 tgtttgtgca aaaatgatgt catcgtacaa actcgcttta cgagtagaat tctacttgta 2820 acgcatgatc aagggatgat gtcatttgtt tttttaaaat tcaactcgct ttacgagtag 2880 aattctactt gtaaaacaca atcgagggat gatgtcattt gtagaatgat gtcatttgtt 2940 tttcaaaacc gaactcgctt tacgagtaga attctacttg taacgcaaga tcggtggatg 3000 atgtcatttt aaaaatgatg tcatcgtaca aactcgcttt acgagtagaa ttctacgtgt 3060 aaaacttgct agcttcttaa gttagatctt tatgcatatc atggagataa ttaaaatgat 3120 aaccatctcg caaataaata agtattttac tgttttcgta acagttttgt aataaaaaaa 3180 cctataaata ttccggatta ttcataccgt cccaccatcg ggcgcggatc tcggtcgcca 3240 tggcggggtt ctacgagatt gtgattaagg tccccagcga ccttgacgag catctgcccg 3300 gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg ccgccagatt 3360 ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag aagctgcagc 3420 gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt ttctttgtgc 3480 aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc accggggtga 3540 aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt cagagaattt 3600 accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc agaaatggcg 3660 ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg ctccccaaaa 3720 cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc gcctgtttga 3780 atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg cagacgcagg 3840 agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga tcaaaaactt 3900 cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc tcggagaagc 3960 agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc aactcgcggt 4020 cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact aaaaccgccc 4080 ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg atttataaaa 4140 ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg ggatgggcca 4200 cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact accgggaaga 4260 ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta aactggacca 4320 atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg gaggagggga 4380 agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc aaggtgcgcg 4440 tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc gtcacctcca 4500 acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac cagcagccgt 4560 tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac tttgggaagg 4620 tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg gttgaggtgg 4680 agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc agtgacgcag 4740 atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg tcagacgcgg 4800 aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac gtgggcatga 4860 atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca aatatctgct 4920 tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct caacccgttt 4980 ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg ggaaaggtgc 5040 cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc atctttgaac 5100 aataaatgat ttaaatcagg tatggctgcc gatggttatc ttccagattg gctcgaggac 5160 actctctctg atgaagagta actaagggcg aattccagca cactggcggc cgttactagg 5220 tagctgagcg ggccgctttc gaatctagag cctgcagtct cgacaagctt gtcgagaagt 5280 actagaggat cataatcagc cataccacat ttgtagaggt tttacttgct ttaaaaaacc 5340 tcccacacct ccccctgaac ctgaaacata aaatgaatgc aattgttgtt gttaacttgt 5400 ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc acaaataaag 5460 catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta tcttatcatg 5520 tctggatcgg tctcaccatg cgtacagctt gacgcgtgcg taataacttc gtataatgta 5580 tgctatacga agttatactg ggcctcatgg gccttccgct cactgcccgc tttccagtcg 5640 ggaaacctgt cgtgccagct gcattaacat ggtcatagct gtttccttgc gtattgggcg 5700 ctctccgctt cctcgctcac tgactcgctg cgctcggtcg ttcgggtaaa gcctggggtg 5760 cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg ttgctggcgt 5820 ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca agtcagaggt 5880 ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc tccctcgtgc 5940 gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc ccttcgggaa 6000 gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag gtcgttcgct 6060 ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc ttatccggta 6120 actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca gcagccactg 6180 gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg aagtggtggc 6240 ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg aagccagtta 6300 ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct ggtagcggtg 6360 gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa gaagatcctt 6420 tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa gggattttgg 6480 tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa tgaagtttta 6540 aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc ttaatcagtg 6600 aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga ctccccgtcg 6660 tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca atgataccgc 6720 gagaaccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc ggaagggccg 6780 agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat tgttgccggg 6840 aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc attgctacag 6900 gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt tcccaacgat 6960 caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc ttcggtcctc 7020 cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg gcagcactgc 7080 ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt gagtactcaa 7140 ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg gcgtcaatac 7200 gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga aaacgttctt 7260 cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg taacccactc 7320 gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg tgagcaaaaa 7380 caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt tgaatactca 7440 tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc atgagcggat 7500 acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca tttccccgaa 7560 aagtgccac 7569 <210> 8 <211> 6326 <212> DNA <213> Artificial Sequence <220> <223> pCLD 015 <400> 8 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600 gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660 caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720 acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780 agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840 gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900 tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960 gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020 gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080 accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140 accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200 gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260 tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320 cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380 gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440 ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500 actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560 gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620 tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680 gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatttttg 1740 ctagcttctt aagttagatc tttatgcatt tcggagcgag acctacggac ctttaattca 1800 acccaacaca atatattata gttaaataag aattattatc aaatcatttg tatattaatt 1860 aaaatactat actgtaaatt acattttatt tacaatcact cgacgaagac ttgatcaccc 1920 ctagattcga aagcggcccg ctcactagta acggccgcca gtgtgctgga attcgccctt 1980 cgcggatcct gttaagacgg cggggttcta cgagattgtg attaaggtcc ccagcgacct 2040 tgacgagcat ctgcccggca tttctgacag ctttgtgaac tgggtggccg agaaggaatg 2100 ggagttgccg ccagattctg acatggatct gaatctgatt gagcaggcac ccctgaccgt 2160 ggccgagaag ctgcagcgcg actttctgac ggaatggcgc cgtgtgagta aggccccgga 2220 ggcccttttc tttgtgcaat ttgagaaggg agagagctac ttccacatgc acgtgctcgt 2280 ggaaaccacc ggggtgaaat ccatggtttt gggacgtttc ctgagtcaga ttcgcgaaaa 2340 actgattcag agaatttacc gcgggatcga gccgactttg ccaaactggt tcgcggtcac 2400 aaagaccaga aatggcgccg gaggcgggaa caaggtggtg gatgagtgct acatccccaa 2460 ttacttgctc cccaaaaccc agcctgagct ccagtgggcg tggactaata tggaacagta 2520 tttaagcgcc tgtttgaatc tcacggagcg taaacggttg gtggcgcagc atctgacgca 2580 cgtgtcgcag acgcaggagc agaacaaaga gaatcagaat cccaattctg atgcgccggt 2640 gatcagatca aaaacttcag ccaggtacat ggagctggtc gggtggctcg tggacaaggg 2700 gattacctcg gagaagcagt ggatccagga ggaccaggcc tcatacatct ccttcaatgc 2760 ggcctccaac tcgcggtccc aaatcaaggc tgccttggac aatgcgggaa agattatgag 2820 cctgactaaa accgcccccg actacctggt gggccagcag cccgtggagg acatttccag 2880 caatcggatt tataaaattt tggaactaaa cgggtacgat ccccaatatg cggcttccgt 2940 ctttctggga tgggccacga aaaagttcgg caagaggaac accatctggc tgtttgggcc 3000 tgcaactacc gggaagacca acatcgcgga ggccatagcc cacactgtgc ccttctacgg 3060 gtgcgtaaac tggaccaatg agaactttcc cttcaacgac tgtgtcgaca agatggtgat 3120 ctggtgggag gaggggaaga tgaccgccaa ggtcgtggag tcggccaaag ccattctcgg 3180 aggaagcaag gtgcgcgtgg accagaaatg caagtcctcg gcccagatag acccgactcc 3240 cgtgatcgtc acctccaaca ccaacatgtg cgccgtgatt gacgggaact caacgacctt 3300 cgaacaccag cagccgttgc aagaccggat gttcaaattt gaactcaccc gccgtctgga 3360 tcatgacttt gggaaggtca ccaagcagga agtcaaagac tttttccggt gggcaaagga 3420 tcacgtggtt gaggtggagc atgaattcta cgtcaaaaag ggtggagcca agaaaagacc 3480 cgcccccagt gacgcagata taagtgagcc caaacgggtg cgcgagtcag ttgcgcagcc 3540 atcgacgtca gacgcggaag cttcgatcaa ctacgcagac aggtaccaaa acaaatgttc 3600 tcgtcacgtg ggcatgaatc tgatgctgtt tccctgcaga caatgcgaga gaatgaatca 3660 gaattcaaat atctgcttca ctcacggaca gaaagactgt ttagagtgct ttcccgtgtc 3720 agaatctcaa cccgtttctg tcgtcaaaaa ggcgtatcag aaactgtgct acattcatca 3780 tatcatggga aaggtgccag acgcttgcac tgcctgcgat ctggtcaatg tggatttgga 3840 tgactgcatc tttgaacaat aaatgattta aatcaggtat ggctgccgat ggttatcttc 3900 cagattggct cgaggacact ctctctgatg aagagtaact aagggcgaat tccagcacac 3960 tggcggccgt tactaggtag ctgagcgggc cgctttcgaa tctagagcct gcagtctcga 4020 caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg tagaggtttt 4080 acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 4140 tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 4200 aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 4260 caatgtatct tatcatgtct ggatcggtct caccatgcgt acagcttgac gcgtgcgtaa 4320 taacttcgta taatgtatgc tatacgaagt tatactgggc ctcatgggcc ttccgctcac 4380 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 4440 tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 4500 gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 4560 ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 4620 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 4680 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 4740 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 4800 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 4860 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 4920 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 4980 gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 5040 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 5100 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 5160 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 5220 acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 5280 ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 5340 ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 5400 tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 5460 tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag caataaacca 5520 gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 5580 tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 5640 tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 5700 ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 5760 tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 5820 ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 5880 gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 5940 ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 6000 cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 6060 ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 6120 ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 6180 gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 6240 ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 6300 gcgcacattt ccccgaaaag tgccac 6326 <210> 9 <211> 7986 <212> DNA <213> Artificial Sequence <220> <223> pCLD 020 <400> 9 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600 gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660 caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720 acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780 agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840 gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900 tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960 gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020 gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080 accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140 accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200 gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260 tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320 cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380 gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440 ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500 actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560 gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620 tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680 gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatttggc 1740 cgcgaattca ctagtgattg cggaataatt gccatatgta aatgatgtca tcgttctaac 1800 tcgctttacg agtagaattc tacgtgtaaa acataatcaa gagatgatgt catttgtttt 1860 tcaaaactga actcaagaaa tgatgtcatt tgtttttcaa aactgaactg gctttacgag 1920 cagaattcta cttgtaacgc atgatcaagg gatgatgtca tttgtttttt aaaattgaac 1980 tggctttacg agtagaattc tacttgtaaa acacaatcga gagatgatgt catattttgc 2040 acacggctct aattaaactc gctttacgag taaaattcta cttgtaacgc atgatcaagg 2100 gatgatgtca ttggatgagt catttgtttt tcaaaactaa actcgcttta cgagtagaat 2160 tctacttgta aaacacaatc aagggatgat gtcattatac aaatgatgtc atttgttttt 2220 caaaactaaa ctcgctttac gggtagaatt ctacttgtaa aacacaatcg agggatgatg 2280 tcatccttta cacatgatta taaacgtgtt tatgtatgac tcatttgttt ttcaaaacta 2340 aactcgcttt acgagtagaa ttctacttgt aacgcacgat caagggatga tgtcatttat 2400 ttgtgcaaag ctgatgtcat cttttgcaca cgattataaa cacaatcaaa taatgactca 2460 tttgttttca aaactgaact cgctttacga gtagaattct acttgtaaaa cacaatcaag 2520 ggatgatgtc attttaaaaa tgatgtcatt tgtttttcaa aactaaactc gctttacgag 2580 tagaattcta cgtgtaaaac acaatcaagg gatgatgtca tttactaaaa taaaataatt 2640 atttaaataa aaatgttttt attgtaaaat acacattgat tacacgtgac aatcgaattc 2700 ccgcttgcta gcttcttaag ttagatcttt atgcatttcg gagcgagacc aaggctgtct 2760 tgctgtgtgc ccgtcgcgcg taccggagcg cgaacgcgcc cgccgccgac ataaacgaca 2820 cttttctaga aaaaatttcc ataccacgag gtcatcgcga ttgttgcgac gcaaaagttt 2880 acgaaactgc cgtgcgcgag tttgtggaag aaactggccg gttttttgac agcgcgttca 2940 tctacaagtt tccatttacg ttacaatgga aagacgacgg tgtcacttac aagtatttga 3000 tatacgtagg cgtcgtgcgc ggcaacttga ttgacgtgaa cgccaaaccc aacacgtaca 3060 ccgtgaagtt gttgccgggc acgtttggca acgactatcg tataatgtta aaaccgcgac 3120 gcttcaattg cgaaataacg cgcagcctgg ccatcgtgcc gctcaacaaa tattttaatt 3180 atatgaacga caaacaattg atcacgtacg attacagcaa ttacattgaa ttttttagtt 3240 ttgtgcgcag catcaagaag cgtttcgata ataggcaatt gcaagacttt ttctacgcca 3300 ctctaaaaaa gatagacaac aacgatgccc cccaaaaatt gcacgcactt aggcgggtgt 3360 aattcggact gcttgacccg aagcgaaata caagcgctgt tcagggaagc catcaacacg 3420 ctcaagcaca caatgaatac agaagacgtc tgcgcgcaca tgttggacat cgtgtcgttt 3480 gagcgtataa aagaatatat aagagctaat ttaggccatt tcacagtaat taccgacaaa 3540 tgttctaagc gtaaggtgtg tcttcatcac aaacgaattg ccaggctgtt gggcattaaa 3600 aaaatatatc atcaagaata caagcgggtc gtttcaaagg tttacaaaaa tcaaacacgg 3660 cggggttcta cgagattgtg attaaggtcc ccagcgacct tgacgagcat ctgcccggca 3720 tttctgacag ctttgtgaac tgggtggccg agaaggaatg ggagttgccg ccagattctg 3780 acatggatct gaatctgatt gagcaggcac ccctgaccgt ggccgagaag ctgcagcgcg 3840 actttctgac ggaatggcgc cgtgtgagta aggccccgga ggcccttttc tttgtgcaat 3900 ttgagaaggg agagagctac ttccacatgc acgtgctcgt ggaaaccacc ggggtgaaat 3960 ccatggtttt gggacgtttc ctgagtcaga ttcgcgaaaa actgattcag agaatttacc 4020 gcgggatcga gccgactttg ccaaactggt tcgcggtcac aaagaccaga aatggcgccg 4080 gaggcgggaa caaggtggtg gatgagtgct acatccccaa ttacttgctc cccaaaaccc 4140 agcctgagct ccagtgggcg tggactaata tggaacagta tttaagcgcc tgtttgaatc 4200 tcacggagcg taaacggttg gtggcgcagc atctgacgca cgtgtcgcag acgcaggagc 4260 agaacaaaga gaatcagaat cccaattctg atgcgccggt gatcagatca aaaacttcag 4320 ccaggtacat ggagctggtc gggtggctcg tggacaaggg gattacctcg gagaagcagt 4380 ggatccagga ggaccaggcc tcatacatct ccttcaatgc ggcctccaac tcgcggtccc 4440 aaatcaaggc tgccttggac aatgcgggaa agattatgag cctgactaaa accgcccccg 4500 actacctggt gggccagcag cccgtggagg acatttccag caatcggatt tataaaattt 4560 tggaactaaa cgggtacgat ccccaatatg cggcttccgt ctttctggga tgggccacga 4620 aaaagttcgg caagaggaac accatctggc tgtttgggcc tgcaactacc gggaagacca 4680 acatcgcgga ggccatagcc cacactgtgc ccttctacgg gtgcgtaaac tggaccaatg 4740 agaactttcc cttcaacgac tgtgtcgaca agatggtgat ctggtgggag gaggggaaga 4800 tgaccgccaa ggtcgtggag tcggccaaag ccattctcgg aggaagcaag gtgcgcgtgg 4860 accagaaatg caagtcctcg gcccagatag acccgactcc cgtgatcgtc acctccaaca 4920 ccaacatgtg cgccgtgatt gacgggaact caacgacctt cgaacaccag cagccgttgc 4980 aagaccggat gttcaaattt gaactcaccc gccgtctgga tcatgacttt gggaaggtca 5040 ccaagcagga agtcaaagac tttttccggt gggcaaagga tcacgtggtt gaggtggagc 5100 atgaattcta cgtcaaaaag ggtggagcca agaaaagacc cgcccccagt gacgcagata 5160 taagtgagcc caaacgggtg cgcgagtcag ttgcgcagcc atcgacgtca gacgcggaag 5220 cttcgatcaa ctacgcagac aggtaccaaa acaaatgttc tcgtcacgtg ggcatgaatc 5280 tgatgctgtt tccctgcaga caatgcgaga gaatgaatca gaattcaaat atctgcttca 5340 ctcacggaca gaaagactgt ttagagtgct ttcccgtgtc agaatctcaa cccgtttctg 5400 tcgtcaaaaa ggcgtatcag aaactgtgct acattcatca tatcatggga aaggtgccag 5460 acgcttgcac tgcctgcgat ctggtcaatg tggatttgga tgactgcatc tttgaacaat 5520 aaatgattta aatcaggtat ggctgccgat ggttatcttc cagattggct cgaggacact 5580 ctctctgatg aagagtaact aagggcgaat tccagcacac tggcggccgt tactaggtag 5640 ctgagcgggc cgctttcgaa tctagagcct gcagtctcga caagcttgtc gagaagtact 5700 agaggatcat aatcagccat accacatttg tagaggtttt acttgcttta aaaaacctcc 5760 cacacctccc cctgaacctg aaacataaaa tgaatgcaat tgttgttgtt aacttgttta 5820 ttgcagctta taatggttac aaataaagca atagcatcac aaatttcaca aataaagcat 5880 ttttttcact gcattctagt tgtggtttgt ccaaactcat caatgtatct tatcatgtct 5940 ggatcggtct caccatgcgt acagcttgac gcgtgcgtaa taacttcgta taatgtatgc 6000 tatacgaagt tatactgggc ctcatgggcc ttccgctcac tgcccgcttt ccagtcggga 6060 aacctgtcgt gccagctgca ttaacatggt catagctgtt tccttgcgta ttgggcgctc 6120 tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc gggtaaagcc tggggtgcct 6180 aatgagcaaa aggccagcaa aaggccagga accgtaaaaa ggccgcgttg ctggcgtttt 6240 tccataggct ccgcccccct gacgagcatc acaaaaatcg acgctcaagt cagaggtggc 6300 gaaacccgac aggactataa agataccagg cgtttccccc tggaagctcc ctcgtgcgct 6360 ctcctgttcc gaccctgccg cttaccggat acctgtccgc ctttctccct tcgggaagcg 6420 tggcgctttc tcatagctca cgctgtaggt atctcagttc ggtgtaggtc gttcgctcca 6480 agctgggctg tgtgcacgaa ccccccgttc agcccgaccg ctgcgcctta tccggtaact 6540 atcgtcttga gtccaacccg gtaagacacg acttatcgcc actggcagca gccactggta 6600 acaggattag cagagcgagg tatgtaggcg gtgctacaga gttcttgaag tggtggccta 6660 actacggcta cactagaaga acagtatttg gtatctgcgc tctgctgaag ccagttacct 6720 tcggaaaaag agttggtagc tcttgatccg gcaaacaaac caccgctggt agcggtggtt 6780 tttttgtttg caagcagcag attacgcgca gaaaaaaagg atctcaagaa gatcctttga 6840 tcttttctac ggggtctgac gctcagtgga acgaaaactc acgttaaggg attttggtca 6900 tgagattatc aaaaaggatc ttcacctaga tccttttaaa ttaaaaatga agttttaaat 6960 caatctaaag tatatatgag taaacttggt ctgacagtta ccaatgctta atcagtgagg 7020 cacctatctc agcgatctgt ctatttcgtt catccatagt tgcctgactc cccgtcgtgt 7080 agataactac gatacgggag ggcttaccat ctggccccag tgctgcaatg ataccgcgag 7140 aaccacgctc accggctcca gatttatcag caataaacca gccagccgga agggccgagc 7200 gcagaagtgg tcctgcaact ttatccgcct ccatccagtc tattaattgt tgccgggaag 7260 ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt tgttgccatt gctacaggca 7320 tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag ctccggttcc caacgatcaa 7380 ggcgagttac atgatccccc atgttgtgca aaaaagcggt tagctccttc ggtcctccga 7440 tcgttgtcag aagtaagttg gccgcagtgt tatcactcat ggttatggca gcactgcata 7500 attctcttac tgtcatgcca tccgtaagat gcttttctgt gactggtgag tactcaacca 7560 agtcattctg agaatagtgt atgcggcgac cgagttgctc ttgcccggcg tcaatacggg 7620 ataataccgc gccacatagc agaactttaa aagtgctcat cattggaaaa cgttcttcgg 7680 ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag ttcgatgtaa cccactcgtg 7740 cacccaactg atcttcagca tcttttactt tcaccagcgt ttctgggtga gcaaaaacag 7800 gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg gaaatgttga atactcatac 7860 tcttcctttt tcaatattat tgaagcattt atcagggtta ttgtctcatg agcggataca 7920 tatttgaatg tatttagaaa aataaacaaa taggggttcc gcgcacattt ccccgaaaag 7980 tgccac 7986 <210> 10 <211> 10046 <212> DNA <213> Artificial Sequence <220> <223> pCLD 050 <400> 10 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600 gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660 caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720 acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780 agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840 gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900 tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960 gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020 gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080 accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140 accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200 gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260 tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320 cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380 gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440 ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500 actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560 gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620 tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680 gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatgtggg 1740 gtatcgacag agtgccagcc ctgggaccga accccgcgtt tatgaacaaa cgacccaaca 1800 cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg cgggttcctt ccggtattgt 1860 ctccttccgt gtttcagtta gcctccccca tctcccgtta ctgctcgaat atacaatcgt 1920 ccaggtcaac gttcacaagg tcacacgcgg tacaggcatc cggtactttg cccataatgt 1980 ggtggatata acagagcttt tggtacgctt tctttaccac acttacaggt tgcgattcac 2040 ttacagggaa gcactccagg cagtcctttt gaccatgggt aaaacatatg tttgagtttt 2100 ggttcatacg ttcacactga cgacaaggga agagcatgag gttcataccg acatggcggc 2160 tgcacttatt ctgataacga tcagcataat taatggaggc ctcagcatcg ctggtgctag 2220 gttgtgcgac gctttcacgg acacgcttag gttcggagat gtcagcatcg ctaggagcag 2280 gacgcttttt agcacctcct ttcttaacat aaaactcgtg ctcgacttct acgacatggt 2340 ctttagccca gcgaaagaaa tccttcacct cctgtttagt aactttaccg aaatcgtggt 2400 cgaggcgtct agtcagctca aacttaaaca ttctatcctg gaggggttgt tgatgttcaa 2460 acgtcgtcga gttaccgtca ataactgcgc acatattagt attactcgta acaattaccg 2520 gggtaggatc gatttgagcg gagcttttac acttttgatc gacacggact ttggaaccac 2580 ccaggattgc cttcgcggat tcaaccactt tagctgtcat tttaccttct tcccaccata 2640 tgaccatttt atccacgcaa tcattaaaag ggaaattttc gttagtccaa ttcacacaac 2700 cataaaatgg gacggtatga gcaatagctt cggcaatatt agttttgccg gttgtggctg 2760 gaccgaagag ccaaatagta ttgcgtttac caaatttctt tgtagcccat ccgaggaata 2820 cagacgcagc gtactgaggg tcataaccat tgagctccaa gatcttgtaa attctgtttg 2880 aacttatgtc ctcaactggt tgttgaccga cgagatagtc cggcgccgtc tttgtaagcg 2940 acatgatctt accagcgttg tccaacgctg cttttatctg gcttctgcta ttactcgcag 3000 cgttaaagct aatataggat gcttgatctt cttgaatcca ttgtttttcg ctcgttatgc 3060 ctttatcgac aagccaaccc accaattcca tgtttaaatt gtgtaattta tgtagctgta 3120 atttttacct tattaatatt ttttacgctt tgcattcgac gactgaactc ccaaatatat 3180 gtttaactcg tcttggtcgt ttgaattttt gttgctgtgt ttcctaatat tttccatcac 3240 cttaaatatg ttattgtaat cctcaatgtt gaactgccca tgaccactaa aatagagctg 3300 agcctagtcg cgtgatttga cttaagattt cggtctgtac gactatagtt tcgtgagata 3360 aactggatcg gcaatttgct agacgatctg gcacagaaag acacagacga aggactcact 3420 atggaatggc ggcttcggcc gccaatgatg gatcccagcg gaagtaggaa gcgatgtggc 3480 ctgaggaata cgtctgtcat tgcgtttaga taaggcatcc cgctggaaag ggaaccagta 3540 ctttgtaaag gagctagagg ttctctttat gctctgtggt tcgtgcggtt cttaaaagca 3600 aacgacgagc gaacaggtgc gtgggcgaga gggcaccctc atttctaagt acgatcaggt 3660 ggactacgat tgcattttat gggttccctg cggctgtcac gctaaatcac tcggagaatg 3720 gcaatgcaat cgactactag caatgaccca ctgaccgaaa tggagcataa cgggtcgttt 3780 tacacgtaga attctactcg taaagcgagt ttgtacgatg acatcatttt taaaatgaca 3840 tcatccaccg atcttgcgtt acaagtagaa ttctactcgt aaagcgagtt cggttttgaa 3900 aaacaaatga catcattcta caaatgacat catccctcga ttgtgtttta caagtagaat 3960 tctactcgta aagcgagttg aattttaaaa aaacaaatga catcatccct tgatcatgcg 4020 ttacaagtag aattctactc gtaaagcgag tttgtacgat gacatcattt ttgcacaaac 4080 atatgagtca tatattaatc acgtttatca acttgcacaa acaaatgagt cgtacattaa 4140 tcatgtttat caacttgcaa aaattaagtt caatgtacca tgtttaaaca tgtttataat 4200 cacgtacaaa aatgacatca tttcttgatt gtgttttaca agtaaaattc tactcgtaaa 4260 gcttttggtc cgcccgagcg gtgcaaccga ttaggaccat gtacagcatt tgttacaagt 4320 cttctagtaa acacaatctt cctgctcagt ggcgcatgat tatcgttgtt gcaagccagc 4380 gtggtaagta acagcaccac tgcgagccta atgtgccctt tccacgaaca cagggctgtc 4440 cgatcctata ttaggactcc gcaatggggt tagcaagtcg caccctaaac gatgttgaag 4500 actcgcgatg tacatgctct ggtacaatac atacgtgttc cggctgttat cctgcatcgg 4560 aacctcaatc atgcatcgca ccagcgtatt cgtgtcatct aggagtgtcg cgtaggataa 4620 ataattcaat taagatgtcg ttatgctagt atacgcctac ccgtcaccgg ccatctgtgt 4680 gcagatgagt cgacgagtta ctggccctga tttctccgct tctaatacca cacactgggc 4740 aatacgagct caagccagtc tcttttgcta gcttcttaag ttagatcttt atgcatttcg 4800 gagcgagacc aaggctgtct tgctgtgtgc ccgtcgcgcg taccggagcg cgaacgcgcc 4860 cgccgccgac ataaacgaca cttttctaga aaaaatttcc ataccacgag gtcatcgcga 4920 ttgttgcgac gcaaaagttt acgaaactgc cgtgcgcgag tttgtggaag aaactggccg 4980 gttttttgac agcgcgttca tctacaagtt tccatttacg ttacaatgga aagacgacgg 5040 tgtcacttac aagtatttga tatacgtagg cgtcgtgcgc ggcaacttga ttgacgtgaa 5100 cgccaaaccc aacacgtaca ccgtgaagtt gttgccgggc acgtttggca acgactatcg 5160 tataatgtta aaaccgcgac gcttcaattg cgaaataacg cgcagcctgg ccatcgtgcc 5220 gctcaacaaa tattttaatt atatgaacga caaacaattg atcacgtacg attacagcaa 5280 ttacattgaa ttttttagtt ttgtgcgcag catcaagaag cgtttcgata ataggcaatt 5340 gcaagacttt ttctacgcca ctctaaaaaa gatagacaac aacgatgccc cccaaaaatt 5400 gcacgcactt aggcgggtgt aattcggact gcttgacccg aagcgaaata caagcgctgt 5460 tcagggaagc catcaacacg ctcaagcaca caatgaatac agaagacgtc tgcgcgcaca 5520 tgttggacat cgtgtcgttt gagcgtataa aagaatatat aagagctaat ttaggccatt 5580 tcacagtaat taccgacaaa tgttctaagc gtaaggtgtg tcttcatcac aaacgaattg 5640 ccaggctgtt gggcattaaa aaaatatatc atcaagaata caagcgggtc gtttcaaagg 5700 tttacaaaaa tcaaacacgg cggggttcta cgagattgtg attaaggtcc ccagcgacct 5760 tgacgagcat ctgcccggca tttctgacag ctttgtgaac tgggtggccg agaaggaatg 5820 ggagttgccg ccagattctg acatggatct gaatctgatt gagcaggcac ccctgaccgt 5880 ggccgagaag ctgcagcgcg actttctgac ggaatggcgc cgtgtgagta aggccccgga 5940 ggcccttttc tttgtgcaat ttgagaaggg agagagctac ttccacatgc acgtgctcgt 6000 ggaaaccacc ggggtgaaat ccatggtttt gggacgtttc ctgagtcaga ttcgcgaaaa 6060 actgattcag agaatttacc gcgggatcga gccgactttg ccaaactggt tcgcggtcac 6120 aaagaccaga aatggcgccg gaggcgggaa caaggtggtg gatgagtgct acatccccaa 6180 ttacttgctc cccaaaaccc agcctgagct ccagtgggcg tggactaata tggaacagta 6240 tttaagcgcc tgtttgaatc tcacggagcg taaacggttg gtggcgcagc atctgacgca 6300 cgtgtcgcag acgcaggagc agaacaaaga gaatcagaat cccaattctg atgcgccggt 6360 gatcagatca aaaacttcag ccaggtacat ggagctggtc gggtggctcg tggacaaggg 6420 gattacctcg gagaagcagt ggatccagga ggaccaggcc tcatacatct ccttcaatgc 6480 ggcctccaac tcgcggtccc aaatcaaggc tgccttggac aatgcgggaa agattatgag 6540 cctgactaaa accgcccccg actacctggt gggccagcag cccgtggagg acatttccag 6600 caatcggatt tataaaattt tggaactaaa cgggtacgat ccccaatatg cggcttccgt 6660 ctttctggga tgggccacga aaaagttcgg caagaggaac accatctggc tgtttgggcc 6720 tgcaactacc gggaagacca acatcgcgga ggccatagcc cacactgtgc ccttctacgg 6780 gtgcgtaaac tggaccaatg agaactttcc cttcaacgac tgtgtcgaca agatggtgat 6840 ctggtgggag gaggggaaga tgaccgccaa ggtcgtggag tcggccaaag ccattctcgg 6900 aggaagcaag gtgcgcgtgg accagaaatg caagtcctcg gcccagatag acccgactcc 6960 cgtgatcgtc acctccaaca ccaacatgtg cgccgtgatt gacgggaact caacgacctt 7020 cgaacaccag cagccgttgc aagaccggat gttcaaattt gaactcaccc gccgtctgga 7080 tcatgacttt gggaaggtca ccaagcagga agtcaaagac tttttccggt gggcaaagga 7140 tcacgtggtt gaggtggagc atgaattcta cgtcaaaaag ggtggagcca agaaaagacc 7200 cgcccccagt gacgcagata taagtgagcc caaacgggtg cgcgagtcag ttgcgcagcc 7260 atcgacgtca gacgcggaag cttcgatcaa ctacgcagac aggtaccaaa acaaatgttc 7320 tcgtcacgtg ggcatgaatc tgatgctgtt tccctgcaga caatgcgaga gaatgaatca 7380 gaattcaaat atctgcttca ctcacggaca gaaagactgt ttagagtgct ttcccgtgtc 7440 agaatctcaa cccgtttctg tcgtcaaaaa ggcgtatcag aaactgtgct acattcatca 7500 tatcatggga aaggtgccag acgcttgcac tgcctgcgat ctggtcaatg tggatttgga 7560 tgactgcatc tttgaacaat aaatgattta aatcaggtat ggctgccgat ggttatcttc 7620 cagattggct cgaggacact ctctctgatg aagagtaact aagggcgaat tccagcacac 7680 tggcggccgt tactaggtag ctgagcgggc cgctttcgaa tctagagcct gcagtctcga 7740 caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg tagaggtttt 7800 acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa tgaatgcaat 7860 tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca atagcatcac 7920 aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt ccaaactcat 7980 caatgtatct tatcatgtct ggatcggtct caccatgcgt acagcttgac gcgtgcgtaa 8040 taacttcgta taatgtatgc tatacgaagt tatactgggc ctcatgggcc ttccgctcac 8100 tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt catagctgtt 8160 tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc tcggtcgttc 8220 gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga accgtaaaaa 8280 ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg 8340 acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc 8400 tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc 8460 ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc 8520 ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg 8580 ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc 8640 actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga 8700 gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc 8760 tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac 8820 caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg 8880 atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc 8940 acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa 9000 ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta 9060 ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt 9120 tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat ctggccccag 9180 tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag caataaacca 9240 gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct ccatccagtc 9300 tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt tgcgcaacgt 9360 tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg cttcattcag 9420 ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca aaaaagcggt 9480 tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt tatcactcat 9540 ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat gcttttctgt 9600 gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac cgagttgctc 9660 ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa aagtgctcat 9720 cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt tgagatccag 9780 ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt tcaccagcgt 9840 ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa gggcgacacg 9900 gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt atcagggtta 9960 ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa taggggttcc 10020 gcgcacattt ccccgaaaag tgccac 10046 <210> 11 <211> 9979 <212> DNA <213> Artificial Sequence <220> <223> pCLD 051 <400> 11 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600 gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660 caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720 acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780 agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840 gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900 tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960 gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020 gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080 accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140 accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200 gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260 tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320 cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380 gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440 ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500 actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560 gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620 tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680 gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatgtggg 1740 gtatcgacag agtgccagcc ctgggaccga accccgcgtt tatgaacaaa cgacccaaca 1800 cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg cgggttcctt ccggtattgt 1860 ctccttccgt gtttcagtta gcctccccca tctcccgtta ctgctcgaat atacaatcgt 1920 ccaggtcaac gttcacaagg tcacacgcgg tacaggcatc cggtactttg cccataatgt 1980 ggtggatata acagagcttt tggtacgctt tctttaccac acttacaggt tgcgattcac 2040 ttacagggaa gcactccagg cagtcctttt gaccatgggt aaaacatatg tttgagtttt 2100 ggttcatacg ttcacactga cgacaaggga agagcatgag gttcataccg acatggcggc 2160 tgcacttatt ctgataacga tcagcataat taatggaggc ctcagcatcg ctggtgctag 2220 gttgtgcgac gctttcacgg acacgcttag gttcggagat gtcagcatcg ctaggagcag 2280 gacgcttttt agcacctcct ttcttaacat aaaactcgtg ctcgacttct acgacatggt 2340 ctttagccca gcgaaagaaa tccttcacct cctgtttagt aactttaccg aaatcgtggt 2400 cgaggcgtct agtcagctca aacttaaaca ttctatcctg gaggggttgt tgatgttcaa 2460 acgtcgtcga gttaccgtca ataactgcgc acatattagt attactcgta acaattaccg 2520 gggtaggatc gatttgagcg gagcttttac acttttgatc gacacggact ttggaaccac 2580 ccaggattgc cttcgcggat tcaaccactt tagctgtcat tttaccttct tcccaccata 2640 tgaccatttt atccacgcaa tcattaaaag ggaaattttc gttagtccaa ttcacacaac 2700 cataaaatgg gacggtatga gcaatagctt cggcaatatt agttttgccg gttgtggctg 2760 gaccgaagag ccaaatagta ttgcgtttac caaatttctt tgtagcccat ccgaggaata 2820 cagacgcagc gtactgaggg tcataaccat tgagctccaa gatcttgtaa attctgtttg 2880 aacttatgtc ctcaactggt tgttgaccga cgagatagtc cggcgccgtc tttgtaagcg 2940 acatgatctt accagcgttg tccaacgctg cttttatctg gcttctgcta ttactcgcag 3000 cgttaaagct aatataggat gcttgatctt cttgaatcca ttgtttttcg ctcgttatgc 3060 ctttatcgac aagccaaccc accaattcca ttatattgta gcaaaaattt aatttttgcc 3120 aaaagactta ataaatcatc agcaatggac aacaaagtaa ataaaaaatt tacaaagcat 3180 aatagagagg tttattgatt attgaacagc ccatgaccac taaaatagag ctgagcctag 3240 tcgcgtgatt tgacttaaga tttcggtctg tacgactata gtttcgtgag ataaactgga 3300 tcggcaattt gctagacgat ctggcacaga aagacacaga cgaaggactc actatggaat 3360 ggcggcttcg gccgccaatg atggatccca gcggaagtag gaagcgatgt ggcctgagga 3420 atacgtctgt cattgcgttt agataaggca tcccgctgga aagggaacca gtactttgta 3480 aaggagctag aggttctctt tatgctctgt ggttcgtgcg gttcttaaaa gcaaacgacg 3540 agcgaacagg tgcgtgggcg agagggcacc ctcatttcta agtacgatca ggtggactac 3600 gattgcattt tatgggttcc ctgcggctgt cacgctaaat cactcggaga atggcaatgc 3660 aatcgactac tagcaatgac ccactgaccg aaatggagca taacgggtcg ttttacacgt 3720 agaattctac tcgtaaagcg agtttgtacg atgacatcat ttttaaaatg acatcatcca 3780 ccgatcttgc gttacaagta gaattctact cgtaaagcga gttcggtttt gaaaaacaaa 3840 tgacatcatt ctacaaatga catcatccct cgattgtgtt ttacaagtag aattctactc 3900 gtaaagcgag ttgaatttta aaaaaacaaa tgacatcatc ccttgatcat gcgttacaag 3960 tagaattcta ctcgtaaagc gagtttgtac gatgacatca tttttgcaca aacatatgag 4020 tcatatatta atcacgttta tcaacttgca caaacaaatg agtcgtacat taatcatgtt 4080 tatcaacttg caaaaattaa gttcaatgta ccatgtttaa acatgtttat aatcacgtac 4140 aaaaatgaca tcatttcttg attgtgtttt acaagtaaaa ttctactcgt aaagcttttg 4200 gtccgcccga gcggtgcaac cgattaggac catgtacagc atttgttaca agtcttctag 4260 taaacacaat cttcctgctc agtggcgcat gattatcgtt gttgcaagcc agcgtggtaa 4320 gtaacagcac cactgcgagc ctaatgtgcc ctttccacga acacagggct gtccgatcct 4380 atattaggac tccgcaatgg ggttagcaag tcgcacccta aacgatgttg aagactcgcg 4440 atgtacatgc tctggtacaa tacatacgtg ttccggctgt tatcctgcat cggaacctca 4500 atcatgcatc gcaccagcgt attcgtgtca tctaggagtg tcgcgtagga taaataattc 4560 aattaagatg tcgttatgct agtatacgcc tacccgtcac cggccatctg tgtgcagatg 4620 agtcgacgag ttactggccc tgatttctcc gcttctaata ccacacactg ggcaatacga 4680 gctcaagcca gtctcttttg ctagcttctt aagttagatc tttatgcatt tcggagcgag 4740 accaaggctg tcttgctgtg tgcccgtcgc gcgtaccgga gcgcgaacgc gcccgccgcc 4800 gacataaacg acacttttct agaaaaaatt tccataccac gaggtcatcg cgattgttgc 4860 gacgcaaaag tttacgaaac tgccgtgcgc gagtttgtgg aagaaactgg ccggtttttt 4920 gacagcgcgt tcatctacaa gtttccattt acgttacaat ggaaagacga cggtgtcact 4980 tacaagtatt tgatatacgt aggcgtcgtg cgcggcaact tgattgacgt gaacgccaaa 5040 cccaacacgt acaccgtgaa gttgttgccg ggcacgtttg gcaacgacta tcgtataatg 5100 ttaaaaccgc gacgcttcaa ttgcgaaata acgcgcagcc tggccatcgt gccgctcaac 5160 aaatatttta attatatgaa cgacaaacaa ttgatcacgt acgattacag caattacatt 5220 gaatttttta gttttgtgcg cagcatcaag aagcgtttcg ataataggca attgcaagac 5280 tttttctacg ccactctaaa aaagatagac aacaacgatg ccccccaaaa attgcacgca 5340 cttaggcggg tgtaattcgg actgcttgac ccgaagcgaa atacaagcgc tgttcaggga 5400 agccatcaac acgctcaagc acacaatgaa tacagaagac gtctgcgcgc acatgttgga 5460 catcgtgtcg tttgagcgta taaaagaata tataagagct aatttaggcc atttcacagt 5520 aattaccgac aaatgttcta agcgtaaggt gtgtcttcat cacaaacgaa ttgccaggct 5580 gttgggcatt aaaaaaatat atcatcaaga atacaagcgg gtcgtttcaa aggtttacaa 5640 aaatcaaaca cggcggggtt ctacgagatt gtgattaagg tccccagcga ccttgacgag 5700 catctgcccg gcatttctga cagctttgtg aactgggtgg ccgagaagga atgggagttg 5760 ccgccagatt ctgacatgga tctgaatctg attgagcagg cacccctgac cgtggccgag 5820 aagctgcagc gcgactttct gacggaatgg cgccgtgtga gtaaggcccc ggaggccctt 5880 ttctttgtgc aatttgagaa gggagagagc tacttccaca tgcacgtgct cgtggaaacc 5940 accggggtga aatccatggt tttgggacgt ttcctgagtc agattcgcga aaaactgatt 6000 cagagaattt accgcgggat cgagccgact ttgccaaact ggttcgcggt cacaaagacc 6060 agaaatggcg ccggaggcgg gaacaaggtg gtggatgagt gctacatccc caattacttg 6120 ctccccaaaa cccagcctga gctccagtgg gcgtggacta atatggaaca gtatttaagc 6180 gcctgtttga atctcacgga gcgtaaacgg ttggtggcgc agcatctgac gcacgtgtcg 6240 cagacgcagg agcagaacaa agagaatcag aatcccaatt ctgatgcgcc ggtgatcaga 6300 tcaaaaactt cagccaggta catggagctg gtcgggtggc tcgtggacaa ggggattacc 6360 tcggagaagc agtggatcca ggaggaccag gcctcataca tctccttcaa tgcggcctcc 6420 aactcgcggt cccaaatcaa ggctgccttg gacaatgcgg gaaagattat gagcctgact 6480 aaaaccgccc ccgactacct ggtgggccag cagcccgtgg aggacatttc cagcaatcgg 6540 atttataaaa ttttggaact aaacgggtac gatccccaat atgcggcttc cgtctttctg 6600 ggatgggcca cgaaaaagtt cggcaagagg aacaccatct ggctgtttgg gcctgcaact 6660 accgggaaga ccaacatcgc ggaggccata gcccacactg tgcccttcta cgggtgcgta 6720 aactggacca atgagaactt tcccttcaac gactgtgtcg acaagatggt gatctggtgg 6780 gaggagggga agatgaccgc caaggtcgtg gagtcggcca aagccattct cggaggaagc 6840 aaggtgcgcg tggaccagaa atgcaagtcc tcggcccaga tagacccgac tcccgtgatc 6900 gtcacctcca acaccaacat gtgcgccgtg attgacggga actcaacgac cttcgaacac 6960 cagcagccgt tgcaagaccg gatgttcaaa tttgaactca cccgccgtct ggatcatgac 7020 tttgggaagg tcaccaagca ggaagtcaaa gactttttcc ggtgggcaaa ggatcacgtg 7080 gttgaggtgg agcatgaatt ctacgtcaaa aagggtggag ccaagaaaag acccgccccc 7140 agtgacgcag atataagtga gcccaaacgg gtgcgcgagt cagttgcgca gccatcgacg 7200 tcagacgcgg aagcttcgat caactacgca gacaggtacc aaaacaaatg ttctcgtcac 7260 gtgggcatga atctgatgct gtttccctgc agacaatgcg agagaatgaa tcagaattca 7320 aatatctgct tcactcacgg acagaaagac tgtttagagt gctttcccgt gtcagaatct 7380 caacccgttt ctgtcgtcaa aaaggcgtat cagaaactgt gctacattca tcatatcatg 7440 ggaaaggtgc cagacgcttg cactgcctgc gatctggtca atgtggattt ggatgactgc 7500 atctttgaac aataaatgat ttaaatcagg tatggctgcc gatggttatc ttccagattg 7560 gctcgaggac actctctctg atgaagagta actaagggcg aattccagca cactggcggc 7620 cgttactagg tagctgagcg ggccgctttc gaatctagag cctgcagtct cgacaagctt 7680 gtcgagaagt actagaggat cataatcagc cataccacat ttgtagaggt tttacttgct 7740 ttaaaaaacc tcccacacct ccccctgaac ctgaaacata aaatgaatgc aattgttgtt 7800 gttaacttgt ttattgcagc ttataatggt tacaaataaa gcaatagcat cacaaatttc 7860 acaaataaag catttttttc actgcattct agttgtggtt tgtccaaact catcaatgta 7920 tcttatcatg tctggatcgg tctcaccatg cgtacagctt gacgcgtgcg taataacttc 7980 gtataatgta tgctatacga agttatactg ggcctcatgg gccttccgct cactgcccgc 8040 tttccagtcg ggaaacctgt cgtgccagct gcattaacat ggtcatagct gtttccttgc 8100 gtattgggcg ctctccgctt cctcgctcac tgactcgctg cgctcggtcg ttcgggtaaa 8160 gcctggggtg cctaatgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 8220 ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 8280 agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 8340 tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 8400 ccttcgggaa gcgtggcgct ttctcatagc tcacgctgta ggtatctcag ttcggtgtag 8460 gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 8520 ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 8580 gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 8640 aagtggtggc ctaactacgg ctacactaga agaacagtat ttggtatctg cgctctgctg 8700 aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 8760 ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatctcaa 8820 gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 8880 gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 8940 tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 9000 ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 9060 ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 9120 atgataccgc gagaaccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 9180 ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaat 9240 tgttgccggg aagctagagt aagtagttcg ccagttaata gtttgcgcaa cgttgttgcc 9300 attgctacag gcatcgtggt gtcacgctcg tcgtttggta tggcttcatt cagctccggt 9360 tcccaacgat caaggcgagt tacatgatcc cccatgttgt gcaaaaaagc ggttagctcc 9420 ttcggtcctc cgatcgttgt cagaagtaag ttggccgcag tgttatcact catggttatg 9480 gcagcactgc ataattctct tactgtcatg ccatccgtaa gatgcttttc tgtgactggt 9540 gagtactcaa ccaagtcatt ctgagaatag tgtatgcggc gaccgagttg ctcttgcccg 9600 gcgtcaatac gggataatac cgcgccacat agcagaactt taaaagtgct catcattgga 9660 aaacgttctt cggggcgaaa actctcaagg atcttaccgc tgttgagatc cagttcgatg 9720 taacccactc gtgcacccaa ctgatcttca gcatctttta ctttcaccag cgtttctggg 9780 tgagcaaaaa caggaaggca aaatgccgca aaaaagggaa taagggcgac acggaaatgt 9840 tgaatactca tactcttcct ttttcaatat tattgaagca tttatcaggg ttattgtctc 9900 atgagcggat acatatttga atgtatttag aaaaataaac aaataggggt tccgcgcaca 9960 tttccccgaa aagtgccac 9979 <210> 12 <211> 10101 <212> DNA <213> Artificial Sequence <220> <223> pCLD 052 <400> 12 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600 gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660 caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720 acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780 agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840 gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900 tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960 gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020 gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080 accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140 accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200 gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260 tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320 cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380 gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440 ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500 actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560 gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620 tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680 gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatgtggg 1740 gtatcgacag agtgccagcc ctgggaccga accccgcgtt tatgaacaaa cgacccaaca 1800 cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg cgggttcctt ccggtattgt 1860 ctccttccgt gtttcagtta gcctccccca tctcccgtta ctgctcgaat atacaatcgt 1920 ccaggtcaac gttcacaagg tcacacgcgg tacaggcatc cggtactttg cccataatgt 1980 ggtggatata acagagcttt tggtacgctt tctttaccac acttacaggt tgcgattcac 2040 ttacagggaa gcactccagg cagtcctttt gaccatgggt aaaacatatg tttgagtttt 2100 ggttcatacg ttcacactga cgacaaggga agagcatgag gttcataccg acatggcggc 2160 tgcacttatt ctgataacga tcagcataat taatggaggc ctcagcatcg ctggtgctag 2220 gttgtgcgac gctttcacgg acacgcttag gttcggagat gtcagcatcg ctaggagcag 2280 gacgcttttt agcacctcct ttcttaacat aaaactcgtg ctcgacttct acgacatggt 2340 ctttagccca gcgaaagaaa tccttcacct cctgtttagt aactttaccg aaatcgtggt 2400 cgaggcgtct agtcagctca aacttaaaca ttctatcctg gaggggttgt tgatgttcaa 2460 acgtcgtcga gttaccgtca ataactgcgc acatattagt attactcgta acaattaccg 2520 gggtaggatc gatttgagcg gagcttttac acttttgatc gacacggact ttggaaccac 2580 ccaggattgc cttcgcggat tcaaccactt tagctgtcat tttaccttct tcccaccata 2640 tgaccatttt atccacgcaa tcattaaaag ggaaattttc gttagtccaa ttcacacaac 2700 cataaaatgg gacggtatga gcaatagctt cggcaatatt agttttgccg gttgtggctg 2760 gaccgaagag ccaaatagta ttgcgtttac caaatttctt tgtagcccat ccgaggaata 2820 cagacgcagc gtactgaggg tcataaccat tgagctccaa gatcttgtaa attctgtttg 2880 aacttatgtc ctcaactggt tgttgaccga cgagatagtc cggcgccgtc tttgtaagcg 2940 acatgatctt accagcgttg tccaacgctg cttttatctg gcttctgcta ttactcgcag 3000 cgttaaagct aatataggat gcttgatctt cttgaatcca ttgtttttcg ctcgttatgc 3060 ctttatcgac aagccaaccc accaattcca tcttaacagg atccgcgaag ggcgaattcc 3120 agcacactgg cggccgttac tagtgagcgg gccgctttcg aatctagggg tgatcaagtc 3180 ttcgtcgagt gattgtaaat aaaatgtaat ttacagtata gtattttaat taatatacaa 3240 atgatttgat aataattctt atttaactat aatatattgt gttgggttga attaaaggtc 3300 cgtagcccat gaccactaaa atagagctga gcctagtcgc gtgatttgac ttaagatttc 3360 ggtctgtacg actatagttt cgtgagataa actggatcgg caatttgcta gacgatctgg 3420 cacagaaaga cacagacgaa ggactcacta tggaatggcg gcttcggccg ccaatgatgg 3480 atcccagcgg aagtaggaag cgatgtggcc tgaggaatac gtctgtcatt gcgtttagat 3540 aaggcatccc gctggaaagg gaaccagtac tttgtaaagg agctagaggt tctctttatg 3600 ctctgtggtt cgtgcggttc ttaaaagcaa acgacgagcg aacaggtgcg tgggcgagag 3660 ggcaccctca tttctaagta cgatcaggtg gactacgatt gcattttatg ggttccctgc 3720 ggctgtcacg ctaaatcact cggagaatgg caatgcaatc gactactagc aatgacccac 3780 tgaccgaaat ggagcataac gggtcgtttt acacgtagaa ttctactcgt aaagcgagtt 3840 tgtacgatga catcattttt aaaatgacat catccaccga tcttgcgtta caagtagaat 3900 tctactcgta aagcgagttc ggttttgaaa aacaaatgac atcattctac aaatgacatc 3960 atccctcgat tgtgttttac aagtagaatt ctactcgtaa agcgagttga attttaaaaa 4020 aacaaatgac atcatccctt gatcatgcgt tacaagtaga attctactcg taaagcgagt 4080 ttgtacgatg acatcatttt tgcacaaaca tatgagtcat atattaatca cgtttatcaa 4140 cttgcacaaa caaatgagtc gtacattaat catgtttatc aacttgcaaa aattaagttc 4200 aatgtaccat gtttaaacat gtttataatc acgtacaaaa atgacatcat ttcttgattg 4260 tgttttacaa gtaaaattct actcgtaaag cggaccagga ccaggaccgc tttacgagta 4320 gaattctacg cgtaaaacac aatcaagtat gagtcataat ctgatgtcat gttttgtaca 4380 cggctcataa ccgaactggc tttacgagta gaattctact tgtaatgcac gatcagtgga 4440 tgatgtcatt tgtttttcaa atcgagatga tgtcatgttt tgcacacggc tcataaactc 4500 gctttacgag tagaattcta cgtgtaacgc acgatcgatt gatgagtcat ttgttttgca 4560 atatgatatc atacaatatg actcatttgt ttttcaaaac cgaacttgat ttacgggtag 4620 aattctactt gtaaagcaca atcaaaaaga tgatgtcatt tgtttttcaa aactgaactc 4680 gctttacgag tagaattcta cgtgtaaaac acaatcaaga aatgatgtca tttgttataa 4740 aaataaaagc tgatgtcatg ttttgcacat ggctcataac taaactcgct ttacgggtag 4800 aattctacgc gtaaaacttt tgctagcttc ttaagttaga tctttatgca tttcggagcg 4860 agaccaaggc tgtcttgctg tgtgcccgtc gcgcgtaccg gagcgcgaac gcgcccgccg 4920 ccgacataaa cgacactttt ctagaaaaaa tttccatacc acgaggtcat cgcgattgtt 4980 gcgacgcaaa agtttacgaa actgccgtgc gcgagtttgt ggaagaaact ggccggtttt 5040 ttgacagcgc gttcatctac aagtttccat ttacgttaca atggaaagac gacggtgtca 5100 cttacaagta tttgatatac gtaggcgtcg tgcgcggcaa cttgattgac gtgaacgcca 5160 aacccaacac gtacaccgtg aagttgttgc cgggcacgtt tggcaacgac tatcgtataa 5220 tgttaaaacc gcgacgcttc aattgcgaaa taacgcgcag cctggccatc gtgccgctca 5280 acaaatattt taattatatg aacgacaaac aattgatcac gtacgattac agcaattaca 5340 ttgaattttt tagttttgtg cgcagcatca agaagcgttt cgataatagg caattgcaag 5400 actttttcta cgccactcta aaaaagatag acaacaacga tgccccccaa aaattgcacg 5460 cacttaggcg ggtgtaattc ggactgcttg acccgaagcg aaatacaagc gctgttcagg 5520 gaagccatca acacgctcaa gcacacaatg aatacagaag acgtctgcgc gcacatgttg 5580 gacatcgtgt cgtttgagcg tataaaagaa tatataagag ctaatttagg ccatttcaca 5640 gtaattaccg acaaatgttc taagcgtaag gtgtgtcttc atcacaaacg aattgccagg 5700 ctgttgggca ttaaaaaaat atatcatcaa gaatacaagc gggtcgtttc aaaggtttac 5760 aaaaatcaaa cacggcgggg ttctacgaga ttgtgattaa ggtccccagc gaccttgacg 5820 agcatctgcc cggcatttct gacagctttg tgaactgggt ggccgagaag gaatgggagt 5880 tgccgccaga ttctgacatg gatctgaatc tgattgagca ggcacccctg accgtggccg 5940 agaagctgca gcgcgacttt ctgacggaat ggcgccgtgt gagtaaggcc ccggaggccc 6000 ttttctttgt gcaatttgag aagggagaga gctacttcca catgcacgtg ctcgtggaaa 6060 ccaccggggt gaaatccatg gttttgggac gtttcctgag tcagattcgc gaaaaactga 6120 ttcagagaat ttaccgcggg atcgagccga ctttgccaaa ctggttcgcg gtcacaaaga 6180 ccagaaatgg cgccggaggc gggaacaagg tggtggatga gtgctacatc cccaattact 6240 tgctccccaa aacccagcct gagctccagt gggcgtggac taatatggaa cagtatttaa 6300 gcgcctgttt gaatctcacg gagcgtaaac ggttggtggc gcagcatctg acgcacgtgt 6360 cgcagacgca ggagcagaac aaagagaatc agaatcccaa ttctgatgcg ccggtgatca 6420 gatcaaaaac ttcagccagg tacatggagc tggtcgggtg gctcgtggac aaggggatta 6480 cctcggagaa gcagtggatc caggaggacc aggcctcata catctccttc aatgcggcct 6540 ccaactcgcg gtcccaaatc aaggctgcct tggacaatgc gggaaagatt atgagcctga 6600 ctaaaaccgc ccccgactac ctggtgggcc agcagcccgt ggaggacatt tccagcaatc 6660 ggatttataa aattttggaa ctaaacgggt acgatcccca atatgcggct tccgtctttc 6720 tgggatgggc cacgaaaaag ttcggcaaga ggaacaccat ctggctgttt gggcctgcaa 6780 ctaccgggaa gaccaacatc gcggaggcca tagcccacac tgtgcccttc tacgggtgcg 6840 taaactggac caatgagaac tttcccttca acgactgtgt cgacaagatg gtgatctggt 6900 gggaggaggg gaagatgacc gccaaggtcg tggagtcggc caaagccatt ctcggaggaa 6960 gcaaggtgcg cgtggaccag aaatgcaagt cctcggccca gatagacccg actcccgtga 7020 tcgtcacctc caacaccaac atgtgcgccg tgattgacgg gaactcaacg accttcgaac 7080 accagcagcc gttgcaagac cggatgttca aatttgaact cacccgccgt ctggatcatg 7140 actttgggaa ggtcaccaag caggaagtca aagacttttt ccggtgggca aaggatcacg 7200 tggttgaggt ggagcatgaa ttctacgtca aaaagggtgg agccaagaaa agacccgccc 7260 ccagtgacgc agatataagt gagcccaaac gggtgcgcga gtcagttgcg cagccatcga 7320 cgtcagacgc ggaagcttcg atcaactacg cagacaggta ccaaaacaaa tgttctcgtc 7380 acgtgggcat gaatctgatg ctgtttccct gcagacaatg cgagagaatg aatcagaatt 7440 caaatatctg cttcactcac ggacagaaag actgtttaga gtgctttccc gtgtcagaat 7500 ctcaacccgt ttctgtcgtc aaaaaggcgt atcagaaact gtgctacatt catcatatca 7560 tgggaaaggt gccagacgct tgcactgcct gcgatctggt caatgtggat ttggatgact 7620 gcatctttga acaataaatg atttaaatca ggtatggctg ccgatggtta tcttccagat 7680 tggctcgagg acactctctc tgatgaagag taactaaggg cgaattccag cacactggcg 7740 gccgttacta ggtagctgag cgggccgctt tcgaatctag agcctgcagt ctcgacaagc 7800 ttgtcgagaa gtactagagg atcataatca gccataccac atttgtagag gttttacttg 7860 ctttaaaaaa cctcccacac ctccccctga acctgaaaca taaaatgaat gcaattgttg 7920 ttgttaactt gtttattgca gcttataatg gttacaaata aagcaatagc atcacaaatt 7980 tcacaaataa agcatttttt tcactgcatt ctagttgtgg tttgtccaaa ctcatcaatg 8040 tatcttatca tgtctggatc ggtctcacca tgcgtacagc ttgacgcgtg cgtaataact 8100 tcgtataatg tatgctatac gaagttatac tgggcctcat gggccttccg ctcactgccc 8160 gctttccagt cgggaaacct gtcgtgccag ctgcattaac atggtcatag ctgtttcctt 8220 gcgtattggg cgctctccgc ttcctcgctc actgactcgc tgcgctcggt cgttcgggta 8280 aagcctgggg tgcctaatga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg 8340 cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct 8400 caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa 8460 gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc 8520 tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc agttcggtgt 8580 aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg 8640 ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg 8700 cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct 8760 tgaagtggtg gcctaactac ggctacacta gaagaacagt atttggtatc tgcgctctgc 8820 tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg 8880 ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa aaaggatctc 8940 aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt 9000 aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa 9060 aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat 9120 gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct 9180 gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg 9240 caatgatacc gcgagaacca cgctcaccgg ctccagattt atcagcaata aaccagccag 9300 ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta 9360 attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg 9420 ccattgctac aggcatcgtg gtgtcacgct cgtcgtttgg tatggcttca ttcagctccg 9480 gttcccaacg atcaaggcga gttacatgat cccccatgtt gtgcaaaaaa gcggttagct 9540 ccttcggtcc tccgatcgtt gtcagaagta agttggccgc agtgttatca ctcatggtta 9600 tggcagcact gcataattct cttactgtca tgccatccgt aagatgcttt tctgtgactg 9660 gtgagtactc aaccaagtca ttctgagaat agtgtatgcg gcgaccgagt tgctcttgcc 9720 cggcgtcaat acgggataat accgcgccac atagcagaac tttaaaagtg ctcatcattg 9780 gaaaacgttc ttcggggcga aaactctcaa ggatcttacc gctgttgaga tccagttcga 9840 tgtaacccac tcgtgcaccc aactgatctt cagcatcttt tactttcacc agcgtttctg 9900 ggtgagcaaa aacaggaagg caaaatgccg caaaaaaggg aataagggcg acacggaaat 9960 gttgaatact catactcttc ctttttcaat attattgaag catttatcag ggttattgtc 10020 tcatgagcgg atacatattt gaatgtattt agaaaaataa acaaataggg gttccgcgca 10080 catttccccg aaaagtgcca c 10101 <210> 13 <211> 10072 <212> DNA <213> Artificial Sequence <220> <223> pCLD 053 <400> 13 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600 gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660 caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720 acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780 agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840 gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900 tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960 gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020 gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080 accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140 accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200 gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260 tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320 cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380 gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440 ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500 actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560 gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620 tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680 gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatgtggg 1740 gtatcgacag agtgccagcc ctgggaccga accccgcgtt tatgaacaaa cgacccaaca 1800 cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg cgggttcctt ccggtattgt 1860 ctccttccgt gtttcagtta gcctccccca tctcccgtta ctgctcgaat atacaatcgt 1920 ccaggtcaac gttcacaagg tcacacgcgg tacaggcatc cggtactttg cccataatgt 1980 ggtggatata acagagcttt tggtacgctt tctttaccac acttacaggt tgcgattcac 2040 ttacagggaa gcactccagg cagtcctttt gaccatgggt aaaacatatg tttgagtttt 2100 ggttcatacg ttcacactga cgacaaggga agagcatgag gttcataccg acatggcggc 2160 tgcacttatt ctgataacga tcagcataat taatggaggc ctcagcatcg ctggtgctag 2220 gttgtgcgac gctttcacgg acacgcttag gttcggagat gtcagcatcg ctaggagcag 2280 gacgcttttt agcacctcct ttcttaacat aaaactcgtg ctcgacttct acgacatggt 2340 ctttagccca gcgaaagaaa tccttcacct cctgtttagt aactttaccg aaatcgtggt 2400 cgaggcgtct agtcagctca aacttaaaca ttctatcctg gaggggttgt tgatgttcaa 2460 acgtcgtcga gttaccgtca ataactgcgc acatattagt attactcgta acaattaccg 2520 gggtaggatc gatttgagcg gagcttttac acttttgatc gacacggact ttggaaccac 2580 ccaggattgc cttcgcggat tcaaccactt tagctgtcat tttaccttct tcccaccata 2640 tgaccatttt atccacgcaa tcattaaaag ggaaattttc gttagtccaa ttcacacaac 2700 cataaaatgg gacggtatga gcaatagctt cggcaatatt agttttgccg gttgtggctg 2760 gaccgaagag ccaaatagta ttgcgtttac caaatttctt tgtagcccat ccgaggaata 2820 cagacgcagc gtactgaggg tcataaccat tgagctccaa gatcttgtaa attctgtttg 2880 aacttatgtc ctcaactggt tgttgaccga cgagatagtc cggcgccgtc tttgtaagcg 2940 acatgatctt accagcgttg tccaacgctg cttttatctg gcttctgcta ttactcgcag 3000 cgttaaagct aatataggat gcttgatctt cttgaatcca ttgtttttcg ctcgttatgc 3060 ctttatcgac aagccaaccc accaattcca tgtttaaatt gtgtaattta tgtagctgta 3120 atttttacct tattaatatt ttttacgctt tgcattcgac gactgaactc ccaaatatat 3180 gtttaactcg tcttggtcgt ttgaattttt gttgctgtgt ttcctaatat tttccatcac 3240 cttaaatatg ttattgtaat cctcaatgtt gaactgccca tgaccactaa aatagagctg 3300 agcctagtcg cgtgatttga cttaagattt cggtctgtac gactatagtt tcgtgagata 3360 aactggatcg gcaatttgct agacgatctg gcacagaaag acacagacga aggactcact 3420 atggaatggc ggcttcggcc gccaatgatg gatcccagcg gaagtaggaa gcgatgtggc 3480 ctgaggaata cgtctgtcat tgcgtttaga taaggcatcc cgctggaaag ggaaccagta 3540 ctttgtaaag gagctagagg ttctctttat gctctgtggt tcgtgcggtt cttaaaagca 3600 aacgacgagc gaacaggtgc gtgggcgaga gggcaccctc atttctaagt acgatcaggt 3660 ggactacgat tgcattttat gggttccctg cggctgtcac gctaaatcac tcggagaatg 3720 gcaatgcaat cgactactag caatgaccca ctgaccgaaa tggagcataa cgggtcgttt 3780 tacacgtaga attctactcg taaagcgagt ttgtacgatg acatcatttt taaaatgaca 3840 tcatccaccg atcttgcgtt acaagtagaa ttctactcgt aaagcgagtt cggttttgaa 3900 aaacaaatga catcattcta caaatgacat catccctcga ttgtgtttta caagtagaat 3960 tctactcgta aagcgagttg aattttaaaa aaacaaatga catcatccct tgatcatgcg 4020 ttacaagtag aattctactc gtaaagcgag tttgtacgat gacatcattt ttgcacaaac 4080 atatgagtca tatattaatc acgtttatca acttgcacaa acaaatgagt cgtacattaa 4140 tcatgtttat caacttgcaa aaattaagtt caatgtacca tgtttaaaca tgtttataat 4200 cacgtacaaa aatgacatca tttcttgatt gtgttttaca agtaaaattc tactcgtaaa 4260 gcggaccagg accaggaccg ctttacgagt agaattctac gcgtaaaaca caatcaagta 4320 tgagtcataa tctgatgtca tgttttgtac acggctcata accgaactgg ctttacgagt 4380 agaattctac ttgtaatgca cgatcagtgg atgatgtcat ttgtttttca aatcgagatg 4440 atgtcatgtt ttgcacacgg ctcataaact cgctttacga gtagaattct acgtgtaacg 4500 cacgatcgat tgatgagtca tttgttttgc aatatgatat catacaatat gactcatttg 4560 tttttcaaaa ccgaacttga tttacgggta gaattctact tgtaaagcac aatcaaaaag 4620 atgatgtcat ttgtttttca aaactgaact cgctttacga gtagaattct acgtgtaaaa 4680 cacaatcaag aaatgatgtc atttgttata aaaataaaag ctgatgtcat gttttgcaca 4740 tggctcataa ctaaactcgc tttacgggta gaattctacg cgtaaaactt ttgctagctt 4800 cttaagttag atctttatgc atttcggagc gagaccaagg ctgtcttgct gtgtgcccgt 4860 cgcgcgtacc ggagcgcgaa cgcgcccgcc gccgacataa acgacacttt tctagaaaaa 4920 atttccatac cacgaggtca tcgcgattgt tgcgacgcaa aagtttacga aactgccgtg 4980 cgcgagtttg tggaagaaac tggccggttt tttgacagcg cgttcatcta caagtttcca 5040 tttacgttac aatggaaaga cgacggtgtc acttacaagt atttgatata cgtaggcgtc 5100 gtgcgcggca acttgattga cgtgaacgcc aaacccaaca cgtacaccgt gaagttgttg 5160 ccgggcacgt ttggcaacga ctatcgtata atgttaaaac cgcgacgctt caattgcgaa 5220 ataacgcgca gcctggccat cgtgccgctc aacaaatatt ttaattatat gaacgacaaa 5280 caattgatca cgtacgatta cagcaattac attgaatttt ttagttttgt gcgcagcatc 5340 aagaagcgtt tcgataatag gcaattgcaa gactttttct acgccactct aaaaaagata 5400 gacaacaacg atgcccccca aaaattgcac gcacttaggc gggtgtaatt cggactgctt 5460 gacccgaagc gaaatacaag cgctgttcag ggaagccatc aacacgctca agcacacaat 5520 gaatacagaa gacgtctgcg cgcacatgtt ggacatcgtg tcgtttgagc gtataaaaga 5580 atatataaga gctaatttag gccatttcac agtaattacc gacaaatgtt ctaagcgtaa 5640 ggtgtgtctt catcacaaac gaattgccag gctgttgggc attaaaaaaa tatatcatca 5700 agaatacaag cgggtcgttt caaaggttta caaaaatcaa acacggcggg gttctacgag 5760 attgtgatta aggtccccag cgaccttgac gagcatctgc ccggcatttc tgacagcttt 5820 gtgaactggg tggccgagaa ggaatgggag ttgccgccag attctgacat ggatctgaat 5880 ctgattgagc aggcacccct gaccgtggcc gagaagctgc agcgcgactt tctgacggaa 5940 tggcgccgtg tgagtaaggc cccggaggcc cttttctttg tgcaatttga gaagggagag 6000 agctacttcc acatgcacgt gctcgtggaa accaccgggg tgaaatccat ggttttggga 6060 cgtttcctga gtcagattcg cgaaaaactg attcagagaa tttaccgcgg gatcgagccg 6120 actttgccaa actggttcgc ggtcacaaag accagaaatg gcgccggagg cgggaacaag 6180 gtggtggatg agtgctacat ccccaattac ttgctcccca aaacccagcc tgagctccag 6240 tgggcgtgga ctaatatgga acagtattta agcgcctgtt tgaatctcac ggagcgtaaa 6300 cggttggtgg cgcagcatct gacgcacgtg tcgcagacgc aggagcagaa caaagagaat 6360 cagaatccca attctgatgc gccggtgatc agatcaaaaa cttcagccag gtacatggag 6420 ctggtcgggt ggctcgtgga caaggggatt acctcggaga agcagtggat ccaggaggac 6480 caggcctcat acatctcctt caatgcggcc tccaactcgc ggtcccaaat caaggctgcc 6540 ttggacaatg cgggaaagat tatgagcctg actaaaaccg cccccgacta cctggtgggc 6600 cagcagcccg tggaggacat ttccagcaat cggatttata aaattttgga actaaacggg 6660 tacgatcccc aatatgcggc ttccgtcttt ctgggatggg ccacgaaaaa gttcggcaag 6720 aggaacacca tctggctgtt tgggcctgca actaccggga agaccaacat cgcggaggcc 6780 atagcccaca ctgtgccctt ctacgggtgc gtaaactgga ccaatgagaa ctttcccttc 6840 aacgactgtg tcgacaagat ggtgatctgg tgggaggagg ggaagatgac cgccaaggtc 6900 gtggagtcgg ccaaagccat tctcggagga agcaaggtgc gcgtggacca gaaatgcaag 6960 tcctcggccc agatagaccc gactcccgtg atcgtcacct ccaacaccaa catgtgcgcc 7020 gtgattgacg ggaactcaac gaccttcgaa caccagcagc cgttgcaaga ccggatgttc 7080 aaatttgaac tcacccgccg tctggatcat gactttggga aggtcaccaa gcaggaagtc 7140 aaagactttt tccggtgggc aaaggatcac gtggttgagg tggagcatga attctacgtc 7200 aaaaagggtg gagccaagaa aagacccgcc cccagtgacg cagatataag tgagcccaaa 7260 cgggtgcgcg agtcagttgc gcagccatcg acgtcagacg cggaagcttc gatcaactac 7320 gcagacaggt accaaaacaa atgttctcgt cacgtgggca tgaatctgat gctgtttccc 7380 tgcagacaat gcgagagaat gaatcagaat tcaaatatct gcttcactca cggacagaaa 7440 gactgtttag agtgctttcc cgtgtcagaa tctcaacccg tttctgtcgt caaaaaggcg 7500 tatcagaaac tgtgctacat tcatcatatc atgggaaagg tgccagacgc ttgcactgcc 7560 tgcgatctgg tcaatgtgga tttggatgac tgcatctttg aacaataaat gatttaaatc 7620 aggtatggct gccgatggtt atcttccaga ttggctcgag gacactctct ctgatgaaga 7680 gtaactaagg gcgaattcca gcacactggc ggccgttact aggtagctga gcgggccgct 7740 ttcgaatcta gagcctgcag tctcgacaag cttgtcgaga agtactagag gatcataatc 7800 agccatacca catttgtaga ggttttactt gctttaaaaa acctcccaca cctccccctg 7860 aacctgaaac ataaaatgaa tgcaattgtt gttgttaact tgtttattgc agcttataat 7920 ggttacaaat aaagcaatag catcacaaat ttcacaaata aagcattttt ttcactgcat 7980 tctagttgtg gtttgtccaa actcatcaat gtatcttatc atgtctggat cggtctcacc 8040 atgcgtacag cttgacgcgt gcgtaataac ttcgtataat gtatgctata cgaagttata 8100 ctgggcctca tgggccttcc gctcactgcc cgctttccag tcgggaaacc tgtcgtgcca 8160 gctgcattaa catggtcata gctgtttcct tgcgtattgg gcgctctccg cttcctcgct 8220 cactgactcg ctgcgctcgg tcgttcgggt aaagcctggg gtgcctaatg agcaaaaggc 8280 cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc 8340 ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga 8400 ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc 8460 ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcat 8520 agctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg 8580 cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc 8640 aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga 8700 gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact 8760 agaagaacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt 8820 ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag 8880 cagcagatta cgcgcagaaa aaaaggatct caagaagatc ctttgatctt ttctacgggg 8940 tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa 9000 aggatcttca cctagatcct tttaaattaa aaatgaagtt ttaaatcaat ctaaagtata 9060 tatgagtaaa cttggtctga cagttaccaa tgcttaatca gtgaggcacc tatctcagcg 9120 atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata 9180 cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaacc acgctcaccg 9240 gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct 9300 gcaactttat ccgcctccat ccagtctatt aattgttgcc gggaagctag agtaagtagt 9360 tcgccagtta atagtttgcg caacgttgtt gccattgcta caggcatcgt ggtgtcacgc 9420 tcgtcgtttg gtatggcttc attcagctcc ggttcccaac gatcaaggcg agttacatga 9480 tcccccatgt tgtgcaaaaa agcggttagc tccttcggtc ctccgatcgt tgtcagaagt 9540 aagttggccg cagtgttatc actcatggtt atggcagcac tgcataattc tcttactgtc 9600 atgccatccg taagatgctt ttctgtgact ggtgagtact caaccaagtc attctgagaa 9660 tagtgtatgc ggcgaccgag ttgctcttgc ccggcgtcaa tacgggataa taccgcgcca 9720 catagcagaa ctttaaaagt gctcatcatt ggaaaacgtt cttcggggcg aaaactctca 9780 aggatcttac cgctgttgag atccagttcg atgtaaccca ctcgtgcacc caactgatct 9840 tcagcatctt ttactttcac cagcgtttct gggtgagcaa aaacaggaag gcaaaatgcc 9900 gcaaaaaagg gaataagggc gacacggaaa tgttgaatac tcatactctt cctttttcaa 9960 tattattgaa gcatttatca gggttattgt ctcatgagcg gatacatatt tgaatgtatt 10020 tagaaaaata aacaaatagg ggttccgcgc acatttcccc gaaaagtgcc ac 10072 <210> 14 <211> 10005 <212> DNA <213> Artificial Sequence <220> <223> pCLD 054 <400> 14 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600 gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660 caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720 acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780 agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840 gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900 tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960 gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020 gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080 accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140 accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200 gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260 tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320 cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380 gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440 ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500 actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560 gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620 tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680 gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatgtggg 1740 gtatcgacag agtgccagcc ctgggaccga accccgcgtt tatgaacaaa cgacccaaca 1800 cccgtgcgtt ttattctgtc tttttattgc cgtcatagcg cgggttcctt ccggtattgt 1860 ctccttccgt gtttcagtta gcctccccca tctcccgtta ctgctcgaat atacaatcgt 1920 ccaggtcaac gttcacaagg tcacacgcgg tacaggcatc cggtactttg cccataatgt 1980 ggtggatata acagagcttt tggtacgctt tctttaccac acttacaggt tgcgattcac 2040 ttacagggaa gcactccagg cagtcctttt gaccatgggt aaaacatatg tttgagtttt 2100 ggttcatacg ttcacactga cgacaaggga agagcatgag gttcataccg acatggcggc 2160 tgcacttatt ctgataacga tcagcataat taatggaggc ctcagcatcg ctggtgctag 2220 gttgtgcgac gctttcacgg acacgcttag gttcggagat gtcagcatcg ctaggagcag 2280 gacgcttttt agcacctcct ttcttaacat aaaactcgtg ctcgacttct acgacatggt 2340 ctttagccca gcgaaagaaa tccttcacct cctgtttagt aactttaccg aaatcgtggt 2400 cgaggcgtct agtcagctca aacttaaaca ttctatcctg gaggggttgt tgatgttcaa 2460 acgtcgtcga gttaccgtca ataactgcgc acatattagt attactcgta acaattaccg 2520 gggtaggatc gatttgagcg gagcttttac acttttgatc gacacggact ttggaaccac 2580 ccaggattgc cttcgcggat tcaaccactt tagctgtcat tttaccttct tcccaccata 2640 tgaccatttt atccacgcaa tcattaaaag ggaaattttc gttagtccaa ttcacacaac 2700 cataaaatgg gacggtatga gcaatagctt cggcaatatt agttttgccg gttgtggctg 2760 gaccgaagag ccaaatagta ttgcgtttac caaatttctt tgtagcccat ccgaggaata 2820 cagacgcagc gtactgaggg tcataaccat tgagctccaa gatcttgtaa attctgtttg 2880 aacttatgtc ctcaactggt tgttgaccga cgagatagtc cggcgccgtc tttgtaagcg 2940 acatgatctt accagcgttg tccaacgctg cttttatctg gcttctgcta ttactcgcag 3000 cgttaaagct aatataggat gcttgatctt cttgaatcca ttgtttttcg ctcgttatgc 3060 ctttatcgac aagccaaccc accaattcca ttatattgta gcaaaaattt aatttttgcc 3120 aaaagactta ataaatcatc agcaatggac aacaaagtaa ataaaaaatt tacaaagcat 3180 aatagagagg tttattgatt attgaacagc ccatgaccac taaaatagag ctgagcctag 3240 tcgcgtgatt tgacttaaga tttcggtctg tacgactata gtttcgtgag ataaactgga 3300 tcggcaattt gctagacgat ctggcacaga aagacacaga cgaaggactc actatggaat 3360 ggcggcttcg gccgccaatg atggatccca gcggaagtag gaagcgatgt ggcctgagga 3420 atacgtctgt cattgcgttt agataaggca tcccgctgga aagggaacca gtactttgta 3480 aaggagctag aggttctctt tatgctctgt ggttcgtgcg gttcttaaaa gcaaacgacg 3540 agcgaacagg tgcgtgggcg agagggcacc ctcatttcta agtacgatca ggtggactac 3600 gattgcattt tatgggttcc ctgcggctgt cacgctaaat cactcggaga atggcaatgc 3660 aatcgactac tagcaatgac ccactgaccg aaatggagca taacgggtcg ttttacacgt 3720 agaattctac tcgtaaagcg agtttgtacg atgacatcat ttttaaaatg acatcatcca 3780 ccgatcttgc gttacaagta gaattctact cgtaaagcga gttcggtttt gaaaaacaaa 3840 tgacatcatt ctacaaatga catcatccct cgattgtgtt ttacaagtag aattctactc 3900 gtaaagcgag ttgaatttta aaaaaacaaa tgacatcatc ccttgatcat gcgttacaag 3960 tagaattcta ctcgtaaagc gagtttgtac gatgacatca tttttgcaca aacatatgag 4020 tcatatatta atcacgttta tcaacttgca caaacaaatg agtcgtacat taatcatgtt 4080 tatcaacttg caaaaattaa gttcaatgta ccatgtttaa acatgtttat aatcacgtac 4140 aaaaatgaca tcatttcttg attgtgtttt acaagtaaaa ttctactcgt aaagcggacc 4200 aggaccagga ccgctttacg agtagaattc tacgcgtaaa acacaatcaa gtatgagtca 4260 taatctgatg tcatgttttg tacacggctc ataaccgaac tggctttacg agtagaattc 4320 tacttgtaat gcacgatcag tggatgatgt catttgtttt tcaaatcgag atgatgtcat 4380 gttttgcaca cggctcataa actcgcttta cgagtagaat tctacgtgta acgcacgatc 4440 gattgatgag tcatttgttt tgcaatatga tatcatacaa tatgactcat ttgtttttca 4500 aaaccgaact tgatttacgg gtagaattct acttgtaaag cacaatcaaa aagatgatgt 4560 catttgtttt tcaaaactga actcgcttta cgagtagaat tctacgtgta aaacacaatc 4620 aagaaatgat gtcatttgtt ataaaaataa aagctgatgt catgttttgc acatggctca 4680 taactaaact cgctttacgg gtagaattct acgcgtaaaa cttttgctag cttcttaagt 4740 tagatcttta tgcatttcgg agcgagacca aggctgtctt gctgtgtgcc cgtcgcgcgt 4800 accggagcgc gaacgcgccc gccgccgaca taaacgacac ttttctagaa aaaatttcca 4860 taccacgagg tcatcgcgat tgttgcgacg caaaagttta cgaaactgcc gtgcgcgagt 4920 ttgtggaaga aactggccgg ttttttgaca gcgcgttcat ctacaagttt ccatttacgt 4980 tacaatggaa agacgacggt gtcacttaca agtatttgat atacgtaggc gtcgtgcgcg 5040 gcaacttgat tgacgtgaac gccaaaccca acacgtacac cgtgaagttg ttgccgggca 5100 cgtttggcaa cgactatcgt ataatgttaa aaccgcgacg cttcaattgc gaaataacgc 5160 gcagcctggc catcgtgccg ctcaacaaat attttaatta tatgaacgac aaacaattga 5220 tcacgtacga ttacagcaat tacattgaat tttttagttt tgtgcgcagc atcaagaagc 5280 gtttcgataa taggcaattg caagactttt tctacgccac tctaaaaaag atagacaaca 5340 acgatgcccc ccaaaaattg cacgcactta ggcgggtgta attcggactg cttgacccga 5400 agcgaaatac aagcgctgtt cagggaagcc atcaacacgc tcaagcacac aatgaataca 5460 gaagacgtct gcgcgcacat gttggacatc gtgtcgtttg agcgtataaa agaatatata 5520 agagctaatt taggccattt cacagtaatt accgacaaat gttctaagcg taaggtgtgt 5580 cttcatcaca aacgaattgc caggctgttg ggcattaaaa aaatatatca tcaagaatac 5640 aagcgggtcg tttcaaaggt ttacaaaaat caaacacggc ggggttctac gagattgtga 5700 ttaaggtccc cagcgacctt gacgagcatc tgcccggcat ttctgacagc tttgtgaact 5760 gggtggccga gaaggaatgg gagttgccgc cagattctga catggatctg aatctgattg 5820 agcaggcacc cctgaccgtg gccgagaagc tgcagcgcga ctttctgacg gaatggcgcc 5880 gtgtgagtaa ggccccggag gcccttttct ttgtgcaatt tgagaaggga gagagctact 5940 tccacatgca cgtgctcgtg gaaaccaccg gggtgaaatc catggttttg ggacgtttcc 6000 tgagtcagat tcgcgaaaaa ctgattcaga gaatttaccg cgggatcgag ccgactttgc 6060 caaactggtt cgcggtcaca aagaccagaa atggcgccgg aggcgggaac aaggtggtgg 6120 atgagtgcta catccccaat tacttgctcc ccaaaaccca gcctgagctc cagtgggcgt 6180 ggactaatat ggaacagtat ttaagcgcct gtttgaatct cacggagcgt aaacggttgg 6240 tggcgcagca tctgacgcac gtgtcgcaga cgcaggagca gaacaaagag aatcagaatc 6300 ccaattctga tgcgccggtg atcagatcaa aaacttcagc caggtacatg gagctggtcg 6360 ggtggctcgt ggacaagggg attacctcgg agaagcagtg gatccaggag gaccaggcct 6420 catacatctc cttcaatgcg gcctccaact cgcggtccca aatcaaggct gccttggaca 6480 atgcgggaaa gattatgagc ctgactaaaa ccgcccccga ctacctggtg ggccagcagc 6540 ccgtggagga catttccagc aatcggattt ataaaatttt ggaactaaac gggtacgatc 6600 cccaatatgc ggcttccgtc tttctgggat gggccacgaa aaagttcggc aagaggaaca 6660 ccatctggct gtttgggcct gcaactaccg ggaagaccaa catcgcggag gccatagccc 6720 acactgtgcc cttctacggg tgcgtaaact ggaccaatga gaactttccc ttcaacgact 6780 gtgtcgacaa gatggtgatc tggtgggagg aggggaagat gaccgccaag gtcgtggagt 6840 cggccaaagc cattctcgga ggaagcaagg tgcgcgtgga ccagaaatgc aagtcctcgg 6900 cccagataga cccgactccc gtgatcgtca cctccaacac caacatgtgc gccgtgattg 6960 acgggaactc aacgaccttc gaacaccagc agccgttgca agaccggatg ttcaaatttg 7020 aactcacccg ccgtctggat catgactttg ggaaggtcac caagcaggaa gtcaaagact 7080 ttttccggtg ggcaaaggat cacgtggttg aggtggagca tgaattctac gtcaaaaagg 7140 gtggagccaa gaaaagaccc gcccccagtg acgcagatat aagtgagccc aaacgggtgc 7200 gcgagtcagt tgcgcagcca tcgacgtcag acgcggaagc ttcgatcaac tacgcagaca 7260 ggtaccaaaa caaatgttct cgtcacgtgg gcatgaatct gatgctgttt ccctgcagac 7320 aatgcgagag aatgaatcag aattcaaata tctgcttcac tcacggacag aaagactgtt 7380 tagagtgctt tcccgtgtca gaatctcaac ccgtttctgt cgtcaaaaag gcgtatcaga 7440 aactgtgcta cattcatcat atcatgggaa aggtgccaga cgcttgcact gcctgcgatc 7500 tggtcaatgt ggatttggat gactgcatct ttgaacaata aatgatttaa atcaggtatg 7560 gctgccgatg gttatcttcc agattggctc gaggacactc tctctgatga agagtaacta 7620 agggcgaatt ccagcacact ggcggccgtt actaggtagc tgagcgggcc gctttcgaat 7680 ctagagcctg cagtctcgac aagcttgtcg agaagtacta gaggatcata atcagccata 7740 ccacatttgt agaggtttta cttgctttaa aaaacctccc acacctcccc ctgaacctga 7800 aacataaaat gaatgcaatt gttgttgtta acttgtttat tgcagcttat aatggttaca 7860 aataaagcaa tagcatcaca aatttcacaa ataaagcatt tttttcactg cattctagtt 7920 gtggtttgtc caaactcatc aatgtatctt atcatgtctg gatcggtctc accatgcgta 7980 cagcttgacg cgtgcgtaat aacttcgtat aatgtatgct atacgaagtt atactgggcc 8040 tcatgggcct tccgctcact gcccgctttc cagtcgggaa acctgtcgtg ccagctgcat 8100 taacatggtc atagctgttt ccttgcgtat tgggcgctct ccgcttcctc gctcactgac 8160 tcgctgcgct cggtcgttcg ggtaaagcct ggggtgccta atgagcaaaa ggccagcaaa 8220 aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg 8280 acgagcatca caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa 8340 gataccaggc gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc 8400 ttaccggata cctgtccgcc tttctccctt cgggaagcgt ggcgctttct catagctcac 8460 gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac 8520 cccccgttca gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg 8580 taagacacga cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt 8640 atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagaa 8700 cagtatttgg tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct 8760 cttgatccgg caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga 8820 ttacgcgcag aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg 8880 ctcagtggaa cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct 8940 tcacctagat ccttttaaat taaaaatgaa gttttaaatc aatctaaagt atatatgagt 9000 aaacttggtc tgacagttac caatgcttaa tcagtgaggc acctatctca gcgatctgtc 9060 tatttcgttc atccatagtt gcctgactcc ccgtcgtgta gataactacg atacgggagg 9120 gcttaccatc tggccccagt gctgcaatga taccgcgaga accacgctca ccggctccag 9180 atttatcagc aataaaccag ccagccggaa gggccgagcg cagaagtggt cctgcaactt 9240 tatccgcctc catccagtct attaattgtt gccgggaagc tagagtaagt agttcgccag 9300 ttaatagttt gcgcaacgtt gttgccattg ctacaggcat cgtggtgtca cgctcgtcgt 9360 ttggtatggc ttcattcagc tccggttccc aacgatcaag gcgagttaca tgatccccca 9420 tgttgtgcaa aaaagcggtt agctccttcg gtcctccgat cgttgtcaga agtaagttgg 9480 ccgcagtgtt atcactcatg gttatggcag cactgcataa ttctcttact gtcatgccat 9540 ccgtaagatg cttttctgtg actggtgagt actcaaccaa gtcattctga gaatagtgta 9600 tgcggcgacc gagttgctct tgcccggcgt caatacggga taataccgcg ccacatagca 9660 gaactttaaa agtgctcatc attggaaaac gttcttcggg gcgaaaactc tcaaggatct 9720 taccgctgtt gagatccagt tcgatgtaac ccactcgtgc acccaactga tcttcagcat 9780 cttttacttt caccagcgtt tctgggtgag caaaaacagg aaggcaaaat gccgcaaaaa 9840 agggaataag ggcgacacgg aaatgttgaa tactcatact cttccttttt caatattatt 9900 gaagcattta tcagggttat tgtctcatga gcggatacat atttgaatgt atttagaaaa 9960 ataaacaaat aggggttccg cgcacatttc cccgaaaagt gccac 10005 <210> 15 <211> 1194 <212> DNA <213> Artificial Sequence <220> <223> Extreme codon optimized Rep52 <400> 15 atggaattgg tgggttggct tgtcgataaa ggcataacga gcgaaaaaca atggattcaa 60 gaagatcaag catcctatat tagctttaac gctgcgagta atagcagaag ccagataaaa 120 gcagcgttgg acaacgctgg taagatcatg tcgcttacaa agacggcgcc ggactatctc 180 gtcggtcaac aaccagttga ggacataagt tcaaacagaa tttacaagat cttggagctc 240 aatggttatg accctcagta cgctgcgtct gtattcctcg gatgggctac aaagaaattt 300 ggtaaacgca atactatttg gctcttcggt ccagccacaa ccggcaaaac taatattgcc 360 gaagctattg ctcataccgt cccattttat ggttgtgtga attggactaa cgaaaatttc 420 ccttttaatg attgcgtgga taaaatggtc atatggtggg aagaaggtaa aatgacagct 480 aaagtggttg aatccgcgaa ggcaatcctg ggtggttcca aagtccgtgt cgatcaaaag 540 tgtaaaagct ccgctcaaat cgatcctacc ccggtaattg ttacgagtaa tactaatatg 600 tgcgcagtta ttgacggtaa ctcgacgacg tttgaacatc aacaacccct ccaggataga 660 atgtttaagt ttgagctgac tagacgcctc gaccacgatt tcggtaaagt tactaaacag 720 gaggtgaagg atttctttcg ctgggctaaa gaccatgtcg tagaagtcga gcacgagttt 780 tatgttaaga aaggaggtgc taaaaagcgt cctgctccta gcgatgctga catctccgaa 840 cctaagcgtg tccgtgaaag cgtcgcacaa cctagcacca gcgatgctga ggcctccatt 900 aattatgctg atcgttatca gaataagtgc agccgccatg tcggtatgaa cctcatgctc 960 ttcccttgtc gtcagtgtga acgtatgaac caaaactcaa acatatgttt tacccatggt 1020 caaaaggact gcctggagtg cttccctgta agtgaatcgc aacctgtaag tgtggtaaag 1080 aaagcgtacc aaaagctctg ttatatccac cacattatgg gcaaagtacc ggatgcctgt 1140 accgcgtgtg accttgtgaa cgttgacctg gacgattgta tattcgagca gtaa 1194 <210> 16 <211> 8316 <212> DNA <213> Artificial Sequence <220> <223> pCLD 011 <400> 16 ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60 attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120 gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180 gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240 gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300 acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360 aggccgcata ccccagcatg cctgctattg tcttcccaat cctccccctt gctgtcctgc 420 cccaccccac cccccagaat agaatgacac ctactcagac aatgcgatgc aatttcctca 480 ttttattagg aaaggacagt gggagtggca ccttccaggg tcaaggaagg cacgggggag 540 gggcaaacaa cagatggctg gcaactagaa ggcacagtcg aggctgatca gcgagctcta 600 gtcgagggcc cgcggtaccg tcgatgaatc catggttcgc aattctgcac aggtgaagac 660 caagcaacac ggacttaacc ctcccaaaca taaccagagg ggagaagttc acgaataccg 720 acggcggttg gctggccgtc tgaatctttt acaatagctt taatgcctgg atgaaggtca 780 agaagtacct gacgacacct gccgcatggg gaaagaatac cacggttttc atttccaatc 840 gccacgatac acgtaaggtt acccgctgct gccgcagccg cagtacccaa tacgaccagc 900 tccgcacaag ggcctccggt gaaatggtac acgttaacac ccgtgaagat gcgtccatcc 960 gacgagagcg ccgcacttgc aactgagtaa tcttccgaaa ttggtataga attgatcgtg 1020 gcggtagcac gctcaatcaa tgtagattcc tcctgtgaga ggggttttgc catggtggcg 1080 accggtagcc tcgagtaccg gatcctctag cggccgaaca gatgctgttc aactgtgttt 1140 accagatcgt tgcgggctgt atttataggc gcgataagcg ggacgggcgc ctcgtgtccg 1200 gtcacgcgca tgagataacg cgcggctgat atggaggcgc gtcctgttcc gataaggagt 1260 tgcgtccggc tgcggttagc aacacaggaa gctggcgtcc tgtcacgata agacaacact 1320 cgtccggtcc gataatgtga ttcgtacgtg acaggacgcg acccgataag gccggcctac 1380 gtgactgccg acacgtactt ttttgcactg caaaaaggtt caatgtgtgg tagtgtattt 1440 ggagcgtata caacggtgta gactatttat gtaaaatagt ctacgaaacg tagagtttgt 1500 actatgtatg ggcccgcgtg caaaagcgtg tttttttgca gtgcaaaaaa gttggtggtg 1560 gggaggccac cgagtataaa ggtgcttgtt ggcaaacatg aaaacacagt tcaacagaat 1620 tgttgttgaa gcaacattag caccatacat tgtttatcat catgaataac ttcgtataat 1680 gtatgctata cgaagttatt tgcggccgct tgatatcttc ctgcaggtta tcgatttggc 1740 cgcgaattca ctagtgattg cggaataatt gccatatgta aatgatgtca tcgttctaac 1800 tcgctttacg agtagaattc tacgtgtaaa acataatcaa gagatgatgt catttgtttt 1860 tcaaaactga actcaagaaa tgatgtcatt tgtttttcaa aactgaactg gctttacgag 1920 cagaattcta cttgtaacgc atgatcaagg gatgatgtca tttgtttttt aaaattgaac 1980 tggctttacg agtagaattc tacttgtaaa acacaatcga gagatgatgt catattttgc 2040 acacggctct aattaaactc gctttacgag taaaattcta cttgtaacgc atgatcaagg 2100 gatgatgtca ttggatgagt catttgtttt tcaaaactaa actcgcttta cgagtagaat 2160 tctacttgta aaacacaatc aagggatgat gtcattatac aaatgatgtc atttgttttt 2220 caaaactaaa ctcgctttac gggtagaatt ctacttgtaa aacacaatcg agggatgatg 2280 tcatccttta cacatgatta taaacgtgtt tatgtatgac tcatttgttt ttcaaaacta 2340 aactcgcttt acgagtagaa ttctacttgt aacgcacgat caagggatga tgtcatttat 2400 ttgtgcaaag ctgatgtcat cttttgcaca cgattataaa cacaatcaaa taatgactca 2460 tttgttttca aaactgaact cgctttacga gtagaattct acttgtaaaa cacaatcaag 2520 ggatgatgtc attttaaaaa tgatgtcatt tgtttttcaa aactaaactc gctttacgag 2580 tagaattcta cgtgtaaaac acaatcaagg gatgatgtca tttactaaaa taaaataatt 2640 atttaaataa aaatgttttt attgtaaaat acacattgat tacacgtgac aatcgaattc 2700 ccgcttgcta gcttcttaag ttagatctga cccgttatgc tccatttcgg tcagtgggtc 2760 attgctagta gtcgattgca ttgccattct ccgagtgatt tagcgtgaca gccgcaggga 2820 acccataaaa tgcaatcgta gtccacctga tcgtacttag aaatgagggt gccctctcgc 2880 ccacgcacct gttcgctcgt cgtttgcttt taagaaccgc acgaaccaca gagcataaag 2940 agaacctcta gctcctttac aaagtactgg ttccctttcc agcgggatgc cttatctaaa 3000 cgcaatgaca gacgtattcc tcaggccaca tcgcttccta cttccgctgg gatccatcat 3060 tggcggccga agccgccatt ccatagtgag tccttcgtct gtgtctttct gtgccagatc 3120 gtctagcaaa ttgccgatcc agtttatctc acgaaactat agtcgtacag accgaaatct 3180 taagtcaaat cacgcgacta ggctcagctc tattttagtg gtcatgggtt ttggtccgcc 3240 cgagcggtgc aaccgattag gaccatgtac agcatttgtt acaagtcttc tagtaaacac 3300 aatcttcctg ctcagtggcg catgattatc gttgttgcta gccagcgtgg taagtaacag 3360 caccactgcg agcctaatgt gccctttcca cgaacacagg gctgtccgat cctatattag 3420 gactccgcaa tggggttagc aagtcgcacc ctaaacgatg ttgaagactc gcgatgtaca 3480 tgctctggta caatacatac gtgttccggc tgttatcctg catcggaacc tcaatcatgc 3540 atcgcaccag cgtattcgtg tcatctagga gtgtcgcgta ggataaataa ttcaattaag 3600 atgtcgttat gctagtatac gcctacccgt caccggccat ctgtgtgcag atgagtcgac 3660 gagttactgg ccctgatttc tccgcttcta ataccacaca ctgggcaata cgagctcaag 3720 ccagtctcga tctttatgca tttcggagcg agaccatcat ggagataatt aaaatgataa 3780 ccatctcgca aataaataag tattttactg ttttcgtaac agttttgtaa taaaaaaacc 3840 tataaatatt ccggattatt cataccgtcc caccatcggg cgcggatccc ggtccgaagc 3900 gcgcggaatt caaaggccta cgtcgacgag ctcactagta acggccgcca gtgtgctgga 3960 attcgccctt cgcggatcct gttaagatgg cggggttcta cgagattgtg attaaggtcc 4020 ccagcgacct tgacgagcat ctgcccggca tttctgacag ctttgtgaac tgggtggccg 4080 agaaggaatg ggagttgccg ccagattctg acatggatct gaatctgatt gagcaggcac 4140 ccctgaccgt ggccgagaag ctgcagcgcg actttctgac ggaatggcgc cgtgtgagta 4200 aggccccgga ggcccttttc tttgtgcaat ttgagaaggg agagagctac ttccacatgc 4260 acgtgctcgt ggaaaccacc ggggtgaaat ccatggtttt gggacgtttc ctgagtcaga 4320 ttcgcgaaaa actgattcag agaatttacc gcgggatcga gccgactttg ccaaactggt 4380 tcgcggtcac aaagaccaga aatggcgccg gaggcgggaa caaggtggtg gatgagtgct 4440 acatccccaa ttacttgctc cccaaaaccc agcctgagct ccagtgggcg tggactaata 4500 tggaacagta tttaagcgcc tgtttgaatc tcacggagcg taaacggttg gtggcgcagc 4560 atctgacgca cgtgtcgcag acgcaggagc agaacaaaga gaatcagaat cccaattctg 4620 atgcgccggt gatcagatca aaaacttcag ccaggtacat ggagctggtc gggtggctcg 4680 tggacaaggg gattacctcg gagaagcagt ggatccagga ggaccaggcc tcatacatct 4740 ccttcaatgc ggcctccaac tcgcggtccc aaatcaaggc tgccttggac aatgcgggaa 4800 agattatgag cctgactaaa accgcccccg actacctggt gggccagcag cccgtggagg 4860 acatttccag caatcggatt tataaaattt tggaactaaa cgggtacgat ccccaatatg 4920 cggcttccgt ctttctggga tgggccacga aaaagttcgg caagaggaac accatctggc 4980 tgtttgggcc tgcaactacc gggaagacca acatcgcgga ggccatagcc cacactgtgc 5040 ccttctacgg gtgcgtaaac tggaccaatg agaactttcc cttcaacgac tgtgtcgaca 5100 agatggtgat ctggtgggag gaggggaaga tgaccgccaa ggtcgtggag tcggccaaag 5160 ccattctcgg aggaagcaag gtgcgcgtgg accagaaatg caagtcctcg gcccagatag 5220 acccgactcc cgtgatcgtc acctccaaca ccaacatgtg cgccgtgatt gacgggaact 5280 caacgacctt cgaacaccag cagccgttgc aagaccggat gttcaaattt gaactcaccc 5340 gccgtctgga tcatgacttt gggaaggtca ccaagcagga agtcaaagac tttttccggt 5400 gggcaaagga tcacgtggtt gaggtggagc atgaattcta cgtcaaaaag ggtggagcca 5460 agaaaagacc cgcccccagt gacgcagata taagtgagcc caaacgggtg cgcgagtcag 5520 ttgcgcagcc atcgacgtca gacgcggaag cttcgatcaa ctacgcagac aggtaccaaa 5580 acaaatgttc tcgtcacgtg ggcatgaatc tgatgctgtt tccctgcaga caatgcgaga 5640 gaatgaatca gaattcaaat atctgcttca ctcacggaca gaaagactgt ttagagtgct 5700 ttcccgtgtc agaatctcaa cccgtttctg tcgtcaaaaa ggcgtatcag aaactgtgct 5760 acattcatca tatcatggga aaggtgccag acgcttgcac tgcctgcgat ctggtcaatg 5820 tggatttgga tgactgcatc tttgaacaat aaatgattta aatcaggtat ggctgccgat 5880 ggttatcttc cagattggct cgaggacact ctctctgatg aagagtaact aagggcgaat 5940 tccagcacac tggcggccgt tactaggtag ctgagcgggc cgctttcgaa tctagagcct 6000 gcagtctcga caagcttgtc gagaagtact agaggatcat aatcagccat accacatttg 6060 tagaggtttt acttgcttta aaaaacctcc cacacctccc cctgaacctg aaacataaaa 6120 tgaatgcaat tgttgttgtt aacttgttta ttgcagctta taatggttac aaataaagca 6180 atagcatcac aaatttcaca aataaagcat ttttttcact gcattctagt tgtggtttgt 6240 ccaaactcat caatgtatct tatcatgtct ggatcggtct caccatgcgt acagcttgac 6300 gcgtgcgtaa taacttcgta taatgtatgc tatacgaagt tatactgggc ctcatgggcc 6360 ttccgctcac tgcccgcttt ccagtcggga aacctgtcgt gccagctgca ttaacatggt 6420 catagctgtt tccttgcgta ttgggcgctc tccgcttcct cgctcactga ctcgctgcgc 6480 tcggtcgttc gggtaaagcc tggggtgcct aatgagcaaa aggccagcaa aaggccagga 6540 accgtaaaaa ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc 6600 acaaaaatcg acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg 6660 cgtttccccc tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat 6720 acctgtccgc ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt 6780 atctcagttc ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc 6840 agcccgaccg ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg 6900 acttatcgcc actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg 6960 gtgctacaga gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg 7020 gtatctgcgc tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg 7080 gcaaacaaac caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca 7140 gaaaaaaagg atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga 7200 acgaaaactc acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga 7260 tccttttaaa ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt 7320 ctgacagtta ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt 7380 catccatagt tgcctgactc cccgtcgtgt agataactac gatacgggag ggcttaccat 7440 ctggccccag tgctgcaatg ataccgcgag aaccacgctc accggctcca gatttatcag 7500 caataaacca gccagccgga agggccgagc gcagaagtgg tcctgcaact ttatccgcct 7560 ccatccagtc tattaattgt tgccgggaag ctagagtaag tagttcgcca gttaatagtt 7620 tgcgcaacgt tgttgccatt gctacaggca tcgtggtgtc acgctcgtcg tttggtatgg 7680 cttcattcag ctccggttcc caacgatcaa ggcgagttac atgatccccc atgttgtgca 7740 aaaaagcggt tagctccttc ggtcctccga tcgttgtcag aagtaagttg gccgcagtgt 7800 tatcactcat ggttatggca gcactgcata attctcttac tgtcatgcca tccgtaagat 7860 gcttttctgt gactggtgag tactcaacca agtcattctg agaatagtgt atgcggcgac 7920 cgagttgctc ttgcccggcg tcaatacggg ataataccgc gccacatagc agaactttaa 7980 aagtgctcat cattggaaaa cgttcttcgg ggcgaaaact ctcaaggatc ttaccgctgt 8040 tgagatccag ttcgatgtaa cccactcgtg cacccaactg atcttcagca tcttttactt 8100 tcaccagcgt ttctgggtga gcaaaaacag gaaggcaaaa tgccgcaaaa aagggaataa 8160 gggcgacacg gaaatgttga atactcatac tcttcctttt tcaatattat tgaagcattt 8220 atcagggtta ttgtctcatg agcggataca tatttgaatg tatttagaaa aataaacaaa 8280 taggggttcc gcgcacattt ccccgaaaag tgccac 8316 <210> 17 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> ATG - AAV2 Rep78/52 <400> 17 atggcggggt tctacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataa 1866 <210> 18 <211> 1866 <212> DNA <213> Artificial Sequence <220> <223> ACG - AAV2 Rep78/52 <400> 18 acggcggggt tctacgagat tgtgattaag gtccccagcg accttgacga gcatctgccc 60 ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt gccgccagat 120 tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga gaagctgcag 180 cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct tttctttgtg 240 caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac caccggggtg 300 aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat tcagagaatt 360 taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac cagaaatggc 420 gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt gctccccaaa 480 acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag cgcctgtttg 540 aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc gcagacgcag 600 gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag atcaaaaact 660 tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac ctcggagaag 720 cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc caactcgcgg 780 tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac taaaaccgcc 840 cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg gatttataaa 900 attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct gggatgggcc 960 acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac taccgggaag 1020 accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt aaactggacc 1080 aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg ggaggagggg 1140 aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag caaggtgcgc 1200 gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat cgtcacctcc 1260 aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca ccagcagccg 1320 ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga ctttgggaag 1380 gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt ggttgaggtg 1440 gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc cagtgacgca 1500 gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac gtcagacgcg 1560 gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca cgtgggcatg 1620 aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc aaatatctgc 1680 ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc tcaacccgtt 1740 tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat gggaaaggtg 1800 ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg catctttgaa 1860 caataa 1866 <210> 19 <211> 486 <212> DNA <213> Artificial Sequence <220> <223> Baculovirus hr4b <400> 19 gctttacgag tagaatttta cttgtaaaac acaatcaaga aatgatgtca tttttgtacg 60 tgattataaa catgtttaaa catggtacat tgaacttaat ttttgcaagt tgataaacat 120 gattaatgta cgactcattt gtttgtgcaa gttgataaac gtgattaata tatgactcat 180 atgtttgtgc aaaaatgatg tcatcgtaca aactcgcttt acgagtagaa ttctacttgt 240 aacgcatgat caagggatga tgtcatttgt ttttttaaaa ttcaactcgc tttacgagta 300 gaattctact tgtaaaacac aatcgaggga tgatgtcatt tgtagaatga tgtcatttgt 360 ttttcaaaac cgaactcgct ttacgagtag aattctactt gtaacgcaag atcggtggat 420 gatgtcattt taaaaatgat gtcatcgtac aaactcgctt tacgagtaga attctacgtg 480 taaaac 486 <210> 20 <211> 509 <212> DNA <213> Artificial Sequence <220> <223> Baculovirus hr5 <400> 20 gctttacgag tagaattcta cgcgtaaaac acaatcaagt atgagtcata atctgatgtc 60 atgttttgta cacggctcat aaccgaactg gctttacgag tagaattcta cttgtaatgc 120 acgatcagtg gatgatgtca tttgtttttc aaatcgagat gatgtcatgt tttgcacacg 180 gctcataaac tcgctttacg agtagaattc tacgtgtaac gcacgatcga ttgatgagtc 240 atttgttttg caatatgata tcatacaata tgactcattt gtttttcaaa accgaacttg 300 atttacgggt agaattctac ttgtaaagca caatcaaaaa gatgatgtca tttgtttttc 360 aaaactgaac tcgctttacg agtagaattc tacgtgtaaa acacaatcaa gaaatgatgt 420 catttgttat aaaaataaaa gctgatgtca tgttttgcac atggctcata actaaactcg 480 ctttacgggt agaattctac gcgtaaaac 509 <210> 21 <211> 906 <212> DNA <213> Artificial Sequence <220> <223> 39k promoter full-length <400> 21 aaggctgtct tgctgtgtgc ccgtcgcgcg taccggagcg cgaacgcgcc cgccgccgac 60 ataaacgaca cttttctaga aaaaatttcc ataccacgag gtcatcgcga ttgttgcgac 120 gcaaaagttt acgaaactgc cgtgcgcgag tttgtggaag aaactggccg gttttttgac 180 agcgcgttca tctacaagtt tccatttacg ttacaatgga aagacgacgg tgtcacttac 240 aagtatttga tatacgtagg cgtcgtgcgc ggcaacttga ttgacgtgaa cgccaaaccc 300 aacacgtaca ccgtgaagtt gttgccgggc acgtttggca acgactatcg tataatgtta 360 aaaccgcgac gcttcaattg cgaaataacg cgcagcctgg ccatcgtgcc gctcaacaaa 420 tattttaatt atatgaacga caaacaattg atcacgtacg attacagcaa ttacattgaa 480 ttttttagtt ttgtgcgcag catcaagaag cgtttcgata ataggcaatt gcaagacttt 540 ttctacgcca ctctaaaaaa gatagacaac aacgatgccc cccaaaaatt gcacgcactt 600 aggcgggtgt aattcggact gcttgacccg aagcgaaata caagcgctgt tcagggaagc 660 catcaacacg ctcaagcaca caatgaatac agaagacgtc tgcgcgcaca tgttggacat 720 cgtgtcgttt gagcgtataa aagaatatat aagagctaat ttaggccatt tcacagtaat 780 taccgacaaa tgttctaagc gtaaggtgtg tcttcatcac aaacgaattg ccaggctgtt 840 gggcattaaa aaaatatatc atcaagaata caagcgggtc gtttcaaagg tttacaaaaa 900 tcaaac 906 <210> 22 <211> 213 <212> DNA <213> Artificial Sequence <220> <223> p10 promoter <400> 22 tacggacctt taattcaacc caacacaata tattatagtt aaataagaat tattatcaaa 60 tcatttgtat attaattaaa atactatact gtaaattaca ttttatttac aatcactcga 120 cgaagacttg atcaccccta gattcgaaag cggcccgctc actagtaacg gccgccagtg 180 tgctggaatt cgcccttcgc ggatcctgtt aag 213 <210> 23 <211> 184 <212> DNA <213> Artificial Sequence <220> <223> p6.9 promoter <400> 23 agttcaacat tgaggattac aataacatat ttaaggtgat ggaaaatatt aggaaacaca 60 gcaacaaaaa ttcaaacgac caagacgagt taaacatata tttgggagtt cagtcgtcga 120 atgcaaagcg taaaaaatat taataaggta aaaattacag ctacataaat tacacaattt 180 aaac 184 <210> 24 <211> 117 <212> DNA <213> Artificial Sequence <220> <223> pSel120 promoter <400> 24 tgttcaataa tcaataaacc tctctattat gctttgtaaa ttttttattt actttgttgt 60 ccattgctga tgatttatta agtcttttgg caaaaattaa atttttgcta caatata 117 <210> 25 <211> 129 <212> DNA <213> Artificial Sequence <220> <223> polH promoter <400> 25 atcatggaga taattaaaat gataaccatc tcgcaaataa ataagtattt tactgttttc 60 gtaacagttt tgtaataaaa aaacctataa atattccgga ttattcatac cgtcccacca 120 tcgggcgcg 129 <210> 26 <211> 457 <212> DNA <213> Artificial Sequence <220> <223> Baculovirus hr1 <400> 26 gttttacaag tagaattcta cccgtaaagc gagtttagtt ttgaaaaaca aatgacatca 60 tttgtataat gacatcatcc cctgattgtg ttttacaagt agaattctat ccgtaaagcg 120 agttcagttt tgaaaacaaa tgagtcatac ctaaacacgt taataatctt ctgatatcag 180 cttatgactc aagttatgag ccgtgtgcaa aacatgagat aagtttatga catcatccac 240 tgatcgtgcg ttacaagtag aattctactc gtaaagccag ttcggttatg agccgtgtgc 300 aaaacatgac atcagcttat gactcatact tgattgtgtt ttacgcgtag aattctactc 360 gtaaagcgag ttcggttatg agccgtgtgc aaaacatgac atcagcttat gagtcataat 420 taatcgtgcg ttacaagtag aattctactc gtaaagc 457 <210> 27 <211> 666 <212> DNA <213> Artificial Sequence <220> <223> Baculovirus hr3 <400> 27 gatttacgcg tagaattcta cttgtaaagc aagttaaaat aagccgtgtg caaaaatgac 60 atcagacaaa tgacatcatc tacctatcat gatcatgtta ataatcatgt tttaaaatga 120 catcagctta tgactaataa ttgatcgtgc gttacaagta gaattctact cgtaaagcga 180 gtttagtttt gaaaaacaaa tgagtcatca ttaaacatgt taataatcgt gtataaagga 240 tgacatcatc cactaatcgt gcgttacaag tagaattcta ctcgtaaagc gagttcggtt 300 ttgaaaaaca aatgacatca tttcttgatt gtgttttaca cgtagaattc tactcgtaaa 360 gtatgttcag tttaaaaaac aaatgacatc attttacaga tgacatcatt tcttgattat 420 gttttacaag tagaattcta ctcgtaaagc aagtttagtt ttaaaaaaca aatgacatca 480 tctcttgatt atgttttaca agtagaattc tactcgtaaa gcgagtttag ttttgaaaaa 540 caaatgacat catctcttga ttatgtttta caagtagaat tctactcgta aagcgagttt 600 agttttcaaa aacaaatgac atcatccctt gatcatgcgt tacaagtaga attctactcg 660 taaagc 666 <210> 28 <211> 806 <212> DNA <213> Artificial Sequence <220> <223> Synthetic hr134b5 <400> 28 gatttacgcg tagaattcta cttgtaaagc aagttaaaat aagccgtgtg caaaaatgac 60 atcagacaaa tgacatcatc tacctatcat gatcatgtta ataatcatgt tttaaaatga 120 catcagctta tgactaataa ttgatcgtgc gttacaagta gaattctacg cgtaaaacac 180 aatcaagtat gagtcataat ctgatgtcat gttttgtaca cggctcataa ccgaactggc 240 tttacgagta gaattctact tgtaatgcac gatcagtgga tgatgtcatt tgtttttcaa 300 atcgagatga tgtcatgttt atgacatcat ccactaatcg tgcgttacaa gtagaattct 360 actcgtaaag cgagttcggt tttgaaaaac aaatgacatc atacctaaac acgttaataa 420 tcttctgata tcagcttatg actcaagtta tgagccgtgt gcaaaacatg agataagttt 480 atgacatcat ccactgatcg tgcgttacaa gtagaattct actcgtaaag ccagttcggt 540 tatgagccgt gtgcaaaaca tgacatcagc ttatgactca tacttgattg tgttttacgc 600 gtagaattct actcgtaaag cgagttcggt tatgatgtca tttgttataa aaataaaagc 660 tgatgtcatg ttttgcacat ggctcataac taaactcgct ttacgggtag aattctactt 720 gtaacgcaag atcggtggat gatgtcattt taaaaatgat gtcatcgtac aaactcgctt 780 tacgagtaga attctacgtg taaaac 806 <210> 29 <211> 14265 <212> DNA <213> Artificial Sequence <220> <223> polH Cap2/5 nano-luciferase <400> 29 tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg 60 agcgcagcga gtcagtgagc gaggaagcgg aagagcgccc aatacgcaaa ccgcctctcc 120 ccgcgcgttg gccgattcat taatgcaggc tgcagggggg gggggggggg gggggggggg 180 ccactccctc tctgcgcgct cgctcgctca ctgaggccgc ccgggcaaag cccgggcgtc 240 gggcgacctt tggtcgcccg gcctcagtga gcgagcgagc gcgcagagag ggagtggcca 300 actccatcac taggggttcc tcagatcttc ggtcgacgga tccttatcga ttttaccaca 360 tttgtagagg ttttacttgc tttaaaaaac ctcccacacc tccccctgaa cctgaaacat 420 aaaatgaatg caattgttgt tgttaacttg tttattgcag cttataatgg ttacaaataa 480 agcaatagca tcacaaattt cacaaataaa gcattttttt cactgcattc tagttgtggt 540 ttgtccaaac tcatcaatgt atcttatcat gtctgctcga agcggccggc cgccccgact 600 ctagaattac gccagaatgc gttcgcacag ccgccagccg gtcactccgt tgatggttac 660 tcggaacagc agggagccgt cggggttgat caggcgctcg tcgataattt tgttgccgtt 720 ccacagggtc cctgttacag tgatcttttt gccgtcgaac acggcgatgc cttcatacgg 780 ccgtccgaaa tagtcgatca tgttcggcgt aaccccgtcg attaccagtg tgccatagtg 840 caggatcacc ttaaagtgat gatcatccac agggtacacc accttaaaaa ttttttcgat 900 ctggcccatt tggtcgccgc tcagaccttc atacgggatg atgacatgga tgtcgatctt 960 cagcccattt tcaccgctca ggacaatcct ttggatcgga gttacggaca ccccgagatt 1020 ctgaaacaaa ctggacacac ctccctgttc aaggacttgg tccaggttgt agccggctgt 1080 ctgtcgccag tccccaacga aatcttcgag tgtgaagact ggggcaggga aggcagcagg 1140 caacaccagg agcaggccca gggagaaggc aactggaccg aaggcgcttg tggagaagga 1200 gttcatggtg gctttaccaa cagtaccgga ttgccaagct tggccgccga ggcccactga 1260 ctgcgttagc aatttaactg tgataaacta ccgcaataaa gcttctagtg atctgacggt 1320 tcactaaacg agctctgctt atatagacct cccaccgtac acgcctaccg cccatttgcg 1380 tcaacggggc ggggttatta cgacattttg gaaagtcccg ttgattttgg tgccaaaaca 1440 aactcccatt gacgtcaatg gggtggagac ttggaaatcc ccgtgagtca aaccgctatc 1500 cacgcccatt ggtgtactgc caaaaccgca tcaccatggt aatagcgatg actaatacgt 1560 agatgtactg ccaagtagga aagtcccgta aggtcatgta ctgggcataa tgccaggcgg 1620 gccatttacc gtcattgacg tcaatagggg gcggacttgg catatgatac acttgatgta 1680 ctgccaagtg ggcagtttac cgtaaatact ccacccattg acgtcaatgg aaagtcccta 1740 ttggcgttac tatgggaaca tacgtcatta ttgacgtcaa tgggcggggg tcgttgggcg 1800 gtcagccagg cgggccattt accgtaagtt atgtaacgcg gaactccata tatgggctat 1860 gaactaatga ccccgtaatt gattactatt aataactagt caataatcaa tgccaacatg 1920 gcggtcatat tggacatgag ccaatataaa tgtacatatt atgatataga tacaacgtat 1980 gcaatggcca atagccaata ttgatttatg ctatataacc aatgaataat atggctaatg 2040 gccaatattg aggccagtta gatctgagga acccctagtg atggagttgg ccactccctc 2100 tctgcgcgct cgctcgctca ctgaggccgg gcgaccaaag gtcgcccgac gcccgggctt 2160 tgcccgggcg gcctcagtga gcgagcgagc gcgcagagag ggagtggccc cccccccccc 2220 cccccctgca gcctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt 2280 gcgcagcctg aatggcgaat ggacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg 2340 gtggttacgc gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct 2400 ttcttccctt cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg 2460 ctccctttag ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag 2520 ggtgatggtt cacgtagtgt gtaatgagac gcacaaacta atatcacaaa ctggaaatgt 2580 ctatcaatat atagttgctg atctatgcat cagctgctag tactccggaa tattaataga 2640 tcatggagat aattaaaatg ataaccatct cgcaaataaa taagtatttt actgttttcg 2700 taacagtttt gtaataaaaa aacctataaa tattccggat tattcatacc gtcccaccat 2760 cgggcgcgga tcgtaccggg cccaagcttc ctgttaagac ggctgccgac ggttatctac 2820 ccgattggtt ggaggacact ctctctgaag gaataagaca gtggtggaag ctcaaacctg 2880 gcccaccacc accaaagccc gcagagcggc ataaggacga cagcaggggt cttgtgcttc 2940 ctgggtacaa gtacctcgga cccttcaacg gactcgacaa gggagagccg gtcaacgagg 3000 cagacgccgc ggccctcgag cacgacaaag cctacgaccg gcagctcgac agcggagaca 3060 acccgtacct caagtacaac cacgccgacg cggagtttca ggagcgcctt aaagaagata 3120 cgtcttttgg gggcaacctc ggacgagcag tcttccaggc gaaaaagagg gttcttgaac 3180 ctctgggcct ggttgaggaa cctgttaaga cggcccctac cggaaagcgg atagacgacc 3240 actttccaaa aagaaagaag gctcggaccg aagaggactc caagccttcc acctcgtcag 3300 acgccgaagc tggacccagc ggatcccagc agctgcaaat cccagcccaa ccagcctcaa 3360 gtttgggagc tgatacaatg tctgcgggag gtggcggccc attgggcgac aataaccaag 3420 gtgccgatgg agtgggcaat gcctcgggag attggcattg cgattccacg tggatggggg 3480 acagagtcgt caccaagtcc acccgaacct gggtgctgcc cagctacaac aaccaccagt 3540 accgagagat caaaagcggc tccgtcgacg gaagcaacgc caacgcctac tttggataca 3600 gcaccccctg ggggtacttt gactttaacc gcttccacag ccactggagc ccccgagact 3660 ggcaaagact catcaacaac tactggggct tcagaccccg gtccctcaga gtcaaaatct 3720 tcaacattca agtcaaagag gtcacggtgc aggactccac caccaccatc gccaacaacc 3780 tcacctccac cgtccaagtg tttacggacg acgactacca gctgccctac gtcgtcggca 3840 acgggaccga gggatgcctg ccggccttcc ctccgcaggt ctttacgctg ccgcagtacg 3900 gttacgcgac gctgaaccgc gacaacacag aaaatcccac cgagaggagc agcttcttct 3960 gcctagagta ctttcccagc aagatgctga gaacgggcaa caactttgag tttacctaca 4020 actttgagga ggtgcccttc cactccagct tcgctcccag tcagaacctg ttcaagctgg 4080 ccaacccgct ggtggaccag tacttgtacc gcttcgtgag cacaaataac actggcggag 4140 tccagttcaa caagaacctg gccgggagat acgccaacac ctacaaaaac tggttcccgg 4200 ggcccatggg ccgaacccag ggctggaacc tgggctccgg ggtcaaccgc gccagtgtca 4260 gcgccttcgc cacgaccaat aggatggagc tcgagggcgc gagttaccag gtgcccccgc 4320 agccgaacgg catgaccaac aacctccagg gcagcaacac ctatgccctg gagaacacta 4380 tgatcttcaa cagccagccg gcgaacccgg gcaccaccgc cacgtacctc gagggcaaca 4440 tgctcatcac cagcgagagc gagacgcagc cggtgaaccg cgtggcgtac aacgtcggcg 4500 ggcagatggc caccaacaac cagagctcca ccactgcccc cgcgaccggc acgtacaacc 4560 tccaggaaat cgtgcccggc agcgtgtgga tggagaggga cgtgtacctc caaggaccca 4620 tctgggccaa gatcccagag acgggggcgc actttcaccc ctctccggcc atgggcggat 4680 tcggactcaa acacccaccg cccatgatgc tcatcaagaa cacgcctgtg cccggaaata 4740 tcaccagctt ctcggacgtg cccgtcagca gcttcatcac ccagtacagc accgggcagg 4800 tcaccgtgga gatggagtgg gagctcaaga aggaaaactc caagaggtgg aacccagaga 4860 tccagtacac aaacaactac aacgaccccc agtttgtgga ctttgccccg gacagcaccg 4920 gggaatacag aaccaccaga cctatcggaa cccgatacct tacccgaccc ctttaaagga 4980 tcataatcag ccataccaca tttgtagagg ttttacttgc tttaaaaaac ctcccacacc 5040 tccccctgaa cctgaaacat aaaatgaatg caattgttgt tgttaacttg tttattgcag 5100 cttataatgg ttacaaataa agcaatagca tcacaaattt cacaaataaa gcattttttt 5160 cactgcattc tagttgtggt ttgtccaaac tcatcaatgt atcttatcat gtctggatcc 5220 acgtagtggg ccatcgccct gatagacggt ttttcgccct ttgacgttaa ttaattaagt 5280 accgactctg ctgaagagga ggaaattctc cttgaagttt ccctggtgtt caaagtaaag 5340 gagtttgcac cagacgcacc tctgttcact ggtccggcgt attaaaacac gatacattgt 5400 tattagtaca tttattaagc gctagattct gtgcgttgtt gatttacaga caattgttgt 5460 acgtatttta ataattcatt aaatttataa tctttagggt ggtatgttag agcgaaaatc 5520 aaatgatttt cagcgtcttt atatctgaat ttaaatatta aatcctcaat agatttgtaa 5580 aataggtttc gattagtttc aaacaagggt tgtttttccg aaccgatggc tggactatct 5640 aatggatttt cgctcaacgc cacaaaactt gccaaatctt gtagcagcaa tctagctttg 5700 tcgatattcg tttgtgtttt gttttgtaat aaaggttcga cgtcgttcaa aatattatgc 5760 gcttttgtat ttctttcatc actgtcgtta gtgtacaatt gactcgacgt aaacacgtta 5820 aataaagctt ggacatattt aacatcgggc gtgttagctt tattaggccg attatcgtcg 5880 tcgtcccaac cctcgtcgtt agaagttgct tccgaagacg attttgccat agccacacga 5940 cgcctattaa ttgtgtcggc taacacgtcc gcgatcaaat ttgtagttga gctttttgga 6000 attatttctg attgcgggcg tttttgggcg ggtttcaatc taactgtgcc cgattttaat 6060 tcagacaaca cgttagaaag cgatggtgca ggcggtggta acatttcaga cggcaaatct 6120 actaatggcg gcggtggtgg agctgatgat aaatctacca tcggtggagg cgcaggcggg 6180 gctggcggcg gaggcggagg cggaggtggt ggcggtgatg cagacggcgg tttaggctca 6240 aatgtctctt taggcaacac agtcggcacc tcaactattg tactggtttc gggcgccgtt 6300 tttggtttga ccggtctgag acgagtgcga tttttttcgt ttctaatagc ttccaacaat 6360 tgttgtctgt cgtctaaagg tgcagcgggt tgaggttccg tcggcattgg tggagcgggc 6420 ggcaattcag acatcgatgg tggtggtggt ggtggaggcg ctggaatgtt aggcacggga 6480 gaaggtggtg gcggcggtgc cgccggtata atttgttctg gtttagtttg ttcgcgcacg 6540 attgtgggca ccggcgcagg cgccgctggc tgcacaacgg aaggtcgtct gcttcgaggc 6600 agcgcttggg gtggtggcaa ttcaatatta taattggaat acaaatcgta aaaatctgct 6660 ataagcattg taatttcgct atcgtttacc gtgccgatat ttaacaaccg ctcaatgtaa 6720 gcaattgtat tgtaaagaga ttgtctcaag ctcggatccc gcacgccgat aacaagcctt 6780 ttcattttta ctacagcatt gtagtggcga gacacttcgc tgtcgtcgac gtacatgtat 6840 gctttgttgt caaaaacgtc gttggcaagc tttaaaatat ttaaaagaac atctctgttc 6900 agcaccactg tgttgtcgta aatgttgttt ttgataattt gcgcttccgc agtatcgaca 6960 cgttcaaaaa attgatgcgc atcaattttg ttgttcctat tattgaataa ataagattgt 7020 acagattcat atctacgatt cgtcatggcc accacaaatg ctacgctgca aacgctggta 7080 caattttacg aaaactgcaa aaacgtcaaa actcggtata aaataatcaa cgggcgcttt 7140 ggcaaaatat ctattttatc gcacaagccc actagcaaat tgtatttgca gaaaacaatt 7200 tcggcgcaca attttaacgc tgacgaaata aaagttcacc agttaatgag cgaccaccca 7260 aattttataa aaatctattt taatcacggt tccatcaaca accaagtgat cgtgatggac 7320 tacattgact gtcccgattt atttgaaaca ctacaaatta aaggcgagct ttcgtaccaa 7380 cttgttagca atattattag acagctgtgt gaagcgctca acgatttgca caagcacaat 7440 ttcatacaca acgacataaa actcgaaaat gtcttatatt tcgaagcact tgatcgcgtg 7500 tatgtttgcg attacggatt gtgcaaacac gaaaactcac ttagcgtgca cgacggcacg 7560 ttggagtatt ttagtccgga aaaaattcga cacacaacta tgcacgtttc gtttgactgg 7620 tacgccgtcg aattcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt 7680 tacccaactt aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga 7740 ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcgcctgat 7800 gcggtatttt ctccttacgc atctgtgcgg tatttcacac cgcatatggt gcactctcag 7860 tacaatctgc tctgatgccg catagttaag ccagccccga cacccgccaa cacccgctga 7920 cgcgccctga cgggcttgtc tgctcccggc atccgcttac agacaagctg tgaccgtctc 7980 cgggagctgc atgtgtcaga ggttttcacc gtcatcaccg aaacgcgcga gacgaaaggg 8040 cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt cttagacgtc 8100 aggtggcact tttcggggaa atgtgcgcgg aacccctatt tgtttatttt tctaaataca 8160 ttcaaatatg tatccgctca tgagacaata accctgataa atgcttcaat aatattgaaa 8220 aaggaagagt atgagtattc aacatttccg tgtcgccctt attccctttt ttgcggcatt 8280 ttgccttcct gtttttgctc acccagaaac gctggtgaaa gtaaaagatg ctgaagatca 8340 gttgggtgca cgagtgggtt acatcgaact ggatctcaac agcggtaaga tccttgagag 8400 ttttcgcccc gaagaacgtt ttccaatgat gagcactttt aaagttctgc tatgtggcgc 8460 ggtattatcc cgtattgacg ccgggcaaga gcaactcggt cgccgcatac actattctca 8520 gaatgacttg gttgagtact caccagtcac agaaaagcat cttacggatg gcatgacagt 8580 aagagaatta tgcagtgctg ccataaccat gagtgataac actgcggcca acttacttct 8640 gacaacgatc ggaggaccga aggagctaac cgcttttttg cacaacatgg gggatcatgt 8700 aactcgcctt gatcgttggg aaccggagct gaatgaagcc ataccaaacg acgagcgtga 8760 caccacgatg cctgtagcaa tggcaacaac gttgcgcaaa ctattaactg gcgaactact 8820 tactctagct tcccggcaac aattaataga ctggatggag gcggataaag ttgcaggacc 8880 acttctgcgc tcggcccttc cggctggctg gtttattgct gataaatctg gagccggtga 8940 gcgtgggtct cgcggtatca ttgcagcact ggggccagat ggtaagccct cccgtatcgt 9000 agttatctac acgacgggga gtcaggcaac tatggatgaa cgaaatagac agatcgctga 9060 gataggtgcc tcactgatta agcattggta actgtcagac caagtttact catatatact 9120 ttagattgat ttaaaacttc atttttaatt taaaaggatc taggtgaaga tcctttttga 9180 taatctcatg accaaaatcc cttaacgtga gttttcgttc cactgagcgt cagaccccgt 9240 agaaaagatc aaaggatctt cttgagatcc tttttttctg cgcgtaatct gctgcttgca 9300 aacaaaaaaa ccaccgctac cagcggtggt ttgtttgccg gatcaagagc taccaactct 9360 ttttccgaag gtaactggct tcagcagagc gcagatacca aatactgttc ttctagtgta 9420 gccgtagtta ggccaccact tcaagaactc tgtagcaccg cctacatacc tcgctctgct 9480 aatcctgtta ccagtggctg ctgccagtgg cgataagtcg tgtcttaccg ggttggactc 9540 aagacgatag ttaccggata aggcgcagcg gtcgggctga acggggggtt cgtgcacaca 9600 gcccagcttg gagcgaacga cctacaccga actgagatac ctacagcgtg agctatgaga 9660 aagcgccacg cttcccgaag ggagaaaggc ggacaggtat ccggtaagcg gcagggtcgg 9720 aacaggagag cgcacgaggg agcttccagg gggaaacgcc tggtatcttt atagtcctgt 9780 cgggtttcgc cacctctgac ttgagcgtcg atttttgtga tgctcgtcag gggggcggag 9840 cctatggaaa aacgccagca acgcggcctt tttacggttc ctggcctttt gctggccttt 9900 tgctcacatg ttctttcctg cgttatcccc tgattctgtg gataaccgta ttaccgcctt 9960 tgagtgagct gataccgctc gccgcagccg aacgaccgag cgcagcgagt cagtgagcga 10020 ggaagcggaa gagcgcccaa tacgcaaacc gcctctcccc gcgcgttggc cgattcatta 10080 atgcagctgg cacgacaggt ttcccgactg gaaagcgggc agtgagcgca acgcaattaa 10140 tgtgagttag ctcactcatt aggcacccca ggctttacac tttatgcttc cggctcgtat 10200 gttgtgtgga attgtgagcg gataacaatt tcacacagga aacagctatg accatgatta 10260 cgccaagctt gcatgcctgc aggtcgactc tagaccgagt tgtttgcgta cgtgactagc 10320 gaagaagatg tgtggaccgc agaacagata gtaaaacaaa accctagtat tggagcaata 10380 atcgatttaa ccaacacgtc taaatattat gatggtgtgc attttttgcg ggcgggcctg 10440 ttatacaaaa aaattcaagt acctggccag actttgccgc ctgaaagcat agttcaagaa 10500 tttattgaca cggtaaaaga atttacagaa aagtgtcccg gcatgttggt gggcgtgcac 10560 tgcacacacg gtattaatcg caccggttac atggtgtgca gatatttaat gcacaccctg 10620 ggtattgcgc cgcaggaagc catagataga ttcgaaaaag ccagaggtca caaaattgaa 10680 agacaaaatt acgttcaaga tttattaatt taattaatat tatttgcatt ctttaacaaa 10740 tactttatcc tattttcaaa ttgttgcgct tcttccagcg aaccaaaact atgcttcgct 10800 tgctccgttt agcttgtagc cgatcagtgg cgttgttcca atcgacggta ggattaggcc 10860 ggatattctc caccacaatg ttggcaacgt tgatgttacg tttatgcttt tggttttcca 10920 cgtacgtctt ttggccggta atagccgtaa acgtagtgcc gtcgcgcgtc acgcacaaca 10980 ccggatgttt gcgcttgtcc gcggggtatt gaaccgcgcg atccgacaaa tccaccactt 11040 tggcaactaa atcggtgacc tgcgcgtctt ttttctgcat tatttcgtct ttcttttgca 11100 tggtttcctg gaagccggtg tacatgcggt ttagatcagt catgacgcgc gtgacctgca 11160 aatctttggc ctcgatctgc ttgtccttga tggcaacgat gcgttcaata aactcttgtt 11220 ttttaacaag ttcctcggtt ttttgcgcca ccaccgcttg cagcgcgttt gtgtgctcgg 11280 tgaatgtcgc aatcagctta gtcaccaact gtttgctctc ctcctcccgt tgtttgatcg 11340 cgggatcgta cttgccggtg cagagcactt gaggaattac ttcttctaaa agccattctt 11400 gtaattctat ggcgtaaggc aatttggact tcataatcag ctgaatcacg ccggatttag 11460 taatgagcac tgtatgcggc tgcaaataca gcgggtcgcc ccttttcacg acgctgttag 11520 aggtagggcc cccattttgg atggtctgct caaataacga tttgtattta ttgtctacat 11580 gaacacgtat agctttatca caaactgtat attttaaact gttagcgacg tccttggcca 11640 cgaaccggac ctgttggtcg cgctctagca cgtaccgcag gttgaacgta tcttctccaa 11700 atttaaattc tccaatttta acgcgagcca ttttgataca cgtgtgtcga ttttgcaaca 11760 actattgttt tttaacgcaa actaaactta ttgtggtaag caataattaa atatggggga 11820 acatgcgccg ctacaacact cgtcgttatg aacgcagacg gcgccggtct cggcgcaagc 11880 ggctaaaacg tgttgcgcgt tcaacgcggc aaacatcgca aaagccaata gtacagtttt 11940 gatttgcata ttaacggcga ttttttaaat tatcttattt aataaatagt tatgacgcct 12000 acaactcccc gcccgcgttg actcgctgca cctcgagcag ttcgttgacg ccttcctccg 12060 tgtggccgaa cacgtcgagc gggtggtcga tgaccagcgg cgtgccgcac gcgacgcaca 12120 agtatctgta caccgaatga tcgtcgggcg aaggcacgtc ggcctccaag tggcaatatt 12180 ggcaaattcg aaaatatata cagttgggtt gtttgcgcat atctatcgtg gcgttgggca 12240 tgtacgtccg aacgttgatt tgcatgcaag ccgaaattaa atcattgcga ttagtgcgat 12300 taaaacgttg tacatcctcg cttttaatca tgccgtcgat taaatcgcgc aatcgagtca 12360 agtgatcaaa gtgtggaata atgttttctt tgtattcccg agtcaagcgc agcgcgtatt 12420 ttaacaaact agccatcttg taagttagtt tcatttaatg caactttatc caataatata 12480 ttatgtatcg cacgtcaaga attaacaatg cgcccgttgt cgcatctcaa cacgactatg 12540 atagagatca aataaagcgc gaattaaata gcttgcgacg caacgtgcac gatctgtgca 12600 cgcgttccgg cacgagcttt gattgtaata agtttttacg aagcgatgac atgacccccg 12660 tagtgacaac gatcacgccc aaaagaactg ccgactacaa aattaccgag tatgtcggtg 12720 acgttaaaac tattaagcca tccaatcgac cgttagtcga atcaggaccg ctggtgcgag 12780 aagccgcgaa gtatggcgaa tgcatcgtat aacgtgtgga gtccgctcat tagagcgtca 12840 tgtttagaca agaaagctac atatttaatt gatcccgatg attttattga taaattgacc 12900 ctaactccat acacggtatt ctacaatggc ggggttttgg tcaaaatttc cggactgcga 12960 ttgtacatgc tgttaacggc tccgcccact attaatgaaa ttaaaaattc caattttaaa 13020 aaacgcagca agagaaacat ttgtatgaaa gaatgcgtag aaggaaagaa aaatgtcgtc 13080 gacatgctga acaacaagat taatatgcct ccgtgtataa aaaaaatatt gaacgatttg 13140 aaagaaaaca atgtaccgcg cggcggtatg tacaggaaga ggtttatact aaactgttac 13200 attgcaaacg tggtttcgtg tgccaagtgt gaaaaccgat gtttaatcaa ggctctgacg 13260 catttctaca accacgactc caagtgtgtg ggtgaagtca tgcatctttt aatcaaatcc 13320 caagatgtgt ataaaccacc aaactgccaa aaaatgaaaa ctgtcgacaa gctctgtccg 13380 tttgctggca actgcaaggg tctcaatcct atttgtaatt attgaataat aaaacaatta 13440 taaatgctaa atttgttttt tattaacgat acaaaccaaa cgcaacaaga acatttgtag 13500 tattatctat aattgaaaac gcgtagttat aatcgctgag gtaatattta aaatcatttt 13560 caaatgattc acagttaatt tgcgacaata taattttatt ttcacataaa ctagacgcct 13620 tgtcgtcttc ttcttcgtat tccttctctt tttcattttt ctcctcataa aaattaacat 13680 agttattatc gtatccatat atgtatctat cgtatagagt aaattttttg ttgtcataaa 13740 tatatatgtc ttttttaatg gggtgtatag taccgctgcg catagttttt ctgtaattta 13800 caacagtgct attttctggt agttcttcgg agtgtgttgc tttaattatt aaatttatat 13860 aatcaatgaa tttgggatcg tcggttttgt acaatatgtt gccggcatag tacgcagctt 13920 cttctagttc aattacacca ttttttagca gcaccggatt aacataactt tccaaaatgt 13980 tgtacgaacc gttaaacaaa aacagttcac ctcccttttc tatactattg tctgcgagca 14040 gttgtttgtt gttaaaaata acagccattg taatgagacg cacaaactaa tatcacaaac 14100 tggaaatgtc tatcaatata tagttgctga tgcgtcgatt tttgtgatgc tcgtcagggg 14160 ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 14220 ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctg 14265 <210> 30 <211> 2178 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV2/5 <400> 30 acggctgccg acggttatct acccgattgg ttggaggaca ctctctctga aggaataaga 60 cagtggtgga agctcaaacc tggcccacca ccaccaaagc ccgcagagcg gcataaggac 120 gacagcaggg gtcttgtgct tcctgggtac aagtacctcg gacccttcaa cggactcgac 180 aagggagagc cggtcaacga ggcagacgcc gcggccctcg agcacgacaa agcctacgac 240 cggcagctcg acagcggaga caacccgtac ctcaagtaca accacgccga cgcggagttt 300 caggagcgcc ttaaagaaga tacgtctttt gggggcaacc tcggacgagc agtcttccag 360 gcgaaaaaga gggttcttga acctctgggc ctggttgagg aacctgttaa gacggcccct 420 accggaaagc ggatagacga ccactttcca aaaagaaaga aggctcggac cgaagaggac 480 tccaagcctt ccacctcgtc agacgccgaa gctggaccca gcggatccca gcagctgcaa 540 atcccagccc aaccagcctc aagtttggga gctgatacaa tgtctgcggg aggtggcggc 600 ccattgggcg acaataacca aggtgccgat ggagtgggca atgcctcggg agattggcat 660 tgcgattcca cgtggatggg ggacagagtc gtcaccaagt ccacccgaac ctgggtgctg 720 cccagctaca acaaccacca gtaccgagag atcaaaagcg gctccgtcga cggaagcaac 780 gccaacgcct actttggata cagcaccccc tgggggtact ttgactttaa ccgcttccac 840 agccactgga gcccccgaga ctggcaaaga ctcatcaaca actactgggg cttcagaccc 900 cggtccctca gagtcaaaat cttcaacatt caagtcaaag aggtcacggt gcaggactcc 960 accaccacca tcgccaacaa cctcacctcc accgtccaag tgtttacgga cgacgactac 1020 cagctgccct acgtcgtcgg caacgggacc gagggatgcc tgccggcctt ccctccgcag 1080 gtctttacgc tgccgcagta cggttacgcg acgctgaacc gcgacaacac agaaaatccc 1140 accgagagga gcagcttctt ctgcctagag tactttccca gcaagatgct gagaacgggc 1200 aacaactttg agtttaccta caactttgag gaggtgccct tccactccag cttcgctccc 1260 agtcagaacc tgttcaagct ggccaacccg ctggtggacc agtacttgta ccgcttcgtg 1320 agcacaaata acactggcgg agtccagttc aacaagaacc tggccgggag atacgccaac 1380 acctacaaaa actggttccc ggggcccatg ggccgaaccc agggctggaa cctgggctcc 1440 ggggtcaacc gcgccagtgt cagcgccttc gccacgacca ataggatgga gctcgagggc 1500 gcgagttacc aggtgccccc gcagccgaac ggcatgacca acaacctcca gggcagcaac 1560 acctatgccc tggagaacac tatgatcttc aacagccagc cggcgaaccc gggcaccacc 1620 gccacgtacc tcgagggcaa catgctcatc accagcgaga gcgagacgca gccggtgaac 1680 cgcgtggcgt acaacgtcgg cgggcagatg gccaccaaca accagagctc caccactgcc 1740 cccgcgaccg gcacgtacaa cctccaggaa atcgtgcccg gcagcgtgtg gatggagagg 1800 gacgtgtacc tccaaggacc catctgggcc aagatcccag agacgggggc gcactttcac 1860 ccctctccgg ccatgggcgg attcggactc aaacacccac cgcccatgat gctcatcaag 1920 aacacgcctg tgcccggaaa tatcaccagc ttctcggacg tgcccgtcag cagcttcatc 1980 acccagtaca gcaccgggca ggtcaccgtg gagatggagt gggagctcaa gaaggaaaac 2040 tccaagaggt ggaacccaga gatccagtac acaaacaact acaacgaccc ccagtttgtg 2100 gactttgccc cggacagcac cggggaatac agaaccacca gacctatcgg aacccgatac 2160 cttacccgac ccctttaa 2178 <210> 31 <211> 2178 <212> DNA <213> Artificial Sequence <220> <223> Cap AAV5 <400> 31 acggcttctt ttgttgatca cccacccgat tggttggaag aagttggtga aggtcttcgc 60 gagtttttgg gccttgaagc gggcccaccg aaaccaaaac ccaatcagca gcatcaagat 120 caagcccgtg gtcttgtgct gcctggttat aactatctcg gacccggaaa cggtctcgat 180 cgaggagagc ctgtcaacag ggcagacgag gtcgcgcgag agcacgacat ctcgtacaac 240 gagcagcttg aggcgggaga caacccctac ctcaagtaca accacgcgga cgccgagttt 300 caggagaagc tcgccgacga cacatccttc gggggaaacc tcggaaaggc agtctttcag 360 gccaagaaaa gggttctcga accttttggc ctggttgaag agggtgctaa gacggcccct 420 accggaaagc ggatagacga ccactttcca aaaagaaaga aggctcggac cgaagaggac 480 tccaagcctt ccacctcgtc agacgccgaa gctggaccca gcggatccca gcagctgcaa 540 atcccagccc aaccagcctc aagtttggga gctgatacaa tgtctgcggg aggtggcggc 600 ccattgggcg acaataacca aggtgccgat ggagtgggca atgcctcggg agattggcat 660 tgcgattcca cgtggatggg ggacagagtc gtcaccaagt ccacccgaac ctgggtgctg 720 cccagctaca acaaccacca gtaccgagag atcaaaagcg gctccgtcga cggaagcaac 780 gccaacgcct actttggata cagcaccccc tgggggtact ttgactttaa ccgcttccac 840 agccactgga gcccccgaga ctggcaaaga ctcatcaaca actactgggg cttcagaccc 900 cggtccctca gagtcaaaat cttcaacatt caagtcaaag aggtcacggt gcaggactcc 960 accaccacca tcgccaacaa cctcacctcc accgtccaag tgtttacgga cgacgactac 1020 cagctgccct acgtcgtcgg caacgggacc gagggatgcc tgccggcctt ccctccgcag 1080 gtctttacgc tgccgcagta cggttacgcg acgctgaacc gcgacaacac agaaaatccc 1140 accgagagga gcagcttctt ctgcctagag tactttccca gcaagatgct gagaacgggc 1200 aacaactttg agtttaccta caactttgag gaggtgccct tccactccag cttcgctccc 1260 agtcagaacc tcttcaagct ggccaacccg ctggtggacc agtacttgta ccgcttcgtg 1320 agcacaaata acactggcgg agtccagttc aacaagaacc tggccgggag atacgccaac 1380 acctacaaaa actggttccc ggggcccatg ggccgaaccc agggctggaa cctgggctcc 1440 ggggtcaacc gcgccagtgt cagcgccttc gccacgacca ataggatgga gctcgagggc 1500 gcgagttacc aggtgccccc gcagccgaac ggcatgacca acaacctcca gggcagcaac 1560 acctatgccc tggagaacac tatgatcttc aacagccagc cggcgaaccc gggcaccacc 1620 gccacgtacc tcgagggcaa catgctcatc accagcgaga gcgagacgca gccggtgaac 1680 cgcgtggcgt acaacgtcgg cgggcagatg gccaccaaca accagagctc caccactgcc 1740 cccgcgaccg gcacgtacaa cctccaggaa atcgtgcccg gcagcgtgtg gatggagagg 1800 gacgtgtacc tccaaggacc catctgggcc aagatcccag agacgggggc gcactttcac 1860 ccctctccgg ccatgggcgg attcggactc aaacacccac cgcccatgat gctcatcaag 1920 aacacgcctg tgcccggaaa tatcaccagc ttctcggacg tgcccgtcag cagcttcatc 1980 acccagtaca gcaccgggca ggtcaccgtg gagatggagt gggagctcaa gaaggaaaac 2040 tccaagaggt ggaacccaga gatccagtac acaaacaact acaacgaccc ccagtttgtg 2100 gactttgccc cggacagcac cggggaatac agaaccacca gacctatcgg aacccgatac 2160 cttacccgac ccctttaa 2178 <210> 32 <211> 28 <212> DNA <213> artificial <220> <223> hr 28-mer <400> 32 ctttacgagt agaattctac gcgtaaaa 28 <210> 33 <211> 1194 <212> DNA <213> Artificial Sequence <220> <223> Rep52 wt <400> 33 atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60 gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120 gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180 gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240 aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300 ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360 gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420 cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480 aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540 tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600 tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660 atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720 gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780 tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840 cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900 aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960 tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020 cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080 aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140 actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194 <210> 34 <211> 1194 <212> DNA <213> Artificial Sequence <220> <223> rep52 sf9 (insect cell) optimised <400> 34 atggagctgg tgggttggct ggtggacaag ggtatcacct ccgagaagca gtggatccag 60 gaggaccagg cttcctacat ctccttcaac gctgcttcca actcccgttc ccagatcaag 120 gctgctctgg acaacgctgg taagatcatg tccctgacca agaccgctcc tgactacctg 180 gtgggtcagc agcctgtgga ggacatctcc tccaaccgta tctacaagat cctggagctg 240 aacggttacg accctcagta cgctgcttcc gtgttcctgg gttgggctac caagaagttc 300 ggtaagcgta acaccatctg gctgttcggt cctgctacca ccggtaagac caacatcgct 360 gaggctatcg ctcacaccgt gcctttctac ggttgcgtga actggaccaa cgagaacttc 420 cctttcaacg actgcgtgga caagatggtg atctggtggg aggagggtaa gatgaccgct 480 aaggtggtgg agtccgctaa ggctatcctg ggtggttcca aggtgcgtgt ggaccagaag 540 tgcaagtcct ccgctcagat cgaccctacc cctgtgatcg tgacctccaa caccaacatg 600 tgcgctgtga tcgacggtaa ctccaccacc ttcgagcacc agcagcctct gcaggaccgt 660 atgttcaagt tcgagctgac ccgtcgtctg gaccacgact tcggtaaggt gaccaagcag 720 gaggtgaagg acttcttccg ttgggctaag gaccacgtgg tggaggtgga gcacgagttc 780 tacgtgaaga agggtggtgc taagaagcgt cctgctcctt ccgacgctga catctccgag 840 cctaagcgtg tgcgtgagtc cgtggctcag ccttccacct ccgacgctga ggcttccatc 900 aactacgctg accgttacca gaacaagtgc tcccgtcacg tgggtatgaa cctgatgctg 960 ttcccttgcc gtcagtgcga gcgtatgaac cagaactcca acatctgctt cacccacggt 1020 cagaaggact gcctggagtg cttccctgtg tccgagtccc agcctgtgtc cgtggtgaag 1080 aaggcttacc agaagctgtg ctacatccac cacatcatgg gtaaggtgcc tgacgcttgc 1140 accgcttgcg acctggtgaa cgtggacctg gacgactgca tcttcgagca gtaa 1194 <210> 35 <211> 1194 <212> DNA <213> Artificial Sequence <220> <223> rep52 AT optimised <400> 35 atggaattag taggatggtt agtagataaa ggaataacat cagaaaaaca atggatacaa 60 gaagatcaag catcatatat atcatttaat gcagcatcaa attcaagatc acaaataaaa 120 gcagcattag ataatgcagg aaaaataatg tcattaacaa aaacagcacc agattattta 180 gtaggacaac aaccagtaga agatatatca tcaaatagaa tatataaaat attagaatta 240 aatggatatg atccacaata tgcagcatca gtatttttag gatgggcaac aaaaaaattt 300 ggaaaaagaa atacaatatg gttatttgga ccagcaacaa caggaaaaac aaatatagca 360 gaagcaatag cacatacagt accattttat ggatgtgtaa attggacaaa tgaaaatttt 420 ccatttaatg attgtgtaga taaaatggta atatggtggg aagaaggaaa aatgacagca 480 aaagtagtag aatcagcaaa agcaatatta ggaggatcaa aagtaagagt agatcaaaaa 540 tgtaaatcat cagcacaaat agatccaaca ccagtaatag taacatcaaa tacaaatatg 600 tgtgcagtaa tagatggaaa ttcaacaaca tttgaacatc aacaaccatt acaagataga 660 atgtttaaat ttgaattaac aagaagatta gatcatgatt ttggaaaagt aacaaaacaa 720 gaagtaaaag atttttttag atgggcaaaa gatcatgtag tagaagtaga acatgaattt 780 tatgtaaaaa aaggaggagc aaaaaaaaga ccagcaccat cagatgcaga tatatcagaa 840 ccaaaaagag taagagaatc agtagcacaa ccatcaacat cagatgcaga agcatcaata 900 aattatgcag atagatatca aaataaatgt tcaagacatg taggaatgaa tttaatgtta 960 tttccatgta gacaatgtga aagaatgaat caaaattcaa atatatgttt tacacatgga 1020 caaaaagatt gtttagaatg ttttccagta tcagaatcac aaccagtatc agtagtaaaa 1080 aaagcatatc aaaaattatg ttatatacat catataatgg gaaaagtacc agatgcatgt 1140 acagcatgtg atttagtaaa tgtagattta gatgattgta tatttgaaca ataa 1194 <210> 36 <211> 1194 <212> DNA <213> Artificial Sequence <220> <223> rep52 GC optimised <400> 36 atggagctgg tggggtggct ggtggacaag gggatcacga gcgagaagca gtggatccag 60 gaggaccagg cgagctacat cagcttcaac gcggcgagca acagccggag ccagatcaag 120 gcggcgctgg acaacgcggg gaagatcatg agcctgacga agacggcgcc ggactacctg 180 gtggggcagc agccggtgga ggacatcagc agcaaccgga tctacaagat cctggagctg 240 aacgggtacg acccgcagta cgcggcgagc gtgttcctgg ggtgggcgac gaagaagttc 300 gggaagcgga acacgatctg gctgttcggg ccggcgacga cggggaagac gaacatcgcg 360 gaggcgatcg cgcacacggt gccgttctac gggtgcgtga actggacgaa cgagaacttc 420 ccgttcaacg actgcgtgga caagatggtg atctggtggg aggaggggaa gatgacggcg 480 aaggtggtgg agagcgcgaa ggcgatcctg ggggggagca aggtgcgggt ggaccagaag 540 tgcaagagca gcgcgcagat cgacccgacg ccggtgatcg tgacgagcaa cacgaacatg 600 tgcgcggtga tcgacgggaa cagcacgacg ttcgagcacc agcagccgct gcaggaccgg 660 atgttcaagt tcgagctgac gcggcggctg gaccacgact tcgggaaggt gacgaagcag 720 gaggtgaagg acttcttccg gtgggcgaag gaccacgtgg tggaggtgga gcacgagttc 780 tacgtgaaga aggggggggc gaagaagcgg ccggcgccga gcgacgcgga catcagcgag 840 ccgaagcggg tgcgggagag cgtggcgcag ccgagcacga gcgacgcgga ggcgagcatc 900 aactacgcgg accggtacca gaacaagtgc agccggcacg tggggatgaa cctgatgctg 960 ttcccgtgcc ggcagtgcga gcggatgaac cagaacagca acatctgctt cacgcacggg 1020 cagaaggact gcctggagtg cttcccggtg agcgagagcc agccggtgag cgtggtgaag 1080 aaggcgtacc agaagctgtg ctacatccac cacatcatgg ggaaggtgcc ggacgcgtgc 1140 acggcgtgcg acctggtgaa cgtggacctg gacgactgca tcttcgagca gtaa 1194 <210> 37 <211> 1194 <212> DNA <213> Artificial Sequence <220> <223> Rep52 <400> 37 atggagctgg tcgggtggct cgtggacaag gggattacct cggagaagca gtggatccag 60 gaggaccagg cctcatacat ctccttcaat gcggcctcca actcgcggtc ccaaatcaag 120 gctgccttgg acaatgcggg aaagattatg agcctgacta aaaccgcccc cgactacctg 180 gtgggccagc agcccgtgga ggacatttcc agcaatcgga tttataaaat tttggaacta 240 aacgggtacg atccccaata tgcggcttcc gtctttctgg gatgggccac gaaaaagttc 300 ggcaagagga acaccatctg gctgtttggg cctgcaacta ccgggaagac caacatcgcg 360 gaggccatag cccacactgt gcccttctac gggtgcgtaa actggaccaa tgagaacttt 420 cccttcaacg actgtgtcga caagatggtg atctggtggg aggaggggaa gatgaccgcc 480 aaggtcgtgg agtcggccaa agccattctc ggaggaagca aggtgcgcgt ggaccagaaa 540 tgcaagtcct cggcccagat agacccgact cccgtgatcg tcacctccaa caccaacatg 600 tgcgccgtga ttgacgggaa ctcaacgacc ttcgaacacc agcagccgtt gcaagaccgg 660 atgttcaaat ttgaactcac ccgccgtctg gatcatgact ttgggaaggt caccaagcag 720 gaagtcaaag actttttccg gtgggcaaag gatcacgtgg ttgaggtgga gcatgaattc 780 tacgtcaaaa agggtggagc caagaaaaga cccgccccca gtgacgcaga tataagtgag 840 cccaaacggg tgcgcgagtc agttgcgcag ccatcgacgt cagacgcgga agcttcgatc 900 aactacgcag accgctacca aaacaaatgt tctcgtcacg tgggcatgaa tctgatgctg 960 tttccctgca gacaatgcga gagaatgaat cagaattcaa atatctgctt cactcacgga 1020 cagaaagact gtttagagtg ctttcccgtg tcagaatctc aacccgtttc tgtcgtcaaa 1080 aaggcgtatc agaaactgtg ctacattcat catatcatgg gaaaggtgcc agacgcttgc 1140 actgcctgcg atctggtcaa tgtggatttg gatgactgca tctttgaaca ataa 1194 <210> 38 <211> 397 <212> PRT <213> Artificial Sequence <220> <223> Rep52 <400> 38 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 1 5 10 15 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 20 25 30 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 35 40 45 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 50 55 60 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 65 70 75 80 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 85 90 95 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 100 105 110 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 115 120 125 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 130 135 140 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 145 150 155 160 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 165 170 175 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 180 185 190 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 195 200 205 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 210 215 220 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 225 230 235 240 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 245 250 255 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 260 265 270 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 275 280 285 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 290 295 300 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 305 310 315 320 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 325 330 335 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 340 345 350 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 355 360 365 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 370 375 380 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 385 390 395 <210> 39 <211> 1873 <212> DNA <213> Artificial Sequence <220> <223> Rep78 <400> 39 cgcagccgcc atgccggggt tttacgagat tgtgattaag gtccccagcg accttgacga 60 gcatctgccc ggcatttctg acagctttgt gaactgggtg gccgagaagg aatgggagtt 120 gccgccagat tctgacatgg atctgaatct gattgagcag gcacccctga ccgtggccga 180 gaagctgcag cgcgactttc tgacggaatg gcgccgtgtg agtaaggccc cggaggccct 240 tttctttgtg caatttgaga agggagagag ctacttccac atgcacgtgc tcgtggaaac 300 caccggggtg aaatccatgg ttttgggacg tttcctgagt cagattcgcg aaaaactgat 360 tcagagaatt taccgcggga tcgagccgac tttgccaaac tggttcgcgg tcacaaagac 420 cagaaatggc gccggaggcg ggaacaaggt ggtggatgag tgctacatcc ccaattactt 480 gctccccaaa acccagcctg agctccagtg ggcgtggact aatatggaac agtatttaag 540 cgcctgtttg aatctcacgg agcgtaaacg gttggtggcg cagcatctga cgcacgtgtc 600 gcagacgcag gagcagaaca aagagaatca gaatcccaat tctgatgcgc cggtgatcag 660 atcaaaaact tcagccaggt acatggagct ggtcgggtgg ctcgtggaca aggggattac 720 ctcggagaag cagtggatcc aggaggacca ggcctcatac atctccttca atgcggcctc 780 caactcgcgg tcccaaatca aggctgcctt ggacaatgcg ggaaagatta tgagcctgac 840 taaaaccgcc cccgactacc tggtgggcca gcagcccgtg gaggacattt ccagcaatcg 900 gatttataaa attttggaac taaacgggta cgatccccaa tatgcggctt ccgtctttct 960 gggatgggcc acgaaaaagt tcggcaagag gaacaccatc tggctgtttg ggcctgcaac 1020 taccgggaag accaacatcg cggaggccat agcccacact gtgcccttct acgggtgcgt 1080 aaactggacc aatgagaact ttcccttcaa cgactgtgtc gacaagatgg tgatctggtg 1140 ggaggagggg aagatgaccg ccaaggtcgt ggagtcggcc aaagccattc tcggaggaag 1200 caaggtgcgc gtggaccaga aatgcaagtc ctcggcccag atagacccga ctcccgtgat 1260 cgtcacctcc aacaccaaca tgtgcgccgt gattgacggg aactcaacga ccttcgaaca 1320 ccagcagccg ttgcaagacc ggatgttcaa atttgaactc acccgccgtc tggatcatga 1380 ctttgggaag gtcaccaagc aggaagtcaa agactttttc cggtgggcaa aggatcacgt 1440 ggttgaggtg gagcatgaat tctacgtcaa aaagggtgga gccaagaaaa gacccgcccc 1500 cagtgacgca gatataagtg agcccaaacg ggtgcgcgag tcagttgcgc agccatcgac 1560 gtcagacgcg gaagcttcga tcaactacgc agacaggtac caaaacaaat gttctcgtca 1620 cgtgggcatg aatctgatgc tgtttccctg cagacaatgc gagagaatga atcagaattc 1680 aaatatctgc ttcactcacg gacagaaaga ctgtttagag tgctttcccg tgtcagaatc 1740 tcaacccgtt tctgtcgtca aaaaggcgta tcagaaactg tgctacattc atcatatcat 1800 gggaaaggtg ccagacgctt gcactgcctg cgatctggtc aatgtggatt tggatgactg 1860 catctttgaa caa 1873 <210> 40 <211> 621 <212> PRT <213> Artificial Sequence <220> <223> Rep78 <400> 40 Met Pro Gly Phe Tyr Glu Ile Val Ile Lys Val Pro Ser Asp Leu Asp 1 5 10 15 Glu His Leu Pro Gly Ile Ser Asp Ser Phe Val Asn Trp Val Ala Glu 20 25 30 Lys Glu Trp Glu Leu Pro Pro Asp Ser Asp Met Asp Leu Asn Leu Ile 35 40 45 Glu Gln Ala Pro Leu Thr Val Ala Glu Lys Leu Gln Arg Asp Phe Leu 50 55 60 Thr Glu Trp Arg Arg Val Ser Lys Ala Pro Glu Ala Leu Phe Phe Val 65 70 75 80 Gln Phe Glu Lys Gly Glu Ser Tyr Phe His Met His Val Leu Val Glu 85 90 95 Thr Thr Gly Val Lys Ser Met Val Leu Gly Arg Phe Leu Ser Gln Ile 100 105 110 Arg Glu Lys Leu Ile Gln Arg Ile Tyr Arg Gly Ile Glu Pro Thr Leu 115 120 125 Pro Asn Trp Phe Ala Val Thr Lys Thr Arg Asn Gly Ala Gly Gly Gly 130 135 140 Asn Lys Val Val Asp Glu Cys Tyr Ile Pro Asn Tyr Leu Leu Pro Lys 145 150 155 160 Thr Gln Pro Glu Leu Gln Trp Ala Trp Thr Asn Met Glu Gln Tyr Leu 165 170 175 Ser Ala Cys Leu Asn Leu Thr Glu Arg Lys Arg Leu Val Ala Gln His 180 185 190 Leu Thr His Val Ser Gln Thr Gln Glu Gln Asn Lys Glu Asn Gln Asn 195 200 205 Pro Asn Ser Asp Ala Pro Val Ile Arg Ser Lys Thr Ser Ala Arg Tyr 210 215 220 Met Glu Leu Val Gly Trp Leu Val Asp Lys Gly Ile Thr Ser Glu Lys 225 230 235 240 Gln Trp Ile Gln Glu Asp Gln Ala Ser Tyr Ile Ser Phe Asn Ala Ala 245 250 255 Ser Asn Ser Arg Ser Gln Ile Lys Ala Ala Leu Asp Asn Ala Gly Lys 260 265 270 Ile Met Ser Leu Thr Lys Thr Ala Pro Asp Tyr Leu Val Gly Gln Gln 275 280 285 Pro Val Glu Asp Ile Ser Ser Asn Arg Ile Tyr Lys Ile Leu Glu Leu 290 295 300 Asn Gly Tyr Asp Pro Gln Tyr Ala Ala Ser Val Phe Leu Gly Trp Ala 305 310 315 320 Thr Lys Lys Phe Gly Lys Arg Asn Thr Ile Trp Leu Phe Gly Pro Ala 325 330 335 Thr Thr Gly Lys Thr Asn Ile Ala Glu Ala Ile Ala His Thr Val Pro 340 345 350 Phe Tyr Gly Cys Val Asn Trp Thr Asn Glu Asn Phe Pro Phe Asn Asp 355 360 365 Cys Val Asp Lys Met Val Ile Trp Trp Glu Glu Gly Lys Met Thr Ala 370 375 380 Lys Val Val Glu Ser Ala Lys Ala Ile Leu Gly Gly Ser Lys Val Arg 385 390 395 400 Val Asp Gln Lys Cys Lys Ser Ser Ala Gln Ile Asp Pro Thr Pro Val 405 410 415 Ile Val Thr Ser Asn Thr Asn Met Cys Ala Val Ile Asp Gly Asn Ser 420 425 430 Thr Thr Phe Glu His Gln Gln Pro Leu Gln Asp Arg Met Phe Lys Phe 435 440 445 Glu Leu Thr Arg Arg Leu Asp His Asp Phe Gly Lys Val Thr Lys Gln 450 455 460 Glu Val Lys Asp Phe Phe Arg Trp Ala Lys Asp His Val Val Glu Val 465 470 475 480 Glu His Glu Phe Tyr Val Lys Lys Gly Gly Ala Lys Lys Arg Pro Ala 485 490 495 Pro Ser Asp Ala Asp Ile Ser Glu Pro Lys Arg Val Arg Glu Ser Val 500 505 510 Ala Gln Pro Ser Thr Ser Asp Ala Glu Ala Ser Ile Asn Tyr Ala Asp 515 520 525 Arg Tyr Gln Asn Lys Cys Ser Arg His Val Gly Met Asn Leu Met Leu 530 535 540 Phe Pro Cys Arg Gln Cys Glu Arg Met Asn Gln Asn Ser Asn Ile Cys 545 550 555 560 Phe Thr His Gly Gln Lys Asp Cys Leu Glu Cys Phe Pro Val Ser Glu 565 570 575 Ser Gln Pro Val Ser Val Val Lys Lys Ala Tyr Gln Lys Leu Cys Tyr 580 585 590 Ile His His Ile Met Gly Lys Val Pro Asp Ala Cys Thr Ala Cys Asp 595 600 605 Leu Val Asn Val Asp Leu Asp Asp Cys Ile Phe Glu Gln 610 615 620 <210> 41 <211> 738 <212> PRT <213> Artificial Sequence <220> <223> AAV8 <400> 41 Met Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Ala Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Gln Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Pro Ser Pro Gln Arg Ser Pro Asp Ser Ser Thr Gly Ile 145 150 155 160 Gly Lys Lys Gly Gln Gln Pro Ala Arg Lys Arg Leu Asn Phe Gly Gln 165 170 175 Thr Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro 180 185 190 Pro Ala Ala Pro Ser Gly Val Gly Pro Asn Thr Met Ala Ala Gly Gly 195 200 205 Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Ser 210 215 220 Ser Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val 225 230 235 240 Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His 245 250 255 Leu Tyr Lys Gln Ile Ser Asn Gly Thr Ser Gly Gly Ala Thr Asn Asp 260 265 270 Asn Thr Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn 275 280 285 Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn 290 295 300 Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Ser Phe Lys Leu Phe Asn 305 310 315 320 Ile Gln Val Lys Glu Val Thr Gln Asn Glu Gly Thr Lys Thr Ile Ala 325 330 335 Asn Asn Leu Thr Ser Thr Ile Gln Val Phe Thr Asp Ser Glu Tyr Gln 340 345 350 Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe 355 360 365 Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn 370 375 380 Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr 385 390 395 400 Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Gln Phe Thr Tyr 405 410 415 Thr Phe Glu Asp Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser 420 425 430 Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu 435 440 445 Ser Arg Thr Gln Thr Thr Gly Gly Thr Ala Asn Thr Gln Thr Leu Gly 450 455 460 Phe Ser Gln Gly Gly Pro Asn Thr Met Ala Asn Gln Ala Lys Asn Trp 465 470 475 480 Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Thr Thr Thr Gly 485 490 495 Gln Asn Asn Asn Ser Asn Phe Ala Trp Thr Ala Gly Thr Lys Tyr His 500 505 510 Leu Asn Gly Arg Asn Ser Leu Ala Asn Pro Gly Ile Ala Met Ala Thr 515 520 525 His Lys Asp Asp Glu Glu Arg Phe Phe Pro Ser Asn Gly Ile Leu Ile 530 535 540 Phe Gly Lys Gln Asn Ala Ala Arg Asp Asn Ala Asp Tyr Ser Asp Val 545 550 555 560 Met Leu Thr Ser Glu Glu Glu Ile Lys Thr Thr Asn Pro Val Ala Thr 565 570 575 Glu Glu Tyr Gly Ile Val Ala Asp Asn Leu Gln Gln Gln Asn Thr Ala 580 585 590 Pro Gln Ile Gly Thr Val Asn Ser Gln Gly Ala Leu Pro Gly Met Val 595 600 605 Trp Gln Asn Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile 610 615 620 Pro His Thr Asp Gly Asn Phe His Pro Ser Pro Leu Met Gly Gly Phe 625 630 635 640 Gly Leu Lys His Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val 645 650 655 Pro Ala Asp Pro Pro Thr Thr Phe Asn Gln Ser Lys Leu Asn Ser Phe 660 665 670 Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu 675 680 685 Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Ile Gln Tyr Thr 690 695 700 Ser Asn Tyr Tyr Lys Ser Thr Ser Val Asp Phe Ala Val Asn Thr Glu 705 710 715 720 Gly Val Tyr Ser Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg 725 730 735 Asn Leu <210> 42 <211> 250 <212> DNA <213> Artificial Sequence <220> <223> PolH long <400> 42 tgtaatgaga cgcacaaact aatatcacaa actggaaatg tctatcaata tatagttgct 60 gatctatgca tcagctgcta gtactccgga atattaatag atcatggaga taattaaaat 120 gataaccatc tcgcaaataa ataagtattt tactgttttc gtaacagttt tgtaataaaa 180 aaacctataa atattccgga ttattcatac cgtcccacca tcgggcgcgg atcgtaccgg 240 gcccaagctt 250 <210> 43 <211> 155 <212> DNA <213> Artificial Sequence <220> <223> PolH short <400> 43 tgtaatgaga cgcacaaact aatatcacaa actggaaatg tctatcaata tatagttgct 60 gatatcatgg agataattaa aatgataacc atctcgcaaa taaataagta ttttactgtt 120 ttcgtaacag ttttgtaata aaaaaaccta taaat 155 <210> 44 <211> 2208 <212> DNA <213> Artificial Sequence <220> <223> AAV 1; VP1, VP2, VP3; startcodon VP1 altered (GTG) <400> 44 gtggctgccg acggttatct acccgattgg ctcgaggaca acctctctga gggcattcgc 60 gagtggtggg acttgaaacc tggagccccg aagcccaaag ccaaccagca aaagcaggac 120 gacggccggg gtctggtgct tcctggctac aagtacctcg gacccttcaa cggactcgac 180 aagggggagc ccgtcaacgc ggcggacgca gcggccctcg agcacgacaa ggcctacgac 240 cagcagctca aagcgggtga caatccgtac ctgcggtata accacgccga cgccgagttt 300 caggagcgtc tgcaagaaga tacgtctttt gggggcaacc tcgggcgagc agtcttccag 360 gccaagaagc gggttctcga acctctcggt ctggttgagg aaggcgctaa gacggctcct 420 ggaaagaaac gtccggtaga gcagtcgcca caagagccag actcctcctc gggcatcggc 480 aagacaggcc agcagcccgc taaaaagaga ctcaattttg gtcagactgg cgactcagag 540 tcagtccccg atccacaacc tctcggagaa cctccagcaa cccccgctgc tgtgggacct 600 actacaatgg cttcaggcgg tggcgcacca atggcagaca ataacgaagg cgccgacgga 660 gtgggtaatg cctcaggaaa ttggcattgc gattccacat ggctgggcga cagagtcatc 720 accaccagca cccgcacctg ggccttgccc acctacaata accacctcta caagcaaatc 780 tccagtgctt caacgggggc cagcaacgac aaccactact tcggctacag caccccctgg 840 gggtattttg atttcaacag attccactgc cacttttcac cacgtgactg gcagcgactc 900 atcaacaaca attggggatt ccggcccaag agactcaact tcaaactctt caacatccaa 960 gtcaaggagg tcacgacgaa tgatggcgtc acaaccatcg ctaataacct taccagcacg 1020 gttcaagtct tctcggactc ggagtaccag cttccgtacg tcctcggctc tgcgcaccag 1080 ggctgcctcc ctccgttccc ggcggacgtg ttcatgattc cgcaatacgg ctacctgacg 1140 ctcaacaatg gcagccaagc cgtgggacgt tcatcctttt actgcctgga atatttccct 1200 tctcagatgc tgagaacggg caacaacttt accttcagct acacctttga ggaagtgcct 1260 ttccacagca gctacgcgca cagccagagc ctggaccggc tgatgaatcc tctcatcgac 1320 caatacctgt attacctgaa cagaactcaa aatcagtccg gaagtgccca aaacaaggac 1380 ttgctgttta gccgtgggtc tccagctggc atgtctgttc agcccaaaaa ctggctacct 1440 ggaccctgtt atcggcagca gcgcgtttct aaaacaaaaa cagacaacaa caacagcaat 1500 tttacctgga ctggtgcttc aaaatataac ctcaatgggc gtgaatccat catcaaccct 1560 ggcactgcta tggcctcaca caaagacgac gaagacaagt tctttcccat gagcggtgtc 1620 atgatttttg gaaaagagag cgccggagct tcaaacactg cattggacaa tgtcatgatt 1680 acagacgaag aggaaattaa agccactaac cctgtggcca ccgaaagatt tgggaccgtg 1740 gcagtcaatt tccagagcag cagcacagac cctgcgaccg gagatgtgca tgctatggga 1800 gcattacctg gcatggtgtg gcaagataga gacgtgtacc tgcagggtcc catttgggcc 1860 aaaattcctc acacagatgg acactttcac ccgtctcctc ttatgggcgg ctttggactc 1920 aagaacccgc ctcctcagat cctcatcaaa aacacgcctg ttcctgcgaa tcctccggcg 1980 gagttttcag ctacaaagtt tgcttcattc atcacccaat actccacagg acaagtgagt 2040 gtggaaattg aatgggagct gcagaaagaa aacagcaagc gctggaatcc cgaagtgcag 2100 tacacatcca attatgcaaa atctgccaac gttgatttta ctgtggacaa caatggactt 2160 tatactgagc ctcgccccat tggcacccgt taccttaccc gtcccctg 2208 <210> 45 <211> 1800 <212> DNA <213> Artificial Sequence <220> <223> AAV1; VP2; VP3 <400> 45 acggctcctg gaaagaaacg tccggtagag cagtcgccac aagagccaga ctcctcctcg 60 ggcatcggca agacaggcca gcagcccgct aaaaagagac tcaattttgg tcagactggc 120 gactcagagt cagtccccga tccacaacct ctcggagaac ctccagcaac ccccgctgct 180 gtgggaccta ctacaatggc ttcaggcggt ggcgcaccaa tggcagacaa taacgaaggc 240 gccgacggag tgggtaatgc ctcaggaaat tggcattgcg attccacatg gctgggcgac 300 agagtcatca ccaccagcac ccgcacctgg gccttgccca cctacaataa ccacctctac 360 aagcaaatct ccagtgcttc aacgggggcc agcaacgaca accactactt cggctacagc 420 accccctggg ggtattttga tttcaacaga ttccactgcc acttttcacc acgtgactgg 480 cagcgactca tcaacaacaa ttggggattc cggcccaaga gactcaactt caaactcttc 540 aacatccaag tcaaggaggt cacgacgaat gatggcgtca caaccatcgc taataacctt 600 accagcacgg ttcaagtctt ctcggactcg gagtaccagc ttccgtacgt cctcggctct 660 gcgcaccagg gctgcctccc tccgttcccg gcggacgtgt tcatgattcc gcaatacggc 720 tacctgacgc tcaacaatgg cagccaagcc gtgggacgtt catcctttta ctgcctggaa 780 tatttccctt ctcagatgct gagaacgggc aacaacttta ccttcagcta cacctttgag 840 gaagtgcctt tccacagcag ctacgcgcac agccagagcc tggaccggct gatgaatcct 900 ctcatcgacc aatacctgta ttacctgaac agaactcaaa atcagtccgg aagtgcccaa 960 aacaaggact tgctgtttag ccgtgggtct ccagctggca tgtctgttca gcccaaaaac 1020 tggctacctg gaccctgtta tcggcagcag cgcgtttcta aaacaaaaac agacaacaac 1080 aacagcaatt ttacctggac tggtgcttca aaatataacc tcaatgggcg tgaatccatc 1140 atcaaccctg gcactgctat ggcctcacac aaagacgacg aagacaagtt ctttcccatg 1200 agcggtgtca tgatttttgg aaaagagagc gccggagctt caaacactgc attggacaat 1260 gtcatgatta cagacgaaga ggaaattaaa gccactaacc ctgtggccac cgaaagattt 1320 gggaccgtgg cagtcaattt ccagagcagc agcacagacc ctgcgaccgg agatgtgcat 1380 gctatgggag cattacctgg catggtgtgg caagatagag acgtgtacct gcagggtccc 1440 atttgggcca aaattcctca cacagatgga cactttcacc cgtctcctct tatgggcggc 1500 tttggactca agaacccgcc tcctcagatc ctcatcaaaa acacgcctgt tcctgcgaat 1560 cctccggcgg agttttcagc tacaaagttt gcttcattca tcacccaata ctccacagga 1620 caagtgagtg tggaaattga atgggagctg cagaaagaaa acagcaagcg ctggaatccc 1680 gaagtgcagt acacatccaa ttatgcaaaa tctgccaacg ttgattttac tgtggacaac 1740 aatggacttt atactgagcc tcgccccatt ggcacccgtt accttacccg tcccctgtaa 1800 <210> 46 <211> 1605 <212> DNA <213> Artificial Sequence <220> <223> AAV1; VP3 <400> 46 atggcttcag gcggtggcgc accaatggca gacaataacg aaggcgccga cggagtgggt 60 aatgcctcag gaaattggca ttgcgattcc acatggctgg gcgacagagt catcaccacc 120 agcacccgca cctgggcctt gcccacctac aataaccacc tctacaagca aatctccagt 180 gcttcaacgg gggccagcaa cgacaaccac tacttcggct acagcacccc ctgggggtat 240 tttgatttca acagattcca ctgccacttt tcaccacgtg actggcagcg actcatcaac 300 aacaattggg gattccggcc caagagactc aacttcaaac tcttcaacat ccaagtcaag 360 gaggtcacga cgaatgatgg cgtcacaacc atcgctaata accttaccag cacggttcaa 420 gtcttctcgg actcggagta ccagcttccg tacgtcctcg gctctgcgca ccagggctgc 480 ctccctccgt tcccggcgga cgtgttcatg attccgcaat acggctacct gacgctcaac 540 aatggcagcc aagccgtggg acgttcatcc ttttactgcc tggaatattt cccttctcag 600 atgctgagaa cgggcaacaa ctttaccttc agctacacct ttgaggaagt gcctttccac 660 agcagctacg cgcacagcca gagcctggac cggctgatga atcctctcat cgaccaatac 720 ctgtattacc tgaacagaac tcaaaatcag tccggaagtg cccaaaacaa ggacttgctg 780 tttagccgtg ggtctccagc tggcatgtct gttcagccca aaaactggct acctggaccc 840 tgttatcggc agcagcgcgt ttctaaaaca aaaacagaca acaacaacag caattttacc 900 tggactggtg cttcaaaata taacctcaat gggcgtgaat ccatcatcaa ccctggcact 960 gctatggcct cacacaaaga cgacgaagac aagttctttc ccatgagcgg tgtcatgatt 1020 tttggaaaag agagcgccgg agcttcaaac actgcattgg acaatgtcat gattacagac 1080 gaagaggaaa ttaaagccac taaccctgtg gccaccgaaa gatttgggac cgtggcagtc 1140 aatttccaga gcagcagcac agaccctgcg accggagatg tgcatgctat gggagcatta 1200 cctggcatgg tgtggcaaga tagagacgtg tacctgcagg gtcccatttg ggccaaaatt 1260 cctcacacag atggacactt tcacccgtct cctcttatgg gcggctttgg actcaagaac 1320 ccgcctcctc agatcctcat caaaaacacg cctgttcctg cgaatcctcc ggcggagttt 1380 tcagctacaa agtttgcttc attcatcacc caatactcca caggacaagt gagtgtggaa 1440 attgaatggg agctgcagaa agaaaacagc aagcgctgga atcccgaagt gcagtacaca 1500 tccaattatg caaaatctgc caacgttgat tttactgtgg acaacaatgg actttatact 1560 gagcctcgcc ccattggcac ccgttacctt acccgtcccc tgtaa 1605 <210> 47 <211> 736 <212> PRT <213> Artificial Sequence <220> <223> AAV1; VP1, VP2, VP3; startcodon VP1 altered (GTG) <400> 47 Val Ala Ala Asp Gly Tyr Leu Pro Asp Trp Leu Glu Asp Asn Leu Ser 1 5 10 15 Glu Gly Ile Arg Glu Trp Trp Asp Leu Lys Pro Gly Ala Pro Lys Pro 20 25 30 Lys Ala Asn Gln Gln Lys Gln Asp Asp Gly Arg Gly Leu Val Leu Pro 35 40 45 Gly Tyr Lys Tyr Leu Gly Pro Phe Asn Gly Leu Asp Lys Gly Glu Pro 50 55 60 Val Asn Ala Ala Asp Ala Ala Ala Leu Glu His Asp Lys Ala Tyr Asp 65 70 75 80 Gln Gln Leu Lys Ala Gly Asp Asn Pro Tyr Leu Arg Tyr Asn His Ala 85 90 95 Asp Ala Glu Phe Gln Glu Arg Leu Gln Glu Asp Thr Ser Phe Gly Gly 100 105 110 Asn Leu Gly Arg Ala Val Phe Gln Ala Lys Lys Arg Val Leu Glu Pro 115 120 125 Leu Gly Leu Val Glu Glu Gly Ala Lys Thr Ala Pro Gly Lys Lys Arg 130 135 140 Pro Val Glu Gln Ser Pro Gln Glu Pro Asp Ser Ser Ser Gly Ile Gly 145 150 155 160 Lys Thr Gly Gln Gln Pro Ala Lys Lys Arg Leu Asn Phe Gly Gln Thr 165 170 175 Gly Asp Ser Glu Ser Val Pro Asp Pro Gln Pro Leu Gly Glu Pro Pro 180 185 190 Ala Thr Pro Ala Ala Val Gly Pro Thr Thr Met Ala Ser Gly Gly Gly 195 200 205 Ala Pro Met Ala Asp Asn Asn Glu Gly Ala Asp Gly Val Gly Asn Ala 210 215 220 Ser Gly Asn Trp His Cys Asp Ser Thr Trp Leu Gly Asp Arg Val Ile 225 230 235 240 Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro Thr Tyr Asn Asn His Leu 245 250 255 Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly Ala Ser Asn Asp Asn His 260 265 270 Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr Phe Asp Phe Asn Arg Phe 275 280 285 His Cys His Phe Ser Pro Arg Asp Trp Gln Arg Leu Ile Asn Asn Asn 290 295 300 Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe Lys Leu Phe Asn Ile Gln 305 310 315 320 Val Lys Glu Val Thr Thr Asn Asp Gly Val Thr Thr Ile Ala Asn Asn 325 330 335 Leu Thr Ser Thr Val Gln Val Phe Ser Asp Ser Glu Tyr Gln Leu Pro 340 345 350 Tyr Val Leu Gly Ser Ala His Gln Gly Cys Leu Pro Pro Phe Pro Ala 355 360 365 Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr Leu Thr Leu Asn Asn Gly 370 375 380 Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr Cys Leu Glu Tyr Phe Pro 385 390 395 400 Ser Gln Met Leu Arg Thr Gly Asn Asn Phe Thr Phe Ser Tyr Thr Phe 405 410 415 Glu Glu Val Pro Phe His Ser Ser Tyr Ala His Ser Gln Ser Leu Asp 420 425 430 Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr Leu Tyr Tyr Leu Asn Arg 435 440 445 Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn Lys Asp Leu Leu Phe Ser 450 455 460 Arg Gly Ser Pro Ala Gly Met Ser Val Gln Pro Lys Asn Trp Leu Pro 465 470 475 480 Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser Lys Thr Lys Thr Asp Asn 485 490 495 Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala Ser Lys Tyr Asn Leu Asn 500 505 510 Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr Ala Met Ala Ser His Lys 515 520 525 Asp Asp Glu Asp Lys Phe Phe Pro Met Ser Gly Val Met Ile Phe Gly 530 535 540 Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala Leu Asp Asn Val Met Ile 545 550 555 560 Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn Pro Val Ala Thr Glu Arg 565 570 575 Phe Gly Thr Val Ala Val Asn Phe Gln Ser Ser Ser Thr Asp Pro Ala 580 585 590 Thr Gly Asp Val His Ala Met Gly Ala Leu Pro Gly Met Val Trp Gln 595 600 605 Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile Trp Ala Lys Ile Pro His 610 615 620 Thr Asp Gly His Phe His Pro Ser Pro Leu Met Gly Gly Phe Gly Leu 625 630 635 640 Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys Asn Thr Pro Val Pro Ala 645 650 655 Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys Phe Ala Ser Phe Ile Thr 660 665 670 Gln Tyr Ser Thr Gly Gln Val Ser Val Glu Ile Glu Trp Glu Leu Gln 675 680 685 Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu Val Gln Tyr Thr Ser Asn 690 695 700 Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr Val Asp Asn Asn Gly Leu 705 710 715 720 Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg Tyr Leu Thr Arg Pro Leu 725 730 735 <210> 48 <211> 599 <212> PRT <213> Artificial Sequence <220> <223> AAV1; VP2, VP3 <400> 48 Thr Ala Pro Gly Lys Lys Arg Pro Val Glu Gln Ser Pro Gln Glu Pro 1 5 10 15 Asp Ser Ser Ser Gly Ile Gly Lys Thr Gly Gln Gln Pro Ala Lys Lys 20 25 30 Arg Leu Asn Phe Gly Gln Thr Gly Asp Ser Glu Ser Val Pro Asp Pro 35 40 45 Gln Pro Leu Gly Glu Pro Pro Ala Thr Pro Ala Ala Val Gly Pro Thr 50 55 60 Thr Met Ala Ser Gly Gly Gly Ala Pro Met Ala Asp Asn Asn Glu Gly 65 70 75 80 Ala Asp Gly Val Gly Asn Ala Ser Gly Asn Trp His Cys Asp Ser Thr 85 90 95 Trp Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu 100 105 110 Pro Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Ala Ser Thr 115 120 125 Gly Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly 130 135 140 Tyr Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp 145 150 155 160 Gln Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn 165 170 175 Phe Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Asn Asp Gly 180 185 190 Val Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ser 195 200 205 Asp Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly 210 215 220 Cys Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly 225 230 235 240 Tyr Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe 245 250 255 Tyr Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn 260 265 270 Phe Thr Phe Ser Tyr Thr Phe Glu Glu Val Pro Phe His Ser Ser Tyr 275 280 285 Ala His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln 290 295 300 Tyr Leu Tyr Tyr Leu Asn Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln 305 310 315 320 Asn Lys Asp Leu Leu Phe Ser Arg Gly Ser Pro Ala Gly Met Ser Val 325 330 335 Gln Pro Lys Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val 340 345 350 Ser Lys Thr Lys Thr Asp Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly 355 360 365 Ala Ser Lys Tyr Asn Leu Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly 370 375 380 Thr Ala Met Ala Ser His Lys Asp Asp Glu Asp Lys Phe Phe Pro Met 385 390 395 400 Ser Gly Val Met Ile Phe Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr 405 410 415 Ala Leu Asp Asn Val Met Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr 420 425 430 Asn Pro Val Ala Thr Glu Arg Phe Gly Thr Val Ala Val Asn Phe Gln 435 440 445 Ser Ser Ser Thr Asp Pro Ala Thr Gly Asp Val His Ala Met Gly Ala 450 455 460 Leu Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro 465 470 475 480 Ile Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro 485 490 495 Leu Met Gly Gly Phe Gly Leu Lys Asn Pro Pro Pro Gln Ile Leu Ile 500 505 510 Lys Asn Thr Pro Val Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr 515 520 525 Lys Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val 530 535 540 Glu Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro 545 550 555 560 Glu Val Gln Tyr Thr Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe 565 570 575 Thr Val Asp Asn Asn Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr 580 585 590 Arg Tyr Leu Thr Arg Pro Leu 595 <210> 49 <211> 534 <212> PRT <213> Artificial Sequence <220> <223> AAV1; VP3 <400> 49 Met Ala Ser Gly Gly Gly Ala Pro Met Ala Asp Asn Asn Glu Gly Ala 1 5 10 15 Asp Gly Val Gly Asn Ala Ser Gly Asn Trp His Cys Asp Ser Thr Trp 20 25 30 Leu Gly Asp Arg Val Ile Thr Thr Ser Thr Arg Thr Trp Ala Leu Pro 35 40 45 Thr Tyr Asn Asn His Leu Tyr Lys Gln Ile Ser Ser Ala Ser Thr Gly 50 55 60 Ala Ser Asn Asp Asn His Tyr Phe Gly Tyr Ser Thr Pro Trp Gly Tyr 65 70 75 80 Phe Asp Phe Asn Arg Phe His Cys His Phe Ser Pro Arg Asp Trp Gln 85 90 95 Arg Leu Ile Asn Asn Asn Trp Gly Phe Arg Pro Lys Arg Leu Asn Phe 100 105 110 Lys Leu Phe Asn Ile Gln Val Lys Glu Val Thr Thr Asn Asp Gly Val 115 120 125 Thr Thr Ile Ala Asn Asn Leu Thr Ser Thr Val Gln Val Phe Ser Asp 130 135 140 Ser Glu Tyr Gln Leu Pro Tyr Val Leu Gly Ser Ala His Gln Gly Cys 145 150 155 160 Leu Pro Pro Phe Pro Ala Asp Val Phe Met Ile Pro Gln Tyr Gly Tyr 165 170 175 Leu Thr Leu Asn Asn Gly Ser Gln Ala Val Gly Arg Ser Ser Phe Tyr 180 185 190 Cys Leu Glu Tyr Phe Pro Ser Gln Met Leu Arg Thr Gly Asn Asn Phe 195 200 205 Thr Phe Ser Tyr Thr Phe Glu Glu Val Pro Phe His Ser Ser Tyr Ala 210 215 220 His Ser Gln Ser Leu Asp Arg Leu Met Asn Pro Leu Ile Asp Gln Tyr 225 230 235 240 Leu Tyr Tyr Leu Asn Arg Thr Gln Asn Gln Ser Gly Ser Ala Gln Asn 245 250 255 Lys Asp Leu Leu Phe Ser Arg Gly Ser Pro Ala Gly Met Ser Val Gln 260 265 270 Pro Lys Asn Trp Leu Pro Gly Pro Cys Tyr Arg Gln Gln Arg Val Ser 275 280 285 Lys Thr Lys Thr Asp Asn Asn Asn Ser Asn Phe Thr Trp Thr Gly Ala 290 295 300 Ser Lys Tyr Asn Leu Asn Gly Arg Glu Ser Ile Ile Asn Pro Gly Thr 305 310 315 320 Ala Met Ala Ser His Lys Asp Asp Glu Asp Lys Phe Phe Pro Met Ser 325 330 335 Gly Val Met Ile Phe Gly Lys Glu Ser Ala Gly Ala Ser Asn Thr Ala 340 345 350 Leu Asp Asn Val Met Ile Thr Asp Glu Glu Glu Ile Lys Ala Thr Asn 355 360 365 Pro Val Ala Thr Glu Arg Phe Gly Thr Val Ala Val Asn Phe Gln Ser 370 375 380 Ser Ser Thr Asp Pro Ala Thr Gly Asp Val His Ala Met Gly Ala Leu 385 390 395 400 Pro Gly Met Val Trp Gln Asp Arg Asp Val Tyr Leu Gln Gly Pro Ile 405 410 415 Trp Ala Lys Ile Pro His Thr Asp Gly His Phe His Pro Ser Pro Leu 420 425 430 Met Gly Gly Phe Gly Leu Lys Asn Pro Pro Pro Gln Ile Leu Ile Lys 435 440 445 Asn Thr Pro Val Pro Ala Asn Pro Pro Ala Glu Phe Ser Ala Thr Lys 450 455 460 Phe Ala Ser Phe Ile Thr Gln Tyr Ser Thr Gly Gln Val Ser Val Glu 465 470 475 480 Ile Glu Trp Glu Leu Gln Lys Glu Asn Ser Lys Arg Trp Asn Pro Glu 485 490 495 Val Gln Tyr Thr Ser Asn Tyr Ala Lys Ser Ala Asn Val Asp Phe Thr 500 505 510 Val Asp Asn Asn Gly Leu Tyr Thr Glu Pro Arg Pro Ile Gly Thr Arg 515 520 525 Tyr Leu Thr Arg Pro Leu 530 <210> 50 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 50 ttgacgcaaa tgggcggta 19 <210> 51 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 51 gatctgacgg ttcactaaac gag 23 <210> 52 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 52 caagtatggc atctacacca aagtct 26 <210> 53 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 53 gcaatagcat cacaaatttc acaaa 25 <210> 54 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> probe <400> 54 tgtgaactgg atcaaggaga agaccaagc 29 <210> 55 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> CMV probe with ZEN quencher at position 10 <220> <221> ZEN-quencher <222> (10)..(10) <223> ZEN-quencher <220> <221> misc_feature <222> (10)..(10) <223> n is a, c, g, or t <400> 55 tatagacctn cccaccgtac acgcc 25

Claims

i) 세포 내에서의 해독(translation)이 파르보바이러스(parvoviral) Rep 78 및 68 단백질 중 적어도 하나를 생산하는, mRNA를 암호화(encoding)하는 뉴클레오타이드 서열에 작동 가능하게 연결된(operably linked) 제1의 프로모터;
ii) 세포 내에서의 해독이 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나를 생산하는, mRNA를 암호화하는 뉴클레오타이드 서열에 작동 가능하게 연결된 제2의 프로모터;
및
iii) 제1 및 제2의 프로모터에 작동 가능하게 연결된 적어도 하나의 인핸서(enhancer)를 포함하는, 세포의 게놈 내로 통합된 곤충 세포로서,
여기서 적어도 하나의 인핸서 성분은 전사 트랜스레귤레이터(transcriptional transregulator)에 의존적이고,
여기서 전사 트랜스레귤레이터의 세포 내로의 도입은 제1 및 제2의 프로모터로부터의 전사를 유도하는, 곤충 세포.
제1항에 있어서, 제1 및 제2의 프로모터가 바큘로바이러스 프로모터(baculobviaral promoter)이고, 전사 트랜스레귤레이터가 바큘로바이러스 이미디어트-얼리 단백질(immediate-early protein; IE1) 또는 이의 스플라이스 변이체(splice variant; IE0)이고 전사 트랜스레귤레이터-의존적인 인핸서 성분이 바큘로바이러스 상동성 영역(homologous region; hr) 인핸서 성분이고, 여기서 바람직하게는 바큘로바이러스가 오토그라파 칼리포르니카(Autographa californica) 다중캡시드 뉴클레오폴리헤드로바이러스인, 곤충 세포.
제2항에 있어서, hr 인핸서 성분이 hr2-0.9 이외의 hr 인핸서 성분이고, 여기서 바람직하게는 hr 인핸서 성분이 바람직하게는 hr 28-mer 서열 CTTTACGAGTAGAATTCTACGCGTAAAA의 적어도 하나의 카피를 포함하고/하거나 이의 적어도 20, 21, 22, 23, 24, 25, 26, 또는 27개의 뉴클레오타이드가 서열 CTTTACGAGTAGAATTCTACGCGTAAAA와 동일하고 바큘로바이러스 IE1 단백질에 결합하는 서열의 적어도 하나의 카피를 포함하고, 여기서 hr 인핸서 성분은, polH 프로모터에 작동 가능하게 연결된 리포터 유전자(reporter gene)를 포함하는 발현 카세트(expression cassette)에 작동 가능하게 연결된 경우,
a) 비-유도 조건(non-inducing condition) 하에서, hr 인핸서 성분을 지닌 발현 카세트가 hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트 보다는 리포터 전사체를 거의 생산하지 않거나, hr 인핸서 성분을 지닌 카세트가 hr4b 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체 양의 1.1, 1.2, 1.5, 2, 5 또는 10배(factor) 미만을 생산하고;
b) 유도 조건 하에서, hr 인핸서 성분을 지닌 발현 카세트가 hr4b 또는 hr2-0.9 성분을 포함하는 다른 동일한 발현 카세트에 의해 생산된 리포터 전사체의 양의 적어도 50, 60, 70, 80, 90 또는 100%를 생산하고,
여기서 보다 바람직하게는, hr 인핸서 성분이 hr1, hr3, hr4b 및 hr5로 이루어진 그룹으로부터 선택되고, 이 중에서 hr4b 및 hr5가 바람직하고, 이 중에서 hr4b가 가장 바람직한, 곤충 세포.
제2항 또는 제3항에 있어서, 제1 및 제2의 프로모터가가 별개이고, 여기서 바람직하게는 제1의 프로모터가 지연된 얼리 바큘로바이러스 프로모터(delayed early baculoviral promoter)이고 제2의 프로모터가 레이트 또는 베리 레이트 바큘로바이러스 프로모터(late or very late baculoviral promoter)이고, 가장 바람직하게는 제1의 프로모터가 39k 프로모터이고 제2의 프로모터가 polH, p10, p6.9 및 pSel120 프로모터로 이루어진 그룹으로부터 선택되는, 곤충 세포.
제1항 내지 제4항 중 어느 한 항에 있어서, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나 및 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나가 적어도 90% 동일한 일반적인 아미노산 서열을 가지지만, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에 대해 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대해 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열과 95, 90, 85, 80, 75, 70, 65 또는 60% 미만의 서열 동일성(sequence identity)을 갖고, 여기서 바람직하게는 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나에 대한 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 내 코돈 사용(codon usage)은 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대한 mRNA 내 일반적인 아미노산 서열을 암호화하는 뉴클레오타이드 서열 내 코돈 사용보다 곤충 세포의 코돈 사용 편향(codon usage bias)에 대해 보다 더 적응되는, 곤충 세포.
제1항 내지 제5항 중 어느 한 항에 있어서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나에 대한 mRNA를 암호화하는 뉴클레오타이드 서열이 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나의 감소된 정상 상태 수준(steady state level)에 영향을 미치는 변형을 포함하고, 바람직하게는 파르보바이러스 Rep78 및 68 단백질 중 적어도 하나가 준최적(suboptimal) 해독 개시 코돈으로 출발하는 개방 판독 프레임(open reading frame)을 포함하고, 여기서 보다 바람직하게는, 준최적 해독 개시 코돈은 ACG, CTG, TTG, GTG 및 ATT로부터 선택되고, 이중 ACG가 가장 바람직한, 곤충 세포.
제1항 내지 제6항 중 어느 한 항에 있어서, 제1 및 제2의 프로모터가 전사의 반대 방향으로 세포의 게놈 내에 통합되고, 여기서 적어도 하나의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재하고, 여기서 보다 바람직하게는 2개의 인핸서 성분은 제1의 프로모터와 제2의 프로모터 사이에 존재하는, 곤충 세포.
제1항 내지 제7항 중 어느 한 항에 있어서, 세포가:
a) 곤충 세포 내에서 발현을 위한 제3의 프로모터에 작동 가능하게 연결된 파르보바이러스 캡시드 단백질 코딩 서열(coding sequence)을 포함하는 뉴클레오타이드 서열;
b) 적어도 하나의 파르보바이러스 역위된 말단 반복 서열(parvovirus inverted terminal repeat sequence)에 의해 플랭킹(flanking)되는 전이유전자를 포함하는 뉴클레오타이드 서열; 및
c) 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 뉴클레오타이드 서열을 추가로 포함하는, 곤충 세포.
제8항에 있어서, a) 및 b) 중 적어도 하나의 뉴클레오타이드 서열이 바큘로바이러스 벡터 내에 포함되고, 여기서, 바람직하게는 a), b) 및 c) 중 적어도 하나의 뉴클레오타이드 서열이 전사 트랜스레귤레이터의 발현을 위한 발현 카세트를 포함하는 바큘로바이러스 벡터 내에 포함되는, 곤충 세포.
제8항 또는 제9항에 있어서, 제1의 프로모터가 제3의 프로모터 앞에서 활성인, 곤충 세포.
제1항 내지 제10항 중 어느 한 항에 있어서, 파르보바이러스 Rep 78 및 68 단백질 중 적어도 하나, 파르보바이러스 Rep 52 및 40 단백질 중 적어도 하나, 파르보바이러스 VP1, VP2, 및 VP3 캡시드 단백질 및 적어도 하나의 파르보바이러스 역위된 말단 반복체 서열이 아데노 관련 바이러스(adeno associated virus; AAV)로부터 유래되는, 곤충 세포.
제1항 내지 제11항 중 어느 한 항에 있어서, 바람직한 cap-코딩 서열이 적어도 CAP AAV2/5(서열 번호: 29) 또는 AAV5(서열 번호: 30)를 포함하는, 곤충 세포.
a) 제1항 내지 제7항 중 어느 한 항에서 정의된 바와 같은 곤충 세포를 배양하는 단계;
b) a)에서 배양된 세포에 제8항 내지 제12항 중 어느 한 항에서 정의된 바와 같은 뉴클레오타이드 서열을 제공하는 단계; 및
c) 재조합 파르보바이러스 비리온(recombinant parvovirus virion)을 회수하는 단계를 포함하는, 재조합 파르보바이러스 비리온을 생산하기 위한 방법.
제13항에 있어서, 단계 c)에서 재조합 파르보바이러스 비리온의 회수가 고정된 항-파르보바이러스 항체, 바람직하게는 단일 쇄 카멜리드 항체(camelid antibody) 또는 이의 단편을 사용한 비리온의 친화성-정제(affinity-purification), 및 30 내지 70 nm의 공칭 공극 크기(nominal pore size)를 지닌 필터 위에서의 여과 중 적어도 하나를 포함하는, 방법.
적어도 제1항 내지 제7항 중 어느 한 항에서 정의된 바와 같은 곤충 세포 및 제8항 내지 제12항 중 어느 한 항에서 정의된 바와 같은 바큘로바이러스 벡터 및/또는 뉴클레오타이드 서열을 포함하는 부분의 키트(kit of parts).