KR20240004433A

KR20240004433A - Ert2 돌연변이체 및 이의 용도

Info

Publication number: KR20240004433A
Application number: KR1020237037724A
Authority: KR
Inventors: 미셸 엘리자베스 헝; 레베카 테일러 콧먼; 러셀 모리슨 골들리; 개리 이; 티모시 관-타 루; 스리니바사라가반 칸난; 찬드라 셰커 베르마
Original assignee: 센티 바이오사이언시스, 인코포레이티드
Priority date: 2021-04-06
Filing date: 2022-04-06
Publication date: 2024-01-11
Also published as: IL307269A; US20240150433A1; EP4320228A1; CA3213591A1; JP2024513231A; WO2022216823A1; AU2022255180A1; CN117321192A

Abstract

에스트로겐 수용체 알파 리간드 결합 도메인(ER-LBD)의 돌연변이체, 및 이러한 돌연변이체 ER-LBD를 포함하는 키메라 단백질이 본원에 제공된다. 또한, 이러한 키메라 단백질의 전사를 조절하고 국소화를 조절하는 방법이 제공된다.

Description

ERT2 돌연변이체 및 이의 용도

관련 출원에 대한 상호 참조

본 출원은 2021년 4월 6일에 출원된 미국 가출원 제63/171,227호의 이익을 주장하고, 이들은 사실상 그 전체가 참조로서 본원에 포함된다.

서열 목록

본 출원은 EFS-Web을 통해 제출된 서열 목록을 함유하며 그 전체가 본원에 참조로 포함된다. 2022년 4월 4일에 생성된 상기 ASCII 사본의 명칭은 STB-028WO_SL.txt이고, 크기는 212,560 바이트이다.

에스트로겐 수용체(ER)는 에스트로겐 및 에스트라디올과 같은 내인성 호르몬 리간드에 결합하는 리간드 의존성 전사 인자이다. ER에 결합하는 합성 리간드는 ER-양성 유방암과 같은 ER-양성 암을 치료하기 위해 개발되었다. 예를 들어, 약물 타목시펜의 활성 대사산물은 ER의 핵 전위를 유도하고 조직-선택적 방식으로 ER에 길항작용을 한다. 타목시펜 및 이의 활성 대사산물은 또한 연구 환경에서 핵 국소화를 제어하기 위한 도구로서 사용된다. 예를 들어, ERT2로 알려진 ER 리간드 결합 도메인 변이체는 동물 모델 시스템에서 Cre 재조합효소 기반 유전자 편집을 조절하기 위해 Cre 재조합효소와 융합 단백질로서 널리 사용되어 왔다. 합성 리간드를 사용하여 핵 국소화를 조작하는 능력은 또한 치료 유전자의 조절과 같은 치료 용도에 유용할 것이다. 따라서, 합성 리간드에 대한 민감도 및/또는 선택성이 개선된 ERT2 기반 시스템은 임상 환경에서 ERT2 기반 유전자 조절을 사용하는 데 유용할 것이다.

일부 구현예에서, 타목시펜 및 이의 대사산물과 같은 비-내인성 리간드에 대한 개선된 민감도 및/또는 선택성을 갖는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)이 본원에 제공된다. 또한, 일부 구현예에서, 본원에 기술된 바와 같은 변형된 ER-LBD를 포함하는 키메라 단백질, 유전자 스위치, 본원에 기술된 바와 같은 변형된 ER-LBD 및 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자, 본원에 기술된 폴리뉴클레오티드 분자를 암호화하거나 본원에 기술된 바와 같은 변형된 ER-LBD 및 키메라 단백질을 발현하는 세포, 및 본원에 기술된 바와 같은 변형된 ER-LBD, 키메라 단백질, 폴리뉴클레오티드 분자, 유전적 스위치, 또는 세포를 사용하는 방법이 본원에 제공된다.

본원에 기술된 변형된 ER-LBD 및 키메라 단백질은 ERT2에 비해 비-내인성 리간드(예를 들어, "4-OHT"로도 지칭되는 4-하이드록시타목시펜)에 대해 더 큰 민감도 및/또는 선택성을 갖는다. ERT2는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환을 포함하는 ER의 리간드 결합 도메인이다(서열번호 2 참조). ERT2는 또한 G400V/M543A/L544A 이외에, V595A 아미노산 치환을 포함할 수 있다(서열번호 3 참조). 타목시펜의 통상적인 임상 투여 후 평균 피크 혈장 농도는 나노몰 범위(예를 들어, 약 40 ng/mL)이다. 그러나, 타목시펜 대사산물(예를 들어, 엔독시펜 및 4-OHT)에 대한 야생형 ERT2의 민감도는 대사산물의 나노몰 농도에서 유전자 발현을 조절하는 데 사용하기에 너무 낮다. 또한, ERT2는 에스트라디올과 같은 내인성 리간드에 반응할 수 있다. 따라서, 변형된 ER-LBD 및 변형된 ER-LBD를 포함하는 키메라 단백질의 비-내인성 리간드에 대한 민감도 및/또는 선택성의 개선은 유전자 조절을 제어하기 위한 ER 기반 시스템의 사용을 허용한다.

서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열을 포함하는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)이 본원에 제공되며, 여기서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환 및 하나 이상의 추가 아미노산 치환을 포함하되, 하나 이상의 추가 아미노산 치환은 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내에 존재하고, 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 또는 내인성 리간드와 비교했을 때 하나 이상의 추가 아미노산 치환의 결과로 비-내인성 리간드에 대해 더 큰 민감도 및/또는 선택성을 갖는다 일부 양태에서, 변형된 ER-LBD는 V595A 아미노산 치환을 추가로 포함한다. 일부 양태에서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.

일부 양태에서, 하나 이상의 추가 아미노산 치환은 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 354, 380, 384, 386, 387, 388, 389, 391, 392, 404, 407, 409, 413, 414, 417, 418, 420, 421, 422, 424, 428, 463, 517, 521, 522, 524, 525, 526, 527, 528, 533, 534, 536, 537, 538, 539, 540, 및 547로 이루어진 군으로부터 선택된 서열번호 1의 하나 이상의 위치에 존재한다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 343을 포함한다. 일부 양태에서, 서열번호 1의 위치 343에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M343F, M343I, M343L, 및 M343V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 344를 포함한다. 일부 양태에서, 서열번호 1의 위치 344에서의 아미노산 치환은 G344M이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 345를 포함한다. 일부 양태에서, 서열번호 1의 위치 345에서의 아미노산 치환은 L345S이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 346을 포함한다. 일부 양태에서, 서열번호 1의 위치 346에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L346I, L346M, L346F, 및 L346V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 347을 포함한다. 일부 양태에서, 서열번호 1의 위치 347에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: T347D, T347E, T347F, T347I, T347K, T347L, T347M, T347N, T347Q, T347R, T347S, 및 T347V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 348을 포함한다. 일부 양태에서, 서열번호 1의 위치 348에서의 아미노산 치환은 N348K이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 349를 포함한다. 일부 양태에서, 서열번호 1의 위치 349에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L349I, L349M, L349F, 및 L349V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 350을 포함한다. 일부 양태에서, 서열번호 1의 위치 350에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: A350F, A350I, A350L, A350M 및 A350V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 351을 포함한다. 일부 양태에서, 서열번호 1의 위치 351에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: D351E, D351F, D351I, D351L, D351M, D351N, D351Q, 및 D351V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 352를 포함한다. 일부 양태에서, 서열번호 1의 위치 352에서의 아미노산 치환은 R352K이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 354를 포함한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L354I, L354M, L354F, 및 L354V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 380을 포함한다. 일부 양태에서, 서열번호 1의 위치 380에서의 아미노산 치환은 E380Q이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 384를 포함한다. 일부 양태에서, 서열번호 1의 위치 384에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L384I, L384M, L384F, 및 L384V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 386을 포함한다. 일부 양태에서, 서열번호 1의 위치 386에서의 아미노산 치환은 I386V이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 387을 포함한다. 일부 양태에서, 서열번호 1의 위치 387에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L387I, L387M, L387F, 및 L387V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 388을 포함한다. 일부 양태에서, 서열번호 1의 위치 388에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M388I, M388L, 및 M388F.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 389를 포함한다. 일부 양태에서, 서열번호 1의 위치 389에서의 아미노산 치환은 I389M이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 391을 포함한다. 일부 양태에서, 서열번호 1의 위치 391에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L391I, L391M, L391F, 및 L391V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 392를 포함한다. 일부 양태에서, 서열번호 1의 위치 392에서의 아미노산 치환은 V392M이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 404를 포함한다. 일부 양태에서, 서열번호 1의 위치 404에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: F404I, F404L, F404M, 및 F404V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 407을 포함한다. 일부 양태에서, 서열번호 1의 위치 407에서의 아미노산 치환은 N407D이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 409를 포함한다. 일부 양태에서, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 413을 포함한다. 일부 양태에서, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 414를 포함한다. 일부 양태에서, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 417을 포함한다. 일부 양태에서, 서열번호 1의 위치 417에서의 아미노산 치환은 C417S이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 418을 포함한다. 일부 양태에서, 서열번호 1의 위치 418에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V418I, V418L, V418M, 및 V418F.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 420을 포함한다. 일부 양태에서, 서열번호 1의 위치 420에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: G420I, G420M, G420F, 및 G420V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 421을 포함한다. 일부 양태에서, 서열번호 1의 위치 421에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M421I, M421L, M421F, 및 M421V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 422를 포함한다. 일부 양태에서, 서열번호 1의 위치 422에서의 아미노산 치환은 V422I이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 424를 포함한다 1. 일부 양태에서, 서열번호 1의 위치 424에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: I424L, I424M, I424F, 및 I424V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 428을 포함한다. 일부 양태에서, 서열번호 1의 위치 428에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L428I, L428M, L428F, 및 L428V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 463을 포함한다. 일부 양태에서, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 517을 포함한다 1. 일부 양태에서, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 521을 포함한다. 일부 양태에서, 서열번호 1의 위치 521에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: G521A, G521F, G521I, G521L, G521M, 및 G521V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 522를 포함한다. 일부 양태에서, 서열번호 1의 위치 522에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M522I, M522L, 및 M522V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 524를 포함한다. 일부 양태에서, 서열번호 1의 위치 524에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다. H524A, H524I, H524L, H524F, 및 H524V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 525를 포함한다. 일부 양태에서, 서열번호 1의 위치 525에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L525F, L525I, L525M, L525N, L525Q, L525S, L525T, 및 L525V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 526을 포함한다. 일부 양태에서, 서열번호 1의 위치 526에서의 아미노산 치환은 Y526L이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 527을 포함한다. 일부 양태에서, 서열번호 1의 위치 527에서의 아미노산 치환은 S527N이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 528을 포함한다. 일부 양태에서, 서열번호 1의 위치 528에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M528F, M528I, 및 M528V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 533을 포함한다. 일부 양태에서, 서열번호 1의 위치 533에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V533F 및 V533W.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 534를 포함한다. 일부 양태에서, 서열번호 1의 위치 534에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V534Q 및 V534R.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 536을 포함한다. 일부 양태에서, 서열번호 1의 위치 536에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L536F, 및 L536M, L536R, 및 L536Y.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 537을 포함한다. 일부 양태에서, 서열번호 1의 위치 537에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: Y537E 및 Y537S.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 538을 포함한다. 일부 양태에서, 서열번호 1의 위치 538에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: D538G 및 D538K.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 539를 포함한다. 일부 양태에서, 서열번호 1의 위치 539에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L539A 및 L539R.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 540을 포함한다. 일부 양태에서, 서열번호 1의 위치 540에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L540A 및 L540F.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 547을 포함한다. 일부 양태에서, 서열번호 1의 위치 547에서의 아미노산 치환은 H547A이다.

일부 양태에서, 하나 이상의 추가 아미노산 치환은 2개의 아미노산 치환이다. 일부 양태에서, 2개의 아미노산 치환 각각은 343, 345, 347, 348, 351, 354, 384, 387, 388, 389, 391, 392, 404, 418, 421, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 있다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 345 및 348에 존재하고, 여기서 서열번호 1의 위치 345에서의 아미노산 치환은 L345S이고, 서열번호 1의 위치 348에서의 아미노산 치환은 N348K이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 389에 존재하고, 여기서 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 389에서의 아미노산 치환은 I389M이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 421 및 392에 존재하고, 여기서 서열번호 1의 위치 421에서의 아미노산 치환은 M421I이고, 서열번호 1의 위치 392에서의 아미노산 치환은 V392M이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 391에 존재하고, 여기서 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 384에 존재하고, 여기서 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 387에 존재하고, 여기서 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 387 및 391에 있고, 여기서 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 387에 있고, 여기서 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이다. 일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 391에 있고, 여기서 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다.

일부 양태에서, 하나 이상의 아미노산 치환은 3개의 아미노산 치환이다. 일부 양태에서, 3개의 아미노산 치환 각각은 343, 347, 351, 354, 388, 391, 404, 414, 418, 463, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재한다. 일부 양태에서, 3개의 아미노산 치환은 서열번호 1의 위치 354, 384, 및 391에 존재하되, 여기서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다. 일부 양태에서, 3개의 아미노산 치환은 서열번호 1의 위치 414, 463, 및 524에 존재하되, 여기서 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다.

일부 양태에서, 하나 이상의 아미노산 치환은 4개의 아미노산 치환이다. 일부 양태에서, 4개의 아미노산 치환 각각은 343, 347, 351, 354, 384, 388, 391, 404, 413, 418, 463, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재한다. 일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 418에 존재하되, 여기서 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이며, 서열번호 1의 위치 418에서의 아미노산 치환은 V418I이다. 일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 343, 388, 521, 및 404에 존재하되, 여기서 서열번호 1의 위치 343에서의 아미노산 치환은 M343I이며, 서열번호 1의 위치 388에서의 아미노산 치환은 M388I이고, 서열번호 1의 위치 521에서의 아미노산 치환은 G521I이며, 서열번호 1의 위치 404에서의 아미노산 치환은 F404L이다. 일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 524, 347, 351, 및 525에 존재하되, 여기서, 서열번호 1의 위치 524에서의 아미노산 치환은 H524V이고, 서열번호 1의 위치 347에서의 아미노산 치환은 T347R이며, 서열번호 1의 위치 351에서의 아미노산 치환은 D351Q이고, 서열번호 1의 위치 525에서의 아미노산 치환은 L525N이다. 일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 463에 존재하되, 여기서 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이다. 일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 및 524에 존재하되, 여기서 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다.

일부 양태에서, 하나 이상의 추가 아미노산 치환은 5개의 아미노산 치환이다. 일부 양태에서, 5개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재한다. 일부 양태에서, 5개의 아미노산 치환은 서열번호 1의 위치 384, 409, 413, 463, 및 524에 존재하되, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다. 일부 양태에서, 5개의 아미노산 치환은 서열번호 1의 위치 391, 413, 414, 463, 및 524에 존재하되, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다. 일부 양태에서, 5개의 아미노산 치환은 서열번호 1의 위치 391, 414, 421, 463 및 524에 존재하되, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다. 일부 양태에서, 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 413, 421, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다. 일부 양태에서, 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 421, 463, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다.

일부 양태에서, 하나 이상의 아미노산 치환은 6개의 아미노산 치환이다. 일부 양태에서, 6개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재한다. 일부 양태에서, 6개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 421, 463, 및 524에 존재하되, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다. 일부 양태에서, 6개의 아미노산 치환은 서열번호 1의 위치 409, 413, 414, 421, 463, 및 524에 존재하되, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다. 일부 양태에서, 6개의 아미노산 치환은 서열번호 1의 위치 354, 391, 409, 413, 414, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다.

일부 양태에서, 하나 이상의 추가 아미노산 치환은 7개의 아미노산 치환이다. 일부 양태에서, 7개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 517, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 있다. 일부 양태에서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 384, 409, 413, 421, 463, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384 에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다. 일부 양태에서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 421, 463, 517, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이다. 일부 양태에서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 414, 421, 517, 및 524에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다.

일부 양태에서, 하나 이상의 아미노산 치환은 8개의 아미노산 치환이다. 일부 양태에서, 8개의 아미노산 치환은 서열번호 1의 위치 384, 391, 409, 413, 421, 463, 517, 및 524에 존재하되, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이다.

또한, 본원에 기술된 바와 같은 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질이 본원에 제공된다. 일부 양태에서, 관심 폴리펩티드는 핵산 결합 도메인을 포함한다. 일부 양태에서, 핵산 결합 도메인은 징크 핑거 도메인을 포함한다. 일부 양태에서, 핵산 결합 도메인은 징크 핑거 도메인을 포함한다. 일부 양태에서, 징크 핑거 도메인은 서열 MSRPGERPFQCRICMRNFSNMSNLTRHTRTHTGEKPFQCRICMRNFSDRSVLRRHLRTHTGSQKPFQCRICMRNFSDPSNLARHTRTHTGEKPFQCRICMRNFSDRSSLRRHLRTHTGSQKPFQCRICMRNFSQSGTLHRHTRTHTGEKPFQCRICMRNFSQRPNLTRHLRTHLRGS(서열번호 62)를 포함한다. 일부 양태에서, 키메라 단백질은 키메라 전사 인자를 포함하고, 관심 폴리펩티드는 핵산 결합 도메인 및 전사 조절자 도메인을 포함한다. 일부 양태에서, 전사 조절자 도메인은 전사 활성인자이다. 일부 양태에서, 전사 활성인자는 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP16의 4개의 탠덤 카피를 포함하는 활성화 도메인; VP64 활성화 도메인; NFκB의 p65 활성화 도메인(p65); 엡스타인-바 바이러스 R 트랜스활성인자(Rta) 활성화 도메인; VP64, p65, 및 Rta 활성화 도메인(VPR 활성화 도메인)을 포함하는 삼부 활성인자; VP64, p65, 및 HSF1 활성화 도메인(VPH 활성화 도메인)을 포함하는 삼부 활성인자; 및 인간 E1A 관련 단백질 p300의 히스톤 아세틸트랜스퍼라제 코어 도메인(p300 HAT 코어 활성화 도메인)으로 이루어진 군으로부터 선택된다. 일부 양태에서, 전사 조절인자 도메인은 아미노산 서열 DEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS(서열번호 64)를 포함하는 p65 전사 활성인자이다.

또한, 본원에 기술된 바와 같은 변형된 ER-LBD를 암호화하거나 본원에 기술된 바와 같은 키메라 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드 분자가 본원에 제공된다.

또한, 본원에 기술된 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물이 본원에 제공된다.

또한, 본원에 기술된 바와 같은 이종 작제물을 포함하는 플라스미드가 본원에 제공된다.

또한, 본원에 기술된 바와 같은 이종 작제물 또는 본원에 기술된 바와 같은 플라스미드를 포함하는 세포가 본원에 제공된다.

또한, (a) 본원에 기술된 바와 같은 키메라 단백질로서, 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터에 결합하는, 키메라 단백질; 및 (b) 비-내인성 리간드로서, 변형된 ER-LBD에 대한 비-내인성 리간드의 결합은 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 비-내인성 리간드를 포함하는, 관심 유전자의 전사를 조절하기 위한 유전자 스위치가 본원에 제공된다.

일부 양태에서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.

일부 양태에서, 관심 유전자는 사이토카인, 케모카인, 귀소 분자, 성장 인자, 세포 사멸 조절인자, 공동 활성화 분자, 종양 미세환경 조절인자 a, 수용체, 리간드, 항체, 폴리뉴클레오티드, 펩티드, 및 효소로 이루어진 군으로부터 선택된 폴리펩티드를 암호화한다.

일부 양태에서, 관심 유전자는 다음으로 이루어진 군으로부터 선택된 사이토카인을 암호화한다: IL1-베타, IL2, IL4, IL6, IL7, IL10, IL12, IL12p70 융합 단백질, IL15, IL17A, IL18, IL21, IL22, I형 인터페론, 인터페론-감마, 및 TNF-알파; 및/또는

일부 양태에서, 관심 유전자는 아미노산 서열 MCHQQLVISWFSLVFLASPLVAIWELKKDVYVVELDWYPDAPGEMVVLTCDTPEEDGITWTLDQSSEVLGSGKTLTIQVKEFGDAGQYTCHKGGEVLSHSLLLLHKKEDGIWSTDILKDQKEPKNKTFLRCEAKNYSGRFTCWWLTTISTDLTFSVKSSRGSSDPQGVTCGAATLSAERVRGDNKEYEYSVECQEDSACPAAEESLPIEVMVDAVHKLKYENYTSSFFIRDIIKPDPPKNLQLKPLKNSRQVEVSWEYPDTWSTPHSYFSLTFCVQVQGKSKREKKDRVFTDKTSATVICRKNASISVRAQDRYYSSSWSEWASVPCSGGGSGGGSGGGSGGGSRNLPVATPDPGMFPCLHHSQNLLRAVSNMLQKARQTLEFYPCTSEEIDHEDITKDKTSTVEACLPLELTKNESCLNSRETSFITNGSCLASRKTSFMMALCLSSIYEDLKMYQVEFKTMNAKLLMDPKRQIFLDQNMLAVIDELMQALNFNSETVPQKSSLEEPDFYKTKIKLCILLHAFRIRAVTIDRVMSYLNAS(서열번호 58)를 포함하는 IL12p70 융합 단백질을 암호화한다.

또한, (i) 본원에 기술된 키메라 단백질을 암호화하는 이종 작제물 및 (ii) 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트로 세포를 형질전환시키는 단계, 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 단계를 포함하는, 관심 유전자의 전사를 조절하는 방법이 본원에 제공된다. 일부 양태에서, 방법은 키메라 단백질이 전사를 조절하도록 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함한다. 일부 양태에서, 전사를 조절하는 단계는 관심 유전자의 전사를 활성화시키는 단계를 포함한다. 일부 양태에서, 표적 발현 카세트는 본원에 기술된 키메라 단백질을 암호화하는 이종 작제물에 의해 암호화되거나, 표적 발현 카세트는 제2 이종 작제물에 의해 암호화된다. 일부 양태에서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.

또한, 키메라 단백질의 국소화를 조절하는 방법이 본원에 제공되되, 방법은 본원에 기술된 키메라 단백질을 암호화하는 이종 작제물로 세포를 형질전환시키는 단계, 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질의 핵 국소화를 유도하는 단계를 포함한다. 일부 양태에서, 방법은 핵 국소화를 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함한다. 일부 양태에서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.

일부 양태에서, 형질전환된 세포는 인간 또는 동물에 존재하며, 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 리간드의 약리학적 용량을 인간 또는 동물에 투여하는 단계를 포함한다.

일부 양태에서, 비-내인성 리간드는 서열번호 1의 야생형 에스트로겐 수용체 알파 상에서 비-내인성 리간드가 실질적으로 불활성인 농도로 투여된다.

서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열 및 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내의 하나 이상의 추가 아미노산 치환을 포함하는 변형된 ER-LBD가 본원에 제공된다. 일부 양태에서, 본원에 기술된 바와 같은 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환을 추가로 포함한다. 일부 양태에서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, L544A, 및 V595A 아미노산 치환을 추가로 포함한다.

일부 양태에서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A, 아미노산 치환 및 하나 이상의 추가 아미노산 치환을 포함한다. 일부 양태에서, 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는다. 일부 양태에서, 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 선택성을 갖는다.

일부 양태에서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, L544A 아미노산 치환, 및 V595A 아미노산 치환, 및 하나 이상의 추가 아미노산 치환을 포함한다. 일부 양태에서, 변형된 ER-LBD는 서열번호 3의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는다. 일부 양태에서, 변형된 ER-LBD는 서열번호 3의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 선택성을 갖는다.

일부 양태에서, 본 개시의 변형된 ER-LBD는 하나 이상의 추가 아미노산 치환의 결과로서 내인성 리간드와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는다.

일부 양태에서, 본 개시의 변형된 ER-LBD는 서열번호 2 또는 서열번호 3의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는다.

일부 양태에서, 본 개시의 변형된 ER-LBD는 서열번호 2 또는 서열번호 3의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 선택성을 갖는다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 343을 포함한다. 일부 양태에서, 위치 343에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M343F, M343I, M343L, 및 M343V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 344를 포함한다. 일부 양태에서, 위치 344에서의 아미노산 치환은 G344M이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 345를 포함한다. 일부 양태에서, 위치 345에서의 아미노산 치환은 L345S이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 346을 포함한다. 일부 양태에서, 위치 346에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L346I, L346M, L346F, 및 L346V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 347을 포함한다. 일부 양태에서, 위치 347에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: T347D, T347E, T347F, T347I, T347K, T347L, T347M, T347N, T347Q, T347R, T347S, 및 T347V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 348을 포함한다. 일부 양태에서, 위치 348에서의 아미노산 치환은 N348K이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 349를 포함한다. 일부 양태에서, 위치 349에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L349I, L349M, L349F, 및 L349V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 350을 포함한다. 일부 양태에서, 위치 350에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: A350F, A350I, A350L, A350M 및 A350V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 351을 포함한다. 일부 양태에서, 위치 351에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: D351E, D351F, D351I, D351L, D351M, D351N, D351Q, 및 D351V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 352를 포함한다. 일부 양태에서, 위치 352에서의 아미노산 치환은 R352K이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 354를 포함한다. 일부 양태에서, 위치 354에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L354I, L354M, L354F, 및 L354V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 380을 포함한다. 일부 양태에서, 위치 380에서의 아미노산 치환은 E380Q이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 384를 포함한다. 일부 양태에서, 위치 384에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L384I, L384M, L384F, 및 L384V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 386을 포함한다. 1. 일부 양태에서, 위치 386에서의 아미노산 치환은 I386V이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 387을 포함한다. 일부 양태에서, 위치 387에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L387I, L387M, L387F, 및 L387V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 388을 포함한다. 일부 양태에서, 위치 388에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M388I, M388L, 및 M388F.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 389를 포함한다. 일부 양태에서, 위치 389에서의 아미노산 치환은 I389M이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 391을 포함한다. 일부 양태에서, 위치 391에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L391I, L391M, L391F, 및 L391V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 392를 포함한다. 일부 양태에서, 위치 392에서의 아미노산 치환은 V392M이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 404를 포함한다. 일부 양태에서, 위치 404에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: F404I, F404L, F404M, 및 F404V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 407을 포함한다. 일부 양태에서, 위치 407에서의 아미노산 치환은 N407D이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 409를 포함한다. 일부 양태에서, 위치 409에서의 아미노산 치환은 L409V이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 413을 포함한다. 일부 양태에서, 위치 413에서의 아미노산 치환은 N413D이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 414를 포함한다. 일부 양태에서, 위치 414에서의 아미노산 치환은 Q414E이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 417을 포함한다. 일부 양태에서, 위치 417에서의 아미노산 치환은 C417S이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 418을 포함한다. 일부 양태에서, 위치 418에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V418I, V418L, V418M, 및 V418F.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 420을 포함한다. 일부 양태에서, 위치 420에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: G420I, G420M, G420F, 및 G420V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 421을 포함한다. 일부 양태에서, 위치 421에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M421I, M421L, M421F, 및 M421V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 422를 포함한다. 일부 양태에서, 위치 422에서의 아미노산 치환은 V422I이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 424를 포함한다. 일부 양태에서, 위치 424에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: I424L, I424M, I424F, 및 I424V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 428을 포함한다. 일부 양태에서, 위치 428에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L428I, L428M, L428F, 및 L428V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 463을 포함한다. 일부 양태에서, 위치 463에서의 아미노산 치환은 S463P이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 517을 포함한다. 일부 양태에서, 위치 517에서의 아미노산 치환은 M517A이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 521을 포함한다. 일부 양태에서, 위치 521에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: G521A, G521F, G521I, G521L, G521M, 및 G521V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 522를 포함한다. 일부 양태에서, 위치 522에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M522I, M522L, 및 M522V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 524를 포함한다. 일부 양태에서, 위치 524에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: H524A, H524I, H524L, H524F, 및 H524V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 525를 포함한다. 일부 양태에서, 위치 525에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L525F, L525I, L525M, L525N, L525Q, L525S, L525T, 및 L525V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 526을 포함한다. 일부 양태에서, 위치 526에서의 아미노산 치환은 Y526L이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 527을 포함한다. 일부 양태에서, 위치 527에서의 아미노산 치환은 S527N이다.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 528을 포함한다. 일부 양태에서, 위치 528에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: M528F, M528I, 및 M528V.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 533을 포함한다. 일부 양태에서, 위치 533에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V533F 및 V533W.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 534를 포함한다. 일부 양태에서, 위치 534에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: V534Q 및 V534R.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 536을 포함한다. 일부 양태에서, 위치 536에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L536F, 및 L536M, L536R, 및 L536Y.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 537을 포함한다. 일부 양태에서, 위치 537에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: Y537E 및 Y537S.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 538을 포함한다. 일부 양태에서, 위치 538에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: D538G 및 D538K.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 539를 포함한다. 일부 양태에서, 위치 539에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L539A 및 L539R.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 540을 포함한다. 일부 양태에서, 위치 540에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택된다: L540A 및 L540F.

일부 양태에서, 하나 이상의 위치는 서열번호 1의 위치 547을 포함한다. 일부 양태에서, 위치 547에서의 아미노산 치환은 H547A이다.

일부 양태에서, 하나 이상의 추가 아미노산 치환은 2개의 아미노산 치환을 포함한다. 일부 양태에서, 2개의 아미노산 치환 각각은 343, 345, 347, 348, 351, 354, 384, 387, 388, 389, 391, 392, 404, 418, 421, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 있다.

일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 345 및 348에 존재한다. 일부 양태에서, 위치 345에서의 아미노산 치환은 L345S이고 서열번호 1의 위치 348에서의 아미노산 치환은 N348K이다.

일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 389에 존재한다. 일부 양태에서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 389에서의 아미노산 치환은 I389M이다.

일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 421 및 392에 존재한다. 일부 양태에서, 서열번호 1의 위치 421에서의 아미노산 치환은 M421I이고 서열번호 1의 위치 392에서의 아미노산 치환은 V392M이다.

일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 391에 존재한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다.

일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 384에 존재한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이다.

일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 387에 존재한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이다.

일부 양태에서, 2개의 아미노산 치환은 위치 387 및 391에 존재한다. 일부 양태에서, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다.

일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 387에 존재한다. 일부 양태에서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이다.

일부 양태에서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 391에 존재한다. 일부 양태에서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다.

일부 양태에서, 하나 이상의 추가 아미노산 치환은 3개의 아미노산 치환을 포함한다. 일부 양태에서, 3개의 아미노산 치환 각각은 343, 347, 351, 354, 388, 391, 404, 418, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재한다.

일부 양태에서, 3개의 아미노산 치환은 서열번호 1의 위치 354, 384, 및 391에 존재한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이다.

일부 양태에서, 하나 이상의 추가 아미노산 치환은 4개의 아미노산 치환을 포함한다.

일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 418에 존재한다. 일부 양태에서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고, 서열번호 1의 위치 418에서의 아미노산 치환은 V418I이다.

일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 343, 388, 521, 및 404에 존재한다. 일부 양태에서, 서열번호 1의 위치 343에서의 아미노산 치환은 M343I이고, 서열번호 1의 위치 388에서의 아미노산 치환은 M388I이며, 서열번호 1의 위치 521에서의 아미노산 치환은 G521I이고, 서열번호 1의 위치 404에서의 아미노산 치환은 F404L이다.

일부 양태에서, 4개의 아미노산 치환은 서열번호 1의 위치 524, 347, 351, 및 525에 존재한다. 일부 양태에서, 서열번호 1의 위치 524에서의 아미노산 치환은 H524V이고, 서열번호 1의 위치 347에서의 아미노산 치환은 T347R이며, 서열번호 1의 위치 351에서의 아미노산 치환은 D351Q이고, 서열번호 1의 위치 525에서의 아미노산 치환은 L525N이다.

일부 양태에서, 비-내인성 리간드는 4-하이드록시타목시펜(4-OHT), N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.

또한, 본원에 기술된 바와 같은 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질이 제공된다. 일부 양태에서, 관심 폴리펩티드는 핵산 결합 도메인을 포함한다. 일부 양태에서, 핵산 결합 도메인은 징크 핑거(ZF) 도메인을 포함한다. 일부 양태에서, 키메라 단백질은 전사 인자이고, 관심 폴리펩티드는 전사 조절인자 도메인을 포함한다.

또한, 본원에 기술된 바와 같은 변형된 ER-LBD 또는 본원에 기술된 바와 같은 키메라 단백질을 암호화하는 단리된 폴리뉴클레오티드 분자가 제공된다.

또한, 본원에 기술된 바와 같은 변형된 ER-LBD 또는 본원에 기술된 바와 같은 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물이 제공된다.

또한, 본원에 기술된 바와 같은 이종 작제물을 포함하는 플라스미드가 제공된다.

또한, 본원에 기술된 바와 같은 이종 작제물 또는 본원에 기술된 바와 같은 플라스미드를 포함하는 세포(예컨대 단리된 세포 또는 세포 집단)가 제공된다.

또한, 관심 유전자의 전사를 조절하기 위한 유전자 스위치가 제공된다. 일부 양태에서, 유전자 스위치는 본원에 기술된 바와 같은 변형된 ER-LBD 및 전사 조절인자를 포함하는 키메라 단백질 및 비-내인성 리간드를 포함하되, 변형된 ER-LBD에 대한 비-내인성 리간드의 결합은 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도한다. 일부 양태에서, 유전자 스위치의 비-내인성 리간드는 4-하이드록시타목시펜(4-OHT), N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.

또한, 관심 유전자의 전사를 조절하는 방법이 본원에 제공된다. 일부 양태에서, 방법은 (a) (i) 변형된 ER-LBD 및 전사 조절인자 도메인을 포함하는 키메라 단백질을 암호화하는 이종 작제물, 및 (ii) 관심 유전자를 포함하는 표적 발현 카세트로 세포를 형질전환시키는 단계; (b) 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계; 및

(c) 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 단계를 포함한다.

일부 양태에서, 전사를 조절하는 방법은 전사를 활성화하는 방법이다.

일부 양태에서, 전사를 조절하는 방법은 전사를 억제하는 방법이다.

일부 양태에서, 표적 발현 카세트는 키메라를 암호화하는 이종 작제물에 의해 암호화된다.

일부 양태에서, 표적 발현 카세트는 키메라를 암호화하는 이종 작제물과 상이한 이종 작제물에 의해 암호화된다.

또한, 관심 폴로 펩티드의 국소화를 조절하는 방법이 제공된다. 일부 양태에서, 방법은 (a) 본원에 기술된 바와 같은 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질을 암호화하는 이종 작제물로 세포를 형질전환시키는 단계; (b) 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계; 및 (c) 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질의 핵 국소화를 유도하는 단계를 포함한다.

일부 양태에서, 본원에 기술된 방법 중 어느 하나의 형질전환된 세포는 인간 또는 동물에 존재한다. 일부 양태에서, 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 리간드의 약리학적 용량을 인간 또는 동물에게 투여하는 단계를 포함한다.

일부 양태에서, 이전에 기술된 방법의 단계 (c)의 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택된다.

일부 양태에서, 비-내인성 리간드는 야생형 에스트로겐 수용체 알파 상에서 비-내인성 리간드가 실질적으로 불활성인 농도로 투여된다.

본 개시의 이들 및 다른 특징, 양태, 및 이점은 하기 설명, 및 첨부 도면과 관련하여 더 잘 이해될 것이다.
도 1a 및 도 1b는 인 실리코 분석된 제1 돌연변이 세트에 대한 결합 에너지 계산을 제공한다. 도 1a는 에스트라디올에 결합하기 위한 결합 에너지 계산을 제공하며, 도 1b는 4-OHT에 결합하기 위한 결합 에너지 계산을 제공한다.
도 2는 인 실리코 분석된 제2 돌연변이 세트에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 3은 인 실리코 분석된 제3 세트의 돌연변이에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 4는 인 실리코 분석된 제4 세트의 돌연변이에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 5는 인 실리코 분석된 제5 돌연변이 세트에 대한 4-OHT 결합에 대한 결합 에너지 계산을 제공한다.
도 6은 나선 12의 배향 및 도킹 부위에서 에스트라디올-결합 및 비-내인성 리간드-결합 형태 사이의 구조적 차이를 보여준다.
도 7은 인 실리코 분석된 제6 돌연변이 세트에 대한, 작용제-결합 대 길항제-결합 형태에 대한 결합 에너지 계산을 제공한다.
도 8a, 도 8b 및 도 8c는 제1 형질감염 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 9a, 도 9b, 및 도 9c는 제2 형질감염 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 10a, 도 10b 및 도 10c는 제3 형질감염 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 11a 및 도 11b는 제1 형질도입 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 12는 제2 형질도입 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 13은 제2 형질도입 스크리닝에서 분석했을 때, 다양한 농도의 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 14a 및 도 14b는 ERT2(SB04401) 및 OFF mCherry 리포터 작제물(SB01066)의 고 처리량 단백질 조작을 위한 백본을 보여준다.
도 15a 및 도 15b는 조합 라이브러리 스크리닝에서 분석했을 때, 다양한 농도의 엔독시펜 및 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다.
도 16a, 도 16b, 도 16c, 및 도 16d는 검증 스크리닝에서 분석했을 때, 다양한 농도의 엔독시펜, 4-OHT, 및 에스트라디올에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다. SB03422는 야생형 ER-LBD이며 성능의 벤치마크로서 포함된다.
도 17a 및 도 17b는 NK 세포에서 분석했을 때, 다양한 농도의 엔독시펜 및 4-OHT에 걸쳐 다양한 변형된 ER-LBD가 리포터 발현에 미치는 효과를 보여준다. 화살표는 인간에서 추정된 약리학적으로 관련된 4-OHT 또는 엔독시펜 농도를 나타낸다.
도 18a 및 도 18b는 NK 세포에서 분석했을 때, 다양한 농도의 엔독시펜에 걸쳐 다양한 변형된 ER-LBD가 IL-12 발현에 미치는 효과를 보여준다.

청구범위 및 명세서에 사용된 용어는 달리 명시되지 않는 한 다음과 같이 정의된다.

용어 "생체 내"는 살아있는 유기체에서 일어나는 과정을 지칭한다.

본원에서 사용되는 용어 "포유동물"은 인간 및 비인간 둘 모두를 포함하고 인간, 비인간 영장류, 개과, 고양이과, 쥣과, 소, 말, 및 돼지를 포함하지만 이에 제한되지는 않는다.

2개 이상의 핵산 또는 폴리펩티드 서열의 맥락에서, 용어 백분율 "동일성"은 하기에 기술된 서열 비교 알고리즘(예를 들어, BLASTP 및 BLASTN 또는 당업자가 이용할 수 있는 기타 알고리즘) 중 하나를 사용하여 또는 육안 검사에 의해 측정된 바와 같이, 최대 일치를 위해 비교되고 정렬될 때 동일한 뉴클레오티드 또는 아미노산 잔기의 특정 백분율을 갖는 2개 이상의 서열 또는 하위서열을 지칭한다. 적용에 따라, 백분율 "동일성"은 비교되는 서열의 영역에 걸쳐, 예를 들어, 기능적 도메인에 걸쳐 존재할 수 있거나, 대안적으로, 비교될 2개의 서열의 전체 길이에 걸쳐 존재할 수 있다.

서열 비교에 대해, 통상적으로 하나의 서열이 시험 서열이 비교되는 참조 서열 역할을 한다. 서열 비교 알고리즘을 사용하는 경우, 시험 서열과 참조 서열을 컴퓨터에 입력하고 필요에 따라 하위 서열 좌표를 지정하고, 서열 알고리즘 프로그램 매개변수를 지정한다. 그런 다음 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로 참조 서열에 대한 시험 서열(들)의 백분율 서열 동일성을 계산한다.

비교를 위한 서열의 최적 정렬은 예를 들어, Smith & Waterman의 문헌[Adv. Appl. Math. 2:482 (1981)]의 국소적 상동성 알고리즘에 의해, Needleman & Wunsch의 문헌[J. Mol. Biol. 48:443 (1970)]의 상동성 정렬 알고리즘에 의해, Pearson & Lipman의 문헌[Proc. Nat'l. Acad. Sci. USA 85:2444 (1988)]의 유사성 검색 방법에 의해, 이러한 알고리즘(Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis.의 GAP, BESTFIT, FASTA, 및 TFASTA)의 컴퓨터 구현에 의해, 또는 육안 검사에 의해(일반적으로 하기 Ausubel et al. 참조) 수행될 수 있다.

백분율 서열 동일성 및 서열 유사성을 결정하는데 적합한 알고리즘의 한 예는 BLAST 알고리즘이고, 이는 Altschul 등의 문헌[J. Mol. Biol. 215:403-410 (1990)]에 기재되어 있다. BLAST 분석을 수행하기 위한 소프트웨어는 국립 생명공학 정보 센터를 통해 공개적으로 제공된다 (www.ncbi.nlm.nih.gov/).

용어 "충분한 양"은 원하는 효과를 생성하기에 충분한 양, 예를 들어 세포에서 단백질 응집을 조절하기에 충분한 양을 의미한다.

용어 "치료적 유효량"은 질환의 증상을 개선하는데 효과적인 양이다. 치료적 유효량은 예방이 요법으로 간주될 수 있기 때문에 "예방적 유효량"일 수 있다.

명세서 및 첨부된 청구범위에 사용된 바와 같이 단수형 "a", "an" 및 "the"는 문맥에서 명백하게 달리 지시하지 않는 한 복수의 지시 대상을 포함한다는 점에 유의해야 한다.

변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)

본 개시는 서열번호 1(인간 에스트로겐 수용체, UniProt ID 번호: P03372)의 아미노산 282~595에 상응하는 아미노산 서열을 포함하고, 아미노산 치환 G400V, M543A, 및 L544A 또는 아미노산 치환G400V, M543A, L544A, 및 V595A를 포함하고, 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로부터 선택된 서열번호 1의 영역 내 리간드 결합 잔기에 대해 하나 이상의 추가 아미노산 치환을 포함하는, 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)을 제공한다. 일부 양태에서, 하나 이상의 아미노산 치환은 다음을 초래한다: (a) 내인성 리간드와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도, (b) 서열번호 2 또는 서열번호 3의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도, 및/또는 (c) 서열번호 2 또는 서열번호 3의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 선택성.

일부 양태에서, 하나 이상의 추가 아미노산 치환은 다음을 초래한다: (a) 내인성 리간드와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도, (b) 서열번호 2 또는 서열번호 3의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도, 및/또는 (c) 서열번호 2 또는 서열번호 3의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 선택성. 일부 구현예에서, 하나 이상의 추가 아미노산 치환은 서열번호 2의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도를 초래한다. 일부 구현예에서, 하나 이상의 추가 아미노산 치환은 서열번호 2의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 민감도를 초래한다. 일부 구현예에서, 하나 이상의 추가 아미노산 치환은 서열번호 2의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 선택성을 초래한다. 일부 구현예에서, 하나 이상의 추가 아미노산 치환은 서열번호 3의 ER-LBD와 비교했을 때 비-내인성 리간드에 대한 더 큰 선택성을 초래한다.

"리간드 결합 잔기"는 에스트로겐 수용체(ER) 또는 ER-리간드 결합 도메인의 리간드 결합 포켓에 위치한 잔기를 지칭하며, 내인성 리간드(예를 들어, 에스트라디올)에 결합하기 위한 포켓 및 4-OHT와 같은 비-내인성 리간드에 결합하기 위한 포켓을 포함한다. 서열번호 1에 상응하는 위치 343~354, 위치 380~392 및 위치 404~463 내의 잔기는 내인성 및 비-내인성 리간드 둘 모두에 대한 결합에 관여한다. 서열번호 1에 상응하는 위치 517~547 내의 잔기(예를 들어, 잔기 517~40 및 잔기 547)는 나선 12로 지칭되는 나선 내에 위치하고 내인성 리간드 결합에 관여한다.

비-내인성 리간드에 대한 민감도에 비해 비-내인성 리간드에 대한 민감도가 더 높다는 것은 변형된 ER-LBD가 내인성 리간드(예를 들어, 에스트라디올)에 대한 결합의 친화도에 비해 더 높은 친화도로 비-내인성 리간드(예를 들어, 엔독시펜)에 결합한다는 것을 의미한다.

하나 이상의 아미노산 치환을 포함하지 않는 ER-LBD(예를 들어, 서열번호 2 또는 서열번호 3의 아미노산 서열을 포함하는 ER-LBD)의 민감도에 비해 비-내인성 리간드에 대한 민감도가 더 높다는 것은 변형된 ER-LBD가 하나 이상의 추가 아미노산 치환을 포함하지 않는 ER-LBD의 비-내인성 리간드에 대한 결합 친화도에 비해 더 높은 친화도로 비-내인성 리간드(예를 들어, 엔독시펜)에 결합한다는 것을 의미한다. 일부 구현예에서, 더 높은 민감도는 하나 이상의 추가 아미노산 치환을 포함하지 않는 ER-LBD의 결합과 비교했을 때, 비-내인성 리간드에 대한 결합 친화도가 적어도 1.5배, 적어도 2배, 적어도 3배, 적어도 4배, 또는 적어도 5배의 개선이다. 일부 구현예에서, 더 큰 민감도는 하나 이상의 추가 아미노산 치환이 결여된 ER-LBD를 포함하는 키메라 전사 인자와 비교하여, 변형된 ER-LBD를 포함하는 키메라 전사 인자의 더 큰 전사 조절(예를 들어, 더 큰 전사 활성화 또는 더 큰 전사 억제)에 의해 입증된다. 일부 구현예에서, 형질도입 검정의 형질감염에서, 변형된 ER-LBD를 포함하는 키메라 전사 인자는 (리포터에 대해 양성인 세포의 %로 측정했을 때, 또는 기하학적 평균 형광 강도에 의해 측정했을 때) 비-내인성 리간드(예를 들어, 4-OHT)에 반응하여 키메라 전사 반응성 프로모터의 조절 하에 리포터의 발현을 동일한 조건 하에 하나 이상의 추가 아미노산 치환이 결여된 ER-LBD를 갖는 리포터의 발현과 비교하여 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 또는 적어도 35% 더 크게 유도할 수 있다.

비-내인성 리간드에 대한 더 큰 선택성은 내인성 리간드(예를 들어, 에스트라디올)에 비해 비-내인성 리간드(예를 들어, 4-OHT 또는 엔독시펜)에 대한 우선적인 결합을 지칭한다. 선택성은, 기질(예를 들어, 변형된 ER-LBD)과의 복합체에서 다른 리간드(예를 들어, 내인성 리간드)의 하나의 리간드(예를 들어, 비-내인성 리간드)에 의한 치환 반응에 대한 평형 상수인 선택성 계수를 사용하여 측정될 수 있다. 선택성 계수가 클수록, 경쟁 리간드(예를 들어, 내인성 리간드)가 기질(예를 들어, 변형된 ER-LBD)과 형성된 복합체로부터 초기 리간드(예를 들어, 비-내인성 리간드)를 더 많이 치환할 것이다. 일부 구현예에서, 내인성 리간드의 존재 시의 전사 조절과 비교했을 때, 비-내인성 리간드의 존재 시 키메라 전사 인자의 전사 조절의 개선에 의해 더 큰 선택성이 입증된다. 일부 구현예에서, 형질도입 검정의 형질감염에서, 변형된 ER-LBD를 포함하는 키메라 전사 인자는 (리포터에 대해 양성인 세포의 %로 측정했을 때, 또는 기하학적 평균 형광 강도에 의해 측정했을 때) 비-내인성 리간드(예를 들어, 4-OHT)에 반응하여 키메라 전사 인자 반응 프로모터의 조절 하에 리포터의 발현을 동일한 조건 하에 내인성 리간드에 대한 리포터의 발현과 비교하여 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 또는 적어도 35% 더 크게 유도할 수 있다.

일부 양태에서, 리간드 결합 잔기에 대한 하나 이상의 아미노산 치환은 나선 12 내에서 하나 이상의 아미노산 치환을 포함한다. ER-LBD의 나선 12는 서열번호 1의 잔기 위치 533~547을 포함한다. 일부 구현예에서, 나선 12 내의 하나 이상의 아미노산 치환은 538, 536, 539, 540, 547, 534, 533, 및 537로부터 선택된 하나 이상의 위치에 존재한다.

"비-내인성 리간드"는, 예를 들어, 에스트로겐 수용체를 발현하는 유기체에 의해 자연적으로 발현되지 않는 합성 에스트로겐 수용체 결합 리간드를 지칭할 수 있다. 비-내인성 에스트로겐 수용체 결합 리간드는 타목시펜 및 이의 대사산물, 예컨대 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜을 포함하지만, 이에 한정되지 않는다.

하나 이상의 추가 아미노산 치환은 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 354, 380, 384, 386, 387, 388, 389, 391, 392, 404, 407, 409, 413, 414, 417, 418, 420, 421, 422, 424, 428, 463, 517, 521, 522, 524, 525, 526, 527, 528, 533, 534, 536, 537, 538, 539, 540, 및 547로부터 선택된 서열번호 1의 하나 이상의 위치에 존재한다. 일부 구현예에서, 하나 이상의 추가 아미노산 치환은 위에 열거된 위치 중 하나, 위에 열거된 위치 중 2개, 위에 열거된 위치 중 3개, 위에 열거된 위치 중 4개, 또는 위에 열거된 위치 중 5개에서의 치환을 포함한다.

일부 양태에서, 하나 이상의 추가 아미노산 치환은 하나 이상의 표 1에 열거된 치환으로부터 선택된다.

아미노산 치환
M343I	L349I	L384M	N413D	L428F	L525S
M343L	L349M	L384V	Q414E	M517A	Y526L
M343V	L349V	L384F	C417S	G521A	S527N
M343F	L349F	I386V	V418I	G521I	M528I
G344M	A350L	L387I	V418L	G521L	M528V
L345S	A350M	L387M	V418M	G521M	M528F
L346I	A350V	L387V	V418F	G521V	V533F
L346M	A350F	L387F	G420I	G521F	V533W
L346V	A350I	M388I	G420M	M522I	V534R
L346F	D351I	M388L	G420V	M522L	V534Q
T347I	D351L	M388F	G420F	M522V	L536F
T347L	D351M	I389M	M421I	H524A	L536M
T347M	D351N	L391I	M421L	H524I	L536Y
T347N	D351V	L391M	M421V	H524L	Y537E
T347R	D351E	L391V	M421F	H524V	D538K
T347V	D351F	L391F	V422I	H524F	L539R
T347D	D351Q	V392M	I424L	L525I	L539A
T347E	R352K	F404I	I424M	L525M	L540A
T347F	L354I	F404L	I424V	L525N	L540F
T347K	L354M	F404M	I424F	L525T	H547A
T347Q	L354V	F404V	L428I	L525V
T347S	L354F	N407D	L428M	L525F
N348K	L384I	L409V	L428V	L525Q

일부 양태에서, 하나 이상의 추가 돌연변이는 적어도 2개의 돌연변이, 적어도 3개의 돌연변이, 적어도 4개의 돌연변이, 적어도 5개의 돌연변이, 적어도 6개의 돌연변이, 적어도 7개의 돌연변이, 또는 적어도 8개의 돌연변이를 포함한다. 일부 양태에서, 하나 이상의 추가 돌연변이는 2개 내지 10개의 돌연변이, 2개 내지 9개의 돌연변이, 2개 내지 8개의 돌연변이, 2개 내지 7개의 돌연변이, 2개 내지 6개의 돌연변이, 2개 내지 5개의 돌연변이, 2개 내지 4개의 돌연변이, 2개 내지 3개의 돌연변이, 3개 내지 10개의 돌연변이, 3개 내지 9개의 돌연변이, 3개 내지 8개의 돌연변이, 3개 내지 7개의 돌연변이, 3개 내지 6개의 돌연변이, 3개 내지 5개의 돌연변이, 3개 내지 4개의 돌연변이, 4개 내지 10개의 돌연변이, 4개 내지 9개의 돌연변이, 4개 내지 8개의 돌연변이, 4개 내지 7개의 돌연변이, 4개 내지 6개의 돌연변이, 4개 내지 5개의 돌연변이, 5개 내지 10개의 돌연변이, 5개 내지 9개의 돌연변이, 5개 내지 8개의 돌연변이, 5개 내지 7개의 돌연변이, 5개 내지 6개의 돌연변이, 6개 내지 10개의 돌연변이, 6개 내지 9개의 돌연변이, 6개 내지 8개의 돌연변이, 6개 내지 7개의 돌연변이, 7개 내지 10개의 돌연변이, 7개 내지 9개의 돌연변이, 7개 내지 8개의 돌연변이, 8개 내지 10개의 돌연변이, 8개 내지 9개의 돌연변이, 또는 9 내지 10개의 돌연변이를 포함한다.

일부 양태에서, 하나 이상의 추가 돌연변이는 표 2에 열거된 돌연변이로부터 선택되는 적어도 2개의 돌연변이를 포함한다.

조합 아미노산 치환
L345S_N348K	L384M_L391F
L384M_I389M	L354I_L384M
M421I_V392M	L354I_L384M_L391F
L354I_L391F	L354I_L384M_L391F_V418I
L354I_L387M	M343I_M388I_G521I_F404L
L387M_L391F	H524V_T347R_D351Q_L525N
L384M_L387M	L354I_L384M_L391F_V418I
Q414E_S463P_H524L	L354I_L384M_L391V_S463P
L384M_L391V_N413D_H524F	L384M_ L409V_N413D_S463P_H524L
L391V_N413D_Q414E_S463P_H524F	L391V_Q414E_M421L_S463P_H524F
L354I_L409V_N413D_M421L_H524L	L354I_L409V_M421L_S463P_H524L
L384M_L391V_N413D_M421L_S463P_ H524L	L409V_N413D_Q414E_M421L_S463P_ H524L
L354I_L391V_L409V_N413D_Q414E_ H524L	L354I_L384M_L409V_N413D_M421L_ S463P_H524F
L354I_L391V_N413D_M421L_S463P_ M517A_H524L	L354I_L391V_N413D_Q414E_M421L_ M517A_H524F
L384M_L391V_L409V_N413D_M421L_ S463P_M517A_H524F

일부 구현예에서, 본원에 기술된 변형된 ER-LBD와 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 또는 100% 동일한 아미노산 서열을 갖는 변형된 ER-LBD 변이체가 본원에 제공되되, 단, 변이체는G400V/MS43A/L544A 삼중 아미노산 치환 또는 G400V/M543A/L544A/V595A 사중 아미노산 치환을 포함하고, 비-내인성 리간드에 대해 더 큰 민감도 및/또는 더 큰 선택성을 부여하는 하나 이상의 추가 아미노산 치환을 가진다(예를 들어, 표 1 및 표 2에 도시된 아미노산 치환 중 하나 이상).

키메라 단백질

일부 양태에서, 본 개시는 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질을 제공한다. 변형된 ER-LBD는 비-내인성 리간드에 결합할 때 핵 국소화가 가능하다. 따라서, 변형된 ER-LBD를 관심 폴리펩티드에 융합하면 관심 폴리펩티드의 세포 국소화를 조절할 수 있다.

일부 구현예에서, 관심 폴리펩티드는 링커를 포함한다. 하나 이상의 링커는 키메라 단백질의 다양한 도메인 사이에, 예컨대 ER-LBD와 관심 폴리펩티드 사이에 사용될 수 있다. 예를 들어, 폴리펩티드 링커는 아미노산 서열, 예컨대, GGGGSGGGGSGGGGSVDGF(서열번호 4) 및 ASGGGGSAS(서열번호 5) 중 하나 이상의 아미노산 서열을 포함할 수 있다.

일부 구현예에서, 관심 폴리펩티드는 적어도 하나의 핵산 결합 도메인을 포함한다. 일부 구현예에서, 핵산 결합 도메인은 징크-핑거 도메인이다. 일부 구현예에서, 키메라 단백질은 전사 활성인자 또는 전사 억제인자와 같은 전사 조절인자를 포함한다. 핵산 결합 도메인을 포함하면 비-내인성 리간드(예를 들어, 4-OHT 또는 엔독시펜)에 의해 유도 가능한, 키메라 단백질에 의한 표적화된 핵산 결합을 허용할 수 있다.

일부 양태에서, 핵산 결합 도메인은 DNA 결합 징크 핑거 단백질 도메인(ZF 단백질 도메인)을 포함한다. 일부 양태에서, ZF 단백질 도메인은 설계상 모듈식이며, 징크 핑거 어레이(ZFA)로 구성된다. 일부 양태에서, 전사 효과기 도메인은 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP16의 4개의 탠덤 카피로 이루어진 활성화 도메인, VP64 활성화 도메인; NFκB의 p65 활성화 도메인; 엡스타인-바 바이러스 R 트랜스활성인자(Rta) 활성화 도메인; VP64, p65, 및 Rta 활성화 도메인(VPR 활성화 도메인)을 포함하는 삼부 활성인자; VP64, p65, 및 HSF1 활성화 도메인(VPH 활성화 도메인)을 포함하는 삼부 활성인자; 인간 E1A-연관 단백질 p300의 히스톤 아세틸트랜스퍼라제(HAT) 코어 도메인(p300 HAT 코어 활성화 도메인); 크루펠 연관 박스(KRAB) 억제 도메인; 억제 요소 침묵화 전사 인자(REST) 억제 도메인; 터럭 관련 염기성 나선-루프-나선 억제 단백질의 WRPW 모티프(서열번호 82), 모티프는 WRPW(서열번호 82) 억제 도메인으로 알려져 있음; DNA(시토신-5)-메틸트랜스퍼라제 3B(DNMT3B) 억제 도메인; 및 HP1 알파 크로모섀도우 억제 도메인으로부터 선택된다.

일부 구현예에서, ZF 단백질 도메인은 설계 상 모듈식이고 징크 핑거 어레이 (ZFA)로 구성된다. 징크 핑거 어레이는 함께 연결된 다수의 징크 핑거 단백질 모티프를 포함한다. 각각의 징크 핑거 모티프는 상이한 핵산 모티프에 결합한다. 이는 임의의 원하는 핵산 서열에 특이성을 갖는 ZFA를 생성한다. ZF 모티프는 서로 직접 인접하거나, 유연한 링커 서열에 의해 분리될 수 있다. 일부 구현예에서, ZFA는 탠덤 배열된 ZF 모티프의 어레이, 스트링 또는 사슬이다. ZFA는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12,1 3, 14, 또는 15개의 징크 핑거 모티프를 가질 수 있다. ZFA는 1~10, 1~15, 1~2, 1~3, 1~4, 1~5, 1~6, 1~7, 1~8, 1~9, 2~3, 2~4, 2~5, 2~6, 2~7, 2~8, 2~9, 2~10, 3~4, 3~5 3~6, 3~7, 3~8, 3~9, 3~10, 4~5, 4~6, 4~7, 4~8, 4~9, 4~10, 5~6, 5~7, 5~8, 5~9, 5~10, 또는 5~15개의 징크 핑거 모티프를 가질 수 있다.

ZF 단백질 도메인은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 또는 그 이상의 ZFA를 가질 수 있다. ZF 도메인은 1~10, 1~15, 1~2, 1~3, 1~4, 1~5, 1~6, 1~7, 1~8, 1~9, 2~3, 2~4, 2~5, 2~6, 2~7, 2~8, 2~9, 2~10, 3~4, 3~5 3~6, 3~7, 3~8, 3~9, 3~10, 4~5, 4~6, 4~7, 4~8, 4~9, 4~10, 5~6, 5~7, 5~8, 5~9, 5~10, 또는 5~15개의 ZFA를 가질 수 있다. 일부 구현예에서, ZF 단백질 도메인은 1 내지 10개의 ZFA(들)를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 하나의 ZFA를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 2개의 ZFA를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 3개의 ZFA를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 4개의 ZFA를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 5개의 ZFA를 포함한다. 일부 구현예에서, ZF 단백질 도메인은 적어도 10개의 ZFA를 포함한다.

예시적인 ZF 단백질 도메인은 서열 SRPGERPFQCRICMRNFSRRHGLDRHTRTHTGEKPFQCRICMRNFSDHSSLKRHLRTHTGSQKPFQCRICMRNFSVRHNLTRHLRTHTGEKPFQCRICMRNFSDHSNLSRHLKTHTGSQKPFQCRICMRNFSQRSSLVRHLRTHTGEKPFQCRICMRNFSESGHLKRHLRTHLRGS(서열번호 6)에 도시된다. 일부 구현예에서, ZF 단백질 도메인은 ZF5-7 DNA 결합 도메인이다. 예시적인 ZF5-7 DNA 결합 도메인은 서열 MSRPGERPFQCRICMRNFSNMSNLTRHTRTHTGEKPFQCRICMRNFSDRSVLRRHLRTHTGSQKPFQCRICMRNFSDPSNLARHTRTHTGEKPFQCRICMRNFSDRSSLRRHLRTHTGSQKPFQCRICMRNFSQSGTLHRHTRTHTGEKPFQCRICMRNFSQRPNLTRHLRTHLRGS(서열번호 62)에 도시되어 있다.

일부 구현예에서, 키메라 단백질은 키메라 전사 인자이며, 변형된 ER-LBD 이외에, 핵산 결합 도메인 및 전사 조절인자 도메인을 포함한다. 일부 양태에서, 핵산 결합 도메인 및 전사 조절인자 도메인은 동일한 자연 발생 단백질의 일부이다. 일부 양태에서, 핵산 결합 도메인 및 전사 조절인자 도메인은 이종이고 자연적으로 동일한 단백질 내에 존재하지 않는다.

본원에서 사용되는 "전사 조절인자 도메인"은 (예를 들어, 관심 프로모터에 특이적으로 결합하는 핵산 결합 도메인에 의해) 유전자의 프로모터 영역에 표적화될 때 유전자의 전사를 조절할 수 있는 폴리펩티드 도메인을 지칭한다. 일부 양태에서, 전사 조절자 도메인은 전사 억제인자 도메인을 포함한다. 일부 양태에서, 전사 억제인자 도메인은 크루펠 연관 박스(KRAB) 억제 도메인; 억제 요소 침묵화 전사 인자(REST) 억제 도메인; 터럭 관련 염기성 나선-루프-나선 억제인자 단백질의 WRPW 모티프(서열번호 82), 모티프는 WRPW(서열번호 82) 억제 도메인으로 알려짐; DNA(시토신-5)-메틸트랜스퍼라제 3B(DNMT3B) 억제 도메인; 및 HP1 알파 크로모새도우 억제 도메인으로부터 선택된다.

일부 양태에서, 전사 조절인자 도메인은 전사 활성인자 도메인을 포함한다. 일부 양태에서, 전사 활성인자 도메인은, 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP16의 4개의 탠덤 카피를 포함하는 활성화 도메인; VP64 활성화 도메인; NFκB의 p65 활성화 도메인(즉, p65); 엡스타인-바 바이러스 R 트랜스활성인자(Rta) 활성화 도메인; VP64, p65, 및 Rta 활성화 도메인(VPR 활성화 도메인)을 포함하는 삼부 활성인자; VP64, p65, 및 HSF1 활성화 도메인(VPH 활성화 도메인)을 포함하는 삼부 활성인자; 및 인간 E1A 관련 단백질 p300의 히스톤 아세틸트랜스퍼라제(HAT) 코어 도메인(p300 HAT 코어 활성화 도메인)으로 이루어진 군으로부터 선택된다. 일부 양태에서, 전사 조절인자 도메인은 p65 전사 활성인자 도메인을 포함한다. 일부 양태에서, p65 전사 활성인자는 아미노산 서열 DEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS(서열번호 64)를 포함한다.

유전자 스위치

또한, 전사를 조절하기 위한 유전자 스위치가 본원에 제공된다. 유전자 스위치는 (a) 변형된 ER-LBD를 포함하고 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성 프로모터(CTF-반응성 프로모터)에 결합할 수 있는 키메라 전사 인자, 및 (b) 키메라 단백질의 변형된 ER-LBD에 결합하는 비-내인성 리간드를 포함할 수 있다. 변형된 ER-LBD에 대한 비-내인성 리간드의 결합 시, 키메라 단백질은 관심 유전자의 전사를 조절할 수 있다.

일부 구현예에서, 관심 유전자는 사이토카인, 케모카인, 귀소 분자, 성장 인자, 세포 사멸 조절인자, 공동 활성화 분자, 종양 미세환경 조절인자 a, 수용체, 리간드, 항체, 폴리뉴클레오티드, 펩티드, 및 효소로 이루어진 군으로부터 선택된 폴리펩티드를 암호화한다. 일부 구현예에서, 관심 유전자는 사이토카인을 암호화한다. 일부 양태에서, 관심 유전자는 다음으로 이루어진 군으로부터 선택된 사이토카인을 암호화한다: IL1-베타, IL2, IL4, IL6, IL7, IL10, IL12, IL12p70 융합 단백질, IL15, IL17A, IL18, IL21, IL22, I형 인터페론, 인터페론-감마, 및 TNF-알파. 일부 구현예에서, 관심 유전자는 MCHQQLVISWFSLVFLASPLVAIWELKKDVYVVELDWYPDAPGEMVVLTCDTPEEDGITWTLDQSSEVLGSGKTLTIQVKEFGDAGQYTCHKGGEVLSHSLLLLHKKEDGIWSTDILKDQKEPKNKTFLRCEAKNYSGRFTCWWLTTISTDLTFSVKSSRGSSDPQGVTCGAATLSAERVRGDNKEYEYSVECQEDSACPAAEESLPIEVMVDAVHKLKYENYTSSFFIRDIIKPDPPKNLQLKPLKNSRQVEVSWEYPDTWSTPHSYFSLTFCVQVQGKSKREKKDRVFTDKTSATVICRKNASISVRAQDRYYSSSWSEWASVPCSGGGSGGGSGGGSGGGSRNLPVATPDPGMFPCLHHSQNLLRAVSNMLQKARQTLEFYPCTSEEIDHEDITKDKTSTVEACLPLELTKNESCLNSRETSFITNGSCLASRKTSFMMALCLSSIYEDLKMYQVEFKTMNAKLLMDPKRQIFLDQNMLAVIDELMQALNFNSETVPQKSSLEEPDFYKTKIKLCILLHAFRIRAVTIDRVMSYLNAS(서열번호 58)의 아미노산 서열을 포함하는 IL12p70 융합 단백질을 암호화한다.

일부 구현예에서, 비-내인성 리간드는 4-하이드록시-타목시펜(4-OHT), N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로부터 선택된다.

특정 구현예에서, 비-내인성 리간드는 4-하이드록시타목시펜(4-OHT, 또한 아피목시펜으로 지칭됨)이다.

특정 구현예에서, 비-내인성 리간드는 엔독시펜이다.

단리된 폴리뉴클레오티드 분자 및 이종 작제물

또한, 본원에 기술된 바와 같은 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 단리된 폴리뉴클레오티드 분자 및 이종 작제물이 본원에 제공된다. 일부 양태에서, 본 개시는 본원에 기술된 바와 같은 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드 분자를 제공한다. 일부 양태에서, 본 개시는 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물을 제공한다.

일부 양태에서, 본 개시는 표적 유전자 발현 카세트를 포함하는 단리된 폴리뉴클레오티드 및/또는 이종 작제물을 추가로 제공한다.

"단리된" 핵산 분자 또는 폴리뉴클레오티드는 그의 고유 환경으로부터 제거된 DNA 또는 RNA와 같은 핵산 분자를 지칭한다. 예를 들어, 이종 작제물에 함유된 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 폴리뉴클레오티드는 단리된 것으로 간주된다. 단리된 폴리뉴클레오티드의 추가 예시는 이종 숙주 세포에서 유지되는 재조합 폴리뉴클레오티드 또는 용액 중 (부분적으로 또는 실질적으로) 정제된 폴리뉴클레오티드를 포함한다. 단리된 폴리뉴클레오티드는 또한 일반적으로 폴리뉴클레오티드 분자를 함유하는 세포에 함유된 폴리뉴클레오티드 분자를 포함하지만, 폴리뉴클레오티드 분자는 염색체외 또는 그의 자연적인 염색체 위치와 상이한 염색체 위치에 존재한다.　

단리된 폴리뉴클레오티드 분자는 cDNA 폴리뉴클레오티드, RNA 폴리뉴클레오티드, RNAi 올리고뉴클레오티드(예를 들어, siRNA, miRNA, 안티센스 올리고뉴클레오티드, shRNA 등), mRNA 폴리뉴클레오티드, 원형 플라스미드, 선형 DNA 단편, 벡터, 미니서클, ssDNA, 박테리아 인공 염색체(BAC), 및 효모 인공 염색체(YAC), 및 올리고뉴클레오티드를 포함하지만, 이들로 한정되지는 않는다.

일부 구현예에서, 단리된 폴리뉴클레오티드는 DNA, cDNA, RNA, mRNA, 및 네이키드 플라스미드(선형 또는 환형)로부터 선택된다.

본 발명의 기준 뉴클레오티드 서열과 적어도, 예를 들어, 95% "동일한" 뉴클레오티드 서열을 갖는 핵산 또는 폴리뉴클레오티드는 폴리뉴클레오티드 서열이 기준 뉴클레오티드 서열의 각각의 100개 뉴클레오티드 당 최대 5개의 점 돌연변이를 포함할 수 있다는 점을 제외하고는 폴리뉴클레오티드의 뉴클레오티드 서열과 기준 서열이 동일하다는 것을 의도한다. 즉, 기준 뉴클레오티드 서열과 적어도 95% 동일한 뉴클레오티드 서열을 갖는 폴리뉴클레오티드를 수득하기 위해, 기준 서열 내의 뉴클레오티드의 최대 5%가 결실되거나 다른 뉴클레오티드로 치환될 수 있거나, 기준 서열 내의 총 뉴클레오티드의 최대 5%인 수의 뉴클레오티드가 기준 서열에 삽입될 수 있다. 기준 서열의 이러한 변경은 기준 뉴클레오티드 서열의 5' 또는 3' 말단 위치에서 또는 이들 말단 위치 사이의 어느 곳에서나 발생할 수 있으며, 이는 기준 서열 내의 잔기들 사이에 개별적으로 또는 기준 서열 내의 하나 이상의 연속된 그룹에 산재된다. 실제로, 임의의 특정 폴리뉴클레오티드 서열이 본 발명의 뉴클레오티드 서열과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일한지 여부는 종래의 공지된 컴퓨터 프로그램을 사용하여 결정될 수 있다.

일부 양태에서, 폴리뉴클레오티드 분자에 의해 암호화된 키메라 단백질은 키메라 전사 인자이고, 폴리뉴클레오티드 분자는 키메라 전사 인자-반응성(CTF-반응성) 프로모터에 작동 가능하게 연결된 관심 유전자를 포함하는 표적 발현 카세트를 추가로 포함한다. 일부 구현예에서, 표적 발현 카세트는 키메라 단백질과 동일한 이종 작제물에 존재한다. 일부 구현예에서, 키메라 단백질 및 표적 발현 카세트는 별도의 이종 작제물에 존재한다.

용어 "발현 카세트"는 표적 세포에서 특정 폴리뉴클레오티드의 전사를 허용하는 일련의 핵산 요소를 갖는 재조합적으로 또는 합성적으로 생성된 폴리뉴클레오티드를 지칭한다. 발현 카세트는 플라스미드, 염색체, 미토콘드리아 DNA, 색소 DNA, 바이러스, 또는 핵산 단편에 혼입될 수 있다. 통상적으로, 발현 벡터의 발현 카세트 부분은, 다른 서열 중에서, 전사될 핵산 서열 및 프로모터를 포함한다. 일부 양태에서, 본 개시는 변형된 ER-LBD를 암호화하는 폴리뉴클레오티드 또는 변형된 ER-LBD를 포함하는 키메라 단백질을 포함하는 발현 카세트를 제공한다.

본원에 기술된 바와 같은 변형된 ER-LBD를 포함하는 단리된 폴리뉴클레오티드 분자 및 이종 작제물은 조작된 폴리뉴클레오티드 분자이다. "조작된 폴리뉴클레오티드"는 자연에서 발생하지 않는 폴리뉴클레오티드이다. 그러나, 조작된 폴리뉴클레오티드는 그 전체가 자연적으로 발생하지 않지만, 자연적으로 발생하는 뉴클레오티드 서열을 포함할 수 있음을 이해해야 한다. 일부 구현예에서, 조작된 폴리뉴클레오티드는 상이한 유기체(예를 들어, 상이한 종)로부터의 뉴클레오티드 서열을 포함한다. 예를 들어, 일부 구현예에서, 조작된 폴리뉴클레오티드는 쥣과 뉴클레오티드 서열, 박테리아 뉴클레오티드 서열, 인간 뉴클레오티드 서열 및/또는 바이러스 뉴클레오티드 서열을 포함한다. 용어 "조작된 폴리뉴클레오티드"는 재조합 핵산 및 합성 핵산을 포함한다. "재조합 폴리뉴클레오티드"는 뉴클레오티드 분자를 연결함으로써 구성되고, 일부 구현예에서, 살아있는 세포에서 복제될 수 있는 분자를 지칭한다. "합성 폴리뉴클레오티드"는 증폭되거나 화학적으로, 또는 다른 수단에 의해 합성된 분자를 지칭한다. 합성 폴리뉴클레오티드는 화학적으로 변형되거나 아니면 변형되지만 자연적으로 발생하는 뉴클레오티드 분자와 염기쌍을 이룰 수 있는 것들을 포함한다. 변형은 하나 이상의 변형된 뉴클레오티드 간 결합 및 비-자연 핵산을 포함하지만, 이에 한정되지 않는다. 변형은 미국 특허 제6,673,611호 및 미국 특허 출원 공개 제2004/0019001호에 더욱 상세히 기술되어 있으며, 이들 각각은 그 전체가 참조로서 본원에 통합된다. 변형된 뉴클레오티드간 결합은 포스포로디티오에이트 또는 포스포로티오에이트 결합일 수 있다. 비-천연 핵산은 잠금 핵산(LNA), 펩티드 핵산(PNA), 글리콜 핵산(GNA), 포스포로디아미데이트 모르폴리노 올리고머(PMO 또는 "모르폴리노"), 및 트레오스 핵산(TNA)일 수 있다. 비-천연 핵산은 국제 출원 WO 제1998/039352호, 미국 출원 공개 제2013/0156849호, 및 미국 특허 제6,670,461호; 제5,539,082호; 제5,185,444호에 더욱 상세히 기술되어 있으며, 이들 각각은 그 전체가 참조로서 본원에 포함된다. 재조합 폴리뉴클레오티드 및 합성 폴리뉴클레오티드는 또한 전술한 것 중 하나의 복제로부터 생성된 이들 분자를 포함한다. 본 개시의 조작된 폴리뉴클레오티드는 단일 분자(예를 들어, 동일한 플라스미드 또는 다른 벡터에 포함됨)에 의해 또는 다수의 상이한 분자(예를 들어, 다수의 상이한 독립적으로 복제하는 분자)에 의해 암호화될 수 있다.

본 개시의 조작된 폴리뉴클레오티드는 표준 분자 생물학 방법을 사용하여 제조될 수 있다(예를 들어, 문헌[Green and Sambrook, Molecular Cloning, A Laboratory Manual, 2012, Cold Spring Harbor Press] 참고). 일부 구현예에서, 조작된 핵산 작제물은 GIBSON ASSEMBLY® 클로닝(예를 들어, 각각이 참조로서 본원에 통합되는, Gibson, D.G.등의 문헌[Nature Methods, 343-345, 2009]; 및 Gibson, D.G.등의 문헌[Nature Methods, 901-903, 2010] 참고)을 사용하여 생산된다. GIBSON ASSEMBLY®는 통상적으로 단일-튜브 반응에서 다음의 3 가지 효소적 활성을 사용한다: 5' 엑소뉴클레아제, DNA 중합효소의 'Y 연장 활성 및 DNA 리가아제 활성. 5' 엑소뉴클레아제 활성은 5' 말단 서열을 다시 츄잉하고 어닐링을 위한 상보적 서열을 노출시킨다. 그런 다음, 중합효소 활성은 어닐링된 영역 상의 갭을 충진한다. 이어서, DNA 리가아제는 닉을 밀봉하고 DNA 단편을 함께 공유적으로 연결한다. 인접한 단편의 오버랩 서열은 골든게이트 어셈블리에 사용된 것보다 훨씬 길어, 더 높은 백분율로 올바른 조립을 생성한다. 일부 구현예에서, 조작된 핵산 작제물은 IN-FUSION® 클로닝(Clontech)을 사용하여 생산된다.

일부 구현예에서, 본원에 기술된 폴리뉴클레오티드 분자는 이종 작제물에 포함된다. 용어 "벡터" 또는 "발현 벡터"는 "이종 작제물"과 동의어이며, 표적 세포에서 작제물과 작동 가능하게 연관된 하나 이상의 유전자의 발현을 도입하고 유도하는 데 사용되는 폴리뉴클레오티드 분자를 지칭한다. 이러한 용어는 자가-복제 핵산 구조로서의 작제물뿐만 아니라 그것이 도입된 숙주 세포의 게놈에 혼입된 벡터를 포함한다. 본원에 기술된 바와 같은 이종 작제물은 발현 카세트를 포함한다. 일부 양태에서, 변형된 ER-LBD 또는 변형된 ER-LBD를 포함하는 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 발현 카세트를 포함하는 이종 작제물이 본원에 제공된다.

본원에서 사용되는 바와 같이, "프로모터"는 나머지 핵산 서열의 전사의 개시 및 속도가 조절되는 핵산 서열의 조절 영역을 지칭한다. 프로모터는 또한 RNA 폴리머라제 및 다른 전사 인자와 같은 조절 단백질 및 분자가 결합할 수 있는 하위 영역을 포함할 수 있다. 프로모터는 구성적, 유도성, 억제성, 조직-특이적 또는 이들의 임의의 조합일 수 있다. 프로모터는 프로모터가 조절하는 핵산 서열의 발현을 유도하거나 전사를 유도한다. 여기에서, 프로모터는 그것이 그 서열의 전사 개시 및/또는 발현을 제어("구동")하기 위해 조절하는 핵산 서열에 대하여 정확한 기능적 위치 및 방향에 있을 때 "작동 가능하게 연결된" 것으로 간주된다.

프로모터는, 주어진 유전자 또는 서열의 코딩 분절의 상류에 위치한 5' 비코딩 서열을 단리함으로써 수득될 수 있는 바와 같은, 유전자 또는 서열과 자연적으로 연관된 것일 수 있다. 이러한 프로모터는 "내인성"으로 지칭될 수 있다. 일부 구현예에서, 코딩 핵산 서열은, 이것의 자연적인 환경에서 암호화된 서열과 일반적으로 연관되지 않은 프로모터를 지칭하는, 재조합 또는 이종 프로모터의 조절 하에 위치될 수 있다. 이러한 프로모터는 다른 유전자의 프로모터; 임의의 다른 세포로부터 단리된 프로모터; 및 예를 들어, 당업계에 공지된 유전 공학 방법을 통해 발현을 변경하는 상이한 전사 조절 영역 및/또는 돌연변이의 상이한 요소를 함유하는 것들과 같은 "자연 발생"이 아닌 합성 프로모터 또는 인핸서를 포함할 수 있다. 프로모터 및 인핸서의 핵산 서열을 합성적으로 생성하는 것 외에, 서열은 중합효소 연쇄 반응(PCR)을 포함하는 재조합 클로닝 및/또는 핵산 증폭 기술을 사용하여 생성될 수 있다(예를 들어, 미국 특허 제4,683,202호 및 미국 특허 제5,928,906호 참조).

본원에서 사용되는 바와 같이, "유도성 프로모터"는 신호의 존재 하에 또는 신호에 의해 영향을 받거나 신호와 접촉될 때 전사 활성을 조절(예를 들어, 개시 또는 활성화)하는 것을 특징으로 하는 프로모터를 지칭한다. 신호는 유도성 프로모터로부터 전사 활성을 조절하는 데에 있어 활성이 되는 방식으로 유도성 프로모터와 접촉하는 내인성 또는 보통 외인성 조건(예를 들어, 광), 화합물(예를 들어, 화학적 또는 비-화학적 화합물) 또는 단백질(예를 들어, 본원에 기재된 바와 같은 키메라 전사 인자)일 수 있다. 전사의 활성화는 전사를 구동하기 위해 프로모터에 직접적으로 작용하는 것 또는 프로모터가 전사를 구동하는 것을 방지하는 억제인자를 불활성화시킴으로써 프로모터에 간접적으로 작용하는 것을 포함할 수 있다. 반대로, 전사의 비활성화는 프로모터에 직접적으로 작용하여 전사를 방지하거나 후에 프로모터에 작용하는 억제인자를 활성화시킴으로써 프로모터에 간접적으로 작용하는 것을 포함할 수 있다.

본원에서 사용되는 바와 같이, 프로모터는 해당 상태 또는 신호의 존재 하에 프로모터로부터의 전사가 활성화, 비활성화, 증가 또는 감소되는 경우 국소 종양 상태(예를 들어, 염증 또는 저산소증) 또는 신호에 "반응성"이거나 "이에 의해 조절"된다. 일부 구현예에서, 프로모터는 반응 요소를 포함한다. "반응 요소"는 프로모터로부터 유전자 발현을 조정(조절)하는 특이적 분자(예를 들어, 전사 인자)에 결합하는 프로모터 영역 내의 짧은 DNA 서열이다. 본 개시에 따라 사용될 수 있는 반응 요소는, 비제한적으로, 플로레틴-조정가능한 조절 요소(PEACE), 징크-핑거 DNA 결합 도메인(DBD), 인터페론-감마-활성화 서열(GAS)(참조로서 본원에 통합된, Decker, T.등의 문헌[J Interferon Cytokine Res. 1997 Mar;17(3):121-34]), 인터페론-자극 반응 요소(ISRE)(참조로서 본원에 통합된, Han, K. J.등의 문헌[J Biol Chem. 2004 Apr 9;279(15):15652-61]), NF-카파B 반응 요소(참조로서 본원에 통합된, Wang, V.등의 문헌[Cell Reports. 2012; 2(4): 824-839]), 및 STAT3 반응 요소(참조로서 본원에 통합된, Zhang, D.등의 문헌[J of Biol Chem. 1996; 271: 9503-9509])를 포함한다. 다른 반응 요소가 본원에 포괄된다. 반응 요소는 또한 탠덤 반복체(예를 들어, 반응 요소를 암호화하는 동일한 뉴클레오티드 서열의 연속 반복체)를 함유하여 일반적으로 이의 동족 결합 분자에 대한 반응 요소의 민감도를 증가시킬 수 있다. 탠덤 반복체는 존재하는 반복의 수를 나타내기 위해 2X, 3X, 4X, 5X 등으로 표시될 수 있다.

반응성 프로모터("유도성 프로모터"라고도 함)(예를 들어, TGF-베타 반응성 프로모터)의 비제한적 예는 표 3에 나열되어 있고, 이는 프로모터 및 전사 인자의 설계 뿐만 아니라 전사 인자(TF) 및 이식유전자 전사(T)에 대한 유도 분자의 효과를 보여준다(B, 결합; D, 해리; n.d., 결정되지 않음)(A, 활성화; DA, 비활성화; DR, 탈억제)(Horner, M. & Weber, W.의 문헌[FEBS Letters 586 (2012) 20784-2096m], 및 문헌에 인용된 참고 문헌 참조). 유도성 프로모터의 구성요소의 비제한적인 예는 표 4에 나타낸 것을 포함한다.

시스템	프로모터 및 작동인자	전사 인자(TF)	유도 분자	유도인자에 대한 반응
				TF	T
전사 활성인자-반응성 프로모터
AIR	PAIR(OalcA-PhCMVmin)	AlcR	아세트알데하이드	n.d.	A
ART	PART(OARG-PhCMVmin)	ArgR-VP16	l-아르기닌	B	A
BIT	PBIT3(OBirA3-PhCMVmin)	BIT(BirA-VP16)	비오틴	B	A
큐메이트 - 활성인자	PCR5(OCuO6-PhCMVmin)	cTA(CymR-VP16)	큐메이트	D	DA
큐메이트 - 역활성인자	PCR5(OCuO6-PhCMVmin)	rcTA(rCymR-VP16)	큐메이트	B	A
E-오프	PETR(OETR-PhCMVmin)	ET(E-VP16)	에리트로마이신	D	DA
NICE-오프	PNIC(ONIC-PhCMVmin)	NT(HdnoR-VP16)	6-하이드록시-니코틴	D	DA
PEACE	PTtgR1(OTtgR-PhCMVmin)	TtgA1(TtgR-VP16)	플로레틴	D	DA
PIP-오프	PPIR (OPIR-Phsp70min)	PIT(PIP-VP16)	프리스티나마이신 I	D	DA
QuoRex	PSCA(OscbR-PhCMVmin)PSPA (OpapRI-PhCMVmin)	SCA(ScbR-VP16)	SCB1	D	DA
Redox	PROP(OROP-PhCMVmin)	REDOX(REX-VP16)	NADH	D	DA
TET-오프	PhCMV*-1 (OtetO7-PhCMVmin)	tTA(TetR-VP16)	테트라사이클린	D	DA
TET-온	PhCMV*-1 (OtetO7-PhCMVmin)	rtTA(rTetR-VP16)	독시사이클린	B	A
TIGR	PCTA(OrheO-PhCMVmin)	CTA(RheA-VP16)	열	D	DA
TraR	O7x(tra box)-PhCMVmin	p65-TraR	3-Oxo-C8-HSL	B	A
VAC-오프	P1VanO2(OVanO2-PhCMVmin)	VanA1(VanR-VP16)	바닐산	D	DA
전사 억제 인자-반응성 프로모터
큐메이트 - 억제 인자	PCuO(PCMV5-OCuO)	CymR	큐메이트	D	DR
E-온	PETRON8(PSV40-OETR8)	E-KRAB	에리트로마이신	D	DR
NICE-온	PNIC(PSV40-ONIC8)	NS(HdnoR-KRAB)	6-하이드록시-니코틴	D	DR
PIP-온	PPIRON(PSV40-OPIR3)	PIT3(PIP-KRAB)	프리스티나마이신 I	D	DR
Q-온	PSCAON8(PSV40-OscbR8)	SCS(ScbR-KRAB)	SCB1	D	DR
TET-온<컴마> 억제인자 기반	OtetO-PHPRT	tTS-H4(TetR-HDAC4)	독시사이클린	D	DR
T-REX	PTetO(PhCMV-OtetO2)	TetR	테트라사이클린	D	DR
UREX	PUREX8(PSV40-OhucO8)	mUTS(KRAB-HucR)	요산	D	DR
VAC-온	PVanON8(PhCMV-OVanO8)	VanA4(VanR-KRAB)	바닐산	D	DR
하이브리드 프로모터
QuoRexPIP-온(IF 게이트 아님)	OscbR8-OPIR3-PhCMVmin	SCAPIT3	SCB1프리스티나마이신 I	DD	DADR
QuoRexE-온(IF 게이트 아님)	OscbR-OETR8-PhCMVmin	SCAE-KRAB	SCB1에리트로마이신	DD	DADR
TET-오프E-온(IF 게이트 아님)	OtetO7-OETR8-PhCMVmin	tTAE-KRAB	테트라사이클린에리트로마이신	DD	DADR
TET-오프PIP-온E-온	OtetO7-OPIR3-OETR8-PhCMVmin	tTAPIT3E-KRAB	테트라사이클린프리스티나마이신 I에리트로마이신	DDD	DADRDR

명칭	DNA 서열	공급원
최소 프로모터; minP	AGAGGGTATATAATGGAAGCTCGACTTCCAG (서열번호 7)	EU581860.1 (프로메가)
NFkB 반응 요소 단백질 프로모터; 5x NFkB-RE	GGGAATTTCCGGGGACTTTCCGGGAATTTCCGGGGACTTTCCGGGAATTTCC(서열번호 8)	EU581860.1(프로메가)
CREB 반응 요소 단백질 프로모터; 4x CRE	CACCAGACAGTGACGTCAGCTGCCAGATCCCATGGCCGTCATACTGTGACGTCTTTCAGACACCCCATTGACGTCAATGGGAGAA(서열번호 9)	DQ904461.1(프로메가)
NFAT 반응 요소 단백질 프로모터; 3x NFAT 결합 부위	GGAGGAAAAACTGTTTCATACAGAAGGCGTGGAGGAAAAACTGTTTCATACAGAAGGCGTGGAGGAAAAACTGTTTCATACAGAAGGCGT (서열번호 10)	DQ904462.1(프로메가)
SRF 반응 요소 단백질 프로모터; 5x SRE	AGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCT (서열번호 11)	FJ773212.1(프로메가)
SRF 반응 요소 단백질 프로모터 2; 5x SRF-RE	AGTATGTCCATATTAGGACATCTACCATGTCCATATTAGGACATCTACTATGTCCATATTAGGACATCTTGTATGTCCATATTAGGACATCTAAAATGTCCATATTAGGACATCT (서열번호 12)	FJ773213.1(프로메가)
AP1 반응 요소 단백질 프로모터; 6x AP1-RE	TGAGTCAGTGACTCAGTGAGTCAGTGACTCAGTGAGTCAGTGACTCAG (서열번호 13)	JQ858516.1(프로메가)
TCF-LEF 반응 요소 프로모터; 8x TCF-LEF-RE	AGATCAAAGGGTTTAAGATCAAAGGGCTTAAGATCAAAGGGTATAAGATCAAAGGGCCTAAGATCAAAGGGACTAAGATCAAAGGGTTTAAGATCAAAGGGCTTAAGATCAAAGGGCCTA (서열번호 14)	JX099537.1(프로메가)
SBEx4	GTCTAGACGTCTAGACGTCTAGACGTCTAGAC (서열번호 15)	Addgene 카탈로그 번호: 16495
SMAD2/3 - CAGACA x4	CAGACACAGACACAGACACAGACA (서열번호 16)	Jonk 등 (J Biol Chem. 1998 Aug 14;273(33):21145-52.
STAT3 결합 부위	Ggatccggtactcgagatctgcgatctaagtaagcttggcattccggtactgttggtaaagccac (서열번호 17)	Addgene 시퀀싱 결과 #211335

프로모터의 다른　비제한적인 예는 사이토메갈로바이러스(CMV) 프로모터, 신장 인자 1-알파(EF1a) 프로모터, 신장 인자(EFS) 프로모터, MND 프로모터(골수증식성 육종 바이러스 인핸서가 있는 변형된 MoMuLV LTR의 U3 영역을 포함하는 합성 프로모터), 포스포글리세레이트 키나아제(PGK) 프로모터, 비장 초점 형성 바이러스(SFFV) 프로모터, 원숭이 바이러스 40(SV40) 프로모터, 및 유비퀴틴 C(UbC) 프로모터를 포함한다.

일부 양태에서, 본 개시는 본원에 기재된 바와 같은 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물을 제공한다.

일부 구현예에서, 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터는 구성적 프로모터, 유도성 프로모터, 또는 합성 프로모터이다.

일부 구현예에서, 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터는 구성적 프로모터이다. 예시적인 구성적 프로모터는 표 5에 제시되어 있다. 일부 구현예에서, 구성적 프로모터는 다음으로부터 선택된다: CMV, EFS, SFFV, SV40, MND, PGK, UbC, hEF1aV1, hCAGG, hEF1aV2, hACTb, heIF4A1, hGAPDH, hGRP78, hGRP94, hHSP70, hKINb, 및 hUBIb.

명칭	DNA 서열
CMV	GTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTC (SEQ ID NO: 18)
EF1a	GGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGCCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGACCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGTCCTCGCGCCGCCGTGTATCGCCCCGCCCCGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGTCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA (서열번호 19)
EFS	GGATCTGCGATCGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGCTGAAGCTTCGAGGGGCTCGCATCTCTCCTTCACGCGCCCGCCGCCCTACCTGAGGCCGCCATCCACGCCGGTTGAGTCGCGTTCTGCCGCCTCCCGCCTGTGGTGCCTCCTGAACTGCGTCCGCCGTCTAGGTAAGTTTAAAGCTCAGGTCGAGACCGGGCCTTTGTCCGGCGCTCCCTTGGAGCCTACCTAGACTCAGCCGGCTCTCCACGCTTTGCCTGACCCTGCTTGCTCAACTCTACGTCTTTGTTTCGTTTTCTGTTCTGCGCCGTTACAGATCCAAGCTGTGACCGGCGCCTAC (서열번호 20)
MND	TTTATTTAGTCTCCAGAAAAAGGGGGGAATGAAAGACCCCACCTGTAGGTTTGGCAAGCTAGGATCAAGGTTAGGAACAGAGAGACAGCAGAATATGGGCCAAACAGGATATCTGTGGTAAGCAGTTCCTGCCCCGGCTCAGGGCCAAGAACAGTTGGAACAGCAGAATATGGGCCAAACAGGATATCTGTGGTAAGCAGTTCCTGCCCCGGCTCAGGGCCAAGAACAGATGGTCCCCAGATGCGGTCCCGCCCTCAGCAGTTTCTAGAGAACCATCAGATGTTTCCAGGGTGCCCCAAGGACCTGAAATGACCCTGTGCCTTATTTGAACTAACCAATCAGTTCGCTTCTCGCTTCTGTTCGCGCGCTTCTGCTCCCCGAGCTCAATAAAAGAGCCCA (서열번호 21)
PGK	GGGGTTGGGGTTGCGCCTTTTCCAAGGCAGCCCTGGGTTTGCGCAGGGACGCGGCTGCTCTGGGCGTGGTTCCGGGAAACGCAGCGGCGCCGACCCTGGGTCTCGCACATTCTTCACGTCCGTTCGCAGCGTCACCCGGATCTTCGCCGCTACCCTTGTGGGCCCCCCGGCGACGCTTCCTGCTCCGCCCCTAAGTCGGGAAGGTTCCTTGCGGTTCGCGGCGTGCCGGACGTGACAAACGGAAGCCGCACGTCTCACTAGTACCCTCGCAGACGGACAGCGCCAGGGAGCAATGGCAGCGCGCCGACCGCGATGGGCTGTGGCCAATAGCGGCTGCTCAGCGGGGCGCGCCGAGAGCAGCGGCCGGGAAGGGGCGGTGCGGGAGGCGGGGTGTGGGGCGGTAGTGTGGGCCCTGTTCCTGCCCGCGCGGTGTTCCGCATTCTGCAAGCCTCCGGAGCGCACGTCGGCAGTCGGCTCCCTCGTTGACCGAATCACCGACCTCTCTCCCCAG (서열번호 22)
SFFV	GTAACGCCATTTTGCAAGGCATGGAAAAATACCAAACCAAGAATAGAGAAGTTCAGATCAAGGGCGGGTACATGAAAATAGCTAACGTTGGGCCAAACAGGATATCTGCGGTGAGCAGTTTCGGCCCCGGCCCGGGGCCAAGAACAGATGGTCACCGCAGTTTCGGCCCCGGCCCGAGGCCAAGAACAGATGGTCCCCAGATATGGCCCAACCCTCAGCAGTTTCTTAAGACCCATCAGATGTTTCCAGGCTCCCCCAAGGACCTGAAATGACCCTGCGCCTTATTTGAATTAACCAATCAGCCTGCTTCTCGCTTCTGTTCGCGCGCTTCTGCTTCCCGAGCTCTATAAAAGAGCTCACAACCCCTCACTCGGCGCGCCAGTCCTCCGACAGACTGAGTCGCCCGGG (서열번호 23)
SV40	CTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCT (서열번호 24)
UbC	GCGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGGAGCGTTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCTAGTTCCGTCGCAGCCGGGATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGGTGAGTTGCGGGCTGCTGGGCTGGCCGGGGCTTTCGTGGCCGCCGGGCCGCTCGGTGGGACGGAAGCGTGTGGAGAGACCGCCAAGGGCTGTAGTCTGGGTCCGCGAGCAAGGTTGCCCTGAACTGGGGGTTGGGGGGAGCGCACAAAATGGCGGCTGTTCCCGAGTCTTGAATGGAAGACGCTTGTAAGGCGGGCTGTGAGGTCGTTGAAACAAGGTGGGGGGCATGGTGGGCGGCAAGAACCCAAGGTCTTGAGGCCTTCGCTAATGCGGGAAAGCTCTTATTCGGGTGAGATGGGCTGGGGCACCATCTGGGGACCCTGACGTGAAGTTTGTCACTGACTGGAGAACTCGGGTTTGTCGTCTGGTTGCGGGGGCGGCAGTTATGCGGTGCCGTTGGGCAGTGCACCCGTACCTTTGGGAGCGCGCGCCTCGTCGTGTCGTGACGTCACCCGTTCTGTTGGCTTATAATGCAGGGTGGGGCCACCTGCCGGTAGGTGTGCGGTAGGCTTTTCTCCGTCGCAGGACGCAGGGTTCGGGCCTAGGGTAGGCTCTCCTGAATCGACAGGCGCCGGACCTCTGGTGAGGGGAGGGATAAGTGAGGCGTCAGTTTCTTTGGTCGGTTTTATGTACCTATCTTCTTAAGTAGCTGAAGCTCCGGTTTTGAACTATGCGCTCGGGGTTGGCGAGTGTGTTTTGTGAAGTTTTTTAGGCACCTTTTGAAATGTAATCATTTGGGTCAATATGTAATTTTCAGTGTTAGACTAGTAAAGCTTCTGCAGGTCGACTCTAGAAAATTGTCCGCTAAATTCTGGCCGTTTTTGGCTTTTTTGTTAGAC (서열번호 25)
hEF1aV1	GGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGTCTCGCGCCGCCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA (서열번호 26)
hCAGG	ACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGGAGTCGCTGCGACGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCTCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCAGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGTCGGTCGGGCTGCAACCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTACGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTC (서열번호 27)
hEF1aV2	GGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAG (서열번호 28)
hACTb	CCACTAGTTCCATGTCCTTATATGGACTCATCTTTGCCTATTGCGACACACACTCAATGAACACCTACTACGCGCTGCAAAGAGCCCCGCAGGCCTGAGGTGCCCCCACCTCACCACTCTTCCTATTTTTGTGTAAAAATCCAGCTTCTTGTCACCACCTCCAAGGAGGGGGAGGAGGAGGAAGGCAGGTTCCTCTAGGCTGAGCCGAATGCCCCTCTGTGGTCCCACGCCACTGATCGCTGCATGCCCACCACCTGGGTACACACAGTCTGTGATTCCCGGAGCAGAACGGACCCTGCCCACCCGGTCTTGTGTGCTACTCAGTGGACAGACCCAAGGCAAGAAAGGGTGACAAGGACAGGGTCTTCCCAGGCTGGCTTTGAGTTCCTAGCACCGCCCCGCCCCCAATCCTCTGTGGCACATGGAGTCTTGGTCCCCAGAGTCCCCCAGCGGCCTCCAGATGGTCTGGGAGGGCAGTTCAGCTGTGGCTGCGCATAGCAGACATACAACGGACGGTGGGCCCAGACCCAGGCTGTGTAGACCCAGCCCCCCCGCCCCGCAGTGCCTAGGTCACCCACTAACGCCCCAGGCCTGGTCTTGGCTGGGCGTGACTGTTACCCTCAAAAGCAGGCAGCTCCAGGGTAAAAGGTGCCCTGCCCTGTAGAGCCCACCTTCCTTCCCAGGGCTGCGGCTGGGTAGGTTTGTAGCCTTCATCACGGGCCACCTCCAGCCACTGGACCGCTGGCCCCTGCCCTGTCCTGGGGAGTGTGGTCCTGCGACTTCTAAGTGGCCGCAAGCCACCTGACTCCCCCAACACCACACTCTACCTCTCAAGCCCAGGTCTCTCCCTAGTGACCCACCCAGCACATTTAGCTAGCTGAGCCCCACAGCCAGAGGTCCTCAGGCCCTGCTTTCAGGGCAGTTGCTCTGAAGTCGGCAAGGGGGAGTGACTGCCTGGCCACTCCATGCCCTCCAAGAGCTCCTTCTGCAGGAGCGTACAGAACCCAGGGCCCTGGCACCCGTGCAGACCCTGGCCCACCCCACCTGGGCGCTCAGTGCCCAAGAGATGTCCACACCTAGGATGTCCCGCGGTGGGTGGGGGGCCCGAGAGACGGGCAGGCCGGGGGCAGGCCTGGCCATGCGGGGCCGAACCGGGCACTGCCCAGCGTGGGGCGCGGGGGCCACGGCGCGCGCCCCCAGCCCCCGGGCCCAGCACCCCAAGGCGGCCAACGCCAAAACTCTCCCTCCTCCTCTTCCTCAATCTCGCTCTCGCTCTTTTTTTTTTTCGCAAAAGGAGGGGAGAGGGGGTAAAAAAATGCTGCACTGTGCGGCGAAGCCGGTGAGTGAGCGGCGCGGGGCCAATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTCGAGCGGCCGCGGCGGCGCCCTATAAAACCCAGCGGCGCGACGCGCCACCACCGCCGAGACCGCGTCCGCCCCGCGAGCACAGAGCCTCGCCTTTGCCGATCCGCCGCCCGTCCACACCCGCCGCCAGGTAAGCCCGGCCAGCCGACCGGGGCAGGCGGCTCACGGCCCGGCCGCAGGCGGCCGCGGCCCCTTCGCCCGTGCAGAGCCGCCGTCTGGGCCGCAGCGGGGGGCGCATGGGGGGGGAACCGGACCGCCGTGGGGGGCGCGGGAGAAGCCCCTGGGCCTCCGGAGATGGGGGACACCCCACGCCAGTTCGGAGGCGCGAGGCCGCGCTCGGGAGGCGCGCTCCGGGGGTGCCGCTCTCGGGGCGGGGGCAACCGGCGGGGTCTTTGTCTGAGCCGGGCTCTTGCCAATGGGGATCGCAGGGTGGGCGCGGCGGAGCCCCCGCCAGGCCCGGTGGGGGCTGGGGCGCCATTGCGCGTGCGCGCTGGTCCTTTGGGCGCTAACTGCGTGCGCGCTGGGAATTGGCGCTAATTGCGCGTGCGCGCTGGGACTCAAGGCGCTAACTGCGCGTGCGTTCTGGGGCCCGGGGTGCCGCGGCCTGGGCTGGGGCGAAGGCGGGCTCGGCCGGAAGGGGTGGGGTCGCCGCGGCTCCCGGGCGCTTGCGCGCACTTCCTGCCCGAGCCGCTGGCCGCCCGAGGGTGTGGCCGCTGCGTGCGCGCGCGCCGACCCGGCGCTGTTTGAACCGGGCGGAGGCGGGGCTGGCGCCCGGTTGGGAGGGGGTTGGGGCCTGGCTTCCTGCCGCGCGCCGCGGGGACGCCTCCGACCAGTGTTTGCCTTTTATGGTAATAACGCGGCCGGCCCGGCTTCCTTTGTCCCCAATCTGGGCGCGCGCCGGCGCCCCCTGGCGGCCTAAGGACTCGGCGCGCCGGAAGTGGCCAGGGCGGGGGCGACCTCGGCTCACAGCGCGCCCGGCTAT (서열번호 29)
heIF4A1	GTTGATTTCCTTCATCCCTGGCACACGTCCAGGCAGTGTCGAATCCATCTCTGCTACAGGGGAAAACAAATAACATTTGAGTCCAGTGGAGACCGGGAGCAGAAGTAAAGGGAAGTGATAACCCCCAGAGCCCGGAAGCCTCTGGAGGCTGAGACCTCGCCCCCCTTGCGTGATAGGGCCTACGGAGCCACATGACCAAGGCACTGTCGCCTCCGCACGTGTGAGAGTGCAGGGCCCCAAGATGGCTGCCAGGCCTCGAGGCCTGACTCTTCTATGTCACTTCCGTACCGGCGAGAAAGGCGGGCCCTCCAGCCAATGAGGCTGCGGGGCGGGCCTTCACCTTGATAGGCACTCGAGTTATCCAATGGTGCCTGCGGGCCGGAGCGACTAGGAACTAACGTCATGCCGAGTTGCTGAGCGCCGGCAGGCGGGGCCGGGGCGGCCAAACCAATGCGATGGCCGGGGCGGAGTCGGGCGCTCTATAAGTTGTCGATAGGCGGGCACTCCGCCCTAGTTTCTAAGGACCATG (서열번호 30)
hGAPDH	AGTTCCCCAACTTTCCCGCCTCTCAGCCTTTGAAAGAAAGAAAGGGGAGGGGGCAGGCCGCGTGCAGTCGCGAGCGGTGCTGGGCTCCGGCTCCAATTCCCCATCTCAGTCGCTCCCAAAGTCCTTCTGTTTCATCCAAGCGTGTAAGGGTCCCCGTCCTTGACTCCCTAGTGTCCTGCTGCCCACAGTCCAGTCCTGGGAACCAGCACCGATCACCTCCCATCGGGCCAATCTCAGTCCCTTCCCCCCTACGTCGGGGCCCACACGCTCGGTGCGTGCCCAGTTGAACCAGGCGGCTGCGGAAAAAAAAAAGCGGGGAGAAAGTAGGGCCCGGCTACTAGCGGTTTTACGGGCGCACGTAGCTCAGGCCTCAAGACCTTGGGCTGGGACTGGCTGAGCCTGGCGGGAGGCGGGGTCCGAGTCACCGCCTGCCGCCGCGCCCCCGGTTTCTATAAATTGAGCCCGCAGCCTCCCGCTTCGCTCTCTGCTCCTCCTGTTCGACAGTCAGCCGCATCTTCTTTTGCGTCGCCAGGTGAAGACGGGCGGAGAGAAACCCGGGAGGCTAGGGACGGCCTGAAGGCGGCAGGGGCGGGCGCAGGCCGGATGTGTTCGCGCCGCTGCGGGGTGGGCCCGGGCGGCCTCCGCATTGCAGGGGCGGGCGGAGGACGTGATGCGGCGCGGGCTGGGCATGGAGGCCTGGTGGGGGAGGGGAGGGGAGGCGTGGGTGTCGGCCGGGGCCACTAGGCGCTCACTGTTCTCTCCCTCCGCGCAGCCGAGCCACATCGCTGAGACAC (서열번호 31)
hGRP78	AGTGCGGTTACCAGCGGAAATGCCTCGGGGTCAGAAGTCGCAGGAGAGATAGACAGCTGCTGAACCAATGGGACCAGCGGATGGGGCGGATGTTATCTACCATTGGTGAACGTTAGAAACGAATAGCAGCCAATGAATCAGCTGGGGGGGCGGAGCAGTGACGTTTATTGCGGAGGGGGCCGCTTCGAATCGGCGGCGGCCAGCTTGGTGGCCTGGGCCAATGAACGGCCTCCAACGAGCAGGGCCTTCACCAATCGGCGGCCTCCACGACGGGGCTGGGGGAGGGTATATAAGCCGAGTAGGCGACGGTGAGGTCGACGCCGGCCAAGACAGCACAGACAGATTGACCTATTGGGGTGTTTCGCGAGTGTGAGAGGGAAGCGCCGCGGCCTGTATTTCTAGACCTGCCCTTCGCCTGGTTCGTGGCGCCTTGTGACCCCGGGCCCCTGCCGCCTGCAAGTCGGAAATTGCGCTGTGCTCCTGTGCTACGGCCTGTGGCTGGACTGCCTGCTGCTGCCCAACTGGCTGGCAC (서열번호 32)
hGRP94	TAGTTTCATCACCACCGCCACCCCCCCGCCCCCCCGCCATCTGAAAGGGTTCTAGGGGATTTGCAACCTCTCTCGTGTGTTTCTTCTTTCCGAGAAGCGCCGCCACACGAGAAAGCTGGCCGCGAAAGTCGTGCTGGAATCACTTCCAACGAAACCCCAGGCATAGATGGGAAAGGGTGAAGAACACGTTGCCATGGCTACCGTTTCCCCGGTCACGGAATAAACGCTCTCTAGGATCCGGAAGTAGTTCCGCCGCGACCTCTCTAAAAGGATGGATGTGTTCTCTGCTTACATTCATTGGACGTTTTCCCTTAGAGGCCAAGGCCGCCCAGGCAAAGGGGCGGTCCCACGCGTGAGGGGCCCGCGGAGCCATTTGATTGGAGAAAAGCTGCAAACCCTGACCAATCGGAAGGAGCCACGCTTCGGGCATCGGTCACCGCACCTGGACAGCTCCGATTGGTGGACTTCCGCCCCCCCTCACGAATCCTCATTGGGTGCCGTGGGTGCGTGGTGCGGCGCGATTGGTGGGTTCATGTTTCCCGTCCCCCGCCCGCGAGAAGTGGGGGTGAAAAGCGGCCCGACCTGCTTGGGGTGTAGTGGGCGGACCGCGCGGCTGGAGGTGTGAGGATCCGAACCCAGGGGTGGGGGGTGGAGGCGGCTCCTGCGATCGAAGGGGACTTGAGACTCACCGGCCGCACGTC (서열번호 33)
hHSP70	GGGCCGCCCACTCCCCCTTCCTCTCAGGGTCCCTGTCCCCTCCAGTGAATCCCAGAAGACTCTGGAGAGTTCTGAGCAGGGGGCGGCACTCTGGCCTCTGATTGGTCCAAGGAAGGCTGGGGGGCAGGACGGGAGGCGAAAACCCTGGAATATTCCCGACCTGGCAGCCTCATCGAGCTCGGTGATTGGCTCAGAAGGGAAAAGGCGGGTCTCCGTGACGACTTATAAAAGCCCAGGGGCAAGCGGTCCGGATAACGGCTAGCCTGAGGAGCTGCTGCGACAGTCCACTACCTTTTTCGAGAGTGACTCCCGTTGTCCCAAGGCTTCCCAGAGCGAACCTGTGCGGCTGCAGGCACCGGCGCGTCGAGTTTCCGGCGTCCGGAAGGACCGAGCTCTTCTCGCGGATCCAGTGTTCCGTTTCCAGCCCCCAATCTCAGAGCGGAGCCGACAGAGAGCAGGGAACCC (서열번호 34)
hKINb	GCCCCACCCCCGTCCGCGTTACAACCGGGAGGCCCGCTGGGTCCTGCACCGTCACCCTCCTCCCTGTGACCGCCCACCTGATACCCAAACAACTTTCTCGCCCCTCCAGTCCCCAGCTCGCCGAGCGCTTGCGGGGAGCCACCCAGCCTCAGTTTCCCCAGCCCCGGGCGGGGCGAGGGGCGATGACGTCATGCCGGCGCGCGGCATTGTGGGGCGGGGCGAGGCGGGGCGCCGGGGGGAGCAACACTGAGACGCCATTTTCGGCGGCGGGAGCGGCGCAGGCGGCCGAGCGGGACTGGCTGGGTCGGCTGGGCTGCTGGTGCGAGGAGCCGCGGGGCTGTGCTCGGCGGCCAAGGGGACAGCGCGTGGGTGGCCGAGGATGCTGCGGGGCGGTAGCTCCGGCGCCCCTCGCTGGTGACTGCTGCGCCGTGCCTCACACAGCCGAGGCGGGCTCGGCGCACAGTCGCTGCTCCGCGCTCGCGCCCGGCGGCGCTCCAGGTGCTGACAGCGCGAGAGAGCGCGGCCTCAGGAGCAACAC (서열번호 35)
hUBIb	TTCCAGAGCTTTCGAGGAAGGTTTCTTCAACTCAAATTCATCCGCCTGATAATTTTCTTATATTTTCCTAAAGAAGGAAGAGAAGCGCATAGAGGAGAAGGGAAATAATTTTTTAGGAGCCTTTCTTACGGCTATGAGGAATTTGGGGCTCAGTTGAAAAGCCTAAACTGCCTCTCGGGAGGTTGGGCGCGGCGAACTACTTTCAGCGGCGCACGGAGACGGCGTCTACGTGAGGGGTGATAAGTGACGCAACACTCGTTGCATAAATTTGCGCTCCGCCAGCCCGGAGCATTTAGGGGCGGTTGGCTTTGTTGGGTGAGCTTGTTTGTGTCCCTGTGGGTGGACGTGGTTGGTGATTGGCAGGATCCTGGTATCCGCTAACAGGTACTGGCCCACAGCCGTAAAGACCTGCGGGGGCGTGAGAGGGGGGAATGGGTGAGGTCAAGCTGGAGGCTTCTTGGGGTTGGGTGGGCCGCTGAGGGGAGGGGAGGGCGAGGTGACGCGACACCCGGCCTTTCTGGGAGAGTGGGCCTTGTTGACCTAAGGGGGGCGAGGGCAGTTGGCACGCGCACGCGCCGACAGAAACTAACAGACATTAACCAACAGCGATTCCGTCGCGTTTACTTGGGAGGAAGGCGGAAAAGAGGTAGTTTGTGTGGCTTCTGGAAACCCTAAATTTGGAATCCCAGTATGAGAATGGTGTCCCTTCTTGTGTTTCAATGGGATTTTTACTTCGCGAGTCTTGTGGGTTTGGTTTTGTTTTCAGTTTGCCTAACACCGTGCTTAGGTTTGAGGCAGATTGGAGTTCGGTCGGGGGAGTTTGAATATCCGGAACAGTTAGTGGGGAAAGCTGTGGACGCTTGGTAAGAGAGCGCTCTGGATTTTCCGCTGTTGACGTTGAAACCTTGAATGACGAATTTCGTATTAAGTGACTTAGCCTTGTAAAATTGAGGGGAGGCTTGCGGAATATTAACGTATTTAAGGCATTTTGAAGGAATAGTTGCTAATTTTGAAGAATATTAGGTGTAAAAGCAAGAAATACAATGATCCTGAGGTGACACGCTTATGTTTTACTTTTAAACTAGGTCACC (서열번호 36)

표적 발현 카세트를 추가로 포함하는 발현 시스템

일부 양태에서, 키메라 단백질은 키메라 전사 인자이고, 본 개시는 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트를 추가로 제공한다.

"표적 발현 카세트"는 키메라 전사 인자-조절 가능한 발현을 갖는 유전자를 포함하는 발현 카세트를 지칭한다. 발현은 비-내인성 리간드(예를 들어, 4-OHT 또는 엔독시펜)의 존재에 기초하여 키메라 전사 인자에 의해 조절된다.

일부 양태에서, 본 개시는 키메라 전사 인자-반응성 프로모터(CTF-반응성 프로모터)에 작동 가능하게 연결된 관심 유전자를 암호화하는 폴리뉴클레오티드 분자를 제공한다. CTF-반응성 프로모터는 변형된 ER-LBD를 포함하는 키메라 전사 인자에 반응하고, 4-OHT와 같은 비-내인성 리간드에 반응하여 유도 가능한 합성 유도성 프로모터이다.

일부 구현예에서, CTF-반응성 프로모터는 본원에 기술된 바와 같은 키메라 전사 인자에 결합하는 코어 프로모터 서열 및 결합 도메인을 포함한다.

결합 도메인은 하나 이상의 징크 핑거 결합 부위를 포함할 수 있다. 결합 도메인은 1, 2, 3, 4,5 ,6 7, 8, 9, 10개, 또는 그 이상의 징크 핑거 결합 부위를 포함할 수 있다. 일부 구현예에서, 결합 도메인은 하나의 징크 핑거 결합 부위를 포함한다. 일부 구현예에서, 결합 도메인은 2개의 징크 핑거 결합 부위를 포함한다. 일부 구현예에서, 결합 도메인은 3개의 징크 핑거 결합 부위를 포함한다. 일부 구현예에서, 결합 도메인은 4개의 징크 핑거 결합 부위를 포함한다. 징크 핑거 결합 부위를 포함하는 예시적인 결합 도메인은 서열 cgggtttcgtaacaatcgcatgaggattcgcaacgccttcGGCGTAGCCGATGTCGCGctcccgtctcagtaaaggtcGGCGTAGCCGATGTCGCGcaatcggactgccttcgtacGGCGTAGCCGATGTCGCGcgtatcagtcgcctcggaacGGCGTAGCCGATGTCGCGcattcgtaagaggctcactctcccttacacggagtggataACTAGTTCTAGAGGGTATATAATGGGGGCCA(서열번호 37)에 나타나 있다.

코어 프로모터 서열은 최소 프로모터를 포함할 수 있다. 최소 프로모터의 예는 minP, minCMV, YB_TATA, 및 minTK를 포함한다.

일부 양태에서, 변형된 ER-LBD를 포함하는 키메라 단백질은 키메라 전사 인자이고, 이종 작제물은 키메라 전사 인자 반응성 프로모터를 포함하는 표적 발현 카세트를 추가로 포함한다. 일부 양태에서, 변형된 ER-LBD를 포함하는 키메라 전사 인자를 암호화하는 폴리뉴클레오티드 분자를 포함하는 발현 카세트를 포함하는 제1 이종 작제물, 및 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트를 포함하는 제2 이종 작제물이 본원에 제공된다.

일부 구현예에서, 본 개시의 조작된 폴리뉴클레오티드 또는 작제물은 다수의 폴리펩티드를 생산하도록 구성된다. 예를 들어, 폴리뉴클레오티드는 2개의 상이한 폴리펩티드를 생산하도록 구성될 수 있다. 폴리뉴클레오티드 분자는 본원에 기술된 바와 같은 키메라 단백질 및 키메라 단백질에 반응하는 프로모터의 조절 하에 발현되는 관심 폴리펩티드를 포함하는 폴리펩티드를 생산하도록 구성될 수 있다.

일부 구현예에서, 본원에 기술된 바와 같은 ER-LBD 또는 키메라 단백질 및 ER-LBD 또는 키메라 단백질에 의해 전사적으로 조절될 수 있는 관심 유전자는 동일한 폴리뉴클레오티드 분자 또는 이종 작제물에 의해 암호화될 수 있다.

일부 구현예에서, 조작된 핵산은 다중시스트론성일 수 있는데, 즉, 하나를 초과하는 개별 폴리펩티드(예를 들어, 다중 외인성 폴리뉴클레오티드)가 단일 전사체로부터 생산될 수 있다. 조작된 핵산은 다양한 링커의 사용을 통해 다중시스트론성일 수 있는데, 예를 들어, 제1 외인성 폴리뉴클레오티드를 암호화하는 폴리뉴클레오티드 서열은 제2 외인성 폴리뉴클레오티드를 암호화하는 뉴클레오티드 서열에 예컨대, 5'에서 3' 배향으로 제1 유전자:링커:제2 유전자로 연결될 수 있다. 링커 폴리뉴클레오티드 서열은 하나 이상의 2A 리보솜 스키핑 요소, 예를 들어 T2A를 암호화할 수 있다. 다른 2A 리보솜 스키핑 요소는 E2A, P2A 및 F2A를 포함하나, 이에 제한되지 않는다. 2A 리보솜 스키핑 요소는 번역 중 생산되는, 제1 및 제2 유전자에 의해 암호화되는 별개의 폴리펩티드의 생산을 허용한다. 링커는 퓨린 절단 부위 또는 TEV 절단 부위와 같은 절단 가능한 링커 폴리펩티드 서열을 암호화할 수 있고, 여기서 발현 후 절단 가능한 링커 폴리펩티드는 제1 및 제2 유전자에 의해 암호화된 별도의 폴리펩티드가 생산되도록 절단된다. 절단 가능한 링커는 절단을 추가로 촉진하는, 가요성 링커(예를 들어, Gly-Ser-Gly 서열)와 같은 폴리펩티드 서열을 포함할 수 있다.

링커는 내부 리보솜 진입 부위(IRES)를 암호화할 수 있어, 번역 중 제1 및 제2 유전자에 의해 암호화된 별도의 폴리펩티드가 생산된다. 링커는 바이러스 스플라이스 수용기와 같은 스플라이스 수용기를 암호화할 수 있다.

링커는 2A 리보솜 스키핑에 이어 2A 잔기의 완전한 제거를 허용하는 퓨린 부위의 추가 절단을 통해 별도의 폴리펩티드를 생산할 수 있는 퓨린-2A 링커와 같은 링커의 조합일 수 있다. 일부 구현예에서, 링커의 조합은 퓨린 서열, 가요성 링커 및 2A 링커를 포함할 수 있다. 따라서, 일부 구현예에서, 링커는 퓨린-Gly-Ser-Gly-2A 융합 폴리펩티드이다. 일부 구현예에서, 링커는 퓨린-Gly-Ser-Gly-T2A 융합 폴리펩티드이다.

일반적으로, 다중시스트론 시스템은 임의의 수의 유전자 또는 이의 부분을 발현하기 위해 임의의 수 또는 조합의 링커를 사용할 수 있다(예를 들어, 제1, 제2 및 제3 폴리펩티드에 의해 암호화된 별도의 폴리펩티드가 생산되도록, 조작된 핵산은 각각 링커에 의해 분리된 제1, 제2 및 제3 폴리펩티드 분자를 암호화할 수 있다).

본원에서 사용되는 "링커"는 제1 폴리펩티드 서열 및 제2 폴리펩티드 서열을 연결하는 폴리펩티드 또는 전술된 다중시스트론 링커를 지칭할 수 있다.

전사후 조절 요소

일부 구현예에서, 본 개시의 조작된 핵산은 전사후 조절 요소(PRE)를 포함한다. PRE는 3차 RNA 구조 안정성 및 3' 말단 형성을 가능하게 하여 유전자 발현을 향상시킬 수 있다. PRE의 비제한적 예는 B형 간염 바이러스 PRE(HPRE) 및 우드척 간염 바이러스 PRE(WPRE)를 포함한다. 일부 구현예에서, 전사후 조절 요소는 우드척 간염 바이러스 전사후 조절 요소(WPRE)이다. 일부 구현예에서, WPRE는 WPRE 요소의 알파, 베타, 및 감마 구성요소를 포함한다. 일부 구현예에서, WPRE는 WPRE 요소의 알파 구성요소를 포함한다. WPRE 서열의 예는 서열번호 38 및 서열번호 39를 포함한다.

조작된 세포

또한, 본 개시의 하나 이상의 폴리뉴클레오티드 분자 또는 작제물을 포함하는 세포, 및 세포를 생산하는 방법이 본원에 제공된다. 이들 세포는 본원에서 "조작된 세포"로 지칭된다. 통상적으로 하나 이상의 조작된 핵산을 포함하는 이러한 세포는 자연에서 발생하지 않는다. 일부 구현예에서, 세포는 하나 이상의 조작된 폴리뉴클레오티드를 재조합적으로 발현하는 단리된 세포이다. 일부 구현예에서, 조작된 폴리뉴클레오티드는 하나 이상의 벡터 또는 세포의 게놈으로부터 선택된 유전자좌로부터 발현된다. 일부 구현예에서, 세포는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 폴리뉴클레오티드를 포함하도록 조작된다.

본 개시의 조작된 세포는 세포의 게놈 내로 통합된 조작된 폴리뉴클레오티드를 포함할 수 있다. 조작된 세포는 예를 들어, 플라스미드 또는 mRNA와 같은 일시적 발현 시스템으로 조작된, 세포의 게놈으로 통합되지 않고 발현할 수 있는 조작된 폴리뉴클레오티드를 포함할 수 있다.

조작된 세포 유형

본 개시의 조작된 세포는 인간 세포일 수 있다. 조작된 세포는 인간 일차 세포일 수 있다. 조작된 일차 세포는 임의의 체세포일 수 있다. 조작된 일차 세포는 임의의 줄기 세포일 수 있다. 일부 구현예에서, 조작된 세포는 대상체로부터 유래된다. 일부 구현예에서, 조작된 세포는 대상체에 대하여 동종이계이다.

본 개시의 조작된 세포는 대상체, 예컨대, 암이 있는 것으로 알려지거나 의심되는 대상체로부터 단리될 수 있다. 세포 단리 방법은 당업자에게 공지되어 있고, FACS 분류, 양성 단리 기술 및 음성 단리, 자기 단리, 및 이들의 조합과 같은 세포-표면 마커 발현에 기초한 분류 기술을 포함하지만 이에 제한되지는 않는다. 조작된 세포는 치료를 받는 대상체에 대하여 동종이형일 수 있다. 동종이형 변형된 세포는 치료를 받는 대상체에 HLA-일치될 수 있다. 조작된 세포는 배양된 세포, 예컨대, 생체 외 배양된 세포일 수 있다. 조작된 세포는 생체 외 배양된 세포, 예컨대, 대상체로부터 단리된 일차 세포일 수 있다. 배양된 세포는 하나 이상의 사이토카인과 함께 배양될 수 있다.

일부 구현예에서, 본 개시의 조작된 세포는 T 세포(예를 들어, CD8+ T 세포, CD4+ T 세포, 또는 감마-델타 T 세포), 세포독성 T 림프구(CTL), 조절 T 세포, 자연 살해 T(NKT) 세포, 자연 살해(NK) 세포, B 세포, 종양 침윤 림프구(TIL), 선천 림프 세포, 비만 세포, 호산구, 호염기구, 호중구, 골수 세포, 대식세포(예를 들어, M1 대식 세포 또는 M2 대식 세포), 단핵구, 수지상 세포, 적혈구, 혈소판 세포, 뉴런, 희소돌기아교세포, 별아교세포, 플라코드-유래 세포, 슈반 세포, 심근세포, 내피 세포, 결절 세포, 미세아교세포, 간세포, 담관세포, 베타 세포, 인간 배아 줄기 세포(ESC), ESC-유래 세포, 다능성 줄기 세포, 간엽 기질 세포(MSC), 유도된 다능성 줄기 세포(iPSC), 및 iPSC-유래 세포로부터 선택된다.

일부 구현예에서, 본 개시의 조작된 세포는 T 세포(예를 들어, CD8+ T 세포, CD4+ T 세포, 또는 감마-델타 T 세포)이다. 일부 구현예에서, 본 개시의 조작된 것은 세포독성 T 림프구(CTL)이다. 일부 구현예에서, 본 개시의 조작된 세포는 조절 T 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 자연 살해 T(NKT) 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 자연 살해(NK) 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 B 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 종양 침윤 림프구(TIL)이다. 일부 구현예에서, 본 개시의 조작된 세포는 선천성 림프 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 비만 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 호산구이다. 일부 구현예에서, 본 개시의 조작된 세포는 호염기구이다. 일부 구현예에서, 본 개시의 조작된 세포는 호중구이다. 일부 구현예에서, 본 개시의 조작된 세포는 골수 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 대식세포, 예를 들어, M1 대식세포 또는 M2 대식세포)이다. 일부 구현예에서, 본 개시의 조작된 세포는 단핵구이다. 일부 구현예에서, 본 개시의 조작되거나 단리된 세포는 수지상 세포이다. 일부 구현예에서, 본 개시의 조작되된 세포는 적혈구이다. 일부 구현예에서, 본 개시의 조작된 세포는 혈소판 세포이다. 일부 구현예에서, 본 개시의 세포는 뉴런이다. 일부 구현예에서, 본 개시의 세포는 희소돌기아교세포이다. 일부 구현예에서, 본 개시의 세포는 별아교세포이다. 일부 구현예에서, 본 개시의 세포는 플라코드-유래 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 슈반 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 심근세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 내피 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 결절 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 미세아교세포이다. 일부 구현예에서, 본 개시의 조작되된 세포는 간세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 담관세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 베타 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 인간 배아 줄기 세포(ESC)이다. 일부 구현예에서, 본 개시의 조작된 세포는 ESC-유래 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 다능성 줄기 세포이다. 일부 구현예에서, 본 개시의 조작된 세포는 간엽 기질 세포(MSC)이다. 일부 구현예에서, 본 개시의 조작된 세포는 유도된 다능성 줄기 세포(iPSC)이다. 일부 구현예에서, 본 개시의 조작된 세포는 iPSC-유래 세포이다. 일부 구현예에서, 조작된 세포는 자가 유래이다. 일부 구현예에서, 조작된 세포는 동종이계이다. 일부 구현예에서, 본 개시의 조작되된 세포는 CD34+ 세포, CD3+ 세포, CD8+ 세포, CD16+ 세포, 및/또는 CD4+ 세포이다.

일부 구현예에서, 본 개시의 세포는 선암종 세포, 방광 종양 세포, 뇌 종양 세포, 유방 종양 세포, 자궁경부 종양 세포, 결장직장 종양 세포, 식도 종양 세포, 신경교종 세포, 신장 종양 세포, 간 종양 세포, 폐 종양 세포, 흑색종 세포, 중피종 세포, 난소 종양 세포, 췌장 종양 세포, 전립선 종양 세포, 피부 종양 세포, 갑상선 종양 세포, 및 자궁 종양 세포로부터 선택된 종양 세포이다.

또한 본 개시의 조작된 세포를 배양하는 단계를 포함하는 방법이 본원에 제공된다. 본원에 기재된 조작된 세포를 배양하는 방법은 공지되어 있다. 당업자는 배양 조건이 특정 조작된 관심 세포에 의존할 것임을 인식할 것이다. 당업자는 배양 조건이 조작된 세포의 특정 하류 용도, 예를 들어 조작된 세포의 대상체에게로의 후속 투여를 위한 특정 배양 조건에 의존할 것임을 인식할 것이다.

세포 조작 방법

본원에 기술된 바와 같은 임의의 폴리뉴클레오티드 분자 또는 작제물로 세포를 조작하기 위한 조성물 및 방법이 또한 본원에 제공된다.

일반적으로, 세포는 본 개시의 하나 이상의 폴리뉴클레오티드의 도입(즉, 전달)을 통해 조작된다. 전달 방법은 바이러스 매개 전달, 지질 매개 형질주입, 나노입자 전달, 전기천공, 초음파 처리 및 물리적 수단에 의한 세포막 변형을 포함하지만, 이에 제한되지 않는다. 당업자는 전달 방법의 선택이 조작될 특정 세포 유형에 의존할 수 있음을 이해할 것이다.

바이러스 매개 전달

바이러스 벡터 기반 전달 플랫폼을 사용하여 세포를 조작할 수 있다. 일반적으로, 바이러스 벡터 기반 전달 플랫폼은 숙주 세포에 도입(즉, 전달)을 통해 세포를 조작한다. 예를 들어, 바이러스 벡터 기반 전달 플랫폼은 본원에 기재된 임의의 조작된 핵산을 도입함으로써 세포를 조작할 수 있다. 바이러스 벡터 기반 전달 플랫폼은 핵산일 수 있고, 따라서 조작된 핵산은 조작된 바이러스 유래 핵산을 포함할 수도 있다. 이러한 조작한 바이러스-유래 핵산은 재조합 바이러스 또는 조작된 바이러스로도 지칭될 수 있다.

바이러스 벡터 기반 전달 플랫폼은 동일한 핵산 내에서 하나를 초과하는 조작된 핵산, 유전자 또는 이식유전자를 암호화할 수 있다. 예를 들어, 조작된 바이러스 유래 핵산, 예를 들어, 재조합 바이러스 또는 조작된 바이러스는 하나 이상의 효과기 분자를 암호화하는 본원에 기재된 임의의 조작된 핵산을 포함하지만, 이에 제한되지 않는 하나 이상의 이식유전자를 암호화할 수 있다. 하나 이상의 이식유전자는 본원에 기재된 폴리펩티드(예를 들어, 변형된 ER-LBD)를 발현하도록 구성될 수 있다. 바이러스 벡터 기반 전달 플랫폼은 변형된 ER-LBD를 암호화하는 이식유전자에 더해 하나 이상의 유전자, 예를 들어 시스 작용 요소 또는 유전자라고 지칭되는, 바이러스 감염성 및/또는 바이러스 생산에 필요한 바이러스 유전자(예를 들어, 캡시드 단백질, 외피 단백질, 바이러스 중합효소, 바이러스 전사효소 등)를 암호화할 수 있다.

바이러스 벡터 기반 전달 플랫폼은 하나를 초과하는 바이러스 벡터, 예컨대, 본원에 기재되고, 트랜스-작용 요소 또는 유전자로 지칭되는 조작된 핵산, 유전자, 또는 이식유전자를 암호화하는 별도의 바이러스 벡터를 포함할 수 있다. 예를 들어, 헬퍼 의존성 바이러스 벡터 기반 전달 플랫폼은 변형된 ER-LBD를 암호화하는 벡터에 더하여 하나 이상의 추가의 개별 벡터에 대한 바이러스 감염성 및/또는 바이러스 생산에 필요한 추가 유전자를 제공할 수 있다. 하나의 바이러스 벡터는 하나 초과의 조작된 폴리뉴클레오티드, 예컨대 변형된 ER-LBD를 생산하도록 구성된 조작된 폴리뉴클레오티드 및 관심 유전자를 생산하도록 구성된 조작된 폴리뉴클레오티드를 전달하는 하나의 벡터를 전달할 수 있다. 하나 초과의 바이러스 벡터는 하나 초과의 조작된 핵산, 예컨대, 변형된 ER-LBD를 생산하도록 구성된 조작된 폴리뉴클레오티드를 전달하는 제1 벡터 및 추가의 조작된 폴리뉴클레오티드를 전달하는 제2 벡터를 전달할 수 있다. 사용되는 바이러스 벡터의 수는 전술된 바이러스 벡터 기반 백신 플랫폼의 패키징 용량에 의존할 수 있고, 당업자는 적절한 수의 바이러스 벡터를 선택할 수 있다.

일반적으로, 임의의 바이러스 벡터 기반 시스템은 분자의 시험관 내 생산에 사용될 수 있거나, 예를 들어, 생체 내 전달을 위한 생체 내 및 생체 외 유전자 요법 절차에서 사용될 수 있다. 적절한 바이러스 벡터 기반 시스템의 선택은 화물/페이로드 크기, 바이러스 시스템의 면역원성, 관심 표적 세포, 유전자 발현 강도 및 시기, 그리고 당업자가 인식하는 기타 요인과 같은 다양한 요인에 따를 것이다.

바이러스 벡터 기반 전달 플랫폼은 RNA 기반 바이러스 또는 DNA 기반 바이러스일 수 있다. 예시적인 바이러스 벡터 기반 전달 플랫폼은 단순 포진 바이러스, 아데노바이러스, 홍역 바이러스, 인플루엔자 바이러스, 인디애나 베시큘로바이러스, 뉴캐슬병 바이러스, 백시니아 바이러스, 소아마비 바이러스, 점액종 바이러스, 레오바이러스, 볼거리 바이러스, 마라바 바이러스, 광견병 바이러스, 로타바이러스, 간염 바이러스, 풍진 바이러스, 뎅기열 바이러스, 치쿤구니야 바이러스, 호흡기 세포융합 바이러스, 림프구성 맥락수막염 바이러스, 모르빌리바이러스, 렌티바이러스, 복제 레트로바이러스, 랍도바이러스, 세네카 밸리 바이러스, 신드비스 바이러스, 및 이들의 임의의 변이체 또는 유도체를 포함하지만 이에 제한되지 않는다. 다른 예시적인 바이러스 벡터 기반 전달 플랫폼은 당업계에 기술되어 있고, 예를 들어 우두, 계두, 자가 복제 알파바이러스, 마라바바이러스, 아데노바이러스(예를 들어, Tatsis 등의 문헌[ Adenoviruses, Molecular Therapy (2004) 10, 616*?*629] 참조), 또는 2, 3 또는 혼성 2/3세대 렌티바이러스 및 특정 세포 유형 또는 수용체를 표적으로 하도록 설계된 임의의 세대의 재조합 렌티바이러스를 포함하지만, 이에 제한되지 않는 렌티바이러스(예를 들어, Hu 등의 문헌[Immunization Delivered by Lentiviral Vectors for Cancer and Infectious Diseases, Immunol Rev. (2011) 239(1): 45-61], Sakuma 등의 문헌[Lentiviral vectors: basic to translational, Biochem J. (2012) 443(3):603-18], Cooper 등의 문헌[Rescue of splicing-mediated intron loss maximizes expression in lentiviral vectors containing the human ubiquitin C promotor, Nucl. Acids Res. (2015) 43 (1): 682-690], Zufferey 등의 문헌[Self-Inactivating Lentivirus Vector for Safe and Efficient In vivo Gene Delivery, J. Virol. (1998) 72 (12): 9873-9880] 참조)이다.

서열은 세포하 구획을 표적으로 하는 하나 이상의 서열이 선행될 수 있다. 숙주 세포 내로 도입(즉, 전달) 시, 감염된 세포(즉, 조작된 세포)는 변형된 ER-LBD(또는 변형된 ER-LBD를 포함하는 키메라 폴리펩티드)를 발현할 수 있고, 일부 경우에는 이를 분비할 수 있다. 면역화 프로토콜에 유용한 백시니아 벡터 및 방법은 예를 들어, 미국 특허 제4,722,848호에 기재되어 있다. 또 다른 벡터는 BCG(Bacille Calmette Guerin)이다. BCG 벡터는 Stover 등의 문헌 [Nature 351:456-460 (1991)]에 기재되어 있다. 조작된 핵산의 도입(즉, 전달)에 유용한 매우 다양한 다른 벡터, 예를 들어, 살모넬라 티피 벡터 등은 본원의 설명으로부터 당업자에게 명백할 것이다.

바이러스 벡터 기반 전달 플랫폼은 본원에서 종양용해성 바이러스로 지칭되는, 종양 세포를 표적으로 하는 바이러스일 수 있다. 종양용해성 바이러스의 예는 종양용해성 단순포진 바이러스, 종양용해성 아데노바이러스, 종양용해성 홍역 바이러스, 종양용해성 인플루엔자 바이러스, 종양용해성 인디애나 소포바이러스, 종양용해성 뉴캐슬병 바이러스, 종양용해성 백시니아 바이러스, 종양용해성 소아마비 바이러스, 종양용해성 점액종 바이러스, 종양용해성 레오바이러스, 종양용해성 이하선염 바이러스, 종양용해성 마라바 바이러스, 종양용해성 광견병 바이러스, 종양용해성 로타바이러스, 종양용해성 간염 바이러스, 종양용해성 풍진 바이러스, 종양용해성 뎅기열 바이러스, 종양용해성 치쿤구니야 바이러스, 종양용해성 호흡기 세포융합 바이러스, 종양용해성 림프구성 맥락수막염 바이러스, 종양용해성 모르빌리바이러스, 종양용해성 렌티바이러스, 종양용해성 복제 레트로바이러스, 종양용해성 랍도바이러스, 종양용해성 세네카 밸리 바이러스, 종양용해성 신드비스 바이러스, 및 이들의 임의의 변이체 또는 유도체를 포함하나, 이에 한정되지는 않는다. 본원에 기재된 임의의 종양용해성 바이러스는 하나 이상의 이식유전자(예를 들어, 본원에 기재된 조작된 핵산)를 포함하는 재조합 종양용해성 바이러스일 수 있다. 이식유전자는 변형된 ER-LBD(또는 변형된 ER-LBD를 포함하는 키메라 폴리펩티드) 및 선택적으로 관심 유전자를 발현하도록 구성될 수 있다.

일부 구현예에서, 바이러스는 렌티바이러스, 레트로바이러스, 종양용해성 바이러스, 아데노바이러스, 아데노-연관 바이러스(AAV), 및 바이러스-유사 입자 (VLP)로부터 선택된다.

바이러스 벡터 기반 전달 플랫폼은 레트로바이러스 기반일 수 있다. 일반적으로, 레트로바이러스 벡터는 최대 6~10 kb의 외래 서열에 대한 패키징 용량을 갖는 시스 작용 긴 말단 반복부로 구성된다. 최소 시스 작용 LTR은 벡터의 복제 및 패키징에 충분하고, 그런 다음 이는 하나 이상의 조작된 핵산(예를 들어, 변형된 ER-LBD를 암호화하는 이식유전자)을 표적 세포에 통합하여 영구적인 이식유전자 발현을 제공하는 데 사용된다. 레트로바이러스 기반 전달 시스템은 쥣과 백혈병, 바이러스(MuLV), 긴팔원숭이 백혈병 바이러스(GaLV), 원숭이 면역 결핍 바이러스(SIV), 인간 면역 결핍 바이러스(HIV), 및 이들의 조합을 기반으로 하는 시스템을 포함하지만, 이에 한정되지 않는다(예를 들어, Buchscher 등의 문헌[J. Virol. 66:2731-2739 (1992)]; Johann 등의 문헌[J. Virol. 66:1635-1640 (1992)]; Sommnerfelt 등의 문헌[Virol. 176:58-59 (1990)]; Wilson 등의 문헌[J. Virol. 63:2374-2378 (1989)]; Miller 등의 문헌[J, Virol. 65:2220-2224 (1991)]; PCT/US94/05700 참조). 다른 레트로바이러스 시스템은 피닉스 레트로바이러스 시스템을 포함한다.

바이러스 벡터 기반 전달 플랫폼은 렌티바이러스 기반일 수 있다. 일반적으로, 렌티바이러스 벡터는 비분열 세포를 형질도입하거나 감염시킬 수 있고 통상적으로 높은 바이러스 역가를 생성할 수 있는 레트로바이러스 벡터이다. 렌티바이러스 기반 전달 플랫폼은 ViraPower 시스템(ThermoFisher) 또는 pLenti 시스템(Cell Biolabs)과 같은 HIV 기반일 수 있다. 렌티바이러스 기반 전달 플랫폼은 SIV, 또는 FIV-기반일 수 있다. 다른 예시적인 렌티바이러스 기반 전달 플랫폼은 미국 특허 번호 제7,311,907호; 제7,262,049호; 제7,250,299호; 제7,226,780호; 제7,220,578호; 제7,211,247호; 제7,160,721호; 제7,078,031호; 제7,070,993호; 제7,056,699호; 제6,955,919호에 상세히 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다.

바이러스 벡터 기반 전달 플랫폼은 아데노바이러스 기반일 수 있다. 일반적으로, 아데노바이러스 기반 벡터는 많은 세포 유형에서 매우 높은 형질도입 효율이 가능하고, 세포 분열이 필요하지 않고, 높은 역가 및 발현 수준을 달성하고, 비교적 간단한 시스템에서 대량으로 생산될 수 있다. 일반적으로, 아데노바이러스는 숙주의 게놈에 통합되지 않기 때문에 감염된 세포 내에서 이식유전자의 일시적인 발현을 위해 아데노바이러스를 사용할 수 있다. 아데노바이러스 기반 전달 플랫폼은 Li 등의 문헌[Invest Opthalmol Vis Sci 35:2543 2549, 1994]; Borras 등의 문헌[Gene Ther 6:515 524, 1999]; Li 및 Davidson의 문헌[PNAS 92:7700 7704, 1995]; Sakamoto 등의 문헌[H Gene Ther 5:1088 1097, 1999]; WO 94/12649, WO 93/03769; WO 93/19191; WO 94/28938; WO 95/11984 및 WO 95/00655에 상세히 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다. 다른 예시적인 아데노바이러스 기반 전달 플랫폼은 미국 특허 번호 제5585362호; 제6,083,716호, 제7,371,570호; 제7,348,178호; 제7,323,177호; 제7,319,033호; 제7,318,919호; 및 제7,306,793호 및 국제 특허 출원 WO96/13597에 상세히 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다.

바이러스 벡터 기반 전달 플랫폼은 아데노 연관 바이러스(AAV) 기반일 수 있다. 아데노-연관 바이러스("AAV") 벡터는 조작된 핵산(예를 들어, 본원에 기재된 임의의 조작된 핵산)으로 세포를 형질도입하기 위해 사용될 수 있다. AAV 시스템은 변형된 ER-LBD(또는 변형된 ER-LBD를 포함하는 키메라 폴리펩티드)의 시험관 내 생산에 사용될 수 있거나, 예를 들어, 변형된 ER-LBD의 생체 내 전달을 위해 생체 내 및 생체 외 유전자 요법 절차에 사용될 수 있다(예를 들어, West 등의 문헌[Virology 160:38-47 (1987)]; 미국 특허 제4,797,368호; 제5,436,146호; 제6,632,670호; 제6,642,051호; 제7,078,387호; 제7,314,912호; 제6,498,244호; 제7,906,111호; 미국 특허 공보 US 2003-0138772, US 2007/0036760, 및 US 2009/0197338; Gao,등의 문헌[J. Virol, 78(12):6381-6388 (June 2004)]; Gao, 등의 문헌[Proc Natl Acad Sci USA, 100(10):6081-6086 (May 13, 2003)]; 및 국제 특허 출원 WO 2010/138263 및 WO 93/24641; Kotin의 문헌[Human Gene Therapy 5:793-801 (1994)]; Muzyczka의 문헌[J. Clin. Invest. 94:1351 (1994)] 참조, 각각은 사실상 본원에 참조로서 포함된다). 재조합 AAV 벡터를 구축하기 위한 예시적인 방법은 미국 특허 제5,173,414호; Tratschin등의 문헌[Mol. Cell. Biol. 5:3251-3260 (1985)]; Tratschin, 등의 문헌[Mol. Cell, Biol. 4:2072-2081 (1984)]; Hermonat & Muzyczka의 문헌[PNAS 81:64666470 (1984)]; 및 Samuiski 등의 문헌[J. Virol. 63:03822-3828 (1989)]에 상세히 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다. 일반적으로, AAV-기반 벡터는 AAV1, AAV2, AAV3, AAV4, AAV5, AAV6, AAV7, AAV8, AAV9, AAV.Rh10, AAV11 및 이들의 변이체 중 어느 하나에 상응하는 아미노산 서열을 갖는 캡시드 단백질을 포함한다.

바이러스 벡터 기반 전달 플랫폼은 바이러스 유사 입자(VLP) 플랫폼일 수 있다. 일반적으로, VLP는 바이러스 구조 단백질을 생성하고 생성된 바이러스 입자를 정제하여 구성된다. 그런 다음, 정제 후, 화물/페이로드(예를 들어, 본원에 기재된 임의의 조작된 핵산)는 생체 외에서 정제된 입자 내에 캡슐화된다. 따라서, VLP의 생산은 바이러스 구조 단백질을 암호화하는 핵산과 화물/페이로드를 암호화하는 핵산의 분리를 유지한다. VLP 생산에 사용되는 바이러스 구조 단백질은 포유동물, 효모, 곤충, 박테리아를 포함하는 다양한 발현 시스템, 또는 생체 내 번역 발현 시스템에서 생산될 수 있다. 정제된 바이러스 입자는 원하는 화물의 존재하에 변성 및 개질되어 당업자에게 공지된 방법을 사용하여 VLP를 생성할 수 있다. VLP의 생산은 Seow 등의 문헌 [Mol Ther. 2009 May; 17(5): 767-777]에 상세히 기재되어 있고, 사실상 본원에 참조로서 포함된다.

바이러스 벡터 기반 전달 플랫폼은 다양한 세포를 표적화(즉, 감염)시키거나, 세포의 좁은 하위세트를 표적화하거나, 특정 세포를 표적화하도록 조작될 수 있다. 일반적으로, 바이러스 벡터 기반 전달 플랫폼에 대해 선택된 외피 단백질은 바이러스 친화성을 결정한다. 바이러스 벡터 기반 전달 플랫폼에 사용되는 바이러스는 특정 관심 세포를 표적으로 하기 위해 유사형을 지정할 수 있다. 바이러스 벡터 기반 전달 플랫폼은 범친화성일 수 있고 다양한 세포를 감염시킬 수 있다. 예를 들어, 범친화성 바이러스 벡터 기반 전달 플랫폼은 VSV-G 외피를 포함할 수 있다. 바이러스 벡터 기반 전달 플랫폼은 양친성일 수 있고 포유동물 세포를 감염시킬 수 있다. 따라서, 당업자는 원하는 세포 유형을 표적화하기 위한 적절한 친화성, 유사형 및/또는 외피 단백질을 선택할 수 있다.

지질 구조 전달 시스템

본 개시의 조작된 핵산(예를 들어, 본원에 기재된 변형된 ER-LBD 또는 키메라 단백질)은 지질 매개 전달 시스템을 사용하여 세포 내로 도입될 수 있다. 일반적으로, 지질 매개 전달 시스템은 내부 구획을 감싸는 외부 지질막으로 구성된 구조를 사용한다. 지질 기반 구조의 예는 지질 기반 나노입자, 리포솜, 미셀, 엑소좀, 소포, 세포외 소포, 세포 또는 조직을 포함하지만, 이에 한정되지 않는다. 지질 구조 전달 시스템은 시험관 내, 생체 내 또는 생체 외에서 화물/페이로드(예를 들어, 본원에 기재된 임의의 조작된 핵산)를 전달할 수 있다.

지질 기반 나노입자는 단층 리포솜, 다중층 리포솜, 및 지질 제제를 포함할 수 있지만 이에 제한되지 않는다. 본원에 사용된 "리포솜"은 원하는 화물, 예를 들어, 본원에 기재된 임의의 조작된 핵산과 같은 조작된 핵산을 지질 쉘 또는 지질 응집체 내에 포함시켜 형성된 지질 비히클의 시험관 내 제제를 포괄하는 일반 용어이다. 리포솜은 일반적으로 인지질을 포함하는 이중층 막, 및 일반적으로 수용성 조성물을 포함하는 내부 매질을 갖는 소포 구조를 갖는 것을 특징으로 할 수 있다. 리포솜은 에멀젼, 발포체, 미셀, 불용성 단층, 액정, 인지질 분산액, 라멜라층 등을 포함하지만 이에 한정되지는 않는다. 리포솜은 단층 리포솜일 수 있다. 리포솜은 다중층 리포솜일 수 있다. 리포솜은 다소포성 리포솜일 수 있다. 리포솜은 양전하, 음전하 또는 중성으로 하전될 수 있다. 특정 구현예에서, 리포솜은 전하가 중성이다. 리포솜은 일반적으로 중성 및 음으로 하전된 인지질과 콜레스테롤과 같은 스테롤을 포함하는 표준 소포 형성 지질로부터 형성될 수 있다. 지질의 선택은 일반적으로 원하는 목적, 예를 들어 리포솜 크기, 산 불안정성 및 혈류 내 리포솜의 안정성과 같은 생체 내 전달 기준을 고려하여 인도된다. 예를 들어, Szoka 등의 문헌[Ann. Rev. Biophys. Bioeng. 9; 467 (1980)], 미국 특허 제4,235,871호, 제4,501,728호, 제4,501,728호, 제4,837,028호, 및 제5,019,369호에 기술된 바와 같이 다양한 방법으로 리포솜을 제조할 수 있고, 각각은 사실상 본원에 참조로서 포함된다.

다중층 리포솜은 인지질을 포함하는 지질이 과량의 수용액에 현탁되어 다중 지질층이 수성 매질에 의해 분리될 때 자발적으로 생성된다. 물과 용해된 용질은 자가 재배열을 겪는 지질 성분에 따라 지질 이중층 사이의 닫힌 구조에 갇힌다. 원하는 화물(예를 들어, 폴리펩티드, 핵산, 소분자 약물, 조작된 핵산, 예를 들어 본원에 기재된 임의의 조작된 핵산, 바이러스 벡터, 바이러스 기반 전달 시스템 등)은 리포솜의 수성 내부에 캡슐화, 리포솜 및 폴리펩티드/핵산 둘 다와 결합된 연결 분자를 통해 리포솜에 부착, 리포솜의 지질 이중층 내에 산재, 리포솜에 포획, 리포솜과 복합체화, 또는 그렇지 않으면 표적 개체에 전달될 수 있도록 리포솜과 결합될 수 있다. 친유성 분자 또는 친유성 영역을 가진 분자도 또한 지질 이중층에 용해되거나 결합될 수 있다.

본 구현예에 따라 사용되는 리포솜은 당업자에게 공지된 바와 같이 상이한 방법에 의해 제조될 수 있다. 리포솜의 제조는 WO 2016/201323, 국제 출원 PCT/US85/01161 및 PCT/US89/05040, 및 미국 특허 제4,728,578호, 제4,728,575호, 제4,737,323호, 제4,533,254호, 제4,162,282호, 제4,310,505호, 및 제4,921,706호에 추가 세부사항이 기재되어 있고; 각각은 사실상 본원에 참조로서 포함된다.

리포솜은 양이온성 리포솜일 수 있다. 양이온성 리포솜의 예는 미국 특허 제5,962,016호; 제5,030,453호; 제6,680,068호, 미국 출원 제2004/0208921호, 및 국제 특허 출원 WO03/015757A1, WO04029213A2, 및 WO02/100435A1에 상세히 기재되어 있고, 각각은 그 전체가 참조로서 본원에 포함된다.

지질 매개 유전자 전달 방법은 예를 들어, WO 96/18372; WO 93/24640; Mannino & Gould-Fogerite의 문헌[BioTechniques 6(7): 682-691 (1988)]; 미국 특허 제5,279,833호 Rose 미국 특허 제5,279,833호; WO91/06309; 및 Felgner 등의 문헌[Proc. Natl. Acad. Sci. USA 84: 7413-7414 (1987)]에 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다.

엑소좀은 원형질막과 다소포체의 융합 후 세포외 환경으로 방출되는 세포내 이입 기원의 작은 막 소포이다. 엑소좀의 크기는 30 내지 100 nm 직경 범위이다. 이들의 표면은 공여자 세포의 세포막에서 나온 지질 이중층으로 구성되어 있고, 엑소좀을 생산한 세포의 세포질을 함유하고, 표면에 모세포의 막 단백질을 나타낸다. 핵산의 전달에 유용한 엑소좀은 당업자에게 공지되어 있고, 예를 들어, 사실상 참조로서 본원에 포함된 미국 특허 제9,889,210호에 상세히 기재된 엑소좀이다.

본원에 사용된 바와 같이, 용어 "세포외 소포" 또는 "EV"는 내부 공간을 둘러싸는 막을 포함하는 세포 유래 소포를 지칭한다. 일반적으로, 세포외 소포는 이들이 유래된 세포보다 작은 직경을 갖는 모든 막 결합 소포를 포함한다. 일반적으로 세포외 소포는 직경이 20 nm 내지 1000 nm 범위이고, 세포외 소포의 외부 표면에 표시되는 내부 공간에 및/또는 막에 걸쳐 있는 다양한 거대분자 화물을 포함할 수 있다. 화물은 핵산(예를 들어, 본원에 기재된 임의의 조작된 핵산), 단백질, 탄수화물, 지질, 소분자, 및/또는 이들의 조합을 포함할 수 있다. 예로서 그리고 제한 없이, 세포외 소포는 세포사멸체, 세포의 단편, 직접 또는 간접 조작(예를 들어, 연속 압출 또는 알칼리 용액으로 처리)에 의해 세포로부터 유래된 소포, 소포화된 소기관, 및 살아있는 세포에 의해 (예를 들어, 직접적인 원형질막 출아 또는 후기 엔도솜과 원형질막의 융합에 의해) 생성된 소포를 포함한다. 세포외 소포는 살아있는 유기체 또는 죽은 유기체, 이식된 조직 또는 기관, 및/또는 배양된 세포로부터 유래될 수 있다.

본원에 사용된 용어 "엑소좀"은 내부 공간을 둘러싸는 막을 포함하는 세포 유래 작은 (직경 20~300 nm, 보다 바람직하게는 직경 40~200 nm 사이) 소포를 지칭하고, 이는 직접적인 원형질막 출아 또는 후기 엔도솜과 원형질막의 융합에 의해 세포로부터 생성된다. 엑소좀은 지질 또는 지방산 및 폴리펩티드를 포함하고 선택적으로 페이로드(예를 들어, 치료제), 수용자(예를 들어, 표적화 모이어티), 폴리뉴클레오티드(예를 들어, 핵산, RNA, 또는 DNA, 예를 들어 본원에 기재된 임의의 조작된 핵산), 당(예를 들어, 단순 당, 다당류, 또는 글리칸) 또는 다른 분자를 포함한다. 엑소좀은 생산자 세포로부터 유래될 수 있고, 그의 크기, 밀도, 생화학적 매개변수, 또는 이들의 조합에 기초하여 생산자 세포로부터 단리될 수 있다. 엑소좀은 세포외 소포의 일종이다. 일반적으로, 엑소좀 생산/생물발생은 생산자 세포의 파괴를 초래하지 않는다. 엑소좀 및 엑소좀의 제조는 그 전체가 참조로서 본원에 포함된 WO 2016/201323에 추가로 상세히 기재되어 있다.

본원에 사용된 용어 "나노소포"("미세소포"로도 지칭됨)는 내부 공간을 둘러싸는 막을 포함하는 세포 유래 작은 (직경 20~250 nm, 보다 바람직하게는 직경 30~150 nm 사이) 소포를 지칭하고, 이는 직접 또는 간접적 조작에 의해 세포로부터 생성되어 상기 나노소포가 상기 조작 없이 상기 생산자 세포에 의해 생성되지 않는다. 일반적으로, 나노소포는 세포외 소포의 아종이다. 생산자 세포의 적절한 조작은 연속 압출, 알칼리 용액 처리, 초음파 처리 또는 이들의 조합을 포함하지만 이에 한정되지는 않는다. 나노소포의 생산은 일부 경우에 상기 생산자 세포의 파괴를 초래할 수 있다. 바람직하게는, 나노소포 집단은 원형질막으로부터의 직접 출아 또는 원형질막과 후기 엔도솜의 융합에 의해 생산자 세포로부터 유래된 소포가 실질적으로 없다. 나노소포는 지질 또는 지방산 및 폴리펩티드, 및 선택적으로 페이로드(예를 들어, 치료제), 수용자(예를 들어, 표적화 모이어티), 폴리뉴클레오티드(예를 들어, 핵산, RNA, 또는 DNA, 예컨대, 본원에 기재된 임의의 조작된 핵산), 당(예를 들어, 단순 당, 다당류, 또는 글리칸) 또는 다른 분자를 포함한다. 나노소포는 일단 상기 조작에 따라 생산자 세포로부터 유래되면, 이의 크기, 밀도, 생화학적 매개변수, 또는 이들의 조합에 기초하여 생산자 세포로부터 단리될 수 있다.

지질 나노입자(LNP)는 일반적으로, 지질의 양친매성 성질에 의존하여 막 및 소포 유사 구조를 형성하는 합성 지질 구조이다(Riley 2017). 일반적으로, 이들 소포는 표적 세포의 막으로 흡수되고 화물을 세포질 내로 방출함으로써 본원에 기재된 임의의 조작된 핵산 또는 바이러스 시스템과 같은 화물/페이로드를 전달한다. LNP 형성에 사용되는 지질은 양이온성, 음이온성 또는 중성일 수 있다. 지질은 합성 또는 천연 유래일 수 있고, 일부 경우에는 생분해성이다. 지질은 지방, 콜레스테롤, 인지질, 폴리에틸렌글리콜(PEG) 접합체(페길화 지질)을 포함하지만, 이에 제한되지 않는 지질 접합체, 왁스, 오일, 글리세리드 및 지용성 비타민을 포함할 수 있다. 지질 조성물은 일반적으로 양이온성, 중성, 음이온성 및 양친매성 지질과 같은 물질의 정의된 혼합물을 포함한다. 일부 예에서, 특정 지질은 LNP 응집을 방지하거나, 지질 산화를 방지하거나, 추가 모이어티의 부착을 용이하게 하는 기능적 화학기를 제공하기 위해 포함된다. 지질 조성물은 전체 LNP 크기와 안정성에 영향을 줄 수 있다. 한 예에서, 지질 조성물은 디리놀레일메틸- 4-디메틸아미노부티레이트(MC3) 또는 MC3-유사 분자를 포함한다. MC3 및 MC3-유사 지질 조성물은 PEG 또는 PEG-접합 지질, 스테롤, 또는 중성 지질과 같은 하나 이상의 다른 지질을 포함하도록 제형화될 수 있다. 또한, LNP는 특정 세포 유형의 표적화를 촉진하기 위해 추가로 조작되거나 기능화될 수 있다. LNP 설계에서 또 다른 고려 사항은 표적화 효율성과 세포 독성 간의 균형이다.

미셀은, 일반적으로, 단일 사슬 지질을 사용하여 형성되는 구형 합성 지질 구조로, 여기서 단일 사슬 지질의 친수성 머리는 외층 또는 막을 형성하고 단일 사슬 지질의 소수성 꼬리는 미셀 중심을 형성한다. 미셀은 통상적으로 지질 단일층만 포함하는 지질 구조를 지칭한다. 미셀은 Quader 등의 문헌 (Mol Ther. 2017 Jul 5; 25(7): 1501-1513)에 보다 상세히 기재되어 있고, 사실상 본원에 참조로서 포함된다.

발현 벡터와 같은, 혈청에 직접 노출된 핵산 벡터는 혈청 뉴클레아제에 의한 핵산 분해 또는 유리 핵산에 의한 면역계의 오프-타켓 자극을 포함하여 여러 가지 바람직하지 않은 결과를 초래할 수 있다. 유사하게, 혈청에 직접 노출된 바이러스 전달 시스템은 원하지 않는 면역 반응 및/또는 바이러스 전달 시스템의 중화를 유발할 수 있다. 따라서 조작된 핵산 및/또는 바이러스 전달 시스템의 캡슐화는 분해를 방지하는 동시에 잠재적인 오프-타겟 영향을 방지하는 데 사용할 수 있다. 특정 예에서, 조작된 핵산 및/또는 바이러스 전달 시스템은 LNP의 수성 내부와 같은 전달 비히클 내에 완전히 캡슐화된다. LNP 내의 조작된 핵산 및/또는 바이러스 전달 시스템의 캡슐화는 미세유체 액적 생성 장치에서 수행되는 미세유체 혼합 및 액적 생성과 같은 당업자에게 잘 알려진 기술에 의해 수행될 수 있다. 이러한 장치는 표준 T-접합 장치 또는 흐름 초점 장치를 포함하지만 이에 한정되지는 않는다. 한 예에서, MC3 또는 MC3-유사 함유 조성물과 같은 원하는 지질 제형은 조작된 핵산 또는 바이러스 전달 시스템 및 임의의 다른 원하는 제제와 병행하여 액적 생성 장치에 제공되어, 전달 벡터 및 원하는 제제는 MC3 또는 MC3 유사 기반 LNP의 내부에 완전히 캡슐화된다. 한 예에서, 액적 생성 장치는 생성된 LNP의 크기 범위 및 크기 분포를 제어할 수 있다. 예를 들어, LNP는 직경 1 내지 1000 나노미터, 예를 들어, 1, 10, 50, 100, 500, 또는 1000 나노미터 범위의 크기를 가질 수 있다. 액적 생성 후, 화물/페이로드(예를 들어, 조작된 핵산 및/또는 바이러스 전달 시스템)를 캡슐화하는 전달 비히클은 투여를 위해 준비하도록 추가로 처리되거나 조작될 수 있다.

나노입자 전달

나노물질은 조작된 핵산(예를 들어, 본원에 기술된 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 핵산)을 전달하는 데 사용될 수 있다. 나노물질 비히클은 중요하게는 비면역원성 물질로 만들어질 수 있고 일반적으로 전달 벡터 자체에 대한 면역을 유발하는 것을 피할 수 있다. 이러한 물질은 지질(이전에 기술된 바와 같음), 무기 나노물질, 및 기타 중합체 물질을 포함할 수 있지만, 이에 한정되지 않는다. 나노물질 입자는 Riley 등의 문헌 (Recent Advances in Nanomaterials for Gene Delivery*?*A Review. Nanomaterials 2017, 7(5), 94)에 더욱 자세히 기재되어 있고, 사실상 본원에 참조로서 포함된다.

게놈 편집 시스템

게놈 편집 시스템은 조작된 핵산, 예를 들어 본 개시의 변형된 ER-LBD를 암호화는 핵산을 암호화하도록 숙주 게놈을 조작하기 위해 사용될 수 있다. 일반적으로, "게놈 편집 시스템"은 외인성 유전자를 숙주 세포의 게놈에 통합하는 임의의 시스템을 지칭한다. 게놈 편집 시스템은 트랜스포존 시스템, 뉴클레아제 게놈 편집 시스템, 및 바이러스 벡터 기반 전달 플랫폼을 포함하지만 이에 한정되지 않는다.

트랜스포존 시스템은 조작된 핵산, 예컨대 본 개시의 조작된 핵산을 숙주 게놈 내로 통합하기 위해 사용될 수 있다. 트랜스포존은 일반적으로 화물/페이로드 핵산 및 트랜스포사제 옆에 있는 말단 역반복체(TIR)를 포함한다. 트랜스포존 시스템은 TIR-측면 화물과 함께 시스 또는 트랜스로 트랜스포존을 제공할 수 있다. 트랜스포존 시스템은 레트로트랜스포존 시스템 또는 DNA 트랜스포존 시스템일 수 있다. 일반적으로, 트랜스포존 시스템은 화물/페이로드(예를 들어, 조작된 핵산)를 숙주 게놈에 무작위로 통합한다. 트랜스포존 시스템의 예는, 각각이 사실상 참조로서 본원에 포함된, Hudecek 등의 문헌 [Crit Rev Biochem Mol Biol. 2017 Aug;52(4):355-380], 및 미국 특허 제6,489,458호, 제6,613,752호 및 제7,985,739호에 더욱 자세히 기술된, Tc1/마리너 트랜스포존 슈퍼패밀리, 예를 들어 Sleeping Beauty 트랜스포존 시스템의 트랜스포존을 사용하는 시스템을 포함한다. 트랜스포존 시스템의 다른 예는 미국 특허 제6,218,185호 및 제6,962,810호에 상세히 기재된 PiggyBac 트랜스포존 시스템을 포함하고, 이들 각각은 사실상 본원에 참고로 포함된다.

뉴클레아제 게놈 편집 시스템은 조작된 핵산, 예를 들어, 본 개시의 단리된 폴리뉴클레오티드 또는 이종 작제물을 암호화하도록 숙주 게놈을 조작하기 위해 사용될 수 있다. 이론에 얽매이지 않기를 바라며, 일반적으로, 외인성 유전자를 도입하기 위해 사용되는 뉴클레아제-매개 유전자 편집 시스템은 세포의 천연 DNA 복구 기전, 특히 상동 재조합(HR) 복구 경로를 이용한다. 간단히, 게놈 DNA에 대한 손상(통상적으로 이중 가닥 파손) 후, 세포는 병변을 복구하기 위한 DNA 합성 중 5' 및 3' 말단 모두에서 동일하거나 실질적으로 동일한 서열을 갖는 다른 DNA 공급원을 주형으로 사용하여 손상을 해결할 수 있다. 자연스러운 상황에서, HDR은 세포에 있는 다른 염색체를 주형으로 사용할 수 있다. 유전자 편집 시스템에서, 외인성 폴리뉴클레오티드는 상동 재조합 주형(HRT 또는 HR 주형)으로 사용하기 위해 세포에 도입된다. 일반적으로, HRT 내의 5' 및 3' 상보적 말단 사이에 포함된 병변이 있는 염색체에서 원래 발견되지 않은 임의의 추가 외인성 서열(예를 들어, 유전자 또는 유전자의 일부)은 주형화된 HDR 중 주어진 게놈 유전자좌에 혼입(즉, "통합")될 수 있다. 따라서, 주어진 게놈 유전자좌에 대한 통상적인 HR 주형은 내인성 게놈 표적 유전자좌의 제1 영역과 동일한 뉴클레오티드 서열, 내인성 게놈 표적 유전자좌의 제2 영역과 동일한 뉴클레오티드 서열, 및 화물/페이로드 핵산(예를 들어, 본원에 기재된 임의의 조작된 핵산, 예컨대, 임의의 조작된 핵산)을 암호화하는 뉴클레오티드 서열을 갖는다.

일부 예에서, HR 주형은 선형일 수 있다. 선형 HR 주형의 예는 선형화된 플라스미드 벡터, ssDNA, 합성된 DNA, 및 PCR 증폭된 DNA를 포함하지만, 이에 제한되지 않는다. 특정 예에서, HR 주형은 플라스미드와 같은 원형일 수 있다. 원형 주형은 슈퍼코일 주형을 포함할 수 있다.

도입될 외인성 서열에 대하여, HR 주형의 5' 및 3' 말단에서 발견되는 동일하거나 실질적으로 동일한 서열은 일반적으로 아암(arms)(HR 아암)으로 지칭된다. HR 아암은 내인성 게놈 표적 유전자좌의 영역과 동일(즉, 100% 동일)할 수 있다. HR 아암은 일부 예에서 내인성 게놈 표적 유전자좌의 영역과 실질적으로 동일할 수 있다. 실질적으로 동일한 HR 아암이 사용될 수 있지만, HDR 경로의 효율성이 100% 미만의 동일성을 갖는 HR 아암에 의해 영향을 받을 수 있으므로 HR 아암이 동일한 것이 유리할 수 있다.

각각의 HR 아암, 즉, 5' 및 3' HR 아암은 동일한 크기이거나 다른 크기일 수 있다. 각각의 HR 아암은 각각 길이가 50, 100, 200, 300, 400, 또는 500개 염기 이상일 수 있다. 일반적으로 HR 아암의 길이는 임의의 길이일 수 있지만, HR 아암 길이 및 전체 주형 크기가 전체 편집 효율성에 미치는 영향과 같은 실용적인 고려 사항도 고려할 수 있다. HR 아암은 절단 부위에 바로 인접한 내인성 게놈 표적 유전자좌의 영역과 동일하거나 실질적으로 동일할 수 있다. 각각의 HR 아암은 절단 부위에 바로 인접한 내인성 게놈 표적 유전자좌의 영역과 동일하거나 실질적으로 동일할 수 있다. 각각의 HR 아암은 절단 부위의 특정 거리 내, 예컨대, 서로 1개 염기쌍, 10개 염기쌍 이하, 50개 염기쌍 이하, 또는 100개 염기쌍 이하 이내 내인성 게놈 표적 유전자좌의 영역과 동일하거나 실질적으로 동일할 수 있다.

뉴클레아제 게놈 편집 시스템은 클러스터링된 규칙적으로 간격이 있는 짧은 회문 반복(CRISPR) 패밀리 뉴클레아제 또는 이의 유도체, 전사 활성인자-유사 효과기 뉴클레아제(TALEN) 또는 이의 유도체, 징크-핑거 뉴클레아제(ZFN) 또는 이의 유도체, 및 귀소 엔도뉴클레아제(HE) 또는 이의 유도체를 포함하지만, 이에 한정되지 않는, 표적 게놈 유전자좌를 절단하기 위한 다양한 뉴클레아제를 사용할 수 있다.

CRISPR-매개 유전자 편집 시스템은 조작된 핵산, 예를 들어 본원에 기재된 조작된 핵산을 암호화하도록 숙주 게놈을 조작하기 위해 사용될 수 있다. CRISPR 시스템은 M. Adli("The CRISPR tool kit for genome editing and beyond" Nature Communications; volume 9 (2018), Article number: 1911)에 더욱 상세히 기재되어 있고, 교시하는 모든 내용에 대해 본원에 참조로 포함된다. 일반적으로, CRISPR-매개 유전자 편집 시스템은 CRISPR-연관(Cas) 뉴클레아제 및 특정 표적 서열로의 절단을 지시하는 RNA(들)를 포함한다. 예시적인 CRISPR-매개 유전자 편집 시스템은 Cas9 뉴클레아제 및 CRISPR RNA(crRNA) 도메인 및 트랜스-활성화 CRISPR(tracrRNA) 도메인을 갖는 RNA(들)로 구성된 CRISPR/Cas9 시스템이다. crRNA는 통상적으로 2개의 RNA 도메인을 갖는다: 염기쌍 혼성화를 통해 표적 서열("정의된 뉴클레오티드 서열"), 예를 들어, 게놈 서열에 대한 특이성을 지시하는 가이드 RNA 서열(gRNA); 및 tracrRNA에 혼성화하는 RNA 도메인. tracrRNA는 게놈 유전자좌에 대한 뉴클레아제(예를 들어, Cas9)와 상호 작용하고 이에 의해 이의 동원을 촉진할 수 있다. crRNA 및 tracrRNA 폴리뉴클레오티드는 별도의 폴리뉴클레오티드일 수 있다. crRNA 및 tracrRNA 폴리뉴클레오티드는 단일 가이드 RNA(sgRNA)로도 지칭되는, 단일 폴리뉴클레오티드일 수 있다. 여기에서는 Cas9 시스템이 설명되어 있지만, Cpf1 시스템과 같은 다른 CRISPR 시스템을 사용할 수 있다. 뉴클레아제는 이의 유도체, 예컨대, Cas9 기능적 돌연변이체, 예를 들어, 일반적으로 Cas9 효소에 의해 통상적으로 생성되는 완전한 이중 가닥 파손과 대조적으로 정의된 뉴클레오티드 서열의 단일 가닥의 절단만을 매개하는 Cas9 "니카아제" 돌연변이체를 포함할 수 있다.

일반적으로, CRISPR 시스템의 구성 요소는 서로 상호 작용하여 리보핵단백질(RNP) 복합체를 형성하여 서열 특이적 절단을 매개한다. 일부 CRISPR 시스템에서, 각 구성 요소를 별도로 생산하여 RNP 복합체를 형성하는 데 사용할 수 있다. 일부 CRISPR 시스템에서, 각 구성 요소는 시험관 내에서 별도로 생산되고 시험관 내에서 서로 접촉(즉, "복합체화")되어 RNP 복합체를 형성할 수 있다. 그런 다음 시험관 내 생산된 RNP는 세포의 세포질 및/또는 핵, 예를 들어, T 세포의 세포질 및/또는 핵으로 도입(즉, "전달")될 수 있다. 시험관 내에서 생산된 RNP 복합체는 전기천공, 지질 매개 형질주입, 물리적 수단에 의한 세포막 변형, 지질 나노입자(LNP), 바이러스 유사 입자(VLP), 및 초음파 처리를 포함하지만 이에 한정되지 않는 다양한 수단에 의해 세포에 전달할 수 있다. 특정 예에서, 시험관 내에서 생산된 RNP 복합체는 Nucleofactor/Nucleofection® 전기천공 기반 전달 시스템(Lonza®)을 사용하여 세포에 전달될 수 있다. 다른 전기천공 시스템은 MaxCyte 전기천공 시스템, Miltenyi CliniMACS 전기천공 시스템, Neon 전기천공 시스템, 및 BTX 전기천공 시스템을 포함하지만, 이에 한정되지 않는다. CRISPR 뉴클레아제, 예를 들어, Cas9는 당업자에게 공지된 다양한 단백질 생산 기술을 사용하여 시험관 내에서 생산(즉, 합성 및 정제)될 수 있다. CRISPR 시스템 RNA, 예를 들어, sgRNA는 시험관 내 전사 또는 화학적 합성과 같은 당업자에게 공지된 다양한 RNA 생산 기술을 사용하여 시험관 내 생산(즉, 합성 및 정제)될 수 있다.

시험관 내에서 생산된 RNP 복합체는 다양한 뉴클레아제 대 gRNA 비율로 복합체를 형성할 수 있다. 시험관 내에서 생산된 RNP 복합체는 또한 CRISPR-매개 편집 시스템에서 상이한 양으로 사용될 수 있다. 예를 들어, 편집하고자 하는 세포의 수에 따라, 반응에서 많은 수의 세포를 편집할 때 첨가되는 RNP 복합체의 양을 줄이는 것과 같이 총 RNP 첨가량을 조절할 수 있다.

일부 CRISPR 시스템에서, 각각의 구성 요소(예를 들어, Cas9 및 sgRNA)는 폴리뉴클레오티드에 의해 별도로 암호화될 수 있으며, 각각의 폴리뉴클레오티드는 함께 또는 개별적으로 세포 내로 도입된다. 일부 CRISPR 시스템에서, 각각의 구성 요소는 단일 폴리뉴클레오티드(즉, 다중-프로모터 또는 다중시스트론 벡터, 하기 예시적인 다중시스트론 시스템의 설명 참조)에 의해 암호화되고 세포 내로 도입될 수 있다. 세포 내에서 각각의 폴리뉴클레오티드 암호화된 CRISPR 구성 요소의 발현(예를 들어, 뉴클레아제의 번역 및 CRISPR RNA의 전사) 후, RNP 복합체가 세포 내에서 형성될 수 있고 이어서 부위-특이적 절단을 지시할 수 있다.

일부 RNP는 핵으로의 RNP 전달을 촉진하는 모이어티를 갖도록 조작될 수 있다. 예를 들어, Cas9 뉴클레아제는 핵 국소화 신호(NLS) 도메인을 가질 수 있으므로, Cas9 RNP 복합체가 세포의 세포질 내로 전달되거나 Cas9의 번역 및 후속 RNP 형성 후에, NLS가 Cas9 RNP의 핵으로의 추가 이동을 촉진할 수 있다.

본원에 기재된 세포는 비-바이러스 방법을 사용하여 조작될 수 있고, 예를 들어, 본원에 기재된 뉴클레아제 및/또는 CRISPR 매개 유전자 편집 시스템은 비-바이러스 방법을 사용하여 세포에 전달될 수 있다. 본원에 기재된 세포는 바이러스 방법을 사용하여 조작될 수 있고, 예를 들어, 본원에 기재된 뉴클레아제 및/또는 CRISPR 매개 유전자 편집 시스템은 아데노바이러스, 레트로바이러스, 렌티바이러스 또는 본원에 기재된 임의의 다른 바이러스 기반 전달 방법과 같은 바이러스 방법을 사용하여 세포에 전달될 수 있다.

일부 CRISPR 시스템에서, 하나를 초과하는 CRISPR 조성물이 제공될 수 있어서 각각이 동일한 유전자 또는 표적 뉴클레오티드 서열보다 많은 일반 게놈 유전자좌를 개별적으로 표적화한다. 예를 들어, 2개의 개별 CRISPR 조성물은 서로의 특정 거리 내에서 2개의 상이한 표적 뉴클레오티드 서열에서 절단을 지시하기 위해 제공될 수 있다. 일부 CRISPR 시스템에서, 동일한 유전자 또는 일반 게놈 유전자좌의 반대 가닥을 각각 별도로 표적화하도록 하나를 초과하는 CRISPR 조성물이 제공될 수 있다. 예를 들어, 2개의 개별 CRISPR "니카아제" 조성물은 동일한 유전자 또는 일반 게놈 유전자좌의 반대 가닥에서 절단을 지시하기 위해 제공될 수 있다.

일반적으로, 본원에 기재된 CRISPR-매개 편집 시스템의 특징은 다른 뉴클레아제-기반 게놈 편집 시스템에 적용될 수 있다. TALEN은 조작된 부위 특이적 뉴클레아제이고, 이는 TALE(전사 활성화제 유사 효과기)의 DNA 결합 도메인 및 제한 엔도뉴클레아제 Fokl의 촉매 도메인으로 구성된다. DNA 결합 도메인의 단량체의 고도로 가변적인 잔기 영역에 존재하는 아미노산을 변경함으로써, 상이한 인공 TALEN을 생성하여 다양한 뉴클레오티드 서열을 표적화할 수 있다. DNA 결합 도메인은 후속적으로 뉴클레아제를 표적 서열로 지시하고 이중 가닥 파손을 생성한다. TALEN-기반 시스템은 미국 특허 제12/965,590호; 미국 특허 제8,450,471호; 미국 특허 제8,440,431호; 미국 특허 제8,440,432호; 미국 특허 제10,172,880호; 및 미국 특허 제13/738,381호에 더욱 상세히 기술되어 있으며, 이들 모두는 그 전체가 참조로서 본원에 포함된다. ZFN-기반 편집 시스템은 미국 특허 제6,453,242호; 제6,534,261호; 제6,599,692호; 제6,503,717호; 제6,689,558호; 제7,030,215호; 제6,794,136호; 제7,067,317호; 제7,262,054호; 제7,070,934호; 제7,361,635호; 제7,253,273호 및 미국 특허 공개 번호 제2005/0064474호; 제2007/0218528호; 제2005/0267061호에 상세히 기재되어 있고, 모두 그 전체가 사실상 참조로서 본원에 포함된다.

기타 조작 전달 시스템

조작된 핵산(예를 들어, 본원에 기재된 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 단리된 폴리뉴클레오티드)을 세포 또는 다른 표적 수용자 개체로 도입하기 위한 다양한 추가 수단, 예컨대 본원에 기재된 임의의 지질 구조.

전기천공법을 사용하여 폴리뉴클레오티드를 수용자 개체에 전달할 수 있다. 전기천공법은 전기장을 적용하여 표적 세포 또는 개체의 외막 또는 껍질을 일시적으로 투과시켜 화물/페이로드를 표적 세포 또는 개체의 내부 구획으로 내부화하는 방법이다. 일반적으로, 방법은 관심 화물(예를 들어, 본원에 기재된 임의의 조작된 핵산)을 함유하는 용액에서 2개의 전극 사이에 세포 또는 표적 개체를 배치하는 단계를 포함한다. 그런 다음, 화물이 세포의 세포질과 같은 개체의 내부로 들어갈 수 있도록 하는 일시적인 설정 전압을 적용함으로써 세포의 지질막이 파괴, 즉 투과화된다. 세포의 예에서, 세포의 다수는 아닐지라도 적어도 일부는 생존할 수 있다. 세포 및 다른 개체는 시험관 내, 생체 내 또는 생체 외에서 전기천공될 수 있다. 전기천공 조건(예를 들어, 세포 수, 화물 농도, 복구 조건, 전압, 시간, 정전용량, 펄스 유형, 펄스 길이, 부피, 큐벳 길이, 전기천공 용액 조성 등)은 세포 또는 다른 수용자 개체의 유형, 전달할 화물, 원하는 내부화의 효율성, 및 원하는 생존율을 포함하지만, 이에 제한되지 않는 여러 인자에 따라 다르다. 이러한 기준의 최적화는 당업자의 범위 내에 있다. 다양한 장치 및 프로토콜을 전기천공에 사용할 수 있다. 예는 Neon® 형질주입 시스템, MaxCyte® Flow Electroporation??, Lonza® Nucleofector?? 시스템, 및 Bio-Rad® 전기천공 시스템을 포함하지만, 이에 한정되지 않는다.

조작된 핵산(예를 들어, 본원에 기재된 변형된 ER-LBD 또는 키메라 단백질을 암호화하는 단리된 폴리뉴클레오티드)을 세포 또는 다른 표적 수용자 개체로 도입하기 위한 다른 수단은 초음파 처리, 유전자 총, 유체역학적 주입 및 물리적 수단에 의한 세포막 변형을 포함하지만, 이에 한정되지 않는다.

생체 내에서 조작된 mRNA, 예를 들어 네이키드 플라스미드 또는 mRNA를 전달하기 위한 조성물 및 방법은 Kowalski 등의 문헌 [Mol Ther. 2019 Apr 10; 27(4): 710-728] 및 Kaczmarek 등의 문헌 [Genome Med. 2017; 9: 60.]에 자세히 기재되어 있고, 각각은 사실상 본원에 참조로서 포함된다.

사용 방법

본원에 기재된 바와 같은 변형된 ER-LBD, 키메라 단백질, 또는 세포를 사용하는 방법도 또한 본 개시에 포함된다.

일부 양태에서, 방법은 관심 유전자의 전사를 조절하는 단계를 포함한다. 전사를 조절하는 방법은 (i) 변형된 ER-LBD를 포함하는 키메라 전사 인자를 암호화하는 이종 작제물 및 (ii) 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트로 세포를 형질전환시키는 단계; 키메라 단백질의 발현에 적합한 조건 하에 형질전환된 세포를 배양하는 단계; 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 단계를 포함할 수 있다.

일부 구현예에서, 전사를 조절하는 방법은 전사를 활성화하는 방법이다. 전사 활성화는 키메라 단백질을 사용하여 달성될 수 있다

일부 구현예에서, 방법은 전사를 활성화하는 단계를 포함한다. 전사 활성화는, 예를 들어, 변형된 ER-LBD, DNA 결합 도메인, 및 전사 활성화 도메인을 포함하는 키메라 단백질을 사용하여 달성될 수 있다.

일부 구현예에서, 방법은 전사를 억제하는 단계를 포함한다. 전사 억제는, 예를 들어, 변형된 ER-LBD, DNA 결합 도메인, 및 전사 억제 도메인을 포함하는 키메라 단백질을 사용하여 달성될 수 있다.

일부 양태에서, 방법은 키메라 단백질의 국소화를 조절하는 단계를 포함한다. 국소화를 조절하는 방법은 변형된 ER-LBD 도메인 및 관심 폴리펩티드를 포함하는 키메라 단백질을 암호화하는 이종 작제물로 세포를 형질전환시키는 단계; 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계; 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질의 핵 국소화를 유도하는 단계를 포함할 수 있다. 일부 구현예에서, 국소화를 조절하는 단계는 핵 국소화를 유도하는 단계를 포함한다.

생체 내 방법

본원에 제공된 방법은 또한, 예를 들어, 생체 내에서 변형된 ER-LBD 또는 키메라 단백질을 발현하는 세포에 비-내인성 리간드를 전달함으로써 생체 내에서 국소화를 변형시키거나 전사를 조절하는 단계를 포함한다.

일부 구현예에서, 형질전환된 세포는 인간 또는 동물에 존재하며, 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 리간드의 약리학적 용량을 인간 또는 동물에 투여하는 단계를 포함한다. 일부 구현예에서, 대상체에게 투여되는 비-내인성 리간드는 타목시펜을 포함한다. 타목시펜의 경구 투여 시, 약물은 간에서 활성 타목시펜 대사산물로 전환된다. 일부 구현예에서, 활성 타목시펜 대사산물은 4-하이드록시-타목시펜 ("4-OHT"), N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로부터 선택된다. 일부 구현예에서, 비-내인성 리간드는 약 1 mg/일 내지 약 100 mg/일의 농도로 대상체에게 투여된다. 특정 구현예에서, 비-내인성 리간드는 약 40 mg/일의 농도로 대상체에게 투여된다.

일부 양태에서, 본원에 제공된 방법은, 예를 들어, (i) 본원에 기술된 키메라 전사 인자로 형질전환된 세포 및 (ii) 비-내인성 리간드를 대상체에게 전달함으로써 생체 내에서 관심 유전자의 전사를 조절하는 단계를 또한 포함한다. 일부 구현예에서, 형질전환된 세포는 관심 유전자에 작동 가능하게 연결된 키메라-전사 인자 반응성 프로모터를 포함하는 표적 유전자 발현 카세트를 포함한다.

일부 구현예에서, 대상체는 인간 또는 동물이고, 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 비-내인성 리간드의 약리학적 용량을 인간 또는 동물에게 투여하는 단계를 포함한다.

일부 양태에서, 본원에 제공된 방법은 또한 본원에 기재된 조작된 세포를 생체 내 생산할 수 있는, 예를 들어, 본원에 기재된 폴리뉴클레오티드 분자를 생체 내 세포에 전달할 수 있는 조성물을 전달하는 단계를 포함한다. 이러한 조성물은 임의의 바이러스 매개 전달 플랫폼, 임의의 지질 구조 전달 시스템, 임의의 나노입자 전달 시스템, 임의의 게놈 편집 시스템, 또는 생체 내 세포 조작을 할 수 있는 본원에 기재된 임의의 다른 조작 전달 시스템을 포함한다.

본원에 제공된 방법은 또한 본원에 기술된 바와 같은 변형된 ER-LBD, 키메라 단백질, 또는 키메라 전사 인자 중 어느 하나(및 일부 구현예에서, 키메라 전사 인자에 의해 조절된 유전자)를 생체 내 생산할 수 있는 조성물을 전달하는 단계를 포함한다. 변형된 ER-LBD, 키메라 단백질, 또는 키메라 전사 인자(및 일부 구현예에서, 키메라 전사 인자에 의해 조절된 유전자)를 생체 내 생산할 수 있는 조성물은, 이에 한정되지는 않으나, 본원에 기재된 임의의 조작된 핵산을 포함한다. 유도 가능한 전사 인자(및 일부 구현예에서, 유도 가능한 전사 인자에 의해 조절되는 유전자)의 생체 내 생산이 가능한 조성물은 네이키드 mRNA 또는 네이키드 플라스미드일 수 있다.

약학적 조성물

본 개시의 변형된 ER-LBD, 키메라 단백질, 및 세포는 약학적 조성물로 제형화될 수 있다. 이들 조성물은 하나 이상의 조작된 핵산 또는 조작된 세포에 더하여, 약학적으로 허용 가능한 부형제, 담체, 완충제, 안정화제 또는 당업자에게 널리 공지된 다른 물질을 포함할 수 있다. 이러한 물질은 독성이 없어야 하며 활성 성분의 효능을 방해해서는 안 된다. 담체 또는 다른 물질의 정확한 특성은 투여 경로, 예를 들어 경구, 정맥내, 피부 또는 피하, 비강, 근육내, 복강내 경로에 따라 달라질 수 있다.

개체에게 제공되는 것이 본 개시에 따른 세포, 폴리펩티드, 핵산, 소분자 또는 기타 약학적으로 유용한 화합물이든 간에, 투여는 바람직하게는 개체에게 혜택을 나타내기에 충분한 "치료적 유효량" 또는 "예방적 유효량" (경우에 따라, 예방이 요법으로 간주될 수 있지만)이다. 투여되는 실제 양, 투여 속도 및 시간 경과는 치료되는 질환의 성질 및 중증도에 따라 달라질 것이다. 투여량의 결정 등과 같은 치료 처방은 일반의 및 기타 의사의 책임이고 일반적으로 치료할 장애, 개별 환자의 상태, 전달 부위, 투여 방법 및 실무자에게 알려진 기타 인자를 고려한다. 전술한 기술 및 프로토콜의 예는 문헌[Remington's Pharmaceutical Sciences, 16th edition, Osol, A. (ed), 1980]에서 찾을 수 있다.

조성물은 치료될 상태에 따라 단독으로 또는 동시에 또는 순차적으로 다른 치료와 조합하여 투여될 수 있다.

추가 구현예

하기 단락은 추가적으로 나열된 구현예를 제공한다.

1. 서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열을 포함하는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)으로서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환, 및 하나 이상의 추가 아미노산 치환을 포함하되, 하나 이상의 추가 아미노산 치환은 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내에 존재하고, 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는, 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD).

2. 서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열을 포함하는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)으로서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환 및 하나 이상의 추가 아미노산 치환을 포함하되, 하나 이상의 추가 아미노산 치환은 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내에 존재하고 변형된 ER-LBD는 하나 이상의 추가 아미노산 치환으로 인해 내인성 리간드와 비교했을 때 비-내인성 리간드에 대해 더 큰 민감도를 갖는, 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD).

3. 서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열을 포함하는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)으로서, 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환 및 하나 이상의 추가 아미노산 치환을 포함하되, 하나 이상의 추가 아미노산 치환은 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내에 존재하고, 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 비-내인성 리간드에 대해 더 큰 선택성을 갖는, 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD).

4. 단락 1 내지 3 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 354, 380, 384, 386, 387, 388, 389, 391, 392, 404, 407, 409, 413, 414, 417, 418, 420, 421, 422, 424, 428, 463, 517, 521, 522, 524, 525, 526, 527, 528, 533, 534, 536, 537, 538, 539, 540, 및 547로 이루어진 군으로부터 선택된 서열번호 1의 하나 이상의 위치에 존재하는, 변형된 ER-LBD.

5. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 343을 포함하는, 변형된 ER-LBD.

6. 단락 5에 있어서, 서열번호 1의 위치 343에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: M343F, M343I, M343L, 및 M343V.

7. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 344를 포함하는, 변형된 ER-LBD.

8. 단락 7에 있어서, 서열번호 1의 위치 344에서의 아미노산 치환은 G344M인, 변형된 ER-LBD.

9. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 345를 포함하는, 변형된 ER-LBD.

10. 단락 9에 있어서, 서열번호 1의 위치 345에서의 아미노산 치환은 L345S인, 변형된 ER-LBD.

11. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 346을 포함하는, 변형된 ER-LBD.

12. 단락 11에 있어서, 서열번호 1의 위치 346에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L346I, L346M, L346F, 및 L346V.

13. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 347을 포함하는, 변형된 ER-LBD.

14. 단락 13에 있어서, 서열번호 1의 위치 347에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: T347D, T347E, T347F, T347I, T347K, T347L, T347M, T347N, T347Q, T347R, T347S, 및 T347V.

15. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 348을 포함하는, 변형된 ER-LBD.

16. 단락 15에 있어서, 서열번호 1의 위치 348에서의 아미노산 치환은 N348K인, 변형된 ER-LBD.

17. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 349를 포함하는, 변형된 ER-LBD.

18. 단락 17에 있어서, 서열번호 1의 위치 349에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L349I, L349M, L349F, 및 L349V.

19. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 350을 포함하는, 변형된 ER-LBD.

20. 단락 19에 있어서, 서열번호 1의 위치 350에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: A350F, A350I, A350L, A350M 및 A350V.

21. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 351을 포함하는, 변형된 ER-LBD.

22. 단락 21에 있어서, 서열번호 1의 위치 351에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: D351E, D351F, D351I, D351L, D351M, D351N, D351Q, 및 D351V.

23. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 352를 포함하는, 변형된 ER-LBD.

24. 단락 23에 있어서, 서열번호 1의 위치 352에서의 아미노산 치환은 R352K인, 변형된 ER-LBD.

25. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 354를 포함하는, 변형된 ER-LBD.

26. 단락 25에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L354I, L354M, L354F, 및 L354V.

27. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 380을 포함하는, 변형된 ER-LBD.

28. 단락 27에 있어서, 서열번호 1의 위치 380에서의 아미노산 치환은 E380Q인, 변형된 ER-LBD.

29. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 384를 포함하는, 변형된 ER-LBD.

30. 단락 29에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L384I, L384M, L384F, 및 L384V.

31. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 386을 포함하는, 변형된 ER-LBD.

32. 단락 31에 있어서, 서열번호 1의 위치 386에서의 아미노산 치환은 I386V인, 변형된 ER-LBD.

33. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 387을 포함하는, 변형된 ER-LBD.

34. 단락 33에 있어서, 서열번호 1의 위치 387에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L387I, L387M, L387F, 및 L387V.

35. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 388을 포함하는, 변형된 ER-LBD.

36. 단락 35에 있어서, 서열번호 1의 위치 388에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: M388I, M388L, 및 M388F.

37. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 389를 포함하는, 변형된 ER-LBD.

38. 단락 37에 있어서, 서열번호 1의 위치 389에서의 아미노산 치환은 I389M인, 변형된 ER-LBD.

39. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 391을 포함하는, 변형된 ER-LBD.

40. 단락 39에 있어서, 서열번호 1의 위치 391에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L391I, L391M, L391F, 및 L391V.

41. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 392를 포함하는, 변형된 ER-LBD.

42. 단락 41에 있어서, 서열번호 1의 위치 392에서의 아미노산 치환은 V392M인, 변형된 ER-LBD.

43. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 404를 포함하는, 변형된 ER-LBD.

44. 단락 43에 있어서, 서열번호 1의 위치 404에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: F404I, F404L, F404M, 및 F404V.

45. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 407을 포함하는, 변형된 ER-LBD 1.

46. 단락 45에 있어서, 서열번호 1의 위치 407에서의 아미노산 치환은 N407D인, 변형된 ER-LBD.

47. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 409를 포함하는, 변형된 ER-LBD.

48. 단락 47에 있어서, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V인, 변형된 ER-LBD.

49. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 413을 포함하는, 변형된 ER-LBD.

50. 단락 49에 있어서, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D인, 변형된 ER-LBD.

51. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 414를 포함하는, 변형된 ER-LBD.

52. 단락 51에 있어서, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E인, 변형된 ER-LBD.

53. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 417을 포함하는, 변형된 ER-LBD.

54. 단락 53에 있어서, 서열번호 1의 위치 417에서의 아미노산 치환은 C417S인, 변형된 ER-LBD.

55. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 418을 포함하는, 변형된 ER-LBD.

56. 단락 55에 있어서, 서열번호 1의 위치 418에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: V418I, V418L, V418M, 및 V418F.

57. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 420을 포함하는, 변형된 ER-LBD.

58. 단락 57에 있어서, 서열번호 1의 위치 420에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: G420I, G420M, G420F, 및 G420V.

59. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 421을 포함하는, 변형된 ER-LBD.

60. 단락 59에 있어서, 서열번호 1의 위치 421에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: M421I, M421L, M421F, 및 M421V.

61. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 422를 포함하는, 변형된 ER-LBD.

62. 단락 61에 있어서, 서열번호 1의 위치 422에서의 아미노산 치환은 V422I인, 변형된 ER-LBD.

63. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 424를 포함하는, 변형된 ER-LBD.

64. 단락 63에 있어서, 서열번호 1의 위치 424에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: I424L, I424M, I424F, 및 I424V.

65. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 428을 포함하는, 변형된 ER-LBD.

66. 단락 65에 있어서, 서열번호 1의 위치 428에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L428I, L428M, L428F, 및 L428V.

67. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 463을 포함하는, 변형된 ER-LBD.

68. 단락 67에 있어서, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P인, 변형된 ER-LBD.

69. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 517을 포함하는, 변형된 ER-LBD.

70. 단락 69에 있어서, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A인, 변형된 ER-LBD.

71. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 521을 포함하는, 변형된 ER-LBD.

72. 단락 71에 있어서, 서열번호 1의 위치 521에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: G521A, G521F, G521I, G521L, G521M, 및 G521V.

73. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 522를 포함하는, 변형된 ER-LBD.

74. 단락 73에 있어서, 서열번호 1의 위치 522에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: M522I, M522L, 및 M522V.

75. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 524를 포함하는, 변형된 ER-LBD.

76. 단락 75에 있어서, 서열번호 1의 위치 524에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: H524A, H524I, H524L, H524F, 및 H524V.

77. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 525를 포함하는, 변형된 ER-LBD.

78. 단락 77에 있어서, 서열번호 1의 위치 525에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L525F, L525I, L525M, L525N, L525Q, L525S, L525T, 및 L525V.

79. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 526을 포함하는, 변형된 ER-LBD.

80. 단락 79에 있어서, 서열번호 1의 위치 526에서의 아미노산 치환은 Y526L인, 변형된 ER-LBD.

81. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 527을 포함하는, 변형된 ER-LBD.

82. 단락 81에 있어서, 서열번호 1의 위치 527에서의 아미노산 치환은 S527N인, 변형된 ER-LBD.

83. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 528을 포함하는, 변형된 ER-LBD.

84. 단락 83에 있어서, 서열번호 1의 위치 528에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: M528F, M528I, 및 M528V.

85. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 533을 포함하는, 변형된 ER-LBD.

86. 단락 85에 있어서, 서열번호 1의 위치 533에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: V533F 및 V533W.

87. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 534를 포함하는, 변형된 ER-LBD.

88. 단락 87에 있어서, 서열번호 1의 위치 534에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: V534Q 및 V534R.

89. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 536을 포함하는, 변형된 ER-LBD.

90. 단락 89에 있어서, 서열번호 1의 위치 536에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L536F, 및 L536M, L536R, 및 L536Y.

91. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 537을 포함하는, 변형된 ER-LBD.

92. 단락 91에 있어서, 서열번호 1의 위치 537에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: Y537E 및 Y537S.

93. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 538을 포함하는, 변형된 ER-LBD.

94. 단락 93에 있어서, 서열번호 1의 위치 538에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: D538G 및 D538K.

95. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 539를 포함하는, 변형된 ER-LBD.

96. 단락 95에 있어서, 서열번호 1의 위치 539에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L539A 및 L539R.

97. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 540을 포함하는, 변형된 ER-LBD.

98. 단락 97에 있어서, 서열번호 1의 위치 540에서의 아미노산 치환은 다음으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD: L540A 및 L540F.

99. 단락 4에 있어서, 하나 이상의 위치는 서열번호 1의 위치 547을 포함하는, 변형된 ER-LBD.

100. 단락 99에 있어서, 서열번호 1의 위치 547에서의 아미노산 치환은 H547A인, 변형된 ER-LBD.

101. 단락 1 내지 100 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 2개의 아미노산 치환인, 변형된 ER-LBD.

102. 단락 101에 있어서, 2개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 있는, 변형된 ER-LBD: 343, 345, 347, 348, 351, 354, 384, 387, 388, 389, 391, 392, 404, 418, 421, 521, 524, 및 525.

103. 단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 345 및 348에 존재하는, 변형된 ER-LBD.

104. 단락 103에 있어서, 서열번호 1의 위치 345에서의 아미노산 치환은 L345S이고 서열번호 1의 위치 348에서의 아미노산 치환은 N348K인, 변형된 ER-LBD.

105. 단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 389에 존재하는, 변형된 ER-LBD.

106. 단락 105에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 389에서의 아미노산 치환은 I389M인, 변형된 ER-LBD.

107. 단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 421 및 392에 존재하는, 변형된 ER-LBD.

108. 단락 107에 있어서, 서열번호 1의 위치 421에서의 아미노산 치환은 M421I이고 서열번호 1의 위치 392에서의 아미노산 치환은 V392M인, 변형된 ER-LBD.

109. 단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 391에 존재하는, 변형된 ER-LBD.

110. 단락 109에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F인, 변형된 ER-LBD.

111. 단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 384에 존재하는, 변형된 ER-LBD.

112. 단락 111에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 384에서의 아미노산 치환은 L384M인, 변형된 ER-LBD.

113. 단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 354 및 387에 존재하는, 변형된 ER-LBD.

114. 단락 113에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고 서열번호 1의 위치 387에서의 아미노산 치환은 L387M인, 변형된 ER-LBD.

115. 단락 102에 있어서, 2개의 아미노산 치환은 위치 387 및 391에 존재하는, 변형된 ER-LBD.

116. 단락 115에 있어서, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F인, 변형된 ER-LBD.

117. 단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 387에 존재하는, 변형된 ER-LBD.

118. 단락 117에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 387에서의 아미노산 치환은 L387M인, 변형된 ER-LBD.

119. 단락 102에 있어서, 2개의 아미노산 치환은 서열번호 1의 위치 384 및 391에 존재하는, 변형된 ER-LBD.

120. 단락 117에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고 서열번호 1의 위치 391에서의 아미노산 치환은 L391F인, 변형된 ER-LBD.

121. 단락 1 내지 120 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 3개의 아미노산 치환인, 변형된 ER-LBD.

122. 단락 121에 있어서, 3개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하는, 변형된 ER-LBD: 343, 347, 351, 354, 388, 391, 404, 414, 418, 463, 521, 524, 및 525.

123. 단락 122에 있어서, 3개의 아미노산 치환은 서열번호 1의 위치 354, 384, 및 391에 존재하는, 변형된 ER-LBD.

124. 단락 123에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F인, 변형된 ER-LBD.

125. 단락 122에 있어서, 3개의 아미노산 치환은 서열번호 1의 위치 414, 463, 및 524에 존재하는, 변형된 ER-LBD.

126. 단락 125에 있어서, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.

127. 단락 1 내지 126 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 4개의 아미노산 치환인, 변형된 ER-LBD.

128. 단락 127에 있어서, 4개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하는, 변형된 ER-LBD: 343, 347, 351, 354, 384, 388, 391, 404, 413, 418, 463, 521, 524, 및 525.

129. 단락 128에 있어서, 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 418에 존재하는, 변형된 ER-LBD.

130. 단락 129에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고, 서열번호 1의 위치 418에서의 아미노산 치환은 V418I인, 변형된 ER-LBD.

131. 단락 128에 있어서, 4개의 아미노산 치환은 서열번호 1의 위치 343, 388, 521, 및 404에 존재하는, 변형된 ER-LBD.

132. 단락 131에 있어서, 서열번호 1의 위치 343에서의 아미노산 치환은 M343I이고, 서열번호 1의 위치 388에서의 아미노산 치환은 M388I이며, 서열번호 1의 위치 521에서의 아미노산 치환은 G521I이고, 서열번호 1의 위치 404에서의 아미노산 치환은 F404L인, 변형된 ER-LBD.

133. 단락 128에 있어서, 4개의 아미노산 치환은 서열번호 1의 위치 524, 347, 351, 및 525에 존재하는, 변형된 ER-LBD.

134. 단락 133에 있어서, 서열번호 1의 위치 524에서의 아미노산 치환은 H524V이고, 서열번호 1의 위치 347에서의 아미노산 치환은 T347R이며, 서열번호 1의 위치 351에서의 아미노산 치환은 D351Q이고, 서열번호 1의 위치 525에서의 아미노산 치환은 L525N인, 변형된 ER-LBD.

135. 단락 128에 있어서, 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 463에 존재하는, 변형된 ER-LBD.

136. 단락 135에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P인, 변형된 ER-LBD.

137. 단락 128에 있어서, 4개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 및 524에 존재하는, 변형된 ER-LBD.

138. 단락 137에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.

139. 단락 1 내지 138 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 5개의 아미노산 치환인, 변형된 ER-LBD.

140. 단락 139에 있어서, 5개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하는, 변형된 ER-LBD: 354, 384, 391, 409, 413, 414, 421, 463, 및 524.

141. 단락 140에 있어서, 5개의 아미노산 치환은 서열번호 1의 위치 384, 409, 413, 463, 및 524에 존재하는, 변형된 ER-LBD.

142. 단락 141에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.

143. 단락 140에 있어서, 5개의 아미노산 치환은 서열번호 1의 위치 391, 413, 414, 463, 및 524에 존재하는, 변형된 ER-LBD.

144. 단락 143에 있어서, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.

145. 단락 140에 있어서, 5개의 아미노산 치환은 서열번호 1의 위치 391, 414, 421, 463, 및 524에 존재하는, 변형된 ER-LBD.

146. 단락 145에 있어서, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.

147. 단락 140에 있어서, 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 413, 421, 및 524에 존재하는, 변형된 ER-LBD.

148. 단락 147에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.

149. 단락 140에 있어서, 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 421, 463 및 524에 존재하는, 변형된 ER-LBD.

150. 단락 149에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.

151. 단락 1 내지 150 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 6개의 아미노산 치환인, 변형된 ER-LBD.

152. 단락 151에 있어서, 6개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하는, 변형된 ER-LBD: 354, 384, 391, 409, 413, 414, 421, 463, 및 524.

153. 단락 152에 있어서, 6개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 421, 463, 및 524에 존재하는, 변형된 ER-LBD.

154. 단락 153에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.

155. 단락 152에 있어서, 6개의 아미노산 치환은 서열번호 1의 위치 409, 413, 414, 421, 463, 및 524에 존재하는, 변형된 ER-LBD.

156. 단락 155에 있어서, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.

157. 단락 152에 있어서, 6개의 아미노산 치환은 서열번호 1의 위치 354, 391, 409, 413, 414, 및 524에 존재하는, 변형된 ER-LBD.

158. 단락 157에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.

159. 단락 1 내지 158 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 7개의 아미노산 치환인, 변형된 ER-LBD.

160. 단락 159에 있어서, 7개의 아미노산 치환 각각은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하는, 변형된 ER-LBD: 354, 384, 391, 409, 413, 414, 421, 463, 517, 및 524.

161. 단락 160에 있어서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 384, 409, 413, 421, 463, 및 524에 존재하는, 변형된 ER-LBD.

162. 단락 161에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.

163. 단락 160에 있어서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 421, 463, 517, 및 524에 존재하는, 변형된 ER-LBD.

164. 단락 163에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L인, 변형된 ER-LBD.

165. 단락 160에 있어서, 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 414, 421, 517, 및 524에 존재하는, 변형된 ER-LBD.

166. 단락 165에 있어서, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.

167. 단락 1 내지 166 중 어느 하나에 있어서, 하나 이상의 추가 아미노산 치환은 8개의 아미노산 치환인, 변형된 ER-LBD.

168. 단락 167에 있어서, 8개의 아미노산 치환은 서열번호 1의 위치 384, 391, 409, 413, 421, 463, 517, 및 524에 존재하는, 변형된 ER-LBD.

169. 단락 168에 있어서, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.

170. 단락 1 내지 169 중 어느 하나에 있어서, 변형된 ER-LBD는 V595A 아미노산 치환을 추가로 포함하는, 변형된 ER-LBD.

171. 단락 1 내지 170 중 어느 하나에 있어서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD.

172. 단락 1 내지 171 중 어느 하나의 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질.

173. 단락 172에 있어서, 관심 폴리펩티드는 핵산 결합 도메인을 포함하는, 키메라 단백질.

174. 단락 173에 있어서, 핵산 결합 도메인은 징크 핑거 도메인을 포함하는, 키메라 단백질.

175. 단락 174에 있어서, 징크 핑거 도메인은 서열 MSRPGERPFQCRICMRNFSNMSNLTRHTRTHTGEKPFQCRICMRNFSDRSVLRRHLRTHTGSQKPFQCRICMRNFSDPSNLARHTRTHTGEKPFQCRICMRNFSDRSSLRRHLRTHTGSQKPFQCRICMRNFSQSGTLHRHTRTHTGEKPFQCRICMRNFSQRPNLTRHLRTHLRGS(서열번호 62)를 포함하는, 키메라 단백질.

176. 단락 172 내지 175 중 어느 하나에 있어서, 키메라 단백질은 키메라 전사 인자를 포함하고, 관심 폴리펩티드는 핵산 결합 도메인 및 전사 조절인자 도메인을 포함하는, 키메라 단백질.

177. 단락 176에 있어서, 전사 조절인자 도메인은 전사 활성인자인, 키메라 단백질.

178. 단락 177에 있어서, 전사 활성인자는 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP16의 4개의 탠덤 카피를 포함하는 활성화 도메인; VP64 활성화 도메인; NFκB의 p65 활성화 도메인(p65); 엡스타인-바 바이러스 R 트랜스활성인자(Rta) 활성화 도메인; VP64, p65, 및 Rta 활성화 도메인(VPR 활성화 도메인)을 포함하는 삼부 활성인자; VP64, p65, 및 HSF1 활성화 도메인(VPH 활성화 도메인)을 포함하는 삼부 활성인자; 및 인간 E1A 관련 단백질 p300의 히스톤 아세틸트랜스퍼라제 코어 도메인(p300 HAT 코어 활성화 도메인)으로 이루어진 군으로부터 선택된, 키메라 단백질.

179. 단락 178에 있어서, 전사 활성인자는 아미노산 서열 DEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS(서열번호 64)를 포함하는 p65 전사 활성인자인, 키메라 단백질.

180. 단락 1 내지 171 중 어느 하나의 변형된 ER-LBD를 암호화하는 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드 분자.

181. 단락 172 내지 179 중 어느 하나의 키메라 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드 분자.

182. 단락 180의 폴리뉴클레오티드 분자에 작동가능하게 연결된 프로모터를 포함하는 이종 작제물.

183. 단락 181의 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물.

184. 단락 182의 이종 작제물을 포함하는 플라스미드.

185. 단락 183의 이종 작제물을 포함하는 플라스미드.

186. 단락 182의 이종 작제물 또는 단락 184의 플라스미드를 포함하는 세포.

187. 단락 183의 이종 작제물 또는 단락 185의 플라스미드를 포함하는 세포.

188. 관심 유전자의 전사를 조절하기 위한 유전자 스위치로서,

(a) 단락 176의 키메라 단백질로서, 키메라 단백질은 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터에 결합하는 키메라 단백질; 및

(b) 비-내인성 리간드로서, 변형된 ER-LBD에 대한 비-내인성 리간드의 결합은 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는, 비-내인성 리간드를 포함하는, 유전자 스위치.

189. 구현예 188에 있어서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 유전자 스위치.

190. 단락 188 또는 단락 189에 있어서, 관심 유전자는 사이토카인, 케모카인, 귀소 분자, 성장 인자, 세포 사멸 조절자, 공동 활성화 분자, 종양 미세환경 조절제 a, 수용체, 리간드, 항체, 폴리뉴클레오티드, 펩티드, 및 효소로 이루어진 군으로부터 선택된 폴리펩티드를 암호화하는, 유전자 스위치.

191. 단락 190에 있어서, 관심 유전자는 다음으로 이루어진 군으로부터 선택된 사이토카인을 암호화하는, 유전자 스위치: IL1-베타, IL2, IL4, IL6, IL7, IL10, IL12, IL12p70 융합 단백질, IL15, IL17A, IL18, IL21, IL22, I형 인터페론, 인터페론-감마, 및 TNF-알파.

192. 단락 191에 있어서, 관심 유전자는 MCHQQLVISWFSLVFLASPLVAIWELKKDVYVVELDWYPDAPGEMVVLTCDTPEEDGITWTLDQSSEVLGSGKTLTIQVKEFGDAGQYTCHKGGEVLSHSLLLLHKKEDGIWSTDILKDQKEPKNKTFLRCEAKNYSGRFTCWWLTTISTDLTFSVKSSRGSSDPQGVTCGAATLSAERVRGDNKEYEYSVECQEDSACPAAEESLPIEVMVDAVHKLKYENYTSSFFIRDIIKPDPPKNLQLKPLKNSRQVEVSWEYPDTWSTPHSYFSLTFCVQVQGKSKREKKDRVFTDKTSATVICRKNASISVRAQDRYYSSSWSEWASVPCSGGGSGGGSGGGSGGGSRNLPVATPDPGMFPCLHHSQNLLRAVSNMLQKARQTLEFYPCTSEEIDHEDITKDKTSTVEACLPLELTKNESCLNSRETSFITNGSCLASRKTSFMMALCLSSIYEDLKMYQVEFKTMNAKLLMDPKRQIFLDQNMLAVIDELMQALNFNSETVPQKSSLEEPDFYKTKIKLCILLHAFRIRAVTIDRVMSYLNAS(서열번호 58)의 아미노산 서열을 포함하는 IL12p70 융합 단백질을 암호화하는, 유전자 스위치.

193. 관심 유전자의 전사를 조절하는 방법으로서, (i) 단락 176의 키메라 단백질을 암호화하는 이종 작제물 및 (ii) 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트로 세포를 형질전환시키는 단계, 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 단계를 포함하는, 방법.

194. 단락 193에 있어서, 방법은 키메라 단백질이 전사를 조절하도록 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함하는, 방법.

195. 단락 193 또는 단락 194에 있어서, 전사를 조절하는 단계는 관심 유전자의 전사를 활성화하는 단계를 포함하는, 방법.

196. 단락 193 또는 단락 194에 있어서, 전사를 조절하는 단계는 관심 유전자의 전사를 억제하는 단계를 포함하는, 방법.

197. 단락 193 내지 196 중 어느 하나에 있어서, 표적 발현 카세트는 단락 174의 키메라 단백질을 암호화하는 이종 작제물에 의해 암호화되는, 방법.

198. 단락 193 내지 196 중 어느 하나에 있어서, 표적 발현 카세트는 제2 이종 작제물에 의해 암호화되는, 방법.

199. 키메라 단백질의 국소화를 조절하는 방법으로서, 단락 172 내지 179 중 어느 하나의 키메라 단백질을 암호화하는 이종 작제물로 세포를 형질전환시키는 단계, 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질의 핵 국소화를 유도하는 단계를 포함하는, 방법.

200. 단락 199에 있어서, 방법은 핵 국소화를 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함하는, 방법.

201. 단락 193, 또는 단락 195 내지 단락 200 중 어느 하나에 있어서, 형질전환된 세포는 인간 또는 동물에 존재하고, 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 리간드의 약리학적 용량을 인간 또는 동물에 투여하는 단계를 포함하는, 방법.

202. 단락 193 내지 201 중 어느 하나에 있어서, 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 방법.

203. 단락 201 또는 단락 202에 있어서, 비-내인성 리간드는 서열번호 1의 야생형 에스트로겐 수용체 알파 상에서 비-내인성 리간드가 실질적으로 불활성인 농도로 투여되는, 방법.

실시예

하기는 본 개시를 수행하기 위한 특정 구현예의 실시예이다. 실시예는 단지 예시 목적으로 제공되며, 어떠한 방식으로도 본 개시의 범위를 제한하는 것으로 의도되지 않는다. 사용된 숫자(예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하기 위한 노력이 이루어졌지만, 일부 실험적 오류 및 편차가 물론 허용되어야 한다.

본 개시의 실행은 달리 지시되지 않는 한, 당업계의 기술 내에서 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학의 통상적인 방법을 사용할 것이다. 이러한 기술은 문헌에서 완전히 설명된다. 예를 들어, T.E. Creighton, Proteins: Structures and Molecular Properties (W.H. Freeman 및 Company, 1993); A.L. Lehninger, Biochemistry (Worth Publishers, Inc., current addition); Sambrook, et al., Molecular Cloning: A Laboratory Manual (2nd Edition, 1989); Methods In Enzymology (S. Colowick 및 N. Kaplan eds., Academic Press, Inc.) ; Remington's Pharmaceutical Sciences, 18th Edition (Easton, Pennsylvania: Mack Publishing Company, 1990); Carey 및 Sundberg Advanced Organic Chemistry 3rd Ed. (Plenum Press) Vols A 및 B(1992) 참조.

실시예 1: 리간드 결합을 조절하는 것으로 예측되는 ERT2 돌연변이

서열번호 2의 ERT2와 비교했을 때, 4-OHT에 대한 민감도가 증가될 것으로 예측되는 돌연변이를 식별하기 위해, ERT2로 알려진 에스트로겐 수용체 알파의 돌연변이체 형태에 대한 4-OHT, 엔독시펜 및 에스트라디올 결합에 대한 인실리코 모델링을 수행하였다.

물질 및 방법

에스트라디올과 ERα(PDB: 1QKU, 해상도 3.2 Å) 사이 및 4-OHT와 ERα(PDB: 3ERT, 해상도 1.9 Å) 사이의 복합체의 이용 가능한 결정 구조를 사용하여 에스트라디올과 ERT2, 4-OHT와 ERT2, 및 엔독시펜과 ERT2 사이의 복합체의 모델을 생성하였다. ERT2 서열은 3개의 잔기(G400V/M543A/L544A)가 ERα와 상이하다. 이용 가능한 구조가 모두 이 영역으로만 해상되었으므로, 306 내지 551의 잔기만이 구조 모델에 사용되었다.

표준 프로토콜(Kannan et al. ACS Omega. 2017 Nov 30; 2(11): 7881-7891.)을 사용하여, apo ERT2, ERT2 - 에스트라디올, ERT2 - 4-OHT 및 ERT2 - 엔독시펜 복합체에 대해 MD 시뮬레이션을 수행하였다(각 시뮬레이션은 각각 100 ns간 3회 수행함). ERT2 및 결합된 리간드/약물 둘 다는 시뮬레이션 동안 안정적으로 유지되었다(표준 측정 사용). 시뮬레이션의 마지막 절반(50 ns) 동안 생성된 형태(시뮬레이션은 평형화된 것으로 간주됨)를 후속 분석에 사용하였다.

결과

개선된 4-OHT 결합에 대해 제1 세트의 돌연변이를 인 실리코 분석하였다. 다른 에스트로겐 수용체 단백질에 대한 상동성 위치에 존재하는 아미노산에 기초하여, 리간드 결합 포켓 내의 잔기에 대한 18개의 돌연변이를 선택하였다. 선택된 18개의 돌연변이 중, 17개의 돌연변이체는 야생형 ERT2보다 적어도 1.8 kcal/mol 만큼 더 단단히 결합하고; M517A 돌연변이만이 4-OHT의 결합을 불안정하게 하는 것으로 보인다(도 1a). 다음으로, 에스트라디올의 결합에 대한 돌연변이의 효과를 보기 위해 결합 에너지 계산을 수행하였다. 4-OHT(M517A를 제외한 모든 돌연변이는 음성 △△G 값으로 표시된 바와 같이 결합을 선호함)와 비교하여, 대부분의 돌연변이(도 1b)는 에스트라디올의 결합에 무시할 만한 효과를 가졌다(대부분의 돌연변이에 대해 2 kcal/mol 보다 큰 4-OHT의 △△G 값과 비교하여, 모든 돌연변이에 대한 △△G 값은 2 kcal/mol 이내임). 돌연변이 L409V, M517A 및 N407D만이 에스트라디올에 대해 1 kcal/mol 초과하는 결합의 증가를 나타냈지만, L409V 및 N407D 둘 모두는 각각 3 및 4 kcal/mol 만큼 4-OHT에 더 단단히 결합한다. 제1 세트의 돌연변이는 아래 표 6에 나타나 있다.

돌연변이
G344M	I389M	C417S
L345S	V392M	M421I
N348K	N407D	V422I
R352K	L409V	M517A
L384M	N413D	Y526L
I386V	Q414E	S527N

개선된 4-OHT 결합에 대해 제2 세트의 돌연변이를 인 실리코 분석하였다. 야생형 ERT2와 비교하여, 4-OHT에 대한 민감도가 증가된 추가 돌연변이체를 식별하기 위해, 리간드 결합 포켓의 5개의 추가 부위(표 6에 나타낸 것에 추가)에서 19개의 상이한 돌연변이에 대해 ERT2에 대한 4-OHT 및 에스트라디올 결합에 대하여 분자 도킹 시뮬레이션을 수행하였다. 결합 에너지 계산은 제1 돌연변이 세트에 대해 수행된 계산과 일관되게 수행하였다. 돌연변이 19개 모두 1.8 kcal/mol 내지 7 kcal/mol 범위로 4-OHT에 대한 결합개선을 나타냈다(도 2 참조). 제2 세트의 돌연변이는 표 7에 나타나 있다.

돌연변이
L354I	L387I	L391V
L354M	L387M	G420I
L354F	L387F	G420M
L354V	L387V	G420F
L384I	L391I	G420V
L384V	L391M
L384F	L391F

개선된 4-OHT 결합에 대해 제3 세트의 돌연변이를 인 실리코 분석하였다. 리간드 결합 포켓 내의 추가 6개의 잔기 위치(잔기 428, 346, 349, 418, 421, 및 424)에서 총 23개의 돌연변이를 분자 도킹 시뮬레이션을 위해 선택하였다. 결합 에너지 계산은 제1 돌연변이 세트에 대해 수행된 계산과 일관되게 수행하였다. 돌연변이 중 6개(L346F, L349M, V418I, V418M, I424M, 및 M421L)는 4-OHT에 대해 적어도 약 1.5 kcal/mol만큼 개선된 결합을 나타냈다(도 3). 이들 23개의 돌연변이는 표 8에 나타나 있다.

돌연변이
L346I	V418I	I424M
L346M	V418L	I424F
L346F	V418M	I424V
L346V	V418F	L428I
L349I	M421L	L428M
L349M	M421F	L428F
L349F	M421V	L428V
L349V	I424L

개선된 4-OHT 결합에 대해 제4 세트의 돌연변이를 인 실리코 분석하였다. 리간드 결합 포켓 내의 추가 6개의 잔기 위치(잔기 528, 343, 388, 522, 414, 및 521)에서 총 23개의 돌연변이를 분자 도킹 시뮬레이션을 위해 선택하였다. 결합 에너지 계산은 제1 돌연변이 세트에 대해 수행된 계산과 일관되게 수행하였다. 23개의 돌연변이 중 18개는 4-OHT에 대해 적어도 약 1.0 kcal/mol 만큼 개선된 결합을 나타냈다(도 4). 제4 세트의 돌연변이는 표 9에 나타나 있다.

돌연변이
M343I	F404L	G521V
M343L	F404M	M522I
M343F	F404V	M522L
M343V	G521A	M522V
M388I	G521I	M528I
M388L	G521L	M528F
M388F	G521M	M528V
F404I	G521F

개선된 4-OHT 결합에 대해 제5 세트의 돌연변이를 인 실리코 분석하였다. 분자 도킹 시뮬레이션을 위해 5개의 추가 잔기 위치(잔기 524, 525, 347, 350, 및 351)에서 총 38개의 돌연변이를 선택하였다. 결합 에너지 계산은 제1 돌연변이 세트에 대해 수행된 계산과 일관되게 수행하였다. 38개의 돌연변이 중 28개는 4-OHT에 대해 적어도 약 1.0 kcal/mol 만큼 그리고 최대 약 4.5 kcal/mol의 개선된 결합을 나타냈다(도 5). 제5 세트의 돌연변이는 표 10에 나타나 있다.

돌연변이
H524A	T347S
H524I	A350I
H524L	A350L
H524F	A350M
H524V	A350F
L525N	A350V
L525Q	D351N
L525I	D351Q
L525M	D351E
L525F	D351I
L525S	D351L
L525T	D351M
L525V	D351F
T347V	D351V

세트 1~5에 대한 모든 돌연변이를 엔독시펜 및 에스트라디올에 대한 결합에 대해 분자 도킹 시뮬레이션으로 추가로 분석하여 엔독시펜 및 에스트라디올에 대한 결합 에너지를 결정하였다(kcal/mol 단위의 △△G로 계산됨). 또한, 에스트라디올 결합과 비교하여 엔독시펜 결합의 결합 에너지 간의 차이를 △△△G 값으로 계산하였다. 4-OHT, 엔독시펜, 및 에스트라디올 각각에 대한 결합 에너지, 및 에스트라디올 결합과 비교한 4-OHT 및 엔독시펜의 결합 에너지 차이의 요약이 표 11에 나타나 있다.

	4-OHT(△△G) (kcal/mol)	END(△△G) (kcal/mol)	EST(△△G) (kcal/mol)	4-OHT-EST(△△△G) (kcal/mol)	END-EST(△△△G)(kcal/mol)
M343I	-3.4	-2.2	1.5	-4.9	-3.7
M343L	-2.2	-1.6	0.9	-3.1	-2.6
M343V	0	-0.7	1.8	-1.8	-2.5
M343F	-2	-1.6	2.2	-4.2	-3.8
G344M	-1.6	-1.4	-0.6	-1	-0.8
L345S	-4.3	1.1	-0.1	-4.2	1.2
L346I	2.2	-0.8	-0.9	3.1	0.1
L346M	-0.4	-0.8	-0.5	0.1	-0.3
L346V	1.3	0.8	0.5	0.8	0.3
L346F	-1.7	-0.8	-0.1	-1.6	-0.6
T347I	-0.1	-0.7	0.4	-0.5	-1.1
T347L	-1.6	-1.2	0.5	-2	-1.7
T347M	-2.4	-2.3	-1.9	-0.5	-0.3
T347N	-0.3	-2.7	1.1	-1.4	-3.8
T347R	-3.3	-4.3	-0.8	-2.5	-3.5
T347V	-1.7	-0.9	0	-1.7	-0.9
T347D	0.4	3.8	0.4	0	3.4
T347E	-1.2	2.5	1.1	-2.3	1.4
T347F	-3.2	-2.2	0.1	-3.3	-2.2
T347K	-1.3	-2.5	1.4	-2.7	-3.9
T347Q	-0.4	0.4	1.3	-1.8	-0.9
T347S	0.2	-2.7	1.1	-0.9	-3.7
N348K	-5.5	-3.6	0.8	-6.3	-4.4
L349I	3.4	1.4	2	1.4	-0.6
L349M	-1.5	-2	2.6	-4.1	-4.6
L349V	0.5	1.5	1.7	-1.2	-0.2
L349F	0.9	-0.8	-0.7	1.6	-0.1
A350L	0.6	-0.6	1	-0.4	-1.6
A350M	-0.5	-2	1.3	-1.8	-3.3
A350V	-0.2	-1.1	0.5	-0.7	-1.5
A350F	-0.7	-2.3	-1	0.4	-1.3
A350I	-1.3	-3.8	0.6	-1.9	-4.4
D351I	-1.2	-3.5	2	-3.2	-5.5
D351L	-1.7	-3.2	0.4	-2.1	-3.6
D351M	-3.6	-3	-0.2	-3.4	-2.9
D351N	-1.3	-2.1	1.8	-3.2	-4
D351V	-3.2	-3.8	0.6	-3.8	-4.4
D351E	-1.2	1	0.7	-1.8	0.3
D351F	-3.4	-2.2	1.2	-4.6	-3.4
D351Q	-3	0.1	0.3	-3.2	-0.2
R352K	-3.8	-2.5	0.1	-3.9	-2.6
L354I	-6.9	-2.5	0.9	-7.8	-3.4
L354M	-4.2	-1.3	0.9	-5.1	-2.2
L354V	-3.5	-2.5	1.5	-5	-4
L354F	-4.9	-2.6	0.7	-5.6	-3.3
L384I	-2.7	-4.6	0.3	-3	-4.9
L384M	-3.3	0	1.4	-4.7	-1.4
L384V	-3.6	-2.5	3.2	-6.9	-5.7
L384F	-2.6	-0.4	3	-5.5	-3.3
I386V	-1.8	-3.4	0.4	-2.2	-3.8
L387I	-2.9	-2.6	0.4	-3.2	-3
L387M	-7.3	-1.9	0.3	-7.5	-2.2
L387V	-5	-2.4	-0.7	-4.3	-1.6
L387F	-2	-0.4	1.1	-3	-1.4
M388I	-3.2	-1.7	0.3	-3.5	-2
M388L	1	-0.7	1.9	-0.9	-2.6
M388F	-1.8	-1.6	1.2	-3	-2.8
I389M	-4.6	-2.1	0.6	-5.2	-2.7
L391I	-5.8	-2.8	2	-7.8	-4.8
L391M	-4.1	-4.5	0	-4.1	-4.5
L391V	-5.6	-3.4	1.5	-7.1	-4.9
L391F	-7.2	-1.5	0.1	-7.3	-1.6
V392M	-3.9	-2.6	0.6	-4.5	-3.2
F404I	-2.2	-1.3	2	-4.2	-3.4
F404L	-2.8	-1.7	-0.5	-2.3	-1.2
F404M	-1.5	-0.3	2.2	-3.7	-2.4
F404V	1	-1	1.4	-0.4	-2.4
N407D	-3.5	-2.2	-1.1	-2.4	-1.1
L409V	-2.5	-1.8	-1.2	-1.3	-0.6
N413D	-4.7	-0.8	-0.4	-4.3	-0.4
Q414E	-4.5	-1.8	-0.1	-4.4	-1.7
C417S	-2.6	-1	1.2	-3.8	-2.2
V418I	-2.3	-1.1	1.9	-4.2	-3.1
V418L	1.5	-1.3	2	-0.5	-3.2
V418M	-1.2	-1.8	1.4	-2.6	-3.2
V418F	0.4	-2.6	0.6	-0.3	-3.2
G420I	-5.3	-2.8	-0.2	-5.1	-2.6
G420M	-6	-3.9	-1.2	-4.8	-2.7
G420V	-4	-2.5	0.1	-4.1	-2.6
G420F	-4.6	-4	3.3	-7.9	-7.3
M421I	-3.3	-2.1	0.1	-3.4	-2.2
M421L	-0.9	-1.7	0	-0.9	-1.7
M421V	0.5	0.4	0.4	0.1	0
M421F	0.3	-1.4	-0.7	1	-0.8
V422I	-2.4	-2.2	-0.7	-1.7	-1.5
I424L	0.8	-0.8	-0.6	1.3	-0.2
I424M	-1.4	-1.8	0.3	-1.7	-2
I424V	0.8	-1.8	3.1	-2.3	-4.9
I424F	1.3	-1.4	0.8	0.5	-2.2
L428I	1.3	-0.5	0.5	0.8	-1.1
L428M	0	-1.9	0.9	-0.9	-2.8
L428V	-0.2	-0.1	2.3	-2.4	-2.4
L428F	1.3	0.7	1.3	0	-0.6
M517A	1.2	0.8	-1.1	2.3	1.9
G521A	-2	0	0.2	-2.2	-0.2
G521I	-3.2	-0.3	2.3	-5.5	-2.6
G521L	-2	-1	1.9	-3.9	-2.9
G521M	-1.7	-2.5	3.3	-5	-5.8
G521V	-1.8	-1.1	0.5	-2.3	-1.6
G521F	-2	-1.8	3.4	-5.4	-5.3
M522I	-2.9	-2	1.7	-4.6	-3.7
M522L	0.8	-0.7	0.1	0.7	-0.8
M522V	-0.5	-1	-0.7	0.2	-0.3
H524A	-2.1	-3	-0.4	-1.7	-2.6
H524I	-3	-3	2.8	-5.8	-5.8
H524L	-1.2	-1.3	2	-3.3	-3.3
H524V	-3.6	-3.3	0.6	-4.2	-4
H524F	-2.1	-3.9	2.7	-4.8	-6.6
L525I	-1.8	-2.1	0.5	-2.3	-2.6
L525M	-1.2	-1.8	-0.2	-0.9	-1.5
L525N	-4.4	-1.4	-0.4	-4	-0.9
L525T	-1.2	-2.3	0.6	-1.7	-2.9
L525V	-3.6	-4.5	-1	-2.7	-3.5
L525F	-0.8	-1.1	-0.4	-0.4	-0.6
L525Q	-2.8	-3.4	-1.4	-1.4	-2
L525S	1.8	-2.4	0.3	1.5	-2.7
Y526L	-2.8	-2	0.1	-2.9	-2.1
S527N	-5.8	-3	1.5	-7.3	-4.5
M528I	-1	-2.5	0.5	-1.5	-2.9
M528V	-1	-1.1	3	-4	-4.1
M528F	-1.5	-1	2.5	-4	-3.5

제6 세트의 돌연변이를 인 실리코 분석하여 작용제-결합 확인(즉, 에스트라디올-결합 형태)을 불안정하게 하고/하거나 길항제-결합 확인(즉, 4-OHT 또는 엔독시펜-결합 형태)을 안정화시키는 돌연변이체를 식별하였다. 작용제-결합 형태와 길항제-결합 형태 사이의 주요 구조적 차이는 나선 12의 배향 및 도킹 부위에 있다(H12, 도 6 참조). 나선 12 내 8개의 잔기 위치에서 총 14개의 돌연변이(잔기 538, 536, 539, 540, 547, 534, 533, 및 537)를 분석을 위해 선택하였다. 길항제-결합 형태의 돌연변이체 ERT2 및 야생형 ERT2의 자유 에너지의 차이, 및 작용제-결합 형태의 돌연변이체 ERT2 및 야생형 ERT2의 자유 에너지의 차이를 △G 값으로 계산하였다. 다음으로, △△G 값을 계산하였는데, 음의 값은 ERT2 돌연변이체의 길항제-결합 형태가 돌연변이체의 작용제-결합 형태보다 선호됨을 나타내고, 양의 값은 작용제 형태가 길항제-결합 형태보다 선호됨을 나타낸다. 14개의 돌연변이 중 7개(D538K, L536F, L536Y, L536M, L539R, H547A, 및 V534R)가 길항제 확인을 안정화시켰다(도 7 참조). 제6 세트의 돌연변이는 표 12에 나타나 있다.

돌연변이
V533F	Y537E
V533W	D538K
V534R	L539R
V534Q	L539A
L536F	L540A
L536M	L540F
L536Y	H547A

실시예 2: 형질감염 스크리닝에 의해 식별되는 약물 민감도가 증가한 ERT2 돌연변이체

ERT2 돌연변이체를 4-OHT에 반응하여 리포터 발현을 유도하는 능력에 대해 형질감염 검정에 의해 분석하였다. 제1 형질감염 스크리닝에서, 실시예 1에 기술된 돌연변이를 갖는 ERT2를 암호화하는 작제물을 서열번호 3에 도시된 바와 같이 "야생형" ERT2의 배경에서 생산하였다(G400V/M543A/L544A/V595A 사중 아미노산 치환을 포함함). 각각의 ERT2 작제물은 DNA 결합을 위한 ZF10-1 도메인, p65 전사 활성화 도메인, 및 ERT2 돌연변이체를 포함하였다. 각각의 작제물을 4-OHT에 대한 민감도에 대해 시험하였다. 각각의 돌연변이체를 HEK293T + YBTATA_mCherry 리포터 세포주를 형질감염하기 위한 발현 작제물에 클로닝하였다. 제2 형질감염 스크리닝에서, 실시예 1에 기술된 추가 ERT2 돌연변이체를 암호화하는 작제물을 생산하고 4-OHT에 대한 민감도에 대해 시험하였다. 스크리닝을 위해, 세포를 3가지 상이한 농도의 4-OHT(0.025, 0.1, 및 0.25 uM)로 처리한 다음, 형광 활성화 세포 분류(FACS)에 의해 mCherry 발현을 검정하였다(도 8a~8c, 도 9a~9c, 및 도 10a~10c).

물질 및 방법

HEK293T 세포를 YBTATA 최소 프로모터에 연결된 4개의 ZF10-1 결합 부위로 이루어진 합성 프로모터를 암호화하는 렌티바이러스로 형질도입하였다. 이러한 합성 프로모터는 mCherry의 발현을 유발한다. 이 세포주의 세포는 "리포터 세포"로 불린다.

1일차에, 리포터 세포를 24 웰 플레이트에 1.5e5 세포/웰로 플레이팅하였다. 2일차에, 세포를 ERT 돌연변이체로 형질감염시켰다. 각각의 웰에 0.6 ug DNA, 1.8 uL Fugene, 및 30 uL Optimem의 혼합물을 만들었으며, 여기서 DNA는 p65에 융합된 ZF10-1 및 ERT2 돌연변이체를 암호화한다. 일부 스크리닝에서, GFP를 암호화하는 플라스미드를 대조군으로서 포함시켜 유세포 계측법으로 형질감염된 세포를 선택하였다. 3일차에, 세포를 1:20의 비율로 분할하고 96 웰 플레이트에 시딩하였다. 세포를 0, 0.025, 0.1, 또는 0.25 uM 4-OHT로 처리하였다. 5일차에, 배지를 제거하고, 세포를 트립신화한 다음, FACS 완충액 + Sytox Red(APC 채널 중의 형광) 생존 염료에 재현탁하였다. 세포를 유세포 계측기 상에서 실행하고, 세포용 FSC/SSC, 생존 세포용 FSC/Sytox Red , 단일 세포용 FSC/FSC-폭, 및 가능한 경우(형질감염 대조군이 포함된 경우) 형질감염된 세포용 GFP+에 의해 게이팅하였다. 각 약물 농도에서 mCherry 양성 세포의 백분율을 도표화하고 야생형 ERT2와 비교하였고, 4-OHT에 더 민감한 돌연변이체를 식별하였다.

결과

도 8a~8c, 도 9a~9c, 및 도 10a~10c에 나타낸 바와 같이, 형질감염 스크리닝은 ERT2(서열번호 3)와 비교하여 mCherry 발현의 유도가 개선된 돌연변이체를 식별하였다. 제1 형질감염 스크리닝에서, 다음의 17개의 돌연변이체에 대해 개선된 발현 유도가 관찰되었다: L354I(SB03498), L391V(SB03505), Q414E(SB03383), L409V(SB03375), S463P(SB03393), L384M(SB03377), L354I+L384M(SB03511), N413D(SB03381), M517A(SB03379), G344M(SB03372), I386V(SB03373), N407D(SB03380), C417S(SB03371), R352K(SB03384), Y537S(SB03389), M388F(SB03579), 및 G521A(SB03587), 가장 큰 발현 개선은 다음의 7종의 돌연변이체에 의해 유도됨: L354I(SB03498), L391V(SB03505), Q414E(SB03383), L409V(SB03375), 및 S463P(SB03393),(도 8a~8c). 제2 형질감염 스크리닝에서, 10종의 돌연변이체에 대해 발현 유도 개선이 관찰되었다: I424L(SB03558), M421L(SB03566), M421F(SB03567), T347E(SB03801), L536M(SB03828), Y537E(SB03839), T347I(SB03802), 및 T347M(SB03805), V418I(SB03550), 및 V533W(SB03838), 발현의 강한 개선은 하기 6종의 돌연변이체에 의해 유도됨: I424L(SB03558), M421L(SB03566), M421F(SB03567), T347E(SB03801), L536M(SB03828), 및 Y537E(SB03839)(도 9a~9c). 제3 형질감염 스크리닝(도 10a~10c)에서, 표 13에 나타낸 돌연변이체에 대해 발현 유도 개선이 관찰되었다.

표 13.

작제물	설명
SB03771	H524L
SB03894	L354I + Q414E
SB03893	L354I +L384M + Q414E
SB03892	L391V + Q414E
SB03772	H524F
SB03882	L409V + L391V
SB03883	L409V + L354I +L384M
SB03881	L409V + S463P
SB03888	S463P + L354I
SB03884	L409V + L354I
SB03890	L391V + L354I +L384M
SB03887	S463P + L354I +L384M
SB03885	L409V + Q414E
SB03891	L391V + L354I
SB03886	S463P + L391V
SB03889	S463P + Q414E

실시예 3: 형질도입 스크리닝에 의해 식별되는 약물 민감도가 증가한 돌연변이체

ERT2 돌연변이체를 4-OHT에 반응하여 리포터 발현을 유도하는 능력에 대해 3회의 형질도입 스크리닝에 의해 분석하였다. 돌연변이체 L354I + L384M(제1 형질감염 스크리닝에서 식별됨)을 3개의 형질도입 스크리닝 모두에 포함시켰다. 실시예 2의 형질감염 스크리닝에서 4-OHT에 대한 개선된 반응을 나타낸 ERT2 돌연변이체를 암호화하는 렌티바이러스 벡터를 클로닝하였다. 실시예 2에 기술된 바와 같은 리포터 세포주를 ERT2 돌연변이체를 암호화하는 렌티바이러스로 형질도입하고, 다양한 4-OHT 농도에 반응하여 mCherry 발현을 유도하는 돌연변이체의 능력을 평가하였다.

물질 및 방법

형질도입 스크리닝을 위해, 1일차에, 리포터 세포를 12 웰 플레이트에 2e5 세포/웰로 플레이팅하였다. 2일차에, 형질감염 스크리닝으로부터 유래한 리드 ERT 돌연변이체를 암호화하는 렌티바이러스로 세포를 형질도입하였다. 3일차 및 4일차에, 세포를 계대하여 플레이트 상에서 90%를 초과하는 컨플루언스를 유지시켰다. 5일차에, 세포를 96 웰 플레이트에 시딩하고, 0, 0.001, 0.0025, 0.004, 0.025, 0.05, 0.1, 또는 0.25 uM 4-OHT로 처리하였다. 8일차에, 배지를 제거하고 세포를 트립신화한 다음, FACS 완충액 + Sytox Red(APC 채널 중의 형광) 생존 염료에 재현탁하였다. 세포를 유세포 계측기 상에서 실행하고 세포에 대해 FSC/SSC, 생존 세포에 대해 FSC/Sytox Red로 게이팅하였고, 각 약물 농도에서 mCherry 양성 세포의 백분율을 도표화하고 더 민감한 돌연변이체를 발견하기 위해 야생형 ERT2와 비교하였다(도 11a). 2가지 약물 농도 0.004 및 0.025 uM 4-OHT에서 mCherry 양성 세포의 백분율도 막대 그래프에 도시되어 있다(도 11b).

결과

도 11a 및 도 11b를 참조하면, 제1 형질도입 스크리닝은 실시예 2의 형질감염 스크리닝에서 개선된 4-OHT 결합을 갖는 것으로 식별된 여러 돌연변이체에 대한 개선된 4-OHT 반응을 확인하였다. 특히, 돌연변이체 L354I, L391V, Q414E, L409V, S463P, L384M, 및 L354I+L384M은 모두 야생형 ERT2(작제물 3422, 서열번호 3)와 비교하여 개선된 4-OHT 반응을 나타냈다. 제1 형질도입 스크리닝에서 개선된 4-OHT 결합을 나타내는 ERT2 돌연변이체가 표 14에 나타나 있다.

작제물	설명
SB03498	L354I
SB03505	L391V
SB03383	Q414E
SB03375	L409V
SB03393	S463P
SB03377	L384M
SB03511	L354I + L384M

도 12에 도시된 바와 같이, 제2 형질도입 스크리닝은 실시예 2의 형질감염 스크리닝에서 식별된 돌연변이체에 대한 개선된 4-OHT 반응을 확인하였다. 특히, 돌연변이체 M517A, 및 N413D, 및 L354I + L384M은 야생형 ERT2(작제물 3422)와 비교하여 개선된 4-OHT 반응을 나타냈다. 특히, L354I + L384M 돌연변이체의 개선된 4-OHT 반응은 제1 및 제2 형질도입 스크리닝 모두에서 확인되었다. 제2 형질도입 스크리닝에서 개선된 4-OHT 결합을 나타내는 ERT2 돌연변이체가 표 15에 나타나 있다.

작제물	설명
SB03379	M517A
SB03381	N413D
SB03511	L354I + L384M

도 13에 도시된 바와 같이, 제3 형질도입 스크리닝은 실시예 2의 형질감염 스크리닝에서 식별된 돌연변이체에 대해서 4-OHT 반응의 개선을 확인하였다. 특히, 돌연변이체 I524L, M421L, 및 L354I +L384M은 야생형 ERT2(작제물 3422)와 비교하여 개선된 4-OHT 반응을 나타냈다. 제3 형질도입 스크린에서 개선된 4-OHT 결합을 나타내는 ERT2 돌연변이체는 표 16에 나타나 있다.

작제물	설명
SB03558	I524L
SB03566	M421L
SB03511	L354I + L384M

실시예 4: 엔독시펜 온 스위치를 개발하기 위한 ERT2 돌연변이체 라이브러리 스크린

물질 및 방법

ERT2 돌연변이체 조합 라이브러리 스크리닝

HEK293T 세포를 조합 ERT2 돌연변이체 라이브러리인, 약 800개의 고유한 ER-LBD 변이체로 구성되되, 각각은 이들의 포함에 대한 이론적 근거에 따라 표 18에 주어진 돌연변이체의 고유한 조합인 SB04401로 형질도입하였다(도 14a). 각 세포가 세포 당 고유한 ER-LBD 변이체를 갖는 균질한 세포주를 생성하기 위해, 형질도입된 HEK293T 세포의 바이러스 통합을 카피 수 검정에 의해 정량화하였다. 세포 당 ERT2 돌연변이체 라이브러리의 카피가 1 미만인 평균 바이러스 통합을 갖는 세포주를 식별하고 퓨로마이신 선별을 거쳤다. 그런 다음, 선별된 세포주를 SB01066 mCherry 리포터로 형질도입하였다(도 14b). 그런 다음, 형질도입된 세포를 mCherry 리포터를 통해 엔독시펜 및 4-OHT에 대한 민감도에 대해 시험하였는데, ER-LBD 변이체가 약 0.1 nM 내지 최대 약 1 uM만큼 낮은 시험된 농도에 민감한 경우 발현할 것이다. mCherry를 발현하는 세포 및 이에 따라 엔독시펜의 처리에 반응하는 세포를 분류한 다음, 상기 분류된 세포로부터 게놈 DNA를 단리하였다. 변이체는 ERT2 코딩 서열의 PCR 증폭에 이어서 PCR 산물을 pcr4 TOPO 벡터(Life Technologies) 내로 삽입함으로써 단리된 게놈 DNA로부터 식별하였다. 그런 다음, 수득된 콜로니를 Sanger 시퀀싱을 위해 제출하였다. 식별된 돌연변이체를 작제물, 예를 들어, SB06136 - SB06153(ZF10-1_p65_ERT2 돌연변이체)에 클로닝하였다.

돌연변이	근거
L391V	세트 2: ERT2에 대한 4-OHT/엔독시펜의 친화도 개선, 리간드 결합 포켓에서의 단일 점 돌연변이
L409V	세트 1: 4-OHT의 친화도 개선, ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이, 에스트라디올에 대한 결합 증가
Q414E	세트 1: 4-OHT의 친화도 개선, ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이
N413D	세트 1: 4-OHT의 친화도 개선, ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이
S463P	음성 대조군, 임상 돌연변이
M421L	세트 1: 4-OHT의 친화도 개선, ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이
M517A	세트 1: ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이, 약 1 kcal/mol로 에스트라디올에 결합함(비교하면, 4-OHT 결합은 약 1.5 kcal/mol 만큼 불리함)
L354I	세트 2: ERT2에 대한 4-OHT/엔독시펜의 친화도 개선, 리간드 결합 포켓에서의 단일 점 돌연변이
L384M	세트 1: 4-OHT의 친화도 개선, ER 상동체에 존재하는 치환에 기초하여 선택된 리간드 결합 포켓에서의 돌연변이
H524L	세트 5: 리간드 결합 포켓에서의 MD 시뮬레이션에 초점을 맞춘, 4-OHT 및 엔독시펜에 대한 결합을 개선하기 위한 ERT2의 합리적인 최적화

mCherry 리포터를 사용한 U87MG에서의 ERT2 돌연변이체 검증

형질도입 약 16시간 전에 100k U87MG :1066 세포를 12 웰 플레이트 포맷으로 16 웰에 시딩하였다. 형질도입 동안, 각각의 웰 내의 세포를 100k pg의 ERT2 변이체 작제물의 바이러스로 형질도입하였다. 형질도입 후, 세포를 24 웰 플레이트 포맷으로 웰 당 50k 세포로 분할하고, 약물-무함유 배지 또는 다양한 엔독시펜 또는 4-OHT 약물 조건으로 처리하였다. 엔독시펜 또는 4-OHT로 세포를 처리한 후 약 2일차에, 세포를 수집하고, 유세포 계측법으로 mCherry 리포터 발현을 정량화하였다.

결과

ERT2 돌연변이체 라이브러리의 스크리닝은 1 nM에서 엔독시펜에 민감한 ERT2 변이체의 하위 집합을 식별하였다. 이러한 하위 집합 중에서, 15개의 변이체(표 19)를 U87MG 세포에서 0 pM, 10 pM, 50 pM, 100 pM, 및 1 nM의 엔독시펜(도 15a) 및 4-OHT(도 15b)의 농도 범위에서 mCherry 리포터를 활성화하는 능력에 대해 검증하였다(SB01066; 도 14b). 엔독시펜 또는 4-OHT로 치료한 후 약 24시간차에 mCherry의 발현을 정량화하였다. 입증된 바와 같이, 15개의 변이체 모두 약 1 nM 이하의 농도에서 엔독시펜 및 4-OHT에 민감했던 반면, 음성 대조군 U87MG 및 U87MG:1066 음성 대조군은 민감도를 나타내지 않았다.

작제물	설명
SB06136	ZF10-1_p65_ERT2_돌연변이체 81
SB06138	ZF10-1_p65_ERT2_돌연변이체 93
SB06139	ZF10-1_p65_ERT2_돌연변이체 86
SB06140	ZF10-1_p65_ERT2_돌연변이체 95
SB06141	ZF10-1_p65_ERT2_돌연변이체 88
SB06142	ZF10-1_p65_ERT2_돌연변이체 77
SB06143	ZF10-1_p65_ERT2_돌연변이체 49
SB06144	ZF10-1_p65_ERT2_돌연변이체 58
SB06145	ZF10-1_p65_ERT2_돌연변이체 62
SB06146	ZF10-1_p65_ERT2_돌연변이체 63
SB06147	ZF10-1_p65_ERT2_돌연변이체 55
SB06149	ZF10-1_p65_ERT2_돌연변이체 41
SB06150	ZF10-1_p65_ERT2_돌연변이체 43
SB06151	ZF10-1_p65_ERT2_돌연변이체 46
SB06152	ZF10-1_p65_ERT2_돌연변이체 40

야생형 ERT2와 비교하여, 엔독시펜 및 4-OHT에 대한 민감도에 대해 이전 스크린에서 선택된 ERT2 변이체(표 20)를 추가로 시험하였다. 시험은 야생형 ERT2의 활성화가 약 25 nM 엔독시펜 및 약 25 nM 4-OHT에서 시작되는 반면, 시험된 3개의 ERT2 변이체는 1 nM 및 0.1 nM 엔독시펜 및 1 nM 및 0.1 nM 4-OHT에서 mCherry 발현을 활성화시킨다는 것을 보여주었다(도 16a~16d). 예시적인 열 지도는 2.2 pM 에스트라디올을 포함하여 다양한 농도에서 시험된 작제물의 mCherry 발현의 배수 활성화를 보여준다(도 16b). ERT2는 에스트라디올에 비민감성이 되도록 돌연변이된 ER-알파이며, 리드 ERT2 변이체는 생물학적으로 관찰된 에스트라디올 농도에 계속 비민감성인 것으로 확인되었다. 배수 활성화는 각각의 시험 조건의 gMFI mCherry 수준을 리포터(SB01066)가 형질도입된 U87MG 세포의 gMFI mCherry 수준으로 나누어 계산하였다.

작제물	설명
SB06141	ZF10-1_p65_ERT2_돌연변이체 88
SB06146	ZF10-1_p65_ERT2_돌연변이체 63
SB06149	ZF10-1_p65_ERT2_돌연변이체 41
SB03422	ZF10-1_p65_ERT2 야생형
SB01066	pMinYBTATA: mCherry 리포터

실시예 5: NK 세포에서 ERT2 돌연변이체 검증

물질 및 방법

NK 세포에서 mCherry 리포터를 이용한 ERT2 돌연변이체의 검증

10일의 공급 세포 활성화 후, NK 세포를 ERT2 돌연변이체 바이러스 및 리포터 SB01066 바이러스와 공동 형질도입하였다(실험 설정 1). 형질도입 후 2일차에, 형질도입된 NK 세포를 0 nM, 0.01 nM, 0.1 nM, 1 nM, 및 10 nM의 농도 범위에서 엔독시펜 또는 4-OHT로 처리하였다. 4일차에, 유세포 계측법으로 세포를 mCherry 발현에 대해 확인하였다.

실험 설정 1

NK 세포에서 IL12 리포터를 이용한 ERT2 돌연변이체의 검증

10일의 공급 세포 활성화 후, NK 세포를 ERT2/IL12 벡터로 형질도입하였다(표 22; 실험 설정 2). 형질도입 후 2일차에, 형질도입된 NK 세포를 0 nM, 0.1 nM, 1 nM, 10 nM, 100 nM, 및 1000 nM의 농도 범위에서 엔독시펜으로 처리하였다. 4일차에, Luminex를 통해 세포를 IL-12 발현에 대해 확인하였다.

실험 설정 2

결과

이전의 스크리닝으로부터 선택한 ERT2 변이체(표 21; 도 17a~17b)를 일차 NK 세포에서 엔독시펜 및 4-OHT에 대한 민감도에 대해 추가로 시험하였다. 시험된 변이체 중에서, SB06142(돌연변이체 77; L354I/L391V/N413D/M421L/S463P/M517A/H524L), SB06136(돌연변이체 81; L384M/L391V/N413D/M421L/S463P/H524L), 및 SB06145(돌연변이체 62; L409V/N413D/Q414E/M421L/S463P/H524L)는 0.1 nM의 농도에서 엔독시펜 및 4-OHT 둘 다에 민감하였다(도 17a~17b).

치료 폴리펩티드의 전달을 입증하기 위해, ERT2/IL-12 벡터를 표 22에 나타낸 바와 같이 작제하고, 일차 NK 세포에서 엔독시펜에 대한 민감도에 대해 시험하였다. NK 세포에서 ERT2/IL-12 벡터를 시험한 결과, SB06142로부터의 ERT2 - L354I / L391V / N413D / S463P / H524L을 사용한 TL10009 및 crIL12 CD16 CS는 IL-12에서 최상의 유도 및 배수 변화를 나타내는 것으로 나타났다(도18a~18b).

TL#	SB#	유도성 IL-12 (4x ZF5BS YBTATA에 의해 유도됨)	절연체	프로모터: ZF	ZF DNA 결합 도메인	활성인자	ERT2 돌연변이체
TL10006	SB07123	ZFN_YB-TATA-sIL-12 1x AUSLDE	A2	SFFV: 5-7	ZF5-7	P65	돌연변이체 81
TL10007	SB07127	ZFN_YB-TATA IL12_CD16 TACE 절단 부위_B7-1 TM	A2	SV40: 5-7	ZF5-7	P65	돌연변이체 81
TL10008	SB07129	ZFN_YB-TATA-sIL-12 1x AUSLDE	A2	SFFV: 5-7	ZF5-7	P65	돌연변이체 77
TL10009	SB07133	ZFN_YB-TATA IL12_CD16 TACE 절단 부위_B7-1 TM	A2	SV40: 5-7	ZF5-7	P65	돌연변이체 77
TL10010	SB07135	ZFN_YB-TATA-sIL-12 1x AUSLDE	A2	SFFV: 5-7	ZF5-7	P65	돌연변이체 62
TL10011	SB07139	ZFN_YB-TATA IL12_CD16 TACE 절단 부위_B7-1 TM	A2	SV40: 5-7	ZF5-7	P65	돌연변이체 62

명칭	서열번호	서열
에스트로겐 수용체 (아미노산 서열)	1	MTMTLHTKASGMALLHQIQGNELEPLNRPQLKIPLERPLGEVYLDSSKPAVYNYPEGAAYEFNAAAAANAQVYGQTGLPYGPGSEAAAFGSNGLGGFPPLNSVSPSPLMLLHPPPQLSPFLQPHGQQVPYYLENEPSGYTVREAGPPAFYRPNSDNRRQGGRERLASTNDKGSMAMESAKETRYCAVCNDYASGYHYGVWSCEGCKAFFKRSIQGHNDYMCPATNQCTIDKNRRKSCQACRLRKCYEVGMMKGGIRKDRRGGRMLKHKRQRDDGEGRGEVGSAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPGKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEMLDAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATV
ERT2 예시	2	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATV
ERT2 예시	3	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
펩티드 링커	4	GGGGSGGGGSGGGGSVDGF
펩티드 링커	5	ASGGGGSAS
징크 핑거 단백질 도메인 ZF10-1	6	SRPGERPFQCRICMRNFSRRHGLDRHTRTHTGEKPFQCRICMRNFSDHSSLKRHLRTHTGSQKPFQCRICMRNFSVRHNLTRHLRTHTGEKPFQCRICMRNFSDHSNLSRHLKTHTGSQKPFQCRICMRNFSQRSSLVRHLRTHTGEKPFQCRICMRNFSESGHLKRHLRTHLRGS
최소 프로모터; minP	7	AGAGGGTATATAATGGAAGCTCGACTTCCAG
NFkB 반응 요소 단백질 프로모터; 5x NFkB-RE	8	GGGAATTTCCGGGGACTTTCCGGGAATTTCCGGGGACTTTCCGGGAATTTCC
CREB 반응 요소 단백질 프로모터; 4x CRE	9	CACCAGACAGTGACGTCAGCTGCCAGATCCCATGGCCGTCATACTGTGACGTCTTTCAGACACCCCATTGACGTCAATGGGAGAA
NFAT 반응 요소 단백질 프로모터; 3x NFAT 결합 부위	10	GGAGGAAAAACTGTTTCATACAGAAGGCGTGGAGGAAAAACTGTTTCATACAGAAGGCGTGGAGGAAAAACTGTTTCATACAGAAGGCGT
SRF 반응 요소 단백질 프로모터; 5x SRE	11	AGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCTAGGATGTCCATATTAGGACATCT
SRF 반응 요소 단백질 프로모터 2; 5x SRF-RE	12	AGTATGTCCATATTAGGACATCTACCATGTCCATATTAGGACATCTACTATGTCCATATTAGGACATCTTGTATGTCCATATTAGGACATCTAAAATGTCCATATTAGGACATCT
AP1 반응 요소 단백질 프로모터; 6x AP1-RE	13	TGAGTCAGTGACTCAGTGAGTCAGTGACTCAGTGAGTCAGTGACTCAG
TCF-LEF 반응 요소 프로모터; 8x TCF-LEF-RE	14	AGATCAAAGGGTTTAAGATCAAAGGGCTTAAGATCAAAGGGTATAAGATCAAAGGGCCTAAGATCAAAGGGACTAAGATCAAAGGGTTTAAGATCAAAGGGCTTAAGATCAAAGGGCCTA
SBEx4	15	GTCTAGACGTCTAGACGTCTAGACGTCTAGAC
SMAD2/3 - CAGACA x4	16	CAGACACAGACACAGACACAGACA
STAT3 결합 부위	17	GGATCCGGTACTCGAGATCTGCGATCTAAGTAAGCTTGGCATTCCGGTACTGTTGGTAAAGCCAC
CMV	18	GTTGACATTGATTATTGACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTGATGCGGTTTTGGCAGTACATCAATGGGCGTGGATAGCGGTTTGACTCACGGGGATTTCCAAGTCTCCACCCCATTGACGTCAATGGGAGTTTGTTTTGGCACCAAAATCAACGGGACTTTCCAAAATGTCGTAACAACTCCGCCCCATTGACGCAAATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTC
EF1a	19	GGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGCCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGACCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGTCCTCGCGCCGCCGTGTATCGCCCCGCCCCGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGTCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA
EFS	20	GGATCTGCGATCGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGCTGAAGCTTCGAGGGGCTCGCATCTCTCCTTCACGCGCCCGCCGCCCTACCTGAGGCCGCCATCCACGCCGGTTGAGTCGCGTTCTGCCGCCTCCCGCCTGTGGTGCCTCCTGAACTGCGTCCGCCGTCTAGGTAAGTTTAAAGCTCAGGTCGAGACCGGGCCTTTGTCCGGCGCTCCCTTGGAGCCTACCTAGACTCAGCCGGCTCTCCACGCTTTGCCTGACCCTGCTTGCTCAACTCTACGTCTTTGTTTCGTTTTCTGTTCTGCGCCGTTACAGATCCAAGCTGTGACCGGCGCCTAC
MND	21	TTTATTTAGTCTCCAGAAAAAGGGGGGAATGAAAGACCCCACCTGTAGGTTTGGCAAGCTAGGATCAAGGTTAGGAACAGAGAGACAGCAGAATATGGGCCAAACAGGATATCTGTGGTAAGCAGTTCCTGCCCCGGCTCAGGGCCAAGAACAGTTGGAACAGCAGAATATGGGCCAAACAGGATATCTGTGGTAAGCAGTTCCTGCCCCGGCTCAGGGCCAAGAACAGATGGTCCCCAGATGCGGTCCCGCCCTCAGCAGTTTCTAGAGAACCATCAGATGTTTCCAGGGTGCCCCAAGGACCTGAAATGACCCTGTGCCTTATTTGAACTAACCAATCAGTTCGCTTCTCGCTTCTGTTCGCGCGCTTCTGCTCCCCGAGCTCAATAAAAGAGCCCA
PGK	22	GGGGTTGGGGTTGCGCCTTTTCCAAGGCAGCCCTGGGTTTGCGCAGGGACGCGGCTGCTCTGGGCGTGGTTCCGGGAAACGCAGCGGCGCCGACCCTGGGTCTCGCACATTCTTCACGTCCGTTCGCAGCGTCACCCGGATCTTCGCCGCTACCCTTGTGGGCCCCCCGGCGACGCTTCCTGCTCCGCCCCTAAGTCGGGAAGGTTCCTTGCGGTTCGCGGCGTGCCGGACGTGACAAACGGAAGCCGCACGTCTCACTAGTACCCTCGCAGACGGACAGCGCCAGGGAGCAATGGCAGCGCGCCGACCGCGATGGGCTGTGGCCAATAGCGGCTGCTCAGCGGGGCGCGCCGAGAGCAGCGGCCGGGAAGGGGCGGTGCGGGAGGCGGGGTGTGGGGCGGTAGTGTGGGCCCTGTTCCTGCCCGCGCGGTGTTCCGCATTCTGCAAGCCTCCGGAGCGCACGTCGGCAGTCGGCTCCCTCGTTGACCGAATCACCGACCTCTCTCCCCAG
SFFV	23	GTAACGCCATTTTGCAAGGCATGGAAAAATACCAAACCAAGAATAGAGAAGTTCAGATCAAGGGCGGGTACATGAAAATAGCTAACGTTGGGCCAAACAGGATATCTGCGGTGAGCAGTTTCGGCCCCGGCCCGGGGCCAAGAACAGATGGTCACCGCAGTTTCGGCCCCGGCCCGAGGCCAAGAACAGATGGTCCCCAGATATGGCCCAACCCTCAGCAGTTTCTTAAGACCCATCAGATGTTTCCAGGCTCCCCCAAGGACCTGAAATGACCCTGCGCCTTATTTGAATTAACCAATCAGCCTGCTTCTCGCTTCTGTTCGCGCGCTTCTGCTTCCCGAGCTCTATAAAAGAGCTCACAACCCCTCACTCGGCGCGCCAGTCCTCCGACAGACTGAGTCGCCCGGG
SV40	24	CTGTGGAATGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAAAGCT
UbC	25	GCGCCGGGTTTTGGCGCCTCCCGCGGGCGCCCCCCTCCTCACGGCGAGCGCTGCCACGTCAGACGAAGGGCGCAGGAGCGTTCCTGATCCTTCCGCCCGGACGCTCAGGACAGCGGCCCGCTGCTCATAAGACTCGGCCTTAGAACCCCAGTATCAGCAGAAGGACATTTTAGGACGGGACTTGGGTGACTCTAGGGCACTGGTTTTCTTTCCAGAGAGCGGAACAGGCGAGGAAAAGTAGTCCCTTCTCGGCGATTCTGCGGAGGGATCTCCGTGGGGCGGTGAACGCCGATGATTATATAAGGACGCGCCGGGTGTGGCACAGCTAGTTCCGTCGCAGCCGGGATTTGGGTCGCGGTTCTTGTTTGTGGATCGCTGTGATCGTCACTTGGTGAGTTGCGGGCTGCTGGGCTGGCCGGGGCTTTCGTGGCCGCCGGGCCGCTCGGTGGGACGGAAGCGTGTGGAGAGACCGCCAAGGGCTGTAGTCTGGGTCCGCGAGCAAGGTTGCCCTGAACTGGGGGTTGGGGGGAGCGCACAAAATGGCGGCTGTTCCCGAGTCTTGAATGGAAGACGCTTGTAAGGCGGGCTGTGAGGTCGTTGAAACAAGGTGGGGGGCATGGTGGGCGGCAAGAACCCAAGGTCTTGAGGCCTTCGCTAATGCGGGAAAGCTCTTATTCGGGTGAGATGGGCTGGGGCACCATCTGGGGACCCTGACGTGAAGTTTGTCACTGACTGGAGAACTCGGGTTTGTCGTCTGGTTGCGGGGGCGGCAGTTATGCGGTGCCGTTGGGCAGTGCACCCGTACCTTTGGGAGCGCGCGCCTCGTCGTGTCGTGACGTCACCCGTTCTGTTGGCTTATAATGCAGGGTGGGGCCACCTGCCGGTAGGTGTGCGGTAGGCTTTTCTCCGTCGCAGGACGCAGGGTTCGGGCCTAGGGTAGGCTCTCCTGAATCGACAGGCGCCGGACCTCTGGTGAGGGGAGGGATAAGTGAGGCGTCAGTTTCTTTGGTCGGTTTTATGTACCTATCTTCTTAAGTAGCTGAAGCTCCGGTTTTGAACTATGCGCTCGGGGTTGGCGAGTGTGTTTTGTGAAGTTTTTTAGGCACCTTTTGAAATGTAATCATTTGGGTCAATATGTAATTTTCAGTGTTAGACTAGTAAAGCTTCTGCAGGTCGACTCTAGAAAATTGTCCGCTAAATTCTGGCCGTTTTTGGCTTTTTTGTTAGAC
hEF1aV1	26	GGCTCCGGTGCCCGTCAGTGGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAGGTAAGTGCCGTGTGTGGTTCCCGCGGGCCTGGCCTCTTTACGGGTTATGGCCCTTGCGTGCCTTGAATTACTTCCACCTGGCTGCAGTACGTGATTCTTGATCCCGAGCTTCGGGTTGGAAGTGGGTGGGAGAGTTCGAGGCCTTGCGCTTAAGGAGCCCCTTCGCCTCGTGCTTGAGTTGAGGCCTGGCCTGGGCGCTGGGGCCGCCGCGTGCGAATCTGGTGGCACCTTCGCGCCTGTCTCGCTGCTTTCGATAAGTCTCTAGCCATTTAAAATTTTTGATGACCTGCTGCGACGCTTTTTTTCTGGCAAGATAGTCTTGTAAATGCGGGCCAAGATCTGCACACTGGTATTTCGGTTTTTGGGGCCGCGGGCGGCGACGGGGCCCGTGCGTCCCAGCGCACATGTTCGGCGAGGCGGGGCCTGCGAGCGCGGCCACCGAGAATCGGACGGGGGTAGTCTCAAGCTGGCCGGCCTGCTCTGGTGCCTGGTCTCGCGCCGCCGTGTATCGCCCCGCCCTGGGCGGCAAGGCTGGCCCGGTCGGCACCAGTTGCGTGAGCGGAAAGATGGCCGCTTCCCGGCCCTGCTGCAGGGAGCTCAAAATGGAGGACGCGGCGCTCGGGAGAGCGGGCGGGTGAGTCACCCACACAAAGGAAAAGGGCCTTTCCGTCCTCAGCCGTCGCTTCATGTGACTCCACGGAGTACCGGGCGCCGTCCAGGCACCTCGATTAGTTCTCGAGCTTTTGGAGTACGTCGTCTTTAGGTTGGGGGGAGGGGTTTTATGCGATGGAGTTTCCCCACACTGAGTGGGTGGAGACTGAAGTTAGGCCAGCTTGGCACTTGATGTAATTCTCCTTGGAATTTGCCCTTTTTGAGTTTGGATCTTGGTTCATTCTCAAGCCTCAGACAGTGGTTCAAAGTTTTTTTCTTCCATTTCAGGTGTCGTGA
hCAGG	27	ACTAGTTATTAATAGTAATCAATTACGGGGTCATTAGTTCATAGCCCATATATGGAGTTCCGCGTTACATAACTTACGGTAAATGGCCCGCCTGGCTGACCGCCCAACGACCCCCGCCCATTGACGTCAATAATGACGTATGTTCCCATAGTAACGCCAATAGGGACTTTCCATTGACGTCAATGGGTGGAGTATTTACGGTAAACTGCCCACTTGGCAGTACATCAAGTGTATCATATGCCAAGTACGCCCCCTATTGACGTCAATGACGGTAAATGGCCCGCCTGGCATTATGCCCAGTACATGACCTTATGGGACTTTCCTACTTGGCAGTACATCTACGTATTAGTCATCGCTATTACCATGGTCGAGGTGAGCCCCACGTTCTGCTTCACTCTCCCCATCTCCCCCCCCTCCCCACCCCCAATTTTGTATTTATTTATTTTTTAATTATTTTGTGCAGCGATGGGGGCGGGGGGGGGGGGGGGGCGCGCGCCAGGCGGGGCGGGGCGGGGCGAGGGGCGGGGCGGGGCGAGGCGGAGAGGTGCGGCGGCAGCCAATCAGAGCGGCGCGCTCCGAAAGTTTCCTTTTATGGCGAGGCGGCGGCGGCGGCGGCCCTATAAAAAGCGAAGCGCGCGGCGGGCGGGGAGTCGCTGCGACGCTGCCTTCGCCCCGTGCCCCGCTCCGCCGCCGCCTCGCGCCGCCCGCCCCGGCTCTGACTGACCGCGTTACTCCCACAGGTGAGCGGGCGGGACGGCCCTTCTCCTCCGGGCTGTAATTAGCGCTTGGTTTAATGACGGCTTGTTTCTTTTCTGTGGCTGCGTGAAAGCCTTGAGGGGCTCCGGGAGGGCCCTTTGTGCGGGGGGAGCGGCTCGGGGGGTGCGTGCGTGTGTGTGTGCGTGGGGAGCGCCGCGTGCGGCTCCGCGCTGCCCGGCGGCTGTGAGCGCTGCGGGCGCGGCGCGGGGCTTTGTGCGCTCCGCAGTGTGCGCGAGGGGAGCGCGGCCGGGGGCGGTGCCCCGCGGTGCGGGGGGGGCTGCGAGGGGAACAAAGGCTGCGTGCGGGGTGTGTGCGTGGGGGGGTGAGCAGGGGGTGTGGGCGCGTCGGTCGGGCTGCAACCCCCCCTGCACCCCCCTCCCCGAGTTGCTGAGCACGGCCCGGCTTCGGGTGCGGGGCTCCGTACGGGGCGTGGCGCGGGGCTCGCCGTGCCGGGCGGGGGGTGGCGGCAGGTGGGGGTGCCGGGCGGGGCGGGGCCGCCTCGGGCCGGGGAGGGCTCGGGGGAGGGGCGCGGCGGCCCCCGGAGCGCCGGCGGCTGTCGAGGCGCGGCGAGCCGCAGCCATTGCCTTTTATGGTAATCGTGCGAGAGGGCGCAGGGACTTCCTTTGTCCCAAATCTGTGCGGAGCCGAAATCTGGGAGGCGCCGCCGCACCCCCTCTAGCGGGCGCGGGGCGAAGCGGTGCGGCGCCGGCAGGAAGGAAATGGGCGGGGAGGGCCTTCGTGCGTCGCCGCGCCGCCGTCCCCTTCTCCCTCTCCAGCCTCGGGGCTGTCCGCGGGGGGACGGCTGCCTTCGGGGGGGACGGGGCAGGGCGGGGTTCGGCTTCTGGCGTGTGACCGGCGGCTCTAGAGCCTCTGCTAACCATGTTCATGCCTTCTTCTTTTTCCTACAGCTCCTGGGCAACGTGCTGGTTATTGTGCTGTCTCATCATTTTGGCAAAGAATTC
hEF1aV2	28	GGGCAGAGCGCACATCGCCCACAGTCCCCGAGAAGTTGGGGGGAGGGGTCGGCAATTGAACCGGTGCCTAGAGAAGGTGGCGCGGGGTAAACTGGGAAAGTGATGTCGTGTACTGGCTCCGCCTTTTTCCCGAGGGTGGGGGAGAACCGTATATAAGTGCAGTAGTCGCCGTGAACGTTCTTTTTCGCAACGGGTTTGCCGCCAGAACACAG
hACTb	29	CCACTAGTTCCATGTCCTTATATGGACTCATCTTTGCCTATTGCGACACACACTCAATGAACACCTACTACGCGCTGCAAAGAGCCCCGCAGGCCTGAGGTGCCCCCACCTCACCACTCTTCCTATTTTTGTGTAAAAATCCAGCTTCTTGTCACCACCTCCAAGGAGGGGGAGGAGGAGGAAGGCAGGTTCCTCTAGGCTGAGCCGAATGCCCCTCTGTGGTCCCACGCCACTGATCGCTGCATGCCCACCACCTGGGTACACACAGTCTGTGATTCCCGGAGCAGAACGGACCCTGCCCACCCGGTCTTGTGTGCTACTCAGTGGACAGACCCAAGGCAAGAAAGGGTGACAAGGACAGGGTCTTCCCAGGCTGGCTTTGAGTTCCTAGCACCGCCCCGCCCCCAATCCTCTGTGGCACATGGAGTCTTGGTCCCCAGAGTCCCCCAGCGGCCTCCAGATGGTCTGGGAGGGCAGTTCAGCTGTGGCTGCGCATAGCAGACATACAACGGACGGTGGGCCCAGACCCAGGCTGTGTAGACCCAGCCCCCCCGCCCCGCAGTGCCTAGGTCACCCACTAACGCCCCAGGCCTGGTCTTGGCTGGGCGTGACTGTTACCCTCAAAAGCAGGCAGCTCCAGGGTAAAAGGTGCCCTGCCCTGTAGAGCCCACCTTCCTTCCCAGGGCTGCGGCTGGGTAGGTTTGTAGCCTTCATCACGGGCCACCTCCAGCCACTGGACCGCTGGCCCCTGCCCTGTCCTGGGGAGTGTGGTCCTGCGACTTCTAAGTGGCCGCAAGCCACCTGACTCCCCCAACACCACACTCTACCTCTCAAGCCCAGGTCTCTCCCTAGTGACCCACCCAGCACATTTAGCTAGCTGAGCCCCACAGCCAGAGGTCCTCAGGCCCTGCTTTCAGGGCAGTTGCTCTGAAGTCGGCAAGGGGGAGTGACTGCCTGGCCACTCCATGCCCTCCAAGAGCTCCTTCTGCAGGAGCGTACAGAACCCAGGGCCCTGGCACCCGTGCAGACCCTGGCCCACCCCACCTGGGCGCTCAGTGCCCAAGAGATGTCCACACCTAGGATGTCCCGCGGTGGGTGGGGGGCCCGAGAGACGGGCAGGCCGGGGGCAGGCCTGGCCATGCGGGGCCGAACCGGGCACTGCCCAGCGTGGGGCGCGGGGGCCACGGCGCGCGCCCCCAGCCCCCGGGCCCAGCACCCCAAGGCGGCCAACGCCAAAACTCTCCCTCCTCCTCTTCCTCAATCTCGCTCTCGCTCTTTTTTTTTTTCGCAAAAGGAGGGGAGAGGGGGTAAAAAAATGCTGCACTGTGCGGCGAAGCCGGTGAGTGAGCGGCGCGGGGCCAATCAGCGTGCGCCGTTCCGAAAGTTGCCTTTTATGGCTCGAGCGGCCGCGGCGGCGCCCTATAAAACCCAGCGGCGCGACGCGCCACCACCGCCGAGACCGCGTCCGCCCCGCGAGCACAGAGCCTCGCCTTTGCCGATCCGCCGCCCGTCCACACCCGCCGCCAGGTAAGCCCGGCCAGCCGACCGGGGCAGGCGGCTCACGGCCCGGCCGCAGGCGGCCGCGGCCCCTTCGCCCGTGCAGAGCCGCCGTCTGGGCCGCAGCGGGGGGCGCATGGGGGGGGAACCGGACCGCCGTGGGGGGCGCGGGAGAAGCCCCTGGGCCTCCGGAGATGGGGGACACCCCACGCCAGTTCGGAGGCGCGAGGCCGCGCTCGGGAGGCGCGCTCCGGGGGTGCCGCTCTCGGGGCGGGGGCAACCGGCGGGGTCTTTGTCTGAGCCGGGCTCTTGCCAATGGGGATCGCAGGGTGGGCGCGGCGGAGCCCCCGCCAGGCCCGGTGGGGGCTGGGGCGCCATTGCGCGTGCGCGCTGGTCCTTTGGGCGCTAACTGCGTGCGCGCTGGGAATTGGCGCTAATTGCGCGTGCGCGCTGGGACTCAAGGCGCTAACTGCGCGTGCGTTCTGGGGCCCGGGGTGCCGCGGCCTGGGCTGGGGCGAAGGCGGGCTCGGCCGGAAGGGGTGGGGTCGCCGCGGCTCCCGGGCGCTTGCGCGCACTTCCTGCCCGAGCCGCTGGCCGCCCGAGGGTGTGGCCGCTGCGTGCGCGCGCGCCGACCCGGCGCTGTTTGAACCGGGCGGAGGCGGGGCTGGCGCCCGGTTGGGAGGGGGTTGGGGCCTGGCTTCCTGCCGCGCGCCGCGGGGACGCCTCCGACCAGTGTTTGCCTTTTATGGTAATAACGCGGCCGGCCCGGCTTCCTTTGTCCCCAATCTGGGCGCGCGCCGGCGCCCCCTGGCGGCCTAAGGACTCGGCGCGCCGGAAGTGGCCAGGGCGGGGGCGACCTCGGCTCACAGCGCGCCCGGCTAT
heIF4A1	30	GTTGATTTCCTTCATCCCTGGCACACGTCCAGGCAGTGTCGAATCCATCTCTGCTACAGGGGAAAACAAATAACATTTGAGTCCAGTGGAGACCGGGAGCAGAAGTAAAGGGAAGTGATAACCCCCAGAGCCCGGAAGCCTCTGGAGGCTGAGACCTCGCCCCCCTTGCGTGATAGGGCCTACGGAGCCACATGACCAAGGCACTGTCGCCTCCGCACGTGTGAGAGTGCAGGGCCCCAAGATGGCTGCCAGGCCTCGAGGCCTGACTCTTCTATGTCACTTCCGTACCGGCGAGAAAGGCGGGCCCTCCAGCCAATGAGGCTGCGGGGCGGGCCTTCACCTTGATAGGCACTCGAGTTATCCAATGGTGCCTGCGGGCCGGAGCGACTAGGAACTAACGTCATGCCGAGTTGCTGAGCGCCGGCAGGCGGGGCCGGGGCGGCCAAACCAATGCGATGGCCGGGGCGGAGTCGGGCGCTCTATAAGTTGTCGATAGGCGGGCACTCCGCCCTAGTTTCTAAGGACCATG
hGAPDH	31	AGTTCCCCAACTTTCCCGCCTCTCAGCCTTTGAAAGAAAGAAAGGGGAGGGGGCAGGCCGCGTGCAGTCGCGAGCGGTGCTGGGCTCCGGCTCCAATTCCCCATCTCAGTCGCTCCCAAAGTCCTTCTGTTTCATCCAAGCGTGTAAGGGTCCCCGTCCTTGACTCCCTAGTGTCCTGCTGCCCACAGTCCAGTCCTGGGAACCAGCACCGATCACCTCCCATCGGGCCAATCTCAGTCCCTTCCCCCCTACGTCGGGGCCCACACGCTCGGTGCGTGCCCAGTTGAACCAGGCGGCTGCGGAAAAAAAAAAGCGGGGAGAAAGTAGGGCCCGGCTACTAGCGGTTTTACGGGCGCACGTAGCTCAGGCCTCAAGACCTTGGGCTGGGACTGGCTGAGCCTGGCGGGAGGCGGGGTCCGAGTCACCGCCTGCCGCCGCGCCCCCGGTTTCTATAAATTGAGCCCGCAGCCTCCCGCTTCGCTCTCTGCTCCTCCTGTTCGACAGTCAGCCGCATCTTCTTTTGCGTCGCCAGGTGAAGACGGGCGGAGAGAAACCCGGGAGGCTAGGGACGGCCTGAAGGCGGCAGGGGCGGGCGCAGGCCGGATGTGTTCGCGCCGCTGCGGGGTGGGCCCGGGCGGCCTCCGCATTGCAGGGGCGGGCGGAGGACGTGATGCGGCGCGGGCTGGGCATGGAGGCCTGGTGGGGGAGGGGAGGGGAGGCGTGGGTGTCGGCCGGGGCCACTAGGCGCTCACTGTTCTCTCCCTCCGCGCAGCCGAGCCACATCGCTGAGACAC
hGRP78	32	AGTGCGGTTACCAGCGGAAATGCCTCGGGGTCAGAAGTCGCAGGAGAGATAGACAGCTGCTGAACCAATGGGACCAGCGGATGGGGCGGATGTTATCTACCATTGGTGAACGTTAGAAACGAATAGCAGCCAATGAATCAGCTGGGGGGGCGGAGCAGTGACGTTTATTGCGGAGGGGGCCGCTTCGAATCGGCGGCGGCCAGCTTGGTGGCCTGGGCCAATGAACGGCCTCCAACGAGCAGGGCCTTCACCAATCGGCGGCCTCCACGACGGGGCTGGGGGAGGGTATATAAGCCGAGTAGGCGACGGTGAGGTCGACGCCGGCCAAGACAGCACAGACAGATTGACCTATTGGGGTGTTTCGCGAGTGTGAGAGGGAAGCGCCGCGGCCTGTATTTCTAGACCTGCCCTTCGCCTGGTTCGTGGCGCCTTGTGACCCCGGGCCCCTGCCGCCTGCAAGTCGGAAATTGCGCTGTGCTCCTGTGCTACGGCCTGTGGCTGGACTGCCTGCTGCTGCCCAACTGGCTGGCAC
hGRP94	33	TAGTTTCATCACCACCGCCACCCCCCCGCCCCCCCGCCATCTGAAAGGGTTCTAGGGGATTTGCAACCTCTCTCGTGTGTTTCTTCTTTCCGAGAAGCGCCGCCACACGAGAAAGCTGGCCGCGAAAGTCGTGCTGGAATCACTTCCAACGAAACCCCAGGCATAGATGGGAAAGGGTGAAGAACACGTTGCCATGGCTACCGTTTCCCCGGTCACGGAATAAACGCTCTCTAGGATCCGGAAGTAGTTCCGCCGCGACCTCTCTAAAAGGATGGATGTGTTCTCTGCTTACATTCATTGGACGTTTTCCCTTAGAGGCCAAGGCCGCCCAGGCAAAGGGGCGGTCCCACGCGTGAGGGGCCCGCGGAGCCATTTGATTGGAGAAAAGCTGCAAACCCTGACCAATCGGAAGGAGCCACGCTTCGGGCATCGGTCACCGCACCTGGACAGCTCCGATTGGTGGACTTCCGCCCCCCCTCACGAATCCTCATTGGGTGCCGTGGGTGCGTGGTGCGGCGCGATTGGTGGGTTCATGTTTCCCGTCCCCCGCCCGCGAGAAGTGGGGGTGAAAAGCGGCCCGACCTGCTTGGGGTGTAGTGGGCGGACCGCGCGGCTGGAGGTGTGAGGATCCGAACCCAGGGGTGGGGGGTGGAGGCGGCTCCTGCGATCGAAGGGGACTTGAGACTCACCGGCCGCACGTC
hHSP70	34	GGGCCGCCCACTCCCCCTTCCTCTCAGGGTCCCTGTCCCCTCCAGTGAATCCCAGAAGACTCTGGAGAGTTCTGAGCAGGGGGCGGCACTCTGGCCTCTGATTGGTCCAAGGAAGGCTGGGGGGCAGGACGGGAGGCGAAAACCCTGGAATATTCCCGACCTGGCAGCCTCATCGAGCTCGGTGATTGGCTCAGAAGGGAAAAGGCGGGTCTCCGTGACGACTTATAAAAGCCCAGGGGCAAGCGGTCCGGATAACGGCTAGCCTGAGGAGCTGCTGCGACAGTCCACTACCTTTTTCGAGAGTGACTCCCGTTGTCCCAAGGCTTCCCAGAGCGAACCTGTGCGGCTGCAGGCACCGGCGCGTCGAGTTTCCGGCGTCCGGAAGGACCGAGCTCTTCTCGCGGATCCAGTGTTCCGTTTCCAGCCCCCAATCTCAGAGCGGAGCCGACAGAGAGCAGGGAACCC
hKINb	35	GCCCCACCCCCGTCCGCGTTACAACCGGGAGGCCCGCTGGGTCCTGCACCGTCACCCTCCTCCCTGTGACCGCCCACCTGATACCCAAACAACTTTCTCGCCCCTCCAGTCCCCAGCTCGCCGAGCGCTTGCGGGGAGCCACCCAGCCTCAGTTTCCCCAGCCCCGGGCGGGGCGAGGGGCGATGACGTCATGCCGGCGCGCGGCATTGTGGGGCGGGGCGAGGCGGGGCGCCGGGGGGAGCAACACTGAGACGCCATTTTCGGCGGCGGGAGCGGCGCAGGCGGCCGAGCGGGACTGGCTGGGTCGGCTGGGCTGCTGGTGCGAGGAGCCGCGGGGCTGTGCTCGGCGGCCAAGGGGACAGCGCGTGGGTGGCCGAGGATGCTGCGGGGCGGTAGCTCCGGCGCCCCTCGCTGGTGACTGCTGCGCCGTGCCTCACACAGCCGAGGCGGGCTCGGCGCACAGTCGCTGCTCCGCGCTCGCGCCCGGCGGCGCTCCAGGTGCTGACAGCGCGAGAGAGCGCGGCCTCAGGAGCAACAC
hUBIb	36	TTCCAGAGCTTTCGAGGAAGGTTTCTTCAACTCAAATTCATCCGCCTGATAATTTTCTTATATTTTCCTAAAGAAGGAAGAGAAGCGCATAGAGGAGAAGGGAAATAATTTTTTAGGAGCCTTTCTTACGGCTATGAGGAATTTGGGGCTCAGTTGAAAAGCCTAAACTGCCTCTCGGGAGGTTGGGCGCGGCGAACTACTTTCAGCGGCGCACGGAGACGGCGTCTACGTGAGGGGTGATAAGTGACGCAACACTCGTTGCATAAATTTGCGCTCCGCCAGCCCGGAGCATTTAGGGGCGGTTGGCTTTGTTGGGTGAGCTTGTTTGTGTCCCTGTGGGTGGACGTGGTTGGTGATTGGCAGGATCCTGGTATCCGCTAACAGGTACTGGCCCACAGCCGTAAAGACCTGCGGGGGCGTGAGAGGGGGGAATGGGTGAGGTCAAGCTGGAGGCTTCTTGGGGTTGGGTGGGCCGCTGAGGGGAGGGGAGGGCGAGGTGACGCGACACCCGGCCTTTCTGGGAGAGTGGGCCTTGTTGACCTAAGGGGGGCGAGGGCAGTTGGCACGCGCACGCGCCGACAGAAACTAACAGACATTAACCAACAGCGATTCCGTCGCGTTTACTTGGGAGGAAGGCGGAAAAGAGGTAGTTTGTGTGGCTTCTGGAAACCCTAAATTTGGAATCCCAGTATGAGAATGGTGTCCCTTCTTGTGTTTCAATGGGATTTTTACTTCGCGAGTCTTGTGGGTTTGGTTTTGTTTTCAGTTTGCCTAACACCGTGCTTAGGTTTGAGGCAGATTGGAGTTCGGTCGGGGGAGTTTGAATATCCGGAACAGTTAGTGGGGAAAGCTGTGGACGCTTGGTAAGAGAGCGCTCTGGATTTTCCGCTGTTGACGTTGAAACCTTGAATGACGAATTTCGTATTAAGTGACTTAGCCTTGTAAAATTGAGGGGAGGCTTGCGGAATATTAACGTATTTAAGGCATTTTGAAGGAATAGTTGCTAATTTTGAAGAATATTAGGTGTAAAAGCAAGAAATACAATGATCCTGAGGTGACACGCTTATGTTTTACTTTTAAACTAGGTCACC
ZF 결합 부위	37	cgggtttcgtaacaatcgcatgaggattcgcaacgccttcGGCGTAGCCGATGTCGCGctcccgtctcagtaaaggtcGGCGTAGCCGATGTCGCGcaatcggactgccttcgtacGGCGTAGCCGATGTCGCGcgtatcagtcgcctcggaacGGCGTAGCCGATGTCGCGcattcgtaagaggctcactctcccttacacggagtggataACTAGTTCTAGAGGGTATATAATGGGGGCCA
예시적인 WPRE	38	TCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTAATGCCTCTGTATCATGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCGGGGAAGCTGACGTCCTTTCCATGGCTGCTCGCCTGTGTTGCCAACTGGATCCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCTCTCAATCCAGCGGACCTCCCTTCCCGAGGCCTTCTGCCGGTTCTGCGGCCTCTCCCGCGTCTTCGCTTTCGGCCTCCGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCCTGTTTCGCCTCGGCGTCCGGTCCGTGTTGCTTGGTCGTCACCTGTGCAGAATTGCGAACCATGGATTCCA
예시적인 WPRE	39	TCTGTTCCTGTTAATCAACCTCTGGATTACAAAATTTGTGAAAGATTGACTGATATTCTTAACTATGTTGCTCCTTTTACGCTGTGTGGATATGCTGCTTTAATGCCTCTGTATCATGCTATTGCTTCCCGTACGGCTTTCGTTTTCTCCTCCTTGTATAAATCCTGGTTGCTGTCTCTTTATGAGGAGTTGTGGCCCGTTGTCCGTCAACGTGGCGTGGTGTGCTCTGTGTTTGCTGACGCAACCCCCACTGGCTGGGGCATTGCCACCACCTGTCAACTCCTTTCTGGGACTTTCGCTTTCCCCCTCCCGATCGCCACGGCAGAACTCATCGCCGCCTGCCTTGCCCGCTGCTGGACAGGGGCTAGGTTGCTGGGCACTGATAATTCCGTGGTGTTGTCGGGGAAATCATCGTCCTTTCCTTGGCTGCTCGCCTGTGTTGCCAACTGGATCCTGCGCGGGACGTCCTTCTGCTACGTCCCTTCGGCTCTCAATCCAGCGGACCTCCCTTCCCGAGGCCTTCTGCCGGTTCTGCGGCCTCTCCCGCGTCTTCGCTTTCGGCCTCCGACGAGTCGGATCTCCCTTTGGGCCGCCTCCCCGCCTGTTTCGCCTCGGCGTCCGGTCCGTGTTGCTTGGTCGTCACCTGTGCAGAATTGCGAACCATGGATTCCA
SB03422 야생형	40	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06136 rld.ERT2.돌연변이체.81 L384M / L391V / N413D / M421L / S463P / H524L	41	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGVVWRSMEHPVKLLFAPNLLLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06138 rld.ERT2.돌연변이체.93 L384M / L391V / N413D / M421L / S463P / H524L	42	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGLVWRSMEHPVKLLFAPNLVLDRDQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06139 rld.ERT2.돌연변이체.86 L354I / L384M / L391V / S463P	43	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGVVWRSMEHPVKLLFAPNLLLDRNQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEHLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06140 rld.ERT2.돌연변이체.95 L354I / L384M / L409V / N413D / M421L / S463P / H524F	44	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGLVWRSMEHPVKLLFAPNLVLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06141 rld.ERT2.돌연변이체.88 L391V / N413D / Q414E / S463P / H524F	45	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLLLDRDEGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06142 rld.ERT2.돌연변이체.77 L354I / L391V / N413D / M421L / S463P / M517A / H524L	46	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLLLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHASNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06143 rld.ERT2.돌연변이체49 L391V / Q414E / M421L / S463P / H524F	47	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLLLDRNEGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06144 rld.ERT2.돌연변이.58 L354I / L409V / N413D / M421L / H524L	48	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLVLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06145 rld.ERT2.돌연변이체.62 L409V / N413D / Q414E / M421L / S463P / H524L	49	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLVLDRDEGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06146 rld.ERT2.돌연변이체.63 L354I / L391V / N413D / Q414E / M421L / M517A / H524F	50	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLLLDRDEGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHASNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06147 rld.ERT2.돌연변이체.55 L354I / L409V / M421L / S463P / H524L	51	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLVLDRNQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06149 rld.ERT2.돌연변이체.41 L354I / L391V / L409V / N413D / Q414E / H524L	52	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLVLDRDEGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06150 rld.ERT2.돌연변이.43 Q414E / S463P / H524L	53	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLLLDRNEGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06151 rld.ERT2.돌연변이체.46 L384M / L391V / L409V / N413D / M421L / S463P / M517A / H524F	54	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGVVWRSMEHPVKLLFAPNLVLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHASNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
SB06152 rld.ERT2.돌연변이체.40 L384M / L391V / N413D / H524F	55	SAGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGVVWRSMEHPVKLLFAPNLLLDRDQGKCVEGMVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLSSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMEFLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPATA
4X ZF5 BD + YB-TATA 최소 (Syn 프로모터)	56	cgggtttcgtaacaatcgcatgaggattcgcaacgcctttGAAGCAGTCGACGCCGAAgtcccgtctcagtaaaggttGAAGCAGTCGACGCCGAAgaatcggactgccttcgtatGAAGCAGTCGACGCCGAAggtatcagtcgcctcggaatGAAGCAGTCGACGCCGAAgattcgtaagaggctcactctcccttacacggagtggataACTAGTTCTAGAGGGTATATAATGGGGGCCA
IL-12	57	ATGTGCCATCAGCAACTCGTCATCTCCTGGTTCTCCCTTGTGTTCCTCGCTTCCCCTCTGGTCGCCATTTGGGAACTGAAGAAGGACGTCTACGTGGTCGAGCTGGATTGGTACCCGGACGCCCCTGGAGAAATGGTCGTGCTGACTTGCGATACGCCAGAAGAGGACGGCATAACCTGGACCCTGGATCAGAGCTCCGAGGTGCTCGGAAGCGGAAAGACCCTGACCATTCAAGTCAAGGAGTTCGGCGACGCGGGCCAGTACACTTGCCACAAGGGTGGCGAAGTGCTGTCCCACTCCCTGCTGCTGCTGCACAAGAAAGAGGATGGAATCTGGTCCACTGACATCCTCAAGGACCAAAAAGAACCGAAGAACAAGACCTTCCTCCGCTGCGAAGCCAAGAACTACAGCGGTCGGTTCACCTGTTGGTGGCTGACGACAATCTCCACCGACCTGACTTTCTCCGTGAAGTCGTCACGGGGATCAAGCGATCCTCAGGGCGTGACCTGTGGAGCCGCCACTCTGTCCGCCGAGAGAGTCAGGGGAGACAACAAGGAATATGAGTACTCCGTGGAATGCCAGGAGGACAGCGCCTGCCCTGCCGCGGAAGAGTCCCTGCCTATCGAGGTCATGGTCGATGCCGTGCATAAGCTGAAATACGAGAACTACACTTCCTCCTTCTTTATCCGCGACATCATCAAGCCTGACCCCCCCAAGAACTTGCAGCTGAAGCCACTCAAGAACTCCCGCCAAGTGGAAGTGTCTTGGGAATATCCAGACACTTGGAGCACCCCGCACTCATACTTCTCGCTCACTTTCTGTGTGCAAGTGCAGGGAAAGTCCAAACGGGAGAAGAAAGACCGGGTGTTCACCGACAAAACCTCCGCCACTGTGATTTGTCGGAAGAACGCGTCAATCAGCGTCCGGGCGCAGGATAGATACTACTCGTCCTCCTGGAGCGAATGGGCCAGCGTGCCTTGTTCCGGTGGCGGATCAGGCGGAGGTTCAGGAGGAGGCTCCGGAGGAGGTTCCCGGAACCTCCCTGTGGCAACCCCCGACCCTGGAATGTTCCCGTGCCTACACCACTCCCAAAACCTCCTGAGGGCTGTGTCGAACATGTTGCAGAAGGCCCGCCAGACCCTTGAGTTCTACCCCTGCACCTCGGAAGAAATTGATCACGAGGACATCACCAAGGACAAGACCTCGACCGTGGAAGCCTGCCTGCCGCTGGAACTGACCAAGAACGAATCGTGTCTGAACTCCCGCGAGACAAGCTTTATCACTAACGGCAGCTGCCTGGCGTCGAGAAAGACCTCATTCATGATGGCGCTCTGTCTTTCCTCGATCTACGAAGATCTGAAGATGTATCAGGTCGAGTTCAAGACCATGAACGCCAAGCTGCTCATGGACCCGAAGCGGCAGATCTTCCTGGACCAGAATATGCTCGCCGTGATTGATGAACTGATGCAGGCCCTGAATTTCAACTCCGAGACTGTGCCTCAAAAGTCCAGCCTGGAAGAACCGGACTTCTACAAGACCAAGATCAAGCTGTGCATCCTGTTGCACGCTTTCCGCATTCGAGCCGTGACCATTGACCGCGTGATGTCCTACCTGAACGCCAGT
IL-12	58	MCHQQLVISWFSLVFLASPLVAIWELKKDVYVVELDWYPDAPGEMVVLTCDTPEEDGITWTLDQSSEVLGSGKTLTIQVKEFGDAGQYTCHKGGEVLSHSLLLLHKKEDGIWSTDILKDQKEPKNKTFLRCEAKNYSGRFTCWWLTTISTDLTFSVKSSRGSSDPQGVTCGAATLSAERVRGDNKEYEYSVECQEDSACPAAEESLPIEVMVDAVHKLKYENYTSSFFIRDIIKPDPPKNLQLKPLKNSRQVEVSWEYPDTWSTPHSYFSLTFCVQVQGKSKREKKDRVFTDKTSATVICRKNASISVRAQDRYYSSSWSEWASVPCSGGGSGGGSGGGSGGGSRNLPVATPDPGMFPCLHHSQNLLRAVSNMLQKARQTLEFYPCTSEEIDHEDITKDKTSTVEACLPLELTKNESCLNSRETSFITNGSCLASRKTSFMMALCLSSIYEDLKMYQVEFKTMNAKLLMDPKRQIFLDQNMLAVIDELMQALNFNSETVPQKSSLEEPDFYKTKIKLCILLHAFRIRAVTIDRVMSYLNAS
AU/SLDE (데스타블리자티-온 도메인)	59	ATTTATTTATTTATTTATTTAacatcggttccCTGTTTAATATTTAAACAG
A2 (절연체)	60	AGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGT
ZF5-7 DBD(ZF DNA BD)	61	ATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCT
ZF5-7 DBD(ZF DNA BD)	62	MSRPGERPFQCRICMRNFSNMSNLTRHTRTHTGEKPFQCRICMRNFSDRSVLRRHLRTHTGSQKPFQCRICMRNFSDPSNLARHTRTHTGEKPFQCRICMRNFSDRSSLRRHLRTHTGSQKPFQCRICMRNFSQSGTLHRHTRTHTGEKPFQCRICMRNFSQRPNLTRHLRTHLRGS
P65(전사 활성인자)	63	GATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCC
P65(전사 활성인자) AA	64	DEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS
돌연변이체 81 (ERT 돌연변이체)	65	gctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGATGGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccaca
돌연변이체 81(ERT 돌연변이체)	66	AGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWMEILMIGVVWRSMEHPVKLLFAPNLLLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPAT
SB07123 벡터	67	aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCTGTTTAAATATTAAACAGggaaccgatgtTAAATAAATAAATAAATAAATGTTTAAACTAGAGTCGCGGCCTCAGTCAGTCACGCATGCCTGCAGTttaACTGGCGTTCAGGTAGGACATCACGCGGTCAATGGTCACGGCTCGAATGCGGAAAGCGTGCAACAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCCGGTTCTTCCAGGCTGGACTTTTGAGGCACAGTCTCGGAGTTGAAATTCAGGGCCTGCATCAGTTCATCAATCACGGCGAGCATATTCTGGTCCAGGAAGATCTGCCGCTTCGGGTCCATGAGCAGCTTGGCGTTCATGGTCTTGAACTCGACCTGATACATCTTCAGATCTTCGTAGATCGAGGAAAGACAGAGCGCCATCATGAATGAGGTCTTTCTCGACGCCAGGCAGCTGCCGTTAGTGATAAAGCTTGTCTCGCGGGAGTTCAGACACGATTCGTTCTTGGTCAGTTCCAGCGGCAGGCAGGCTTCCACGGTCGAGGTCTTGTCCTTGGTGATGTCCTCGTGATCAATTTCTTCCGAGGTGCAGGGGTAGAACTCAAGGGTCTGGCGGGCCTTCTGCAACATGTTCGACACAGCCCTCAGGAGGTTTTGGGAGTGGTGTAGGCACGGGAACATTCCAGGGTCGGGGGTTGCCACAGGGAGGTTCCGGGAACCTCCTCCGGAGCCTCCTCCTGAACCTCCGCCTGATCCGCCACCGGAACAAGGCACGCTGGCCCATTCGCTCCAGGAGGACGAGTAGTATCTATCCTGCGCCCGGACGCTGATTGACGCGTTCTTCCGACAAATCACAGTGGCGGAGGTTTTGTCGGTGAACACCCGGTCTTTCTTCTCCCGTTTGGACTTTCCCTGCACTTGCACACAGAAAGTGAGCGAGAAGTATGAGTGCGGGGTGCTCCAAGTGTCTGGATATTCCCAAGACACTTCCACTTGGCGGGAGTTCTTGAGTGGCTTCAGCTGCAAGTTCTTGGGGGGGTCAGGCTTGATGATGTCGCGGATAAAGAAGGAGGAAGTGTAGTTCTCGTATTTCAGCTTATGCACGGCATCGACCATGACCTCGATAGGCAGGGACTCTTCCGCGGCAGGGCAGGCGCTGTCCTCCTGGCATTCCACGGAGTACTCATATTCCTTGTTGTCTCCCCTGACTCTCTCGGCGGACAGAGTGGCGGCTCCACAGGTCACGCCCTGAGGATCGCTTGATCCCCGTGACGACTTCACGGAGAAAGTCAGGTCGGTGGAGATTGTCGTCAGCCACCAACAGGTGAACCGACCGCTGTAGTTCTTGGCTTCGCAGCGGAGGAAGGTCTTGTTCTTCGGTTCTTTTTGGTCCTTGAGGATGTCAGTGGACCAGATTCCATCCTCTTTCTTGTGCAGCAGCAGCAGGGAGTGGGACAGCACTTCGCCACCCTTGTGGCAAGTGTACTGGCCCGCGTCGCCGAACTCCTTGACTTGAATGGTCAGGGTCTTTCCGCTTCCGAGCACCTCGGAGCTCTGATCCAGGGTCCAGGTTATGCCGTCCTCTTCTGGCGTATCGCAAGTCAGCACGACCATTTCTCCAGGGGCGTCCGGGTACCAATCCAGCTCGACCACGTAGACGTCCTTCTTCAGTTCCCAAATGGCGACCAGAGGGGAAGCGAGGAACACAAGGGAGAACCAGGAGATGACGAGTTGCTGATGGCACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcagtaacgccattttgcaaggcatggaaaaataccaaaccaagaatagagaagttcagatcaagggcgggtacatgaaaatagctaacgttgggccaaacaggatatctgcggtgagcagtttcggccccggcccggggccaagaacagatggtcaccgcagtttcggccccggcccgaggccaagaacagatggtccccagatatggcccaaccctcagcagtttcttaagacccatcagatgtttccaggctcccccaaggacctgaaatgaccctgcgccttatttgaattaaccaatcagcctgcttctcgcttctgttcgcgcgcttctgcttcccgagctctataaaagagctcacaacccctcactcggcgcgccagtcctccgacagactgagtcgcccgggGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGATGGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc
돌연변이체 77 (ERT 돌연변이체)	68	gctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagATCGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACGCCAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccaca
돌연변이체 77 (ERT 돌연변이체)	69	AGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADREIVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGVVWRSMEHPVKLLFAPNLLLDRDQGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHASNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPAT
SB07129 벡터	70	aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCTGTTTAAATATTAAACAGggaaccgatgtTAAATAAATAAATAAATAAATGTTTAAACTAGAGTCGCGGCCTCAGTCAGTCACGCATGCCTGCAGTttaACTGGCGTTCAGGTAGGACATCACGCGGTCAATGGTCACGGCTCGAATGCGGAAAGCGTGCAACAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCCGGTTCTTCCAGGCTGGACTTTTGAGGCACAGTCTCGGAGTTGAAATTCAGGGCCTGCATCAGTTCATCAATCACGGCGAGCATATTCTGGTCCAGGAAGATCTGCCGCTTCGGGTCCATGAGCAGCTTGGCGTTCATGGTCTTGAACTCGACCTGATACATCTTCAGATCTTCGTAGATCGAGGAAAGACAGAGCGCCATCATGAATGAGGTCTTTCTCGACGCCAGGCAGCTGCCGTTAGTGATAAAGCTTGTCTCGCGGGAGTTCAGACACGATTCGTTCTTGGTCAGTTCCAGCGGCAGGCAGGCTTCCACGGTCGAGGTCTTGTCCTTGGTGATGTCCTCGTGATCAATTTCTTCCGAGGTGCAGGGGTAGAACTCAAGGGTCTGGCGGGCCTTCTGCAACATGTTCGACACAGCCCTCAGGAGGTTTTGGGAGTGGTGTAGGCACGGGAACATTCCAGGGTCGGGGGTTGCCACAGGGAGGTTCCGGGAACCTCCTCCGGAGCCTCCTCCTGAACCTCCGCCTGATCCGCCACCGGAACAAGGCACGCTGGCCCATTCGCTCCAGGAGGACGAGTAGTATCTATCCTGCGCCCGGACGCTGATTGACGCGTTCTTCCGACAAATCACAGTGGCGGAGGTTTTGTCGGTGAACACCCGGTCTTTCTTCTCCCGTTTGGACTTTCCCTGCACTTGCACACAGAAAGTGAGCGAGAAGTATGAGTGCGGGGTGCTCCAAGTGTCTGGATATTCCCAAGACACTTCCACTTGGCGGGAGTTCTTGAGTGGCTTCAGCTGCAAGTTCTTGGGGGGGTCAGGCTTGATGATGTCGCGGATAAAGAAGGAGGAAGTGTAGTTCTCGTATTTCAGCTTATGCACGGCATCGACCATGACCTCGATAGGCAGGGACTCTTCCGCGGCAGGGCAGGCGCTGTCCTCCTGGCATTCCACGGAGTACTCATATTCCTTGTTGTCTCCCCTGACTCTCTCGGCGGACAGAGTGGCGGCTCCACAGGTCACGCCCTGAGGATCGCTTGATCCCCGTGACGACTTCACGGAGAAAGTCAGGTCGGTGGAGATTGTCGTCAGCCACCAACAGGTGAACCGACCGCTGTAGTTCTTGGCTTCGCAGCGGAGGAAGGTCTTGTTCTTCGGTTCTTTTTGGTCCTTGAGGATGTCAGTGGACCAGATTCCATCCTCTTTCTTGTGCAGCAGCAGCAGGGAGTGGGACAGCACTTCGCCACCCTTGTGGCAAGTGTACTGGCCCGCGTCGCCGAACTCCTTGACTTGAATGGTCAGGGTCTTTCCGCTTCCGAGCACCTCGGAGCTCTGATCCAGGGTCCAGGTTATGCCGTCCTCTTCTGGCGTATCGCAAGTCAGCACGACCATTTCTCCAGGGGCGTCCGGGTACCAATCCAGCTCGACCACGTAGACGTCCTTCTTCAGTTCCCAAATGGCGACCAGAGGGGAAGCGAGGAACACAAGGGAGAACCAGGAGATGACGAGTTGCTGATGGCACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcagtaacgccattttgcaaggcatggaaaaataccaaaccaagaatagagaagttcagatcaagggcgggtacatgaaaatagctaacgttgggccaaacaggatatctgcggtgagcagtttcggccccggcccggggccaagaacagatggtcaccgcagtttcggccccggcccgaggccaagaacagatggtccccagatatggcccaaccctcagcagtttcttaagacccatcagatgtttccaggctcccccaaggacctgaaatgaccctgcgccttatttgaattaaccaatcagcctgcttctcgcttctgttcgcgcgcttctgcttcccgagctctataaaagagctcacaacccctcactcggcgcgccagtcctccgacagactgagtcgcccgggGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagATCGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACGCCAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc
돌연변이체 62 (ERT 돌연변이체)	71	gctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTCTCGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGGTGTTGGACAGGGACGAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccaca
돌연변이체 62 (ERT 돌연변이체)	72	AGDMRAANLWPSPLMIKRSKKNSLALSLTADQMVSALLDAEPPILYSEYDPTRPFSEASMMGLLTNLADRELVHMINWAKRVPGFVDLTLHDQVHLLECAWLEILMIGLVWRSMEHPVKLLFAPNLVLDRDEGKCVEGLVEIFDMLLATSSRFRMMNLQGEEFVCLKSIILLNSGVYTFLPSTLKSLEEKDHIHRVLDKITDTLIHLMAKAGLTLQQQHQRLAQLLLILSHIRHMSNKGMELLYSMKCKNVVPLYDLLLEAADAHRLHAPTSRGGASVEETDQSHLATAGSTSSHSLQKYYITGEAEGFPAT
SB07135 벡터	73	aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCTGTTTAAATATTAAACAGggaaccgatgtTAAATAAATAAATAAATAAATGTTTAAACTAGAGTCGCGGCCTCAGTCAGTCACGCATGCCTGCAGTttaACTGGCGTTCAGGTAGGACATCACGCGGTCAATGGTCACGGCTCGAATGCGGAAAGCGTGCAACAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCCGGTTCTTCCAGGCTGGACTTTTGAGGCACAGTCTCGGAGTTGAAATTCAGGGCCTGCATCAGTTCATCAATCACGGCGAGCATATTCTGGTCCAGGAAGATCTGCCGCTTCGGGTCCATGAGCAGCTTGGCGTTCATGGTCTTGAACTCGACCTGATACATCTTCAGATCTTCGTAGATCGAGGAAAGACAGAGCGCCATCATGAATGAGGTCTTTCTCGACGCCAGGCAGCTGCCGTTAGTGATAAAGCTTGTCTCGCGGGAGTTCAGACACGATTCGTTCTTGGTCAGTTCCAGCGGCAGGCAGGCTTCCACGGTCGAGGTCTTGTCCTTGGTGATGTCCTCGTGATCAATTTCTTCCGAGGTGCAGGGGTAGAACTCAAGGGTCTGGCGGGCCTTCTGCAACATGTTCGACACAGCCCTCAGGAGGTTTTGGGAGTGGTGTAGGCACGGGAACATTCCAGGGTCGGGGGTTGCCACAGGGAGGTTCCGGGAACCTCCTCCGGAGCCTCCTCCTGAACCTCCGCCTGATCCGCCACCGGAACAAGGCACGCTGGCCCATTCGCTCCAGGAGGACGAGTAGTATCTATCCTGCGCCCGGACGCTGATTGACGCGTTCTTCCGACAAATCACAGTGGCGGAGGTTTTGTCGGTGAACACCCGGTCTTTCTTCTCCCGTTTGGACTTTCCCTGCACTTGCACACAGAAAGTGAGCGAGAAGTATGAGTGCGGGGTGCTCCAAGTGTCTGGATATTCCCAAGACACTTCCACTTGGCGGGAGTTCTTGAGTGGCTTCAGCTGCAAGTTCTTGGGGGGGTCAGGCTTGATGATGTCGCGGATAAAGAAGGAGGAAGTGTAGTTCTCGTATTTCAGCTTATGCACGGCATCGACCATGACCTCGATAGGCAGGGACTCTTCCGCGGCAGGGCAGGCGCTGTCCTCCTGGCATTCCACGGAGTACTCATATTCCTTGTTGTCTCCCCTGACTCTCTCGGCGGACAGAGTGGCGGCTCCACAGGTCACGCCCTGAGGATCGCTTGATCCCCGTGACGACTTCACGGAGAAAGTCAGGTCGGTGGAGATTGTCGTCAGCCACCAACAGGTGAACCGACCGCTGTAGTTCTTGGCTTCGCAGCGGAGGAAGGTCTTGTTCTTCGGTTCTTTTTGGTCCTTGAGGATGTCAGTGGACCAGATTCCATCCTCTTTCTTGTGCAGCAGCAGCAGGGAGTGGGACAGCACTTCGCCACCCTTGTGGCAAGTGTACTGGCCCGCGTCGCCGAACTCCTTGACTTGAATGGTCAGGGTCTTTCCGCTTCCGAGCACCTCGGAGCTCTGATCCAGGGTCCAGGTTATGCCGTCCTCTTCTGGCGTATCGCAAGTCAGCACGACCATTTCTCCAGGGGCGTCCGGGTACCAATCCAGCTCGACCACGTAGACGTCCTTCTTCAGTTCCCAAATGGCGACCAGAGGGGAAGCGAGGAACACAAGGGAGAACCAGGAGATGACGAGTTGCTGATGGCACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcagtaacgccattttgcaaggcatggaaaaataccaaaccaagaatagagaagttcagatcaagggcgggtacatgaaaatagctaacgttgggccaaacaggatatctgcggtgagcagtttcggccccggcccggggccaagaacagatggtcaccgcagtttcggccccggcccgaggccaagaacagatggtccccagatatggcccaaccctcagcagtttcttaagacccatcagatgtttccaggctcccccaaggacctgaaatgaccctgcgccttatttgaattaaccaatcagcctgcttctcgcttctgttcgcgcgcttctgcttcccgagctctataaaagagctcacaacccctcactcggcgcgccagtcctccgacagactgagtcgcccgggGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTCTCGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGGTGTTGGACAGGGACGAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc
LR1 분할 N 용어 링커 + CD16Tace(절단 부위)	74	AGCGGCGGAGGTGGTAGCGGAGGCGGAGGATCTGGAATTACACAGGGACTCGCCGTGTCTACAATCTCCAGCTTCTTTGGTGGCGGTAGTGGCGGCGGTGGCAGTGGCGGTGGATCTCTTCAA
LR1 분할 N 용어 링커 + CD16Tace(절단 부위)	75	SGGGGSGGGGSGITQGLAVSTISSFFGGGSGGGGSGGGSLQ
B7-1(TM 도메인)	76	CTGCTGCCAAGCTGGGCCATCACACTGATCTCCGTGAACGGCATCTTCGTGATCTGTTGCCTGACCTACTGCTTCGCCCCTCGGTGCAGAGAGCGGAGAAGAAACGAACGGCTGCGGAGAGAATCTGTGCGGCCTGTG
B7-1(TM 도메인)	77	LLPSWAITLISVNGIFVICCLTYCFAPRCRERRRNERLRRESVRPV
SV40 프로모터	78	GTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAA
SB07127 벡터	79	aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCACAGGCCGCACAGATTCTCTCCGCAGCCGTTCGTTTCTTCTCCGCTCTCTGCACCGAGGGGCGAAGCAGTAGGTCAGGCAACAGATCACGAAGATGCCGTTCACGGAGATCAGTGTGATGGCCCAGCTTGGCAGCAGTTGAAGAGATCCACCGCCACTGCCACCGCCGCCACTACCGCCACCAAAGAAGCTGGAGATTGTAGACACGGCGAGTCCCTGTGTAATTCCAGATCCTCCGCCTCCGCTACCACCTCCGCCGCTAGAGGCGTTCAGGTAGCTCATCACTCTGTCGATGGTCACGGCTCTGATCCGGAAGGCGTGCAGCAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCGGGTTCTTCCAGGCTAGACTTCTGGGGCACTGTCTCGCTGTTGAAGTTCAGGGCCTGCATCAGCTCGTCGATCACGGCCAGCATATTCTGGTCCAGGAAGATCTGCCGCTTGGGGTCCATCAGCAGCTTGGCGTTCATGGTCTTGAATTCCACCTGGTACATCTTCAGGTCCTCGTAGATGCTGCTCAGGCACAGGGCCATCATGAAGGAGGTCTTTCTGCTGGCCAGGCAAGAGCCGTTGGTGATGAAGCTGGTTTCCCGGCTGTTCAGGCAGCTCTCGTTCTTGGTCAGTTCCAGAGGCAGGCAGGCTTCCACGGTGCTGGTCTTATCCTTGGTGATGTCCTCGTGGTCGATTTCCTCGCTGGTGCAGGGGTAGAATTCCAGGGTCTGTCTGGCCTTCTGCAGCATGTTGGACACGGCTCTCAGCAGGTTCTGGCTGTGGTGCAGACAAGGGAACATGCCAGGATCAGGAGTGGCCACAGGCAGGTTTCTAGATCCGCCGCCAGATCCACCACCTGATCCGCCACCGCTTCCTCCGCCAGAACATGGCACGCTGGCCCATTCGCTCCAAGAGCTGCTGTAGTACCGGTCCTGGGCTCTGACGCTGATGCTGGCGTTCTTTCTGCAGATCACGGTGGCGCTGGTCTTGTCGGTGAACACCCGGTCCTTTTTCTCGCGCTTGGACTTGCCCTGCACTTGCACGCAAAAGGTCAGGCTGAAGTAGCTGTGGGGTGTAGACCAGGTGTCGGGGTACTCCCAGGACACTTCCACCTGTCTGCTGTTCTTCAGAGGCTTCAGCTGCAGGTTCTTTGGAGGATCGGGCTTGATGATGTCCCGGATGAAAAAGCTGGAGGTGTAGTTCTCGTACTTCAGCTTGTGCACGGCGTCCACCATCACTTCGATAGGCAGAGACTCTTCGGCGGCTGGACAGGCGCTGTCCTCTTGGCATTCCACGCTGTACTCGTATTCTTTGTTGTCGCCCCGCACTCTTTCGGCAGACAGTGTAGCGGCGCCACATGTAACGCCCTGAGGATCACTGCTGCCTCTGCTGGACTTCACGCTGAAGGTCAGGTCGGTGCTGATGGTGGTCAGCCACCAACATGTGAACCGGCCGCTGTAGTTCTTGGCCTCGCATCTCAGGAAGGTCTTGTTCTTGGGCTCTTTCTGGTCCTTCAGGATGTCGGTGCTCCAAATGCCATCCTCTTTCTTGTGGAGCAGCAGCAGGCTGTGGCTCAGCACTTCTCCGCCTTTGTGACAGGTGTACTGGCCGGCGTCGCCAAACTCTTTCACTTGGATGGTCAGGGTCTTGCCGCTGCCGAGCACCTCGCTAGACTGATCCAGTGTCCAGGTGATGCCGTCCTCTTCAGGGGTATCGCAGGTCAGCACCACCATCTCGCCAGGAGCATCGGGATACCAGTCCAGTTCCACCACGTACACGTCTTTCTTCAGCTCCCAGATGGCCACCAGAGGAGAGGCCAGGAACACCAGGCTGAACCAGCTGATGACCAGCTGCTGGTGACACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcaGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGATGGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc
SB07133 벡터	80	aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCACAGGCCGCACAGATTCTCTCCGCAGCCGTTCGTTTCTTCTCCGCTCTCTGCACCGAGGGGCGAAGCAGTAGGTCAGGCAACAGATCACGAAGATGCCGTTCACGGAGATCAGTGTGATGGCCCAGCTTGGCAGCAGTTGAAGAGATCCACCGCCACTGCCACCGCCGCCACTACCGCCACCAAAGAAGCTGGAGATTGTAGACACGGCGAGTCCCTGTGTAATTCCAGATCCTCCGCCTCCGCTACCACCTCCGCCGCTAGAGGCGTTCAGGTAGCTCATCACTCTGTCGATGGTCACGGCTCTGATCCGGAAGGCGTGCAGCAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCGGGTTCTTCCAGGCTAGACTTCTGGGGCACTGTCTCGCTGTTGAAGTTCAGGGCCTGCATCAGCTCGTCGATCACGGCCAGCATATTCTGGTCCAGGAAGATCTGCCGCTTGGGGTCCATCAGCAGCTTGGCGTTCATGGTCTTGAATTCCACCTGGTACATCTTCAGGTCCTCGTAGATGCTGCTCAGGCACAGGGCCATCATGAAGGAGGTCTTTCTGCTGGCCAGGCAAGAGCCGTTGGTGATGAAGCTGGTTTCCCGGCTGTTCAGGCAGCTCTCGTTCTTGGTCAGTTCCAGAGGCAGGCAGGCTTCCACGGTGCTGGTCTTATCCTTGGTGATGTCCTCGTGGTCGATTTCCTCGCTGGTGCAGGGGTAGAATTCCAGGGTCTGTCTGGCCTTCTGCAGCATGTTGGACACGGCTCTCAGCAGGTTCTGGCTGTGGTGCAGACAAGGGAACATGCCAGGATCAGGAGTGGCCACAGGCAGGTTTCTAGATCCGCCGCCAGATCCACCACCTGATCCGCCACCGCTTCCTCCGCCAGAACATGGCACGCTGGCCCATTCGCTCCAAGAGCTGCTGTAGTACCGGTCCTGGGCTCTGACGCTGATGCTGGCGTTCTTTCTGCAGATCACGGTGGCGCTGGTCTTGTCGGTGAACACCCGGTCCTTTTTCTCGCGCTTGGACTTGCCCTGCACTTGCACGCAAAAGGTCAGGCTGAAGTAGCTGTGGGGTGTAGACCAGGTGTCGGGGTACTCCCAGGACACTTCCACCTGTCTGCTGTTCTTCAGAGGCTTCAGCTGCAGGTTCTTTGGAGGATCGGGCTTGATGATGTCCCGGATGAAAAAGCTGGAGGTGTAGTTCTCGTACTTCAGCTTGTGCACGGCGTCCACCATCACTTCGATAGGCAGAGACTCTTCGGCGGCTGGACAGGCGCTGTCCTCTTGGCATTCCACGCTGTACTCGTATTCTTTGTTGTCGCCCCGCACTCTTTCGGCAGACAGTGTAGCGGCGCCACATGTAACGCCCTGAGGATCACTGCTGCCTCTGCTGGACTTCACGCTGAAGGTCAGGTCGGTGCTGATGGTGGTCAGCCACCAACATGTGAACCGGCCGCTGTAGTTCTTGGCCTCGCATCTCAGGAAGGTCTTGTTCTTGGGCTCTTTCTGGTCCTTCAGGATGTCGGTGCTCCAAATGCCATCCTCTTTCTTGTGGAGCAGCAGCAGGCTGTGGCTCAGCACTTCTCCGCCTTTGTGACAGGTGTACTGGCCGGCGTCGCCAAACTCTTTCACTTGGATGGTCAGGGTCTTGCCGCTGCCGAGCACCTCGCTAGACTGATCCAGTGTCCAGGTGATGCCGTCCTCTTCAGGGGTATCGCAGGTCAGCACCACCATCTCGCCAGGAGCATCGGGATACCAGTCCAGTTCCACCACGTACACGTCTTTCTTCAGCTCCCAGATGGCCACCAGAGGAGAGGCCAGGAACACCAGGCTGAACCAGCTGATGACCAGCTGCTGGTGACACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcaGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagATCGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTGTGGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGCTCTTGGACAGGGACCAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACGCCAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc
SB07139 벡터	81	aagcttgaattcgagcttgcatgcctgcaggtcgttacataacttacggtaaatggcccgcctggctgaccgcccaacgacccccgcccattgacgtcaataatgacgtatgttcccatagtaacgccaatagggactttccattgacgtcaatgggtggagtatttacggtaaactgcccacttggcagtacatcaagtgtatcatatgccaagtacgccccctattgacgtcaatgacggtaaatggcccgcctggcattatgcccagtacatgaccttatgggactttcctacttggcagtacatctacgtattagtcatcgctattaccatggtgatgcggttttggcagtacatcaatgggcgtggatagcggtttgactcacggggatttccaagtctccaccccattgacgtcaatgggagtttgttttggcaccaaaatcaacgggactttccaaaatgtcgtaacaactccgccccattgacgcaaatgggcggtaggcgtgtacggtgggaggtctatataagcagagctcaataaaagagcccacaacccctcactcggcgcgccagtcctccgattgactgagtcgcccgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcatttgggggctcgtccgagatcgggagacccctgcccagggaccaccgacccaccaccgggaggtaagctggccagcaacttatctgtgtctgtccgattgtctagtgtctatgactgattttatgcgcctgcgtcggtactagttagctaactagctctgtatctggcggacccgtggtggaactgacgagttcggaacacccggccgcaaccctgggagacgtcccagggacttcgggggccgtttttgtggcccgacctgagtcctaaaatcccgatcgtttaggactctttggtgcaccccccttagaggagggatatgtggttctggtaggagacgagaacctaaaacagttcccgcctccgtctgaatttttgctttcggtttgggaccgaagccgcgccgcgcgtcttgtctgctgcagcatcgttctgtgttgtctctgtctgactgtgtttctgtatttgtctgaaaatatgggccccccctcgagtccccagcatgcctgctattctcttcccaatcctcccccttgctgtcctgccccaccccaccccccagaatagaatgacacctactcagacaatgcgatgcaatttcctcattttattaggaaaggacagtgggagtggcaccttccagggtcaaggaaggcacgggggaggggcaaacaacagatggctggcaactagaaggcacagttacttaCACAGGCCGCACAGATTCTCTCCGCAGCCGTTCGTTTCTTCTCCGCTCTCTGCACCGAGGGGCGAAGCAGTAGGTCAGGCAACAGATCACGAAGATGCCGTTCACGGAGATCAGTGTGATGGCCCAGCTTGGCAGCAGTTGAAGAGATCCACCGCCACTGCCACCGCCGCCACTACCGCCACCAAAGAAGCTGGAGATTGTAGACACGGCGAGTCCCTGTGTAATTCCAGATCCTCCGCCTCCGCTACCACCTCCGCCGCTAGAGGCGTTCAGGTAGCTCATCACTCTGTCGATGGTCACGGCTCTGATCCGGAAGGCGTGCAGCAGGATGCACAGCTTGATCTTGGTCTTGTAGAAGTCGGGTTCTTCCAGGCTAGACTTCTGGGGCACTGTCTCGCTGTTGAAGTTCAGGGCCTGCATCAGCTCGTCGATCACGGCCAGCATATTCTGGTCCAGGAAGATCTGCCGCTTGGGGTCCATCAGCAGCTTGGCGTTCATGGTCTTGAATTCCACCTGGTACATCTTCAGGTCCTCGTAGATGCTGCTCAGGCACAGGGCCATCATGAAGGAGGTCTTTCTGCTGGCCAGGCAAGAGCCGTTGGTGATGAAGCTGGTTTCCCGGCTGTTCAGGCAGCTCTCGTTCTTGGTCAGTTCCAGAGGCAGGCAGGCTTCCACGGTGCTGGTCTTATCCTTGGTGATGTCCTCGTGGTCGATTTCCTCGCTGGTGCAGGGGTAGAATTCCAGGGTCTGTCTGGCCTTCTGCAGCATGTTGGACACGGCTCTCAGCAGGTTCTGGCTGTGGTGCAGACAAGGGAACATGCCAGGATCAGGAGTGGCCACAGGCAGGTTTCTAGATCCGCCGCCAGATCCACCACCTGATCCGCCACCGCTTCCTCCGCCAGAACATGGCACGCTGGCCCATTCGCTCCAAGAGCTGCTGTAGTACCGGTCCTGGGCTCTGACGCTGATGCTGGCGTTCTTTCTGCAGATCACGGTGGCGCTGGTCTTGTCGGTGAACACCCGGTCCTTTTTCTCGCGCTTGGACTTGCCCTGCACTTGCACGCAAAAGGTCAGGCTGAAGTAGCTGTGGGGTGTAGACCAGGTGTCGGGGTACTCCCAGGACACTTCCACCTGTCTGCTGTTCTTCAGAGGCTTCAGCTGCAGGTTCTTTGGAGGATCGGGCTTGATGATGTCCCGGATGAAAAAGCTGGAGGTGTAGTTCTCGTACTTCAGCTTGTGCACGGCGTCCACCATCACTTCGATAGGCAGAGACTCTTCGGCGGCTGGACAGGCGCTGTCCTCTTGGCATTCCACGCTGTACTCGTATTCTTTGTTGTCGCCCCGCACTCTTTCGGCAGACAGTGTAGCGGCGCCACATGTAACGCCCTGAGGATCACTGCTGCCTCTGCTGGACTTCACGCTGAAGGTCAGGTCGGTGCTGATGGTGGTCAGCCACCAACATGTGAACCGGCCGCTGTAGTTCTTGGCCTCGCATCTCAGGAAGGTCTTGTTCTTGGGCTCTTTCTGGTCCTTCAGGATGTCGGTGCTCCAAATGCCATCCTCTTTCTTGTGGAGCAGCAGCAGGCTGTGGCTCAGCACTTCTCCGCCTTTGTGACAGGTGTACTGGCCGGCGTCGCCAAACTCTTTCACTTGGATGGTCAGGGTCTTGCCGCTGCCGAGCACCTCGCTAGACTGATCCAGTGTCCAGGTGATGCCGTCCTCTTCAGGGGTATCGCAGGTCAGCACCACCATCTCGCCAGGAGCATCGGGATACCAGTCCAGTTCCACCACGTACACGTCTTTCTTCAGCTCCCAGATGGCCACCAGAGGAGAGGCCAGGAACACCAGGCTGAACCAGCTGATGACCAGCTGCTGGTGACACATCATGGTGGCGACACCGGTACGCGTTGGCCCCCATTATATACCCTCTAGAACTAGTtatccactccgtgtaagggagagtgagcctcttacgaatcTTCGGCGTCGACTGCTTCattccgaggcgactgataccTTCGGCGTCGACTGCTTCatacgaaggcagtccgattcTTCGGCGTCGACTGCTTCaacctttactgagacgggacTTCGGCGTCGACTGCTTCaaaggcgttgcgaatcctcatgcgattgttacgaaacccgTTAATTAAAGAGCGAGATTCCGTCTCAAAGAAAAAAAAAGTAATGAAATGAATAAAATGAGTCCTAGAGCCAGTAAATGTCGTAAATGTCTCAGCTAGTCAGGTAGTAAAAGGTCTCAACTAGGCAGTGGCAGAGCAGGATTCAAATTCAGGGCTGTTGTGATGCCTCCGCAGACTCTGAGCGCCACCTGGTGGTAATTTGTCTGTGCCTCTTCTGACGTGGAAGAACAGCAACTAACACACTAACACGGCATTTACTATGGGCCAGCCATTGTCCATCTAGATGGccgataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagctgcaGTGTGTCAGTTAGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCAGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCTGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAGGATCCGCCACCATGTCTAGACCTGGCGAGAGGCCCTTCCAGTGCCGGATCTGCATGCGGAACTTCAGCAACATGAGCAACCTGACCAGACACACCCGGACACACACAGGCGAGAAGCCTTTTCAGTGCAGAATCTGTATGCGCAATTTCTCCGACAGAAGCGTGCTGCGGAGACACCTGAGAACCCACACCGGCAGCCAGAAACCATTCCAGTGTCGCATCTGTATGAGAAACTTTAGCGACCCCTCCAATCTGGCCCGGCACACCAGAACACATACCGGGGAAAAACCCTTTCAGTGTAGGATATGCATGAGGAATTTTTCCGACCGGTCCAGCCTGAGGCGGCACCTGAGGACACATACTGGCTCCCAAAAGCCGTTCCAATGTCGGATATGTATGCGCAACTTTAGCCAGAGCGGCACCCTGCACAGACACACAAGAACCCATACTGGCGAGAAACCTTTCCAATGTAGAATCTGCATGCGAAATTTTTCCCAGCGGCCTAATCTGACCAGGCATCTGAGGACCCACCTGAGAGGATCTaCCTGCAGGGATGAGTTTCCCACCATGGTGTTTCCTTCTGGGCAGATCAGCCAGGCCTCGGCCTTGGCCCCGGCCCCTCCCCAAGTCCTGCCCCAGGCTCCAGCCCCTGCCCCTGCTCCAGCCATGGTATCAGCTCTGGCCCAGGCCCCAGCCCCTGTCCCAGTCCTAGCCCCAGGCCCTCCTCAGGCTGTGGCCCCACCTGCCCCCAAGCCCACCCAGGCTGGGGAAGGAACGCTGTCAGAGGCCCTGCTGCAGCTGCAGTTTGATGATGAAGACCTGGGGGCCTTGCTTGGCAACAGCACAGACCCAGCTGTGTTCACAGACCTGGCATCCGTCGACAACTCCGAGTTTCAGCAGCTGCTGAACCAGGGCATACCTGTGGCCCCCCACACAACTGAGCCCATGCTGATGGAGTACCCTGAGGCTATAACTCGCCTAGTGACAGGGGCCCAGAGGCCCCCCGACCCAGCTCCTGCTCCACTGGGGGCCCCGGGGCTCCCCAATGGCCTCCTTTCAGGAGATGAAGACTTCTCCTCCATTGCGGACATGGACTTCTCAGCCCTGCTGAGTCAGATCAGCTCCcaattgtgcgtacgcggatcctctgctggagacatgagagctgccaacctttggccaagcccgctcatgatcaaacgctctaagaagaacagcctggccttgtccctgacggccgaccagatggtcagtgccttgttggatgctgagccccccatactctattccgagtatgatcctaccagacccttcagtgaagcttcgatgatgggcttactgaccaacctggcagacagggagCTGGTTCACATGATCAACTGGGCGAAGAGGGTGCCAGGCTTTGTGGATTTGACCCTCCATGATCAGGTCCACCTTCTAGAATGTGCCTGGCTAGAGATCCTGATGATTGGTCTCGTCTGGCGCTCCATGGAGCACCCAGTGAAGCTACTGTTTGCTCCTAACTTGGTGTTGGACAGGGACGAGGGAAAATGTGTAGAGGGCCTGGTGGAGATCTTCGACATGCTGCTGGCTACATCATCTCGGTTCCGCATGATGAATCTGCAGGGAGAGGAGTTTGTGTGCCTCAAATCTATTATTTTGCTTAATTCTGGAGTGTACACATTTCTGCCCAGCACCCTGAAGTCTCTGGAAGAGAAGGACCATATCCACCGAGTCCTGGACAAGATCACAGACACTTTGATCCACCTGATGGCCAAGGCAGGCCTGACCCTGCAGCAGCAGCACCAGCGGCTGGCCCAGCTCCTCCTCATCCTCTCCCACATCAGGCACATGAGTAACAAAGGCATGGAGCTGctgtacagcatgaagtgcaagaacgtggtgcccctctatGaCctgctgctggaggcggcggacgcccaccgcctacatgcgcccactagccgtggaggggcatccgtggaggagacggaccaaagccacttggccactgcgggctctacttcatcgcattccttgcaaaagtattacatcacgggggaggcagagggtttccctgccacaTaAGTCGACAATCAACCTCtggattacaaaatttgtgaaagattgactggtattcttaactatgttgctccttttacgctatgtggatacgctgctttaatgcctttgtatcatgctattgcttcccgtatggctttcattttctcctccttgtataaatcctggttgctgtctctttatgaggagttgtggcccgttgtcaggcaacgtggcgtggtgtgcactgtgtttgctgacgcaacccccactggttggggcattgccaccacctgtcagctcctttccgggactttcgctttccccctccctattgccacggcggaactcatcgccgcctgccttgcccgctgctggacaggggctcggctgttgggcactgacaattccgtggtgttgtcggggaaatcatcgtcctttccttggctgctcgcctgtgttgccacctggattctgcgcgggacgtccttctgctacgtcccttcggccctcaatccagcggaccttccttcccgcggcctgctgccggctctgcggcctcttccgcgtctacgccttcgccctcagacgagtcggatctccctttgggccgcctccccgcgatatcagtggtccaggctctagttttgactcaacaatatcaccagctgaagcctatagagtacgagccatagataaaataaaagattttatttagtctccagaaaaaggggggaatgaaagaccccacctgtaggtttggcaagctagcaataaaagagcccacaacccctcactcggggcgccagtcctccgattgactgagtcgcccggccgcttcgagcagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttaacaacaacaattgcattcattttatgtttcaggttcagggggagatgtgggaggttttttaaagcaagtaaaacctctacaaatgtggtaaaatcgataaggatcgggtacccgtgtatccaataaaccctcttgcagttgcatccgacttgtggtctcgctgttccttgggagggtctcctctgagtgattgactacccgtcagcgggggtctttcacacatgcagcatgtatcaaaattaatttggttttttttcttaagctgtgccttctagttgccagccatctgttgtttgcccctcccccgtgccttccttgaccctggaaggtgccactcccactgtcctttcctaataaaatgaggaaattgcatcgcattgtctgagtaggtgtcattctattctggggggtggggtggggcaggacagcaagggggaggattgggaagacaatagcaggcatgctggggatgcggtgggctctatggagatcccgcggtacctcgcgaatgcatctagatccaatggcctttttggcccagacatgataagatacattgatgagtttggacaaaccacaactagaatgcagtgaaaaaaatgctttatttgtgaaatttgtgatgctattgctttatttgtaaccattataagctgcaataaacaagttgcggccgcttagccctcccacacataaccagagggcagcaattcacgaatcccaactgccgtcggctgtccatcactgtccttcactatggctttgatcccaggatgcagatcgagaagcacctgtcggcaccgtccgcaggggctcaagatgcccctgttctcatttccgatcgcgacgatacaagtcaggttgccagctgccgcagcagcagcagtgcccagcaccacgagttctgcacaaggtcccccagtaaaatgatatacattgacaccagtgaagatgcggccgtcgctagagagagctgcgctggcgacgctgtagtcttcagagatggggatgctgttgattgtagccgttgctctttcaatgagggtggattcttcttgagacaaaggcttggccatgcggccgccgctcggtgttcgaggccacacgcgtcaccttaatatgcgaagtggacctcggaccgcgccgccccgactgcatctgcgtgttcgaattcgccaatgacaagacgctgggcggggtttgtgtcatcatagaactaaagacatgcaaatatatttcttccggggggtaccggcctttttggccATTGGatcggatctggccaaaaaggcccttaagtatttacattaaatggccatagtacttaaagttacattggcttccttgaaataaacatggagtattcagaatgtgtcataaatatttctaattttaagatagtatctccattggctttctactttttcttttatttttttttgtcctctgtcttccatttgttgttgttgttgtttgtttgtttgtttgttggttggttggttaatttttttttaaagatcctacactatagttcaagctagactattagctactctgtaacccagggtgaccttgaagtcatgggtagcctgctgttttagccttcccacatctaagattacaggtatgagctatcatttttggtatattgattgattgattgattgatgtgtgtgtgtgtgattgtgtttgtgtgtgtgaTtgtgTaTatgtgtgtatggTtgtgtgtgaTtgtgtgtatgtatgTTtgtgtgtgaTtgTgtgtgtgtgaTtgtgcatgtgtgtgtgtgtgaTtgtgtTtatgtgtatgaTtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgtgttgtgTaTaTatatttatggtagtgagagGcaacgctccggctcaggtgtcaggttggtttttgagacagagtctttcacttagcttggaattcactggccgtcgttttacaacgtcgtgactgggaaaaccctggcgttacccaacttaatcgccttgcagcacatccccctttcgccagctggcgtaatagcgaagaggcccgcaccgatcgcccttcccaacagttgcgcagcctgaatggcgaatggcgcctgatgcggtattttctccttacgcatctgtgcggtatttcacaccgcatatggtgcactctcagtacaatctgctctgatgccgcatagttaagccagccccgacacccgccaacacccgctgacgcgccctgacgggcttgtctgctcccggcatccgcttacagacaagctgtgaccgtctccgggagctgcatgtgtcagaggttttcaccgtcatcaccgaaacgcgcgagacgaaagggcctcgtgatacgcctatttttataggttaatgtcatgataataatggtttcttagacgtcaggtggcacttttcggggaaatgtgcgcggaacccctatttgtttatttttctaaatacattcaaatatgtatccgctcatgagacaataaccctgataaatgcttcaataatattgaaaaaggaagagtatgagtattcaacatttccgtgtcgcccttattcccttttttgcggcattttgccttcctgtttttgctcacccagaaacgctggtgaaagtaaaagatgctgaagatcagttgggtgcacgagtgggttacatcgaactggatctcaacagcggtaagatccttgagagttttcgccccgaagaacgttttccaatgatgagcacttttaaagttctgctatgtggcgcggtattatcccgtattgacgccgggcaagagcaactcggtcgccgcatacactattctcagaatgacttggttgagtactcaccagtcacagaaaagcatcttacggatggcatgacagtaagagaattatgcagtgctgccataaccatgagtgataacactgcggccaacttacttctgacaacgatcggaggaccgaaggagctaaccgcttttttgcacaacatgggggatcatgtaactcgccttgatcgttgggaaccggagctgaatgaagccataccaaacgacgagcgtgacaccacgatgcctgtagcaatggcaacaacgttgcgcaaactattaactggcgaactacttactctagcttcccggcaacaattaatagactggatggaggcggataaagttgcaggaccacttctgcgctcggcccttccggctggctggtttattgctgataaatctggagccggtgagcgtgggtctcgcggtatcattgcagcactggggccagatggtaagccctcccgtatcgtagttatctacacgacggggagtcaggcaactatggatgaacgaaatagacagatcgctgagataggtgcctcactgattaagcattggtaactgtcagaccaagtttactcatatatactttagattgatttaaaacttcatttttaatttaaaaggatctaggtgaagatcctttttgataatctcatgaccaaaatcccttaacgtgagttttcgttccactgagcgtcagaccccgtagaaaagatcaaaggatcttcttgagatcctttttttctgcgcgtaatctgctgcttgcaaacaaaaaaaccaccgctaccagcggtggtttgtttgccggatcaagagctaccaactctttttccgaaggtaactggcttcagcagagcgcagataccaaatactgtccttctagtgtagccgtagttaggccaccacttcaagaactctgtagcaccgcctacatacctcgctctgctaatcctgttaccagtggctgctgccagtggcgataagtcgtgtcttaccgggttggactcaagacgatagttaccggataaggcgcagcggtcgggctgaacggggggttcgtgcacacagcccagcttggagcgaacgacctacaccgaactgagatacctacagcgtgagctatgagaaagcgccacgcttcccgaagggagaaaggcggacaggtatccggtaagcggcagggtcggaacaggagagcgcacgagggagcttccagggggaaacgcctggtatctttatagtcctgtcgggtttcgccacctctgacttgagcgtcgatttttgtgatgctcgtcaggggggcggagcctatggaaaaacgccagcaacgcggcctttttacggttcctggccttttgctggccttttgctcacatgttctttcctgcgttatcccctgattctgtggataaccgtattaccgcctttgagtgagctgataccgctcgccgcagccgaacgaccgagcgcagcgagtcagtgagcgaggaagcggaagagcgcccaatacgcaaaccgcctctccccgcgcgttggccgattcattaatgcagctggcacgacaggtttcccgactggaaagcgggcagtgagcgcaacgcaattaatgtgagttagctcactcattaggcaccccaggctttacactttatgcttccggctcgtatgttgtgtggaattgtgagcggataacaatttcacacaggaaacagctatgaccatgattacgcc
WRPW 모티프	82	WRPW
IL-12	83	ATGTGTCACCAGCAGCTGGTCATCAGCTGGTTCAGCCTGGTGTTCCTGGCCTCTCCTCTGGTGGCCATCTGGGAGCTGAAGAAAGACGTGTACGTGGTGGAACTGGACTGGTATCCCGATGCTCCTGGCGAGATGGTGGTGCTGACCTGCGATACCCCTGAAGAGGACGGCATCACCTGGACACTGGATCAGTCTAGCGAGGTGCTCGGCAGCGGCAAGACCCTGACCATCCAAGTGAAAGAGTTTGGCGACGCCGGCCAGTACACCTGTCACAAAGGCGGAGAAGTGCTGAGCCACAGCCTGCTGCTGCTCCACAAGAAAGAGGATGGCATTTGGAGCACCGACATCCTGAAGGACCAGAAAGAGCCCAAGAACAAGACCTTCCTGAGATGCGAGGCCAAGAACTACAGCGGCCGGTTCACATGTTGGTGGCTGACCACCATCAGCACCGACCTGACCTTCAGCGTGAAGTCCAGCAGAGGCAGCAGTGATCCTCAGGGCGTTACATGTGGCGCCGCTACACTGTCTGCCGAAAGAGTGCGGGGCGACAACAAAGAATACGAGTACAGCGTGGAATGCCAAGAGGACAGCGCCTGTCCAGCCGCCGAAGAGTCTCTGCCTATCGAAGTGATGGTGGACGCCGTGCACAAGCTGAAGTACGAGAACTACACCTCCAGCTTTTTCATCCGGGACATCATCAAGCCCGATCCTCCAAAGAACCTGCAGCTGAAGCCTCTGAAGAACAGCAGACAGGTGGAAGTGTCCTGGGAGTACCCCGACACCTGGTCTACACCCCACAGCTACTTCAGCCTGACCTTTTGCGTGCAAGTGCAGGGCAAGTCCAAGCGCGAGAAAAAGGACCGGGTGTTCACCGACAAGACCAGCGCCACCGTGATCTGCAGAAAGAACGCCAGCATCAGCGTCAGAGCCCAGGACCGGTACTACAGCAGCTCTTGGAGCGAATGGGCCAGCGTGCCATGTTCTGGCGGAGGAAGCGGTGGCGGATCAGGTGGTGGATCTGGCGGCGGATCTAGAAACCTGCCTGTGGCCACTCCTGATCCTGGCATGTTCCCTTGTCTGCACCACAGCCAGAACCTGCTGAGAGCCGTGTCCAACATGCTGCAGAAGGCCAGACAGACCCTGGAATTCTACCCCTGCACCAGCGAGGAAATCGACCACGAGGACATCACCAAGGATAAGACCAGCACCGTGGAAGCCTGCCTGCCTCTGGAACTGACCAAGAACGAGAGCTGCCTGAACAGCCGGGAAACCAGCTTCATCACCAACGGCTCTTGCCTGGCCAGCAGAAAGACCTCCTTCATGATGGCCCTGTGCCTGAGCAGCATCTACGAGGACCTGAAGATGTACCAGGTGGAATTCAAGACCATGAACGCCAAGCTGCTGATGGACCCCAAGCGGCAGATCTTCCTGGACCAGAATATGCTGGCCGTGATCGACGAGCTGATGCAGGCCCTGAACTTCAACAGCGAGACAGTGCCCCAGAAGTCTAGCCTGGAAGAACCCGACTTCTACAAGACCAAGATCAAGC TGTGCATCCTGCTGCACGCCTTCCGGATCAGAGCCGTGACCATCGACAGAGTGATGAGCTACCTGAACGCCTCT

본 개시는 바람직한 구현예 및 다양한 대안적인 구현예를 참조하여 구체적으로 도시되고 설명되었지만, 관련 기술분야의 통상의 기술자는 본 개시 및 첨부된 청구범위의 사상 및 범위를 벗어나지 않고 형태 및 세부사항의 다양한 변경이 이루어질 수 있음을 이해할 것이다.

본 명세서의 본문 내에서 인용된 모든 참고문헌, 발행된 특허 및 특허 출원은 사실상 그 전체가 참조로 본원에 포함된다.

SEQUENCE LISTING <110> SENTI BIOSCIENCES, INC. <120> ERT2 MUTANTS AND USES THEREOF <130> STB-028WO <140> <141> <150> 63/171,227 <151> 2021-04-06 <160> 83 <170> PatentIn version 3.5 <210> 1 <211> 595 <212> PRT <213> Homo sapiens <400> 1 Met Thr Met Thr Leu His Thr Lys Ala Ser Gly Met Ala Leu Leu His 1 5 10 15 Gln Ile Gln Gly Asn Glu Leu Glu Pro Leu Asn Arg Pro Gln Leu Lys 20 25 30 Ile Pro Leu Glu Arg Pro Leu Gly Glu Val Tyr Leu Asp Ser Ser Lys 35 40 45 Pro Ala Val Tyr Asn Tyr Pro Glu Gly Ala Ala Tyr Glu Phe Asn Ala 50 55 60 Ala Ala Ala Ala Asn Ala Gln Val Tyr Gly Gln Thr Gly Leu Pro Tyr 65 70 75 80 Gly Pro Gly Ser Glu Ala Ala Ala Phe Gly Ser Asn Gly Leu Gly Gly 85 90 95 Phe Pro Pro Leu Asn Ser Val Ser Pro Ser Pro Leu Met Leu Leu His 100 105 110 Pro Pro Pro Gln Leu Ser Pro Phe Leu Gln Pro His Gly Gln Gln Val 115 120 125 Pro Tyr Tyr Leu Glu Asn Glu Pro Ser Gly Tyr Thr Val Arg Glu Ala 130 135 140 Gly Pro Pro Ala Phe Tyr Arg Pro Asn Ser Asp Asn Arg Arg Gln Gly 145 150 155 160 Gly Arg Glu Arg Leu Ala Ser Thr Asn Asp Lys Gly Ser Met Ala Met 165 170 175 Glu Ser Ala Lys Glu Thr Arg Tyr Cys Ala Val Cys Asn Asp Tyr Ala 180 185 190 Ser Gly Tyr His Tyr Gly Val Trp Ser Cys Glu Gly Cys Lys Ala Phe 195 200 205 Phe Lys Arg Ser Ile Gln Gly His Asn Asp Tyr Met Cys Pro Ala Thr 210 215 220 Asn Gln Cys Thr Ile Asp Lys Asn Arg Arg Lys Ser Cys Gln Ala Cys 225 230 235 240 Arg Leu Arg Lys Cys Tyr Glu Val Gly Met Met Lys Gly Gly Ile Arg 245 250 255 Lys Asp Arg Arg Gly Gly Arg Met Leu Lys His Lys Arg Gln Arg Asp 260 265 270 Asp Gly Glu Gly Arg Gly Glu Val Gly Ser Ala Gly Asp Met Arg Ala 275 280 285 Ala Asn Leu Trp Pro Ser Pro Leu Met Ile Lys Arg Ser Lys Lys Asn 290 295 300 Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln Met Val Ser Ala Leu Leu 305 310 315 320 Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu Tyr Asp Pro Thr Arg Pro 325 330 335 Phe Ser Glu Ala Ser Met Met Gly Leu Leu Thr Asn Leu Ala Asp Arg 340 345 350 Glu Leu Val His Met Ile Asn Trp Ala Lys Arg Val Pro Gly Phe Val 355 360 365 Asp Leu Thr Leu His Asp Gln Val His Leu Leu Glu Cys Ala Trp Leu 370 375 380 Glu Ile Leu Met Ile Gly Leu Val Trp Arg Ser Met Glu His Pro Gly 385 390 395 400 Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu Asp Arg Asn Gln Gly Lys 405 410 415 Cys Val Glu Gly Met Val Glu Ile Phe Asp Met Leu Leu Ala Thr Ser 420 425 430 Ser Arg Phe Arg Met Met Asn Leu Gln Gly Glu Glu Phe Val Cys Leu 435 440 445 Lys Ser Ile Ile Leu Leu Asn Ser Gly Val Tyr Thr Phe Leu Ser Ser 450 455 460 Thr Leu Lys Ser Leu Glu Glu Lys Asp His Ile His Arg Val Leu Asp 465 470 475 480 Lys Ile Thr Asp Thr Leu Ile His Leu Met Ala Lys Ala Gly Leu Thr 485 490 495 Leu Gln Gln Gln His Gln Arg Leu Ala Gln Leu Leu Leu Ile Leu Ser 500 505 510 His Ile Arg His Met Ser Asn Lys Gly Met Glu His Leu Tyr Ser Met 515 520 525 Lys Cys Lys Asn Val Val Pro Leu Tyr Asp Leu Leu Leu Glu Met Leu 530 535 540 Asp Ala His Arg Leu His Ala Pro Thr Ser Arg Gly Gly Ala Ser Val 545 550 555 560 Glu Glu Thr Asp Gln Ser His Leu Ala Thr Ala Gly Ser Thr Ser Ser 565 570 575 His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly Glu Ala Glu Gly Phe Pro 580 585 590 Ala Thr Val 595 <210> 2 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 2 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Val 305 310 <210> 3 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 3 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 4 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 4 Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Val 1 5 10 15 Asp Gly Phe <210> 5 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 5 Ala Ser Gly Gly Gly Gly Ser Ala Ser 1 5 <210> 6 <211> 176 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 6 Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg Asn 1 5 10 15 Phe Ser Arg Arg His Gly Leu Asp Arg His Thr Arg Thr His Thr Gly 20 25 30 Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp His 35 40 45 Ser Ser Leu Lys Arg His Leu Arg Thr His Thr Gly Ser Gln Lys Pro 50 55 60 Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Val Arg His Asn Leu 65 70 75 80 Thr Arg His Leu Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys Arg 85 90 95 Ile Cys Met Arg Asn Phe Ser Asp His Ser Asn Leu Ser Arg His Leu 100 105 110 Lys Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys Met 115 120 125 Arg Asn Phe Ser Gln Arg Ser Ser Leu Val Arg His Leu Arg Thr His 130 135 140 Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser 145 150 155 160 Glu Ser Gly His Leu Lys Arg His Leu Arg Thr His Leu Arg Gly Ser 165 170 175 <210> 7 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 7 agagggtata taatggaagc tcgacttcca g 31 <210> 8 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 8 gggaatttcc ggggactttc cgggaatttc cggggacttt ccgggaattt cc 52 <210> 9 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 9 caccagacag tgacgtcagc tgccagatcc catggccgtc atactgtgac gtctttcaga 60 caccccattg acgtcaatgg gagaa 85 <210> 10 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 10 ggaggaaaaa ctgtttcata cagaaggcgt ggaggaaaaa ctgtttcata cagaaggcgt 60 ggaggaaaaa ctgtttcata cagaaggcgt 90 <210> 11 <211> 115 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 11 aggatgtcca tattaggaca tctaggatgt ccatattagg acatctagga tgtccatatt 60 aggacatcta ggatgtccat attaggacat ctaggatgtc catattagga catct 115 <210> 12 <211> 115 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 12 agtatgtcca tattaggaca tctaccatgt ccatattagg acatctacta tgtccatatt 60 aggacatctt gtatgtccat attaggacat ctaaaatgtc catattagga catct 115 <210> 13 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 13 tgagtcagtg actcagtgag tcagtgactc agtgagtcag tgactcag 48 <210> 14 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 14 agatcaaagg gtttaagatc aaagggctta agatcaaagg gtataagatc aaagggccta 60 agatcaaagg gactaagatc aaagggttta agatcaaagg gcttaagatc aaagggccta 120 <210> 15 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 15 gtctagacgt ctagacgtct agacgtctag ac 32 <210> 16 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 16 cagacacaga cacagacaca gaca 24 <210> 17 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 17 ggatccggta ctcgagatct gcgatctaag taagcttggc attccggtac tgttggtaaa 60 gccac 65 <210> 18 <211> 588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 18 gttgacattg attattgact agttattaat agtaatcaat tacggggtca ttagttcata 60 gcccatatat ggagttccgc gttacataac ttacggtaaa tggcccgcct ggctgaccgc 120 ccaacgaccc ccgcccattg acgtcaataa tgacgtatgt tcccatagta acgccaatag 180 ggactttcca ttgacgtcaa tgggtggagt atttacggta aactgcccac ttggcagtac 240 atcaagtgta tcatatgcca agtacgcccc ctattgacgt caatgacggt aaatggcccg 300 cctggcatta tgcccagtac atgaccttat gggactttcc tacttggcag tacatctacg 360 tattagtcat cgctattacc atggtgatgc ggttttggca gtacatcaat gggcgtggat 420 agcggtttga ctcacgggga tttccaagtc tccaccccat tgacgtcaat gggagtttgt 480 tttggcacca aaatcaacgg gactttccaa aatgtcgtaa caactccgcc ccattgacgc 540 aaatgggcgg taggcgtgta cggtgggagg tctatataag cagagctc 588 <210> 19 <211> 1179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 19 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120 gatgccgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300 acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360 gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 420 cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480 ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540 caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 600 gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660 gcgcgaccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 720 gtcctcgcgc cgccgtgtat cgccccgccc cgggcggcaa ggctggcccg gtcggcacca 780 gttgcgtgag cggaaagatg gccgcttccc ggtcctgctg cagggagctc aaaatggagg 840 acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900 tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960 tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020 gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080 ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140 gtggttcaaa gtttttttct tccatttcag gtgtcgtga 1179 <210> 20 <211> 544 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 20 ggatctgcga tcgctccggt gcccgtcagt gggcagagcg cacatcgccc acagtccccg 60 agaagttggg gggaggggtc ggcaattgaa ccggtgccta gagaaggtgg cgcggggtaa 120 actgggaaag tgatgtcgtg tactggctcc gcctttttcc cgagggtggg ggagaaccgt 180 atataagtgc agtagtcgcc gtgaacgttc tttttcgcaa cgggtttgcc gccagaacac 240 agctgaagct tcgaggggct cgcatctctc cttcacgcgc ccgccgccct acctgaggcc 300 gccatccacg ccggttgagt cgcgttctgc cgcctcccgc ctgtggtgcc tcctgaactg 360 cgtccgccgt ctaggtaagt ttaaagctca ggtcgagacc gggcctttgt ccggcgctcc 420 cttggagcct acctagactc agccggctct ccacgctttg cctgaccctg cttgctcaac 480 tctacgtctt tgtttcgttt tctgttctgc gccgttacag atccaagctg tgaccggcgc 540 ctac 544 <210> 21 <211> 399 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 21 tttatttagt ctccagaaaa aggggggaat gaaagacccc acctgtaggt ttggcaagct 60 aggatcaagg ttaggaacag agagacagca gaatatgggc caaacaggat atctgtggta 120 agcagttcct gccccggctc agggccaaga acagttggaa cagcagaata tgggccaaac 180 aggatatctg tggtaagcag ttcctgcccc ggctcagggc caagaacaga tggtccccag 240 atgcggtccc gccctcagca gtttctagag aaccatcaga tgtttccagg gtgccccaag 300 gacctgaaat gaccctgtgc cttatttgaa ctaaccaatc agttcgcttc tcgcttctgt 360 tcgcgcgctt ctgctccccg agctcaataa aagagccca 399 <210> 22 <211> 511 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 22 ggggttgggg ttgcgccttt tccaaggcag ccctgggttt gcgcagggac gcggctgctc 60 tgggcgtggt tccgggaaac gcagcggcgc cgaccctggg tctcgcacat tcttcacgtc 120 cgttcgcagc gtcacccgga tcttcgccgc tacccttgtg ggccccccgg cgacgcttcc 180 tgctccgccc ctaagtcggg aaggttcctt gcggttcgcg gcgtgccgga cgtgacaaac 240 ggaagccgca cgtctcacta gtaccctcgc agacggacag cgccagggag caatggcagc 300 gcgccgaccg cgatgggctg tggccaatag cggctgctca gcggggcgcg ccgagagcag 360 cggccgggaa ggggcggtgc gggaggcggg gtgtggggcg gtagtgtggg ccctgttcct 420 gcccgcgcgg tgttccgcat tctgcaagcc tccggagcgc acgtcggcag tcggctccct 480 cgttgaccga atcaccgacc tctctcccca g 511 <210> 23 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 23 gtaacgccat tttgcaaggc atggaaaaat accaaaccaa gaatagagaa gttcagatca 60 agggcgggta catgaaaata gctaacgttg ggccaaacag gatatctgcg gtgagcagtt 120 tcggccccgg cccggggcca agaacagatg gtcaccgcag tttcggcccc ggcccgaggc 180 caagaacaga tggtccccag atatggccca accctcagca gtttcttaag acccatcaga 240 tgtttccagg ctcccccaag gacctgaaat gaccctgcgc cttatttgaa ttaaccaatc 300 agcctgcttc tcgcttctgt tcgcgcgctt ctgcttcccg agctctataa aagagctcac 360 aacccctcac tcggcgcgcc agtcctccga cagactgagt cgcccggg 408 <210> 24 <211> 344 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 24 ctgtggaatg tgtgtcagtt agggtgtgga aagtccccag gctccccagc aggcagaagt 60 atgcaaagca tgcatctcaa ttagtcagca accaggtgtg gaaagtcccc aggctcccca 120 gcaggcagaa gtatgcaaag catgcatctc aattagtcag caaccatagt cccgccccta 180 actccgccca tcccgcccct aactccgccc agttccgccc attctccgcc ccatggctga 240 ctaatttttt ttatttatgc agaggccgag gccgcctctg cctctgagct attccagaag 300 tagtgaggag gcttttttgg aggcctaggc ttttgcaaaa agct 344 <210> 25 <211> 1229 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 25 gcgccgggtt ttggcgcctc ccgcgggcgc ccccctcctc acggcgagcg ctgccacgtc 60 agacgaaggg cgcaggagcg ttcctgatcc ttccgcccgg acgctcagga cagcggcccg 120 ctgctcataa gactcggcct tagaacccca gtatcagcag aaggacattt taggacggga 180 cttgggtgac tctagggcac tggttttctt tccagagagc ggaacaggcg aggaaaagta 240 gtcccttctc ggcgattctg cggagggatc tccgtggggc ggtgaacgcc gatgattata 300 taaggacgcg ccgggtgtgg cacagctagt tccgtcgcag ccgggatttg ggtcgcggtt 360 cttgtttgtg gatcgctgtg atcgtcactt ggtgagttgc gggctgctgg gctggccggg 420 gctttcgtgg ccgccgggcc gctcggtggg acggaagcgt gtggagagac cgccaagggc 480 tgtagtctgg gtccgcgagc aaggttgccc tgaactgggg gttgggggga gcgcacaaaa 540 tggcggctgt tcccgagtct tgaatggaag acgcttgtaa ggcgggctgt gaggtcgttg 600 aaacaaggtg gggggcatgg tgggcggcaa gaacccaagg tcttgaggcc ttcgctaatg 660 cgggaaagct cttattcggg tgagatgggc tggggcacca tctggggacc ctgacgtgaa 720 gtttgtcact gactggagaa ctcgggtttg tcgtctggtt gcgggggcgg cagttatgcg 780 gtgccgttgg gcagtgcacc cgtacctttg ggagcgcgcg cctcgtcgtg tcgtgacgtc 840 acccgttctg ttggcttata atgcagggtg gggccacctg ccggtaggtg tgcggtaggc 900 ttttctccgt cgcaggacgc agggttcggg cctagggtag gctctcctga atcgacaggc 960 gccggacctc tggtgagggg agggataagt gaggcgtcag tttctttggt cggttttatg 1020 tacctatctt cttaagtagc tgaagctccg gttttgaact atgcgctcgg ggttggcgag 1080 tgtgttttgt gaagtttttt aggcaccttt tgaaatgtaa tcatttgggt caatatgtaa 1140 ttttcagtgt tagactagta aagcttctgc aggtcgactc tagaaaattg tccgctaaat 1200 tctggccgtt tttggctttt ttgttagac 1229 <210> 26 <211> 1179 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 26 ggctccggtg cccgtcagtg ggcagagcgc acatcgccca cagtccccga gaagttgggg 60 ggaggggtcg gcaattgaac cggtgcctag agaaggtggc gcggggtaaa ctgggaaagt 120 gatgtcgtgt actggctccg cctttttccc gagggtgggg gagaaccgta tataagtgca 180 gtagtcgccg tgaacgttct ttttcgcaac gggtttgccg ccagaacaca ggtaagtgcc 240 gtgtgtggtt cccgcgggcc tggcctcttt acgggttatg gcccttgcgt gccttgaatt 300 acttccacct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 360 gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 420 cctgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 480 ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 540 caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 600 gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 660 gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 720 ggtctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 780 gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 840 acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 900 tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 960 tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1020 gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1080 ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1140 gtggttcaaa gtttttttct tccatttcag gtgtcgtga 1179 <210> 27 <211> 1718 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 27 actagttatt aatagtaatc aattacgggg tcattagttc atagcccata tatggagttc 60 cgcgttacat aacttacggt aaatggcccg cctggctgac cgcccaacga cccccgccca 120 ttgacgtcaa taatgacgta tgttcccata gtaacgccaa tagggacttt ccattgacgt 180 caatgggtgg agtatttacg gtaaactgcc cacttggcag tacatcaagt gtatcatatg 240 ccaagtacgc cccctattga cgtcaatgac ggtaaatggc ccgcctggca ttatgcccag 300 tacatgacct tatgggactt tcctacttgg cagtacatct acgtattagt catcgctatt 360 accatggtcg aggtgagccc cacgttctgc ttcactctcc ccatctcccc cccctcccca 420 cccccaattt tgtatttatt tattttttaa ttattttgtg cagcgatggg ggcggggggg 480 gggggggggc gcgcgccagg cggggcgggg cggggcgagg ggcggggcgg ggcgaggcgg 540 agaggtgcgg cggcagccaa tcagagcggc gcgctccgaa agtttccttt tatggcgagg 600 cggcggcggc ggcggcccta taaaaagcga agcgcgcggc gggcggggag tcgctgcgac 660 gctgccttcg ccccgtgccc cgctccgccg ccgcctcgcg ccgcccgccc cggctctgac 720 tgaccgcgtt actcccacag gtgagcgggc gggacggccc ttctcctccg ggctgtaatt 780 agcgcttggt ttaatgacgg cttgtttctt ttctgtggct gcgtgaaagc cttgaggggc 840 tccgggaggg ccctttgtgc ggggggagcg gctcgggggg tgcgtgcgtg tgtgtgtgcg 900 tggggagcgc cgcgtgcggc tccgcgctgc ccggcggctg tgagcgctgc gggcgcggcg 960 cggggctttg tgcgctccgc agtgtgcgcg aggggagcgc ggccgggggc ggtgccccgc 1020 ggtgcggggg gggctgcgag gggaacaaag gctgcgtgcg gggtgtgtgc gtgggggggt 1080 gagcaggggg tgtgggcgcg tcggtcgggc tgcaaccccc cctgcacccc cctccccgag 1140 ttgctgagca cggcccggct tcgggtgcgg ggctccgtac ggggcgtggc gcggggctcg 1200 ccgtgccggg cggggggtgg cggcaggtgg gggtgccggg cggggcgggg ccgcctcggg 1260 ccggggaggg ctcgggggag gggcgcggcg gcccccggag cgccggcggc tgtcgaggcg 1320 cggcgagccg cagccattgc cttttatggt aatcgtgcga gagggcgcag ggacttcctt 1380 tgtcccaaat ctgtgcggag ccgaaatctg ggaggcgccg ccgcaccccc tctagcgggc 1440 gcggggcgaa gcggtgcggc gccggcagga aggaaatggg cggggagggc cttcgtgcgt 1500 cgccgcgccg ccgtcccctt ctccctctcc agcctcgggg ctgtccgcgg ggggacggct 1560 gccttcgggg gggacggggc agggcggggt tcggcttctg gcgtgtgacc ggcggctcta 1620 gagcctctgc taaccatgtt catgccttct tctttttcct acagctcctg ggcaacgtgc 1680 tggttattgt gctgtctcat cattttggca aagaattc 1718 <210> 28 <211> 212 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 28 gggcagagcg cacatcgccc acagtccccg agaagttggg gggaggggtc ggcaattgaa 60 ccggtgccta gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc 120 gcctttttcc cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc 180 tttttcgcaa cgggtttgcc gccagaacac ag 212 <210> 29 <211> 2379 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 29 ccactagttc catgtcctta tatggactca tctttgccta ttgcgacaca cactcaatga 60 acacctacta cgcgctgcaa agagccccgc aggcctgagg tgcccccacc tcaccactct 120 tcctattttt gtgtaaaaat ccagcttctt gtcaccacct ccaaggaggg ggaggaggag 180 gaaggcaggt tcctctaggc tgagccgaat gcccctctgt ggtcccacgc cactgatcgc 240 tgcatgccca ccacctgggt acacacagtc tgtgattccc ggagcagaac ggaccctgcc 300 cacccggtct tgtgtgctac tcagtggaca gacccaaggc aagaaagggt gacaaggaca 360 gggtcttccc aggctggctt tgagttccta gcaccgcccc gcccccaatc ctctgtggca 420 catggagtct tggtccccag agtcccccag cggcctccag atggtctggg agggcagttc 480 agctgtggct gcgcatagca gacatacaac ggacggtggg cccagaccca ggctgtgtag 540 acccagcccc cccgccccgc agtgcctagg tcacccacta acgccccagg cctggtcttg 600 gctgggcgtg actgttaccc tcaaaagcag gcagctccag ggtaaaaggt gccctgccct 660 gtagagccca ccttccttcc cagggctgcg gctgggtagg tttgtagcct tcatcacggg 720 ccacctccag ccactggacc gctggcccct gccctgtcct ggggagtgtg gtcctgcgac 780 ttctaagtgg ccgcaagcca cctgactccc ccaacaccac actctacctc tcaagcccag 840 gtctctccct agtgacccac ccagcacatt tagctagctg agccccacag ccagaggtcc 900 tcaggccctg ctttcagggc agttgctctg aagtcggcaa gggggagtga ctgcctggcc 960 actccatgcc ctccaagagc tccttctgca ggagcgtaca gaacccaggg ccctggcacc 1020 cgtgcagacc ctggcccacc ccacctgggc gctcagtgcc caagagatgt ccacacctag 1080 gatgtcccgc ggtgggtggg gggcccgaga gacgggcagg ccgggggcag gcctggccat 1140 gcggggccga accgggcact gcccagcgtg gggcgcgggg gccacggcgc gcgcccccag 1200 cccccgggcc cagcacccca aggcggccaa cgccaaaact ctccctcctc ctcttcctca 1260 atctcgctct cgctcttttt ttttttcgca aaaggagggg agagggggta aaaaaatgct 1320 gcactgtgcg gcgaagccgg tgagtgagcg gcgcggggcc aatcagcgtg cgccgttccg 1380 aaagttgcct tttatggctc gagcggccgc ggcggcgccc tataaaaccc agcggcgcga 1440 cgcgccacca ccgccgagac cgcgtccgcc ccgcgagcac agagcctcgc ctttgccgat 1500 ccgccgcccg tccacacccg ccgccaggta agcccggcca gccgaccggg gcaggcggct 1560 cacggcccgg ccgcaggcgg ccgcggcccc ttcgcccgtg cagagccgcc gtctgggccg 1620 cagcgggggg cgcatggggg gggaaccgga ccgccgtggg gggcgcggga gaagcccctg 1680 ggcctccgga gatgggggac accccacgcc agttcggagg cgcgaggccg cgctcgggag 1740 gcgcgctccg ggggtgccgc tctcggggcg ggggcaaccg gcggggtctt tgtctgagcc 1800 gggctcttgc caatggggat cgcagggtgg gcgcggcgga gcccccgcca ggcccggtgg 1860 gggctggggc gccattgcgc gtgcgcgctg gtcctttggg cgctaactgc gtgcgcgctg 1920 ggaattggcg ctaattgcgc gtgcgcgctg ggactcaagg cgctaactgc gcgtgcgttc 1980 tggggcccgg ggtgccgcgg cctgggctgg ggcgaaggcg ggctcggccg gaaggggtgg 2040 ggtcgccgcg gctcccgggc gcttgcgcgc acttcctgcc cgagccgctg gccgcccgag 2100 ggtgtggccg ctgcgtgcgc gcgcgccgac ccggcgctgt ttgaaccggg cggaggcggg 2160 gctggcgccc ggttgggagg gggttggggc ctggcttcct gccgcgcgcc gcggggacgc 2220 ctccgaccag tgtttgcctt ttatggtaat aacgcggccg gcccggcttc ctttgtcccc 2280 aatctgggcg cgcgccggcg ccccctggcg gcctaaggac tcggcgcgcc ggaagtggcc 2340 agggcggggg cgacctcggc tcacagcgcg cccggctat 2379 <210> 30 <211> 529 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 30 gttgatttcc ttcatccctg gcacacgtcc aggcagtgtc gaatccatct ctgctacagg 60 ggaaaacaaa taacatttga gtccagtgga gaccgggagc agaagtaaag ggaagtgata 120 acccccagag cccggaagcc tctggaggct gagacctcgc cccccttgcg tgatagggcc 180 tacggagcca catgaccaag gcactgtcgc ctccgcacgt gtgagagtgc agggccccaa 240 gatggctgcc aggcctcgag gcctgactct tctatgtcac ttccgtaccg gcgagaaagg 300 cgggccctcc agccaatgag gctgcggggc gggccttcac cttgataggc actcgagtta 360 tccaatggtg cctgcgggcc ggagcgacta ggaactaacg tcatgccgag ttgctgagcg 420 ccggcaggcg gggccggggc ggccaaacca atgcgatggc cggggcggag tcgggcgctc 480 tataagttgt cgataggcgg gcactccgcc ctagtttcta aggaccatg 529 <210> 31 <211> 794 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 31 agttccccaa ctttcccgcc tctcagcctt tgaaagaaag aaaggggagg gggcaggccg 60 cgtgcagtcg cgagcggtgc tgggctccgg ctccaattcc ccatctcagt cgctcccaaa 120 gtccttctgt ttcatccaag cgtgtaaggg tccccgtcct tgactcccta gtgtcctgct 180 gcccacagtc cagtcctggg aaccagcacc gatcacctcc catcgggcca atctcagtcc 240 cttcccccct acgtcggggc ccacacgctc ggtgcgtgcc cagttgaacc aggcggctgc 300 ggaaaaaaaa aagcggggag aaagtagggc ccggctacta gcggttttac gggcgcacgt 360 agctcaggcc tcaagacctt gggctgggac tggctgagcc tggcgggagg cggggtccga 420 gtcaccgcct gccgccgcgc ccccggtttc tataaattga gcccgcagcc tcccgcttcg 480 ctctctgctc ctcctgttcg acagtcagcc gcatcttctt ttgcgtcgcc aggtgaagac 540 gggcggagag aaacccggga ggctagggac ggcctgaagg cggcaggggc gggcgcaggc 600 cggatgtgtt cgcgccgctg cggggtgggc ccgggcggcc tccgcattgc aggggcgggc 660 ggaggacgtg atgcggcgcg ggctgggcat ggaggcctgg tgggggaggg gaggggaggc 720 gtgggtgtcg gccggggcca ctaggcgctc actgttctct ccctccgcgc agccgagcca 780 catcgctgag acac 794 <210> 32 <211> 532 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 32 agtgcggtta ccagcggaaa tgcctcgggg tcagaagtcg caggagagat agacagctgc 60 tgaaccaatg ggaccagcgg atggggcgga tgttatctac cattggtgaa cgttagaaac 120 gaatagcagc caatgaatca gctggggggg cggagcagtg acgtttattg cggagggggc 180 cgcttcgaat cggcggcggc cagcttggtg gcctgggcca atgaacggcc tccaacgagc 240 agggccttca ccaatcggcg gcctccacga cggggctggg ggagggtata taagccgagt 300 aggcgacggt gaggtcgacg ccggccaaga cagcacagac agattgacct attggggtgt 360 ttcgcgagtg tgagagggaa gcgccgcggc ctgtatttct agacctgccc ttcgcctggt 420 tcgtggcgcc ttgtgacccc gggcccctgc cgcctgcaag tcggaaattg cgctgtgctc 480 ctgtgctacg gcctgtggct ggactgcctg ctgctgccca actggctggc ac 532 <210> 33 <211> 701 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 33 tagtttcatc accaccgcca cccccccgcc cccccgccat ctgaaagggt tctaggggat 60 ttgcaacctc tctcgtgtgt ttcttctttc cgagaagcgc cgccacacga gaaagctggc 120 cgcgaaagtc gtgctggaat cacttccaac gaaaccccag gcatagatgg gaaagggtga 180 agaacacgtt gccatggcta ccgtttcccc ggtcacggaa taaacgctct ctaggatccg 240 gaagtagttc cgccgcgacc tctctaaaag gatggatgtg ttctctgctt acattcattg 300 gacgttttcc cttagaggcc aaggccgccc aggcaaaggg gcggtcccac gcgtgagggg 360 cccgcggagc catttgattg gagaaaagct gcaaaccctg accaatcgga aggagccacg 420 cttcgggcat cggtcaccgc acctggacag ctccgattgg tggacttccg ccccccctca 480 cgaatcctca ttgggtgccg tgggtgcgtg gtgcggcgcg attggtgggt tcatgtttcc 540 cgtcccccgc ccgcgagaag tgggggtgaa aagcggcccg acctgcttgg ggtgtagtgg 600 gcggaccgcg cggctggagg tgtgaggatc cgaacccagg ggtggggggt ggaggcggct 660 cctgcgatcg aaggggactt gagactcacc ggccgcacgt c 701 <210> 34 <211> 465 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 34 gggccgccca ctcccccttc ctctcagggt ccctgtcccc tccagtgaat cccagaagac 60 tctggagagt tctgagcagg gggcggcact ctggcctctg attggtccaa ggaaggctgg 120 ggggcaggac gggaggcgaa aaccctggaa tattcccgac ctggcagcct catcgagctc 180 ggtgattggc tcagaaggga aaaggcgggt ctccgtgacg acttataaaa gcccaggggc 240 aagcggtccg gataacggct agcctgagga gctgctgcga cagtccacta cctttttcga 300 gagtgactcc cgttgtccca aggcttccca gagcgaacct gtgcggctgc aggcaccggc 360 gcgtcgagtt tccggcgtcc ggaaggaccg agctcttctc gcggatccag tgttccgttt 420 ccagccccca atctcagagc ggagccgaca gagagcaggg aaccc 465 <210> 35 <211> 538 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 35 gccccacccc cgtccgcgtt acaaccggga ggcccgctgg gtcctgcacc gtcaccctcc 60 tccctgtgac cgcccacctg atacccaaac aactttctcg cccctccagt ccccagctcg 120 ccgagcgctt gcggggagcc acccagcctc agtttcccca gccccgggcg gggcgagggg 180 cgatgacgtc atgccggcgc gcggcattgt ggggcggggc gaggcggggc gccgggggga 240 gcaacactga gacgccattt tcggcggcgg gagcggcgca ggcggccgag cgggactggc 300 tgggtcggct gggctgctgg tgcgaggagc cgcggggctg tgctcggcgg ccaaggggac 360 agcgcgtggg tggccgagga tgctgcgggg cggtagctcc ggcgcccctc gctggtgact 420 gctgcgccgt gcctcacaca gccgaggcgg gctcggcgca cagtcgctgc tccgcgctcg 480 cgcccggcgg cgctccaggt gctgacagcg cgagagagcg cggcctcagg agcaacac 538 <210> 36 <211> 1091 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 36 ttccagagct ttcgaggaag gtttcttcaa ctcaaattca tccgcctgat aattttctta 60 tattttccta aagaaggaag agaagcgcat agaggagaag ggaaataatt ttttaggagc 120 ctttcttacg gctatgagga atttggggct cagttgaaaa gcctaaactg cctctcggga 180 ggttgggcgc ggcgaactac tttcagcggc gcacggagac ggcgtctacg tgaggggtga 240 taagtgacgc aacactcgtt gcataaattt gcgctccgcc agcccggagc atttaggggc 300 ggttggcttt gttgggtgag cttgtttgtg tccctgtggg tggacgtggt tggtgattgg 360 caggatcctg gtatccgcta acaggtactg gcccacagcc gtaaagacct gcgggggcgt 420 gagagggggg aatgggtgag gtcaagctgg aggcttcttg gggttgggtg ggccgctgag 480 gggaggggag ggcgaggtga cgcgacaccc ggcctttctg ggagagtggg ccttgttgac 540 ctaagggggg cgagggcagt tggcacgcgc acgcgccgac agaaactaac agacattaac 600 caacagcgat tccgtcgcgt ttacttggga ggaaggcgga aaagaggtag tttgtgtggc 660 ttctggaaac cctaaatttg gaatcccagt atgagaatgg tgtcccttct tgtgtttcaa 720 tgggattttt acttcgcgag tcttgtgggt ttggttttgt tttcagtttg cctaacaccg 780 tgcttaggtt tgaggcagat tggagttcgg tcgggggagt ttgaatatcc ggaacagtta 840 gtggggaaag ctgtggacgc ttggtaagag agcgctctgg attttccgct gttgacgttg 900 aaaccttgaa tgacgaattt cgtattaagt gacttagcct tgtaaaattg aggggaggct 960 tgcggaatat taacgtattt aaggcatttt gaaggaatag ttgctaattt tgaagaatat 1020 taggtgtaaa agcaagaaat acaatgatcc tgaggtgaca cgcttatgtt ttacttttaa 1080 actaggtcac c 1091 <210> 37 <211> 243 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 37 cgggtttcgt aacaatcgca tgaggattcg caacgccttc ggcgtagccg atgtcgcgct 60 cccgtctcag taaaggtcgg cgtagccgat gtcgcgcaat cggactgcct tcgtacggcg 120 tagccgatgt cgcgcgtatc agtcgcctcg gaacggcgta gccgatgtcg cgcattcgta 180 agaggctcac tctcccttac acggagtgga taactagttc tagagggtat ataatggggg 240 cca 243 <210> 38 <211> 672 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 38 tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 60 aactatgttg ctccttttac gctgtgtgga tatgctgctt taatgcctct gtatcatgct 120 attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 180 tatgaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 240 gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 300 ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 360 ggggctaggt tgctgggcac tgataattcc gtggtgttgt cggggaagct gacgtccttt 420 ccatggctgc tcgcctgtgt tgccaactgg atcctgcgcg ggacgtcctt ctgctacgtc 480 ccttcggctc tcaatccagc ggacctccct tcccgaggcc ttctgccggt tctgcggcct 540 ctcccgcgtc ttcgctttcg gcctccgacg agtcggatct ccctttgggc cgcctccccg 600 cctgtttcgc ctcggcgtcc ggtccgtgtt gcttggtcgt cacctgtgca gaattgcgaa 660 ccatggattc ca 672 <210> 39 <211> 672 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 tctgttcctg ttaatcaacc tctggattac aaaatttgtg aaagattgac tgatattctt 60 aactatgttg ctccttttac gctgtgtgga tatgctgctt taatgcctct gtatcatgct 120 attgcttccc gtacggcttt cgttttctcc tccttgtata aatcctggtt gctgtctctt 180 tatgaggagt tgtggcccgt tgtccgtcaa cgtggcgtgg tgtgctctgt gtttgctgac 240 gcaaccccca ctggctgggg cattgccacc acctgtcaac tcctttctgg gactttcgct 300 ttccccctcc cgatcgccac ggcagaactc atcgccgcct gccttgcccg ctgctggaca 360 ggggctaggt tgctgggcac tgataattcc gtggtgttgt cggggaaatc atcgtccttt 420 ccttggctgc tcgcctgtgt tgccaactgg atcctgcgcg ggacgtcctt ctgctacgtc 480 ccttcggctc tcaatccagc ggacctccct tcccgaggcc ttctgccggt tctgcggcct 540 ctcccgcgtc ttcgctttcg gcctccgacg agtcggatct ccctttgggc cgcctccccg 600 cctgtttcgc ctcggcgtcc ggtccgtgtt gcttggtcgt cacctgtgca gaattgcgaa 660 ccatggattc ca 672 <210> 40 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 40 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 41 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 41 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Val Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 42 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 42 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val 115 120 125 Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 43 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 43 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Val Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu His Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 44 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 44 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val 115 120 125 Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 45 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 45 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 46 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 46 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Ala Ser Asn Lys Gly 225 230 235 240 Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 47 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 47 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asn Glu Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 48 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 48 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val 115 120 125 Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 49 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 49 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val 115 120 125 Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 50 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 50 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Ala Ser Asn Lys Gly 225 230 235 240 Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 51 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 51 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val 115 120 125 Leu Asp Arg Asn Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 52 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 52 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val 115 120 125 Leu Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 53 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 53 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asn Glu Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 54 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 54 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Val Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val 115 120 125 Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Ala Ser Asn Lys Gly 225 230 235 240 Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 55 <211> 314 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 55 Ser Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met 1 5 10 15 Ile Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp 20 25 30 Gln Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser 35 40 45 Glu Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu 50 55 60 Leu Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala 65 70 75 80 Lys Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His 85 90 95 Leu Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Val Val Trp 100 105 110 Arg Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu 115 120 125 Leu Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Met Val Glu Ile Phe 130 135 140 Asp Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln 145 150 155 160 Gly Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly 165 170 175 Val Tyr Thr Phe Leu Ser Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp 180 185 190 His Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu 195 200 205 Met Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala 210 215 220 Gln Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly 225 230 235 240 Met Glu Phe Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr 245 250 255 Asp Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr 260 265 270 Ser Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala 275 280 285 Thr Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr 290 295 300 Gly Glu Ala Glu Gly Phe Pro Ala Thr Ala 305 310 <210> 56 <211> 243 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 56 cgggtttcgt aacaatcgca tgaggattcg caacgccttt gaagcagtcg acgccgaagt 60 cccgtctcag taaaggttga agcagtcgac gccgaagaat cggactgcct tcgtatgaag 120 cagtcgacgc cgaaggtatc agtcgcctcg gaatgaagca gtcgacgccg aagattcgta 180 agaggctcac tctcccttac acggagtgga taactagttc tagagggtat ataatggggg 240 cca 243 <210> 57 <211> 1623 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 57 atgtgccatc agcaactcgt catctcctgg ttctcccttg tgttcctcgc ttcccctctg 60 gtcgccattt gggaactgaa gaaggacgtc tacgtggtcg agctggattg gtacccggac 120 gcccctggag aaatggtcgt gctgacttgc gatacgccag aagaggacgg cataacctgg 180 accctggatc agagctccga ggtgctcgga agcggaaaga ccctgaccat tcaagtcaag 240 gagttcggcg acgcgggcca gtacacttgc cacaagggtg gcgaagtgct gtcccactcc 300 ctgctgctgc tgcacaagaa agaggatgga atctggtcca ctgacatcct caaggaccaa 360 aaagaaccga agaacaagac cttcctccgc tgcgaagcca agaactacag cggtcggttc 420 acctgttggt ggctgacgac aatctccacc gacctgactt tctccgtgaa gtcgtcacgg 480 ggatcaagcg atcctcaggg cgtgacctgt ggagccgcca ctctgtccgc cgagagagtc 540 aggggagaca acaaggaata tgagtactcc gtggaatgcc aggaggacag cgcctgccct 600 gccgcggaag agtccctgcc tatcgaggtc atggtcgatg ccgtgcataa gctgaaatac 660 gagaactaca cttcctcctt ctttatccgc gacatcatca agcctgaccc ccccaagaac 720 ttgcagctga agccactcaa gaactcccgc caagtggaag tgtcttggga atatccagac 780 acttggagca ccccgcactc atacttctcg ctcactttct gtgtgcaagt gcagggaaag 840 tccaaacggg agaagaaaga ccgggtgttc accgacaaaa cctccgccac tgtgatttgt 900 cggaagaacg cgtcaatcag cgtccgggcg caggatagat actactcgtc ctcctggagc 960 gaatgggcca gcgtgccttg ttccggtggc ggatcaggcg gaggttcagg aggaggctcc 1020 ggaggaggtt cccggaacct ccctgtggca acccccgacc ctggaatgtt cccgtgccta 1080 caccactccc aaaacctcct gagggctgtg tcgaacatgt tgcagaaggc ccgccagacc 1140 cttgagttct acccctgcac ctcggaagaa attgatcacg aggacatcac caaggacaag 1200 acctcgaccg tggaagcctg cctgccgctg gaactgacca agaacgaatc gtgtctgaac 1260 tcccgcgaga caagctttat cactaacggc agctgcctgg cgtcgagaaa gacctcattc 1320 atgatggcgc tctgtctttc ctcgatctac gaagatctga agatgtatca ggtcgagttc 1380 aagaccatga acgccaagct gctcatggac ccgaagcggc agatcttcct ggaccagaat 1440 atgctcgccg tgattgatga actgatgcag gccctgaatt tcaactccga gactgtgcct 1500 caaaagtcca gcctggaaga accggacttc tacaagacca agatcaagct gtgcatcctg 1560 ttgcacgctt tccgcattcg agccgtgacc attgaccgcg tgatgtccta cctgaacgcc 1620 agt 1623 <210> 58 <211> 541 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 58 Met Cys His Gln Gln Leu Val Ile Ser Trp Phe Ser Leu Val Phe Leu 1 5 10 15 Ala Ser Pro Leu Val Ala Ile Trp Glu Leu Lys Lys Asp Val Tyr Val 20 25 30 Val Glu Leu Asp Trp Tyr Pro Asp Ala Pro Gly Glu Met Val Val Leu 35 40 45 Thr Cys Asp Thr Pro Glu Glu Asp Gly Ile Thr Trp Thr Leu Asp Gln 50 55 60 Ser Ser Glu Val Leu Gly Ser Gly Lys Thr Leu Thr Ile Gln Val Lys 65 70 75 80 Glu Phe Gly Asp Ala Gly Gln Tyr Thr Cys His Lys Gly Gly Glu Val 85 90 95 Leu Ser His Ser Leu Leu Leu Leu His Lys Lys Glu Asp Gly Ile Trp 100 105 110 Ser Thr Asp Ile Leu Lys Asp Gln Lys Glu Pro Lys Asn Lys Thr Phe 115 120 125 Leu Arg Cys Glu Ala Lys Asn Tyr Ser Gly Arg Phe Thr Cys Trp Trp 130 135 140 Leu Thr Thr Ile Ser Thr Asp Leu Thr Phe Ser Val Lys Ser Ser Arg 145 150 155 160 Gly Ser Ser Asp Pro Gln Gly Val Thr Cys Gly Ala Ala Thr Leu Ser 165 170 175 Ala Glu Arg Val Arg Gly Asp Asn Lys Glu Tyr Glu Tyr Ser Val Glu 180 185 190 Cys Gln Glu Asp Ser Ala Cys Pro Ala Ala Glu Glu Ser Leu Pro Ile 195 200 205 Glu Val Met Val Asp Ala Val His Lys Leu Lys Tyr Glu Asn Tyr Thr 210 215 220 Ser Ser Phe Phe Ile Arg Asp Ile Ile Lys Pro Asp Pro Pro Lys Asn 225 230 235 240 Leu Gln Leu Lys Pro Leu Lys Asn Ser Arg Gln Val Glu Val Ser Trp 245 250 255 Glu Tyr Pro Asp Thr Trp Ser Thr Pro His Ser Tyr Phe Ser Leu Thr 260 265 270 Phe Cys Val Gln Val Gln Gly Lys Ser Lys Arg Glu Lys Lys Asp Arg 275 280 285 Val Phe Thr Asp Lys Thr Ser Ala Thr Val Ile Cys Arg Lys Asn Ala 290 295 300 Ser Ile Ser Val Arg Ala Gln Asp Arg Tyr Tyr Ser Ser Ser Trp Ser 305 310 315 320 Glu Trp Ala Ser Val Pro Cys Ser Gly Gly Gly Ser Gly Gly Gly Ser 325 330 335 Gly Gly Gly Ser Gly Gly Gly Ser Arg Asn Leu Pro Val Ala Thr Pro 340 345 350 Asp Pro Gly Met Phe Pro Cys Leu His His Ser Gln Asn Leu Leu Arg 355 360 365 Ala Val Ser Asn Met Leu Gln Lys Ala Arg Gln Thr Leu Glu Phe Tyr 370 375 380 Pro Cys Thr Ser Glu Glu Ile Asp His Glu Asp Ile Thr Lys Asp Lys 385 390 395 400 Thr Ser Thr Val Glu Ala Cys Leu Pro Leu Glu Leu Thr Lys Asn Glu 405 410 415 Ser Cys Leu Asn Ser Arg Glu Thr Ser Phe Ile Thr Asn Gly Ser Cys 420 425 430 Leu Ala Ser Arg Lys Thr Ser Phe Met Met Ala Leu Cys Leu Ser Ser 435 440 445 Ile Tyr Glu Asp Leu Lys Met Tyr Gln Val Glu Phe Lys Thr Met Asn 450 455 460 Ala Lys Leu Leu Met Asp Pro Lys Arg Gln Ile Phe Leu Asp Gln Asn 465 470 475 480 Met Leu Ala Val Ile Asp Glu Leu Met Gln Ala Leu Asn Phe Asn Ser 485 490 495 Glu Thr Val Pro Gln Lys Ser Ser Leu Glu Glu Pro Asp Phe Tyr Lys 500 505 510 Thr Lys Ile Lys Leu Cys Ile Leu Leu His Ala Phe Arg Ile Arg Ala 515 520 525 Val Thr Ile Asp Arg Val Met Ser Tyr Leu Asn Ala Ser 530 535 540 <210> 59 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 59 atttatttat ttatttattt aacatcggtt ccctgtttaa tatttaaaca g 51 <210> 60 <211> 266 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 60 agagcgagat tccgtctcaa agaaaaaaaa agtaatgaaa tgaataaaat gagtcctaga 60 gccagtaaat gtcgtaaatg tctcagctag tcaggtagta aaaggtctca actaggcagt 120 ggcagagcag gattcaaatt cagggctgtt gtgatgcctc cgcagactct gagcgccacc 180 tggtggtaat ttgtctgtgc ctcttctgac gtggaagaac agcaactaac acactaacac 240 ggcatttact atgggccagc cattgt 266 <210> 61 <211> 531 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 61 atgtctagac ctggcgagag gcccttccag tgccggatct gcatgcggaa cttcagcaac 60 atgagcaacc tgaccagaca cacccggaca cacacaggcg agaagccttt tcagtgcaga 120 atctgtatgc gcaatttctc cgacagaagc gtgctgcgga gacacctgag aacccacacc 180 ggcagccaga aaccattcca gtgtcgcatc tgtatgagaa actttagcga cccctccaat 240 ctggcccggc acaccagaac acataccggg gaaaaaccct ttcagtgtag gatatgcatg 300 aggaattttt ccgaccggtc cagcctgagg cggcacctga ggacacatac tggctcccaa 360 aagccgttcc aatgtcggat atgtatgcgc aactttagcc agagcggcac cctgcacaga 420 cacacaagaa cccatactgg cgagaaacct ttccaatgta gaatctgcat gcgaaatttt 480 tcccagcggc ctaatctgac caggcatctg aggacccacc tgagaggatc t 531 <210> 62 <211> 177 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 62 Met Ser Arg Pro Gly Glu Arg Pro Phe Gln Cys Arg Ile Cys Met Arg 1 5 10 15 Asn Phe Ser Asn Met Ser Asn Leu Thr Arg His Thr Arg Thr His Thr 20 25 30 Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp 35 40 45 Arg Ser Val Leu Arg Arg His Leu Arg Thr His Thr Gly Ser Gln Lys 50 55 60 Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe Ser Asp Pro Ser Asn 65 70 75 80 Leu Ala Arg His Thr Arg Thr His Thr Gly Glu Lys Pro Phe Gln Cys 85 90 95 Arg Ile Cys Met Arg Asn Phe Ser Asp Arg Ser Ser Leu Arg Arg His 100 105 110 Leu Arg Thr His Thr Gly Ser Gln Lys Pro Phe Gln Cys Arg Ile Cys 115 120 125 Met Arg Asn Phe Ser Gln Ser Gly Thr Leu His Arg His Thr Arg Thr 130 135 140 His Thr Gly Glu Lys Pro Phe Gln Cys Arg Ile Cys Met Arg Asn Phe 145 150 155 160 Ser Gln Arg Pro Asn Leu Thr Arg His Leu Arg Thr His Leu Arg Gly 165 170 175 Ser <210> 63 <211> 573 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 63 gatgagtttc ccaccatggt gtttccttct gggcagatca gccaggcctc ggccttggcc 60 ccggcccctc cccaagtcct gccccaggct ccagcccctg cccctgctcc agccatggta 120 tcagctctgg cccaggcccc agcccctgtc ccagtcctag ccccaggccc tcctcaggct 180 gtggccccac ctgcccccaa gcccacccag gctggggaag gaacgctgtc agaggccctg 240 ctgcagctgc agtttgatga tgaagacctg ggggccttgc ttggcaacag cacagaccca 300 gctgtgttca cagacctggc atccgtcgac aactccgagt ttcagcagct gctgaaccag 360 ggcatacctg tggcccccca cacaactgag cccatgctga tggagtaccc tgaggctata 420 actcgcctag tgacaggggc ccagaggccc cccgacccag ctcctgctcc actgggggcc 480 ccggggctcc ccaatggcct cctttcagga gatgaagact tctcctccat tgcggacatg 540 gacttctcag ccctgctgag tcagatcagc tcc 573 <210> 64 <211> 191 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 64 Asp Glu Phe Pro Thr Met Val Phe Pro Ser Gly Gln Ile Ser Gln Ala 1 5 10 15 Ser Ala Leu Ala Pro Ala Pro Pro Gln Val Leu Pro Gln Ala Pro Ala 20 25 30 Pro Ala Pro Ala Pro Ala Met Val Ser Ala Leu Ala Gln Ala Pro Ala 35 40 45 Pro Val Pro Val Leu Ala Pro Gly Pro Pro Gln Ala Val Ala Pro Pro 50 55 60 Ala Pro Lys Pro Thr Gln Ala Gly Glu Gly Thr Leu Ser Glu Ala Leu 65 70 75 80 Leu Gln Leu Gln Phe Asp Asp Glu Asp Leu Gly Ala Leu Leu Gly Asn 85 90 95 Ser Thr Asp Pro Ala Val Phe Thr Asp Leu Ala Ser Val Asp Asn Ser 100 105 110 Glu Phe Gln Gln Leu Leu Asn Gln Gly Ile Pro Val Ala Pro His Thr 115 120 125 Thr Glu Pro Met Leu Met Glu Tyr Pro Glu Ala Ile Thr Arg Leu Val 130 135 140 Thr Gly Ala Gln Arg Pro Pro Asp Pro Ala Pro Ala Pro Leu Gly Ala 145 150 155 160 Pro Gly Leu Pro Asn Gly Leu Leu Ser Gly Asp Glu Asp Phe Ser Ser 165 170 175 Ile Ala Asp Met Asp Phe Ser Ala Leu Leu Ser Gln Ile Ser Ser 180 185 190 <210> 65 <211> 936 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 65 gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 60 aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 120 gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 180 atgggcttac tgaccaacct ggcagacagg gagctggttc acatgatcaa ctgggcgaag 240 agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 300 tggatggaga tcctgatgat tggtgtggtc tggcgctcca tggagcaccc agtgaagcta 360 ctgtttgctc ctaacttgct cttggacagg gaccagggaa aatgtgtaga gggcctggtg 420 gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 480 gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 540 cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 600 acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 660 cggctggccc agctcctcct catcctctcc cacatcaggc acatgagtaa caaaggcatg 720 gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 780 gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 840 acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 900 tacatcacgg gggaggcaga gggtttccct gccaca 936 <210> 66 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 66 Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile 1 5 10 15 Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln 20 25 30 Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu 35 40 45 Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu 50 55 60 Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys 65 70 75 80 Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu 85 90 95 Leu Glu Cys Ala Trp Met Glu Ile Leu Met Ile Gly Val Val Trp Arg 100 105 110 Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu 115 120 125 Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe Asp 130 135 140 Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly 145 150 155 160 Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val 165 170 175 Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His 180 185 190 Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met 195 200 205 Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln 210 215 220 Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met 225 230 235 240 Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp 245 250 255 Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser 260 265 270 Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr 275 280 285 Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly 290 295 300 Glu Ala Glu Gly Phe Pro Ala Thr 305 310 <210> 67 <211> 11809 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 67 aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540 caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600 cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660 tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720 ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780 gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840 gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900 acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960 tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020 ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080 tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140 atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200 ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260 ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320 tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380 ggcaaacaac agatggctgg caactagaag gcacagttac ttactgttta aatattaaac 1440 agggaaccga tgttaaataa ataaataaat aaatgtttaa actagagtcg cggcctcagt 1500 cagtcacgca tgcctgcagt ttaactggcg ttcaggtagg acatcacgcg gtcaatggtc 1560 acggctcgaa tgcggaaagc gtgcaacagg atgcacagct tgatcttggt cttgtagaag 1620 tccggttctt ccaggctgga cttttgaggc acagtctcgg agttgaaatt cagggcctgc 1680 atcagttcat caatcacggc gagcatattc tggtccagga agatctgccg cttcgggtcc 1740 atgagcagct tggcgttcat ggtcttgaac tcgacctgat acatcttcag atcttcgtag 1800 atcgaggaaa gacagagcgc catcatgaat gaggtctttc tcgacgccag gcagctgccg 1860 ttagtgataa agcttgtctc gcgggagttc agacacgatt cgttcttggt cagttccagc 1920 ggcaggcagg cttccacggt cgaggtcttg tccttggtga tgtcctcgtg atcaatttct 1980 tccgaggtgc aggggtagaa ctcaagggtc tggcgggcct tctgcaacat gttcgacaca 2040 gccctcagga ggttttggga gtggtgtagg cacgggaaca ttccagggtc gggggttgcc 2100 acagggaggt tccgggaacc tcctccggag cctcctcctg aacctccgcc tgatccgcca 2160 ccggaacaag gcacgctggc ccattcgctc caggaggacg agtagtatct atcctgcgcc 2220 cggacgctga ttgacgcgtt cttccgacaa atcacagtgg cggaggtttt gtcggtgaac 2280 acccggtctt tcttctcccg tttggacttt ccctgcactt gcacacagaa agtgagcgag 2340 aagtatgagt gcggggtgct ccaagtgtct ggatattccc aagacacttc cacttggcgg 2400 gagttcttga gtggcttcag ctgcaagttc ttgggggggt caggcttgat gatgtcgcgg 2460 ataaagaagg aggaagtgta gttctcgtat ttcagcttat gcacggcatc gaccatgacc 2520 tcgataggca gggactcttc cgcggcaggg caggcgctgt cctcctggca ttccacggag 2580 tactcatatt ccttgttgtc tcccctgact ctctcggcgg acagagtggc ggctccacag 2640 gtcacgccct gaggatcgct tgatccccgt gacgacttca cggagaaagt caggtcggtg 2700 gagattgtcg tcagccacca acaggtgaac cgaccgctgt agttcttggc ttcgcagcgg 2760 aggaaggtct tgttcttcgg ttctttttgg tccttgagga tgtcagtgga ccagattcca 2820 tcctctttct tgtgcagcag cagcagggag tgggacagca cttcgccacc cttgtggcaa 2880 gtgtactggc ccgcgtcgcc gaactccttg acttgaatgg tcagggtctt tccgcttccg 2940 agcacctcgg agctctgatc cagggtccag gttatgccgt cctcttctgg cgtatcgcaa 3000 gtcagcacga ccatttctcc aggggcgtcc gggtaccaat ccagctcgac cacgtagacg 3060 tccttcttca gttcccaaat ggcgaccaga ggggaagcga ggaacacaag ggagaaccag 3120 gagatgacga gttgctgatg gcacatcatg gtggcgacac cggtacgcgt tggcccccat 3180 tatataccct ctagaactag ttatccactc cgtgtaaggg agagtgagcc tcttacgaat 3240 cttcggcgtc gactgcttca ttccgaggcg actgatacct tcggcgtcga ctgcttcata 3300 cgaaggcagt ccgattcttc ggcgtcgact gcttcaacct ttactgagac gggacttcgg 3360 cgtcgactgc ttcaaaggcg ttgcgaatcc tcatgcgatt gttacgaaac ccgttaatta 3420 aagagcgaga ttccgtctca aagaaaaaaa aagtaatgaa atgaataaaa tgagtcctag 3480 agccagtaaa tgtcgtaaat gtctcagcta gtcaggtagt aaaaggtctc aactaggcag 3540 tggcagagca ggattcaaat tcagggctgt tgtgatgcct ccgcagactc tgagcgccac 3600 ctggtggtaa tttgtctgtg cctcttctga cgtggaagaa cagcaactaa cacactaaca 3660 cggcatttac tatgggccag ccattgtcca tctagatggc cgataaaata aaagatttta 3720 tttagtctcc agaaaaaggg gggaatgaaa gaccccacct gtaggtttgg caagctagct 3780 gcagtaacgc cattttgcaa ggcatggaaa aataccaaac caagaataga gaagttcaga 3840 tcaagggcgg gtacatgaaa atagctaacg ttgggccaaa caggatatct gcggtgagca 3900 gtttcggccc cggcccgggg ccaagaacag atggtcaccg cagtttcggc cccggcccga 3960 ggccaagaac agatggtccc cagatatggc ccaaccctca gcagtttctt aagacccatc 4020 agatgtttcc aggctccccc aaggacctga aatgaccctg cgccttattt gaattaacca 4080 atcagcctgc ttctcgcttc tgttcgcgcg cttctgcttc ccgagctcta taaaagagct 4140 cacaacccct cactcggcgc gccagtcctc cgacagactg agtcgcccgg gggatccgcc 4200 accatgtcta gacctggcga gaggcccttc cagtgccgga tctgcatgcg gaacttcagc 4260 aacatgagca acctgaccag acacacccgg acacacacag gcgagaagcc ttttcagtgc 4320 agaatctgta tgcgcaattt ctccgacaga agcgtgctgc ggagacacct gagaacccac 4380 accggcagcc agaaaccatt ccagtgtcgc atctgtatga gaaactttag cgacccctcc 4440 aatctggccc ggcacaccag aacacatacc ggggaaaaac cctttcagtg taggatatgc 4500 atgaggaatt tttccgaccg gtccagcctg aggcggcacc tgaggacaca tactggctcc 4560 caaaagccgt tccaatgtcg gatatgtatg cgcaacttta gccagagcgg caccctgcac 4620 agacacacaa gaacccatac tggcgagaaa cctttccaat gtagaatctg catgcgaaat 4680 ttttcccagc ggcctaatct gaccaggcat ctgaggaccc acctgagagg atctacctgc 4740 agggatgagt ttcccaccat ggtgtttcct tctgggcaga tcagccaggc ctcggccttg 4800 gccccggccc ctccccaagt cctgccccag gctccagccc ctgcccctgc tccagccatg 4860 gtatcagctc tggcccaggc cccagcccct gtcccagtcc tagccccagg ccctcctcag 4920 gctgtggccc cacctgcccc caagcccacc caggctgggg aaggaacgct gtcagaggcc 4980 ctgctgcagc tgcagtttga tgatgaagac ctgggggcct tgcttggcaa cagcacagac 5040 ccagctgtgt tcacagacct ggcatccgtc gacaactccg agtttcagca gctgctgaac 5100 cagggcatac ctgtggcccc ccacacaact gagcccatgc tgatggagta ccctgaggct 5160 ataactcgcc tagtgacagg ggcccagagg ccccccgacc cagctcctgc tccactgggg 5220 gccccggggc tccccaatgg cctcctttca ggagatgaag acttctcctc cattgcggac 5280 atggacttct cagccctgct gagtcagatc agctcccaat tgtgcgtacg cggatcctct 5340 gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 5400 aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 5460 gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 5520 atgggcttac tgaccaacct ggcagacagg gagctggttc acatgatcaa ctgggcgaag 5580 agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 5640 tggatggaga tcctgatgat tggtgtggtc tggcgctcca tggagcaccc agtgaagcta 5700 ctgtttgctc ctaacttgct cttggacagg gaccagggaa aatgtgtaga gggcctggtg 5760 gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 5820 gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 5880 cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 5940 acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 6000 cggctggccc agctcctcct catcctctcc cacatcaggc acatgagtaa caaaggcatg 6060 gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 6120 gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 6180 acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 6240 tacatcacgg gggaggcaga gggtttccct gccacataag tcgacaatca acctctggat 6300 tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 6360 ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 6420 tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 6480 caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 6540 accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 6600 ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 6660 tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg tgttgccacc 6720 tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 6780 ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtctacgcct tcgccctcag 6840 acgagtcgga tctccctttg ggccgcctcc ccgcgatatc agtggtccag gctctagttt 6900 tgactcaaca atatcaccag ctgaagccta tagagtacga gccatagata aaataaaaga 6960 ttttatttag tctccagaaa aaggggggaa tgaaagaccc cacctgtagg tttggcaagc 7020 tagcaataaa agagcccaca acccctcact cggggcgcca gtcctccgat tgactgagtc 7080 gcccggccgc ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact 7140 agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 7200 accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 7260 gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa 7320 atcgataagg atcgggtacc cgtgtatcca ataaaccctc ttgcagttgc atccgacttg 7380 tggtctcgct gttccttggg agggtctcct ctgagtgatt gactacccgt cagcgggggt 7440 ctttcacaca tgcagcatgt atcaaaatta atttggtttt ttttcttaag ctgtgccttc 7500 tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 7560 cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 7620 tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 7680 tagcaggcat gctggggatg cggtgggctc tatggagatc ccgcggtacc tcgcgaatgc 7740 atctagatcc aatggccttt ttggcccaga catgataaga tacattgatg agtttggaca 7800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 7860 tttatttgta accattataa gctgcaataa acaagttgcg gccgcttagc cctcccacac 7920 ataaccagag ggcagcaatt cacgaatccc aactgccgtc ggctgtccat cactgtcctt 7980 cactatggct ttgatcccag gatgcagatc gagaagcacc tgtcggcacc gtccgcaggg 8040 gctcaagatg cccctgttct catttccgat cgcgacgata caagtcaggt tgccagctgc 8100 cgcagcagca gcagtgccca gcaccacgag ttctgcacaa ggtcccccag taaaatgata 8160 tacattgaca ccagtgaaga tgcggccgtc gctagagaga gctgcgctgg cgacgctgta 8220 gtcttcagag atggggatgc tgttgattgt agccgttgct ctttcaatga gggtggattc 8280 ttcttgagac aaaggcttgg ccatgcggcc gccgctcggt gttcgaggcc acacgcgtca 8340 ccttaatatg cgaagtggac ctcggaccgc gccgccccga ctgcatctgc gtgttcgaat 8400 tcgccaatga caagacgctg ggcggggttt gtgtcatcat agaactaaag acatgcaaat 8460 atatttcttc cggggggtac cggccttttt ggccattgga tcggatctgg ccaaaaaggc 8520 ccttaagtat ttacattaaa tggccatagt acttaaagtt acattggctt ccttgaaata 8580 aacatggagt attcagaatg tgtcataaat atttctaatt ttaagatagt atctccattg 8640 gctttctact ttttctttta tttttttttg tcctctgtct tccatttgtt gttgttgttg 8700 tttgtttgtt tgtttgttgg ttggttggtt aatttttttt taaagatcct acactatagt 8760 tcaagctaga ctattagcta ctctgtaacc cagggtgacc ttgaagtcat gggtagcctg 8820 ctgttttagc cttcccacat ctaagattac aggtatgagc tatcattttt ggtatattga 8880 ttgattgatt gattgatgtg tgtgtgtgtg attgtgtttg tgtgtgtgat tgtgtatatg 8940 tgtgtatggt tgtgtgtgat tgtgtgtatg tatgtttgtg tgtgattgtg tgtgtgtgat 9000 tgtgcatgtg tgtgtgtgtg attgtgttta tgtgtatgat tgtgtgtgtg tgtgtgtgtg 9060 tgtgtgtgtg tgtgtgtgtg tgtgtgttgt gtatatatat ttatggtagt gagaggcaac 9120 gctccggctc aggtgtcagg ttggtttttg agacagagtc tttcacttag cttggaattc 9180 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 9240 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 9300 cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct 9360 tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 9420 tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 9480 ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 9540 tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct 9600 atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 9660 gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 9720 gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 9780 tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 9840 tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 9900 gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 9960 acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 10020 tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 10080 gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 10140 tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 10200 accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 10260 ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 10320 agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 10380 gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 10440 ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 10500 tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 10560 ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 10620 gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 10680 acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 10740 aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 10800 atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 10860 gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 10920 tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 10980 ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 11040 ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 11100 ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 11160 aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 11220 cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 11280 gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 11340 ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 11400 cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 11460 tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 11520 cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 11580 cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 11640 caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac 11700 tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt 11760 gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcc 11809 <210> 68 <211> 936 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 68 gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 60 aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 120 gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 180 atgggcttac tgaccaacct ggcagacagg gagatcgttc acatgatcaa ctgggcgaag 240 agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 300 tggctagaga tcctgatgat tggtgtggtc tggcgctcca tggagcaccc agtgaagcta 360 ctgtttgctc ctaacttgct cttggacagg gaccagggaa aatgtgtaga gggcctggtg 420 gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 480 gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 540 cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 600 acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 660 cggctggccc agctcctcct catcctctcc cacatcaggc acgccagtaa caaaggcatg 720 gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 780 gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 840 acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 900 tacatcacgg gggaggcaga gggtttccct gccaca 936 <210> 69 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 69 Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile 1 5 10 15 Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln 20 25 30 Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu 35 40 45 Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu 50 55 60 Thr Asn Leu Ala Asp Arg Glu Ile Val His Met Ile Asn Trp Ala Lys 65 70 75 80 Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu 85 90 95 Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Val Val Trp Arg 100 105 110 Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Leu Leu 115 120 125 Asp Arg Asp Gln Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe Asp 130 135 140 Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly 145 150 155 160 Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val 165 170 175 Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His 180 185 190 Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met 195 200 205 Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln 210 215 220 Leu Leu Leu Ile Leu Ser His Ile Arg His Ala Ser Asn Lys Gly Met 225 230 235 240 Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp 245 250 255 Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser 260 265 270 Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr 275 280 285 Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly 290 295 300 Glu Ala Glu Gly Phe Pro Ala Thr 305 310 <210> 70 <211> 11809 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 70 aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540 caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600 cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660 tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720 ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780 gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840 gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900 acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960 tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020 ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080 tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140 atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200 ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260 ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320 tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380 ggcaaacaac agatggctgg caactagaag gcacagttac ttactgttta aatattaaac 1440 agggaaccga tgttaaataa ataaataaat aaatgtttaa actagagtcg cggcctcagt 1500 cagtcacgca tgcctgcagt ttaactggcg ttcaggtagg acatcacgcg gtcaatggtc 1560 acggctcgaa tgcggaaagc gtgcaacagg atgcacagct tgatcttggt cttgtagaag 1620 tccggttctt ccaggctgga cttttgaggc acagtctcgg agttgaaatt cagggcctgc 1680 atcagttcat caatcacggc gagcatattc tggtccagga agatctgccg cttcgggtcc 1740 atgagcagct tggcgttcat ggtcttgaac tcgacctgat acatcttcag atcttcgtag 1800 atcgaggaaa gacagagcgc catcatgaat gaggtctttc tcgacgccag gcagctgccg 1860 ttagtgataa agcttgtctc gcgggagttc agacacgatt cgttcttggt cagttccagc 1920 ggcaggcagg cttccacggt cgaggtcttg tccttggtga tgtcctcgtg atcaatttct 1980 tccgaggtgc aggggtagaa ctcaagggtc tggcgggcct tctgcaacat gttcgacaca 2040 gccctcagga ggttttggga gtggtgtagg cacgggaaca ttccagggtc gggggttgcc 2100 acagggaggt tccgggaacc tcctccggag cctcctcctg aacctccgcc tgatccgcca 2160 ccggaacaag gcacgctggc ccattcgctc caggaggacg agtagtatct atcctgcgcc 2220 cggacgctga ttgacgcgtt cttccgacaa atcacagtgg cggaggtttt gtcggtgaac 2280 acccggtctt tcttctcccg tttggacttt ccctgcactt gcacacagaa agtgagcgag 2340 aagtatgagt gcggggtgct ccaagtgtct ggatattccc aagacacttc cacttggcgg 2400 gagttcttga gtggcttcag ctgcaagttc ttgggggggt caggcttgat gatgtcgcgg 2460 ataaagaagg aggaagtgta gttctcgtat ttcagcttat gcacggcatc gaccatgacc 2520 tcgataggca gggactcttc cgcggcaggg caggcgctgt cctcctggca ttccacggag 2580 tactcatatt ccttgttgtc tcccctgact ctctcggcgg acagagtggc ggctccacag 2640 gtcacgccct gaggatcgct tgatccccgt gacgacttca cggagaaagt caggtcggtg 2700 gagattgtcg tcagccacca acaggtgaac cgaccgctgt agttcttggc ttcgcagcgg 2760 aggaaggtct tgttcttcgg ttctttttgg tccttgagga tgtcagtgga ccagattcca 2820 tcctctttct tgtgcagcag cagcagggag tgggacagca cttcgccacc cttgtggcaa 2880 gtgtactggc ccgcgtcgcc gaactccttg acttgaatgg tcagggtctt tccgcttccg 2940 agcacctcgg agctctgatc cagggtccag gttatgccgt cctcttctgg cgtatcgcaa 3000 gtcagcacga ccatttctcc aggggcgtcc gggtaccaat ccagctcgac cacgtagacg 3060 tccttcttca gttcccaaat ggcgaccaga ggggaagcga ggaacacaag ggagaaccag 3120 gagatgacga gttgctgatg gcacatcatg gtggcgacac cggtacgcgt tggcccccat 3180 tatataccct ctagaactag ttatccactc cgtgtaaggg agagtgagcc tcttacgaat 3240 cttcggcgtc gactgcttca ttccgaggcg actgatacct tcggcgtcga ctgcttcata 3300 cgaaggcagt ccgattcttc ggcgtcgact gcttcaacct ttactgagac gggacttcgg 3360 cgtcgactgc ttcaaaggcg ttgcgaatcc tcatgcgatt gttacgaaac ccgttaatta 3420 aagagcgaga ttccgtctca aagaaaaaaa aagtaatgaa atgaataaaa tgagtcctag 3480 agccagtaaa tgtcgtaaat gtctcagcta gtcaggtagt aaaaggtctc aactaggcag 3540 tggcagagca ggattcaaat tcagggctgt tgtgatgcct ccgcagactc tgagcgccac 3600 ctggtggtaa tttgtctgtg cctcttctga cgtggaagaa cagcaactaa cacactaaca 3660 cggcatttac tatgggccag ccattgtcca tctagatggc cgataaaata aaagatttta 3720 tttagtctcc agaaaaaggg gggaatgaaa gaccccacct gtaggtttgg caagctagct 3780 gcagtaacgc cattttgcaa ggcatggaaa aataccaaac caagaataga gaagttcaga 3840 tcaagggcgg gtacatgaaa atagctaacg ttgggccaaa caggatatct gcggtgagca 3900 gtttcggccc cggcccgggg ccaagaacag atggtcaccg cagtttcggc cccggcccga 3960 ggccaagaac agatggtccc cagatatggc ccaaccctca gcagtttctt aagacccatc 4020 agatgtttcc aggctccccc aaggacctga aatgaccctg cgccttattt gaattaacca 4080 atcagcctgc ttctcgcttc tgttcgcgcg cttctgcttc ccgagctcta taaaagagct 4140 cacaacccct cactcggcgc gccagtcctc cgacagactg agtcgcccgg gggatccgcc 4200 accatgtcta gacctggcga gaggcccttc cagtgccgga tctgcatgcg gaacttcagc 4260 aacatgagca acctgaccag acacacccgg acacacacag gcgagaagcc ttttcagtgc 4320 agaatctgta tgcgcaattt ctccgacaga agcgtgctgc ggagacacct gagaacccac 4380 accggcagcc agaaaccatt ccagtgtcgc atctgtatga gaaactttag cgacccctcc 4440 aatctggccc ggcacaccag aacacatacc ggggaaaaac cctttcagtg taggatatgc 4500 atgaggaatt tttccgaccg gtccagcctg aggcggcacc tgaggacaca tactggctcc 4560 caaaagccgt tccaatgtcg gatatgtatg cgcaacttta gccagagcgg caccctgcac 4620 agacacacaa gaacccatac tggcgagaaa cctttccaat gtagaatctg catgcgaaat 4680 ttttcccagc ggcctaatct gaccaggcat ctgaggaccc acctgagagg atctacctgc 4740 agggatgagt ttcccaccat ggtgtttcct tctgggcaga tcagccaggc ctcggccttg 4800 gccccggccc ctccccaagt cctgccccag gctccagccc ctgcccctgc tccagccatg 4860 gtatcagctc tggcccaggc cccagcccct gtcccagtcc tagccccagg ccctcctcag 4920 gctgtggccc cacctgcccc caagcccacc caggctgggg aaggaacgct gtcagaggcc 4980 ctgctgcagc tgcagtttga tgatgaagac ctgggggcct tgcttggcaa cagcacagac 5040 ccagctgtgt tcacagacct ggcatccgtc gacaactccg agtttcagca gctgctgaac 5100 cagggcatac ctgtggcccc ccacacaact gagcccatgc tgatggagta ccctgaggct 5160 ataactcgcc tagtgacagg ggcccagagg ccccccgacc cagctcctgc tccactgggg 5220 gccccggggc tccccaatgg cctcctttca ggagatgaag acttctcctc cattgcggac 5280 atggacttct cagccctgct gagtcagatc agctcccaat tgtgcgtacg cggatcctct 5340 gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 5400 aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 5460 gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 5520 atgggcttac tgaccaacct ggcagacagg gagatcgttc acatgatcaa ctgggcgaag 5580 agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 5640 tggctagaga tcctgatgat tggtgtggtc tggcgctcca tggagcaccc agtgaagcta 5700 ctgtttgctc ctaacttgct cttggacagg gaccagggaa aatgtgtaga gggcctggtg 5760 gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 5820 gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 5880 cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 5940 acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 6000 cggctggccc agctcctcct catcctctcc cacatcaggc acgccagtaa caaaggcatg 6060 gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 6120 gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 6180 acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 6240 tacatcacgg gggaggcaga gggtttccct gccacataag tcgacaatca acctctggat 6300 tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 6360 ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 6420 tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 6480 caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 6540 accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 6600 ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 6660 tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg tgttgccacc 6720 tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 6780 ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtctacgcct tcgccctcag 6840 acgagtcgga tctccctttg ggccgcctcc ccgcgatatc agtggtccag gctctagttt 6900 tgactcaaca atatcaccag ctgaagccta tagagtacga gccatagata aaataaaaga 6960 ttttatttag tctccagaaa aaggggggaa tgaaagaccc cacctgtagg tttggcaagc 7020 tagcaataaa agagcccaca acccctcact cggggcgcca gtcctccgat tgactgagtc 7080 gcccggccgc ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact 7140 agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 7200 accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 7260 gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa 7320 atcgataagg atcgggtacc cgtgtatcca ataaaccctc ttgcagttgc atccgacttg 7380 tggtctcgct gttccttggg agggtctcct ctgagtgatt gactacccgt cagcgggggt 7440 ctttcacaca tgcagcatgt atcaaaatta atttggtttt ttttcttaag ctgtgccttc 7500 tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 7560 cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 7620 tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 7680 tagcaggcat gctggggatg cggtgggctc tatggagatc ccgcggtacc tcgcgaatgc 7740 atctagatcc aatggccttt ttggcccaga catgataaga tacattgatg agtttggaca 7800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 7860 tttatttgta accattataa gctgcaataa acaagttgcg gccgcttagc cctcccacac 7920 ataaccagag ggcagcaatt cacgaatccc aactgccgtc ggctgtccat cactgtcctt 7980 cactatggct ttgatcccag gatgcagatc gagaagcacc tgtcggcacc gtccgcaggg 8040 gctcaagatg cccctgttct catttccgat cgcgacgata caagtcaggt tgccagctgc 8100 cgcagcagca gcagtgccca gcaccacgag ttctgcacaa ggtcccccag taaaatgata 8160 tacattgaca ccagtgaaga tgcggccgtc gctagagaga gctgcgctgg cgacgctgta 8220 gtcttcagag atggggatgc tgttgattgt agccgttgct ctttcaatga gggtggattc 8280 ttcttgagac aaaggcttgg ccatgcggcc gccgctcggt gttcgaggcc acacgcgtca 8340 ccttaatatg cgaagtggac ctcggaccgc gccgccccga ctgcatctgc gtgttcgaat 8400 tcgccaatga caagacgctg ggcggggttt gtgtcatcat agaactaaag acatgcaaat 8460 atatttcttc cggggggtac cggccttttt ggccattgga tcggatctgg ccaaaaaggc 8520 ccttaagtat ttacattaaa tggccatagt acttaaagtt acattggctt ccttgaaata 8580 aacatggagt attcagaatg tgtcataaat atttctaatt ttaagatagt atctccattg 8640 gctttctact ttttctttta tttttttttg tcctctgtct tccatttgtt gttgttgttg 8700 tttgtttgtt tgtttgttgg ttggttggtt aatttttttt taaagatcct acactatagt 8760 tcaagctaga ctattagcta ctctgtaacc cagggtgacc ttgaagtcat gggtagcctg 8820 ctgttttagc cttcccacat ctaagattac aggtatgagc tatcattttt ggtatattga 8880 ttgattgatt gattgatgtg tgtgtgtgtg attgtgtttg tgtgtgtgat tgtgtatatg 8940 tgtgtatggt tgtgtgtgat tgtgtgtatg tatgtttgtg tgtgattgtg tgtgtgtgat 9000 tgtgcatgtg tgtgtgtgtg attgtgttta tgtgtatgat tgtgtgtgtg tgtgtgtgtg 9060 tgtgtgtgtg tgtgtgtgtg tgtgtgttgt gtatatatat ttatggtagt gagaggcaac 9120 gctccggctc aggtgtcagg ttggtttttg agacagagtc tttcacttag cttggaattc 9180 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 9240 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 9300 cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct 9360 tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 9420 tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 9480 ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 9540 tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct 9600 atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 9660 gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 9720 gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 9780 tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 9840 tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 9900 gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 9960 acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 10020 tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 10080 gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 10140 tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 10200 accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 10260 ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 10320 agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 10380 gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 10440 ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 10500 tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 10560 ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 10620 gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 10680 acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 10740 aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 10800 atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 10860 gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 10920 tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 10980 ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 11040 ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 11100 ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 11160 aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 11220 cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 11280 gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 11340 ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 11400 cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 11460 tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 11520 cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 11580 cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 11640 caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac 11700 tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt 11760 gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcc 11809 <210> 71 <211> 936 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 71 gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 60 aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 120 gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 180 atgggcttac tgaccaacct ggcagacagg gagctggttc acatgatcaa ctgggcgaag 240 agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 300 tggctagaga tcctgatgat tggtctcgtc tggcgctcca tggagcaccc agtgaagcta 360 ctgtttgctc ctaacttggt gttggacagg gacgagggaa aatgtgtaga gggcctggtg 420 gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 480 gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 540 cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 600 acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 660 cggctggccc agctcctcct catcctctcc cacatcaggc acatgagtaa caaaggcatg 720 gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 780 gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 840 acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 900 tacatcacgg gggaggcaga gggtttccct gccaca 936 <210> 72 <211> 312 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 72 Ala Gly Asp Met Arg Ala Ala Asn Leu Trp Pro Ser Pro Leu Met Ile 1 5 10 15 Lys Arg Ser Lys Lys Asn Ser Leu Ala Leu Ser Leu Thr Ala Asp Gln 20 25 30 Met Val Ser Ala Leu Leu Asp Ala Glu Pro Pro Ile Leu Tyr Ser Glu 35 40 45 Tyr Asp Pro Thr Arg Pro Phe Ser Glu Ala Ser Met Met Gly Leu Leu 50 55 60 Thr Asn Leu Ala Asp Arg Glu Leu Val His Met Ile Asn Trp Ala Lys 65 70 75 80 Arg Val Pro Gly Phe Val Asp Leu Thr Leu His Asp Gln Val His Leu 85 90 95 Leu Glu Cys Ala Trp Leu Glu Ile Leu Met Ile Gly Leu Val Trp Arg 100 105 110 Ser Met Glu His Pro Val Lys Leu Leu Phe Ala Pro Asn Leu Val Leu 115 120 125 Asp Arg Asp Glu Gly Lys Cys Val Glu Gly Leu Val Glu Ile Phe Asp 130 135 140 Met Leu Leu Ala Thr Ser Ser Arg Phe Arg Met Met Asn Leu Gln Gly 145 150 155 160 Glu Glu Phe Val Cys Leu Lys Ser Ile Ile Leu Leu Asn Ser Gly Val 165 170 175 Tyr Thr Phe Leu Pro Ser Thr Leu Lys Ser Leu Glu Glu Lys Asp His 180 185 190 Ile His Arg Val Leu Asp Lys Ile Thr Asp Thr Leu Ile His Leu Met 195 200 205 Ala Lys Ala Gly Leu Thr Leu Gln Gln Gln His Gln Arg Leu Ala Gln 210 215 220 Leu Leu Leu Ile Leu Ser His Ile Arg His Met Ser Asn Lys Gly Met 225 230 235 240 Glu Leu Leu Tyr Ser Met Lys Cys Lys Asn Val Val Pro Leu Tyr Asp 245 250 255 Leu Leu Leu Glu Ala Ala Asp Ala His Arg Leu His Ala Pro Thr Ser 260 265 270 Arg Gly Gly Ala Ser Val Glu Glu Thr Asp Gln Ser His Leu Ala Thr 275 280 285 Ala Gly Ser Thr Ser Ser His Ser Leu Gln Lys Tyr Tyr Ile Thr Gly 290 295 300 Glu Ala Glu Gly Phe Pro Ala Thr 305 310 <210> 73 <211> 11809 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 73 aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540 caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600 cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660 tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720 ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780 gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840 gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900 acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960 tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020 ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080 tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140 atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200 ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260 ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320 tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380 ggcaaacaac agatggctgg caactagaag gcacagttac ttactgttta aatattaaac 1440 agggaaccga tgttaaataa ataaataaat aaatgtttaa actagagtcg cggcctcagt 1500 cagtcacgca tgcctgcagt ttaactggcg ttcaggtagg acatcacgcg gtcaatggtc 1560 acggctcgaa tgcggaaagc gtgcaacagg atgcacagct tgatcttggt cttgtagaag 1620 tccggttctt ccaggctgga cttttgaggc acagtctcgg agttgaaatt cagggcctgc 1680 atcagttcat caatcacggc gagcatattc tggtccagga agatctgccg cttcgggtcc 1740 atgagcagct tggcgttcat ggtcttgaac tcgacctgat acatcttcag atcttcgtag 1800 atcgaggaaa gacagagcgc catcatgaat gaggtctttc tcgacgccag gcagctgccg 1860 ttagtgataa agcttgtctc gcgggagttc agacacgatt cgttcttggt cagttccagc 1920 ggcaggcagg cttccacggt cgaggtcttg tccttggtga tgtcctcgtg atcaatttct 1980 tccgaggtgc aggggtagaa ctcaagggtc tggcgggcct tctgcaacat gttcgacaca 2040 gccctcagga ggttttggga gtggtgtagg cacgggaaca ttccagggtc gggggttgcc 2100 acagggaggt tccgggaacc tcctccggag cctcctcctg aacctccgcc tgatccgcca 2160 ccggaacaag gcacgctggc ccattcgctc caggaggacg agtagtatct atcctgcgcc 2220 cggacgctga ttgacgcgtt cttccgacaa atcacagtgg cggaggtttt gtcggtgaac 2280 acccggtctt tcttctcccg tttggacttt ccctgcactt gcacacagaa agtgagcgag 2340 aagtatgagt gcggggtgct ccaagtgtct ggatattccc aagacacttc cacttggcgg 2400 gagttcttga gtggcttcag ctgcaagttc ttgggggggt caggcttgat gatgtcgcgg 2460 ataaagaagg aggaagtgta gttctcgtat ttcagcttat gcacggcatc gaccatgacc 2520 tcgataggca gggactcttc cgcggcaggg caggcgctgt cctcctggca ttccacggag 2580 tactcatatt ccttgttgtc tcccctgact ctctcggcgg acagagtggc ggctccacag 2640 gtcacgccct gaggatcgct tgatccccgt gacgacttca cggagaaagt caggtcggtg 2700 gagattgtcg tcagccacca acaggtgaac cgaccgctgt agttcttggc ttcgcagcgg 2760 aggaaggtct tgttcttcgg ttctttttgg tccttgagga tgtcagtgga ccagattcca 2820 tcctctttct tgtgcagcag cagcagggag tgggacagca cttcgccacc cttgtggcaa 2880 gtgtactggc ccgcgtcgcc gaactccttg acttgaatgg tcagggtctt tccgcttccg 2940 agcacctcgg agctctgatc cagggtccag gttatgccgt cctcttctgg cgtatcgcaa 3000 gtcagcacga ccatttctcc aggggcgtcc gggtaccaat ccagctcgac cacgtagacg 3060 tccttcttca gttcccaaat ggcgaccaga ggggaagcga ggaacacaag ggagaaccag 3120 gagatgacga gttgctgatg gcacatcatg gtggcgacac cggtacgcgt tggcccccat 3180 tatataccct ctagaactag ttatccactc cgtgtaaggg agagtgagcc tcttacgaat 3240 cttcggcgtc gactgcttca ttccgaggcg actgatacct tcggcgtcga ctgcttcata 3300 cgaaggcagt ccgattcttc ggcgtcgact gcttcaacct ttactgagac gggacttcgg 3360 cgtcgactgc ttcaaaggcg ttgcgaatcc tcatgcgatt gttacgaaac ccgttaatta 3420 aagagcgaga ttccgtctca aagaaaaaaa aagtaatgaa atgaataaaa tgagtcctag 3480 agccagtaaa tgtcgtaaat gtctcagcta gtcaggtagt aaaaggtctc aactaggcag 3540 tggcagagca ggattcaaat tcagggctgt tgtgatgcct ccgcagactc tgagcgccac 3600 ctggtggtaa tttgtctgtg cctcttctga cgtggaagaa cagcaactaa cacactaaca 3660 cggcatttac tatgggccag ccattgtcca tctagatggc cgataaaata aaagatttta 3720 tttagtctcc agaaaaaggg gggaatgaaa gaccccacct gtaggtttgg caagctagct 3780 gcagtaacgc cattttgcaa ggcatggaaa aataccaaac caagaataga gaagttcaga 3840 tcaagggcgg gtacatgaaa atagctaacg ttgggccaaa caggatatct gcggtgagca 3900 gtttcggccc cggcccgggg ccaagaacag atggtcaccg cagtttcggc cccggcccga 3960 ggccaagaac agatggtccc cagatatggc ccaaccctca gcagtttctt aagacccatc 4020 agatgtttcc aggctccccc aaggacctga aatgaccctg cgccttattt gaattaacca 4080 atcagcctgc ttctcgcttc tgttcgcgcg cttctgcttc ccgagctcta taaaagagct 4140 cacaacccct cactcggcgc gccagtcctc cgacagactg agtcgcccgg gggatccgcc 4200 accatgtcta gacctggcga gaggcccttc cagtgccgga tctgcatgcg gaacttcagc 4260 aacatgagca acctgaccag acacacccgg acacacacag gcgagaagcc ttttcagtgc 4320 agaatctgta tgcgcaattt ctccgacaga agcgtgctgc ggagacacct gagaacccac 4380 accggcagcc agaaaccatt ccagtgtcgc atctgtatga gaaactttag cgacccctcc 4440 aatctggccc ggcacaccag aacacatacc ggggaaaaac cctttcagtg taggatatgc 4500 atgaggaatt tttccgaccg gtccagcctg aggcggcacc tgaggacaca tactggctcc 4560 caaaagccgt tccaatgtcg gatatgtatg cgcaacttta gccagagcgg caccctgcac 4620 agacacacaa gaacccatac tggcgagaaa cctttccaat gtagaatctg catgcgaaat 4680 ttttcccagc ggcctaatct gaccaggcat ctgaggaccc acctgagagg atctacctgc 4740 agggatgagt ttcccaccat ggtgtttcct tctgggcaga tcagccaggc ctcggccttg 4800 gccccggccc ctccccaagt cctgccccag gctccagccc ctgcccctgc tccagccatg 4860 gtatcagctc tggcccaggc cccagcccct gtcccagtcc tagccccagg ccctcctcag 4920 gctgtggccc cacctgcccc caagcccacc caggctgggg aaggaacgct gtcagaggcc 4980 ctgctgcagc tgcagtttga tgatgaagac ctgggggcct tgcttggcaa cagcacagac 5040 ccagctgtgt tcacagacct ggcatccgtc gacaactccg agtttcagca gctgctgaac 5100 cagggcatac ctgtggcccc ccacacaact gagcccatgc tgatggagta ccctgaggct 5160 ataactcgcc tagtgacagg ggcccagagg ccccccgacc cagctcctgc tccactgggg 5220 gccccggggc tccccaatgg cctcctttca ggagatgaag acttctcctc cattgcggac 5280 atggacttct cagccctgct gagtcagatc agctcccaat tgtgcgtacg cggatcctct 5340 gctggagaca tgagagctgc caacctttgg ccaagcccgc tcatgatcaa acgctctaag 5400 aagaacagcc tggccttgtc cctgacggcc gaccagatgg tcagtgcctt gttggatgct 5460 gagcccccca tactctattc cgagtatgat cctaccagac ccttcagtga agcttcgatg 5520 atgggcttac tgaccaacct ggcagacagg gagctggttc acatgatcaa ctgggcgaag 5580 agggtgccag gctttgtgga tttgaccctc catgatcagg tccaccttct agaatgtgcc 5640 tggctagaga tcctgatgat tggtctcgtc tggcgctcca tggagcaccc agtgaagcta 5700 ctgtttgctc ctaacttggt gttggacagg gacgagggaa aatgtgtaga gggcctggtg 5760 gagatcttcg acatgctgct ggctacatca tctcggttcc gcatgatgaa tctgcaggga 5820 gaggagtttg tgtgcctcaa atctattatt ttgcttaatt ctggagtgta cacatttctg 5880 cccagcaccc tgaagtctct ggaagagaag gaccatatcc accgagtcct ggacaagatc 5940 acagacactt tgatccacct gatggccaag gcaggcctga ccctgcagca gcagcaccag 6000 cggctggccc agctcctcct catcctctcc cacatcaggc acatgagtaa caaaggcatg 6060 gagctgctgt acagcatgaa gtgcaagaac gtggtgcccc tctatgacct gctgctggag 6120 gcggcggacg cccaccgcct acatgcgccc actagccgtg gaggggcatc cgtggaggag 6180 acggaccaaa gccacttggc cactgcgggc tctacttcat cgcattcctt gcaaaagtat 6240 tacatcacgg gggaggcaga gggtttccct gccacataag tcgacaatca acctctggat 6300 tacaaaattt gtgaaagatt gactggtatt cttaactatg ttgctccttt tacgctatgt 6360 ggatacgctg ctttaatgcc tttgtatcat gctattgctt cccgtatggc tttcattttc 6420 tcctccttgt ataaatcctg gttgctgtct ctttatgagg agttgtggcc cgttgtcagg 6480 caacgtggcg tggtgtgcac tgtgtttgct gacgcaaccc ccactggttg gggcattgcc 6540 accacctgtc agctcctttc cgggactttc gctttccccc tccctattgc cacggcggaa 6600 ctcatcgccg cctgccttgc ccgctgctgg acaggggctc ggctgttggg cactgacaat 6660 tccgtggtgt tgtcggggaa atcatcgtcc tttccttggc tgctcgcctg tgttgccacc 6720 tggattctgc gcgggacgtc cttctgctac gtcccttcgg ccctcaatcc agcggacctt 6780 ccttcccgcg gcctgctgcc ggctctgcgg cctcttccgc gtctacgcct tcgccctcag 6840 acgagtcgga tctccctttg ggccgcctcc ccgcgatatc agtggtccag gctctagttt 6900 tgactcaaca atatcaccag ctgaagccta tagagtacga gccatagata aaataaaaga 6960 ttttatttag tctccagaaa aaggggggaa tgaaagaccc cacctgtagg tttggcaagc 7020 tagcaataaa agagcccaca acccctcact cggggcgcca gtcctccgat tgactgagtc 7080 gcccggccgc ttcgagcaga catgataaga tacattgatg agtttggaca aaccacaact 7140 agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc tttatttgta 7200 accattataa gctgcaataa acaagttaac aacaacaatt gcattcattt tatgtttcag 7260 gttcaggggg agatgtggga ggttttttaa agcaagtaaa acctctacaa atgtggtaaa 7320 atcgataagg atcgggtacc cgtgtatcca ataaaccctc ttgcagttgc atccgacttg 7380 tggtctcgct gttccttggg agggtctcct ctgagtgatt gactacccgt cagcgggggt 7440 ctttcacaca tgcagcatgt atcaaaatta atttggtttt ttttcttaag ctgtgccttc 7500 tagttgccag ccatctgttg tttgcccctc ccccgtgcct tccttgaccc tggaaggtgc 7560 cactcccact gtcctttcct aataaaatga ggaaattgca tcgcattgtc tgagtaggtg 7620 tcattctatt ctggggggtg gggtggggca ggacagcaag ggggaggatt gggaagacaa 7680 tagcaggcat gctggggatg cggtgggctc tatggagatc ccgcggtacc tcgcgaatgc 7740 atctagatcc aatggccttt ttggcccaga catgataaga tacattgatg agtttggaca 7800 aaccacaact agaatgcagt gaaaaaaatg ctttatttgt gaaatttgtg atgctattgc 7860 tttatttgta accattataa gctgcaataa acaagttgcg gccgcttagc cctcccacac 7920 ataaccagag ggcagcaatt cacgaatccc aactgccgtc ggctgtccat cactgtcctt 7980 cactatggct ttgatcccag gatgcagatc gagaagcacc tgtcggcacc gtccgcaggg 8040 gctcaagatg cccctgttct catttccgat cgcgacgata caagtcaggt tgccagctgc 8100 cgcagcagca gcagtgccca gcaccacgag ttctgcacaa ggtcccccag taaaatgata 8160 tacattgaca ccagtgaaga tgcggccgtc gctagagaga gctgcgctgg cgacgctgta 8220 gtcttcagag atggggatgc tgttgattgt agccgttgct ctttcaatga gggtggattc 8280 ttcttgagac aaaggcttgg ccatgcggcc gccgctcggt gttcgaggcc acacgcgtca 8340 ccttaatatg cgaagtggac ctcggaccgc gccgccccga ctgcatctgc gtgttcgaat 8400 tcgccaatga caagacgctg ggcggggttt gtgtcatcat agaactaaag acatgcaaat 8460 atatttcttc cggggggtac cggccttttt ggccattgga tcggatctgg ccaaaaaggc 8520 ccttaagtat ttacattaaa tggccatagt acttaaagtt acattggctt ccttgaaata 8580 aacatggagt attcagaatg tgtcataaat atttctaatt ttaagatagt atctccattg 8640 gctttctact ttttctttta tttttttttg tcctctgtct tccatttgtt gttgttgttg 8700 tttgtttgtt tgtttgttgg ttggttggtt aatttttttt taaagatcct acactatagt 8760 tcaagctaga ctattagcta ctctgtaacc cagggtgacc ttgaagtcat gggtagcctg 8820 ctgttttagc cttcccacat ctaagattac aggtatgagc tatcattttt ggtatattga 8880 ttgattgatt gattgatgtg tgtgtgtgtg attgtgtttg tgtgtgtgat tgtgtatatg 8940 tgtgtatggt tgtgtgtgat tgtgtgtatg tatgtttgtg tgtgattgtg tgtgtgtgat 9000 tgtgcatgtg tgtgtgtgtg attgtgttta tgtgtatgat tgtgtgtgtg tgtgtgtgtg 9060 tgtgtgtgtg tgtgtgtgtg tgtgtgttgt gtatatatat ttatggtagt gagaggcaac 9120 gctccggctc aggtgtcagg ttggtttttg agacagagtc tttcacttag cttggaattc 9180 actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc aacttaatcg 9240 ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc gcaccgatcg 9300 cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt attttctcct 9360 tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa tctgctctga 9420 tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc cctgacgggc 9480 ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga gctgcatgtg 9540 tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg tgatacgcct 9600 atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg gcacttttcg 9660 gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa atatgtatcc 9720 gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga agagtatgag 9780 tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc ttcctgtttt 9840 tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt 9900 gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc gccccgaaga 9960 acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat tatcccgtat 10020 tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg acttggttga 10080 gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag aattatgcag 10140 tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa cgatcggagg 10200 accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc gccttgatcg 10260 ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca cgatgcctgt 10320 agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc tagcttcccg 10380 gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc tgcgctcggc 10440 ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg 10500 tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta tctacacgac 10560 ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag gtgcctcact 10620 gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga ttgatttaaa 10680 acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc tcatgaccaa 10740 aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa agatcaaagg 10800 atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc 10860 gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc cgaaggtaac 10920 tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt agttaggcca 10980 ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc tgttaccagt 11040 ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac gatagttacc 11100 ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca gcttggagcg 11160 aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc 11220 cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag gagagcgcac 11280 gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt ttcgccacct 11340 ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc 11400 cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc acatgttctt 11460 tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt gagctgatac 11520 cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg 11580 cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca gctggcacga 11640 caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga gttagctcac 11700 tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt gtggaattgt 11760 gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcc 11809 <210> 74 <211> 123 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 74 agcggcggag gtggtagcgg aggcggagga tctggaatta cacagggact cgccgtgtct 60 acaatctcca gcttctttgg tggcggtagt ggcggcggtg gcagtggcgg tggatctctt 120 caa 123 <210> 75 <211> 41 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 75 Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Ile Thr Gln Gly 1 5 10 15 Leu Ala Val Ser Thr Ile Ser Ser Phe Phe Gly Gly Gly Ser Gly Gly 20 25 30 Gly Gly Ser Gly Gly Gly Ser Leu Gln 35 40 <210> 76 <211> 138 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 76 ctgctgccaa gctgggccat cacactgatc tccgtgaacg gcatcttcgt gatctgttgc 60 ctgacctact gcttcgcccc tcggtgcaga gagcggagaa gaaacgaacg gctgcggaga 120 gaatctgtgc ggcctgtg 138 <210> 77 <211> 46 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 77 Leu Leu Pro Ser Trp Ala Ile Thr Leu Ile Ser Val Asn Gly Ile Phe 1 5 10 15 Val Ile Cys Cys Leu Thr Tyr Cys Phe Ala Pro Arg Cys Arg Glu Arg 20 25 30 Arg Arg Asn Glu Arg Leu Arg Arg Glu Ser Val Arg Pro Val 35 40 45 <210> 78 <211> 330 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 78 gtgtgtcagt tagggtgtgg aaagtcccca ggctccccag caggcagaag tatgcaaagc 60 atgcatctca attagtcagc aaccaggtgt ggaaagtccc caggctcccc agcaggcaga 120 agtatgcaaa gcatgcatct caattagtca gcaaccatag tcccgcccct aactccgccc 180 atcccgcccc taactccgcc cagttccgcc cattctccgc cccatggctg actaattttt 240 tttatttatg cagaggccga ggccgcctct gcctctgagc tattccagaa gtagtgagga 300 ggcttttttg gaggcctagg cttttgcaaa 330 <210> 79 <211> 11892 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 79 aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540 caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600 cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660 tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720 ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780 gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840 gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900 acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960 tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020 ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080 tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140 atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200 ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260 ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320 tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380 ggcaaacaac agatggctgg caactagaag gcacagttac ttacacaggc cgcacagatt 1440 ctctccgcag ccgttcgttt cttctccgct ctctgcaccg aggggcgaag cagtaggtca 1500 ggcaacagat cacgaagatg ccgttcacgg agatcagtgt gatggcccag cttggcagca 1560 gttgaagaga tccaccgcca ctgccaccgc cgccactacc gccaccaaag aagctggaga 1620 ttgtagacac ggcgagtccc tgtgtaattc cagatcctcc gcctccgcta ccacctccgc 1680 cgctagaggc gttcaggtag ctcatcactc tgtcgatggt cacggctctg atccggaagg 1740 cgtgcagcag gatgcacagc ttgatcttgg tcttgtagaa gtcgggttct tccaggctag 1800 acttctgggg cactgtctcg ctgttgaagt tcagggcctg catcagctcg tcgatcacgg 1860 ccagcatatt ctggtccagg aagatctgcc gcttggggtc catcagcagc ttggcgttca 1920 tggtcttgaa ttccacctgg tacatcttca ggtcctcgta gatgctgctc aggcacaggg 1980 ccatcatgaa ggaggtcttt ctgctggcca ggcaagagcc gttggtgatg aagctggttt 2040 cccggctgtt caggcagctc tcgttcttgg tcagttccag aggcaggcag gcttccacgg 2100 tgctggtctt atccttggtg atgtcctcgt ggtcgatttc ctcgctggtg caggggtaga 2160 attccagggt ctgtctggcc ttctgcagca tgttggacac ggctctcagc aggttctggc 2220 tgtggtgcag acaagggaac atgccaggat caggagtggc cacaggcagg tttctagatc 2280 cgccgccaga tccaccacct gatccgccac cgcttcctcc gccagaacat ggcacgctgg 2340 cccattcgct ccaagagctg ctgtagtacc ggtcctgggc tctgacgctg atgctggcgt 2400 tctttctgca gatcacggtg gcgctggtct tgtcggtgaa cacccggtcc tttttctcgc 2460 gcttggactt gccctgcact tgcacgcaaa aggtcaggct gaagtagctg tggggtgtag 2520 accaggtgtc ggggtactcc caggacactt ccacctgtct gctgttcttc agaggcttca 2580 gctgcaggtt ctttggagga tcgggcttga tgatgtcccg gatgaaaaag ctggaggtgt 2640 agttctcgta cttcagcttg tgcacggcgt ccaccatcac ttcgataggc agagactctt 2700 cggcggctgg acaggcgctg tcctcttggc attccacgct gtactcgtat tctttgttgt 2760 cgccccgcac tctttcggca gacagtgtag cggcgccaca tgtaacgccc tgaggatcac 2820 tgctgcctct gctggacttc acgctgaagg tcaggtcggt gctgatggtg gtcagccacc 2880 aacatgtgaa ccggccgctg tagttcttgg cctcgcatct caggaaggtc ttgttcttgg 2940 gctctttctg gtccttcagg atgtcggtgc tccaaatgcc atcctctttc ttgtggagca 3000 gcagcaggct gtggctcagc acttctccgc ctttgtgaca ggtgtactgg ccggcgtcgc 3060 caaactcttt cacttggatg gtcagggtct tgccgctgcc gagcacctcg ctagactgat 3120 ccagtgtcca ggtgatgccg tcctcttcag gggtatcgca ggtcagcacc accatctcgc 3180 caggagcatc gggataccag tccagttcca ccacgtacac gtctttcttc agctcccaga 3240 tggccaccag aggagaggcc aggaacacca ggctgaacca gctgatgacc agctgctggt 3300 gacacatcat ggtggcgaca ccggtacgcg ttggccccca ttatataccc tctagaacta 3360 gttatccact ccgtgtaagg gagagtgagc ctcttacgaa tcttcggcgt cgactgcttc 3420 attccgaggc gactgatacc ttcggcgtcg actgcttcat acgaaggcag tccgattctt 3480 cggcgtcgac tgcttcaacc tttactgaga cgggacttcg gcgtcgactg cttcaaaggc 3540 gttgcgaatc ctcatgcgat tgttacgaaa cccgttaatt aaagagcgag attccgtctc 3600 aaagaaaaaa aaagtaatga aatgaataaa atgagtccta gagccagtaa atgtcgtaaa 3660 tgtctcagct agtcaggtag taaaaggtct caactaggca gtggcagagc aggattcaaa 3720 ttcagggctg ttgtgatgcc tccgcagact ctgagcgcca cctggtggta atttgtctgt 3780 gcctcttctg acgtggaaga acagcaacta acacactaac acggcattta ctatgggcca 3840 gccattgtcc atctagatgg ccgataaaat aaaagatttt atttagtctc cagaaaaagg 3900 ggggaatgaa agaccccacc tgtaggtttg gcaagctagc tgcagtgtgt cagttagggt 3960 gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 4020 cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 4080 atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 4140 cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 4200 ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 4260 taggcttttg caaaggatcc gccaccatgt ctagacctgg cgagaggccc ttccagtgcc 4320 ggatctgcat gcggaacttc agcaacatga gcaacctgac cagacacacc cggacacaca 4380 caggcgagaa gccttttcag tgcagaatct gtatgcgcaa tttctccgac agaagcgtgc 4440 tgcggagaca cctgagaacc cacaccggca gccagaaacc attccagtgt cgcatctgta 4500 tgagaaactt tagcgacccc tccaatctgg cccggcacac cagaacacat accggggaaa 4560 aaccctttca gtgtaggata tgcatgagga atttttccga ccggtccagc ctgaggcggc 4620 acctgaggac acatactggc tcccaaaagc cgttccaatg tcggatatgt atgcgcaact 4680 ttagccagag cggcaccctg cacagacaca caagaaccca tactggcgag aaacctttcc 4740 aatgtagaat ctgcatgcga aatttttccc agcggcctaa tctgaccagg catctgagga 4800 cccacctgag aggatctacc tgcagggatg agtttcccac catggtgttt ccttctgggc 4860 agatcagcca ggcctcggcc ttggccccgg cccctcccca agtcctgccc caggctccag 4920 cccctgcccc tgctccagcc atggtatcag ctctggccca ggccccagcc cctgtcccag 4980 tcctagcccc aggccctcct caggctgtgg ccccacctgc ccccaagccc acccaggctg 5040 gggaaggaac gctgtcagag gccctgctgc agctgcagtt tgatgatgaa gacctggggg 5100 ccttgcttgg caacagcaca gacccagctg tgttcacaga cctggcatcc gtcgacaact 5160 ccgagtttca gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca 5220 tgctgatgga gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg 5280 acccagctcc tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg 5340 aagacttctc ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccc 5400 aattgtgcgt acgcggatcc tctgctggag acatgagagc tgccaacctt tggccaagcc 5460 cgctcatgat caaacgctct aagaagaaca gcctggcctt gtccctgacg gccgaccaga 5520 tggtcagtgc cttgttggat gctgagcccc ccatactcta ttccgagtat gatcctacca 5580 gacccttcag tgaagcttcg atgatgggct tactgaccaa cctggcagac agggagctgg 5640 ttcacatgat caactgggcg aagagggtgc caggctttgt ggatttgacc ctccatgatc 5700 aggtccacct tctagaatgt gcctggatgg agatcctgat gattggtgtg gtctggcgct 5760 ccatggagca cccagtgaag ctactgtttg ctcctaactt gctcttggac agggaccagg 5820 gaaaatgtgt agagggcctg gtggagatct tcgacatgct gctggctaca tcatctcggt 5880 tccgcatgat gaatctgcag ggagaggagt ttgtgtgcct caaatctatt attttgctta 5940 attctggagt gtacacattt ctgcccagca ccctgaagtc tctggaagag aaggaccata 6000 tccaccgagt cctggacaag atcacagaca ctttgatcca cctgatggcc aaggcaggcc 6060 tgaccctgca gcagcagcac cagcggctgg cccagctcct cctcatcctc tcccacatca 6120 ggcacatgag taacaaaggc atggagctgc tgtacagcat gaagtgcaag aacgtggtgc 6180 ccctctatga cctgctgctg gaggcggcgg acgcccaccg cctacatgcg cccactagcc 6240 gtggaggggc atccgtggag gagacggacc aaagccactt ggccactgcg ggctctactt 6300 catcgcattc cttgcaaaag tattacatca cgggggaggc agagggtttc cctgccacat 6360 aagtcgacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 6420 atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 6480 cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 6540 aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 6600 cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 6660 ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 6720 ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt 6780 ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 6840 cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 6900 cgcgtctacg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcgat 6960 atcagtggtc caggctctag ttttgactca acaatatcac cagctgaagc ctatagagta 7020 cgagccatag ataaaataaa agattttatt tagtctccag aaaaaggggg gaatgaaaga 7080 ccccacctgt aggtttggca agctagcaat aaaagagccc acaacccctc actcggggcg 7140 ccagtcctcc gattgactga gtcgcccggc cgcttcgagc agacatgata agatacattg 7200 atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 7260 gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 7320 attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 7380 aaaacctcta caaatgtggt aaaatcgata aggatcgggt acccgtgtat ccaataaacc 7440 ctcttgcagt tgcatccgac ttgtggtctc gctgttcctt gggagggtct cctctgagtg 7500 attgactacc cgtcagcggg ggtctttcac acatgcagca tgtatcaaaa ttaatttggt 7560 tttttttctt aagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 7620 ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 7680 gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 7740 aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggag 7800 atcccgcggt acctcgcgaa tgcatctaga tccaatggcc tttttggccc agacatgata 7860 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 7920 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 7980 gcggccgctt agccctccca cacataacca gagggcagca attcacgaat cccaactgcc 8040 gtcggctgtc catcactgtc cttcactatg gctttgatcc caggatgcag atcgagaagc 8100 acctgtcggc accgtccgca ggggctcaag atgcccctgt tctcatttcc gatcgcgacg 8160 atacaagtca ggttgccagc tgccgcagca gcagcagtgc ccagcaccac gagttctgca 8220 caaggtcccc cagtaaaatg atatacattg acaccagtga agatgcggcc gtcgctagag 8280 agagctgcgc tggcgacgct gtagtcttca gagatgggga tgctgttgat tgtagccgtt 8340 gctctttcaa tgagggtgga ttcttcttga gacaaaggct tggccatgcg gccgccgctc 8400 ggtgttcgag gccacacgcg tcaccttaat atgcgaagtg gacctcggac cgcgccgccc 8460 cgactgcatc tgcgtgttcg aattcgccaa tgacaagacg ctgggcgggg tttgtgtcat 8520 catagaacta aagacatgca aatatatttc ttccgggggg taccggcctt tttggccatt 8580 ggatcggatc tggccaaaaa ggcccttaag tatttacatt aaatggccat agtacttaaa 8640 gttacattgg cttccttgaa ataaacatgg agtattcaga atgtgtcata aatatttcta 8700 attttaagat agtatctcca ttggctttct actttttctt ttattttttt ttgtcctctg 8760 tcttccattt gttgttgttg ttgtttgttt gtttgtttgt tggttggttg gttaattttt 8820 ttttaaagat cctacactat agttcaagct agactattag ctactctgta acccagggtg 8880 accttgaagt catgggtagc ctgctgtttt agccttccca catctaagat tacaggtatg 8940 agctatcatt tttggtatat tgattgattg attgattgat gtgtgtgtgt gtgattgtgt 9000 ttgtgtgtgt gattgtgtat atgtgtgtat ggttgtgtgt gattgtgtgt atgtatgttt 9060 gtgtgtgatt gtgtgtgtgt gattgtgcat gtgtgtgtgt gtgattgtgt ttatgtgtat 9120 gattgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt tgtgtatata 9180 tatttatggt agtgagaggc aacgctccgg ctcaggtgtc aggttggttt ttgagacaga 9240 gtctttcact tagcttggaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 9300 cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 9360 agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 9420 cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc 9480 actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 9540 cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 9600 accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 9660 cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 9720 tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 9780 taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 9840 tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 9900 gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 9960 gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 10020 cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 10080 tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 10140 tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 10200 atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 10260 ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 10320 gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 10380 gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 10440 gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 10500 gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 10560 gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 10620 cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 10680 atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 10740 tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 10800 ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 10860 gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 10920 tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 10980 ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 11040 ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 11100 gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 11160 ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 11220 tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 11280 ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 11340 agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 11400 agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 11460 gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 11520 tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 11580 accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 11640 gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg 11700 attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac 11760 gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg 11820 gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac 11880 catgattacg cc 11892 <210> 80 <211> 11892 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 80 aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540 caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600 cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660 tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720 ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780 gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840 gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900 acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960 tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020 ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080 tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140 atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200 ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260 ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320 tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380 ggcaaacaac agatggctgg caactagaag gcacagttac ttacacaggc cgcacagatt 1440 ctctccgcag ccgttcgttt cttctccgct ctctgcaccg aggggcgaag cagtaggtca 1500 ggcaacagat cacgaagatg ccgttcacgg agatcagtgt gatggcccag cttggcagca 1560 gttgaagaga tccaccgcca ctgccaccgc cgccactacc gccaccaaag aagctggaga 1620 ttgtagacac ggcgagtccc tgtgtaattc cagatcctcc gcctccgcta ccacctccgc 1680 cgctagaggc gttcaggtag ctcatcactc tgtcgatggt cacggctctg atccggaagg 1740 cgtgcagcag gatgcacagc ttgatcttgg tcttgtagaa gtcgggttct tccaggctag 1800 acttctgggg cactgtctcg ctgttgaagt tcagggcctg catcagctcg tcgatcacgg 1860 ccagcatatt ctggtccagg aagatctgcc gcttggggtc catcagcagc ttggcgttca 1920 tggtcttgaa ttccacctgg tacatcttca ggtcctcgta gatgctgctc aggcacaggg 1980 ccatcatgaa ggaggtcttt ctgctggcca ggcaagagcc gttggtgatg aagctggttt 2040 cccggctgtt caggcagctc tcgttcttgg tcagttccag aggcaggcag gcttccacgg 2100 tgctggtctt atccttggtg atgtcctcgt ggtcgatttc ctcgctggtg caggggtaga 2160 attccagggt ctgtctggcc ttctgcagca tgttggacac ggctctcagc aggttctggc 2220 tgtggtgcag acaagggaac atgccaggat caggagtggc cacaggcagg tttctagatc 2280 cgccgccaga tccaccacct gatccgccac cgcttcctcc gccagaacat ggcacgctgg 2340 cccattcgct ccaagagctg ctgtagtacc ggtcctgggc tctgacgctg atgctggcgt 2400 tctttctgca gatcacggtg gcgctggtct tgtcggtgaa cacccggtcc tttttctcgc 2460 gcttggactt gccctgcact tgcacgcaaa aggtcaggct gaagtagctg tggggtgtag 2520 accaggtgtc ggggtactcc caggacactt ccacctgtct gctgttcttc agaggcttca 2580 gctgcaggtt ctttggagga tcgggcttga tgatgtcccg gatgaaaaag ctggaggtgt 2640 agttctcgta cttcagcttg tgcacggcgt ccaccatcac ttcgataggc agagactctt 2700 cggcggctgg acaggcgctg tcctcttggc attccacgct gtactcgtat tctttgttgt 2760 cgccccgcac tctttcggca gacagtgtag cggcgccaca tgtaacgccc tgaggatcac 2820 tgctgcctct gctggacttc acgctgaagg tcaggtcggt gctgatggtg gtcagccacc 2880 aacatgtgaa ccggccgctg tagttcttgg cctcgcatct caggaaggtc ttgttcttgg 2940 gctctttctg gtccttcagg atgtcggtgc tccaaatgcc atcctctttc ttgtggagca 3000 gcagcaggct gtggctcagc acttctccgc ctttgtgaca ggtgtactgg ccggcgtcgc 3060 caaactcttt cacttggatg gtcagggtct tgccgctgcc gagcacctcg ctagactgat 3120 ccagtgtcca ggtgatgccg tcctcttcag gggtatcgca ggtcagcacc accatctcgc 3180 caggagcatc gggataccag tccagttcca ccacgtacac gtctttcttc agctcccaga 3240 tggccaccag aggagaggcc aggaacacca ggctgaacca gctgatgacc agctgctggt 3300 gacacatcat ggtggcgaca ccggtacgcg ttggccccca ttatataccc tctagaacta 3360 gttatccact ccgtgtaagg gagagtgagc ctcttacgaa tcttcggcgt cgactgcttc 3420 attccgaggc gactgatacc ttcggcgtcg actgcttcat acgaaggcag tccgattctt 3480 cggcgtcgac tgcttcaacc tttactgaga cgggacttcg gcgtcgactg cttcaaaggc 3540 gttgcgaatc ctcatgcgat tgttacgaaa cccgttaatt aaagagcgag attccgtctc 3600 aaagaaaaaa aaagtaatga aatgaataaa atgagtccta gagccagtaa atgtcgtaaa 3660 tgtctcagct agtcaggtag taaaaggtct caactaggca gtggcagagc aggattcaaa 3720 ttcagggctg ttgtgatgcc tccgcagact ctgagcgcca cctggtggta atttgtctgt 3780 gcctcttctg acgtggaaga acagcaacta acacactaac acggcattta ctatgggcca 3840 gccattgtcc atctagatgg ccgataaaat aaaagatttt atttagtctc cagaaaaagg 3900 ggggaatgaa agaccccacc tgtaggtttg gcaagctagc tgcagtgtgt cagttagggt 3960 gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 4020 cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 4080 atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 4140 cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 4200 ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 4260 taggcttttg caaaggatcc gccaccatgt ctagacctgg cgagaggccc ttccagtgcc 4320 ggatctgcat gcggaacttc agcaacatga gcaacctgac cagacacacc cggacacaca 4380 caggcgagaa gccttttcag tgcagaatct gtatgcgcaa tttctccgac agaagcgtgc 4440 tgcggagaca cctgagaacc cacaccggca gccagaaacc attccagtgt cgcatctgta 4500 tgagaaactt tagcgacccc tccaatctgg cccggcacac cagaacacat accggggaaa 4560 aaccctttca gtgtaggata tgcatgagga atttttccga ccggtccagc ctgaggcggc 4620 acctgaggac acatactggc tcccaaaagc cgttccaatg tcggatatgt atgcgcaact 4680 ttagccagag cggcaccctg cacagacaca caagaaccca tactggcgag aaacctttcc 4740 aatgtagaat ctgcatgcga aatttttccc agcggcctaa tctgaccagg catctgagga 4800 cccacctgag aggatctacc tgcagggatg agtttcccac catggtgttt ccttctgggc 4860 agatcagcca ggcctcggcc ttggccccgg cccctcccca agtcctgccc caggctccag 4920 cccctgcccc tgctccagcc atggtatcag ctctggccca ggccccagcc cctgtcccag 4980 tcctagcccc aggccctcct caggctgtgg ccccacctgc ccccaagccc acccaggctg 5040 gggaaggaac gctgtcagag gccctgctgc agctgcagtt tgatgatgaa gacctggggg 5100 ccttgcttgg caacagcaca gacccagctg tgttcacaga cctggcatcc gtcgacaact 5160 ccgagtttca gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca 5220 tgctgatgga gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg 5280 acccagctcc tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg 5340 aagacttctc ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccc 5400 aattgtgcgt acgcggatcc tctgctggag acatgagagc tgccaacctt tggccaagcc 5460 cgctcatgat caaacgctct aagaagaaca gcctggcctt gtccctgacg gccgaccaga 5520 tggtcagtgc cttgttggat gctgagcccc ccatactcta ttccgagtat gatcctacca 5580 gacccttcag tgaagcttcg atgatgggct tactgaccaa cctggcagac agggagatcg 5640 ttcacatgat caactgggcg aagagggtgc caggctttgt ggatttgacc ctccatgatc 5700 aggtccacct tctagaatgt gcctggctag agatcctgat gattggtgtg gtctggcgct 5760 ccatggagca cccagtgaag ctactgtttg ctcctaactt gctcttggac agggaccagg 5820 gaaaatgtgt agagggcctg gtggagatct tcgacatgct gctggctaca tcatctcggt 5880 tccgcatgat gaatctgcag ggagaggagt ttgtgtgcct caaatctatt attttgctta 5940 attctggagt gtacacattt ctgcccagca ccctgaagtc tctggaagag aaggaccata 6000 tccaccgagt cctggacaag atcacagaca ctttgatcca cctgatggcc aaggcaggcc 6060 tgaccctgca gcagcagcac cagcggctgg cccagctcct cctcatcctc tcccacatca 6120 ggcacgccag taacaaaggc atggagctgc tgtacagcat gaagtgcaag aacgtggtgc 6180 ccctctatga cctgctgctg gaggcggcgg acgcccaccg cctacatgcg cccactagcc 6240 gtggaggggc atccgtggag gagacggacc aaagccactt ggccactgcg ggctctactt 6300 catcgcattc cttgcaaaag tattacatca cgggggaggc agagggtttc cctgccacat 6360 aagtcgacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 6420 atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 6480 cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 6540 aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 6600 cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 6660 ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 6720 ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt 6780 ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 6840 cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 6900 cgcgtctacg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcgat 6960 atcagtggtc caggctctag ttttgactca acaatatcac cagctgaagc ctatagagta 7020 cgagccatag ataaaataaa agattttatt tagtctccag aaaaaggggg gaatgaaaga 7080 ccccacctgt aggtttggca agctagcaat aaaagagccc acaacccctc actcggggcg 7140 ccagtcctcc gattgactga gtcgcccggc cgcttcgagc agacatgata agatacattg 7200 atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 7260 gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 7320 attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 7380 aaaacctcta caaatgtggt aaaatcgata aggatcgggt acccgtgtat ccaataaacc 7440 ctcttgcagt tgcatccgac ttgtggtctc gctgttcctt gggagggtct cctctgagtg 7500 attgactacc cgtcagcggg ggtctttcac acatgcagca tgtatcaaaa ttaatttggt 7560 tttttttctt aagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 7620 ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 7680 gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 7740 aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggag 7800 atcccgcggt acctcgcgaa tgcatctaga tccaatggcc tttttggccc agacatgata 7860 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 7920 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 7980 gcggccgctt agccctccca cacataacca gagggcagca attcacgaat cccaactgcc 8040 gtcggctgtc catcactgtc cttcactatg gctttgatcc caggatgcag atcgagaagc 8100 acctgtcggc accgtccgca ggggctcaag atgcccctgt tctcatttcc gatcgcgacg 8160 atacaagtca ggttgccagc tgccgcagca gcagcagtgc ccagcaccac gagttctgca 8220 caaggtcccc cagtaaaatg atatacattg acaccagtga agatgcggcc gtcgctagag 8280 agagctgcgc tggcgacgct gtagtcttca gagatgggga tgctgttgat tgtagccgtt 8340 gctctttcaa tgagggtgga ttcttcttga gacaaaggct tggccatgcg gccgccgctc 8400 ggtgttcgag gccacacgcg tcaccttaat atgcgaagtg gacctcggac cgcgccgccc 8460 cgactgcatc tgcgtgttcg aattcgccaa tgacaagacg ctgggcgggg tttgtgtcat 8520 catagaacta aagacatgca aatatatttc ttccgggggg taccggcctt tttggccatt 8580 ggatcggatc tggccaaaaa ggcccttaag tatttacatt aaatggccat agtacttaaa 8640 gttacattgg cttccttgaa ataaacatgg agtattcaga atgtgtcata aatatttcta 8700 attttaagat agtatctcca ttggctttct actttttctt ttattttttt ttgtcctctg 8760 tcttccattt gttgttgttg ttgtttgttt gtttgtttgt tggttggttg gttaattttt 8820 ttttaaagat cctacactat agttcaagct agactattag ctactctgta acccagggtg 8880 accttgaagt catgggtagc ctgctgtttt agccttccca catctaagat tacaggtatg 8940 agctatcatt tttggtatat tgattgattg attgattgat gtgtgtgtgt gtgattgtgt 9000 ttgtgtgtgt gattgtgtat atgtgtgtat ggttgtgtgt gattgtgtgt atgtatgttt 9060 gtgtgtgatt gtgtgtgtgt gattgtgcat gtgtgtgtgt gtgattgtgt ttatgtgtat 9120 gattgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt tgtgtatata 9180 tatttatggt agtgagaggc aacgctccgg ctcaggtgtc aggttggttt ttgagacaga 9240 gtctttcact tagcttggaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 9300 cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 9360 agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 9420 cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc 9480 actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 9540 cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 9600 accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 9660 cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 9720 tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 9780 taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 9840 tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 9900 gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 9960 gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 10020 cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 10080 tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 10140 tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 10200 atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 10260 ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 10320 gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 10380 gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 10440 gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 10500 gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 10560 gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 10620 cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 10680 atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 10740 tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 10800 ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 10860 gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 10920 tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 10980 ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 11040 ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 11100 gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 11160 ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 11220 tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 11280 ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 11340 agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 11400 agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 11460 gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 11520 tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 11580 accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 11640 gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg 11700 attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac 11760 gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg 11820 gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac 11880 catgattacg cc 11892 <210> 81 <211> 11892 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 81 aagcttgaat tcgagcttgc atgcctgcag gtcgttacat aacttacggt aaatggcccg 60 cctggctgac cgcccaacga cccccgccca ttgacgtcaa taatgacgta tgttcccata 120 gtaacgccaa tagggacttt ccattgacgt caatgggtgg agtatttacg gtaaactgcc 180 cacttggcag tacatcaagt gtatcatatg ccaagtacgc cccctattga cgtcaatgac 240 ggtaaatggc ccgcctggca ttatgcccag tacatgacct tatgggactt tcctacttgg 300 cagtacatct acgtattagt catcgctatt accatggtga tgcggttttg gcagtacatc 360 aatgggcgtg gatagcggtt tgactcacgg ggatttccaa gtctccaccc cattgacgtc 420 aatgggagtt tgttttggca ccaaaatcaa cgggactttc caaaatgtcg taacaactcc 480 gccccattga cgcaaatggg cggtaggcgt gtacggtggg aggtctatat aagcagagct 540 caataaaaga gcccacaacc cctcactcgg cgcgccagtc ctccgattga ctgagtcgcc 600 cgggtacccg tgtatccaat aaaccctctt gcagttgcat ccgacttgtg gtctcgctgt 660 tccttgggag ggtctcctct gagtgattga ctacccgtca gcgggggtct ttcatttggg 720 ggctcgtccg agatcgggag acccctgccc agggaccacc gacccaccac cgggaggtaa 780 gctggccagc aacttatctg tgtctgtccg attgtctagt gtctatgact gattttatgc 840 gcctgcgtcg gtactagtta gctaactagc tctgtatctg gcggacccgt ggtggaactg 900 acgagttcgg aacacccggc cgcaaccctg ggagacgtcc cagggacttc gggggccgtt 960 tttgtggccc gacctgagtc ctaaaatccc gatcgtttag gactctttgg tgcacccccc 1020 ttagaggagg gatatgtggt tctggtagga gacgagaacc taaaacagtt cccgcctccg 1080 tctgaatttt tgctttcggt ttgggaccga agccgcgccg cgcgtcttgt ctgctgcagc 1140 atcgttctgt gttgtctctg tctgactgtg tttctgtatt tgtctgaaaa tatgggcccc 1200 ccctcgagtc cccagcatgc ctgctattct cttcccaatc ctcccccttg ctgtcctgcc 1260 ccaccccacc ccccagaata gaatgacacc tactcagaca atgcgatgca atttcctcat 1320 tttattagga aaggacagtg ggagtggcac cttccagggt caaggaaggc acgggggagg 1380 ggcaaacaac agatggctgg caactagaag gcacagttac ttacacaggc cgcacagatt 1440 ctctccgcag ccgttcgttt cttctccgct ctctgcaccg aggggcgaag cagtaggtca 1500 ggcaacagat cacgaagatg ccgttcacgg agatcagtgt gatggcccag cttggcagca 1560 gttgaagaga tccaccgcca ctgccaccgc cgccactacc gccaccaaag aagctggaga 1620 ttgtagacac ggcgagtccc tgtgtaattc cagatcctcc gcctccgcta ccacctccgc 1680 cgctagaggc gttcaggtag ctcatcactc tgtcgatggt cacggctctg atccggaagg 1740 cgtgcagcag gatgcacagc ttgatcttgg tcttgtagaa gtcgggttct tccaggctag 1800 acttctgggg cactgtctcg ctgttgaagt tcagggcctg catcagctcg tcgatcacgg 1860 ccagcatatt ctggtccagg aagatctgcc gcttggggtc catcagcagc ttggcgttca 1920 tggtcttgaa ttccacctgg tacatcttca ggtcctcgta gatgctgctc aggcacaggg 1980 ccatcatgaa ggaggtcttt ctgctggcca ggcaagagcc gttggtgatg aagctggttt 2040 cccggctgtt caggcagctc tcgttcttgg tcagttccag aggcaggcag gcttccacgg 2100 tgctggtctt atccttggtg atgtcctcgt ggtcgatttc ctcgctggtg caggggtaga 2160 attccagggt ctgtctggcc ttctgcagca tgttggacac ggctctcagc aggttctggc 2220 tgtggtgcag acaagggaac atgccaggat caggagtggc cacaggcagg tttctagatc 2280 cgccgccaga tccaccacct gatccgccac cgcttcctcc gccagaacat ggcacgctgg 2340 cccattcgct ccaagagctg ctgtagtacc ggtcctgggc tctgacgctg atgctggcgt 2400 tctttctgca gatcacggtg gcgctggtct tgtcggtgaa cacccggtcc tttttctcgc 2460 gcttggactt gccctgcact tgcacgcaaa aggtcaggct gaagtagctg tggggtgtag 2520 accaggtgtc ggggtactcc caggacactt ccacctgtct gctgttcttc agaggcttca 2580 gctgcaggtt ctttggagga tcgggcttga tgatgtcccg gatgaaaaag ctggaggtgt 2640 agttctcgta cttcagcttg tgcacggcgt ccaccatcac ttcgataggc agagactctt 2700 cggcggctgg acaggcgctg tcctcttggc attccacgct gtactcgtat tctttgttgt 2760 cgccccgcac tctttcggca gacagtgtag cggcgccaca tgtaacgccc tgaggatcac 2820 tgctgcctct gctggacttc acgctgaagg tcaggtcggt gctgatggtg gtcagccacc 2880 aacatgtgaa ccggccgctg tagttcttgg cctcgcatct caggaaggtc ttgttcttgg 2940 gctctttctg gtccttcagg atgtcggtgc tccaaatgcc atcctctttc ttgtggagca 3000 gcagcaggct gtggctcagc acttctccgc ctttgtgaca ggtgtactgg ccggcgtcgc 3060 caaactcttt cacttggatg gtcagggtct tgccgctgcc gagcacctcg ctagactgat 3120 ccagtgtcca ggtgatgccg tcctcttcag gggtatcgca ggtcagcacc accatctcgc 3180 caggagcatc gggataccag tccagttcca ccacgtacac gtctttcttc agctcccaga 3240 tggccaccag aggagaggcc aggaacacca ggctgaacca gctgatgacc agctgctggt 3300 gacacatcat ggtggcgaca ccggtacgcg ttggccccca ttatataccc tctagaacta 3360 gttatccact ccgtgtaagg gagagtgagc ctcttacgaa tcttcggcgt cgactgcttc 3420 attccgaggc gactgatacc ttcggcgtcg actgcttcat acgaaggcag tccgattctt 3480 cggcgtcgac tgcttcaacc tttactgaga cgggacttcg gcgtcgactg cttcaaaggc 3540 gttgcgaatc ctcatgcgat tgttacgaaa cccgttaatt aaagagcgag attccgtctc 3600 aaagaaaaaa aaagtaatga aatgaataaa atgagtccta gagccagtaa atgtcgtaaa 3660 tgtctcagct agtcaggtag taaaaggtct caactaggca gtggcagagc aggattcaaa 3720 ttcagggctg ttgtgatgcc tccgcagact ctgagcgcca cctggtggta atttgtctgt 3780 gcctcttctg acgtggaaga acagcaacta acacactaac acggcattta ctatgggcca 3840 gccattgtcc atctagatgg ccgataaaat aaaagatttt atttagtctc cagaaaaagg 3900 ggggaatgaa agaccccacc tgtaggtttg gcaagctagc tgcagtgtgt cagttagggt 3960 gtggaaagtc cccaggctcc ccagcaggca gaagtatgca aagcatgcat ctcaattagt 4020 cagcaaccag gtgtggaaag tccccaggct ccccagcagg cagaagtatg caaagcatgc 4080 atctcaatta gtcagcaacc atagtcccgc ccctaactcc gcccatcccg cccctaactc 4140 cgcccagttc cgcccattct ccgccccatg gctgactaat tttttttatt tatgcagagg 4200 ccgaggccgc ctctgcctct gagctattcc agaagtagtg aggaggcttt tttggaggcc 4260 taggcttttg caaaggatcc gccaccatgt ctagacctgg cgagaggccc ttccagtgcc 4320 ggatctgcat gcggaacttc agcaacatga gcaacctgac cagacacacc cggacacaca 4380 caggcgagaa gccttttcag tgcagaatct gtatgcgcaa tttctccgac agaagcgtgc 4440 tgcggagaca cctgagaacc cacaccggca gccagaaacc attccagtgt cgcatctgta 4500 tgagaaactt tagcgacccc tccaatctgg cccggcacac cagaacacat accggggaaa 4560 aaccctttca gtgtaggata tgcatgagga atttttccga ccggtccagc ctgaggcggc 4620 acctgaggac acatactggc tcccaaaagc cgttccaatg tcggatatgt atgcgcaact 4680 ttagccagag cggcaccctg cacagacaca caagaaccca tactggcgag aaacctttcc 4740 aatgtagaat ctgcatgcga aatttttccc agcggcctaa tctgaccagg catctgagga 4800 cccacctgag aggatctacc tgcagggatg agtttcccac catggtgttt ccttctgggc 4860 agatcagcca ggcctcggcc ttggccccgg cccctcccca agtcctgccc caggctccag 4920 cccctgcccc tgctccagcc atggtatcag ctctggccca ggccccagcc cctgtcccag 4980 tcctagcccc aggccctcct caggctgtgg ccccacctgc ccccaagccc acccaggctg 5040 gggaaggaac gctgtcagag gccctgctgc agctgcagtt tgatgatgaa gacctggggg 5100 ccttgcttgg caacagcaca gacccagctg tgttcacaga cctggcatcc gtcgacaact 5160 ccgagtttca gcagctgctg aaccagggca tacctgtggc cccccacaca actgagccca 5220 tgctgatgga gtaccctgag gctataactc gcctagtgac aggggcccag aggccccccg 5280 acccagctcc tgctccactg ggggccccgg ggctccccaa tggcctcctt tcaggagatg 5340 aagacttctc ctccattgcg gacatggact tctcagccct gctgagtcag atcagctccc 5400 aattgtgcgt acgcggatcc tctgctggag acatgagagc tgccaacctt tggccaagcc 5460 cgctcatgat caaacgctct aagaagaaca gcctggcctt gtccctgacg gccgaccaga 5520 tggtcagtgc cttgttggat gctgagcccc ccatactcta ttccgagtat gatcctacca 5580 gacccttcag tgaagcttcg atgatgggct tactgaccaa cctggcagac agggagctgg 5640 ttcacatgat caactgggcg aagagggtgc caggctttgt ggatttgacc ctccatgatc 5700 aggtccacct tctagaatgt gcctggctag agatcctgat gattggtctc gtctggcgct 5760 ccatggagca cccagtgaag ctactgtttg ctcctaactt ggtgttggac agggacgagg 5820 gaaaatgtgt agagggcctg gtggagatct tcgacatgct gctggctaca tcatctcggt 5880 tccgcatgat gaatctgcag ggagaggagt ttgtgtgcct caaatctatt attttgctta 5940 attctggagt gtacacattt ctgcccagca ccctgaagtc tctggaagag aaggaccata 6000 tccaccgagt cctggacaag atcacagaca ctttgatcca cctgatggcc aaggcaggcc 6060 tgaccctgca gcagcagcac cagcggctgg cccagctcct cctcatcctc tcccacatca 6120 ggcacatgag taacaaaggc atggagctgc tgtacagcat gaagtgcaag aacgtggtgc 6180 ccctctatga cctgctgctg gaggcggcgg acgcccaccg cctacatgcg cccactagcc 6240 gtggaggggc atccgtggag gagacggacc aaagccactt ggccactgcg ggctctactt 6300 catcgcattc cttgcaaaag tattacatca cgggggaggc agagggtttc cctgccacat 6360 aagtcgacaa tcaacctctg gattacaaaa tttgtgaaag attgactggt attcttaact 6420 atgttgctcc ttttacgcta tgtggatacg ctgctttaat gcctttgtat catgctattg 6480 cttcccgtat ggctttcatt ttctcctcct tgtataaatc ctggttgctg tctctttatg 6540 aggagttgtg gcccgttgtc aggcaacgtg gcgtggtgtg cactgtgttt gctgacgcaa 6600 cccccactgg ttggggcatt gccaccacct gtcagctcct ttccgggact ttcgctttcc 6660 ccctccctat tgccacggcg gaactcatcg ccgcctgcct tgcccgctgc tggacagggg 6720 ctcggctgtt gggcactgac aattccgtgg tgttgtcggg gaaatcatcg tcctttcctt 6780 ggctgctcgc ctgtgttgcc acctggattc tgcgcgggac gtccttctgc tacgtccctt 6840 cggccctcaa tccagcggac cttccttccc gcggcctgct gccggctctg cggcctcttc 6900 cgcgtctacg ccttcgccct cagacgagtc ggatctccct ttgggccgcc tccccgcgat 6960 atcagtggtc caggctctag ttttgactca acaatatcac cagctgaagc ctatagagta 7020 cgagccatag ataaaataaa agattttatt tagtctccag aaaaaggggg gaatgaaaga 7080 ccccacctgt aggtttggca agctagcaat aaaagagccc acaacccctc actcggggcg 7140 ccagtcctcc gattgactga gtcgcccggc cgcttcgagc agacatgata agatacattg 7200 atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 7260 gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 7320 attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 7380 aaaacctcta caaatgtggt aaaatcgata aggatcgggt acccgtgtat ccaataaacc 7440 ctcttgcagt tgcatccgac ttgtggtctc gctgttcctt gggagggtct cctctgagtg 7500 attgactacc cgtcagcggg ggtctttcac acatgcagca tgtatcaaaa ttaatttggt 7560 tttttttctt aagctgtgcc ttctagttgc cagccatctg ttgtttgccc ctcccccgtg 7620 ccttccttga ccctggaagg tgccactccc actgtccttt cctaataaaa tgaggaaatt 7680 gcatcgcatt gtctgagtag gtgtcattct attctggggg gtggggtggg gcaggacagc 7740 aagggggagg attgggaaga caatagcagg catgctgggg atgcggtggg ctctatggag 7800 atcccgcggt acctcgcgaa tgcatctaga tccaatggcc tttttggccc agacatgata 7860 agatacattg atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt 7920 tgtgaaattt gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt 7980 gcggccgctt agccctccca cacataacca gagggcagca attcacgaat cccaactgcc 8040 gtcggctgtc catcactgtc cttcactatg gctttgatcc caggatgcag atcgagaagc 8100 acctgtcggc accgtccgca ggggctcaag atgcccctgt tctcatttcc gatcgcgacg 8160 atacaagtca ggttgccagc tgccgcagca gcagcagtgc ccagcaccac gagttctgca 8220 caaggtcccc cagtaaaatg atatacattg acaccagtga agatgcggcc gtcgctagag 8280 agagctgcgc tggcgacgct gtagtcttca gagatgggga tgctgttgat tgtagccgtt 8340 gctctttcaa tgagggtgga ttcttcttga gacaaaggct tggccatgcg gccgccgctc 8400 ggtgttcgag gccacacgcg tcaccttaat atgcgaagtg gacctcggac cgcgccgccc 8460 cgactgcatc tgcgtgttcg aattcgccaa tgacaagacg ctgggcgggg tttgtgtcat 8520 catagaacta aagacatgca aatatatttc ttccgggggg taccggcctt tttggccatt 8580 ggatcggatc tggccaaaaa ggcccttaag tatttacatt aaatggccat agtacttaaa 8640 gttacattgg cttccttgaa ataaacatgg agtattcaga atgtgtcata aatatttcta 8700 attttaagat agtatctcca ttggctttct actttttctt ttattttttt ttgtcctctg 8760 tcttccattt gttgttgttg ttgtttgttt gtttgtttgt tggttggttg gttaattttt 8820 ttttaaagat cctacactat agttcaagct agactattag ctactctgta acccagggtg 8880 accttgaagt catgggtagc ctgctgtttt agccttccca catctaagat tacaggtatg 8940 agctatcatt tttggtatat tgattgattg attgattgat gtgtgtgtgt gtgattgtgt 9000 ttgtgtgtgt gattgtgtat atgtgtgtat ggttgtgtgt gattgtgtgt atgtatgttt 9060 gtgtgtgatt gtgtgtgtgt gattgtgcat gtgtgtgtgt gtgattgtgt ttatgtgtat 9120 gattgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt gtgtgtgtgt tgtgtatata 9180 tatttatggt agtgagaggc aacgctccgg ctcaggtgtc aggttggttt ttgagacaga 9240 gtctttcact tagcttggaa ttcactggcc gtcgttttac aacgtcgtga ctgggaaaac 9300 cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag ctggcgtaat 9360 agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa tggcgaatgg 9420 cgcctgatgc ggtattttct ccttacgcat ctgtgcggta tttcacaccg catatggtgc 9480 actctcagta caatctgctc tgatgccgca tagttaagcc agccccgaca cccgccaaca 9540 cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag acaagctgtg 9600 accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa acgcgcgaga 9660 cgaaagggcc tcgtgatacg cctattttta taggttaatg tcatgataat aatggtttct 9720 tagacgtcag gtggcacttt tcggggaaat gtgcgcggaa cccctatttg tttatttttc 9780 taaatacatt caaatatgta tccgctcatg agacaataac cctgataaat gcttcaataa 9840 tattgaaaaa ggaagagtat gagtattcaa catttccgtg tcgcccttat tccctttttt 9900 gcggcatttt gccttcctgt ttttgctcac ccagaaacgc tggtgaaagt aaaagatgct 9960 gaagatcagt tgggtgcacg agtgggttac atcgaactgg atctcaacag cggtaagatc 10020 cttgagagtt ttcgccccga agaacgtttt ccaatgatga gcacttttaa agttctgcta 10080 tgtggcgcgg tattatcccg tattgacgcc gggcaagagc aactcggtcg ccgcatacac 10140 tattctcaga atgacttggt tgagtactca ccagtcacag aaaagcatct tacggatggc 10200 atgacagtaa gagaattatg cagtgctgcc ataaccatga gtgataacac tgcggccaac 10260 ttacttctga caacgatcgg aggaccgaag gagctaaccg cttttttgca caacatgggg 10320 gatcatgtaa ctcgccttga tcgttgggaa ccggagctga atgaagccat accaaacgac 10380 gagcgtgaca ccacgatgcc tgtagcaatg gcaacaacgt tgcgcaaact attaactggc 10440 gaactactta ctctagcttc ccggcaacaa ttaatagact ggatggaggc ggataaagtt 10500 gcaggaccac ttctgcgctc ggcccttccg gctggctggt ttattgctga taaatctgga 10560 gccggtgagc gtgggtctcg cggtatcatt gcagcactgg ggccagatgg taagccctcc 10620 cgtatcgtag ttatctacac gacggggagt caggcaacta tggatgaacg aaatagacag 10680 atcgctgaga taggtgcctc actgattaag cattggtaac tgtcagacca agtttactca 10740 tatatacttt agattgattt aaaacttcat ttttaattta aaaggatcta ggtgaagatc 10800 ctttttgata atctcatgac caaaatccct taacgtgagt tttcgttcca ctgagcgtca 10860 gaccccgtag aaaagatcaa aggatcttct tgagatcctt tttttctgcg cgtaatctgc 10920 tgcttgcaaa caaaaaaacc accgctacca gcggtggttt gtttgccgga tcaagagcta 10980 ccaactcttt ttccgaaggt aactggcttc agcagagcgc agataccaaa tactgtcctt 11040 ctagtgtagc cgtagttagg ccaccacttc aagaactctg tagcaccgcc tacatacctc 11100 gctctgctaa tcctgttacc agtggctgct gccagtggcg ataagtcgtg tcttaccggg 11160 ttggactcaa gacgatagtt accggataag gcgcagcggt cgggctgaac ggggggttcg 11220 tgcacacagc ccagcttgga gcgaacgacc tacaccgaac tgagatacct acagcgtgag 11280 ctatgagaaa gcgccacgct tcccgaaggg agaaaggcgg acaggtatcc ggtaagcggc 11340 agggtcggaa caggagagcg cacgagggag cttccagggg gaaacgcctg gtatctttat 11400 agtcctgtcg ggtttcgcca cctctgactt gagcgtcgat ttttgtgatg ctcgtcaggg 11460 gggcggagcc tatggaaaaa cgccagcaac gcggcctttt tacggttcct ggccttttgc 11520 tggccttttg ctcacatgtt ctttcctgcg ttatcccctg attctgtgga taaccgtatt 11580 accgcctttg agtgagctga taccgctcgc cgcagccgaa cgaccgagcg cagcgagtca 11640 gtgagcgagg aagcggaaga gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg 11700 attcattaat gcagctggca cgacaggttt cccgactgga aagcgggcag tgagcgcaac 11760 gcaattaatg tgagttagct cactcattag gcaccccagg ctttacactt tatgcttccg 11820 gctcgtatgt tgtgtggaat tgtgagcgga taacaatttc acacaggaaa cagctatgac 11880 catgattacg cc 11892 <210> 82 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 82 Trp Arg Pro Trp 1 <210> 83 <211> 1623 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 83 atgtgtcacc agcagctggt catcagctgg ttcagcctgg tgttcctggc ctctcctctg 60 gtggccatct gggagctgaa gaaagacgtg tacgtggtgg aactggactg gtatcccgat 120 gctcctggcg agatggtggt gctgacctgc gatacccctg aagaggacgg catcacctgg 180 acactggatc agtctagcga ggtgctcggc agcggcaaga ccctgaccat ccaagtgaaa 240 gagtttggcg acgccggcca gtacacctgt cacaaaggcg gagaagtgct gagccacagc 300 ctgctgctgc tccacaagaa agaggatggc atttggagca ccgacatcct gaaggaccag 360 aaagagccca agaacaagac cttcctgaga tgcgaggcca agaactacag cggccggttc 420 acatgttggt ggctgaccac catcagcacc gacctgacct tcagcgtgaa gtccagcaga 480 ggcagcagtg atcctcaggg cgttacatgt ggcgccgcta cactgtctgc cgaaagagtg 540 cggggcgaca acaaagaata cgagtacagc gtggaatgcc aagaggacag cgcctgtcca 600 gccgccgaag agtctctgcc tatcgaagtg atggtggacg ccgtgcacaa gctgaagtac 660 gagaactaca cctccagctt tttcatccgg gacatcatca agcccgatcc tccaaagaac 720 ctgcagctga agcctctgaa gaacagcaga caggtggaag tgtcctggga gtaccccgac 780 acctggtcta caccccacag ctacttcagc ctgacctttt gcgtgcaagt gcagggcaag 840 tccaagcgcg agaaaaagga ccgggtgttc accgacaaga ccagcgccac cgtgatctgc 900 agaaagaacg ccagcatcag cgtcagagcc caggaccggt actacagcag ctcttggagc 960 gaatgggcca gcgtgccatg ttctggcgga ggaagcggtg gcggatcagg tggtggatct 1020 ggcggcggat ctagaaacct gcctgtggcc actcctgatc ctggcatgtt cccttgtctg 1080 caccacagcc agaacctgct gagagccgtg tccaacatgc tgcagaaggc cagacagacc 1140 ctggaattct acccctgcac cagcgaggaa atcgaccacg aggacatcac caaggataag 1200 accagcaccg tggaagcctg cctgcctctg gaactgacca agaacgagag ctgcctgaac 1260 agccgggaaa ccagcttcat caccaacggc tcttgcctgg ccagcagaaa gacctccttc 1320 atgatggccc tgtgcctgag cagcatctac gaggacctga agatgtacca ggtggaattc 1380 aagaccatga acgccaagct gctgatggac cccaagcggc agatcttcct ggaccagaat 1440 atgctggccg tgatcgacga gctgatgcag gccctgaact tcaacagcga gacagtgccc 1500 cagaagtcta gcctggaaga acccgacttc tacaagacca agatcaagct gtgcatcctg 1560 ctgcacgcct tccggatcag agccgtgacc atcgacagag tgatgagcta cctgaacgcc 1620 tct 1623

Claims

서열번호 1의 아미노산 282~595에 상응하는 아미노산 서열을 포함하는 변형된 에스트로겐 수용체 리간드 결합 도메인(ER-LBD)으로서, 상기 변형된 ER-LBD는 G400V 아미노산 치환, M543A 아미노산 치환, 및 L544A 아미노산 치환, 및 하나 이상의 추가 아미노산 치환을 포함하되, 상기 하나 이상의 추가 아미노산 치환은 위치 343~354, 위치 380~392, 위치 404~463, 및 위치 517~540, 및 위치 547로 이루어진 군으로부터 선택된 서열번호 1의 영역 내에 존재하고, 상기 변형된 ER-LBD는 서열번호 2의 아미노산 서열을 포함하는 ER-LBD와 비교했을 때 또는 내인성 리간드와 비교했을 때 하나 이상의 추가 아미노산 치환으로 인해 비-내인성 리간드에 대한 더 큰 민감도 및/또는 선택성을 갖고,
선택적으로, 상기 변형된 ER-LBD는 V595A 아미노산 치환을 추가로 포함하고/하거나,
선택적으로 상기 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 변형된 ER-LBD.
제1항에 있어서, 상기 하나 이상의 추가 아미노산 치환은 다음으로 이루어진 군으로부터 선택된 서열번호 1의 하나 이상의 위치에 존재하는, 변형된 ER-LBD: 343, 344, 345, 346, 347, 348, 349, 350, 351, 352, 354, 380, 384, 386, 387, 388, 389, 391, 392, 404, 407, 409, 413, 414, 417, 418, 420, 421, 422, 424, 428, 463, 517, 521, 522, 524, 525, 526, 527, 528, 533, 534, 536, 537, 538, 539, 540, 및 547.
제2항에 있어서,
a. 상기 하나 이상의 위치는 서열번호 1의 위치 343을 포함하되, 선택적으로 서열번호 1의 위치 343에서의 아미노산 치환은 M343F, M343I, M343L, 및 M343V로 이루어진 군으로부터 선택되거나;
b. 상기 하나 이상의 위치는 서열번호 1의 위치 344 를 포함하되, 선택적으로 서열번호 1의 위치 344에서의 아미노산 치환은 G344M이거나;
c. 상기 하나 이상의 위치는 서열번호 1의 위치 345를 포함하되, 선택적으로 서열번호 1의 위치 345에서의 아미노산 치환은 L345S이거나;
d. 상기 하나 이상의 위치는 서열번호 1의 위치 346을 포함하되, 선택적으로 서열번호 1의 위치 346에서의 아미노산 치환은 L346I, L346M, L346F, 및 L346V로 이루어진 군으로부터 선택되거나;
e. 상기 하나 이상의 위치는 서열번호 1의 위치 347을 포함하되, 선택적으로 서열번호 1의 위치 347에서의 아미노산 치환은 T347D, T347E, T347F, T347I, T347K, T347L, T347M, T347N, T347Q, T347R, T347S, 및 T347V로 이루어진 군으로부터 선택되거나;
f. 상기 하나 이상의 위치는 서열번호 1의 위치 348을 포함하되, 선택적으로 서열번호 1의 위치 348에서의 아미노산 치환은 N348K이거나;
g. 상기 하나 이상의 위치는 서열번호 1의 위치 349를 포함하되, 선택적으로 서열번호 1의 위치 349에서의 아미노산 치환은 L349I, L349M, L349F, 및 L349V로 이루어진 군으로부터 선택되거나;
h. 상기 하나 이상의 위치는 서열번호 1의 위치 350을 포함하되, 선택적으로 서열번호 1의 위치 350에서의 아미노산 치환은 A350F, A350I, A350L, A350M 및 A350V로 이루어진 군으로부터 선택되거나;
i. 상기 하나 이상의 위치는 서열번호 1의 위치 351을 포함하되, 선택적으로 서열번호 1의 위치 351에서의 아미노산 치환은 D351E, D351F, D351I, D351L, D351M, D351N, D351Q, 및 D351V로 이루어진 군으로부터 선택되거나;
j. 상기 하나 이상의 위치는 서열번호 1의 위치 352를 포함하되, 선택적으로 서열번호 1의 위치 352에서의 아미노산 치환은 R352K이거나;
k. 상기 하나 이상의 위치는 서열번호 1의 위치 354를 포함하되, 선택적으로 서열번호 1의 위치 354에서의 아미노산 치환은 L354I, L354M, L354F, 및 L354V로 이루어진 군으로부터 선택되거나;
l. 상기 하나 이상의 위치는 서열번호 1의 위치 380을 포함하되, 선택적으로 서열번호 1의 위치 380에서의 아미노산 치환은 E380Q이거나;
m. 상기 하나 이상의 위치는 서열번호 1의 위치 384를 포함하되, 선택적으로 서열번호 1의 위치 384에서의 아미노산 치환은 L384I, L384M, L384F, 및 L384V로 이루어진 군으로부터 선택되거나;
n. 상기 하나 이상의 위치는 서열번호 1의 위치 386을 포함하되, 선택적으로 서열번호 1의 위치 386에서의 아미노산 치환은 I386V이거나;
o. 상기 하나 이상의 위치는 서열번호 1의 위치 387을 포함하되, 선택적으로 서열번호 1의 위치 387에서의 아미노산 치환은 L387I, L387M, L387F, 및 L387V로 이루어진 군으로부터 선택되거나;
p. 상기 하나 이상의 위치는 서열번호 1의 위치 388을 포함하되, 선택적으로 서열번호 1의 위치 388에서의 아미노산 치환은 M388I, M388L, 및 M388F로 이루어진 군으로부터 선택되거나;
q. 상기 하나 이상의 위치는 서열번호 1의 위치 389를 포함하되, 선택적으로 서열번호 1의 위치 389에서의 아미노산 치환은 I389M이거나;
r. 상기 하나 이상의 위치는 서열번호 1의 위치 391을 포함하되, 선택적으로 서열번호 1의 위치 391에서의 아미노산 치환은 L391I, L391M, L391F, 및 L391V로 이루어진 군으로부터 선택되거나;
s. 상기 하나 이상의 위치는 서열번호 1의 위치 392를 포함하되, 선택적으로 서열번호 1의 위치 392에서의 아미노산 치환은 V392M이거나;
t. 상기 하나 이상의 위치는 서열번호 1의 위치 404를 포함하되, 선택적으로 서열번호 1의 위치 404에서의 아미노산 치환은 F404I, F404L, F404M, 및 F404V로 이루어진 군으로부터 선택되거나;
u. 상기 하나 이상의 위치는 서열번호 1의 위치 407을 포함하되, 선택적으로 서열번호 1의 위치 407에서의 아미노산 치환은 N407D이거나;
v. 상기 하나 이상의 위치는 서열번호 1의 위치 409를 포함하되, 선택적으로 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이거나;
w. 상기 하나 이상의 위치는 서열번호 1의 위치 413을 포함하되, 선택적으로 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이거나;
x. 상기 하나 이상의 위치는 서열번호 1의 위치 414를 포함하되, 선택적으로 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이거나;
y. 상기 하나 이상의 위치는 서열번호 1의 위치 417을 포함하되, 선택적으로 서열번호 1의 위치 417에서의 아미노산 치환은 C417S이거나;
z. 상기 하나 이상의 위치는 서열번호 1의 위치 418을 포함하되, 선택적으로 서열번호 1의 위치 418에서의 아미노산 치환은 V418I, V418L, V418M, 및 V418F로 이루어진 군으로부터 선택되거나;
aa. 상기 하나 이상의 위치는 서열번호 1의 위치 420을 포함하되, 선택적으로 서열번호 1의 위치 420에서의 아미노산 치환은 G420I, G420M, G420F, 및 G420V로 이루어진 군으로부터 선택되거나;
bb. 상기 하나 이상의 위치는 서열번호 1의 위치 421을 포함하되, 선택적으로 서열번호 1의 위치 421에서의 아미노산 치환은 M421I, M421L, M421F, 및 M421V로 이루어진 군으로부터 선택되거나;
cc. 상기 하나 이상의 위치는 서열번호 1의 위치 422를 포함하되, 선택적으로 서열번호 1의 위치 422에서의 아미노산 치환은 V422I이거나;
dd. 상기 하나 이상의 위치는 서열번호 1의 위치 424를 포함하되, 선택적으로 서열번호 1의 위치 424에서의 아미노산 치환은 I424L, I424M, I424F, 및 I424V로 이루어진 군으로부터 선택되거나;
ee. 상기 하나 이상의 위치는 서열번호 1의 위치 428을 포함하되, 선택적으로 서열번호 1의 위치 428에서의 아미노산 치환은 L428I, L428M, L428F, 및 L428V로 이루어진 군으로부터 선택되거나;
ff. 상기 하나 이상의 위치는 서열번호 1의 위치 463을 포함하되, 선택적으로 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이거나;
gg. 상기 하나 이상의 위치는 서열번호 1의 위치 517을 포함하되, 선택적으로 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이거나;
hh. 상기 하나 이상의 위치는 서열번호 1의 위치 521을 포함하되, 선택적으로 서열번호 1의 위치 521에서의 아미노산 치환은 G521A, G521F, G521I, G521L, G521M, 및 G521V로 이루어진 군으로부터 선택되거나;
ii. 상기 하나 이상의 위치는 서열번호 1의 위치 522를 포함하되, 선택적으로 서열번호 1의 위치 522에서의 아미노산 치환은 M522I, M522L, 및 M522V로 이루어진 군으로부터 선택되거나;
jj. 상기 하나 이상의 위치는 서열번호 1의 위치 524를 포함하되, 선택적으로 서열번호 1의 위치 524에서의 아미노산 치환은 H524A, H524I, H524L, H524F, 및 H524V로 이루어진 군으로부터 선택되거나;
kk. 상기 하나 이상의 위치는 서열번호 1의 위치 525를 포함하되, 선택적으로 서열번호 1의 위치 525에서의 아미노산 치환은 L525F, L525I, L525M, L525N, L525Q, L525S, L525T, 및 L525V로 이루어진 군으로부터 선택되거나;
ll. 상기 하나 이상의 위치는 서열번호 1의 위치 526을 포함하되, 선택적으로 서열번호 1의 위치 526에서의 아미노산 치환은 Y526L이거나;
mm. 상기 하나 이상의 위치는 서열번호 1의 위치 527을 포함하되, 선택적으로 서열번호 1의 위치 527에서의 아미노산 치환은 S527N이거나;
nn. 상기 하나 이상의 위치는 서열번호 1의 위치 528을 포함하되, 선택적으로 서열번호 1의 위치 528에서의 아미노산 치환은 M528F, M528I, 및 M528V로 이루어진 군으로부터 선택되거나;
oo. 상기 하나 이상의 위치는 서열번호 1의 위치 533을 포함하되, 선택적으로 서열번호 1의 위치 533에서의 아미노산 치환은 V533F 및 V533W로 이루어진 군으로부터 선택되거나;
pp. 상기 하나 이상의 위치는 서열번호 1의 위치 534를 포함하되, 선택적으로 서열번호 1의 위치 534에서의 아미노산 치환은 V534Q 및 V534R로 이루어진 군으로부터 선택되거나;
qq. 상기 하나 이상의 위치는 서열번호 1의 위치 536을 포함하되, 선택적으로 서열번호 1의 위치 536에서의 아미노산 치환은 L536F, 및 L536M, L536R, 및 L536Y로 이루어진 군으로부터 선택되거나;
rr. 상기 하나 이상의 위치는 서열번호 1의 위치 537을 포함하되, 선택적으로 서열번호 1의 위치 537에서의 아미노산 치환은 Y537E 및 Y537S로 이루어진 군으로부터 선택되거나;
ss. 상기 하나 이상의 위치는 서열번호 1의 위치 538을 포함하되, 선택적으로 서열번호 1의 위치 538에서의 아미노산 치환은 D538G 및 D538K로 이루어진 군으로부터 선택되거나;
tt. 상기 하나 이상의 위치는 서열번호 1의 위치 539를 포함하되, 선택적으로 서열번호 1의 위치 539에서의 아미노산 치환은 L539A 및 L539R로 이루어진 군으로부터 선택되거나;
uu. 상기 하나 이상의 위치는 서열번호 1의 위치 540을 포함하되, 선택적으로 서열번호 1의 위치 540에서의 아미노산 치환은 L540A 및 L540F로 이루어진 군으로부터 선택되거나;
vv. 상기 하나 이상의 위치는 서열번호 1의 위치 547을 포함하되, 선택적으로 서열번호 1의 위치 547에서의 아미노산 치환은 H547A인, 변형된 ER-LBD.
제1항 내지 제3항 중 어느 한 항에 있어서,
a. 상기 하나 이상의 추가 아미노산 치환은 2개의 아미노산 치환이며, 선택적으로 상기 2개의 아미노산 치환 각각은 343, 345, 347, 348, 351, 354, 384, 387, 388, 389, 391, 392, 404, 418, 421, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 345 및 348에 존재하되, 상기 서열번호 1의 위치 345에서의 아미노산 치환은 L345S이고, 서열번호 1의 위치 348에서의 아미노산 치환은 N348K이고.
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 384 및 389에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 389에서의 아미노산 치환은 I389M이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 421 및 392에 존재하되, 상기 서열번호 1의 위치 421에서의 아미노산 치환은 M421I이고, 서열번호 1의 위치 392에서의 아미노산 치환은 V392M이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 354 및 391에 존재하되, 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 354 및 384에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 354 및 387에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 387 및 391에 존재하되, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 384 및 387에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 387에서의 아미노산 치환은 L387M이고,
선택적으로, 상기 2개의 아미노산 치환은 서열번호 1의 위치 384 및 391에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고/이거나
b. 상기 하나 이상의 추가 아미노산 치환은 3개의 아미노산 치환이며, 선택적으로 상기 3개의 아미노산 치환 각각은 343, 347, 351, 354, 388, 391, 404, 414, 418, 463, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 3개의 아미노산 치환은 서열번호 1의 위치 354, 384, 및 391에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이고, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이고,
선택적으로, 상기 3개의 아미노산 치환은 서열번호 1의 위치 414, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고/이거나,
c. 상기 하나 이상의 추가 아미노산 치환은 4개의 아미노산 치환이며, 선택적으로 상기 4개의 아미노산 치환 각각은 343, 347, 351, 354, 384, 388, 391, 404, 413, 418, 463, 521, 524, 및 525로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 418에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391F이며, 서열번호 1의 위치 418에서의 아미노산 치환은 V418I이고.
선택적으로, 상기 4개의 아미노산 치환은 서열번호 1의 위치 343, 388, 521, 및 404에 존재하되, 상기 서열번호 1의 위치 343에서의 아미노산 치환은 M343I이고, 서열번호 1의 위치 388에서의 아미노산 치환은M388I이고, 서열번호 1의 위치 521에서의 아미노산 치환은 G521I이고, 서열번호 1의 위치 404에서의 아미노산 치환은 F404L이고,
선택적으로, 상기 4개의 아미노산 치환은 서열번호 1의 위치 524, 347, 351, 및 525에 존재하되, 상기 서열번호 1의 위치 524에서의 아미노산 치환은 H524V이고, 서열번호 1의 위치 347에서의 아미노산 치환은 T347R이며, 서열번호 1의 위치 351에서의 아미노산 치환은 D351Q이고, 서열번호 1의 위치 525에서의 아미노산 치환은 L525N이고,
선택적으로, 상기 4개의 아미노산 치환은 서열번호 1의 위치 354, 384, 391, 및 463에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고.
선택적으로, 상기 4개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 및 524에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이고/이거나;
d. 상기 하나 이상의 추가 아미노산 치환은 5개의 아미노산 치환이며, 선택적으로 상기 5개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 5개의 아미노산 치환은 서열번호 1의 위치 384, 409, 413, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고,
선택적으로, 5개의 아미노산 치환은 서열번호 1의 위치 391, 413, 414, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이고,
선택적으로, 상기 5개의 아미노산 치환은 서열번호 1의 위치 391, 414, 421, 463 및 524에 존재하되, 상기 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이고,
선택적으로, 상기 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 413, 421, 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고,
선택적으로, 상기 5개의 아미노산 치환은 서열번호 1의 위치 354, 409, 421, 463 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고/이거나
e. 상기 하나 이상의 추가 아미노산 치환은 6개의 아미노산 치환이며, 선택적으로 상기 6개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 6개의 아미노산 치환은 서열번호 1의 위치 384, 391, 413, 421, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고,
선택적으로, 상기 6개의 아미노산 치환은 서열번호 1의 위치 409, 413, 414, 421, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고,
선택적으로, 상기 6개의 아미노산 치환은 서열번호 1의 위치 354, 391, 409, 413, 414, 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고/이거나;
f. 상기 하나 이상의 추가 아미노산 치환은 7개의 아미노산 치환이며, 선택적으로 상기 7개의 아미노산 치환 각각은 354, 384, 391, 409, 413, 414, 421, 463, 517, 및 524로 이루어진 군으로부터 선택된 서열번호 1의 위치에 존재하고,
선택적으로, 상기 7개의 아미노산 치환은 서열번호 1의 위치 354, 384, 409, 413, 421, 463, 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 384 에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이며, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이고,
선택적으로, 상기 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 421, 463, 517, 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이며, 서열번호 1의 위치 524에서의 아미노산 치환은 H524L이고,
선택적으로, 상기 7개의 아미노산 치환은 서열번호 1의 위치 354, 391, 413, 414, 421, 517, 및 524에 존재하되, 상기 서열번호 1의 위치 354에서의 아미노산 치환은 L354I이며, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이며, 서열번호 1의 위치 414에서의 아미노산 치환은 Q414E이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이며, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F이고/이거나;
g. 상기 하나 이상의 추가 아미노산 치환은 8개의 아미노산 치환이고, 선택적으로, 상기 8개의 아미노산 치환은 서열번호 1의 위치 384, 391, 409, 413, 421, 463, 517, 및 524에 존재하되, 상기 서열번호 1의 위치 384에서의 아미노산 치환은 L384M이고, 서열번호 1의 위치 391에서의 아미노산 치환은 L391V이고, 서열번호 1의 위치 409에서의 아미노산 치환은 L409V이고, 서열번호 1의 위치 413에서의 아미노산 치환은 N413D이고, 서열번호 1의 위치 421에서의 아미노산 치환은 M421L이고, 서열번호 1의 위치 463에서의 아미노산 치환은 S463P이고, 서열번호 1의 위치 517에서의 아미노산 치환은 M517A이고, 서열번호 1의 위치 524에서의 아미노산 치환은 H524F인, 변형된 ER-LBD.
제1항 내지 제4항 중 어느 하나의 변형된 ER-LBD에 융합된 관심 폴리펩티드를 포함하는 키메라 단백질로서.
선택적으로, 상기 관심 폴리펩티드는 핵산 결합 도메인을 포함하되, 선택적으로, 상기 핵산 결합 도메인은 징크 핑거 도메인을 포함하고, 선택적으로, 상기 핵산 결합 도메인은 징크 핑거 도메인을 포함하고, 선택적으로, 상기 징크 핑거 도메인은 서열 MSRPGERPFQCRICMRNFSNMSNLTRHTRTHTGEKPFQCRICMRNFSDRSVLRRHLRTHTGSQKPFQCRICMRNFSDPSNLARHTRTHTGEKPFQCRICMRNFSDRSSLRRHLRTHTGSQKPFQCRICMRNFSQSGTLHRHTRTHTGEKPFQCRICMRNFSQRPNLTRHLRTHLRGS(서열번호 62)를 포함하거나,
선택적으로 상기 키메라 단백질은 키메라 전사 인자를 포함하고, 상기 관심 폴리펩티드는 핵산 결합 도메인 및 전자 조절인자 도메인을 포함하되, 선택적으로 상기 전사 조절인자 도메인은 전사 활성인자이고, 선택적으로 상기 전사 활성인자는 단순 포진 바이러스 단백질 16(VP16) 활성화 도메인; VP16의 4개의 탠덤 카피를 포함하는 활성화 도메인; VP64 활성화 도메인; NFκB의 p65 활성화 도메인(p65); 엡스타인-바 바이러스 R 트랜스활성인자(Rta) 활성화 도메인; VP64, p65, 및 Rta 활성화 도메인(VPR 활성화 도메인)을 포함하는 삼부 활성인자; VP64, p65, 및 HSF1 활성화 도메인(VPH 활성화 도메인)을 포함하는 삼부 활성인자; 및 인간 E1A-관련 단백질 p300의 히스톤 아세틸트랜스퍼라아제 코어 도메인(p300 HAT 코어 활성화 도메인)으로 이루어진 군으로부터 선택되거나,
선택적으로, 전사 조절인자 도메인은 아미노산 서열 DEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS(서열번호 64)를 포함하는 p65 전사 활성인자인, 키메라 단백질.
제1항 내지 제4항 중 어느 하나의 변형된 ER-LBD 또는 제5항의 키메라 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 단리된 폴리뉴클레오티드 분자.
제6항의 폴리뉴클레오티드 분자에 작동 가능하게 연결된 프로모터를 포함하는 이종 작제물.
제7항의 이종 작제물을 포함하는 플라스미드.
제7항의 이종 작제물 또는 제8항의 플라스미드를 포함하는 세포.
관심 유전자의 전사를 조절하기 위한 유전자 스위치로서,
(a) 제5항의 키메라 단백질로서, 상기 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터에 결합하는 것인, 키메라 단백질;
(b) 비-내인성 리간드로서, 상기 변형된 ER-LBD에 대한 비-내인성 리간드의 결합은 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는, 비-내인성 리간드를 포함하는, 유전자 스위치.
제10항에 있어서,
a. 상기 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되고/되거나;
b. 상기 관심 유전자는 사이토카인, 케모카인, 귀소 분자, 성장 인자, 세포 사멸 조절인자, 공동 활성화 분자, 종양 미세환경 조절인자 a, 수용체, 리간드, 항체, 폴리뉴클레오티드, 펩티드, 및 효소로 이루어진 군으로부터 선택된 폴리펩티드를 암호화하고/하거나
c. 상기 관심 유전자는 IL1-베타, IL2, IL4, IL6, IL7, IL10, IL12, IL12p70 융합 단백질, IL15, IL17A, IL18, IL21, IL22, I형 인터페론, 인터페론-감마, 및 TNF-알파로 이루어진 군으로부터 선택된 사이토카인을 암호화하고/하거나;
d. 상기 관심 유전자는 MCHQQLVISWFSLVFLASPLVAIWELKKDVYVVELDWYPDAPGEMVVLTCDTPEEDGITWTLDQSSEVLGSGKTLTIQVKEFGDAGQYTCHKGGEVLSHSLLLLHKKEDGIWSTDILKDQKEPKNKTFLRCEAKNYSGRFTCWWLTTISTDLTFSVKSSRGSSDPQGVTCGAATLSAERVRGDNKEYEYSVECQEDSACPAAEESLPIEVMVDAVHKLKYENYTSSFFIRDIIKPDPPKNLQLKPLKNSRQVEVSWEYPDTWSTPHSYFSLTFCVQVQGKSKREKKDRVFTDKTSATVICRKNASISVRAQDRYYSSSWSEWASVPCSGGGSGGGSGGGSGGGSRNLPVATPDPGMFPCLHHSQNLLRAVSNMLQKARQTLEFYPCTSEEIDHEDITKDKTSTVEACLPLELTKNESCLNSRETSFITNGSCLASRKTSFMMALCLSSIYEDLKMYQVEFKTMNAKLLMDPKRQIFLDQNMLAVIDELMQALNFNSETVPQKSSLEEPDFYKTKIKLCILLHAFRIRAVTIDRVMSYLNAS(서열번호 58)의 아미노산 서열을 포함하는 IL12p70 융합 단백질을 암호화하는, 유전자 스위치.
관심 유전자의 전사를 조절하는 방법으로서, (i) 제5항의 키메라 단백질을 암호화하는 이종 작제물 및 (ii) 관심 유전자에 작동 가능하게 연결된 키메라 전사 인자-반응성(CTF-반응성) 프로모터를 포함하는 표적 발현 카세트로 세포를 형질전환시키는 단계, 및 상기 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질이 관심 유전자의 전사를 조절하도록 유도하는 단계를 포함하되,
선택적으로, 상기 방법은 전사를 조절하도록 키메라 단백질을 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함하고,
선택적으로, 전사를 조절하는 단계는 관심 유전자의 전사를 활성화시키는 단계를 포함하고,
선택적으로, 상기 표적 발현 카세트는 제5항의 키메라 단백질을 암호화하는 이종 작제물에 의해 암호화되거나, 상기 표적 발현 카세트는 제2 이종 작제물에 의해 암호화되고,
선택적으로 상기 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 방법.
키메라 단백질의 국소화를 조절하는 방법으로서, 제5항의 키메라 단백질을 암호화하는 이종 작제물로 세포를 형질전환시키는 단계, 및 형질전환된 세포를 비-내인성 리간드와 접촉시킴으로써 키메라 단백질의 핵 국소화를 유도하는 단계를 포함하되,
선택적으로, 상기 방법은 핵 국소화를 유도하기 전에 키메라 단백질의 발현에 적합한 조건 하에서 형질전환된 세포를 배양하는 단계를 추가로 포함하고,
선택적으로 상기 비-내인성 리간드는 4-하이드록시타목시펜, N-데스메틸타목시펜, 타목시펜-N-옥사이드, 및 엔독시펜으로 이루어진 군으로부터 선택되는, 방법.
제12항 또는 제13항 중 어느 하나에 있어서, 상기 형질전환된 세포는 인간 또는 동물에 존재하고, 상기 형질전환된 세포를 비-내인성 리간드와 접촉시키는 단계는 리간드의 약리학적 용량을 인간 또는 동물에 투여하는 단계를 포함하는, 방법.
제14항에 있어서, 상기 비-내인성 리간드는 서열번호 1의 야생형 에스트로겐 수용체 알파 상에서 상기 비-내인성 리간드가 실질적으로 불활성인 농도로 투여되는, 방법.