KR20230046313A

KR20230046313A - 다중에피토프 백신 카세트

Info

Publication number: KR20230046313A
Application number: KR1020237007429A
Authority: KR
Inventors: 카린 주스; 로만 엘렌스키; 제임스 신 선; 에이미 레이첼 라파포트; 시아란 다니엘 스캘란; 레오니드 기틀린; 크리스틴 데니스 팔머; 모니카 레인
Original assignee: 그릿스톤 바이오, 인코포레이티드
Priority date: 2020-08-06
Filing date: 2021-08-06
Publication date: 2023-04-05
Also published as: EP4192496A2; AU2021320896A1; CA3187258A1; WO2022032196A3; JP2023541108A; US20220265797A1; IL300026A; CN116438308A; WO2022032196A2; US11771747B2

Abstract

KRAS 네오에피토프-코딩 서열의 다중 반복을 갖고/갖거나 면역우성 에피토프가 결여된 항원-코딩 핵산 서열을 포함하는 조성물이 본원에 개시된다. 또한 백신으로서의 사용을 포함하는 조성물과 관련된 뉴클레오티드, 세포 및 방법이 개시된다.

Description

다중에피토프 백신 카세트

관련 출원에 대한 상호 참조

본 출원은 2020년 8월 6일에 출원된 미국 가출원 제63/062,268호의 이익을 주장하며, 이는 모든 목적을 위해 전체적으로 본원에 참조로 포함된다.

서열 목록

본 출원은 ASCII 형식으로 전자적으로 제출된 서열 목록을 포함하며, 이는 그 전체가 참고로 포함된다. 2020년 8월 6일에 생성된 상기 ASCII 사본의 이름은 GSO_095_sequencelisting.txt이고 크기는 425,984 바이트이다.

종양-특이적 항원에 기반한 치료용 백신은 차세대 맞춤형 암 면역요법으로서 큰 가능성을 가지고 있다. ^1-3예를 들어, 비소세포 폐암(NSCLC) 및 흑색종과 같이 돌연변이 부담이 높은 암은 상대적으로 신생항원 생성 가능성이 상대적으로 더 높기 때문에 이러한 요법의 특히 매력적인 대상이다. ^4,5 초기 증거에 따르면 신생항원-기반 백신접종은 T 세포 반응을 유도할 수 있으며⁶ 신생항원 표적 세포-요법은 특정 상황에서 선택된 환자의 종양 퇴행을 유발할 수 있다.⁷

암 및 감염성 질병 환경 모두에서 항원 백신 설계에 대한 한가지 질문은 존재하는 많은 코딩 돌연변이 중 어느 것이 "최상의" 치료 항원, 예를 들어 면역을 유도할 수 있는 항원을 생성하는지에 대한 문제이다.

현재의 항원 예측 방법의 도전에 더하여, 인간에서 항원 전달에 사용될 수 있는 이용가능한 벡터 시스템에 대한 특정 도전이 또한 존재하며, 이들 중 다수는 인간으로부터 유래된다. 예를 들어, 많은 인간은 이전의 자연적 노출의 결과로 인간 바이러스에 대한 기존 면역성을 가지고 있으며, 이 면역성은 암 치료 또는 감염성 질병에 대한 백신접종과 같은 백신접종 전략에서 항원 전달을 위해 재조합 인간 바이러스를 사용하는 데 주요 장애물이 될 수 있다. 위의 문제를 해결하는 백신 접종 전략에서 일부 진전이 있었지만, 백신 효능 및 효능 개선과 같은 특히 임상 적용을 위한 개선이 여전히 필요하다.

항원-코딩 카세트, 또는 카세트에 의해 코딩된 폴리펩티드 서열이 본원에 개시되며, 여기서 항원-코딩 카세트는 5'에서 3'으로 다음식으로 기술된 적어도 하나의 항원-코딩 핵산 서열을 포함한다:

(E _x -(E ^N _n ) _y ) _z

여기서 E는 별개의 에피토프-코딩 핵산 서열을 포함하는 뉴클레오티드 서열을 나타내고, n은 분리된 별개의 에피토프-코딩 핵산 서열의 수를 나타내고 0을 포함하는 임의의 정수이고, E^N은 각각의 상응하는 n에 대해 분리된 별개의 에피토프-코딩 핵산을 포함하는 뉴클레오티드 서열을 나타내고, z의 각 반복에 대해: 각 n에 대해 x = 0 또는 1, y = 0 또는 1이고, 그리고 x 또는 y 중 적어도 하나는 1이고, z = 2 이상이고, 여기서 항원-코딩 핵산 서열은 E, 주어진 E^N, 또는 이들의 조합의 적어도 2회 반복을 포함하고, 적어도 2회 반복을 포함하는 별개의 에피토프-코딩 핵산 서열 중 적어도 하나는 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩한다.

일부 측면에서, 항원-코딩 카세트는 각각의 아미노산 서열 VVVGACGVGK(서열번호: 75), VVVGADGVGK(서열번호: 78), VVGAVGVGK (서열번호: 79), 및 ILDTAGHEEY(서열번호: 82)의 적어도 4회 반복을 코딩한다. 일부 측면에서, KRAS-연관 MHC 클래스 I 네오에피토프 또는 KRAS 돌연변이는 KRAS G12C 돌연변이, KRAS G12V 돌연변이, KRAS G12D 돌연변이 또는 KRAS Q61H 돌연변이를 포함한다. 일부 측면에서, KRAS-연관 MHC 클래스 I 네오에피토프 또는 KRAS 돌연변이는 서열번호 75-82에 제시된 아미노산 서열 중 임의의 하나를 포함한다. 일부 측면에서, 항원-코딩 카세트는 서열번호: 75-82에 제시된 각각의 아미노산 서열을 포함한다. 일부 측면에서, 항원-코딩 카세트는 서열번호: 75-82에 제시된 각각의 아미노산 서열의 2회 이상의 반복을 포함한다. 일부 측면에서, 항원-코딩 카세트는 서열번호: 75-82에 제시된 각각의 아미노산 서열의 4회 반복을 포함한다. 일부 측면에서, KRAS-연관 MHC 클래스 I 네오에피토프 또는 KRAS 돌연변이는 서열번호: 57, 서열번호: 58, 서열번호: 59 또는 서열번호: 60에 제시된 아미노산 서열을 포함한다. 일부 측면에서, 에피토프-코딩 핵산 서열은 별개의 KRAS-연관 MHC 클래스 I 네오에피토프 또는 별개의 KRAS 돌연변이를 독립적으로 코딩하는 2개 이상의 별개의 에피토프-코딩 핵산 서열을 포함한다. 일부 측면에서, 각각의 에피토프-코딩 핵산 서열은 별개의 KRAS-연관 MHC 클래스 I 네오에피토프 또는 별개의 KRAS 돌연변이를 독립적으로 코딩한다. 일부 측면에서, 에피토프-코딩 핵산 서열은 KRAS G12C 돌연변이, KRAS G12V 돌연변이, KRAS G12D 돌연변이 또는 KRAS Q61H 돌연변이를 독립적으로 코딩하는 2개 이상의 별개의 에피토프-코딩 핵산 서열을 포함한다. 일부 측면에서, 에피토프-코딩 핵산 서열은 각각의 KRAS G12C 돌연변이, KRAS G12V 돌연변이 및 KRAS G12D 돌연변이, 및 임의로 KRAS Q61H 돌연변이를 독립적으로 코딩한다. 일부 측면에서, 항원-코딩 핵산 서열은 서열번호: 64 또는 서열번호: 65에 제시된 아미노산 서열을 포함하는 펩티드를 코딩한다. 일부 측면에서, 항원-코딩 핵산 서열은 서열번호: 65에 제시된 아미노산 서열을 포함하는 펩티드를 코딩한다.

일부 측면에서, 적어도 2회 반복을 포함하는 적어도 2개의 별개의 에피토프-코딩 핵산 서열은 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩한다. 일부 측면에서, 적어도 2회 반복을 포함하는 별개의 에피토프-코딩 핵산 서열 중 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8개는 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩한다. 일부 측면에서, 적어도 2회 반복을 포함하는 각각의 별개의 에피토프-코딩 핵산 서열은 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩한다. 일부 측면에서, KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 하나 이상의 핵산 서열은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8회 반복을 포함한다. 일부 측면에서, KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 각각의 핵산 서열은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8회 반복을 포함한다. 일부 측면에서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 하나 이상의 핵산 서열은 적어도 4회 반복을 포함한다. 일부 측면에서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 각각의 핵산 서열은 적어도 4회 반복을 포함한다. 일부 측면에서, 하나 이상의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프는 독립적으로 KRAS G12C 돌연변이, KRAS G12V 돌연변이, KRAS G12D 돌연변이 또는 KRAS Q61H 돌연변이를 포함한다.

일부 측면에서, 각각의 E 또는 E^N은 독립적으로 5'에서 3'으로 식 (L5_b-N_c-L3_d)에 의해 기술된 뉴클레오티드 서열을 포함하고, 여기서 N은 각각 E 또는 E^N과 연관된 별개의 에피토프-코딩 핵산 서열을 포함하고, 여기서 c = 1이고, L5는 5' 링커 서열을 포함하고, 여기서 b = 0 또는 1이고, L3은 3' 링커 서열을 포함하고, 여기서, d = 0 또는 1이다. 일부 측면에서, 각각의 N은 7-15개 아미노산 길이인 에피토프를 코딩하고, L5는 에피토프의 천연 N-말단 아미노산 서열을 코딩하는 천연 5' 링커 서열이고, 여기서 5' 링커 서열은 길이가 적어도 2개 아미노산인 펩티드를 코딩하고, L3은 에피토프의 천연 C-말단 아미노산 서열을 코딩하는 천연 3' 링커 서열이고, 여기서 3' 링커 서열은 길이가 적어도 32개 아미노산인 펩티드를 코딩한다. 일부 측면에서, 5' 및/또는 3' 링커 서열은 적어도 3개의 아미노산 길이인 펩티드를 코딩한다. 일부 측면에서, 5' 및/또는 3' 링커 서열은 적어도 4개의 아미노산 길이인 펩티드를 코딩한다. 일부 측면에서, 5' 및/또는 3' 링커 서열은 적어도 5개의 아미노산 길이인 펩티드를 코딩한다. 일부 측면에서, 5' 및/또는 3' 링커 서열은 적어도 8개의 아미노산 길이인 펩티드를 코딩한다. 일부 측면에서, 5' 및/또는 3' 링커 서열은 적어도 2-8개 아미노산 길이인 펩티드를 코딩한다. 일부 측면에서, 5' 및/또는 3' 링커 서열은 적어도 2-10개 아미노산 길이인 펩티드를 코딩한다.

일부 측면에서, 각각의 E 및 E^N은 길이가 적어도 7개의 아미노산인 에피토프를 코딩한다. 일부 측면에서, 각각의 E 및 E^N은 길이가 7-15개 아미노산인 에피토프를 코딩한다. 일부 측면에서, 각각의 E 및 E^N은 적어도 21개 뉴클레오티드 길이의 뉴클레오티드 서열이다. 일부 측면에서, 각각의 E 및 E^N은 75개 뉴클레오티드 길이의 뉴클레오티드 서열이다.

항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물이 본원에서 제공되며, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고, 하나 이상의 벡터는: (a)벡터 백본, 여기서 백본은: (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하고; 및 (b) 카세트를 포함하고, 여기서 카세트는 (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열, 여기서 각각의 에피토프-코딩 핵산 서열은; (A) 임의로 5' 링커 서열, 및 (B) 임의로 3' 링커 서열을 포함하고; (ii) 임의로, 항원-코딩 핵산 서열에 작동 가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및 (iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열; (iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및 (v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고, 여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함한다.

항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물이 본원에서 제공되며, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고 하나 이상의 벡터는: (a) 벡터 백본, 여기서 백본은 (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하고; 및 (b) 카세트를 포함하고, 여기서 카세트는: (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) 서로 선형으로 연결된 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 별개의 에피토프-코딩 핵산 서열, 여기서 적어도 하나의 별개의 에피토프-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하고, 여기서 각각의 에피토프-코딩 핵산 서열은; (A) 임의로 5' 링커 서열, 및 (B) 임의로 3' 링커 서열을 포함하고; (ii) 임의로, 항원-코딩 핵산 서열에 작동 가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및 (iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열; (iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및 (v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고, 여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 적어도 하나의 별개의 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함한다.

일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열은 적어도 3개의 별개의 에피토프-코딩 핵산 서열을 포함한다.

항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물이 본원에서 제공되며, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고 하나 이상의 벡터는: (a) 벡터 백본, 여기서 벡터 백본은 침팬지 아데노바이러스 벡터를 포함하고, 임의로 침팬지 아데노바이러스 벡터는 ChAdV68 벡터, 또는 알파바이러스 벡터이고, 임의로 여기서 알파바이러스 벡터는 베네수엘라 말 뇌염 바이러스 벡터이고; 및 (b) 카세트를 포함하고, 임의로 카세트는 벡터 백본에 천연인 천연 프로모터 뉴클레오티드 서열 및 폴리(A) 서열 사이에 통합되며, 여기서 카세트는: (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) 서로 선형으로 연결된 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 포함하는, KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열을 포함하고, 여기서 각각의 에피토프-코딩 핵산 서열은 임의로 다음을 포함하고: (A) MHC 클래스 I 에피토프 코딩 핵산 서열, 여기서 MHC 클래스 I 에피토프 코딩 핵산 서열은 길이가 7-15개 아미노산인 MHC 클래스 I 에피토프를 코딩하고, (B) 5' 링커 서열, 여기서 5' 링커 서열은 MHC 클래스 I 에피토프의 천연 N-말단 아미노산 서열을 코딩하고, 여기서 5' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하고, (C) 3' 링커 서열, 여기서 3' 링커 서열은 MHC 클래스 I 에피토프의 천연 C-말단 산 서열을 코딩하고, 여기서 3' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하고, 카세트는 천연 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 각각의 에피토프-코딩 핵산 서열은 길이가 13 내지 25개 아미노산인 폴리펩티드를 코딩하고, 여기서 각각의 에피토프-코딩 핵산의 각각의 3'단부는 카세트에서 최종 에피토프-코딩 핵산 서열을 제외하고 다음의 에피토프-코딩 핵산 서열의 5'단부에 연결되고; 및 (ii) 다음을 포함하는 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열: (I) PADRE MHC 클래스 II 서열(서열번호:48), (II) 파상풍 톡소이드 MHC 클래스 II 서열(서열번호: 46), (III) PADRE MHC 클래스 II 서열과 파상풍 톡소이드 MHC 클래스 II 서열을 연결하는 GPGPG 아미노산 링커 서열을 코딩하는 제 1 핵산 서열, (IV) 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열의 5'단부를 에피토프-코딩 핵산 서열에 연결하는 GPGPG 아미노산 링커 서열을 코딩하는 제 2 핵산 서열, (V) 임의로, 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열의 3'단부에서 GPGPG 아미노산 링커 서열을 코딩하는 제 3 핵산 서열; (iii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열을 포함하고; 여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 천연 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열의 적어도 2회의 반복을 포함한다.

일부 측면에서, 카세트의 각 요소의 정렬된 서열은 5'에서 3'으로 다음을 포함하는 다음식으로 기술된다:

P_a-(L5_b-N_c-L3_d)_X-(G5_e-U_f)_Y-G3_g

여기서 P는 제 2 프로모터 뉴클레오티드 서열을 포함하고, 여기서 a = 0 또는 1이고, N은 별개의 에피토프-코딩 유래 핵산 서열 중 하나를 포함하며, 여기서 c = 1이고, L5는 5' 링커 서열을 포함하고, 여기서 b = 0 또는 1이고, L3은 3' 링커 서열을 포함하고, 여기서 d = 0 또는 1이고, G5는 GPGPG 아미노산 링커를 코딩하는 적어도 하나의 핵산 중 하나를 포함하고, 여기서 e = 0 또는 1이고, G3은 GPGPG 아미노산 링커를 코딩하는 적어도 하나의 핵산 서열 중 하나를 포함하고, 여기서 g = 0 또는 1이고, U는 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열 중 하나를 포함하며, 여기서 f = 1, X = 1 내지 400이고, 여기서 각각의 X에 대해 상응하는 N_c는 에피토프-코딩 핵산 서열이고, 및 Y = 0, 1 또는 2이고, 여기서 각각의 Y에 대해 상응하는 U_f는 MHC 클래스 II 에피토프-코딩 핵산 서열이다.

일부 측면에서, 각각의 X에 대해 상응하는 N_c는 별개의 에피토프-코딩 핵산 서열의 적어도 2회 반복에 상응하는 N_c를 제외하고 별개의 에피토프-코딩 핵산 서열이다. 일부 측면에서, 각 Y에 대해 상응하는 U_f는 별개의 MHC 클래스 II 에피토프-코딩 핵산 서열이다. 일부 측면에서, a = 0, b = 1, d = 1, e = 1, g = 1, h = 1, X = 16, Y = 2이고, 적어도 하나의 프로모터 뉴클레오티드 서열은 벡터 백본에 천연인 단일 천연 프로모터 뉴클레오티드 서열이고, 적어도 하나의 폴리아데닐화 폴리(A) 서열은 백본에 의해 제공되는 적어도 80개의 연속 A 뉴클레오티드의 폴리(A) 서열이고, 각각의 N은 7-15개 아미노산 길이인 에피토프를 코딩하고, L5는 에피토프의 천연 N-말단 아미노산 서열을 코딩하는 천연 5' 링커 서열이고, 여기서 5' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하고, L3은 에피토프의 천연 C-말단 아미노산 서열을 코딩하는 천연 3' 링커 서열이고, 여기서 3' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하고, U는 각각 PADRE 클래스 II 서열 및 파상풍 톡소이드 MHC 클래스 II 서열이고, 벡터 백본은 침팬지 아데노바이러스 벡터를 포함하고, 임의로 침팬지 아데노바이러스 벡터는 ChAdV68 벡터, 또는 알파바이러스 벡터이고, 임의로 여기서 알파바이러스 벡터는 베네수엘라 말 뇌염 바이러스 벡터이고, 임의로 여기서 천연 프로모터 뉴클레오티드 서열은 벡터 백본이 알파바이러스 벡터를 포함할 때 서브게놈(예를 들어, 26S) 프로모터이고, 각각의 MHC 클래스 II 에피토프-코딩 핵산 서열은 길이가 13 내지 25개의 아미노산인 폴리펩티드를 코딩한다.

일부 측면에서, 적어도 2회의 반복은 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8회의 반복이다. 일부 측면에서, 적어도 2회 반복은 적어도 8회 반복이다. 일부 측면에서, 적어도 2회의 반복은 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19 또는 적어도 20회 반복이다. 일부 측면에서, 적어도 2회의 반복은 2-3, 2-4, 2-5, 2-6, 2-7 또는 2-8회이다. 일부 측면에서, 적어도 2회 반복은 7회 이하 반복, 6회 이하 반복, 5회 이하 반복, 4회 이하 반복, 또는 3회 이하 반복이다.

일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열은 적어도 2개의 별개의 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함한다. 일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열은 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 또는 적어도 10개의 별개의 에피토프 코딩 핵산 서열의 적어도 2회 반복을 포함한다. 일부 측면에서, 적어도 2회 반복은 적어도 하나의 분리된 별개의 에피토프-코딩 핵산 서열에 의해 분리된다. 일부 측면에서, 적어도 2회 반복은 적어도 2개의 분리된 별개의 에피토프 코딩 핵산 서열에 의해 분리된다. 일부 측면에서, 임의의 5' 링커 서열 및/또는 임의의 3' 링커 서열을 포함하는 적어도 2회 반복은 적어도 75개의 뉴클레오티드에 의해 분리된다. 일부 측면에서, 임의의 5' 링커 서열 및/또는 임의의 3' 링커 서열을 포함하는 적어도 2회 반복은 적어도 150개의 뉴클레오티드, 적어도 300개의 뉴클레오티드, 또는 적어도 675개의 뉴클레오티드에 의해 분리된다. 일부 측면에서, 임의의 5' 링커 서열 및/또는 임의의 3' 링커 서열을 포함하는 적어도 2회 반복은 적어도 50개의 뉴클레오티드, 적어도 100개의 뉴클레오티드, 적어도 200개의 뉴클레오티드, 적어도 250개의 뉴클레오티드, 적어도 350개의 뉴클레오티드, 적어도 400개의 뉴클레오티드, 적어도 450개의 뉴클레오티드, 적어도 500개의 뉴클레오티드, 적어도 700개의 뉴클레오티드, 적어도 700개의 뉴클레오티드, 적어도 750개의 뉴클레오티드, 적어도 800개의 뉴클레오티드, 적어도 900개의 뉴클레오티드, 또는 적어도 1000개의 뉴클레오티드에 의해 분리된다. 일부 측면에서, 임의의 5' 링커 서열 및/또는 임의의 3' 링커 서열을 포함하는 적어도 2회 반복은 적어도 10개의 뉴클레오티드, 적어도 15개의 뉴클레오티드, 적어도 20개의 뉴클레오티드, 적어도 25개의 뉴클레오티드, 적어도 30개의 뉴클레오티드, 적어도 35개의 뉴클레오티드, 적어도 40개의 뉴클레오티드, 적어도 45개의 뉴클레오티드, 적어도 50개의 뉴클레오티드, 적어도 55개의 뉴클레오티드, 적어도 60개의 뉴클레오티드, 적어도 65개의 뉴클레오티드, 또는 적어도 70개의 뉴클레오티드에 의해 분리된다.

적어도 하나의 항원-코딩 핵산 서열은 5'에서 3'로 다음식으로 기술된다:

(E _x -(E ^N _n ) _y ) _z

여기서 E는 적어도 하나의 별개의 에피토프-코딩 핵산 서열을 포함하는 뉴클레오티드 서열을 나타내고, n은 분리된 별개의 에피토프-코딩 핵산 서열의 수를 나타내고 0을 포함하는 임의의 정수이고, E^N은 각각의 상응하는 n에 대해 분리된 별개의 에피토프-코딩 핵산을 포함하는 뉴클레오티드 서열을 나타내고, z의 각 반복에 대해: 각 n에 대해 x = 0 또는 1, y = 0 또는 1이고, x 또는 y 중 적어도 하나는 1이고, z = 2 이상이고, 여기서 항원-코딩 핵산 서열은 E, 주어진 E^N, 또는 이들의 조합의 적어도 2회 반복을 포함한다.

일부 측면에서, 항원-코딩 카세트는 각각의 아미노산 서열 VVVGACGVGK(서열번호: 75), VVVGADGVGK(서열번호: 78), VVGAVGVGK (서열번호: 79), 및 ILDTAGHEEY(서열번호: 82)의 적어도 4회 반복을 코딩한다.

일부 측면에서, 별개의 에피토프-코딩 핵산 서열은 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 각각 코딩하는 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 포함한다. 일부 측면에서, 별개의 에피토프-코딩 핵산 서열은 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8개의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 각각 코딩하는 에피토프-코딩 핵산 서열을 포함한다. 일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열의 각각의 에피토프-코딩 핵산 서열은 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩한다. 일부 측면에서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코당하는 하나 이상의 핵산 서열은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8회 반복을 포함한다. 일부 측면에서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 각각의 핵산 서열은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8회 반복을 포함한다. 일부 측면에서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 하나 이상의 핵산 서열은 적어도 4회 반복을 포함한다. 일부 측면에서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 각각의 핵산 서열은 적어도 4회 반복을 포함한다. 일부 측면에서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프 중 하나 이상은 독립적으로 KRAS G12C 돌연변이, KRAS G12V 돌연변이, KRAS G12D 돌연변이 또는 KRAS Q61H 돌연변이를 포함한다.

일부 측면에서, 적어도 2회의 반복은 다수의 반복을 포함하거나, z는 에피토프-코딩 핵산의 단일 반복을 포함하는 항원-코딩 핵산 서열에 비해 더 큰 면역 반응을 자극하기에 충분한 수를 포함한다. 일부 측면에서, 적어도 2회 반복은 다수의 반복을 포함하거나, z는 면역 반응을 자극하기에 충분한 수를 포함하고, 에피토프-코딩 핵산 서열의 단일 반복은 면역 반응을 자극하기에 불충분하거나 검출가능한 면역 반응을 자극하기에 불충분하다. 일부 측면에서, 면역 반응은 항원 발현 시스템의 전달을 위한 조성물로 생체내 면역화 후 에피토프-특이적 T 세포의 확장이다. 일부 측면에서, 면역 반응은 항원 발현 시스템의 전달을 위한 조성물로 생체내 면역화 후 에피토프-특이적 T 세포의 증가된 활성화 및/또는 에피토프-특이적 T 세포에 의한 증가된 에피토프-특이적 사멸이다.

항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물이 본원에서 제공되며, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고 하나 이상의 벡터는 (a) 벡터 백본, 여기서 백본은 (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 임의로 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하고; 및 (b) 카세트를 포함하고, 여기서 카세트는: (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) 적어도 2개의 별개의 에피토프-코딩 핵산 서열, 임의로 다음을 포함하고 (1) 코딩된 에피토프 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경, 임의로 여기서 적어도 하나의 변경은 KRAS 돌연변이이고, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드로 이루어진 군에서 선택된 감염성 질병 유기체 펩티드를 코딩하는 핵산 서열; 여기서 각각의 에피토프-코딩 핵산 서열은; (A) 임의로 5' 링커 서열, 및 (B) 임의로 3' 링커 서열을 포함하고, (ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및 (iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열; (iv) 임의로, GPGPG 아미노산 링커 서열(서열번호:56)을 코딩하는 적어도 하나의 핵산 서열; 및 (v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고, 여기서 제 2 프로모터가 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 카세트는 (1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나, (2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아니다.

항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물이 본원에서 제공되며, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고 하나 이상의 벡터는: (a) 벡터 백본, 여기서 백본은 (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 임의로 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하고; 및 (b) 카세트를 포함하고, 여기서 카세트는: (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) 서로 작동가능하게 연결된 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 별개의 에피토프-코딩 핵산 서열, 임의로 다음을 포함하고 (1) 코딩된 에피토프 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경, 임의로 여기서 적어도 하나의 변경은 KRAS 돌연변이이고, 또는 (2) 서열 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드로 이루어진 군에서 선택된 감염성 질병 유기체 펩티드를 코딩하는 핵산 서열; 여기서 각각의 에피토프-코딩 핵산 서열은; (A) 임의로 5' 링커 서열, 및 (B) 임의로 3' 링커 서열을 포함하고, (ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및 (iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열; (iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및 (v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고, 여기서 제 2 프로모터가 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 카세트는: (1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나, (2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아니다.

일부 측면에서, 적어도 하나의 별개의 에피토프 코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩한다.

항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물이 본원에서 제공되며, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고 하나 이상의 벡터는: (a) 벡터 백본, 여기서 벡터 백본은 침팬지 아데노바이러스 벡터를 포함하고, 임의로 침팬지 아데노바이러스 벡터는 ChAdV68 벡터, 또는 알파바이러스 벡터이고, 임의로 여기서 알파바이러스 벡터는 베네수엘라 말 뇌염 바이러스 벡터이고; 및 (b) 카세트를 포함하고, 임의로 카세트는 벡터 백본에 천연인 천연 프로모터 뉴클레오티드 서열 및 폴리(A) 서열 사이에 통합되며, 임의로 여기서 폴리(A) 서열은 벡터 백본에 천연이고, 여기서 카세트는: (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) 서로 선형으로 연결된 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 에피토프-코딩 핵산 서열, 여기서 각각의 에피토프-코딩 핵산 서열은 임의로 다음을 포함하고: (A) MHC 클래스 I 에피토프 코딩 핵산 서열, 여기서 MHC 클래스 I 에피토프 코딩 핵산 서열은 길이가 7-15개 아미노산인 MHC 클래스 I 에피토프를 코딩하고, (B) 5' 링커 서열, 여기서 5' 링커 서열은 MHC 클래스 I 에피토프의 천연 N-말단 아미노산 서열을 코딩하고, 여기서 5' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하고, (C) 3' 링커 서열, 여기서 3' 링커 서열은 MHC 클래스 I 에피토프의 천연 C-말단 산 서열을 코딩하고, 여기서 3' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하고, 여기서 카세트는 천연 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 각각의 에피토프-코딩 핵산 서열은 길이가 13 내지 25개 아미노산인 폴리펩티드를 코딩하고, 여기서 각각의 에피토프-코딩 핵산의 각각의 3'단부는 카세트에서 최종 에피토프-코딩 핵산 서열을 제외하고 다음의 에피토프-코딩 핵산 서열의 5' 단부에 연결되고; 및 (ii) 다음을 포함하는 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열: (I) PADRE MHC 클래스 II 서열(서열번호: 48), (II) 파상풍 톡소이드 MHC 클래스 II 서열(서열번호: 46), (III) PADRE MHC 클래스 II 서열과 파상풍 톡소이드 MHC 클래스 II 서열을 연결하는 GPGPG 아미노산 링커 서열을 코딩하는 제 1 핵산 서열, (IV) 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열의 5'단부를 에피토프-코딩 핵산 서열에 연결하는 GPGPG 아미노산 링커 서열을 코딩하는 제 2 핵산 서열, (V) 임의로, 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열의 3' 단부에서 GPGPG 아미노산 링커 서열을 코딩하는 제 3 핵산 서열; (iii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열을 포함하고; 여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 천연 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 카세트는: (1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나, (2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아니다.

일부 측면에서, 면역우성 MHC 클래스 I 에피토프는 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 10배, 20배, 30배, 40배, 50배, 100배, 200배, 300배, 400배, 500배, 1000배, 2000배, 3000배, 4000배, 5000배 또는 10,000배 또는 그 이상의 면역 반응을 자극할 수 있다. 일부 측면에서, 면역우성 MHC 클래스 I 에피토프는 다른 MHC 클래스 I 에피토프의 면역 반응을 검출 한계 미만으로 감소시키고/시키거나 치료적으로 효과적인 반응을 자극하지 않는다. 일부 측면에서, 대상체는 면역우성 MHC 클래스 I 에피토프 및 카세트에서 코딩된 다른 MHC 클래스 I 에피토프 모두를 제시하는 것으로 알려지거나 예측되는 적어도 하나의 HLA 대립유전자를 발현한다.

일부 측면에서, 하나 이상의 에피토프-코딩 핵산 서열은 대상체의 종양, 감염 또는 감염된 세포로부터 유래된다. 일부 측면에서, 각각의 에피토프-코딩 핵산 서열은 대상체의 종양, 감염 또는 감염된 세포로부터 유래된다. 일부 측면에서, 하나 이상의 에피토프-코딩 핵산 서열은 대상체의 종양, 감염 또는 감염된 세포에서 유래하지 않는다. 일부 측면에서, 각각의 에피토프-코딩 핵산 서열은 대상체의 종양, 감염 또는 감염된 세포로부터 유래되지 않는다.

일부 측면에서, 에피토프-코딩 핵산 서열은 세포 표면 상의 MHC 클래스 I에 의해 제시되는 것으로 알려지거나 의심되는 에피토프를 코딩하며, 임의로 세포 표면은 종양 세포 표면 또는 감염된 세포 표면이고, 임의로 세포는 대상체의 세포이다. 일부 측면에서, 세포는 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 비소세포 폐암, 및 소세포 폐암으로 이루어진 군으로부터 선택되는 종양 세포이거나, 또는 여기서 세포는 병원균 감염 세포, 바이러스 감염 세포, 박테리아 감염 세포, 진균 감염 세포 및 기생충 감염 세포로 이루어진 군으로부터 선택된 감염된 세포이다. 일부 측면에서, 바이러스 감염된 세포는 HIV 감염 세포, 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS) 감염 세포, 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2) 감염 세포, 에볼라 감염 세포, B형 간염 바이러스(HBV) 감염 세포, 인플루엔자 감염 세포, 오르티믹소바이러스과 바이러스 감염 세포, 인간 유두종 바이러스(HPV) 감염 세포, 거대세포바이러스(CMV) 감염 세포, 치쿤구니야 바이러스 감염 세포 세포, 호흡기 세포융합 바이러스(RSV) 감염 세포, 뎅기열 바이러스 감염 세포 및 C형 간염 바이러스(HCV) 감염 세포로 이루어진 군에서 선택된다.

일부 측면에서, 조성물은 나노입자 전달 비히클을 추가로 포함한다. 일부 측면에서, 나노입자 전달 비히클은 지질 나노입자(LNP)이다. 일부 측면에서, LNP는 이온화가능한 아미노 지질을 포함한다. 일부 측면에서, 이온화가능한 아미노 지질은 MC3-유사(디리놀레일메틸-4-디메틸아미노부티레이트) 분자를 포함한다. 일부 측면에서, 나노입자 전달 비히클은 항원 발현 시스템을 캡슐화한다.

일부 측면에서, 항원 카세트는 적어도 하나의 프로모터 뉴클레오티드 서열과 적어도 하나의 폴리(A) 서열 사이에 통합된다. 일부 측면에서, 제 2 프로모터 뉴클레오티드가 부재하고 적어도 하나의 프로모터 뉴클레오티드 서열은 항원-코딩 핵산 서열에 작동가능하게 연결된다.

일부 측면에서, 하나 이상의 벡터는 하나 이상의 +-가닥 RNA 벡터를 포함한다. 일부 측면에서, 하나 이상의 +-가닥 RNA 벡터는 5' 7-메틸구아노신(m7g) 캡을 포함한다. 일부 측면에서, 하나 이상의 +-가닥 RNA 벡터는 시험관내 전사에 의해 생성된다. 일부 측면에서, 하나 이상의 벡터는 포유동물 세포 내에서 자가-복제된다. 일부 측면에서, 백본은 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 포레스트 바이러스, 신드비스 바이러스 또는 마야로 바이러스의 적어도 하나의 뉴클레오티드 서열을 포함한다. 일부 측면에서, 백본은 베네수엘라 말 뇌염 바이러스의 적어도 하나의 뉴클레오티드 서열을 포함한다. 일부 측면에서, 백본은 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 포레스트 바이러스, 신드비스 바이러스 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 코딩되는 적어도 비구조 단백질-매개 증폭을 위한 서열, 26S 프로모터 서열, 폴리(A) 서열, 비구조 단백질 1(nsP1) 유전자, nsP2 유전자, nsP3 유전자 및 nsP4 유전자를 포함한다. 일부 측면에서, 백본은 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 포레스트 바이러스, 신드비스 바이러스 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 코딩되는 적어도 비구조 단백질-매개 증폭을 위한 서열, 26S 프로모터 서열, 및 폴리(A) 서열을 포함한다. 일부 측면에서, 비구조적 단백질-매개 증폭을 위한 서열은 알파바이러스 5'UTR, 51-nt CSE, 24-nt CSE, 26S 서브게놈 프로모터 서열, 19-nt CSE, 알파바이러스 3'UTR, 또는 이들의 조합으로 이루어진 군으로부터 선택된다. 일부 측면에서, 백본은 구조적 비리온 단백질 캡시드, E2 및 E1을 코딩하지 않는다. 일부 측면에서, 항원 카세트는 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 포레스트 바이러스, 신드비스 바이러스, 또는 마야로 바이러스의 뉴클레오티드 서열 내의 구조적 비리온 단백질 대신에 삽입된다.

일부 측면에서, 베네수엘라 말 뇌염 바이러스는 서열번호: 3 또는 서열번호: 5의 서열을 포함한다. 일부 측면에서, 베네수엘라 말 뇌염 바이러스는 염기쌍 7544와 11175 사이의 결실을 추가로 포함하는 서열번호: 3 또는 서열번호: 5의 서열을 포함한다. 일부 측면에서, 백본은 서열번호: 6 또는 서열번호: 7에 제시된 서열을 포함한다. 일부 측면에서, 카세트는 서열번호: 3 또는 서열번호: 5의 서열에 제시된 염기쌍 7544와 11175 사이의 결실을 대체하기 위해 위치 7544에 삽입된다.

일부 측면에서, 항원 카세트의 삽입은 nsP1-4 유전자 및 적어도 하나의 항원-코딩 핵산 서열을 포함하는 폴리시스트론 RNA의 전사를 제공하며, 여기서 nsP1-4 유전자 및 적어도 하나의 항원-코딩 핵산 서열은 분리된 열린 해독틀에 있다.

일부 측면에서, 백본은 침팬지 아데노바이러스 벡터의 적어도 하나의 뉴클레오티드 서열을 포함한다. 일부 측면에서, 침팬지 아데노바이러스 벡터는 ChAdV68 벡터이다. 일부 측면에서, ChAdV68 벡터는 서열번호: 1에 제시된 서열을 포함하는 ChAdV68 벡터 백본을 포함한다. 일부 측면에서, 서열이 서열번호: 1에 제시된 서열의 침팬지 아데노바이러스 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자로 이루어진 군으로부터 선택된 적어도 하나의 유전자에서 완전히 결실되거나 기능적으로 결실된 것을 제외하고, ChAdV68 벡터는 서열번호: 1에 제시된 서열을 포함하는 ChAdV68 벡터 백본을 포함하고, 임의로 서열은 서열번호: 1에 제시된 서열의 (1) E1A 및 E1B; (2) E1A, E1B 및 E3; 또는 (3) E1A, E1B, E3 및 E4에서 완전히 결실되거나 기능적으로 결실된다. 일부 측면에서, ChAdV68 벡터는 서열번호: 1의 서열로부터 수득한 유전자 또는 조절 서열을 포함하는 ChAdV68 벡터 백본을 포함하며, 임의로 여기서 유전자는 서열번호: 1에 제시된 서열의 침팬지 아데노바이러스 역 말단 반복(ITR), E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자로 이루어진 군으로부터 선택된다. 일부 측면에서, ChAdV68 벡터는 결실 또는 부분 결실 E4orf2 영역 및 결실 또는 부분 결실 E4orf3 영역, 및 임의로 결실 또는 부분 결실 E4orf4 영역을 포함하는 부분 결실 E4 유전자를 포함하는 ChAdV68 벡터 백본을 포함한다. 일부 측면에서, ChAdV68 벡터는 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 2 내지 36,518을 포함하는 ChAdV68 벡터 백본을 포함하고 추가로 (1) 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 577 내지 3403의 E1 결실, (2) 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 27,125 내지 31,825의 E3 결실, 및 (3) 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 34,916 내지 35,642의 E4 결실을 추가로 포함하고; 임의로 여기서 항원 카세트는 E1 결실 내에 삽입된다. 일부 측면에서, ChAdV68 벡터는 서열번호: 68에 제시된 서열을 포함하는 ChAdV68 벡터 백본을 포함하며, 임의로 여기서 항원 카세트는 E1 결실 내에 삽입된다. 일부 측면에서, ChAdV68 벡터는 염기쌍 번호 577과 3403 사이 또는 염기쌍 456과 3014 사이에 하나 이상의 결실을 포함하는 ChAdV68 벡터 백본을 포함하고, 임의로 여기서 벡터는 서열번호: 1에 제시된 서열의 염기쌍 27,125와 31,825 사이 또는 염기쌍 27,816와 31,333사이에 하나 이상의 결실을 추가로 포함한다. 일부 측면에서, ChAdV68 벡터는 서열번호: 1에 제시된 서열의 염기쌍 번호 3957과 10346, 염기쌍 번호 21787과 23370, 염기쌍 번호 33486과 36193 사이에 하나 이상의 결실을 포함하는 ChAdV68 벡터 백본을 포함한다. 일부 측면에서, 카세트는 E1 영역, E3 영역, 및/또는 카세트의 혼입을 허용하는 임의의 결실된 AdV 영역에서 ChAdV 백본에 삽입된다.

일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열은 백본에 의해 코딩되는 천연 26S 프로모터 뉴클레오티드 서열이다. 일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열은 외인성 RNA 프로모터이다. 일부 측면에서, 제 2 프로모터 뉴클레오티드 서열은 26S 프로모터 뉴클레오티드 서열이다. 일부 측면에서, 제 2 프로모터 뉴클레오티드 서열은 다수의 26S 프로모터 뉴클레오티드 서열 을 포함하며, 여기서 각각의 26S 프로모터 뉴클레오티드 서열은 하나 이상의 분리된 열린 해독틀의 전사를 제공한다.

일부 측면에서, 하나 이상의 벡터는 각각 크기가 적어도 300 nt이다. 일부 측면에서, 하나 이상의 벡터는 각각 크기가 적어도 1 kb이다. 일부 측면에서, 하나 이상의 벡터는 크기가 각각 2 kb이다. 일부 양태에서, 하나 이상의 벡터는 각각 크기가 5 kb 미만이다.

일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열 중 적어도 하나는 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상에서 MHC 클래스 I에 의해 제시되는 폴리펩티드 서열 또는 이의 일부를 코딩한다.

일부 측면에서, 각각의 에피토프-코딩 핵산 서열은 서로 직접적으로 연결된다. 일부 측면에서, 적어도 하나의 에피토프-코딩 핵산 서열은 링커를 코딩하는 핵산 서열을 갖는 별개의 에피토프-코딩 핵산 서열에 연결된다. 일부 측면에서, 링커는 두 개의 MHC 클래스 I 서열 또는 MHC 클래스 I 서열을 MHC 클래스 II 서열에 연결한다. 일부 측면에서, 링커는 (1) 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 잔기인 연속적인 글리신 잔기; (2) 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 잔기인 연속적인 알라닌 잔기; (3) 2개의 아르기닌 잔기(RR); (4) 알라닌, 알라닌, 티로신(AAY); (5) 포유동물 프로테아좀에 의해 효율적으로 처리되는 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 잔기 길이의 컨센서스 서열; 및 (6) 기원의 동족 단백질로부터 유래된 항원에 플랭킹하고 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 2-20개 아미노산 잔기 길이인 하나 이상의 천연 서열로 이루어진 군으로부터 선택된다. 일부 측면에서, 링커는 2개의 MHC 클래스 II 서열 또는 MHC 클래스 II 서열을 MHC 클래스 I 서열에 연결한다. 일부 측면에서, 링커는 서열 GPGPG를 포함한다. 일부 측면에서, 적어도 하나의 에피토프-코딩 핵산 서열은 그로부터 코딩된 에피토프의 에피토프-코딩 핵산 서열의 발현, 안정성, 세포 트래피킹, 처리 및 제시 및/또는 면역원성을 향상시키는 분리된 또는 인접 서열에 작동가능하게 또는 직접적으로 연결된다. 일부 측면에서, 분리된 또는 인접 서열은 유비퀴틴 서열, 프로테아좀 표적화를 증가시키도록 변형된 유비퀴틴 서열(예를 들어, 유비퀴틴 서열은 위치 76에서 Gly에서 Ala로의 치환을 함유), 면역글로불린 신호 서열(예를 들어, IgK), 주요 조직적합성 클래스 I 서열, 리소좀-관련 막 단백질(LAMP)-1, 인간 수지상 세포 리소좀-관련 막 단백질 및 주요 조직적합성 클래스 II 서열 중 적어도 하나를 포함하고; 임의로 여기서 프로테아좀 표적화를 증가시키기 위해 변형된 유비퀴틴 서열은 A76이다.

일부 측면에서, 적어도 하나의 에피토프-코딩 핵산 서열은 번역된 상응하는 야생형 핵산 서열에 비해 이의 상응하는 MHC 대립유전자에 대해 증가된 결합 친화도를 갖는 폴리펩티드 서열 또는 이의 일부를 코딩한다. 일부 측면에서, 적어도 하나의 에피토프-코딩 핵산 서열은 번역된 상응하는 야생형 핵산 서열에 비해 이의 상응하는 MHC 대립유전자에 대한 증가된 결합 안정성을 갖는 폴리펩티드 서열 또는 이의 일부를 코딩한다. 일부 측면에서, 적어도 하나의 에피토프-코딩 핵산 서열은 번역된 상응하는 야생형 핵산 서열에 비해 이의 상응하는 MHC 대립유전자 상에 증가된 제시 가능성을 갖는 폴리펩티드 서열 또는 이의 일부를 코딩한다. 일부 측면에서, 적어도 하나의 변경은 점 돌연변이, 프레임시프트 돌연변이, 비-프레임시프트 돌연변이, 결실 돌연변이, 삽입 돌연변이, 스플라이스 변이, 게놈 재배열, 또는 프로테아좀-생성 스플라이싱된 항원을 포함한다.

일부 측면에서, 종양은 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 방광암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 성인 급성 림프구성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 비소세포 폐암, 및 소세포 폐암으로 이루어진 군으로부터 선택되고, 또는 여기서 감염성 질병 유기체는 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS), 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 에볼라, HIV, B형 간염 바이러스(HBV), 인플루엔자, C형 간염 바이러스(HCV), 인간 유두종 바이러스(HPV), 거대세포바이러스(CMV), 치쿤구니야 바이러스, 호흡기 세포융합 바이러스(RSV), 뎅기열 바이러스, 오르티믹소바이러스과 바이러스, 및 결핵으로 이루어진 군에서 선택된다.

일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열은 적어도 2-10, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 에피토프-코딩 핵산 서열을 포함한다. 일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열은 적어도 11-20, 15-20, 11-100, 11-200, 11-300, 11-400, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 최대 400개의 에피토프-코딩 핵산 서열을 포함한다. 일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열은 적어도 2-400개의 에피토프-코딩 핵산 서열을 포함하고, 여기서 에피토프-코딩 핵산 서열 중 적어도 2개는 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상에서 MHC 클래스 I에 의해 제시되는 폴리펩티드 서열 또는 이의 일부를 코딩한다. 일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열은 적어도 2-10, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 항원-코딩 핵산 서열을 포함한다. 일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열은 적어도 11-20, 15-20, 11-100, 11-200, 11-300, 11-400, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 최대 400개의 항원-코딩 핵산 서열을 포함한다. 일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열은 적어도 2-400개의 항원-코딩 핵산 서열을 포함하고, 여기서 항원-코딩 핵산 서열 중 적어도 2개는 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상에서 MHC 클래스 I에 의해 제시되는 폴리펩티드 서열 또는 이의 일부를 코딩한다. 일부 측면에서, 항원-코딩 핵산 서열 중 적어도 2개는 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상에서 MHC 클래스 I에 의해 제시되는 폴리펩티드 서열 또는 이의 일부를 코딩한다.

일부 측면에서, 대상체에게 투여되고 번역될 때, 에피토프-코딩 핵산 서열에 의해 코딩된 적어도 하나의 에피토프는 항원 제시 세포 상에 제시되어 종양 세포 표면 또는 감염된 세포 상의 항원 중 적어도 하나를 표적으로 하는 면역 반응을 초래한다. 일부 측면에서, 적어도 하나의 항원-코딩 핵산 서열이 대상체에게 투여되고 번역될 때, MHC 클래스 I 또는 클래스 II 에피토프 중 적어도 하나는 항원 제시 세포 상에 제시되어 종양 세포 표면 또는 감염된 세포 표면 상의 에피토프 중 적어도 하나를 표적으로 하는 면역 반응을 초래하고, 임의로 여기서 적어도 하나의 항원-코딩 핵산 서열 각각의 발현은 적어도 하나의 프로모터 뉴클레오티드 서열에 의해 구동된다.

일부 측면에서, 각각의 에피토프-코딩 핵산 서열은 8 내지 35개의 아미노산 길이, 임의로 9-17, 9-25, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35 아미노산 길이인 폴리펩티드 서열을 코딩한다.

일부 측면에서, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열이 존재한다. 일부 측면에서, 적어도 하나의 MHC 클래스 II 에피토프 코딩 핵산 서열이 존재하고 코딩된 펩티드 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경을 포함하는 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열을 포함한다. 일부 측면에서, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열은 길이가 12-20, 12, 13, 14, 15, 16, 17, 18, 19, 20, 또는 20-40개 아미노산 길이이다. 일부 측면에서, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열이 존재하고 적어도 하나의 보편적인 MHC 클래스 II 항원-코딩 핵산 서열을 포함하며, 임의로 여기서 적어도 하나의 보편적인 서열은 적어도 하나의 파상풍 톡소이드 및 PADRE를 포함한다.

일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열 또는 제 2 프로모터 뉴클레오티드 서열은 유도성이다. 일부 측면에서, 적어도 하나의 프로모터 뉴클레오티드 서열 또는 제 2 프로모터 뉴클레오티드 서열은 비-유도성이다.

일부 측면에서, 적어도 하나의 폴리(A) 서열은 백본에 천연 폴리(A) 서열을 포함한다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 백본에 외인성 폴리(A) 서열을 포함한다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 적어도 하나의 항원-코딩 핵산 서열 중 적어도 하나에 작동가능하게 연결된다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80 적어도 90 또는 적어도 100개의 연속 A 뉴클레오티드이다. 일부 측면에서, 적어도 하나의 폴리(A) 서열은 적어도 80개의 연속 A 뉴클레오티드이다.

일부 측면에서, 카세트는 인트론 서열, 우드척 간염 바이러스 전사후 조절 요소(WPRE) 서열, 내부 리보솜 진입 서열(IRES) 서열, 2A 자가 절단 펩티드 서열을 코딩하는 뉴클레오티드 서열, 푸린 절단 부위를 코딩하는 뉴클레오티드 서열, 또는 적어도 하나의 항원-코딩 핵산 서열 중 적어도 하나에 작동가능하게 연결된 mRNA의 핵 수출, 안정성 또는 번역 효율을 향상시키는 것으로 알려진 5' 또는 3' 비-코딩 영역의 서열 중 적어도 하나를 추가로 포함한다. 일부 측면에서, 카세트는 녹색 형광 단백질(GFP), GFP 변이체, 분비된 알칼리성 포스파타제, 루시퍼라제, 루시페라제 변이체, 또는 검출가능한 펩티드 또는 에피토프를 포함하나 이에 제한되지 않는 리포터 유전자를 추가로 포함한다. 일부 측면에서, 검출가능한 펩티드 또는 에피토프는 HA 태그, 플래그(Flag) 태그, His-태그 또는 V5 태그로 이루어진 군으로부터 선택된다.

일부 측면에서, 하나 이상의 벡터는 적어도 하나의 면역 조절자를 코딩하는 하나 이상의 핵산 서열을 추가로 포함한다. 일부 측면에서, 면역 조절자는 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원-결합 단편, 항-4-1BB 항체 또는 이의 항원 결합 단편, 또는 항-OX-40 항체 또는 이의 항원 결합 단편이다. 일부 측면에서, 항체 또는 이의 항원 결합 단편은 Fab 단편, Fab' 단편, 단일 사슬 Fv(scFv), 단일 특이성 또는 다중 특이성으로 함께 연결된 단일 도메인 항체(sdAb)(예를 들어, 낙타류 항체 도메인), 또는 전장 단일-사슬 항체(예를 들어, 가요성 링커에 의해 연결된 중쇄 및 경쇄가 있는 전장 IgG)이다. 일부 측면에서, 항체의 중쇄 및 경쇄 서열은 2A 또는 IRES와 같은 자가-절단 서열에 분리된 인접 서열이거나; 또는 항체의 중쇄 및 경쇄 서열은 연속적인 글리신 잔기와 같은 가요성 링커에 의해 연결된다. 일부 측면에서, 면역 조절자는 사이토카인이다. 일부 측면에서, 사이토카인은 IL-2, IL-7, IL-12, IL-15, 또는 IL-21 또는 이들 각각의 변이체 중 적어도 하나이다.

일부 측면에서, 적어도 하나의 에피토프-코딩 핵산 서열은 다음 단계를 수행함으로써 선택된다: (a) 종양, 감염된 세포, 또는 감염성 질병 유기체로부터 엑솜, 전사체 또는 전체 게놈 뉴클레오티드 시퀀싱 데이터 중 적어도 하나를 수득하는 단계, 여기서 뉴클레오티드 시퀀싱 데이터는 각 항원 세트의 펩티드 서열을 나타내는 데이터를 수득하는 데 사용되고; (b) 세포 표면, 임의로 종양 세포 표면, 또는 감염된 세포 표면 상에서 하나 이상의 MHC 대립유전자에 의해 각 항원이 제시되는 수치적 가능성 세트를 생성하기 위해 각 항원의 펩티드 서열을 제시 모델에 입력하는 단계, 수치적 가능성 세트는 적어도 수신된 질량 분석 데이터에 기반하여 확인되고; 및 (c) 에피토프-코딩 핵산 서열을 생성하는 데 사용되는 선택된 항원 세트를 생성하기 위한 수치적 가능성 세트를 기반으로 항원 세트의 하위세트를 선택하는 단계.

일부 측면에서, 각각의 에피토프-코딩 핵산 서열은 다음 단계를 수행함으로써 선택된다: (a) 종양, 감염된 세포, 또는 감염성 질병 유기체로부터 엑솜, 전사체 또는 전체 게놈 뉴클레오티드 시퀀싱 데이터 중 적어도 하나를 수득하는 단계, 여기서 뉴클레오티드 시퀀싱 데이터는 각 항원 세트의 펩티드 서열을 나타내는 데이터를 수득하는 데 사용되고; (b) 세포 표면, 임의로 종양 세포 표면, 또는 감염된 세포 표면 상에서 하나 이상의 MHC 대립유전자에 의해 각 항원이 제시되는 수치적 가능성 세트를 생성하기 위해 각 항원의 펩티드 서열을 제시 모델에 입력하는 단계, 수치적 가능성 세트는 적어도 수신된 질량 분석 데이터에 기초하여 확인되고; 및 (c) 적어도 20개의 에피토프-코딩 핵산 서열을 생성하는 데 사용되는 선택된 항원 세트를 생성하기 위한 수치적 가능성 세트를 기반으로 항원 세트의 하위 세트를 선택하는 단계. 일부 측면에서, 선택된 항원 세트의 수는 2-20개이다. 일부 측면에서, 제시 모델은 (a) 펩티드 서열의 특정 위치에서 특정 아미노산과 MHC 대립유전자의 특정 쌍의 존재; 및 (b) 특정 위치에 특정 아미노산을 포함하는 펩티드 서열의 쌍의 MHC 대립유전자 중 특정 하나에 의해 세포 표면, 임의로 종양 세포 표면, 또는 감염된 세포 표면에 제시될 가능성 사이의 의존성을 나타낸다. 일부 측면에서, 선택된 항원 세트를 선택하는 것은 제시 모델을 기반으로 선택되지 않은 항원에 비해 세포 표면에 제시될 가능성이 증가된 항원을 선택하는 것을 포함하며, 임의로 여기서 선택된 항원은 하나 이상의 특정 HLA 대립 유전자에 의해 제시는 것으로 검증되었다. 일부 측면에서, 선택된 항원 세트를 선택하는 것은 제시 모델을 기반으로 선택되지 않은 항원에 비해 대상체에서 종양-특이적 또는 감염성 질병-특이적 면역 반응을 유도할 수 있는 가능성이 증가된 항원을 선택하는 것을 포함한다. 일부 측면에서, 선택된 항원 세트를 선택하는 것은 제시 모델을 기반으로 선택되지 않은 항원에 비해 전문 항원 제시 세포(APC)에 의해 미경험 T 세포에 제시될 수 있는 가능성이 증가된 항원을 선택하는 것을 포함하며, 임의로 APC는 수지상 세포(DC)이다. 일부 측면에서, 선택된 항원 세트를 선택하는 것은 제시 모델을 기반으로 선택되지 않은 항원에 비해 중추 또는 말초 관용을 통해 억제될 가능성이 감소된 항원을 선택하는 것을 포함한다. 일부 측면에서, 선택된 항원 세트를 선택하는 것은 제시 모델을 기반으로 선택되지 않은 항원에 비해 대상체에서 정상 조직에 대한 자가면역 반응을 유도할 수 있는 가능성이 감소된 항원을 선택하는 것을 포함한다. 일부 측면에서, 엑솜 또는 전사체 뉴클레오티드 시퀀싱 데이터는 종양 세포 또는 조직, 감염된 세포 또는 감염성 질병 유기체에 대한 시퀀싱을 수행함으로써 수득된다. 일부 측면에서 시퀀싱은 차세대 시퀀싱(NGS) 또는 대규모 병렬 시퀀싱 접근 방식이다.

일부 측면에서, 카세트는 카세트에서 인접한 서열에 의해 형성된 접합 에피토프 서열을 포함한다. 일부 측면에서, 적어도 하나 또는 각각의 접합 에피토프 서열은 MHC에 대해 500 nM 초과의 친화도를 갖는다. 일부 측면에서, 각각의 접합 에피토프 서열은 비-자가이다.

일부 측면에서, 각각의 MHC 클래스 I 에피토프는 집단의 적어도 5%에 존재하는 적어도 하나의 HLA 대립유전자에 의해 제시될 수 있는 것으로 예측되거나 검증된다. 일부 측면에서, 각각의 MHC 클래스 I 에피토프는 적어도 하나의 HLA 대립유전자에 의해 제시될 수 있는 것으로 예측되거나 검증되며, 여기서 각각의 항원/HLA 쌍은 집단에서 적어도 0.01%의 항원/HLA 유병률을 갖는다. 일부 측면에서, 각각의 MHC 클래스 I 에피토프는 적어도 하나의 HLA 대립유전자에 의해 제시될 수 있는 것으로 예측되거나 검증되며, 여기서 각각의 항원/HLA 쌍은 집단에서 적어도 0.1%의 항원/HLA 유병률을 갖는다.

일부 측면에서, 카세트는 번역된 야생형 핵산 서열을 포함하는 비-치료적 MHC 클래스 I 또는 클래스 II 에피토프 핵산 서열을 코딩하지 않으며, 여기서 비-치료적 에피토프는 대상체의 MHC 대립유전자 상에서 표시될 것으로 예측된다. 일부 측면에서, 비-치료적 예측 MHC 클래스 I 또는 클래스 II 에피토프 서열은 카세트에서 인접한 서열에 의해 형성된 접합 에피토프 서열이다.

일부 측면에서, 예측은 비-치료적 에피토프의 서열을 제시 모델에 입력함으로써 생성된 제시 가능성을 기반으로 한다.

일부 측면에서, 카세트에서 적어도 하나의 항원-코딩 핵산 서열의 순서는 (a) 적어도 하나의 항원-코딩 유래 핵산 서열의 상이한 순서에 상응하는 후보 카세트 서열 세트를 생성하는 단계; (b) 각각의 후보 카세트 서열에 대해, 후보 카세트 서열 내의 비-치료적 에피토프의 제시를 기반으로 제시 점수를 결정하는 단계; 및 (c) 항원 백신에 대한 카세트 서열로서 미리결정된 임계값 미만의 제시 점수와 관련된 후보 카세트 서열을 선택하는 단계를 포함하는 일련의 단계에 의해 결정된다.

또한 본원에는 본원에 제공된 임의의 조성물 및 약제학적으로 허용되는 담체의 약제학적 조성물이 제공된다. 일부 측면에서, 조성물은 보조제를 추가로 포함한다. 일부 측면에서, 조성물은 면역 조절자를 추가로 포함한다. 일부 측면에서, 면역 조절자는 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원-결합 단편, 항-4-1BB 항체 또는 이의 항원 결합 단편, 또는 항-OX-40 항체 또는 이의 항원 결합 단편이다.

또한 본원에는 본원에 기재된 임의의 조성물의 카세트 및 서열번호: 3 또는 서열번호: 5의 서열로부터 수득된 하나 이상의 요소를 포함하는 분리된 뉴클레오티드 서열 또는 분리된 뉴클레오티드 서열 세트가 제공되고, 임의로 여기서 하나 이상의 요소는 서열번호: 3 또는 서열번호: 5에 제시된 서열의 비구조적 단백질-매개 증폭에 필요한 서열, 26S 프로모터 뉴클레오티드 서열, 폴리(A) 서열, 및 nsP1-4 유전자로 이루어진 군으로부터 선택되고, 임의로 여기서 뉴클레오티드 서열은 cDNA이다. 일부 측면에서, 분리된 뉴클레오티드 서열의 서열 또는 세트는 서열번호: 6 또는 서열번호: 7에 제시된 서열의 위치 7544에 삽입된 상기 조성물 청구항의 임의의 카세트를 포함한다. 일부 측면에서, 조성물은 a) 서열번호: 3 또는 서열번호: 5의 서열로부터 수득한 하나 이상의 요소의 T7 또는 SP6 RNA 중합효소 프로모터 뉴클레오티드 서열 5'; 및 b) 임의로, 폴리(A) 서열의 하나 이상의 제한 부위 3'를 추가로 포함한다. 일부 측면에서, 본원에 제공된 임의의 조성물 청구항의 카세트는 서열번호: 8 또는 서열번호: 9의 위치 7563에 삽입된다.

또한, 본원에 기재된 임의의 뉴클레오티드 서열을 포함하는 벡터 또는 벡터 세트가 본원에 제공된다.

또한 본원에는 본원에 기재된 임의의 분리된 뉴클레오티드 서열 또는 분리된 뉴클레오티드 서열 세트를 포함하는 분리된 세포가 제공되며, 임의로 여기서 세포는 BHK-21, CHO, HEK293 또는 이의 변이체, 911, HeLa, A549, LP-293, PER.C6 또는 AE1-2a 세포이다.

또한 본원에는 본원에 기재된 임의의 조성물 및 사용 설명서를 포함하는 키트가 제공된다.

일부 측면에서, 임의의 상기 조성물은 다수의 LNP를 추가로 포함하며, 여기서 LNP는 항원 발현 시스템; 양이온성 지질; 비-양이온성 지질; 및 LNP의 응집을 억제하는 접합 지질을 포함하며, 여기서 다수의 LNP에서 LNP의 적어도 약 95%는 비-라멜라 형태를 갖거나; 또는 전자-고밀도에 있다.

일부 측면에서, 비-양이온성 지질은 (1) 인지질 및 (2) 콜레스테롤 또는 콜레스테롤 유도체의 혼합물이다.

일부 측면에서, LNP의 응집을 억제하는 접합 지질은 폴리에틸렌글리콜(PEG)-지질 접합체이다. 일부 측면에서, PEG-지질 접합체는 PEG-디아실글리세롤(PEG-DAG) 접합체, PEG 디알킬옥시프로필(PEG-DAA) 접합체, PEG-인지질 접합체, PEG-세라마이드(PEG-Cer) 접합체, 및 이들의 혼합물로 이루어진 군으로부터 선택된다. 일부 측면에서 PEG-DAA 접합체는 PEG-디데실옥시프로필(C₁₀) 접합체, PEG-디라우릴옥시프로필(C₁₂) 접합체, PEG-디미리스틸옥시프로필(C₁₄) 접합체, PEG-디팔미틸옥시프로필(C₁₆) 접합체, PEG-디스테아릴옥시프로필(C₁₈) 접합체 및 이들의 혼합물로 이루어진 군으로부터 선택된다.

일부 측면에서, 항원 발현 시스템은 LNP에 완전히 캡슐화된다.

일부 측면에서, LNP의 비-라멜라 형태는 역육방정계(H _II ) 또는 입방체 상 구조를 포함한다.

일부 측면에서, 양이온성 지질은 LNP에 존재하는 총 지질의 약 10 mol% 내지 약 50 mol%를 포함한다. 일부 측면에서, 양이온성 지질은 LNP에 존재하는 총 지질의 약 20 mol% 내지 약 50 mol%를 포함한다. 일부 측면에서, 양이온성 지질은 LNP에 존재하는 총 지질의 약 20 mol% 내지 약 40 mol%를 포함한다.

일부 측면에서, 비-양이온성 지질은 LNP에 존재하는 총 지질의 약 10 mol% 내지 약 60 mol%를 포함한다. 일부 측면에서, 비-양이온성 지질은 LNP에 존재하는 총 지질의 약 20 mol% 내지 약 55 mol%를 포함한다. 일부 측면에서, 비-양이온성 지질은 LNP에 존재하는 총 지질의 약 25 mol% 내지 약 50 mol%를 포함한다.

일부 측면에서, 접합 지질은 LNP에 존재하는 총 지질의 약 0.5 mol% 내지 약 20 mol%를 포함한다. 일부 측면에서, 접합 지질은 LNP에 존재하는 총 지질의 약 2 mol% 내지 약 20 mol%를 포함한다. 일부 측면에서, 접합된 지질은 LNP에 존재하는 총 지질의 약 1.5 mol% 내지 약 18 mol%를 포함한다.

일부 측면에서, LNP의 95% 초과는 비-라멜라 형태를 갖는다. 일부 측면에서, LNP의 95% 초과는 전자 고밀도이다.

일부 측면에서, 임의의 상기 조성물은 다수의 LNP를 추가로 포함하며, 여기서 LNP는 LNP에 존재하는 총 지질의 50 mol% 내지 65 mol%를 포함하는 양이온성 지질; LNP에 존재하는 총 지질의 0.5 mol% 내지 2 mol%를 포함하는 LNP의 응집을 억제하는 접합 지질; 및 인지질 및 콜레스테롤 또는 이의 유도체의 혼합물을 포함하는 비-양이온성 지질을 포함하고, 여기서 인지질은 LNP에 존재하는 총 지질의 4 mol% 내지 10 mol%를 포함하고 콜레스테롤 또는 이의 유도체는 LNP에 존재하는 총 지질의 30 mol% 내지 40 mol%를 포함하고; 인지질 및 콜레스테롤 또는 이의 유도체의 혼합물, 여기서 인지질은 LNP에 존재하는 총 지질의 3 mol% 내지 15 mol%를 포함하고 콜레스테롤 또는 이의 유도체는 LNP에 존재하는 전체 지질의 30 mol% 내지 40 mol%를 포함하고; 또는 LNP에 존재하는 총 지질의 49.5 mol%까지의 인지질 및 콜레스테롤 또는 이의 유도체, 여기서 콜레스테롤 또는 이의 유도체는 LNP에 존재하는 총 지질의 30 mol% 내지 40 mol%를 포함한다.

일부 측면에서, 임의의 상기 조성물은 다수의 LNP를 추가로 포함하며, 여기서 LNP는 LNP에 존재하는 총 지질의 50 mol% 내지 85 mol%를 포함하는 양이온성 지질; LNP에 존재하는 총 지질의 0.5 mol% 내지 2 mol%를 포함하는 LNP의 응집을 억제하는 접합 지질; 및 LNP에 존재하는 총 지질의 13 mol% 내지 49.5 mol%를 포함하는 비-양이온성 지질을 포함한다.

일부 측면에서, 인지질은 디팔미토일포스파티딜콜린(DPPC), 디스테아로일포스파티딜콜린(DSPC) 또는 이들의 혼합물을 포함한다.

일부 측면에서, 접합 지질은 폴리에틸렌글리콜(PEG)-지질 접합체를 포함한다. 일부 측면에서, PEG-지질 접합체는 PEG-디아실글리세롤(PEG-DAG) 접합체, PEG-디알킬옥시프로필(PEG-DAA) 접합체 또는 이들의 혼합물을 포함한다. 일부 측면에서, PEG-DAA 접합체는 PEG-디미리스틸옥시프로필(PEG-DMA) 접합체, PEG-디스테아릴옥시프로필(PEG-DSA) 접합체 또는 이들의 혼합물을 포함한다. 일부 측면에서, 접합체의 PEG 부분은 평균 분자량이 약 2,000달톤이다.

일부 측면에서, 접합 지질은 LNP에 존재하는 총 지질의 1 mol% 내지 2 mol%를 포함한다.

일부 측면에서, LNP는 하기식 I의 구조를 갖는 화합물 또는 약제학적으로 허용되는 이의 염, 호변이성질체, 전구약물 또는 입체이성질체을 포함한다:

(I)

여기서: L¹ 및 L²는 각각 독립적으로 -0(C=0)-, -(C=0)0-, -C(=0)-, -0-, -S(0)_x-, -S-S-, -C(=0)S-, -SC(=0)-, -R^aC(=0)-, -C(=0)R^a-, -R^aC(=0)R^a-, -OC(=0) R^a-, -R^aC(=0)0- 또는 직접 결합이고; G¹은 C_i-C₂알킬렌, -(C=O)-, -O(C=O)-, -SC(=O)-, -R^aC(=O)- 또는 직접 결합이고: -C(=0)-, -(C=0)0-, -C(=0)S-, -C(=0)R^a- 또는 직접 결합이고; G는 C_i-C₆알킬렌이고; R^a는 H 또는 C₁-C₁₂ 알킬이고; R^1a 및 R^1b는 각각의 경우 독립적으로 (a) H 또는 C₁-C₁₂ 알킬; 또는 (b) R^1a는 H 또는 C₁-C₁₂ 알킬이고, R^lb는 결합된 탄소 원자와 함께 인접한 R^lb 및 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성하며; R^2a 및 R^2b는 각각의 경우 독립적으로 (a) H 또는 C₁-C₁₂ 알킬; 또는 (b) R^2a는 H 또는 C₁-C₁₂ 알킬이고, R^2b는 결합된 탄소 원자와 함께 인접한 R^2b 및 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성하고; R^3a 및 R^3b는 각각의 경우 독립적으로 (a): H 또는 C₁-C₁₂ 알킬이고; 또는 (b) R^3a는 H 또는 C₁-C₁₂ 알킬이고, R^3b는 결합된 탄소 원자와 함께 인접한 R 및 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성하고; R^4a 및 R^4b는 각각의 경우 독립적으로 (a) H 또는 C₁-C₁₂ 알킬; 또는 (b) R^4a는 H 또는 C₁-C₁₂ 알킬이고, R^4b는 결합된 탄소 원자와 함께 인접한 R^4b 및 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성하고; R⁵ 및 R⁶은 각각 독립적으로 H 또는 메틸이고; R⁷은 C₄-C₂₀알킬이고; R⁸ 및 R⁹는 각각 독립적으로 C₁-C₁₂ 알킬이고; 또는 R⁸및 R⁹는 이들이 결합된 질소 원자와 함께 5원, 6원 또는 7원 헤테로사이클릭 고리를 형성하고; a, b, c 및 d는 각각 독립적으로 1 내지 24의 정수이고; x는 0, 1 또는 2이다.

일부 측면에서, LNP는 하기식 II의 구조를 갖는 화합물 또는 약제학적으로 허용되는 이의 염, 호변이성질체, 전구약물 또는 입체이성질체을 포함한다:

(II)

여기서: L¹ 및 L²는 각각 독립적으로 -O(C=O)-, -(C=O)O- 또는 탄소-탄소 이중 결합이고; R^la 및 R^lb는 각각의 경우에 독립적으로 (a) H 또는 C₁-C₁₂알킬이거나, (b) R^la는 H 또는 C₁-C₁₂ 알킬이고, R^lb는 결합된 탄소 원자와 함께 인접한 R^lb 및 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성하고; R^2a 및 R^2b는 각각의 경우 독립적으로 (a) H 또는 C₁-C₁₂ 알킬이거나, (b) R^2a는 H 또는 C₁-C₁₂ 알킬이고, R^2b는 결합된 탄소 원자와 함께 인접한 R^2b및 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성하고; R^3a 및 R^3b는 각각의 경우 독립적으로 (a) H 또는 C₁-C₁₂ 알킬이거나, (b) R^3a는 H 또는 C₁-C₁₂ 알킬이고, R^3b는 결합된 탄소 원자와 함께 인접한 R^3b 및 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성하고; R^4a 및 R^4b는 각각의 경우 독립적으로 (a) H 또는 C₁-C₁₂ 알킬이거나, (b) R^4a는 H 또는 C₁-C₁₂ 알킬이고, R^4b는 결합된 탄소 원자와 함께 인접한 R^4b 및 결합된 탄소 원자와 함께 탄소-탄소 이중 결합을 형성하고; R⁵및 R⁶은 각각 독립적으로 메틸 또는 사이클로알킬이고; R⁷은 각 경우에 독립적으로 H 또는 C₁-C₁₂ 알킬이고; R⁸ 및 R⁹는 각각 독립적으로 비치환된 C₁-C₁₂ 알킬이고; 또는 R⁸ 및 R⁹는 이들이 부착된 질소 원자와 함께 하나의 질소 원자를 포함하는 5, 6 또는 7원 헤테로사이클릭 고리를 형성하고; a 및 d는 각각 독립적으로 0 내지 24의 정수이고; b 및 c는 각각 독립적으로 1 내지 24의 정수이고; e는 1 또는 2이고, 단 R^1a, R^2a, R^3a 또는 R^4a 중 적어도 하나는 C₁-C₁₂ 알킬이거나, L¹ 또는 L² 중 적어도 하나는 -O(C=O)- 또는 -(C=O)0-이고; R^1a 및 R^1b는 a가 6일 때 이소프로필이 아니고, a가 8일 때 n-부틸이 아니다.

일부 측면에서, 임의의 상기 조성물은 중성 지질, 스테로이드 및 중합체 접합 지질을 포함하는 하나 이상의 부형제를 추가로 포함한다. 일부 측면에서, 중성 지질은 1,2-디스테아로일-sn-글리세로-3-포스포콜린(DSPC), 1,2-디팔미토일-sn-글리세로-3-포스포콜린(DPPC), 1,2-디미리스토일-sn-글리세로-3-포스포콜린(DMPC), 1-팔미토일-2-올레오일-sn-글리세로-3-포스포콜린(POPC), 1,2-디올레오일-sn-글리세로-3-포스포콜린(DOPC) 및 1,2-디올레오일-sn-글리세로-3-포스포에탄올아민(DOPE) 중 적어도 하나를 포함한다. 일부 측면에서, 중성 지질은 DSPC이다.

일부 측면에서, 화합물 대 중성 지질의 몰비는 약 2:1 내지 약 8:1 범위이다.

일부 측면에서, 스테로이드는 콜레스테롤이다. 일부 측면에서, 화합물 대 콜레스테롤의 몰비는 약 2:1 내지 1:1 범위이다.

일부 측면에서, 중합체 접합 지질은 페길화된 지질이다. 일부 측면에서, 화합물 대 페길화된 지질의 몰비는 약 100:1 내지 약 25:1 범위이다. 일부 측면에서, 페길화된 지질은 PEG-DAG, PEG 폴리에틸렌(PEG-PE), PEG-숙시노일-디아실글리세롤(PEG-S-DAG), PEG-cer 또는 PEG 디알킬옥시프로필카바메이트이다. 일부 측면에서, 페길화된 지질은 하기 구조 III 또는 약제학적으로 허용되는 이의 염, 호변이성질체, 또는 입체이성질체을 갖는다:

(III)

여기서: R¹⁰ 및 R¹¹은 각각 독립적으로 10 내지 30개의 탄소 원자를 함유하는 직쇄 또는 분지쇄, 포화 또는 불포화 알킬 사슬이고, 여기서 알킬 사슬은 임의로 하나 이상의 에스테르 결합에 의해 중단되고; z는 30 내지 60 범위의 평균값을 갖는다. 일부 측면에서, R¹⁰ 및 R¹¹은 각각 독립적으로 12 내지 16개의 탄소 원자를 갖는 직쇄 포화 알킬 사슬이다. 일부 측면에서 평균 z는 약 45이다.

여기서 시작

일부 측면에서, LNP는 다중음이온성 핵산과 혼합될 때 비-이중층 구조로 자가-조립된다. 일부 측면에서, 비-이중층 구조는 60 nm 및 120 nm 사이의 직경을 갖는다. 일부 측면에서, 비-이중층 구조는 약 70 nm, 약 80 nm, 약 90 nm 또는 약 100 nm의 직경을 갖는다. 일부 측면에서, 나노입자 전달 비히클은 약 100 nm의 직경을 갖는다.

또한 본원에서는 본원에 기재된 임의의 조성물 또는 임의의 약제학적 조성물을 대상체에게 투여하는 것을 포함하여, 암을 갖는 대상체를 치료하는 방법을 제공한다. 일부 측면에서, 에피토프-코딩 핵산 서열은 암에 걸린 대상체의 종양 또는 감염된 대상체의 세포 또는 샘플로부터 유래된다. 일부 측면에서, 에피토프-코딩 핵산 서열은 암에 걸린 대상체의 종양 또는 감염된 대상체의 세포 또는 샘플에서 유래하지 않는다.

또한 본원에 기재된 임의의 조성물 또는 임의의 약제학적 조성물을 대상체에게 투여하는 것을 포함하여, 대상체에서 면역 반응을 자극하는 방법이 본원에 제공된다.

일부 측면에서, 대상체는 MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립유전자를 발현한다. 일부 측면에서, MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 HLA 대립유전자는 A*03:01, A*11:01, A*02:01, C*01:02, 및/또는 A*01:01이다. 일부 측면에서, MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 HLA 대립유전자는 A*03:01이다. 일부 측면에서, MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 HLA 대립유전자는 A*11:01이다. 일부 측면에서, MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 HLA 대립유전자는 A*02:01이다. 일부 측면에서, MHC 클래스 I 에피토프를 제공하는 것으로 예측되거나 알려진 HLA 대립유전자는 C*01:02이다. 일부 측면에서, MHC 클래스 I 에피토프를 제공하는 것으로 예측되거나 알려진 HLA 대립유전자는 A*01:01이다. 일부 측면에서, 조성물은 근육내(IM), 피내(ID), 피하(SC), 또는 정맥내(IV)로 투여된다. 일부 측면에서, 조성물은 근육내 투여된다.일부 측면에서, 방법은 하나 이상의 면역 조절자를 투여하는 것을 추가로 포함하며, 임의로 면역 조절자는 조성물 또는 약제학 조성물의 투여 전, 투여와 동시에 또는 투여 후에 투여된다. 일부 측면에서, 하나 이상의 면역 조절자는 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원-결합 단편, 항-4-1BB 항체 또는 이의 항원 결합 단편, 또는 항-OX-40 항체 또는 이의 항원 결합 단편으로 이루어진 군으로부터 선택된다. 일부 측면에서, 면역 조절자는 정맥내(IV), 근육내(IM), 피내(ID) 또는 피하(SC)로 투여된다. 일부 측면에서, 피하 투여는 조성물 또는 약제학적 조성물 투여 부위 근처에 있거나 하나 이상의 벡터 또는 조성물 배액 림프절에 아주 근접해 있다.

일부 측면에서, 방법은 대상체에게 제 2 백신 조성물을 투여하는 것을 추가로 포함한다. 일부 측면에서, 제 2 백신 조성물은 제 1 조성물 또는 약제학적 조성물의 투여 전에 투여된다. 일부 측면에서, 제 2 백신 조성물은 본원에 제공된 임의의 조성물 또는 약제학적 조성물의 투여 후에 투여된다. 일부 측면에서, 제 2 백신 조성물은 투여되는 제 1 조성물 또는 약제학적 조성물과 동일하다. 일부 측면에서, 제 2 백신 조성물은 투여되는 제 1 조성물 또는 약제학적 조성물과 상이하다. 일부측면에서, 제 2 백신 조성물은 적어도 하나의 항원-코딩 핵산 서열을 코딩하는 침팬지 아데노바이러스 벡터를 포함한다. 일부 측면에서, 침팬지 아데노바이러스 벡터에 의해 코딩된 적어도 하나의 항원-코딩 핵산 서열은 본원에 제공된 임의의 조성물 청구항의 적어도 하나의 항원-코딩 핵산 서열과 동일하다.

또한, 본원에서는 임의의 상기 조성물 청구항의 하나 이상의 벡터를 제조하는 방법을 제공하며, 이 방법은 (a) 백본 및 카세트를 포함하는 선형화된 DNA 서열을 수득하는 단계; (b) 선형화된 DNA 서열을 RNA로 전사하는데 필요한 모든 성분을 함유하는 시험관내 전사 반응물에 선형화된 DNA 서열을 첨가함으로써 선형화된 DNA 서열을 시험관내 전사하는 단계, 임의로 생성된 RNA에 m7g 캡을 시험관내 첨가하는 것을 추가로 포함하고; 및 (c) 시험관내 전사 반응물로부터 하나 이상의 벡터를 분리하는 단계를 포함한다. 일부 측면에서, 선형화된 DNA 서열은 DNA 플라스미드 서열을 선형화하거나 PCR을 사용하여 증폭함으로써 생성된다. 일부 측면에서, DNA 플라스미드 서열은 박테리아 재조합 또는 전체 게놈 DNA 합성 또는 박테리아 세포에서 합성된 DNA의 증폭과 함께 전체 게놈 DNA 합성 중 하나를 사용하여 생성된다. 일부 측면에서, 시험관내 전사 반응물으로부터 하나 이상의 벡터를 분리하는 것은 페놀 클로로포름 추출, 실리카 컬럼 기반 정제 또는 유사한 RNA 정제 방법 중 하나 이상을 포함한다.

또한 항원 발현 시스템의 전달을 위한 임의의 상기 조성물 청구항의 조성물을 제조하는 방법이 본원에 제공되며, 상기 방법은 (a) 나노입자 전달 비히클을 위한 성분을 제공하는 단계; (b) 항원 발현 시스템을 제공하는 단계; 및 (c) 나노입자 전달 비히클 및 항원 발현 시스템이 항원 발현 시스템의 전달을 위한 조성물을 생성하기에 충분한 조건을 제공하는 단계를 포함한다. 일부 측면에서, 미세유체 혼합에 의해 조건이 제공된다.

또한, 임의로 질병이 암 또는 감염인 질병에 걸린 대상체를 치료하는 방법이 본원에 제공되며, 상기 방법은 대상체에게 항원-기반 백신을 투여하는 단계를 포함하며, 여기서 항원 기반 백신은 항원-코딩 카세트, 또는 카세트에 의해 코딩된 폴리펩티드 서열을 포함하고, 여기서 항원-코딩 카세트는 5'에서 3'으로 하기식으로 기술된 적어도 하나의 항원-코딩 핵산 서열을 포함하며:

(E _x -(E ^N _n ) _y ) _z

여기서 E는 적어도 하나의 별개의 에피토프-코딩 핵산 서열을 포함하는 뉴클레오티드 서열을 나타내고, n은 분리된 별개의 에피토프-코딩 핵산 서열의 수를 나타내고 0을 포함하는 임의의 정수이고, E^N은 각각의 상응하는 n에 대해 분리된 별개의 에피토프-코딩 핵산을 포함하는 뉴클레오티드 서열을 나타내고, z의 각 반복에 대해: 각 n에 대해 x = 0 또는 1, y = 0 또는 1이고, x 또는 y 중 적어도 하나는 1이고, z = 2 이상이고, 여기서 항원-코딩 핵산 서열은 E, 주어진 E^N, 또는 이들의 조합의 적어도 2회의 반복을 포함하고, 적어도 2회 반복을 포함하는 별개의 에피토프-코딩 핵산 서열 중 적어도 하나는 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩한다.

또한, 임의로 질병이 암인 질병에 걸린 대상체를 치료하는 방법이 본원에 제공되며, 상기 방법은 대상체에게 항원-기반 백신을 투여하는 단계를 포함하며, 여기서 항원-기반 백신은 항원 발현 시스템을 포함하고, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고, 하나 이상의 벡터는: (a) 벡터 백본, 여기서 백본은: (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하고; 및 (b) 카세트를 포함하고, 여기서 카세트는 (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열, 여기서 각각의 에피토프-코딩 핵산 서열은; (A) 임의로 5' 링커 서열, 및 (B) 임의로 3' 링커 서열을 포함하고; (ii) 항원-코딩 핵산 서열에 작동 가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및 (iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열; (iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및 (v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고, 여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함한다.

또한, 임의로 질병이 암인 질병에 걸린 대상체를 치료하는 방법이 본원에 제공되며, 상기 방법은 대상체에게 항원-기반 백신을 투여하는 단계를 포함하며, 여기서 항원-기반 백신은 항원 발현 시스템을 포함하고, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고, 하나 이상의 벡터는: (a) 벡터 백본, 여기서 백본은: (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하고; 및 (b) 카세트를 포함하고, 여기서 카세트는 (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) 적어도 2개의 별개의 에피토프-코딩 핵산 서열, 임의로 다음을 포함하고 (1) 코딩된 에피토프 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경, 임의로 여기서 적어도 하나의 변경은 KRAS 돌연변이이고, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드로 이루어진 군에서 선택된 감염성 질병 유기체 펩티드를 코딩하는 핵산 서열; 여기서 각각의 에피토프-코딩 핵산 서열은; (A) 임의로 5' 링커 서열, 및 (B) 임의로 3' 링커 서열을 포함하고, (ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및 (iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열; (iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및 (v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고, 여기서 제 2 프로모터가 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 카세트는: (1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나, (2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아니다.

일부 측면에서, 항원-코딩 카세트는 각각의 아미노산 서열 VVVGACGVGK(서열번호: 75), VVVGADGVGK(서열번호: 78), VVGAVGVGK(서열번호: 79), 및 ILDTAGHEEY(서열번호: 82)의 적어도 4회 반복을 코딩한다.

일부 측면에서, 에피토프-코딩 핵산 서열은 암에 걸린 대상체의 종양 또는 감염된 대상체의 세포 또는 샘플에서 유래한다. 일부 측면에서, 에피토프-코딩 핵산 서열은 암에 걸린 대상체의 종양 또는 감염된 대상체의 세포 또는 샘플에서 유래하지 않는다.

또한 대상체에서 면역 반응을 자극하는 방법이 본원에 제공되며, 상기 방법은 대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하며, 여기서 상기 항원-기반 백신은 항원-코딩 카세트, 또는 카세트에 의해 코딩된 폴리펩티드 서열을 포함하고, 여기서 항원-코딩 카세트는 5'에서 3'으로 다음식으로 기술된 적어도 하나의 항원 코딩 핵산 서열을 포함하고:

(E _x -(E ^N _n ) _y ) _z

또한 대상체에서 면역 반응을 자극하는 방법이 본원에 제공되며, 상기 방법은 대상체에게 항원-기반 백신을 대상체에서 투여하는 단계를 포함하며, 여기서 항원-기반 백신은 항원 발현 시스템을 포함하고, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고, 하나 이상의 벡터는: (a) 벡터 백본, 여기서 백본은: (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하고; 및 (b) 카세트를 포함하고, 여기서 카세트는 (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열, 여기서 각각의 에피토프-코딩 핵산 서열은; (A) 임의로 5' 링커 서열, 및 (B) 임의로 3' 링커 서열을 포함하고; (ii) 임의로, 항원-코딩 핵산 서열에 작동 가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및 (iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열; (iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및 (v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고, 여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함한다.

또한, 임의로 질병이 암 또는 감염인 질병에 걸린 대상체를 치료하는 방법이 본원에 제공되며, 상기 방법은 대상체에게 항원-기반 백신을 투여하는 단계를 포함하며, 여기서 항원-기반 백신은 항원 발현 시스템을 포함하고, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고, 하나 이상의 벡터는: (a) 벡터 백본, 여기서 백본은: (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하고; 및 (b) 카세트를 포함하고, 여기서 카세트는 (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) 적어도 2개의 별개의 에피토프-코딩 핵산 서열, 임의로 다음을 포함하고 (1) 코딩된 에피토프 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경, 임의로 여기서 적어도 하나의 변경은 KRAS 돌연변이이고, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드로 이루어진 군에서 선택된 감염성 질병 유기체 펩티드를 코딩하는 핵산 서열; 여기서 각각의 에피토프-코딩 핵산 서열은; (A) 임의로 5' 링커 서열, 및 (B) 임의로 3' 링커 서열을 포함하고, (ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및 (iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열; (iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및 (v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고, 여기서 제 2 프로모터가 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 카세트는: (1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나, (2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아니다.

일부 측면에서, 대상체는 적어도 하나의 에피토프 서열을 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립유전자를 발현하며, 임의로 여기서 제시되는 것으로 예측되거나 알려진 적어도 하나의 에피토프 서열은 (1) KRAS-연관 MHC 클래스 I 네오에피토프, 및/또는 (2) 면역우성 MHC 클래스 I 에피토프 및 카세트에 코딩된 다른 MHC 클래스 I 에피토프를 포함한다. 일부 측면에서, 대상체는 적어도 하나의 에피토프 서열을 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립유전자를 발현하고, 여기서 적어도 하나의 에피토프 서열은 표면 상의 MHC 클래스 I에 의해 제시되는 것으로 알려지거나 의심되는 에피토프를 포함하고, 여기서 임의로 예측되거나 제시된 것으로 알려진 적어도 하나의 에피토프 서열은 (1) KRAS-관련 MHC 클래스 I 네오에피토프, 및/또는 (2) 면역우성 MHC 클래스 I 에피토프 및 카세트에서 코딩된 다른 MHC 클래스 I 에피토프를 포함한다. 일부 측면에서, 세포의 표면은 종양 세포 표면이다. 일부 측면에서, 세포는 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 비소세포 폐암, 및 소세포 폐암으로 이루어진 군으로부터 선택되는 종양 세포이다. 일부 측면에서, 세포의 표면은 감염된 세포 표면이다. 일부 측면에서, 세포는 병원균 감염 세포, 바이러스 감염 세포, 박테리아 감염 세포, 진균 감염 세포 및 기생충 감염 세포로 이루어진 군으로부터 선택된 감염된 세포이다. 일부 측면에서, 바이러스 감염된 세포는 HIV 감염 세포, 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS) 감염 세포, 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2) 감염 세포, 에볼라 감염 세포, B형 간염 바이러스(HBV) 감염 세포, 인플루엔자 감염 세포, 오르티믹소바이러스과 바이러스 감염 세포, 인간 유두종 바이러스(HPV) 감염 세포, 거대세포바이러스(CMV) 감염 세포, 치쿤구니야 바이러스 감염 세포 세포, 호흡기 세포융합 바이러스(RSV) 감염 세포, 뎅기열 바이러스 감염 세포 및 C형 간염 바이러스(HCV) 감염 세포로 이루어진 군에서 선택된다.

또한 대상체에서 면역 반응을 유도하는 방법이 본원에 제공되며, 상기 방법은 대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하며, 여기서 상기 항원-기반 백신은 항원-코딩 카세트, 또는 카세트에 의해 코딩된 폴리펩티드 서열을 포함하고, 여기서 항원-코딩 카세트는 5'에서 3'으로 다음식으로 기술된 적어도 하나의 항원 코딩 핵산 서열을 포함하고:

(E _x -(E ^N _n ) _y ) _z

여기서 E는 적어도 하나의 별개의 에피토프-코딩 핵산 서열을 포함하는 뉴클레오티드 서열을 나타내고, n은 분리된 별개의 에피토프-코딩 핵산 서열의 수를 나타내고 0을 포함하는 임의의 정수이고, E^N은 각각의 상응하는 n에 대해 분리된 별개의 에피토프-코딩 핵산을 포함하는 뉴클레오티드 서열을 나타내고, z의 각 반복에 대해: 각 n에 대해 x = 0 또는 1, y = 0 또는 1이고, x 또는 y 중 적어도 하나는 1이고, z = 2 이상이고, 여기서 항원-코딩 핵산 서열은 E, 주어진 E^N, 또는 이들의 조합의 적어도 2회 반복을 포함하고, 적어도 2회 반복을 포함하는 별개의 에피토프-코딩 핵산 서열 중 적어도 하나는 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩한다.

또한 대상체에서 면역 반응을 유도하는 방법이 본원에 제공되며, 상기 방법은 대상체에게 항원-기반 백신을 대상체에서 투여하는 단계를 포함하며, 여기서 항원-기반 백신은 항원 발현 시스템을 포함하고, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고, 하나 이상의 벡터는: (a) 벡터 백본, 여기서 백본은: (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하고; 및 (b) 카세트를 포함하고, 여기서 카세트는 (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열, 여기서 각각의 에피토프-코딩 핵산 서열은; (A) 임의로 5' 링커 서열, 및 (B) 임의로 3' 링커 서열을 포함하고; (ii) 항원-코딩 핵산 서열에 작동 가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및 (iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열; (iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및 (v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고, 여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함하고, 여기서 대상체는 적어도 하나의 KRAS-연관 MHC 클래스 I 네오에피토프를 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립형질을 발현한다.

또한 대상체에서 면역 반응을 유도하는 방법이 본원에 제공되며, 상기 방법은 대상체에게 항원-기반 백신을 대상체에서 투여하는 단계를 포함하며, 여기서 항원-기반 백신은 항원 발현 시스템을 포함하고, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고, 하나 이상의 벡터는: (a) 벡터 백본, 여기서 백본은: (i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및 (ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하고; 및 (b) 카세트를 포함하고, 여기서 카세트는 (i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열: (I) 적어도 2개의 별개의 에피토프-코딩 핵산 서열, 임의로 다음을 포함하고 (1) 코딩된 에피토프 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경, 임의로 여기서 적어도 하나의 변경은 KRAS 돌연변이이고, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드로 이루어진 군에서 선택된 감염성 질병 유기체 펩티드를 코딩하는 핵산 서열; 여기서 각각의 에피토프-코딩 핵산 서열은; (A) 임의로 5' 링커 서열, 및 (B) 임의로 3' 링커 서열을 포함하고, (ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및 (iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열; (iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및 (v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고, 여기서 제 2 프로모터가 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 카세트는: (1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나, (2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아니고, 여기서 대상체는 면역우성 MHC 클래스 I 에피토프 및 카세트에서 코딩된 다른 MHC 클래스 I 에피토프 모두를 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립유전자를 발현한다.

일부 측면에서, 항원-코딩 카세트는 각각의 아미노산 서열 VVVGACGVGK(서열번호: 75), VVVGADGVGK(서열번호: 78), VVGAVGVGK (서열번호: 79), 및 ILDTAGHEEY(서열번호: 82)의 적어도 4회 반복을 코딩한다. 일부 측면에서, KRAS-연관 MHC 클래스 I 네오에피토프 또는 KRAS 돌연변이는 KRAS G12C 돌연변이, KRAS G12V 돌연변이, KRAS G12D 돌연변이 또는 KRAS Q61H 돌연변이를 포함한다. 일부 측면에서, KRAS-연관 MHC 클래스 I 네오에피토프 또는 KRAS 돌연변이는 서열번호 75-82에 제시된 아미노산 서열 중 임의의 하나를 포함한다. 일부 측면에서, 항원-코딩 카세트는 서열번호: 75-82에 제시된 각각의 아미노산 서열을 포함한다. 일부 측면에서, 항원-코딩 카세트는 서열번호: 75-82에 제시된 각각의 아미노산 서열의 2회 이상의 반복을 포함한다. 일부 측면에서, 항원-코딩 카세트는 서열번호: 75-82에 제시된 각각의 아미노산 서열의 4회 반복을 포함한다. 일부 측면에서, KRAS-연관 MHC 클래스 I 네오에피토프 또는 KRAS 돌연변이는 서열번호: 57, 서열번호: 58, 서열번호: 59 또는 서열번호: 60에 제시된 아미노산 서열을 포함한다. 측면에서, 에피토프-코딩 핵산 서열은 별개의 KRAS-연관 MHC 클래스 I 네오에피토프 또는 별개의 KRAS 돌연변이를 독립적으로 코딩하는 2개 이상의 별개의 에피토프-코딩 핵산 서열을 포함한다. 일부 측면에서, 각각의 에피토프-코딩 핵산 서열은 별개의 KRAS-연관 MHC 클래스 I 네오에피토프 또는 별개의 KRAS 돌연변이를 독립적으로 코딩한다. 일부 측면에서, 에피토프-코딩 핵산 서열은 KRAS G12C 돌연변이, KRAS G12V 돌연변이, KRAS G12D 돌연변이 또는 KRAS Q61H 돌연변이를 독립적으로 코딩하는 2개 이상의 별개의 에피토프-코딩 핵산 서열을 포함한다. 일부 측면에서, 에피토프-코딩 핵산 서열은 각각의 KRAS G12C 돌연변이, KRAS G12V 돌연변이 및 KRAS G12D 돌연변이, 및 임의로 KRAS Q61H 돌연변이를 독립적으로 코딩한다. 일부 측면에서, 항원-코딩 핵산 서열은 서열번호: 64 또는 서열번호: 65에 제시된 아미노산 서열을 포함하는 펩티드를 코딩한다. 일부 측면에서, 항원-코딩 핵산 서열은 서열번호: 65에 제시된 아미노산 서열을 포함하는 펩티드를 코딩한다.

일부 측면에서, 카세트는 (1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나, (2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아니다. 일부 측면에서, 카세트는 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 KRAS-연관 네오에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않는다. 일부 측면에서, 카세트는 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않는다. 일부 측면에서, 카세트는 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 검출 한계 미만으로 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않는다. 일부 측면에서, 카세트는 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않으며, 여기서 다른 MHC 클래스 I 에피토프에 대한 면역 반응은 치료학적으로 효과적인 반응이 아니다.

일부 측면에서, 면역우성 에피토프는 TP53-연관 MHC 클래스 I 네오에피토프이고, 임의로 TP53-연관 MHC 클래스 I 네오에피토프는 S127Y 돌연변이를 포함한다.

일부 측면에서, 항원 발현 시스템은 본원에 기술된 항원 발현 시스템 중 임의의 하나를 포함한다. 일부 측면에서, 항원-기반 백신은 본원에 기술된 약제학적 조성물 중 임의의 하나를 포함한다.

일부 측면에서, 항원-기반 백신은 프라이밍 용량으로 투여된다. 일부 측면에서, 항원-기반 백신은 하나 이상의 부스팅 용량으로 투여된다. 일부 측면에서, 부스팅 용량은 프라이밍 용량과 상이하다. 일부 측면에서, a) 프라이밍 용량은 침팬지 아데노바이러스 벡터를 포함하고 부스팅 용량은 알파바이러스 벡터를 포함하고; 또는 b) 프라이밍 용량은 알파바이러스 벡터 벡터를 포함하고 부스팅 용량은 침팬지 아데노바이러스 벡터를 포함한다. 일부 측면에서, 부스팅 용량은 프라이밍 용량과 동일하다. 일부 측면에서, 하나 이상의 부스팅 용량의 주사 부위는 프라이밍 용량의 주사 부위에 가능한 한 가깝다.

일부 측면에서, 방법은 대상체의 HLA-일배체형을 결정하거나 결정했던 것을 추가로 포함한다.

일부 측면에서, 항원-기반 백신은 근육내(IM), 피내(ID), 피하(SC) 또는 정맥내(IV) 투여된다. 일부 측면에서, 항원-기반 백신은 근육내(IM) 투여된다. 일부 측면에서, IM 투여는 별도의 주사 부위에서 투여된다. 일부 측면에서, 별도의 주사 부위는 반대편 삼각근에 있다. 일부 측면에서, 별도의 주사 부위는 양쪽의 둔근 또는 대퇴직근 부위에 있다.

또한 본원에는 본원에 개시된 임의의 조성물(예컨대 본원에 개시된 알파바이러스-기반 또는 ChAd-기반 벡터) 및 약제학적으로 허용되는 담체를 포함하는 약제학적 조성물이 개시되어 있다. 일부 측면에서, 약제학적 조성물은 보조제를 추가로 포함한다. 일부 측면에서, 약제학적 조성물은 면역 조절자를 추가로 포함한다. 일부 측면에서, 면역 조절자는 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원-결합 단편, 항-4-1BB 항체 또는 이의 항원 결합 단편, 또는 항-OX-40 항체 또는 이의 항원 결합 단편이다.

또한 본원에 개시된 분리된 뉴클레오티드 서열을 포함하는 벡터가 본원에 개시된다.

또한 본원에는 본원에 개시된 벡터 또는 조성물 및 사용 설명서를 포함하는 키트가 개시되어 있다.

또한 본원에 기재된 임의의 조성물 또는 임의의 약제학적 조성물을 대상체에게 투여하는 것을 포함하여, 대상체를 치료하는 방법이 본원에 제공된다. 또한 본원에 기술된 임의의 조성물, 벡터 또는 약제학적 조성물을 대상체에게 투여하는 것을 포함하여, 대상체에서 면역 반응을 유도하는 방법이 본원에 개시된다. 일부 측면에서, 대상체는 MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립유전자를 발현한다. 일부 측면에서, MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 HLA 대립유전자는 A*03:01, A*11:01, A*02:01, C*01:02, 및/또는 A*01:01이다. 일부 측면에서, MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 HLA 대립유전자는 A*03:01이다. 일부 측면에서, MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 HLA 대립유전자는 A*11:01이다. 일부 측면에서, MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 HLA 대립유전자는 A*02:01이다. 일부 측면에서, MHC 클래스 I 에피토프를 제공하는 것으로 예측되거나 알려진 HLA 대립유전자는 C*01:02이다. 일부 측면에서, MHC 클래스 I 에피토프를 제공하는 것으로 예측되거나 알려진 HLA 대립유전자는 A*01:01이다. 일부 측면에서, 벡터 또는 조성물은 근육내(IM), 피내(ID), 피하(SC), 또는 정맥내(IV)로 투여된다.

또한, 본원에서는 임의의 상기 조성물의 하나 이상의 벡터를 제조하는 방법을 제공하며, 이 방법은: 백본 및 카세트를 포함하는 선형화된 DNA 서열을 수득하는 단계; 선형화된 DNA 서열을 RNA로 전사하는데 필요한 모든 성분을 함유하는 시험관내 전사 반응물에 선형화된 DNA 서열을 첨가함으로써 선형화된 DNA 서열을 시험관내 전사하는 단계, 임의로 생성된 RNA에 m7g 캡을 시험관내 첨가하는 것을 추가로 포함하고; 및 시험관내 전사 반응물로부터 하나 이상의 벡터를 분리하는 단계를 포함한다. 일부 측면에서, 선형화된 DNA 서열은 DNA 플라스미드 서열을 선형화하거나 PCR을 사용하여 증폭함으로써 생성된다. 일부 측면에서, DNA 플라스미드 서열은 박테리아 재조합 또는 전체 게놈 DNA 합성 또는 박테리아 세포에서 합성된 DNA의 증폭과 함께 전체 게놈 DNA 합성 중 하나를 사용하여 생성된다. 일부 측면에서, 시험관내 전사 반응물으로부터 하나 이상의 벡터를 분리하는 것은 페놀 클로로포름 추출, 실리카 컬럼 기반 정제 또는 유사한 RNA 정제 방법 중 하나 이상을 포함한다.

또한 본원에 개시된 임의의 조성물을 제조하는 방법이 본원에 개시되며, 상기 방법은 나노입자 전달 비히클을 위한 구성요소를 제공하는 단계; 항원 발현 시스템을 제공하는 단계; 및 나노입자 전달 비히클 및 항원 발현 시스템이 항원 발현 시스템의 전달을 위한 조성물을 생성하기에 충분한 조건을 제공하는 단계를 포함한다. 일부 측면에서, 미세유체 혼합에 의해 조건이 제공된다.

또한 본원에 개시된 아데노바이러스 벡터를 제조하는 방법이 본원에 제공되며, 상기 방법은 적어도 하나의 프로모터 서열 및 항원 카세트를 포함하는 플라스미드 서열을 수득하는 단계; 플라스미드 서열을 하나 이상의 숙주 세포로 형질주입시키는 단계; 및 하나 이상의 숙주 세포로부터 아데노바이러스 벡터를 분리하는 단계를 포함한다.

일부 측면에서, 분리는 아데노바이러스 벡터를 포함하는 세포 용해물을 수득하기 위해 숙주 세포를 용해시키는 단계; 및 세포 용해물로부터 아데노바이러스 벡터를 정제하는 단계를 포함한다.

일부 측면에서, 플라스미드 서열은 박테리아 재조합 또는 전체 게놈 DNA 합성 또는 박테리아 세포에서 합성된 DNA의 증폭과 함께 전체 게놈 DNA 합성 중 하나를 사용하여 생성된다. 일부 측면에서, 하나 이상의 숙주 세포는 CHO, HEK293 또는 이의 변이체, 911, HeLa, A549, LP-293, PER.C6 및 AE1-2a 세포 중 적어도 하나이다. 일부 측면에서, 세포 용해물로부터 아데노바이러스 벡터를 정제하는 것은 크로마토그래피 분리, 원심분리, 바이러스 침전 및 여과 중 하나 이상을 포함한다.

본 발명의 이들 및 다른 특징, 측면 및 이점은 하기 설명 및 첨부 도면과 관련하여 더 잘 이해될 것이다:
도 1a는 KRAS 네오에피토프 G12C, G12V, G12D 및 Q61H의 단일 카피("KRAS 1X(20x1)"; 카세트 = 서열번호: 63), KRAS G12C, G12V, G12D 및 Q61H 네오에피토프 의 2회 반복 및 추가적인 KRAS 네오에피토프의 2개 반복("KRAS 2X(8x2)"; 카세트 = 서열번호: 64), 또는 KRAS 네오에피토프의 4개 반복("KRAS 4X(4x4)"; 카세트 = 서열번호: 65)를 특징으로 하는 카세트의 예시를 제시한다. 숫자 식별자는 각각의 카세트에 대한 에피토프 "슬롯"을 참조하며 카세트 설계 전체에 대한 것은 아니다(예를 들어, 20x1 카세트의 슬롯 "3" 에피토프는 8x2 카세트의 슬롯 3에 있는 에피토프와 동일하지 않다).
도 1b는 반복 에피토프가 백신 유도 항원-특이적 T 세포 반응을 증가시킨다 는 것을 입증한다. 반복된 네오에피토프 KRAS G12C에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 8x10¹⁰ VP로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 VVVGACGVGK(서열번호: 75)로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다.
도 1c는 반복 에피토프가 백신 유도 항원-특이적 T 세포 반응을 증가시킨다는 것을 입증한다. 반복된 네오에피토프 KRAS G12V에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 8x10¹⁰ VP로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 VVVGAVGVGK(서열번호: 81)로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다. 파선은 셀 수 없을 정도로 많은 샘플(TNTC)을 나타낸다.
도 1d는 반복 에피토프가 백신 유도 항원-특이적 T 세포 반응을 증가시킨다는 것을 입증한다. 반복된 네오에피토프 KRAS G12D에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 8x10¹⁰ VP로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 VVVGADGVGK(서열번호: 78)로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다.
도 2a는 TP53 에피토프, 구체적으로 KRAS 네오에피토프 G12C, G12V, G12D 및 Q61H("KRAS 4x1"; 카세트 = 서열번호: 66)만, TP53 R213L 네오에피토프와 조합된 KRAS 네오에피토프("KRAS 4x1 + R213L"; 카세트 = 서열번호: 67), 및 TP53 S127Y 네오에피토프와 조합된 KRAS 네오에피토프("KRAS 4x1 + S127Y"; 카세트 = 서열번호: 68)을 포함하는 벡터의 면역우성를 평가하기 위해 설계된 ChAdV68 전달 벡터의 예시를 제시한다.
도 2b는 면역우성 에피토프의 제거가 KRAS 네오에피토프에 대한 백신 유도 항원-특이적 T 세포 반응을 증가시킨다는 것을 입증한다. 네오에피토프 KRAS G12C에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 5x10¹⁰ VP로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 VVVGACGVGK(서열번호: 75)로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다.
도 2c는 면역우성 에피토프의 제거가 KRAS 네오에피토프에 대한 백신 유도 항원-특이적 T 세포 반응을 증가시킨다는 것을 입증한다. 네오에피토프 KRAS G12D에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 5x10¹⁰ VP로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 VVVGADGVGK(서열번호: 78)로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다.
도 2d는 면역우성 에피토프의 제거가 KRAS 네오에피토프에 대한 백신 유도 항원-특이적 T 세포 반응을 증가시킨다는 것을 입증한다. 네오에피토프 KRAS G12V에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 5x10¹⁰ VP로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 VVVGAVGVGK(서열번호: 81)로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다.
도 2e는 반복 에피토프가 백신 유도 항원-특이적 T 세포 반응을 증가시킨다는 것을 입증한다. R213L 및 S127Y 네오에피토프에 대한 TP53 네오에피토프 풀에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 5x10¹⁰ VP로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다. 파선은 셀 수 없을 정도로 많은 샘플(TNTC)을 나타낸다.
도 3은 반복 에피토프가 백신 유도된 항원-특이적 T-세포 반응을 증가시킨다는 것을 입증한다. 반복된 네오에피토프 KRAS G12V(왼쪽 패널) 또는 KRAS G12D(오른쪽 패널)에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 5x10¹⁰ VP로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 VVVGAVGVGK (서열번호: 81) 또는 VVVGADGVGK (서열번호: 78)로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다.
도 4는 반복 에피토프가 백신 유도된 항원-특이적 T-세포 반응을 증가시킨다는 것을 입증한다. 반복된 네오에피토프 KRAS G12V(왼쪽 패널) 또는 KRAS G12D(오른쪽 패널)에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 7x10¹⁰ VP로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 VVVGAVGVGK (서열번호: 81) 또는 VVVGADGVGK (서열번호: 78)로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다.
도 5는 반복 에피토프가 KRAS Q61H에 대한 백신 유도 항원-특이적 T 세포 반응을 증가시킨다는 것을 입증한다. 표시된 카세트 형식에 대해 반복된 네오에피토프 KRAS Q61H에 대한 ELISpot 결과가 표시된다. 인간 HLA-A01:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 5x10¹⁰ VP로 면역화하고 면역화 12일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 ILDTAGHEEY (서열번호: 82)로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다.
도 6은 반복 에피토프가 ChAdV68 및 SAM 벡터 형식 모두에 대해 백신 유도된 항원-특이적 T-세포 반응을 증가시킨다는 것을 입증한다. 반복된 네오에피토프 KRAS G12V(왼쪽 패널) 또는 KRAS G12D(오른쪽 패널)에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 5x10¹⁰ VP 또는 표시된 SAM 벡터 10μg로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 25량체에 걸쳐 있는 모든 가능한 38개의 최소 에피토프를 함유하는 각각의 펩티드 풀로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다. 열은 왼쪽에서 오른쪽으로 ChAdV68 20x1, SAM 20x1, ChAdV68 4x4 및 SAM 4x4이다.
도 7은 반복 에피토프가 ChAdV68 및 SAM 벡터 형식 모두에 대해 백신 유도된 항원-특이적 T-세포 반응을 증가시킨다는 것을 입증한다. 반복된 네오에피토프 KRAS G12V(왼쪽 패널) 또는 KRAS G12D(오른쪽 패널)에 대한 ELISpot 결과가 표시된다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 표시된 ChAdV68 전달 벡터를 사용하여 5x10¹⁰ VP 또는 표시된 SAM 벡터 10μg로 면역화하고 면역화 14일 후 비장 세포를 분리하였다. 항원-특이적 T 세포의 수는 VVGAVGVGK (서열번호: 79) 또는 VVVGADGVGK (서열번호: 78)로 밤새 자극한 후 IFNg ELISpot에 의해 측정되었다. 데이터는 각 동물에 대해 1x10⁶ 비장 세포당 스팟 형성 콜로니(SFC)로 표시된다. 막대는 중앙값을 나타낸다. 열은 왼쪽에서 오른쪽으로 ChAdV68 20x1, SAM 20x1, ChAdV68 4x4 및 SAM 4x4이다.

I. 정의

일반적으로, 청구범위 및 명세서에 사용된 용어는 당업자에 의해 이해되는 평이한 의미를 갖는 것으로 해석되도록 의도된다. 추가 명확성을 제공하기 위해 특정 용어가 아래에 정의되어 있다. 일반 의미와 제공된 정의가 상충하는 경우 제공된 정의를 사용된다.

본원에서 사용되는 용어 "항원"은 면역 반응을 자극하는 물질이다. 항원은 신생항원일 수 있다. 항원은 특정 집단, 예를 들어 암 환자의 특정 집단에서 발견되는 항원인 "공유 항원"일 수 있다.

본원에 사용된 용어 "신생항원"은, 예를 들어 종양 세포에서의 돌연변이 또는 종양 세포에 특이적인 번역후 변형을 통해 상응하는 야생형 항원과 구별되게 만드는 적어도 하나의 변경을 갖는 항원이다. 신생항원은 폴리펩티드 서열 또는 뉴클레오티드 서열을 포함할 수 있다. 돌연변이는 프레임시프트 또는 비-프레임시프트 인델, 미스센스 또는 넌센스 치환, 스플라이스 부위 변경, 게놈 재배열 또는 유전자 융합, 또는 neoORF를 발생시키는 임의의 게놈 또는 발현 변경을 포함할 수 있다. 돌연변이는 또한 스플라이스 변이체를 포함할 수 있다. 종양 세포에 특이적인 번역 후 변형에는 비정상적인 인산화가 포함될 수 있다. 종양 세포에 특이적인 번역 후 변형에는 프로테아좀-생성 스플라이싱된 항원도 포함될 수 있다(Liepe et al., A large fraction of HLA class I ligands are proteasome-generated spliced peptides; Science. 2016 Oct 21;354(6310):354-358). 대상체는 다양한 진단 방법, 예를 들어 하기에 추가로 기재된 환자 선택 방법의 사용을 통해 투여를 위해 확인될 수 있다.

본원에 사용된 용어 "종양 항원"은 대상체의 종양 세포 또는 조직에 존재하지만 대상체의 상응하는 정상 세포 또는 조직에는 존재하지 않는 항원이거나, 정상 세포 또는 조직과 비교하여 종양세포 또는 암 조직에서 발현이 변경된 것으로 알려졌거나 발견된 폴리펩티드로부터 유래된다.

본원에 사용된 용어 "항원-기반 백신"은 하나 이상의 항원, 예를 들어 다수의 항원을 기반으로 하는 백신 조성물이다. 백신은 뉴클레오티드-기반(예를 들어, 바이러스 기반, RNA 기반 또는 DNA 기반), 단백질-기반(예를 들어, 펩티드 기반) 또는 이들의 조합일 수 있다.

본원에 사용된 용어 "후보 항원"은 항원을 나타낼 수 있는 서열을 발생시키는 돌연변이 또는 기타 이상이다.

본원에서 사용되는 용어 "코딩 영역"은 단백질을 코딩하는 유전자의 일부(들)이다.

본원에서 사용되는 용어 "코딩 돌연변이"는 코딩 영역에서 발생하는 돌연변이이다.

본원에서 사용되는 용어 "ORF"는 열린 해독틀을 의미한다.

본원에서 사용되는 용어 "NEO-ORF"는 돌연변이 또는 스플라이싱과 같은 다른 이상으로부터 발생하는 종양-특이적 ORF이다.

본원에 사용된 용어 "미스센스 돌연변이"는 하나의 아미노산에서 다른 아미노산으로의 치환을 야기하는 돌연변이이다.

본원에 사용된 용어 "넌센스 돌연변이"는 아미노산에서 정지 코돈으로의 치환을 유발하거나 표준 개시 코돈의 제거를 유발하는 돌연변이이다.

본원에서 사용되는 용어 "프레임시프트 돌연변이"는 단백질의 프레임에 변화를 일으키는 돌연변이이다.

본원에서 사용되는 용어 "인델"은 하나 이상의 핵산의 삽입 또는 결실이다.

2개 이상의 핵산 또는 폴리펩티드 서열과 관련하여 본원에 사용된 퍼센트 "동일성"이라는 용어는 하기 기술된 서열 비교 알고리즘(예를 들어, BLASTP 및 BLASTN 또는 당업자에게 이용가능한 다른 알고리즘) 중 하나를 사용하여 또는 육안 검사에 의해 측정된 바와 같이, 최대 일치를 위해 비교 및 정렬될 때 동일한 뉴클레오티드 또는 아미노산 잔기의 특정 퍼센트를 갖는 2개 이상의 서열 또는 하위서열을 의미한다. 적용에 따라, 퍼센트 "동일성"은 비교되는 서열의 영역에 걸쳐, 예를 들어 기능적 도메인에 걸쳐 존재할 수 있거나, 대안적으로 비교될 2개의 서열의 전체 길이에 걸쳐 존재할 수 있다.

서열 비교를 위해, 전형적으로 하나의 서열은 테스트 서열이 비교되는 참조 서열로서 작용한다. 서열 비교 알고리즘을 사용할 때 컴퓨터에 테스트 및 참조 서열을 입력하고 필요에 따라 서열 좌표를 지정하고 서열 알고리즘 프로그램 매개변수를 지정한다. 이어서 서열 비교 알고리즘은 지정된 프로그램 매개변수를 기반으로 참조 서열에 대한 테스트 서열(들)에 대한 서열 동일성 백분율을 계산한다. 대안적으로, 서열 유사성 또는 비유사성은 특정 뉴클레오티드, 또는 번역된 서열의 경우, 선택된 서열 위치(예를 들어, 서열 모티프)의 아미노산의 결합된 존재 또는 부재에 의해 확립될 수 있다.

비교를 위한 서열의 최적 정렬은, 예를 들어 국소 상동성 알고리즘에 의해(Smith & Waterman, Adv. Appl. Math. 2:482 (1981)), 상동성 정렬 알고리즘에 의해(Needleman & Wunsch, J. Mol. Biol. 48:443 (1970), 유사성 탐색 방법으로(Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988), 이러한 알고리즘의 전산화된 구현에 의해(GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, Wis), 또는 육안 검사(Ausubel et al., infra)로 수행될 수 있다.

퍼센트 서열 동일성 및 서열 유사성을 결정하기에 적합한 알고리즘의 한 예는 BLAST 알고리즘이다(Altschul et al., J. Mol. Biol. 215:403-410 (1990)). BLAST 분석을 수행하기 위한 소프트웨어는 국립 생명공학 정보 센터(National Center for Biotechnology Information)를 통해 공개적으로 사용할 수 있다.

본원에서 사용되는 용어 "논스톱 또는 리드-스루(read-through)"는 천연 정지 코돈의 제거를 야기하는 돌연변이이다.

본원에서 사용되는 용어 "에피토프"는 항체 또는 T 세포 수용체에 의해 전형적으로 결합되는 항원의 특정 부분이다.

본원에 사용된 용어 "면역원성"은, 예를 들어 T 세포, B 세포 또는 둘 모두를 통해 면역 반응을 자극하는 능력이다.

본원에서 사용되는 용어 "HLA 결합 친화도" "MHC 결합 친화도"는 특정 항원과 특정 MHC 대립형질 사이의 결합 친화도를 의미한다.

본원에서 사용되는 용어 "베이트(bait)"는 샘플로부터 DNA 또는 RNA의 특정 서열을 강화하는 데 사용되는 핵산 프로브이다.

본원에서 사용되는 용어 "변이체"는 대상체의 핵산과 대조군으로 사용되는 참조 인간 게놈 간의 차이이다.

본원에서 사용되는 용어 "변이체 호출(variant call)"은 일반적으로 시퀀싱으로부터 변이체의 존재를 알고리즘적으로 결정하는 것이다.

본원에서 사용되는 용어 "다형성"은 생식계열 변이체, 즉 개체의 모든 DNA 함유 세포에서 발견되는 변이체이다.

본원에서 사용되는 용어 "체세포 변이체"는 개체의 비-생식계열 세포에서 발생하는 변이체이다.

본원에서 사용되는 용어 "대립유전자"는 유전자의 버전 또는 유전자 서열의 버전 또는 단백질의 버전이다.

본원에서 사용되는 용어 "HLA 유형"은 HLA 유전자 대립유전자의 보체이다.

본원에서 사용되는 용어 "넌센스-매개 붕괴" 또는 "NMD"는 미성숙 정지 코돈으로 인한 세포에 의한 mRNA의 분해이다.

본원에서 사용되는 용어 "줄기 돌연변이(truncal mutation)"는 종양 발생 초기에 발생하고 종양 세포의 상당 부분에 존재하는 돌연변이이다.

본원에 사용된 용어 "서브클로날 돌연변이"는 종양 발달에서 나중에 발생하고 종양 세포의 하위세트에만 존재하는 돌연변이이다.

본원에서 사용되는 용어 "엑솜"은 단백질을 코딩하는 게놈의 하위세트이다. 엑솜은 게놈의 집합적 엑손일 수 있다.

본원에서 사용되는 용어 "로지스틱 회귀"는 종속 변수가 1과 동일한 확률의 로짓이 종속 변수의 선형 함수로 모델링되는 통계로부터의 이진 데이터에 대한 회귀 모델이다.

본원에서 사용되는 용어 "신경망"은 일반적으로 확률적 경사 하강법 및 역전파를 통해 트레이닝되는 요소별 비선형성이 뒤따르는 다중 계층의 선형 변환으로 이루어진 분류 또는 회귀를 위한 기계 학습 모델이다.

본원에서 사용되는 용어 "프로테옴"은 세포, 세포 군 또는 개체에 의해 발현 및/또는 번역되는 모든 단백질 세트이다.

본원에서 사용되는 용어 "펩티돔"은 세포 표면 상에서 MHC-I 또는 MHC-II에 의해 제시되는 모든 펩티드 세트이다. 펩티돔은 세포의 특성 또는 세포 집합체를 의미할 수 있다(예를 들어, 종양을 구성하는 모든 세포의 펩티돔의 결합을 의미하는 종양 펩티돔, 또는 감염성 질병에 의해 감염된 모든 세포의 펩티돔의 결합을 의미하는 감염성 질병 펩티돔).

본원에서 사용되는 "ELISPOT"이라는 용어는 효소-결합 면역흡착 스팟 검정법을 의미하며, 이는 인간 및 동물에서 면역 반응을 모니터링하기 위한 일반적인 방법이다.

본원에서 사용되는 용어 "덱스트라머"는 유동 세포측정법에서 항원-특이적 T-세포 염색에 사용되는 덱스트란-기반 펩티드-MHC 멀티머이다.

본원에서 사용되는 용어 "관용 또는 면역 관용"은 하나 이상의 항원, 예를 들어 자기-항원에 대한 면역 무반응 상태이다.

본원에 사용된 용어 "중추 관용"은 자가-반응성 T 세포 클론을 결실시키거나 자가-반응성 T 세포 클론을 촉진하여 면역억제 조절 T 세포(Tregs)로 분화시킴으로써 흉선에서 영향을 받는 관용성이다.

본원에서 사용되는 용어 "말초 관용"은 중추 관용에서 살아남는 자가-반응성 T 세포를 하향조절하거나 애너자이징(anergizing)함으로써 이들 T 세포를 Treg로 분화하도록 촉진함으로써 말초에서 영향을 받는 관용이다.

용어 "샘플"은 정맥 천자, 배설, 사정, 마사지, 생검, 바늘 흡인, 세척 샘플, 스크래핑, 외과적 절개, 또는 개입 또는 당업계에 공지된 다른 수단을 포함하는 수단에 의해 대상체로부터 채취한 단일 세포 또는 다중 세포 또는 세포 단편 또는 체액 분취액을 포함할 수 있다.

용어 "대상체"는 세포, 조직 또는 유기체, 인간 또는 비인간, 생체내, 생체외 또는 시험관내, 남성 또는 여성을 포함한다. 대상체라는 용어는 인간을 포함한 포유동물을 포함한다.

용어 "포유류"는 인간 및 인간이 아닌 것 모두를 포괄하고 인간, 인간이 아닌 영장류, 개, 고양이, 쥐, 소, 말 및 돼지를 포함하지만 이에 제한되지 않는다.

"임상 인자"라는 용어는 대상체의 상태, 예를 들어 질병 활성도 또는 중증도의 척도를 의미한다. "임상적 인자"는 비-샘플 마커 및/또는 이에 제한되지 않는 연령 및 성별과 같은 대상체의 기타 특성을 포함하여 대상체의 건강 상태에 대한 모든 마커를 포함한다. 임상적 인자는 점수, 값 또는 결정된 조건 하에서 대상체 또는 대상체로부터의 샘플(또는 샘플 집단)의 평가에서 얻을 수 있는 일련의 값일 수 있다. 임상적 인자는 또한 마커 및/또는 유전자 발현 대리물과 같은 다른 매개변수에 의해 예측될 수 있다. 임상적 인자에는 종양 유형, 종양 하위 유형, 감염 유형, 감염 하위 유형 및 흡연 이력이 포함될 수 있다.

"종양으로부터 유래된 항원-코딩 핵산 서열"이라는 용어는 종양으로부터, 예를 들어 RT-PCR을 통해 수득된 핵산 서열; 또는 종양을 시퀀싱한 다음 시퀀싱 데이터를 사용하여, 예를 들어 당업계에 공지된 다양한 합성 또는 PCR-기반 방법을 통해 핵산 서열을 합성함으로써 얻은 서열 데이터을 지칭한다. 유래된 서열은 종양으로부터 수득한 상응하는 천연 핵산 서열과 동일한 폴리펩티드 서열을 코딩하는 서열-최적화된 핵산 서열 변이체(예를 들어, 코돈-최적화된 및/또는 발현을 위해 최적화된 것)와 같은 핵산 서열 변이체를 포함할 수 있다.

"감염으로부터 유래된 항원-코딩 핵산 서열"이라는 용어는 감염된 세포 또는 감염성 질병 유기체로부터, 예를 들어 RT-PCR을 통해 수득된 핵산 서열; 또는 감염된 세포 또는 감염성 질병 유기체을 시퀀싱한 다음 시퀀싱 데이터를 사용하여, 예를 들어 당업계에 공지된 다양한 합성 또는 PCR-기반 방법을 통해 핵산 서열을 합성함으로써 얻은 서열 데이터을 지칭한다. 유래된 서열은 상응하는 천연 감염성 질병 유기체 핵산 서열과 동일한 폴리펩티드 서열을 코딩하는 서열-최적화된 핵산 서열 변이체(예를 들어, 코돈-최적화된 및/또는 발현을 위해 최적화된 것)와 같은 핵산 서열 변이체를 포함할 수 있다. 유래된 서열은 천연 감염성 질병 유기체 폴리펩티드 서열에 비해 하나 이상(예를 들어, 1, 2, 3, 4 또는 5개)의 돌연변이를 갖는 변형된 감염성 질병 유기체 폴리펩티드 서열을 코딩하는 핵산 서열 변이체를 포함할 수 있다. 예를 들어, 변형된 폴리펩티드 서열은 감염성 질병 유기체 단백질의 천연 폴리펩티드 서열에 비해 하나 이상의 미스센스 돌연변이를 가질 수 있다.

용어 "알파바이러스"는 토가바이러스과(Togaviridae) 과의 구성원을 말하며 포지티브-센스 단일 가닥 RNA 바이러스이다. 알파바이러스는 일반적으로 신드비스, 로스 리버, 마야로, 치쿤구니야 및 셈리키 포레스트 바이러스와 같은 구세계 또는 동부 말 뇌염, 아우라, 포트 모건 또는 베네수엘라 말 뇌염 및 그 유래 변종 TC-83과 같은 신세계로 분류된다. 알파바이러스는 일반적으로 자가-복제 RNA 바이러스이다.

용어 "알파바이러스 백본"은 바이러스 게놈의 자가-복제를 가능하게 하는 알파바이러스의 최소 서열(들)을 지칭한다. 최소 서열은 비구조 단백질-매개 증폭을 위한 보존된 서열, 비구조 단백질 1(nsP1) 유전자, nsP2 유전자, nsP3 유전자, nsP4 유전자 및 폴리A 서열 뿐만 아니라 서브게놈(예를 들어, 26S) 프로모터 요소를 포함하는 서브게놈 바이러스 RNA의 발현을 위한 서열을 포함할 수 있다.

용어 "비구조 단백질-매개 증폭을 위한 서열"은 당업자에게 잘 알려진 알파바이러스 보존 서열 요소(CSE)를 포함한다. CSE에는 알파바이러스 5' UTR, 51-nt CSE, 24-nt CSE, 서브게놈 프로모터 서열(예를 들어, 26S 서브게놈 프로모터 서열), 19-nt CSE 및 알파바이러스 3' UTR이 포함되나 이에 제한되지 않는다.

용어 "RNA 중합효소"는 DNA 주형으로부터 RNA 폴리뉴클레오티드의 생산을 촉매하는 중합효소를 포함한다. RNA 중합효소는 T3, T7 및 SP6을 포함하는 박테리오파지 유래 중합효소를 포함하지만 이에 제한되지 않는다.

용어 "지질"은 소수성 및/또는 양친매성 분자를 포함한다. 지질은 양이온, 음이온 또는 중성일 수 있다. 지질은 합성 또는 천연 유래일 수 있으며 경우에 따라 생분해성이다. 지질은 콜레스테롤, 인지질, 폴리에틸렌글리콜(PEG) 접합체(PEG화된 지질)를 포함하지만 이에 제한되지 않는 지질 접합체, 왁스, 오일, 글리세리드, 지방 및 지용성 비타민을 포함할 수 있다. 지질은 또한 디리놀레일메틸-4-디메틸아미노부티레이트(MC3) 및 MC3-유사 분자를 포함할 수 있다.

용어 "지질 나노입자" 또는 "LNP"는 리포솜이라고도 하는 수성 내부를 둘러싸는 지질 함유 막을 사용하여 형성된 소포형 구조를 포함한다. 지질 나노입자는 계면활성제에 의해 안정화된 고체 지질 코어를 갖는 지질-기반 조성물을 포함한다. 코어 지질은 지방산, 아실글리세롤, 왁스 및 이들 계면활성제의 혼합물일 수 있다. 인지질, 스핑고미엘린, 담즙염(나트륨 타우로콜레이트) 및 스테롤(콜레스테롤)과 같은 생물학적 막 지질이 안정제로 사용될 수 있다. 지질 나노입자는 하나 이상의 양이온성, 음이온성 또는 중성 지질의 정의된 비율을 포함하지만 이에 제한되지 않는 상이한 지질 분자의 정의된 비율을 사용하여 형성될 수 있다. 지질 나노입자는 외부 막 껍질 내에서 분자를 캡슐화할 수 있고 이어서 표적 세포와 접촉하여 캡슐화된 분자를 숙주 세포 세포질로 전달할 수 있다. 지질 나노입자는 표면을 포함하여 비-지질 분자로 변형되거나 기능화될 수 있다. 지질 나노입자는 단일-층(unilamellar) 또는 다중-층(multilamellar)일 수 있다. 지질 나노입자는 핵산과 복합체화될 수 있다. 단층 지질 나노입자는 핵산과 복합체를 형성할 수 있으며, 여기서 핵산은 수성 내부에 있다. 다층 지질 나노입자는 핵산과 복합체를 형성할 수 있으며, 여기서 핵산은 수성 내부에 있거나 사이에 끼어 있다.

약어: MHC: 주요 조직 적합성 복합체; HLA: 인간 백혈구 항원 또는 인간 MHC 유전자좌; NGS: 차세대 시퀀싱; PPV: 양성 예측값; TSNA: 종양-특이적 신생항원; FFPE: 포르말린-고정, 파라핀-임베디드; NMD: 넌센스-매개 붕괴; NSCLC: 비소세포 폐암; DC: 수지상 세포.

명세서 및 첨부된 청구범위에 사용된 바와 같이, 단수 형태 "하나", 및 "그"는 문맥이 달리 명시하지 않는 한 복수 지시 대상을 포함한다는 점에 유의해야 한다.

구체적으로 언급되지 않거나 달리 문맥상 명백하지 않은 한, 본원에 사용된 용어 "약"은 당업계의 정상적인 허용 범위 내, 예를 들어 평균의 2 표준 편차 내로 이해된다. 약은 명시된 값의 10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%, 0.5%, 0.1%, 0.05% 또는 0.01% 이내로 이해될 수 있다. 문맥상 달리 명확하지 않은 한, 여기에 제공된 모든 수치는 약이라는 용어로 수정된다.

본원에서 직접 정의되지 않은 임의의 용어는 본 발명의 기술 내에서 이해되는 바와 같이 이들과 일반적으로 관련된 의미를 갖는 것으로 이해되어야 한다. 특정 용어는 본 발명의 측면의 조성물, 장치, 방법 등 및 이들을 제조하거나 사용하는 방법을 설명함에 있어서 실무자에게 추가 지침을 제공하기 위해 본원에서 논의된다. 동일한 내용이 여러 가지 방식으로 언급될 수 있음을 인식할 것이다. 결과적으로 여기에서 논의된 용어 중 하나 이상에 대체 언어 및 동의어가 사용될 수 있다. 용어가 여기에서 설명되거나 논의되는지 여부는 중요하지 않다. 일부 동의어 또는 대체 가능한 방법, 자료 등이 제공된다. 명시적으로 언급되지 않는 한, 하나 또는 몇 개의 동의어 또는 등가물에 대한 설명은 다른 동의어 또는 등가물의 사용을 배제하지 않는다. 용어의 예를 포함하는 예의 사용은 단지 설명을 위한 것이며 본 발명의 측면의 범위 및 의미를 제한하지 않는다.

명세서 본문 내에서 인용된 모든 참고문헌, 발행된 특허 및 특허 출원은 모든 목적을 위해 그 전체가 참조로 포함된다.

II. 항원 확인

종양 및 정상 엑솜 및 전사체의 NGS 분석을 위한 연구 방법이 설명되었고 항원 확인 공간에 적용되었다.^6,14,15 임상 환경에서 항원 확인을 위한 더 큰 민감도 및 특이성을 위한 특정 최적화를 고려할 수 있다. 이러한 최적화는 실험실 과정과 관련된 영역과 NGS 데이터 분석과 관련된 영역의 두 영역으로 그룹화할 수 있다. 설명된 연구 방법은 감염성 질병 유기체, 대상체의 감염 또는 대상체의 감염된 세포에서 항원을 확인하는 것과 같은 다른 환경에서 항원을 확인하는 데에도 적용될 수 있다. 최적화의 예는 당업자에게 공지되어 있으며, 예를 들어 각각 본원에 모든 목적을 위해 그 전체 내용이 참조로 포함되는 미국 특허 10,055,540, US 출원공개 US20200010849A1, US 출원번호 16/606,577, 국제 특허 출원 공개 WO2020181240A1, WO/2018/195357 및 WO/2018/208856에 상세히 기술되어 있다.

항원(예를 들어, 종양 또는 감염성 질병 유기체로부터 유래된 항원)을 확인하는 방법은 세포 표면에 제시될 가능성(예를 들어, 수지상 세포와 같은 전문 항원 제시 세포를 포함하여 종양 세포, 감염된 세포 또는 면역 세포 상의 MHC에 의해 제시)이 있고/있거나 면역원성일 가능성이 있는 항원을 확인하는 것을 포함한다. 예를 들어, 이러한 방법 중 하나는 종양, 감염된 세포 또는 감염성 질병 유기체로부터 엑솜, 전사체 또는 전체 게놈 뉴클레오티드 시퀀싱 및/또는 발현 데이터 중 적어도 하나를 수득하는 단계, 여기서 뉴클레오티드 시퀀싱 데이터 및/또는 발현 데이터는 각각의 항원 세트(예를 들어, 종양 또는 감염성 질병 유기체로부터 유래된 항원)의 펩티드 서열을 나타내는 데이터를 수득하기 위해 사용되며; 각 항원의 펩티드 서열을 하나 이상의 제시 모델에 입력하여 각각의 항원이 대상체의 종양 세포 또는 감염된 세포와 같은 세포 표면 상의 하나 이상의 MHC 대립유전자에 의해 제시되는 일련의 수치적 가능성을 생성하는 단계, 수치적 가능성 세트는 적어도 수신된 질량 분석 데이터에 기초하여 확인되고; 및 선택된 항원 세트를 생성하기 위해 수치적 가능성 세트에 기초하여 항원 세트의 하위세트를 선택하는 단계를 포함한다.

III. 신생항원에서 종양 특이적 돌연변이의 확인

또한 특정 돌연변이(예를 들어, 암 세포에 존재하는 변이체 또는 대립유전자)를 확인하기 위한 방법이 본원에 개시되어 있다. 특히, 이들 돌연변이는 암을 앓는 대상체의 암세포의 게놈, 전사체, 프로테옴 또는 엑솜에 존재할 수 있지만 대상체의 정상 조직에는 존재할 수 없다. 공유된 신생항원을 포함하여 종양에 특이적인 신생항원을 확인하기 위한 특정 방법은 당업자에게 공지되어 있으며, 예를 들어 각각 본원에 모든 목적을 위해 그 전문이 참조로 포함되는 미국 특허 10,055,540, US 출원공개 US20200010849A1, 및 국제 특허 출원 공개 WO/2018/195357 및 WO/2018/208856에 상세히 기재되어 있다. 종양에 특이적인 공유 신생항원의 예는 모든 목적을 위해 전문이 참조로 본원에 포함되는 국제 특허 출원 공보 WO2019226941A1에 더 자세히 설명되어 있다. 공유 신생항원에는 KRAS-연관 돌연변이(예를 들어, KRAS G12C, KRAS G12V, KRAS G12D 및/또는 KRAS Q61H 돌연변이)가 포함되지만 이에 제한되지 않는다. 예를 들어, KRAS-연관 MHC 클래스 I 네오에피토프는 야생형(WT) 인간 KRAS, 예를 들어 하기 예시적인 아미노산 서열과 관련하여 그러한 돌연변이를 포함할 수 있다:

MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQVVIDGETCLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHHYREQIKRVKDSEDVPMVLVGNKCDLPSRTVDTKQAQDLARSYGIPFIETSAKTRQRVEDAFYTLVREIRQYRLKKISKEEKTPGCVKIKKCIIM (서열번호: 84).

종양에서의 유전적 돌연변이는 종양에서 독점적으로 단백질의 아미노산 서열의 변화를 야기한다면 종양의 면역학적 표적화에 유용한 것으로 간주될 수 있다. 유용한 돌연변이는 다음을 포함한다: (1) 단백질에서 상이한 아미노산으로 이어지는 비-동의(non-synonymous) 돌연변이; (2) 종결 코돈이 변형되거나 결실되어 C-말단에서 새로운 종양-특이적 서열을 갖는 더 긴 단백질의 번역을 유도하는 리드-스루 돌연변이(read-through mutations); (3) 성숙한 mRNA에 인트론을 포함을 야기하여 독특한 종양-특이적 단백질 서열을 만드는 스플라이스 부위 돌연변이; (4) 2개의 단백질의 접합부에서 종양-특이적 서열을 갖는 키메라 단백질을 발생시키는 염색체 재배열(즉, 유전자 융합); (5) 새로운 종양-특이적 단백질 서열을 가진 새로운 열린 해독틀을 야기하는 프레임시프트 돌연변이 또는 결실. 돌연변이는 또한 하나 이상의 비-프레임시프트 인델, 미스센스 또는 넌센스 치환, 스플라이스 부위 변경, 게놈 재배열 또는 유전자 융합, 또는 neoORF를 발생시키는 임의의 게놈 또는 발현 변경을 포함할 수 있다.

예를 들어, 종양 세포에서 스플라이스-부위, 프레임시프트, 리드스루 또는 유전자 융합 돌연변이로부터 발생하는 돌연변이를 갖는 펩티드 또는 돌연변이된 폴리펩티드는 종양 대 정상 세포에서 DNA, RNA 또는 단백질을 시퀀싱함으로써 확인할 수 있다.

또한 돌연변이는 이전에 확인된 종양 특이적 돌연변이를 포함할 수 있다. 알려진 종양 돌연변이는 암의 체세포 돌연변이 카탈로그(COSMIC) 데이터베이스에서 찾을 수 있다.

개체의 DNA 또는 RNA에서 특정 돌연변이 또는 대립유전자의 존재를 검출하기 위해 다양한 방법이 이용가능하다. 이 분야의 발전으로 정확하고 쉬우며 저렴한 대규모 SNP 유전형분석이 가능해졌다. 예를 들어, 동적 대립유전자-특이적 혼성화(DASH), 마이크로플레이트 어레이 대각선 겔 전기영동(MADGE), 파이로시퀀싱, 올리고뉴클레오티드-특이적 결찰, 탁만(TaqMan) 시스템 및 아피메트릭스(Affymetrix) SNP 칩과 같은 다양한 DNA "칩" 기술을 포함한 여러 기술이 설명되었다. 이들 방법은 전형적으로 PCR에 의한 표적 유전자 영역의 증폭을 이용한다. 또 다른 방법은 침습적 절단에 이어 질량 분석 또는 고정된 패드락 프로브(immobilized padlock probe) 및 롤링-서클 증폭에 의한 작은 신호 분자의 생성을 기반으로 한다. 특정 돌연변이를 검출하기 위한 당업계에 알려진 여러 방법이 아래에 요약되어 있다.

PCR 기반 검출 수단은 다수의 마커를 동시에 다중 증폭하는 것을 포함할 수 있다. 예를 들어, 크기가 겹치지 않고 동시에 분석될 수 있는 PCR 산물을 생성하기 위해 PCR 프라이머를 선택하는 것은 당업계에 잘 알려져 있다. 대안적으로, 차별적으로 표지되어 각각 차별적으로 검출될 수 있는 프라이머로 상이한 마커를 증폭하는 것이 가능하다. 물론 혼성화 기반 검출 수단은 샘플에서 여러 PCR 산물의 차등 검출을 허용한다. 다수의 마커의 다중 분석을 가능하게 하는 다른 기술이 당업계에 공지되어 있다.

게놈 DNA 또는 세포 RNA에서 단일 뉴클레오티드 다형성의 분석을 용이하게 하기 위해 여러 방법이 개발되었다. 예를 들어, 문헌(Mundy, C. R., U.S. Pat. No. 4,656,127)에 개시된 바와 같이 특수화된 엑소뉴클레아제-저항성 뉴클레오티드를 사용하여 단일 염기 다형성을 검출할 수 있다. 이 방법에 따르면, 다형성 부위의 바로 3'에 있는 대립형질 서열에 상보적인 프라이머가 특정 동물 또는 인간으로부터 수득한 표적 분자에 혼성화하는 것이 허용된다. 표적 분자의 다형성 부위가 존재하는 특정 엑소뉴클레아제-저항성 뉴클레오티드 유도체에 상보적인 뉴클레오티드를 포함하는 경우, 그 유도체는 혼성화된 프라이머의 끝에 혼입될 것이다. 이러한 혼입은 프라이머가 엑소뉴클레아제에 저항성이 있게 하여 검출을 허용한다. 샘플의 엑소뉴클레아제-저항성 유도체의 정체가 알려져 있기 때문에, 프라이머가 엑소뉴클레아제에 저항성이 있다는 발견은 표적 분자의 다형성 부위에 존재하는 뉴클레오티드(들)가 반응에서 사용된 뉴클레오티드 유도체의 다형성 부위에 상보적임을 나타낸다. 이 방법은 많은 양의 외부 서열 데이터를 결정할 필요가 없다는 장점이 있다.

용액-기반 방법은 다형성 부위의 뉴클레오티드 정체를 결정하는 데 사용될 수 있다(Cohen, D. et al., French Patent 2,650,840; PCT Appln. No. WO91/02087). 먼디(Mundy)의 미국 특허 4,656,127의 방법에서는 다형성 부위의 바로 3'에 있는 대립유전자 서열에 상보적인 프라이머를 사용한다. 이 방법은 다형성 부위의 뉴클레오티드에 상보적인 경우 프라이머의 말단에 혼입될 표지된 디데옥시뉴클레오티드 유도체를 사용하여 해당 부위의 뉴클레오티드의 정체를 결정한다.

유전자 비트 분석(Genetic Bit Analysis) 또는 GBA로 알려진 다른 방법은 문헌에 기재되어 있다(Goelet, P. et al., PCT Appln. No. 92/15712). 고렛 등의 방법은 표지된 종결자 및 다형성 부위의 3' 서열에 상보적인 프라이머의 혼합물을 사용한다. 따라서 혼입되는 표지된 종결자는 평가되는 표적 분자의 다형성 부위에 존재하는 뉴클레오티드에 의해 결정되고 상보적이다. 코헨 등(Cohen et al., French Patent 2,650,840; PCT Appln. No. WO91/02087))의 방법과는 대조적으로, 고렛 등의 방법은 프라이머 또는 표적 분자가 고체 상에 고정되는 이종 상 검정일 수 있다.

DNA의 다형성 부위를 검정하기 위한 몇 가지 프라이머-안내 뉴클레오티드 혼입 절차가 문헌에 기술되었다(Komher, J. S. et al., Nucl. Acids. Res. 17:7779-7784 (1989); Sokolov, B. P., Nucl. Acids Res. 18:3671 (1990); Syvanen, A.-C., et al., Genomics 8:684-692 (1990); Kuppuswamy, M. N. et al., Proc. Natl. Acad. Sci. (U.S.A.) 88:1143-1147 (1991); Prezant, T. R. et al., Hum. Mutat. 1:159-164 (1992); Ugozzoli, L. et al., GATA 9:107-112 (1992); Nyren, P. et al., Anal. Biochem. 208:171-175 (1993)). 이러한 방법은 다형성 부위에서 염기를 구별하기 위해 표지된 데옥시뉴클레오티드의 혼입을 활용한다는 점에서 GBA와 다르다. 이러한 형식에서, 신호는 혼입된 데옥시뉴클레오티드의 수에 비례하기 때문에, 동일한 뉴클레오티드의 런에서 발생하는 다형성은 런의 길이에 비례하는 신호를 초래할 수 있다(Syvanen, A.-C., et al., Amer. J. Hum. Genet. 52:46-59 (1993)).

많은 구상이 병렬로 수백만 개의 개별 DNA 또는 RNA 분자로부터 직접 서열 정보를 수득한다. 합성에 의한 실시간 단일 분자 시퀀싱 기술은 시퀀싱되는 주형에 상보적인 초기 DNA 가닥에 혼입되는 형광 뉴클레오티드의 검출에 의존한다. 한 방법에서, 길이가 30-50 염기인 올리고뉴클레오티드는 유리 커버 슬립에 대한 5'단부에 공유결합으로 고정된다. 이 고정된 가닥은 두 가지 기능을 수행한다. 첫째, 주형이 표면-결합 올리고뉴클레오티드에 상보적인 포획 테일로 이루어진 경우 표적 주형 가닥에 대한 포획 부위 역할을 한다. 이들은 또한 서열 판독의 기초를 형성하는 주형 지정 프라이머 확장을 위한 프라이머 역할을 한다. 포획 프라이머는 염료를 제거하기 위한 염료-링커의 합성, 검출 및 화학적 절단의 여러 주기를 사용하여 서열 결정을 위한 고정 위치 부위로 기능한다. 각 주기에는 중합효소/표지된 뉴클레오티드 혼합물 첨가, 헹굼, 이미징 및 염료 절단이 포함된다. 대안적인 방법에서, 중합효소는 형광 공여체 분자로 변형되고 유리 슬라이드에 고정되며, 각 뉴클레오티드는 감마-포스페이트에 부착된 수용체 형광 모이어티로 색상-코딩된다. 이 시스템은 뉴클레오티드가 새로운 사슬에 혼입될 때 형광-태그된 중합효소 및 형광으로 변형된 뉴클레오티드 사이의 상호 작용을 검출한다. 다른 합성에 의한 시퀀싱 기술도 존재한다.

임의의 적합한 합성에 의한 시퀀싱 플랫폼을 사용하여 돌연변이를 확인할 수 있다. 위에서 설명한 대로, 합성에 의한 시퀀싱 플랫폼은 현재 4가지 주요 시퀀싱 플랫폼을 현재 사용할 수 있다: 게놈 시퀀서(the Genome Sequencers from Roche/454 Life Sciences), 1G 분석기(the 1G Analyzer from Illumina/Solexa, the SOLiD system from Applied BioSystems), 및 헬리스코프 시스템(the Heliscope system from Helicos Biosciences). 합성에 의한 시퀀싱 플랫폼은 또한 퍼시픽 바이오사이언스(Pacific BioSciences) 및 비지겜 바이오테크놀로지스(VisiGen Biotechnologies)에 의해 기술되었다. 일부 구현양태에서, 시퀀싱되는 다수의 핵산 분자는 지지체(예를 들어, 고체 지지체)에 결합된다. 지지체에 핵산을 고정하기 위해 포획 서열/보편적인 프라이밍 부위를 주형의 3' 및/또는 5' 단부에 추가할 수 있다. 핵산은 포획 서열을 지지체에 공유 부착된 상보적 서열에 혼성화함으로써 지지체에 결합될 수 있다. 포획 서열(보편적인 포획 서열이라고도 지칭)은 이중으로 보편적인 프라이머 역할을 할 수 있는 지지체에 부착된 서열에 상보적인 핵산 서열이다.

포획 서열에 대한 대안으로서, 커플링 쌍의 구성원(예를 들어, 항체/항원, 수용체/리간드, 또는 예를 들어 미국 특허 출원 번호 2006/0252077에 기재된 바와 같은 아비딘-비오틴 쌍)은 커플링 쌍의 각각의 제 2 구성원으로 코팅된 표면 상에 포획될 각각의 단편에 연결될 수 있다.

포획 후, 서열은 합성에 의한 주형-의존성 시퀀싱을 포함하는, 예를 들어 실시예 및 미국 특허 번호 7,283,337에 기재된 단일 분자 검출/시퀀싱에 의해 분석될 수 있다. 합성에 의한 시퀀싱에서, 표면-결합 분자는 중합효소의 존재 하에 다수의 표지된 뉴클레오티드 트리포스페이트에 노출된다. 주형의 서열은 성장 사슬의 3' 단부에 혼입된 표지된 뉴클레오티드의 순서에 의해 결정된다. 이는 실시간으로 수행하거나 단계별 반복 모드로 수행할 수 있다. 실시간 분석을 위해, 각 뉴클레오티드에 대한 서로 다른 광학 표지를 혼입할 수 있으며 혼입된 뉴클레오티드의 자극을 위해 다중 레이저를 활용할 수 있다.

시퀀싱은 또한 다른 대규모 병렬 시퀀싱 또는 차세대 시퀀싱(NGS) 기술 및 플랫폼을 포함할 수 있다. 대규모 병렬 시퀀싱 기술 및 플랫폼의 추가 예로는 Illumina HiSeq 또는 MiSeq, Thermo PGM 또는 Proton, Pac Bio RS II 또는 Sequel, Qiagen의 Gene Reader 및 Oxford Nanopore MinION이 있다. 추가적인 유사한 현재 대규모 병렬 시퀀싱 기술은 물론 이러한 기술의 미래 세대를 사용할 수 있다.

임의의 세포 유형 또는 조직을 이용하여 본원에 기술된 방법에 사용하기 위한 핵산 샘플을 얻을 수 있다. 예를 들어, DNA 또는 RNA 샘플은 종양 또는 체액, 예를 들어 알려진 기술(예를 들어, 정맥 천자)로 얻은 혈액 또는 타액에서 얻을 수 있다. 대안적으로, 핵산 테스트는 건조한 샘플(예를 들어, 모발 또는 피부)에서 수행될 수 있다. 또한, 시퀀싱을 위해 종양으로부터 샘플을 얻을 수 있고 정상 조직이 종양과 동일한 조직 유형인 시퀀싱을 위해 정상 조직으로부터 또 다른 샘플을 얻을 수 있다. 시퀀싱을 위해 종양으로부터 샘플을 얻을 수 있고 정상 조직이 종양에 비해 별개의 조직 유형인 시퀀싱을 위해 정상 조직으로부터 또 다른 샘플을 얻을 수 있다.

종양은 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 뇌암, B-세포 림프종, 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병 및 T 세포 림프구성 백혈병, 비소 세포 폐암 및 소세포 폐암 중 하나 이상을 포함할 수 있다.

대안적으로, 종양 세포 상의 MHC 단백질에 결합된 돌연변이 펩티드의 존재를 확인하거나 검증하기 위해 단백질 질량분석법을 사용할 수 있다. 펩티드는 종양 세포 또는 종양에서 면역침전된 HLA 분자에서 산으로 용출된 다음 질량분석법을 사용하여 식별될 수 있다.

IV. 항원

항원은 뉴클레오티드 또는 폴리펩티드를 포함할 수 있다. 예를 들어, 항원은 폴리펩티드 서열을 코딩하는 RNA 서열일 수 있다. 따라서 백신에 유용한 항원은 뉴클레오티드 서열 또는 폴리펩티드 서열을 포함할 수 있다.

본원에 개시된 방법에 의해 확인된 종양 특이적 돌연변이를 포함하는 분리된 펩티드, 공지된 종양 특이적 돌연변이를 포함하는 펩티드, 및 본원에 개시된 방법에 의해 확인된 돌연변이 폴리펩티드 또는 이의 단편이 개시된다. 신생항원 펩티드는 신생항원이 관련 폴리펩티드 서열을 코딩하는 뉴클레오티드 서열(예를 들어, DNA 또는 RNA)을 포함하는 코딩 서열의 맥락에서 기술될 수 있다.

구체적으로, 본원에서는 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함하는 카세트를 개시한다. KRAS-연관 MHC 클래스 I 네오에피토프는 KRAS G12 돌연변이 및/또는 KRAS Q61 돌연변이를 갖는 네오에피토프를 포함하나 이에 제한되지 않는다. 카세트는 KRAS G12 돌연변이를 갖는 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 KRAS Q61 돌연변이를 갖는 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 KRAS G12C, KRAS G12V, KRAS G12D 및/또는 KRAS Q61H 돌연변이를 갖는 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 KRAS G12C 돌연변이를 갖는 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 KRAS G12V 돌연변이를 갖는 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 KRAS G12D 돌연변이를 갖는 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 KRAS Q61H 돌연변이를 갖는 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 KRAS G12C, KRAS G12V, KRAS G12D 및 KRAS Q61H 돌연변이를 갖는 각각의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 KRAS G12C, KRAS G12V, KRAS G12D, 및 KRAS Q61H 돌연변이로 이루어진 군으로부터 선택된 적어도 2개의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 KRAS G12C, KRAS G12V, KRAS G12D, 및 KRAS Q61H 돌연변이로 이루어진 군으로부터 선택된 적어도 3개의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 단일의 별개의 KRAS 관련 MHC 클래스 I 네오에피토프의 반복만을 포함할 수 있다. 카세트는 KRAS G12C 돌연변이를 갖는 단일의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복만을 포함할 수 있다. 카세트는 KRAS G12D 돌연변이를 갖는 단일의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복만을 포함할 수 있다. 카세트는 KRAS G12V 돌연변이를 갖는 단일의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복만을 포함할 수 있다. 카세트는 KRAS Q61H 돌연변이를 갖는 단일의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복만을 포함할 수 있다.

KRAS G12C 돌연변이를 갖는 KRAS-연관 MHC 클래스 I 네오에피토프는 VVVGACGVGK(서열번호: 75) 또는 KLVVVGACGV(서열번호: 76)를 포함한다. KRAS G12D 돌연변이를 갖는 KRAS-연관 MHC 클래스 I 네오에피토프는 VVGADGVGK(서열번호: 77) 또는 VVVGADGVGK(서열번호: 78)를 포함하고, KRAS G12V 돌연변이를 갖는 KRAS-연관 MHC 클래스 I 네오에피토프는 VVGAVGVGK(서열번호: 79), VVVGAVGVGK(서열번호 81), 또는 AVGVGKSAL(서열번호: 80)를 포함한다.

카세트는 아미노산 서열 VVVGACGVGK(서열번호: 75), VVVGADGVGK(서열번호: 78), VVGAVGVGK(서열번호: 79), 및 ILDTAGHEEY(서열번호: 82)을 갖는 각각의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함한다. 카세트는 VVVGACGVGK (서열번호: 75), VVVGADGVGK (서열번호: 78), VVGAVGVGK (서열번호: 79), 및 ILDTAGHEEY (서열번호O: 82)로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 적어도 2개의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 VVVGACGVGK (서열번호: 75), VVVGADGVGK (서열번호: 78), VVGAVGVGK (서열번호: 79), 및 ILDTAGHEEY (서열번호: 82)로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 적어도 3개의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다. 카세트는 VVVGACGVGK (서열번호: 75), VVVGADGVGK (서열번호: 78), VVGAVGVGK (서열번호: 79), 및 ILDTAGHEEY (서열번호: 82)로 이루어진 군으로부터 선택된 아미노산 서열을 갖는 적어도 하나의 KRAS-연관 MHC 클래스 I 네오에피토프의 반복을 포함할 수 있다.

KRAS-연관 MHC 클래스 I 네오에피토프는 천연 KRAS 단백질과 관련하여 치료 백신 에피토프의 천연 N- 및/또는 C-말단 플랭킹 서열을 포함할 수 있다. KRAS-연관 MHC 클래스 I 네오에피토프의 예시적인 비-제한적 예는 25량체

KRAS G12C에 대한 MTEYKLVVVGACGVGKSALTIQLIQ (서열번호: 57),

KRAS G12D에 대한 MTEYKLVVVGADGVGKSALTIQLIQ (서열번호: 58),

KRAS G12V에 대한 MTEYKLVVVGAVGVGKSALTIQLIQ (서열번호: 59), 및

KRAS Q61H에 대한 ETCLLDILDTAGHEEYSAMRDQYMR (서열번호: 60)이다. 천연 플랭킹 서열을 포함하는 KRAS-연관 MHC 클래스 I 네오에피토프는 각각의 천연 플랭킹 서열을 포함하는 다른 네오에피토프(예를 들어, 다른 KRAS-연관 MHC 클래스 I 네오에피토프)를 포함하여 카세트에 코딩된 다른 네오에피토프에 연결(연접)될 수 있다. 돌연변이 KRAS G12C, KRAS G12D, KRAS G12V 및 KRAS Q61H를 갖는 각각의 KRAS 네오에피토프에 대해 4회 반복을 포함하고 천연 플랭킹 서열을 통해 연결되는 연접된 KRAS-연관 MHC 클래스 I 네오에피토프의 예시적인 비-제한적 카세트는 서열번호: 65에 나타낸 아미노산 서열로 표시된다.

천연 N- 및/또는 C-말단 플랭킹 서열을 포함하는 것과 같은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열은 다수의 알려진 및/또는 예측된 KRAS-연관 MHC 클래스 I 네오에피토프을 코딩할 수 있다. 예시적인 예로서, KRAS G12V 25량체 MTEYKLVVVGAVGVGKSALTIQLIQ (서열번호: 59)는 알려진 및/또는 예측된 KRAS-연관 MHC 클래스 I 네오에피토프 VVGAVGVGK(서열번호: 79), VVVGAVGVGK(서열번호: 81), 및 AVGVGKSAL (서열번호: 80)을 각각 코딩한다.

KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 것을 포함하는 에피토프 -코딩 핵산 서열은 카세트에서 임의의 순서일 수 있다. KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 것을 포함하는 에피토프-코딩 핵산 서열은 본원에 추가로 기재된 바와 같이 접합 에피토프를 최소화하는 순서일 수 있다. 예시적인 비-제한적 예로서, 접합 에피토프를 최소화하기 위해 함께 연결된 연접된 KRAS-연관 MHC 클래스 I 네오에피토프는 서열번호: 65에 나타낸 아미노산 서열로 표시되고 다음과 같은 순서를 갖는다: G12C G12D Q61H G12D G12V G12C Q61H G12D G12V G12C Q61H G12D G12V Q61H G12V G12C.

정상 세포 또는 조직과 비교하여 종양 세포 또는 암성 조직에서 발현이 변경된 것으로 알려졌거나 발견된 임의의 폴리펩티드, 예를 들어, 정상 세포 또는 조직에 비해 종양 세포 또는 암 조직에서 비정상적으로 발현된 것으로 알려졌거나 발견된 임의의 폴리펩티드로부터 유래된 펩티드가 본원에 또한 기재된다. 항원성 펩티드가 유도될 수 있는 적합한 폴리펩티드는, 예를 들어 COSMIC 데이터베이스에서 찾을 수 있다. COSMIC은 인간 암의 체세포 돌연변이에 대한 포괄적인 정보를 선별한다. 펩티드는 종양 특이적 돌연변이를 함유한다. 종양 항원(예를 들어, 공유 종양 항원 및 종양 신생항원)은 이로 제한되지 않으나 모든 목적을 위해 본 원에 참조로 포함되는 US 출원 번호 17/058,128에 기재된 것을 포함할 수 있다. 항원 펩티드는 항원이 관련된 폴리펩티드 서열을 코딩하는 뉴클레오티드 서열(예를 들어, DNA 또는 RNA)을 포함하는 코딩 서열의 맥락에서 기술될 수 있다.

또한 감염성 질병 유기체, 대상체의 감염, 또는 대상체의 감염된 세포와 관련된 임의의 폴리펩티드로부터 유래된 펩티드가 본원에 개시되어 있다. 항원은 감염성 질병 유기체의 뉴클레오티드 서열 또는 폴리펩티드 서열에서 유래할 수 있다. 감염성 질병 유기체의 폴리펩티드 서열은 병원체 유래 펩티드, 바이러스 유래 펩티드, 박테리아 유래 펩티드, 진균 유래 펩티드 및/또는 기생충 유래 펩티드를 포함하지만 이에 제한되지 않는다. 전염병 유기체에는 중증급성호흡기증후군 관련 코로나바이러스(SARS), 중증급성호흡기증후군 코로나바이러스 2(SARS-CoV-2), 에볼라, HIV, B형 간염 바이러스(HBV), 인플루엔자, C형 간염 바이러스(HCV), 인유두종바이러스(HPV), 거대세포바이러스(CMV), 치쿤구니아 바이러스, 호흡기 세포융합 바이러스(RSV), 뎅기열 바이러스, 오르티믹소바이러스과 바이러스 및 결핵이 포함되나 이에 제한되지 않는다.

본원에 개시된 방법에 의해 확인된 감염성 질병 유기체 특이적 항원 또는 에피토프를 포함하는 분리된 펩티드, 공지된 감염성 질병 유기체 특이적 항원 또는 에피토프를 포함하는 펩티드, 및 본원에 개시된 방법에 의해 확인된 돌연변이 폴리펩티드 또는 이의 단편이 개시된다. 항원 펩티드는 항원이 관련된 폴리펩티드 서열을 코딩하는 뉴클레오티드 서열(예를 들어, DNA 또는 RNA)을 포함하는 코딩 서열의 맥락에서 기술될 수 있다.

본원에 기재된 벡터 및 관련 조성물은 유기체 또는 이의 부산물과 관련된 감염 또는 기타 역반응을 예방 및/또는 치료하기 위해 독소 또는 기타 부산물을 포함하는 임의의 유기체로부터 항원을 전달하는 데 사용될 수 있다.

백신에 혼입될 수 있는(예를 들어, 카세트에 코딩된) 항원은 인간 및 비-인간 척추동물을 감염시키는 병원성 바이러스와 같은 바이러스에 대해 인간 또는 비-인간 동물을 면역화하는 데 유용한 면역원을 포함한다. 항원은 다양한 바이러스 과에서 선택될 수 있다. 면역 반응이 바람직한 바람직한 바이러스 과의 예에는 일반 감기 사례의 약 50%를 담당하는 라이노바이러스 속을 포함하는 피코르나바이러스 계열; 폴리오바이러스, 콕사키바이러스, 에코바이러스 및 A형 간염 바이러스와 같은 인간 엔테로바이러스를 포함하는 엔테로바이러스 속; 주로 비-사람 동물에서 구제역을 일으키는 아프토바이러스 속을 포함한다. 피코르나바이러스 과의 바이러스 내에서 표적 항원에는 VP1, VP2, VP3, VP4 및 VPG가 포함된다. 또 다른 바이러스 과에는 칼시바이러스 과가 포함되며, 이는 유행성 위장염의 중요한 원인 인자인 바이러스의 노워크(Norwalk) 군을 포함한다. 인간 및 비-인간 동물에서 면역 반응을 자극하기 위해 항원을 표적화하는데 사용하기에 바람직한 또 다른 바이러스 과는 신드비스 바이러스, 로스리버 바이러스 및 베네수엘라, 동부 및 서부 말 뇌염 및 풍진 바이러스를 포함한 루비바이러스를 포함하는 알파바이러스 속을 포함하는 토가바이러스 과이다. 플라비바이러스과 계열에는 뎅기열, 황열병, 일본 뇌염, 세인트루이스 뇌염 및 진드기 매개 뇌염 바이러스가 포함된다. 다른 표적 항원은 C형 간염 또는 코로나바이러스 과로부터 생성될 수 있으며 여기에는 감염성 기관지염 바이러스(가금류), 돼지 전염성 위장병 바이러스(돼지), 돼지 혈구응집성 뇌척수염 바이러스(돼지), 고양이 전염성 복막염 바이러스(고양이), 고양이 장 코로나바이러스(고양이), 개 코로나바이러스(개)와 같은 다수의 비-인간바이러스 및 일반 감기 및/또는 비-A형, B형 또는 C형 간염을 유발할 수 있는 인간 호흡기 코로나바이러스를 포함한다. 코로나바이러스 과 내에서 표적 항원에는 E1(M 또는 매트릭스 단백질이라고도 지칭), E2(S 또는 스파이크 단백질이라고도 지칭), E3(HE 또는 헤마글루틴-엘테로스라고도 지칭) 당단백질(모든 코로나바이러스에 존재하지 않는다) 또는 N(뉴클레오캡시드)이 포함된다. 또 다른 항원은 베시큘로바이러스 속(예를 들어, 수포성 구내염 바이러스) 및 일반적인 리사바이러스(예를 들어, 광견병)를 포함하는 랍도바이러스 과에 대해 표적이 될 수 있다. 랍도바이러스 과 내에서 적절한 항원은 G 단백질 또는 N 단백질에서 유래될 수 있다. 마르부르크 및 에볼라 바이러스와 같은 출혈열 바이러스를 포함하는 필로바이러스과가 적절한 항원 공급원이 될 수 있다. 파라믹소바이러스 과에는 파라인플루엔자 바이러스 1형, 파라인플루엔자 바이러스 3형, 소 파라인플루엔자 바이러스 3형, 루불라바이러스(볼거리 바이러스), 파라인플루엔자 바이러스 2형, 파라인플루엔자 바이러스 4형, 뉴캐슬병 바이러스(닭), 우역, 홍역 및 개 홍역을 포함하는 모빌리바이러, 호흡기 합포체 바이러스(예를 들어, 글리코-(G) 단백질 및 융합(F) 단백질, 이에 대한 서열은 GenBank로부터 이용가능함)를 포함하는 뉴모바이러스를 포함한다. 인플루엔자 바이러스는 오르토믹소바이러스과로 분류되며 항원(예를 들어, HA 단백질, N1 단백질)의 적절한 공급원이 될 수 있다. 분야바이러스 과에는 분야바이러스(캘리포니아 뇌염, 라크로스), 플레보바이러스(리프트 밸리 열), 한타바이러스(퓨레말라는 헤마긴열 바이러스이다), 나이로바이러스(나이로비 양병) 및 다양한 할당되지 않은 분가바이러스가 포함된다. 아레나바이러스 과는 LCM 및 라사 열병 바이러스에 대한 항원 공급원을 제공한다. 레오바이러스 과에는 레오바이러스, 로타바이러스(소아에게 급성 위장염을 일으킨다), 오르비바이러스 및 컬티바이러스(콜로라도 진드기열, 레봄보(인간), 말 뇌증, 푸른 혀) 속이 포함된다. 레트로바이러스 과에는 고양이 백혈병 바이러스, HTLVI 및 HTLVII, 렌티비리날(인간 면역결핍 바이러스(HIV), 원숭이 면역결핍 바이러스(SIV), 고양이 면역결핍 바이러스(FIV), 말 감염성 빈혈 바이러스 및 스푸마비리날를 포함)과 같은 인간 및 수의과 질병을 포괄하는 온코리비리날 아과가 포함된다. 렌티바이러스 중에서 많은 적합한 항원이 기술되어 있으며 쉽게 선택할 수 있다. 적합한 HIV 및 SIV 항원의 예는 제한 없이 gag, pol, Vif, Vpx, VPR, Env, Tat, Nef 및 Rev 단백질 뿐만 아니라 이의 다양한 단편을 포함한다. 예를 들어, Env 단백질의 적합한 단편은 gp120, gp160, gp41 또는 예를 들어 적어도 약 8개 아미노산 길이의 이의 더 작은 단편과 같은 임의의 서브유닛을 포함할 수 있다. 유사하게, tat 단백질의 단편이 선택될 수 있다(U.S. Pat. No. 5,891,994 and U.S. Pat. No. 6,193,981. the HIV and SIV proteins, D. H. Barouch et al, J. Virol., 75(5):2462-2467 (March 2001), and R. R. Amara, et al,　Science,　292:69-74 (6 Apr. 2001)). 또 다른 예에서, HIV 및/또는 SIV 면역원성 단백질 또는 펩티드는 융합 단백질 또는 다른 면역원성 분자를 형성하는 데 사용될 수 있다. 예를 들어, 문헌에 기재된 HIV-1 Tat 및/또는 Nef 융합 단백질 및 면역화 요법을 참조한다(WO 01/54719, published Aug. 2, 2001, 및 WO 99/16884, published Apr. 8, 1999). 본 발명은 본원에 기술된 HIV 및/또는 SIV 면역원성 단백질 또는 펩티드에 제한되지 않는다. 또한, 이들 단백질에 대한 다양한 변형이 기재되었거나 당업자에 의해 용이하게 이루어질 수 있다(U.S. Pat. No. 5,972,596). 또한, 원하는 HIV 및/또는 SIV 면역원은 단독으로 또는 조합하여 전달할 수 있다. 이러한 조합은 단일 벡터 또는 다중 벡터로부터의 발현을 포함할 수 있다. 파포바바이러스 과에는 폴리오마바이러스 아과(BKU 및 JCU 바이러스) 및 유두종바이러스 아과(암 또는 유두종의 악성 진행과 관련)가 포함된다. 아데노바이러스 과에는 호흡기 질환 및/또는 장염을 유발하는 바이러스(EX, AD7, ARD, O.B.)가 포함된다. 파보바이러스 과 고양이 파보바이러스(고양이 장염), 고양이 범백혈구 감소증 바이러스, 개 파보바이러스 및 돼지 파보바이러스. 헤르페스바이러스 과에는 심플렉스바이러스(HSVI, HSVII), 바리셀로바이러스(가성 광견병, 대상포진) 속을 포함하는 알파헤르페스바이러스 아과 및 거대세포바이러스(인간 CMV), 무로메갈로바이러스) 속을 포함하는 베타헤르페스바이러스 아과 및 림포크립토바이러스, EBV(버킷 림프종), 감염성 비기관염, 마렉병 바이러스 및 라디노바이러스 속을 포함하는 감마헤르페스바이러스과 아과를 포함한다. 폭스바이러스 과는 오르토폭스바이러스(바비올라(천연두) 및 백시니아(우두)) 속, 파라폭스바이러스, 아비폭스바이러스, 카프리폭스바이러스, 레포리폭스바이러스, 수이폭스바이러스 및 아과 엔토모폭시이리나에를 포함하는 아과 코르도폭시이리나에를 포함한다. 헤파드나바이러스 과에는 B형 간염 바이러스가 포함된다. 적절한 항원 공급원이 될 수 있는 분류되지 않은 바이러스 중 하나는 델타 간염 바이러스이다. 또 다른 바이러스 공급원은 조류 감염성 윤활낭 질환 바이러스 및 돼지 호흡기 및 생식 증후군 바이러스를 포함할 수 있다. 알파바이러스 과에는 말 동맥염 바이러스와 다양한 뇌염 바이러스가 포함된다.

또한 백신에 혼입될 수 있는(예를 들어, 카세트에 코딩된) 항원은 또한 인간 및 비-인간 척추동물을 감염시키는 박테리아, 진균, 기생 미생물 또는 다세포 기생충을 포함하는 병원체에 대해 인간 또는 비-인간 동물을 면역화하는 데 유용한 면역원을 포함한다. 박테리아 병원체의 예에는 폐렴구균을 포함하는 병원성 그람-양성 구균; 포도상구균; 및 연쇄상 구균을 포함한다. 병원성 그람-음성 구균에는 수막 구균; 임균이 포함된다. 병원성 장내 그람-음성 간균은 장내세균과; 슈도모나스(pseudomonas), 아시네토박테리아 및 에이케넬라(eikenella); 멜리오이드증; 살모넬라균(salmonella); 이질균(shigella); 헤모필루스(haemophilus)(헤모필루스 인플루엔자(Haemophilus influenzae), 헤모필루스 솜누스(Haemophilus somnus)); 모락셀라(moraxella); H. 듀크레이(H. ducreyi)(연골종을 유발); 브루셀라(brucella); 프러니셀라 툴라렌시스(Franisella tularensis)(야토병을 유발); 여시니아(yersinia)(파스퇴렐라(pasteurella)); 스트렙토바실러스 모닐리포르미스(streptobacillus moniliformis) 및 스피릴룸(spirillum)을 포함한다. 그람-양성 간균은 리스테리아 모노사이토제네스(listeria monocytogenes); 에리시펠로트릭스 류시오패티에(erysipelothrix rhusiopathiae); 코리네박테리움 디프테리아(Corynebacterium diphtheria)(디프테리아); 콜레라; B. 탄저균(anthracis)(anthrax); 도노바노시스(사타구니 육아종); 및 바르토넬라증이 포함된다. 병원성 혐기성 박테리아에 의해 유발되는 질병에는 파상풍; 보툴리누스 중독; 다른 클로스트리듐; 결핵; 나병; 및 기타 마이코박테리아가 포함된다. 특정 박테리아 종의 예는 제한없이 스트렙토코커스 뉴모니애(Streptococcus pneumoniae), 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 아갈락티아에(Streptococcus agalactiae), 스트렙토코커스 파에칼리스(Streptococcus faecalis), 모락셀라 카타랄리스(Moraxella catarrhalis), 헬리코박터 파일로리균(Helicobacter pylori), 나이세리아 수막염(Neisseria meningitidis), 나이세리아 임질(Neisseria gonorrhoeae), 클라미디아 트라코마티스(Chlamydia trachomatis), 클라미디아 뉴모니아(Chlamydia pneumoniae), 클라미디아 시타시(Chlamydia psittaci), 보르데텔라 백일해(Bordetella pertussis), 살모넬라 티피(Salmonella typhi), 살모넬라 티피무리움(Salmonella typhimurium), 살모넬라 콜레라수이스(Salmonella choleraesuis), 대장균(Escherichia coli), 시겔라(Shigella), 비브리오 콜레라(Vibrio cholerae), 코리네박테리움 디프테리아(Corynebacterium diphtheriae), 결핵균(Mycobacterium tuberculosis), 마이코박테리움 아비움(Mycobacterium avium), 마이코박테리움 세포내 세균복합체(Mycobacterium intracellulare　complex), 프로테우스 미라빌리스(Proteus mirabilis), 프로테우스 불가리스(Proteus vulgaris), 황색포도상구균(Staphylococcus aureus), 클로스트리디움 테타니(Clostridium tetani), 렙토스피라 인터로간(Leptospira interrogans), 보렐리아 부르그도르페리(Borrelia burgdorferi), 파스퇴렐라 헤몰리티카(Pasteurella haemolytica), 파스퇴렐라 멀토시다(Pasteurella multocida), 방선균 흉막폐렴(Actinobacillus pleuropneumoniae) 및 마이코플라스마 갈리셉티쿰(Mycoplasma gallisepticum)이다. 병원성 스피로헤타 질병에는 매독; 트레포네마토시스: 요, 핀타 및 풍토성 매독; 및 렙토스피라증이 포함된다. 고병원성 박테리아 및 병원성 진균에 의해 유발되는 기타 감염에는 방선균증; 노심증; 크립토코커스(Cryptococcus), 분구균증(Blastomyces), 히스토플라스마증(Histoplasma) 및 콕시디오이데스진균증(Coccidiodes); 칸디다증(Candida), 아스페르길루스증(Aspergillis), 및 점막진균증; 스포로트리코증; 파라콕시디오도진균증, 페트리엘리디움증, 토룰롭증, 균종 및 염색체 균증; 및 피부사상균증이 포함된다. 리케차 감염에는 장티푸스열, 로키산반점열, Q열 및 리케차두가 포함된다. 마이코플라스마 및 클라미디아 감염의 예는 다음을 포함한다: 마이코플라스마 폐렴(mycoplasma pneumoniae); 성성 림프육아종; 시타코증; 및 주산기 클라미디아 감염. 병원성 진핵생물은 병원성 원생동물 및 기생충을 포함하며 이에 의해 생성되는 감염은 아메바증; 말라리아; 리슈만편모충증(예를 들어, 주요 리슈만편모충증(Leishmania major)에 의해 유발); 트리파노소마증; 톡소플라스마증(예를 들어, 톡소플라스마 곤디(Toxoplasma gondii)에 의해 유발); 뉴모시스티스 카리니이(Pneumocystis carinii); 트라이칸스; 톡소플라스마 곤디(Toxoplasma gondii); 바베시오증; 편모충증(예를 들어, 편모충(Giardia)에 의해 유발); 선모충증(예를 들어, 트리코모나스(Trichomonas)에 의해 유발); 사상충증; 주혈흡충증(예를 들어, 주혈흡충(Schistosoma)에 의해 유발); 선충류; 흡충류 또는 플루크; 및 조충류(촌충) 감염. 다른 기생충 감염은 특히 아스카리스(Ascaris), 트리츄리스(Trichuris), 크립토스포리디움(Cryptosporidium) 및 폐포자충(Pneumocystis carinii)에 의해 발생할 수 있다.

또한 감염성 질병 유기체, 대상체의 감염, 또는 대상체의 감염된 세포와 관련된 임의의 폴리펩티드로부터 유래된 펩티드가 본원에 개시되어 있다. 항원은 감염성 질병 유기체의 핵산 서열 또는 폴리펩티드 서열로부터 유래될 수 있다. 감염성 질병 유기체의 폴리펩티드 서열은 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드 및/또는 기생충-유래 펩티드를 포함하지만 이에 제한되지 않는다. 감염성 질병 유기체에는 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS), 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 에볼라, HIV, B형 간염 바이러스(HBV), 인플루엔자, C 형 간염 바이러스(HCV), 인유두종바이러스(HPV), 거대세포바이러스(CMV), 치쿤구니야 바이러스, 호흡기 세포융합 바이러스(RSV), 뎅기열 바이러스, 오르티믹소바이러스과 바이러스 및 결핵이 포함되지만 이에 제한되지는 않는다.

수지상 세포와 같은 전문적인 항원 제시 세포를 포함하여, 종양 세포, 감염된 세포 또는 면역 세포와 같은 세포의 세포 표면 상에 제시될 것으로 예측되는 항원이 선택될 수 있다. 면역원성으로 예측되는 항원이 선택될 수 있다.

항원 뉴클레오티드 서열에 의해 코딩되는 하나 이상의 폴리펩티드는 1000 nM 미만의 IC50 값을 갖는 MHC와의 결합 친화도, MHC 클래스 I 펩티드의 경우 길이 8-15, 8, 9, 10, 11, 12, 13, 14 또는 15개의 아미노산, 프로테아좀 절단을 촉진하는 펩티드 내부 또는 근처에 서열 모티프의 존재, 및 TAP 수송을 촉진하는 서열 모티프의 존재 중 적어도 하나를 포함할 수 있다. MHC 클래스 II 펩티드의 경우 길이는 6-30, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개 아미노산이고, 세포외 또는 리소좀 프로테아제(예를 들어, 카텝신) 또는 HLA-DM 촉매된 HLA 결합에 의한 절단을 촉진하는 펩티드 내부 또는 근처에 서열 모티프가 존재한다.

하나 이상의 항원이 종양의 표면 상에 제시될 수 있다. 하나 이상의 항원이 감염된 세포의 표면 상에 제시될 수 있다.

하나 이상의 항원은, 예를 들어 대상체에서 T 세포 반응 및/또는 B 세포 반응을 자극할 수 있는 종양이 있는 대상체에서 면역원성일 수 있다. 하나 이상의 항원은, 예를 들어 대상체에서 T 세포 반응 및/또는 B 세포 반응을 자극할 수 있는 감염이 있는 대상체에서 또는 감염이 있는 것으로 의심되는 대상체에서 면역원성일 수 있다. 하나 이상의 항원은 감염의 위험이 있는 대상체에서 면역원성일 수 있으며, 예를 들어 기억 T 세포, 기억 B 세포 및/또는 감염에 특이적인 항체의 생성을 자극하여 감염에 대한 면역학적 보호(즉, 면역)를 제공하는 대상체에서 T 세포 반응 및/또는 B 세포 반응을 자극할 수 있다.

하나 이상의 항원은 하나 이상의 항원을 인식하는 항체(예를 들어, 종양 또는 감염성 질병 항원을 인식하는 항체)의 생성과 같은 B 세포 반응을 자극할 수 있다. 항체는 선형 폴리펩티드 서열을 인식하거나 2차 및 3차 구조를 인식할 수 있다. 따라서, B 세포 항원은 전장 단백질, 단백질 서브유닛, 단백질 도메인, 또는 2차 및 3차 구조를 가질 것으로 알려져 있거나 예측되는 임의의 폴리펩티드 서열을 포함하나 이에 제한되지 않는 선형 폴리펩티드 서열 또는 2차 및 3차 구조를 갖는 폴리펩티드를 포함할 수 있다. 종양 또는 감염성 질병 유기체에 대한 B 세포 반응을 자극할 수 있는 항원은 각각 종양 또는 감염성 질병 유기체의 표면 상에서 발견되는 항원일 수 있다. 종양 또는 감염성 질병 유기체에 대한 B 세포 반응을 유발할 수 있는 항원은 각각 종양 또는 감염성 질병 유기체의 표면 상에서 발현되는 세포내 신생항원일 수 있다.

하나 이상의 항원은 T 세포 반응을 자극할 수 있는 항원(예를 들어, 예측된 T 세포 에피토프 서열을 포함하는 펩티드) 및 B 세포 반응을 자극할 수 있는 별개의 항원(예를 들어, 전장 단백질, 단백질 서브유닛, 단백질 도메인)의 조합을 포함할 수 있다.

대상체에서 자가면역 반응을 자극하는 하나 이상의 항원은 대상체에 대한 백신 생성과 관련하여 고려에서 제외될 수 있다.

적어도 하나의 항원성 펩티드 분자(예를 들어, 에피토프 서열)의 크기는 약 5, 약 6, 약 7, 약 8, 약 9, 약 10, 약 11, 약 12, 약 13, 약 14, 약 15, 약 16, 약 17, 약 18, 약 19, 약 20, 약 21, 약 22, 약 23, 약 24, 약 25, 약 26, 약 27, 약 28, 약 29, 약 30, 약 31, 약 32, 약 33, 약 34, 약 35, 약 36, 약 37, 약 38, 약 39, 약 40, 약 41, 약 42, 약 43, 약 44, 약 45, 약 46, 약 47, 약 48, 약 49, 약 50, 약 60, 약 70, 약 80, 약 90, 약 100, 약 110, 약 120개 이상의 아미노 분자 잔기, 및 그 안에서 유도가능한 임의의 범위를 포함할 수 있다. 특정 구현양태에서 항원성 펩티드 분자는 50개 이하의 아미노산이다.

항원성 펩티드 및 폴리펩티드는 MHC 클래스 I의 경우 길이가 15개 이하이고 일반적으로 약 8개 내지 약 11개 잔기, 특히 9개 또는 10개 잔기로 구성되고; MHC 클래스 II의 경우 6-30개 잔기를 포함한다.

원하는 경우, 더 긴 펩티드가 여러 방식으로 설계될 수 있다. 한 경우에, HLA 대립유전자에 대한 펩티드의 제시 가능성이 예측되거나 알려져 있을 때, 더 긴 펩티드는 다음 중 하나로 구성될 수 있다: (1) 각각의 상응하는 유전자 생성물의 N- 및 C-말단을 향해 2-5개 아미노산의 확장을 갖는 개별 제시 펩티드; (2) 각각에 대해 확장된 서열을 갖는 제시된 펩티드의 일부 또는 전부의 연속. 또 다른 경우, 시퀀싱에서 긴(>10개 잔기) 네오에피토프 서열이 종양에서 존재(예를 들어, 새로운 펩티드 서열을 유도하는 프레임시프트, 리드-스루 또는 인트론 포함으로 인해)하는 것으로 밝혀지면, 더 긴 펩티드는 다음으로 이루어진다: (3) 새로운 종양-특이적 또는 감염성 질병-특이적 아미노산의 전체 스트레치 -- 따라서 가장 강력한 HLA 제시 짧은 펩티드의 컴퓨터 또는 시험관내 테스트-기반 선택에 대한 필요성 우회. 두 경우 모두, 더 긴 펩티드를 사용하면 환자 세포에 의한 내인성 처리가 가능하고 보다 효과적인 항원 제시 및 T 세포 반응 자극으로 이어질 수 있다. 더 긴 펩티드는 또한 종양 또는 감염성 질병 유기체에서 발현되는 펩티드의 전장 단백질, 단백질 서브유닛, 단백질 도메인, 및 이들의 조합을 포함할 수 있다. 더 긴 펩티드(예를 들어, 전장 단백질, 단백질 서브유닛 또는 단백질 도메인) 및 이들의 조합이 B 세포 반응을 자극하기 위해 포함될 수 있다.

항원성 펩티드 및 폴리펩티드는 HLA 단백질 상에 제시될 수 있다. 일부 측면에서 항원성 펩티드 및 폴리펩티드는 야생형 펩티드보다 더 큰 친화도로 HLA 단백질에 제시된다. 일부 측면에서, 항원성 펩티드 또는 폴리펩티드는 적어도 5000 nM 미만, 적어도 1000 nM 미만, 적어도 500 nM 미만, 적어도 250 nM 미만, 적어도 200 nM 미만, 적어도 150nM 미만, 적어도 100nM 미만, 적어도 50nM 미만 또는 그 미만의 IC50을 가질 수 있다.

일부 측면에서, 항원성 펩티드 및 폴리펩티드는 대상체에게 투여될 때 자가면역 반응을 자극하지 않거나 및/또는 면역학적 내성을 유발하지 않는다.

또한, 적어도 2개 이상의 항원성 펩티드를 포함하는 조성물이 제공된다. 일부 구현양태에서, 조성물은 적어도 2개의 별개의 펩티드를 함유한다. 적어도 2개의 별개의 펩티드가 동일한 폴리펩티드로부터 유래될 수 있다. 별개의 폴리펩티드는 펩티드가 길이, 아미노산 서열, 또는 둘 다에 따라 변한다는 것을 의미한다. 펩티드는 종양-특이적 돌연변이를 포함할 수 있다. 종양-특이적 펩티드는 종양 특이적 돌연변이를 함유한다고 알려졌거나 발혀진 임의의 폴리펩티드, 또는 정상 세포 또는 조직과 비교하여 종양 세포 또는 암조직에서 변경된 발현을 갖는 것으로 알려져 있거나 발견된 임의의 폴리펩티드로부터 유래된 펩티드, 예를 들어 정상 세포 또는 조직과 비교하여 종양 세포 또는 암 조직에서 비정상적으로 발현되는 것으로 알려졌거나 발견된 임의의 폴리펩티드일 수 있다. 펩티드는 감염성 질병 유기체에 대해 알려졌거나 관련이 있는 것으로 의심되는 임의의 폴리펩티드, 또는 정상 세포 또는 조직과 비교하여 감염된 세포에서 변경된 발현을 갖는 것으로 알려져 있거나 발견된 임의의 폴리펩티드로부터 유래된 펩티드일 수 있다(예를 들어, 감염성 질병 폴리뉴클레오티드 또는 폴리펩티드, 또는 숙주 세포에 제한된 발현을 갖는 감염성 질병 폴리뉴클레오티드 또는 폴리펩티드). 항원성 펩티드가 유래될 수 있는 적합한 폴리펩티드는, 예를 들어 COSMIC 데이터베이스 또는 AACR 유전체학 증거 종양 정보 교환(Genomics Evidence Neoplasia Information Exchange, GENIE) 데이터베이스에서 찾을 수 있다. COSMIC은 인간 암의 체세포 돌연변이에 대한 포괄적인 정보를 정리한다. AACR GENIE는 임상 등급의 암 게놈 데이터를 수만 명의 암 환자로부터 얻은 임상 결과와 집계하고 연결한다. 일부 측면에서 종양 특이적 돌연변이는 특정 암 유형에 대한 동인(driver) 돌연변이이다. 펩티드는 KRAS 돌연변이(예를 들어, KRAS G12C, KRAS G12V, KRAS G12D, 및/또는 KRAS Q61H 돌연변이)를 포함할 수 있다.

원하는 활성 또는 특성을 갖는 항원성 펩티드 및 폴리펩티드는 특정 원하는 속성, 예를 들어 개선된 약리학적 특성을 제공하도록 변형될 수 있으며, 반면 원하는 MHC 분자에 결합하고 적절한 T 세포를 활성화시키기 위해 비변형된 펩티드의 생물학적 활성을 증가시키거나 적어도 실질적으로 모두 유지한다. 예를 들어, 항원성 펩티드 및 폴리펩티드는 보존적 또는 비보존적 치환과 같은 다양한 변화를 받을 수 있으며, 이러한 변화는 개선된 MHC 결합, 안정성 또는 제시와 같은 사용상의 특정 이점을 제공할 수 있다. 보존적 치환은 아미노산 잔기를 생물학적 및/또는 화학적으로 유사한 다른 것으로, 예를 들어 하나의 소수성 잔기를 다른 것으로, 또는 하나의 극성 잔기를 다른 것으로 대체하는 것을 의미한다. 치환은 Gly, Ala; Val, Ile, Leu, Met; Asp, Glu; Asn, Gln; Ser, Thr; Lys, Arg; 및 Phe, Tyr와 같은 조합을 포함한다. 단일 아미노산 치환의 효과는 D-아미노산을 사용하여 조사할 수도 있다. 이러한 변형은, 예를 들어 문헌에 기재된 잘 공지된 합성 방법을 사용하여 만들 수 있다(Merrifield, Science 232:341-347 (1986), Barany & Merrifield, The Peptides, Gross & Meienhofer, eds. (N.Y., Academic Press), pp. 1-284 (1979); and Stewart & Young, Solid Phase Peptide Synthesis, (Rockford, Ill., Pierce), 2d Ed. (1984)).

다양한 아미노산 모방체 또는 비천연 아미노산을 사용한 펩티드 및 폴리펩티드의 변형은 생체내 펩티드 및 폴리펩티드의 안정성을 증가시키는데 특히 유용할 수 있다. 안정성은 여러 가지 방법으로 검정할 수 있다. 예를 들어, 펩티다제 및 인간 혈장 및 혈청과 같은 다양한 생물학적 배지를 사용하여 안정성을 테스트했다(Verhoef et al., Eur. J. Drug Metab Pharmacokin. 11:291-302 (1986)). 펩티드의 반감기는 25% 인간 혈청(v/v) 검정을 사용하여 편리하게 결정할 수 있다. 프로토콜은 일반적으로 다음과 같다. 풀링된 인간 혈청(유형 AB, 비-열 비활성화)은 사용 전에 원심분리에 의해 탈지된다. 그런 다음 혈청을 RPMI 조직 배양 배지로 25%로 희석하고 펩티드 안정성을 테스트하는 데 사용한다. 소정의 시간 간격으로 소량의 반응 용액을 제거하고 6% 트리클로로아세트산 수용액 또는 에탄올에 첨가한다. 탁한 반응 샘플을 15분 동안 냉각(4℃)한 다음 회전시켜 침전된 혈청 단백질을 펠릿화한다. 펩티드의 존재는 그 다음 안정성-특이적 크로마토그래피 조건을 사용하여 역상 HPLC에 의해 결정된다.

펩티드 및 폴리펩티드는 개선된 혈청 반감기 이외의 원하는 속성을 제공하도록 변형될 수 있다. 예를 들어, CTL 활성을 자극하는 펩티드의 능력은 T 헬퍼 세포 반응을 자극할 수 있는 적어도 하나의 에피토프를 함유하는 서열에 대한 연결에 의해 향상될 수 있다. 면역원성 펩티드/T 헬퍼 접합체는 스페이서 분자에 의해 연결될 수 있다. 스페이서는 일반적으로 생리학적 조건에서 실질적으로 전하를 띠지 않는 아미노산 또는 아미노산 모방체와 같은 비교적 작은 중성 분자로 이루어진다. 스페이서는 전형적으로, 예를 들어 Ala, Gly, 또는 비극성 아미노산 또는 중성 극성 아미노산의 다른 중성 스페이서로부터 선택된다. 임의로 존재하는 스페이서는 동일한 잔기로 구성될 필요가 없고 따라서 헤테로- 또는 호모-올리고머일 수 있음이 이해될 것이다. 존재하는 경우, 스페이서는 일반적으로 적어도 1개 또는 2개의 잔기, 보다 일반적으로 3개 내지 6개의 잔기일 것이다. 대안적으로, 펩티드는 스페이서 없이 T 헬퍼 펩티드에 연결될 수 있다.

항원성 펩티드는 펩티드의 아미노 또는 카복시 말단에서 직접적으로 또는 스페이서를 통해 T 헬퍼 펩티드에 연결될 수 있다. 항원성 펩티드 또는 T 헬퍼 펩티드의 아미노 말단은 아실화될 수 있다. 예시적인 T 헬퍼 펩티드는 파상풍 톡소이드 830-843, 인플루엔자 307-319, 말라리아 환포자소체 382-398 및 378-389를 포함한다.

단백질 또는 펩티드는 표준 분자 생물학적 기술을 통한 단백질, 폴리펩티드 또는 펩티드의 발현, 천연 소스으로부터 단백질 또는 펩티드의 분리, 또는 단백질 또는 펩티드의 화학적 합성을 포함하는 당업자에게 공지된 임의의 기술에 의해 제조될 수 있다. 다양한 유전자에 상응하는 뉴클레오티드 및 단백질, 폴리펩티드 및 펩티드 서열은 이전에 개시되었으며, 당해 분야의 숙련가에게 공지된 컴퓨터화된 데이터베이스에서 찾을 수 있다. 그러한 데이터베이스 중 하나는 국립 보건원(National Institutes of Health) 웹사이트에 있는 국립 생명 공학 정보 센터(National Center for Biotechnology Information)의 진뱅크(Genbank) 및 진펩트(GenPept) 데이터베이스이다. 공지된 유전자에 대한 코딩 영역은 본원에 개시된 기술을 사용하여 또는 당업자에게 공지된 바와 같이 증폭 및/또는 발현될 수 있다. 대안적으로, 단백질, 폴리펩티드 및 펩티드의 다양한 상업적 제제가 당업자에게 공지되어 있다.

추가 측면에서, 항원은 항원성 펩티드 또는 이의 일부를 코딩하는 핵산(예를 들어, 폴리뉴클레오티드)을 포함한다. 폴리뉴클레오티드는, 예를 들어 DNA, cDNA, PNA, CNA, RNA(예를 들어, mRNA), 단일-가닥 및/또는 이중-가닥, 또는 천연 또는 안정화된 형태의 폴리뉴클레오티드, 예를 들어 포스포로티에이트 백본을 갖는 폴리뉴클레오티드, 또는 이들의 조합이며 인트론을 포함하거나 포함하지 않을 수 있다. 항원을 코딩하는 폴리뉴클레오티드 서열은, 예를 들어 전사, 번역, 전사후 처리 및/또는 RNA 안정성의 개선을 통해 발현을 개선하도록 서열-최적화될 수 있다. 예를 들어, 항원을 코딩하는 폴리뉴클레오티드 서열은 코돈-최적화될 수 있다. 본원에서 "코돈-최적화"는 주어진 유기체의 코돈 편향과 관련하여 자주 사용되지 않는 코돈을 자주 사용되는 동의(synonymous) 코돈으로 대체하는 것을 의미한다. 폴리뉴클레오티드 서열은 전사 후 처리를 개선하도록 최적화될 수 있으며, 예를 들어 스플라이싱 모티프(예를 들어, 표준 및/또는 비밀/비표준 스플라이스 공여체, 분지 및/또는 수용체 서열)의 제거 및/또는 편향 선호된 스플라이싱 이벤트에 대한 외인성 스플라이싱 모티프(예를 들어, 스플라이스 공여체, 분지 및/또는 수용체 서열)의 도입을 통해 의도하지 않은 스플라이싱을 줄이기 위해 최적화될 수 있다. 외인성 인트론 서열은 SV40(예를 들어, SV40 미니-인트론)에서 유래되고 면역글로불린(예를 들어, 인간 β-글로빈 유전자)에서 유래된 것을 포함하지만 이에 제한되지 않는다. 외인성 인트론 서열은 프로모터/인핸서 서열 및 항원(들) 서열 사이에 혼입될 수 있다. 발현 벡터에 사용하기 위한 외인성 인트론 서열은 모든 목적을 위해 본원에 참고로 포함되는 문헌에 기재되어 있다(Callendret et al., Virology. 2007 Jul 5; 363(2): 288-302). 폴리뉴클레오티드 서열은, 예를 들어 RNA 불안정성 모티프(예를 들어, AU-풍부 요소 및 3' UTR 모티프) 및/또는 반복적인 뉴클레오티드 서열의 제거를 통해 전사체 안정성을 개선하도록 최적화될 수 있다. 폴리뉴클레오티드 서열은, 예를 들어 비밀 전사 개시자 및/또는 종결자의 제거를 통해 정확한 전사를 개선하도록 최적화될 수 있다. 폴리뉴클레오티드 서열은, 예를 들어 비밀 AUG 개시 코돈, 미성숙 폴리A 서열 및/또는 2차 구조 모티프의 제거를 통해 번역 및 번역 정확도를 개선하도록 최적화될 수 있다. 폴리뉴클레오티드 서열은 구성 수송 요소(CTE), RNA 수송 요소(RTE) 또는 우드척 전사후 조절 요소(WPRE)의 첨가를 통해 전사체의 핵 수출을 개선하도록 최적화될 수 있다. 발현 벡터에 사용하기 위한 핵 수출 신호는 모든 목적을 위해 본원에 참고로 포함되는 문헌에 기재되어 있다(Callendret et al., Virology. 2007 Jul 5; 363(2): 288-302). 폴리뉴클레오티드 서열은, 예를 들어 주어진 유기체의 평균 GC 함량을 반영하기 위해 GC 함량과 관련하여 최적화될 수 있다. 서열 최적화는 전사, 번역, 전사 후 처리 및/또는 RNA 안정성과 같은 하나 이상의 서열 특성의 균형을 맞출 수 있다. 서열 최적화는 전사, 번역, 전사 후 처리 및 RNA 안정성 각각의 균형을 유지하는 최적의 서열을 생성할 수 있다. 서열 최적화 알고리즘은 진아트(GeneArt)(Thermo Fisher), 코돈 최적화 툴(Codon Optimization Tool)(IDT), 쿨 툴(Cool Tool)(University of Singapore), SGI-DNA(La Jolla California)와 같은 당업자에게 알려져 있다. 항원-코딩 단백질의 하나 이상의 영역은 별도로 서열 최적화될 수 있다.

또 다른 측면은 폴리펩티드 또는 이의 일부를 발현할 수 있는 발현 벡터를 제공한다. 상이한 세포 유형에 대한 발현 벡터는 당업계에 잘 알려져 있고 과도한 실험 없이 선택될 수 있다. 일반적으로 DNA는 플라스미드와 같은 발현 벡터에 적절한 방향과 발현을 위한 정확한 해독틀로 삽입된다. 필요한 경우, DNA는 원하는 숙주에 의해 인식되는 적절한 전사 및 번역 조절 제어 뉴클레오티드 서열에 연결될 수 있지만, 이러한 제어는 일반적으로 발현 벡터에서 이용가능하다. 그런 다음 벡터는 표준 기술을 통해 숙주에 도입된다. 지침은 문헌에서 찾을 수 있다(Sambrook et al. (1989) Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, N.Y).

V. 백신 조성물

또한 특이적 면역 반응, 예를 들어 종양-특이적 면역 반응, 또는 감염성 질병 유기체-특이적 면역 반응을 일으킬 수 있는 면역원성 조성물, 예를 들어 백신 조성물이 본원에 개시되어 있다. 백신 조성물은 전형적으로, 예를 들어 본원에 기재된 방법을 사용하여 선택되거나 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및/또는 기생충-유래 펩티드로부터 선택된 하나 또는 다수의 항원을 포함한다. 백신 조성물은 또한 백신으로 지칭될 수 있다.

백신은 1 내지 30개의 펩티드, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 또는 30개의 상이한 펩티드, 6, 7, 8, 9, 10, 11, 12, 13, 또는 14개의 상이한 펩티드, 또는 12, 13 또는 14 상이한 펩티드를 함유할 수 있다. 펩티드는 번역 후 변형을 포함할 수 있다. 백신은 1 내지 100개 이상의 뉴클레오티드 서열, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 그 이상의 상이한 뉴클레오티드 서열, 6, 7, 8, 9, 10 11, 12, 13, 또는 14개의 상이한 뉴클레오티드 서열, 또는 12, 13 또는 14개의 상이한 뉴클레오티드 서열을 포함할 수 있다. 백신에는 1 내지 30개의 항원 서열, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 그 이상의 상이한 항원 서열, 6, 7, 8, 9, 10, 11, 12, 13, 또는 14개의 상이한 항원 서열, 또는 12, 13 또는 14개의 상이한 항원 서열이 포함될 수 있다.

백신은 1 내지 30개의 항원-코딩 핵산 서열, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 그 이상의 상이한항원-코딩 핵산 서열, 6, 7, 8, 9, 10 11, 12, 13 또는 14개의 상이한 항원-코딩 핵산 서열, 또는 12, 13 또는 14개의 상이한 항원-코딩 핵산 서열을 포함할 수 있다. 항원-코딩 핵산 서열은 "항원 카세트"의 항원-코딩 부분을 지칭할 수 있다. 항원 카세트의 특징이 본원에 설명되어 있다. 항원-코딩 핵산 서열은 하나 이상의 에피토프-코딩 핵산 서열(예를 들어, 연접된 T 세포 에피토프를 코딩하는 항원-코딩 핵산 서열)을 함유할 수 있다.

백신은 1 내지 30개의 별개의 에피토프-코딩 핵산 서열, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 그 이상의 별개의 에피토프-코딩 핵산 서열, 6, 7, 8, 9, 10 11, 12, 13, 또는 14개의 별개의 에피토프-코딩 핵산 서열, 또는 12, 13 또는 14개의 별개의 에피토프-코딩 핵산 서열을 함유할 수 있다. 에피토프-코딩 핵산 서열은 연접된 T 세포 에피토프를 코딩하는 항원-코딩 핵산 서열에서 각각의 T 세포 에피토프와 같은 개별 에피토프 서열에 대한 서열을 지칭할 수 있다.

백신은 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함할 수 있다. 본원에 사용된 "반복"(또는 되풀이와 상호교환가능하다)은 항원-코딩 핵산 서열내에서 동일한 핵산 에피토프-코딩 핵산 서열(본원에 기재된 임의의 5' 링커 서열 및/또는 임의의 3' 링커 서열 포함)의 2회 이상의 반복을 의미한다. 한 예에서, 카세트의 항원-코딩 핵산 서열 부분은 에피토프-코딩 핵산 서열의 적어도 2회 반복을 코딩한다. 추가의 비제한적 예에서, 카세트의 항원-코딩 핵산 서열 부분은 하나 이상의 별개의 에피토프를 코딩하고, 별개의 에피토프 중 적어도 하나는 별개의 에피토프를 코딩하는 핵산 서열의 적어도 2회 반복에 의해 코딩된다(즉, 적어도 2개의 별개의 에피토프-코딩 핵산 서열). 예시적인 비제한적 예에서, 항원-코딩 핵산 서열은 에피토프-코딩 핵산 서열 에피토프-코딩 서열 A(E_A), 에피토프-코딩 서열 B(E_B) 및 에피토프-코딩 서열 C(E_C)에 의해 코딩된 에피토프 A, B 및 C를 코딩하고, 별개의 에피토프의 적어도 하나의 반복을 갖는 예시적인 항원-코딩 핵산 서열은 하기식에 의해 예시되지만 이에 제한되지는 않는다:

- 하나의 별개의 에피토프의 반복(에피토프 A의 반복):

E_A-E_B-E_C-E_A; 또는

E_A-E_A-E_B-E_C

- 다중 별개의 에피토프의 반복(에피토프 A, B 및 C의 반복):

E_A-E_B-E_C-E_A-E_B-E_C; 또는

E_A-E_A-E_B-E_B-E_C-E_C

- 다중 별개의 에피토프의 다중 반복(에피토프 A, B 및 C의 반복):

E_A-E_B-E_C-E_A-E_B-E_C-E_A-E_B-E_C; 또는

E_A-E_A-E_A-E_B-E_B-E_B-E_C-E_C-E_C

상기 예는 제한적이지 않으며, 별개의 에피토프의 적어도 하나의 반복을 갖는 항원-코딩 핵산 서열은 임의의 순서 또는 빈도로 별개의 에피토프 각각을 코딩할 수 있다. 예를 들어, 순서와 빈도는 식 E_A-E_B-E_C-E_C-E_A-E_B-E_A-E_C-E_A-E_C-E_C-E_B에 의한, 예를 들어 에피토프 A, B 및 C가 있는 예에서 별개의 에피토프의 무작위 배열일 수 있다.

또한 본원은 5'에서 3'으로 하기식으로 기술된 적어도 하나의 항원-코딩 핵산 서열을 갖는 항원-코딩 카세트를 제공한다:

(E_x-(E^N _n)_y)_z

여기서, E는 적어도 하나의 별개의 에피토프-코딩 핵산 서열 중 적어도 하나를 포함하는 뉴클레오티드 서열을 나타내고,

n은 분리된 별개의 에피토프-코딩 핵산 서열의 수를 나타내고 0을 포함하는 임의의 정수이고,

E^N은 각각의 상응하는 n에 대한 분리된 별개의 에피토프-코딩 핵산 서열을 포함하는 뉴클레오티드 서열을 나타내고,

z의 각 반복에 대해 x = 0 또는 1, 각 n에 대해 y = 0 또는 1, x 또는 y 중 적어도 하나는 = 1, 및 z = 2 또는 그 이상이고, 여기서 항원-코딩 핵산 서열은 E, 주어진 E^N 또는 이들의 조합의 2회 이상의 반복을 포함한다. 일부 측면에서, 적어도 2회 반복을 갖는 적어도 하나의 별개의 에피토프 코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩한다.

각각의 E 또는 E^N은 독립적으로 본원에 기재된 임의의 에피토프-코딩 핵산 서열(예를 들어, 감염성 질병 T 세포 에피토프 및/또는 신생항원 에피토프를 코딩하는 펩티드)을 포함할 수 있다. 예를 들어, 각각의 E 또는 E^N은 식 (L5_b-N_c-L3_d)에 의해 5'에서 3'으로 기술된 뉴클레오티드 서열을 독립적으로 포함할 수 있으며, 여기서 N은 각 E 또는 E^N과 관련된 별개의 에피토프-코딩 핵산 서열을 포함하고, 여기서 c = 1이고, L5는 5' 링커 서열을 포함하고, 여기서 b= 0 또는 1이고, L3은 3' 링커 서열을 포함하고, 여기서 d= 0 또는 1이다. 사용될 수 있는 에피토프 및 링커는 본원에 추가로 기재되어 있다.

에피토프-코딩 핵산 서열(임의의 5' 링커 서열 및/또는 임의의 3' 링커 서열 포함)의 반복은 서로 선형으로 직접 연결될 수 있다(예를 들어, 위에 예시된 바와 같이 E_A-E_A-…). 에피토프-코딩 핵산 서열의 반복은 하나 이상의 추가 뉴클레오티드 서열에 의해 분리될 수 있다. 일반적으로, 에피토프-코딩 핵산 서열의 반복은 본원에 기재된 조성물에 적용가능한 임의의 크기의 뉴클레오티드 서열에 의해 분리될 수 있다. 한 예에서, 에피토프-코딩 핵산 서열의 반복은 분리된 별개의 에피토프-코딩 핵산 서열(예를 들어, 상기 예시된 바와 같이 E_A-E_B-E_C-E_A…)에 의해 분리될 수 있다. 반복이 단일 분리된 별개의 에피토프-코딩 핵산 서열에 의해 분리되고 각각의 에피토프-코딩 핵산 서열(임의로 5' 링커 서열 및/또는 임의로 3' 링커 서열 포함)이 25개 아미노산 길이의 펩티드를 코딩하는 예에서, 반복은 E_A-E_B-E_A...로 표시되는 항원-코딩 핵산과 같이 75개 뉴클레오티드로 분리될 수 있고, E_A는 75개 뉴클레오티드에 의해 분리된다. 예시적인 실시예에서, 25량체 항원 Trp1 (VTNTEMFVTAPDNLGYMYEVQWPGQ) 및 Trp2(TQPQIANCSVYDFFVWLHYYSVRDT)의 VTNTEMFVTAPDNLGYMYEVQWPGQTQPQIANCSVYDFFVWLHYYSVRDTVTNTEMFVTAPDNLGYMYEVQWPGQTQPQIANCSVYDFFVWLHYYSVRDT 서열 코딩 반복을 갖는 항원-코딩 핵산에서, Trp1의 반복부는 25량체 Trp2에 의해 분리되고, 따라서 Trp1 에피토프-코딩 핵산 서열의 반복부는 75개 뉴클레오티드 Trp2 에피토프-코딩 핵산 서열로 분리된다. 반복이 2, 3, 4, 5, 6, 7, 8 또는 9개의 분리된 별개의 에피토프-코딩 핵산 서열에 의해 분리되는 예에서, 각각의 에피토프-코딩 핵산 서열(임의의 5' 링커 서열 및/또는 또는 임의의 3' 링커 서열 포함)은 25개 아미노산 길이의 펩티드를 코딩하며, 반복는 각각 150, 225, 300, 375, 450, 525, 600 또는 675개의 뉴클레오티드로 분리될 수 있다.

한 구현양태에서, 펩티드 및/또는 폴리펩티드가 상이한 MHC 클래스 I 분자 및/또는 상이한 MHC 클래스 II분자와 같은 상이한 MHC 분자와 관련될 수 있도록 상이한 펩티드 및/또는 폴리펩티드 또는 이를 코딩하는 뉴클레오티드 서열이 선택된다. 일부 측면에서, 하나의 백신 조성물은 가장 빈번하게 발생하는 MHC 클래스 I 분자 및/또는 상이한 MHC 클래스 II 분자와 관련될 수 있는 펩티드 및/또는 폴리펩티드에 대한 코딩 서열을 포함한다. 따라서, 백신 조성물은 적어도 2개의 바람직한, 적어도 3개의 바람직한, 또는 적어도 4개의 바람직한 MHC 클래스 I 분자 및/또는 상이한 MHC 클래스 II 분자와 관련될 수 있는 상이한 단편을 포함할 수 있다.

백신 조성물은 특이적 세포독성 T-세포 반응 및/또는 특이적 헬퍼 T-세포 반응을 자극할 수 있다. 백신 조성물은 특이적 세포독성 T-세포 반응 및 특이적 헬퍼 T-세포 반응을 자극할 수 있다.

백신 조성물은 특이적 B-세포 반응(예를 들어, 항체 반응)을 자극할 수 있다.

백신 조성물은 특이적 세포독성 T-세포 반응, 특이적 헬퍼 T-세포 반응, 및/또는 특이적 B-세포 반응을 자극할 수 있다. 백신 조성물은 특이적 세포독성 T-세포 반응, 및 특이적 B-세포 반응을 자극할 수 있다. 백신 조성물은 특이적 헬퍼 T-세포 반응, 및 특이적 B-세포 반응을 자극할 수 있다. 백신 조성물은 특이적 세포독성 T-세포 반응, 특이적 헬퍼 T-세포 반응, 및 특이적 B-세포 반응을 자극할 수 있다.

백신 조성물은 보조제 및/또는 담체를 추가로 포함할 수 있다. 유용한 보조제 및 담체의 예는 하기에 제공된다. 조성물은 예를 들어, T-세포에 펩티드를 제시할 수 있는 수지상 세포(DC)와 같은 단백질 또는 항원-제시 세포와 같은 담체와 관련될 수 있다.

보조제는 백신 조성물로의 이의 혼합이 항원에 대한 면역 반응을 증가시키거나 달리 변형시키는 임의의 물질이다. 담체는 항원이 관련될 수 있는 스캐폴드 구조, 예를 들어 폴리펩티드 또는 다당류일 수 있다. 임의로, 보조제는 공유적으로 또는 비공유적으로 접합된다.

항원에 대한 면역 반응을 증가시키는 보조제의 능력은 일반적으로 면역-매개 반응의 상당하거나 실질적인 증가 또는 질병 증상의 감소에 의해 나타난다. 예를 들어, 체액성 면역의 증가는 전형적으로 항원에 대해 증가된 항체 역가의 상당한 증가에 의해 나타나고, T-세포 활성의 증가는 전형적으로 증가된 세포 증식, 또는 세포 세포독성 또는 사이토카인 분비로 나타난다. 보조제는 또한, 예를 들어 주로 체액성 또는 Th 반응을 주로 세포성 또는 Th 반응으로 변경함으로써 면역 반응을 변경할 수 있다.

적합한 보조제는 1018 ISS, 명반, 알루미늄 염, 앰플리백스(Amplivax), AS15, BCG, CP-870,893, CpG7909, CyaA, dSLIM, GM-CSF, IC30, IC31, 이미퀴모드(Imiquimod), 이뮤팩트(ImuFact)IMP321, IS 패치, ISS, ISCOMATRIX, 쥬브이뮨(JuvImmune), 리포백(LipoVac), MF59, 모노포스포릴 지질 A, 몬타니드(Montanide) IMS 1312, 몬타니드 ISA 206, 몬타니드 ISA 50V, 몬타니드 ISA-51, OK-432, OM-174, OM-197-MP-EC, ONTAK, PepTel 벡터 시스템, PLG 마이크로입자, 레시퀴모드, SRL172, 비로솜(Virosomes) 및 기타 바이러스-유사 입자, YF-17D, VEGF 트랩, R848, 베타-글루칸, Pam3Cys, 사포닌, 마이코박테리아 추출물 및 합성 박테리아 세포벽 모방체에서 유래된 아퀼라(Aquila's) QS21 스티뮬론(Aquila Biotech, Worcester, Mass., USA), 및 리비 데톡스(Ribi's Detox), 퀼(Quil) 또는 슈퍼포스(Superfos)와 같은 기타 독점 보조제를 포함하나 이에 제한되지는 않는다. 불완전 프로인트 또는 GM-CSF와 같은 보조제가 유용하다. 수지상 세포 및 이의 제조에 특이적인 여러 면역학적 보조제(예를 들어, MF59)는 이전에 기술된 바 있다(Dupuis M, et al., Cell Immunol. 1998; 186(1):18-27; Allison A C; Dev Biol Stand. 1998; 92:3-11). 또한 사이토카인을 사용할 수 있다. 여러 사이토카인은 수지상 세포가 림프 조직(예를 들어, TNF-알파)으로 이동하는 데 영향을 미치도록 직접적으로 연결되어 수지상 세포가 T-림프구(예를 들어, GM-CSF, IL-1 및 IL-4) (전체가 본원에 참조로 포함되는 U.S.특허 5,849,589)에 대한 효율적인 항원-제시 세포로 성숙하는 것을 가속화하고 면역보조제(예를 들어, IL-12)로서 작용한다(Gabrilovich D I, et al., J Immunother Emphasis Tumor Immunol. 1996 (6):414-418).

CpG 면역자극성 올리고뉴클레오티드는 또한 백신 환경에서 보조제의 효과를 향상시키는 것으로 보고되었다. RNA 결합 TLR 7, TLR 8 및/또는 TLR 9와 같은 다른 TLR 결합 분자가 또한 사용될 수 있다.

유용한 보조제의 다른 예에는 화학적으로 변형된 CpG(예를 들어, CpR, Idera), 폴리(I:C)(예를 들어, 폴리i:CI2U), 비-CpG 박테리아 DNA 또는 RNA 뿐만 아니라 면역활성 작은 분자 및 사이클로포스파미드, 수니티닙, 베바시주맙, 셀레브렉스, NCX-4016, 실데나필, 타다라필, 바르데나필, 소라피닙, XL-999, CP-547632, 파조파닙, ZD2171, AZD2171, 이필리무맙, 트레멜리무맙 및 SC58175와 같은 항체를 포함하지만 이로 제한되지 않으며, 치료적으로 및/또는 보조제로서 작용할 수 있다. 보조제 및 첨가제의 양 및 농도는 과도한 실험 없이 숙련된 기술자에 의해 용이하게 결정될 수 있다. 추가 보조제는 과립구 대식세포 집락 자극 인자(GM-CSF, 사그라모스팀)와 같은 집락-자극 인자를 포함한다.

백신 조성물은 하나 이상의 상이한 보조제를 포함할 수 있다. 또한, 치료 조성물은 상기 중 임의의 것 또는 이들의 조합을 포함하는 임의의 보조제 물질을 포함할 수 있다. 백신 및 보조제가 함께 또는 임의의 적절한 순서로 별도로 투여될 수 있음이 또한 고려된다.

담체(또는 부형제)는 보조제와 독립적으로 존재할 수 있다. 담체의 기능은, 예를 들어 특정 돌연변이체의 분자량을 증가시키거나, 활성 또는 면역원성을 증가시키거나, 안정성을 부여하거나, 생물학적 활성을 증가시키거나, 혈청 반감기를 증가시키는 것일 수 있다. 또한, 담체는 펩티드를 T 세포에 제시하는 데 도움이 될 수 있다. 담체는 당업자에게 공지된 임의의 적합한 담체, 예를 들어 단백질 또는 항원 제시 세포일 수 있다. 담체 단백질은 키홀 림펫 헤모시아닌, 트랜스페린과 같은 혈청 단백질, 소 혈청 알부민, 인간 혈청 알부민, 티로글로불린 또는 오브알부민, 면역글로불린, 또는 호르몬, 예컨대 인슐린 또는 팔미트산일 수 있지만 이에 제한되지는 않는다. 인간의 면역화를 위해, 담체는 일반적으로 인간에게 허용되고 안전한 생리학적으로 허용되는 담체이다. 그러나 파상풍 톡소이드 및/또는 디프테리아 톡소이드가 적합한 담체이다. 대안적으로, 담체는 덱스트란, 예를 들어 세파로스일 수 있다.

세포독성 T-세포(CTL)는 온전한 외래 항원 자체보다는 MHC 분자에 결합된 펩티드 형태의 항원을 인식한다. MHC 분자 자체는 항원 제시 세포의 세포 표면에 위치한다. 따라서, 펩티드 항원, MHC 분자 및 APC의 삼량체 복합체가 존재하는 경우, CTL의 활성화가 가능하다. 상응하게, 펩티드가 CTL의 활성화를 위해 사용될 뿐만 아니라 추가로 각각의 MHC 분자와 함께 APC가 첨가되는 경우, 면역 반응을 향상시킬 수 있다. 따라서, 일부 구현양태에서 백신 조성물은 적어도 하나의 항원 제시 세포를 추가로 함유한다.

항원은 또한 백시니아, 계두, 자가-복제 알파바이러스, 마라바바이러스, 아데노바이러스(Tatsis et al., Adenoviruses, Molecular Therapy (2004) 10, 616―629) 또는 2세대, 3세대 또는 하이브리드 2세대/3세대 렌티바이러스 및 특정 세포 유형 또는 수용체를 표적으로 하도록 설계된 모든 세대의 재조합 렌티바이러스를 포함하지만 이에 제한되지 않는 렌티바이러스와 같은 바이러스 벡터-기반 백신 플랫폼에 포함될 수 있다(Hu et al., Immunization Delivered by Lentiviral Vectors for Cancer and Infectious Diseases, Immunol Rev. (2011) 239(1): 45-61, Sakuma et al., Lentiviral vectors: basic to translational, Biochem J. (2012) 443(3):603-18, Cooper et al., Rescue of splicing-mediated intron loss maximizes expression in lentiviral vectors containing the human ubiquitin C promoter, Nucl. Acids Res. (2015) 43 (1): 682-690, Zufferey et al., Self-Inactivating Lentivirus Vector for Safe and Efficient In Vivo Gene Delivery, J. Virol. (1998) 72 (12): 9873-9880)). 위에서 언급한 바이러스 벡터-기반 백신 플랫폼의 패키징 능력에 따라, 이 접근법은 하나 이상의 항원 펩티드를 코딩하는 하나 이상의 뉴클레오티드 서열을 전달할 수 있다. 서열은 돌연변이되지 않은 서열에 의해 플랭킹될 수 있거나, 링커에 의해 분리될 수 있거나, 세포내 구획을 표적화하는 하나 이상의 서열이 선행될 수 있다(Gros et al., Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients, Nat Med. (2016) 22 (4):433-8, Stronen et al., Targeting of cancer neoantigens with donor-derived T cell receptor repertoires, Science. (2016) 352 (6291):1337-41, Lu et al., Efficient identification of mutated cancer antigens recognized by T cells associated with durable tumor regressions, Clin Cancer Res. (2014) 20(13):3401-10). 숙주에 도입되면, 감염된 세포는 항원을 발현하고, 이에 의해 펩티드(들)에 대한 숙주 면역(예를 들어, CTL) 반응을 자극한다. 면역화 프로토콜에 유용한 백시니아 벡터 및 방법은, 예를 들어 U.S. 특허 4,722,848에 기재되어 있다. 또 다른 벡터는 BCG(Bacille Calmette Guerin)이다. BCG 벡터는 문헌에 기재되어 있다(Stover et al., Nature 351:456-460 (1991)). 항원의 치료적 투여 또는 면역화에 유용한 매우 다양한 다른 백신 벡터, 예를 들어 살모넬라 타이피 벡터 등은 본원의 설명으로부터 당업자에게 명백할 것이다.

V.A. 항원 카세트

하나 이상의 항원의 선택, "항원 카세트"의 클로닝 및 구성 및 바이러스 벡터로의 삽입에 사용되는 방법은 본원에 제공된 교시가 주어진 당업계의 기술 범위 내에 있다. "항원 카세트" 또는 "카세트"는 선택된 항원 또는 다수의 항원(예를 들어, 항원-코딩 핵산 서열) 및 항원(들)을 전사하고 전사된 생성물을 발현하는 데 필요한 다른 조절 요소의 조합을 의미한다. 선택된 항원 또는 다수의 항원은 별개의 에피토프 서열을 지칭할 수 있으며, 예를 들어 카세트에서 항원-코딩 핵산 서열은 에피토프가 전사되고 발현되도록 에피토프-코딩 핵산 서열(또는 다수의 에피토프-코딩 핵산 서열)을 코딩할 수 있다. 항원 또는 다수의 항원은 전사를 허용하는 방식으로 조절 구성요소에 작동가능하게 연결될 수 있다. 이러한 구성요소는 바이러스 벡터로 형질주입된 세포에서 항원(들)의 발현을 구동할 수 있는 통상적인 조절 요소를 포함한다. 따라서 항원 카세트는 또한 항원(들)에 연결되고 다른 임의의 조절 요소와 함께 재조합 벡터의 선택된 바이러스 서열 내에 위치하는 선택된 프로모터를 함유할 수 있다. 카세트는 하나 이상의 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 및/또는 기생충-유래 펩티드와 같은 하나 이상의 항원을 포함할 수 있다. 카세트는 분리된 프로모터에 각각 독립적으로 작동가능하게 연결되고 및/또는 2A 리보솜 스키핑 서열 요소(예를 들어, E2A, P2A, F2A, 또는 T2A 서열) 또는 내부 리보솜 진입 부위(IRES) 서열 요소와 같은 다른 멀티시스트론 시스템을 사용하여 함께 연결되는 다중 항원-코딩 핵산 서열을 함유하는 카세트와 같은 하나 이상의 항원-코딩 핵산 서열을 가질 수 있다. 링커는 또한 TEV 또는 푸린 절단 부위와 같은 절단 부위를 가질 수 있다. 절단 부위가 있는 링커는 멀티시스트론 시스템과 같은 다른 요소와 조합하여 사용할 수 있다. 비제한적인 예시적인 예에서, 푸린 프로테아제 절단 부위는 푸린 프로테아제 절단 부위가 번역 후 2A 서열의 제거를 용이하게 하도록 구성되도록 2A 리보솜 스키핑 서열 요소와 함께 사용될 수 있다. 하나 이상의 항원-코딩 핵산 서열을 함유하는 카세트에서, 각각의 항원-코딩 핵산 서열은 하나 이상의 에피토프-코딩 핵산 서열(예를 들어, 연접된 T 세포 에피토프를 코딩하는 항원-코딩 핵산 서열)을 함유할 수 있다.

유용한 프로모터는 구성적 프로모터 또는 조절된(유도성) 프로모터일 수 있으며, 이는 발현될 항원(들)의 양을 제어할 수 있게 한다. 예를 들어, 바람직한 프로모터는 거대세포바이러스 즉시 초기 프로모터/인핸서의 프로모터이다(Boshart et al, Cell, 41:521-530 (1985)). 또 다른 바람직한 프로모터는 라우스 육종 바이러스 LTR 프로모터/인핸서를 포함한다. 또 다른 프로모터/인핸서 서열은 닭 세포질 베타-액틴 프로모터이다(T. A. Kost et al, Nucl. Acids Res., 11(23):8287 (1983)). 다른 적합하거나 바람직한 프로모터는 당업자에 의해 선택될 수 있다.

또한 TET-On 시스템 또는 TET-Off 시스템과 같은 TET 프로모터 시스템인 조절가능한 프로모터에 작동가능하게 연결된 적어도 하나의 페이로드 서열을 갖는 카세트를 포함하는 바이러스 벡터가 본원에 개시되어 있다. 이론에 얽매이지 않고 TET 프로모터 시스템을 사용하여 바이러스 생산 동안 백신 카세트에 코딩된 항원과 같은 카세트에 코딩된 페이로드 핵산의 전사를 최소화할 수 있다. TET 프로모터 시스템은 국제 특허 출원 공보 WO2020/243719에 자세히 설명되어 있으며, 모든 목적을 위해 여기에 참조로 포함된다.

TET 프로모터 시스템은 테트라사이클린(TET) 억제 단백질(TETr) 조절 프로모터를 포함할 수 있다. 따라서, 테트라사이클린(TET) 억제 단백질(TETr) 제어 프로모터에 작동가능하게 연결된 적어도 하나의 페이로드 서열을 갖는 카세트를 포함하는 바이러스 벡터가 또한 본원에 개시된다. TETr 제어 프로모터는 19 bp TET 오퍼레이터(TETo) 서열 TCCCTATCAGTGATAGAGA(서열번호: 83)를 포함할 수 있다. TETr 제어 프로모터는 2, 3, 4, 5, 6, 7, 8, 9 또는 10개 이상의 TETo 핵산 서열을 포함할 수 있다. TETr 제어 프로모터는 2개 이상의 TETo 핵산 서열을 가지며, TETo 서열은 함께 연결될 수 있다. TETr 제어 프로모터는 2개 이상의 TETo 핵산 서열을 가지며, TETo 서열은 함께 직접 연결될 수 있다. 2개 이상의 TETo 핵산 서열을 갖는 TETr 제어 프로모터에서, TETo 서열은 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개 이상의 뉴클레오티드을 갖는 링커 서열과 같은 링커 서열과 함께 연결될 수 있다. 일반적으로, TETr 제어 프로모터는 SV40, EF-1, RSV, PGK, HSA, MCK 또는 EBV 프로모터 서열과 같은 원하는 임의의 프로모터 서열을 사용할 수 있다. TETr 제어 프로모터는 CMV 프로모터 서열을 사용할 수 있다. TETr 제어 프로모터는 최소 CMV 프로모터 서열을 사용할 수 있다. TETo 서열은 RNA 중합효소가 결합하는 프로모터 서열 영역의 업스트림(5')일 수 있다. 예시적인 예에서, 7개의 TETo 서열은 프로모터 서열의 업스트림(5')이다. 프로모터 서열 영역의 업스트림에 있는 TETo 서열을 갖는 적어도 하나의 페이로드 핵산 서열에 작동가능하게 연결된 TETr 제어된 프로모터는 5'에서 3'로 다음식에 기술된 정렬된 서열을 가질 수 있다:

(T-L _Y ) _X -P-N

여기서 N은 페이로드 핵산 서열이고, P는 페이로드 핵산 서열에 작동가능하게 연결된 프로모터 서열의 RNA 중합효소 결합 서열이고, T는 서열번호: 66에 나타낸 뉴클레오티드 서열을 포함하는 TETo 핵산 서열이고, L은 링커 서열, 여기서 각 X에 대해 Y = 0 또는 1이고, X = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20이다. 예시적인 예에서, 각각의 X에 대한 X=7 및 Y=1은 7개의 TETo 서열이 프로모터 서열의 업스트림(5')이고 각각의 TETo 서열이 링커에 의해 분리되는 경우를 설명한다.

TETo 서열은 RNA 중합효소가 결합하는 프로모터 서열 영역의 다운스트림(3')일 수 있다. 다른 예시적인 예에서, 2개의 TETo 서열은 프로모터 서열의 다운스트림(3')이다. 프로모터 서열 영역의 다운스트림에 있는 TETo 서열을 갖는 적어도 하나의 페이로드 핵산 서열에 작동가능하게 연결된 TETr 제어된 프로모터는 5'에서 3'로 다음식에 기술된 정렬된 서열을 가질 수 있다:

P-(T-L _Y ) _X -N

여기서 N은 페이로드 핵산 서열이고, P는 페이로드 핵산 서열에 작동가능하게 연결된 프로모터 서열의 RNA 중합효소 결합 서열이고, T는 서열번호: 66에 나타낸 뉴클레오티드 서열을 포함하는 TETo 핵산 서열이고, L은 링커 서열이고, 여기서 각 X에 대해 Y = 0 또는 1이고, X = 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20이다. 예시적인 예에서, 각각의 X에 대한 X=2 및 Y=1은 2개의 TETo 서열이 프로모터 서열의 다운스트림(3')이고 각각의 TETo 서열이 링커에 의해 분리되는 경우를 설명한다.

TETr 제어된 프로모터를 갖는 벡터의 바이러스 생산은 TETr 서열(tTS)을 발현하도록 조작된 임의의 바이러스 생산 세포주, 예컨대 tTS를 발현하도록 조작된 293 세포주 또는 이의 유도체(예를 들어, 293F 세포주)를 사용할 수 있다. tTS-발현 세포에서 TETr 제어 프로모터를 갖는 벡터의 바이러스 생산은 바이러스 생산을 향상시킬 수 있다. tTS-발현 세포에서 TETr 제어 프로모터를 갖는 벡터의 바이러스 생산은 감염 단위(IU)당 바이러스 입자(VP)로 정의되는 바이러스 감염성을 향상시킬 수 있다. tTS-발현 세포에서 TETr 제어된 프로모터를 갖는 벡터의 바이러스 생산은 바이러스 생산 및/또는 바이러스 감염성을 비-tTS-발현 세포에서의 생산량에 비해 적어도 1.5, 적어도 2, 적어도 2.5, 적어도 3, 적어도 3.5, 적어도 4, 적어도 4.5, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10배 만큼 향상시킬 수 있다. tTS-발현 세포에서 TETr 제어된 프로모터를 갖는 벡터의 바이러스 생산은 바이러스 생산 및/또는 바이러스 감염성을 비-tTS-발현 세포에서의 생산량에 비해 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 또는 적어도 100배 향상시킬 수 있다. tTS-발현 세포에서 TETr 제어된 프로모터를 갖는 벡터의 바이러스 생산은 바이러스 생산 및/또는 바이러스 감염성을 TETr 제어된 프로모터를 갖지 않는 벡터의 생산에 비해 적어도 1.5, 적어도 2, 적어도 2.5, 적어도 3, 적어도 3.5, 적어도 4, 적어도 4.5, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10배 만큼 향상시킬 수 있다. tTS-발현 세포에서 TETr 제어된 프로모터를 갖는 벡터의 바이러스 생산은 TETr 제어된 프로모터를 갖지 않는 벡터의 생산에 비해 바이러스 생산 및/또는 바이러스 감염성을 적어도 15, 적어도 20, 적어도 25, 적어도 30, 적어도 35, 적어도 40, 적어도 45, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90, 또는 적어도 100배 만큼 향상시킬 수 있다.

항원 카세트는 또한 전사체(폴리(A), 폴리-A 또는 pA)의 효율적인 폴리아데닐화를 위한 신호를 제공하는 서열 및 기능적 스플라이스 공여체 및 수용체 부위를 갖는 인트론을 포함하는 바이러스 벡터 서열에 이종성인 핵산 서열을 포함할 수 있다. 본 발명의 예시적인 벡터에 사용되는 일반적인 폴리-A 서열은 파포바바이러스 SV-40에서 유래된 것이다. 폴리-A 서열은 일반적으로 항원-기반 서열 다음에 및 바이러스 벡터 서열 전에 카세트에 삽입될 수 있다. 일반적인 인트론 서열도 SV-40에서 유래될 수 있으며 SV-40 T 인트론 서열로 지칭된다. 항원 카세트는 또한 프로모터/인핸서 서열 및 항원(들) 사이에 위치한 이러한 인트론을 함유할 수 있다. 이들 및 기타 공통 벡터 요소의 선택은 통상적이고(Sambrook 등, "Molecular Cloning. A Laboratory Manual.", 2d edit., Cold Spring Harbor Laboratory, New York (1989) 및 그 안에 인용된 참고 문헌 참조) 많은 이러한 서열은 젠뱅크(Genbank) 뿐만 아니라 상업적 및 산업적 소스로부터 입수가능하다.

항원 카세트는 하나 이상의 항원을 가질 수 있다. 예를 들어, 주어진 카세트는 1-10, 1-20, 1-30, 10-20, 15-25, 15-20, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 그 이상의 항원을 포함할 수 있다. 항원은 서로 직접 연결될 수 있다. 항원은 또한 링커로 서로 연결될 수 있다. 항원은 N에서 C 또는 C에서 N을 포함하여 서로에 대해 임의의 방향일 수 있다.

다른 곳에서 기술된 바와 같이, 선택할 수 있는 다른 것 중에서, 항원 카세트는 VEE 백본의 결실된 구조 단백질 또는 ChAd-기반 벡터의 E1 유전자 영역 결실 또는 E3 유전자 영역 결실 부위에서와 같은 바이러스 벡터에서 임의의 선택된 결실 부위에 위치할 수 있다.

항원 카세트는 각 요소의 정렬된 서열을 설명하기 위해 5'에서 3'로 다음식을 사용하여 기술될 수 있다:

(P_a-(L5_b-N_c-L3_d)_X)_Z-(P2_h-(G5_e-U_f)_Y)_W-G3_g

여기서 P 및 P2는 프로모터 뉴클레오티드 서열을 포함하고, N은 MHC 클래스 I 에피토프-코딩 핵산 서열을 포함하고, L5는 5' 링커 서열을 포함하고, L3은 3' 링커 서열을 포함하고, G5는 아미노산 링커를 코딩하는 핵산 서열을 포함하고, G3은 아미노산 링커를 코딩하는 적어도 하나의 핵산 서열 중 하나를 포함하고, U는 MHC 클래스 II 항원-코딩 핵산 서열을 포함하고, 여기서 각각의 X에 대해 상응하는 N_c는 에피토프 코딩 핵산 서열이고, 여기서 각각의 Y에 대해 상응하는 U_f는 MHC 클래스 II 에피토프-코딩 핵산 서열(예를 들어, 보편적인 MHC 클래스 II 에피토프-코딩 핵산 서열)이다. 보편적인 서열은 파상풍 톡소이드 및 PADRE 중 적어도 하나를 포함한다. 보편적인 서열은 파상풍 독소 펩티드를 포함할 수 있다. 보편적인 서열은 PADRE 펩티드를 포함할 수 있다. 보편적인 서열은 파상풍 톡소이드 및 PADRE 펩티드를 포함할 수 있다. 구성 및 정렬된 서열은 존재하는 요소의 수를 선택하여 추가로 정의할 수 있으며, 예를 들어 a = 0 또는 1, b = 0 또는 1, c = 1, d = 0 또는 1, e = 0 또는 1, f = 1, g = 0 또는 1, h = 0 또는 1, X = 1 내지 400, Y = 0, 1, 2, 3, 4 또는 5, Z = 1 내지 400, W = 0, 1, 2, 3, 4 또는 5이다.

한 예에서, 존재하는 요소는 a = 0, b = 1, d = 1, e = 1, g = 1, h = 0, X = 10, Y = 2, Z = 1, 및 W = 1을 포함하고, 추가 프로모터가 존재하지 않는 경우(예를 들어, RNA 알파바이러스 백본과 같은 벡터 백본에 의해 제공된 프로모터 뉴클레오티드 서열만이 존재), 10개의 MHC 클래스 I 에피토프가 존재하고, 각각에 N에 대해 5' 링커가 존재하고, 각각의 N에 대해 3' 링커가 존재하고, 2개의 MHC 클래스 II 에피토프가 존재하고, 2개의 MHC 클래스 II 에피토프를 연결하는 링커가 존재하고, 2개의 MHC 클래스 II 에피토프의 5'단부를 최종 MHC 클래스 I 에피토프의 3' 링커에 연결하는 링커가 존재하고 및 2개의 MHC 클래스 II 에피토프의 3'단부를 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 연결하는 링커가 존재한다. 항원 카세트의 3'단부를 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 연결하는 예는 3' 19-nt CSE와 같은 벡터 백본에 의해 제공되는 3' UTR 요소에 직접 연결하는 것을 포함한다. 항원 카세트의 5'단부를 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 연결하는 예는 서브게놈 프로모터 서열(예를 들어, 26S 서브게놈 프로모터 서열), 알파바이러스 5' UTR, 51-nt CSE 또는 24-nt CSE와 같은 벡터 백본의 프로모터 또는 5' UTR 요소에 직접 연결하는 것을 포함한다.

다른 예는 다음을 포함한다: 여기서 a = 1은 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 의해 제공되는 프로모터 뉴클레오티드 서열 이외의 프로모터가 존재하는 것을 설명하고; 여기서 a = 1이고 Z는 1보다 큰 경우, 여기서 벡터 백본에 의해 제공되는 프로모터 뉴클레오티드 서열 이외의 다중 프로모터가 각각 존재하여 1개 이상의 별개의 MHC 클래스 I 에피토프 코딩 핵산 서열의 발현을 구동하고; 여기서 h = 1은 분리된 프로모터가 MHC 클래스 II 에피토프-코딩 핵산 서열의 발현을 구동하기 위해 존재하는 것을 설명하고; 및 여기서 g = 0은, 존재하는 경우 MHC 클래스 II 에피토프-코딩 핵산 서열이 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 직접 연결됨을 설명한다.

다른 예는 존재하는 각각의 MHC 클래스 I 에피토프는 5' 링커, 3' 링커, 둘 다 갖거나 또는 둘 다를 가질 수 없는 경우를 포함한다. 하나 이상의 MHC 클래스 I 에피토프가 동일한 항원 카세트에 존재하는 예에서, 일부 MHC 클래스 I 에피토프는 5' 링커 및 3' 링커를 모두 가질 수 있는 반면, 다른 MHC 클래스 I 에피토프는 5' 링커, 3' 링커 중 하나, 또는 둘 다 가질 수 없다. 하나 이상의 MHC 클래스 I 에피토프가 동일한 항원 카세트에 존재하는 다른 예에서, 일부 MHC 클래스 I 에피토프는 5' 링커 또는 3' 링커를 가질 수 있는 반면, 다른 MHC 클래스 I 에피토프는 5' 링커, 3' 링커를 갖거나, 또는 둘 다를 가질 수 없다.

하나 이상의 MHC 클래스 II 에피토프가 동일한 항원 카세트에 존재하는 예에서, 일부 MHC 클래스 II 에피토프는 5' 링커 및 3' 링커를 모두 가질 수 있는 반면, 다른 MHC 클래스 II 에피토프는 5' 링커, 3' 링커를 갖거나 또는 둘 다가질 수 없다. 하나 이상의 MHC 클래스 II 에피토프가 동일한 항원 카세트에 존재하는 다른 예에서, 일부 MHC 클래스 II 에피토프는 5' 링커 또는 3' 링커를 가질 수 있는 반면, 다른 MHC 클래스 II 에피토프는 5' 링커, 3' 링커를 갖거나, 또는 둘 다 가질 수 없다.

다른 예는 존재하는 각각의 항원이 5' 링커, 3' 링커, 둘 다 없거나 또는 둘 모두를 가질 수 있는 경우를 포함한다. 하나 이상의 항원이 동일한 항원 카세트에 존재하는 예에서, 일부 항원은 5' 링커 및 3' 링커를 둘 다 가질 수 있는 반면, 다른 항원은 5' 링커, 3' 링커 또는 둘 다 갖지 않을 수 있다. 하나 이상의 항원이 동일한 항원 카세트에 존재하는 다른 예에서, 일부 항원은 5' 링커 또는 3' 링커를 가질 수 있는 반면, 다른 항원은 5' 링커, 3' 링커 또는 둘 다 갖지 않을 수 있다.

프로모터 뉴클레오티드 서열 P 및/또는 P2는 RNA 알파바이러스 백본과 같은 벡터 백본에 의해 제공되는 프로모터 뉴클레오티드 서열과 동일할 수 있다. 예를 들어, 벡터 백본, Pn 및 P2에 의해 제공되는 프로모터 서열은 각각 서브게놈 프로모터 서열(예를 들어, 26S 서브게놈 프로모터 서열) 또는 CMV 프로모터를 포함할 수 있다. 프로모터 뉴클레오티드 서열 P 및/또는 P2는 벡터 백본(예를 들어, RNA 알파바이러스 백본)에 의해 제공되는 프로모터 뉴클레오티드 서열과 상이할 수 있을 뿐만 아니라 서로 상이할 수 있다.

5' 링커 L5는 천연 서열 또는 비-천연 서열일 수 있다. 비-천연 서열은 AAY, RR 및 DPP를 포함하지만 이에 제한되지는 않는다. 3' 링커 L3은 또한 천연 서열 또는 비-천연 서열일 수 있다. 추가로, L5 및 L3은 둘 다 천연 서열일 수 있고, 둘 다 비-천연 서열이거나, 하나는 천연이고 다른 하나는 비-천연일 수 있다. 각각의 X에 대해 아미노산 링커는 길이가 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 이상의 아미노산일 수 있다. 각각의 X에 대해, 아미노산 링커는 또한 길이가 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 또는 적어도 30개 아미노산일 수 있다.

각각의 Y에 대해 아미노산 링커 G5는 길이가 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 이상의 아미노산일 수 있다. 각각의 Y에 대해, 아미노산 링커는 또한 길이가 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 또는 적어도 30개 아미노산일 수 있다.

아미노산 링커 G3은 길이가 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 또는 이상의 아미노산일 수 있다. G3은 또한 길이가 적어도 3개, 적어도 4개, 적어도 5개, 적어도 6개, 적어도 7개, 적어도 8개, 적어도 9개, 적어도 10개, 적어도 11개, 적어도 12개, 적어도 13개, 적어도 14개, 적어도 15개, 적어도 16개, 적어도 17개, 적어도 18개, 적어도 19개, 적어도 20개, 적어도 21개, 적어도 22개, 적어도 23개, 적어도 24개, 적어도 25개, 적어도 26개, 적어도 27개, 적어도 28개, 적어도 29개, 또는 적어도 30개 아미노산일 수 있다.

각각의 X에 대해, 각각의 N은 MHC 클래스 I 에피토프, MHC 클래스 II 에피토프, B 세포 반응을 자극할 수 있는 에피토프/항원, 또는 이들의 조합을 코딩할 수 있다. 각각의 X에 대해, N은 MHC 클래스 I 에피토프, MHC 클래스 II 에피토프, 및 B 세포 반응을 자극할 수 있는 에피토프/항원의 조합을 코딩할 수 있다. 각각의 X에 대해, N은 MHC 클래스 I 에피토프 및 MHC 클래스 II 에피토프의 조합을 코딩할 수 있다. 각각의 X에 대해 N은 MHC 클래스 I 에피토프 및 B 세포 반응을 자극할 수 있는 에피토프/항원의 조합을 코딩할 수 있다. 각각의 X에 대해 N은 MHC 클래스 II 에피토프 및 B 세포 반응을 자극할 수 있는 에피토프/항원의 조합을 코딩할 수 있다. 각각의 X에 대해 N은 MHC 클래스 II 에피토프를 코딩할 수 있다. 각각의 X에 대해 N은 B 세포 반응을 자극할 수 있는 에피토프/항원의 조합을 코딩할 수 있다. 각각의 X에 대해, 각각의 N은 7-15개 아미노산 길이의 MHC 클래스 I 에피토프를 코딩할 수 있다. 각각의 X에 대해, 각각의 N은 또한 아미노산 길이가 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29 또는 30개인 MHC 클래스 I 에피토프를 코딩할 수 있다. 각각의 X에 대해 각각의 N은 아미노산 길이가 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19, 적어도 20, 적어도 21, 적어도 22, 적어도 23, 적어도 24, 적어도 25, 적어도 26, 적어도 27, 적어도 28, 적어도 29, 또는 적어도 30개인 MHC 클래스 I 에피토프를 코딩할 수도 있다.

하나 이상의 항원을 코딩하는 카세트는 700개 이하의 뉴클레오티드일 수 있다. 하나 이상의 항원을 코딩하는 카세트는 700개 이하의 뉴클레오티드일 수 있고 2개의 별개의 에피토프-코딩 핵산 서열을 코딩한다(예를 들어, 면역원성 폴리펩티드를 코딩하는 2개의 별개의 감염성 질병 또는 종양 유래 핵산 서열을 코딩한다). 하나 이상의 항원을 코딩하는 카세트는 700개 이하의 뉴클레오티드일 수 있고 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 700개 이하의 뉴클레오티드일 수 있고 3개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 700개 이하의 뉴클레오티드일 수 있고 적어도 3개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 700개 이하의 뉴클레오티드일 수 있고 1-10, 1-5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 항원을 포함할 수 있다.

하나 이상의 항원을 코딩하는 카세트는 길이가 375-700개 뉴클레오티드일 수 있다. 하나 이상의 항원을 코딩하는 카세트는 길이가 375-700개 뉴클레오티드일 수 있고 2개의 별개의 에피토프-코딩 핵산 서열을 코딩한다(예를 들어, 면역원성 폴리펩티드를 코딩하는 2개의 별개의 감염성 질병 또는 종양 유래 핵산 서열을 코딩한다). 하나 이상의 항원을 인코딩하는 카세트는 길이가 375-700개 뉴클레오티드일 수 있고 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 375-700개 뉴클레오티드일 수 있고 3개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 375-700개 뉴클레오티드일 수 있고 적어도 3개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 375-700개의 뉴클레오티드일 수 있고 1-10, 1-5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 항원을 포함한다.

하나 이상의 항원을 코딩하는 카세트는 길이가 600, 500, 400, 300, 200 또는 100개 뉴클레오티드 이하일 수 있다. 하나 이상의 항원을 코딩하는 카세트는 길이가 600, 500, 400, 300, 200 또는 100개 이하의 뉴클레오티드일 수 있고 2개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 600, 500, 400, 300, 200, 또는 100개 이하의 뉴클레오티드일 수 있고 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 600, 500, 400, 300, 200, 또는 100개 이하의 뉴클레오티드일 수 있고 3개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 600, 500, 400, 300, 200, 또는 100개 이하의 뉴클레오티드일 수 있고 적어도 3개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 600, 500, 400, 300, 200 또는 100개 이하의 뉴클레오티드일 수 있고 1-10, 1-5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 항원을 포함한다.

하나 이상의 항원을 코딩하는 카세트는 길이가 375-600, 375-500, 또는 375-400개 뉴클레오티드일 수 있다. 하나 이상의 항원을 코딩하는 카세트는 길이가 375-600, 375-500, 또는 375-400개 뉴클레오티드일 수 있고 2개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 375-600, 375-500, 또는 375-400 뉴클레오티드일 수 있고 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 375-600, 375-500, 또는 375-400 뉴클레오티드일 수 있고 3개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 375-600, 375-500, 또는 375-400 뉴클레오티드일 수 있고 적어도 3개의 별개의 에피토프-코딩 핵산 서열을 코딩한다. 하나 이상의 항원을 코딩하는 카세트는 길이가 375-600, 375-500, 또는 375-400개 뉴클레오티드일 수 있고 1-10, 1-5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 항원을 포함한다.

일부 예에서, 추가 항원 및/또는 에피토프를 코딩하는 카세트의 항원 또는 에피토프는 코딩된 다른 항원에 비해 면역우성 에피토프일 수 있다. 일반적으로 면역우성은 단 하나 또는 소수의 특이적 면역원성 펩티드에 대한 면역 반응의 왜곡이다. 면역우성은 면역 모니터링 프로토콜의 일부로 평가할 수 있다. 예를 들어, 코딩된 항원에 대한 T 세포 및/또는 B 세포 반응을 평가함으로써 면역우성을 평가할 수 있다.

면역우성은 하나 이상의 다른 항원에 대한 면역 반응에 대한 면역우성 항원의 존재의 영향으로 평가될 수 있다. 예를 들어, 면역우성 항원 및 이의 각각의 면역 반응(예를 들어, 면역우성 MHC 클래스 I 에피토프)은 면역우성 항원이 없을 때의 면역 반응에 비해 다른 항원의 면역 반응을 감소시킬 수 있다. 이러한 감소는 면역우성 항원의 존재 하에서의 면역 반응이 치료적으로 효과적인 반응으로 간주되지 않도록 하는 것일 수 있다. 예를 들어, MHC 클래스 I 에피토프는 일반적으로 다른 항원에 대한 T 세포 반응이 면역우성 MHC 클래스 I 에피토프의 부재에서 유발된 반응과 비교하여 더 이상 치료적으로 효과적인 반응으로 간주되지 않는 경우 면역우성인 것으로 간주된다. 면역 반응은 면역우성 항원의 부재에서 유발된 반응과 비교하여 검출 한계 이하 또는 검출 한계 근처로 감소될 수 있다. 예를 들어, MHC 클래스 I 에피토프는 일반적으로 다른 항원에 대한 T 세포 반응이 면역우성 MHC 클래스 I 에피토프의 부재에서 유발된 반응과 비교하여 검출 한계 이하인 경우 면역우성인 것으로 간주된다. 일반적으로, 면역우성의 평가는 면역 반응을 자극할 수 있는 두 항원 사이, 예를 들어, 각각의 에피토프를 제시하는 것으로 알려지거나 예측되는 동족 MHC 대립유전자를 소유하는 대상체에게 투여된 백신 조성물의 두 T 세포 에피토프 사이에서 이루어진다. 면역우성은 의심되는 면역우성 항원의 존재 및 부재 하에 다른 항원에 대한 상대적인 면역 반응을 평가함으로써 평가될 수 있다.

면역우성은 2개 이상의 항원 사이의 면역 반응의 상대적인 차이로 평가될 수 있다. 면역우성은 동일한 카세트에 코딩된 다른 항원에 비해 특정 항원의 5배, 10배, 20배, 30배, 40배 또는 50배 면역 반응을 의미할 수 있다. 면역우성은 동일한 카세트에 코딩된 다른 항원에 비해 특정 항원의 100배, 200배, 300배, 400배 또는 500배 면역 반응을 의미할 수 있다. 면역우성은 동일한 카세트에 코딩된 다른 항원에 비해 특정 항원의 1000배, 2000배, 3000배, 4000배 또는 5000배 면역 반응을 의미할 수 있다. 면역우성은 동일한 카세트에 코딩된 다른 항원에 비해 특정 항원의 10,000배 면역 반응을 의미할 수 있다.

일부 경우에, 면역우성 에피토프를 함유하는 백신 조성물을 피하는 것이 바람직할 수 있다. 예를 들어, 면역우성 에피토프를 코딩하는 백신 카세트의 설계를 피하는 것이 바람직할 수 있다. 이론에 구속되지 않고, 추가 에피토프와 함께 면역우성 에피토프를 투여 및/또는 코딩하는 것은 잠재적으로 추가 에피토프에 대한 백신 효능을 궁극적으로 감소시키는 것을 포함하여 추가 에피토프에 대한 면역 반응을 감소시킬 수 있다. 예시적인 비-제한적 예로서, TP53-연관 네오에피토프를 포함하는 백신 조성물은 면역 반응, 예를 들어 백신 조성물 내의 다른 항원 또는 에피토프(예를 들어, 백신 조성물의 하나 이상의 KRAS-연관 네오에피토프, 예를 들어 서열번호: 75-82에 제시된 KRAS-연관 네오에피토프 중 임의의 것)에 대한 면역 반응에 부정적인 영향(예를 들어, 면역 반응이 치료학적으로 효과적인 반응이 아닌 경우 및/또는 검출 한계 이하로 면역 반응을 감소시키고)을 미치는 TP53-연관 네오에피토프 쪽으로 치우친 T 세포 반응을 가질 수 있다. 따라서, 백신 조성물은 면역우성 에피토프를 코딩하지 않도록 백신 카세트(예를 들어, (신생)항원-코딩 카세트)를 설계하는 것과 같이, 면역우성 에피토프를 함유하지 않도록 설계될 수 있다. 예를 들어, 카세트는 다른 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 에피토프에 대한 면역 반응을 감소시키는 에피토프를 코딩하지 않는다. 다른 예에서, 카세트는 다른 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 다른 에피토프에 대한 면역 반응을 검출 한계 미만으로 감소시키는 에피토프를 코딩하지 않는다. 또 다른 예에서, 카세트는 다른 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 에피토프에 대한 면역 반응을 감소시키는 에피토프를 코딩하지 않으며, 여기서 면역 반응은 치료학적으로 효과적인 반응이 아니다. 또 다른 예에서, 카세트는 각 항원이 대상체에서 면역 반응을 자극할 수 있는 대상체에게 투여된 백신 조성물에서 동일한 카세트에서 코딩된 다른 에피토프에 비해 5배, 10배, 20배, 30배, 40배 또는 50배 이상의 면역 반응을 자극하는 에피토프를 코딩하지 않는다. 또 다른 예에서, 카세트는 각 항원이 대상체에서 면역 반응을 자극할 수 있는 대상체에게 투여된 백신 조성물에서 동일한 카세트에서 코딩된 다른 에피토프에 비해 100배, 200배, 300배, 400배 또는 500배 이상의 면역 반응을 자극하는 에피토프를 코딩하지 않는다. 또 다른 예에서, 카세트는 각 항원이 대상체에서 면역 반응을 자극할 수 있는 대상체에게 투여된 백신 조성물에서 동일한 카세트에서 코딩된 다른 에피토프에 비해 1000배, 2000배, 3000배, 4000배 또는 5000배 이상의 면역 반응을 자극하는 에피토프를 코딩하지 않는다. 또 다른 예에서, 카세트는 각 항원이 대상체에서 면역 반응을 자극할 수 있는 대상체에게 투여된 백신 조성물에서 동일한 카세트에서 코딩된 다른 에피토프에 비해 10,000배 이상의 면역 반응을 초래하는 에피토프를 코딩하지 않는다.

V.B. 면역 조절자

본원에 기재된 C68 벡터 또는 본원에 기재된 알파바이러스 벡터와 같은 본원에 기재된 벡터는 적어도 하나의 항원을 코딩하는 핵산을 포함할 수 있고, 동일하거나 분리된 벡터는 적어도 하나의 면역 조절자를 코딩하는 핵산을 포함할 수 있다. 면역 조절자는 면역 관문 분자에 결합하고 그 활성을 차단하는 결합 분자(예를 들어, scFv와 같은 항체)를 포함할 수 있다. 면역 조절자는 IL-2, IL-7, IL-12(IL-12 p35, p40, p70 및/또는 p70-융합 구성물 포함), IL-15 또는 IL-21과 같은 사이토카인을 포함할 수 있다. 면역 조절자는 변형된 사이토카인(예를 들어, pegIL-2)을 포함할 수 있다. 벡터는 항원 카세트 및 면역 조절자를 코딩하는 하나 이상의 핵산 분자를 포함할 수 있다.

차단 또는 억제를 위해 표적화될 수 있는 예시적인 면역 관문 분자에는 CTLA-4, 4-1BB(CD137), 4-1BBL(CD137L), PDL1, PDL2, PD1, B7-H3, B7-H4, BTLA, HVEM, TIM3, GAL9, LAG3, TIM3, B7H3, B7H4, VISTA, KIR, 2B4(CD2 분자 계열에 속하며 모든 NK, γδ 및 기억 CD8+(αβ) T 세포 상에서 발현), CD160(BY55라고도 한다) 및 CGEN-15049가 포함되지만 이에 제한되지 않는다. 면역 관문 억제제는 CTLA-4, PDL1, PDL2, PD1, B7-H3, B7-H4, BTLA, HVEM, TIM3, GAL9, LAG3, TIM3, B7H3, B7H4, VISTA, KIR, 2B4, CD160, 및 CGEN-15049 중 하나 이상에 결합하여 이들의 활성을 차단하거나 억제하는 항체 또는 이의 항원 결합 단편, 또는 기타 결합 단백질을 포함한다. 예시적인 면역 관문 억제제에는 트레멜리무맙(CTLA-4 차단 항체), 항-OX40, PD-L1 모노클로날 항체(항-B7-H1; MEDI4736), 이필리무맙, MK-3475(PD-1 차단제), 니볼루맙(항-PD1 항체), CT-011(항-PD1 항체), BY55 모노클로날 항체, AMP224(항-PDL1 항체), BMS-936559(항-PDL1 항체), MPLDL3280A(항-PDL1 항체), MSB0010718C(항-PDL1 항체) 및 여보이/이필리무맙(항-CTLA-4 관문 억제제)를 포함한다. 항체-코딩 서열은 해당 분야의 통상적인 기술을 사용하여 C68과 같은 벡터 내로 조작될 수 있다. 예시적인 방법은 모든 목적을 위해 참조로 본원에 포함되는 문헌에 2A 펩티드를 사용하여 치료 수준에서 안정적인 항체 발현에서 설명되어 있다(Fang et al., Nat Biotechnol.　2005 May;23(5):584-90. Epub 2005 Apr 17).

V.C. 백신 설계 및 제조에 대한 추가 고려 사항

V.C.1. 모든 종양 서브클론을 커버하는 펩티드 세트의 결정

모든 또는 대부분의 서브클론에 의해 제시되는 것을 의미하는 줄기 펩티드는 백신에 포함시키기 위해 우선 순위를 지정할 수 있다. 임의로 높은 확률로 제시될 것으로 예측되고 면역원성인 줄기 펩티드가 없는 경우, 또는 높은 확률로 제시될 것으로 예측되고 면역원성인 줄기 펩티드의 수가 충분히 작아서 백신에 추가 비-줄기 펩티드가 포함될 수 있는 경우, 추가로 펩티드는 종양 서브클론의 수와 정체성을 추정하고 백신에 의해 커버되는 종양 서브클론의 수를 최대화하기 위해 펩티드를 선택함으로써 우선순위를 지정할 수 있다.

V.C.2. 항원 우선순위지정

위의 모든 항원 필터가 적용된 후, 백신 기술이 지원할 수 있는 것보다 더 많은 후보 항원이 백신 포함에 여전히 이용가능할 수 있다. 또한, 항원 분석의 다양한 측면에 대한 불확실성이 남아 있을 수 있으며 후보 백신 항원의 서로 다른 특성 간에 트레이드오프가 존재할 수 있다. 따라서, 선택 과정의 각 단계에서 미리 결정된 필터 대신에, 적어도 다음 축이 있는 공간에 후보 항원을 배치하고 통합 접근 방식을 사용하여 선택을 최적화하는 통합 다차원 모델을 고려할 수 있다.

1. 자가-면역 또는 내성의 위험(생식계열의 위험)(일반적으로 자가-면역의 위험이 낮은 것이 바람직하다)

2. 시퀀싱 인공물의 확률(일반적으로 인공물의 낮은 확률이 바람직하다)

3. 면역원성의 확률(일반적으로 면역원성의 확률이 높을수록 바람직하다)

4. 제시 확률(일반적으로 제시 확률이 높을수록 바람직하다)

5. 유전자 발현(일반적으로 더 높은 발현이 바람직하다)

6. HLA 유전자의 적용범위(항원 세트의 제시와 관련된 더 많은 수의 HLA 분자는 HLA 분자의 하향조절 또는 돌연변이를 통해 종양, 감염성 질병, 및/또는 감염된 세포가 면역 공격을 피할 확률을 낮출 수 있다)

7. HLA 클래스의 적용범위(HLA-I 및 HLA-II를 모두 포함하면 치료 반응 확률이 증가하고 종양 또는 감염성 질병 도피 확률이 감소할 수 있다)

추가로, 임의로, 항원은 환자의 종양 또는 감염된 세포의 전부 또는 일부에서 손실되거나 비활성화된 HLA 대립유전자에 의해 제시될 것으로 예측되는 경우 백신접종에서 우선순위를 낮출 수 있다(예를 들어, 제외될 수 있다). HLA 대립유전자 손실은 체세포 돌연변이, 이형접합의 손실 또는 유전자좌의 동형접합 결실에 의해 발생할 수 있다. HLA 대립유전자 체세포 돌연변이의 검출 방법은 당업계에 잘 알려져 있다(Shukla et al., 2015). 체세포 LOH 및 동형접합 결실(HLA 유전자좌 포함)의 검출 방법도 마찬가지로 잘 설명되어 있다(Carter et al., 2012; McGranahan et al., 2017; Van Loo et al., 2010). 또한 질량 분석 데이터가 예측된 항원이 예측된 HLA 대립 유전자에 의해 제시되지 않는다는 것을 나타내는 경우 항원의 우선 순위를 낮출 수 있다.

V.D. 알파바이러스

V.D.1. 알파바이러스 생물학

알파바이러스는 토가비리과(Togaviridae)과의 구성원이며 포지티브-센스 단일 가닥 RNA 바이러스이다. 구성원은 일반적으로 신드비스, 로스 리버, 마야로, 치쿤구니야 및 셈리키 포레스트 바이러스와 같은 구세계 또는 동부 말 뇌염, 아우라,포트 모건 또는 베네수엘라 말 뇌염 바이러스 및 이의 파생 균주 TC-83(Strauss Microbrial Review 1994)와 같은 신세계로 분류된다. 천연 알파바이러스 게놈의 길이는 일반적으로 약 12 kb이며, 처음 2/3는 바이러스 게놈의 자가-복제를 위한 RNA 복제 복합체를 형성하는 비-구조 단백질(nsP)을 코딩하는 유전자를 함유하고 마지막 3분의 1은 비리온 생산을 위한 구조 단백질을 코딩하는 서브게놈 발현 카세트를 함유한다(Frolov RNA 2001).

알파바이러스의 모델 수명주기는 몇 가지 별개의 단계를 포함한다(Strauss Microbrial Review 1994, Jose Future Microbiol 2009). 숙주 세포에 바이러스가 부착된 후, 비리온은 세포내이입 구획 내의 막과 융합하여 결국 게놈 RNA를 세포질로 방출한다. 플러스-가닥 방향이고 5' 메틸구아닐레이트 캡 및 3' 폴리A 테일을 포함하는 게놈 RNA는 복제 복합체를 형성하는 비-구조 단백질 nsP1-4를 생성하도록 번역된다. 감염 초기에 플러스-가닥은 복합체에 의해 마이너스-가닥 주형으로 복제된다. 현재 모델에서, 복제 복합체는 감염이 진행됨에 따라 추가 처리되며, 생성된 처리된 복합체는 전장의 포지티브-가닥 게놈 RNA와 구조 유전자를 함유하는 26S 서브게놈 포지티브-가닥 RNA로 마이너스-가닥의 전사로 전환된다. 알파바이러스의 여러 보존 서열 요소(CSE)는 다음을 포함한 다양한 RNA 복제 단계에서 잠재적으로 역할을 하는 것으로 확인되었다; 마이너스-가닥 주형에서 플러스-가닥 RNA 복제에서 5' UTR의 보체, 게놈 주형에서 마이너스-가닥 합성 복제에서 51-nt CSE, 마이너스 -가닥의 서브게놈 RNA 전사에서 nsP 및 26S RNA 사이의 접합 영역에 있는 24-nt CSE, 및 플러스-가닥 주형에서 마이너스-가닥 합성에 있는 3'19-nt CSE.

다양한 RNA 종의 복제 후, 바이러스 입자는 일반적으로 바이러스의 자연적 수명 주기에서 조립된다. 26S RNA는 번역되고 생성된 단백질은 캡시드 단백질, 당단백질 E1 및 E2, 및 두 개의 작은 폴리펩티드 E3 및 6K를 포함하는 구조적 단백질을 생산하기 위해 추가 처리된다(Strauss 1994). 바이러스 RNA의 캡시드화(Encapsidation)는 일반적으로 게놈 RNA에만 특이적인 캡시드 단백질이 패키징된 후 발생하며, 비리온 조립 및 막 표면의 출아가 뒤따른다.

V.D.2. 전달 벡터로서의 알파바이러스

알파바이러스(알파바이러스 서열, 특징 및 기타 요소 포함)를 사용하여 알파바이러스-기반 전달 벡터(알파바이러스 벡터, 알파바이러스 바이러스 벡터, 알파바이러스 백신 벡터, 자가-복제 RNA(srRNA) 벡터, 또는 자가-증폭 RNA(SAM) 벡터라고도 한다)를 생성할 수 있다. 알파바이러스는 이전에 발현 벡터 시스템으로 사용하도록 조작되었다(Pushko 1997, Reme 2004). 알파바이러스는 특히 이종 항원 발현이 요구될 수 있는 백신 환경에서 몇 가지 이점을 제공한다. 숙주 세포질에서 자가-복제하는 능력으로 인해, 알파바이러스 벡터는 일반적으로 높은 수준의 이종 항원 생산을 초래하는 세포 내에서 높은 카피 수의 발현 카세트를 생산할 수 있다. 또한, 벡터는 일반적으로 일시적이어서 생물학적 안전성이 향상되고 벡터에 대한 면역학적 내성의 유도가 감소한다. 일반 대중은 또한 인간 아데노바이러스와 같은 다른 표준 바이러스 벡터와 비교하여 알파바이러스 벡터에 대한 기존 면역성이 부족하다. 알파바이러스 기반 벡터는 또한 일반적으로 감염된 세포에 대한 세포독성 반응을 초래한다. 세포독성은 발현된 이종 항원에 대한 면역 반응을 적절하게 자극하는 백신 환경에서 어느 정도 중요할 수 있다. 그러나 원하는 세포독성의 정도는 균형을 이루는 작용이 될 수 있으므로 VEE의 TC-83 균주를 포함하여 여러 약독화된 알파바이러스가 개발되었다. 따라서, 본원에 기술된 항원 발현 벡터의 예는 높은 수준의 항원 발현을 허용하고, 항원에 대한 강력한 면역 반응을 자극하고, 벡터 자체에 대한 면역 반응을 자극하지 않고, 안전한 방식으로 사용될 수 있는 알파바이러스 백본을 이용할 수 있다. 더욱이, 항원 발현 카세트는 VEE 또는 이의 약독화된 유도체 TC-83으로부터 유래된 서열을 포함하지만 이에 제한되지 않는 벡터가 사용하는 알파바이러스 서열의 최적화를 통해 면역 반응의 상이한 수준을 자극하도록 설계될 수 있다.

알파바이러스 서열을 사용하여 여러 발현 벡터 설계 전략이 조작되었다(Pushko 1997). 한 전략에서, 알파바이러스 벡터 설계는 구조 단백질 유전자의 다운스트림에 26S 프로모터 서열 요소의 두 번째 카피를 삽입한 다음 이종 유전자를 삽입하는 것을 포함한다(Frolov 1993). 따라서, 천연 비-구조 및 구조 단백질이외에, 이종 단백질을 발현하는 추가적인 서브게놈 RNA가 생성된다. 이 시스템에는 감염성 비리온 생산을 위한 모든 요소가 존재하므로 비-감염 세포에서 발현 벡터의 반복적인 감염이 발생할 수 있다.

다른 발현 벡터 설계는 헬퍼 바이러스 시스템을 사용한다(Pushko 1997). 이 전략에서 구조 단백질은 이종 유전자로 대체된다. 따라서, 여전히 온전한 비-구조적 유전자에 의해 매개되는 바이러스 RNA의 자가-복제 후, 26S 서브게놈 RNA는 이종 단백질의 발현을 제공한다. 전통적으로, 구조 단백질을 발현하는 추가 벡터는 감염성 바이러스를 생산하기 위해 세포주의 동시-형질주입과 같이 트랜스(in trans)로 공급된다. 시스템은 USPN 8,093,021에 자세히 설명되어 있으며, 이는 모든 목적을 위해 전체가 참조로 본원에 포함된다. 헬퍼 벡터 시스템은 감염성 입자 형성 가능성을 제한하는 이점을 제공하여 생물학적 안전성을 향상시킨다. 또한, 헬퍼 벡터 시스템은 전체 벡터 길이를 줄여 잠재적으로 복제 및 발현 효율을 향상시킨다. 따라서, 본원에 기술된 항원 발현 벡터의 예는 구조 단백질이 항원 카세트로 대체된 알파바이러스 백본을 이용할 수 있으며, 생성된 벡터는 생물학적 안전성 문제를 감소시키는 동시에 전체 발현 벡터 크기의 감소로 인한 효율적인 발현을 촉진한다.

V.D.3. 시험관내 알파바이러스 생산

알파바이러스 전달 벡터는 일반적으로 포지티브-센스 RNA 폴리뉴클레오티드이다. RNA 생산을 위한 당업계에 잘 알려진 편리한 기술은 시험관내 전사 IVT이다. 이 기술에서, 원하는 벡터의 DNA 주형은 클로닝, 제한 분해, 결찰, 유전자 합성(예를 들어, 화학적 및/또는 효소적 합성) 및 중합효소 연쇄 반응(PCR)과 같은 표준 분자 생물학 기술을 포함하는 당업자에게 잘 알려진 기술에 의해 먼저 생성된다. DNA 주형은 RNA로 전사되기를 원하는 서열의 5'단부에 RNA 중합효소 프로모터를 함유한다. 프로모터는 T3, T7, 또는 SP6과 같은 박테리오파지 중합효소 프로모터를 포함하지만 이에 제한되지 않는다. 그런 다음 DNA 주형을 적절한 RNA 중합효소 효소, 완충제 및 뉴클레오티드(NTP)와 함께 인큐베이션한다. 생성된 RNA 폴리뉴클레오티드는 7-메틸구아노신 또는 관련 구조와 같은 5' 캡 구조의 추가, 및 임의로 폴리아데닐레이트(폴리A) 테일을 포함하도록 3'단부를 변형하는 것을 포함하지만 이에 제한되지 않는 추가로 변형될 수 있다. 그 다음, RNA는 페놀-클로로포름 추출 또는 컬럼 정제(예를 들어, 크로마토그래피-기반 정제)와 같은 분야에 잘 알려진 기술을 사용하여 정제될 수 있다.

V.D.4. 지질 나노입자를 통한 전달

백신 벡터 설계에서 고려해야 할 중요한 측면은 벡터 자체에 대한 면역성이다(Riley 2017). 이것은 특정 인간 아데노바이러스 시스템과 같이 벡터 자체에 대한 기존 면역의 형태이거나 백신 투여 후 벡터에 대한 면역이 발달하는 형태일 수 있다. 후자는 분리된 프라이밍 및 부스팅 용량과 같이 동일한 백신의 다중 투여가 수행되거나 동일한 백신 벡터 시스템을 사용하여 다른 항원 카세트를 전달하는 경우 중요한 고려 사항이다.

알파바이러스 벡터의 경우, 표준 전달 방법은 캡시드, E1 및 E2 단백질을 트랜스(in trans)로 제공하여 감염성 바이러스 입자를 생성하는 이전에 논의된 헬퍼 바이러스 시스템이다. 그러나 E1 및 E2 단백질이 종종 항체를 중화시키는 주요 표적이라는 점에 유의하는 것이 중요하다(Strauss 1994). 따라서, 감염성 입자가 중화 항체에 의해 표적화되는 경우, 표적 세포에 관심 항원을 전달하기 위해 알파바이러스 벡터를 사용하는 효능이 감소될 수 있다.

바이러스 입자 매개 유전자 전달에 대한 대안은 발현 벡터를 전달하기 위해 나노물질을 사용하는 것이다(Riley 2017). 나노물질 비히클은 중요하게는 비-면역원성 물질로 만들어질 수 있으며 일반적으로 전달 벡터 자체에 대한 면역을 유발하는 것을 피할 수 있다. 이러한 물질은 지질, 무기 나노물질 및 기타 중합체 물질을 포함할 수 있지만 이에 제한되지는 않는다. 지질은 양이온성, 음이온성 또는 중성일 수 있다. 물질은 합성 또는 천연 유래일 수 있으며 어떤 경우에는 생분해성일 수 있다. 지질은 지방, 콜레스테롤, 인지질, 폴리에틸렌글리콜(PEG) 접합체(PEG화 지질), 왁스, 오일, 글리세라이드 및 지방 가용성 비타민을 포함하나 이에 제한되지 않는 지질 접합체를 포함할 수 있다.

지질 나노입자(LNP)는 막 및 소포 유사 구조의 형성을 가능하게 하는 지질의 양친매성 특성으로 인해 매력적인 전달 시스템이다(Riley 2017). 일반적으로 이러한 소포는 표적 세포의 막으로 흡수되고 핵산을 세포질 내로 방출함으로써 발현 벡터를 전달한다. 또한, 특정 세포 유형의 표적화를 용이하게 하기 위해 LNP를 추가로 변형하거나 기능화할 수 있다. LNP 설계에서 또 다른 고려 사항은 표적화 효율성과 세포 독성 간의 균형이다. 지질 조성물은 일반적으로 양이온성, 중성, 음이온성 및 양친매성 지질의 정의된 혼합물을 포함한다. 일부 예에서, 특정 지질은 LNP 응집을 방지하고, 지질 산화를 방지하고, 또는 추가 모이어티의 부착을 용이하게 하는 기능적 화학기를 제공하기 위해 포함된다. 지질 조성은 전체 LNP 크기와 안정성에 영향을 줄 수 있다. 한 예에서, 지질 조성물은 디리놀레일메틸-4-디메틸아미노부티레이트(MC3) 또는 MC3-유사 분자를 포함한다. MC3 및 MC3-유사 지질 조성물은 PEG 또는 PEG-접합 지질, 스테롤, 또는 중성 지질과 같은 하나 이상의 다른 지질을 포함하도록 제형화될 수 있다.

혈청에 직접 노출된 발현 벡터와 같은 핵산 벡터는 혈청 뉴클레아제에 의한 핵산의 분해 또는 유리 핵산에 의한 면역계의 표적외 자극을 포함하여 몇 가지 바람직하지 않은 결과를 가질 수 있다. 따라서 알파바이러스 벡터의 캡슐화는 잠재적인 표적외 영향을 피하면서 분해를 방지하는 데 사용할 수 있다. 특정 예에서, 알파바이러스 벡터는 LNP의 수성 내부와 같은 전달 비히클 내에서 완전히 캡슐화된다. LNP 내의 알파바이러스 벡터의 캡슐화는 미세유체 액적 생성 장치에서 수행되는 미세유체 혼합 및 액적 생성과 같은 당업자에게 잘 알려진 기술에 의해 수행될 수 있다. 이러한 장치에는 표준 T-접합 장치 또는 흐름-초점(flow-focusing) 장치가 포함되지만 이에 제한되지는 않는다. 한 예에서, MC3 또는 MC3-유사 함유 조성물과 같은 원하는 지질 제형은 알파바이러스 전달 벡터 및 다른 원하는 제제와 병행하여 액적 생성 장치에 제공되어 전달 벡터 및 원하는 제제가 MC3 또는 MC3-유사 기반 LNP의 내부에 완전히 캡슐화되도록 한다. 한 예에서, 액적 생성 장치는 생성된 LNP의 크기 범위 및 크기 분포를 제어할 수 있다. 예를 들어, LNP는 직경이 1 내지 1000 나노미터, 예를 들어 1, 10, 50, 100, 500, 또는 1000 나노미터 범위의 크기를 가질 수 있다. 액적 생성 후, 발현 벡터를 캡슐화하는 전달 비히클은 투여를 위해 제조하기 위해 추가로 처리되거나 변형될 수 있다.

V.E. 침팬지 아데노바이러스(ChAd)

V.E.1. 침팬지 아데노바이러스로 바이러스 전달

(예를 들어, 항원 카세트를 통해) 하나 이상의 항원을 전달하기 위한 백신 조성물은 침팬지 기원의 아데노바이러스 뉴클레오티드 서열, 다양한 신규 벡터 및 침팬지 아데노바이러스 유전자를 발현하는 세포주를 제공함으로써 생성될 수 있다. 침팬지 C68 아데노바이러스(본원에서 ChAdV68이라고도 지칭)의 뉴클레오티드 서열은 항원 전달용 백신 조성물에 사용될 수 있다(서열번호: 1 참조). C68 아데노바이러스 유래 벡터의 사용은 USPN 6,083,716에 더 자세히 설명되어 있으며, 이는 모든 목적을 위해 그 전체가 참고로 본원에 포함된다. ChAdV68-기반 벡터 및 전달 시스템은 US 출원 공개번호 US20200197500A1 및 국제 특허 출원 공개 WO2020243719A1에 기술되어 있으며, 이들 각각은 모든 목적을 위해 본원에 참조로 포함된다.

추가 측면에서, C68과 같은 침팬지 아데노바이러스의 DNA 서열 및 이의 발현을 지시하는 조절 서열에 작동가능하게 연결된 항원 카세트를 포함하는 재조합 아데노바이러스가 본원에 제공된다. 재조합 바이러스는 포유동물, 바람직하게는 인간 세포를 감염시킬 수 있고 세포에서 항원 카세트 생성물을 발현할 수 있다. 이 벡터에서 천연 침팬지 E1 유전자 및/또는 E3 유전자 및/또는 E4 유전자가 결실될 수 있다. 항원 카세트는 이러한 유전자 결실 부위에 삽입될 수 있다. 항원 카세트는 프라이밍된 면역 반응이 요구되는 항원을 포함할 수 있다.

또 다른 측면에서, C68과 같은 침팬지 아데노바이러스로 감염된 포유동물 세포가 본원에 제공된다.

또 다른 측면에서, 침팬지 아데노바이러스 유전자(예를 들어, C68로부터의) 또는 이의 기능적 단편을 발현하는 신규한 포유동물 세포주가 제공된다.

또 다른 측면에서, 본원에서는 항원 카세트를 발현하도록 조작된 C68과 같은 침팬지 아데노바이러스의 유효량을 세포 내로 도입하는 단계를 포함하는 포유동물 세포 내로 항원 카세트를 전달하는 방법을 제공한다.

또 다른 측면은 포유동물 숙주에서 암을 치료하기 위해 면역 반응을 자극하는 방법을 제공한다. 상기 방법은 면역 반응이 표적화되는 종양으로부터 하나 이상의 항원을 코딩하는 항원 카세트를 포함하는, C68과 같은 재조합 침팬지 아데노바이러스의 유효량을 숙주에 투여하는 단계를 포함할 수 있다.

또 다른 측면은 감염성 질병과 같은 대상체의 질병을 치료 또는 예방하기 위해 포유동물 숙주에서 면역 반응을 자극하는 방법을 제공한다. 상기 방법은 면역 반응이 표적화되는 감염성 질병으로부터의 하나 이상의 항원을 코딩하는 항원 카세트를 포함하는, C68과 같은 재조합 침팬지 아데노바이러스의 유효량을 숙주에 투여하는 단계를 포함할 수 있다.

서열번호: 1의 서열로부터 수득된 침팬지 아데노바이러스 유전자를 발현하는 비-유인종 포유동물 세포가 또한 개시된다. 유전자는 서열번호: 1의 아데노바이러스 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5로 이루어진 군으로부터 선택될 수 있다.

서열번호: 1의 서열로부터 수득된 유전자를 포함하는 침팬지 아데노바이러스 DNA 서열을 포함하는 핵산 분자가 또한 개시된다. 유전자는 서열번호: 1의 상기 침팬지 아데노바이러스 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자로 이루어진 군으로부터 선택될 수 있다. 일부 측면에서 핵산 분자는 서열번호: 1을 포함한다. 일부 측면에서 핵산 분자는 서열번호: 1의 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자로 이루어진 군으로부터 선택된 적어도 하나의 유전자가 결여된 서열번호: 1을 포함한다.

또한, 서열번호: 1로부터 수득된 침팬지 아데노바이러스 DNA 서열 및 이종 숙주 세포에서 카세트의 발현을 지시하는 하나 이상의 조절 서열에 작동가능하게 연결된 항원 카세트를 포함하는 벡터가 개시되며, 여기서 임의로 침팬지 아데노바이러스 DNA 서열은 복제 및 비리온 캡시드화에 필요한 적어도 시스(cis-)-요소, 항원 카세트 및 조절 서열을 플랭킹하는 시스-요소를 포함한다. 일부 측면에서, 침팬지 아데노바이러스 DNA 서열은 서열번호: 1의 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자 서열로 이루어진 군으로부터 선택된 유전자를 포함한다. 일부측면에서, 벡터는 E1A 및/또는 E1B 유전자가 결여될 수 있다.

또한 결실되거나 부분적으로 결실된 E4orf2 영역 및 결실되거나 부분적으로 결실된 E4orf3 영역, 및 임의로 결실되거나 부분적으로 결실된 E4orf4 영역을 포함하는 부분적으로 결실된 E4 유전자를 포함하는 아데노바이러스 벡터가 본원에 개시된다. 부분적으로 결실된 E4는 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 34,916 내지 35,642의 E4 결실을 포함할 수 있고, 여기서 벡터는 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 2 내지 36,518을 포함한다. 부분적으로 결실된 E4는 서열번호: 1에 제시된 서열의 뉴클레오티드 34,916 내지 34,942의 적어도 부분적 결실, 서열번호: 1에 제시된 서열의 뉴클레오티드 34,952 내지 35,305의 적어도 부분적 결실, 및 서열번호: 1에 제시된 서열의 뉴클레오티드 35,302 내지 35,642의 적어도 부분적 결실의 E4 결실을 포함하고, 여기서 벡터는 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 2 내지 36,518을 포함한다. 부분적으로 결실된 E4는 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 34,980 내지 36,516의 E4 결실을 포함할 수 있고, 여기서 벡터는 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 2 내지 36,518을 포함한다. 부분적으로 결실된 E4는 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 34,979 내지 35,642의 E4 결실을 포함할 수 있고, 여기서 벡터는 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 2 내지 36,518을 포함한다. 부분적으로 결실된 E4는 E4Orf2의 적어도 부분적인 결실, 완전히 결실된 E4Orf3, 및 E4Orf4의 적어도 부분적인 결실의 E4 결실을 포함할 수 있다. 부분적으로 결실된 E4는 E4Orf2의 적어도 부분적인 결실, E4Orf3의 적어도 부분적인 결실, 및 E4Orf4의 적어도 부분적인 결실의 E4 결실을 포함할 수 있다. 부분적으로 결실된 E4는 E4Orf1의 적어도 부분적인 결실, 완전히 결실된 E4Orf2, 및 E4Orf3의 적어도 부분적인 결실의 E4 결실을 포함할 수 있다. 부분적으로 결실된 E4는 E4Orf2의 적어도 부분적인 결실 및 E4Orf3의 적어도 부분적인 결실의 E4 결실을 포함할 수 있다. 부분적으로 결실된 E4는 E4Orf1의 시작 부위와 E4Orf5의 시작 부위 사이의 E4 결실을 포함할 수 있다. 부분적으로 결실된 E4는 E4Orf1의 시작 부위에 인접한 E4 결실일 수 있다. 부분적으로 결실된 E4는 E4Orf2의 시작 부위에 인접한 E4 결실일 수 있다. 부분적으로 결실된 E4는 E4Orf3의 시작 부위에 인접한 E4 결실일 수 있다. 부분적으로 결실된 E4는 E4Orf4의 시작 부위에 인접한 E4 결실일 수 있다. E4 결실은 적어도 50, 적어도 100, 적어도 200, 적어도 300, 적어도 400, 적어도 500, 적어도 600, 적어도 700, 적어도 800, 적어도 900, 적어도 1000, 적어도 1100, 적어도 1200, 적어도 1300, 적어도 1400, 적어도 1500, 적어도 1600, 적어도 1700, 적어도 1800, 적어도 1900, 또는 적어도 2000개의 뉴클레오티드일 수 있다. E4 결실은 적어도 700개의 뉴클레오티드일 수 있다. E4 결실은 적어도 1500개의 뉴클레오티드일 수 있다. E4 결실은 50 이하, 100 이하, 200 이하, 300 이하, 400 이하, 500 이하, 600 이하, 700 이하, 800 이하, 900 이하, 1000 이하, 1100 이하, 1200 이하, 1300 이하, 1400 이하, 1500 이하, 1600 이하, 1700 이하, 1800 이하, 1900 이하, 또는 2000 이하의 뉴클레오티드일 수 있다. E4 결실은 750개 이하의 뉴클레오티드일 수 있다. E4 결실은 1550개 이상의 뉴클레오티드 이하일 수 있다.

부분적으로 결실된 E4 유전자는 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 34,916 내지 35,642가 결여된 서열번호: 1에 제시된 E4 유전자 서열일 수 있다. 부분적으로 결실된 E4 유전자는 서열번호: 1에 제시된 E4 유전자 서열이 결여되고 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 34,916 내지 34,942, 뉴클레오티드 34,952 내지 35,305 및 서열번호: 1에 제시된 서열의 뉴클레오티드 35,302 내지 35,642가 결여된 서열번호: 1에 제시된 E4 유전자 서열일 수 있다. 부분적으로 결실된 E4 유전자는 서열번호: 1에 제시된 E4 유전자 서열일 수 있고 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 34,980 내지 36,516이 결여되어 있다. 부분적으로 결실된 E4 유전자는 서열번호: 1에 제시된 뉴클레오티드 E4 유전자 서열일 수 있고 서열번호: 1에 제시된 뉴클레오티드 서열의 적어도 뉴클레오티드 34,979 내지 35,642가 결여되어 있다. 부분적으로 결실된 E4 유전자를 갖는 아데노바이러스 벡터는 카세트를 가질 수 있고, 여기서 카세트는 적어도 하나의 페이로드 핵산 서열을 포함하고, 카세트는 적어도 하나의 페이로드 핵산 서열에 작동가능하게 연결된 적어도 하나의 프로모터 서열을 포함한다. 부분적으로 결실된 E4 유전자를 갖는 아데노바이러스 벡터는 서열번호: 1에 제시된 ChAdV68 서열의 하나 이상의 유전자 또는 조절 서열을 가질 수 있으며, 임의로 여기서 하나 이상의 유전자 또는 조절 서열은 서열번호: 1에 제시된 서열의 적어도 하나의 침팬지 아데노바이러스 역 말단 반복(ITR), E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자를 포함한다. 부분적으로 결실된 E4 유전자를 갖는 아데노바이러스 벡터는 서열번호: 1에 제시된 서열의 뉴클레오티드 2 내지 34,916을 가질 수 있고, 여기서 부분적으로 결실된 E4 유전자는 뉴클레오티드 2 내지 34,916의 3'이고, 임의로 뉴클레오티드 2 내지 34,916에는 E1 결실에 상응하는 서열번호: 1에 제시된 서열의 뉴클레오티드 577 내지 3403이 추가로 결여되어 있고 및/또는 E3 결실에 상응하는 서열번호: 1에 제시된 서열의 뉴클레오티드 27,125 내지 31,825가 결여된다. 부분적으로 결실된 E4 유전자를 갖는 아데노바이러스 벡터는 서열번호: 1에 제시된 서열의 뉴클레오티드 35,643 내지 36,518을 가질 수 있고, 여기서 부분적으로 결실된 E4 유전자는 뉴클레오티드 35,643 내지 36,518의 5'이다. 부분적으로 결실된 E4 유전자를 갖는 아데노바이러스 벡터는 서열번호: 1에 제시된 서열의 뉴클레오티드 2 내지 34,916을 가질 수 있고, 여기서 부분적으로 결실된 E4 유전자는 뉴클레오티드 2 내지 34,916의 3'이고, 뉴클레오티드 2 내지 34,916에는 추가로 E1 결실에 상응하는 서열번호: 1에 제시된 서열의 뉴클레오티드 577 내지 3403 및 E3 결실에 상응하는 서열번호: 1에 제시된 서열의 뉴클레오티드 27,125 내지 31,825가 결여되어 있다. 부분적으로 결실된 E4 유전자를 갖는 아데노바이러스 벡터는 서열번호: 1에 제시된 서열의 뉴클레오티드 2 내지 34,916을 가질 수 있고, 여기서 부분적으로 결실된 E4 유전자는 뉴클레오티드 2 내지 34,916의 3'이고, 뉴클레오티드 2 내지 34,916에는 추가로 E1 결실에 상응하는 서열번호: 1에 제시된 서열의 뉴클레오티드 577 내지 3403가 결여되고 및 E3 결실에 상응하는 서열번호: 1에 제시된 서열의 뉴클레오티드 27,125 내지 31,825가 결여되고, 서열번호: 1에 제시된 서열의 뉴클레오티드 35,643 내지 36,518을 갖고, 부분적으로 결실된 E4 유전자는 뉴클레오티드 35,643 내지 36,518의 5'이다.

부분적으로 결실된 E4 유전자는 서열번호: 1에 제시된 서열의 뉴클레오티드 34,916 내지 35,642, 서열번호: 1에 제시된 서열의 뉴클레오티드 2 내지 34,916이 결여된 서열번호: 1에 나타낸 E4 유전자 서열일 수 있고, 여기서 부분적으로 결실된 E4 유전자는 뉴클레오티드 2 내지 34,916의 3'이고, 뉴클레오티드 2 내지 34,916은 E1 결실에 상응하는 서열번호: 1에 제시된 서열의 뉴클레오티드 577 내지 3403이 추가로 결여되고 E3 결실에 상응하는 서열번호: 1에 제시된 서열의 뉴클레오티드가 27,125 내지 31,825가 결여되고 서열번호: 1에 제시된 서열의 뉴클레오티드 35,643 내지 36,518을 가지며, 부분적으로 결실된 E4 유전자는 뉴클레오티드 35,643 내지 36,518의 5'이다.

또한, 항원 카세트를 발현하도록 조작된 C68 벡터와 같은 본원에 개시된 벡터로 형질주입된 숙주 세포가 본원에 개시되어 있다. 또한, 본원에 개시된 벡터를 세포 내로 도입함으로써 내부에 도입된 선택된 유전자를 발현하는 인간 세포가 본원에 개시된다.

또한, 항원 카세트를 발현하도록 조작된 C68 벡터와 같은 본원에 개시된 벡터의 유효량을 포유동물 세포에 도입하는 것을 포함하여, 항원 카세트를 포유동물 세포에 전달하는 방법이 본원에 개시되어 있다.

또한, 본원에 개시된 벡터를 포유동물 세포에 도입하고, 적합한 조건 하에 세포를 배양하고, 항원을 생산하는 것을 포함하여, 항원을 생산하는 방법이 본원에 개시되어 있다.

V.E.2. E1-발현 상보성 세포주

본원에 기재된 임의의 유전자에서 결실된 재조합 침팬지 아데노바이러스(Ad)를 생성하기 위해, 바이러스의 복제 및 감염성에 필수적인 경우 결실된 유전자 영역의 기능은 헬퍼 바이러스 또는 세포주, 즉, 상보성 또는 팩키징 세포주에 의해 재조합 바이러스에 공급될 수 있다. 예를 들어, 복제-결함 침팬지 아데노바이러스 벡터를 생성하기 위해, 인간 또는 침팬지 아데노바이러스의 E1 유전자 생성물을 발현하는 세포주가 사용될 수 있고; 이러한 세포주는 HEK293 또는 이의 변이체를 포함할 수 있다. 침팬지 E1 유전자 생성물을 발현하는 세포주의 생성을 위한 프로토콜(USPN 6,083,716의 실시예 3 및 4)은 임의의 선택된 침팬지 아데노바이러스 유전자를 발현하는 세포주를 생성하기 위해 따를 수 있다.

AAV 증대 검정은 침팬지 아데노바이러스 E1-발현 세포주를 확인하는 데 사용될 수 있다. 이 검정은, 예를 들어 다른 종의 다른 특성화되지 않은 아데노바이러스의 E1 유전자를 사용하여 만든 세포주에서 E1 기능을 확인하는 데 유용하다. 그 검정은 USPN 6,083,716의 실시예 4B에 설명되어 있다.

선택된 침팬지 아데노바이러스 유전자, 예를 들어 E1은 선택된 모 세포주에서의 발현을 위한 프로모터의 전사 제어 하에 있을 수 있다. 이러한 목적을 위해 유도성 또는 구성적 프로모터를 사용할 수 있다. 유도성 프로모터 중에는 아연에 의해 유도되는 양 메탈로티오닌 프로모터 또는 글루코코르티코이드, 특히 덱사메타손에 의해 유도되는 마우스 유방 종양 바이러스(MMTV) 프로모터가 포함된다. 본원에 참조로 포함된 국제 특허 출원 WO95/13392에서 확인된 것과 같은 다른 유도성 프로모터도 패키징 세포주의 생산에 사용될 수 있다. 침팬지 아데노바이러스 유전자의 발현을 제어하는 구성적 프로모터가 또한 사용될 수 있다.

임의의 원하는 C68 유전자를 발현하는 신규 세포주의 생성을 위해 모 세포를 선택할 수 있다. 제한 없이, 이러한 모 세포주는 HeLa[ATCC 수탁 번호 CCL 2], A549[ATCC 수탁 번호 CCL 185], KB[CCL 17], 디트로이트[예를 들어, 디트로이트 510, CCL 72] 및 WI-38[CCL 75] 세포일 수 있다. 다른 적절한 모 세포주는 다른 출처에서 얻을 수 있다. 모 세포주는 CHO, HEK293 또는 이의 변이체, 911, HeLa, A549, LP-293, PER.C6 또는 AE1-2a를 포함할 수 있다.

E1-발현 세포주는 재조합 침팬지 아데노바이러스 E1 결실 벡터의 생성에 유용할 수 있다. 하나 이상의 다른 침팬지 아데노바이러스 유전자 생성물을 발현하는 본질적으로 동일한 절차를 사용하여 이루어진 세포주는 그러한 생성물을 코딩하는 유전자에서 결실된 재조합 침팬지 아데노바이러스 벡터의 생성에 유용하다. 또한, 다른 인간 Ad E1 유전자 생성물을 발현하는 세포주는 침팬지 재조합 Ad를 생성하는 데에도 유용하다.

V.E.3. 벡터로서의 재조합 바이러스 입자

본원에 개시된 조성물은 하나 이상의 항원을 세포에 전달하는 바이러스 벡터를 포함할 수 있다. 이러한 벡터는 C68과 같은 침팬지 아데노바이러스 DNA 서열 및 카세트의 발현을 지시하는 조절 서열에 작동가능하게 연결된 항원 카세트를 포함한다. C68 벡터는 감염된 포유동물 세포에서 카세트를 발현할 수 있다. C68 벡터는 하나 이상의 바이러스 유전자에서 기능적으로 결실될 수 있다. 항원 카세트는 프로모터와 같은 하나 이상의 조절 서열의 제어 하에 하나 이상의 항원을 포함한다. 임의의 헬퍼 바이러스 및/또는 팩키징 세포주는 결실된 아데노바이러스 유전자의 필요한 생성물을 침팬지 바이러스 벡터에 공급할 수 있다.

"기능적으로 결실된"이라는 용어는 충분한 양의 유전자 영역이, 예를 들어 돌연변이 또는 변형에 의해 제거되거나 달리 변경되어 유전자 영역이 유전자 발현의 하나 이상의 기능적 생성물을 더 이상 생성할 수 없음을 의미한다. 기능적 결실을 초래할 수 있는 돌연변이 또는 변형에는 미성숙 정지 코돈의 도입 및 정규 및 비정규 개시 코돈의 제거와 같은 넌센스 돌연변이, mRNA 스플라이싱 또는 기타 전사 처리를 변경하는 돌연변이, 또는 이들의 조합이 포함되지만 이에 제한되지는 않는다. 원하는 경우 전체 유전자 영역이 제거될 수 있다.

서열 결실, 삽입 및 기타 돌연변이를 포함하는 본원에 개시된 벡터를 형성하는 핵산 서열의 변형은 표준 분자 생물학적 기술을 사용하여 생성될 수 있고 본 발명의 범위 내에 있다.

V.E.4. 바이러스 플라스미드 벡터의 구성

본 발명에 유용한 침팬지 아데노바이러스 C68 벡터는 재조합 결함 아데노바이러스, 즉 E1a 또는 E1b 유전자에서 기능적으로 결실된 침팬지 아데노바이러스 서열을 포함하고, 임의로 다른 돌연변이, 예를 들어 온도-민감성 돌연변이 또는 다른 유전자에서 결실을 보유한다. 이들 침팬지 서열은 또한 다른 아데노바이러스 및/또는 아데노-관련 바이러스 서열로부터 하이브리드 벡터를 형성하는데 유용할 것으로 예상된다. 인간 아데노바이러스로부터 제조된 상동성 아데노바이러스 벡터는 공개된 문헌에 기재되어 있다(위에서 인용되고 본원에 참고로 포함된 Kozarsky I and II, 및 U.S. Pat. No. 5,240,846).

항원 카세트를 인간(또는 다른 포유동물) 세포로 전달하기 위한 유용한 침팬지 아데노바이러스 C68 벡터의 구성에서, 다양한 아데노바이러스 핵산 서열이 벡터에 사용될 수 있다. 최소 침팬지 C68 아데노바이러스 서열을 포함하는 벡터는 감염성 재조합 바이러스 입자를 생성하기 위해 헬퍼 바이러스와 함께 사용될 수 있다. 헬퍼 바이러스는 최소 침팬지 아데노바이러스 벡터의 바이러스 감염성 및 증식에 필요한 필수 유전자 생성물을 제공한다. 다른 기능의 바이러스 벡터에서 침팬지 아데노바이러스 유전자의 하나 이상의 선택된 결실만 이루어진 경우, 결실된 유전자 생성물은 트랜스로 결실된 유전자 기능을 제공하는 선택된 패키징 세포주에서 바이러스를 증식시켜 바이러스 벡터 생산 공정에 공급될 수 있다.

V.E.5. 재조합 최소 아데노바이러스

최소 침팬지 Ad C68 바이러스는 복제 및 비리온 캡시드화에 필요한 아데노바이러스 시스-요소만을 함유하는 바이러스 입자이다. 즉, 벡터는 아데노바이러스의 시스-작용 5' 및 3' 역 말단 반복부(ITR) 서열(복제 기점으로 기능) 및 천연 5' 패키징/인핸서 도메인(E1 프로모터에 대한 Ad 게놈 및 인핸서 요소 선형 패키징에 필요한 서열을 함유)을 함유한다. 예를 들어, 본원에 참조로 포함되는 국제 특허 출원 WO96/13597에서 "최소" 인간 Ad 벡터의 제조에 대한 기술이 설명되어 있다.

V.E.6. 기타 결함 아데노바이러스

재조합 복제-결함 아데노바이러스는 또한 최소 침팬지 아데노바이러스 서열보다 많은 것을 함유할 수 있다. 이들 다른 Ad 벡터는 바이러스의 유전자 영역의 다양한 부분의 결실, 및 헬퍼 바이러스 및/또는 패키징 세포주의 임의의 사용에 의해 형성된 감염성 바이러스 입자를 특징으로 할 수 있다.

한 예로서, 적절한 벡터는 정상적인 생물학적 기능을 제거하기 위해 C68 아데노바이러스 즉시 초기 유전자 E1a 및 지연된 초기 유전자 E1b의 전부 또는 충분한 부분을 결실시킴으로써 형성될 수 있다. 복제-결함 E1-결실된 바이러스는 상응하는 유전자 생성물을 트랜스로 제공하는 기능성 아데노바이러스 E1a 및 E1b 유전자를 함유하는 침팬지 아데노바이러스-형질전환된 상보성 세포주에서 증식할 때 감염성 바이러스를 복제하고 생산할 수 있다. 알려진 아데노바이러스 서열에 대한 상동성에 기초하여, 당해 분야의 인간 재조합 E1-결실된 아데노바이러스에 대해 사실인 것처럼, 생성된 재조합 침팬지 아데노바이러스는 많은 세포 유형을 감염시킬 수 있고 항원(들)을 발현할 수 있지만, 침팬지 E1 영역 DNA를 가지고 있지 않은 대부분의 세포에서는 세포가 매우 높은 감염 다중도로 감염되지 않는 한 복제할 수 없다.

또 다른 예로서, C68 아데노바이러스 지연 초기 유전자 E3의 전부 또는 일부는 재조합 바이러스의 일부를 형성하는 침팬지 아데노바이러스 서열로부터 제거될 수 있다.

E4 유전자가 결실된 침팬지 아데노바이러스 C68 벡터도 구성될 수 있다. 또 다른 벡터는 지연된 초기 유전자 E2a에 결실을 함유할 수 있다.

침팬지 C68 아데노바이러스 게놈의 후기 유전자 L1 내지 L5 중 어느 것에서도 결실이 이루어질 수 있다. 유사하게, 중간 유전자 IX 및 IVa2의 결실은 일부 목적에 유용할 수 있다. 다른 구조적 또는 비구조적 아데노바이러스 유전자에서 다른 결실이 이루어질 수 있다.

상기 논의된 결실은 개별적으로 사용될 수 있으며, 즉, 아데노바이러스 서열은 E1의 결실만을 함유할 수 있다. 대안적으로, 그들의 생물학적 활성을 파괴하거나 감소시키는데 효과적인 전체 유전자 또는 이의 부분의 결실은 임의의 조합으로 사용될 수 있다. 예를 들어, 하나의 예시적인 벡터에서, 아데노바이러스 C68 서열은 E3 결실과 함께 또는 없이, E1 유전자 및 E4 유전자 결실, 또는 E1, E2a 및 E3 유전자 결실, 또는 E1 및 E3 유전자 결실, 또는 E1, E2a 및 E4 유전자의 결실 등을 가질 수 있다. 상기 논의된 바와 같이, 이러한 결실은 원하는 결과를 달성하기 위해 온도-민감성 돌연변이와 같은 다른 돌연변이와 조합하여 사용될 수 있다.

항원(들)을 포함하는 카세트는 임의로 침팬지 C68 Ad 바이러스의 임의의 결실된 영역에 삽입된다. 대안적으로, 카세트는 원하는 경우 해당 영역의 기능을 방해하기 위해 기존 유전자 영역에 삽입될 수 있다.

V.E.7. 헬퍼 바이러스

항원 카세트를 운반하기 위해 사용된 바이러스 벡터의 침팬지 아데노바이러스 유전자 함량에 따라, 카세트를 함유하는 감염성 재조합 바이러스 입자를 생성하기에 충분한 침팬지 아데노바이러스 유전자 서열을 제공하기 위해 헬퍼 아데노바이러스 또는 비-복제 바이러스 단편이 사용될 수 있다.

유용한 헬퍼 바이러스는 아데노바이러스 벡터 구성물에 존재하지 않거나 및/또는 벡터가 형질주입된 패키징 세포주에 의해 발현되지 않는 선택된 아데노바이러스 유전자 서열을 함유한다. 헬퍼 바이러스는 복제-결함이 있을 수 있으며 위에서 설명한 서열 외에도 다양한 아데노바이러스 유전자를 함유한다. 헬퍼 바이러스는 본원에 기재된 E1-발현 세포주와 조합하여 사용될 수 있다.

C68의 경우, "헬퍼" 바이러스는 SspI를 갖는 C68 게놈의 C 말단 단부를 클리핑하여 형성된 단편일 수 있으며, 이는 바이러스의 왼쪽 단부로부터 약 1300 bp를 제거한다. 이 클리핑된 바이러스는 플라스미드 DNA와 함께 E1-발현 세포주로 공동-형질주입되어 플라스미드에서 C68 서열과 상동 재조합에 의해 재조합 바이러스를 형성한다.

헬퍼 바이러스는 또한 문헌에 기재된 바와 같이 다중-양이온 접합체로 형성될 수 있다(Wu et al, J. Biol. Chem., 264:16985-16987 (1989); K. J. Fisher and J. M. Wilson, Biochem. J., 299:49 (Apr. 1, 1994)). 헬퍼 바이러스는 임의로 리포터 유전자를 함유할 수 있다. 다수의 그러한 리포터 유전자가 당업계에 공지되어 있다. 아데노바이러스 벡터 상의 항원 카세트와 다른 헬퍼 바이러스 상의 리포터 유전자의 존재는 Ad 벡터 및 헬퍼 바이러스 모두를 독립적으로 모니터링할 수 있게 한다. 이 두 번째 리포터는 정제 시 생성된 재조합 바이러스 및 헬퍼 바이러스를 분리하는 데 사용된다.

V.E.8. 바이러스 입자의 조립 및 세포주의 감염

아데노바이러스, 항원 카세트 및 기타 벡터 요소의 선택된 DNA 서열을 다양한 중간 플라스미드 및 셔틀 벡터로 조립하고 플라스미드 및 벡터를 사용하여 재조합 바이러스 입자를 생성하는 것은 모두 통상적인 기술을 사용하여 달성할 수 있다. 이러한 기술에는 시험관내 재조합 기술(예를 들어, 깁슨(Gibson) 어셈블리)에서, cDNA의 통상적인 클로닝 기술, 아데노바이러스 게놈의 중첩 올리고뉴클레오티드 서열의 사용, 중합효소 연쇄 반응, 및 원하는 뉴클레오티드 서열을 제공하는 임의의 적합한 방법이 포함된다. 표준 형질주입 및 공동-형질주입 기술, 예를 들어 CaPO4 침전 기술 또는 리포펙타민과 같은 리포솜-매개 형질주입 방법이 사용된다. 사용되는 다른 통상적인 방법에는 바이러스 게놈의 상동 재조합, 한천 오버레이에서 바이러스의 플라크, 신호 생성 측정 방법 등이 포함된다.

예를 들어, 원하는 항원 카세트-함유 바이러스 벡터의 구성 및 조립 후, 벡터는 헬퍼 바이러스의 존재 하에 시험관내에서 패키징 세포주로 형질주입될 수 있다. 헬퍼 및 벡터 서열 사이에 상동 재조합이 일어나서 벡터에서 아데노바이러스-항원 서열이 복제되고 비리온 캡시드로 패키징되어 재조합 바이러스 벡터 입자가 생성된다.

생성된 재조합 침팬지 C68 아데노바이러스는 항원 카세트를 선택된 세포로 전달하는데 유용하다. 패키징 세포주에서 성장한 재조합 바이러스를 사용한 생체내 실험에서, E1-결실된 재조합 침팬지 아데노바이러스는 비-침팬지, 바람직하게는 인간, 세포로 카세트를 운반하는 데 유용함을 보여준다.

V.E.9. 재조합 바이러스 벡터의 사용

항원 카세트를 함유하는 생성된 재조합 침팬지 C68 아데노바이러스(상기 기재된 바와 같이 아데노바이러스 벡터 및 헬퍼 바이러스 또는 아데노바이러스 벡터 및 패키징 세포주의 협력에 의해 생성)는 따라서 항원(들)을 생체내 또는 생체외에서 대상체에게 전달할 수 있는 효율적인 유전자 전달 비히클을 제공한다.

상기 기술된 재조합 벡터는 공개된 유전자 치료 방법에 따라 인간에게 투여된다. 항원 카세트를 보유하는 침팬지 바이러스 벡터는 바람직하게는 생물학적으로 적합한 용액 또는 약제학적으로 허용되는 전달 비히클에 현탁되어 환자에게 투여될 수 있다. 적합한 비히클에는 멸균 식염수가 포함된다. 다른 수성 및 비-수성 등장 멸균 주사 용액 및 약제학적으로 허용가능한 담체로 알려져 있고 당업자에게 잘 알려진 수성 및 비-수성 멸균 현탁액이 이러한 목적을 위해 사용될 수 있다.

침팬지 아데노바이러스 벡터는 인간 세포를 형질도입하고 충분한 수준의 항원 전달 및 발현을 제공하여 과도한 유해 없이 또는 의학적으로 허용되는 생리학적 효과와 함께 치료적 이점을 제공하기에 충분한 양으로 투여되며, 이는 의료 부문에서 당업자에 의해 결정될 수 있다. 통상적이고 약제학상 허용되는 투여 경로는 간, 비강내, 정맥내, 근육내, 피하, 피내, 경구 및 기타 비경구 투여 경로로의 직접 전달을 포함하지만 이에 제한되지는 않는다. 원하는 경우 투여 경로를 조합할 수 있다.

바이러스 벡터의 투여량은 주로 치료되는 상태, 환자의 연령, 체중 및 건강과 같은 요인에 의존할 것이며, 따라서 환자마다 다를 수 있다. 투여량은 임의의 부작용에 대한 치료적 이점의 균형을 맞추기 위해 조정될 것이며 이러한 투여량은 재조합 벡터가 사용되는 치료적 적용에 따라 달라질 수 있다. 항원(들)의 발현 수준은 투여량 투여의 빈도를 결정하기 위해 모니터링될 수 있다.

재조합 복제 결함 아데노바이러스는 "약제학적 유효량", 즉 원하는 세포를 형질주입시키고 선택된 유전자의 충분한 발현 수준을 제공하기 위한 투여 경로에서 백신접종 혜택, 즉 측정가능한 수준의 보호 면역을 제공하기 위해 효과적인 재조합 아데노바이러스의 양으로 투여될 수 있다. 항원 카세트를 포함하는 C68 벡터는 보조제와 함께 공동-투여될 수 있다. 보조제는 특히 보조제가 단백질인 경우 벡터와 분리되거나(예를 들어, 명반) 벡터 내에서 코딩될 수 있다. 보조제는 당업계에 잘 알려져 있다.

통상적이고 약제학상 허용되는 투여 경로는 비강내, 근육내, 기관내, 피하, 피내, 직장, 경구 및 기타 비경구 투여 경로를 포함하지만 이에 제한되지는 않는다. 투여 경로는 원하는 경우 조합되거나 면역원 또는 질병에 따라 조정될 수 있다. 예를 들어, 광견병 예방에서는 피하, 기관 내 및 비강 경로가 선호된다. 투여 경로는 주로 치료되는 질병의 특성에 따라 달라진다.

항원(들)에 대한 면역 수준을 모니터링하여 부스터에 대한 필요성이 있는 경우 이를 결정할 수 있다. 혈청 내 항체 역가 평가 후, 예를 들어 임의의 부스터 면역이 필요할 수 있다.

VI. 치료 및 제조 방법

또한, 본원에 개시된 방법을 사용하여 확인된 다수의 항원과 같은 하나 이상의 항원을 대상체에게 투여함으로써, 대상체에서 종양 특이적 면역 반응을 자극하고, 종양에 대해 백신을 접종하고, 대상체에서 암의 증상을 치료 및/또는 완화하는 방법이 제공된다.

또한, 본원에 개시된 방법을 사용하여 확인된 다수의 항원과 같은 하나 이상의 항원을 대상체에게 투여함으로써, 대상체에서 감염성 질병 유기체-특이적 면역 반응을 자극하고, 감염성 질병 유기체에 대해 백신을 접종하고, 대상체에서 감염성 질병 유기체와 관련된 감염의 증상을 치료 및/또는 완화하는 방법이 제공된다.

일부 측면에서, 대상체는 암 진단을 받았거나 암 발병 위험이 있다. 대상체는 인간, 개, 고양이, 말 또는 종양 특이적 면역 반응이 필요한 임의의 동물일 수 있다. 종양은 유방, 난소, 전립선, 폐, 신장, 위, 대장, 고환, 두경부, 췌장, 뇌, 흑색종과 같은 임의의 고형 종양 및 조직 기관의 종양 및 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병 및 B 세포 림프종을 포함하여 림프종 및 백혈병과 같은 혈액 종양일 수 있다.

일부 측면에서, 대상체는 감염 진단을 받았거나 감염 위험(예를 들어 연령, 지리적/여행, 및/또는 업무-관련 감염 위험 증가 또는 감염의 소인, 또는 계절성 및/또는 새로운 질병 감염)이 있는 것으로 진단되었다.

항원은 CTL 반응을 자극하기에 충분한 양으로 투여될 수 있다. 항원은 T 세포 반응 반응을 자극하기에 충분한 양으로 투여될 수 있다. 항원은 B 세포 반응 반응을 자극하기에 충분한 양으로 투여될 수 있다. 항원은 T 세포 반응 반응 및 B 세포 반응 모두를 자극하기에 충분한 양으로 투여될 수 있다.

항원은 단독으로 또는 다른 치료제와 조합하여 투여될 수 있다. 치료제는 항바이러스제 또는 항생제와 같은 감염성 질병 유기체를 표적으로 하는 것들을 포함할 수 있다.

또한, 대상체는 관문 억제제와 같은 항-면역억제제/면역자극제를 추가로 투여받을 수 있다. 예를 들어, 대상체는 항-CTLA 항체 또는 항-PD-1 또는 항-PD-L1을 추가로 투여받을 수 있다. 항체에 의한 CTLA-4 또는 PD-L1의 차단은 환자의 암 세포에 대한 면역 반응을 향상시킬 수 있다. 특히, CTLA-4 차단은 백신 접종 프로토콜을 따를 때 효과적인 것으로 나타났다.

백신 조성물에 포함될 각 항원의 최적량 및 최적 투여 요법이 결정될 수 있다. 예를 들어, 항원 또는 이의 변이체는 정맥내(i.v.) 주사, 피하(s.c.) 주사, 피내(i.d.) 주사, 복강내(i.p.) 주사, 근육내(i.m.) 주사를 위해 제조될 수 있다. 주사 방법에는 s.c., i.d., i.p., i.m. 및 i.v.가 포함된다. DNA 또는 RNA 주입 방법에는 i.d., i.m., s.c., i.p. 및 i.v.가 포함된다. 백신 조성물의 다른 투여 방법은 당업자에게 공지되어 있다.

백신은 조성물에 존재하는 항원의 선택, 수 및/또는 양이 조직, 암, 감염성 질병 및/또는 환자-특이적이도록 편집될 수 있다. 예를 들어, 펩티드의 정확한 선택은 주어진 조직에서 모 단백질의 발현 패턴에 의해 안내되거나 환자의 돌연변이 또는 질병 상태에 의해 안내될 수 있다. 선택은 특정 암 유형, 특정 감염성 질병(예를 들어, 대상체가 감염되었거나 감염 위험이 있는 특정 전염병 분리주/균주), 질병 상태, 백신접종 목표(예를 들어, 예방 또는 진행 중인 질병을 표적으로), 초기 치료 요법, 환자의 면역 상태, 및 물론 환자의 HLA-일배체형에 따라 달라질 수 있다. 또한 백신은 특정 환자의 개인적 필요에 따라 개별화된 구성요소를 포함할 수 있다. 예에는 특정 환자의 항원 발현에 따라 항원 선택을 변경하거나 1차 치료 또는 치료 계획에 따른 2차 치료에 대한 조정이 포함된다.

다양한 진단 방법, 예를 들어 하기에 추가로 설명되는 환자 선택 방법을 사용하여 항원 백신의 투여를 위해 환자를 확인할 수 있다. 환자 선택은 하나 이상의 유전자의 돌연변이 또는 발현 패턴을 확인하는 것을 포함할 수 있다. 환자 선택은 진행 중인 감염의 감염성 질병을 확인하는 것을 포함할 수 있다. 환자 선택에는 감염성 질병에 의한 감염 위험을 확인하는 것이 포함될 수 있다. 어떤 경우에는 환자 선택에 환자의 일배체형 확인이 포함된다. 다양한 환자 선택 방법은 병렬로 수행될 수 있고, 예를 들어 시퀀싱 진단은 환자의 돌연변이 및 일배체형을 모두 확인할 수 있다. 다양한 환자 선택 방법은 순차적으로 수행될 수 있고, 예를 들어 하나의 진단 테스트는 돌연변이를 확인하고 별도의 진단 테스트는 환자의 일배체형을 확인하며, 여기서 각 테스트는 동일하거나(예를 들어, 고처리량 시퀀싱) 또는 상이한(예를 들어, 하나는 높은 처리량 시퀀싱 및 다른 하나는 생거 시퀀싱) 진단 방법일 수 있다.

암 또는 감염성 질병에 대한 백신으로 사용되는 조성물의 경우, 정상 조직에서 다량으로 발현되는 유사한 정상 자가-펩티드를 갖는 항원은 회피하거나 본원에 기재된 조성물에 소량으로 존재할 수 있다. 반면에, 환자의 종양 또는 감염된 세포가 특정 항원을 다량으로 발현하는 것으로 알려진 경우, 이 암 또는 감염의 치료를 위한 각각의 약제학적 조성물은 다량으로 존재할 수 있고/있거나 이 특정 항원 또는 이 항원의 경로에 특이적인 하나 이상의 항원이 포함될 수 있다.

항원을 포함하는 조성물은 이미 암 또는 감염을 앓고 있는 개체에게 투여될 수 있다. 치료적 적용에서, 조성물은 종양 항원 또는 감염성 질병 유기체 항원에 대한 효과적인 CTL 반응을 자극하고 증상 및/또는 합병증을 치료하거나 적어도 부분적으로 정지시키기에 충분한 양으로 환자에게 투여된다. 이를 달성하기에 적절한 양은 "치료 유효량"으로 정의된다. 이러한 용도에 효과적인 양은, 예를 들어, 조성, 투여 방식, 치료되는 질병의 단계 및 중증도, 환자의 체중 및 일반적인 건강 상태, 처방 의사의 판단에 따라 달라질 것이다. 조성물은 일반적으로 심각한 질병 상태, 즉 생명을 위협하거나 잠재적으로 생명을 위협하는 상황에서, 특히 암이 전이되거나 감염성 질병 유기체가 장기 손상 및/또는 기타 면역 병리를 유도한 경우에 사용될 수 있음을 염두에 두어야 한다. 그러한 경우에, 외래 물질의 최소화 및 항원의 상대적인 비독성 특성의 관점에서, 이러한 조성물의 실질적인 과량을 투여하는 것이 치료 의사에 의해 가능하고 바람직하다고 느낄 수 있다.

치료적 사용을 위해, 투여는 종양의 검출 또는 외과적 제거에서 시작하거나감염의 검출 또는 치료에서 시작할 수 있다. 이것은 적어도 증상이 실질적으로 경감될 때까지 및 그 후 일정 기간 동안, 또는 면역이 제공되는 것으로 간주될 때까지(예를 들어, 기억 B 세포 또는 T 세포 집단, 또는 항원 특이적 B 세포 또는 항체가 생성될 때까지) 부스팅 용량이 뒤따를 수 있다.

치료적 치료를 위한 약제학적 조성물(예를 들어, 백신 조성물)은 비경구, 국소, 비강, 경구 또는 국부 투여를 위한 것이다. 약제학적 조성물은 비경구적으로, 예를 들어 정맥내로, 피하로, 피내로, 또는 근육내로 투여될 수 있다. 조성물은 종양에 대한 국소 면역 반응을 자극하기 위해 외과적 절제 부위에 투여될 수 있다. 조성물은 대상체의 특정 감염된 조직 및/또는 세포를 표적화하기 위해 투여될 수 있다. 본원에는 항원의 용액을 포함하는 비경구 투여용 조성물 및 백신 조성물이 허용되는 담체, 예를 들어 수성 담체에 용해되거나 현탁되어 있는 조성물이 기재되어 있다. 다양한 수성 담체, 예를 들어 물, 완충수, 0.9% 식염수, 0.3% 글리신, 히알루론산 등이 사용될 수 있다. 이들 조성물은 통상적이고 잘 알려진 멸균 기술에 의해 멸균될 수 있거나 멸균 여과될 수 있다. 생성된 수용액은 그대로 사용하기 위해 포장되거나 동결건조될 수 있으며, 동결건조된 제제는 투여 전에 멸균 용액과 조합된다. 조성물은 pH 조절제 및 완충제, 긴장성 조절제, 습윤제 등과 같은 생리학적 조건을 비슷하게 하는 데 필요한 약제학상 허용되는 보조 물질, 예를 들어 나트륨 아세테이트, 나트륨 락테이트, 염화나트륨, 염화칼륨, 염화칼슘, 소르비탄 모노라우레이트, 트리에탄올아민 올레이트 등을 함유할 수 있다.

항원은 또한 림프 조직과 같은 특정 세포 조직을 표적으로 하는 리포솜을 통해 투여될 수 있다. 리포솜은 또한 반감기를 증가시키는 데 유용하다. 리포솜은 에멀젼, 발포체, 미셀, 불용성 단일층, 액정, 인지질 분산액, 라멜라층 등을 포함한다. 이러한 제제에서 전달될 항원은 단독으로 또는 예를 들어, CD45 항원에 결합하는 모노클로날 항체와 같은 림프성 세포 사이에 널리 퍼져 있는 수용체에 결합하는 분자와 함께 또는 다른 치료 또는 면역원성 조성물과 함께 혼입될 수 있다. 따라서, 원하는 항원으로 채워진 리포솜은 림프 세포의 부위로 유도될 수 있고, 여기서 리포솜은 선택된 치료/면역원성 조성물을 전달한다. 리포솜은 일반적으로 중성 및 음으로 하전된 인지질과 콜레스테롤과 같은 스테롤을 포함하는 표준 소포-형성 지질로부터 형성될 수 있다. 지질의 선택은 일반적으로, 예를 들어 리포솜 크기, 산 불안정성 및 혈류에서 리포솜의 안정성을 고려하여 안내된다. 예를 들어, 문헌에 기술된 바와 같이 리포솜을 제조하기 위해 다양한 방법을 사용할 수 있다(Szoka 등, Ann. Rev. Biophys. Bioeng. 9; 467 (1980), U.S. Pat. Nos. 4,235,871, 4,501,728, 4,501,728, 4,837,028, 및 5,019,369).

면역 세포를 표적화하기 위해, 리포솜에 혼입될 리간드는, 예를 들어 원하는 면역계 세포의 세포 표면 결정인자에 특이적인 항체 또는 이의 단편을 포함할 수 있다. 리포솜 현탁액은 특히 투여 방식, 전달되는 펩티드 및 치료되는 질병의 단계에 따라 달라지는 용량으로 정맥내, 국부적으로, 국소적으로 등으로 투여될 수 있다.

치료 또는 면역화 목적을 위해, 펩티드 및 임의로 본원에 기재된 펩티드 중 하나 이상을 코딩하는 핵산이 또한 환자에게 투여될 수 있다. 핵산을 환자에게 전달하기 위해 다수의 방법이 편리하게 사용된다. 예를 들어, 핵산은 "네이키드(naked) DNA"로 직접 전달될 수 있다. 이러한 접근법은 문헌에 기술되어 있다(Wolff 등, Science 247: 1465-1468 (1990); U.S. Pat. Nos. 5,580,859 및 5,589,466). 핵산은 또한, 예를 들어 U.S. 특허 5,204,253에 기재된 바와 같이 탄도 전달을 사용하여 투여할 수도 있다. DNA만으로 이루어진 입자를 투여할 수 있다. 대안적으로, DNA는 금 입자와 같은 입자에 부착될 수 있다. 핵산 서열을 전달하기 위한 접근법은 전기천공이 있거나 없는 바이러스 벡터, mRNA 벡터 및 DNA 벡터를 포함할 수 있다.

핵산은 또한 양이온성 지질과 같은 양이온성 화합물과 복합되어 전달될 수 있다. 지질-매개 유전자 전달 방법은 문헌에 기재되어 있다(9618372 WO AWO 96/18372; 9324640 WOAWO 93/24640; Mannino & Gould-Fogerite, BioTechniques 6(7): 682-691 (1988); U.S. Pat. No. 5,279,833 Rose U.S. Pat. No. 5,279,833; 9106309WOAWO 91/06309; 및 Felgner et al., Proc. Natl. Acad. Sci. USA 84: 7413-7414 (1987)).

항원은 또한 백시니아, 계두, 자가-복제 알파바이러스, 마라바바이러스, 아데노바이러스(Tatsis et al., Adenoviruses, Molecular Therapy (2004) 10, 616-629) 또는 2세대, 3세대 또는 하이브리드 2세대/3세대 렌티바이러스 및 특정 세포 유형 또는 수용체를 표적으로 하도록 설계된 임의의 세대의 재조합 렌티바이러스(Hu et al., Immunization Delivered by Lentiviral Vectors for Cancer and Infectious Diseases, Immunol Rev. (2011) 239(1): 45-61, Sakuma et al., Lentiviral vectors: basic to translational, Biochem J. (2012) 443(3):603-18, Cooper et al., Rescue of splicing-mediated intron loss maximizes expression in lentiviral vectors containing the human ubiquitin C promoter, Nucl. Acids Res. (2015) 43 (1): 682-690, Zufferey et al., Self-Inactivating Lentivirus Vector for Safe and Efficient In Vivo Gene Delivery, J. Virol. (1998) 72 (12): 9873-9880)를 포함하나 이에 제한되지 않는 렌티바이러스와 같은 바이러스 벡터 기반-백신 플랫폼에 포함될 수 있다. 위에서 언급한 바이러스 벡터-기반 백신 플랫폼의 패키징 능력에 따라, 이 접근법은 하나 이상의 항원 펩티드를 코딩하는 하나 이상의 뉴클레오티드 서열을 전달할 수 있다. 서열은 돌연변이되지 않은 서열에 의해 플랭킹될 수 있거나, 링커에 의해 분리될 수 있거나, 세포하 구획을 표적으로 하는 하나 이상의 서열이 선행될 수 있다(Gros et al., Prospective identification of neoantigen-specific lymphocytes in the peripheral blood of melanoma patients, Nat Med. (2016) 22 (4):433-8, Stronen et al., Targeting of cancer neoantigens with donor-derived T cell receptor repertoires, Science. (2016) 352 (6291):1337-41, Lu et al., Efficient identification of mutated cancer antigens recognized by T cells associated with durable tumor regressions, Clin Cancer Res. (2014) 20(13):3401-10). 숙주에 도입되면, 감염된 세포는 항원을 발현하고, 이에 의해 펩티드(들)에 대한 숙주 면역(예를 들어, CTL) 반응을 자극한다. 면역화 프로토콜에 유용한 백시니아 벡터 및 방법은, 예를 들어 U.S. 특허 4,722,848에 기재되어 있다. 또 다른 벡터는 BCG(Bacille Calmette Guerin)이다. BCG 벡터는 문헌에 기재되어 있다(Stover 등, Nature 351:456-460 (1991)). 항원의 치료적 투여 또는 면역화에 유용한 매우 다양한 다른 백신 벡터, 예를 들어 살모넬라 타이피 벡터 등은 본원의 설명으로부터 당업자에게 명백할 것이다.

핵산을 투여하는 수단은 하나 또는 다중 에피토프를 코딩하는 미니유전자 구성물을 사용한다. 인간 세포에서의 발현을 위해 선택된 CTL 에피토프(미니유전자)를 코딩하는 DNA 서열을 생성하기 위해, 에피토프의 아미노산 서열은 역 번역된다. 인간 코돈 사용 표는 각 아미노산에 대한 코돈 선택을 안내하는 데 사용된다. 이러한 에피토프-코딩 DNA 서열은 직접 연결되어 연속적인 폴리펩티드 서열을 생성한다. 발현 및/또는 면역원성을 최적화하기 위해, 추가 요소를 미니유전자 설계에 혼입할 수 있다. 역 번역될 수 있고 미니유전자 서열에 포함될 수 있는 아미노산 서열의 예는 헬퍼 T 림프구, 에피토프, 리더(신호) 서열 및 소포체 보유 신호를 포함한다. 또한, CTL 에피토프의 MHC 제시는 CTL 에피토프에 인접한 합성(예를 들어, 폴리-알라닌) 또는 자연-발생 플랭킹 서열을 포함함으로써 개선될 수 있다. 미니유전자 서열은 미니유전자의 플러스 및 마이너스 가닥을 코딩하는 올리고뉴클레오티드를 조립함으로써 DNA로 전환된다. 중첩 올리고뉴클레오티드(30-100 염기 길이)는 잘 알려진 기술을 사용하여 적절한 조건에서 합성, 인산화, 정제 및 어닐링된다. 올리고뉴클레오티드의 끝은 T4 DNA 리가제를 사용하여 연결된다. CTL 에피토프 폴리펩티드를 코딩하는 이 합성 미니유전자는 원하는 발현 벡터로 클로닝될 수 있다.

정제된 플라스미드 DNA는 다양한 제형을 사용하여 주사용으로 제조할 수 있다. 이들 중 가장 간단한 것은 멸균 인산염-완충 식염수(PBS)에서 동결건조된 DNA를 재구성하는 것이다. 다양한 방법이 설명되었으며 새로운 기술을 사용할 수 있다. 위에서 언급한 바와 같이, 핵산은 양이온성 지질과 함께 편리하게 제형화된다. 또한 당지질, 융합성 리포솜, 펩티드 및 집합적으로 보호, 상호작용, 비-응축(PINC)이라고 하는 화합물도 정제된 플라스미드 DNA와 복합체를 형성하여 안정성, 근육내 분산 또는 특정 장기 또는 세포 유형으로의 트래픽킹과 같은 변수에 영향을 미칠 수 있다.

본원에 개시된 방법의 단계를 수행하고, 다수의 항원 또는 다수의 항원의 서브세트를 포함하는 백신을 생산하는 것을 포함하는 백신을 제조하는 방법이 또한 개시된다.

본원에 개시된 항원은 당업계에 공지된 방법을 사용하여 제조할 수 있다. 예를 들어, 본원에 개시된 항원 또는 벡터(예를 들어, 하나 이상의 항원을 코딩하는 적어도 하나의 서열을 포함하는 벡터)를 생산하는 방법은 항원 또는 벡터를 발현하기에 적합한 조건 하에 숙주 세포를 배양하는 것을 포함할 수 있으며, 여기서 숙주 세포는 항원 또는 벡터를 코딩하는 적어도 하나의 폴리뉴클레오티드를 포함하고, 항원 또는 벡터를 정제하는 것을 포함한다. 표준 정제 방법에는 크로마토그래피 기술, 전기영동, 면역학, 침전, 투석, 여과, 농축 및 크로마토포커싱 기술이 포함된다.

숙주 세포는 차이니즈 햄스터 난소(CHO) 세포, NS0 세포, 효모 또는 HEK293 세포를 포함할 수 있다. 숙주 세포는 본원에 개시된 항원 또는 벡터를 코딩하는 적어도 하나의 핵산 서열을 포함하는 하나 이상의 폴리뉴클레오티드로 형질전환될 수 있으며, 임의로 분리된 폴리뉴클레오티드는 항원 또는 벡터을 코딩하는 적어도 하나의 핵산 서열에 작동가능하게 연결된 프로모터 서열을 추가로 포함한다. 특정 구현양태에서, 분리된 폴리뉴클레오티드는 cDNA일 수 있다.

VII. 항원 사용 및 투여

백신접종 프로토콜을 사용하여 대상체에게 하나 이상의 항원을 투여할 수 있다. 프라이밍 백신 및 부스팅 백신을 사용하여 대상체에게 투여할 수 있다. 사용될 수 있는 백신접종 방법, 프로토콜 및 일정은 모든 목적을 위해 본원에 참조로 포함된 국제 출원 공개 WO2021092095에 기술된 것을 포함하지만 이에 제한되지 않는다.

프라이밍 백신은 C68(예를 들어, 서열번호: 1 또는 2에 제시된 서열) 또는 SAM(예를 들어, 서열번호: 3 또는 4에 제시된 서열)를 기반으로 할 수 있다. 부스팅 백신은 C68(예를 들어, 서열번호: 1 또는 2에 제시된 서열) 또는 SAM(예를 들어, 서열번호: 3 또는 4에 제시된 서열)를 기반으로 할 수 있다.

프라임/부스트 전략의 각 벡터는 일반적으로 항원을 포함하는 카세트를 포함한다. 카세트는 일반적으로 각 항원 또는 AAY와 같은 다른 비-천연 스페이서 서열을 둘러싸는 천연 서열과 같은 스페이서에 의해 분리된 약 1-50개의 항원을 포함할 수 있다. 카세트에는 또한 파상풍 톡소이드 항원 및 PADRE 항원과 같은 MHC II 항원이 포함될 수 있으며, 이는 보편적 클래스 II 항원으로 간주될 수 있다. 카세트는 또한 유비퀴틴 표적화 서열과 같은 표적화 서열을 포함할 수 있다. 또한, 각 백신 용량은 면역 조절자와 함께(예를 들어, 동시에, 전에 또는 후에) 대상체에게 투여될 수 있다. 각 백신 용량은 관문 억제제(CPI)와 함께(예를 들어, 동시에, 전에 또는 후에) 대상체에게 투여될 수 있다. CPI는 항체 또는 이의 항원-결합 부분과 같은 CTLA4, PD1 및/또는 PDL1을 억제하는 것을 포함할 수 있다. 이러한 항체에는 트레멜리무맙 또는 더발루맙이 포함될 수 있다. 각 백신 용량은 IL-2, IL-7, IL-12(IL-12 p35, p40, p70 및/또는 p70-융합 구성물), IL-15, 또는 IL-21과 같은 사이토카인과 함께(예를 들어, 동시에, 전 또는 후에) 대상체에게 투여될 수 있다. 각각의 백신 용량은 변형된 사이토카인(예를 들어, pegIL-2)과 함께(예를 들어, 동시에, 전 또는 후에) 대상체에게 투여될 수 있다.

프라이밍 백신은 대상체에게 (예를 들어, 근육내로) 주사될 수 있다. 용량당 양측 주사를 사용할 수 있다. 예를 들어, ChAdV68(C68)을 1회 이상 주사(예를 들어, 총 용량 1x10¹² 바이러스 입자); 0.001 내지 1 ug RNA, 특히 0.1 또는 1 ug 범위로부터 선택된 낮은 백신 용량에서 SAM 백터의 1회 이상의 주사가 사용될 수 있고; 또는 1 내지 100 ug RNA, 특히 10 또는 100 ug 범위에서 선택된 고 백신 용량에서 SAM 백터의 1회 이상의 주사가 사용될 수 있다.

백신 부스트(부스팅 백신)는 프라임 백신접종 후에 (예를 들어, 근육내로) 주사될 수 있다. 부스팅 백신은 프라임 후 약 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10주마다, 예를 들어 4주마다 및/또는 8주마다 투여될 수 있다. 용량 당 양측 주사를 사용할 수 있다. 예를 들어, ChAdV68(C68)을 1회 이상 주사(예를 들어, 총 용량 1x10¹² 바이러스 입자)가 사용될 수 있고; 0.001 내지 1 ug RNA, 특히 0.1 또는 1 ug 범위로부터 선택된 낮은 백신 용량에서 SAM 백터의 1회 이상의 주사가 사용될 수 있고; 또는 1 내지 100 ug RNA, 특히 10 또는 100 ug 범위에서 선택된 고 백신 용량에서 SAM 백터의 1회 이상의 주사가 사용될 수 있다.

항-CTLA-4(예를 들어, 트레멜리무맙)가 또한 대상체에게 투여될 수 있다. 예를 들어, 항-CTLA4는 동일한 림프절로의 배수를 보장하기 위해 근육내 백신 주사(ChAdV68 프라임 또는 SAM 저용량) 부위 근처에 피하 투여될 수 있다. 트레멜리무맙은 CTLA-4의 선택적 인간 IgG2 mAb 억제제이다. 표적 항-CTLA-4(트레멜리무맙) 피하 용량은 전형적으로 70-75 mg(특히 75 mg)이며, 용량 범위는, 예를 들어 1-100 mg 또는 5-420 mg이다.

특정 예에서 항-PD-L1 항체, 예컨대 더발루맙(MEDI 4736)이 사용될 수 있다. 더발루맙은 PD-1 및 CD80에 대한 PD-L1 결합을 차단하는 선택적 고친화성 인간 IgG1 mAb이다. 더발루맙은 일반적으로 4주마다 20 mg/kg i.v.로 투여된다.

면역 모니터링은 백신 투여 전, 투여 중 및/또는 투여 후에 수행될 수 있다. 이러한 모니터링은 다른 매개변수 중에서 안전성과 효능에 대한 정보를 줄 수 있다.

면역 모니터링을 수행하기 위해, PBMC가 일반적으로 사용된다. PBMC는 프라임 백신접종 전 및 프라임 백신접종 후(예를 들어, 4주 및 8주)로 분리할 수 있다. PBMC는 부스터 백신접종 직전과 각 부스터 백신접종 후(예를 들어, 4주 및 8주) 수확할 수 있다.

T 세포 반응 및 B 세포 반응과 같은 면역 반응은 면역 모니터링 프로토콜의 일부로 평가될 수 있다. 예를 들어, 면역 반응을 자극하는 본원에 기재된 백신 조성물의 능력이 모니터링 및/또는 평가될 수 있다. 본원에 사용된 바와 같이, "면역 반응을 자극하다"는 면역 반응의 개시(예를 들어, 미경험 대상체에서 면역 반응의 개시를 자극하는 프라이밍 백신) 또는 면역 반응의 향상(예를 들어, 프라이밍 백신에 의해 개시되는 기존 면역 반응과 같이 항원에 대한 기존 면역 반응을 갖는 대상체에서 면역 반응의 향상을 자극하는 부스팅 백신)과 같은 면역 반응에서 임의의 증가를 지칭한다. T 세포 반응은 ELISpot, 세포내 사이토카인 염색, 사이토카인 분비 및 세포 표면 포획, T 세포 증식, MHC 다량체 염색 또는 세포독성 검정과 같은 당업계에 공지된 하나 이상의 방법을 사용하여 측정될 수 있다. 백신에 코딩된 에피토프에 대한 T 세포 반응은 ELISpot 검정을 사용하여 IFN-감마와 같은 사이토카인의 유도를 측정함으로써 PBMC에서 모니터링할 수 있다. 백신에 코딩된 에피토프에 대한 특정 CD4 또는 CD8 T 세포 반응은 유세포 분석을 사용하여 IFN-감마와 같이 세포내 또는 세포외에서 포획된 사이토카인의 유도를 측정함으로써 PBMC에서 모니터링할 수 있다. 백신에 코딩된 에피토프에 대한 특정 CD4 또는 CD8 T 세포 반응은 MHC 다량체 염색을 사용하여 에피토프/MHC 클래스 I 복합체에 특이적인 T 세포 수용체를 발현하는 T 세포 집단을 측정함으로써 PBMC로부터 모니터링할 수 있다. 백신에 코딩된 에피토프에 대한 특정 CD4 또는 CD8 T 세포 반응은 3H-티미딘, 브로모데옥시우리딘 및 카복시플루오레세인-디아세테이트-숙신이미딜에스테르(CFSE) 통합 후 T 세포 집단의 생체외 확장을 측정하여 PBMC에서 모니터링할 수 있다. 백신에 코딩된 에피토프에 특이적인 PBMC-유래 T 세포의 항원 인식 능력 및 용해 활성은 크롬 방출 검정 또는 대체 비색 세포독성 검정에 의해 기능적으로 평가될 수 있다.

B 세포 반응은 B 세포 분화(예를 들어, 형질 세포로의 분화), B 세포 또는 형질 세포 증식, B 세포 또는 형질 세포 활성화(예를 들어, CD80 또는 CD86과 같은 공동자극 마커의 상향조절), 항체 클래스 전환, 및/또는 항체 생산를 결정하는 데 사용되는 검정(예를 들어, ELISA)과 같은 당업계에 알려진 하나 이상의 방법을 사용하여 측정할 수 있다. 항체는 또한 중화 능력 평가와 같은 기능에 대해 평가될 수 있다.

본원에 기재된 임의의 백신 조성물의 투여 후 대상체의 질병 상태를 모니터링할 수 있다. 예를 들어, 질병 상태는 대상체로부터 분리된 무세포 DNA(cfDNA)를 사용하여 모니터링할 수 있다. 또한, 백신 요법의 효능은 대상체로부터 분리된 cfDNA를 사용하여 모니터링할 수 있다. cfDNA 모니터링에는 다음 단계가 포함될 수 있다: a. 대상체로부터 cfDNA를 분리하거나 분리했던 단계; b. 분리된 cfDNA를 시퀀싱하거나 시퀀싱했던 단계; c. 대상체의 야생형 생식선 핵산 서열에 비해 cfDNA에서 하나 이상의 돌연변이의 빈도를 결정하거나 결정했던 단계, d. 단계 (c)로부터 대상체의 질병 상태를 평가하거나 평가하는 단계. 상기 방법은 또한 상기 단계 (c)에 이어서, d. 주어진 대상체에 대해 단계 (a)-(c)의 1회 이상의 반복을 수행하고 1회 이상의 반복에서 결정된 하나 이상의 돌연변이의 빈도를 비교하는 단계; 및 f. 단계 (d)로부터 대상체의 질병 상태를 평가하거나 평가하는 단계를 포함할 수 있다. 백신 조성물의 투여 전에 수행되는 단계 (a)-(c)의 첫 번째 반복 및 백신 조성물의 투여 이후 단계 (a)-(c)의 두 번째 반복이 수행되는 것과 같이, 하나 이상의 반복이 상이한 시점에서 수행될 수 있다. 단계 (c)는: 하나 이상의 반복에서 결정된 하나 이상의 돌연변이의 빈도, 또는 첫 번째 반복에서 결정된 하나 이상의 돌연변이의 빈도와 두 번째 반복에서 결정된 하나 이상의 돌연변이의 빈도를 비교하는 것을 포함할 수 있다. 후속 반복 또는 두 번째 반복에서 결정된 하나 이상의 돌연변이 빈도의 증가는 질병 진행으로 평가될 수 있다. 후속 반복 또는 두 번째 반복에서 결정된 하나 이상의 돌연변이 빈도의 감소는 반응으로 평가될 수 있다. 일부 측면에서, 반응은 완전 반응(CR) 또는 부분 반응(PR)이다. 치료는 cfDNA에서 하나 이상의 돌연변이 빈도의 평가가 대상체가 질병을 가지고 있음을 나타내는 경우와 같은 평가 단계 후에 대상체에게 투여될 수 있다. cfDNA 분리 단계는 원심분리를 사용하여 세포 또는 세포 파편에서 cfDNA를 분리할 수 있다. cfDNA는 혈장 층, 버피 코트 및 적혈구를 분리하는 것과 같이 전혈에서 분리할 수 있다. cfDNA 시퀀싱은 차세대 시퀀싱(NGS), 생어(Sanger) 시퀀싱, 듀플렉스 시퀀싱, 전체-엑솜 시퀀싱, 전체-게놈 시퀀싱, 드 노보 시퀀싱, 단계적 시퀀싱, 표적 앰플리콘 시퀀싱, 샷건 시퀀싱 또는 이들의 조합을 사용할 수 있으며, 시퀀싱 전에 하나 이상의 관심 폴리뉴클레오티드 영역에 대한 cfDNA(예를 들어, 하나 이상의 돌연변이, 코딩 영역 및/또는 종양 엑솜 폴리뉴클레오티드를 코딩하는 것으로 알려져 있거나 의심되는 폴리뉴클레오티드)를 농축하는 것을 포함할 수 있다. cfDNA를 농축하는 것은 하나 이상의 관심 폴리뉴클레오티드 영역에 변형(예를 들어, 비오티닐화)될 수 있는 하나 이상의 폴리뉴클레오티드 프로브를 혼성화하는 것을 포함할 수 있다. 일반적으로 임의의 수의 돌연변이를 동시에 또는 병렬로 모니터링할 수 있다.

VIII. HLA 펩티드의 분리 및 검출

HLA-펩티드 분자의 분리는 조직 샘플(55-58)의 용해 및 가용화 후에 고전적인 면역침전(IP) 방법을 사용하여 수행되었다. HLA 특이적 IP에 대해 정화된(clarified) 용해물을 사용했다.

항체가 HLA 분자에 특이적인 비드에 커플링된 항체를 사용하여 면역침전을 수행하였다. 범-클래스 I HLA 면역 침전의 경우, 범-클래스 I CR 항체가 사용되며 클래스 II HLA - DR의 경우, HLA-DR 항체가 사용된다. 항체는 밤새 배양하는 동안 NHS-세파로스 비드에 공유적으로 부착된다. 공유 부착 후, 비드를 세척하고 IP를 위해 분취했다. (59, 60) 면역침전은 비드에 공유적으로 부착되지 않은 항체로 수행할 수도 있다. 일반적으로 이것은 항체를 컬럼에 고정하기 위해 단백질 A 및/또는 단백질 G로 코팅된 세파로스 또는 자기 비드를 사용하여 수행된다. MHC/펩티드 복합체를 선택적으로 풍부하게 하는 데 사용할 수 있는 일부 항체는 아래에 나열되어 있다.

면역침전을 위해 정화된 조직 용해물을 항체 비드에 첨가한다. 면역 침전 후, 비드는 용해물에서 제거되고 용해물은 추가 IP를 포함한 추가 실험을 위해 저장된다. IP 비드를 세척하여 비-특이적 결합을 제거하고 HLA/펩티드 복합체는 표준 기술을 사용하여 비드에서 용출된다. 단백질 성분은 분자량 스핀 컬럼 또는 C18 분획을 사용하여 펩티드에서 제거된다. 생성된 펩티드는 스피드백(SpeedVac) 증발에 의해 건조되고 어떤 경우에는 MS 분석 전에 -20℃에서 저장된다.

건조된 펩티드는 역상 크로마토그래피에 적합한 HPLC 완충액에서 재구성되고 퓨전 루모스(Fusion Lumos) 질량 분석기(Thermo)에서 구배 용출을 위해 C-18 미세모세관 HPLC 컬럼에 로딩된다. 펩티드 질량/전하(m/z)의 MS1 스펙트럼을 오비트랩(Orbitrap) 검출기에서 고 분해능으로 수집한 다음 MS2 저 분해능 스캔을 선택한 이온의 HCD 단편화 후 이온 트랩 검출기에서 수집했다. 또한 MS2 스펙트럼은 CID 또는 ETD 단편화 방법 또는 세 가지 기술의 조합을 사용하여 펩티드의 더 큰 아미노산 범위를 얻을 수 있다. MS2 스펙트럼은 오비트랩 검출기에서 병렬 반응 모니터링으로 알려진 표적 방법을 사용하여 고분해능 질량 정확도로 측정할 수도 있다. 표적 PRM에서, 특정 펩티드 전구체 이온은 오비트랩 검출기에서 분리되고 생성된 모든 HCD 단편화 이온은 펩티드 피크의 용리를 가로질러 스캔된다. 이를 통해 공동 주입된 안정한 동위원소 표지 펩티드 표준의 존재 하에서 내인성 펩티드의 펩티드 확인 및 정량화를 모두 수행할 수 있다.

각 분석으로부터의 MS2 스펙트럼은 코미트(Comet)(61, 62)를 사용하여 단백질 데이터베이스에 대해 검색되고 펩티드 확인은 퍼콜레이터(Percolator)(63-65)를 사용하여 점수화된다. 추가 시퀀싱은 PEAKS 스튜디오(Bioinformatics Solutions Inc.)를 사용하여 수행되며 스펙트럼 일치 및 새로운 시퀀싱을 포함하여(97) 다른 검색 엔진 또는 시퀀싱 방법을 사용할 수 있다. 표적화 MS1 및 MS2 스펙트럼은 스카이라인(Skyline)(104)을 통해 처리된다.

VIII.B.1. 포괄적인 HLA 펩티드 시퀀싱을 지원하는 MS 검출 한계 연구

펩티드 YVYVADVAAK를 사용하여 LC 컬럼에 로딩된 상이한 양의 펩티드를 사용하여 검출 한계가 무엇인지를 결정하였다. 테스트된 펩티드의 양은 1 pmol, 100 fmol, 10 fmol, 1 fmol 및 100 amol이다.(표 1) 이러한 결과는 검출의 최저 한계(LoD)가 애토몰(attomol) 범위(10^-18)에 있고, 동적 범위가 5배의 크기에 걸쳐 있으며, 신호 대 잡음비가 낮은 펨토몰(femtomol) 범위(10^-15)에서 시퀀싱에 충분해 보인다.

표 1

IX. 제시 모델

제시 모델은 환자에서 펩티드 제시의 가능성을 확인하기 위해 사용될 수 있다. 다양한 제시 모델이 당업자에게, 예를 들어 미국 특허 10,055,540, US 출원공개 US20200010849A1 및 US20110293637, 및 국제 특허출원 공개 WO/2018/195357, WO/2018/208856 및 WO2016187508에 공지되어 있으며, 각각은 본 원에 모든 목적을 위해 그 전문이 참조로 포함된다.

X. 트레이닝 모듈

트레이닝 모듈은 펩티드 서열이 펩티드 서열과 관련된 MHC 대립유전자에 의해 제시될 것인지의 가능성을 생성하는 트레이닝 데이터 세트에 기반으로 하나 이상의 제시 모델을 구성하는데 사용될 수 있다. 다양한 트레이닝 모듈이 당업자에게, 예를 들어 미국 특허 10,055,540, US 출원공개 US20200010849A1, 및 국제 특허출원 공개 WO/2018/195357 및 WO/2018/208856에 공지되어 있으며, 각각은 본원에 모든 목적을 위해 그 전문이 참조로 포함된다. 트레이닝 모듈은 대립유전자 별로 펩티드의 제시 가능성을 예측하기 위한 제시 모델을 구성할 수 있다. 트레이닝 모듈은 또한 두 개 이상의 MHC 대립유전자가 존재하는 다중-대립유전자 설정에서 펩티드의 제시 가능성을 예측하기 위해 제시 모델을 구성할 수 있다.

XI. 예측 모듈

예측 모듈은 제시 모델을 사용하여 서열 데이터를 수신하고 서열 데이터에서 후보 항원을 선택하는 데 사용될 수 있다. 구체적으로, 서열 데이터는 환자의 종양 조직 세포, 환자의 감염된 세포 또는 감염성 질병 유기체 자체로부터 추출된 DNA 서열, RNA 서열 및/또는 단백질 서열일 수 있다. 예측 모듈은 하나 이상의 돌연변이를 함유하는 부분을 확인하기 위해 환자의 정상 조직 세포로부터 추출된 서열 데이터와 환자의 종양 조직 세포로부터 추출된 서열 데이터를 비교함으로써 돌연변이된 펩티드 서열인 후보 신생항원을 확인할 수 있다. 예측 모듈은 하나 이상의 감염성 질병 유기체 관련 항원을 함유하는 부분을 확인하기 위해 환자의 정상 조직 세포에서 추출한 서열 데이터를 환자의 감염된 세포로부터 추출된 서열 데이터와 비교하여 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드인 후보 항원을 확인할 수 있다. 예측 모듈은 부적절하게 발현된 후보 항원을 확인하기 위해 환자의 정상 조직 세포에서 추출한 서열 데이터와 환자의 종양 조직 세포에서 추출한 서열 데이터를 비교하여 정상 세포 또는 조직에 비해 종양 세포 또는 암 조직에서 발현이 변경된 후보 항원을 확인할 수 있다. 예측 모듈은 발현된 후보 항원을 확인하기 위해(예를 들어, 감염성 질병에 특이적인 발현된 폴리뉴클레오티드 및/또는 폴리펩티드를 확인함으로써) 환자의 정상 조직 세포에서 추출한 서열 데이터를 환자의 감염된 조직 세포에서 추출한 서열 데이터를 비교하여 정상 세포 또는 조직과 비교하여 감염된 세포 또는 감염된 조직에서 발현된 후보 항원을 확인할 수 있다.

제시 모듈은 펩티드 서열의 제시 가능성을 추정하기 위해 처리된 펩티드 서열에 하나 이상의 제시 모델을 적용할 수 있다. 구체적으로, 예측 모듈은 제시 모델을 후보 항원에 적용함으로써 종양 HLA 분자 또는 감염된 세포 HLA 분자 상에 제시될 가능성이 있는 하나 이상의 후보 항원 펩티드 서열을 선택할 수 있다. 한 구현에서, 제시 모듈은 미리 결정된 임계값을 초과하는 추정된 제시 가능성을 갖는 후보 항원 서열을 선택한다. 다른 구현에서, 제시 모델은 가장 높은 추정 제시 가능성을 갖는 N 후보 항원 서열을 선택한다(여기서, N은 일반적으로 백신에서 전달될 수 있는 에피토프의 최대 수이다). 주어진 환자에 대해 선택된 후보 항원을 포함하는 백신을 환자에게 주입하여 면역 반응을 자극할 수 있다.

XI.B. 카세트 설계 모듈

XI.B.1 개요

카세트 설계 모듈은 환자에게 주사하기 위해 선택된 후보 펩티드에 기반으로 백신 카세트 서열을 생성하기 위해 사용될 수 있다. 다양한 카세트 설계 모듈은 당업자에게 공지되어 있으며, 예를 들어 미국 특허 10,055,540, US 출원공개 US20200010849A1, 및 국제 특허출원 공개 WO/2018/195357 및 WO/2018/208856에 상세히 기술되어 있으며, 각각은 본원에 모든 목적을 위해 그 전문이 참조로 포함된다.

한 세트의 치료적 에피토프는 미리 결정된 임계값을 초과하는 제시 가능성과 관련된 예측 모듈에 의해 결정된 선택된 펩티드를 기반으로 생성될 수 있으며, 여기서 제시 가능성은 제시 모델에 의해 결정된다. 그러나 다른 구현양태에서 치료적 에피토프 세트는, 예를 들어 환자의 HLA 클래스 I 또는 클래스 II 대립유전자에 대한 결합 친화도 또는 예측된 결합 친화도, 환자의 HLA 클래스 I 또는 클래스 II 대립유전자에 대한 결합 안정성 또는 예측된 결합 안정성, 무작위 샘플링 등을 기반으로 (단독으로 또는 조합하여) 다수의 방법 중 임의의 하나 이상을 기반으로 생성될 수 있음이 이해된다.

치료적 에피토프는 선택된 펩티드 자체에 해당할 수 있다. 치료적 에피토프는 또한 선택된 펩티드 이외에 C- 및/또는 N-말단 플랭킹 서열을 포함할 수 있다. N- 및 C-말단 플랭킹 서열은 이의 공급원 단백질과 관련하여 치료적 백신 에피토프의 천연 N- 및 C-말단 플랭킹 서열일 수 있다. 치료적 에피토프는 고정-길이 에피토프를 나타낼 수 있다. 치료적 에피토프는 가변-길이 에피토프를 나타낼 수 있으며, 여기서 에피토프의 길이는, 예를 들어 C- 또는 N-플랭킹 서열의 길이에 따라 달라질 수 있다. 예를 들어, C-말단 플랭킹 서열 및 N-말단 플랭킹 서열은 각각 2-5개 잔기의 다양한 길이를 가질 수 있어서, 에피토프에 대해 16개의 가능한 선택이 가능하다.

카세트 설계 모듈은 또한 카세트에서 한 쌍의 치료적 에피토프 사이의 접합부에 걸쳐 있는 접합부 에피토프의 제시를 고려하여 카세트 서열을 생성할 수 있다. 접합부 에피토프는 카세트에서 치료적 에피토프와 카세트의 링커 서열을 연결하는 과정으로 인해 카세트에서 발생하는 새로운 비-자기이지만 관련 없는 에피토프 서열이다. 접합부 에피토프의 새로운 서열은 카세트 자체의 치료적 에피토프와 다르다.

카세트 설계 모듈은 접합부 에피토프가 환자에게 제시될 가능성을 감소시키는 카세트 서열을 생성할 수 있다. 구체적으로, 카세트가 환자에게 주입될 때 접합 에피토프는 환자의 HLA 클래스 I 또는 HLA 클래스 II 대립유전자에 의해 제시될 가능성이 있으며 각각 CD8 또는 CD4 T-세포 반응을 자극한다. 접합 에피토프에 반응하는 T-세포는 치료 효과가 없고 항원 경쟁⁷⁶에 의해 카세트에서 선택된 치료 에피토프에 대한 면역 반응을 감소시킬 수 있기 때문에, 이러한 반응은 종종 바람직하지 않다.

카세트 설계 모듈은 하나 이상의 후보 카세트를 통해 반복할 수 있고, 그 카세트 서열과 관련된 접합부 에피토프의 제시 점수가 수치 임계값 미만인 카세트 서열을 결정할 수 있다. 접합 에피토프 제시 점수는 카세트 내의 접합 에피토프의 제시 가능성과 관련된 양이며, 접합 에피토프 제시 점수의 값이 높을수록 카세트의 접합 에피토프가 HLA 클래스 I 또는 HLA 클래스 II 또는 둘 모두에 의해 제시될 가능성이 더 높다는 것을 나타낸다.

한 구현형태에서, 카세트 설계 모듈은 후보 카세트 서열 중에서 가장 낮은 접합 에피토프 제시 점수와 관련된 카세트 서열을 결정할 수 있다.

카세트 설계 모듈은 하나 이상의 후보 카세트 서열을 통해 반복하고, 후보 카세트에 대한 접합부 에피토프 제시 점수를 결정하고, 임계값 미만의 접합부 에피토프 제시 점수와 관련된 최적의 카세트 서열을 확인할 수 있다.

카세트 설계 모듈은 하나 이상의 후보 카세트 서열을 추가로 검사하여 후보 카세트 서열 내의 임의의 접합 에피토프가 백신이 설계되고 있는 주어진 환자에 대한 자가-에피토프인지 확인할 수 있다. 이를 달성하기 위해, 카세트 설계 모듈은 BLAST와 같은 알려진 데이터베이스에 대해 접합 에피토프를 확인한다. 한 구현양태에서, 카세트 설계 모듈은 접합 자가-에피토프를 피하는 카세트를 설계하도록 구성될 수 있다.

카세트 설계 모듈은 가장 작은 접합부 에피토프 제시 점수를 갖는 서열을 선택하기 위해 무차별 대입 접근법을 수행하고 모든 또는 대부분의 가능한 후보 카세트 서열을 통해 반복할 수 있다. 그러나 이러한 후보 카세트의 수는 백신의 용량이 증가함에 따라 엄청나게 커질 수 있다. 예를 들어, 20개 에피토프의 백신 용량에 대해, 카세트 설계 모듈은 가장 낮은 접합 에피토프 제시 점수를 가진 카세트를 결정하기 위해 약 10¹⁸개의 가능한 후보 카세트를 통해 반복해야 한다. 이 결정은 (필요한 계산 처리 자원 측면에서) 계산적으로 부담이 될 수 있으며 카세트 설계 모듈이 환자를 위한 백신을 생성하기 위해 합당한 시간 내에 완료하는 데 때때로 다루기 어려울 수 있다. 더욱이, 각각의 후보 카세트에 대한 가능한 접합 에피토프를 설명하는 것은 훨씬 더 부담스러울 수 있다. 따라서, 카세트 설계 모듈은 무차별 대입 방식에 대한 후보 카세트 서열의 수보다 상당히 적은 수의 후보 카세트 서열을 통해 반복하는 방식에 기초하여 카세트 서열을 선택할 수 있다.

카세트 설계 모듈은 무작위로 또는 적어도 유사-무작위로 생성된 후보 카세트의 하위세트를 생성할 수 있고, 미리 결정된 임계값 미만의 접합 에피토프 제시 점수와 연관된 후보 카세트를 카세트 서열로 선택할 수 있다. 추가로, 카세트 설계 모듈은 가장 낮은 접합 에피토프 제시 스코어를 갖는 하위세트로부터 카세트 서열로서 후보 카세트를 선택할 수 있다. 예를 들어, 카세트 설계 모듈은 20개의 선택된 에피토프 세트에 대해 약 100만 후보 카세트의 하위세트를 생성하고 접합 에피토프 제시 점수가 가장 작은 후보 카세트를 선택할 수 있다. 무작위 카세트 서열의 하위세트를 생성하고 하위세트 중에서 접합 에피토프 제시 점수가 낮은 카세트 서열을 선택하는 것이 무차별 대입 접근 방식에 비해 차선일 수 있지만 계산 자원이 훨씬 적게 필요하므로 기술적으로 구현이 가능하다. 또한, 이 보다 효율적인 기술과 달리 무차별 대입 방법을 수행하면 접합 에피토프 표시 점수가 미미하거나 심지어 무시할 수 있을 정도로 향상될 수 있으므로 자원 할당 관점에서 볼 때 가치가 없다. 카세트 설계 모듈은 카세트에 대한 에피토프 서열을 비대칭 여행하는 세일즈맨 문제(TSP)로 공식화하여 개선된 카세트 구성을 결정할 수 있다. 노드 목록과 각 노드 쌍 사이의 거리가 주어지면 TSP는 각 노드를 정확히 한 번 방문하고 원래 노드로 돌아가기 위해 가장 짧은 총 거리와 관련된 노드 순서를 결정한다. 예를 들어 도시 A, B, C가 서로 알려진 거리가 있는 경우 TSP의 해결책은 각 도시를 정확히 한 번 방문하기 위해 이동한 총 거리가 가능한 경로 중에서 가장 작은 도시의 폐쇄 순서를 생성한다. TSP의 비대칭 버전은 한 쌍의 노드 사이의 거리가 비대칭일 때 최적의 노드 순서를 결정한다. 예를 들어 노드 A에서 노드 B로 이동하는 "거리"는 노드 B에서 노드 A로 이동하는 "거리"와 다를 수 있다. 비대칭 TSP를 사용하여 개선된 최적의 카세트를 해결함으로써 카세트 설계 모듈은 카세트의 에피토프 사이의 접합부에 걸쳐 감소된 제시 점수를 초래하는 카세트 서열을 찾을 수 있다. 비대칭 TSP의 해결책은 카세트의 접합부에서 접합부 에피토프 제시 점수를 최소화하기 위해 카세트에서 에피토프가 연결되어야 하는 순서에 해당하는 치료적 에피토프의 서열을 나타낸다. 이 접근법을 통해 결정된 카세트 서열은 특히 생성된 후보 카세트 서열의 수가 많을 때 무작위 샘플링 접근법보다 잠재적으로 훨씬 적은 계산 자원을 필요로 하면서 접합 에피토프의 제시가 상당히 적은 서열을 생성할 수 있다. 카세트 설계를 최적화하기 위한 상이한 연산 접근법 및 비교의 예시적인 예는 미국 특허 10,055,540, US 출원공개 US20200010849A1, 및 국제 특허 출원 공개 WO/2018/195357 및 WO/2018/208856에 상세히 기술되어 있으며, 각각은 본원에 모든 목적을 위해 그 전문이 참조로 포함된다.

천연 플랭킹 서열을 통해 연결된 연접된 KRAS-연관 MHC 클래스 I 네오에피토프의 예시적인 비-제한적 카세트는 돌연변이 KRAS G12C, KRAS G12D, KRAS G12V 및 KRAS Q61H를 갖는 각 KRAS 네오에피토프에 대한 4회 반복을 포함하며, 잠재적인 접합 에피토프를 최소화하기 위해 정렬되었으며 서열번호: 65에 나타낸 아미노산 서열로 표시되고 KRAS-연관 네오에피토프의 다음의 순서를 갖는다: G12C G12D Q61H G12D G12V G12C Q61H G12D G12V G12C Q61H G12D G12V Q61H G12V G12C.

공유 항원 백신에 포함하기 위한 공유 (신생)항원 서열 및 이러한 백신으로 치료하기에 적절한 환자는, 예를 들어 모든 목적을 위해 그 전문이 본원에 참조로 포함되는 US 출원번호 17/058,128에 기재된 바와 같이 당업자에 의해 선택될 수 있다. 후보 공유(신생)항원의 질량 분석(MS) 검증은 선택 과정의 일부로 수행할 수 있다.

XIII. 예시 컴퓨터

본원에 설명된 계산 방법을 위해 컴퓨터를 사용할 수 있다. 당업자는 컴퓨터가 상이한 아키텍처를 가질 수 있음을 인지할 것이다. 컴퓨터의 예는 당업자에게 공지되어 있으며, 예를 들어 미국 특허 10,055,540, US 출원공개 US20200010849A1, 및 국제 특허출원 공개 WO/2018/195357 및 WO/2018/208856에 상세히 기술되어 있으며, 각각은 본원에 모든 목적을 위해 그 전문이 참조로 포함된다.

XIV. 실시예

하기는 본 발명을 수행하기 위한 특정 구현양태의 실시예이다. 실시예는 예시 목적으로만 제공되며 어떤 식으로든 본 발명의 범위를 제한하려는 의도가 아니다. 사용된 숫자(예를 들어, 양, 온도 등)와 관련하여 정확성을 보장하기 위해 노력했지만 일부 실험 오류 및 편차는 물론 허용되어야 한다.

본 발명의 실시는 달리 나타내지 않는 한 당업계의 기술 내에서 단백질 화학, 생화학, 재조합 DNA 기술 및 약리학의 통상적인 방법을 사용할 것이다. 이러한 기술은 문헌에 충분히 설명되어 있다(T.E. Creighton, Proteins: Structures and Molecular Properties, W.H. Freeman and Company, 1993; A.L. Lehninger, Biochemistry, Worth Publishers, Inc., current addition; Sambrook, et al., Molecular Cloning: A Laboratory Manual, 2nd Edition, 1989; Methods In Enzymology, S. Colowick and N. Kaplan eds., Academic Press, Inc.; Remington's Pharmaceutical Sciences, 18th Edition, Easton, Pennsylvania: Mack Publishing Company, 1990; Carey and Sundberg Advanced Organic Chemistry 3 ^rd Ed., Plenum Press, Vols A and B(1992)).

XIV.A. 반복된 네오에피토프 및/또는 면역우성 네오에피토프의 제거가 있는 카세트의 평가 개요

백신접종을 통해, 상응하는 세포 면역 반응(들)을 자극하는 다중 클래스 I MHC 제한 항원이 전달될 수 있다. 다수의 네오에피토프, 구체적으로 다수의 별개의 KRAS-연관 네오에피토프를 단일 유전자 산물로서 코딩하도록 여러 백신 카세트를 조작하였고, 여기서 에피토프는 천연 주변 펩티드 서열 내에 임베딩되었다. 다양한 카세트 설계는 하나 이상의 네오에피토프의 다중 카피(즉, 반복)를 특징으로 한다. 다양한 카세트 설계는 또한 면역우성 네오에피토프를 제거하는 것을 특징으로 한다.

XIV.B. 반복 네오에피토프 및/또는 면역우성 네오에피토프의 제거 평가 재료 및 방법

항원

하기 실시예에서 사용된 에피토프-함유 25량체 아미노산 서열(즉, 천연 N 및 C 말단 아미노산 링커가 플랭킹된 에피토프)은 표 2A에 제시되어 있다. 아래에 설명된 대로 사용되었다. 다양한 구성물에 대한 카세트의 항원-코딩 서열은 각각의 25량체 서열을 하기 실시예에 기재된 순서 및 수로 서로 직접 연결함으로써(즉, 연속적인 25량체 서열 사이에 추가 아미노산이 없음) 구성되었다. 참조: 도. 1a, 2a, 3a 및 4a. 함께 연결된 여러 개의 별개의 에피토프를 함유하는 전장 항원-코딩 서열을 포함하는 카세트 뿐만 아니라 보편적인 MHC 클래스 II 항원 파상풍 톡소이드 및 PADRE(굵은 서열)는 표 2B에 제시되어 있다. 벡터로의 완전한 외인성 뉴클레오티드 삽입은 5'에서 3': Kozak 서열(GCCACC), 3개의 아미노산 MAG(ATGGCCGGG)를 코딩하는 뉴클레오티드, 표 2B의 카세트 서열 중 하나 및 2개의 정지 코돈(TAATGA)을 포함한다. 추가 카세트는 개별 KRAS 돌연변이 G12V, G12C 및 G12D(즉, 서열번호: 57, 58 또는 59의 분리된 연쇄체)의 4회 반복으로 생성되었다.

표 2A - 25량체 네오에피토프 함유 서열

표 2B - 카세트에서 전장 다중-네오에피토프 서열

아데노바이러스 벡터

항원 발현 시스템을 위한 변형된 ChAdV68 벡터는 E1(nt 577 내지 3403) 및 E3(nt 27,125-31,825) 서열이 결실되고 5개 위치에서 치환된 상응하는 ATCC VR-594(독립적으로 서열화된 전장 VR-594 C68 서열번호: 10)뉴클레오티드를 갖는 AC_000011.1에 기초하여 생성되었다. 5개의 위치에서 치환된 상응하는 ATCC VR-594 뉴클레오티드를 갖는 전장 ChAdVC68 AC_000011.1 서열은 "ChAdV68.5WTnt"(서열번호: 1)로 지칭된다. CMV 프로모터/인핸서의 제어 하에 있는 항원 카세트를 결실된 E1 서열 대신에 삽입하였다. 항원 카세트에 20개의 모델 항원을 함유하는 대표적인 ChAdV68 벡터는 "ChAdV68.5WTnt.MAG25량체"(서열번호: 2)이다. MAG25량체 카세트를 갖는 하기에 기재된 항원 카세트를 특징으로 하는 벡터는, 예를 들어 상기 표 2B에 기재된 항원 카세트로 대체될 수 있다.

293F 세포에서 아데노바이러스 생산

ChAdV68 바이러스 생산은 8% CO₂에서 인큐베이터에서 293 FreeStyle^TM(ThermoFisher) 배지에서 성장한 293F 세포에서 수행되었다. 감염 당일에 세포를 98% 생존율로 mL당 10⁶개 세포로 희석하고 1 L 진탕 플라스크(Corning)에서 생산 실행당 400 mL를 사용했다. >3.3의 표적 MOI를 갖는 4 mL의 3차 바이러스 스톡을 감염당 사용했다. 세포를 트리판 블루(Trypan blue)로 측정했을 때 생존율이 <70%가 될 때까지 48-72시간 동안 인큐베이션했다. 그런 다음 감염된 세포를 원심분리, 전속 벤치탑 원심분리기에 의해 수확하고 1XPBS에서 세척하고 다시 원심분리한 다음 20 mL의 10 mM 트리스 pH7.4에 재현탁했다. 세포 펠렛을 3X 동결 해동으로 용해시키고 4,300Xg에서 5분 동안 원심분리하여 정화시켰다.

CsCl 원심분리에 의한 아데노바이러스 정제

바이러스 DNA를 CsCl 원심분리에 의해 정제하였다. 두 번의 불연속 구배 실행이 수행되었다. 첫 번째는 세포 성분에서 바이러스를 정제하는 것이고 두 번째는 세포 성분으로부터 분리를 더욱 정제하고 감염성 입자에서 결함을 분리하는 것이다.

10 mL의 1.2 CsCl(92 mL의 10 mM 트리스 pH 8.0에 용해된 26.8 g의 CsCl)을 폴리알로머 튜브에 첨가하였다. 그런 다음 8 mL의 1.4 CsCl(87 mL의 10 mM 트리스 pH 8.0에 용해된 53 g의 CsCl)을 피펫을 사용하여 튜브 바닥으로 전달하면서 조심스럽게 첨가했다. 정화된 바이러스는 1.2층 위에 조심스럽게 층을 이루었다. 필요한 경우 더 많은 10 mM 트리스를 추가하여 튜브의 균형을 맞추었다. 그런 다음 튜브를 SW-32Ti 로터에 넣고 10℃에서 2시간 30분 동안 원심분리했다. 그런 다음 튜브를 층류 캐비닛으로 제거하고 18 게이지 바늘과 10 mL 주사기를 사용하여 바이러스 밴드를 뽑아내었다. 오염된 숙주 세포 DNA와 단백질을 제거하지 않도록 주의를 기울였다. 그런 다음 밴드를 10 mM 트리스 pH 8.0으로 2X 이상 희석하고 앞서 설명한 바와 같이 불연속 구배에서 이전과 같이 층을 이루었다. 이번에는 실행이 밤새 수행되었다는 점을 제외하고는 앞에서 설명한 대로 실행을 수행했다. 다음날 결함이 있는 입자 밴드가 뽑아지지 않도록 주의하여 밴드를 뽑아내었다. 그런 다음 ARM 완충액(20 mM 트리스 pH 8.0, 25 mM NaCl, 2.5% 글리세롤)에 대해 Slide-a-Lyzer^TM 카세트(Pierce)를 사용하여 바이러스를 투석했다. 이것은 완충액 교환당 1시간 동안 3회 수행되었다. 그런 다음 바이러스를 -80℃에서 보관하기 위해 분취했다.

아데노바이러스 바이러스 검정

VP 농축은 1.1x 10¹² 바이러스 입자(VP)의 흡광 계수를 기반으로 하는 OD 260 검정을 사용하여 수행되었으며, 이는 OD 260 nm에서 흡광도 값 1과 동일하다. 바이러스 용해 완충액(0.1% SDS, 10 mM 트리스 pH 7.4, 1 mM EDTA)에서 아데노바이러스의 두 가지 희석액(1:5 및 1:10)을 만들었다. OD는 두 희석액에서 이중으로 측정되었고 VP 농도/mL는 OD260 값 X 희석 인자 X 1.1x 10¹²VP를 곱하여 측정되었다.

감염 단위(IU) 역가는 바이러스 스톡의 한계 희석 검정에 의해 계산되었다. 바이러스는 처음에 DMEM/5% NS/1X PS에서 100X 희석된 다음 1x 10^-7까지 10배 희석을 사용하여 희석되었다. 그런 다음 이러한 희석액 100 μL를 24웰 플레이트의 3e5 세포/웰에서 적어도 한 시간 전에 시딩한 293A 세포에 첨가했다. 이것은 이중으로 수행되었다. 플레이트를 37℃의 CO₂(5%) 인큐베이터에서 48시간 동안 인큐베이션했다. 그런 다음 세포를 1XPBS로 세척한 다음 100% 차가운 메탄올(-20℃)로 고정했다. 이어서 플레이트를 -20℃에서 최소 20분 동안 인큐베이션하였다. 웰을 1XPBS로 세척한 다음 실온에서 1시간 동안 1XPBS/0.1% BSA에서 차단했다. 토끼 항-Ad 항체(Abcam, Cambridge, MA)를 차단 완충액(웰당 0.25 ml)에 1:8,000 희석으로 첨가하고 실온에서 1시간 동안 인큐베이션했다. 웰을 웰당 0.5 mL PBS로 4X 세척하였다. 1000X로 희석된 HRP 접합된 염소 항-토끼 항체(Bethyl Labs, Montgomery Texas)를 웰당 첨가하고 최종 세척 라운드 전에 1시간 동안 인큐베이션하였다. 5회 PBS 세척을 수행하고 0.01% H₂O₂를 포함하는 트리스 완충 식염수(50 mM 트리스 pH 7.5 중 0.67 mg/mL DAB, 150 mM NaCl) 중 DAB(디아미노벤지딘 테트라하이드로클로라이드) 기질을 사용하여 플레이트를 전개했다. 웰은 계수 전에 5분 동안 전개되었다. 시야당 4-40개의 염색된 세포를 제공하는 희석을 사용하여 10X 대물렌즈 하에서 세포를 계수하였다. 사용된 시야각은 0.32 mm² 그리드이고 24웰 플레이트의 시야각 당 625에 해당한다. 감염성 바이러스의 수/mL는 희석 계수 10을 곱한 시야당 그리드 수를 곱한 그리드당 염색된 세포 수로 결정할 수 있다. 유사하게, GFP 발현 세포로 작업할 때 캡시드 염색보다 형광을 사용하여 mL당 비리온을 발현하는 GFP의 수를 결정할 수 있다.

SAM 벡터

항원 발현 시스템을 위한 RNA 알파바이러스 백본은 26S 서브게놈 프로모터의 3'에 위치한 VEE의 구조적 단백질를 결실(VEE 서열 7544 내지 11,175 결실; Kinney et al 1986에 기초한 넘버링; 서열번호: 6)시킴으로써 자가-복제 베네수엘라 말 뇌염(VEE) 바이러스(Kinney, 1986, Virology 152: 400-413)로부터 생성되었다. 자가-증폭 mRNA("SAM") 벡터를 생성하기 위해, 삭제된 서열을 항원 서열로 대체하였다. 20개의 모델 항원을 함유하는 대표적인 SAM 벡터는 "VEE-MAG25량체"(서열번호; 4)이다. MAG25량체 카세트를 갖는 기재된 항원 카세트를 특징으로 하는 벡터는 본원에 기재된 SARS-CoV-2 카세트 및/또는 전장 단백질로 대체될 수 있다.

SAM을 생성하기 위한 시험관내 전사

생체내 연구의 경우 : SAM 벡터는 "AU-SAM" 벡터로 생성되었다. 정식 3' 디뉴클레오티드 GG가 결여된 변형된 T7 RNA 중합효소 프로모터(TAATACGACTCACTATA)를 SAM 벡터의 5'단부에 첨가하여 시험관내 전사 주형 DNA(예를 들어, 서열번호: 6에 제시된 서열; 삽입된 항원 카세트 없이 7544 내지 11,175가 결실된 SAM)를 생성하였다. 반응 조건은 다음과 같다:

- 1x T7 RNA 중합효소 믹스(E2040S)의 최종 농도를 사용하는 1x 전사 완충액(40 mM 트리스-HCL [pH7.9], 10 mM 디티오트레이톨, 2 mM 스페르미딘, 0.002% 트리톤 X-100 및 27 mM 염화마그네슘); 0.025 mg/mL DNA 전사 주형(제한 분해에 의해 선형화); 8 mM 클린캡 시약(CleanCap Reagent) AU(Cat. No. N-7114) 및 각각의 ATP 10 mM, 시티딘 트리포스페이트(CTP), GTP 및 우리딘 트리포스페이트(UTP)

- 전사 반응을 37℃에서 2시간 동안 인큐베이션하고 DNase I 완충액에서 최종 2U DNase I(AM2239)/0.001 mg DNA 전사 주형으로 37℃에서 1시간 동안 처리했다.

- SAM은 RNeasy Maxi(QIAGEN, 75162)로 정제되었다.

5'캡 구조의 공동-전사 첨가에 대안적으로, 7-메틸구아노신 또는 관련 5' 캡 구조는 mRNA 2'-O-메틸전이효소 및 S-아데노실 메티오닌을 함유하는 백시니아 캡핑 시스템(NEB Cat. No. M2080)을 사용하여 전사 후에 효소적으로 첨가될 수 있다.

면역화

ChAdV68 백신의 경우, 키메라 HLA-A11:01(Taconic Model #9660-[CB6F1-Tg(HLA-A*1101/H2-Kb)A11.01])을 발현하는 형질전환 마우스에 8x10¹⁰ 바이러스 입자(VP) 또는 5x10¹⁰ VP를 지시된 바와 같이 100 μL 용량으로 양측 근육 주사(다리당 50 μL)로 주입했다.

SAM 백신의 경우, 100 μL 부피의 RNA-LNP 복합체 10 μg을 양측 근육내 주사(다리당 50 μL)로 주사하였다.

비장세포 해리

면역화 후 14일에 비장세포를 분리하였다. 각 마우스의 비장은 3 mL의 완전한 RPMI(RPMI, 10% FBS, 페니실린/스트렙토마이신)에 풀링되었다. 기계적 해리는 제조사의 프로토콜에 따라 젠틀맥스 분리기(gentleMACS Dissociator)(Miltenyi Biotec)를 사용하여 수행되었다. 해리된 세포를 40 마이크론 필터를 통해 여과하고 적혈구를 ACK 용해 완충액(150 mM NH₄Cl, 10 mM KHCO₃, 0.1 mM Na₂EDTA)으로 용해시켰다. 세포를 30 마이크론 필터를 통해 다시 여과한 다음 완전한 RPMI에 재현탁시켰다. 세포는 죽은 세포 및 세포자연사 세포를 배제하기 위해 프로피듐 요오다이드 염색을 사용하여 Cytoflex LX(Beckman Coulter)에서 계수되었다. 그런 다음 세포를 후속 분석을 위해 살아있는 세포의 적절한 농도로 조정했다.

생체외 효소-결합 면역스팟(ELISpot) 분석

ELISPOT 분석은 마우스 IFNg ELISpotPLUS 키트(MABTECH)를 사용하여 ELISPOT 조화 지침{DOI: 10.1038/nprot.2015.068}에 따라 수행되었다. 1x10⁵ 비장세포를 96-웰 IFNg 항체 코팅된 플레이트에서 16시간 동안 표시된 펩티드 10 uM과 함께 인큐베이션하였다. 알칼리 포스파타제를 사용하여 스팟을 전개시켰다. 반응 시간을 10분으로 측정하고 수돗물에서 플레이트를 작동시켜 종결시켰다. AID vSpot 판독기 스펙트럼(Reader Spectrum)을 사용하여 스팟을 계수했다. ELISPOT 분석의 경우, 포화도 >50%인 웰은 "너무 많아 셀 수 없음"으로 기록되었다. 복제 웰의 편차가 > 10%인 샘플은 분석에서 제외되었다. 다음 공식을 사용하여 웰 컨플루언스에 대해 스팟 계수를 수정했다: 스팟 계수 + 2 x (스팟 계수 x %컨플루언스/[100% - %컨플루언스]). 음성 배경은 항원 자극 웰에서 음성 펩티드 자극 웰의 스팟 계수를 빼서 수정했다. 마지막으로, 셀 수 없을 정도로 많다고 표시된 웰은 가장 가까운 100단위로 반올림하여 관찰된 가장 높은 수정 값으로 설정되었다.

XIV.C. 반복된 에피토프 평가 결과

반복된 네오에피토프를 갖는 카세트의 백신 효능을 주어진 네오에피토프의 단일 카피만을 갖는 카세트와 비교하였다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 하기 기술된 ChAdV68 전달 벡터를 사용하여 8x10¹⁰ VP로 면역화하고 효능을 IFNγ ELISpot으로 평가하였다.

도 1a에 예시된 바와 같이, 일련의 ChAdV68 전달 벡터는 단일 카피의 KRAS 네오에피토프 G12C, G12V, G12D 및 Q61H("KRAS 1X(20x1)"; 카세트 = 서열번호: 63), KRAS G12C, G12V, G12D 및 Q61H2 네오에피토프의 2회 반복 및 추가적인 KRAS 네오에피토프의 2개 반복("KRAS 2X(8x2)"; 카세트 = 서열번호: 64), 또는 KRAS 네오에피토프의 4개 반복("KRAS 4X(4x4)"; 카세트 = 서열번호: 65)를 특징으로 하는 카세트의 효능을 평가하도록 설계되었다. HLA-A11:01은 이전에 KRAS G12C, G12V 및 G12D 네오에피토프를 제시하는 것으로 예측되었다(데이터는 표시되지 않음).

도 1b 및 표 3에 제시된 바와 같이, 네오에피토프의 다중 반복을 특징으로 하는 벡터를 사용한 백신접종은 증가된 스팟 형성 콜로니(SFC)를 입증했으며, 이는 카세트에서 에피토프-코딩 서열의 반복이 KRAS 네오에피토프 G12C에 대한 항원-특이적 면역 반응을 증가시켰음을 나타낸다. 그러나, G12V 1x4 카세트(G12V만 발현)가 있는 G12C 펩티드에 대한 반응이 있고 G12C 1x4 카세트(G12C만 발현)가 있는 곳은 반응이 없다는 추가 관찰 시, 4x4 카세트가 있는 G12C 펩티드에 대해 관찰된 반응은 아마도 G12V 에피토프에 의해 구동되었다. 질량 분석 결과 G12C 펩티드가 G12V 펩티드로 오염되었음을 확인했다.

도 1c 및 도 1d에 도시되고 표 3A에 제시된 바와 같이, 네오에피토프의 다중 반복을 특징으로 하는 벡터로 백신접종은 증가된 스팟 형성 콜로니(SFC)를 입증했으며, 이는 카세트에서 에피토프-코딩 서열의 반복이 KRAS 네오에피토프, ChAdV68 전달 시스템을 사용하는 특히 G12V 및 G12D 네오에피토프에 대한 증가된 항원-특이적 면역 반응을 초래함을 나타낸다.

표 3 - KRAS 네오에피토프 G12C, G12V 및 G12D +/- 반복에 대한 ELISpot 데이터

* 5/6 샘플이 셀 수 없을 정도로 많았다(최대 값 6200).

+ G12V로 인한 오염 가능성

XIV.D. 면역우성 에피토프 제거 평가 결과

면역 반응을 자극할 수 있는 잠재적으로 면역우성 TP53 네오에피토프를 갖는 카세트를 사용한 백신 효능을 면역 반응을 자극할 수 있는 TP53 네오에피토프가 없는 카세트와 비교하였다. 인간 HLA-A11:01을 발현하도록 조작된 마우스를 하기 기술된 ChAdV68 전달 벡터를 사용하여 5x10¹⁰ VP로 면역화하고 효능을 ELISpot으로 평가하였다. HLA-A11:01은 이전에 KRAS G12C, G12V, G12D 및 TP53 S127Y 네오에피토프를 제시하는 것으로 예측되었다(데이터는 표시되지 않음).

도 2a에 예시된 바와 같이, 일련의 ChAdV68 전달 벡터는 TP53 에피토프의 면역우성을 평가하기 위해 설계되었다. HLA-A11:01이 아닌 인간 HLA-A02:01("KRAS 4x1 + R213L"; 카세트 = 서열번호: 67)에 의해 제시될 것으로 예상되고 또는 TP53 S127Y 네오에피토프와 조합된 KRAS 네오에피토프는 HLA-A11:01("KRAS 4x1 + S127Y"; 카세트 = 서열번호: 68)에 의해 제시될 것으로 예측되는 바와 같이, KRAS 네오에피토프 G12C, G12V, G12D 및 Q61H("KRAS 4x1"; 카세트 = 서열번호: 66) 단독, TP53 R213L 네오에피토프와 조합된 KRAS 네오에피토프를 함유하는 벡터는 마우스 모델에서 HLA-A11:01에서 면역 반응을 자극할 수 없는 것으로 간주되었다.

도 2b에 도시되고 표 4에 제시된 바와 같이, 면역원성 TP53 S127Y 에피토프를 포함하는 벡터를 사용한 백신접종은 TP53 네오에피토프를 포함하지 않거나("4x1") 비-면역원성 TP53 네오에피토프를 포함하는 벡터("4x1+R213L")에 비해 KRAS 에피토프 G12C에 대한 감소된 스팟 형성 콜로니(SFC)를 입증했으며, 이는 백신 카세트에서 TP53 S127Y 네오에피토프의 존재가 KRAS-특이적 T 세포 반응을 감소시키는 면역우성 네오에피토프로서 작용함을 나타낸다. 그러나, G12V 1x4 카세트(G12V만 발현)가 있는 G12C 펩티드에 대한 반응이 있었고 G12C 1x4 카세트(G12C만 발현)가 있는 곳에는 반응이 없었다는 추가 관찰 시, 4x4 카세트가 있는 G12C 펩티드에 대해 관찰된 반응은 아마도 G12V 에피토프에 의해 구동되었다. 질량 분석 결과 G12C 펩티드가 G12V 펩티드로 오염되었음을 확인했다.

도 2 c-e에 도시되고 표 4에 제시된 바와 같이, 면역원성 TP53 S127Y 에피토프를 포함하는 벡터를 사용한 백신접종은 TP53 네오에피토프를 포함하지 않거나("4x1") 비-면역원성 TP53 네오에피토프를 포함하는("4x1+R213L") 벡터에 비해 KRAS 에피토프 G12V 및 G12D에 대해 감소된 반점 형성 콜로니(SFC)를 입증했고 이는, 백신 카세트에서 TP53 S127Y 네오에피토프의 존재가 KRAS-특이적 T 세포 반응을 감소시키는 면역우성 네오에피토프로서 작용함을 나타낸다.

표 4 - KRAS 및 TP53 네오에피토프에 대한 ELISpot 데이터

ND = 결정되지 않음; *3/6 샘플이 셀 수 없을 정도로 많았다(최대 값 6200).

XIV.E. 질량 분석법에 의한 KRAS 네오에피토프의 제시 평가

후보 KRAS 에피토프의 질량 분석법(MS) 검증을 표적 질량 분석법을 사용하여 수행했다. 공여체 종양 절제술(다중 대립유전자; EDGE 예측에서 대립유전자 지정) 또는 지정된 카세트를 발현하도록 조작된 단일 대립유전자 K562 계통을 평가했다. 질량 분석법 분석 방법은 모든 목적을 위해 전문이 참조로 본원에 포함되는 문헌에 기재되어 있다(Gillete et al., Nat Methods. 2013 Jan;10(1):28-34). K562 단일 대립유전자 시험관내 시스템의 사용을 포함하는 표적 질량 분석법 분석은 모든 목적을 위해 본원에 참조로 포함된 국제 출원 공보 WO2021092095에 기재되어 있다. 다양한 KRAS 네오에피토프에 의한 HLA-특이적 제시의 확인을 입증하는 결과를 표 5에 나타내었다.

표 5 - KRAS 네오에피토프 질량분석법

NA = 해당 없음(종양 또는 세포주가 이용가능하지 않음/테스트를 위해 생성)

XIV.F. 반복 KRAS 네오에피토프 카세트 평가 결과

반복된(즉, 반복된) 네오에피토프 또는 주어진 네오에피토프의 단일 카피를 갖는 다양한 카세트로 백신 효능을 평가하였다. KRAS G12 돌연변이에 대한 인간 HLA-A11:01 또는 KRAS Q61H에 대한 인간 HLA-A01:01을 발현하도록 조작된 마우스를 하기에 기재된 ChAdV68 전달 벡터를 사용하여 5x10¹⁰ VP로 면역화하고 효능을 IFNγ ELISpot으로 평가했다.

KRAS 네오에피토프 G12C, G12V, G12D 및 Q61H의 단일 카피("KRAS 4x1"; 카세트 = 서열번호: 66), 각각의 KRAS 네오에피토프 G12C, G12V, G12D 및 Q61H의 4회 반복("KRAS 4X(4x4)"; 카세트 = 서열번호: 65), 또는 KRAS 네오에피토프 G12C, G12V, G12D 또는 Q61H 중 하나만의 4회 반복("KRAS 1x4")를 특징으로 하는 카세트의 효능을 평가하기 위해 일련의 ChAdV68 전달 벡터를 설계했다.

KRAS 네오에피토프의 단일 카피("4x1") 또는 각각의 KRAS 네오에피토프의 4회 반복("4x4")을 특징으로 하는 카세트를 비교하였다. 도 3에 도시되고 표 6에서 정량화된 바와 같이, 네오에피토프의 다중 반복을 특징으로 하는 벡터를 사용한 백신접종은 증가된 스팟 형성 콜로니(SFC)를 입증했으며, 이는 카세트에서 에피토프 -코딩 서열의 반복이 ChAdV68 전달 시스템을 사용하는 KRAS 네오에피토프, 구체적으로 G12V 및 G12D 네오에피토프에 대한 항원-특이적 면역 반응을 증가시켰음을 나타낸다.

각각의 KRAS 네오에피토프의 4회 반복("4x4") 또는 KRAS 중 하나만의 4회 반복("1x4")을 특징으로 하는 카세트를 비교하였다. 도 4에 도시되고 표 7에서 정량화된 바와 같이, 4x4 또는 1x4 형식으로 네오에피토프의 다중 반복을 특징으로 하는 벡터를 사용한 백신접종은 스팟 형성 콜로니(SFC)에 의해 면역 반응을 생성하고 형식 간에 비교가능하여 카세트에서 에피토프-코딩 서열의 반복이 ChAdV68 전달 시스템을 사용하여 KRAS 네오에피토프, 구체적으로 G12V 및 G12D 네오에피토프에 대한 증가된 항원-특이적 면역 반응을 초래함을 나타낸다.

19개의 다른 별개의 네오에피토프를 갖는 KRAS Q61H의 단일 카피("20x1"), KRAS Q61H의 2회 반복("8x2"), KRAS G12 네오에피토프의 단일 카피를 갖는 KRAS Q61H의 단일 카피("4x1"), KRAS G12 네오에피토프 반복을 갖는 KRAS Q61H의 4회 반복("4x4"); 또는 KRAS Q61H("1x4")만의 4회 반복을 특징으로 하는 카세트를 포함하여 KRAS Q61H에 대한 카세트 형식에 대한 면역 반응을 비교했다. 도 5에 도시되고 표 8에서 정량화된 바와 같이, 단일 카피의 KRAS G12 네오에피토프와 함께 KRAS Q61H의 단일 카피를 갖는 벡터로 백신접종은 더 큰 카세트(4x1 대 20x1 또는 8x2)에 비해 약간의 개선을 보인 반면, 4x4 또는 1x4 형식에서 네오에피토프의 다중 반복을 특징으로 하는 벡터로 백신접종은 가장 강력한 반응을 나타내는 1x4 형식의 스팟 형성 콜로니(SFC)에 의해 면역 반응을 생성했으며, 이는 카세트에서 에피토프-코딩 서열의 반복 및 더 짧은 형식 및/또는 추가의 별개의 네오에피토프 제거가ChAdV68 전달 시스템을 사용하여 KRAS 네오에피토프 Q61H에 대한 증가된 항원-특이적 면역 반응을 유발함을 나타낸다.

ChAdV68 전달 시스템 또는 SAM 전달 시스템으로 면역화 후 반응을 비교하였다. KRAS 네오에피토프의 단일 카피 뿐만 아니라 다른 네오에피토프("20x1") 또는 각 KRAS 네오에피토프의 4회 반복("4x4")을 특징으로 하는 카세트를 평가했다. 도 6 및 도 7에 도시되고 표 9에서 정량화된 바와 같이, 네오에피토프의 다중 반복을 특징으로 하는 벡터를 사용한 백신접종은 ChAdV68 및 SAM 형식 모두에 대해 증가된 스팟 형성 콜로니(SFC)를 입증했으며, 이는 카세트에서 에피토프-코딩 서열의 반복이 ChAdV68 또는 SAM 전달 시스템을 사용하여 KRAS 네오에피토프, 구체적으로 G12V 및 G12D 네오에피토프에 대해 항원-특이적 면역 반응을 증가시켰음을 나타내며, 이는 네오에피토프의 반복을 특징으로 하는 카세트를 갖는 개선된 반응이 사용된 벡터 플랫폼에 구애받지 않음을 시사한다.

표 6 - KRAS 네오에피토프 G12V 및 G12D +/- 반복에 대한 ELISpot 데이터

표 7 - KRAS 네오에피토프 G12V 및 G12D +/- 반복에 대한 ELISpot 데이터

* 결과는 형식 간에 크게 다르지 않았다(p = 0.1896)

표 8 - KRAS 네오에피토프 Q61H +/- 반복에 대한 ELISpot 데이터

표 9 - Chad/SAM 형식에서 KRAS G12V 및 G12D +/- 반복에 대한 ELISpot

특정 서열

본원에서 언급된 벡터, 카세트 및 항체는 하기에 기술되고 서열번호에 의해 참조된다.

참고문헌

SEQUENCE LISTING <110> GRITSTONE ONCOLOGY, INC. <120> MULTIEPITOPE VACCINE CASSETTES <130> GSO-095 <140> <141> <150> <151> <160> 56 <170> PatentIn version 3.5 <210> 1 <211> 36519 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 1 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagatga ggcacctgag agacctgccc 600 gatgagaaaa tcatcatcgc ttccgggaac gagattctgg aactggtggt aaatgccatg 660 atgggcgacg accctccgga gccccccacc ccatttgaga caccttcgct gcacgatttg 720 tatgatctgg aggtggatgt gcccgaggac gatcccaatg aggaggcggt aaatgatttt 780 tttagcgatg ccgcgctgct agctgccgag gaggcttcga gctctagctc agacagcgac 840 tcttcactgc atacccctag acccggcaga ggtgagaaaa agatccccga gcttaaaggg 900 gaagagatgg acttgcgctg ctatgaggaa tgcttgcccc cgagcgatga tgaggacgag 960 caggcgatcc agaacgcagc gagccaggga gtgcaagccg ccagcgagag ctttgcgctg 1020 gactgcccgc ctctgcccgg acacggctgt aagtcttgtg aatttcatcg catgaatact 1080 ggagataaag ctgtgttgtg tgcactttgc tatatgagag cttacaacca ttgtgtttac 1140 agtaagtgtg attaagttga actttagagg gaggcagaga gcagggtgac tgggcgatga 1200 ctggtttatt tatgtatata tgttctttat ataggtcccg tctctgacgc agatgatgag 1260 acccccacta caaagtccac ttcgtcaccc ccagaaattg gcacatctcc acctgagaat 1320 attgttagac cagttcctgt tagagccact gggaggagag cagctgtgga atgtttggat 1380 gacttgctac agggtggggt tgaacctttg gacttgtgta cccggaaacg ccccaggcac 1440 taagtgccac acatgtgtgt ttacttgagg tgatgtcagt atttataggg tgtggagtgc 1500 aataaaaaat gtgttgactt taagtgcgtg gtttatgact caggggtggg gactgtgagt 1560 atataagcag gtgcagacct gtgtggttag ctcagagcgg catggagatt tggacggtct 1620 tggaagactt tcacaagact agacagctgc tagagaacgc ctcgaacgga gtctcttacc 1680 tgtggagatt ctgcttcggt ggcgacctag ctaggctagt ctacagggcc aaacaggatt 1740 atagtgaaca atttgaggtt attttgagag agtgttctgg tctttttgac gctcttaact 1800 tgggccatca gtctcacttt aaccagagga tttcgagagc ccttgatttt actactcctg 1860 gcagaaccac tgcagcagta gccttttttg cttttattct tgacaaatgg agtcaagaaa 1920 cccatttcag cagggattac cagctggatt tcttagcagt agctttgtgg agaacatgga 1980 agtgccagcg cctgaatgca atctccggct acttgccggt acagccgcta gacactctga 2040 ggatcctgaa tctccaggag agtcccaggg cacgccaacg tcgccagcag cagcagcagg 2100 aggaggatca agaagagaac ccgagagccg gcctggaccc tccggcggag gaggaggagt 2160 agctgacctg tttcctgaac tgcgccgggt gctgactagg tcttcgagtg gtcgggagag 2220 ggggattaag cgggagaggc atgatgagac taatcacaga actgaactga ctgtgggtct 2280 gatgagtcgc aagcgcccag aaacagtgtg gtggcatgag gtgcagtcga ctggcacaga 2340 tgaggtgtcg gtgatgcatg agaggttttc tctagaacaa gtcaagactt gttggttaga 2400 gcctgaggat gattgggagg tagccatcag gaattatgcc aagctggctc tgaggccaga 2460 caagaagtac aagattacta agctgataaa tatcagaaat gcctgctaca tctcagggaa 2520 tggggctgaa gtggagatct gtctccagga aagggtggct ttcagatgct gcatgatgaa 2580 tatgtacccg ggagtggtgg gcatggatgg ggttaccttt atgaacatga ggttcagggg 2640 agatgggtat aatggcacgg tctttatggc caataccaag ctgacagtcc atggctgctc 2700 cttctttggg tttaataaca cctgcatcga ggcctggggt caggtcggtg tgaggggctg 2760 cagtttttca gccaactgga tgggggtcgt gggcaggacc aagagtatgc tgtccgtgaa 2820 gaaatgcttg tttgagaggt gccacctggg ggtgatgagc gagggcgaag ccagaatccg 2880 ccactgcgcc tctaccgaga cgggctgctt tgtgctgtgc aagggcaatg ctaagatcaa 2940 gcataatatg atctgtggag cctcggacga gcgcggctac cagatgctga cctgcgccgg 3000 cgggaacagc catatgctgg ccaccgtaca tgtggcttcc catgctcgca agccctggcc 3060 cgagttcgag cacaatgtca tgaccaggtg caatatgcat ctggggtccc gccgaggcat 3120 gttcatgccc taccagtgca acctgaatta tgtgaaggtg ctgctggagc ccgatgccat 3180 gtccagagtg agcctgacgg gggtgtttga catgaatgtg gaggtgtgga agattctgag 3240 atatgatgaa tccaagacca ggtgccgagc ctgcgagtgc ggagggaagc atgccaggtt 3300 ccagcccgtg tgtgtggatg tgacggagga cctgcgaccc gatcatttgg tgttgccctg 3360 caccgggacg gagttcggtt ccagcgggga agaatctgac tagagtgagt agtgttctgg 3420 ggcgggggag gacctgcatg agggccagaa taactgaaat ctgtgctttt ctgtgtgttg 3480 cagcagcatg agcggaagcg gctcctttga gggaggggta ttcagccctt atctgacggg 3540 gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg tggacggccg 3600 gcccgtgcag cccgcgaact cttcaaccct gacctatgca accctgagct cttcgtcgtt 3660 ggacgcagct gccgccgcag ctgctgcatc tgccgccagc gccgtgcgcg gaatggccat 3720 gggcgccggc tactacggca ctctggtggc caactcgagt tccaccaata atcccgccag 3780 cctgaacgag gagaagctgt tgctgctgat ggcccagctc gaggccttga cccagcgcct 3840 gggcgagctg acccagcagg tggctcagct gcaggagcag acgcgggccg cggttgccac 3900 ggtgaaatcc aaataaaaaa tgaatcaata aataaacgga gacggttgtt gattttaaca 3960 cagagtctga atctttattt gatttttcgc gcgcggtagg ccctggacca ccggtctcga 4020 tcattgagca cccggtggat cttttccagg acccggtaga ggtgggcttg gatgttgagg 4080 tacatgggca tgagcccgtc ccgggggtgg aggtagctcc attgcagggc ctcgtgctcg 4140 ggggtggtgt tgtaaatcac ccagtcatag caggggcgca gggcatggtg ttgcacaata 4200 tctttgagga ggagactgat ggccacgggc agccctttgg tgtaggtgtt tacaaatctg 4260 ttgagctggg agggatgcat gcggggggag atgaggtgca tcttggcctg gatcttgaga 4320 ttggcgatgt taccgcccag atcccgcctg gggttcatgt tgtgcaggac caccagcacg 4380 gtgtatccgg tgcacttggg gaatttatca tgcaacttgg aagggaaggc gtgaaagaat 4440 ttggcgacgc ctttgtgccc gcccaggttt tccatgcact catccatgat gatggcgatg 4500 ggcccgtggg cggcggcctg ggcaaagacg tttcgggggt cggacacatc atagttgtgg 4560 tcctgggtga ggtcatcata ggccatttta atgaatttgg ggcggagggt gccggactgg 4620 gggacaaagg taccctcgat cccgggggcg tagttcccct cacagatctg catctcccag 4680 gctttgagct cggagggggg gatcatgtcc acctgcgggg cgataaagaa cacggtttcc 4740 ggggcggggg agatgagctg ggccgaaagc aagttccgga gcagctggga cttgccgcag 4800 ccggtggggc cgtagatgac cccgatgacc ggctgcaggt ggtagttgag ggagagacag 4860 ctgccgtcct cccggaggag gggggccacc tcgttcatca tctcgcgcac gtgcatgttc 4920 tcgcgcacca gttccgccag gaggcgctct ccccccaggg ataggagctc ctggagcgag 4980 gcgaagtttt tcagcggctt gagtccgtcg gccatgggca ttttggagag ggtttgttgc 5040 aagagttcca ggcggtccca gagctcggtg atgtgctcta cggcatctcg atccagcaga 5100 cctcctcgtt tcgcgggttg ggacggctgc gggagtaggg caccagacga tgggcgtcca 5160 gcgcagccag ggtccggtcc ttccagggtc gcagcgtccg cgtcagggtg gtctccgtca 5220 cggtgaaggg gtgcgcgccg ggctgggcgc ttgcgagggt gcgcttcagg ctcatccggc 5280 tggtcgaaaa ccgctcccga tcggcgccct gcgcgtcggc caggtagcaa ttgaccatga 5340 gttcgtagtt gagcgcctcg gccgcgtggc ctttggcgcg gagcttacct ttggaagtct 5400 gcccgcaggc gggacagagg agggacttga gggcgtagag cttgggggcg aggaagacgg 5460 actcgggggc gtaggcgtcc gcgccgcagt gggcgcagac ggtctcgcac tccacgagcc 5520 aggtgaggtc gggctggtcg gggtcaaaaa ccagtttccc gccgttcttt ttgatgcgtt 5580 tcttaccttt ggtctccatg agctcgtgtc cccgctgggt gacaaagagg ctgtccgtgt 5640 ccccgtagac cgactttatg ggccggtcct cgagcggtgt gccgcggtcc tcctcgtaga 5700 ggaaccccgc ccactccgag acgaaagccc gggtccaggc cagcacgaag gaggccacgt 5760 gggacgggta gcggtcgttg tccaccagcg ggtccacctt ttccagggta tgcaaacaca 5820 tgtccccctc gtccacatcc aggaaggtga ttggcttgta agtgtaggcc acgtgaccgg 5880 gggtcccggc cgggggggta taaaagggtg cgggtccctg ctcgtcctca ctgtcttccg 5940 gatcgctgtc caggagcgcc agctgttggg gtaggtattc cctctcgaag gcgggcatga 6000 cctcggcact caggttgtca gtttctagaa acgaggagga tttgatattg acggtgccgg 6060 cggagatgcc tttcaagagc ccctcgtcca tctggtcaga aaagacgatc tttttgttgt 6120 cgagcttggt ggcgaaggag ccgtagaggg cgttggagag gagcttggcg atggagcgca 6180 tggtctggtt tttttccttg tcggcgcgct ccttggcggc gatgttgagc tgcacgtact 6240 cgcgcgccac gcacttccat tcggggaaga cggtggtcag ctcgtcgggc acgattctga 6300 cctgccagcc ccgattatgc agggtgatga ggtccacact ggtggccacc tcgccgcgca 6360 ggggctcatt agtccagcag aggcgtccgc ccttgcgcga gcagaagggg ggcagggggt 6420 ccagcatgac ctcgtcgggg gggtcggcat cgatggtgaa gatgccgggc aggaggtcgg 6480 ggtcaaagta gctgatggaa gtggccagat cgtccagggc agcttgccat tcgcgcacgg 6540 ccagcgcgcg ctcgtaggga ctgaggggcg tgccccaggg catgggatgg gtaagcgcgg 6600 aggcgtacat gccgcagatg tcgtagacgt agaggggctc ctcgaggatg ccgatgtagg 6660 tggggtagca gcgccccccg cggatgctgg cgcgcacgta gtcatacagc tcgtgcgagg 6720 gggcgaggag ccccgggccc aggttggtgc gactgggctt ttcggcgcgg tagacgatct 6780 ggcggaaaat ggcatgcgag ttggaggaga tggtgggcct ttggaagatg ttgaagtggg 6840 cgtggggcag tccgaccgag tcgcggatga agtgggcgta ggagtcttgc agcttggcga 6900 cgagctcggc ggtgactagg acgtccagag cgcagtagtc gagggtctcc tggatgatgt 6960 catacttgag ctgtcccttt tgtttccaca gctcgcggtt gagaaggaac tcttcgcggt 7020 ccttccagta ctcttcgagg gggaacccgt cctgatctgc acggtaagag cctagcatgt 7080 agaactggtt gacggccttg taggcgcagc agcccttctc cacggggagg gcgtaggcct 7140 gggcggcctt gcgcagggag gtgtgcgtga gggcgaaagt gtccctgacc atgaccttga 7200 ggaactggtg cttgaagtcg atatcgtcgc agcccccctg ctcccagagc tggaagtccg 7260 tgcgcttctt gtaggcgggg ttgggcaaag cgaaagtaac atcgttgaag aggatcttgc 7320 ccgcgcgggg cataaagttg cgagtgatgc ggaaaggttg gggcacctcg gcccggttgt 7380 tgatgacctg ggcggcgagc acgatctcgt cgaagccgtt gatgttgtgg cccacgatgt 7440 agagttccac gaatcgcgga cggcccttga cgtggggcag tttcttgagc tcctcgtagg 7500 tgagctcgtc ggggtcgctg agcccgtgct gctcgagcgc ccagtcggcg agatgggggt 7560 tggcgcggag gaaggaagtc cagagatcca cggccagggc ggtttgcaga cggtcccggt 7620 actgacggaa ctgctgcccg acggccattt tttcgggggt gacgcagtag aaggtgcggg 7680 ggtccccgtg ccagcgatcc catttgagct ggagggcgag atcgagggcg agctcgacga 7740 gccggtcgtc cccggagagt ttcatgacca gcatgaaggg gacgagctgc ttgccgaagg 7800 accccatcca ggtgtaggtt tccacatcgt aggtgaggaa gagcctttcg gtgcgaggat 7860 gcgagccgat ggggaagaac tggatctcct gccaccaatt ggaggaatgg ctgttgatgt 7920 gatggaagta gaaatgccga cggcgcgccg aacactcgtg cttgtgttta tacaagcggc 7980 cacagtgctc gcaacgctgc acgggatgca cgtgctgcac gagctgtacc tgagttcctt 8040 tgacgaggaa tttcagtggg aagtggagtc gtggcgcctg catctcgtgc tgtactacgt 8100 cgtggtggtc ggcctggccc tcttctgcct cgatggtggt catgctgacg agcccgcgcg 8160 ggaggcaggt ccagacctcg gcgcgagcgg gtcggagagc gaggacgagg gcgcgcaggc 8220 cggagctgtc cagggtcctg agacgctgcg gagtcaggtc agtgggcagc ggcggcgcgc 8280 ggttgacttg caggagtttt tccagggcgc gcgggaggtc cagatggtac ttgatctcca 8340 ccgcgccatt ggtggcgacg tcgatggctt gcagggtccc gtgcccctgg ggtgtgacca 8400 ccgtcccccg tttcttcttg ggcggctggg gcgacggggg cggtgcctct tccatggtta 8460 gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520 cggcaggggc acgtcggcgc cgcgcgcggg taggttctgg tactgcgccc ggagaagact 8580 ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640 gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700 ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760 catgaactgc tcgatctcct cctcttgaag gtctccgcgg ccggcgcgct ccacggtggc 8820 cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc ccgcctcgtt 8880 ccagacgcgg ctgtagacca cgacgccctc gggatcgcgg gcgcgcatga ccacctgggc 8940 gaggttgagc tccacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000 gttgagcgtg gtggcgatgt gctcggtgac gaagaaatac atgatccagc ggcggagcgg 9060 catctcgctg acgtcgccca gcgcctccaa acgttccatg gcctcgtaaa agtccacggc 9120 gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180 gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc cccgggagtt cctccacttc 9240 ctcttcttcc tcctccacta acatctcttc tacttcctcc tcaggcggca gtggtggcgg 9300 gggagggggc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360 ctcgccgcgc cggcgtcgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420 cgtgaagacg ccgccgcgca tctccaggtg gccggggggg tccccgttgg gcagggagag 9480 ggcgctgacg atgcatctta tcaattgccc cgtagggact ccgcgcaagg acctgagcgt 9540 ctcgagatcc acgggatctg aaaaccgctg aacgaaggct tcgagccagt cgcagtcgca 9600 aggtaggctg agcacggttt cttctggcgg gtcatgttgg ttgggagcgg ggcgggcgat 9660 gctgctggtg atgaagttga aataggcggt tctgagacgg cggatggtgg cgaggagcac 9720 caggtctttg ggcccggctt gctggatgcg cagacggtcg gccatgcccc aggcgtggtc 9780 ctgacacctg gccaggtcct tgtagtagtc ctgcatgagc cgctccacgg gcacctcctc 9840 ctcgcccgcg cggccgtgca tgcgcgtgag cccgaagccg cgctggggct ggacgagcgc 9900 caggtcggcg acgacgcgct cggcgaggat ggcttgctgg atctgggtga gggtggtctg 9960 gaagtcatca aagtcgacga agcggtggta ggctccggtg ttgatggtgt aggagcagtt 10020 ggccatgacg gaccagttga cggtctggtg gcccggacgc acgagctcgt ggtacttgag 10080 gcgcgagtag gcgcgcgtgt cgaagatgta gtcgttgcag gtgcgcacca ggtactggta 10140 gccgatgagg aagtgcggcg gcggctggcg gtagagcggc catcgctcgg tggcgggggc 10200 gccgggcgcg aggtcctcga gcatggtgcg gtggtagccg tagatgtacc tggacatcca 10260 ggtgatgccg gcggcggtgg tggaggcgcg cgggaactcg cggacgcggt tccagatgtt 10320 gcgcagcggc aggaagtagt tcatggtggg cacggtctgg cccgtgaggc gcgcgcagtc 10380 gtggatgctc tatacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440 gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500 ccgcagctaa cgtggtattg gcactcccgt ctcgacccaa gcctgcacca accctccagg 10560 atacggaggc gggtcgtttt gcaacttttt tttggaggcc ggatgagact agtaagcgcg 10620 gaaagcggcc gaccgcgatg gctcgctgcc gtagtctgga gaagaatcgc cagggttgcg 10680 ttgcggtgtg ccccggttcg aggccggccg gattccgcgg ctaacgaggg cgtggctgcc 10740 ccgtcgtttc caagacccca tagccagccg acttctccag ttacggagcg agcccctctt 10800 ttgttttgtt tgtttttgcc agatgcatcc cgtactgcgg cagatgcgcc cccaccaccc 10860 tccaccgcaa caacagcccc ctccacagcc ggcgcttctg cccccgcccc agcagcaact 10920 tccagccacg accgccgcgg ccgccgtgag cggggctgga cagagttatg atcaccagct 10980 ggccttggaa gagggcgagg ggctggcgcg cctgggggcg tcgtcgccgg agcggcaccc 11040 gcgcgtgcag atgaaaaggg acgctcgcga ggcctacgtg cccaagcaga acctgttcag 11100 agacaggagc ggcgaggagc ccgaggagat gcgcgcggcc cggttccacg cggggcggga 11160 gctgcggcgc ggcctggacc gaaagagggt gctgagggac gaggatttcg aggcggacga 11220 gctgacgggg atcagccccg cgcgcgcgca cgtggccgcg gccaacctgg tcacggcgta 11280 cgagcagacc gtgaaggagg agagcaactt ccaaaaatcc ttcaacaacc acgtgcgcac 11340 cctgatcgcg cgcgaggagg tgaccctggg cctgatgcac ctgtgggacc tgctggaggc 11400 catcgtgcag aaccccacca gcaagccgct gacggcgcag ctgttcctgg tggtgcagca 11460 tagtcgggac aacgaagcgt tcagggaggc gctgctgaat atcaccgagc ccgagggccg 11520 ctggctcctg gacctggtga acattctgca gagcatcgtg gtgcaggagc gcgggctgcc 11580 gctgtccgag aagctggcgg ccatcaactt ctcggtgctg agtttgggca agtactacgc 11640 taggaagatc tacaagaccc cgtacgtgcc catagacaag gaggtgaaga tcgacgggtt 11700 ttacatgcgc atgaccctga aagtgctgac cctgagcgac gatctggggg tgtaccgcaa 11760 cgacaggatg caccgtgcgg tgagcgccag caggcggcgc gagctgagcg accaggagct 11820 gatgcatagt ctgcagcggg ccctgaccgg ggccgggacc gagggggaga gctactttga 11880 catgggcgcg gacctgcact ggcagcccag ccgccgggcc ttggaggcgg cggcaggacc 11940 ctacgtagaa gaggtggacg atgaggtgga cgaggagggc gagtacctgg aagactgatg 12000 gcgcgaccgt atttttgcta gatgcaacaa caacagccac ctcctgatcc cgcgatgcgg 12060 gcggcgctgc agagccagcc gtccggcatt aactcctcgg acgattggac ccaggccatg 12120 caacgcatca tggcgctgac gacccgcaac cccgaagcct ttagacagca gccccaggcc 12180 aaccggctct cggccatcct ggaggccgtg gtgccctcgc gctccaaccc cacgcacgag 12240 aaggtcctgg ccatcgtgaa cgcgctggtg gagaacaagg ccatccgcgg cgacgaggcc 12300 ggcctggtgt acaacgcgct gctggagcgc gtggcccgct acaacagcac caacgtgcag 12360 accaacctgg accgcatggt gaccgacgtg cgcgaggccg tggcccagcg cgagcggttc 12420 caccgcgagt ccaacctggg atccatggtg gcgctgaacg ccttcctcag cacccagccc 12480 gccaacgtgc cccggggcca ggaggactac accaacttca tcagcgccct gcgcctgatg 12540 gtgaccgagg tgccccagag cgaggtgtac cagtccgggc cggactactt cttccagacc 12600 agtcgccagg gcttgcagac cgtgaacctg agccaggctt tcaagaactt gcagggcctg 12660 tggggcgtgc aggccccggt cggggaccgc gcgacggtgt cgagcctgct gacgccgaac 12720 tcgcgcctgc tgctgctgct ggtggccccc ttcacggaca gcggcagcat caaccgcaac 12780 tcgtacctgg gctacctgat taacctgtac cgcgaggcca tcggccaggc gcacgtggac 12840 gagcagacct accaggagat cacccacgtg agccgcgccc tgggccagga cgacccgggc 12900 aacctggaag ccaccctgaa ctttttgctg accaaccggt cgcagaagat cccgccccag 12960 tacgcgctca gcaccgagga ggagcgcatc ctgcgttacg tgcagcagag cgtgggcctg 13020 ttcctgatgc aggagggggc cacccccagc gccgcgctcg acatgaccgc gcgcaacatg 13080 gagcccagca tgtacgccag caaccgcccg ttcatcaata aactgatgga ctacttgcat 13140 cgggcggccg ccatgaactc tgactatttc accaacgcca tcctgaatcc ccactggctc 13200 ccgccgccgg ggttctacac gggcgagtac gacatgcccg accccaatga cgggttcctg 13260 tgggacgatg tggacagcag cgtgttctcc ccccgaccgg gtgctaacga gcgccccttg 13320 tggaagaagg aaggcagcga ccgacgcccg tcctcggcgc tgtccggccg cgagggtgct 13380 gccgcggcgg tgcccgaggc cgccagtcct ttcccgagct tgcccttctc gctgaacagt 13440 atccgcagca gcgagctggg caggatcacg cgcccgcgct tgctgggcga agaggagtac 13500 ttgaatgact cgctgttgag acccgagcgg gagaagaact tccccaataa cgggatagaa 13560 agcctggtgg acaagatgag ccgctggaag acgtatgcgc aggagcacag ggacgatccc 13620 cgggcgtcgc agggggccac gagccggggc agcgccgccc gtaaacgccg gtggcacgac 13680 aggcagcggg gacagatgtg ggacgatgag gactccgccg acgacagcag cgtgttggac 13740 ttgggtggga gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg catgatgtaa 13800 gagaaaccga aaataaatga tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860 tctctgttgt tgttgtatct agtatgatga ggcgtgcgta cccggagggt cctcctccct 13920 cgtacgagag cgtgatgcag caggcgatgg cggcggcggc gatgcagccc ccgctggagg 13980 ctccttacgt gcccccgcgg tacctggcgc ctacggaggg gcggaacagc attcgttact 14040 cggagctggc acccttgtac gataccaccc ggttgtacct ggtggacaac aagtcggcgg 14100 acatcgcctc gctgaactac cagaacgacc acagcaactt cctgaccacc gtggtgcaga 14160 acaatgactt cacccccacg gaggccagca cccagaccat caactttgac gagcgctcgc 14220 ggtggggcgg ccagctgaaa accatcatgc acaccaacat gcccaacgtg aacgagttca 14280 tgtacagcaa caagttcaag gcgcgggtga tggtctcccg caagaccccc aatggggtga 14340 cagtgacaga ggattatgat ggtagtcagg atgagctgaa gtatgaatgg gtggaatttg 14400 agctgcccga aggcaacttc tcggtgacca tgaccatcga cctgatgaac aacgccatca 14460 tcgacaatta cttggcggtg gggcggcaga acggggtgct ggagagcgac atcggcgtga 14520 agttcgacac taggaacttc aggctgggct gggaccccgt gaccgagctg gtcatgcccg 14580 gggtgtacac caacgaggct ttccatcccg atattgtctt gctgcccggc tgcggggtgg 14640 acttcaccga gagccgcctc agcaacctgc tgggcattcg caagaggcag cccttccagg 14700 aaggcttcca gatcatgtac gaggatctgg aggggggcaa catccccgcg ctcctggatg 14760 tcgacgccta tgagaaaagc aaggaggatg cagcagctga agcaactgca gccgtagcta 14820 ccgcctctac cgaggtcagg ggcgataatt ttgcaagcgc cgcagcagtg gcagcggccg 14880 aggcggctga aaccgaaagt aagatagtca ttcagccggt ggagaaggat agcaagaaca 14940 ggagctacaa cgtactaccg gacaagataa acaccgccta ccgcagctgg tacctagcct 15000 acaactatgg cgaccccgag aagggcgtgc gctcctggac gctgctcacc acctcggacg 15060 tcacctgcgg cgtggagcaa gtctactggt cgctgcccga catgatgcaa gacccggtca 15120 ccttccgctc cacgcgtcaa gttagcaact acccggtggt gggcgccgag ctcctgcccg 15180 tctactccaa gagcttcttc aacgagcagg ccgtctactc gcagcagctg cgcgccttca 15240 cctcgcttac gcacgtcttc aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg 15300 cgcccaccat taccaccgtc agtgaaaacg ttcctgctct cacagatcac gggaccctgc 15360 cgctgcgcag cagtatccgg ggagtccagc gcgtgaccgt tactgacgcc agacgccgca 15420 cctgccccta cgtctacaag gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca 15480 ccttctaaat gtccattctc atctcgccca gtaataacac cggttggggc ctgcgcgcgc 15540 ccagcaagat gtacggaggc gctcgccaac gctccacgca acaccccgtg cgcgtgcgcg 15600 ggcacttccg cgctccctgg ggcgccctca agggccgcgt gcggtcgcgc accaccgtcg 15660 acgacgtgat cgaccaggtg gtggccgacg cgcgcaacta cacccccgcc gccgcgcccg 15720 tctccaccgt ggacgccgtc atcgacagcg tggtggccga cgcgcgccgg tacgcccgcg 15780 ccaagagccg gcggcggcgc atcgcccggc ggcaccggag cacccccgcc atgcgcgcgg 15840 cgcgagcctt gctgcgcagg gccaggcgca cgggacgcag ggccatgctc agggcggcca 15900 gacgcgcggc ttcaggcgcc agcgccggca ggacccggag acgcgcggcc acggcggcgg 15960 cagcggccat cgccagcatg tcccgcccgc ggcgagggaa cgtgtactgg gtgcgcgacg 16020 ccgccaccgg tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgttcac 16080 ttcgcgatgt tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat tcaaggaaga 16140 gatgctccag gtcatcgcgc ctgagatcta cggccctgcg gtggtgaagg aggaaagaaa 16200 gccccgcaaa atcaagcggg tcaaaaagga caaaaaggaa gaagaaagtg atgtggacgg 16260 attggtggag tttgtgcgcg agttcgcccc ccggcggcgc gtgcagtggc gcgggcggaa 16320 ggtgcaaccg gtgctgagac ccggcaccac cgtggtcttc acgcccggcg agcgctccgg 16380 caccgcttcc aagcgctcct acgacgaggt gtacggggat gatgatattc tggagcaggc 16440 ggccgagcgc ctgggcgagt ttgcttacgg caagcgcagc cgttccgcac cgaaggaaga 16500 ggcggtgtcc atcccgctgg accacggcaa ccccacgccg agcctcaagc ccgtgacctt 16560 gcagcaggtg ctgccgaccg cggcgccgcg ccgggggttc aagcgcgagg gcgaggatct 16620 gtaccccacc atgcagctga tggtgcccaa gcgccagaag ctggaagacg tgctggagac 16680 catgaaggtg gacccggacg tgcagcccga ggtcaaggtg cggcccatca agcaggtggc 16740 cccgggcctg ggcgtgcaga ccgtggacat caagattccc acggagccca tggaaacgca 16800 gaccgagccc atgatcaagc ccagcaccag caccatggag gtgcagacgg atccctggat 16860 gccatcggct cctagtcgaa gaccccggcg caagtacggc gcggccagcc tgctgatgcc 16920 caactacgcg ctgcatcctt ccatcatccc cacgccgggc taccgcggca cgcgcttcta 16980 ccgcggtcat accagcagcc gccgccgcaa gaccaccact cgccgccgcc gtcgccgcac 17040 cgccgctgca accacccctg ccgccctggt gcggagagtg taccgccgcg gccgcgcacc 17100 tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaaactt tcgcctgctt 17160 tgcagatcaa tggccctcac atgccgcctt cgcgttccca ttacgggcta ccgaggaaga 17220 aaaccgcgcc gtagaaggct ggcggggaac gggatgcgtc gccaccacca ccggcggcgg 17280 cgcgccatca gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc 17340 gcggcgatcg gggcgatccc cggcattgct tccgtggcgg tgcaggcctc tcagcgccac 17400 tgagacacac ttggaaacat cttgtaataa accaatggac tctgacgctc ctggtcctgt 17460 gatgtgtttt cgtagacaga tggaagacat caatttttcg tccctggctc cgcgacacgg 17520 cacgcggccg ttcatgggca cctggagcga catcggcacc agccaactga acgggggcgc 17580 cttcaattgg agcagtctct ggagcgggct taagaatttc gggtccacgc ttaaaaccta 17640 tggcagcaag gcgtggaaca gcaccacagg gcaggcgctg agggataagc tgaaagagca 17700 gaacttccag cagaaggtgg tcgatgggct cgcctcgggc atcaacgggg tggtggacct 17760 ggccaaccag gccgtgcagc ggcagatcaa cagccgcctg gacccggtgc cgcccgccgg 17820 ctccgtggag atgccgcagg tggaggagga gctgcctccc ctggacaagc ggggcgagaa 17880 gcgaccccgc cccgatgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta 17940 cgaggaggcg gtgaaactgg gtctgcccac cacgcggccc atcgcgcccc tggccaccgg 18000 ggtgctgaaa cccgaaaagc ccgcgaccct ggacttgcct cctccccagc cttcccgccc 18060 ctctacagtg gctaagcccc tgccgccggt ggccgtggcc cgcgcgcgac ccgggggcac 18120 cgcccgccct catgcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca 18180 gagtgtgaag cgccgccgct gctattaaac ctaccgtagc gcttaacttg cttgtctgtg 18240 tgtgtatgta ttatgtcgcc gccgccgctg tccaccagaa ggaggagtga agaggcgcgt 18300 cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg 18360 ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagtttgcc cgcgccacag 18420 acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg 18480 tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca 18540 acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca 18600 tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct 18660 actccggcac cgcctacaac agtctggccc ccaagggagc acccaacact tgtcagtgga 18720 catataaagc cgatggtgaa actgccacag aaaaaaccta tacatatgga aatgcacccg 18780 tgcagggcat taacatcaca aaagatggta ttcaacttgg aactgacacc gatgatcagc 18840 caatctacgc agataaaacc tatcagcctg aacctcaagt gggtgatgct gaatggcatg 18900 acatcactgg tactgatgaa aagtatggag gcagagctct taagcctgat accaaaatga 18960 agccttgtta tggttctttt gccaagccta ctaataaaga aggaggtcag gcaaatgtga 19020 aaacaggaac aggcactact aaagaatatg acatagacat ggctttcttt gacaacagaa 19080 gtgcggctgc tgctggccta gctccagaaa ttgttttgta tactgaaaat gtggatttgg 19140 aaactccaga tacccatatt gtatacaaag caggcacaga tgacagcagc tcttctatta 19200 atttgggtca gcaagccatg cccaacagac ctaactacat tggtttcaga gacaacttta 19260 tcgggctcat gtactacaac agcactggca atatgggggt gctggccggt caggcttctc 19320 agctgaatgc tgtggttgac ttgcaagaca gaaacaccga gctgtcctac cagctcttgc 19380 ttgactctct gggtgacaga acccggtatt tcagtatgtg gaatcaggcg gtggacagct 19440 atgatcctga tgtgcgcatt attgaaaatc atggtgtgga ggatgaactt cccaactatt 19500 gtttccctct ggatgctgtt ggcagaacag atacttatca gggaattaag gctaatggaa 19560 ctgatcaaac cacatggacc aaagatgaca gtgtcaatga tgctaatgag ataggcaagg 19620 gtaatccatt cgccatggaa atcaacatcc aagccaacct gtggaggaac ttcctctacg 19680 ccaacgtggc cctgtacctg cccgactctt acaagtacac gccggccaat gttaccctgc 19740 ccaccaacac caacacctac gattacatga acggccgggt ggtggcgccc tcgctggtgg 19800 actcctacat caacatcggg gcgcgctggt cgctggatcc catggacaac gtgaacccct 19860 tcaaccacca ccgcaatgcg gggctgcgct accgctccat gctcctgggc aacgggcgct 19920 acgtgccctt ccacatccag gtgccccaga aatttttcgc catcaagagc ctcctgctcc 19980 tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga 20040 gctccctcgg caacgacctg cgcacggacg gggcctccat ctccttcacc agcatcaacc 20100 tctacgccac cttcttcccc atggcgcaca acacggcctc cacgctcgag gccatgctgc 20160 gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc 20220 ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct 20280 tccgcggctg gtccttcacg cgtctcaaga ccaaggagac gccctcgctg ggctccgggt 20340 tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca 20400 accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg 20460 accggctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacggc gagggctaca 20520 acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca 20580 acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct 20640 tccgcaactt ccagcccatg agccgccagg tggtggacga ggtcaactac aaggactacc 20700 aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca 20760 ccatgcgcca gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg 20820 ccgtcaccag cgtcacccag aaaaagttcc tctgcgacag ggtcatgtgg cgcatcccct 20880 tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctatg 20940 ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc 21000 ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg 21060 tcatcgaggc cgtctacctg cgcaccccct tctcggccgg taacgccacc acctaagctc 21120 ttgcttcttg caagccatgg ccgcgggctc cggcgagcag gagctcaggg ccatcatccg 21180 cgacctgggc tgcgggccct acttcctggg caccttcgat aagcgcttcc cgggattcat 21240 ggccccgcac aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcga 21300 gcactggctg gccttcgcct ggaacccgcg ctcgaacacc tgctacctct tcgacccctt 21360 cgggttctcg gacgagcgcc tcaagcagat ctaccagttc gagtacgagg gcctgctgcg 21420 ccgcagcgcc ctggccaccg aggaccgctg cgtcaccctg gaaaagtcca cccagaccgt 21480 gcagggtccg cgctcggccg cctgcgggct cttctgctgc atgttcctgc acgccttcgt 21540 gcactggccc gaccgcccca tggacaagaa ccccaccatg aacttgctga cgggggtgcc 21600 caacggcatg ctccagtcgc cccaggtgga acccaccctg cgccgcaacc aggaggcgct 21660 ctaccgcttc ctcaactccc actccgccta ctttcgctcc caccgcgcgc gcatcgagaa 21720 ggccaccgcc ttcgaccgca tgaatcaaga catgtaaacc gtgtgtgtat gttaaatgtc 21780 tttaataaac agcactttca tgttacacat gcatctgaga tgatttattt agaaatcgaa 21840 agggttctgc cgggtctcgg catggcccgc gggcagggac acgttgcgga actggtactt 21900 ggccagccac ttgaactcgg ggatcagcag tttgggcagc ggggtgtcgg ggaaggagtc 21960 ggtccacagc ttccgcgtca gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa 22020 atcgcagttg ggacccgcgt tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg 22080 gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg tgatgctctc 22140 cacgtcgagg tcctcggcgt tggccatccc gaagggggtc atcttgcagg tctgccttcc 22200 catggtgggc acgcacccgg gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat 22260 ctgggcctgg tcggcgttca tccccgggta catggccttc atgaaagcct ccaattgcct 22320 gaacgcctgc tgggccttgg ctccctcggt gaagaagacc ccgcaggact tgctagagaa 22380 ctggttggtg gcgcacccgg cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg 22440 caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt tctccttcag 22500 cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc atgtgctcct tctggatcat 22560 ggtggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag 22620 cgcgcacccg gtgcactccc agttcttgtg ggcgatctgg gaatgcgcgt gcacgaagcc 22680 ctgcaggaag cggcccatca tggtggtcag ggtcttgttg ctagtgaagg tcagcggaat 22740 gccgcggtgc tcctcgttga tgtacaggtg gcagatgcgg cggtacacct cgccctgctc 22800 gggcatcagc tggaagttgg ctttcaggtc ggtctccacg cggtagcggt ccatcagcat 22860 agtcatgatt tccataccct tctcccaggc cgagacgatg ggcaggctca tagggttctt 22920 caccatcatc ttagcgctag cagccgcggc cagggggtcg ctctcgtcca gggtctcaaa 22980 gctccgcttg ccgtccttct cggtgatccg caccgggggg tagctgaagc ccacggccgc 23040 cagctcctcc tcggcctgtc tttcgtcctc gctgtcctgg ctgacgtcct gcaggaccac 23100 atgcttggtc ttgcggggtt tcttcttggg cggcagcggc ggcggagatg ttggagatgg 23160 cgagggggag cgcgagttct cgctcaccac tactatctct tcctcttctt ggtccgaggc 23220 cacgcggcgg taggtatgtc tcttcggggg cagaggcgga ggcgacgggc tctcgccgcc 23280 gcgacttggc ggatggctgg cagagcccct tccgcgttcg ggggtgcgct cccggcggcg 23340 ctctgactga cttcctccgc ggccggccat tgtgttctcc tagggaggaa caacaagcat 23400 ggagactcag ccatcgccaa cctcgccatc tgcccccacc gccgacgaga agcagcagca 23460 gcagaatgaa agcttaaccg ccccgccgcc cagccccgcc acctccgacg cggccgtccc 23520 agacatgcaa gagatggagg aatccatcga gattgacctg ggctatgtga cgcccgcgga 23580 gcacgaggag gagctggcag tgcgcttttc acaagaagag atacaccaag aacagccaga 23640 gcaggaagca gagaatgagc agagtcaggc tgggctcgag catgacggcg actacctcca 23700 cctgagcggg ggggaggacg cgctcatcaa gcatctggcc cggcaggcca ccatcgtcaa 23760 ggatgcgctg ctcgaccgca ccgaggtgcc cctcagcgtg gaggagctca gccgcgccta 23820 cgagttgaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaatg gcacctgcga 23880 gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc tggccaccta 23940 ccacatcttt ttcaagaacc aaaagatccc cgtctcctgc cgcgccaacc gcacccgcgc 24000 cgacgccctt ttcaacctgg gtcccggcgc ccgcctacct gatatcgcct ccttggaaga 24060 ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga acgctctgca 24120 aggagaagga ggagagcatg agcaccacag cgccctggtc gagttggaag gcgacaacgc 24180 gcggctggcg gtgctcaaac gcacggtcga gctgacccat ttcgcctacc cggctctgaa 24240 cctgcccccc aaagtcatga gcgcggtcat ggaccaggtg ctcatcaagc gcgcgtcgcc 24300 catctccgag gacgagggca tgcaagactc cgaggagggc aagcccgtgg tcagcgacga 24360 gcagctggcc cggtggctgg gtcctaatgc tagtccccag agtttggaag agcggcgcaa 24420 actcatgatg gccgtggtcc tggtgaccgt ggagctggag tgcctgcgcc gcttcttcgc 24480 cgacgcggag accctgcgca aggtcgagga gaacctgcac tacctcttca ggcacgggtt 24540 cgtgcgccag gcctgcaaga tctccaacgt ggagctgacc aacctggtct cctacatggg 24600 catcttgcac gagaaccgcc tggggcagaa cgtgctgcac accaccctgc gcggggaggc 24660 ccggcgcgac tacatccgcg actgcgtcta cctctacctc tgccacacct ggcagacggg 24720 catgggcgtg tggcagcagt gtctggagga gcagaacctg aaagagctct gcaagctcct 24780 gcagaagaac ctcaagggtc tgtggaccgg gttcgacgag cgcaccaccg cctcggacct 24840 ggccgacctc attttccccg agcgcctcag gctgacgctg cgcaacggcc tgcccgactt 24900 tatgagccaa agcatgttgc aaaactttcg ctctttcatc ctcgaacgct ccggaatcct 24960 gcccgccacc tgctccgcgc tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc 25020 cccgccgctg tggagccact gctacctgct gcgcctggcc aactacctgg cctaccactc 25080 ggacgtgatc gaggacgtca gcggcgaggg cctgctcgag tgccactgcc gctgcaacct 25140 ctgcacgccg caccgctccc tggcctgcaa cccccagctg ctgagcgaga cccagatcat 25200 cggcaccttc gagttgcaag ggcccagcga aggcgagggt tcagccgcca aggggggtct 25260 gaaactcacc ccggggctgt ggacctcggc ctacttgcgc aagttcgtgc ccgaggacta 25320 ccatcccttc gagatcaggt tctacgagga ccaatcccat ccgcccaagg ccgagctgtc 25380 ggcctgcgtc atcacccagg gggcgatcct ggcccaattg caagccatcc agaaatcccg 25440 ccaagaattc ttgctgaaaa agggccgcgg ggtctacctc gacccccaga ccggtgagga 25500 gctcaacccc ggcttccccc aggatgcccc gaggaaacaa gaagctgaaa gtggagctgc 25560 cgcccgtgga ggatttggag gaagactggg agaacagcag tcaggcagag gaggaggaga 25620 tggaggaaga ctgggacagc actcaggcag aggaggacag cctgcaagac agtctggagg 25680 aagacgagga ggaggcagag gaggaggtgg aagaagcagc cgccgccaga ccgtcgtcct 25740 cggcggggga gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcccgctc 25800 gaccacacag tagatgggac gagaccggac gattcccgaa ccccaccacc cagaccggta 25860 agaaggagcg gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct 25920 tgcaggcctg cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg 25980 tgaactttcc ccgcaacatc ttgcattact accgtcacct ccacagcccc tactacttcc 26040 aagaagaggc agcagcagca gaaaaagacc agcagaaaac cagcagctag aaaatccaca 26100 gcggcggcag caggtggact gaggatcgcg gcgaacgagc cggcgcaaac ccgggagctg 26160 aggaaccgga tctttcccac cctctatgcc atcttccagc agagtcgggg gcaggagcag 26220 gaactgaaag tcaagaaccg ttctctgcgc tcgctcaccc gcagttgtct gtatcacaag 26280 agcgaagacc aacttcagcg cactctcgag gacgccgagg ctctcttcaa caagtactgc 26340 gcgctcactc ttaaagagta gcccgcgccc gcccagtcgc agaaaaaggc gggaattacg 26400 tcacctgtgc ccttcgccct agccgcctcc acccatcatc atgagcaaag agattcccac 26460 gccttacatg tggagctacc agccccagat gggcctggcc gccggtgccg cccaggacta 26520 ctccacccgc atgaattggc tcagcgccgg gcccgcgatg atctcacggg tgaatgacat 26580 ccgcgcccac cgaaaccaga tactcctaga acagtcagcg ctcaccgcca cgccccgcaa 26640 tcacctcaat ccgcgtaatt ggcccgccgc cctggtgtac caggaaattc cccagcccac 26700 gaccgtacta cttccgcgag acgcccaggc cgaagtccag ctgactaact caggtgtcca 26760 gctggcgggc ggcgccaccc tgtgtcgtca ccgccccgct cagggtataa agcggctggt 26820 gatccggggc agaggcacac agctcaacga cgaggtggtg agctcttcgc tgggtctgcg 26880 acctgacgga gtcttccaac tcgccggatc ggggagatct tccttcacgc ctcgtcaggc 26940 cgtcctgact ttggagagtt cgtcctcgca gccccgctcg ggtggcatcg gcactctcca 27000 gttcgtggag gagttcactc cctcggtcta cttcaacccc ttctccggct cccccggcca 27060 ctacccggac gagttcatcc cgaacttcga cgccatcagc gagtcggtgg acggctacga 27120 ttgaatgtcc catggtggcg cagctgacct agctcggctt cgacacctgg accactgccg 27180 ccgcttccgc tgcttcgctc gggatctcgc cgagtttgcc tactttgagc tgcccgagga 27240 gcaccctcag ggcccggccc acggagtgcg gatcgtcgtc gaagggggcc tcgactccca 27300 cctgcttcgg atcttcagcc agcgtccgat cctggtcgag cgcgagcaag gacagaccct 27360 tctgactctg tactgcatct gcaaccaccc cggcctgcat gaaagtcttt gttgtctgct 27420 gtgtactgag tataataaaa gctgagatca gcgactactc cggacttccg tgtgttcctg 27480 aatccatcaa ccagtctttg ttcttcaccg ggaacgagac cgagctccag ctccagtgta 27540 agccccacaa gaagtacctc acctggctgt tccagggctc cccgatcgcc gttgtcaacc 27600 actgcgacaa cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca 27660 gaagcaagct ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac 27720 cctgccatca caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca 27780 accaaactaa cctccaccaa cgccaccgtc gcgacctttc tgaatctaat actaccaccc 27840 acaccggagg tgagctccga ggtcaaccaa cctctgggat ttactacggc ccctgggagg 27900 tggttgggtt aatagcgcta ggcctagttg cgggtgggct tttggttctc tgctacctat 27960 acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg gtttaagaaa tggggaagat 28020 caccctagtg agctgcggtg cgctggtggc ggtgttgctt tcgattgtgg gactgggcgg 28080 tgcggctgta gtgaaggaga aggccgatcc ctgcttgcat ttcaatccca acaaatgcca 28140 gctgagtttt cagcccgatg gcaatcggtg cgcggtactg atcaagtgcg gatgggaatg 28200 cgagaacgtg agaatcgagt acaataacaa gactcggaac aatactctcg cgtccgtgtg 28260 gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc ggtgctgacg gctccccgcg 28320 caccgtgaat aatactttca tttttgcgca catgtgcgac acggtcatgt ggatgagcaa 28380 gcagtacgat atgtggcccc ccacgaagga gaacatcgtg gtcttctcca tcgcttacag 28440 cctgtgcacg gcgctaatca ccgctatcgt gtgcctgagc attcacatgc tcatcgctat 28500 tcgccccaga aataatgccg aaaaagaaaa acagccataa cgtttttttt cacacctttt 28560 tcagaccatg gcctctgtta aatttttgct tttatttgcc agtctcattg ccgtcattca 28620 tggaatgagt aatgagaaaa ttactattta cactggcact aatcacacat tgaaaggtcc 28680 agaaaaagcc acagaagttt catggtattg ttattttaat gaatcagatg tatctactga 28740 actctgtgga aacaataaca aaaaaaatga gagcattact ctcatcaagt ttcaatgtgg 28800 atctgactta accctaatta acatcactag agactatgta ggtatgtatt atggaactac 28860 agcaggcatt tcggacatgg aattttatca agtttctgtg tctgaaccca ccacgcctag 28920 aatgaccaca accacaaaaa ctacacctgt taccactatg cagctcacta ccaataacat 28980 ttttgccatg cgtcaaatgg tcaacaatag cactcaaccc accccaccca gtgaggaaat 29040 tcccaaatcc atgattggca ttattgttgc tgtagtggtg tgcatgttga tcatcgcctt 29100 gtgcatggtg tactatgcct tctgctacag aaagcacaga ctgaacgaca agctggaaca 29160 cttactaagt gttgaatttt aattttttag aaccatgaag atcctaggcc ttttaatttt 29220 ttctatcatt acctctgctc tatgcaattc tgacaatgag gacgttactg tcgttgtcgg 29280 atcaaattat acactgaaag gtccagcgaa gggtatgctt tcgtggtatt gctattttgg 29340 atctgacact acagaaactg aattatgcaa tcttaagaat ggcaaaattc aaaattctaa 29400 aattaacaat tatatatgca atggtactga tctgatactc ctcaatatca cgaaatcata 29460 tgctggcagt tacacctgcc ctggagatga tgctgacagt atgatttttt acaaagtaac 29520 tgttgttgat cccactactc cacctccacc caccacaact actcacacca cacacacaga 29580 tcaaaccgca gcagaggagg cagcaaagtt agccttgcag gtccaagaca gttcatttgt 29640 tggcattacc cctacacctg atcagcggtg tccggggctg ctagtcagcg gcattgtcgg 29700 tgtgctttcg ggattagcag tcataatcat ctgcatgttc atttttgctt gctgctatag 29760 aaggctttac cgacaaaaat cagacccact gctgaacctc tatgtttaat tttttccaga 29820 gtcatgaagg cagttagcgc tctagttttt tgttctttga ttggcattgt tttttgcaat 29880 cctattccta aagttagctt tattaaagat gtgaatgtta ctgagggggg caatgtgaca 29940 ctggtaggtg tagagggtgc tgaaaacacc acctggacaa aataccacct caatgggtgg 30000 aaagatattt gcaattggag tgtattagtt tatacatgtg agggagttaa tcttaccatt 30060 gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgtcag tgtatctaat 30120 gggtatttta cccaacatac ttttatctat gacgttaaag tcataccact gcctacgcct 30180 agcccaccta gcactaccac acagacaacc cacactacac agacaaccac atacagtaca 30240 ttaaatcagc ctaccaccac tacagcagca gaggttgcca gctcgtctgg ggtccgagtg 30300 gcatttttga tgtgggcccc atctagcagt cccactgcta gtaccaatga gcagactact 30360 gaatttttgt ccactgtcga gagccacacc acagctacct ccagtgcctt ctctagcacc 30420 gccaatctct cctcgctttc ctctacacca atcagtcccg ctactactcc tagccccgct 30480 cctcttccca ctcccctgaa gcaaacagac ggcggcatgc aatggcagat caccctgctc 30540 attgtgatcg ggttggtcat cctggccgtg ttgctctact acatcttctg ccgccgcatt 30600 cccaacgcgc accgcaagcc ggtctacaag cccatcattg tcgggcagcc ggagccgctt 30660 caggtggaag ggggtctaag gaatcttctc ttctctttta cagtatggtg attgaactat 30720 gattcctaga caattcttga tcactattct tatctgcctc ctccaagtct gtgccaccct 30780 cgctctggtg gccaacgcca gtccagactg tattgggccc ttcgcctcct acgtgctctt 30840 tgccttcacc acctgcatct gctgctgtag catagtctgc ctgcttatca ccttcttcca 30900 gttcattgac tggatctttg tgcgcatcgc ctacctgcgc caccaccccc agtaccgcga 30960 ccagcgagtg gcgcggctgc tcaggctcct ctgataagca tgcgggctct gctacttctc 31020 gcgcttctgc tgttagtgct cccccgtccc gtcgaccccc ggtcccccac ccagtccccc 31080 gaggaggtcc gcaaatgcaa attccaagaa ccctggaaat tcctcaaatg ctaccgccaa 31140 aaatcagaca tgcatcccag ctggatcatg atcattggga tcgtgaacat tctggcctgc 31200 accctcatct cctttgtgat ttacccctgc tttgactttg gttggaactc gccagaggcg 31260 ctctatctcc cgcctgaacc tgacacacca ccacagcaac ctcaggcaca cgcactacca 31320 ccactacagc ctaggccaca atacatgccc atattagact atgaggccga gccacagcga 31380 cccatgctcc ccgctattag ttacttcaat ctaaccggcg gagatgactg acccactggc 31440 caacaacaac gtcaacgacc ttctcctgga catggacggc cgcgcctcgg agcagcgact 31500 cgcccaactt cgcattcgcc agcagcagga gagagccgtc aaggagctgc aggatgcggt 31560 ggccatccac cagtgcaaga gaggcatctt ctgcctggtg aaacaggcca agatctccta 31620 cgaggtcact ccaaacgacc atcgcctctc ctacgagctc ctgcagcagc gccagaagtt 31680 cacctgcctg gtcggagtca accccatcgt catcacccag cagtctggcg ataccaaggg 31740 gtgcatccac tgctcctgcg actcccccga ctgcgtccac actctgatca agaccctctg 31800 cggcctccgc gacctcctcc ccatgaacta atcaccccct tatccagtga aataaagatc 31860 atattgatga tgattttaca gaaataaaaa ataatcattt gatttgaaat aaagatacaa 31920 tcatattgat gatttgagtt taacaaaaaa ataaagaatc acttacttga aatctgatac 31980 caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32040 ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32100 ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32160 gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32220 aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gttgtccctg 32280 cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32340 gtggacctcg attcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32400 ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32460 ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32520 acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32580 ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32640 ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32700 tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32760 acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32820 tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 32880 acaacacctg atccatcacc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 32940 ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33000 agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33060 gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33120 cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33180 aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33240 atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33300 agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33360 gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33420 cccaccctgc atgccaaccc ttcccacccc actctgtgga acaaactctg aaacacaaaa 33480 taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33540 ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33600 tctgaatgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33660 gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33720 cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33780 agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33840 gccccgcagc agtcgctgcc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 33900 cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 33960 gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca gaaccaccag 34020 gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34080 acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggtgccccc tccagaacac 34140 gctgcccacg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34200 caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34260 cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34320 ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcatat 34380 gctcatgcat ctcttcagca ctctcaactc ctcgggggtc aaaaccatat cccagggcac 34440 ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34500 attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagagaagc 34560 gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34620 cgcggctgat cgtgttcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34680 tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tctcggcgct 34740 tggaacgctc ggtgttgaaa ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34800 gggcctcagg agtgatgaag atcccatcat gcctgatggc tctgatcaca tcgaccaccg 34860 tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggtg acggcggggg 34920 agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agtacttcaa 34980 aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35040 ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35100 gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35160 tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35220 ctagttcctg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35280 ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35340 cagattgaca agcggaatat caaaatctct gccgcgatcc ctgagctcct ccctcagcaa 35400 taactgtaag tactctttca tatcctctcc gaaattttta gccataggac caccaggaat 35460 aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35520 tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35580 aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtggacgtt 35640 tagagcctcg ggaacaacga tgaagtaaat gcaagcggtg cgttccagca tggttagtta 35700 gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35760 gtaaatcgtt ctctccagca ccaggcaggc cacggggtct ccggcgcgac cctcgtaaaa 35820 attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 35880 tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 35940 gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36000 aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36060 agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36120 agcacacaac aggcgcaaga gtcagagaaa ggctgagctc taacctgtcc acccgctctc 36180 tgctcaatat atagcccaga tctacactga cgtaaaggcc aaagtctaaa aatacccgcc 36240 aaataatcac acacgcccag cacacgccca gaaaccggtg acacactcaa aaaaatacgc 36300 gcacttcctc aaacgcccaa aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 36360 acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 36420 cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 36480 aacgcgcaca aaaagtttga ggtatattat tgatgatgg 36519 <210> 2 <211> 31588 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 2 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600 gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840 atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900 atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960 tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200 cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260 ccgggatgtt ccaggcactg tccgaaggct gcacacccta tgatattaac cagatgctga 1320 atgtcctggg agaccaccag gtctctggcc tggagcagct ggagagcatc atcaacttcg 1380 agaagctgac cgagtggaca agctccaatg tgatgcctat cctgtcccca ctgaccaagg 1440 gcatcctggg cttcgtgttt accctgacag tgccttctga gcggggcctg tcttgcatca 1500 gcgaggcaga cgcaaccaca ccagagtccg ccaatctggg cgaggagatc ctgtctcagc 1560 tgtacctgtg gccccgggtg acatatcact ccccttctta cgcctatcac cagttcgagc 1620 ggagagccaa gtacaagaga cacttcccag gctttggcca gtctctgctg ttcggctacc 1680 ccgtgtacgt gttcggcgat tgcgtgcagg gcgactggga tgccatccgg tttagatact 1740 gcgcaccacc tggatatgca ctgctgaggt gtaacgacac caattattcc gccctgctgg 1800 cagtgggcgc cctggagggc cctcgcaatc aggattggct gggcgtgcca aggcagctgg 1860 tgacacgcat gcaggccatc cagaacgcag gcctgtgcac cctggtggca atgctggagg 1920 agacaatctt ctggctgcag gcctttctga tggccctgac cgacagcggc cccaagacaa 1980 acatcatcgt ggattcccag tacgtgatgg gcatctccaa gccttctttc caggagtttg 2040 tggactggga gaacgtgagc ccagagctga attccaccga tcagccattc tggcaggcag 2100 gaatcctggc aaggaacctg gtgcctatgg tggccacagt gcagggccag aatctgaagt 2160 accagggcca gagcctggtc atcagcgcct ccatcatcgt gtttaacctg ctggagctgg 2220 agggcgacta tcgggacgat ggcaacgtgt gggtgcacac cccactgagc cccagaacac 2280 tgaacgcctg ggtgaaggcc gtggaggaga agaagggcat cccagtgcac ctggagctgg 2340 cctccatgac caatatggag ctgatgtcta gcatcgtgca ccagcaggtg aggacatacg 2400 gacccgtgtt catgtgcctg ggaggcctgc tgaccatggt ggcaggagcc gtgtggctga 2460 cagtgcgggt gctggagctg ttcagagccg cccagctggc caacgatgtg gtgctgcaga 2520 tcatggagct gtgcggagca gcctttcgcc aggtgtgcca caccacagtg ccatggccca 2580 atgcctccct gacccccaag tggaacaatg agacaacaca gcctcagatc gccaactgta 2640 gcgtgtacga cttcttcgtg tggctgcact actatagcgt gagggatacc ctgtggcccc 2700 gcgtgacata ccacatgaat aagtacgcct atcacatgct ggagaggcgc gccaagtata 2760 agagaggccc tggcccaggc gcaaagtttg tggcagcatg gaccctgaag gccgccgccg 2820 gccccggccc cggccagtat atcaaggcta acagtaagtt cattggaatc acagagctgg 2880 gacccggacc tggataatga gtttaaactc ccatttaaat gtgagggtta atgcttcgag 2940 cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 3000 aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 3060 ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 3120 gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaataact ataacggtcc 3180 taaggtagcg agtgagtagt gttctggggc gggggaggac ctgcatgagg gccagaataa 3240 ctgaaatctg tgcttttctg tgtgttgcag cagcatgagc ggaagcggct cctttgaggg 3300 aggggtattc agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa 3360 tgtgatggga tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac 3420 ctatgcaacc ctgagctctt cgtcgttgga cgcagctgcc gccgcagctg ctgcatctgc 3480 cgccagcgcc gtgcgcggaa tggccatggg cgccggctac tacggcactc tggtggccaa 3540 ctcgagttcc accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc 3600 ccagctcgag gccttgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca 3660 ggagcagacg cgggccgcgg ttgccacggt gaaatccaaa taaaaaatga atcaataaat 3720 aaacggagac ggttgttgat tttaacacag agtctgaatc tttatttgat ttttcgcgcg 3780 cggtaggccc tggaccaccg gtctcgatca ttgagcaccc ggtggatctt ttccaggacc 3840 cggtagaggt gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg 3900 tagctccatt gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag 3960 gggcgcaggg catggtgttg cacaatatct ttgaggagga gactgatggc cacgggcagc 4020 cctttggtgt aggtgtttac aaatctgttg agctgggagg gatgcatgcg gggggagatg 4080 aggtgcatct tggcctggat cttgagattg gcgatgttac cgcccagatc ccgcctgggg 4140 ttcatgttgt gcaggaccac cagcacggtg tatccggtgc acttggggaa tttatcatgc 4200 aacttggaag ggaaggcgtg aaagaatttg gcgacgcctt tgtgcccgcc caggttttcc 4260 atgcactcat ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt 4320 cgggggtcgg acacatcata gttgtggtcc tgggtgaggt catcataggc cattttaatg 4380 aatttggggc ggagggtgcc ggactggggg acaaaggtac cctcgatccc gggggcgtag 4440 ttcccctcac agatctgcat ctcccaggct ttgagctcgg agggggggat catgtccacc 4500 tgcggggcga taaagaacac ggtttccggg gcgggggaga tgagctgggc cgaaagcaag 4560 ttccggagca gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc 4620 tgcaggtggt agttgaggga gagacagctg ccgtcctccc ggaggagggg ggccacctcg 4680 ttcatcatct cgcgcacgtg catgttctcg cgcaccagtt ccgccaggag gcgctctccc 4740 cccagggata ggagctcctg gagcgaggcg aagtttttca gcggcttgag tccgtcggcc 4800 atgggcattt tggagagggt ttgttgcaag agttccaggc ggtcccagag ctcggtgatg 4860 tgctctacgg catctcgatc cagcagacct cctcgtttcg cgggttggga cggctgcggg 4920 agtagggcac cagacgatgg gcgtccagcg cagccagggt ccggtccttc cagggtcgca 4980 gcgtccgcgt cagggtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg 5040 cgagggtgcg cttcaggctc atccggctgg tcgaaaaccg ctcccgatcg gcgccctgcg 5100 cgtcggccag gtagcaattg accatgagtt cgtagttgag cgcctcggcc gcgtggcctt 5160 tggcgcggag cttacctttg gaagtctgcc cgcaggcggg acagaggagg gacttgaggg 5220 cgtagagctt gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagtggg 5280 cgcagacggt ctcgcactcc acgagccagg tgaggtcggg ctggtcgggg tcaaaaacca 5340 gtttcccgcc gttctttttg atgcgtttct tacctttggt ctccatgagc tcgtgtcccc 5400 gctgggtgac aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga 5460 gcggtgtgcc gcggtcctcc tcgtagagga accccgccca ctccgagacg aaagcccggg 5520 tccaggccag cacgaaggag gccacgtggg acgggtagcg gtcgttgtcc accagcgggt 5580 ccaccttttc cagggtatgc aaacacatgt ccccctcgtc cacatccagg aaggtgattg 5640 gcttgtaagt gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggtgcgg 5700 gtccctgctc gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta 5760 ggtattccct ctcgaaggcg ggcatgacct cggcactcag gttgtcagtt tctagaaacg 5820 aggaggattt gatattgacg gtgccggcgg agatgccttt caagagcccc tcgtccatct 5880 ggtcagaaaa gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt 5940 tggagaggag cttggcgatg gagcgcatgg tctggttttt ttccttgtcg gcgcgctcct 6000 tggcggcgat gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg 6060 tggtcagctc gtcgggcacg attctgacct gccagccccg attatgcagg gtgatgaggt 6120 ccacactggt ggccacctcg ccgcgcaggg gctcattagt ccagcagagg cgtccgccct 6180 tgcgcgagca gaaggggggc agggggtcca gcatgacctc gtcggggggg tcggcatcga 6240 tggtgaagat gccgggcagg aggtcggggt caaagtagct gatggaagtg gccagatcgt 6300 ccagggcagc ttgccattcg cgcacggcca gcgcgcgctc gtagggactg aggggcgtgc 6360 cccagggcat gggatgggta agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga 6420 ggggctcctc gaggatgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc 6480 gcacgtagtc atacagctcg tgcgaggggg cgaggagccc cgggcccagg ttggtgcgac 6540 tgggcttttc ggcgcggtag acgatctggc ggaaaatggc atgcgagttg gaggagatgg 6600 tgggcctttg gaagatgttg aagtgggcgt ggggcagtcc gaccgagtcg cggatgaagt 6660 gggcgtagga gtcttgcagc ttggcgacga gctcggcggt gactaggacg tccagagcgc 6720 agtagtcgag ggtctcctgg atgatgtcat acttgagctg tcccttttgt ttccacagct 6780 cgcggttgag aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct 6840 gatctgcacg gtaagagcct agcatgtaga actggttgac ggccttgtag gcgcagcagc 6900 ccttctccac ggggagggcg taggcctggg cggccttgcg cagggaggtg tgcgtgaggg 6960 cgaaagtgtc cctgaccatg accttgagga actggtgctt gaagtcgata tcgtcgcagc 7020 ccccctgctc ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga 7080 aagtaacatc gttgaagagg atcttgcccg cgcggggcat aaagttgcga gtgatgcgga 7140 aaggttgggg cacctcggcc cggttgttga tgacctgggc ggcgagcacg atctcgtcga 7200 agccgttgat gttgtggccc acgatgtaga gttccacgaa tcgcggacgg cccttgacgt 7260 ggggcagttt cttgagctcc tcgtaggtga gctcgtcggg gtcgctgagc ccgtgctgct 7320 cgagcgccca gtcggcgaga tgggggttgg cgcggaggaa ggaagtccag agatccacgg 7380 ccagggcggt ttgcagacgg tcccggtact gacggaactg ctgcccgacg gccatttttt 7440 cgggggtgac gcagtagaag gtgcgggggt ccccgtgcca gcgatcccat ttgagctgga 7500 gggcgagatc gagggcgagc tcgacgagcc ggtcgtcccc ggagagtttc atgaccagca 7560 tgaaggggac gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg 7620 tgaggaagag cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc 7680 accaattgga ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgaac 7740 actcgtgctt gtgtttatac aagcggccac agtgctcgca acgctgcacg ggatgcacgt 7800 gctgcacgag ctgtacctga gttcctttga cgaggaattt cagtgggaag tggagtcgtg 7860 gcgcctgcat ctcgtgctgt actacgtcgt ggtggtcggc ctggccctct tctgcctcga 7920 tggtggtcat gctgacgagc ccgcgcggga ggcaggtcca gacctcggcg cgagcgggtc 7980 ggagagcgag gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag 8040 tcaggtcagt gggcagcggc ggcgcgcggt tgacttgcag gagtttttcc agggcgcgcg 8100 ggaggtccag atggtacttg atctccaccg cgccattggt ggcgacgtcg atggcttgca 8160 gggtcccgtg cccctggggt gtgaccaccg tcccccgttt cttcttgggc ggctggggcg 8220 acgggggcgg tgcctcttcc atggttagaa gcggcggcga ggacgcgcgc cgggcggcag 8280 gggcggctcg gggcccggag gcaggggcgg caggggcacg tcggcgccgc gcgcgggtag 8340 gttctggtac tgcgcccgga gaagactggc gtgagcgacg acgcgacggt tgacgtcctg 8400 gatctgacgc ctctgggtga aggccacggg acccgtgagt ttgaacctga aagagagttc 8460 gacagaatca atctcggtat cgttgacggc ggcctgccgc aggatctctt gcacgtcgcc 8520 cgagttgtcc tggtaggcga tctcggtcat gaactgctcg atctcctcct cttgaaggtc 8580 tccgcggccg gcgcgctcca cggtggccgc gaggtcgttg gagatgcggc ccatgagctg 8640 cgagaaggcg ttcatgcccg cctcgttcca gacgcggctg tagaccacga cgccctcggg 8700 atcgcgggcg cgcatgacca cctgggcgag gttgagctcc acgtggcgcg tgaagaccgc 8760 gtagttgcag aggcgctggt agaggtagtt gagcgtggtg gcgatgtgct cggtgacgaa 8820 gaaatacatg atccagcggc ggagcggcat ctcgctgacg tcgcccagcg cctccaaacg 8880 ttccatggcc tcgtaaaagt ccacggcgaa gttgaaaaac tgggagttgc gcgccgagac 8940 ggtcaactcc tcctccagaa gacggatgag ctcggcgatg gtggcgcgca cctcgcgctc 9000 gaaggccccc gggagttcct ccacttcctc ttcttcctcc tccactaaca tctcttctac 9060 ttcctcctca ggcggcagtg gtggcggggg agggggcctg cgtcgccggc ggcgcacggg 9120 cagacggtcg atgaagcgct cgatggtctc gccgcgccgg cgtcgcatgg tctcggtgac 9180 ggcgcgcccg tcctcgcggg gccgcagcgt gaagacgccg ccgcgcatct ccaggtggcc 9240 gggggggtcc ccgttgggca gggagagggc gctgacgatg catcttatca attgccccgt 9300 agggactccg cgcaaggacc tgagcgtctc gagatccacg ggatctgaaa accgctgaac 9360 gaaggcttcg agccagtcgc agtcgcaagg taggctgagc acggtttctt ctggcgggtc 9420 atgttggttg ggagcggggc gggcgatgct gctggtgatg aagttgaaat aggcggttct 9480 gagacggcgg atggtggcga ggagcaccag gtctttgggc ccggcttgct ggatgcgcag 9540 acggtcggcc atgccccagg cgtggtcctg acacctggcc aggtccttgt agtagtcctg 9600 catgagccgc tccacgggca cctcctcctc gcccgcgcgg ccgtgcatgc gcgtgagccc 9660 gaagccgcgc tggggctgga cgagcgccag gtcggcgacg acgcgctcgg cgaggatggc 9720 ttgctggatc tgggtgaggg tggtctggaa gtcatcaaag tcgacgaagc ggtggtaggc 9780 tccggtgttg atggtgtagg agcagttggc catgacggac cagttgacgg tctggtggcc 9840 cggacgcacg agctcgtggt acttgaggcg cgagtaggcg cgcgtgtcga agatgtagtc 9900 gttgcaggtg cgcaccaggt actggtagcc gatgaggaag tgcggcggcg gctggcggta 9960 gagcggccat cgctcggtgg cgggggcgcc gggcgcgagg tcctcgagca tggtgcggtg 10020 gtagccgtag atgtacctgg acatccaggt gatgccggcg gcggtggtgg aggcgcgcgg 10080 gaactcgcgg acgcggttcc agatgttgcg cagcggcagg aagtagttca tggtgggcac 10140 ggtctggccc gtgaggcgcg cgcagtcgtg gatgctctat acgggcaaaa acgaaagcgg 10200 tcagcggctc gactccgtgg cctggaggct aagcgaacgg gttgggctgc gcgtgtaccc 10260 cggttcgaat ctcgaatcag gctggagccg cagctaacgt ggtattggca ctcccgtctc 10320 gacccaagcc tgcaccaacc ctccaggata cggaggcggg tcgttttgca actttttttt 10380 ggaggccgga tgagactagt aagcgcggaa agcggccgac cgcgatggct cgctgccgta 10440 gtctggagaa gaatcgccag ggttgcgttg cggtgtgccc cggttcgagg ccggccggat 10500 tccgcggcta acgagggcgt ggctgccccg tcgtttccaa gaccccatag ccagccgact 10560 tctccagtta cggagcgagc ccctcttttg ttttgtttgt ttttgccaga tgcatcccgt 10620 actgcggcag atgcgccccc accaccctcc accgcaacaa cagccccctc cacagccggc 10680 gcttctgccc ccgccccagc agcaacttcc agccacgacc gccgcggccg ccgtgagcgg 10740 ggctggacag agttatgatc accagctggc cttggaagag ggcgaggggc tggcgcgcct 10800 gggggcgtcg tcgccggagc ggcacccgcg cgtgcagatg aaaagggacg ctcgcgaggc 10860 ctacgtgccc aagcagaacc tgttcagaga caggagcggc gaggagcccg aggagatgcg 10920 cgcggcccgg ttccacgcgg ggcgggagct gcggcgcggc ctggaccgaa agagggtgct 10980 gagggacgag gatttcgagg cggacgagct gacggggatc agccccgcgc gcgcgcacgt 11040 ggccgcggcc aacctggtca cggcgtacga gcagaccgtg aaggaggaga gcaacttcca 11100 aaaatccttc aacaaccacg tgcgcaccct gatcgcgcgc gaggaggtga ccctgggcct 11160 gatgcacctg tgggacctgc tggaggccat cgtgcagaac cccaccagca agccgctgac 11220 ggcgcagctg ttcctggtgg tgcagcatag tcgggacaac gaagcgttca gggaggcgct 11280 gctgaatatc accgagcccg agggccgctg gctcctggac ctggtgaaca ttctgcagag 11340 catcgtggtg caggagcgcg ggctgccgct gtccgagaag ctggcggcca tcaacttctc 11400 ggtgctgagt ttgggcaagt actacgctag gaagatctac aagaccccgt acgtgcccat 11460 agacaaggag gtgaagatcg acgggtttta catgcgcatg accctgaaag tgctgaccct 11520 gagcgacgat ctgggggtgt accgcaacga caggatgcac cgtgcggtga gcgccagcag 11580 gcggcgcgag ctgagcgacc aggagctgat gcatagtctg cagcgggccc tgaccggggc 11640 cgggaccgag ggggagagct actttgacat gggcgcggac ctgcactggc agcccagccg 11700 ccgggccttg gaggcggcgg caggacccta cgtagaagag gtggacgatg aggtggacga 11760 ggagggcgag tacctggaag actgatggcg cgaccgtatt tttgctagat gcaacaacaa 11820 cagccacctc ctgatcccgc gatgcgggcg gcgctgcaga gccagccgtc cggcattaac 11880 tcctcggacg attggaccca ggccatgcaa cgcatcatgg cgctgacgac ccgcaacccc 11940 gaagccttta gacagcagcc ccaggccaac cggctctcgg ccatcctgga ggccgtggtg 12000 ccctcgcgct ccaaccccac gcacgagaag gtcctggcca tcgtgaacgc gctggtggag 12060 aacaaggcca tccgcggcga cgaggccggc ctggtgtaca acgcgctgct ggagcgcgtg 12120 gcccgctaca acagcaccaa cgtgcagacc aacctggacc gcatggtgac cgacgtgcgc 12180 gaggccgtgg cccagcgcga gcggttccac cgcgagtcca acctgggatc catggtggcg 12240 ctgaacgcct tcctcagcac ccagcccgcc aacgtgcccc ggggccagga ggactacacc 12300 aacttcatca gcgccctgcg cctgatggtg accgaggtgc cccagagcga ggtgtaccag 12360 tccgggccgg actacttctt ccagaccagt cgccagggct tgcagaccgt gaacctgagc 12420 caggctttca agaacttgca gggcctgtgg ggcgtgcagg ccccggtcgg ggaccgcgcg 12480 acggtgtcga gcctgctgac gccgaactcg cgcctgctgc tgctgctggt ggcccccttc 12540 acggacagcg gcagcatcaa ccgcaactcg tacctgggct acctgattaa cctgtaccgc 12600 gaggccatcg gccaggcgca cgtggacgag cagacctacc aggagatcac ccacgtgagc 12660 cgcgccctgg gccaggacga cccgggcaac ctggaagcca ccctgaactt tttgctgacc 12720 aaccggtcgc agaagatccc gccccagtac gcgctcagca ccgaggagga gcgcatcctg 12780 cgttacgtgc agcagagcgt gggcctgttc ctgatgcagg agggggccac ccccagcgcc 12840 gcgctcgaca tgaccgcgcg caacatggag cccagcatgt acgccagcaa ccgcccgttc 12900 atcaataaac tgatggacta cttgcatcgg gcggccgcca tgaactctga ctatttcacc 12960 aacgccatcc tgaatcccca ctggctcccg ccgccggggt tctacacggg cgagtacgac 13020 atgcccgacc ccaatgacgg gttcctgtgg gacgatgtgg acagcagcgt gttctccccc 13080 cgaccgggtg ctaacgagcg ccccttgtgg aagaaggaag gcagcgaccg acgcccgtcc 13140 tcggcgctgt ccggccgcga gggtgctgcc gcggcggtgc ccgaggccgc cagtcctttc 13200 ccgagcttgc ccttctcgct gaacagtatc cgcagcagcg agctgggcag gatcacgcgc 13260 ccgcgcttgc tgggcgaaga ggagtacttg aatgactcgc tgttgagacc cgagcgggag 13320 aagaacttcc ccaataacgg gatagaaagc ctggtggaca agatgagccg ctggaagacg 13380 tatgcgcagg agcacaggga cgatccccgg gcgtcgcagg gggccacgag ccggggcagc 13440 gccgcccgta aacgccggtg gcacgacagg cagcggggac agatgtggga cgatgaggac 13500 tccgccgacg acagcagcgt gttggacttg ggtgggagtg gtaacccgtt cgctcacctg 13560 cgcccccgta tcgggcgcat gatgtaagag aaaccgaaaa taaatgatac tcaccaaggc 13620 catggcgacc agcgtgcgtt cgtttcttct ctgttgttgt tgtatctagt atgatgaggc 13680 gtgcgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag gcgatggcgg 13740 cggcggcgat gcagcccccg ctggaggctc cttacgtgcc cccgcggtac ctggcgccta 13800 cggaggggcg gaacagcatt cgttactcgg agctggcacc cttgtacgat accacccggt 13860 tgtacctggt ggacaacaag tcggcggaca tcgcctcgct gaactaccag aacgaccaca 13920 gcaacttcct gaccaccgtg gtgcagaaca atgacttcac ccccacggag gccagcaccc 13980 agaccatcaa ctttgacgag cgctcgcggt ggggcggcca gctgaaaacc atcatgcaca 14040 ccaacatgcc caacgtgaac gagttcatgt acagcaacaa gttcaaggcg cgggtgatgg 14100 tctcccgcaa gacccccaat ggggtgacag tgacagagga ttatgatggt agtcaggatg 14160 agctgaagta tgaatgggtg gaatttgagc tgcccgaagg caacttctcg gtgaccatga 14220 ccatcgacct gatgaacaac gccatcatcg acaattactt ggcggtgggg cggcagaacg 14280 gggtgctgga gagcgacatc ggcgtgaagt tcgacactag gaacttcagg ctgggctggg 14340 accccgtgac cgagctggtc atgcccgggg tgtacaccaa cgaggctttc catcccgata 14400 ttgtcttgct gcccggctgc ggggtggact tcaccgagag ccgcctcagc aacctgctgg 14460 gcattcgcaa gaggcagccc ttccaggaag gcttccagat catgtacgag gatctggagg 14520 ggggcaacat ccccgcgctc ctggatgtcg acgcctatga gaaaagcaag gaggatgcag 14580 cagctgaagc aactgcagcc gtagctaccg cctctaccga ggtcaggggc gataattttg 14640 caagcgccgc agcagtggca gcggccgagg cggctgaaac cgaaagtaag atagtcattc 14700 agccggtgga gaaggatagc aagaacagga gctacaacgt actaccggac aagataaaca 14760 ccgcctaccg cagctggtac ctagcctaca actatggcga ccccgagaag ggcgtgcgct 14820 cctggacgct gctcaccacc tcggacgtca cctgcggcgt ggagcaagtc tactggtcgc 14880 tgcccgacat gatgcaagac ccggtcacct tccgctccac gcgtcaagtt agcaactacc 14940 cggtggtggg cgccgagctc ctgcccgtct actccaagag cttcttcaac gagcaggccg 15000 tctactcgca gcagctgcgc gccttcacct cgcttacgca cgtcttcaac cgcttccccg 15060 agaaccagat cctcgtccgc ccgcccgcgc ccaccattac caccgtcagt gaaaacgttc 15120 ctgctctcac agatcacggg accctgccgc tgcgcagcag tatccgggga gtccagcgcg 15180 tgaccgttac tgacgccaga cgccgcacct gcccctacgt ctacaaggcc ctgggcatag 15240 tcgcgccgcg cgtcctctcg agccgcacct tctaaatgtc cattctcatc tcgcccagta 15300 ataacaccgg ttggggcctg cgcgcgccca gcaagatgta cggaggcgct cgccaacgct 15360 ccacgcaaca ccccgtgcgc gtgcgcgggc acttccgcgc tccctggggc gccctcaagg 15420 gccgcgtgcg gtcgcgcacc accgtcgacg acgtgatcga ccaggtggtg gccgacgcgc 15480 gcaactacac ccccgccgcc gcgcccgtct ccaccgtgga cgccgtcatc gacagcgtgg 15540 tggccgacgc gcgccggtac gcccgcgcca agagccggcg gcggcgcatc gcccggcggc 15600 accggagcac ccccgccatg cgcgcggcgc gagccttgct gcgcagggcc aggcgcacgg 15660 gacgcagggc catgctcagg gcggccagac gcgcggcttc aggcgccagc gccggcagga 15720 cccggagacg cgcggccacg gcggcggcag cggccatcgc cagcatgtcc cgcccgcggc 15780 gagggaacgt gtactgggtg cgcgacgccg ccaccggtgt gcgcgtgccc gtgcgcaccc 15840 gcccccctcg cacttgaaga tgttcacttc gcgatgttga tgtgtcccag cggcgaggag 15900 gatgtccaag cgcaaattca aggaagagat gctccaggtc atcgcgcctg agatctacgg 15960 ccctgcggtg gtgaaggagg aaagaaagcc ccgcaaaatc aagcgggtca aaaaggacaa 16020 aaaggaagaa gaaagtgatg tggacggatt ggtggagttt gtgcgcgagt tcgccccccg 16080 gcggcgcgtg cagtggcgcg ggcggaaggt gcaaccggtg ctgagacccg gcaccaccgt 16140 ggtcttcacg cccggcgagc gctccggcac cgcttccaag cgctcctacg acgaggtgta 16200 cggggatgat gatattctgg agcaggcggc cgagcgcctg ggcgagtttg cttacggcaa 16260 gcgcagccgt tccgcaccga aggaagaggc ggtgtccatc ccgctggacc acggcaaccc 16320 cacgccgagc ctcaagcccg tgaccttgca gcaggtgctg ccgaccgcgg cgccgcgccg 16380 ggggttcaag cgcgagggcg aggatctgta ccccaccatg cagctgatgg tgcccaagcg 16440 ccagaagctg gaagacgtgc tggagaccat gaaggtggac ccggacgtgc agcccgaggt 16500 caaggtgcgg cccatcaagc aggtggcccc gggcctgggc gtgcagaccg tggacatcaa 16560 gattcccacg gagcccatgg aaacgcagac cgagcccatg atcaagccca gcaccagcac 16620 catggaggtg cagacggatc cctggatgcc atcggctcct agtcgaagac cccggcgcaa 16680 gtacggcgcg gccagcctgc tgatgcccaa ctacgcgctg catccttcca tcatccccac 16740 gccgggctac cgcggcacgc gcttctaccg cggtcatacc agcagccgcc gccgcaagac 16800 caccactcgc cgccgccgtc gccgcaccgc cgctgcaacc acccctgccg ccctggtgcg 16860 gagagtgtac cgccgcggcc gcgcacctct gaccctgccg cgcgcgcgct accacccgag 16920 catcgccatt taaactttcg cctgctttgc agatcaatgg ccctcacatg ccgccttcgc 16980 gttcccatta cgggctaccg aggaagaaaa ccgcgccgta gaaggctggc ggggaacggg 17040 atgcgtcgcc accaccaccg gcggcggcgc gccatcagca agcggttggg gggaggcttc 17100 ctgcccgcgc tgatccccat catcgccgcg gcgatcgggg cgatccccgg cattgcttcc 17160 gtggcggtgc aggcctctca gcgccactga gacacacttg gaaacatctt gtaataaacc 17220 aatggactct gacgctcctg gtcctgtgat gtgttttcgt agacagatgg aagacatcaa 17280 tttttcgtcc ctggctccgc gacacggcac gcggccgttc atgggcacct ggagcgacat 17340 cggcaccagc caactgaacg ggggcgcctt caattggagc agtctctgga gcgggcttaa 17400 gaatttcggg tccacgctta aaacctatgg cagcaaggcg tggaacagca ccacagggca 17460 ggcgctgagg gataagctga aagagcagaa cttccagcag aaggtggtcg atgggctcgc 17520 ctcgggcatc aacggggtgg tggacctggc caaccaggcc gtgcagcggc agatcaacag 17580 ccgcctggac ccggtgccgc ccgccggctc cgtggagatg ccgcaggtgg aggaggagct 17640 gcctcccctg gacaagcggg gcgagaagcg accccgcccc gatgcggagg agacgctgct 17700 gacgcacacg gacgagccgc ccccgtacga ggaggcggtg aaactgggtc tgcccaccac 17760 gcggcccatc gcgcccctgg ccaccggggt gctgaaaccc gaaaagcccg cgaccctgga 17820 cttgcctcct ccccagcctt cccgcccctc tacagtggct aagcccctgc cgccggtggc 17880 cgtggcccgc gcgcgacccg ggggcaccgc ccgccctcat gcgaactggc agagcactct 17940 gaacagcatc gtgggtctgg gagtgcagag tgtgaagcgc cgccgctgct attaaaccta 18000 ccgtagcgct taacttgctt gtctgtgtgt gtatgtatta tgtcgccgcc gccgctgtcc 18060 accagaagga ggagtgaaga ggcgcgtcgc cgagttgcaa gatggccacc ccatcgatgc 18120 tgccccagtg ggcgtacatg cacatcgccg gacaggacgc ttcggagtac ctgagtccgg 18180 gtctggtgca gtttgcccgc gccacagaca cctacttcag tctggggaac aagtttagga 18240 accccacggt ggcgcccacg cacgatgtga ccaccgaccg cagccagcgg ctgacgctgc 18300 gcttcgtgcc cgtggaccgc gaggacaaca cctactcgta caaagtgcgc tacacgctgg 18360 ccgtgggcga caaccgcgtg ctggacatgg ccagcaccta ctttgacatc cgcggcgtgc 18420 tggatcgggg ccctagcttc aaaccctact ccggcaccgc ctacaacagt ctggccccca 18480 agggagcacc caacacttgt cagtggacat ataaagccga tggtgaaact gccacagaaa 18540 aaacctatac atatggaaat gcacccgtgc agggcattaa catcacaaaa gatggtattc 18600 aacttggaac tgacaccgat gatcagccaa tctacgcaga taaaacctat cagcctgaac 18660 ctcaagtggg tgatgctgaa tggcatgaca tcactggtac tgatgaaaag tatggaggca 18720 gagctcttaa gcctgatacc aaaatgaagc cttgttatgg ttcttttgcc aagcctacta 18780 ataaagaagg aggtcaggca aatgtgaaaa caggaacagg cactactaaa gaatatgaca 18840 tagacatggc tttctttgac aacagaagtg cggctgctgc tggcctagct ccagaaattg 18900 ttttgtatac tgaaaatgtg gatttggaaa ctccagatac ccatattgta tacaaagcag 18960 gcacagatga cagcagctct tctattaatt tgggtcagca agccatgccc aacagaccta 19020 actacattgg tttcagagac aactttatcg ggctcatgta ctacaacagc actggcaata 19080 tgggggtgct ggccggtcag gcttctcagc tgaatgctgt ggttgacttg caagacagaa 19140 acaccgagct gtcctaccag ctcttgcttg actctctggg tgacagaacc cggtatttca 19200 gtatgtggaa tcaggcggtg gacagctatg atcctgatgt gcgcattatt gaaaatcatg 19260 gtgtggagga tgaacttccc aactattgtt tccctctgga tgctgttggc agaacagata 19320 cttatcaggg aattaaggct aatggaactg atcaaaccac atggaccaaa gatgacagtg 19380 tcaatgatgc taatgagata ggcaagggta atccattcgc catggaaatc aacatccaag 19440 ccaacctgtg gaggaacttc ctctacgcca acgtggccct gtacctgccc gactcttaca 19500 agtacacgcc ggccaatgtt accctgccca ccaacaccaa cacctacgat tacatgaacg 19560 gccgggtggt ggcgccctcg ctggtggact cctacatcaa catcggggcg cgctggtcgc 19620 tggatcccat ggacaacgtg aaccccttca accaccaccg caatgcgggg ctgcgctacc 19680 gctccatgct cctgggcaac gggcgctacg tgcccttcca catccaggtg ccccagaaat 19740 ttttcgccat caagagcctc ctgctcctgc ccgggtccta cacctacgag tggaacttcc 19800 gcaaggacgt caacatgatc ctgcagagct ccctcggcaa cgacctgcgc acggacgggg 19860 cctccatctc cttcaccagc atcaacctct acgccacctt cttccccatg gcgcacaaca 19920 cggcctccac gctcgaggcc atgctgcgca acgacaccaa cgaccagtcc ttcaacgact 19980 acctctcggc ggccaacatg ctctacccca tcccggccaa cgccaccaac gtgcccatct 20040 ccatcccctc gcgcaactgg gccgccttcc gcggctggtc cttcacgcgt ctcaagacca 20100 aggagacgcc ctcgctgggc tccgggttcg acccctactt cgtctactcg ggctccatcc 20160 cctacctcga cggcaccttc tacctcaacc acaccttcaa gaaggtctcc atcaccttcg 20220 actcctccgt cagctggccc ggcaacgacc ggctcctgac gcccaacgag ttcgaaatca 20280 agcgcaccgt cgacggcgag ggctacaacg tggcccagtg caacatgacc aaggactggt 20340 tcctggtcca gatgctggcc cactacaaca tcggctacca gggcttctac gtgcccgagg 20400 gctacaagga ccgcatgtac tccttcttcc gcaacttcca gcccatgagc cgccaggtgg 20460 tggacgaggt caactacaag gactaccagg ccgtcaccct ggcctaccag cacaacaact 20520 cgggcttcgt cggctacctc gcgcccacca tgcgccaggg ccagccctac cccgccaact 20580 acccctaccc gctcatcggc aagagcgccg tcaccagcgt cacccagaaa aagttcctct 20640 gcgacagggt catgtggcgc atccccttct ccagcaactt catgtccatg ggcgcgctca 20700 ccgacctcgg ccagaacatg ctctatgcca actccgccca cgcgctagac atgaatttcg 20760 aagtcgaccc catggatgag tccacccttc tctatgttgt cttcgaagtc ttcgacgtcg 20820 tccgagtgca ccagccccac cgcggcgtca tcgaggccgt ctacctgcgc acccccttct 20880 cggccggtaa cgccaccacc taagctcttg cttcttgcaa gccatggccg cgggctccgg 20940 cgagcaggag ctcagggcca tcatccgcga cctgggctgc gggccctact tcctgggcac 21000 cttcgataag cgcttcccgg gattcatggc cccgcacaag ctggcctgcg ccatcgtcaa 21060 cacggccggc cgcgagaccg ggggcgagca ctggctggcc ttcgcctgga acccgcgctc 21120 gaacacctgc tacctcttcg accccttcgg gttctcggac gagcgcctca agcagatcta 21180 ccagttcgag tacgagggcc tgctgcgccg cagcgccctg gccaccgagg accgctgcgt 21240 caccctggaa aagtccaccc agaccgtgca gggtccgcgc tcggccgcct gcgggctctt 21300 ctgctgcatg ttcctgcacg ccttcgtgca ctggcccgac cgccccatgg acaagaaccc 21360 caccatgaac ttgctgacgg gggtgcccaa cggcatgctc cagtcgcccc aggtggaacc 21420 caccctgcgc cgcaaccagg aggcgctcta ccgcttcctc aactcccact ccgcctactt 21480 tcgctcccac cgcgcgcgca tcgagaaggc caccgccttc gaccgcatga atcaagacat 21540 gtaaaccgtg tgtgtatgtt aaatgtcttt aataaacagc actttcatgt tacacatgca 21600 tctgagatga tttatttaga aatcgaaagg gttctgccgg gtctcggcat ggcccgcggg 21660 cagggacacg ttgcggaact ggtacttggc cagccacttg aactcgggga tcagcagttt 21720 gggcagcggg gtgtcgggga aggagtcggt ccacagcttc cgcgtcagtt gcagggcgcc 21780 cagcaggtcg ggcgcggaga tcttgaaatc gcagttggga cccgcgttct gcgcgcggga 21840 gttgcggtac acggggttgc agcactggaa caccatcagg gccgggtgct tcacgctcgc 21900 cagcaccgtc gcgtcggtga tgctctccac gtcgaggtcc tcggcgttgg ccatcccgaa 21960 gggggtcatc ttgcaggtct gccttcccat ggtgggcacg cacccgggct tgtggttgca 22020 atcgcagtgc agggggatca gcatcatctg ggcctggtcg gcgttcatcc ccgggtacat 22080 ggccttcatg aaagcctcca attgcctgaa cgcctgctgg gccttggctc cctcggtgaa 22140 gaagaccccg caggacttgc tagagaactg gttggtggcg cacccggcgt cgtgcacgca 22200 gcagcgcgcg tcgttgttgg ccagctgcac cacgctgcgc ccccagcggt tctgggtgat 22260 cttggcccgg tcggggttct ccttcagcgc gcgctgcccg ttctcgctcg ccacatccat 22320 ctcgatcatg tgctccttct ggatcatggt ggtcccgtgc aggcaccgca gcttgccctc 22380 ggcctcggtg cacccgtgca gccacagcgc gcacccggtg cactcccagt tcttgtgggc 22440 gatctgggaa tgcgcgtgca cgaagccctg caggaagcgg cccatcatgg tggtcagggt 22500 cttgttgcta gtgaaggtca gcggaatgcc gcggtgctcc tcgttgatgt acaggtggca 22560 gatgcggcgg tacacctcgc cctgctcggg catcagctgg aagttggctt tcaggtcggt 22620 ctccacgcgg tagcggtcca tcagcatagt catgatttcc atacccttct cccaggccga 22680 gacgatgggc aggctcatag ggttcttcac catcatctta gcgctagcag ccgcggccag 22740 ggggtcgctc tcgtccaggg tctcaaagct ccgcttgccg tccttctcgg tgatccgcac 22800 cggggggtag ctgaagccca cggccgccag ctcctcctcg gcctgtcttt cgtcctcgct 22860 gtcctggctg acgtcctgca ggaccacatg cttggtcttg cggggtttct tcttgggcgg 22920 cagcggcggc ggagatgttg gagatggcga gggggagcgc gagttctcgc tcaccactac 22980 tatctcttcc tcttcttggt ccgaggccac gcggcggtag gtatgtctct tcgggggcag 23040 aggcggaggc gacgggctct cgccgccgcg acttggcgga tggctggcag agccccttcc 23100 gcgttcgggg gtgcgctccc ggcggcgctc tgactgactt cctccgcggc cggccattgt 23160 gttctcctag ggaggaacaa caagcatgga gactcagcca tcgccaacct cgccatctgc 23220 ccccaccgcc gacgagaagc agcagcagca gaatgaaagc ttaaccgccc cgccgcccag 23280 ccccgccacc tccgacgcgg ccgtcccaga catgcaagag atggaggaat ccatcgagat 23340 tgacctgggc tatgtgacgc ccgcggagca cgaggaggag ctggcagtgc gcttttcaca 23400 agaagagata caccaagaac agccagagca ggaagcagag aatgagcaga gtcaggctgg 23460 gctcgagcat gacggcgact acctccacct gagcgggggg gaggacgcgc tcatcaagca 23520 tctggcccgg caggccacca tcgtcaagga tgcgctgctc gaccgcaccg aggtgcccct 23580 cagcgtggag gagctcagcc gcgcctacga gttgaacctc ttctcgccgc gcgtgccccc 23640 caagcgccag cccaatggca cctgcgagcc caacccgcgc ctcaacttct acccggtctt 23700 cgcggtgccc gaggccctgg ccacctacca catctttttc aagaaccaaa agatccccgt 23760 ctcctgccgc gccaaccgca cccgcgccga cgcccttttc aacctgggtc ccggcgcccg 23820 cctacctgat atcgcctcct tggaagaggt tcccaagatc ttcgagggtc tgggcagcga 23880 cgagactcgg gccgcgaacg ctctgcaagg agaaggagga gagcatgagc accacagcgc 23940 cctggtcgag ttggaaggcg acaacgcgcg gctggcggtg ctcaaacgca cggtcgagct 24000 gacccatttc gcctacccgg ctctgaacct gccccccaaa gtcatgagcg cggtcatgga 24060 ccaggtgctc atcaagcgcg cgtcgcccat ctccgaggac gagggcatgc aagactccga 24120 ggagggcaag cccgtggtca gcgacgagca gctggcccgg tggctgggtc ctaatgctag 24180 tccccagagt ttggaagagc ggcgcaaact catgatggcc gtggtcctgg tgaccgtgga 24240 gctggagtgc ctgcgccgct tcttcgccga cgcggagacc ctgcgcaagg tcgaggagaa 24300 cctgcactac ctcttcaggc acgggttcgt gcgccaggcc tgcaagatct ccaacgtgga 24360 gctgaccaac ctggtctcct acatgggcat cttgcacgag aaccgcctgg ggcagaacgt 24420 gctgcacacc accctgcgcg gggaggcccg gcgcgactac atccgcgact gcgtctacct 24480 ctacctctgc cacacctggc agacgggcat gggcgtgtgg cagcagtgtc tggaggagca 24540 gaacctgaaa gagctctgca agctcctgca gaagaacctc aagggtctgt ggaccgggtt 24600 cgacgagcgc accaccgcct cggacctggc cgacctcatt ttccccgagc gcctcaggct 24660 gacgctgcgc aacggcctgc ccgactttat gagccaaagc atgttgcaaa actttcgctc 24720 tttcatcctc gaacgctccg gaatcctgcc cgccacctgc tccgcgctgc cctcggactt 24780 cgtgccgctg accttccgcg agtgcccccc gccgctgtgg agccactgct acctgctgcg 24840 cctggccaac tacctggcct accactcgga cgtgatcgag gacgtcagcg gcgagggcct 24900 gctcgagtgc cactgccgct gcaacctctg cacgccgcac cgctccctgg cctgcaaccc 24960 ccagctgctg agcgagaccc agatcatcgg caccttcgag ttgcaagggc ccagcgaagg 25020 cgagggttca gccgccaagg ggggtctgaa actcaccccg gggctgtgga cctcggccta 25080 cttgcgcaag ttcgtgcccg aggactacca tcccttcgag atcaggttct acgaggacca 25140 atcccatccg cccaaggccg agctgtcggc ctgcgtcatc acccaggggg cgatcctggc 25200 ccaattgcaa gccatccaga aatcccgcca agaattcttg ctgaaaaagg gccgcggggt 25260 ctacctcgac ccccagaccg gtgaggagct caaccccggc ttcccccagg atgccccgag 25320 gaaacaagaa gctgaaagtg gagctgccgc ccgtggagga tttggaggaa gactgggaga 25380 acagcagtca ggcagaggag gaggagatgg aggaagactg ggacagcact caggcagagg 25440 aggacagcct gcaagacagt ctggaggaag acgaggagga ggcagaggag gaggtggaag 25500 aagcagccgc cgccagaccg tcgtcctcgg cgggggagaa agcaagcagc acggatacca 25560 tctccgctcc gggtcggggt cccgctcgac cacacagtag atgggacgag accggacgat 25620 tcccgaaccc caccacccag accggtaaga aggagcggca gggatacaag tcctggcggg 25680 ggcacaaaaa cgccatcgtc tcctgcttgc aggcctgcgg gggcaacatc tccttcaccc 25740 ggcgctacct gctcttccac cgcggggtga actttccccg caacatcttg cattactacc 25800 gtcacctcca cagcccctac tacttccaag aagaggcagc agcagcagaa aaagaccagc 25860 agaaaaccag cagctagaaa atccacagcg gcggcagcag gtggactgag gatcgcggcg 25920 aacgagccgg cgcaaacccg ggagctgagg aaccggatct ttcccaccct ctatgccatc 25980 ttccagcaga gtcgggggca ggagcaggaa ctgaaagtca agaaccgttc tctgcgctcg 26040 ctcacccgca gttgtctgta tcacaagagc gaagaccaac ttcagcgcac tctcgaggac 26100 gccgaggctc tcttcaacaa gtactgcgcg ctcactctta aagagtagcc cgcgcccgcc 26160 cagtcgcaga aaaaggcggg aattacgtca cctgtgccct tcgccctagc cgcctccacc 26220 catcatcatg agcaaagaga ttcccacgcc ttacatgtgg agctaccagc cccagatggg 26280 cctggccgcc ggtgccgccc aggactactc cacccgcatg aattggctca gcgccgggcc 26340 cgcgatgatc tcacgggtga atgacatccg cgcccaccga aaccagatac tcctagaaca 26400 gtcagcgctc accgccacgc cccgcaatca cctcaatccg cgtaattggc ccgccgccct 26460 ggtgtaccag gaaattcccc agcccacgac cgtactactt ccgcgagacg cccaggccga 26520 agtccagctg actaactcag gtgtccagct ggcgggcggc gccaccctgt gtcgtcaccg 26580 ccccgctcag ggtataaagc ggctggtgat ccggggcaga ggcacacagc tcaacgacga 26640 ggtggtgagc tcttcgctgg gtctgcgacc tgacggagtc ttccaactcg ccggatcggg 26700 gagatcttcc ttcacgcctc gtcaggccgt cctgactttg gagagttcgt cctcgcagcc 26760 ccgctcgggt ggcatcggca ctctccagtt cgtggaggag ttcactccct cggtctactt 26820 caaccccttc tccggctccc ccggccacta cccggacgag ttcatcccga acttcgacgc 26880 catcagcgag tcggtggacg gctacgattg aaactaatca cccccttatc cagtgaaata 26940 aagatcatat tgatgatgat tttacagaaa taaaaaataa tcatttgatt tgaaataaag 27000 atacaatcat attgatgatt tgagtttaac aaaaaaataa agaatcactt acttgaaatc 27060 tgataccagg tctctgtcca tgttttctgc caacaccact tcactcccct cttcccagct 27120 ctggtactgc aggccccggc gggctgcaaa cttcctccac acgctgaagg ggatgtcaaa 27180 ttcctcctgt ccctcaatct tcattttatc ttctatcaga tgtccaaaaa gcgcgtccgg 27240 gtggatgatg acttcgaccc cgtctacccc tacgatgcag acaacgcacc gaccgtgccc 27300 ttcatcaacc cccccttcgt ctcttcagat ggattccaag agaagcccct gggggtgttg 27360 tccctgcgac tggccgaccc cgtcaccacc aagaacgggg aaatcaccct caagctggga 27420 gagggggtgg acctcgattc ctcgggaaaa ctcatctcca acacggccac caaggccgcc 27480 gcccctctca gtttttccaa caacaccatt tcccttaaca tggatcaccc cttttacact 27540 aaagatggaa aattatcctt acaagtttct ccaccattaa atatactgag aacaagcatt 27600 ctaaacacac tagctttagg ttttggatca ggtttaggac tccgtggctc tgccttggca 27660 gtacagttag tctctccact tacatttgat actgatggaa acataaagct taccttagac 27720 agaggtttgc atgttacaac aggagatgca attgaaagca acataagctg ggctaaaggt 27780 ttaaaatttg aagatggagc catagcaacc aacattggaa atgggttaga gtttggaagc 27840 agtagtacag aaacaggtgt tgatgatgct tacccaatcc aagttaaact tggatctggc 27900 cttagctttg acagtacagg agccataatg gctggtaaca aagaagacga taaactcact 27960 ttgtggacaa cacctgatcc atcaccaaac tgtcaaatac tcgcagaaaa tgatgcaaaa 28020 ctaacacttt gcttgactaa atgtggtagt caaatactgg ccactgtgtc agtcttagtt 28080 gtaggaagtg gaaacctaaa ccccattact ggcaccgtaa gcagtgctca ggtgtttcta 28140 cgttttgatg caaacggtgt tcttttaaca gaacattcta cactaaaaaa atactggggg 28200 tataggcagg gagatagcat agatggcact ccatatacca atgctgtagg attcatgccc 28260 aatttaaaag cttatccaaa gtcacaaagt tctactacta aaaataatat agtagggcaa 28320 gtatacatga atggagatgt ttcaaaacct atgcttctca ctataaccct caatggtact 28380 gatgacagca acagtacata ttcaatgtca ttttcataca cctggactaa tggaagctat 28440 gttggagcaa catttggggc taactcttat accttctcat acatcgccca agaatgaaca 28500 ctgtatccca ccctgcatgc caacccttcc caccccactc tgtggaacaa actctgaaac 28560 acaaaataaa ataaagttca agtgttttat tgattcaaca gttttacagg attcgagcag 28620 ttatttttcc tccaccctcc caggacatgg aatacaccac cctctccccc cgcacagcct 28680 tgaacatctg aatgccattg gtgatggaca tgcttttggt ctccacgttc cacacagttt 28740 cagagcgagc cagtctcggg tcggtcaggg agatgaaacc ctccgggcac tcccgcatct 28800 gcacctcaca gctcaacagc tgaggattgt cctcggtggt cgggatcacg gttatctgga 28860 agaagcagaa gagcggcggt gggaatcata gtccgcgaac gggatcggcc ggtggtgtcg 28920 catcaggccc cgcagcagtc gctgccgccg ccgctccgtc aagctgctgc tcagggggtc 28980 cgggtccagg gactccctca gcatgatgcc cacggccctc agcatcagtc gtctggtgcg 29040 gcgggcgcag cagcgcatgc ggatctcgct caggtcgctg cagtacgtgc aacacagaac 29100 caccaggttg ttcaacagtc catagttcaa cacgctccag ccgaaactca tcgcgggaag 29160 gatgctaccc acgtggccgt cgtaccagat cctcaggtaa atcaagtggt gccccctcca 29220 gaacacgctg cccacgtaca tgatctcctt gggcatgtgg cggttcacca cctcccggta 29280 ccacatcacc ctctggttga acatgcagcc ccggatgatc ctgcggaacc acagggccag 29340 caccgccccg cccgccatgc agcgaagaga ccccgggtcc cggcaatggc aatggaggac 29400 ccaccgctcg tacccgtgga tcatctggga gctgaacaag tctatgttgg cacagcacag 29460 gcatatgctc atgcatctct tcagcactct caactcctcg ggggtcaaaa ccatatccca 29520 gggcacgggg aactcttgca ggacagcgaa ccccgcagaa cagggcaatc ctcgcacaga 29580 acttacattg tgcatggaca gggtatcgca atcaggcagc accgggtgat cctccaccag 29640 agaagcgcgg gtctcggtct cctcacagcg tggtaagggg gccggccgat acgggtgatg 29700 gcgggacgcg gctgatcgtg ttcgcgaccg tgtcatgatg cagttgcttt cggacatttt 29760 cgtacttgct gtagcagaac ctggtccggg cgctgcacac cgatcgccgg cggcggtctc 29820 ggcgcttgga acgctcggtg ttgaaattgt aaaacagcca ctctctcaga ccgtgcagca 29880 gatctagggc ctcaggagtg atgaagatcc catcatgcct gatggctctg atcacatcga 29940 ccaccgtgga atgggccaga cccagccaga tgatgcaatt ttgttgggtt tcggtgacgg 30000 cgggggaggg aagaacagga agaaccatga ttaactttta atccaaacgg tctcggagta 30060 cttcaaaatg aagatcgcgg agatggcacc tctcgccccc gctgtgttgg tggaaaataa 30120 cagccaggtc aaaggtgata cggttctcga gatgttccac ggtggcttcc agcaaagcct 30180 ccacgcgcac atccagaaac aagacaatag cgaaagcggg agggttctct aattcctcaa 30240 tcatcatgtt acactcctgc accatcccca gataattttc atttttccag ccttgaatga 30300 ttcgaactag ttcctgaggt aaatccaagc cagccatgat aaagagctcg cgcagagcgc 30360 cctccaccgg cattcttaag cacaccctca taattccaag atattctgct cctggttcac 30420 ctgcagcaga ttgacaagcg gaatatcaaa atctctgccg cgatccctga gctcctccct 30480 cagcaataac tgtaagtact ctttcatatc ctctccgaaa tttttagcca taggaccacc 30540 aggaataaga ttagggcaag ccacagtaca gataaaccga agtcctcccc agtgagcatt 30600 gccaaatgca agactgctat aagcatgctg gctagacccg gtgatatctt ccagataact 30660 ggacagaaaa tcgcccaggc aatttttaag aaaatcaaca aaagaaaaat cctccaggtg 30720 gacgtttaga gcctcgggaa caacgatgaa gtaaatgcaa gcggtgcgtt ccagcatggt 30780 tagttagctg atctgtagaa aaaacaaaaa tgaacattaa accatgctag cctggcgaac 30840 aggtgggtaa atcgttctct ccagcaccag gcaggccacg gggtctccgg cgcgaccctc 30900 gtaaaaattg tcgctatgat tgaaaaccat cacagagaga cgttcccggt ggccggcgtg 30960 aatgattcga caagatgaat acacccccgg aacattggcg tccgcgagtg aaaaaaagcg 31020 cccgaggaag caataaggca ctacaatgct cagtctcaag tccagcaaag cgatgccatg 31080 cggatgaagc acaaaattct caggtgcgta caaaatgtaa ttactcccct cctgcacagg 31140 cagcaaagcc cccgatccct ccaggtacac atacaaagcc tcagcgtcca tagcttaccg 31200 agcagcagca cacaacaggc gcaagagtca gagaaaggct gagctctaac ctgtccaccc 31260 gctctctgct caatatatag cccagatcta cactgacgta aaggccaaag tctaaaaata 31320 cccgccaaat aatcacacac gcccagcaca cgcccagaaa ccggtgacac actcaaaaaa 31380 atacgcgcac ttcctcaaac gcccaaaact gccgtcattt ccgggttccc acgctacgtc 31440 atcaaaacac gactttcaaa ttccgtcgac cgttaaaaac gtcacccgcc ccgcccctaa 31500 cggtcgcccg tctctcagcc aatcagcgcc ccgcatcccc aaattcaaac acctcatttg 31560 catattaacg cgcacaaaaa gtttgagg 31588 <210> 3 <211> 11447 <212> DNA <213> Venezuelan equine encephalitis virus <400> 3 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560 gatgttcccg ttccagccaa tgtatccgat gcagccaatg ccctatcgca acccgttcgc 7620 ggccccgcgc aggccctggt tccccagaac cgaccctttt ctggcgatgc aggtgcagga 7680 attaacccgc tcgatggcta acctgacgtt caagcaacgc cgggacgcgc cacctgaggg 7740 gccatccgct aagaaaccga agaaggaggc ctcgcaaaaa cagaaagggg gaggccaagg 7800 gaagaagaag aagaaccaag ggaagaagaa ggctaagaca gggccgccta atccgaaggc 7860 acagaatgga aacaagaaga agaccaacaa gaaaccaggc aagagacagc gcatggtcat 7920 gaaattggaa tctgacaaga cgttcccaat catgttggaa gggaagataa acggctacgc 7980 ttgtgtggtc ggagggaagt tattcaggcc gatgcatgtg gaaggcaaga tcgacaacga 8040 cgttctggcc gcgcttaaga cgaagaaagc atccaaatac gatcttgagt atgcagatgt 8100 gccacagaac atgcgggccg atacattcaa atacacccat gagaaacccc aaggctatta 8160 cagctggcat catggagcag tccaatatga aaatgggcgt ttcacggtgc cgaaaggagt 8220 tggggccaag ggagacagcg gacgacccat tctggataac cagggacggg tggtcgctat 8280 tgtgctggga ggtgtgaatg aaggatctag gacagccctt tcagtcgtca tgtggaacga 8340 gaagggagtt accgtgaagt atactccgga gaactgcgag caatggtcac tagtgaccac 8400 catgtgtctg ctcgccaatg tgacgttccc atgtgctcaa ccaccaattt gctacgacag 8460 aaaaccagca gagactttgg ccatgctcag cgttaacgtt gacaacccgg gctacgatga 8520 gctgctggaa gcagctgtta agtgccccgg aaggaaaagg agatccaccg aggagctgtt 8580 taaggagtat aagctaacgc gcccttacat ggccagatgc atcagatgtg cagttgggag 8640 ctgccatagt ccaatagcaa tcgaggcagt aaagagcgac gggcacgacg gttatgttag 8700 acttcagact tcctcgcagt atggcctgga ttcctccggc aacttaaagg gcaggaccat 8760 gcggtatgac atgcacggga ccattaaaga gataccacta catcaagtgt cactccatac 8820 atctcgcccg tgtcacattg tggatgggca cggttatttc ctgcttgcca ggtgcccggc 8880 aggggactcc atcaccatgg aatttaagaa agattccgtc acacactcct gctcggtgcc 8940 gtatgaagtg aaatttaatc ctgtaggcag agaactctat actcatcccc cagaacacgg 9000 agtagagcaa gcgtgccaag tctacgcaca tgatgcacag aacagaggag cttatgtcga 9060 gatgcacctc ccgggctcag aagtggacag cagtttggtt tccttgagcg gcagttcagt 9120 caccgtgaca cctcctgttg ggactagcgc cctggtggaa tgcgagtgtg gcggcacaaa 9180 gatctccgag accatcaaca agacaaaaca gttcagccag tgcacaaaga aggagcagtg 9240 cagagcatat cggctgcaga acgataagtg ggtgtataat tctgacaaac tgcccaaagc 9300 agcgggagcc accttaaaag gaaaactgca tgtcccattc ttgctggcag acggcaaatg 9360 caccgtgcct ctagcaccag aacctatgat aacctttggt ttcagatcag tgtcactgaa 9420 actgcaccct aagaatccca catatctaac cacccgccaa cttgctgatg agcctcacta 9480 cacgcacgag ctcatatctg aaccagctgt taggaatttt accgtcaccg aaaaagggtg 9540 ggagtttgta tggggaaacc acccgccgaa aaggttttgg gcacaggaaa cagcacccgg 9600 aaatccacat gggctaccgc acgaggtgat aactcattat taccacagat accctatgtc 9660 caccatcctg ggtttgtcaa tttgtgccgc cattgcaacc gtttccgttg cagcgtctac 9720 ctggctgttt tgcagatcta gagttgcgtg cctaactcct taccggctaa cacctaacgc 9780 taggatacca ttttgtctgg ctgtgctttg ctgcgcccgc actgcccggg ccgagaccac 9840 ctgggagtcc ttggatcacc tatggaacaa taaccaacag atgttctgga ttcaattgct 9900 gatccctctg gccgccttga tcgtagtgac tcgcctgctc aggtgcgtgt gctgtgtcgt 9960 gcctttttta gtcatggccg gcgccgcagg cgccggcgcc tacgagcacg cgaccacgat 10020 gccgagccaa gcgggaatct cgtataacac tatagtcaac agagcaggct acgcaccact 10080 ccctatcagc ataacaccaa caaagatcaa gctgatacct acagtgaact tggagtacgt 10140 cacctgccac tacaaaacag gaatggattc accagccatc aaatgctgcg gatctcagga 10200 atgcactcca acttacaggc ctgatgaaca gtgcaaagtc ttcacagggg tttacccgtt 10260 catgtggggt ggtgcatatt gcttttgcga cactgagaac acccaagtca gcaaggccta 10320 cgtaatgaaa tctgacgact gccttgcgga tcatgctgaa gcatataaag cgcacacagc 10380 ctcagtgcag gcgttcctca acatcacagt gggagaacac tctattgtga ctaccgtgta 10440 tgtgaatgga gaaactcctg tgaatttcaa tggggtcaaa ttaactgcag gtccgctttc 10500 cacagcttgg acaccctttg atcgcaaaat cgtgcagtat gccggggaga tctataatta 10560 tgattttcct gagtatgggg caggacaacc aggagcattt ggagatatac aatccagaac 10620 agtctcaagc tcagatctgt atgccaatac caacctagtg ctgcagagac ccaaagcagg 10680 agcgatccac gtgccataca ctcaggcacc ttcgggtttt gagcaatgga agaaagataa 10740 agctccatca ttgaaattta ccgccccttt cggatgcgaa atatatacaa accccattcg 10800 cgccgaaaac tgtgctgtag ggtcaattcc attagccttt gacattcccg acgccttgtt 10860 caccagggtg tcagaaacac cgacactttc agcggccgaa tgcactctta acgagtgcgt 10920 gtattcttcc gactttggtg ggatcgccac ggtcaagtac tcggccagca agtcaggcaa 10980 gtgcgcagtc catgtgccat cagggactgc taccctaaaa gaagcagcag tcgagctaac 11040 cgagcaaggg tcggcgacta tccatttctc gaccgcaaat atccacccgg agttcaggct 11100 ccaaatatgc acatcatatg ttacgtgcaa aggtgattgt caccccccga aagaccatat 11160 tgtgacacac cctcagtatc acgcccaaac atttacagcc gcggtgtcaa aaaccgcgtg 11220 gacgtggtta acatccctgc tgggaggatc agccgtaatt attataattg gcttggtgct 11280 ggctactatt gtggccatgt acgtgctgac caaccagaaa cataattgaa tacagcagca 11340 attggcaagc tgcttacata gaactcgcgg cgattggcat gccgccttaa aatttttatt 11400 ttattttttc ttttcttttc cgaatcggat tttgttttta atatttc 11447 <210> 4 <211> 9577 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 4 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560 ttaagccacc atggcaggca tgtttcaggc gctgagcgaa ggctgcaccc cgtatgatat 7620 taaccagatg ctgaacgtgc tgggcgatca tcaggtctca ggccttgagc agcttgagag 7680 tataatcaac tttgaaaaac tgactgaatg gaccagttct aatgttatgc ctatcctgtc 7740 tcctctgaca aagggcatcc tgggcttcgt gtttaccctg accgtgcctt ctgagagagg 7800 acttagctgc attagcgaag cggatgcgac caccccggaa agcgcgaacc tgggcgaaga 7860 aattctgagc cagctgtatc tttggccaag ggtgacctac cattccccta gttatgctta 7920 ccaccaattt gaaagacgag ccaaatataa aagacacttc cccggctttg gccagagcct 7980 gctgtttggc taccctgtgt acgtgttcgg cgattgcgtg cagggcgatt gggatgcgat 8040 tcgctttcgc tattgcgcgc cgccgggcta tgcgctgctg cgctgcaacg ataccaacta 8100 tagcgctctg ctggctgtgg gggccctaga aggacccagg aatcaggact ggcttggtgt 8160 cccaagacaa cttgtaactc ggatgcaggc tattcagaat gccggcctgt gtaccctggt 8220 ggccatgctg gaagagacaa tcttctggct gcaagcgttt ctgatggcgc tgaccgatag 8280 cggcccgaaa accaacatta ttgtggatag ccagtatgtg atgggcatta gcaaaccgag 8340 ctttcaggaa tttgtggatt gggaaaacgt gagcccggaa ctgaacagca ccgatcagcc 8400 gttttggcaa gccggaatcc tggccagaaa tctggtgcct atggtggcca cagtgcaggg 8460 ccagaacctg aagtaccagg gtcagtcact agtcatctct gcttctatca ttgtcttcaa 8520 cctgctggaa ctggaaggtg attatcgaga tgatggcaac gtgtgggtgc ataccccgct 8580 gagcccgcgc accctgaacg cgtgggtgaa agcggtggaa gaaaaaaaag gtattccagt 8640 tcacctagag ctggccagta tgaccaacat ggagctcatg agcagtattg tgcatcagca 8700 ggtcagaaca tacggccccg tgttcatgtg tctcggcgga ctgcttacaa tggtggctgg 8760 tgctgtgtgg ctgacagtgc gagtgctcga gctgttccgg gccgcgcagc tggccaacga 8820 cgtggtcctc cagatcatgg agctttgtgg tgcagcgttt cgccaggtgt gccataccac 8880 cgtgccgtgg ccgaacgcga gcctgacccc gaaatggaac aacgaaacca cccagcccca 8940 gatcgccaac tgcagcgtgt atgacttttt tgtgtggctc cattattatt ctgttcgaga 9000 cacactttgg ccaagggtga cctaccatat gaacaaatat gcgtatcata tgctggaaag 9060 acgagccaaa tataaaagag gaccaggacc tggcgctaaa tttgtggccg cctggacact 9120 gaaagccgct gctggtcctg gacctggcca gtacatcaag gccaacagca agttcatcgg 9180 catcaccgaa ctcggacccg gaccaggctg atgattcgaa cggccgtatc acgcccaaac 9240 atttacagcc gcggtgtcaa aaaccgcgtg gacgtggtta acatccctgc tgggaggatc 9300 agccgtaatt attataattg gcttggtgct ggctactatt gtggccatgt acgtgctgac 9360 caaccagaaa cataattgaa tacagcagca attggcaagc tgcttacata gaactcgcgg 9420 cgattggcat gccgccttaa aatttttatt ttattttttc ttttcttttc cgaatcggat 9480 tttgttttta atatttcaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 9540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 9577 <210> 5 <211> 11447 <212> DNA <213> Venezuelan equine encephalitis virus <400> 5 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gacatagtct agtccgccaa 7560 gatgttcccg ttccagccaa tgtatccgat gcagccaatg ccctatcgca acccgttcgc 7620 ggccccgcgc aggccctggt tccccagaac cgaccctttt ctggcgatgc aggtgcagga 7680 attaacccgc tcgatggcta acctgacgtt caagcaacgc cgggacgcgc cacctgaggg 7740 gccatccgct aagaaaccga agaaggaggc ctcgcaaaaa cagaaagggg gaggccaagg 7800 gaagaagaag aagaaccaag ggaagaagaa ggctaagaca gggccgccta atccgaaggc 7860 acagaatgga aacaagaaga agaccaacaa gaaaccaggc aagagacagc gcatggtcat 7920 gaaattggaa tctgacaaga cgttcccaat catgttggaa gggaagataa acggctacgc 7980 ttgtgtggtc ggagggaagt tattcaggcc gatgcatgtg gaaggcaaga tcgacaacga 8040 cgttctggcc gcgcttaaga cgaagaaagc atccaaatac gatcttgagt atgcagatgt 8100 gccacagaac atgcgggccg atacattcaa atacacccat gagaaacccc aaggctatta 8160 cagctggcat catggagcag tccaatatga aaatgggcgt ttcacggtgc cgaaaggagt 8220 tggggccaag ggagacagcg gacgacccat tctggataac cagggacggg tggtcgctat 8280 tgtgctggga ggtgtgaatg aaggatctag gacagccctt tcagtcgtca tgtggaacga 8340 gaagggagtt accgtgaagt atactccgga gaactgcgag caatggtcac tagtgaccac 8400 catgtgtctg ctcgccaatg tgacgttccc atgtgctcaa ccaccaattt gctacgacag 8460 aaaaccagca gagactttgg ccatgctcag cgttaacgtt gacaacccgg gctacgatga 8520 gctgctggaa gcagctgtta agtgccccgg aaggaaaagg agatccaccg aggagctgtt 8580 taaggagtat aagctaacgc gcccttacat ggccagatgc atcagatgtg cagttgggag 8640 ctgccatagt ccaatagcaa tcgaggcagt aaagagcgac gggcacgacg gttatgttag 8700 acttcagact tcctcgcagt atggcctgga ttcctccggc aacttaaagg gcaggaccat 8760 gcggtatgac atgcacggga ccattaaaga gataccacta catcaagtgt cactccatac 8820 atctcgcccg tgtcacattg tggatgggca cggttatttc ctgcttgcca ggtgcccggc 8880 aggggactcc atcaccatgg aatttaagaa agattccgtc acacactcct gctcggtgcc 8940 gtatgaagtg aaatttaatc ctgtaggcag agaactctat actcatcccc cagaacacgg 9000 agtagagcaa gcgtgccaag tctacgcaca tgatgcacag aacagaggag cttatgtcga 9060 gatgcacctc ccgggctcag aagtggacag cagtttggtt tccttgagcg gcagttcagt 9120 caccgtgaca cctcctgttg ggactagcgc cctggtggaa tgcgagtgtg gcggcacaaa 9180 gatctccgag accatcaaca agacaaaaca gttcagccag tgcacaaaga aggagcagtg 9240 cagagcatat cggctgcaga acgataagtg ggtgtataat tctgacaaac tgcccaaagc 9300 agcgggagcc accttaaaag gaaaactgca tgtcccattc ttgctggcag acggcaaatg 9360 caccgtgcct ctagcaccag aacctatgat aacctttggt ttcagatcag tgtcactgaa 9420 actgcaccct aagaatccca catatctaac cacccgccaa cttgctgatg agcctcacta 9480 cacgcacgag ctcatatctg aaccagctgt taggaatttt accgtcaccg aaaaagggtg 9540 ggagtttgta tggggaaacc acccgccgaa aaggttttgg gcacaggaaa cagcacccgg 9600 aaatccacat gggctaccgc acgaggtgat aactcattat taccacagat accctatgtc 9660 caccatcctg ggtttgtcaa tttgtgccgc cattgcaacc gtttccgttg cagcgtctac 9720 ctggctgttt tgcagatcta gagttgcgtg cctaactcct taccggctaa cacctaacgc 9780 taggatacca ttttgtctgg ctgtgctttg ctgcgcccgc actgcccggg ccgagaccac 9840 ctgggagtcc ttggatcacc tatggaacaa taaccaacag atgttctgga ttcaattgct 9900 gatccctctg gccgccttga tcgtagtgac tcgcctgctc aggtgcgtgt gctgtgtcgt 9960 gcctttttta gtcatggccg gcgccgcagg cgccggcgcc tacgagcacg cgaccacgat 10020 gccgagccaa gcgggaatct cgtataacac tatagtcaac agagcaggct acgcaccact 10080 ccctatcagc ataacaccaa caaagatcaa gctgatacct acagtgaact tggagtacgt 10140 cacctgccac tacaaaacag gaatggattc accagccatc aaatgctgcg gatctcagga 10200 atgcactcca acttacaggc ctgatgaaca gtgcaaagtc ttcacagggg tttacccgtt 10260 catgtggggt ggtgcatatt gcttttgcga cactgagaac acccaagtca gcaaggccta 10320 cgtaatgaaa tctgacgact gccttgcgga tcatgctgaa gcatataaag cgcacacagc 10380 ctcagtgcag gcgttcctca acatcacagt gggagaacac tctattgtga ctaccgtgta 10440 tgtgaatgga gaaactcctg tgaatttcaa tggggtcaaa ttaactgcag gtccgctttc 10500 cacagcttgg acaccctttg atcgcaaaat cgtgcagtat gccggggaga tctataatta 10560 tgattttcct gagtatgggg caggacaacc aggagcattt ggagatatac aatccagaac 10620 agtctcaagc tcagatctgt atgccaatac caacctagtg ctgcagagac ccaaagcagg 10680 agcgatccac gtgccataca ctcaggcacc ttcgggtttt gagcaatgga agaaagataa 10740 agctccatca ttgaaattta ccgccccttt cggatgcgaa atatatacaa accccattcg 10800 cgccgaaaac tgtgctgtag ggtcaattcc attagccttt gacattcccg acgccttgtt 10860 caccagggtg tcagaaacac cgacactttc agcggccgaa tgcactctta acgagtgcgt 10920 gtattcttcc gactttggtg ggatcgccac ggtcaagtac tcggccagca agtcaggcaa 10980 gtgcgcagtc catgtgccat cagggactgc taccctaaaa gaagcagcag tcgagctaac 11040 cgagcaaggg tcggcgacta tccatttctc gaccgcaaat atccacccgg agttcaggct 11100 ccaaatatgc acatcatatg ttacgtgcaa aggtgattgt caccccccga aagaccatat 11160 tgtgacacac cctcagtatc acgcccaaac atttacagcc gcggtgtcaa aaaccgcgtg 11220 gacgtggtta acatccctgc tgggaggatc agccgtaatt attataattg gcttggtgct 11280 ggctactatt gtggccatgt acgtgctgac caaccagaaa cataattgaa tacagcagca 11340 attggcaagc tgcttacata gaactcgcgg cgattggcat gccgccttaa aatttttatt 11400 ttattttttc ttttcttttc cgaatcggat tttgttttta atatttc 11447 <210> 6 <211> 7894 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 6 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gactatcacg cccaaacatt 7560 tacagccgcg gtgtcaaaaa ccgcgtggac gtggttaaca tccctgctgg gaggatcagc 7620 cgtaattatt ataattggct tggtgctggc tactattgtg gccatgtacg tgctgaccaa 7680 ccagaaacat aattgaatac agcagcaatt ggcaagctgc ttacatagaa ctcgcggcga 7740 ttggcatgcc gccttaaaat ttttatttta ttttttcttt tcttttccga atcggatttt 7800 gtttttaata tttcaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 7894 <210> 7 <211> 7893 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 7 ataggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgatggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gactatcacg cccaaacatt 7560 tacagccgcg gtgtcaaaaa ccgcgtggac gtggttaaca tccctgctgg gaggatcagc 7620 cgtaattatt ataattggct tggtgctggc tactattgtg gccatgtacg tgctgaccaa 7680 ccagaaacat aattgaatac agcagcaatt ggcaagctgc ttacatagaa ctcgcggcga 7740 ttggcatgcc gccttaaaat ttttatttta tttttctttt cttttccgaa tcggattttg 7800 tttttaatat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 7893 <210> 8 <211> 7927 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 8 taatacgact cactatagga tgggcggcgc atgagagaag cccagaccaa ttacctaccc 60 aaaatggaga aagttcacgt tgacatcgag gaagacagcc cattcctcag agctttgcag 120 cggagcttcc cgcagtttga ggtagaagcc aagcaggtca ctgataatga ccatgctaat 180 gccagagcgt tttcgcatct ggcttcaaaa ctgatcgaaa cggaggtgga cccatccgac 240 acgatccttg acattggaag tgcgcccgcc cgcagaatgt attctaagca caagtatcat 300 tgtatctgtc cgatgagatg tgcggaagat ccggacagat tgtataagta tgcaactaag 360 ctgaagaaaa actgtaagga aataactgat aaggaattgg acaagaaaat gaaggagctc 420 gccgccgtca tgagcgaccc tgacctggaa actgagacta tgtgcctcca cgacgacgag 480 tcgtgtcgct acgaagggca agtcgctgtt taccaggatg tatacgcggt tgacggaccg 540 acaagtctct atcaccaagc caataaggga gttagagtcg cctactggat aggctttgac 600 accacccctt ttatgtttaa gaacttggct ggagcatatc catcatactc taccaactgg 660 gccgacgaaa ccgtgttaac ggctcgtaac ataggcctat gcagctctga cgttatggag 720 cggtcacgta gagggatgtc cattcttaga aagaagtatt tgaaaccatc caacaatgtt 780 ctattctctg ttggctcgac catctaccac gagaagaggg acttactgag gagctggcac 840 ctgccgtctg tatttcactt acgtggcaag caaaattaca catgtcggtg tgagactata 900 gttagttgcg acgggtacgt cgttaaaaga atagctatca gtccaggcct gtatgggaag 960 ccttcaggct atgctgctac gatgcaccgc gagggattct tgtgctgcaa agtgacagac 1020 acattgaacg gggagagggt ctcttttccc gtgtgcacgt atgtgccagc tacattgtgt 1080 gaccaaatga ctggcatact ggcaacagat gtcagtgcgg acgacgcgca aaaactgctg 1140 gttgggctca accagcgtat agtcgtcaac ggtcgcaccc agagaaacac caataccatg 1200 aaaaattacc ttttgcccgt agtggcccag gcatttgcta ggtgggcaaa ggaatataag 1260 gaagatcaag aagatgaaag gccactagga ctacgagata gacagttagt catggggtgt 1320 tgttgggctt ttagaaggca caagataaca tctatttata agcgcccgga tacccaaacc 1380 atcatcaaag tgaacagcga tttccactca ttcgtgctgc ccaggatagg cagtaacaca 1440 ttggagatcg ggctgagaac aagaatcagg aaaatgttag aggagcacaa ggagccgtca 1500 cctctcatta ccgccgagga cgtacaagaa gctaagtgcg cagccgatga ggctaaggag 1560 gtgcgtgaag ccgaggagtt gcgcgcagct ctaccacctt tggcagctga tgttgaggag 1620 cccactctgg aagccgatgt cgacttgatg ttacaagagg ctggggccgg ctcagtggag 1680 acacctcgtg gcttgataaa ggttaccagc tacgctggcg aggacaagat cggctcttac 1740 gctgtgcttt ctccgcaggc tgtactcaag agtgaaaaat tatcttgcat ccaccctctc 1800 gctgaacaag tcatagtgat aacacactct ggccgaaaag ggcgttatgc cgtggaacca 1860 taccatggta aagtagtggt gccagaggga catgcaatac ccgtccagga ctttcaagct 1920 ctgagtgaaa gtgccaccat tgtgtacaac gaacgtgagt tcgtaaacag gtacctgcac 1980 catattgcca cacatggagg agcgctgaac actgatgaag aatattacaa aactgtcaag 2040 cccagcgagc acgacggcga atacctgtac gacatcgaca ggaaacagtg cgtcaagaaa 2100 gaactagtca ctgggctagg gctcacaggc gagctggtgg atcctccctt ccatgaattc 2160 gcctacgaga gtctgagaac acgaccagcc gctccttacc aagtaccaac cataggggtg 2220 tatggcgtgc caggatcagg caagtctggc atcattaaaa gcgcagtcac caaaaaagat 2280 ctagtggtga gcgccaagaa agaaaactgt gcagaaatta taagggacgt caagaaaatg 2340 aaagggctgg acgtcaatgc cagaactgtg gactcagtgc tcttgaatgg atgcaaacac 2400 cccgtagaga ccctgtatat tgacgaagct tttgcttgtc atgcaggtac tctcagagcg 2460 ctcatagcca ttataagacc taaaaaggca gtgctctgcg gggatcccaa acagtgcggt 2520 ttttttaaca tgatgtgcct gaaagtgcat tttaaccacg agatttgcac acaagtcttc 2580 cacaaaagca tctctcgccg ttgcactaaa tctgtgactt cggtcgtctc aaccttgttt 2640 tacgacaaaa aaatgagaac gacgaatccg aaagagacta agattgtgat tgacactacc 2700 ggcagtacca aacctaagca ggacgatctc attctcactt gtttcagagg gtgggtgaag 2760 cagttgcaaa tagattacaa aggcaacgaa ataatgacgg cagctgcctc tcaagggctg 2820 acccgtaaag gtgtgtatgc cgttcggtac aaggtgaatg aaaatcctct gtacgcaccc 2880 acctcagaac atgtgaacgt cctactgacc cgcacggagg accgcatcgt gtggaaaaca 2940 ctagccggcg acccatggat aaaaacactg actgccaagt accctgggaa tttcactgcc 3000 acgatagagg agtggcaagc agagcatgat gccatcatga ggcacatctt ggagagaccg 3060 gaccctaccg acgtcttcca gaataaggca aacgtgtgtt gggccaaggc tttagtgccg 3120 gtgctgaaga ccgctggcat agacatgacc actgaacaat ggaacactgt ggattatttt 3180 gaaacggaca aagctcactc agcagagata gtattgaacc aactatgcgt gaggttcttt 3240 ggactcgatc tggactccgg tctattttct gcacccactg ttccgttatc cattaggaat 3300 aatcactggg ataactcccc gtcgcctaac atgtacgggc tgaataaaga agtggtccgt 3360 cagctctctc gcaggtaccc acaactgcct cgggcagttg ccactggaag agtctatgac 3420 atgaacactg gtacactgcg caattatgat ccgcgcataa acctagtacc tgtaaacaga 3480 agactgcctc atgctttagt cctccaccat aatgaacacc cacagagtga cttttcttca 3540 ttcgtcagca aattgaaggg cagaactgtc ctggtggtcg gggaaaagtt gtccgtccca 3600 ggcaaaatgg ttgactggtt gtcagaccgg cctgaggcta ccttcagagc tcggctggat 3660 ttaggcatcc caggtgatgt gcccaaatat gacataatat ttgttaatgt gaggacccca 3720 tataaatacc atcactatca gcagtgtgaa gaccatgcca ttaagcttag catgttgacc 3780 aagaaagctt gtctgcatct gaatcccggc ggaacctgtg tcagcatagg ttatggttac 3840 gctgacaggg ccagcgaaag catcattggt gctatagcgc ggcagttcaa gttttcccgg 3900 gtatgcaaac cgaaatcctc acttgaagag acggaagttc tgtttgtatt cattgggtac 3960 gatcgcaagg cccgtacgca caatccttac aagctttcat caaccttgac caacatttat 4020 acaggttcca gactccacga agccggatgt gcaccctcat atcatgtggt gcgaggggat 4080 attgccacgg ccaccgaagg agtgattata aatgctgcta acagcaaagg acaacctggc 4140 ggaggggtgt gcggagcgct gtataagaaa ttcccggaaa gcttcgattt acagccgatc 4200 gaagtaggaa aagcgcgact ggtcaaaggt gcagctaaac atatcattca tgccgtagga 4260 ccaaacttca acaaagtttc ggaggttgaa ggtgacaaac agttggcaga ggcttatgag 4320 tccatcgcta agattgtcaa cgataacaat tacaagtcag tagcgattcc actgttgtcc 4380 accggcatct tttccgggaa caaagatcga ctaacccaat cattgaacca tttgctgaca 4440 gctttagaca ccactgatgc agatgtagcc atatactgca gggacaagaa atgggaaatg 4500 actctcaagg aagcagtggc taggagagaa gcagtggagg agatatgcat atccgacgac 4560 tcttcagtga cagaacctga tgcagagctg gtgagggtgc atccgaagag ttctttggct 4620 ggaaggaagg gctacagcac aagcgatggc aaaactttct catatttgga agggaccaag 4680 tttcaccagg cggccaagga tatagcagaa attaatgcca tgtggcccgt tgcaacggag 4740 gccaatgagc aggtatgcat gtatatcctc ggagaaagca tgagcagtat taggtcgaaa 4800 tgccccgtcg aagagtcgga agcctccaca ccacctagca cgctgccttg cttgtgcatc 4860 catgccatga ctccagaaag agtacagcgc ctaaaagcct cacgtccaga acaaattact 4920 gtgtgctcat cctttccatt gccgaagtat agaatcactg gtgtgcagaa gatccaatgc 4980 tcccagccta tattgttctc accgaaagtg cctgcgtata ttcatccaag gaagtatctc 5040 gtggaaacac caccggtaga cgagactccg gagccatcgg cagagaacca atccacagag 5100 gggacacctg aacaaccacc acttataacc gaggatgaga ccaggactag aacgcctgag 5160 ccgatcatca tcgaagagga agaagaggat agcataagtt tgctgtcaga tggcccgacc 5220 caccaggtgc tgcaagtcga ggcagacatt cacgggccgc cctctgtatc tagctcatcc 5280 tggtccattc ctcatgcatc cgactttgat gtggacagtt tatccatact tgacaccctg 5340 gagggagcta gcgtgaccag cggggcaacg tcagccgaga ctaactctta cttcgcaaag 5400 agtatggagt ttctggcgcg accggtgcct gcgcctcgaa cagtattcag gaaccctcca 5460 catcccgctc cgcgcacaag aacaccgtca cttgcaccca gcagggcctg ctcgagaacc 5520 agcctagttt ccaccccgcc aggcgtgaat agggtgatca ctagagagga gctcgaggcg 5580 cttaccccgt cacgcactcc tagcaggtcg gtctcgagaa ccagcctggt ctccaacccg 5640 ccaggcgtaa atagggtgat tacaagagag gagtttgagg cgttcgtagc acaacaacaa 5700 tgacggtttg atgcgggtgc atacatcttt tcctccgaca ccggtcaagg gcatttacaa 5760 caaaaatcag taaggcaaac ggtgctatcc gaagtggtgt tggagaggac cgaattggag 5820 atttcgtatg ccccgcgcct cgaccaagaa aaagaagaat tactacgcaa gaaattacag 5880 ttaaatccca cacctgctaa cagaagcaga taccagtcca ggaaggtgga gaacatgaaa 5940 gccataacag ctagacgtat tctgcaaggc ctagggcatt atttgaaggc agaaggaaaa 6000 gtggagtgct accgaaccct gcatcctgtt cctttgtatt catctagtgt gaaccgtgcc 6060 ttttcaagcc ccaaggtcgc agtggaagcc tgtaacgcca tgttgaaaga gaactttccg 6120 actgtggctt cttactgtat tattccagag tacgatgcct atttggacat ggttgacgga 6180 gcttcatgct gcttagacac tgccagtttt tgccctgcaa agctgcgcag ctttccaaag 6240 aaacactcct atttggaacc cacaatacga tcggcagtgc cttcagcgat ccagaacacg 6300 ctccagaacg tcctggcagc tgccacaaaa agaaattgca atgtcacgca aatgagagaa 6360 ttgcccgtat tggattcggc ggcctttaat gtggaatgct tcaagaaata tgcgtgtaat 6420 aatgaatatt gggaaacgtt taaagaaaac cccatcaggc ttactgaaga aaacgtggta 6480 aattacatta ccaaattaaa aggaccaaaa gctgctgctc tttttgcgaa gacacataat 6540 ttgaatatgt tgcaggacat accaatggac aggtttgtaa tggacttaaa gagagacgtg 6600 aaagtgactc caggaacaaa acatactgaa gaacggccca aggtacaggt gatccaggct 6660 gccgatccgc tagcaacagc gtatctgtgc ggaatccacc gagagctggt taggagatta 6720 aatgcggtcc tgcttccgaa cattcataca ctgtttgata tgtcggctga agactttgac 6780 gctattatag ccgagcactt ccagcctggg gattgtgttc tggaaactga catcgcgtcg 6840 tttgataaaa gtgaggacga cgccatggct ctgaccgcgt taatgattct ggaagactta 6900 ggtgtggacg cagagctgtt gacgctgatt gaggcggctt tcggcgaaat ttcatcaata 6960 catttgccca ctaaaactaa atttaaattc ggagccatga tgaaatctgg aatgttcctc 7020 acactgtttg tgaacacagt cattaacatt gtaatcgcaa gcagagtgtt gagagaacgg 7080 ctaaccggat caccatgtgc agcattcatt ggagatgaca atatcgtgaa aggagtcaaa 7140 tcggacaaat taatggcaga caggtgcgcc acctggttga atatggaagt caagattata 7200 gatgctgtgg tgggcgagaa agcgccttat ttctgtggag ggtttatttt gtgtgactcc 7260 gtgaccggca cagcgtgccg tgtggcagac cccctaaaaa ggctgtttaa gcttggcaaa 7320 cctctggcag cagacgatga acatgatgat gacaggagaa gggcattgca tgaagagtca 7380 acacgctgga accgagtggg tattctttca gagctgtgca aggcagtaga atcaaggtat 7440 gaaaccgtag gaacttccat catagttatg gccatgacta ctctagctag cagtgttaaa 7500 tcattcagct acctgagagg ggcccctata actctctacg gctaacctga atggactacg 7560 actatcacgc ccaaacattt acagccgcgg tgtcaaaaac cgcgtggacg tggttaacat 7620 ccctgctggg aggatcagcc gtaattatta taattggctt ggtgctggct actattgtgg 7680 ccatgtacgt gctgaccaac cagaaacata attgaataca gcagcaattg gcaagctgct 7740 tacatagaac tcgcggcgat tggcatgccg ccttaaaatt tttattttat tttttctttt 7800 cttttccgaa tcggattttg tttttaatat ttcaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaatacgtag 7920 tttaaac 7927 <210> 9 <211> 7926 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 9 taatacgact cactatagga taggcggcgc atgagagaag cccagaccaa ttacctaccc 60 aaaatggaga aagttcacgt tgacatcgag gaagacagcc cattcctcag agctttgcag 120 cggagcttcc cgcagtttga ggtagaagcc aagcaggtca ctgataatga ccatgctaat 180 gccagagcgt tttcgcatct ggcttcaaaa ctgatcgaaa cggaggtgga cccatccgac 240 acgatccttg acattggaag tgcgcccgcc cgcagaatgt attctaagca caagtatcat 300 tgtatctgtc cgatgagatg tgcggaagat ccggacagat tgtataagta tgcaactaag 360 ctgaagaaaa actgtaagga aataactgat aaggaattgg acaagaaaat gaaggagctc 420 gccgccgtca tgagcgaccc tgacctggaa actgagacta tgtgcctcca cgacgacgag 480 tcgtgtcgct acgaagggca agtcgctgtt taccaggatg tatacgcggt tgacggaccg 540 acaagtctct atcaccaagc caataaggga gttagagtcg cctactggat aggctttgac 600 accacccctt ttatgtttaa gaacttggct ggagcatatc catcatactc taccaactgg 660 gccgacgaaa ccgtgttaac ggctcgtaac ataggcctat gcagctctga cgttatggag 720 cggtcacgta gagggatgtc cattcttaga aagaagtatt tgaaaccatc caacaatgtt 780 ctattctctg ttggctcgac catctaccac gagaagaggg acttactgag gagctggcac 840 ctgccgtctg tatttcactt acgtggcaag caaaattaca catgtcggtg tgagactata 900 gttagttgcg acgggtacgt cgttaaaaga atagctatca gtccaggcct gtatgggaag 960 ccttcaggct atgctgctac gatgcaccgc gagggattct tgtgctgcaa agtgacagac 1020 acattgaacg gggagagggt ctcttttccc gtgtgcacgt atgtgccagc tacattgtgt 1080 gaccaaatga ctggcatact ggcaacagat gtcagtgcgg acgacgcgca aaaactgctg 1140 gttgggctca accagcgtat agtcgtcaac ggtcgcaccc agagaaacac caataccatg 1200 aaaaattacc ttttgcccgt agtggcccag gcatttgcta ggtgggcaaa ggaatataag 1260 gaagatcaag aagatgaaag gccactagga ctacgagata gacagttagt catggggtgt 1320 tgttgggctt ttagaaggca caagataaca tctatttata agcgcccgga tacccaaacc 1380 atcatcaaag tgaacagcga tttccactca ttcgtgctgc ccaggatagg cagtaacaca 1440 ttggagatcg ggctgagaac aagaatcagg aaaatgttag aggagcacaa ggagccgtca 1500 cctctcatta ccgccgagga cgtacaagaa gctaagtgcg cagccgatga ggctaaggag 1560 gtgcgtgaag ccgaggagtt gcgcgcagct ctaccacctt tggcagctga tgttgaggag 1620 cccactctgg aagccgatgt cgacttgatg ttacaagagg ctggggccgg ctcagtggag 1680 acacctcgtg gcttgataaa ggttaccagc tacgatggcg aggacaagat cggctcttac 1740 gctgtgcttt ctccgcaggc tgtactcaag agtgaaaaat tatcttgcat ccaccctctc 1800 gctgaacaag tcatagtgat aacacactct ggccgaaaag ggcgttatgc cgtggaacca 1860 taccatggta aagtagtggt gccagaggga catgcaatac ccgtccagga ctttcaagct 1920 ctgagtgaaa gtgccaccat tgtgtacaac gaacgtgagt tcgtaaacag gtacctgcac 1980 catattgcca cacatggagg agcgctgaac actgatgaag aatattacaa aactgtcaag 2040 cccagcgagc acgacggcga atacctgtac gacatcgaca ggaaacagtg cgtcaagaaa 2100 gaactagtca ctgggctagg gctcacaggc gagctggtgg atcctccctt ccatgaattc 2160 gcctacgaga gtctgagaac acgaccagcc gctccttacc aagtaccaac cataggggtg 2220 tatggcgtgc caggatcagg caagtctggc atcattaaaa gcgcagtcac caaaaaagat 2280 ctagtggtga gcgccaagaa agaaaactgt gcagaaatta taagggacgt caagaaaatg 2340 aaagggctgg acgtcaatgc cagaactgtg gactcagtgc tcttgaatgg atgcaaacac 2400 cccgtagaga ccctgtatat tgacgaagct tttgcttgtc atgcaggtac tctcagagcg 2460 ctcatagcca ttataagacc taaaaaggca gtgctctgcg gggatcccaa acagtgcggt 2520 ttttttaaca tgatgtgcct gaaagtgcat tttaaccacg agatttgcac acaagtcttc 2580 cacaaaagca tctctcgccg ttgcactaaa tctgtgactt cggtcgtctc aaccttgttt 2640 tacgacaaaa aaatgagaac gacgaatccg aaagagacta agattgtgat tgacactacc 2700 ggcagtacca aacctaagca ggacgatctc attctcactt gtttcagagg gtgggtgaag 2760 cagttgcaaa tagattacaa aggcaacgaa ataatgacgg cagctgcctc tcaagggctg 2820 acccgtaaag gtgtgtatgc cgttcggtac aaggtgaatg aaaatcctct gtacgcaccc 2880 acctcagaac atgtgaacgt cctactgacc cgcacggagg accgcatcgt gtggaaaaca 2940 ctagccggcg acccatggat aaaaacactg actgccaagt accctgggaa tttcactgcc 3000 acgatagagg agtggcaagc agagcatgat gccatcatga ggcacatctt ggagagaccg 3060 gaccctaccg acgtcttcca gaataaggca aacgtgtgtt gggccaaggc tttagtgccg 3120 gtgctgaaga ccgctggcat agacatgacc actgaacaat ggaacactgt ggattatttt 3180 gaaacggaca aagctcactc agcagagata gtattgaacc aactatgcgt gaggttcttt 3240 ggactcgatc tggactccgg tctattttct gcacccactg ttccgttatc cattaggaat 3300 aatcactggg ataactcccc gtcgcctaac atgtacgggc tgaataaaga agtggtccgt 3360 cagctctctc gcaggtaccc acaactgcct cgggcagttg ccactggaag agtctatgac 3420 atgaacactg gtacactgcg caattatgat ccgcgcataa acctagtacc tgtaaacaga 3480 agactgcctc atgctttagt cctccaccat aatgaacacc cacagagtga cttttcttca 3540 ttcgtcagca aattgaaggg cagaactgtc ctggtggtcg gggaaaagtt gtccgtccca 3600 ggcaaaatgg ttgactggtt gtcagaccgg cctgaggcta ccttcagagc tcggctggat 3660 ttaggcatcc caggtgatgt gcccaaatat gacataatat ttgttaatgt gaggacccca 3720 tataaatacc atcactatca gcagtgtgaa gaccatgcca ttaagcttag catgttgacc 3780 aagaaagctt gtctgcatct gaatcccggc ggaacctgtg tcagcatagg ttatggttac 3840 gctgacaggg ccagcgaaag catcattggt gctatagcgc ggcagttcaa gttttcccgg 3900 gtatgcaaac cgaaatcctc acttgaagag acggaagttc tgtttgtatt cattgggtac 3960 gatcgcaagg cccgtacgca caatccttac aagctttcat caaccttgac caacatttat 4020 acaggttcca gactccacga agccggatgt gcaccctcat atcatgtggt gcgaggggat 4080 attgccacgg ccaccgaagg agtgattata aatgctgcta acagcaaagg acaacctggc 4140 ggaggggtgt gcggagcgct gtataagaaa ttcccggaaa gcttcgattt acagccgatc 4200 gaagtaggaa aagcgcgact ggtcaaaggt gcagctaaac atatcattca tgccgtagga 4260 ccaaacttca acaaagtttc ggaggttgaa ggtgacaaac agttggcaga ggcttatgag 4320 tccatcgcta agattgtcaa cgataacaat tacaagtcag tagcgattcc actgttgtcc 4380 accggcatct tttccgggaa caaagatcga ctaacccaat cattgaacca tttgctgaca 4440 gctttagaca ccactgatgc agatgtagcc atatactgca gggacaagaa atgggaaatg 4500 actctcaagg aagcagtggc taggagagaa gcagtggagg agatatgcat atccgacgac 4560 tcttcagtga cagaacctga tgcagagctg gtgagggtgc atccgaagag ttctttggct 4620 ggaaggaagg gctacagcac aagcgatggc aaaactttct catatttgga agggaccaag 4680 tttcaccagg cggccaagga tatagcagaa attaatgcca tgtggcccgt tgcaacggag 4740 gccaatgagc aggtatgcat gtatatcctc ggagaaagca tgagcagtat taggtcgaaa 4800 tgccccgtcg aagagtcgga agcctccaca ccacctagca cgctgccttg cttgtgcatc 4860 catgccatga ctccagaaag agtacagcgc ctaaaagcct cacgtccaga acaaattact 4920 gtgtgctcat cctttccatt gccgaagtat agaatcactg gtgtgcagaa gatccaatgc 4980 tcccagccta tattgttctc accgaaagtg cctgcgtata ttcatccaag gaagtatctc 5040 gtggaaacac caccggtaga cgagactccg gagccatcgg cagagaacca atccacagag 5100 gggacacctg aacaaccacc acttataacc gaggatgaga ccaggactag aacgcctgag 5160 ccgatcatca tcgaagagga agaagaggat agcataagtt tgctgtcaga tggcccgacc 5220 caccaggtgc tgcaagtcga ggcagacatt cacgggccgc cctctgtatc tagctcatcc 5280 tggtccattc ctcatgcatc cgactttgat gtggacagtt tatccatact tgacaccctg 5340 gagggagcta gcgtgaccag cggggcaacg tcagccgaga ctaactctta cttcgcaaag 5400 agtatggagt ttctggcgcg accggtgcct gcgcctcgaa cagtattcag gaaccctcca 5460 catcccgctc cgcgcacaag aacaccgtca cttgcaccca gcagggcctg ctcgagaacc 5520 agcctagttt ccaccccgcc aggcgtgaat agggtgatca ctagagagga gctcgaggcg 5580 cttaccccgt cacgcactcc tagcaggtcg gtctcgagaa ccagcctggt ctccaacccg 5640 ccaggcgtaa atagggtgat tacaagagag gagtttgagg cgttcgtagc acaacaacaa 5700 tgacggtttg atgcgggtgc atacatcttt tcctccgaca ccggtcaagg gcatttacaa 5760 caaaaatcag taaggcaaac ggtgctatcc gaagtggtgt tggagaggac cgaattggag 5820 atttcgtatg ccccgcgcct cgaccaagaa aaagaagaat tactacgcaa gaaattacag 5880 ttaaatccca cacctgctaa cagaagcaga taccagtcca ggaaggtgga gaacatgaaa 5940 gccataacag ctagacgtat tctgcaaggc ctagggcatt atttgaaggc agaaggaaaa 6000 gtggagtgct accgaaccct gcatcctgtt cctttgtatt catctagtgt gaaccgtgcc 6060 ttttcaagcc ccaaggtcgc agtggaagcc tgtaacgcca tgttgaaaga gaactttccg 6120 actgtggctt cttactgtat tattccagag tacgatgcct atttggacat ggttgacgga 6180 gcttcatgct gcttagacac tgccagtttt tgccctgcaa agctgcgcag ctttccaaag 6240 aaacactcct atttggaacc cacaatacga tcggcagtgc cttcagcgat ccagaacacg 6300 ctccagaacg tcctggcagc tgccacaaaa agaaattgca atgtcacgca aatgagagaa 6360 ttgcccgtat tggattcggc ggcctttaat gtggaatgct tcaagaaata tgcgtgtaat 6420 aatgaatatt gggaaacgtt taaagaaaac cccatcaggc ttactgaaga aaacgtggta 6480 aattacatta ccaaattaaa aggaccaaaa gctgctgctc tttttgcgaa gacacataat 6540 ttgaatatgt tgcaggacat accaatggac aggtttgtaa tggacttaaa gagagacgtg 6600 aaagtgactc caggaacaaa acatactgaa gaacggccca aggtacaggt gatccaggct 6660 gccgatccgc tagcaacagc gtatctgtgc ggaatccacc gagagctggt taggagatta 6720 aatgcggtcc tgcttccgaa cattcataca ctgtttgata tgtcggctga agactttgac 6780 gctattatag ccgagcactt ccagcctggg gattgtgttc tggaaactga catcgcgtcg 6840 tttgataaaa gtgaggacga cgccatggct ctgaccgcgt taatgattct ggaagactta 6900 ggtgtggacg cagagctgtt gacgctgatt gaggcggctt tcggcgaaat ttcatcaata 6960 catttgccca ctaaaactaa atttaaattc ggagccatga tgaaatctgg aatgttcctc 7020 acactgtttg tgaacacagt cattaacatt gtaatcgcaa gcagagtgtt gagagaacgg 7080 ctaaccggat caccatgtgc agcattcatt ggagatgaca atatcgtgaa aggagtcaaa 7140 tcggacaaat taatggcaga caggtgcgcc acctggttga atatggaagt caagattata 7200 gatgctgtgg tgggcgagaa agcgccttat ttctgtggag ggtttatttt gtgtgactcc 7260 gtgaccggca cagcgtgccg tgtggcagac cccctaaaaa ggctgtttaa gcttggcaaa 7320 cctctggcag cagacgatga acatgatgat gacaggagaa gggcattgca tgaagagtca 7380 acacgctgga accgagtggg tattctttca gagctgtgca aggcagtaga atcaaggtat 7440 gaaaccgtag gaacttccat catagttatg gccatgacta ctctagctag cagtgttaaa 7500 tcattcagct acctgagagg ggcccctata actctctacg gctaacctga atggactacg 7560 actatcacgc ccaaacattt acagccgcgg tgtcaaaaac cgcgtggacg tggttaacat 7620 ccctgctggg aggatcagcc gtaattatta taattggctt ggtgctggct actattgtgg 7680 ccatgtacgt gctgaccaac cagaaacata attgaataca gcagcaattg gcaagctgct 7740 tacatagaac tcgcggcgat tggcatgccg ccttaaaatt tttattttat ttttcttttc 7800 ttttccgaat cggattttgt ttttaatatt tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa 7860 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aatacgtagt 7920 ttaaac 7926 <210> 10 <211> 36519 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 10 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagatga ggcacctgag agacctgccc 600 gatgagaaaa tcatcatcgc ttccgggaac gagattctgg aactggtggt aaatgccatg 660 atgggcgacg accctccgga gccccccacc ccatttgaga caccttcgct gcacgatttg 720 tatgatctgg aggtggatgt gcccgaggac gatcccaatg aggaggcggt aaatgatttt 780 tttagcgatg ccgcgctgct agctgccgag gaggcttcga gctctagctc agacagcgac 840 tcttcactgc atacccctag acccggcaga ggtgagaaaa agatccccga gcttaaaggg 900 gaagagatgg acttgcgctg ctatgaggaa tgcttgcccc cgagcgatga tgaggacgag 960 caggcgatcc agaacgcagc gagccaggga gtgcaagccg ccagcgagag ctttgcgctg 1020 gactgcccgc ctctgcccgg acacggctgt aagtcttgtg aatttcatcg catgaatact 1080 ggagataaag ctgtgttgtg tgcactttgc tatatgagag cttacaacca ttgtgtttac 1140 agtaagtgtg attaagttga actttagagg gaggcagaga gcagggtgac tgggcgatga 1200 ctggtttatt tatgtatata tgttctttat ataggtcccg tctctgacgc agatgatgag 1260 acccccacta caaagtccac ttcgtcaccc ccagaaattg gcacatctcc acctgagaat 1320 attgttagac cagttcctgt tagagccact gggaggagag cagctgtgga atgtttggat 1380 gacttgctac agggtggggt tgaacctttg gacttgtgta cccggaaacg ccccaggcac 1440 taagtgccac acatgtgtgt ttacttgagg tgatgtcagt atttataggg tgtggagtgc 1500 aataaaaaat gtgttgactt taagtgcgtg gtttatgact caggggtggg gactgtgagt 1560 atataagcag gtgcagacct gtgtggttag ctcagagcgg catggagatt tggacggtct 1620 tggaagactt tcacaagact agacagctgc tagagaacgc ctcgaacgga gtctcttacc 1680 tgtggagatt ctgcttcggt ggcgacctag ctaggctagt ctacagggcc aaacaggatt 1740 atagtgaaca atttgaggtt attttgagag agtgttctgg tctttttgac gctcttaact 1800 tgggccatca gtctcacttt aaccagagga tttcgagagc ccttgatttt actactcctg 1860 gcagaaccac tgcagcagta gccttttttg cttttattct tgacaaatgg agtcaagaaa 1920 cccatttcag cagggattac cagctggatt tcttagcagt agctttgtgg agaacatgga 1980 agtgccagcg cctgaatgca atctccggct acttgccggt acagccgcta gacactctga 2040 ggatcctgaa tctccaggag agtcccaggg cacgccaacg tcgccagcag cagcagcagg 2100 aggaggatca agaagagaac ccgagagccg gcctggaccc tccggcggag gaggaggagt 2160 agctgacctg tttcctgaac tgcgccgggt gctgactagg tcttcgagtg gtcgggagag 2220 ggggattaag cgggagaggc atgatgagac taatcacaga actgaactga ctgtgggtct 2280 gatgagtcgc aagcgcccag aaacagtgtg gtggcatgag gtgcagtcga ctggcacaga 2340 tgaggtgtcg gtgatgcatg agaggttttc tctagaacaa gtcaagactt gttggttaga 2400 gcctgaggat gattgggagg tagccatcag gaattatgcc aagctggctc tgaggccaga 2460 caagaagtac aagattacta agctgataaa tatcagaaat gcctgctaca tctcagggaa 2520 tggggctgaa gtggagatct gtctccagga aagggtggct ttcagatgct gcatgatgaa 2580 tatgtacccg ggagtggtgg gcatggatgg ggttaccttt atgaacatga ggttcagggg 2640 agatgggtat aatggcacgg tctttatggc caataccaag ctgacagtcc atggctgctc 2700 cttctttggg tttaataaca cctgcatcga ggcctggggt caggtcggtg tgaggggctg 2760 cagtttttca gccaactgga tgggggtcgt gggcaggacc aagagtatgc tgtccgtgaa 2820 gaaatgcttg tttgagaggt gccacctggg ggtgatgagc gagggcgaag ccagaatccg 2880 ccactgcgcc tctaccgaga cgggctgctt tgtgctgtgc aagggcaatg ctaagatcaa 2940 gcataatatg atctgtggag cctcggacga gcgcggctac cagatgctga cctgcgccgg 3000 cgggaacagc catatgctgg ccaccgtaca tgtggcttcc catgctcgca agccctggcc 3060 cgagttcgag cacaatgtca tgaccaggtg caatatgcat ctggggtccc gccgaggcat 3120 gttcatgccc taccagtgca acctgaatta tgtgaaggtg ctgctggagc ccgatgccat 3180 gtccagagtg agcctgacgg gggtgtttga catgaatgtg gaggtgtgga agattctgag 3240 atatgatgaa tccaagacca ggtgccgagc ctgcgagtgc ggagggaagc atgccaggtt 3300 ccagcccgtg tgtgtggatg tgacggagga cctgcgaccc gatcatttgg tgttgccctg 3360 caccgggacg gagttcggtt ccagcgggga agaatctgac tagagtgagt agtgttctgg 3420 ggcgggggag gacctgcatg agggccagaa taactgaaat ctgtgctttt ctgtgtgttg 3480 cagcagcatg agcggaagcg gctcctttga gggaggggta ttcagccctt atctgacggg 3540 gcgtctcccc tcctgggcgg gagtgcgtca gaatgtgatg ggatccacgg tggacggccg 3600 gcccgtgcag cccgcgaact cttcaaccct gacctatgca accctgagct cttcgtcgtt 3660 ggacgcagct gccgccgcag ctgctgcatc tgccgccagc gccgtgcgcg gaatggccat 3720 gggcgccggc tactacggca ctctggtggc caactcgagt tccaccaata atcccgccag 3780 cctgaacgag gagaagctgt tgctgctgat ggcccagctc gaggccttga cccagcgcct 3840 gggcgagctg acccagcagg tggctcagct gcaggagcag acgcgggccg cggttgccac 3900 ggtgaaatcc aaataaaaaa tgaatcaata aataaacgga gacggttgtt gattttaaca 3960 cagagtctga atctttattt gatttttcgc gcgcggtagg ccctggacca ccggtctcga 4020 tcattgagca cccggtggat cttttccagg acccggtaga ggtgggcttg gatgttgagg 4080 tacatgggca tgagcccgtc ccgggggtgg aggtagctcc attgcagggc ctcgtgctcg 4140 ggggtggtgt tgtaaatcac ccagtcatag caggggcgca gggcatggtg ttgcacaata 4200 tctttgagga ggagactgat ggccacgggc agccctttgg tgtaggtgtt tacaaatctg 4260 ttgagctggg agggatgcat gcggggggag atgaggtgca tcttggcctg gatcttgaga 4320 ttggcgatgt taccgcccag atcccgcctg gggttcatgt tgtgcaggac caccagcacg 4380 gtgtatccgg tgcacttggg gaatttatca tgcaacttgg aagggaaggc gtgaaagaat 4440 ttggcgacgc ctttgtgccc gcccaggttt tccatgcact catccatgat gatggcgatg 4500 ggcccgtggg cggcggcctg ggcaaagacg tttcgggggt cggacacatc atagttgtgg 4560 tcctgggtga ggtcatcata ggccatttta atgaatttgg ggcggagggt gccggactgg 4620 gggacaaagg taccctcgat cccgggggcg tagttcccct cacagatctg catctcccag 4680 gctttgagct cggagggggg gatcatgtcc acctgcgggg cgataaagaa cacggtttcc 4740 ggggcggggg agatgagctg ggccgaaagc aagttccgga gcagctggga cttgccgcag 4800 ccggtggggc cgtagatgac cccgatgacc ggctgcaggt ggtagttgag ggagagacag 4860 ctgccgtcct cccggaggag gggggccacc tcgttcatca tctcgcgcac gtgcatgttc 4920 tcgcgcacca gttccgccag gaggcgctct ccccccaggg ataggagctc ctggagcgag 4980 gcgaagtttt tcagcggctt gagtccgtcg gccatgggca ttttggagag ggtttgttgc 5040 aagagttcca ggcggtccca gagctcggtg atgtgctcta cggcatctcg atccagcaga 5100 cctcctcgtt tcgcgggttg ggacggctgc gggagtaggg caccagacga tgggcgtcca 5160 gcgcagccag ggtccggtcc ttccagggtc gcagcgtccg cgtcagggtg gtctccgtca 5220 cggtgaaggg gtgcgcgccg ggctgggcgc ttgcgagggt gcgcttcagg ctcatccggc 5280 tggtcgaaaa ccgctcccga tcggcgccct gcgcgtcggc caggtagcaa ttgaccatga 5340 gttcgtagtt gagcgcctcg gccgcgtggc ctttggcgcg gagcttacct ttggaagtct 5400 gcccgcaggc gggacagagg agggacttga gggcgtagag cttgggggcg aggaagacgg 5460 actcgggggc gtaggcgtcc gcgccgcagt gggcgcagac ggtctcgcac tccacgagcc 5520 aggtgaggtc gggctggtcg gggtcaaaaa ccagtttccc gccgttcttt ttgatgcgtt 5580 tcttaccttt ggtctccatg agctcgtgtc cccgctgggt gacaaagagg ctgtccgtgt 5640 ccccgtagac cgactttatg ggccggtcct cgagcggtgt gccgcggtcc tcctcgtaga 5700 ggaaccccgc ccactccgag acgaaagccc gggtccaggc cagcacgaag gaggccacgt 5760 gggacgggta gcggtcgttg tccaccagcg ggtccacctt ttccagggta tgcaaacaca 5820 tgtccccctc gtccacatcc aggaaggtga ttggcttgta agtgtaggcc acgtgaccgg 5880 gggtcccggc cgggggggta taaaagggtg cgggtccctg ctcgtcctca ctgtcttccg 5940 gatcgctgtc caggagcgcc agctgttggg gtaggtattc cctctcgaag gcgggcatga 6000 cctcggcact caggttgtca gtttctagaa acgaggagga tttgatattg acggtgccgg 6060 cggagatgcc tttcaagagc ccctcgtcca tctggtcaga aaagacgatc tttttgttgt 6120 cgagcttggt ggcgaaggag ccgtagaggg cgttggagag gagcttggcg atggagcgca 6180 tggtctggtt tttttccttg tcggcgcgct ccttggcggc gatgttgagc tgcacgtact 6240 cgcgcgccac gcacttccat tcggggaaga cggtggtcag ctcgtcgggc acgattctga 6300 cctgccagcc ccgattatgc agggtgatga ggtccacact ggtggccacc tcgccgcgca 6360 ggggctcatt agtccagcag aggcgtccgc ccttgcgcga gcagaagggg ggcagggggt 6420 ccagcatgac ctcgtcgggg gggtcggcat cgatggtgaa gatgccgggc aggaggtcgg 6480 ggtcaaagta gctgatggaa gtggccagat cgtccagggc agcttgccat tcgcgcacgg 6540 ccagcgcgcg ctcgtaggga ctgaggggcg tgccccaggg catgggatgg gtaagcgcgg 6600 aggcgtacat gccgcagatg tcgtagacgt agaggggctc ctcgaggatg ccgatgtagg 6660 tggggtagca gcgccccccg cggatgctgg cgcgcacgta gtcatacagc tcgtgcgagg 6720 gggcgaggag ccccgggccc aggttggtgc gactgggctt ttcggcgcgg tagacgatct 6780 ggcggaaaat ggcatgcgag ttggaggaga tggtgggcct ttggaagatg ttgaagtggg 6840 cgtggggcag tccgaccgag tcgcggatga agtgggcgta ggagtcttgc agcttggcga 6900 cgagctcggc ggtgactagg acgtccagag cgcagtagtc gagggtctcc tggatgatgt 6960 catacttgag ctgtcccttt tgtttccaca gctcgcggtt gagaaggaac tcttcgcggt 7020 ccttccagta ctcttcgagg gggaacccgt cctgatctgc acggtaagag cctagcatgt 7080 agaactggtt gacggccttg taggcgcagc agcccttctc cacggggagg gcgtaggcct 7140 gggcggcctt gcgcagggag gtgtgcgtga gggcgaaagt gtccctgacc atgaccttga 7200 ggaactggtg cttgaagtcg atatcgtcgc agcccccctg ctcccagagc tggaagtccg 7260 tgcgcttctt gtaggcgggg ttgggcaaag cgaaagtaac atcgttgaag aggatcttgc 7320 ccgcgcgggg cataaagttg cgagtgatgc ggaaaggttg gggcacctcg gcccggttgt 7380 tgatgacctg ggcggcgagc acgatctcgt cgaagccgtt gatgttgtgg cccacgatgt 7440 agagttccac gaatcgcgga cggcccttga cgtggggcag tttcttgagc tcctcgtagg 7500 tgagctcgtc ggggtcgctg agcccgtgct gctcgagcgc ccagtcggcg agatgggggt 7560 tggcgcggag gaaggaagtc cagagatcca cggccagggc ggtttgcaga cggtcccggt 7620 actgacggaa ctgctgcccg acggccattt tttcgggggt gacgcagtag aaggtgcggg 7680 ggtccccgtg ccagcgatcc catttgagct ggagggcgag atcgagggcg agctcgacga 7740 gccggtcgtc cccggagagt ttcatgacca gcatgaaggg gacgagctgc ttgccgaagg 7800 accccatcca ggtgtaggtt tccacatcgt aggtgaggaa gagcctttcg gtgcgaggat 7860 gcgagccgat ggggaagaac tggatctcct gccaccaatt ggaggaatgg ctgttgatgt 7920 gatggaagta gaaatgccga cggcgcgccg aacactcgtg cttgtgttta tacaagcggc 7980 cacagtgctc gcaacgctgc acgggatgca cgtgctgcac gagctgtacc tgagttcctt 8040 tgacgaggaa tttcagtggg aagtggagtc gtggcgcctg catctcgtgc tgtactacgt 8100 cgtggtggtc ggcctggccc tcttctgcct cgatggtggt catgctgacg agcccgcgcg 8160 ggaggcaggt ccagacctcg gcgcgagcgg gtcggagagc gaggacgagg gcgcgcaggc 8220 cggagctgtc cagggtcctg agacgctgcg gagtcaggtc agtgggcagc ggcggcgcgc 8280 ggttgacttg caggagtttt tccagggcgc gcgggaggtc cagatggtac ttgatctcca 8340 ccgcgccatt ggtggcgacg tcgatggctt gcagggtccc gtgcccctgg ggtgtgacca 8400 ccgtcccccg tttcttcttg ggcggctggg gcgacggggg cggtgcctct tccatggtta 8460 gaagcggcgg cgaggacgcg cgccgggcgg caggggcggc tcggggcccg gaggcagggg 8520 cggcaggggc acgtcggcgc cgcgcgcggg taggttctgg tactgcgccc ggagaagact 8580 ggcgtgagcg acgacgcgac ggttgacgtc ctggatctga cgcctctggg tgaaggccac 8640 gggacccgtg agtttgaacc tgaaagagag ttcgacagaa tcaatctcgg tatcgttgac 8700 ggcggcctgc cgcaggatct cttgcacgtc gcccgagttg tcctggtagg cgatctcggt 8760 catgaactgc tcgatctcct cctcttgaag gtctccgcgg ccggcgcgct ccacggtggc 8820 cgcgaggtcg ttggagatgc ggcccatgag ctgcgagaag gcgttcatgc ccgcctcgtt 8880 ccagacgcgg ctgtagacca cgacgccctc gggatcgcgg gcgcgcatga ccacctgggc 8940 gaggttgagc tccacgtggc gcgtgaagac cgcgtagttg cagaggcgct ggtagaggta 9000 gttgagcgtg gtggcgatgt gctcggtgac gaagaaatac atgatccagc ggcggagcgg 9060 catctcgctg acgtcgccca gcgcctccaa acgttccatg gcctcgtaaa agtccacggc 9120 gaagttgaaa aactgggagt tgcgcgccga gacggtcaac tcctcctcca gaagacggat 9180 gagctcggcg atggtggcgc gcacctcgcg ctcgaaggcc cccgggagtt cctccacttc 9240 ctcttcttcc tcctccacta acatctcttc tacttcctcc tcaggcggca gtggtggcgg 9300 gggagggggc ctgcgtcgcc ggcggcgcac gggcagacgg tcgatgaagc gctcgatggt 9360 ctcgccgcgc cggcgtcgca tggtctcggt gacggcgcgc ccgtcctcgc ggggccgcag 9420 cgtgaagacg ccgccgcgca tctccaggtg gccggggggg tccccgttgg gcagggagag 9480 ggcgctgacg atgcatctta tcaattgccc cgtagggact ccgcgcaagg acctgagcgt 9540 ctcgagatcc acgggatctg aaaaccgctg aacgaaggct tcgagccagt cgcagtcgca 9600 aggtaggctg agcacggttt cttctggcgg gtcatgttgg ttgggagcgg ggcgggcgat 9660 gctgctggtg atgaagttga aataggcggt tctgagacgg cggatggtgg cgaggagcac 9720 caggtctttg ggcccggctt gctggatgcg cagacggtcg gccatgcccc aggcgtggtc 9780 ctgacacctg gccaggtcct tgtagtagtc ctgcatgagc cgctccacgg gcacctcctc 9840 ctcgcccgcg cggccgtgca tgcgcgtgag cccgaagccg cgctggggct ggacgagcgc 9900 caggtcggcg acgacgcgct cggcgaggat ggcttgctgg atctgggtga gggtggtctg 9960 gaagtcatca aagtcgacga agcggtggta ggctccggtg ttgatggtgt aggagcagtt 10020 ggccatgacg gaccagttga cggtctggtg gcccggacgc acgagctcgt ggtacttgag 10080 gcgcgagtag gcgcgcgtgt cgaagatgta gtcgttgcag gtgcgcacca ggtactggta 10140 gccgatgagg aagtgcggcg gcggctggcg gtagagcggc catcgctcgg tggcgggggc 10200 gccgggcgcg aggtcctcga gcatggtgcg gtggtagccg tagatgtacc tggacatcca 10260 ggtgatgccg gcggcggtgg tggaggcgcg cgggaactcg cggacgcggt tccagatgtt 10320 gcgcagcggc aggaagtagt tcatggtggg cacggtctgg cccgtgaggc gcgcgcagtc 10380 gtggatgctc tatacgggca aaaacgaaag cggtcagcgg ctcgactccg tggcctggag 10440 gctaagcgaa cgggttgggc tgcgcgtgta ccccggttcg aatctcgaat caggctggag 10500 ccgcagctaa cgtggtattg gcactcccgt ctcgacccaa gcctgcacca accctccagg 10560 atacggaggc gggtcgtttt gcaacttttt tttggaggcc ggatgagact agtaagcgcg 10620 gaaagcggcc gaccgcgatg gctcgctgcc gtagtctgga gaagaatcgc cagggttgcg 10680 ttgcggtgtg ccccggttcg aggccggccg gattccgcgg ctaacgaggg cgtggctgcc 10740 ccgtcgtttc caagacccca tagccagccg acttctccag ttacggagcg agcccctctt 10800 ttgttttgtt tgtttttgcc agatgcatcc cgtactgcgg cagatgcgcc cccaccaccc 10860 tccaccgcaa caacagcccc ctccacagcc ggcgcttctg cccccgcccc agcagcaact 10920 tccagccacg accgccgcgg ccgccgtgag cggggctgga cagagttatg atcaccagct 10980 ggccttggaa gagggcgagg ggctggcgcg cctgggggcg tcgtcgccgg agcggcaccc 11040 gcgcgtgcag atgaaaaggg acgctcgcga ggcctacgtg cccaagcaga acctgttcag 11100 agacaggagc ggcgaggagc ccgaggagat gcgcgcggcc cggttccacg cggggcggga 11160 gctgcggcgc ggcctggacc gaaagagggt gctgagggac gaggatttcg aggcggacga 11220 gctgacgggg atcagccccg cgcgcgcgca cgtggccgcg gccaacctgg tcacggcgta 11280 cgagcagacc gtgaaggagg agagcaactt ccaaaaatcc ttcaacaacc acgtgcgcac 11340 cctgatcgcg cgcgaggagg tgaccctggg cctgatgcac ctgtgggacc tgctggaggc 11400 catcgtgcag aaccccacca gcaagccgct gacggcgcag ctgttcctgg tggtgcagca 11460 tagtcgggac aacgaagcgt tcagggaggc gctgctgaat atcaccgagc ccgagggccg 11520 ctggctcctg gacctggtga acattctgca gagcatcgtg gtgcaggagc gcgggctgcc 11580 gctgtccgag aagctggcgg ccatcaactt ctcggtgctg agtttgggca agtactacgc 11640 taggaagatc tacaagaccc cgtacgtgcc catagacaag gaggtgaaga tcgacgggtt 11700 ttacatgcgc atgaccctga aagtgctgac cctgagcgac gatctggggg tgtaccgcaa 11760 cgacaggatg caccgtgcgg tgagcgccag caggcggcgc gagctgagcg accaggagct 11820 gatgcatagt ctgcagcggg ccctgaccgg ggccgggacc gagggggaga gctactttga 11880 catgggcgcg gacctgcact ggcagcccag ccgccgggcc ttggaggcgg cggcaggacc 11940 ctacgtagaa gaggtggacg atgaggtgga cgaggagggc gagtacctgg aagactgatg 12000 gcgcgaccgt atttttgcta gatgcaacaa caacagccac ctcctgatcc cgcgatgcgg 12060 gcggcgctgc agagccagcc gtccggcatt aactcctcgg acgattggac ccaggccatg 12120 caacgcatca tggcgctgac gacccgcaac cccgaagcct ttagacagca gccccaggcc 12180 aaccggctct cggccatcct ggaggccgtg gtgccctcgc gctccaaccc cacgcacgag 12240 aaggtcctgg ccatcgtgaa cgcgctggtg gagaacaagg ccatccgcgg cgacgaggcc 12300 ggcctggtgt acaacgcgct gctggagcgc gtggcccgct acaacagcac caacgtgcag 12360 accaacctgg accgcatggt gaccgacgtg cgcgaggccg tggcccagcg cgagcggttc 12420 caccgcgagt ccaacctggg atccatggtg gcgctgaacg ccttcctcag cacccagccc 12480 gccaacgtgc cccggggcca ggaggactac accaacttca tcagcgccct gcgcctgatg 12540 gtgaccgagg tgccccagag cgaggtgtac cagtccgggc cggactactt cttccagacc 12600 agtcgccagg gcttgcagac cgtgaacctg agccaggctt tcaagaactt gcagggcctg 12660 tggggcgtgc aggccccggt cggggaccgc gcgacggtgt cgagcctgct gacgccgaac 12720 tcgcgcctgc tgctgctgct ggtggccccc ttcacggaca gcggcagcat caaccgcaac 12780 tcgtacctgg gctacctgat taacctgtac cgcgaggcca tcggccaggc gcacgtggac 12840 gagcagacct accaggagat cacccacgtg agccgcgccc tgggccagga cgacccgggc 12900 aacctggaag ccaccctgaa ctttttgctg accaaccggt cgcagaagat cccgccccag 12960 tacgcgctca gcaccgagga ggagcgcatc ctgcgttacg tgcagcagag cgtgggcctg 13020 ttcctgatgc aggagggggc cacccccagc gccgcgctcg acatgaccgc gcgcaacatg 13080 gagcccagca tgtacgccag caaccgcccg ttcatcaata aactgatgga ctacttgcat 13140 cgggcggccg ccatgaactc tgactatttc accaacgcca tcctgaatcc ccactggctc 13200 ccgccgccgg ggttctacac gggcgagtac gacatgcccg accccaatga cgggttcctg 13260 tgggacgatg tggacagcag cgtgttctcc ccccgaccgg gtgctaacga gcgccccttg 13320 tggaagaagg aaggcagcga ccgacgcccg tcctcggcgc tgtccggccg cgagggtgct 13380 gccgcggcgg tgcccgaggc cgccagtcct ttcccgagct tgcccttctc gctgaacagt 13440 atccgcagca gcgagctggg caggatcacg cgcccgcgct tgctgggcga agaggagtac 13500 ttgaatgact cgctgttgag acccgagcgg gagaagaact tccccaataa cgggatagaa 13560 agcctggtgg acaagatgag ccgctggaag acgtatgcgc aggagcacag ggacgatccc 13620 cgggcgtcgc agggggccac gagccggggc agcgccgccc gtaaacgccg gtggcacgac 13680 aggcagcggg gacagatgtg ggacgatgag gactccgccg acgacagcag cgtgttggac 13740 ttgggtggga gtggtaaccc gttcgctcac ctgcgccccc gtatcgggcg catgatgtaa 13800 gagaaaccga aaataaatga tactcaccaa ggccatggcg accagcgtgc gttcgtttct 13860 tctctgttgt tgttgtatct agtatgatga ggcgtgcgta cccggagggt cctcctccct 13920 cgtacgagag cgtgatgcag caggcgatgg cggcggcggc gatgcagccc ccgctggagg 13980 ctccttacgt gcccccgcgg tacctggcgc ctacggaggg gcggaacagc attcgttact 14040 cggagctggc acccttgtac gataccaccc ggttgtacct ggtggacaac aagtcggcgg 14100 acatcgcctc gctgaactac cagaacgacc acagcaactt cctgaccacc gtggtgcaga 14160 acaatgactt cacccccacg gaggccagca cccagaccat caactttgac gagcgctcgc 14220 ggtggggcgg ccagctgaaa accatcatgc acaccaacat gcccaacgtg aacgagttca 14280 tgtacagcaa caagttcaag gcgcgggtga tggtctcccg caagaccccc aatggggtga 14340 cagtgacaga ggattatgat ggtagtcagg atgagctgaa gtatgaatgg gtggaatttg 14400 agctgcccga aggcaacttc tcggtgacca tgaccatcga cctgatgaac aacgccatca 14460 tcgacaatta cttggcggtg gggcggcaga acggggtgct ggagagcgac atcggcgtga 14520 agttcgacac taggaacttc aggctgggct gggaccccgt gaccgagctg gtcatgcccg 14580 gggtgtacac caacgaggct ttccatcccg atattgtctt gctgcccggc tgcggggtgg 14640 acttcaccga gagccgcctc agcaacctgc tgggcattcg caagaggcag cccttccagg 14700 aaggcttcca gatcatgtac gaggatctgg aggggggcaa catccccgcg ctcctggatg 14760 tcgacgccta tgagaaaagc aaggaggatg cagcagctga agcaactgca gccgtagcta 14820 ccgcctctac cgaggtcagg ggcgataatt ttgcaagcgc cgcagcagtg gcagcggccg 14880 aggcggctga aaccgaaagt aagatagtca ttcagccggt ggagaaggat agcaagaaca 14940 ggagctacaa cgtactaccg gacaagataa acaccgccta ccgcagctgg tacctagcct 15000 acaactatgg cgaccccgag aagggcgtgc gctcctggac gctgctcacc acctcggacg 15060 tcacctgcgg cgtggagcaa gtctactggt cgctgcccga catgatgcaa gacccggtca 15120 ccttccgctc cacgcgtcaa gttagcaact acccggtggt gggcgccgag ctcctgcccg 15180 tctactccaa gagcttcttc aacgagcagg ccgtctactc gcagcagctg cgcgccttca 15240 cctcgcttac gcacgtcttc aaccgcttcc ccgagaacca gatcctcgtc cgcccgcccg 15300 cgcccaccat taccaccgtc agtgaaaacg ttcctgctct cacagatcac gggaccctgc 15360 cgctgcgcag cagtatccgg ggagtccagc gcgtgaccgt tactgacgcc agacgccgca 15420 cctgccccta cgtctacaag gccctgggca tagtcgcgcc gcgcgtcctc tcgagccgca 15480 ccttctaaat gtccattctc atctcgccca gtaataacac cggttggggc ctgcgcgcgc 15540 ccagcaagat gtacggaggc gctcgccaac gctccacgca acaccccgtg cgcgtgcgcg 15600 ggcacttccg cgctccctgg ggcgccctca agggccgcgt gcggtcgcgc accaccgtcg 15660 acgacgtgat cgaccaggtg gtggccgacg cgcgcaacta cacccccgcc gccgcgcccg 15720 tctccaccgt ggacgccgtc atcgacagcg tggtggccga cgcgcgccgg tacgcccgcg 15780 ccaagagccg gcggcggcgc atcgcccggc ggcaccggag cacccccgcc atgcgcgcgg 15840 cgcgagcctt gctgcgcagg gccaggcgca cgggacgcag ggccatgctc agggcggcca 15900 gacgcgcggc ttcaggcgcc agcgccggca ggacccggag acgcgcggcc acggcggcgg 15960 cagcggccat cgccagcatg tcccgcccgc ggcgagggaa cgtgtactgg gtgcgcgacg 16020 ccgccaccgg tgtgcgcgtg cccgtgcgca cccgcccccc tcgcacttga agatgttcac 16080 ttcgcgatgt tgatgtgtcc cagcggcgag gaggatgtcc aagcgcaaat tcaaggaaga 16140 gatgctccag gtcatcgcgc ctgagatcta cggccctgcg gtggtgaagg aggaaagaaa 16200 gccccgcaaa atcaagcggg tcaaaaagga caaaaaggaa gaagaaagtg atgtggacgg 16260 attggtggag tttgtgcgcg agttcgcccc ccggcggcgc gtgcagtggc gcgggcggaa 16320 ggtgcaaccg gtgctgagac ccggcaccac cgtggtcttc acgcccggcg agcgctccgg 16380 caccgcttcc aagcgctcct acgacgaggt gtacggggat gatgatattc tggagcaggc 16440 ggccgagcgc ctgggcgagt ttgcttacgg caagcgcagc cgttccgcac cgaaggaaga 16500 ggcggtgtcc atcccgctgg accacggcaa ccccacgccg agcctcaagc ccgtgacctt 16560 gcagcaggtg ctgccgaccg cggcgccgcg ccgggggttc aagcgcgagg gcgaggatct 16620 gtaccccacc atgcagctga tggtgcccaa gcgccagaag ctggaagacg tgctggagac 16680 catgaaggtg gacccggacg tgcagcccga ggtcaaggtg cggcccatca agcaggtggc 16740 cccgggcctg ggcgtgcaga ccgtggacat caagattccc acggagccca tggaaacgca 16800 gaccgagccc atgatcaagc ccagcaccag caccatggag gtgcagacgg atccctggat 16860 gccatcggct cctagtcgaa gaccccggcg caagtacggc gcggccagcc tgctgatgcc 16920 caactacgcg ctgcatcctt ccatcatccc cacgccgggc taccgcggca cgcgcttcta 16980 ccgcggtcat accagcagcc gccgccgcaa gaccaccact cgccgccgcc gtcgccgcac 17040 cgccgctgca accacccctg ccgccctggt gcggagagtg taccgccgcg gccgcgcacc 17100 tctgaccctg ccgcgcgcgc gctaccaccc gagcatcgcc atttaaactt tcgcctgctt 17160 tgcagatcaa tggccctcac atgccgcctt cgcgttccca ttacgggcta ccgaggaaga 17220 aaaccgcgcc gtagaaggct ggcggggaac gggatgcgtc gccaccacca ccggcggcgg 17280 cgcgccatca gcaagcggtt ggggggaggc ttcctgcccg cgctgatccc catcatcgcc 17340 gcggcgatcg gggcgatccc cggcattgct tccgtggcgg tgcaggcctc tcagcgccac 17400 tgagacacac ttggaaacat cttgtaataa accaatggac tctgacgctc ctggtcctgt 17460 gatgtgtttt cgtagacaga tggaagacat caatttttcg tccctggctc cgcgacacgg 17520 cacgcggccg ttcatgggca cctggagcga catcggcacc agccaactga acgggggcgc 17580 cttcaattgg agcagtctct ggagcgggct taagaatttc gggtccacgc ttaaaaccta 17640 tggcagcaag gcgtggaaca gcaccacagg gcaggcgctg agggataagc tgaaagagca 17700 gaacttccag cagaaggtgg tcgatgggct cgcctcgggc atcaacgggg tggtggacct 17760 ggccaaccag gccgtgcagc ggcagatcaa cagccgcctg gacccggtgc cgcccgccgg 17820 ctccgtggag atgccgcagg tggaggagga gctgcctccc ctggacaagc ggggcgagaa 17880 gcgaccccgc cccgatgcgg aggagacgct gctgacgcac acggacgagc cgcccccgta 17940 cgaggaggcg gtgaaactgg gtctgcccac cacgcggccc atcgcgcccc tggccaccgg 18000 ggtgctgaaa cccgaaaagc ccgcgaccct ggacttgcct cctccccagc cttcccgccc 18060 ctctacagtg gctaagcccc tgccgccggt ggccgtggcc cgcgcgcgac ccgggggcac 18120 cgcccgccct catgcgaact ggcagagcac tctgaacagc atcgtgggtc tgggagtgca 18180 gagtgtgaag cgccgccgct gctattaaac ctaccgtagc gcttaacttg cttgtctgtg 18240 tgtgtatgta ttatgtcgcc gccgccgctg tccaccagaa ggaggagtga agaggcgcgt 18300 cgccgagttg caagatggcc accccatcga tgctgcccca gtgggcgtac atgcacatcg 18360 ccggacagga cgcttcggag tacctgagtc cgggtctggt gcagtttgcc cgcgccacag 18420 acacctactt cagtctgggg aacaagttta ggaaccccac ggtggcgccc acgcacgatg 18480 tgaccaccga ccgcagccag cggctgacgc tgcgcttcgt gcccgtggac cgcgaggaca 18540 acacctactc gtacaaagtg cgctacacgc tggccgtggg cgacaaccgc gtgctggaca 18600 tggccagcac ctactttgac atccgcggcg tgctggatcg gggccctagc ttcaaaccct 18660 actccggcac cgcctacaac agtctggccc ccaagggagc acccaacact tgtcagtgga 18720 catataaagc cgatggtgaa actgccacag aaaaaaccta tacatatgga aatgcacccg 18780 tgcagggcat taacatcaca aaagatggta ttcaacttgg aactgacacc gatgatcagc 18840 caatctacgc agataaaacc tatcagcctg aacctcaagt gggtgatgct gaatggcatg 18900 acatcactgg tactgatgaa aagtatggag gcagagctct taagcctgat accaaaatga 18960 agccttgtta tggttctttt gccaagccta ctaataaaga aggaggtcag gcaaatgtga 19020 aaacaggaac aggcactact aaagaatatg acatagacat ggctttcttt gacaacagaa 19080 gtgcggctgc tgctggccta gctccagaaa ttgttttgta tactgaaaat gtggatttgg 19140 aaactccaga tacccatatt gtatacaaag caggcacaga tgacagcagc tcttctatta 19200 atttgggtca gcaagccatg cccaacagac ctaactacat tggtttcaga gacaacttta 19260 tcgggctcat gtactacaac agcactggca atatgggggt gctggccggt caggcttctc 19320 agctgaatgc tgtggttgac ttgcaagaca gaaacaccga gctgtcctac cagctcttgc 19380 ttgactctct gggtgacaga acccggtatt tcagtatgtg gaatcaggcg gtggacagct 19440 atgatcctga tgtgcgcatt attgaaaatc atggtgtgga ggatgaactt cccaactatt 19500 gtttccctct ggatgctgtt ggcagaacag atacttatca gggaattaag gctaatggaa 19560 ctgatcaaac cacatggacc aaagatgaca gtgtcaatga tgctaatgag ataggcaagg 19620 gtaatccatt cgccatggaa atcaacatcc aagccaacct gtggaggaac ttcctctacg 19680 ccaacgtggc cctgtacctg cccgactctt acaagtacac gccggccaat gttaccctgc 19740 ccaccaacac caacacctac gattacatga acggccgggt ggtggcgccc tcgctggtgg 19800 actcctacat caacatcggg gcgcgctggt cgctggatcc catggacaac gtgaacccct 19860 tcaaccacca ccgcaatgcg gggctgcgct accgctccat gctcctgggc aacgggcgct 19920 acgtgccctt ccacatccag gtgccccaga aatttttcgc catcaagagc ctcctgctcc 19980 tgcccgggtc ctacacctac gagtggaact tccgcaagga cgtcaacatg atcctgcaga 20040 gctccctcgg caacgacctg cgcacggacg gggcctccat ctccttcacc agcatcaacc 20100 tctacgccac cttcttcccc atggcgcaca acacggcctc cacgctcgag gccatgctgc 20160 gcaacgacac caacgaccag tccttcaacg actacctctc ggcggccaac atgctctacc 20220 ccatcccggc caacgccacc aacgtgccca tctccatccc ctcgcgcaac tgggccgcct 20280 tccgcggctg gtccttcacg cgtctcaaga ccaaggagac gccctcgctg ggctccgggt 20340 tcgaccccta cttcgtctac tcgggctcca tcccctacct cgacggcacc ttctacctca 20400 accacacctt caagaaggtc tccatcacct tcgactcctc cgtcagctgg cccggcaacg 20460 accggctcct gacgcccaac gagttcgaaa tcaagcgcac cgtcgacggc gagggctaca 20520 acgtggccca gtgcaacatg accaaggact ggttcctggt ccagatgctg gcccactaca 20580 acatcggcta ccagggcttc tacgtgcccg agggctacaa ggaccgcatg tactccttct 20640 tccgcaactt ccagcccatg agccgccagg tggtggacga ggtcaactac aaggactacc 20700 aggccgtcac cctggcctac cagcacaaca actcgggctt cgtcggctac ctcgcgccca 20760 ccatgcgcca gggccagccc taccccgcca actaccccta cccgctcatc ggcaagagcg 20820 ccgtcaccag cgtcacccag aaaaagttcc tctgcgacag ggtcatgtgg cgcatcccct 20880 tctccagcaa cttcatgtcc atgggcgcgc tcaccgacct cggccagaac atgctctatg 20940 ccaactccgc ccacgcgcta gacatgaatt tcgaagtcga ccccatggat gagtccaccc 21000 ttctctatgt tgtcttcgaa gtcttcgacg tcgtccgagt gcaccagccc caccgcggcg 21060 tcatcgaggc cgtctacctg cgcaccccct tctcggccgg taacgccacc acctaagctc 21120 ttgcttcttg caagccatgg ccgcgggctc cggcgagcag gagctcaggg ccatcatccg 21180 cgacctgggc tgcgggccct acttcctggg caccttcgat aagcgcttcc cgggattcat 21240 ggccccgcac aagctggcct gcgccatcgt caacacggcc ggccgcgaga ccgggggcga 21300 gcactggctg gccttcgcct ggaacccgcg ctcgaacacc tgctacctct tcgacccctt 21360 cgggttctcg gacgagcgcc tcaagcagat ctaccagttc gagtacgagg gcctgctgcg 21420 ccgcagcgcc ctggccaccg aggaccgctg cgtcaccctg gaaaagtcca cccagaccgt 21480 gcagggtccg cgctcggccg cctgcgggct cttctgctgc atgttcctgc acgccttcgt 21540 gcactggccc gaccgcccca tggacaagaa ccccaccatg aacttgctga cgggggtgcc 21600 caacggcatg ctccagtcgc cccaggtgga acccaccctg cgccgcaacc aggaggcgct 21660 ctaccgcttc ctcaactccc actccgccta ctttcgctcc caccgcgcgc gcatcgagaa 21720 ggccaccgcc ttcgaccgca tgaatcaaga catgtaaacc gtgtgtgtat gttaaatgtc 21780 tttaataaac agcactttca tgttacacat gcatctgaga tgatttattt agaaatcgaa 21840 agggttctgc cgggtctcgg catggcccgc gggcagggac acgttgcgga actggtactt 21900 ggccagccac ttgaactcgg ggatcagcag tttgggcagc ggggtgtcgg ggaaggagtc 21960 ggtccacagc ttccgcgtca gttgcagggc gcccagcagg tcgggcgcgg agatcttgaa 22020 atcgcagttg ggacccgcgt tctgcgcgcg ggagttgcgg tacacggggt tgcagcactg 22080 gaacaccatc agggccgggt gcttcacgct cgccagcacc gtcgcgtcgg tgatgctctc 22140 cacgtcgagg tcctcggcgt tggccatccc gaagggggtc atcttgcagg tctgccttcc 22200 catggtgggc acgcacccgg gcttgtggtt gcaatcgcag tgcaggggga tcagcatcat 22260 ctgggcctgg tcggcgttca tccccgggta catggccttc atgaaagcct ccaattgcct 22320 gaacgcctgc tgggccttgg ctccctcggt gaagaagacc ccgcaggact tgctagagaa 22380 ctggttggtg gcgcacccgg cgtcgtgcac gcagcagcgc gcgtcgttgt tggccagctg 22440 caccacgctg cgcccccagc ggttctgggt gatcttggcc cggtcggggt tctccttcag 22500 cgcgcgctgc ccgttctcgc tcgccacatc catctcgatc atgtgctcct tctggatcat 22560 ggtggtcccg tgcaggcacc gcagcttgcc ctcggcctcg gtgcacccgt gcagccacag 22620 cgcgcacccg gtgcactccc agttcttgtg ggcgatctgg gaatgcgcgt gcacgaagcc 22680 ctgcaggaag cggcccatca tggtggtcag ggtcttgttg ctagtgaagg tcagcggaat 22740 gccgcggtgc tcctcgttga tgtacaggtg gcagatgcgg cggtacacct cgccctgctc 22800 gggcatcagc tggaagttgg ctttcaggtc ggtctccacg cggtagcggt ccatcagcat 22860 agtcatgatt tccataccct tctcccaggc cgagacgatg ggcaggctca tagggttctt 22920 caccatcatc ttagcgctag cagccgcggc cagggggtcg ctctcgtcca gggtctcaaa 22980 gctccgcttg ccgtccttct cggtgatccg caccgggggg tagctgaagc ccacggccgc 23040 cagctcctcc tcggcctgtc tttcgtcctc gctgtcctgg ctgacgtcct gcaggaccac 23100 atgcttggtc ttgcggggtt tcttcttggg cggcagcggc ggcggagatg ttggagatgg 23160 cgagggggag cgcgagttct cgctcaccac tactatctct tcctcttctt ggtccgaggc 23220 cacgcggcgg taggtatgtc tcttcggggg cagaggcgga ggcgacgggc tctcgccgcc 23280 gcgacttggc ggatggctgg cagagcccct tccgcgttcg ggggtgcgct cccggcggcg 23340 ctctgactga cttcctccgc ggccggccat tgtgttctcc tagggaggaa caacaagcat 23400 ggagactcag ccatcgccaa cctcgccatc tgcccccacc gccgacgaga agcagcagca 23460 gcagaatgaa agcttaaccg ccccgccgcc cagccccgcc acctccgacg cggccgtccc 23520 agacatgcaa gagatggagg aatccatcga gattgacctg ggctatgtga cgcccgcgga 23580 gcacgaggag gagctggcag tgcgcttttc acaagaagag atacaccaag aacagccaga 23640 gcaggaagca gagaatgagc agagtcaggc tgggctcgag catgacggcg actacctcca 23700 cctgagcggg ggggaggacg cgctcatcaa gcatctggcc cggcaggcca ccatcgtcaa 23760 ggatgcgctg ctcgaccgca ccgaggtgcc cctcagcgtg gaggagctca gccgcgccta 23820 cgagttgaac ctcttctcgc cgcgcgtgcc ccccaagcgc cagcccaatg gcacctgcga 23880 gcccaacccg cgcctcaact tctacccggt cttcgcggtg cccgaggccc tggccaccta 23940 ccacatcttt ttcaagaacc aaaagatccc cgtctcctgc cgcgccaacc gcacccgcgc 24000 cgacgccctt ttcaacctgg gtcccggcgc ccgcctacct gatatcgcct ccttggaaga 24060 ggttcccaag atcttcgagg gtctgggcag cgacgagact cgggccgcga acgctctgca 24120 aggagaagga ggagagcatg agcaccacag cgccctggtc gagttggaag gcgacaacgc 24180 gcggctggcg gtgctcaaac gcacggtcga gctgacccat ttcgcctacc cggctctgaa 24240 cctgcccccc aaagtcatga gcgcggtcat ggaccaggtg ctcatcaagc gcgcgtcgcc 24300 catctccgag gacgagggca tgcaagactc cgaggagggc aagcccgtgg tcagcgacga 24360 gcagctggcc cggtggctgg gtcctaatgc tagtccccag agtttggaag agcggcgcaa 24420 actcatgatg gccgtggtcc tggtgaccgt ggagctggag tgcctgcgcc gcttcttcgc 24480 cgacgcggag accctgcgca aggtcgagga gaacctgcac tacctcttca ggcacgggtt 24540 cgtgcgccag gcctgcaaga tctccaacgt ggagctgacc aacctggtct cctacatggg 24600 catcttgcac gagaaccgcc tggggcagaa cgtgctgcac accaccctgc gcggggaggc 24660 ccggcgcgac tacatccgcg actgcgtcta cctctacctc tgccacacct ggcagacggg 24720 catgggcgtg tggcagcagt gtctggagga gcagaacctg aaagagctct gcaagctcct 24780 gcagaagaac ctcaagggtc tgtggaccgg gttcgacgag cgcaccaccg cctcggacct 24840 ggccgacctc attttccccg agcgcctcag gctgacgctg cgcaacggcc tgcccgactt 24900 tatgagccaa agcatgttgc aaaactttcg ctctttcatc ctcgaacgct ccggaatcct 24960 gcccgccacc tgctccgcgc tgccctcgga cttcgtgccg ctgaccttcc gcgagtgccc 25020 cccgccgctg tggagccact gctacctgct gcgcctggcc aactacctgg cctaccactc 25080 ggacgtgatc gaggacgtca gcggcgaggg cctgctcgag tgccactgcc gctgcaacct 25140 ctgcacgccg caccgctccc tggcctgcaa cccccagctg ctgagcgaga cccagatcat 25200 cggcaccttc gagttgcaag ggcccagcga aggcgagggt tcagccgcca aggggggtct 25260 gaaactcacc ccggggctgt ggacctcggc ctacttgcgc aagttcgtgc ccgaggacta 25320 ccatcccttc gagatcaggt tctacgagga ccaatcccat ccgcccaagg ccgagctgtc 25380 ggcctgcgtc atcacccagg gggcgatcct ggcccaattg caagccatcc agaaatcccg 25440 ccaagaattc ttgctgaaaa agggccgcgg ggtctacctc gacccccaga ccggtgagga 25500 gctcaacccc ggcttccccc aggatgcccc gaggaaacaa gaagctgaaa gtggagctgc 25560 cgcccgtgga ggatttggag gaagactggg agaacagcag tcaggcagag gaggaggaga 25620 tggaggaaga ctgggacagc actcaggcag aggaggacag cctgcaagac agtctggagg 25680 aagacgagga ggaggcagag gaggaggtgg aagaagcagc cgccgccaga ccgtcgtcct 25740 cggcggggga gaaagcaagc agcacggata ccatctccgc tccgggtcgg ggtcccgctc 25800 gaccacacag tagatgggac gagaccggac gattcccgaa ccccaccacc cagaccggta 25860 agaaggagcg gcagggatac aagtcctggc gggggcacaa aaacgccatc gtctcctgct 25920 tgcaggcctg cgggggcaac atctccttca cccggcgcta cctgctcttc caccgcgggg 25980 tgaactttcc ccgcaacatc ttgcattact accgtcacct ccacagcccc tactacttcc 26040 aagaagaggc agcagcagca gaaaaagacc agcagaaaac cagcagctag aaaatccaca 26100 gcggcggcag caggtggact gaggatcgcg gcgaacgagc cggcgcaaac ccgggagctg 26160 aggaaccgga tctttcccac cctctatgcc atcttccagc agagtcgggg gcaggagcag 26220 gaactgaaag tcaagaaccg ttctctgcgc tcgctcaccc gcagttgtct gtatcacaag 26280 agcgaagacc aacttcagcg cactctcgag gacgccgagg ctctcttcaa caagtactgc 26340 gcgctcactc ttaaagagta gcccgcgccc gcccagtcgc agaaaaaggc gggaattacg 26400 tcacctgtgc ccttcgccct agccgcctcc acccatcatc atgagcaaag agattcccac 26460 gccttacatg tggagctacc agccccagat gggcctggcc gccggtgccg cccaggacta 26520 ctccacccgc atgaattggc tcagcgccgg gcccgcgatg atctcacggg tgaatgacat 26580 ccgcgcccac cgaaaccaga tactcctaga acagtcagcg ctcaccgcca cgccccgcaa 26640 tcacctcaat ccgcgtaatt ggcccgccgc cctggtgtac caggaaattc cccagcccac 26700 gaccgtacta cttccgcgag acgcccaggc cgaagtccag ctgactaact caggtgtcca 26760 gctggcgggc ggcgccaccc tgtgtcgtca ccgccccgct cagggtataa agcggctggt 26820 gatccggggc agaggcacac agctcaacga cgaggtggtg agctcttcgc tgggtctgcg 26880 acctgacgga gtcttccaac tcgccggatc ggggagatct tccttcacgc ctcgtcaggc 26940 cgtcctgact ttggagagtt cgtcctcgca gccccgctcg ggtggcatcg gcactctcca 27000 gttcgtggag gagttcactc cctcggtcta cttcaacccc ttctccggct cccccggcca 27060 ctacccggac gagttcatcc cgaacttcga cgccatcagc gagtcggtgg acggctacga 27120 ttgaatgtcc catggtggcg cagctgacct agctcggctt cgacacctgg accactgccg 27180 ccgcttccgc tgcttcgctc gggatctcgc cgagtttgcc tactttgagc tgcccgagga 27240 gcaccctcag ggcccggccc acggagtgcg gatcgtcgtc gaagggggcc tcgactccca 27300 cctgcttcgg atcttcagcc agcgtccgat cctggtcgag cgcgagcaag gacagaccct 27360 tctgactctg tactgcatct gcaaccaccc cggcctgcat gaaagtcttt gttgtctgct 27420 gtgtactgag tataataaaa gctgagatca gcgactactc cggacttccg tgtgttcctg 27480 aatccatcaa ccagtctttg ttcttcaccg ggaacgagac cgagctccag ctccagtgta 27540 agccccacaa gaagtacctc acctggctgt tccagggctc cccgatcgcc gttgtcaacc 27600 actgcgacaa cgacggagtc ctgctgagcg gccctgccaa ccttactttt tccacccgca 27660 gaagcaagct ccagctcttc caacccttcc tccccgggac ctatcagtgc gtctcgggac 27720 cctgccatca caccttccac ctgatcccga ataccacagc gtcgctcccc gctactaaca 27780 accaaactaa cctccaccaa cgccaccgtc gcgacctttc tgaatctaat actaccaccc 27840 acaccggagg tgagctccga ggtcaaccaa cctctgggat ttactacggc ccctgggagg 27900 tggttgggtt aatagcgcta ggcctagttg cgggtgggct tttggttctc tgctacctat 27960 acctcccttg ctgttcgtac ttagtggtgc tgtgttgctg gtttaagaaa tggggaagat 28020 caccctagtg agctgcggtg cgctggtggc ggtgttgctt tcgattgtgg gactgggcgg 28080 tgcggctgta gtgaaggaga aggccgatcc ctgcttgcat ttcaatccca acaaatgcca 28140 gctgagtttt cagcccgatg gcaatcggtg cgcggtactg atcaagtgcg gatgggaatg 28200 cgagaacgtg agaatcgagt acaataacaa gactcggaac aatactctcg cgtccgtgtg 28260 gcagcccggg gaccccgagt ggtacaccgt ctctgtcccc ggtgctgacg gctccccgcg 28320 caccgtgaat aatactttca tttttgcgca catgtgcgac acggtcatgt ggatgagcaa 28380 gcagtacgat atgtggcccc ccacgaagga gaacatcgtg gtcttctcca tcgcttacag 28440 cctgtgcacg gcgctaatca ccgctatcgt gtgcctgagc attcacatgc tcatcgctat 28500 tcgccccaga aataatgccg aaaaagaaaa acagccataa cgtttttttt cacacctttt 28560 tcagaccatg gcctctgtta aatttttgct tttatttgcc agtctcattg ccgtcattca 28620 tggaatgagt aatgagaaaa ttactattta cactggcact aatcacacat tgaaaggtcc 28680 agaaaaagcc acagaagttt catggtattg ttattttaat gaatcagatg tatctactga 28740 actctgtgga aacaataaca aaaaaaatga gagcattact ctcatcaagt ttcaatgtgg 28800 atctgactta accctaatta acatcactag agactatgta ggtatgtatt atggaactac 28860 agcaggcatt tcggacatgg aattttatca agtttctgtg tctgaaccca ccacgcctag 28920 aatgaccaca accacaaaaa ctacacctgt taccactatg cagctcacta ccaataacat 28980 ttttgccatg cgtcaaatgg tcaacaatag cactcaaccc accccaccca gtgaggaaat 29040 tcccaaatcc atgattggca ttattgttgc tgtagtggtg tgcatgttga tcatcgcctt 29100 gtgcatggtg tactatgcct tctgctacag aaagcacaga ctgaacgaca agctggaaca 29160 cttactaagt gttgaatttt aattttttag aaccatgaag atcctaggcc ttttaatttt 29220 ttctatcatt acctctgctc tatgcaattc tgacaatgag gacgttactg tcgttgtcgg 29280 atcaaattat acactgaaag gtccagcgaa gggtatgctt tcgtggtatt gctattttgg 29340 atctgacact acagaaactg aattatgcaa tcttaagaat ggcaaaattc aaaattctaa 29400 aattaacaat tatatatgca atggtactga tctgatactc ctcaatatca cgaaatcata 29460 tgctggcagt tacacctgcc ctggagatga tgctgacagt atgatttttt acaaagtaac 29520 tgttgttgat cccactactc cacctccacc caccacaact actcacacca cacacacaga 29580 tcaaaccgca gcagaggagg cagcaaagtt agccttgcag gtccaagaca gttcatttgt 29640 tggcattacc cctacacctg atcagcggtg tccggggctg ctagtcagcg gcattgtcgg 29700 tgtgctttcg ggattagcag tcataatcat ctgcatgttc atttttgctt gctgctatag 29760 aaggctttac cgacaaaaat cagacccact gctgaacctc tatgtttaat tttttccaga 29820 gtcatgaagg cagttagcgc tctagttttt tgttctttga ttggcattgt tttttgcaat 29880 cctattccta aagttagctt tattaaagat gtgaatgtta ctgagggggg caatgtgaca 29940 ctggtaggtg tagagggtgc tgaaaacacc acctggacaa aataccacct caatgggtgg 30000 aaagatattt gcaattggag tgtattagtt tatacatgtg agggagttaa tcttaccatt 30060 gtcaatgcca cctcagctca aaatggtaga attcaaggac aaagtgtcag tgtatctaat 30120 gggtatttta cccaacatac ttttatctat gacgttaaag tcataccact gcctacgcct 30180 agcccaccta gcactaccac acagacaacc cacactacac agacaaccac atacagtaca 30240 ttaaatcagc ctaccaccac tacagcagca gaggttgcca gctcgtctgg ggtccgagtg 30300 gcatttttga tgttggcccc atctagcagt cccactgcta gtaccaatga gcagactact 30360 gaatttttgt ccactgtcga gagccacacc acagctacct ccagtgcctt ctctagcacc 30420 gccaatctct cctcgctttc ctctacacca atcagtcccg ctactactcc tagccccgct 30480 cctcttccca ctcccctgaa gcaaacagac ggcggcatgc aatggcagat caccctgctc 30540 attgtgatcg ggttggtcat cctggccgtg ttgctctact acatcttctg ccgccgcatt 30600 cccaacgcgc accgcaagcc ggtctacaag cccatcattg tcgggcagcc ggagccgctt 30660 caggtggaag ggggtctaag gaatcttctc ttctctttta cagtatggtg attgaactat 30720 gattcctaga caattcttga tcactattct tatctgcctc ctccaagtct gtgccaccct 30780 cgctctggtg gccaacgcca gtccagactg tattgggccc ttcgcctcct acgtgctctt 30840 tgccttcacc acctgcatct gctgctgtag catagtctgc ctgcttatca ccttcttcca 30900 gttcattgac tggatctttg tgcgcatcgc ctacctgcgc caccaccccc agtaccgcga 30960 ccagcgagtg gcgcggctgc tcaggctcct ctgataagca tgcgggctct gctacttctc 31020 gcgcttctgc tgttagtgct cccccgtccc gtcgaccccc ggtcccccac ccagtccccc 31080 gaggaggtcc gcaaatgcaa attccaagaa ccctggaaat tcctcaaatg ctaccgccaa 31140 aaatcagaca tgcatcccag ctggatcatg atcattggga tcgtgaacat tctggcctgc 31200 accctcatct cctttgtgat ttacccctgc tttgactttg gttggaactc gccagaggcg 31260 ctctatctcc cgcctgaacc tgacacacca ccacagcaac ctcaggcaca cgcactacca 31320 ccactacagc ctaggccaca atacatgccc atattagact atgaggccga gccacagcga 31380 cccatgctcc ccgctattag ttacttcaat ctaaccggcg gagatgactg acccactggc 31440 caacaacaac gtcaacgacc ttctcctgga catggacggc cgcgcctcgg agcagcgact 31500 cgcccaactt cgcattcgcc agcagcagga gagagccgtc aaggagctgc aggatgcggt 31560 ggccatccac cagtgcaaga gaggcatctt ctgcctggtg aaacaggcca agatctccta 31620 cgaggtcact ccaaacgacc atcgcctctc ctacgagctc ctgcagcagc gccagaagtt 31680 cacctgcctg gtcggagtca accccatcgt catcacccag cagtctggcg ataccaaggg 31740 gtgcatccac tgctcctgcg actcccccga ctgcgtccac actctgatca agaccctctg 31800 cggcctccgc gacctcctcc ccatgaacta atcaccccct tatccagtga aataaagatc 31860 atattgatga tgattttaca gaaataaaaa ataatcattt gatttgaaat aaagatacaa 31920 tcatattgat gatttgagtt taacaaaaaa ataaagaatc acttacttga aatctgatac 31980 caggtctctg tccatgtttt ctgccaacac cacttcactc ccctcttccc agctctggta 32040 ctgcaggccc cggcgggctg caaacttcct ccacacgctg aaggggatgt caaattcctc 32100 ctgtccctca atcttcattt tatcttctat cagatgtcca aaaagcgcgt ccgggtggat 32160 gatgacttcg accccgtcta cccctacgat gcagacaacg caccgaccgt gcccttcatc 32220 aaccccccct tcgtctcttc agatggattc caagagaagc ccctgggggt gttgtccctg 32280 cgactggccg accccgtcac caccaagaac ggggaaatca ccctcaagct gggagagggg 32340 gtggacctcg attcctcggg aaaactcatc tccaacacgg ccaccaaggc cgccgcccct 32400 ctcagttttt ccaacaacac catttccctt aacatggatc acccctttta cactaaagat 32460 ggaaaattat ccttacaagt ttctccacca ttaaatatac tgagaacaag cattctaaac 32520 acactagctt taggttttgg atcaggttta ggactccgtg gctctgcctt ggcagtacag 32580 ttagtctctc cacttacatt tgatactgat ggaaacataa agcttacctt agacagaggt 32640 ttgcatgtta caacaggaga tgcaattgaa agcaacataa gctgggctaa aggtttaaaa 32700 tttgaagatg gagccatagc aaccaacatt ggaaatgggt tagagtttgg aagcagtagt 32760 acagaaacag gtgttgatga tgcttaccca atccaagtta aacttggatc tggccttagc 32820 tttgacagta caggagccat aatggctggt aacaaagaag acgataaact cactttgtgg 32880 acaacacctg atccatcacc aaactgtcaa atactcgcag aaaatgatgc aaaactaaca 32940 ctttgcttga ctaaatgtgg tagtcaaata ctggccactg tgtcagtctt agttgtagga 33000 agtggaaacc taaaccccat tactggcacc gtaagcagtg ctcaggtgtt tctacgtttt 33060 gatgcaaacg gtgttctttt aacagaacat tctacactaa aaaaatactg ggggtatagg 33120 cagggagata gcatagatgg cactccatat accaatgctg taggattcat gcccaattta 33180 aaagcttatc caaagtcaca aagttctact actaaaaata atatagtagg gcaagtatac 33240 atgaatggag atgtttcaaa acctatgctt ctcactataa ccctcaatgg tactgatgac 33300 agcaacagta catattcaat gtcattttca tacacctgga ctaatggaag ctatgttgga 33360 gcaacatttg gggctaactc ttataccttc tcatacatcg cccaagaatg aacactgtat 33420 cccaccctgc atgccaaccc ttcccacccc actctgtgga acaaactctg aaacacaaaa 33480 taaaataaag ttcaagtgtt ttattgattc aacagtttta caggattcga gcagttattt 33540 ttcctccacc ctcccaggac atggaataca ccaccctctc cccccgcaca gccttgaaca 33600 tctgaatgcc attggtgatg gacatgcttt tggtctccac gttccacaca gtttcagagc 33660 gagccagtct cgggtcggtc agggagatga aaccctccgg gcactcccgc atctgcacct 33720 cacagctcaa cagctgagga ttgtcctcgg tggtcgggat cacggttatc tggaagaagc 33780 agaagagcgg cggtgggaat catagtccgc gaacgggatc ggccggtggt gtcgcatcag 33840 gccccgcagc agtcgctgcc gccgccgctc cgtcaagctg ctgctcaggg ggtccgggtc 33900 cagggactcc ctcagcatga tgcccacggc cctcagcatc agtcgtctgg tgcggcgggc 33960 gcagcagcgc atgcggatct cgctcaggtc gctgcagtac gtgcaacaca gaaccaccag 34020 gttgttcaac agtccatagt tcaacacgct ccagccgaaa ctcatcgcgg gaaggatgct 34080 acccacgtgg ccgtcgtacc agatcctcag gtaaatcaag tggtgccccc tccagaacac 34140 gctgcccacg tacatgatct ccttgggcat gtggcggttc accacctccc ggtaccacat 34200 caccctctgg ttgaacatgc agccccggat gatcctgcgg aaccacaggg ccagcaccgc 34260 cccgcccgcc atgcagcgaa gagaccccgg gtcccggcaa tggcaatgga ggacccaccg 34320 ctcgtacccg tggatcatct gggagctgaa caagtctatg ttggcacagc acaggcatat 34380 gctcatgcat ctcttcagca ctctcaactc ctcgggggtc aaaaccatat cccagggcac 34440 ggggaactct tgcaggacag cgaaccccgc agaacagggc aatcctcgca cagaacttac 34500 attgtgcatg gacagggtat cgcaatcagg cagcaccggg tgatcctcca ccagagaagc 34560 gcgggtctcg gtctcctcac agcgtggtaa gggggccggc cgatacgggt gatggcggga 34620 cgcggctgat cgtgttcgcg accgtgtcat gatgcagttg ctttcggaca ttttcgtact 34680 tgctgtagca gaacctggtc cgggcgctgc acaccgatcg ccggcggcgg tctcggcgct 34740 tggaacgctc ggtgttgaaa ttgtaaaaca gccactctct cagaccgtgc agcagatcta 34800 gggcctcagg agtgatgaag atcccatcat gcctgatggc tctgatcaca tcgaccaccg 34860 tggaatgggc cagacccagc cagatgatgc aattttgttg ggtttcggtg acggcggggg 34920 agggaagaac aggaagaacc atgattaact tttaatccaa acggtctcgg agtacttcaa 34980 aatgaagatc gcggagatgg cacctctcgc ccccgctgtg ttggtggaaa ataacagcca 35040 ggtcaaaggt gatacggttc tcgagatgtt ccacggtggc ttccagcaaa gcctccacgc 35100 gcacatccag aaacaagaca atagcgaaag cgggagggtt ctctaattcc tcaatcatca 35160 tgttacactc ctgcaccatc cccagataat tttcattttt ccagccttga atgattcgaa 35220 ctagttcctg aggtaaatcc aagccagcca tgataaagag ctcgcgcaga gcgccctcca 35280 ccggcattct taagcacacc ctcataattc caagatattc tgctcctggt tcacctgcag 35340 cagattgaca agcggaatat caaaatctct gccgcgatcc ctgagctcct ccctcagcaa 35400 taactgtaag tactctttca tatcctctcc gaaattttta gccataggac caccaggaat 35460 aagattaggg caagccacag tacagataaa ccgaagtcct ccccagtgag cattgccaaa 35520 tgcaagactg ctataagcat gctggctaga cccggtgata tcttccagat aactggacag 35580 aaaatcgccc aggcaatttt taagaaaatc aacaaaagaa aaatcctcca ggtggacgtt 35640 tagagcctcg ggaacaacga tgaagtaaat gcaagcggtg cgttccagca tggttagtta 35700 gctgatctgt agaaaaaaca aaaatgaaca ttaaaccatg ctagcctggc gaacaggtgg 35760 gtaaatcgtt ctctccagca ccaggcaggc cacggggtct ccggcgcgac cctcgtaaaa 35820 attgtcgcta tgattgaaaa ccatcacaga gagacgttcc cggtggccgg cgtgaatgat 35880 tcgacaagat gaatacaccc ccggaacatt ggcgtccgcg agtgaaaaaa agcgcccgag 35940 gaagcaataa ggcactacaa tgctcagtct caagtccagc aaagcgatgc catgcggatg 36000 aagcacaaaa ttctcaggtg cgtacaaaat gtaattactc ccctcctgca caggcagcaa 36060 agcccccgat ccctccaggt acacatacaa agcctcagcg tccatagctt accgagcagc 36120 agcacacaac aggcgcaaga gtcagagaaa ggctgagctc taacctgtcc acccgctctc 36180 tgctcaatat atagcccaga tctacactga cgtaaaggcc aaagtctaaa aatacccgcc 36240 aaataatcac acacgcccag cacacgccca gaaaccggtg acacactcaa aaaaatacgc 36300 gcacttcctc aaacgcccaa aactgccgtc atttccgggt tcccacgcta cgtcatcaaa 36360 acacgacttt caaattccgt cgaccgttaa aaacgtcacc cgccccgccc ctaacggtcg 36420 cccgtctctc agccaatcag cgccccgcat ccccaaattc aaacacctca tttgcatatt 36480 aacgcgcaca aaaagtttga ggtatattat tgatgatgg 36519 <210> 11 <211> 31867 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 11 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600 gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840 atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900 atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960 tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200 cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260 tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 1320 acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 1380 agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 1440 tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 1500 acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 1560 aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 1620 accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 1680 tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 1740 tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 1800 actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 1860 tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 1920 tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctttac aagtagtgag 1980 tttaaactcc catttaaatg tgagggttaa tgcttcgagc agacatgata agatacattg 2040 atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2100 gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 2160 attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 2220 aaaacctcta caaatgtggt aaaataacta taacggtcct aaggtagcga gtgagtagtg 2280 ttctggggcg ggggaggacc tgcatgaggg ccagaataac tgaaatctgt gcttttctgt 2340 gtgttgcagc agcatgagcg gaagcggctc ctttgaggga ggggtattca gcccttatct 2400 gacggggcgt ctcccctcct gggcgggagt gcgtcagaat gtgatgggat ccacggtgga 2460 cggccggccc gtgcagcccg cgaactcttc aaccctgacc tatgcaaccc tgagctcttc 2520 gtcgttggac gcagctgccg ccgcagctgc tgcatctgcc gccagcgccg tgcgcggaat 2580 ggccatgggc gccggctact acggcactct ggtggccaac tcgagttcca ccaataatcc 2640 cgccagcctg aacgaggaga agctgttgct gctgatggcc cagctcgagg ccttgaccca 2700 gcgcctgggc gagctgaccc agcaggtggc tcagctgcag gagcagacgc gggccgcggt 2760 tgccacggtg aaatccaaat aaaaaatgaa tcaataaata aacggagacg gttgttgatt 2820 ttaacacaga gtctgaatct ttatttgatt tttcgcgcgc ggtaggccct ggaccaccgg 2880 tctcgatcat tgagcacccg gtggatcttt tccaggaccc ggtagaggtg ggcttggatg 2940 ttgaggtaca tgggcatgag cccgtcccgg gggtggaggt agctccattg cagggcctcg 3000 tgctcggggg tggtgttgta aatcacccag tcatagcagg ggcgcagggc atggtgttgc 3060 acaatatctt tgaggaggag actgatggcc acgggcagcc ctttggtgta ggtgtttaca 3120 aatctgttga gctgggaggg atgcatgcgg ggggagatga ggtgcatctt ggcctggatc 3180 ttgagattgg cgatgttacc gcccagatcc cgcctggggt tcatgttgtg caggaccacc 3240 agcacggtgt atccggtgca cttggggaat ttatcatgca acttggaagg gaaggcgtga 3300 aagaatttgg cgacgccttt gtgcccgccc aggttttcca tgcactcatc catgatgatg 3360 gcgatgggcc cgtgggcggc ggcctgggca aagacgtttc gggggtcgga cacatcatag 3420 ttgtggtcct gggtgaggtc atcataggcc attttaatga atttggggcg gagggtgccg 3480 gactggggga caaaggtacc ctcgatcccg ggggcgtagt tcccctcaca gatctgcatc 3540 tcccaggctt tgagctcgga gggggggatc atgtccacct gcggggcgat aaagaacacg 3600 gtttccgggg cgggggagat gagctgggcc gaaagcaagt tccggagcag ctgggacttg 3660 ccgcagccgg tggggccgta gatgaccccg atgaccggct gcaggtggta gttgagggag 3720 agacagctgc cgtcctcccg gaggaggggg gccacctcgt tcatcatctc gcgcacgtgc 3780 atgttctcgc gcaccagttc cgccaggagg cgctctcccc ccagggatag gagctcctgg 3840 agcgaggcga agtttttcag cggcttgagt ccgtcggcca tgggcatttt ggagagggtt 3900 tgttgcaaga gttccaggcg gtcccagagc tcggtgatgt gctctacggc atctcgatcc 3960 agcagacctc ctcgtttcgc gggttgggac ggctgcggga gtagggcacc agacgatggg 4020 cgtccagcgc agccagggtc cggtccttcc agggtcgcag cgtccgcgtc agggtggtct 4080 ccgtcacggt gaaggggtgc gcgccgggct gggcgcttgc gagggtgcgc ttcaggctca 4140 tccggctggt cgaaaaccgc tcccgatcgg cgccctgcgc gtcggccagg tagcaattga 4200 ccatgagttc gtagttgagc gcctcggccg cgtggccttt ggcgcggagc ttacctttgg 4260 aagtctgccc gcaggcggga cagaggaggg acttgagggc gtagagcttg ggggcgagga 4320 agacggactc gggggcgtag gcgtccgcgc cgcagtgggc gcagacggtc tcgcactcca 4380 cgagccaggt gaggtcgggc tggtcggggt caaaaaccag tttcccgccg ttctttttga 4440 tgcgtttctt acctttggtc tccatgagct cgtgtccccg ctgggtgaca aagaggctgt 4500 ccgtgtcccc gtagaccgac tttatgggcc ggtcctcgag cggtgtgccg cggtcctcct 4560 cgtagaggaa ccccgcccac tccgagacga aagcccgggt ccaggccagc acgaaggagg 4620 ccacgtggga cgggtagcgg tcgttgtcca ccagcgggtc caccttttcc agggtatgca 4680 aacacatgtc cccctcgtcc acatccagga aggtgattgg cttgtaagtg taggccacgt 4740 gaccgggggt cccggccggg ggggtataaa agggtgcggg tccctgctcg tcctcactgt 4800 cttccggatc gctgtccagg agcgccagct gttggggtag gtattccctc tcgaaggcgg 4860 gcatgacctc ggcactcagg ttgtcagttt ctagaaacga ggaggatttg atattgacgg 4920 tgccggcgga gatgcctttc aagagcccct cgtccatctg gtcagaaaag acgatctttt 4980 tgttgtcgag cttggtggcg aaggagccgt agagggcgtt ggagaggagc ttggcgatgg 5040 agcgcatggt ctggtttttt tccttgtcgg cgcgctcctt ggcggcgatg ttgagctgca 5100 cgtactcgcg cgccacgcac ttccattcgg ggaagacggt ggtcagctcg tcgggcacga 5160 ttctgacctg ccagccccga ttatgcaggg tgatgaggtc cacactggtg gccacctcgc 5220 cgcgcagggg ctcattagtc cagcagaggc gtccgccctt gcgcgagcag aaggggggca 5280 gggggtccag catgacctcg tcgggggggt cggcatcgat ggtgaagatg ccgggcagga 5340 ggtcggggtc aaagtagctg atggaagtgg ccagatcgtc cagggcagct tgccattcgc 5400 gcacggccag cgcgctctcg tagggactga ggggcgtgcc ccagggcatg ggatgggtaa 5460 gcgcggaggc gtacatgccg cagatgtcgt agacgtagag gggctcctcg aggatgccga 5520 tgtaggtggg gtagcagcgc cccccgcgga tgctggcgcg cacgtagtca tacagctcgt 5580 gcgagggggc gaggagcccc gggcccaggt tggtgcgact gggcttttcg gcgcggtaga 5640 cgatctggcg gaaaatggca tgcgagttgg aggagatggt gggcctttgg aagatgttga 5700 agtgggcgtg gggcagtccg accgagtcgc ggatgaagtg ggcgtaggag tcttgcagct 5760 tggcgacgag ctcggcggtg actaggacgt ccagagcgca gtagtcgagg gtctcctgga 5820 tgatgtcata cttgagctgt cccttttgtt tccacagctc gcggttgaga aggaactctt 5880 cgcggtcctt ccagtactct tcgaggggga acccgtcctg atctgcacgg taagagccta 5940 gcatgtagaa ctggttgacg gccttgtagg cgcagcagcc cttctccacg gggagggcgt 6000 aggcctgggc ggccttgcgc agggaggtgt gcgtgagggc gaaagtgtcc ctgaccatga 6060 ccttgaggaa ctggtgcttg aagtcgatat cgtcgcagcc cccctgctcc cagagctgga 6120 agtccgtgcg cttcttgtag gcggggttgg gcaaagcgaa agtaacatcg ttgaagagga 6180 tcttgcccgc gcggggcata aagttgcgag tgatgcggaa aggttggggc acctcggccc 6240 ggttgttgat gacctgggcg gcgagcacga tctcgtcgaa gccgttgatg ttgtggccca 6300 cgatgtagag ttccacgaat cgcggacggc ccttgacgtg gggcagtttc ttgagctcct 6360 cgtaggtgag ctcgtcgggg tcgctgagcc cgtgctgctc gagcgcccag tcggcgagat 6420 gggggttggc gcggaggaag gaagtccaga gatccacggc cagggcggtt tgcagacggt 6480 cccggtactg acggaactgc tgcccgacgg ccattttttc gggggtgacg cagtagaagg 6540 tgcgggggtc cccgtgccag cgatcccatt tgagctggag ggcgagatcg agggcgagct 6600 cgacgagccg gtcgtccccg gagagtttca tgaccagcat gaaggggacg agctgcttgc 6660 cgaaggaccc catccaggtg taggtttcca catcgtaggt gaggaagagc ctttcggtgc 6720 gaggatgcga gccgatgggg aagaactgga tctcctgcca ccaattggag gaatggctgt 6780 tgatgtgatg gaagtagaaa tgccgacggc gcgccgaaca ctcgtgcttg tgtttataca 6840 agcggccaca gtgctcgcaa cgctgcacgg gatgcacgtg ctgcacgagc tgtacctgag 6900 ttcctttgac gaggaatttc agtgggaagt ggagtcgtgg cgcctgcatc tcgtgctgta 6960 ctacgtcgtg gtggtcggcc tggccctctt ctgcctcgat ggtggtcatg ctgacgagcc 7020 cgcgcgggag gcaggtccag acctcggcgc gagcgggtcg gagagcgagg acgagggcgc 7080 gcaggccgga gctgtccagg gtcctgagac gctgcggagt caggtcagtg ggcagcggcg 7140 gcgcgcggtt gacttgcagg agtttttcca gggcgcgcgg gaggtccaga tggtacttga 7200 tctccaccgc gccattggtg gcgacgtcga tggcttgcag ggtcccgtgc ccctggggtg 7260 tgaccaccgt cccccgtttc ttcttgggcg gctggggcga cgggggcggt gcctcttcca 7320 tggttagaag cggcggcgag gacgcgcgcc gggcggcagg ggcggctcgg ggcccggagg 7380 caggggcggc aggggcacgt cggcgccgcg cgcgggtagg ttctggtact gcgcccggag 7440 aagactggcg tgagcgacga cgcgacggtt gacgtcctgg atctgacgcc tctgggtgaa 7500 ggccacggga cccgtgagtt tgaacctgaa agagagttcg acagaatcaa tctcggtatc 7560 gttgacggcg gcctgccgca ggatctcttg cacgtcgccc gagttgtcct ggtaggcgat 7620 ctcggtcatg aactgctcga tctcctcctc ttgaaggtct ccgcggccgg cgcgctccac 7680 ggtggccgcg aggtcgttgg agatgcggcc catgagctgc gagaaggcgt tcatgcccgc 7740 ctcgttccag acgcggctgt agaccacgac gccctcggga tcgcgggcgc gcatgaccac 7800 ctgggcgagg ttgagctcca cgtggcgcgt gaagaccgcg tagttgcaga ggcgctggta 7860 gaggtagttg agcgtggtgg cgatgtgctc ggtgacgaag aaatacatga tccagcggcg 7920 gagcggcatc tcgctgacgt cgcccagcgc ctccaaacgt tccatggcct cgtaaaagtc 7980 cacggcgaag ttgaaaaact gggagttgcg cgccgagacg gtcaactcct cctccagaag 8040 acggatgagc tcggcgatgg tggcgcgcac ctcgcgctcg aaggcccccg ggagttcctc 8100 cacttcctct tcttcctcct ccactaacat ctcttctact tcctcctcag gcggcagtgg 8160 tggcggggga gggggcctgc gtcgccggcg gcgcacgggc agacggtcga tgaagcgctc 8220 gatggtctcg ccgcgccggc gtcgcatggt ctcggtgacg gcgcgcccgt cctcgcgggg 8280 ccgcagcgtg aagacgccgc cgcgcatctc caggtggccg ggggggtccc cgttgggcag 8340 ggagagggcg ctgacgatgc atcttatcaa ttgccccgta gggactccgc gcaaggacct 8400 gagcgtctcg agatccacgg gatctgaaaa ccgctgaacg aaggcttcga gccagtcgca 8460 gtcgcaaggt aggctgagca cggtttcttc tggcgggtca tgttggttgg gagcggggcg 8520 ggcgatgctg ctggtgatga agttgaaata ggcggttctg agacggcgga tggtggcgag 8580 gagcaccagg tctttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc 8640 gtggtcctga cacctggcca ggtccttgta gtagtcctgc atgagccgct ccacgggcac 8700 ctcctcctcg cccgcgcggc cgtgcatgcg cgtgagcccg aagccgcgct ggggctggac 8760 gagcgccagg tcggcgacga cgcgctcggc gaggatggct tgctggatct gggtgagggt 8820 ggtctggaag tcatcaaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga 8880 gcagttggcc atgacggacc agttgacggt ctggtggccc ggacgcacga gctcgtggta 8940 cttgaggcgc gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcaccaggta 9000 ctggtagccg atgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc 9060 gggggcgccg ggcgcgaggt cctcgagcat ggtgcggtgg tagccgtaga tgtacctgga 9120 catccaggtg atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca 9180 gatgttgcgc agcggcagga agtagttcat ggtgggcacg gtctggcccg tgaggcgcgc 9240 gcagtcgtgg atgctctata cgggcaaaaa cgaaagcggt cagcggctcg actccgtggc 9300 ctggaggcta agcgaacggg ttgggctgcg cgtgtacccc ggttcgaatc tcgaatcagg 9360 ctggagccgc agctaacgtg gtattggcac tcccgtctcg acccaagcct gcaccaaccc 9420 tccaggatac ggaggcgggt cgttttgcaa cttttttttg gaggccggat gagactagta 9480 agcgcggaaa gcggccgacc gcgatggctc gctgccgtag tctggagaag aatcgccagg 9540 gttgcgttgc ggtgtgcccc ggttcgaggc cggccggatt ccgcggctaa cgagggcgtg 9600 gctgccccgt cgtttccaag accccatagc cagccgactt ctccagttac ggagcgagcc 9660 cctcttttgt tttgtttgtt tttgccagat gcatcccgta ctgcggcaga tgcgccccca 9720 ccaccctcca ccgcaacaac agccccctcc acagccggcg cttctgcccc cgccccagca 9780 gcaacttcca gccacgaccg ccgcggccgc cgtgagcggg gctggacaga gttatgatca 9840 ccagctggcc ttggaagagg gcgaggggct ggcgcgcctg ggggcgtcgt cgccggagcg 9900 gcacccgcgc gtgcagatga aaagggacgc tcgcgaggcc tacgtgccca agcagaacct 9960 gttcagagac aggagcggcg aggagcccga ggagatgcgc gcggcccggt tccacgcggg 10020 gcgggagctg cggcgcggcc tggaccgaaa gagggtgctg agggacgagg atttcgaggc 10080 ggacgagctg acggggatca gccccgcgcg cgcgcacgtg gccgcggcca acctggtcac 10140 ggcgtacgag cagaccgtga aggaggagag caacttccaa aaatccttca acaaccacgt 10200 gcgcaccctg atcgcgcgcg aggaggtgac cctgggcctg atgcacctgt gggacctgct 10260 ggaggccatc gtgcagaacc ccaccagcaa gccgctgacg gcgcagctgt tcctggtggt 10320 gcagcatagt cgggacaacg aagcgttcag ggaggcgctg ctgaatatca ccgagcccga 10380 gggccgctgg ctcctggacc tggtgaacat tctgcagagc atcgtggtgc aggagcgcgg 10440 gctgccgctg tccgagaagc tggcggccat caacttctcg gtgctgagtt tgggcaagta 10500 ctacgctagg aagatctaca agaccccgta cgtgcccata gacaaggagg tgaagatcga 10560 cgggttttac atgcgcatga ccctgaaagt gctgaccctg agcgacgatc tgggggtgta 10620 ccgcaacgac aggatgcacc gtgcggtgag cgccagcagg cggcgcgagc tgagcgacca 10680 ggagctgatg catagtctgc agcgggccct gaccggggcc gggaccgagg gggagagcta 10740 ctttgacatg ggcgcggacc tgcactggca gcccagccgc cgggccttgg aggcggcggc 10800 aggaccctac gtagaagagg tggacgatga ggtggacgag gagggcgagt acctggaaga 10860 ctgatggcgc gaccgtattt ttgctagatg caacaacaac agccacctcc tgatcccgcg 10920 atgcgggcgg cgctgcagag ccagccgtcc ggcattaact cctcggacga ttggacccag 10980 gccatgcaac gcatcatggc gctgacgacc cgcaaccccg aagcctttag acagcagccc 11040 caggccaacc ggctctcggc catcctggag gccgtggtgc cctcgcgctc caaccccacg 11100 cacgagaagg tcctggccat cgtgaacgcg ctggtggaga acaaggccat ccgcggcgac 11160 gaggccggcc tggtgtacaa cgcgctgctg gagcgcgtgg cccgctacaa cagcaccaac 11220 gtgcagacca acctggaccg catggtgacc gacgtgcgcg aggccgtggc ccagcgcgag 11280 cggttccacc gcgagtccaa cctgggatcc atggtggcgc tgaacgcctt cctcagcacc 11340 cagcccgcca acgtgccccg gggccaggag gactacacca acttcatcag cgccctgcgc 11400 ctgatggtga ccgaggtgcc ccagagcgag gtgtaccagt ccgggccgga ctacttcttc 11460 cagaccagtc gccagggctt gcagaccgtg aacctgagcc aggctttcaa gaacttgcag 11520 ggcctgtggg gcgtgcaggc cccggtcggg gaccgcgcga cggtgtcgag cctgctgacg 11580 ccgaactcgc gcctgctgct gctgctggtg gcccccttca cggacagcgg cagcatcaac 11640 cgcaactcgt acctgggcta cctgattaac ctgtaccgcg aggccatcgg ccaggcgcac 11700 gtggacgagc agacctacca ggagatcacc cacgtgagcc gcgccctggg ccaggacgac 11760 ccgggcaacc tggaagccac cctgaacttt ttgctgacca accggtcgca gaagatcccg 11820 ccccagtacg cgctcagcac cgaggaggag cgcatcctgc gttacgtgca gcagagcgtg 11880 ggcctgttcc tgatgcagga gggggccacc cccagcgccg cgctcgacat gaccgcgcgc 11940 aacatggagc ccagcatgta cgccagcaac cgcccgttca tcaataaact gatggactac 12000 ttgcatcggg cggccgccat gaactctgac tatttcacca acgccatcct gaatccccac 12060 tggctcccgc cgccggggtt ctacacgggc gagtacgaca tgcccgaccc caatgacggg 12120 ttcctgtggg acgatgtgga cagcagcgtg ttctcccccc gaccgggtgc taacgagcgc 12180 cccttgtgga agaaggaagg cagcgaccga cgcccgtcct cggcgctgtc cggccgcgag 12240 ggtgctgccg cggcggtgcc cgaggccgcc agtcctttcc cgagcttgcc cttctcgctg 12300 aacagtatcc gcagcagcga gctgggcagg atcacgcgcc cgcgcttgct gggcgaagag 12360 gagtacttga atgactcgct gttgagaccc gagcgggaga agaacttccc caataacggg 12420 atagaaagcc tggtggacaa gatgagccgc tggaagacgt atgcgcagga gcacagggac 12480 gatccccggg cgtcgcaggg ggccacgagc cggggcagcg ccgcccgtaa acgccggtgg 12540 cacgacaggc agcggggaca gatgtgggac gatgaggact ccgccgacga cagcagcgtg 12600 ttggacttgg gtgggagtgg taacccgttc gctcacctgc gcccccgtat cgggcgcatg 12660 atgtaagaga aaccgaaaat aaatgatact caccaaggcc atggcgacca gcgtgcgttc 12720 gtttcttctc tgttgttgtt gtatctagta tgatgaggcg tgcgtacccg gagggtcctc 12780 ctccctcgta cgagagcgtg atgcagcagg cgatggcggc ggcggcgatg cagcccccgc 12840 tggaggctcc ttacgtgccc ccgcggtacc tggcgcctac ggaggggcgg aacagcattc 12900 gttactcgga gctggcaccc ttgtacgata ccacccggtt gtacctggtg gacaacaagt 12960 cggcggacat cgcctcgctg aactaccaga acgaccacag caacttcctg accaccgtgg 13020 tgcagaacaa tgacttcacc cccacggagg ccagcaccca gaccatcaac tttgacgagc 13080 gctcgcggtg gggcggccag ctgaaaacca tcatgcacac caacatgccc aacgtgaacg 13140 agttcatgta cagcaacaag ttcaaggcgc gggtgatggt ctcccgcaag acccccaatg 13200 gggtgacagt gacagaggat tatgatggta gtcaggatga gctgaagtat gaatgggtgg 13260 aatttgagct gcccgaaggc aacttctcgg tgaccatgac catcgacctg atgaacaacg 13320 ccatcatcga caattacttg gcggtggggc ggcagaacgg ggtgctggag agcgacatcg 13380 gcgtgaagtt cgacactagg aacttcaggc tgggctggga ccccgtgacc gagctggtca 13440 tgcccggggt gtacaccaac gaggctttcc atcccgatat tgtcttgctg cccggctgcg 13500 gggtggactt caccgagagc cgcctcagca acctgctggg cattcgcaag aggcagccct 13560 tccaggaagg cttccagatc atgtacgagg atctggaggg gggcaacatc cccgcgctcc 13620 tggatgtcga cgcctatgag aaaagcaagg aggatgcagc agctgaagca actgcagccg 13680 tagctaccgc ctctaccgag gtcaggggcg ataattttgc aagcgccgca gcagtggcag 13740 cggccgaggc ggctgaaacc gaaagtaaga tagtcattca gccggtggag aaggatagca 13800 agaacaggag ctacaacgta ctaccggaca agataaacac cgcctaccgc agctggtacc 13860 tagcctacaa ctatggcgac cccgagaagg gcgtgcgctc ctggacgctg ctcaccacct 13920 cggacgtcac ctgcggcgtg gagcaagtct actggtcgct gcccgacatg atgcaagacc 13980 cggtcacctt ccgctccacg cgtcaagtta gcaactaccc ggtggtgggc gccgagctcc 14040 tgcccgtcta ctccaagagc ttcttcaacg agcaggccgt ctactcgcag cagctgcgcg 14100 ccttcacctc gcttacgcac gtcttcaacc gcttccccga gaaccagatc ctcgtccgcc 14160 cgcccgcgcc caccattacc accgtcagtg aaaacgttcc tgctctcaca gatcacggga 14220 ccctgccgct gcgcagcagt atccggggag tccagcgcgt gaccgttact gacgccagac 14280 gccgcacctg cccctacgtc tacaaggccc tgggcatagt cgcgccgcgc gtcctctcga 14340 gccgcacctt ctaaatgtcc attctcatct cgcccagtaa taacaccggt tggggcctgc 14400 gcgcgcccag caagatgtac ggaggcgctc gccaacgctc cacgcaacac cccgtgcgcg 14460 tgcgcgggca cttccgcgct ccctggggcg ccctcaaggg ccgcgtgcgg tcgcgcacca 14520 ccgtcgacga cgtgatcgac caggtggtgg ccgacgcgcg caactacacc cccgccgccg 14580 cgcccgtctc caccgtggac gccgtcatcg acagcgtggt ggccgacgcg cgccggtacg 14640 cccgcgccaa gagccggcgg cggcgcatcg cccggcggca ccggagcacc cccgccatgc 14700 gcgcggcgcg agccttgctg cgcagggcca ggcgcacggg acgcagggcc atgctcaggg 14760 cggccagacg cgcggcttca ggcgccagcg ccggcaggac ccggagacgc gcggccacgg 14820 cggcggcagc ggccatcgcc agcatgtccc gcccgcggcg agggaacgtg tactgggtgc 14880 gcgacgccgc caccggtgtg cgcgtgcccg tgcgcacccg cccccctcgc acttgaagat 14940 gttcacttcg cgatgttgat gtgtcccagc ggcgaggagg atgtccaagc gcaaattcaa 15000 ggaagagatg ctccaggtca tcgcgcctga gatctacggc cctgcggtgg tgaaggagga 15060 aagaaagccc cgcaaaatca agcgggtcaa aaaggacaaa aaggaagaag aaagtgatgt 15120 ggacggattg gtggagtttg tgcgcgagtt cgccccccgg cggcgcgtgc agtggcgcgg 15180 gcggaaggtg caaccggtgc tgagacccgg caccaccgtg gtcttcacgc ccggcgagcg 15240 ctccggcacc gcttccaagc gctcctacga cgaggtgtac ggggatgatg atattctgga 15300 gcaggcggcc gagcgcctgg gcgagtttgc ttacggcaag cgcagccgtt ccgcaccgaa 15360 ggaagaggcg gtgtccatcc cgctggacca cggcaacccc acgccgagcc tcaagcccgt 15420 gaccttgcag caggtgctgc cgaccgcggc gccgcgccgg gggttcaagc gcgagggcga 15480 ggatctgtac cccaccatgc agctgatggt gcccaagcgc cagaagctgg aagacgtgct 15540 ggagaccatg aaggtggacc cggacgtgca gcccgaggtc aaggtgcggc ccatcaagca 15600 ggtggccccg ggcctgggcg tgcagaccgt ggacatcaag attcccacgg agcccatgga 15660 aacgcagacc gagcccatga tcaagcccag caccagcacc atggaggtgc agacggatcc 15720 ctggatgcca tcggctccta gtcgaagacc ccggcgcaag tacggcgcgg ccagcctgct 15780 gatgcccaac tacgcgctgc atccttccat catccccacg ccgggctacc gcggcacgcg 15840 cttctaccgc ggtcatacca gcagccgccg ccgcaagacc accactcgcc gccgccgtcg 15900 ccgcaccgcc gctgcaacca cccctgccgc cctggtgcgg agagtgtacc gccgcggccg 15960 cgcacctctg accctgccgc gcgcgcgcta ccacccgagc atcgccattt aaactttcgc 16020 ctgctttgca gatcaatggc cctcacatgc cgccttcgcg ttcccattac gggctaccga 16080 ggaagaaaac cgcgccgtag aaggctggcg gggaacggga tgcgtcgcca ccaccaccgg 16140 cggcggcgcg ccatcagcaa gcggttgggg ggaggcttcc tgcccgcgct gatccccatc 16200 atcgccgcgg cgatcggggc gatccccggc attgcttccg tggcggtgca ggcctctcag 16260 cgccactgag acacacttgg aaacatcttg taataaacca atggactctg acgctcctgg 16320 tcctgtgatg tgttttcgta gacagatgga agacatcaat ttttcgtccc tggctccgcg 16380 acacggcacg cggccgttca tgggcacctg gagcgacatc ggcaccagcc aactgaacgg 16440 gggcgccttc aattggagca gtctctggag cgggcttaag aatttcgggt ccacgcttaa 16500 aacctatggc agcaaggcgt ggaacagcac cacagggcag gcgctgaggg ataagctgaa 16560 agagcagaac ttccagcaga aggtggtcga tgggctcgcc tcgggcatca acggggtggt 16620 ggacctggcc aaccaggccg tgcagcggca gatcaacagc cgcctggacc cggtgccgcc 16680 cgccggctcc gtggagatgc cgcaggtgga ggaggagctg cctcccctgg acaagcgggg 16740 cgagaagcga ccccgccccg atgcggagga gacgctgctg acgcacacgg acgagccgcc 16800 cccgtacgag gaggcggtga aactgggtct gcccaccacg cggcccatcg cgcccctggc 16860 caccggggtg ctgaaacccg aaaagcccgc gaccctggac ttgcctcctc cccagccttc 16920 ccgcccctct acagtggcta agcccctgcc gccggtggcc gtggcccgcg cgcgacccgg 16980 gggcaccgcc cgccctcatg cgaactggca gagcactctg aacagcatcg tgggtctggg 17040 agtgcagagt gtgaagcgcc gccgctgcta ttaaacctac cgtagcgctt aacttgcttg 17100 tctgtgtgtg tatgtattat gtcgccgccg ccgctgtcca ccagaaggag gagtgaagag 17160 gcgcgtcgcc gagttgcaag atggccaccc catcgatgct gccccagtgg gcgtacatgc 17220 acatcgccgg acaggacgct tcggagtacc tgagtccggg tctggtgcag tttgcccgcg 17280 ccacagacac ctacttcagt ctggggaaca agtttaggaa ccccacggtg gcgcccacgc 17340 acgatgtgac caccgaccgc agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg 17400 aggacaacac ctactcgtac aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc 17460 tggacatggc cagcacctac tttgacatcc gcggcgtgct ggatcggggc cctagcttca 17520 aaccctactc cggcaccgcc tacaacagtc tggcccccaa gggagcaccc aacacttgtc 17580 agtggacata taaagccgat ggtgaaactg ccacagaaaa aacctataca tatggaaatg 17640 cacccgtgca gggcattaac atcacaaaag atggtattca acttggaact gacaccgatg 17700 atcagccaat ctacgcagat aaaacctatc agcctgaacc tcaagtgggt gatgctgaat 17760 ggcatgacat cactggtact gatgaaaagt atggaggcag agctcttaag cctgatacca 17820 aaatgaagcc ttgttatggt tcttttgcca agcctactaa taaagaagga ggtcaggcaa 17880 atgtgaaaac aggaacaggc actactaaag aatatgacat agacatggct ttctttgaca 17940 acagaagtgc ggctgctgct ggcctagctc cagaaattgt tttgtatact gaaaatgtgg 18000 atttggaaac tccagatacc catattgtat acaaagcagg cacagatgac agcagctctt 18060 ctattaattt gggtcagcaa gccatgccca acagacctaa ctacattggt ttcagagaca 18120 actttatcgg gctcatgtac tacaacagca ctggcaatat gggggtgctg gccggtcagg 18180 cttctcagct gaatgctgtg gttgacttgc aagacagaaa caccgagctg tcctaccagc 18240 tcttgcttga ctctctgggt gacagaaccc ggtatttcag tatgtggaat caggcggtgg 18300 acagctatga tcctgatgtg cgcattattg aaaatcatgg tgtggaggat gaacttccca 18360 actattgttt ccctctggat gctgttggca gaacagatac ttatcaggga attaaggcta 18420 atggaactga tcaaaccaca tggaccaaag atgacagtgt caatgatgct aatgagatag 18480 gcaagggtaa tccattcgcc atggaaatca acatccaagc caacctgtgg aggaacttcc 18540 tctacgccaa cgtggccctg tacctgcccg actcttacaa gtacacgccg gccaatgtta 18600 ccctgcccac caacaccaac acctacgatt acatgaacgg ccgggtggtg gcgccctcgc 18660 tggtggactc ctacatcaac atcggggcgc gctggtcgct ggatcccatg gacaacgtga 18720 accccttcaa ccaccaccgc aatgcggggc tgcgctaccg ctccatgctc ctgggcaacg 18780 ggcgctacgt gcccttccac atccaggtgc cccagaaatt tttcgccatc aagagcctcc 18840 tgctcctgcc cgggtcctac acctacgagt ggaacttccg caaggacgtc aacatgatcc 18900 tgcagagctc cctcggcaac gacctgcgca cggacggggc ctccatctcc ttcaccagca 18960 tcaacctcta cgccaccttc ttccccatgg cgcacaacac ggcctccacg ctcgaggcca 19020 tgctgcgcaa cgacaccaac gaccagtcct tcaacgacta cctctcggcg gccaacatgc 19080 tctaccccat cccggccaac gccaccaacg tgcccatctc catcccctcg cgcaactggg 19140 ccgccttccg cggctggtcc ttcacgcgtc tcaagaccaa ggagacgccc tcgctgggct 19200 ccgggttcga cccctacttc gtctactcgg gctccatccc ctacctcgac ggcaccttct 19260 acctcaacca caccttcaag aaggtctcca tcaccttcga ctcctccgtc agctggcccg 19320 gcaacgaccg gctcctgacg cccaacgagt tcgaaatcaa gcgcaccgtc gacggcgagg 19380 gctacaacgt ggcccagtgc aacatgacca aggactggtt cctggtccag atgctggccc 19440 actacaacat cggctaccag ggcttctacg tgcccgaggg ctacaaggac cgcatgtact 19500 ccttcttccg caacttccag cccatgagcc gccaggtggt ggacgaggtc aactacaagg 19560 actaccaggc cgtcaccctg gcctaccagc acaacaactc gggcttcgtc ggctacctcg 19620 cgcccaccat gcgccagggc cagccctacc ccgccaacta cccctacccg ctcatcggca 19680 agagcgccgt caccagcgtc acccagaaaa agttcctctg cgacagggtc atgtggcgca 19740 tccccttctc cagcaacttc atgtccatgg gcgcgctcac cgacctcggc cagaacatgc 19800 tctatgccaa ctccgcccac gcgctagaca tgaatttcga agtcgacccc atggatgagt 19860 ccacccttct ctatgttgtc ttcgaagtct tcgacgtcgt ccgagtgcac cagccccacc 19920 gcggcgtcat cgaggccgtc tacctgcgca cccccttctc ggccggtaac gccaccacct 19980 aagctcttgc ttcttgcaag ccatggccgc gggctccggc gagcaggagc tcagggccat 20040 catccgcgac ctgggctgcg ggccctactt cctgggcacc ttcgataagc gcttcccggg 20100 attcatggcc ccgcacaagc tggcctgcgc catcgtcaac acggccggcc gcgagaccgg 20160 gggcgagcac tggctggcct tcgcctggaa cccgcgctcg aacacctgct acctcttcga 20220 ccccttcggg ttctcggacg agcgcctcaa gcagatctac cagttcgagt acgagggcct 20280 gctgcgccgc agcgccctgg ccaccgagga ccgctgcgtc accctggaaa agtccaccca 20340 gaccgtgcag ggtccgcgct cggccgcctg cgggctcttc tgctgcatgt tcctgcacgc 20400 cttcgtgcac tggcccgacc gccccatgga caagaacccc accatgaact tgctgacggg 20460 ggtgcccaac ggcatgctcc agtcgcccca ggtggaaccc accctgcgcc gcaaccagga 20520 ggcgctctac cgcttcctca actcccactc cgcctacttt cgctcccacc gcgcgcgcat 20580 cgagaaggcc accgccttcg accgcatgaa tcaagacatg taaaccgtgt gtgtatgtta 20640 aatgtcttta ataaacagca ctttcatgtt acacatgcat ctgagatgat ttatttagaa 20700 atcgaaaggg ttctgccggg tctcggcatg gcccgcgggc agggacacgt tgcggaactg 20760 gtacttggcc agccacttga actcggggat cagcagtttg ggcagcgggg tgtcggggaa 20820 ggagtcggtc cacagcttcc gcgtcagttg cagggcgccc agcaggtcgg gcgcggagat 20880 cttgaaatcg cagttgggac ccgcgttctg cgcgcgggag ttgcggtaca cggggttgca 20940 gcactggaac accatcaggg ccgggtgctt cacgctcgcc agcaccgtcg cgtcggtgat 21000 gctctccacg tcgaggtcct cggcgttggc catcccgaag ggggtcatct tgcaggtctg 21060 ccttcccatg gtgggcacgc acccgggctt gtggttgcaa tcgcagtgca gggggatcag 21120 catcatctgg gcctggtcgg cgttcatccc cgggtacatg gccttcatga aagcctccaa 21180 ttgcctgaac gcctgctggg ccttggctcc ctcggtgaag aagaccccgc aggacttgct 21240 agagaactgg ttggtggcgc acccggcgtc gtgcacgcag cagcgcgcgt cgttgttggc 21300 cagctgcacc acgctgcgcc cccagcggtt ctgggtgatc ttggcccggt cggggttctc 21360 cttcagcgcg cgctgcccgt tctcgctcgc cacatccatc tcgatcatgt gctccttctg 21420 gatcatggtg gtcccgtgca ggcaccgcag cttgccctcg gcctcggtgc acccgtgcag 21480 ccacagcgcg cacccggtgc actcccagtt cttgtgggcg atctgggaat gcgcgtgcac 21540 gaagccctgc aggaagcggc ccatcatggt ggtcagggtc ttgttgctag tgaaggtcag 21600 cggaatgccg cggtgctcct cgttgatgta caggtggcag atgcggcggt acacctcgcc 21660 ctgctcgggc atcagctgga agttggcttt caggtcggtc tccacgcggt agcggtccat 21720 cagcatagtc atgatttcca tacccttctc ccaggccgag acgatgggca ggctcatagg 21780 gttcttcacc atcatcttag cgctagcagc cgcggccagg gggtcgctct cgtccagggt 21840 ctcaaagctc cgcttgccgt ccttctcggt gatccgcacc ggggggtagc tgaagcccac 21900 ggccgccagc tcctcctcgg cctgtctttc gtcctcgctg tcctggctga cgtcctgcag 21960 gaccacatgc ttggtcttgc ggggtttctt cttgggcggc agcggcggcg gagatgttgg 22020 agatggcgag ggggagcgcg agttctcgct caccactact atctcttcct cttcttggtc 22080 cgaggccacg cggcggtagg tatgtctctt cgggggcaga ggcggaggcg acgggctctc 22140 gccgccgcga cttggcggat ggctggcaga gccccttccg cgttcggggg tgcgctcccg 22200 gcggcgctct gactgacttc ctccgcggcc ggccattgtg ttctcctagg gaggaacaac 22260 aagcatggag actcagccat cgccaacctc gccatctgcc cccaccgccg acgagaagca 22320 gcagcagcag aatgaaagct taaccgcccc gccgcccagc cccgccacct ccgacgcggc 22380 cgtcccagac atgcaagaga tggaggaatc catcgagatt gacctgggct atgtgacgcc 22440 cgcggagcac gaggaggagc tggcagtgcg cttttcacaa gaagagatac accaagaaca 22500 gccagagcag gaagcagaga atgagcagag tcaggctggg ctcgagcatg acggcgacta 22560 cctccacctg agcggggggg aggacgcgct catcaagcat ctggcccggc aggccaccat 22620 cgtcaaggat gcgctgctcg accgcaccga ggtgcccctc agcgtggagg agctcagccg 22680 cgcctacgag ttgaacctct tctcgccgcg cgtgcccccc aagcgccagc ccaatggcac 22740 ctgcgagccc aacccgcgcc tcaacttcta cccggtcttc gcggtgcccg aggccctggc 22800 cacctaccac atctttttca agaaccaaaa gatccccgtc tcctgccgcg ccaaccgcac 22860 ccgcgccgac gcccttttca acctgggtcc cggcgcccgc ctacctgata tcgcctcctt 22920 ggaagaggtt cccaagatct tcgagggtct gggcagcgac gagactcggg ccgcgaacgc 22980 tctgcaagga gaaggaggag agcatgagca ccacagcgcc ctggtcgagt tggaaggcga 23040 caacgcgcgg ctggcggtgc tcaaacgcac ggtcgagctg acccatttcg cctacccggc 23100 tctgaacctg ccccccaaag tcatgagcgc ggtcatggac caggtgctca tcaagcgcgc 23160 gtcgcccatc tccgaggacg agggcatgca agactccgag gagggcaagc ccgtggtcag 23220 cgacgagcag ctggcccggt ggctgggtcc taatgctagt ccccagagtt tggaagagcg 23280 gcgcaaactc atgatggccg tggtcctggt gaccgtggag ctggagtgcc tgcgccgctt 23340 cttcgccgac gcggagaccc tgcgcaaggt cgaggagaac ctgcactacc tcttcaggca 23400 cgggttcgtg cgccaggcct gcaagatctc caacgtggag ctgaccaacc tggtctccta 23460 catgggcatc ttgcacgaga accgcctggg gcagaacgtg ctgcacacca ccctgcgcgg 23520 ggaggcccgg cgcgactaca tccgcgactg cgtctacctc tacctctgcc acacctggca 23580 gacgggcatg ggcgtgtggc agcagtgtct ggaggagcag aacctgaaag agctctgcaa 23640 gctcctgcag aagaacctca agggtctgtg gaccgggttc gacgagcgca ccaccgcctc 23700 ggacctggcc gacctcattt tccccgagcg cctcaggctg acgctgcgca acggcctgcc 23760 cgactttatg agccaaagca tgttgcaaaa ctttcgctct ttcatcctcg aacgctccgg 23820 aatcctgccc gccacctgct ccgcgctgcc ctcggacttc gtgccgctga ccttccgcga 23880 gtgccccccg ccgctgtgga gccactgcta cctgctgcgc ctggccaact acctggccta 23940 ccactcggac gtgatcgagg acgtcagcgg cgagggcctg ctcgagtgcc actgccgctg 24000 caacctctgc acgccgcacc gctccctggc ctgcaacccc cagctgctga gcgagaccca 24060 gatcatcggc accttcgagt tgcaagggcc cagcgaaggc gagggttcag ccgccaaggg 24120 gggtctgaaa ctcaccccgg ggctgtggac ctcggcctac ttgcgcaagt tcgtgcccga 24180 ggactaccat cccttcgaga tcaggttcta cgaggaccaa tcccatccgc ccaaggccga 24240 gctgtcggcc tgcgtcatca cccagggggc gatcctggcc caattgcaag ccatccagaa 24300 atcccgccaa gaattcttgc tgaaaaaggg ccgcggggtc tacctcgacc cccagaccgg 24360 tgaggagctc aaccccggct tcccccagga tgccccgagg aaacaagaag ctgaaagtgg 24420 agctgccgcc cgtggaggat ttggaggaag actgggagaa cagcagtcag gcagaggagg 24480 aggagatgga ggaagactgg gacagcactc aggcagagga ggacagcctg caagacagtc 24540 tggaggaaga cgaggaggag gcagaggagg aggtggaaga agcagccgcc gccagaccgt 24600 cgtcctcggc gggggagaaa gcaagcagca cggataccat ctccgctccg ggtcggggtc 24660 ccgctcgacc acacagtaga tgggacgaga ccggacgatt cccgaacccc accacccaga 24720 ccggtaagaa ggagcggcag ggatacaagt cctggcgggg gcacaaaaac gccatcgtct 24780 cctgcttgca ggcctgcggg ggcaacatct ccttcacccg gcgctacctg ctcttccacc 24840 gcggggtgaa ctttccccgc aacatcttgc attactaccg tcacctccac agcccctact 24900 acttccaaga agaggcagca gcagcagaaa aagaccagca gaaaaccagc agctagaaaa 24960 tccacagcgg cggcagcagg tggactgagg atcgcggcga acgagccggc gcaaacccgg 25020 gagctgagga accggatctt tcccaccctc tatgccatct tccagcagag tcgggggcag 25080 gagcaggaac tgaaagtcaa gaaccgttct ctgcgctcgc tcacccgcag ttgtctgtat 25140 cacaagagcg aagaccaact tcagcgcact ctcgaggacg ccgaggctct cttcaacaag 25200 tactgcgcgc tcactcttaa agagtagccc gcgcccgccc agtcgcagaa aaaggcggga 25260 attacgtcac ctgtgccctt cgccctagcc gcctccaccc atcatcatga gcaaagagat 25320 tcccacgcct tacatgtgga gctaccagcc ccagatgggc ctggccgccg gtgccgccca 25380 ggactactcc acccgcatga attggctcag cgccgggccc gcgatgatct cacgggtgaa 25440 tgacatccgc gcccaccgaa accagatact cctagaacag tcagcgctca ccgccacgcc 25500 ccgcaatcac ctcaatccgc gtaattggcc cgccgccctg gtgtaccagg aaattcccca 25560 gcccacgacc gtactacttc cgcgagacgc ccaggccgaa gtccagctga ctaactcagg 25620 tgtccagctg gcgggcggcg ccaccctgtg tcgtcaccgc cccgctcagg gtataaagcg 25680 gctggtgatc cggggcagag gcacacagct caacgacgag gtggtgagct cttcgctggg 25740 tctgcgacct gacggagtct tccaactcgc cggatcgggg agatcttcct tcacgcctcg 25800 tcaggccgtc ctgactttgg agagttcgtc ctcgcagccc cgctcgggtg gcatcggcac 25860 tctccagttc gtggaggagt tcactccctc ggtctacttc aaccccttct ccggctcccc 25920 cggccactac ccggacgagt tcatcccgaa cttcgacgcc atcagcgagt cggtggacgg 25980 ctacgattga atgtcccatg gtggcgcagc tgacctagct cggcttcgac acctggacca 26040 ctgccgccgc ttccgctgct tcgctcggga tctcgccgag tttgcctact ttgagctgcc 26100 cgaggagcac cctcagggcc cggcccacgg agtgcggatc gtcgtcgaag ggggcctcga 26160 ctcccacctg cttcggatct tcagccagcg tccgatcctg gtcgagcgcg agcaaggaca 26220 gacccttctg actctgtact gcatctgcaa ccaccccggc ctgcatgaaa gtctttgttg 26280 tctgctgtgt actgagtata ataaaagctg agatcagcga ctactccgga cttccgtgtg 26340 ttcctgaatc catcaaccag tctttgttct tcaccgggaa cgagaccgag ctccagctcc 26400 agtgtaagcc ccacaagaag tacctcacct ggctgttcca gggctccccg atcgccgttg 26460 tcaaccactg cgacaacgac ggagtcctgc tgagcggccc tgccaacctt actttttcca 26520 cccgcagaag caagctccag ctcttccaac ccttcctccc cgggacctat cagtgcgtct 26580 cgggaccctg ccatcacacc ttccacctga tcccgaatac cacagcgtcg ctccccgcta 26640 ctaacaacca aactaacctc caccaacgcc accgtcgcga cggccacaat acatgcccat 26700 attagactat gaggccgagc cacagcgacc catgctcccc gctattagtt acttcaatct 26760 aaccggcgga gatgactgac ccactggcca acaacaacgt caacgacctt ctcctggaca 26820 tggacggccg cgcctcggag cagcgactcg cccaacttcg cattcgccag cagcaggaga 26880 gagccgtcaa ggagctgcag gatgcggtgg ccatccacca gtgcaagaga ggcatcttct 26940 gcctggtgaa acaggccaag atctcctacg aggtcactcc aaacgaccat cgcctctcct 27000 acgagctcct gcagcagcgc cagaagttca cctgcctggt cggagtcaac cccatcgtca 27060 tcacccagca gtctggcgat accaaggggt gcatccactg ctcctgcgac tcccccgact 27120 gcgtccacac tctgatcaag accctctgcg gcctccgcga cctcctcccc atgaactaat 27180 caccccctta tccagtgaaa taaagatcat attgatgatg attttacaga aataaaaaat 27240 aatcatttga tttgaaataa agatacaatc atattgatga tttgagttta acaaaaaaat 27300 aaagaatcac ttacttgaaa tctgatacca ggtctctgtc catgttttct gccaacacca 27360 cttcactccc ctcttcccag ctctggtact gcaggccccg gcgggctgca aacttcctcc 27420 acacgctgaa ggggatgtca aattcctcct gtccctcaat cttcatttta tcttctatca 27480 gatgtccaaa aagcgcgtcc gggtggatga tgacttcgac cccgtctacc cctacgatgc 27540 agacaacgca ccgaccgtgc ccttcatcaa cccccccttc gtctcttcag atggattcca 27600 agagaagccc ctgggggtgt tgtccctgcg actggccgac cccgtcacca ccaagaacgg 27660 ggaaatcacc ctcaagctgg gagagggggt ggacctcgat tcctcgggaa aactcatctc 27720 caacacggcc accaaggccg ccgcccctct cagtttttcc aacaacacca tttcccttaa 27780 catggatcac cccttttaca ctaaagatgg aaaattatcc ttacaagttt ctccaccatt 27840 aaatatactg agaacaagca ttctaaacac actagcttta ggttttggat caggtttagg 27900 actccgtggc tctgccttgg cagtacagtt agtctctcca cttacatttg atactgatgg 27960 aaacataaag cttaccttag acagaggttt gcatgttaca acaggagatg caattgaaag 28020 caacataagc tgggctaaag gtttaaaatt tgaagatgga gccatagcaa ccaacattgg 28080 aaatgggtta gagtttggaa gcagtagtac agaaacaggt gttgatgatg cttacccaat 28140 ccaagttaaa cttggatctg gccttagctt tgacagtaca ggagccataa tggctggtaa 28200 caaagaagac gataaactca ctttgtggac aacacctgat ccatcaccaa actgtcaaat 28260 actcgcagaa aatgatgcaa aactaacact ttgcttgact aaatgtggta gtcaaatact 28320 ggccactgtg tcagtcttag ttgtaggaag tggaaaccta aaccccatta ctggcaccgt 28380 aagcagtgct caggtgtttc tacgttttga tgcaaacggt gttcttttaa cagaacattc 28440 tacactaaaa aaatactggg ggtataggca gggagatagc atagatggca ctccatatac 28500 caatgctgta ggattcatgc ccaatttaaa agcttatcca aagtcacaaa gttctactac 28560 taaaaataat atagtagggc aagtatacat gaatggagat gtttcaaaac ctatgcttct 28620 cactataacc ctcaatggta ctgatgacag caacagtaca tattcaatgt cattttcata 28680 cacctggact aatggaagct atgttggagc aacatttggg gctaactctt ataccttctc 28740 atacatcgcc caagaatgaa cactgtatcc caccctgcat gccaaccctt cccaccccac 28800 tctgtggaac aaactctgaa acacaaaata aaataaagtt caagtgtttt attgattcaa 28860 cagttttaca ggattcgagc agttattttt cctccaccct cccaggacat ggaatacacc 28920 accctctccc cccgcacagc cttgaacatc tgaatgccat tggtgatgga catgcttttg 28980 gtctccacgt tccacacagt ttcagagcga gccagtctcg ggtcggtcag ggagatgaaa 29040 ccctccgggc actcccgcat ctgcacctca cagctcaaca gctgaggatt gtcctcggtg 29100 gtcgggatca cggttatctg gaagaagcag aagagcggcg gtgggaatca tagtccgcga 29160 acgggatcgg ccggtggtgt cgcatcaggc cccgcagcag tcgctgccgc cgccgctccg 29220 tcaagctgct gctcaggggg tccgggtcca gggactccct cagcatgatg cccacggccc 29280 tcagcatcag tcgtctggtg cggcgggcgc agcagcgcat gcggatctcg ctcaggtcgc 29340 tgcagtacgt gcaacacaga accaccaggt tgttcaacag tccatagttc aacacgctcc 29400 agccgaaact catcgcggga aggatgctac ccacgtggcc gtcgtaccag atcctcaggt 29460 aaatcaagtg gtgccccctc cagaacacgc tgcccacgta catgatctcc ttgggcatgt 29520 ggcggttcac cacctcccgg taccacatca ccctctggtt gaacatgcag ccccggatga 29580 tcctgcggaa ccacagggcc agcaccgccc cgcccgccat gcagcgaaga gaccccgggt 29640 cccggcaatg gcaatggagg acccaccgct cgtacccgtg gatcatctgg gagctgaaca 29700 agtctatgtt ggcacagcac aggcatatgc tcatgcatct cttcagcact ctcaactcct 29760 cgggggtcaa aaccatatcc cagggcacgg ggaactcttg caggacagcg aaccccgcag 29820 aacagggcaa tcctcgcaca gaacttacat tgtgcatgga cagggtatcg caatcaggca 29880 gcaccgggtg atcctccacc agagaagcgc gggtctcggt ctcctcacag cgtggtaagg 29940 gggccggccg atacgggtga tggcgggacg cggctgatcg tgttcgcgac cgtgtcatga 30000 tgcagttgct ttcggacatt ttcgtacttg ctgtagcaga acctggtccg ggcgctgcac 30060 accgatcgcc ggcggcggtc tcggcgcttg gaacgctcgg tgttgaaatt gtaaaacagc 30120 cactctctca gaccgtgcag cagatctagg gcctcaggag tgatgaagat cccatcatgc 30180 ctgatggctc tgatcacatc gaccaccgtg gaatgggcca gacccagcca gatgatgcaa 30240 ttttgttggg tttcggtgac ggcgggggag ggaagaacag gaagaaccat gattaacttt 30300 taatccaaac ggtctcggag tacttcaaaa tgaagatcgc ggagatggca cctctcgccc 30360 ccgctgtgtt ggtggaaaat aacagccagg tcaaaggtga tacggttctc gagatgttcc 30420 acggtggctt ccagcaaagc ctccacgcgc acatccagaa acaagacaat agcgaaagcg 30480 ggagggttct ctaattcctc aatcatcatg ttacactcct gcaccatccc cagataattt 30540 tcatttttcc agccttgaat gattcgaact agttcgtgag gtaaatccaa gccagccatg 30600 ataaagagct cgcgcagagc gccctccacc ggcattctta agcacaccct cataattcca 30660 agatattctg ctcctggttc acctgcagca gattgacaag cggaatatca aaatctctgc 30720 cgcgatccct gagctcctcc ctcagcaata actgtaagta ctctttcata tcctctccga 30780 aatttttagc cataggacca ccaggaataa gattagggca agccacagta cagataaacc 30840 gaagtcctcc ccagtgagca ttgccaaatg caagactgct ataagcatgc tggctagacc 30900 cggtgatatc ttccagataa ctggacagaa aatcgcccag gcaattttta agaaaatcaa 30960 caaaagaaaa atcctccagg tggacgttta gagcctcggg aacaacgatg aagtaaatgc 31020 aagcggtgcg ttccagcatg gttagttagc tgatctgtag aaaaaacaaa aatgaacatt 31080 aaaccatgct agcctggcga acaggtgggt aaatcgttct ctccagcacc aggcaggcca 31140 cggggtctcc ggcgcgaccc tcgtaaaaat tgtcgctatg attgaaaacc atcacagaga 31200 gacgttcccg gtggccggcg tgaatgattc gacaagatga atacaccccc ggaacattgg 31260 cgtccgcgag tgaaaaaaag cgcccgagga agcaataagg cactacaatg ctcagtctca 31320 agtccagcaa agcgatgcca tgcggatgaa gcacaaaatt ctcaggtgcg tacaaaatgt 31380 aattactccc ctcctgcaca ggcagcaaag cccccgatcc ctccaggtac acatacaaag 31440 cctcagcgtc catagcttac cgagcagcag cacacaacag gcgcaagagt cagagaaagg 31500 ctgagctcta acctgtccac ccgctctctg ctcaatatat agcccagatc tacactgacg 31560 taaaggccaa agtctaaaaa tacccgccaa ataatcacac acgcccagca cacgcccaga 31620 aaccggtgac acactcaaaa aaatacgcgc acttcctcaa acgcccaaaa ctgccgtcat 31680 ttccgggttc ccacgctacg tcatcaaaac acgactttca aattccgtcg accgttaaaa 31740 acgtcacccg ccccgcccct aacggtcgcc cgtctctcag ccaatcagcg ccccgcatcc 31800 ccaaattcaa acacctcatt tgcatattaa cgcgcacaaa aagtttgagg tatattattg 31860 atgatgg 31867 <210> 12 <211> 32788 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 12 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600 gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840 atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900 atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960 tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200 cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260 ccgggatgtt ccaggcactg tccgaaggct gcacacccta tgatattaac cagatgctga 1320 atgtcctggg agaccaccag gtctctggcc tggagcagct ggagagcatc atcaacttcg 1380 agaagctgac cgagtggaca agctccaatg tgatgcctat cctgtcccca ctgaccaagg 1440 gcatcctggg cttcgtgttt accctgacag tgccttctga gcggggcctg tcttgcatca 1500 gcgaggcaga cgcaaccaca ccagagtccg ccaatctggg cgaggagatc ctgtctcagc 1560 tgtacctgtg gccccgggtg acatatcact ccccttctta cgcctatcac cagttcgagc 1620 ggagagccaa gtacaagaga cacttcccag gctttggcca gtctctgctg ttcggctacc 1680 ccgtgtacgt gttcggcgat tgcgtgcagg gcgactggga tgccatccgg tttagatact 1740 gcgcaccacc tggatatgca ctgctgaggt gtaacgacac caattattcc gccctgctgg 1800 cagtgggcgc cctggagggc cctcgcaatc aggattggct gggcgtgcca aggcagctgg 1860 tgacacgcat gcaggccatc cagaacgcag gcctgtgcac cctggtggca atgctggagg 1920 agacaatctt ctggctgcag gcctttctga tggccctgac cgacagcggc cccaagacaa 1980 acatcatcgt ggattcccag tacgtgatgg gcatctccaa gccttctttc caggagtttg 2040 tggactggga gaacgtgagc ccagagctga attccaccga tcagccattc tggcaggcag 2100 gaatcctggc aaggaacctg gtgcctatgg tggccacagt gcagggccag aatctgaagt 2160 accagggcca gagcctggtc atcagcgcct ccatcatcgt gtttaacctg ctggagctgg 2220 agggcgacta tcgggacgat ggcaacgtgt gggtgcacac cccactgagc cccagaacac 2280 tgaacgcctg ggtgaaggcc gtggaggaga agaagggcat cccagtgcac ctggagctgg 2340 cctccatgac caatatggag ctgatgtcta gcatcgtgca ccagcaggtg aggacatacg 2400 gacccgtgtt catgtgcctg ggaggcctgc tgaccatggt ggcaggagcc gtgtggctga 2460 cagtgcgggt gctggagctg ttcagagccg cccagctggc caacgatgtg gtgctgcaga 2520 tcatggagct gtgcggagca gcctttcgcc aggtgtgcca caccacagtg ccatggccca 2580 atgcctccct gacccccaag tggaacaatg agacaacaca gcctcagatc gccaactgta 2640 gcgtgtacga cttcttcgtg tggctgcact actatagcgt gagggatacc ctgtggcccc 2700 gcgtgacata ccacatgaat aagtacgcct atcacatgct ggagaggcgc gccaagtata 2760 agagaggccc tggcccaggc gcaaagtttg tggcagcatg gaccctgaag gccgccgccg 2820 gccccggccc cggccagtat atcaaggcta acagtaagtt cattggaatc acagagctgg 2880 gacccggacc tggataatga gtttaaactc ccatttaaat gtgagggtta atgcttcgag 2940 cagacatgat aagatacatt gatgagtttg gacaaaccac aactagaatg cagtgaaaaa 3000 aatgctttat ttgtgaaatt tgtgatgcta ttgctttatt tgtaaccatt ataagctgca 3060 ataaacaagt taacaacaac aattgcattc attttatgtt tcaggttcag ggggagatgt 3120 gggaggtttt ttaaagcaag taaaacctct acaaatgtgg taaaataact ataacggtcc 3180 taaggtagcg agtgagtagt gttctggggc gggggaggac ctgcatgagg gccagaataa 3240 ctgaaatctg tgcttttctg tgtgttgcag cagcatgagc ggaagcggct cctttgaggg 3300 aggggtattc agcccttatc tgacggggcg tctcccctcc tgggcgggag tgcgtcagaa 3360 tgtgatggga tccacggtgg acggccggcc cgtgcagccc gcgaactctt caaccctgac 3420 ctatgcaacc ctgagctctt cgtcgttgga cgcagctgcc gccgcagctg ctgcatctgc 3480 cgccagcgcc gtgcgcggaa tggccatggg cgccggctac tacggcactc tggtggccaa 3540 ctcgagttcc accaataatc ccgccagcct gaacgaggag aagctgttgc tgctgatggc 3600 ccagctcgag gccttgaccc agcgcctggg cgagctgacc cagcaggtgg ctcagctgca 3660 ggagcagacg cgggccgcgg ttgccacggt gaaatccaaa taaaaaatga atcaataaat 3720 aaacggagac ggttgttgat tttaacacag agtctgaatc tttatttgat ttttcgcgcg 3780 cggtaggccc tggaccaccg gtctcgatca ttgagcaccc ggtggatctt ttccaggacc 3840 cggtagaggt gggcttggat gttgaggtac atgggcatga gcccgtcccg ggggtggagg 3900 tagctccatt gcagggcctc gtgctcgggg gtggtgttgt aaatcaccca gtcatagcag 3960 gggcgcaggg catggtgttg cacaatatct ttgaggagga gactgatggc cacgggcagc 4020 cctttggtgt aggtgtttac aaatctgttg agctgggagg gatgcatgcg gggggagatg 4080 aggtgcatct tggcctggat cttgagattg gcgatgttac cgcccagatc ccgcctgggg 4140 ttcatgttgt gcaggaccac cagcacggtg tatccggtgc acttggggaa tttatcatgc 4200 aacttggaag ggaaggcgtg aaagaatttg gcgacgcctt tgtgcccgcc caggttttcc 4260 atgcactcat ccatgatgat ggcgatgggc ccgtgggcgg cggcctgggc aaagacgttt 4320 cgggggtcgg acacatcata gttgtggtcc tgggtgaggt catcataggc cattttaatg 4380 aatttggggc ggagggtgcc ggactggggg acaaaggtac cctcgatccc gggggcgtag 4440 ttcccctcac agatctgcat ctcccaggct ttgagctcgg agggggggat catgtccacc 4500 tgcggggcga taaagaacac ggtttccggg gcgggggaga tgagctgggc cgaaagcaag 4560 ttccggagca gctgggactt gccgcagccg gtggggccgt agatgacccc gatgaccggc 4620 tgcaggtggt agttgaggga gagacagctg ccgtcctccc ggaggagggg ggccacctcg 4680 ttcatcatct cgcgcacgtg catgttctcg cgcaccagtt ccgccaggag gcgctctccc 4740 cccagggata ggagctcctg gagcgaggcg aagtttttca gcggcttgag tccgtcggcc 4800 atgggcattt tggagagggt ttgttgcaag agttccaggc ggtcccagag ctcggtgatg 4860 tgctctacgg catctcgatc cagcagacct cctcgtttcg cgggttggga cggctgcggg 4920 agtagggcac cagacgatgg gcgtccagcg cagccagggt ccggtccttc cagggtcgca 4980 gcgtccgcgt cagggtggtc tccgtcacgg tgaaggggtg cgcgccgggc tgggcgcttg 5040 cgagggtgcg cttcaggctc atccggctgg tcgaaaaccg ctcccgatcg gcgccctgcg 5100 cgtcggccag gtagcaattg accatgagtt cgtagttgag cgcctcggcc gcgtggcctt 5160 tggcgcggag cttacctttg gaagtctgcc cgcaggcggg acagaggagg gacttgaggg 5220 cgtagagctt gggggcgagg aagacggact cgggggcgta ggcgtccgcg ccgcagtggg 5280 cgcagacggt ctcgcactcc acgagccagg tgaggtcggg ctggtcgggg tcaaaaacca 5340 gtttcccgcc gttctttttg atgcgtttct tacctttggt ctccatgagc tcgtgtcccc 5400 gctgggtgac aaagaggctg tccgtgtccc cgtagaccga ctttatgggc cggtcctcga 5460 gcggtgtgcc gcggtcctcc tcgtagagga accccgccca ctccgagacg aaagcccggg 5520 tccaggccag cacgaaggag gccacgtggg acgggtagcg gtcgttgtcc accagcgggt 5580 ccaccttttc cagggtatgc aaacacatgt ccccctcgtc cacatccagg aaggtgattg 5640 gcttgtaagt gtaggccacg tgaccggggg tcccggccgg gggggtataa aagggtgcgg 5700 gtccctgctc gtcctcactg tcttccggat cgctgtccag gagcgccagc tgttggggta 5760 ggtattccct ctcgaaggcg ggcatgacct cggcactcag gttgtcagtt tctagaaacg 5820 aggaggattt gatattgacg gtgccggcgg agatgccttt caagagcccc tcgtccatct 5880 ggtcagaaaa gacgatcttt ttgttgtcga gcttggtggc gaaggagccg tagagggcgt 5940 tggagaggag cttggcgatg gagcgcatgg tctggttttt ttccttgtcg gcgcgctcct 6000 tggcggcgat gttgagctgc acgtactcgc gcgccacgca cttccattcg gggaagacgg 6060 tggtcagctc gtcgggcacg attctgacct gccagccccg attatgcagg gtgatgaggt 6120 ccacactggt ggccacctcg ccgcgcaggg gctcattagt ccagcagagg cgtccgccct 6180 tgcgcgagca gaaggggggc agggggtcca gcatgacctc gtcggggggg tcggcatcga 6240 tggtgaagat gccgggcagg aggtcggggt caaagtagct gatggaagtg gccagatcgt 6300 ccagggcagc ttgccattcg cgcacggcca gcgcgctctc gtagggactg aggggcgtgc 6360 cccagggcat gggatgggta agcgcggagg cgtacatgcc gcagatgtcg tagacgtaga 6420 ggggctcctc gaggatgccg atgtaggtgg ggtagcagcg ccccccgcgg atgctggcgc 6480 gcacgtagtc atacagctcg tgcgaggggg cgaggagccc cgggcccagg ttggtgcgac 6540 tgggcttttc ggcgcggtag acgatctggc ggaaaatggc atgcgagttg gaggagatgg 6600 tgggcctttg gaagatgttg aagtgggcgt ggggcagtcc gaccgagtcg cggatgaagt 6660 gggcgtagga gtcttgcagc ttggcgacga gctcggcggt gactaggacg tccagagcgc 6720 agtagtcgag ggtctcctgg atgatgtcat acttgagctg tcccttttgt ttccacagct 6780 cgcggttgag aaggaactct tcgcggtcct tccagtactc ttcgaggggg aacccgtcct 6840 gatctgcacg gtaagagcct agcatgtaga actggttgac ggccttgtag gcgcagcagc 6900 ccttctccac ggggagggcg taggcctggg cggccttgcg cagggaggtg tgcgtgaggg 6960 cgaaagtgtc cctgaccatg accttgagga actggtgctt gaagtcgata tcgtcgcagc 7020 ccccctgctc ccagagctgg aagtccgtgc gcttcttgta ggcggggttg ggcaaagcga 7080 aagtaacatc gttgaagagg atcttgcccg cgcggggcat aaagttgcga gtgatgcgga 7140 aaggttgggg cacctcggcc cggttgttga tgacctgggc ggcgagcacg atctcgtcga 7200 agccgttgat gttgtggccc acgatgtaga gttccacgaa tcgcggacgg cccttgacgt 7260 ggggcagttt cttgagctcc tcgtaggtga gctcgtcggg gtcgctgagc ccgtgctgct 7320 cgagcgccca gtcggcgaga tgggggttgg cgcggaggaa ggaagtccag agatccacgg 7380 ccagggcggt ttgcagacgg tcccggtact gacggaactg ctgcccgacg gccatttttt 7440 cgggggtgac gcagtagaag gtgcgggggt ccccgtgcca gcgatcccat ttgagctgga 7500 gggcgagatc gagggcgagc tcgacgagcc ggtcgtcccc ggagagtttc atgaccagca 7560 tgaaggggac gagctgcttg ccgaaggacc ccatccaggt gtaggtttcc acatcgtagg 7620 tgaggaagag cctttcggtg cgaggatgcg agccgatggg gaagaactgg atctcctgcc 7680 accaattgga ggaatggctg ttgatgtgat ggaagtagaa atgccgacgg cgcgccgaac 7740 actcgtgctt gtgtttatac aagcggccac agtgctcgca acgctgcacg ggatgcacgt 7800 gctgcacgag ctgtacctga gttcctttga cgaggaattt cagtgggaag tggagtcgtg 7860 gcgcctgcat ctcgtgctgt actacgtcgt ggtggtcggc ctggccctct tctgcctcga 7920 tggtggtcat gctgacgagc ccgcgcggga ggcaggtcca gacctcggcg cgagcgggtc 7980 ggagagcgag gacgagggcg cgcaggccgg agctgtccag ggtcctgaga cgctgcggag 8040 tcaggtcagt gggcagcggc ggcgcgcggt tgacttgcag gagtttttcc agggcgcgcg 8100 ggaggtccag atggtacttg atctccaccg cgccattggt ggcgacgtcg atggcttgca 8160 gggtcccgtg cccctggggt gtgaccaccg tcccccgttt cttcttgggc ggctggggcg 8220 acgggggcgg tgcctcttcc atggttagaa gcggcggcga ggacgcgcgc cgggcggcag 8280 gggcggctcg gggcccggag gcaggggcgg caggggcacg tcggcgccgc gcgcgggtag 8340 gttctggtac tgcgcccgga gaagactggc gtgagcgacg acgcgacggt tgacgtcctg 8400 gatctgacgc ctctgggtga aggccacggg acccgtgagt ttgaacctga aagagagttc 8460 gacagaatca atctcggtat cgttgacggc ggcctgccgc aggatctctt gcacgtcgcc 8520 cgagttgtcc tggtaggcga tctcggtcat gaactgctcg atctcctcct cttgaaggtc 8580 tccgcggccg gcgcgctcca cggtggccgc gaggtcgttg gagatgcggc ccatgagctg 8640 cgagaaggcg ttcatgcccg cctcgttcca gacgcggctg tagaccacga cgccctcggg 8700 atcgcgggcg cgcatgacca cctgggcgag gttgagctcc acgtggcgcg tgaagaccgc 8760 gtagttgcag aggcgctggt agaggtagtt gagcgtggtg gcgatgtgct cggtgacgaa 8820 gaaatacatg atccagcggc ggagcggcat ctcgctgacg tcgcccagcg cctccaaacg 8880 ttccatggcc tcgtaaaagt ccacggcgaa gttgaaaaac tgggagttgc gcgccgagac 8940 ggtcaactcc tcctccagaa gacggatgag ctcggcgatg gtggcgcgca cctcgcgctc 9000 gaaggccccc gggagttcct ccacttcctc ttcttcctcc tccactaaca tctcttctac 9060 ttcctcctca ggcggcagtg gtggcggggg agggggcctg cgtcgccggc ggcgcacggg 9120 cagacggtcg atgaagcgct cgatggtctc gccgcgccgg cgtcgcatgg tctcggtgac 9180 ggcgcgcccg tcctcgcggg gccgcagcgt gaagacgccg ccgcgcatct ccaggtggcc 9240 gggggggtcc ccgttgggca gggagagggc gctgacgatg catcttatca attgccccgt 9300 agggactccg cgcaaggacc tgagcgtctc gagatccacg ggatctgaaa accgctgaac 9360 gaaggcttcg agccagtcgc agtcgcaagg taggctgagc acggtttctt ctggcgggtc 9420 atgttggttg ggagcggggc gggcgatgct gctggtgatg aagttgaaat aggcggttct 9480 gagacggcgg atggtggcga ggagcaccag gtctttgggc ccggcttgct ggatgcgcag 9540 acggtcggcc atgccccagg cgtggtcctg acacctggcc aggtccttgt agtagtcctg 9600 catgagccgc tccacgggca cctcctcctc gcccgcgcgg ccgtgcatgc gcgtgagccc 9660 gaagccgcgc tggggctgga cgagcgccag gtcggcgacg acgcgctcgg cgaggatggc 9720 ttgctggatc tgggtgaggg tggtctggaa gtcatcaaag tcgacgaagc ggtggtaggc 9780 tccggtgttg atggtgtagg agcagttggc catgacggac cagttgacgg tctggtggcc 9840 cggacgcacg agctcgtggt acttgaggcg cgagtaggcg cgcgtgtcga agatgtagtc 9900 gttgcaggtg cgcaccaggt actggtagcc gatgaggaag tgcggcggcg gctggcggta 9960 gagcggccat cgctcggtgg cgggggcgcc gggcgcgagg tcctcgagca tggtgcggtg 10020 gtagccgtag atgtacctgg acatccaggt gatgccggcg gcggtggtgg aggcgcgcgg 10080 gaactcgcgg acgcggttcc agatgttgcg cagcggcagg aagtagttca tggtgggcac 10140 ggtctggccc gtgaggcgcg cgcagtcgtg gatgctctat acgggcaaaa acgaaagcgg 10200 tcagcggctc gactccgtgg cctggaggct aagcgaacgg gttgggctgc gcgtgtaccc 10260 cggttcgaat ctcgaatcag gctggagccg cagctaacgt ggtattggca ctcccgtctc 10320 gacccaagcc tgcaccaacc ctccaggata cggaggcggg tcgttttgca actttttttt 10380 ggaggccgga tgagactagt aagcgcggaa agcggccgac cgcgatggct cgctgccgta 10440 gtctggagaa gaatcgccag ggttgcgttg cggtgtgccc cggttcgagg ccggccggat 10500 tccgcggcta acgagggcgt ggctgccccg tcgtttccaa gaccccatag ccagccgact 10560 tctccagtta cggagcgagc ccctcttttg ttttgtttgt ttttgccaga tgcatcccgt 10620 actgcggcag atgcgccccc accaccctcc accgcaacaa cagccccctc cacagccggc 10680 gcttctgccc ccgccccagc agcaacttcc agccacgacc gccgcggccg ccgtgagcgg 10740 ggctggacag agttatgatc accagctggc cttggaagag ggcgaggggc tggcgcgcct 10800 gggggcgtcg tcgccggagc ggcacccgcg cgtgcagatg aaaagggacg ctcgcgaggc 10860 ctacgtgccc aagcagaacc tgttcagaga caggagcggc gaggagcccg aggagatgcg 10920 cgcggcccgg ttccacgcgg ggcgggagct gcggcgcggc ctggaccgaa agagggtgct 10980 gagggacgag gatttcgagg cggacgagct gacggggatc agccccgcgc gcgcgcacgt 11040 ggccgcggcc aacctggtca cggcgtacga gcagaccgtg aaggaggaga gcaacttcca 11100 aaaatccttc aacaaccacg tgcgcaccct gatcgcgcgc gaggaggtga ccctgggcct 11160 gatgcacctg tgggacctgc tggaggccat cgtgcagaac cccaccagca agccgctgac 11220 ggcgcagctg ttcctggtgg tgcagcatag tcgggacaac gaagcgttca gggaggcgct 11280 gctgaatatc accgagcccg agggccgctg gctcctggac ctggtgaaca ttctgcagag 11340 catcgtggtg caggagcgcg ggctgccgct gtccgagaag ctggcggcca tcaacttctc 11400 ggtgctgagt ttgggcaagt actacgctag gaagatctac aagaccccgt acgtgcccat 11460 agacaaggag gtgaagatcg acgggtttta catgcgcatg accctgaaag tgctgaccct 11520 gagcgacgat ctgggggtgt accgcaacga caggatgcac cgtgcggtga gcgccagcag 11580 gcggcgcgag ctgagcgacc aggagctgat gcatagtctg cagcgggccc tgaccggggc 11640 cgggaccgag ggggagagct actttgacat gggcgcggac ctgcactggc agcccagccg 11700 ccgggccttg gaggcggcgg caggacccta cgtagaagag gtggacgatg aggtggacga 11760 ggagggcgag tacctggaag actgatggcg cgaccgtatt tttgctagat gcaacaacaa 11820 cagccacctc ctgatcccgc gatgcgggcg gcgctgcaga gccagccgtc cggcattaac 11880 tcctcggacg attggaccca ggccatgcaa cgcatcatgg cgctgacgac ccgcaacccc 11940 gaagccttta gacagcagcc ccaggccaac cggctctcgg ccatcctgga ggccgtggtg 12000 ccctcgcgct ccaaccccac gcacgagaag gtcctggcca tcgtgaacgc gctggtggag 12060 aacaaggcca tccgcggcga cgaggccggc ctggtgtaca acgcgctgct ggagcgcgtg 12120 gcccgctaca acagcaccaa cgtgcagacc aacctggacc gcatggtgac cgacgtgcgc 12180 gaggccgtgg cccagcgcga gcggttccac cgcgagtcca acctgggatc catggtggcg 12240 ctgaacgcct tcctcagcac ccagcccgcc aacgtgcccc ggggccagga ggactacacc 12300 aacttcatca gcgccctgcg cctgatggtg accgaggtgc cccagagcga ggtgtaccag 12360 tccgggccgg actacttctt ccagaccagt cgccagggct tgcagaccgt gaacctgagc 12420 caggctttca agaacttgca gggcctgtgg ggcgtgcagg ccccggtcgg ggaccgcgcg 12480 acggtgtcga gcctgctgac gccgaactcg cgcctgctgc tgctgctggt ggcccccttc 12540 acggacagcg gcagcatcaa ccgcaactcg tacctgggct acctgattaa cctgtaccgc 12600 gaggccatcg gccaggcgca cgtggacgag cagacctacc aggagatcac ccacgtgagc 12660 cgcgccctgg gccaggacga cccgggcaac ctggaagcca ccctgaactt tttgctgacc 12720 aaccggtcgc agaagatccc gccccagtac gcgctcagca ccgaggagga gcgcatcctg 12780 cgttacgtgc agcagagcgt gggcctgttc ctgatgcagg agggggccac ccccagcgcc 12840 gcgctcgaca tgaccgcgcg caacatggag cccagcatgt acgccagcaa ccgcccgttc 12900 atcaataaac tgatggacta cttgcatcgg gcggccgcca tgaactctga ctatttcacc 12960 aacgccatcc tgaatcccca ctggctcccg ccgccggggt tctacacggg cgagtacgac 13020 atgcccgacc ccaatgacgg gttcctgtgg gacgatgtgg acagcagcgt gttctccccc 13080 cgaccgggtg ctaacgagcg ccccttgtgg aagaaggaag gcagcgaccg acgcccgtcc 13140 tcggcgctgt ccggccgcga gggtgctgcc gcggcggtgc ccgaggccgc cagtcctttc 13200 ccgagcttgc ccttctcgct gaacagtatc cgcagcagcg agctgggcag gatcacgcgc 13260 ccgcgcttgc tgggcgaaga ggagtacttg aatgactcgc tgttgagacc cgagcgggag 13320 aagaacttcc ccaataacgg gatagaaagc ctggtggaca agatgagccg ctggaagacg 13380 tatgcgcagg agcacaggga cgatccccgg gcgtcgcagg gggccacgag ccggggcagc 13440 gccgcccgta aacgccggtg gcacgacagg cagcggggac agatgtggga cgatgaggac 13500 tccgccgacg acagcagcgt gttggacttg ggtgggagtg gtaacccgtt cgctcacctg 13560 cgcccccgta tcgggcgcat gatgtaagag aaaccgaaaa taaatgatac tcaccaaggc 13620 catggcgacc agcgtgcgtt cgtttcttct ctgttgttgt tgtatctagt atgatgaggc 13680 gtgcgtaccc ggagggtcct cctccctcgt acgagagcgt gatgcagcag gcgatggcgg 13740 cggcggcgat gcagcccccg ctggaggctc cttacgtgcc cccgcggtac ctggcgccta 13800 cggaggggcg gaacagcatt cgttactcgg agctggcacc cttgtacgat accacccggt 13860 tgtacctggt ggacaacaag tcggcggaca tcgcctcgct gaactaccag aacgaccaca 13920 gcaacttcct gaccaccgtg gtgcagaaca atgacttcac ccccacggag gccagcaccc 13980 agaccatcaa ctttgacgag cgctcgcggt ggggcggcca gctgaaaacc atcatgcaca 14040 ccaacatgcc caacgtgaac gagttcatgt acagcaacaa gttcaaggcg cgggtgatgg 14100 tctcccgcaa gacccccaat ggggtgacag tgacagagga ttatgatggt agtcaggatg 14160 agctgaagta tgaatgggtg gaatttgagc tgcccgaagg caacttctcg gtgaccatga 14220 ccatcgacct gatgaacaac gccatcatcg acaattactt ggcggtgggg cggcagaacg 14280 gggtgctgga gagcgacatc ggcgtgaagt tcgacactag gaacttcagg ctgggctggg 14340 accccgtgac cgagctggtc atgcccgggg tgtacaccaa cgaggctttc catcccgata 14400 ttgtcttgct gcccggctgc ggggtggact tcaccgagag ccgcctcagc aacctgctgg 14460 gcattcgcaa gaggcagccc ttccaggaag gcttccagat catgtacgag gatctggagg 14520 ggggcaacat ccccgcgctc ctggatgtcg acgcctatga gaaaagcaag gaggatgcag 14580 cagctgaagc aactgcagcc gtagctaccg cctctaccga ggtcaggggc gataattttg 14640 caagcgccgc agcagtggca gcggccgagg cggctgaaac cgaaagtaag atagtcattc 14700 agccggtgga gaaggatagc aagaacagga gctacaacgt actaccggac aagataaaca 14760 ccgcctaccg cagctggtac ctagcctaca actatggcga ccccgagaag ggcgtgcgct 14820 cctggacgct gctcaccacc tcggacgtca cctgcggcgt ggagcaagtc tactggtcgc 14880 tgcccgacat gatgcaagac ccggtcacct tccgctccac gcgtcaagtt agcaactacc 14940 cggtggtggg cgccgagctc ctgcccgtct actccaagag cttcttcaac gagcaggccg 15000 tctactcgca gcagctgcgc gccttcacct cgcttacgca cgtcttcaac cgcttccccg 15060 agaaccagat cctcgtccgc ccgcccgcgc ccaccattac caccgtcagt gaaaacgttc 15120 ctgctctcac agatcacggg accctgccgc tgcgcagcag tatccgggga gtccagcgcg 15180 tgaccgttac tgacgccaga cgccgcacct gcccctacgt ctacaaggcc ctgggcatag 15240 tcgcgccgcg cgtcctctcg agccgcacct tctaaatgtc cattctcatc tcgcccagta 15300 ataacaccgg ttggggcctg cgcgcgccca gcaagatgta cggaggcgct cgccaacgct 15360 ccacgcaaca ccccgtgcgc gtgcgcgggc acttccgcgc tccctggggc gccctcaagg 15420 gccgcgtgcg gtcgcgcacc accgtcgacg acgtgatcga ccaggtggtg gccgacgcgc 15480 gcaactacac ccccgccgcc gcgcccgtct ccaccgtgga cgccgtcatc gacagcgtgg 15540 tggccgacgc gcgccggtac gcccgcgcca agagccggcg gcggcgcatc gcccggcggc 15600 accggagcac ccccgccatg cgcgcggcgc gagccttgct gcgcagggcc aggcgcacgg 15660 gacgcagggc catgctcagg gcggccagac gcgcggcttc aggcgccagc gccggcagga 15720 cccggagacg cgcggccacg gcggcggcag cggccatcgc cagcatgtcc cgcccgcggc 15780 gagggaacgt gtactgggtg cgcgacgccg ccaccggtgt gcgcgtgccc gtgcgcaccc 15840 gcccccctcg cacttgaaga tgttcacttc gcgatgttga tgtgtcccag cggcgaggag 15900 gatgtccaag cgcaaattca aggaagagat gctccaggtc atcgcgcctg agatctacgg 15960 ccctgcggtg gtgaaggagg aaagaaagcc ccgcaaaatc aagcgggtca aaaaggacaa 16020 aaaggaagaa gaaagtgatg tggacggatt ggtggagttt gtgcgcgagt tcgccccccg 16080 gcggcgcgtg cagtggcgcg ggcggaaggt gcaaccggtg ctgagacccg gcaccaccgt 16140 ggtcttcacg cccggcgagc gctccggcac cgcttccaag cgctcctacg acgaggtgta 16200 cggggatgat gatattctgg agcaggcggc cgagcgcctg ggcgagtttg cttacggcaa 16260 gcgcagccgt tccgcaccga aggaagaggc ggtgtccatc ccgctggacc acggcaaccc 16320 cacgccgagc ctcaagcccg tgaccttgca gcaggtgctg ccgaccgcgg cgccgcgccg 16380 ggggttcaag cgcgagggcg aggatctgta ccccaccatg cagctgatgg tgcccaagcg 16440 ccagaagctg gaagacgtgc tggagaccat gaaggtggac ccggacgtgc agcccgaggt 16500 caaggtgcgg cccatcaagc aggtggcccc gggcctgggc gtgcagaccg tggacatcaa 16560 gattcccacg gagcccatgg aaacgcagac cgagcccatg atcaagccca gcaccagcac 16620 catggaggtg cagacggatc cctggatgcc atcggctcct agtcgaagac cccggcgcaa 16680 gtacggcgcg gccagcctgc tgatgcccaa ctacgcgctg catccttcca tcatccccac 16740 gccgggctac cgcggcacgc gcttctaccg cggtcatacc agcagccgcc gccgcaagac 16800 caccactcgc cgccgccgtc gccgcaccgc cgctgcaacc acccctgccg ccctggtgcg 16860 gagagtgtac cgccgcggcc gcgcacctct gaccctgccg cgcgcgcgct accacccgag 16920 catcgccatt taaactttcg cctgctttgc agatcaatgg ccctcacatg ccgccttcgc 16980 gttcccatta cgggctaccg aggaagaaaa ccgcgccgta gaaggctggc ggggaacggg 17040 atgcgtcgcc accaccaccg gcggcggcgc gccatcagca agcggttggg gggaggcttc 17100 ctgcccgcgc tgatccccat catcgccgcg gcgatcgggg cgatccccgg cattgcttcc 17160 gtggcggtgc aggcctctca gcgccactga gacacacttg gaaacatctt gtaataaacc 17220 aatggactct gacgctcctg gtcctgtgat gtgttttcgt agacagatgg aagacatcaa 17280 tttttcgtcc ctggctccgc gacacggcac gcggccgttc atgggcacct ggagcgacat 17340 cggcaccagc caactgaacg ggggcgcctt caattggagc agtctctgga gcgggcttaa 17400 gaatttcggg tccacgctta aaacctatgg cagcaaggcg tggaacagca ccacagggca 17460 ggcgctgagg gataagctga aagagcagaa cttccagcag aaggtggtcg atgggctcgc 17520 ctcgggcatc aacggggtgg tggacctggc caaccaggcc gtgcagcggc agatcaacag 17580 ccgcctggac ccggtgccgc ccgccggctc cgtggagatg ccgcaggtgg aggaggagct 17640 gcctcccctg gacaagcggg gcgagaagcg accccgcccc gatgcggagg agacgctgct 17700 gacgcacacg gacgagccgc ccccgtacga ggaggcggtg aaactgggtc tgcccaccac 17760 gcggcccatc gcgcccctgg ccaccggggt gctgaaaccc gaaaagcccg cgaccctgga 17820 cttgcctcct ccccagcctt cccgcccctc tacagtggct aagcccctgc cgccggtggc 17880 cgtggcccgc gcgcgacccg ggggcaccgc ccgccctcat gcgaactggc agagcactct 17940 gaacagcatc gtgggtctgg gagtgcagag tgtgaagcgc cgccgctgct attaaaccta 18000 ccgtagcgct taacttgctt gtctgtgtgt gtatgtatta tgtcgccgcc gccgctgtcc 18060 accagaagga ggagtgaaga ggcgcgtcgc cgagttgcaa gatggccacc ccatcgatgc 18120 tgccccagtg ggcgtacatg cacatcgccg gacaggacgc ttcggagtac ctgagtccgg 18180 gtctggtgca gtttgcccgc gccacagaca cctacttcag tctggggaac aagtttagga 18240 accccacggt ggcgcccacg cacgatgtga ccaccgaccg cagccagcgg ctgacgctgc 18300 gcttcgtgcc cgtggaccgc gaggacaaca cctactcgta caaagtgcgc tacacgctgg 18360 ccgtgggcga caaccgcgtg ctggacatgg ccagcaccta ctttgacatc cgcggcgtgc 18420 tggatcgggg ccctagcttc aaaccctact ccggcaccgc ctacaacagt ctggccccca 18480 agggagcacc caacacttgt cagtggacat ataaagccga tggtgaaact gccacagaaa 18540 aaacctatac atatggaaat gcacccgtgc agggcattaa catcacaaaa gatggtattc 18600 aacttggaac tgacaccgat gatcagccaa tctacgcaga taaaacctat cagcctgaac 18660 ctcaagtggg tgatgctgaa tggcatgaca tcactggtac tgatgaaaag tatggaggca 18720 gagctcttaa gcctgatacc aaaatgaagc cttgttatgg ttcttttgcc aagcctacta 18780 ataaagaagg aggtcaggca aatgtgaaaa caggaacagg cactactaaa gaatatgaca 18840 tagacatggc tttctttgac aacagaagtg cggctgctgc tggcctagct ccagaaattg 18900 ttttgtatac tgaaaatgtg gatttggaaa ctccagatac ccatattgta tacaaagcag 18960 gcacagatga cagcagctct tctattaatt tgggtcagca agccatgccc aacagaccta 19020 actacattgg tttcagagac aactttatcg ggctcatgta ctacaacagc actggcaata 19080 tgggggtgct ggccggtcag gcttctcagc tgaatgctgt ggttgacttg caagacagaa 19140 acaccgagct gtcctaccag ctcttgcttg actctctggg tgacagaacc cggtatttca 19200 gtatgtggaa tcaggcggtg gacagctatg atcctgatgt gcgcattatt gaaaatcatg 19260 gtgtggagga tgaacttccc aactattgtt tccctctgga tgctgttggc agaacagata 19320 cttatcaggg aattaaggct aatggaactg atcaaaccac atggaccaaa gatgacagtg 19380 tcaatgatgc taatgagata ggcaagggta atccattcgc catggaaatc aacatccaag 19440 ccaacctgtg gaggaacttc ctctacgcca acgtggccct gtacctgccc gactcttaca 19500 agtacacgcc ggccaatgtt accctgccca ccaacaccaa cacctacgat tacatgaacg 19560 gccgggtggt ggcgccctcg ctggtggact cctacatcaa catcggggcg cgctggtcgc 19620 tggatcccat ggacaacgtg aaccccttca accaccaccg caatgcgggg ctgcgctacc 19680 gctccatgct cctgggcaac gggcgctacg tgcccttcca catccaggtg ccccagaaat 19740 ttttcgccat caagagcctc ctgctcctgc ccgggtccta cacctacgag tggaacttcc 19800 gcaaggacgt caacatgatc ctgcagagct ccctcggcaa cgacctgcgc acggacgggg 19860 cctccatctc cttcaccagc atcaacctct acgccacctt cttccccatg gcgcacaaca 19920 cggcctccac gctcgaggcc atgctgcgca acgacaccaa cgaccagtcc ttcaacgact 19980 acctctcggc ggccaacatg ctctacccca tcccggccaa cgccaccaac gtgcccatct 20040 ccatcccctc gcgcaactgg gccgccttcc gcggctggtc cttcacgcgt ctcaagacca 20100 aggagacgcc ctcgctgggc tccgggttcg acccctactt cgtctactcg ggctccatcc 20160 cctacctcga cggcaccttc tacctcaacc acaccttcaa gaaggtctcc atcaccttcg 20220 actcctccgt cagctggccc ggcaacgacc ggctcctgac gcccaacgag ttcgaaatca 20280 agcgcaccgt cgacggcgag ggctacaacg tggcccagtg caacatgacc aaggactggt 20340 tcctggtcca gatgctggcc cactacaaca tcggctacca gggcttctac gtgcccgagg 20400 gctacaagga ccgcatgtac tccttcttcc gcaacttcca gcccatgagc cgccaggtgg 20460 tggacgaggt caactacaag gactaccagg ccgtcaccct ggcctaccag cacaacaact 20520 cgggcttcgt cggctacctc gcgcccacca tgcgccaggg ccagccctac cccgccaact 20580 acccctaccc gctcatcggc aagagcgccg tcaccagcgt cacccagaaa aagttcctct 20640 gcgacagggt catgtggcgc atccccttct ccagcaactt catgtccatg ggcgcgctca 20700 ccgacctcgg ccagaacatg ctctatgcca actccgccca cgcgctagac atgaatttcg 20760 aagtcgaccc catggatgag tccacccttc tctatgttgt cttcgaagtc ttcgacgtcg 20820 tccgagtgca ccagccccac cgcggcgtca tcgaggccgt ctacctgcgc acccccttct 20880 cggccggtaa cgccaccacc taagctcttg cttcttgcaa gccatggccg cgggctccgg 20940 cgagcaggag ctcagggcca tcatccgcga cctgggctgc gggccctact tcctgggcac 21000 cttcgataag cgcttcccgg gattcatggc cccgcacaag ctggcctgcg ccatcgtcaa 21060 cacggccggc cgcgagaccg ggggcgagca ctggctggcc ttcgcctgga acccgcgctc 21120 gaacacctgc tacctcttcg accccttcgg gttctcggac gagcgcctca agcagatcta 21180 ccagttcgag tacgagggcc tgctgcgccg cagcgccctg gccaccgagg accgctgcgt 21240 caccctggaa aagtccaccc agaccgtgca gggtccgcgc tcggccgcct gcgggctctt 21300 ctgctgcatg ttcctgcacg ccttcgtgca ctggcccgac cgccccatgg acaagaaccc 21360 caccatgaac ttgctgacgg gggtgcccaa cggcatgctc cagtcgcccc aggtggaacc 21420 caccctgcgc cgcaaccagg aggcgctcta ccgcttcctc aactcccact ccgcctactt 21480 tcgctcccac cgcgcgcgca tcgagaaggc caccgccttc gaccgcatga atcaagacat 21540 gtaaaccgtg tgtgtatgtt aaatgtcttt aataaacagc actttcatgt tacacatgca 21600 tctgagatga tttatttaga aatcgaaagg gttctgccgg gtctcggcat ggcccgcggg 21660 cagggacacg ttgcggaact ggtacttggc cagccacttg aactcgggga tcagcagttt 21720 gggcagcggg gtgtcgggga aggagtcggt ccacagcttc cgcgtcagtt gcagggcgcc 21780 cagcaggtcg ggcgcggaga tcttgaaatc gcagttggga cccgcgttct gcgcgcggga 21840 gttgcggtac acggggttgc agcactggaa caccatcagg gccgggtgct tcacgctcgc 21900 cagcaccgtc gcgtcggtga tgctctccac gtcgaggtcc tcggcgttgg ccatcccgaa 21960 gggggtcatc ttgcaggtct gccttcccat ggtgggcacg cacccgggct tgtggttgca 22020 atcgcagtgc agggggatca gcatcatctg ggcctggtcg gcgttcatcc ccgggtacat 22080 ggccttcatg aaagcctcca attgcctgaa cgcctgctgg gccttggctc cctcggtgaa 22140 gaagaccccg caggacttgc tagagaactg gttggtggcg cacccggcgt cgtgcacgca 22200 gcagcgcgcg tcgttgttgg ccagctgcac cacgctgcgc ccccagcggt tctgggtgat 22260 cttggcccgg tcggggttct ccttcagcgc gcgctgcccg ttctcgctcg ccacatccat 22320 ctcgatcatg tgctccttct ggatcatggt ggtcccgtgc aggcaccgca gcttgccctc 22380 ggcctcggtg cacccgtgca gccacagcgc gcacccggtg cactcccagt tcttgtgggc 22440 gatctgggaa tgcgcgtgca cgaagccctg caggaagcgg cccatcatgg tggtcagggt 22500 cttgttgcta gtgaaggtca gcggaatgcc gcggtgctcc tcgttgatgt acaggtggca 22560 gatgcggcgg tacacctcgc cctgctcggg catcagctgg aagttggctt tcaggtcggt 22620 ctccacgcgg tagcggtcca tcagcatagt catgatttcc atacccttct cccaggccga 22680 gacgatgggc aggctcatag ggttcttcac catcatctta gcgctagcag ccgcggccag 22740 ggggtcgctc tcgtccaggg tctcaaagct ccgcttgccg tccttctcgg tgatccgcac 22800 cggggggtag ctgaagccca cggccgccag ctcctcctcg gcctgtcttt cgtcctcgct 22860 gtcctggctg acgtcctgca ggaccacatg cttggtcttg cggggtttct tcttgggcgg 22920 cagcggcggc ggagatgttg gagatggcga gggggagcgc gagttctcgc tcaccactac 22980 tatctcttcc tcttcttggt ccgaggccac gcggcggtag gtatgtctct tcgggggcag 23040 aggcggaggc gacgggctct cgccgccgcg acttggcgga tggctggcag agccccttcc 23100 gcgttcgggg gtgcgctccc ggcggcgctc tgactgactt cctccgcggc cggccattgt 23160 gttctcctag ggaggaacaa caagcatgga gactcagcca tcgccaacct cgccatctgc 23220 ccccaccgcc gacgagaagc agcagcagca gaatgaaagc ttaaccgccc cgccgcccag 23280 ccccgccacc tccgacgcgg ccgtcccaga catgcaagag atggaggaat ccatcgagat 23340 tgacctgggc tatgtgacgc ccgcggagca cgaggaggag ctggcagtgc gcttttcaca 23400 agaagagata caccaagaac agccagagca ggaagcagag aatgagcaga gtcaggctgg 23460 gctcgagcat gacggcgact acctccacct gagcgggggg gaggacgcgc tcatcaagca 23520 tctggcccgg caggccacca tcgtcaagga tgcgctgctc gaccgcaccg aggtgcccct 23580 cagcgtggag gagctcagcc gcgcctacga gttgaacctc ttctcgccgc gcgtgccccc 23640 caagcgccag cccaatggca cctgcgagcc caacccgcgc ctcaacttct acccggtctt 23700 cgcggtgccc gaggccctgg ccacctacca catctttttc aagaaccaaa agatccccgt 23760 ctcctgccgc gccaaccgca cccgcgccga cgcccttttc aacctgggtc ccggcgcccg 23820 cctacctgat atcgcctcct tggaagaggt tcccaagatc ttcgagggtc tgggcagcga 23880 cgagactcgg gccgcgaacg ctctgcaagg agaaggagga gagcatgagc accacagcgc 23940 cctggtcgag ttggaaggcg acaacgcgcg gctggcggtg ctcaaacgca cggtcgagct 24000 gacccatttc gcctacccgg ctctgaacct gccccccaaa gtcatgagcg cggtcatgga 24060 ccaggtgctc atcaagcgcg cgtcgcccat ctccgaggac gagggcatgc aagactccga 24120 ggagggcaag cccgtggtca gcgacgagca gctggcccgg tggctgggtc ctaatgctag 24180 tccccagagt ttggaagagc ggcgcaaact catgatggcc gtggtcctgg tgaccgtgga 24240 gctggagtgc ctgcgccgct tcttcgccga cgcggagacc ctgcgcaagg tcgaggagaa 24300 cctgcactac ctcttcaggc acgggttcgt gcgccaggcc tgcaagatct ccaacgtgga 24360 gctgaccaac ctggtctcct acatgggcat cttgcacgag aaccgcctgg ggcagaacgt 24420 gctgcacacc accctgcgcg gggaggcccg gcgcgactac atccgcgact gcgtctacct 24480 ctacctctgc cacacctggc agacgggcat gggcgtgtgg cagcagtgtc tggaggagca 24540 gaacctgaaa gagctctgca agctcctgca gaagaacctc aagggtctgt ggaccgggtt 24600 cgacgagcgc accaccgcct cggacctggc cgacctcatt ttccccgagc gcctcaggct 24660 gacgctgcgc aacggcctgc ccgactttat gagccaaagc atgttgcaaa actttcgctc 24720 tttcatcctc gaacgctccg gaatcctgcc cgccacctgc tccgcgctgc cctcggactt 24780 cgtgccgctg accttccgcg agtgcccccc gccgctgtgg agccactgct acctgctgcg 24840 cctggccaac tacctggcct accactcgga cgtgatcgag gacgtcagcg gcgagggcct 24900 gctcgagtgc cactgccgct gcaacctctg cacgccgcac cgctccctgg cctgcaaccc 24960 ccagctgctg agcgagaccc agatcatcgg caccttcgag ttgcaagggc ccagcgaagg 25020 cgagggttca gccgccaagg ggggtctgaa actcaccccg gggctgtgga cctcggccta 25080 cttgcgcaag ttcgtgcccg aggactacca tcccttcgag atcaggttct acgaggacca 25140 atcccatccg cccaaggccg agctgtcggc ctgcgtcatc acccaggggg cgatcctggc 25200 ccaattgcaa gccatccaga aatcccgcca agaattcttg ctgaaaaagg gccgcggggt 25260 ctacctcgac ccccagaccg gtgaggagct caaccccggc ttcccccagg atgccccgag 25320 gaaacaagaa gctgaaagtg gagctgccgc ccgtggagga tttggaggaa gactgggaga 25380 acagcagtca ggcagaggag gaggagatgg aggaagactg ggacagcact caggcagagg 25440 aggacagcct gcaagacagt ctggaggaag acgaggagga ggcagaggag gaggtggaag 25500 aagcagccgc cgccagaccg tcgtcctcgg cgggggagaa agcaagcagc acggatacca 25560 tctccgctcc gggtcggggt cccgctcgac cacacagtag atgggacgag accggacgat 25620 tcccgaaccc caccacccag accggtaaga aggagcggca gggatacaag tcctggcggg 25680 ggcacaaaaa cgccatcgtc tcctgcttgc aggcctgcgg gggcaacatc tccttcaccc 25740 ggcgctacct gctcttccac cgcggggtga actttccccg caacatcttg cattactacc 25800 gtcacctcca cagcccctac tacttccaag aagaggcagc agcagcagaa aaagaccagc 25860 agaaaaccag cagctagaaa atccacagcg gcggcagcag gtggactgag gatcgcggcg 25920 aacgagccgg cgcaaacccg ggagctgagg aaccggatct ttcccaccct ctatgccatc 25980 ttccagcaga gtcgggggca ggagcaggaa ctgaaagtca agaaccgttc tctgcgctcg 26040 ctcacccgca gttgtctgta tcacaagagc gaagaccaac ttcagcgcac tctcgaggac 26100 gccgaggctc tcttcaacaa gtactgcgcg ctcactctta aagagtagcc cgcgcccgcc 26160 cagtcgcaga aaaaggcggg aattacgtca cctgtgccct tcgccctagc cgcctccacc 26220 catcatcatg agcaaagaga ttcccacgcc ttacatgtgg agctaccagc cccagatggg 26280 cctggccgcc ggtgccgccc aggactactc cacccgcatg aattggctca gcgccgggcc 26340 cgcgatgatc tcacgggtga atgacatccg cgcccaccga aaccagatac tcctagaaca 26400 gtcagcgctc accgccacgc cccgcaatca cctcaatccg cgtaattggc ccgccgccct 26460 ggtgtaccag gaaattcccc agcccacgac cgtactactt ccgcgagacg cccaggccga 26520 agtccagctg actaactcag gtgtccagct ggcgggcggc gccaccctgt gtcgtcaccg 26580 ccccgctcag ggtataaagc ggctggtgat ccggggcaga ggcacacagc tcaacgacga 26640 ggtggtgagc tcttcgctgg gtctgcgacc tgacggagtc ttccaactcg ccggatcggg 26700 gagatcttcc ttcacgcctc gtcaggccgt cctgactttg gagagttcgt cctcgcagcc 26760 ccgctcgggt ggcatcggca ctctccagtt cgtggaggag ttcactccct cggtctactt 26820 caaccccttc tccggctccc ccggccacta cccggacgag ttcatcccga acttcgacgc 26880 catcagcgag tcggtggacg gctacgattg aatgtcccat ggtggcgcag ctgacctagc 26940 tcggcttcga cacctggacc actgccgccg cttccgctgc ttcgctcggg atctcgccga 27000 gtttgcctac tttgagctgc ccgaggagca ccctcagggc ccggcccacg gagtgcggat 27060 cgtcgtcgaa gggggcctcg actcccacct gcttcggatc ttcagccagc gtccgatcct 27120 ggtcgagcgc gagcaaggac agacccttct gactctgtac tgcatctgca accaccccgg 27180 cctgcatgaa agtctttgtt gtctgctgtg tactgagtat aataaaagct gagatcagcg 27240 actactccgg acttccgtgt gttcctgaat ccatcaacca gtctttgttc ttcaccggga 27300 acgagaccga gctccagctc cagtgtaagc cccacaagaa gtacctcacc tggctgttcc 27360 agggctcccc gatcgccgtt gtcaaccact gcgacaacga cggagtcctg ctgagcggcc 27420 ctgccaacct tactttttcc acccgcagaa gcaagctcca gctcttccaa cccttcctcc 27480 ccgggaccta tcagtgcgtc tcgggaccct gccatcacac cttccacctg atcccgaata 27540 ccacagcgtc gctccccgct actaacaacc aaactaacct ccaccaacgc caccgtcgcg 27600 acggccacaa tacatgccca tattagacta tgaggccgag ccacagcgac ccatgctccc 27660 cgctattagt tacttcaatc taaccggcgg agatgactga cccactggcc aacaacaacg 27720 tcaacgacct tctcctggac atggacggcc gcgcctcgga gcagcgactc gcccaacttc 27780 gcattcgcca gcagcaggag agagccgtca aggagctgca ggatgcggtg gccatccacc 27840 agtgcaagag aggcatcttc tgcctggtga aacaggccaa gatctcctac gaggtcactc 27900 caaacgacca tcgcctctcc tacgagctcc tgcagcagcg ccagaagttc acctgcctgg 27960 tcggagtcaa ccccatcgtc atcacccagc agtctggcga taccaagggg tgcatccact 28020 gctcctgcga ctcccccgac tgcgtccaca ctctgatcaa gaccctctgc ggcctccgcg 28080 acctcctccc catgaactaa tcaccccctt atccagtgaa ataaagatca tattgatgat 28140 gattttacag aaataaaaaa taatcatttg atttgaaata aagatacaat catattgatg 28200 atttgagttt aacaaaaaaa taaagaatca cttacttgaa atctgatacc aggtctctgt 28260 ccatgttttc tgccaacacc acttcactcc cctcttccca gctctggtac tgcaggcccc 28320 ggcgggctgc aaacttcctc cacacgctga aggggatgtc aaattcctcc tgtccctcaa 28380 tcttcatttt atcttctatc agatgtccaa aaagcgcgtc cgggtggatg atgacttcga 28440 ccccgtctac ccctacgatg cagacaacgc accgaccgtg cccttcatca accccccctt 28500 cgtctcttca gatggattcc aagagaagcc cctgggggtg ttgtccctgc gactggccga 28560 ccccgtcacc accaagaacg gggaaatcac cctcaagctg ggagaggggg tggacctcga 28620 ttcctcggga aaactcatct ccaacacggc caccaaggcc gccgcccctc tcagtttttc 28680 caacaacacc atttccctta acatggatca ccccttttac actaaagatg gaaaattatc 28740 cttacaagtt tctccaccat taaatatact gagaacaagc attctaaaca cactagcttt 28800 aggttttgga tcaggtttag gactccgtgg ctctgccttg gcagtacagt tagtctctcc 28860 acttacattt gatactgatg gaaacataaa gcttacctta gacagaggtt tgcatgttac 28920 aacaggagat gcaattgaaa gcaacataag ctgggctaaa ggtttaaaat ttgaagatgg 28980 agccatagca accaacattg gaaatgggtt agagtttgga agcagtagta cagaaacagg 29040 tgttgatgat gcttacccaa tccaagttaa acttggatct ggccttagct ttgacagtac 29100 aggagccata atggctggta acaaagaaga cgataaactc actttgtgga caacacctga 29160 tccatcacca aactgtcaaa tactcgcaga aaatgatgca aaactaacac tttgcttgac 29220 taaatgtggt agtcaaatac tggccactgt gtcagtctta gttgtaggaa gtggaaacct 29280 aaaccccatt actggcaccg taagcagtgc tcaggtgttt ctacgttttg atgcaaacgg 29340 tgttctttta acagaacatt ctacactaaa aaaatactgg gggtataggc agggagatag 29400 catagatggc actccatata ccaatgctgt aggattcatg cccaatttaa aagcttatcc 29460 aaagtcacaa agttctacta ctaaaaataa tatagtaggg caagtataca tgaatggaga 29520 tgtttcaaaa cctatgcttc tcactataac cctcaatggt actgatgaca gcaacagtac 29580 atattcaatg tcattttcat acacctggac taatggaagc tatgttggag caacatttgg 29640 ggctaactct tataccttct catacatcgc ccaagaatga acactgtatc ccaccctgca 29700 tgccaaccct tcccacccca ctctgtggaa caaactctga aacacaaaat aaaataaagt 29760 tcaagtgttt tattgattca acagttttac aggattcgag cagttatttt tcctccaccc 29820 tcccaggaca tggaatacac caccctctcc ccccgcacag ccttgaacat ctgaatgcca 29880 ttggtgatgg acatgctttt ggtctccacg ttccacacag tttcagagcg agccagtctc 29940 gggtcggtca gggagatgaa accctccggg cactcccgca tctgcacctc acagctcaac 30000 agctgaggat tgtcctcggt ggtcgggatc acggttatct ggaagaagca gaagagcggc 30060 ggtgggaatc atagtccgcg aacgggatcg gccggtggtg tcgcatcagg ccccgcagca 30120 gtcgctgccg ccgccgctcc gtcaagctgc tgctcagggg gtccgggtcc agggactccc 30180 tcagcatgat gcccacggcc ctcagcatca gtcgtctggt gcggcgggcg cagcagcgca 30240 tgcggatctc gctcaggtcg ctgcagtacg tgcaacacag aaccaccagg ttgttcaaca 30300 gtccatagtt caacacgctc cagccgaaac tcatcgcggg aaggatgcta cccacgtggc 30360 cgtcgtacca gatcctcagg taaatcaagt ggtgccccct ccagaacacg ctgcccacgt 30420 acatgatctc cttgggcatg tggcggttca ccacctcccg gtaccacatc accctctggt 30480 tgaacatgca gccccggatg atcctgcgga accacagggc cagcaccgcc ccgcccgcca 30540 tgcagcgaag agaccccggg tcccggcaat ggcaatggag gacccaccgc tcgtacccgt 30600 ggatcatctg ggagctgaac aagtctatgt tggcacagca caggcatatg ctcatgcatc 30660 tcttcagcac tctcaactcc tcgggggtca aaaccatatc ccagggcacg gggaactctt 30720 gcaggacagc gaaccccgca gaacagggca atcctcgcac agaacttaca ttgtgcatgg 30780 acagggtatc gcaatcaggc agcaccgggt gatcctccac cagagaagcg cgggtctcgg 30840 tctcctcaca gcgtggtaag ggggccggcc gatacgggtg atggcgggac gcggctgatc 30900 gtgttcgcga ccgtgtcatg atgcagttgc tttcggacat tttcgtactt gctgtagcag 30960 aacctggtcc gggcgctgca caccgatcgc cggcggcggt ctcggcgctt ggaacgctcg 31020 gtgttgaaat tgtaaaacag ccactctctc agaccgtgca gcagatctag ggcctcagga 31080 gtgatgaaga tcccatcatg cctgatggct ctgatcacat cgaccaccgt ggaatgggcc 31140 agacccagcc agatgatgca attttgttgg gtttcggtga cggcggggga gggaagaaca 31200 ggaagaacca tgattaactt ttaatccaaa cggtctcgga gtacttcaaa atgaagatcg 31260 cggagatggc acctctcgcc cccgctgtgt tggtggaaaa taacagccag gtcaaaggtg 31320 atacggttct cgagatgttc cacggtggct tccagcaaag cctccacgcg cacatccaga 31380 aacaagacaa tagcgaaagc gggagggttc tctaattcct caatcatcat gttacactcc 31440 tgcaccatcc ccagataatt ttcatttttc cagccttgaa tgattcgaac tagttcgtga 31500 ggtaaatcca agccagccat gataaagagc tcgcgcagag cgccctccac cggcattctt 31560 aagcacaccc tcataattcc aagatattct gctcctggtt cacctgcagc agattgacaa 31620 gcggaatatc aaaatctctg ccgcgatccc tgagctcctc cctcagcaat aactgtaagt 31680 actctttcat atcctctccg aaatttttag ccataggacc accaggaata agattagggc 31740 aagccacagt acagataaac cgaagtcctc cccagtgagc attgccaaat gcaagactgc 31800 tataagcatg ctggctagac ccggtgatat cttccagata actggacaga aaatcgccca 31860 ggcaattttt aagaaaatca acaaaagaaa aatcctccag gtggacgttt agagcctcgg 31920 gaacaacgat gaagtaaatg caagcggtgc gttccagcat ggttagttag ctgatctgta 31980 gaaaaaacaa aaatgaacat taaaccatgc tagcctggcg aacaggtggg taaatcgttc 32040 tctccagcac caggcaggcc acggggtctc cggcgcgacc ctcgtaaaaa ttgtcgctat 32100 gattgaaaac catcacagag agacgttccc ggtggccggc gtgaatgatt cgacaagatg 32160 aatacacccc cggaacattg gcgtccgcga gtgaaaaaaa gcgcccgagg aagcaataag 32220 gcactacaat gctcagtctc aagtccagca aagcgatgcc atgcggatga agcacaaaat 32280 tctcaggtgc gtacaaaatg taattactcc cctcctgcac aggcagcaaa gcccccgatc 32340 cctccaggta cacatacaaa gcctcagcgt ccatagctta ccgagcagca gcacacaaca 32400 ggcgcaagag tcagagaaag gctgagctct aacctgtcca cccgctctct gctcaatata 32460 tagcccagat ctacactgac gtaaaggcca aagtctaaaa atacccgcca aataatcaca 32520 cacgcccagc acacgcccag aaaccggtga cacactcaaa aaaatacgcg cacttcctca 32580 aacgcccaaa actgccgtca tttccgggtt cccacgctac gtcatcaaaa cacgactttc 32640 aaattccgtc gaccgttaaa aacgtcaccc gccccgcccc taacggtcgc ccgtctctca 32700 gccaatcagc gccccgcatc cccaaattca aacacctcat ttgcatatta acgcgcacaa 32760 aaagtttgag gtatattatt gatgatgg 32788 <210> 13 <211> 30684 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 13 ccatcttcaa taatatacct caaacttttt gtgcgcgtta atatgcaaat gaggcgtttg 60 aatttgggga ggaagggcgg tgattggtcg agggatgagc gaccgttagg ggcggggcga 120 gtgacgtttt gatgacgtgg ttgcgaggag gagccagttt gcaagttctc gtgggaaaag 180 tgacgtcaaa cgaggtgtgg tttgaacacg gaaatactca attttcccgc gctctctgac 240 aggaaatgag gtgtttctgg gcggatgcaa gtgaaaacgg gccattttcg cgcgaaaact 300 gaatgaggaa gtgaaaatct gagtaatttc gcgtttatgg cagggaggag tatttgccga 360 gggccgagta gactttgacc gattacgtgg gggtttcgat taccgtgttt ttcacctaaa 420 tttccgcgta cggtgtcaaa gtccggtgtt tttacgtagg tgtcagctga tcgccagggt 480 atttaaacct gcgctctcca gtcaagaggc cactcttgag tgccagcgag aagagttttc 540 tcctccgcgc cgcgagtcag atctacactt tgaaagtagg gataacaggg taatgacatt 600 gattattgac tagttgttaa tagtaatcaa ttacggggtc attagttcat agcccatata 660 tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc 720 cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc 780 attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt 840 atcatatgcc aagtccgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt 900 atgcccagta catgacctta cgggactttc ctacttggca gtacatctac gtattagtca 960 tcgctattac catggtgatg cggttttggc agtacaccaa tgggcgtgga tagcggtttg 1020 actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc 1080 aaaatcaacg ggactttcca aaatgtcgta ataaccccgc cccgttgacg caaatgggcg 1140 gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg 1200 cctggaacgc catccacgct gttttgacct ccatagaaga cagcgatcgc gccaccatgg 1260 tgagcaaggg cgaggagctg ttcaccgggg tggtgcccat cctggtcgag ctggacggcg 1320 acgtaaacgg ccacaagttc agcgtgtccg gcgagggcga gggcgatgcc acctacggca 1380 agctgaccct gaagttcatc tgcaccaccg gcaagctgcc cgtgccctgg cccaccctcg 1440 tgaccaccct gacctacggc gtgcagtgct tcagccgcta ccccgaccac atgaagcagc 1500 acgacttctt caagtccgcc atgcccgaag gctacgtcca ggagcgcacc atcttcttca 1560 aggacgacgg caactacaag acccgcgccg aggtgaagtt cgagggcgac accctggtga 1620 accgcatcga gctgaagggc atcgacttca aggaggacgg caacatcctg gggcacaagc 1680 tggagtacaa ctacaacagc cacaacgtct atatcatggc cgacaagcag aagaacggca 1740 tcaaggtgaa cttcaagatc cgccacaaca tcgaggacgg cagcgtgcag ctcgccgacc 1800 actaccagca gaacaccccc atcggcgacg gccccgtgct gctgcccgac aaccactacc 1860 tgagcaccca gtccgccctg agcaaagacc ccaacgagaa gcgcgatcac atggtcctgc 1920 tggagttcgt gaccgccgcc gggatcactc tcggcatgga cgagctttac aagtagtgag 1980 tttaaactcc catttaaatg tgagggttaa tgcttcgagc agacatgata agatacattg 2040 atgagtttgg acaaaccaca actagaatgc agtgaaaaaa atgctttatt tgtgaaattt 2100 gtgatgctat tgctttattt gtaaccatta taagctgcaa taaacaagtt aacaacaaca 2160 attgcattca ttttatgttt caggttcagg gggagatgtg ggaggttttt taaagcaagt 2220 aaaacctcta caaatgtggt aaaataacta taacggtcct aaggtagcga gtgagtagtg 2280 ttctggggcg ggggaggacc tgcatgaggg ccagaataac tgaaatctgt gcttttctgt 2340 gtgttgcagc agcatgagcg gaagcggctc ctttgaggga ggggtattca gcccttatct 2400 gacggggcgt ctcccctcct gggcgggagt gcgtcagaat gtgatgggat ccacggtgga 2460 cggccggccc gtgcagcccg cgaactcttc aaccctgacc tatgcaaccc tgagctcttc 2520 gtcgttggac gcagctgccg ccgcagctgc tgcatctgcc gccagcgccg tgcgcggaat 2580 ggccatgggc gccggctact acggcactct ggtggccaac tcgagttcca ccaataatcc 2640 cgccagcctg aacgaggaga agctgttgct gctgatggcc cagctcgagg ccttgaccca 2700 gcgcctgggc gagctgaccc agcaggtggc tcagctgcag gagcagacgc gggccgcggt 2760 tgccacggtg aaatccaaat aaaaaatgaa tcaataaata aacggagacg gttgttgatt 2820 ttaacacaga gtctgaatct ttatttgatt tttcgcgcgc ggtaggccct ggaccaccgg 2880 tctcgatcat tgagcacccg gtggatcttt tccaggaccc ggtagaggtg ggcttggatg 2940 ttgaggtaca tgggcatgag cccgtcccgg gggtggaggt agctccattg cagggcctcg 3000 tgctcggggg tggtgttgta aatcacccag tcatagcagg ggcgcagggc atggtgttgc 3060 acaatatctt tgaggaggag actgatggcc acgggcagcc ctttggtgta ggtgtttaca 3120 aatctgttga gctgggaggg atgcatgcgg ggggagatga ggtgcatctt ggcctggatc 3180 ttgagattgg cgatgttacc gcccagatcc cgcctggggt tcatgttgtg caggaccacc 3240 agcacggtgt atccggtgca cttggggaat ttatcatgca acttggaagg gaaggcgtga 3300 aagaatttgg cgacgccttt gtgcccgccc aggttttcca tgcactcatc catgatgatg 3360 gcgatgggcc cgtgggcggc ggcctgggca aagacgtttc gggggtcgga cacatcatag 3420 ttgtggtcct gggtgaggtc atcataggcc attttaatga atttggggcg gagggtgccg 3480 gactggggga caaaggtacc ctcgatcccg ggggcgtagt tcccctcaca gatctgcatc 3540 tcccaggctt tgagctcgga gggggggatc atgtccacct gcggggcgat aaagaacacg 3600 gtttccgggg cgggggagat gagctgggcc gaaagcaagt tccggagcag ctgggacttg 3660 ccgcagccgg tggggccgta gatgaccccg atgaccggct gcaggtggta gttgagggag 3720 agacagctgc cgtcctcccg gaggaggggg gccacctcgt tcatcatctc gcgcacgtgc 3780 atgttctcgc gcaccagttc cgccaggagg cgctctcccc ccagggatag gagctcctgg 3840 agcgaggcga agtttttcag cggcttgagt ccgtcggcca tgggcatttt ggagagggtt 3900 tgttgcaaga gttccaggcg gtcccagagc tcggtgatgt gctctacggc atctcgatcc 3960 agcagacctc ctcgtttcgc gggttgggac ggctgcggga gtagggcacc agacgatggg 4020 cgtccagcgc agccagggtc cggtccttcc agggtcgcag cgtccgcgtc agggtggtct 4080 ccgtcacggt gaaggggtgc gcgccgggct gggcgcttgc gagggtgcgc ttcaggctca 4140 tccggctggt cgaaaaccgc tcccgatcgg cgccctgcgc gtcggccagg tagcaattga 4200 ccatgagttc gtagttgagc gcctcggccg cgtggccttt ggcgcggagc ttacctttgg 4260 aagtctgccc gcaggcggga cagaggaggg acttgagggc gtagagcttg ggggcgagga 4320 agacggactc gggggcgtag gcgtccgcgc cgcagtgggc gcagacggtc tcgcactcca 4380 cgagccaggt gaggtcgggc tggtcggggt caaaaaccag tttcccgccg ttctttttga 4440 tgcgtttctt acctttggtc tccatgagct cgtgtccccg ctgggtgaca aagaggctgt 4500 ccgtgtcccc gtagaccgac tttatgggcc ggtcctcgag cggtgtgccg cggtcctcct 4560 cgtagaggaa ccccgcccac tccgagacga aagcccgggt ccaggccagc acgaaggagg 4620 ccacgtggga cgggtagcgg tcgttgtcca ccagcgggtc caccttttcc agggtatgca 4680 aacacatgtc cccctcgtcc acatccagga aggtgattgg cttgtaagtg taggccacgt 4740 gaccgggggt cccggccggg ggggtataaa agggtgcggg tccctgctcg tcctcactgt 4800 cttccggatc gctgtccagg agcgccagct gttggggtag gtattccctc tcgaaggcgg 4860 gcatgacctc ggcactcagg ttgtcagttt ctagaaacga ggaggatttg atattgacgg 4920 tgccggcgga gatgcctttc aagagcccct cgtccatctg gtcagaaaag acgatctttt 4980 tgttgtcgag cttggtggcg aaggagccgt agagggcgtt ggagaggagc ttggcgatgg 5040 agcgcatggt ctggtttttt tccttgtcgg cgcgctcctt ggcggcgatg ttgagctgca 5100 cgtactcgcg cgccacgcac ttccattcgg ggaagacggt ggtcagctcg tcgggcacga 5160 ttctgacctg ccagccccga ttatgcaggg tgatgaggtc cacactggtg gccacctcgc 5220 cgcgcagggg ctcattagtc cagcagaggc gtccgccctt gcgcgagcag aaggggggca 5280 gggggtccag catgacctcg tcgggggggt cggcatcgat ggtgaagatg ccgggcagga 5340 ggtcggggtc aaagtagctg atggaagtgg ccagatcgtc cagggcagct tgccattcgc 5400 gcacggccag cgcgcgctcg tagggactga ggggcgtgcc ccagggcatg ggatgggtaa 5460 gcgcggaggc gtacatgccg cagatgtcgt agacgtagag gggctcctcg aggatgccga 5520 tgtaggtggg gtagcagcgc cccccgcgga tgctggcgcg cacgtagtca tacagctcgt 5580 gcgagggggc gaggagcccc gggcccaggt tggtgcgact gggcttttcg gcgcggtaga 5640 cgatctggcg gaaaatggca tgcgagttgg aggagatggt gggcctttgg aagatgttga 5700 agtgggcgtg gggcagtccg accgagtcgc ggatgaagtg ggcgtaggag tcttgcagct 5760 tggcgacgag ctcggcggtg actaggacgt ccagagcgca gtagtcgagg gtctcctgga 5820 tgatgtcata cttgagctgt cccttttgtt tccacagctc gcggttgaga aggaactctt 5880 cgcggtcctt ccagtactct tcgaggggga acccgtcctg atctgcacgg taagagccta 5940 gcatgtagaa ctggttgacg gccttgtagg cgcagcagcc cttctccacg gggagggcgt 6000 aggcctgggc ggccttgcgc agggaggtgt gcgtgagggc gaaagtgtcc ctgaccatga 6060 ccttgaggaa ctggtgcttg aagtcgatat cgtcgcagcc cccctgctcc cagagctgga 6120 agtccgtgcg cttcttgtag gcggggttgg gcaaagcgaa agtaacatcg ttgaagagga 6180 tcttgcccgc gcggggcata aagttgcgag tgatgcggaa aggttggggc acctcggccc 6240 ggttgttgat gacctgggcg gcgagcacga tctcgtcgaa gccgttgatg ttgtggccca 6300 cgatgtagag ttccacgaat cgcggacggc ccttgacgtg gggcagtttc ttgagctcct 6360 cgtaggtgag ctcgtcgggg tcgctgagcc cgtgctgctc gagcgcccag tcggcgagat 6420 gggggttggc gcggaggaag gaagtccaga gatccacggc cagggcggtt tgcagacggt 6480 cccggtactg acggaactgc tgcccgacgg ccattttttc gggggtgacg cagtagaagg 6540 tgcgggggtc cccgtgccag cgatcccatt tgagctggag ggcgagatcg agggcgagct 6600 cgacgagccg gtcgtccccg gagagtttca tgaccagcat gaaggggacg agctgcttgc 6660 cgaaggaccc catccaggtg taggtttcca catcgtaggt gaggaagagc ctttcggtgc 6720 gaggatgcga gccgatgggg aagaactgga tctcctgcca ccaattggag gaatggctgt 6780 tgatgtgatg gaagtagaaa tgccgacggc gcgccgaaca ctcgtgcttg tgtttataca 6840 agcggccaca gtgctcgcaa cgctgcacgg gatgcacgtg ctgcacgagc tgtacctgag 6900 ttcctttgac gaggaatttc agtgggaagt ggagtcgtgg cgcctgcatc tcgtgctgta 6960 ctacgtcgtg gtggtcggcc tggccctctt ctgcctcgat ggtggtcatg ctgacgagcc 7020 cgcgcgggag gcaggtccag acctcggcgc gagcgggtcg gagagcgagg acgagggcgc 7080 gcaggccgga gctgtccagg gtcctgagac gctgcggagt caggtcagtg ggcagcggcg 7140 gcgcgcggtt gacttgcagg agtttttcca gggcgcgcgg gaggtccaga tggtacttga 7200 tctccaccgc gccattggtg gcgacgtcga tggcttgcag ggtcccgtgc ccctggggtg 7260 tgaccaccgt cccccgtttc ttcttgggcg gctggggcga cgggggcggt gcctcttcca 7320 tggttagaag cggcggcgag gacgcgcgcc gggcggcagg ggcggctcgg ggcccggagg 7380 caggggcggc aggggcacgt cggcgccgcg cgcgggtagg ttctggtact gcgcccggag 7440 aagactggcg tgagcgacga cgcgacggtt gacgtcctgg atctgacgcc tctgggtgaa 7500 ggccacggga cccgtgagtt tgaacctgaa agagagttcg acagaatcaa tctcggtatc 7560 gttgacggcg gcctgccgca ggatctcttg cacgtcgccc gagttgtcct ggtaggcgat 7620 ctcggtcatg aactgctcga tctcctcctc ttgaaggtct ccgcggccgg cgcgctccac 7680 ggtggccgcg aggtcgttgg agatgcggcc catgagctgc gagaaggcgt tcatgcccgc 7740 ctcgttccag acgcggctgt agaccacgac gccctcggga tcgcgggcgc gcatgaccac 7800 ctgggcgagg ttgagctcca cgtggcgcgt gaagaccgcg tagttgcaga ggcgctggta 7860 gaggtagttg agcgtggtgg cgatgtgctc ggtgacgaag aaatacatga tccagcggcg 7920 gagcggcatc tcgctgacgt cgcccagcgc ctccaaacgt tccatggcct cgtaaaagtc 7980 cacggcgaag ttgaaaaact gggagttgcg cgccgagacg gtcaactcct cctccagaag 8040 acggatgagc tcggcgatgg tggcgcgcac ctcgcgctcg aaggcccccg ggagttcctc 8100 cacttcctct tcttcctcct ccactaacat ctcttctact tcctcctcag gcggcagtgg 8160 tggcggggga gggggcctgc gtcgccggcg gcgcacgggc agacggtcga tgaagcgctc 8220 gatggtctcg ccgcgccggc gtcgcatggt ctcggtgacg gcgcgcccgt cctcgcgggg 8280 ccgcagcgtg aagacgccgc cgcgcatctc caggtggccg ggggggtccc cgttgggcag 8340 ggagagggcg ctgacgatgc atcttatcaa ttgccccgta gggactccgc gcaaggacct 8400 gagcgtctcg agatccacgg gatctgaaaa ccgctgaacg aaggcttcga gccagtcgca 8460 gtcgcaaggt aggctgagca cggtttcttc tggcgggtca tgttggttgg gagcggggcg 8520 ggcgatgctg ctggtgatga agttgaaata ggcggttctg agacggcgga tggtggcgag 8580 gagcaccagg tctttgggcc cggcttgctg gatgcgcaga cggtcggcca tgccccaggc 8640 gtggtcctga cacctggcca ggtccttgta gtagtcctgc atgagccgct ccacgggcac 8700 ctcctcctcg cccgcgcggc cgtgcatgcg cgtgagcccg aagccgcgct ggggctggac 8760 gagcgccagg tcggcgacga cgcgctcggc gaggatggct tgctggatct gggtgagggt 8820 ggtctggaag tcatcaaagt cgacgaagcg gtggtaggct ccggtgttga tggtgtagga 8880 gcagttggcc atgacggacc agttgacggt ctggtggccc ggacgcacga gctcgtggta 8940 cttgaggcgc gagtaggcgc gcgtgtcgaa gatgtagtcg ttgcaggtgc gcaccaggta 9000 ctggtagccg atgaggaagt gcggcggcgg ctggcggtag agcggccatc gctcggtggc 9060 gggggcgccg ggcgcgaggt cctcgagcat ggtgcggtgg tagccgtaga tgtacctgga 9120 catccaggtg atgccggcgg cggtggtgga ggcgcgcggg aactcgcgga cgcggttcca 9180 gatgttgcgc agcggcagga agtagttcat ggtgggcacg gtctggcccg tgaggcgcgc 9240 gcagtcgtgg atgctctata cgggcaaaaa cgaaagcggt cagcggctcg actccgtggc 9300 ctggaggcta agcgaacggg ttgggctgcg cgtgtacccc ggttcgaatc tcgaatcagg 9360 ctggagccgc agctaacgtg gtattggcac tcccgtctcg acccaagcct gcaccaaccc 9420 tccaggatac ggaggcgggt cgttttgcaa cttttttttg gaggccggat gagactagta 9480 agcgcggaaa gcggccgacc gcgatggctc gctgccgtag tctggagaag aatcgccagg 9540 gttgcgttgc ggtgtgcccc ggttcgaggc cggccggatt ccgcggctaa cgagggcgtg 9600 gctgccccgt cgtttccaag accccatagc cagccgactt ctccagttac ggagcgagcc 9660 cctcttttgt tttgtttgtt tttgccagat gcatcccgta ctgcggcaga tgcgccccca 9720 ccaccctcca ccgcaacaac agccccctcc acagccggcg cttctgcccc cgccccagca 9780 gcaacttcca gccacgaccg ccgcggccgc cgtgagcggg gctggacaga gttatgatca 9840 ccagctggcc ttggaagagg gcgaggggct ggcgcgcctg ggggcgtcgt cgccggagcg 9900 gcacccgcgc gtgcagatga aaagggacgc tcgcgaggcc tacgtgccca agcagaacct 9960 gttcagagac aggagcggcg aggagcccga ggagatgcgc gcggcccggt tccacgcggg 10020 gcgggagctg cggcgcggcc tggaccgaaa gagggtgctg agggacgagg atttcgaggc 10080 ggacgagctg acggggatca gccccgcgcg cgcgcacgtg gccgcggcca acctggtcac 10140 ggcgtacgag cagaccgtga aggaggagag caacttccaa aaatccttca acaaccacgt 10200 gcgcaccctg atcgcgcgcg aggaggtgac cctgggcctg atgcacctgt gggacctgct 10260 ggaggccatc gtgcagaacc ccaccagcaa gccgctgacg gcgcagctgt tcctggtggt 10320 gcagcatagt cgggacaacg aagcgttcag ggaggcgctg ctgaatatca ccgagcccga 10380 gggccgctgg ctcctggacc tggtgaacat tctgcagagc atcgtggtgc aggagcgcgg 10440 gctgccgctg tccgagaagc tggcggccat caacttctcg gtgctgagtt tgggcaagta 10500 ctacgctagg aagatctaca agaccccgta cgtgcccata gacaaggagg tgaagatcga 10560 cgggttttac atgcgcatga ccctgaaagt gctgaccctg agcgacgatc tgggggtgta 10620 ccgcaacgac aggatgcacc gtgcggtgag cgccagcagg cggcgcgagc tgagcgacca 10680 ggagctgatg catagtctgc agcgggccct gaccggggcc gggaccgagg gggagagcta 10740 ctttgacatg ggcgcggacc tgcactggca gcccagccgc cgggccttgg aggcggcggc 10800 aggaccctac gtagaagagg tggacgatga ggtggacgag gagggcgagt acctggaaga 10860 ctgatggcgc gaccgtattt ttgctagatg caacaacaac agccacctcc tgatcccgcg 10920 atgcgggcgg cgctgcagag ccagccgtcc ggcattaact cctcggacga ttggacccag 10980 gccatgcaac gcatcatggc gctgacgacc cgcaaccccg aagcctttag acagcagccc 11040 caggccaacc ggctctcggc catcctggag gccgtggtgc cctcgcgctc caaccccacg 11100 cacgagaagg tcctggccat cgtgaacgcg ctggtggaga acaaggccat ccgcggcgac 11160 gaggccggcc tggtgtacaa cgcgctgctg gagcgcgtgg cccgctacaa cagcaccaac 11220 gtgcagacca acctggaccg catggtgacc gacgtgcgcg aggccgtggc ccagcgcgag 11280 cggttccacc gcgagtccaa cctgggatcc atggtggcgc tgaacgcctt cctcagcacc 11340 cagcccgcca acgtgccccg gggccaggag gactacacca acttcatcag cgccctgcgc 11400 ctgatggtga ccgaggtgcc ccagagcgag gtgtaccagt ccgggccgga ctacttcttc 11460 cagaccagtc gccagggctt gcagaccgtg aacctgagcc aggctttcaa gaacttgcag 11520 ggcctgtggg gcgtgcaggc cccggtcggg gaccgcgcga cggtgtcgag cctgctgacg 11580 ccgaactcgc gcctgctgct gctgctggtg gcccccttca cggacagcgg cagcatcaac 11640 cgcaactcgt acctgggcta cctgattaac ctgtaccgcg aggccatcgg ccaggcgcac 11700 gtggacgagc agacctacca ggagatcacc cacgtgagcc gcgccctggg ccaggacgac 11760 ccgggcaacc tggaagccac cctgaacttt ttgctgacca accggtcgca gaagatcccg 11820 ccccagtacg cgctcagcac cgaggaggag cgcatcctgc gttacgtgca gcagagcgtg 11880 ggcctgttcc tgatgcagga gggggccacc cccagcgccg cgctcgacat gaccgcgcgc 11940 aacatggagc ccagcatgta cgccagcaac cgcccgttca tcaataaact gatggactac 12000 ttgcatcggg cggccgccat gaactctgac tatttcacca acgccatcct gaatccccac 12060 tggctcccgc cgccggggtt ctacacgggc gagtacgaca tgcccgaccc caatgacggg 12120 ttcctgtggg acgatgtgga cagcagcgtg ttctcccccc gaccgggtgc taacgagcgc 12180 cccttgtgga agaaggaagg cagcgaccga cgcccgtcct cggcgctgtc cggccgcgag 12240 ggtgctgccg cggcggtgcc cgaggccgcc agtcctttcc cgagcttgcc cttctcgctg 12300 aacagtatcc gcagcagcga gctgggcagg atcacgcgcc cgcgcttgct gggcgaagag 12360 gagtacttga atgactcgct gttgagaccc gagcgggaga agaacttccc caataacggg 12420 atagaaagcc tggtggacaa gatgagccgc tggaagacgt atgcgcagga gcacagggac 12480 gatccccggg cgtcgcaggg ggccacgagc cggggcagcg ccgcccgtaa acgccggtgg 12540 cacgacaggc agcggggaca gatgtgggac gatgaggact ccgccgacga cagcagcgtg 12600 ttggacttgg gtgggagtgg taacccgttc gctcacctgc gcccccgtat cgggcgcatg 12660 atgtaagaga aaccgaaaat aaatgatact caccaaggcc atggcgacca gcgtgcgttc 12720 gtttcttctc tgttgttgtt gtatctagta tgatgaggcg tgcgtacccg gagggtcctc 12780 ctccctcgta cgagagcgtg atgcagcagg cgatggcggc ggcggcgatg cagcccccgc 12840 tggaggctcc ttacgtgccc ccgcggtacc tggcgcctac ggaggggcgg aacagcattc 12900 gttactcgga gctggcaccc ttgtacgata ccacccggtt gtacctggtg gacaacaagt 12960 cggcggacat cgcctcgctg aactaccaga acgaccacag caacttcctg accaccgtgg 13020 tgcagaacaa tgacttcacc cccacggagg ccagcaccca gaccatcaac tttgacgagc 13080 gctcgcggtg gggcggccag ctgaaaacca tcatgcacac caacatgccc aacgtgaacg 13140 agttcatgta cagcaacaag ttcaaggcgc gggtgatggt ctcccgcaag acccccaatg 13200 gggtgacagt gacagaggat tatgatggta gtcaggatga gctgaagtat gaatgggtgg 13260 aatttgagct gcccgaaggc aacttctcgg tgaccatgac catcgacctg atgaacaacg 13320 ccatcatcga caattacttg gcggtggggc ggcagaacgg ggtgctggag agcgacatcg 13380 gcgtgaagtt cgacactagg aacttcaggc tgggctggga ccccgtgacc gagctggtca 13440 tgcccggggt gtacaccaac gaggctttcc atcccgatat tgtcttgctg cccggctgcg 13500 gggtggactt caccgagagc cgcctcagca acctgctggg cattcgcaag aggcagccct 13560 tccaggaagg cttccagatc atgtacgagg atctggaggg gggcaacatc cccgcgctcc 13620 tggatgtcga cgcctatgag aaaagcaagg aggatgcagc agctgaagca actgcagccg 13680 tagctaccgc ctctaccgag gtcaggggcg ataattttgc aagcgccgca gcagtggcag 13740 cggccgaggc ggctgaaacc gaaagtaaga tagtcattca gccggtggag aaggatagca 13800 agaacaggag ctacaacgta ctaccggaca agataaacac cgcctaccgc agctggtacc 13860 tagcctacaa ctatggcgac cccgagaagg gcgtgcgctc ctggacgctg ctcaccacct 13920 cggacgtcac ctgcggcgtg gagcaagtct actggtcgct gcccgacatg atgcaagacc 13980 cggtcacctt ccgctccacg cgtcaagtta gcaactaccc ggtggtgggc gccgagctcc 14040 tgcccgtcta ctccaagagc ttcttcaacg agcaggccgt ctactcgcag cagctgcgcg 14100 ccttcacctc gcttacgcac gtcttcaacc gcttccccga gaaccagatc ctcgtccgcc 14160 cgcccgcgcc caccattacc accgtcagtg aaaacgttcc tgctctcaca gatcacggga 14220 ccctgccgct gcgcagcagt atccggggag tccagcgcgt gaccgttact gacgccagac 14280 gccgcacctg cccctacgtc tacaaggccc tgggcatagt cgcgccgcgc gtcctctcga 14340 gccgcacctt ctaaatgtcc attctcatct cgcccagtaa taacaccggt tggggcctgc 14400 gcgcgcccag caagatgtac ggaggcgctc gccaacgctc cacgcaacac cccgtgcgcg 14460 tgcgcgggca cttccgcgct ccctggggcg ccctcaaggg ccgcgtgcgg tcgcgcacca 14520 ccgtcgacga cgtgatcgac caggtggtgg ccgacgcgcg caactacacc cccgccgccg 14580 cgcccgtctc caccgtggac gccgtcatcg acagcgtggt ggccgacgcg cgccggtacg 14640 cccgcgccaa gagccggcgg cggcgcatcg cccggcggca ccggagcacc cccgccatgc 14700 gcgcggcgcg agccttgctg cgcagggcca ggcgcacggg acgcagggcc atgctcaggg 14760 cggccagacg cgcggcttca ggcgccagcg ccggcaggac ccggagacgc gcggccacgg 14820 cggcggcagc ggccatcgcc agcatgtccc gcccgcggcg agggaacgtg tactgggtgc 14880 gcgacgccgc caccggtgtg cgcgtgcccg tgcgcacccg cccccctcgc acttgaagat 14940 gttcacttcg cgatgttgat gtgtcccagc ggcgaggagg atgtccaagc gcaaattcaa 15000 ggaagagatg ctccaggtca tcgcgcctga gatctacggc cctgcggtgg tgaaggagga 15060 aagaaagccc cgcaaaatca agcgggtcaa aaaggacaaa aaggaagaag aaagtgatgt 15120 ggacggattg gtggagtttg tgcgcgagtt cgccccccgg cggcgcgtgc agtggcgcgg 15180 gcggaaggtg caaccggtgc tgagacccgg caccaccgtg gtcttcacgc ccggcgagcg 15240 ctccggcacc gcttccaagc gctcctacga cgaggtgtac ggggatgatg atattctgga 15300 gcaggcggcc gagcgcctgg gcgagtttgc ttacggcaag cgcagccgtt ccgcaccgaa 15360 ggaagaggcg gtgtccatcc cgctggacca cggcaacccc acgccgagcc tcaagcccgt 15420 gaccttgcag caggtgctgc cgaccgcggc gccgcgccgg gggttcaagc gcgagggcga 15480 ggatctgtac cccaccatgc agctgatggt gcccaagcgc cagaagctgg aagacgtgct 15540 ggagaccatg aaggtggacc cggacgtgca gcccgaggtc aaggtgcggc ccatcaagca 15600 ggtggccccg ggcctgggcg tgcagaccgt ggacatcaag attcccacgg agcccatgga 15660 aacgcagacc gagcccatga tcaagcccag caccagcacc atggaggtgc agacggatcc 15720 ctggatgcca tcggctccta gtcgaagacc ccggcgcaag tacggcgcgg ccagcctgct 15780 gatgcccaac tacgcgctgc atccttccat catccccacg ccgggctacc gcggcacgcg 15840 cttctaccgc ggtcatacca gcagccgccg ccgcaagacc accactcgcc gccgccgtcg 15900 ccgcaccgcc gctgcaacca cccctgccgc cctggtgcgg agagtgtacc gccgcggccg 15960 cgcacctctg accctgccgc gcgcgcgcta ccacccgagc atcgccattt aaactttcgc 16020 ctgctttgca gatcaatggc cctcacatgc cgccttcgcg ttcccattac gggctaccga 16080 ggaagaaaac cgcgccgtag aaggctggcg gggaacggga tgcgtcgcca ccaccaccgg 16140 cggcggcgcg ccatcagcaa gcggttgggg ggaggcttcc tgcccgcgct gatccccatc 16200 atcgccgcgg cgatcggggc gatccccggc attgcttccg tggcggtgca ggcctctcag 16260 cgccactgag acacacttgg aaacatcttg taataaacca atggactctg acgctcctgg 16320 tcctgtgatg tgttttcgta gacagatgga agacatcaat ttttcgtccc tggctccgcg 16380 acacggcacg cggccgttca tgggcacctg gagcgacatc ggcaccagcc aactgaacgg 16440 gggcgccttc aattggagca gtctctggag cgggcttaag aatttcgggt ccacgcttaa 16500 aacctatggc agcaaggcgt ggaacagcac cacagggcag gcgctgaggg ataagctgaa 16560 agagcagaac ttccagcaga aggtggtcga tgggctcgcc tcgggcatca acggggtggt 16620 ggacctggcc aaccaggccg tgcagcggca gatcaacagc cgcctggacc cggtgccgcc 16680 cgccggctcc gtggagatgc cgcaggtgga ggaggagctg cctcccctgg acaagcgggg 16740 cgagaagcga ccccgccccg atgcggagga gacgctgctg acgcacacgg acgagccgcc 16800 cccgtacgag gaggcggtga aactgggtct gcccaccacg cggcccatcg cgcccctggc 16860 caccggggtg ctgaaacccg aaaagcccgc gaccctggac ttgcctcctc cccagccttc 16920 ccgcccctct acagtggcta agcccctgcc gccggtggcc gtggcccgcg cgcgacccgg 16980 gggcaccgcc cgccctcatg cgaactggca gagcactctg aacagcatcg tgggtctggg 17040 agtgcagagt gtgaagcgcc gccgctgcta ttaaacctac cgtagcgctt aacttgcttg 17100 tctgtgtgtg tatgtattat gtcgccgccg ccgctgtcca ccagaaggag gagtgaagag 17160 gcgcgtcgcc gagttgcaag atggccaccc catcgatgct gccccagtgg gcgtacatgc 17220 acatcgccgg acaggacgct tcggagtacc tgagtccggg tctggtgcag tttgcccgcg 17280 ccacagacac ctacttcagt ctggggaaca agtttaggaa ccccacggtg gcgcccacgc 17340 acgatgtgac caccgaccgc agccagcggc tgacgctgcg cttcgtgccc gtggaccgcg 17400 aggacaacac ctactcgtac aaagtgcgct acacgctggc cgtgggcgac aaccgcgtgc 17460 tggacatggc cagcacctac tttgacatcc gcggcgtgct ggatcggggc cctagcttca 17520 aaccctactc cggcaccgcc tacaacagtc tggcccccaa gggagcaccc aacacttgtc 17580 agtggacata taaagccgat ggtgaaactg ccacagaaaa aacctataca tatggaaatg 17640 cacccgtgca gggcattaac atcacaaaag atggtattca acttggaact gacaccgatg 17700 atcagccaat ctacgcagat aaaacctatc agcctgaacc tcaagtgggt gatgctgaat 17760 ggcatgacat cactggtact gatgaaaagt atggaggcag agctcttaag cctgatacca 17820 aaatgaagcc ttgttatggt tcttttgcca agcctactaa taaagaagga ggtcaggcaa 17880 atgtgaaaac aggaacaggc actactaaag aatatgacat agacatggct ttctttgaca 17940 acagaagtgc ggctgctgct ggcctagctc cagaaattgt tttgtatact gaaaatgtgg 18000 atttggaaac tccagatacc catattgtat acaaagcagg cacagatgac agcagctctt 18060 ctattaattt gggtcagcaa gccatgccca acagacctaa ctacattggt ttcagagaca 18120 actttatcgg gctcatgtac tacaacagca ctggcaatat gggggtgctg gccggtcagg 18180 cttctcagct gaatgctgtg gttgacttgc aagacagaaa caccgagctg tcctaccagc 18240 tcttgcttga ctctctgggt gacagaaccc ggtatttcag tatgtggaat caggcggtgg 18300 acagctatga tcctgatgtg cgcattattg aaaatcatgg tgtggaggat gaacttccca 18360 actattgttt ccctctggat gctgttggca gaacagatac ttatcaggga attaaggcta 18420 atggaactga tcaaaccaca tggaccaaag atgacagtgt caatgatgct aatgagatag 18480 gcaagggtaa tccattcgcc atggaaatca acatccaagc caacctgtgg aggaacttcc 18540 tctacgccaa cgtggccctg tacctgcccg actcttacaa gtacacgccg gccaatgtta 18600 ccctgcccac caacaccaac acctacgatt acatgaacgg ccgggtggtg gcgccctcgc 18660 tggtggactc ctacatcaac atcggggcgc gctggtcgct ggatcccatg gacaacgtga 18720 accccttcaa ccaccaccgc aatgcggggc tgcgctaccg ctccatgctc ctgggcaacg 18780 ggcgctacgt gcccttccac atccaggtgc cccagaaatt tttcgccatc aagagcctcc 18840 tgctcctgcc cgggtcctac acctacgagt ggaacttccg caaggacgtc aacatgatcc 18900 tgcagagctc cctcggcaac gacctgcgca cggacggggc ctccatctcc ttcaccagca 18960 tcaacctcta cgccaccttc ttccccatgg cgcacaacac ggcctccacg ctcgaggcca 19020 tgctgcgcaa cgacaccaac gaccagtcct tcaacgacta cctctcggcg gccaacatgc 19080 tctaccccat cccggccaac gccaccaacg tgcccatctc catcccctcg cgcaactggg 19140 ccgccttccg cggctggtcc ttcacgcgtc tcaagaccaa ggagacgccc tcgctgggct 19200 ccgggttcga cccctacttc gtctactcgg gctccatccc ctacctcgac ggcaccttct 19260 acctcaacca caccttcaag aaggtctcca tcaccttcga ctcctccgtc agctggcccg 19320 gcaacgaccg gctcctgacg cccaacgagt tcgaaatcaa gcgcaccgtc gacggcgagg 19380 gctacaacgt ggcccagtgc aacatgacca aggactggtt cctggtccag atgctggccc 19440 actacaacat cggctaccag ggcttctacg tgcccgaggg ctacaaggac cgcatgtact 19500 ccttcttccg caacttccag cccatgagcc gccaggtggt ggacgaggtc aactacaagg 19560 actaccaggc cgtcaccctg gcctaccagc acaacaactc gggcttcgtc ggctacctcg 19620 cgcccaccat gcgccagggc cagccctacc ccgccaacta cccctacccg ctcatcggca 19680 agagcgccgt caccagcgtc acccagaaaa agttcctctg cgacagggtc atgtggcgca 19740 tccccttctc cagcaacttc atgtccatgg gcgcgctcac cgacctcggc cagaacatgc 19800 tctatgccaa ctccgcccac gcgctagaca tgaatttcga agtcgacccc atggatgagt 19860 ccacccttct ctatgttgtc ttcgaagtct tcgacgtcgt ccgagtgcac cagccccacc 19920 gcggcgtcat cgaggccgtc tacctgcgca cccccttctc ggccggtaac gccaccacct 19980 aagctcttgc ttcttgcaag ccatggccgc gggctccggc gagcaggagc tcagggccat 20040 catccgcgac ctgggctgcg ggccctactt cctgggcacc ttcgataagc gcttcccggg 20100 attcatggcc ccgcacaagc tggcctgcgc catcgtcaac acggccggcc gcgagaccgg 20160 gggcgagcac tggctggcct tcgcctggaa cccgcgctcg aacacctgct acctcttcga 20220 ccccttcggg ttctcggacg agcgcctcaa gcagatctac cagttcgagt acgagggcct 20280 gctgcgccgc agcgccctgg ccaccgagga ccgctgcgtc accctggaaa agtccaccca 20340 gaccgtgcag ggtccgcgct cggccgcctg cgggctcttc tgctgcatgt tcctgcacgc 20400 cttcgtgcac tggcccgacc gccccatgga caagaacccc accatgaact tgctgacggg 20460 ggtgcccaac ggcatgctcc agtcgcccca ggtggaaccc accctgcgcc gcaaccagga 20520 ggcgctctac cgcttcctca actcccactc cgcctacttt cgctcccacc gcgcgcgcat 20580 cgagaaggcc accgccttcg accgcatgaa tcaagacatg taaaccgtgt gtgtatgtta 20640 aatgtcttta ataaacagca ctttcatgtt acacatgcat ctgagatgat ttatttagaa 20700 atcgaaaggg ttctgccggg tctcggcatg gcccgcgggc agggacacgt tgcggaactg 20760 gtacttggcc agccacttga actcggggat cagcagtttg ggcagcgggg tgtcggggaa 20820 ggagtcggtc cacagcttcc gcgtcagttg cagggcgccc agcaggtcgg gcgcggagat 20880 cttgaaatcg cagttgggac ccgcgttctg cgcgcgggag ttgcggtaca cggggttgca 20940 gcactggaac accatcaggg ccgggtgctt cacgctcgcc agcaccgtcg cgtcggtgat 21000 gctctccacg tcgaggtcct cggcgttggc catcccgaag ggggtcatct tgcaggtctg 21060 ccttcccatg gtgggcacgc acccgggctt gtggttgcaa tcgcagtgca gggggatcag 21120 catcatctgg gcctggtcgg cgttcatccc cgggtacatg gccttcatga aagcctccaa 21180 ttgcctgaac gcctgctggg ccttggctcc ctcggtgaag aagaccccgc aggacttgct 21240 agagaactgg ttggtggcgc acccggcgtc gtgcacgcag cagcgcgcgt cgttgttggc 21300 cagctgcacc acgctgcgcc cccagcggtt ctgggtgatc ttggcccggt cggggttctc 21360 cttcagcgcg cgctgcccgt tctcgctcgc cacatccatc tcgatcatgt gctccttctg 21420 gatcatggtg gtcccgtgca ggcaccgcag cttgccctcg gcctcggtgc acccgtgcag 21480 ccacagcgcg cacccggtgc actcccagtt cttgtgggcg atctgggaat gcgcgtgcac 21540 gaagccctgc aggaagcggc ccatcatggt ggtcagggtc ttgttgctag tgaaggtcag 21600 cggaatgccg cggtgctcct cgttgatgta caggtggcag atgcggcggt acacctcgcc 21660 ctgctcgggc atcagctgga agttggcttt caggtcggtc tccacgcggt agcggtccat 21720 cagcatagtc atgatttcca tacccttctc ccaggccgag acgatgggca ggctcatagg 21780 gttcttcacc atcatcttag cgctagcagc cgcggccagg gggtcgctct cgtccagggt 21840 ctcaaagctc cgcttgccgt ccttctcggt gatccgcacc ggggggtagc tgaagcccac 21900 ggccgccagc tcctcctcgg cctgtctttc gtcctcgctg tcctggctga cgtcctgcag 21960 gaccacatgc ttggtcttgc ggggtttctt cttgggcggc agcggcggcg gagatgttgg 22020 agatggcgag ggggagcgcg agttctcgct caccactact atctcttcct cttcttggtc 22080 cgaggccacg cggcggtagg tatgtctctt cgggggcaga ggcggaggcg acgggctctc 22140 gccgccgcga cttggcggat ggctggcaga gccccttccg cgttcggggg tgcgctcccg 22200 gcggcgctct gactgacttc ctccgcggcc ggccattgtg ttctcctagg gaggaacaac 22260 aagcatggag actcagccat cgccaacctc gccatctgcc cccaccgccg acgagaagca 22320 gcagcagcag aatgaaagct taaccgcccc gccgcccagc cccgccacct ccgacgcggc 22380 cgtcccagac atgcaagaga tggaggaatc catcgagatt gacctgggct atgtgacgcc 22440 cgcggagcac gaggaggagc tggcagtgcg cttttcacaa gaagagatac accaagaaca 22500 gccagagcag gaagcagaga atgagcagag tcaggctggg ctcgagcatg acggcgacta 22560 cctccacctg agcggggggg aggacgcgct catcaagcat ctggcccggc aggccaccat 22620 cgtcaaggat gcgctgctcg accgcaccga ggtgcccctc agcgtggagg agctcagccg 22680 cgcctacgag ttgaacctct tctcgccgcg cgtgcccccc aagcgccagc ccaatggcac 22740 ctgcgagccc aacccgcgcc tcaacttcta cccggtcttc gcggtgcccg aggccctggc 22800 cacctaccac atctttttca agaaccaaaa gatccccgtc tcctgccgcg ccaaccgcac 22860 ccgcgccgac gcccttttca acctgggtcc cggcgcccgc ctacctgata tcgcctcctt 22920 ggaagaggtt cccaagatct tcgagggtct gggcagcgac gagactcggg ccgcgaacgc 22980 tctgcaagga gaaggaggag agcatgagca ccacagcgcc ctggtcgagt tggaaggcga 23040 caacgcgcgg ctggcggtgc tcaaacgcac ggtcgagctg acccatttcg cctacccggc 23100 tctgaacctg ccccccaaag tcatgagcgc ggtcatggac caggtgctca tcaagcgcgc 23160 gtcgcccatc tccgaggacg agggcatgca agactccgag gagggcaagc ccgtggtcag 23220 cgacgagcag ctggcccggt ggctgggtcc taatgctagt ccccagagtt tggaagagcg 23280 gcgcaaactc atgatggccg tggtcctggt gaccgtggag ctggagtgcc tgcgccgctt 23340 cttcgccgac gcggagaccc tgcgcaaggt cgaggagaac ctgcactacc tcttcaggca 23400 cgggttcgtg cgccaggcct gcaagatctc caacgtggag ctgaccaacc tggtctccta 23460 catgggcatc ttgcacgaga accgcctggg gcagaacgtg ctgcacacca ccctgcgcgg 23520 ggaggcccgg cgcgactaca tccgcgactg cgtctacctc tacctctgcc acacctggca 23580 gacgggcatg ggcgtgtggc agcagtgtct ggaggagcag aacctgaaag agctctgcaa 23640 gctcctgcag aagaacctca agggtctgtg gaccgggttc gacgagcgca ccaccgcctc 23700 ggacctggcc gacctcattt tccccgagcg cctcaggctg acgctgcgca acggcctgcc 23760 cgactttatg agccaaagca tgttgcaaaa ctttcgctct ttcatcctcg aacgctccgg 23820 aatcctgccc gccacctgct ccgcgctgcc ctcggacttc gtgccgctga ccttccgcga 23880 gtgccccccg ccgctgtgga gccactgcta cctgctgcgc ctggccaact acctggccta 23940 ccactcggac gtgatcgagg acgtcagcgg cgagggcctg ctcgagtgcc actgccgctg 24000 caacctctgc acgccgcacc gctccctggc ctgcaacccc cagctgctga gcgagaccca 24060 gatcatcggc accttcgagt tgcaagggcc cagcgaaggc gagggttcag ccgccaaggg 24120 gggtctgaaa ctcaccccgg ggctgtggac ctcggcctac ttgcgcaagt tcgtgcccga 24180 ggactaccat cccttcgaga tcaggttcta cgaggaccaa tcccatccgc ccaaggccga 24240 gctgtcggcc tgcgtcatca cccagggggc gatcctggcc caattgcaag ccatccagaa 24300 atcccgccaa gaattcttgc tgaaaaaggg ccgcggggtc tacctcgacc cccagaccgg 24360 tgaggagctc aaccccggct tcccccagga tgccccgagg aaacaagaag ctgaaagtgg 24420 agctgccgcc cgtggaggat ttggaggaag actgggagaa cagcagtcag gcagaggagg 24480 aggagatgga ggaagactgg gacagcactc aggcagagga ggacagcctg caagacagtc 24540 tggaggaaga cgaggaggag gcagaggagg aggtggaaga agcagccgcc gccagaccgt 24600 cgtcctcggc gggggagaaa gcaagcagca cggataccat ctccgctccg ggtcggggtc 24660 ccgctcgacc acacagtaga tgggacgaga ccggacgatt cccgaacccc accacccaga 24720 ccggtaagaa ggagcggcag ggatacaagt cctggcgggg gcacaaaaac gccatcgtct 24780 cctgcttgca ggcctgcggg ggcaacatct ccttcacccg gcgctacctg ctcttccacc 24840 gcggggtgaa ctttccccgc aacatcttgc attactaccg tcacctccac agcccctact 24900 acttccaaga agaggcagca gcagcagaaa aagaccagca gaaaaccagc agctagaaaa 24960 tccacagcgg cggcagcagg tggactgagg atcgcggcga acgagccggc gcaaacccgg 25020 gagctgagga accggatctt tcccaccctc tatgccatct tccagcagag tcgggggcag 25080 gagcaggaac tgaaagtcaa gaaccgttct ctgcgctcgc tcacccgcag ttgtctgtat 25140 cacaagagcg aagaccaact tcagcgcact ctcgaggacg ccgaggctct cttcaacaag 25200 tactgcgcgc tcactcttaa agagtagccc gcgcccgccc agtcgcagaa aaaggcggga 25260 attacgtcac ctgtgccctt cgccctagcc gcctccaccc atcatcatga gcaaagagat 25320 tcccacgcct tacatgtgga gctaccagcc ccagatgggc ctggccgccg gtgccgccca 25380 ggactactcc acccgcatga attggctcag cgccgggccc gcgatgatct cacgggtgaa 25440 tgacatccgc gcccaccgaa accagatact cctagaacag tcagcgctca ccgccacgcc 25500 ccgcaatcac ctcaatccgc gtaattggcc cgccgccctg gtgtaccagg aaattcccca 25560 gcccacgacc gtactacttc cgcgagacgc ccaggccgaa gtccagctga ctaactcagg 25620 tgtccagctg gcgggcggcg ccaccctgtg tcgtcaccgc cccgctcagg gtataaagcg 25680 gctggtgatc cggggcagag gcacacagct caacgacgag gtggtgagct cttcgctggg 25740 tctgcgacct gacggagtct tccaactcgc cggatcgggg agatcttcct tcacgcctcg 25800 tcaggccgtc ctgactttgg agagttcgtc ctcgcagccc cgctcgggtg gcatcggcac 25860 tctccagttc gtggaggagt tcactccctc ggtctacttc aaccccttct ccggctcccc 25920 cggccactac ccggacgagt tcatcccgaa cttcgacgcc atcagcgagt cggtggacgg 25980 ctacgattga aactaatcac ccccttatcc agtgaaataa agatcatatt gatgatgatt 26040 ttacagaaat aaaaaataat catttgattt gaaataaaga tacaatcata ttgatgattt 26100 gagtttaaca aaaaaataaa gaatcactta cttgaaatct gataccaggt ctctgtccat 26160 gttttctgcc aacaccactt cactcccctc ttcccagctc tggtactgca ggccccggcg 26220 ggctgcaaac ttcctccaca cgctgaaggg gatgtcaaat tcctcctgtc cctcaatctt 26280 cattttatct tctatcagat gtccaaaaag cgcgtccggg tggatgatga cttcgacccc 26340 gtctacccct acgatgcaga caacgcaccg accgtgccct tcatcaaccc ccccttcgtc 26400 tcttcagatg gattccaaga gaagcccctg ggggtgttgt ccctgcgact ggccgacccc 26460 gtcaccacca agaacgggga aatcaccctc aagctgggag agggggtgga cctcgattcc 26520 tcgggaaaac tcatctccaa cacggccacc aaggccgccg cccctctcag tttttccaac 26580 aacaccattt cccttaacat ggatcacccc ttttacacta aagatggaaa attatcctta 26640 caagtttctc caccattaaa tatactgaga acaagcattc taaacacact agctttaggt 26700 tttggatcag gtttaggact ccgtggctct gccttggcag tacagttagt ctctccactt 26760 acatttgata ctgatggaaa cataaagctt accttagaca gaggtttgca tgttacaaca 26820 ggagatgcaa ttgaaagcaa cataagctgg gctaaaggtt taaaatttga agatggagcc 26880 atagcaacca acattggaaa tgggttagag tttggaagca gtagtacaga aacaggtgtt 26940 gatgatgctt acccaatcca agttaaactt ggatctggcc ttagctttga cagtacagga 27000 gccataatgg ctggtaacaa agaagacgat aaactcactt tgtggacaac acctgatcca 27060 tcaccaaact gtcaaatact cgcagaaaat gatgcaaaac taacactttg cttgactaaa 27120 tgtggtagtc aaatactggc cactgtgtca gtcttagttg taggaagtgg aaacctaaac 27180 cccattactg gcaccgtaag cagtgctcag gtgtttctac gttttgatgc aaacggtgtt 27240 cttttaacag aacattctac actaaaaaaa tactgggggt ataggcaggg agatagcata 27300 gatggcactc catataccaa tgctgtagga ttcatgccca atttaaaagc ttatccaaag 27360 tcacaaagtt ctactactaa aaataatata gtagggcaag tatacatgaa tggagatgtt 27420 tcaaaaccta tgcttctcac tataaccctc aatggtactg atgacagcaa cagtacatat 27480 tcaatgtcat tttcatacac ctggactaat ggaagctatg ttggagcaac atttggggct 27540 aactcttata ccttctcata catcgcccaa gaatgaacac tgtatcccac cctgcatgcc 27600 aacccttccc accccactct gtggaacaaa ctctgaaaca caaaataaaa taaagttcaa 27660 gtgttttatt gattcaacag ttttacagga ttcgagcagt tatttttcct ccaccctccc 27720 aggacatgga atacaccacc ctctcccccc gcacagcctt gaacatctga atgccattgg 27780 tgatggacat gcttttggtc tccacgttcc acacagtttc agagcgagcc agtctcgggt 27840 cggtcaggga gatgaaaccc tccgggcact cccgcatctg cacctcacag ctcaacagct 27900 gaggattgtc ctcggtggtc gggatcacgg ttatctggaa gaagcagaag agcggcggtg 27960 ggaatcatag tccgcgaacg ggatcggccg gtggtgtcgc atcaggcccc gcagcagtcg 28020 ctgccgccgc cgctccgtca agctgctgct cagggggtcc gggtccaggg actccctcag 28080 catgatgccc acggccctca gcatcagtcg tctggtgcgg cgggcgcagc agcgcatgcg 28140 gatctcgctc aggtcgctgc agtacgtgca acacagaacc accaggttgt tcaacagtcc 28200 atagttcaac acgctccagc cgaaactcat cgcgggaagg atgctaccca cgtggccgtc 28260 gtaccagatc ctcaggtaaa tcaagtggtg ccccctccag aacacgctgc ccacgtacat 28320 gatctccttg ggcatgtggc ggttcaccac ctcccggtac cacatcaccc tctggttgaa 28380 catgcagccc cggatgatcc tgcggaacca cagggccagc accgccccgc ccgccatgca 28440 gcgaagagac cccgggtccc ggcaatggca atggaggacc caccgctcgt acccgtggat 28500 catctgggag ctgaacaagt ctatgttggc acagcacagg catatgctca tgcatctctt 28560 cagcactctc aactcctcgg gggtcaaaac catatcccag ggcacgggga actcttgcag 28620 gacagcgaac cccgcagaac agggcaatcc tcgcacagaa cttacattgt gcatggacag 28680 ggtatcgcaa tcaggcagca ccgggtgatc ctccaccaga gaagcgcggg tctcggtctc 28740 ctcacagcgt ggtaaggggg ccggccgata cgggtgatgg cgggacgcgg ctgatcgtgt 28800 tcgcgaccgt gtcatgatgc agttgctttc ggacattttc gtacttgctg tagcagaacc 28860 tggtccgggc gctgcacacc gatcgccggc ggcggtctcg gcgcttggaa cgctcggtgt 28920 tgaaattgta aaacagccac tctctcagac cgtgcagcag atctagggcc tcaggagtga 28980 tgaagatccc atcatgcctg atggctctga tcacatcgac caccgtggaa tgggccagac 29040 ccagccagat gatgcaattt tgttgggttt cggtgacggc gggggaggga agaacaggaa 29100 gaaccatgat taacttttaa tccaaacggt ctcggagtac ttcaaaatga agatcgcgga 29160 gatggcacct ctcgcccccg ctgtgttggt ggaaaataac agccaggtca aaggtgatac 29220 ggttctcgag atgttccacg gtggcttcca gcaaagcctc cacgcgcaca tccagaaaca 29280 agacaatagc gaaagcggga gggttctcta attcctcaat catcatgtta cactcctgca 29340 ccatccccag ataattttca tttttccagc cttgaatgat tcgaactagt tcctgaggta 29400 aatccaagcc agccatgata aagagctcgc gcagagcgcc ctccaccggc attcttaagc 29460 acaccctcat aattccaaga tattctgctc ctggttcacc tgcagcagat tgacaagcgg 29520 aatatcaaaa tctctgccgc gatccctgag ctcctccctc agcaataact gtaagtactc 29580 tttcatatcc tctccgaaat ttttagccat aggaccacca ggaataagat tagggcaagc 29640 cacagtacag ataaaccgaa gtcctcccca gtgagcattg ccaaatgcaa gactgctata 29700 agcatgctgg ctagacccgg tgatatcttc cagataactg gacagaaaat cgcccaggca 29760 atttttaaga aaatcaacaa aagaaaaatc ctccaggtgg acgtttagag cctcgggaac 29820 aacgatgaag taaatgcaag cggtgcgttc cagcatggtt agttagctga tctgtagaaa 29880 aaacaaaaat gaacattaaa ccatgctagc ctggcgaaca ggtgggtaaa tcgttctctc 29940 cagcaccagg caggccacgg ggtctccggc gcgaccctcg taaaaattgt cgctatgatt 30000 gaaaaccatc acagagagac gttcccggtg gccggcgtga atgattcgac aagatgaata 30060 cacccccgga acattggcgt ccgcgagtga aaaaaagcgc ccgaggaagc aataaggcac 30120 tacaatgctc agtctcaagt ccagcaaagc gatgccatgc ggatgaagca caaaattctc 30180 aggtgcgtac aaaatgtaat tactcccctc ctgcacaggc agcaaagccc ccgatccctc 30240 caggtacaca tacaaagcct cagcgtccat agcttaccga gcagcagcac acaacaggcg 30300 caagagtcag agaaaggctg agctctaacc tgtccacccg ctctctgctc aatatatagc 30360 ccagatctac actgacgtaa aggccaaagt ctaaaaatac ccgccaaata atcacacacg 30420 cccagcacac gcccagaaac cggtgacaca ctcaaaaaaa tacgcgcact tcctcaaacg 30480 cccaaaactg ccgtcatttc cgggttccca cgctacgtca tcaaaacacg actttcaaat 30540 tccgtcgacc gttaaaaacg tcacccgccc cgcccctaac ggtcgcccgt ctctcagcca 30600 atcagcgccc cgcatcccca aattcaaaca cctcatttgc atattaacgc gcacaaaaag 30660 tttgaggtat attattgatg atgg 30684 <210> 14 <211> 8602 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 14 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560 ttaaagtccg ccatatgagg ccaccatgca gatcttcgtg aagaccctga ccggcaagac 7620 catcacccta gaggtggagc ccagtgacac catcgagaac gtgaaggcca agatccagga 7680 taaagagggc atcccccctg accagcagag gctgatcttt gccggcaagc agctggaaga 7740 tggccgcacc ctctctgatt acaacatcca gaaggagtca accctgcacc tggtccttcg 7800 cctgagaggt ggcgctgctt acagtataat caactttgaa aaactggctg cttacggcat 7860 cctgggcttt gtgtttacac tggctgccta cctgctgttt ggctatcctg tgtacgtggc 7920 cgcttatgga ctgtgtaccc tggtggccat gctggctgct tacaatctgg tgcctatggt 7980 ggccacagtg gccgcctatt gtcttggcgg actgctgaca atggtggcag cctacagccc 8040 gagctatgcg tatcatcagt ttgcagccta cggcccagga ccaggcgcta aatttgtggc 8100 tgcctggaca ctgaaagccg ccgctggacc aggtcctgga cagtacatca aggccaacag 8160 caagttcatc ggcatcaccg aactcggccc aggaccaggc tatccctacg atgtgcctga 8220 ttacgcctga tagtgatgat tcgaacggcc gtatcacgcc caaacattta cagccgcggt 8280 gtcaaaaacc gcgtggacgt ggttaacatc cctgctggga ggatcagccg taattattat 8340 aattggcttg gtgctggcta ctattgtggc catgtacgtg ctgaccaacc agaaacataa 8400 ttgaatacag cagcaattgg caagctgctt acatagaact cgcggcgatt ggcatgccgc 8460 cttaaaattt ttattttatt ttttcttttc ttttccgaat cggattttgt ttttaatatt 8520 tcaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 8580 aaaaaaaaaa aaaaaaaaaa aa 8602 <210> 15 <211> 9595 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 15 atgggcggcg catgagagaa gcccagacca attacctacc caaaatggag aaagttcacg 60 ttgacatcga ggaagacagc ccattcctca gagctttgca gcggagcttc ccgcagtttg 120 aggtagaagc caagcaggtc actgataatg accatgctaa tgccagagcg ttttcgcatc 180 tggcttcaaa actgatcgaa acggaggtgg acccatccga cacgatcctt gacattggaa 240 gtgcgcccgc ccgcagaatg tattctaagc acaagtatca ttgtatctgt ccgatgagat 300 gtgcggaaga tccggacaga ttgtataagt atgcaactaa gctgaagaaa aactgtaagg 360 aaataactga taaggaattg gacaagaaaa tgaaggagct cgccgccgtc atgagcgacc 420 ctgacctgga aactgagact atgtgcctcc acgacgacga gtcgtgtcgc tacgaagggc 480 aagtcgctgt ttaccaggat gtatacgcgg ttgacggacc gacaagtctc tatcaccaag 540 ccaataaggg agttagagtc gcctactgga taggctttga caccacccct tttatgttta 600 agaacttggc tggagcatat ccatcatact ctaccaactg ggccgacgaa accgtgttaa 660 cggctcgtaa cataggccta tgcagctctg acgttatgga gcggtcacgt agagggatgt 720 ccattcttag aaagaagtat ttgaaaccat ccaacaatgt tctattctct gttggctcga 780 ccatctacca cgagaagagg gacttactga ggagctggca cctgccgtct gtatttcact 840 tacgtggcaa gcaaaattac acatgtcggt gtgagactat agttagttgc gacgggtacg 900 tcgttaaaag aatagctatc agtccaggcc tgtatgggaa gccttcaggc tatgctgcta 960 cgatgcaccg cgagggattc ttgtgctgca aagtgacaga cacattgaac ggggagaggg 1020 tctcttttcc cgtgtgcacg tatgtgccag ctacattgtg tgaccaaatg actggcatac 1080 tggcaacaga tgtcagtgcg gacgacgcgc aaaaactgct ggttgggctc aaccagcgta 1140 tagtcgtcaa cggtcgcacc cagagaaaca ccaataccat gaaaaattac cttttgcccg 1200 tagtggccca ggcatttgct aggtgggcaa aggaatataa ggaagatcaa gaagatgaaa 1260 ggccactagg actacgagat agacagttag tcatggggtg ttgttgggct tttagaaggc 1320 acaagataac atctatttat aagcgcccgg atacccaaac catcatcaaa gtgaacagcg 1380 atttccactc attcgtgctg cccaggatag gcagtaacac attggagatc gggctgagaa 1440 caagaatcag gaaaatgtta gaggagcaca aggagccgtc acctctcatt accgccgagg 1500 acgtacaaga agctaagtgc gcagccgatg aggctaagga ggtgcgtgaa gccgaggagt 1560 tgcgcgcagc tctaccacct ttggcagctg atgttgagga gcccactctg gaagccgatg 1620 tcgacttgat gttacaagag gctggggccg gctcagtgga gacacctcgt ggcttgataa 1680 aggttaccag ctacgctggc gaggacaaga tcggctctta cgctgtgctt tctccgcagg 1740 ctgtactcaa gagtgaaaaa ttatcttgca tccaccctct cgctgaacaa gtcatagtga 1800 taacacactc tggccgaaaa gggcgttatg ccgtggaacc ataccatggt aaagtagtgg 1860 tgccagaggg acatgcaata cccgtccagg actttcaagc tctgagtgaa agtgccacca 1920 ttgtgtacaa cgaacgtgag ttcgtaaaca ggtacctgca ccatattgcc acacatggag 1980 gagcgctgaa cactgatgaa gaatattaca aaactgtcaa gcccagcgag cacgacggcg 2040 aatacctgta cgacatcgac aggaaacagt gcgtcaagaa agaactagtc actgggctag 2100 ggctcacagg cgagctggtg gatcctccct tccatgaatt cgcctacgag agtctgagaa 2160 cacgaccagc cgctccttac caagtaccaa ccataggggt gtatggcgtg ccaggatcag 2220 gcaagtctgg catcattaaa agcgcagtca ccaaaaaaga tctagtggtg agcgccaaga 2280 aagaaaactg tgcagaaatt ataagggacg tcaagaaaat gaaagggctg gacgtcaatg 2340 ccagaactgt ggactcagtg ctcttgaatg gatgcaaaca ccccgtagag accctgtata 2400 ttgacgaagc ttttgcttgt catgcaggta ctctcagagc gctcatagcc attataagac 2460 ctaaaaaggc agtgctctgc ggggatccca aacagtgcgg tttttttaac atgatgtgcc 2520 tgaaagtgca ttttaaccac gagatttgca cacaagtctt ccacaaaagc atctctcgcc 2580 gttgcactaa atctgtgact tcggtcgtct caaccttgtt ttacgacaaa aaaatgagaa 2640 cgacgaatcc gaaagagact aagattgtga ttgacactac cggcagtacc aaacctaagc 2700 aggacgatct cattctcact tgtttcagag ggtgggtgaa gcagttgcaa atagattaca 2760 aaggcaacga aataatgacg gcagctgcct ctcaagggct gacccgtaaa ggtgtgtatg 2820 ccgttcggta caaggtgaat gaaaatcctc tgtacgcacc cacctcagaa catgtgaacg 2880 tcctactgac ccgcacggag gaccgcatcg tgtggaaaac actagccggc gacccatgga 2940 taaaaacact gactgccaag taccctggga atttcactgc cacgatagag gagtggcaag 3000 cagagcatga tgccatcatg aggcacatct tggagagacc ggaccctacc gacgtcttcc 3060 agaataaggc aaacgtgtgt tgggccaagg ctttagtgcc ggtgctgaag accgctggca 3120 tagacatgac cactgaacaa tggaacactg tggattattt tgaaacggac aaagctcact 3180 cagcagagat agtattgaac caactatgcg tgaggttctt tggactcgat ctggactccg 3240 gtctattttc tgcacccact gttccgttat ccattaggaa taatcactgg gataactccc 3300 cgtcgcctaa catgtacggg ctgaataaag aagtggtccg tcagctctct cgcaggtacc 3360 cacaactgcc tcgggcagtt gccactggaa gagtctatga catgaacact ggtacactgc 3420 gcaattatga tccgcgcata aacctagtac ctgtaaacag aagactgcct catgctttag 3480 tcctccacca taatgaacac ccacagagtg acttttcttc attcgtcagc aaattgaagg 3540 gcagaactgt cctggtggtc ggggaaaagt tgtccgtccc aggcaaaatg gttgactggt 3600 tgtcagaccg gcctgaggct accttcagag ctcggctgga tttaggcatc ccaggtgatg 3660 tgcccaaata tgacataata tttgttaatg tgaggacccc atataaatac catcactatc 3720 agcagtgtga agaccatgcc attaagctta gcatgttgac caagaaagct tgtctgcatc 3780 tgaatcccgg cggaacctgt gtcagcatag gttatggtta cgctgacagg gccagcgaaa 3840 gcatcattgg tgctatagcg cggcagttca agttttcccg ggtatgcaaa ccgaaatcct 3900 cacttgaaga gacggaagtt ctgtttgtat tcattgggta cgatcgcaag gcccgtacgc 3960 acaatcctta caagctttca tcaaccttga ccaacattta tacaggttcc agactccacg 4020 aagccggatg tgcaccctca tatcatgtgg tgcgagggga tattgccacg gccaccgaag 4080 gagtgattat aaatgctgct aacagcaaag gacaacctgg cggaggggtg tgcggagcgc 4140 tgtataagaa attcccggaa agcttcgatt tacagccgat cgaagtagga aaagcgcgac 4200 tggtcaaagg tgcagctaaa catatcattc atgccgtagg accaaacttc aacaaagttt 4260 cggaggttga aggtgacaaa cagttggcag aggcttatga gtccatcgct aagattgtca 4320 acgataacaa ttacaagtca gtagcgattc cactgttgtc caccggcatc ttttccggga 4380 acaaagatcg actaacccaa tcattgaacc atttgctgac agctttagac accactgatg 4440 cagatgtagc catatactgc agggacaaga aatgggaaat gactctcaag gaagcagtgg 4500 ctaggagaga agcagtggag gagatatgca tatccgacga ctcttcagtg acagaacctg 4560 atgcagagct ggtgagggtg catccgaaga gttctttggc tggaaggaag ggctacagca 4620 caagcgatgg caaaactttc tcatatttgg aagggaccaa gtttcaccag gcggccaagg 4680 atatagcaga aattaatgcc atgtggcccg ttgcaacgga ggccaatgag caggtatgca 4740 tgtatatcct cggagaaagc atgagcagta ttaggtcgaa atgccccgtc gaagagtcgg 4800 aagcctccac accacctagc acgctgcctt gcttgtgcat ccatgccatg actccagaaa 4860 gagtacagcg cctaaaagcc tcacgtccag aacaaattac tgtgtgctca tcctttccat 4920 tgccgaagta tagaatcact ggtgtgcaga agatccaatg ctcccagcct atattgttct 4980 caccgaaagt gcctgcgtat attcatccaa ggaagtatct cgtggaaaca ccaccggtag 5040 acgagactcc ggagccatcg gcagagaacc aatccacaga ggggacacct gaacaaccac 5100 cacttataac cgaggatgag accaggacta gaacgcctga gccgatcatc atcgaagagg 5160 aagaagagga tagcataagt ttgctgtcag atggcccgac ccaccaggtg ctgcaagtcg 5220 aggcagacat tcacgggccg ccctctgtat ctagctcatc ctggtccatt cctcatgcat 5280 ccgactttga tgtggacagt ttatccatac ttgacaccct ggagggagct agcgtgacca 5340 gcggggcaac gtcagccgag actaactctt acttcgcaaa gagtatggag tttctggcgc 5400 gaccggtgcc tgcgcctcga acagtattca ggaaccctcc acatcccgct ccgcgcacaa 5460 gaacaccgtc acttgcaccc agcagggcct gctcgagaac cagcctagtt tccaccccgc 5520 caggcgtgaa tagggtgatc actagagagg agctcgaggc gcttaccccg tcacgcactc 5580 ctagcaggtc ggtctcgaga accagcctgg tctccaaccc gccaggcgta aatagggtga 5640 ttacaagaga ggagtttgag gcgttcgtag cacaacaaca atgacggttt gatgcgggtg 5700 catacatctt ttcctccgac accggtcaag ggcatttaca acaaaaatca gtaaggcaaa 5760 cggtgctatc cgaagtggtg ttggagagga ccgaattgga gatttcgtat gccccgcgcc 5820 tcgaccaaga aaaagaagaa ttactacgca agaaattaca gttaaatccc acacctgcta 5880 acagaagcag ataccagtcc aggaaggtgg agaacatgaa agccataaca gctagacgta 5940 ttctgcaagg cctagggcat tatttgaagg cagaaggaaa agtggagtgc taccgaaccc 6000 tgcatcctgt tcctttgtat tcatctagtg tgaaccgtgc cttttcaagc cccaaggtcg 6060 cagtggaagc ctgtaacgcc atgttgaaag agaactttcc gactgtggct tcttactgta 6120 ttattccaga gtacgatgcc tatttggaca tggttgacgg agcttcatgc tgcttagaca 6180 ctgccagttt ttgccctgca aagctgcgca gctttccaaa gaaacactcc tatttggaac 6240 ccacaatacg atcggcagtg ccttcagcga tccagaacac gctccagaac gtcctggcag 6300 ctgccacaaa aagaaattgc aatgtcacgc aaatgagaga attgcccgta ttggattcgg 6360 cggcctttaa tgtggaatgc ttcaagaaat atgcgtgtaa taatgaatat tgggaaacgt 6420 ttaaagaaaa ccccatcagg cttactgaag aaaacgtggt aaattacatt accaaattaa 6480 aaggaccaaa agctgctgct ctttttgcga agacacataa tttgaatatg ttgcaggaca 6540 taccaatgga caggtttgta atggacttaa agagagacgt gaaagtgact ccaggaacaa 6600 aacatactga agaacggccc aaggtacagg tgatccaggc tgccgatccg ctagcaacag 6660 cgtatctgtg cggaatccac cgagagctgg ttaggagatt aaatgcggtc ctgcttccga 6720 acattcatac actgtttgat atgtcggctg aagactttga cgctattata gccgagcact 6780 tccagcctgg ggattgtgtt ctggaaactg acatcgcgtc gtttgataaa agtgaggacg 6840 acgccatggc tctgaccgcg ttaatgattc tggaagactt aggtgtggac gcagagctgt 6900 tgacgctgat tgaggcggct ttcggcgaaa tttcatcaat acatttgccc actaaaacta 6960 aatttaaatt cggagccatg atgaaatctg gaatgttcct cacactgttt gtgaacacag 7020 tcattaacat tgtaatcgca agcagagtgt tgagagaacg gctaaccgga tcaccatgtg 7080 cagcattcat tggagatgac aatatcgtga aaggagtcaa atcggacaaa ttaatggcag 7140 acaggtgcgc cacctggttg aatatggaag tcaagattat agatgctgtg gtgggcgaga 7200 aagcgcctta tttctgtgga gggtttattt tgtgtgactc cgtgaccggc acagcgtgcc 7260 gtgtggcaga ccccctaaaa aggctgttta agcttggcaa acctctggca gcagacgatg 7320 aacatgatga tgacaggaga agggcattgc atgaagagtc aacacgctgg aaccgagtgg 7380 gtattctttc agagctgtgc aaggcagtag aatcaaggta tgaaaccgta ggaacttcca 7440 tcatagttat ggccatgact actctagcta gcagtgttaa atcattcagc tacctgagag 7500 gggcccctat aactctctac ggctaacctg aatggactac gactctagaa tagtctttaa 7560 ttaaagtccg ccatatgaga tggaagatgc caaaaacatt aagaagggcc cagcgccatt 7620 ctacccactc gaagacggga ccgccggcga gcagctgcac aaagccatga agcgctacgc 7680 cctggtgccc ggcaccatcg cctttaccga cgcacatatc gaggtggaca ttacctacgc 7740 cgagtacttc gagatgagcg ttcggctggc agaagctatg aagcgctatg ggctgaatac 7800 aaaccatcgg atcgtggtgt gcagcgagaa tagcttgcag ttcttcatgc ccgtgttggg 7860 tgccctgttc atcggtgtgg ctgtggcccc agctaacgac atctacaacg agcgcgagct 7920 gctgaacagc atgggcatca gccagcccac cgtcgtattc gtgagcaaga aagggctgca 7980 aaagatcctc aacgtgcaaa agaagctacc gatcatacaa aagatcatca tcatggatag 8040 caagaccgac taccagggct tccaaagcat gtacaccttc gtgacttccc atttgccacc 8100 cggcttcaac gagtacgact tcgtgcccga gagcttcgac cgggacaaaa ccatcgccct 8160 gatcatgaac agtagtggca gtaccggatt gcccaagggc gtagccctac cgcaccgcac 8220 cgcttgtgtc cgattcagtc atgcccgcga ccccatcttc ggcaaccaga tcatccccga 8280 caccgctatc ctcagcgtgg tgccatttca ccacggcttc ggcatgttca ccacgctggg 8340 ctacttgatc tgcggctttc gggtcgtgct catgtaccgc ttcgaggagg agctattctt 8400 gcgcagcttg caagactata agattcaatc tgccctgctg gtgcccacac tatttagctt 8460 cttcgctaag agcactctca tcgacaagta cgacctaagc aacttgcacg agatcgccag 8520 cggcggggcg ccgctcagca aggaggtagg tgaggccgtg gccaaacgct tccacctacc 8580 aggcatccgc cagggctacg gcctgacaga aacaaccagc gccattctga tcacccccga 8640 aggggacgac aagcctggcg cagtaggcaa ggtggtgccc ttcttcgagg ctaaggtggt 8700 ggacttggac accggtaaga cactgggtgt gaaccagcgc ggcgagctgt gcgtccgtgg 8760 ccccatgatc atgagcggct acgttaacaa ccccgaggct acaaacgctc tcatcgacaa 8820 ggacggctgg ctgcacagcg gcgacatcgc ctactgggac gaggacgagc acttcttcat 8880 cgtggaccgg ctgaagagcc tgatcaaata caagggctac caggtagccc cagccgaact 8940 ggagagcatc ctgctgcaac accccaacat cttcgacgcc ggggtcgccg gcctgcccga 9000 cgacgatgcc ggcgagctgc ccgccgcagt cgtcgtgctg gaacacggta aaaccatgac 9060 cgagaaggag atcgtggact atgtggccag ccaggttaca accgccaaga agctgcgcgg 9120 tggtgttgtg ttcgtggacg aggtgcctaa aggactgacc ggcaagttgg acgcccgcaa 9180 gatccgcgag attctcatta aggccaagaa gggcggcaag atcgccgtgt aattcgaacg 9240 gccgtatcac gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgga cgtggttaac 9300 atccctgctg ggaggatcag ccgtaattat tataattggc ttggtgctgg ctactattgt 9360 ggccatgtac gtgctgacca accagaaaca taattgaata cagcagcaat tggcaagctg 9420 cttacataga actcgcggcg attggcatgc cgccttaaaa tttttatttt attttttctt 9480 ttcttttccg aatcggattt tgtttttaat atttcaaaaa aaaaaaaaaa aaaaaaaaaa 9540 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 9595 <210> 16 <211> 139 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 16 Pro Ser Ser Leu Ser Ala Ser Val Gly Asp Arg Val Thr Ile Thr Cys 1 5 10 15 Arg Ala Ser Gln Ser Ile Asn Ser Tyr Leu Asp Trp Tyr Gln Gln Lys 20 25 30 Pro Gly Lys Ala Pro Lys Leu Leu Ile Tyr Ala Ala Ser Ser Leu Gln 35 40 45 Ser Gly Val Pro Ser Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe 50 55 60 Thr Leu Thr Ile Ser Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr 65 70 75 80 Cys Gln Gln Tyr Tyr Ser Thr Pro Phe Thr Phe Gly Pro Gly Thr Lys 85 90 95 Val Glu Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro 100 105 110 Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu 115 120 125 Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val 130 135 <210> 17 <211> 167 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 17 Gly Val Val Gln Pro Gly Arg Ser Leu Arg Leu Ser Cys Ala Ala Ser 1 5 10 15 Gly Phe Thr Phe Ser Ser Tyr Gly Met His Trp Val Arg Gln Ala Pro 20 25 30 Gly Lys Gly Leu Glu Trp Val Ala Val Ile Trp Tyr Asp Gly Ser Asn 35 40 45 Lys Tyr Tyr Ala Asp Ser Val Lys Gly Arg Phe Thr Ile Ser Arg Asp 50 55 60 Asn Ser Lys Asn Thr Leu Tyr Leu Gln Met Asn Ser Leu Arg Ala Glu 65 70 75 80 Asp Thr Ala Val Tyr Tyr Cys Ala Arg Asp Pro Arg Gly Ala Thr Leu 85 90 95 Tyr Tyr Tyr Tyr Tyr Gly Met Asp Val Trp Gly Gln Gly Thr Thr Val 100 105 110 Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala 115 120 125 Pro Cys Ser Arg Ser Thr Ser Glu Ser Thr Ala Ala Leu Gly Cys Leu 130 135 140 Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly 145 150 155 160 Ala Leu Thr Ser Gly Val His 165 <210> 18 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 18 Gly Phe Thr Phe Ser Ser Tyr Gly Met His 1 5 10 <210> 19 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 19 Val Ile Trp Tyr Asp Gly Ser Asn Lys Tyr Tyr Ala Asp Ser Val 1 5 10 15 <210> 20 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 20 Asp Pro Arg Gly Ala Thr Leu Tyr Tyr Tyr Tyr Tyr Gly Met Asp Val 1 5 10 15 <210> 21 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 21 Arg Ala Ser Gln Ser Ile Asn Ser Tyr Leu Asp 1 5 10 <210> 22 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 22 Ala Ala Ser Ser Leu Gln Ser 1 5 <210> 23 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 23 Gln Gln Tyr Tyr Ser Thr Pro Phe Thr 1 5 <210> 24 <211> 108 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 24 Glu Ile Val Leu Thr Gln Ser Pro Gly Thr Leu Ser Leu Ser Pro Gly 1 5 10 15 Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln Arg Val Ser Ser Ser 20 25 30 Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu 35 40 45 Ile Tyr Asp Ala Ser Ser Arg Ala Thr Gly Ile Pro Asp Arg Phe Ser 50 55 60 Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Arg Leu Glu 65 70 75 80 Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Tyr Gly Ser Leu Pro 85 90 95 Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys 100 105 <210> 25 <211> 121 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 25 Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly 1 5 10 15 Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Arg Tyr 20 25 30 Trp Met Ser Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val 35 40 45 Ala Asn Ile Lys Gln Asp Gly Ser Glu Lys Tyr Tyr Val Asp Ser Val 50 55 60 Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Ser Leu Tyr 65 70 75 80 Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys 85 90 95 Ala Arg Glu Gly Gly Trp Phe Gly Glu Leu Ala Phe Asp Tyr Trp Gly 100 105 110 Gln Gly Thr Leu Val Thr Val Ser Ser 115 120 <210> 26 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 26 Arg Tyr Trp Met Ser 1 5 <210> 27 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 27 Asn Ile Lys Gln Asp Gly Ser Glu Lys Tyr Tyr Val Asp Ser Val Lys 1 5 10 15 Gly <210> 28 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 28 Glu Gly Gly Trp Phe Gly Glu Leu Ala Phe Asp Tyr 1 5 10 <210> 29 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 29 Arg Ala Ser Gln Arg Val Ser Ser Ser Tyr Leu Ala 1 5 10 <210> 30 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 30 Asp Ala Ser Ser Arg Ala Thr 1 5 <210> 31 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 31 Gln Gln Tyr Gly Ser Leu Pro Trp Thr 1 5 <210> 32 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 32 gcccgggcat ttaaatgcga tcgcatcgat tacgactcta gaatagtcta gtccgcaggc 60 caccatgcag atcttcgtga agaccctgac cggcaagacc atcaccctag aggtggagcc 120 cagtgacacc atcgagaacg tgaaggccaa gatccaggat aaagagggca tcccccctga 180 ccagcagagg ctgatctttg ccggcaagca gctggaagat ggccgcaccc tctctgatta 240 caacatccag aaggagtcaa ccctgcacct ggtccttcgc ctgagaggtg ccatgtttca 300 ggcgctgagc gaaggctgca ccccgtatga tattaaccag atgctgaacg tgctgggcga 360 tcatcaggtc tcaggccttg agcagcttga gagtataatc aactttgaaa aactgactga 420 atggaccagt tctaatgtta tgcctatcct gtctcctctg acaaagggca tcctgggctt 480 cgtgtttacc ctgaccgtgc cttctgagag aggacttagc tgcattagcg aagcggatgc 540 gaccaccccg gaaagcgcga acctgggcga agaaattctg agccagctgt atctttggcc 600 aagggtgacc taccattccc ctagttatgc ttaccaccaa tttgaaagac gagccaaata 660 taaaagacac ttccccggct ttggccagag cctgctgttt ggctaccctg tgtacgtgtt 720 cggcgattgc gtgcagggcg attgggatgc gattcgcttt cgctattgcg cgccgccggg 780 ctatgcgctg ctgcgctgca acgataccaa ctatagcgct ctgctggctg tgggggccct 840 agaaggaccc aggaatcagg actggcttgg tgtcccaaga caacttgtaa ctcggatgca 900 ggctattcag aatgccggcc tgtgtaccct ggtggccatg ctggaagaga caatcttctg 960 gctgcaagcg tttctgatgg cgctgaccga tagcggcccg aaaaccaaca ttattgtgga 1020 tagccagtat gtgatgggca ttagcaaacc gagctttcag gaatttgtgg attgggaaaa 1080 cgtgagcccg gaactgaaca gcaccgatca gccgttttgg caagccggaa tcctggccag 1140 aaatctggtg cctatggtgg ccacagtgca gggccagaac ctgaagtacc agggtcagtc 1200 actagtcatc tctgcttcta tcattgtctt caacctgctg gaactggaag gtgattatcg 1260 agatgatggc aacgtgtggg tgcatacccc gctgagcccg cgcaccctga acgcgtgggt 1320 gaaagcggtg gaagaaaaaa aaggtattcc agttcaccta gagctggcca gtatgaccaa 1380 catggagctc atgagcagta ttgtgcatca gcaggtcaga acatacggcc ccgtgttcat 1440 gtgtctcggc ggactgctta caatggtggc tggtgctgtg tggctgacag tgcgagtgct 1500 cgagctgttc cgggccgcgc agctggccaa cgacgtggtc ctccagatca tggagctttg 1560 tggtgcagcg tttcgccagg tgtgccatac caccgtgccg tggccgaacg cgagcctgac 1620 cccgaaatgg aacaacgaaa ccacccagcc ccagatcgcc aactgcagcg tgtatgactt 1680 ttttgtgtgg ctccattatt attctgttcg agacacactt tggccaaggg tgacctacca 1740 tatgaacaaa tatgcgtatc atatgctgga aagacgagcc aaatataaaa gaggaccagg 1800 acctggcgct aaatttgtgg ccgcctggac actgaaagcc gctgctggtc ctggacctgg 1860 ccagtacatc aaggccaaca gcaagttcat cggcatcacc gaactcggac ccggaccagg 1920 ctgatgattt cgaaatttaa ataagcttgc ggccgctagg gataacaggg taattatcac 1980 gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgg 2019 <210> 33 <211> 619 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 33 Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu 1 5 10 15 Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp 20 25 30 Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys 35 40 45 Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu 50 55 60 Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Ala Met Phe Gln Ala 65 70 75 80 Leu Ser Glu Gly Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Asn Val 85 90 95 Leu Gly Asp His Gln Val Ser Gly Leu Glu Gln Leu Glu Ser Ile Ile 100 105 110 Asn Phe Glu Lys Leu Thr Glu Trp Thr Ser Ser Asn Val Met Pro Ile 115 120 125 Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe Thr Leu Thr 130 135 140 Val Pro Ser Glu Arg Gly Leu Ser Cys Ile Ser Glu Ala Asp Ala Thr 145 150 155 160 Thr Pro Glu Ser Ala Asn Leu Gly Glu Glu Ile Leu Ser Gln Leu Tyr 165 170 175 Leu Trp Pro Arg Val Thr Tyr His Ser Pro Ser Tyr Ala Tyr His Gln 180 185 190 Phe Glu Arg Arg Ala Lys Tyr Lys Arg His Phe Pro Gly Phe Gly Gln 195 200 205 Ser Leu Leu Phe Gly Tyr Pro Val Tyr Val Phe Gly Asp Cys Val Gln 210 215 220 Gly Asp Trp Asp Ala Ile Arg Phe Arg Tyr Cys Ala Pro Pro Gly Tyr 225 230 235 240 Ala Leu Leu Arg Cys Asn Asp Thr Asn Tyr Ser Ala Leu Leu Ala Val 245 250 255 Gly Ala Leu Glu Gly Pro Arg Asn Gln Asp Trp Leu Gly Val Pro Arg 260 265 270 Gln Leu Val Thr Arg Met Gln Ala Ile Gln Asn Ala Gly Leu Cys Thr 275 280 285 Leu Val Ala Met Leu Glu Glu Thr Ile Phe Trp Leu Gln Ala Phe Leu 290 295 300 Met Ala Leu Thr Asp Ser Gly Pro Lys Thr Asn Ile Ile Val Asp Ser 305 310 315 320 Gln Tyr Val Met Gly Ile Ser Lys Pro Ser Phe Gln Glu Phe Val Asp 325 330 335 Trp Glu Asn Val Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Trp 340 345 350 Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val Ala Thr Val 355 360 365 Gln Gly Gln Asn Leu Lys Tyr Gln Gly Gln Ser Leu Val Ile Ser Ala 370 375 380 Ser Ile Ile Val Phe Asn Leu Leu Glu Leu Glu Gly Asp Tyr Arg Asp 385 390 395 400 Asp Gly Asn Val Trp Val His Thr Pro Leu Ser Pro Arg Thr Leu Asn 405 410 415 Ala Trp Val Lys Ala Val Glu Glu Lys Lys Gly Ile Pro Val His Leu 420 425 430 Glu Leu Ala Ser Met Thr Asn Met Glu Leu Met Ser Ser Ile Val His 435 440 445 Gln Gln Val Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu 450 455 460 Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Arg Val Leu Glu 465 470 475 480 Leu Phe Arg Ala Ala Gln Leu Ala Asn Asp Val Val Leu Gln Ile Met 485 490 495 Glu Leu Cys Gly Ala Ala Phe Arg Gln Val Cys His Thr Thr Val Pro 500 505 510 Trp Pro Asn Ala Ser Leu Thr Pro Lys Trp Asn Asn Glu Thr Thr Gln 515 520 525 Pro Gln Ile Ala Asn Cys Ser Val Tyr Asp Phe Phe Val Trp Leu His 530 535 540 Tyr Tyr Ser Val Arg Asp Thr Leu Trp Pro Arg Val Thr Tyr His Met 545 550 555 560 Asn Lys Tyr Ala Tyr His Met Leu Glu Arg Arg Ala Lys Tyr Lys Arg 565 570 575 Gly Pro Gly Pro Gly Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala 580 585 590 Ala Ala Gly Pro Gly Pro Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe 595 600 605 Ile Gly Ile Thr Glu Leu Gly Pro Gly Pro Gly 610 615 <210> 34 <211> 1638 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 34 atggccggga tgttccaggc actgtccgaa ggctgcacac cctatgatat taaccagatg 60 ctgaatgtcc tgggagacca ccaggtctct ggcctggagc agctggagag catcatcaac 120 ttcgagaagc tgaccgagtg gacaagctcc aatgtgatgc ctatcctgtc cccactgacc 180 aagggcatcc tgggcttcgt gtttaccctg acagtgcctt ctgagcgggg cctgtcttgc 240 atcagcgagg cagacgcaac cacaccagag tccgccaatc tgggcgagga gatcctgtct 300 cagctgtacc tgtggccccg ggtgacatat cactcccctt cttacgccta tcaccagttc 360 gagcggagag ccaagtacaa gagacacttc ccaggctttg gccagtctct gctgttcggc 420 taccccgtgt acgtgttcgg cgattgcgtg cagggcgact gggatgccat ccggtttaga 480 tactgcgcac cacctggata tgcactgctg aggtgtaacg acaccaatta ttccgccctg 540 ctggcagtgg gcgccctgga gggccctcgc aatcaggatt ggctgggcgt gccaaggcag 600 ctggtgacac gcatgcaggc catccagaac gcaggcctgt gcaccctggt ggcaatgctg 660 gaggagacaa tcttctggct gcaggccttt ctgatggccc tgaccgacag cggccccaag 720 acaaacatca tcgtggattc ccagtacgtg atgggcatct ccaagccttc tttccaggag 780 tttgtggact gggagaacgt gagcccagag ctgaattcca ccgatcagcc attctggcag 840 gcaggaatcc tggcaaggaa cctggtgcct atggtggcca cagtgcaggg ccagaatctg 900 aagtaccagg gccagagcct ggtcatcagc gcctccatca tcgtgtttaa cctgctggag 960 ctggagggcg actatcggga cgatggcaac gtgtgggtgc acaccccact gagccccaga 1020 acactgaacg cctgggtgaa ggccgtggag gagaagaagg gcatcccagt gcacctggag 1080 ctggcctcca tgaccaatat ggagctgatg tctagcatcg tgcaccagca ggtgaggaca 1140 tacggacccg tgttcatgtg cctgggaggc ctgctgacca tggtggcagg agccgtgtgg 1200 ctgacagtgc gggtgctgga gctgttcaga gccgcccagc tggccaacga tgtggtgctg 1260 cagatcatgg agctgtgcgg agcagccttt cgccaggtgt gccacaccac agtgccatgg 1320 cccaatgcct ccctgacccc caagtggaac aatgagacaa cacagcctca gatcgccaac 1380 tgtagcgtgt acgacttctt cgtgtggctg cactactata gcgtgaggga taccctgtgg 1440 ccccgcgtga cataccacat gaataagtac gcctatcaca tgctggagag gcgcgccaag 1500 tataagagag gccctggccc aggcgcaaag tttgtggcag catggaccct gaaggccgcc 1560 gccggccccg gccccggcca gtatatcaag gctaacagta agttcattgg aatcacagag 1620 ctgggacccg gacctgga 1638 <210> 35 <211> 546 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 35 Met Ala Gly Met Phe Gln Ala Leu Ser Glu Gly Cys Thr Pro Tyr Asp 1 5 10 15 Ile Asn Gln Met Leu Asn Val Leu Gly Asp His Gln Val Ser Gly Leu 20 25 30 Glu Gln Leu Glu Ser Ile Ile Asn Phe Glu Lys Leu Thr Glu Trp Thr 35 40 45 Ser Ser Asn Val Met Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu 50 55 60 Gly Phe Val Phe Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Ser Cys 65 70 75 80 Ile Ser Glu Ala Asp Ala Thr Thr Pro Glu Ser Ala Asn Leu Gly Glu 85 90 95 Glu Ile Leu Ser Gln Leu Tyr Leu Trp Pro Arg Val Thr Tyr His Ser 100 105 110 Pro Ser Tyr Ala Tyr His Gln Phe Glu Arg Arg Ala Lys Tyr Lys Arg 115 120 125 His Phe Pro Gly Phe Gly Gln Ser Leu Leu Phe Gly Tyr Pro Val Tyr 130 135 140 Val Phe Gly Asp Cys Val Gln Gly Asp Trp Asp Ala Ile Arg Phe Arg 145 150 155 160 Tyr Cys Ala Pro Pro Gly Tyr Ala Leu Leu Arg Cys Asn Asp Thr Asn 165 170 175 Tyr Ser Ala Leu Leu Ala Val Gly Ala Leu Glu Gly Pro Arg Asn Gln 180 185 190 Asp Trp Leu Gly Val Pro Arg Gln Leu Val Thr Arg Met Gln Ala Ile 195 200 205 Gln Asn Ala Gly Leu Cys Thr Leu Val Ala Met Leu Glu Glu Thr Ile 210 215 220 Phe Trp Leu Gln Ala Phe Leu Met Ala Leu Thr Asp Ser Gly Pro Lys 225 230 235 240 Thr Asn Ile Ile Val Asp Ser Gln Tyr Val Met Gly Ile Ser Lys Pro 245 250 255 Ser Phe Gln Glu Phe Val Asp Trp Glu Asn Val Ser Pro Glu Leu Asn 260 265 270 Ser Thr Asp Gln Pro Phe Trp Gln Ala Gly Ile Leu Ala Arg Asn Leu 275 280 285 Val Pro Met Val Ala Thr Val Gln Gly Gln Asn Leu Lys Tyr Gln Gly 290 295 300 Gln Ser Leu Val Ile Ser Ala Ser Ile Ile Val Phe Asn Leu Leu Glu 305 310 315 320 Leu Glu Gly Asp Tyr Arg Asp Asp Gly Asn Val Trp Val His Thr Pro 325 330 335 Leu Ser Pro Arg Thr Leu Asn Ala Trp Val Lys Ala Val Glu Glu Lys 340 345 350 Lys Gly Ile Pro Val His Leu Glu Leu Ala Ser Met Thr Asn Met Glu 355 360 365 Leu Met Ser Ser Ile Val His Gln Gln Val Arg Thr Tyr Gly Pro Val 370 375 380 Phe Met Cys Leu Gly Gly Leu Leu Thr Met Val Ala Gly Ala Val Trp 385 390 395 400 Leu Thr Val Arg Val Leu Glu Leu Phe Arg Ala Ala Gln Leu Ala Asn 405 410 415 Asp Val Val Leu Gln Ile Met Glu Leu Cys Gly Ala Ala Phe Arg Gln 420 425 430 Val Cys His Thr Thr Val Pro Trp Pro Asn Ala Ser Leu Thr Pro Lys 435 440 445 Trp Asn Asn Glu Thr Thr Gln Pro Gln Ile Ala Asn Cys Ser Val Tyr 450 455 460 Asp Phe Phe Val Trp Leu His Tyr Tyr Ser Val Arg Asp Thr Leu Trp 465 470 475 480 Pro Arg Val Thr Tyr His Met Asn Lys Tyr Ala Tyr His Met Leu Glu 485 490 495 Arg Arg Ala Lys Tyr Lys Arg Gly Pro Gly Pro Gly Ala Lys Phe Val 500 505 510 Ala Ala Trp Thr Leu Lys Ala Ala Ala Gly Pro Gly Pro Gly Gln Tyr 515 520 525 Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu Gly Pro Gly 530 535 540 Pro Gly 545 <210> 36 <211> 2019 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 36 gcccgggcat ttaaatgcga tcgcatcgat tacgactcta gaatagtcta gtccgcaggc 60 caccatgcag atcttcgtga agaccctgac cggcaagacc atcaccctag aggtggagcc 120 cagtgacacc atcgagaacg tgaaggccaa gatccaggat aaagagggca tcccccctga 180 ccagcagagg ctgatctttg ccggcaagca gctggaagat ggccgcaccc tctctgatta 240 caacatccag aaggagtcaa ccctgcacct ggtccttcgc ctgagaggtg ccatgtttca 300 ggcgctgagc gaaggctgca ccccgtatga tattaaccag atgctgaacg tgctgggcga 360 tcatcagttt aagcacatca aagcctttga ccggacattt gctaacaacc caggtcccat 420 ggttgtgttt gccacacctg ggcctatcct gtctcctctg acaaagggca tcctgggctt 480 cgtgtttacc ctgaccgtgc cttctgagag aggacttagc tgcattagcg aagcggatgc 540 gaccaccccg gaaagcgcga acctgggcga agaaattctg agccagctgt atctttggcc 600 aagggtgacc taccattccc ctagttatgc ttaccaccaa tttgaaagac gagccaaata 660 taaaagacac ttccccggct ttggccagag cctgctgttt ggctaccctg tgtacgtgtt 720 cggcgattgc gtgcagggcg attgggatgc gattcgcttt cgctattgcg cgccgccggg 780 ctatgcgctg ctgcgctgca acgataccaa ctatagcgct ctgctggctg tgggggccct 840 agaaggaccc aggaatcagg actggcttgg tgtcccaaga caacttgtaa ctcggatgca 900 ggctattcag aatgccggcc tgtgtaccct ggtggccatg ctggaagaga caatcttctg 960 gctgcaagcg tttctgatgg cgctgaccga tagcggcccg aaaaccaaca ttattgtgga 1020 tagccagtat gtgatgggca ttagcaaacc gagctttcag gaatttgtgg attgggaaaa 1080 cgtgagcccg gaactgaaca gcaccgatca gccgttttgg caagccggaa tcctggccag 1140 aaatctggtg cctatggtgg ccacagtgca gggccagaac ctgaagtacc agggtcagtc 1200 actagtcatc tctgcttcta tcattgtctt caacctgctg gaactggaag gtgattatcg 1260 agatgatggc aacgtgtggg tgcatacccc gctgagcccg cgcaccctga acgcgtgggt 1320 gaaagcggtg gaagaaaaaa aaggtattcc agttcaccta gagctggcca gtatgaccaa 1380 catggagctc atgagcagta ttgtgcatca gcaggtcaga acatacggcc ccgtgttcat 1440 gtgtctcggc ggactgctta caatggtggc tggtgctgtg tggctgacag tgcgagtgct 1500 cgagctgttc cgggccgcgc agctggccaa cgacgtggtc ctccagatca tggagctttg 1560 tggtgcagcg tttcgccagg tgtgccatac caccgtgccg tggccgaacg cgagcctgac 1620 cccgaaatgg aacaacgaaa ccacccagcc ccagatcgcc aactgcagcg tgtatgactt 1680 ttttgtgtgg ctccattatt attctgttcg agacacactt tggccaaggg tgacctacca 1740 tatgaacaaa tatgcgtatc atatgctgga aagacgagcc aaatataaaa gaggaccagg 1800 acctggcgct aaatttgtgg ccgcctggac actgaaagcc gctgctggtc ctggacctgg 1860 ccagtacatc aaggccaaca gcaagttcat cggcatcacc gaactcggac ccggaccagg 1920 ctgatgattt cgaaatttaa ataagcttgc ggccgctagg gataacaggg taattatcac 1980 gcccaaacat ttacagccgc ggtgtcaaaa accgcgtgg 2019 <210> 37 <211> 619 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 37 Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu 1 5 10 15 Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp 20 25 30 Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys 35 40 45 Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu 50 55 60 Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Ala Met Phe Gln Ala 65 70 75 80 Leu Ser Glu Gly Cys Thr Pro Tyr Asp Ile Asn Gln Met Leu Asn Val 85 90 95 Leu Gly Asp His Gln Phe Lys His Ile Lys Ala Phe Asp Arg Thr Phe 100 105 110 Ala Asn Asn Pro Gly Pro Met Val Val Phe Ala Thr Pro Gly Pro Ile 115 120 125 Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe Thr Leu Thr 130 135 140 Val Pro Ser Glu Arg Gly Leu Ser Cys Ile Ser Glu Ala Asp Ala Thr 145 150 155 160 Thr Pro Glu Ser Ala Asn Leu Gly Glu Glu Ile Leu Ser Gln Leu Tyr 165 170 175 Leu Trp Pro Arg Val Thr Tyr His Ser Pro Ser Tyr Ala Tyr His Gln 180 185 190 Phe Glu Arg Arg Ala Lys Tyr Lys Arg His Phe Pro Gly Phe Gly Gln 195 200 205 Ser Leu Leu Phe Gly Tyr Pro Val Tyr Val Phe Gly Asp Cys Val Gln 210 215 220 Gly Asp Trp Asp Ala Ile Arg Phe Arg Tyr Cys Ala Pro Pro Gly Tyr 225 230 235 240 Ala Leu Leu Arg Cys Asn Asp Thr Asn Tyr Ser Ala Leu Leu Ala Val 245 250 255 Gly Ala Leu Glu Gly Pro Arg Asn Gln Asp Trp Leu Gly Val Pro Arg 260 265 270 Gln Leu Val Thr Arg Met Gln Ala Ile Gln Asn Ala Gly Leu Cys Thr 275 280 285 Leu Val Ala Met Leu Glu Glu Thr Ile Phe Trp Leu Gln Ala Phe Leu 290 295 300 Met Ala Leu Thr Asp Ser Gly Pro Lys Thr Asn Ile Ile Val Asp Ser 305 310 315 320 Gln Tyr Val Met Gly Ile Ser Lys Pro Ser Phe Gln Glu Phe Val Asp 325 330 335 Trp Glu Asn Val Ser Pro Glu Leu Asn Ser Thr Asp Gln Pro Phe Trp 340 345 350 Gln Ala Gly Ile Leu Ala Arg Asn Leu Val Pro Met Val Ala Thr Val 355 360 365 Gln Gly Gln Asn Leu Lys Tyr Gln Gly Gln Ser Leu Val Ile Ser Ala 370 375 380 Ser Ile Ile Val Phe Asn Leu Leu Glu Leu Glu Gly Asp Tyr Arg Asp 385 390 395 400 Asp Gly Asn Val Trp Val His Thr Pro Leu Ser Pro Arg Thr Leu Asn 405 410 415 Ala Trp Val Lys Ala Val Glu Glu Lys Lys Gly Ile Pro Val His Leu 420 425 430 Glu Leu Ala Ser Met Thr Asn Met Glu Leu Met Ser Ser Ile Val His 435 440 445 Gln Gln Val Arg Thr Tyr Gly Pro Val Phe Met Cys Leu Gly Gly Leu 450 455 460 Leu Thr Met Val Ala Gly Ala Val Trp Leu Thr Val Arg Val Leu Glu 465 470 475 480 Leu Phe Arg Ala Ala Gln Leu Ala Asn Asp Val Val Leu Gln Ile Met 485 490 495 Glu Leu Cys Gly Ala Ala Phe Arg Gln Val Cys His Thr Thr Val Pro 500 505 510 Trp Pro Asn Ala Ser Leu Thr Pro Lys Trp Asn Asn Glu Thr Thr Gln 515 520 525 Pro Gln Ile Ala Asn Cys Ser Val Tyr Asp Phe Phe Val Trp Leu His 530 535 540 Tyr Tyr Ser Val Arg Asp Thr Leu Trp Pro Arg Val Thr Tyr His Met 545 550 555 560 Asn Lys Tyr Ala Tyr His Met Leu Glu Arg Arg Ala Lys Tyr Lys Arg 565 570 575 Gly Pro Gly Pro Gly Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala 580 585 590 Ala Ala Gly Pro Gly Pro Gly Gln Tyr Ile Lys Ala Asn Ser Lys Phe 595 600 605 Ile Gly Ile Thr Glu Leu Gly Pro Gly Pro Gly 610 615 <210> 38 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 38 atgcagatct tcgtgaagac cctgaccggc aagaccatca ccctagaggt ggagcccagt 60 gacaccatcg agaacgtgaa ggccaagatc caggataaag agggcatccc ccctgaccag 120 cagaggctga tctttgccgg caagcagctg gaagatggcc gcaccctctc tgattacaac 180 atccagaagg agtcaaccct gcacctggtc cttcgcctga gaggtggc 228 <210> 39 <211> 228 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 atgcagatct tcgtgaagac cctgaccggc aagaccatca ccctagaggt ggagcccagt 60 gacaccatcg agaacgtgaa ggccaagatc caggataaag agggcatccc ccctgaccag 120 cagaggctga tctttgccgg caagcagctg gaagatggcc gcaccctctc tgattacaac 180 atccagaagg agtcaaccct gcacctggtc cttcgcctga gaggtgcc 228 <210> 40 <211> 78 <212> DNA <213> Homo sapiens <400> 40 atggccgtca tggcgccccg aaccctcgtc ctgctactct cgggggctct ggccctgacc 60 cagacctggg cgggctct 78 <210> 41 <211> 201 <212> DNA <213> Homo sapiens <400> 41 ccgtcttccc agcccaccat ccccatcgtg ggcatcattg ctggcctggt tctctttgga 60 gctgtgatca ctggagctgt ggtcgctgct gtgatgtgga ggaggaagag ctcagataga 120 aaaggaggga gctactctca ggctgcaagc agtgacagtg cccagggctc tgatgtgtct 180 ctcacagctt gtaaagtgtg a 201 <210> 42 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 42 atggagaccg atacactgct gctgtgggtg ctgctcctgt gggtgccagg aagcacaggc 60 <210> 43 <211> 3178 <212> DNA <213> Homo sapiens <400> 43 ggcaccgatt cggggcctgc ccggacttcg ccgcacgctg cagaacctcg cccagcgccc 60 accatgcccc ggcagctcag cgcggcggcc gcgctcttcg cgtccctggc cgtaattttg 120 cacgatggca gtcaaatgag agcaaaagca tttccagaaa ccagagatta ttctcaacct 180 actgcagcag caacagtaca ggacataaaa aaacctgtcc agcaaccagc taagcaagca 240 cctcaccaaa ctttagcagc aagattcatg gatggtcata tcacctttca aacagcggcc 300 acagtaaaaa ttccaacaac taccccagca actacaaaaa acactgcaac caccagccca 360 attacctaca ccctggtcac aacccaggcc acacccaaca actcacacac agctcctcca 420 gttactgaag ttacagtcgg ccctagctta gccccttatt cactgccacc caccatcacc 480 ccaccagctc atacagctgg aaccagttca tcaaccgtca gccacacaac tgggaacacc 540 actcaaccca gtaaccagac cacccttcca gcaactttat cgatagcact gcacaaaagc 600 acaaccggtc agaagcctga tcaacccacc catgccccag gaacaacggc agctgcccac 660 aataccaccc gcacagctgc acctgcctcc acggttcctg ggcccaccct tgcacctcag 720 ccatcgtcag tcaagactgg aatttatcag gttctaaacg gaagcagact ctgtataaaa 780 gcagagatgg ggatacagct gattgttcaa gacaaggagt cggttttttc acctcggaga 840 tacttcaaca tcgaccccaa cgcaacgcaa gcctctggga actgtggcac ccgaaaatcc 900 aaccttctgt tgaattttca gggcggattt gtgaatctca catttaccaa ggatgaagaa 960 tcatattata tcagtgaagt gggagcctat ttgaccgtct cagatccaga gacagtttac 1020 caaggaatca aacatgcggt ggtgatgttc cagacagcag tcgggcattc cttcaagtgc 1080 gtgagtgaac agagcctcca gttgtcagcc cacctgcagg tgaaaacaac cgatgtccaa 1140 cttcaagcct ttgattttga agatgaccac tttggaaatg tggatgagtg ctcgtctgac 1200 tacacaattg tgcttcctgt gattggggcc atcgtggttg gtctctgcct tatgggtatg 1260 ggtgtctata aaatccgcct aaggtgtcaa tcatctggat accagagaat ctaattgttg 1320 cccgggggga atgaaaataa tggaatttag agaactcttt catcccttcc aggatggatg 1380 ttgggaaatt ccctcagagt gtgggtcctt caaacaatgt aaaccaccat cttctattca 1440 aatgaagtga gtcatgtgtg atttaagttc aggcagcaca tcaatttcta aatacttttt 1500 gtttatttta tgaaagatat agtgagctgt ttattttcta gtttccttta gaatatttta 1560 gccactcaaa gtcaacattt gagatatgtt gaattaacat aatatatgta aagtagaata 1620 agccttcaaa ttataaacca agggtcaatt gtaactaata ctactgtgtg tgcattgaag 1680 attttatttt acccttgatc ttaacaaagc ctttgctttg ttatcaaatg gactttcagt 1740 gcttttacta tctgtgtttt atggtttcat gtaacataca tattcctggt gtagcactta 1800 actccttttc cactttaaat ttgtttttgt tttttgagac ggagtttcac tcttgtcacc 1860 caggctggag tacagtggca cgatctcggc ttatggcaac ctccgcctcc cgggttcaag 1920 tgattctcct gcttcagctt cccgagtagc tgggattaca ggcacacact accacgcctg 1980 gctaattttt gtatttttat tatagacggg tttcaccatg ttggccagac tggtcttgaa 2040 ctcttgacct caggtgatcc acccacctca gcctcccaaa gtgctgggat tacaggcatg 2100 agccattgcg cccggcctta aatgtttttt ttaatcatca aaaagaacaa catatctcag 2160 gttgtctaag tgtttttatg taaaaccaac aaaaagaaca aatcagctta tattttttat 2220 cttgatgact cctgctccag aattgctaga ctaagaatta ggtggctaca gatggtagaa 2280 ctaaacaata agcaagagac aataataatg gcccttaatt attaacaaag tgccagagtc 2340 taggctaagc actttatcta tatctcattt cattctcaca acttataagt gaatgagtaa 2400 actgagactt aagggaactg aatcacttaa atgtcacctg gctaactgat ggcagagcca 2460 gagcttgaat tcatgttggt ctgacatcaa ggtctttggt cttctcccta caccaagtta 2520 cctacaagaa caatgacacc acactctgcc tgaaggctca cacctcatac cagcatacgc 2580 tcaccttaca gggaaatggg tttatccagg atcatgagac attagggtag atgaaaggag 2640 agctttgcag ataacaaaat agcctatcct taataaatcc tccactctct ggaaggagac 2700 tgaggggctt tgtaaaacat tagtcagttg ctcattttta tgggattgct tagctgggct 2760 gtaaagatga aggcatcaaa taaactcaaa gtatttttaa atttttttga taatagagaa 2820 acttcgctaa ccaactgttc tttcttgagt gtatagcccc atcttgtggt aacttgctgc 2880 ttctgcactt catatccata tttcctattg ttcactttat tctgtagagc agcctgccaa 2940 gaattttatt tctgctgttt tttttgctgc taaagaaagg aactaagtca ggatgttaac 3000 agaaaagtcc acataaccct agaattctta gtcaaggaat aattcaagtc agcctagaga 3060 ccatgttgac tttcctcatg tgtttcctta tgactcagta agttggcaag gtcctgactt 3120 tagtcttaat aaaacattga attgtagtaa aggtttttgc aataaaaact tactttgg 3178 <210> 44 <211> 1858 <212> DNA <213> Mus sp. <400> 44 attccggagg tgaaaaacaa tggcacaacg tgtataatgg ccagcttctc tgcctccttt 60 ctgaccacct acgagactgc gaatggttct cagatcgtga acatttccct gccagcctct 120 gcagaagtac tgaaaaatgg cagttcttgt ggtaaagaaa atgtttctga ccccagcctc 180 acaattactt ttggaagagg atatttactg acactcaact tcacaaaaaa tacaacacgt 240 tacagtgtcc agcatatgta ttttacatat aacttgtcag atacagaaca ttttcccaat 300 gccatcagca aagagatcta caccatggat tccacaactg acatcaaggc agacatcaac 360 aaagcatacc ggtgtgtcag tgatatccgg gtctacatga agaatgtgac cgttgtgctc 420 cgggatgcca ctatccaggc ctacctgtcg agtggcaact tcagcaagga agagacacac 480 tgcacacagg atggaccttc cccaaccact gggccaccca gcccctcacc accacttgtg 540 cccacaaacc ccactgtatc caagtacaat gttactggta acaacggaac ctgcctgctg 600 gcctctatgg cactgcaact gaatatcacc tacctgaaaa aggacaacaa gacggtgacc 660 agagcgttca acatcagccc aaatgacaca tctagtggga gttgcggtat caacttggtg 720 accctgaaag tggagaacaa gaacagagcc ctggaattgc agtttgggat gaatgccagc 780 tctagcctgt ttttcttgca aggagtgcgc ttgaatatga ctcttcctga tgccctagtg 840 cccacattca gcatctccaa ccattcactg aaagctcttc aggccactgt gggaaactca 900 tacaagtgca acactgagga acacatcttt gtcagcaaga tgctctccct caatgtcttc 960 agtgtgcagg tccaggcttt caaggtggac agtgacaggt ttgggtctgt ggaagagtgt 1020 gttcaggatg gtaacaacat gttgatcccc attgctgtgg gcggtgccct ggcagggctg 1080 atcctcatcg tcctcattgc ctacctcatt ggcaggaaga ggagtcacgc cggctatcag 1140 accatctagc ctggtgggca ggtgcaccag agatgcacag gggcctgttc tcacatcccc 1200 aagcttagat aggtgtggaa gggaggcaca ctttctggca aactgtttta aaatctgctt 1260 tatcaaatgt gaagttcatc ttgcaacatt tactatgcac aaaggaataa ctattgaaat 1320 gacggtgtta attttgctaa ctgggttaaa tattgatgag aaggctccac tgatttgact 1380 tttaagactt ggtgtttggt tcttcattct tttactcaga tttaagccta tcaaagggat 1440 actctggtcc agaccttggc ctggcaaggg tggctgatgg ttaggctgca cacacttaag 1500 aagcaacggg agcagggaag gcttgcacac aggcacgcac agggtcaacc tctggacact 1560 tggcttgggc tacctggcct tgggggggct gaactctggc atctggctgg gtacacaccc 1620 ccccaatttc tgtgctctgc cacccgtgag ctgccacttt cctaaataga aaatggcatt 1680 atttttattt acttttttgt aaagtgattt ccagtcttgt gttggcgttc agggtggccc 1740 tgtctctgca ctgtgtacaa taatagattc acactgctga cgtgtcttgc agcgtaggtg 1800 ggttgtacac tgggcatcag ctcacgtaat gcattgcctg taacgatgct aataaaaa 1858 <210> 45 <211> 2339 <212> DNA <213> Homo sapiens <400> 45 ggcccaaccg ccgcccgcgc ccccgctctc cgcaccgtac ccggccgcct cgcgccatgg 60 cggcccccgg cagcgcccgg cgacccctgc tgctgctact gctgttgctg ctgctcggcc 120 tcatgcattg tgcgtcagca gcaatgttta tggtgaaaaa tggcaacggg accgcgtgca 180 taatggccaa cttctctgct gccttctcag tgaactacga caccaagagt ggccctaaga 240 acatgacctt tgacctgcca tcagatgcca cagtggtgct caaccgcagc tcctgtggaa 300 aagagaacac ttctgacccc agtctcgtga ttgcttttgg aagaggacat acactcactc 360 tcaatttcac gagaaatgca acacgttaca gcgtccagct catgagtttt gtttataact 420 tgtcagacac acaccttttc cccaatgcga gctccaaaga aatcaagact gtggaatcta 480 taactgacat cagggcagat atagataaaa aatacagatg tgttagtggc acccaggtcc 540 acatgaacaa cgtgaccgta acgctccatg atgccaccat ccaggcgtac ctttccaaca 600 gcagcttcag caggggagag acacgctgtg aacaagacag gccttcccca accacagcgc 660 cccctgcgcc acccagcccc tcgccctcac ccgtgcccaa gagcccctct gtggacaagt 720 acaacgtgag cggcaccaac gggacctgcc tgctggccag catggggctg cagctgaacc 780 tcacctatga gaggaaggac aacacgacgg tgacaaggct tctcaacatc aaccccaaca 840 agacctcggc cagcgggagc tgcggcgccc acctggtgac tctggagctg cacagcgagg 900 gcaccaccgt cctgctcttc cagttcggga tgaatgcaag ttctagccgg tttttcctac 960 aaggaatcca gttgaataca attcttcctg acgccagaga ccctgccttt aaagctgcca 1020 acggctccct gcgagcgctg caggccacag tcggcaattc ctacaagtgc aacgcggagg 1080 agcacgtccg tgtcacgaag gcgttttcag tcaatatatt caaagtgtgg gtccaggctt 1140 tcaaggtgga aggtggccag tttggctctg tggaggagtg tctgctggac gagaacagca 1200 tgctgatccc catcgctgtg ggtggtgccc tggcggggct ggtcctcatc gtcctcatcg 1260 cctacctcgt cggcaggaag aggagtcacg caggctacca gactatctag cctggtgcac 1320 gcaggcacag cagctgcagg ggcctctgtt cctttctctg ggcttagggt cctgtcgaag 1380 gggaggcaca ctttctggca aacgtttctc aaatctgctt catccaatgt gaagttcatc 1440 ttgcagcatt tactatgcac aacagagtaa ctatcgaaat gacggtgtta attttgctaa 1500 ctgggttaaa tattttgcta actggttaaa cattaatatt taccaaagta ggattttgag 1560 ggtgggggtg ctctctctga gggggtgggg gtgccgctgt ctctgagggg tgggggtgcc 1620 gctgtctctg aggggtgggg gtgccgctct ctctgagggg gtgggggtgc cgctttctct 1680 gagggggtgg gggtgccgct ctctctgagg gggtgggggt gctgctctct ccgaggggtg 1740 gaatgccgct gtctctgagg ggtgggggtg ccgctctaaa ttggctccat atcatttgag 1800 tttagggttc tggtgtttgg tttcttcatt ctttactgca ctcagattta agccttacaa 1860 agggaaagcc tctggccgtc acacgtagga cgcatgaagg tcactcgtgg tgaggctgac 1920 atgctcacac attacaacag tagagaggga aaatcctaag acagaggaac tccagagatg 1980 agtgtctgga gcgcttcagt tcagctttaa aggccaggac gggccacacg tggctggcgg 2040 cctcgttcca gtggcggcac gtccttgggc gtctctaatg tctgcagctc aagggctggc 2100 acttttttaa atataaaaat gggtgttatt tttatttttt tttgtaaagt gatttttggt 2160 cttctgttga cattcggggt gatcctgttc tgcgctgtgt acaatgtgag atcggtgcgt 2220 tctcctgatg ttttgccgtg gcttggggat tgtacacggg accagctcac gtaatgcatt 2280 gcctgtaaca atgtaataaa aagcctcttt cttttaaaaa aaaaaaaaaa aaaaaaaaa 2339 <210> 46 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 46 cagtacatca aggccaacag caagttcatc ggcatcaccg aactc 45 <210> 47 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 47 Gln Tyr Ile Lys Ala Asn Ser Lys Phe Ile Gly Ile Thr Glu Leu 1 5 10 15 <210> 48 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 48 gctaaatttg tggctgcctg gacactgaaa gccgccgct 39 <210> 49 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 49 Ala Lys Phe Val Ala Ala Trp Thr Leu Lys Ala Ala Ala 1 5 10 <210> 50 <211> 593 <212> DNA <213> Woodchuck hepatitis virus <400> 50 aatcaacctc tggattacaa aatttgtgaa agattgactg gtattcttaa ctatgttgct 60 ccttttacgc tatgtggata cgctgcttta atgcctttgt atcatgctat tgcttcccgt 120 atggctttca ttttctcctc cttgtataaa tcctggttgc tgtctcttta tgaggagttg 180 tggcccgttg tcaggcaacg tggcgtggtg tgcactgtgt ttgctgacgc aacccccact 240 ggttggggca ttgccaccac ctgtcagctc ctttccggga ctttcgcttt ccccctccct 300 attgccacgg cggaactcat cgccgcctgc cttgcccgct gctggacagg ggctcggctg 360 ttgggcactg acaattccgt ggtgttgtcg gggaagctga cgtcctttcc atggctgctc 420 gcctgtgttg ccacctggat tctgcgcggg acgtccttct gctacgtccc ttcggccctc 480 aatccagcgg accttccttc ccgcggcctg ctgccggctc tgcggcctct tccgcgtctt 540 cgccttcgcc ctcagacgag tcggatctcc ctttgggccg cctccccgcc tgt 593 <210> 51 <211> 589 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 51 tctccccccc ccccctctcc ctcccccccc cctaacgtta ctggccgaag ccgcttggaa 60 taaggccggt gtgcgtttgt ctatatgtta ttttccacca tattgccgtc ttttggcaat 120 gtgagggccc ggaaacctgg ccctgtcttc ttgacgagca ttcctagggg tctttcccct 180 ctcgccaaag gaatgcaagg tctgttgaat gtcgtgaagg aagcagttcc tctggaagct 240 tcttgaagac aaacaacgtc tgtagcgacc ctttgcaggc agcggaaccc cccacctggc 300 gacaggtgcc tctgcggcca aaagccacgt gtataagata cacctgcaaa ggcggcacaa 360 ccccagtgcc acgttgtgag ttggatagtt gtggaaagag tcaaatggct ctcctcaagc 420 gtattcaaca aggggctgaa ggatgcccag aaggtacccc attgtatggg atctgatctg 480 gggcctcggt gcacatgctt tacatgtgtt tagtcgaggt taaaaaaacg tctaggcccc 540 ccgaaccacg gggacgtggt tttcctttga aaaacacgat gataatatg 589 <210> 52 <211> 720 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 52 atggtgagca agggcgagga gctgttcacc ggggtggtgc ccatcctggt cgagctggac 60 ggcgacgtaa acggccacaa gttcagcgtg tccggcgagg gcgagggcga tgccacctac 120 ggcaagctga ccctgaagtt catctgcacc accggcaagc tgcccgtgcc ctggcccacc 180 ctcgtgacca ccctgaccta cggcgtgcag tgcttcagcc gctaccccga ccacatgaag 240 cagcacgact tcttcaagtc cgccatgccc gaaggctacg tccaggagcg caccatcttc 300 ttcaaggacg acggcaacta caagacccgc gccgaggtga agttcgaggg cgacaccctg 360 gtgaaccgca tcgagctgaa gggcatcgac ttcaaggagg acggcaacat cctggggcac 420 aagctggagt acaactacaa cagccacaac gtctatatca tggccgacaa gcagaagaac 480 ggcatcaagg tgaacttcaa gatccgccac aacatcgagg acggcagcgt gcagctcgcc 540 gaccactacc agcagaacac ccccatcggc gacggccccg tgctgctgcc cgacaaccac 600 tacctgagca cccagtccgc cctgagcaaa gaccccaacg agaagcgcga tcacatggtc 660 ctgctggagt tcgtgaccgc cgccgggatc actctcggca tggacgagct gtacaagtag 720 <210> 53 <211> 1563 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 53 atgctgctgc tgctgctgct gctgggcctg aggctacagc tctccctggg catcatccca 60 gttgaggagg agaacccgga cttctggaac cgcgaggcag ccgaggccct gggtgccgcc 120 aagaagctgc agcctgcaca gacagccgcc aagaacctca tcatcttcct gggcgatggg 180 atgggggtgt ctacggtgac agctgccagg atcctaaaag ggcagaagaa ggacaaactg 240 gggcctgaga tacccctggc catggaccgc ttcccatatg tggctctgtc caagacatac 300 aatgtagaca aacatgtgcc agacagtgga gccacagcca cggcctacct gtgcggggtc 360 aagggcaact tccagaccat tggcttgagt gcagccgccc gctttaacca gtgcaacacg 420 acacgcggca acgaggtcat ctccgtgatg aatcgggcca agaaagcagg gaagtcagtg 480 ggagtggtaa ccaccacacg agtgcagcac gcctcgccag ccggcaccta cgcccacacg 540 gtgaaccgca actggtactc ggacgccgac gtgcctgcct cggcccgcca ggaggggtgc 600 caggacatcg ctacgcagct catctccaac atggacattg acgtgatcct aggtggaggc 660 cgaaagtaca tgtttcgcat gggaacccca gaccctgagt acccagatga ctacagccaa 720 ggtgggacca ggctggacgg gaagaatctg gtgcaggaat ggctggcgaa gcgccagggt 780 gcccggtatg tgtggaaccg cactgagctc atgcaggctt ccctggaccc gtctgtgacc 840 catctcatgg gtctctttga gcctggagac atgaaatacg agatccaccg agactccaca 900 ctggacccct ccctgatgga gatgacagag gctgccctgc gcctgctgag caggaacccc 960 cgcggcttct tcctcttcgt ggagggtggt cgcatcgacc atggtcatca tgaaagcagg 1020 gcttaccggg cactgactga gacgatcatg ttcgacgacg ccattgagag ggcgggccag 1080 ctcaccagcg aggaggacac gctgagcctc gtcactgccg accactccca cgtcttctcc 1140 ttcggaggct accccctgcg agggagctcc atcttcgggc tggcccctgg caaggcccgg 1200 gacaggaagg cctacacggt cctcctatac ggaaacggtc caggctatgt gctcaaggac 1260 ggcgcccggc cggatgttac cgagagcgag agcgggagcc ccgagtatcg gcagcagtca 1320 gcagtgcccc tggacgaaga gacccacgca ggcgaggacg tggcggtgtt cgcgcgcggc 1380 ccgcaggcgc acctggttca cggcgtgcag gagcagacct tcatagcgca cgtcatggcc 1440 ttcgccgcct gcctggagcc ctacaccgcc tgcgacctgg cgccccccgc cggcaccacc 1500 gacgccgcgc acccgggtta ctctagagtc ggggcggccg gccgcttcga gcagacatga 1560 taa 1563 <210> 54 <211> 1653 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 54 atggaagatg ccaaaaacat taagaagggc ccagcgccat tctacccact cgaagacggg 60 accgccggcg agcagctgca caaagccatg aagcgctacg ccctggtgcc cggcaccatc 120 gcctttaccg acgcacatat cgaggtggac attacctacg ccgagtactt cgagatgagc 180 gttcggctgg cagaagctat gaagcgctat gggctgaata caaaccatcg gatcgtggtg 240 tgcagcgaga atagcttgca gttcttcatg cccgtgttgg gtgccctgtt catcggtgtg 300 gctgtggccc cagctaacga catctacaac gagcgcgagc tgctgaacag catgggcatc 360 agccagccca ccgtcgtatt cgtgagcaag aaagggctgc aaaagatcct caacgtgcaa 420 aagaagctac cgatcataca aaagatcatc atcatggata gcaagaccga ctaccagggc 480 ttccaaagca tgtacacctt cgtgacttcc catttgccac ccggcttcaa cgagtacgac 540 ttcgtgcccg agagcttcga ccgggacaaa accatcgccc tgatcatgaa cagtagtggc 600 agtaccggat tgcccaaggg cgtagcccta ccgcaccgca ccgcttgtgt ccgattcagt 660 catgcccgcg accccatctt cggcaaccag atcatccccg acaccgctat cctcagcgtg 720 gtgccatttc accacggctt cggcatgttc accacgctgg gctacttgat ctgcggcttt 780 cgggtcgtgc tcatgtaccg cttcgaggag gagctattct tgcgcagctt gcaagactat 840 aagattcaat ctgccctgct ggtgcccaca ctatttagct tcttcgctaa gagcactctc 900 atcgacaagt acgacctaag caacttgcac gagatcgcca gcggcggggc gccgctcagc 960 aaggaggtag gtgaggccgt ggccaaacgc ttccacctac caggcatccg ccagggctac 1020 ggcctgacag aaacaaccag cgccattctg atcacccccg aaggggacga caagcctggc 1080 gcagtaggca aggtggtgcc cttcttcgag gctaaggtgg tggacttgga caccggtaag 1140 acactgggtg tgaaccagcg cggcgagctg tgcgtccgtg gccccatgat catgagcggc 1200 tacgttaaca accccgaggc tacaaacgct ctcatcgaca aggacggctg gctgcacagc 1260 ggcgacatcg cctactggga cgaggacgag cacttcttca tcgtggaccg gctgaagagc 1320 ctgatcaaat acaagggcta ccaggtagcc ccagccgaac tggagagcat cctgctgcaa 1380 caccccaaca tcttcgacgc cggggtcgcc ggcctgcccg acgacgatgc cggcgagctg 1440 cccgccgcag tcgtcgtgct ggaacacggt aaaaccatga ccgagaagga gatcgtggac 1500 tatgtggcca gccaggttac aaccgccaag aagctgcgcg gtggtgttgt gttcgtggac 1560 gaggtgccta aaggactgac cggcaagttg gacgcccgca agatccgcga gattctcatt 1620 aaggccaaga agggcggcaa gatcgccgtg taa 1653 <210> 55 <211> 66 <212> DNA <213> Foot-and-mouth disease virus <400> 55 gtaaagcaaa cactgaactt tgaccttctc aagttggctg gagacgttga gtccaatcct 60 gggccc 66 <210> 56 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 56 Gly Pro Gly Pro Gly 1 5

Claims

항원-코딩 카세트, 또는 카세트에 의해 코딩된 폴리펩티드 서열로서, 여기서 항원-코딩 카세트는 5'에서 3'으로 다음식으로 기술된 적어도 하나의 항원-코딩 핵산 서열을 포함하고,
(E _x -(E ^N _n ) _y ) _z
여기서 E는 별개의 에피토프-코딩 핵산 서열을 포함하는 뉴클레오티드 서열을 나타내고,
n은 분리된 별개의 에피토프-코딩 핵산 서열의 수를 나타내고 0을 포함하는 임의의 정수이고,
E^N은 각각의 상응하는 n에 대해 분리된 별개의 에피토프-코딩 핵산을 포함하는 뉴클레오티드 서열을 나타내고,
z의 각 반복에 대해: 각 n에 대해 x = 0 또는 1, y = 0 또는 1이고, 그리고 x 또는 y 중 적어도 하나는 1이고,
z = 2 이상이고, 여기서 항원-코딩 핵산 서열은 E, 주어진 E^N, 또는 이들의 조합의 적어도 2회의 반복을 포함하고,
적어도 2회 반복을 포함하는 별개의 에피토프-코딩 핵산 서열 중 적어도 하나는 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는, 항원-코딩 카세트, 또는 카세트에 의해 코딩된 폴리펩티드 서열.
제 1항에 있어서, 상기 항원-코딩 카세트는 아미노산 서열 VVVGACGVGK (서열번호: 75), VVVGADGVGK (서열번호: 78), VVGAVGVGK (서열번호: 79), 및 ILDTAGHEEY (서열번호: 82) 각각의 적어도 4회 반복을 코딩하는, 조성물.
제 1항에 있어서, 적어도 2회 반복을 포함하는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8개의 별개의 에피토프-코딩 핵산 서열이 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는, 조성물.
제 1항에 있어서, 적어도 2회 반복을 포함하는 각각의 별개의 에피토프-코딩 핵산 서열이 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는, 조성물.
제 1항 내지 제 4항 중 어느 한 항에 있어서, KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 하나 이상의 에피토프-코딩 핵산 서열이 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8회 반복을 포함하는, 조성물.
제 1항 내지 제 4항 중 어느 한 항에 있어서, KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 각각의 핵산 서열이 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8회 반복을 포함하는, 조성물.
제 1항 내지 제 4항 중 어느 한 항에 있어서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 하나 이상의 핵산 서열이 적어도 4회 반복을 포함하는, 조성물.
제 1항 내지 제 4항 중 어느 한 항에 있어서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 각각의 핵산 서열이 적어도 4회 반복을 포함하는, 조성물.
제 1항 내지 제 8항 중 어느 한 항에 있어서, 하나 이상의 별개의 KRAS-연관 MHC 클래스 I 네오에피토프가 독립적으로 KRAS G12C 돌연변이, KRAS G12V 돌연변이, KRAS G12D 돌연변이 또는 KRAS Q61H 돌연변이를 포함하는, 조성물.
제 1항 내지 제 9항 중 어느 한 항에 있어서, 각각의 E 또는 E^N은 독립적으로 5'에서 3'으로 식 (L5_b-N_c-L3_d)에 의해 기술된 뉴클레오티드 서열을 포함하고,
여기서 N은 각각 E 또는 E^N과 연관된 별개의 에피토프-코딩 핵산 서열을 포함하고, 여기서 c = 1이고,
L5는 5' 링커 서열을 포함하고, 여기서 b = 0 또는 1이고,
L3은 3' 링커 서열을 포함하고, 여기서, d = 0 또는 1인, 조성물.
제 10항에 있어서,
각각의 N은 7-15개 아미노산 길이인 에피토프를 코딩하고,
L5는 에피토프의 천연 N-말단 아미노산 서열을 코딩하는 천연 5' 링커 서열이고, 여기서 5' 링커 서열은 길이가 적어도 2개 아미노산인 펩티드를 코딩하고,
L3은 에피토프의 천연 C-말단 아미노산 서열을 코딩하는 천연 3' 링커 서열이고, 여기서 3' 링커 서열은 길이가 적어도 2개 아미노산인 펩티드를 코딩하는, 조성물.
제 1항 내지 제 11항 중 어느 한 항에 있어서, 각각의 E 및 E^N이 적어도 7개 아미노산 길이인 에피토프를 코딩하는, 조성물.
제 1항 내지 제 11항 중 어느 한 항에 있어서, 각각의 E 및 E^N이 7-15개 아미노산 길이인 에피토프를 코딩하는, 조성물.
제 1항 내지 제 13항 중 어느 한 항에 있어서, 각각의 E 및 E^N은 적어도 21개 뉴클레오티드 길이인 뉴클레오티드 서열인, 조성물.
제 1항 내지 제 13항 중 어느 한 항에 있어서, 각각의 E 및 E^N은 75개 뉴클레오티드 길이인 뉴클레오티드 서열인, 조성물.
항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물로서, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 백본은,
(i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및
(ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 벡터 백본; 및
(b) 카세트를 포함하고, 여기서 카세트는:
(i) (I) KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서,
여기서 각각의 에피토프-코딩 핵산 서열은,
(A) 임의로 5' 링커 서열, 및
(B) 임의로 3' 링커 서열을 포함하는, 적어도 하나의 항원-코딩 핵산 서열;
(ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및
(iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및
(v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고,
여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함하는, 조성물.
항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물로서, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본로서, 여기서 백본은:
(i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및
(ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 벡터 백본; 및
(b) 카세트를 포함하고, 여기서 카세트는,
(i) (I) 서로 선형으로 연결된 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 별개의 에피토프 코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서, 여기서 적어도 하나의 별개의 에피토프-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하고,
여기서 각각의 에피토프-코딩 핵산 서열은,
(A) 임의로 5' 링커 서열, 및
(B) 임의로 3' 링커 서열을 포함하는, 적어도 하나의 항원-코딩 핵산 서열;
(ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열;
(iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및
(v) 임의로, 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열인 적어도 하나의 제 2 폴리(A) 서열을 포함하고,
여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 별개의 에피토프-코딩 핵산 서열 중 적어도 하나의 적어도 2회 반복을 포함하는, 조성물.
제 17항에 있어서, 적어도 하나의 항원-코딩 핵산 서열이 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 각각 코딩하는 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 포함하는, 조성물.
항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물로서, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 벡터 백본은 침팬지 아데노바이러스 벡터를 포함하고, 임의로 여기서 침팬지 아데노바이러스 벡터는 ChAdV68 벡터, 또는 알파바이러스 벡터이고, 임의로 여기서 알파바이러스 벡터는 베네수엘라 말 뇌염 바이러스 벡터인, 벡터 백본; 및
(b) 카세트를 포함하고, 임의로 여기서 카세트는 벡터 백본에 천연인 천연 프로모터 뉴클레오티드 서열 및 폴리(A) 서열 사이에 통합되며, 임의로 여기서 폴리(A) 서열은 벡터 백본에 천연이고, 여기서 카세트는,
(i) (I) 서로 선형으로 연결된 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 포함하는, KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서,
여기서 각각의 에피토프-코딩 핵산 서열은 임의로,
(A) 길이가 7-15개 아미노산인 MHC 클래스 I 에피토프를 코딩하는 MHC 클래스 I 에피토프 코딩 핵산 서열;
(B) 5' 링커 서열로서, 여기서 5' 링커 서열은 MHC 클래스 I 에피토프의 천연 N-말단 아미노산 서열을 코딩하고, 여기서 5' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하는, 5' 링커 서열;
(C) 3' 링커 서열로서, 여기서 3' 링커 서열은 MHC 클래스 I 에피토프의 천연 C-말단 산 서열을 코딩하고, 여기서 3' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하는, 3' 링커 서열을 포함하며,
여기서 카세트는 천연 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 각각의 에피토프-코딩 핵산 서열은 길이가 13 내지 25개 아미노산인 폴리펩티드를 코딩하고, 여기서 각각의 에피토프-코딩 핵산의 각각의 3' 말단은 카세트에서 최종 에피토프-코딩 핵산 서열을 제외하고 다음의 에피토프-코딩 핵산 서열의 5' 말단에 연결되고; 그리고
(ii) 다음을 포함하는 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열:
(I) PADRE MHC 클래스 II 서열(서열번호: 48),
(II) 파상풍 톡소이드 MHC 클래스 II 서열(서열번호: 46),
(III) PADRE MHC 클래스 II 서열과 파상풍 톡소이드 MHC 클래스 II 서열을 연결하는 GPGPG 아미노산 링커 서열을 코딩하는 제 1 핵산 서열,
(IV) 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열의 5'끝을 에피토프-코딩 핵산 서열에 연결하는 GPGPG 아미노산 링커 서열을 코딩하는 제 2 핵산 서열,
(V) 임의로, 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열의 3'끝에서 GPGPG 아미노산 링커 서열을 코딩하는 제 3 핵산 서열;
(iii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열을 포함하며,
여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 천연 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함하는, 조성물.
제 16항 내지 제 18항 중 어느 한 항에 있어서, 상기 카세트의 각 요소의 정렬된 순서는 5'에서 3'로 다음을 포함하는 식으로 기술되고,
P_a-(L5_b-N_c-L3_d)_X-(G5_e-U_f)_Y-G3_g
여기서,
P는 제 2 프로모터 뉴클레오티드 서열을 포함하고, 여기서 a = 0 또는 1이고,
N은 별개의 에피토프-코딩 핵산 서열 중 하나를 포함하며, c = 1이고,
L5는 5' 링커 서열을 포함하고, b = 0 또는 1이고,
L3은 3' 링커 서열을 포함하고, d = 0 또는 1이고,
G5는 GPGPG 아미노산 링커를 코딩하는 적어도 하나의 핵산 중 하나를 포함하고, 여기서 e = 0 또는 1이고,
G3은 GPGPG 아미노산 링커를 코딩하는 적어도 하나의 핵산 서열 중 하나를 포함하고, 여기서 g = 0 또는 1이고,
U는 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열 중 하나를 포함하며, 여기서 f = 1이고,
X = 1 내지 400이고, 여기서 각각의 X에 대해 상응하는 N_c는 에피토프-코딩 핵산 서열이고, 그리고,
Y = 0, 1 또는 2이고, 여기서 각각의 Y에 대해 상응하는 U_f는 MHC 클래스 II 에피토프-코딩 핵산 서열인, 조성물.
제 20항에 있어서, 별개의 에피토프-코딩 핵산 서열의 적어도 2회 반복에 상응하는 N_c를 제외하고, 각각의 X에 대해 상응하는 N_c가 별개의 에피토프-코딩 핵산 서열인, 조성물.
제 20항 또는 제 21항에 있어서, 각각의 Y에 대해 상응하는 U_f가 별개의 MHC 클래스 II 에피토프-코딩 핵산 서열인, 조성물.
제 20항 내지 제 22항 중 어느 한 항에 있어서,
a = 0, b = 1, d = 1, e = 1, g = 1, h = 1, X = 16, Y = 2이고,
적어도 하나의 프로모터 뉴클레오티드 서열은 벡터 백본에 천연인 단일 천연 프로모터 뉴클레오티드 서열이고,
적어도 하나의 폴리아데닐화 폴리(A) 서열은 벡터 백본에 의해 제공되는 적어도 80개의 연속 A 뉴클레오티드의 폴리(A) 서열이고,
각각의 N은 7-15개 아미노산 길이인 에피토프를 코딩하고,
L5는 에피토프의 천연 N-말단 아미노산 서열을 코딩하는 천연 5' 링커 서열이고, 여기서 5' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하고,
L3은 에피토프의 천연 C-말단 아미노산 서열을 코딩하는 천연 3' 링커 서열이고, 여기서 3' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하고,
U는 각각 PADRE 클래스 II 서열 및 파상풍 톡소이드 MHC 클래스 II 서열이고,
벡터 백본은 침팬지 아데노바이러스 벡터를 포함하고, 임의로 여기서 침팬지 아데노바이러스 벡터는 ChAdV68 벡터, 또는 알파바이러스 벡터이고, 임의로 여기서 알파바이러스 벡터는 베네수엘라 말 뇌염 바이러스 벡터이고, 임의로 여기서 천연 프로모터 뉴클레오티드 서열은 벡터 백본이 알파바이러스 벡터를 포함할 때 서브게놈 프로모터이고,
각각의 MHC 클래스 II 에피토프-코딩 핵산 서열은 길이가 13 내지 25개의 아미노산인 폴리펩티드를 코딩하는, 조성물.
제 16항 내지 제 23항 중 어느 한 항에 있어서, 적어도 2회 반복이 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8회 반복인, 조성물.
제 16항 내지 제 23항 중 어느 한 항에 있어서, 적어도 2회 반복이 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 4, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 적어도 19 또는 적어도 20회 반복인, 조성물.
제 16항 내지 제 23항 중 어느 한 항에 있어서, 적어도 2회 반복이 2-3, 2-4, 2-5, 2-6, 2-7 반복, 또는 2-8회 반복인, 조성물.
제 16항 내지 제 23항 중 어느 한 항에 있어서, 적어도 2회 반복이 7 반복 이하, 6 반복 이하, 5 반복 이하, 4 반복 이하, 또는 3 반복 이하인, 조성물.
제 16항 내지 제 27항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-코딩 핵산 서열이 적어도 2개의 별개의 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함하는, 조성물.
제 16항 내지 제 27항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-코딩 핵산 서열이 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9 또는 적어도 10의 별개의 에피토프 코딩 핵산 서열의 적어도 2회 반복을 포함하는, 조성물.
제 16항 내지 제 29항 중 어느 한 항에 있어서, 적어도 2회 반복이 적어도 하나의 분리된 별개의 에피토프-코딩 핵산 서열에 의해 분리되는, 조성물.
제 16항 내지 제 29항 중 어느 한 항에 있어서, 적어도 2회 반복이 적어도 2개의 분리된 별개의 에피토프-코딩 핵산 서열에 의해 분리되는, 조성물.
제 16항 내지 제 29항 중 어느 한 항에 있어서, 임의의 5' 링커 서열 및/또는 임의의 3' 링커 서열을 포함하는 적어도 2회 반복이 적어도 75개의 뉴클레오티드에 의해 분리되는, 조성물.
제 16항 내지 제 29항 중 어느 한 항에 있어서, 임의의 5' 링커 서열 및/또는 임의의 3' 링커 서열을 포함하는 적어도 2회 반복이 적어도 150 뉴클레오티드, 적어도 300 뉴클레오티드, 또는 적어도 675개 뉴클레오티드에 의해 분리되는, 조성물.
제 16항 내지 제 29항 중 어느 한 항에 있어서, 임의의 5' 링커 서열 및/또는 임의의 3' 링커 서열을 포함하는 적어도 2회 반복이 적어도 50 뉴클레오티드, 적어도 100 뉴클레오티드, 적어도 200 뉴클레오티드, 적어도 250 뉴클레오티드, 적어도 350 뉴클레오티드, 적어도 400 뉴클레오티드, 적어도 450 뉴클레오티드, 적어도 500 뉴클레오티드, 적어도 700 뉴클레오티드, 적어도 700 뉴클레오티드, 적어도 750 뉴클레오티드, 적어도 800 뉴클레오티드, 적어도 900 뉴클레오티드, 또는 적어도 1000개 뉴클레오티드에 의해 분리되는, 조성물.
제 16항 내지 제 29항 중 어느 한 항에 있어서, 임의의 5' 링커 서열 및/또는 임의의 3' 링커 서열을 포함하는 적어도 2회 반복이 적어도 10 뉴클레오티드, 적어도 15 뉴클레오티드, 적어도 20 뉴클레오티드, 적어도 25 뉴클레오티드, 적어도 30 뉴클레오티드, 적어도 35 뉴클레오티드, 적어도 40 뉴클레오티드, 적어도 45 뉴클레오티드, 적어도 50 뉴클레오티드, 적어도 55 뉴클레오티드, 적어도 60 뉴클레오티드, 적어도 65 뉴클레오티드, 또는 적어도 70개 뉴클레오티드에 의해 분리되는, 조성물.
제 16항 내지 제 35항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-코딩 핵산 서열은 5'에서 3'으로 다음식으로 기술되고,
(E _x -(E ^N _n ) _y ) _z
여기서 E는 별개의 에피토프-코딩 핵산 서열 중 적어도 하나를 포함하는 뉴클레오티드 서열을 나타내고,
n은 분리된 별개의 에피토프-코딩 핵산 서열의 수를 나타내고 0을 포함하는 임의의 정수이고,
E^N은 각각의 상응하는 n에 대해 분리된 별개의 에피토프-코딩 핵산을 포함하는 뉴클레오티드 서열을 나타내고,
z의 각 반복에 대해: 각 n에 대해 x = 0 또는 1, y = 0 또는 1이고, 그리고 x 또는 y 중 적어도 하나는 1이고,
z = 2 이상이고, 여기서 항원-코딩 핵산 서열은 E, 주어진 E^N, 또는 이들의 조합의 적어도 2회 반복을 포함하는, 조성물.
제 16항 내지 제 36항 중 어느 한 항에 있어서, 상기 항원-코딩 카세트는 아미노산 서열 VVVGACGVGK (서열번호: 75), VVVGADGVGK (서열번호: 78), VVGAVGVGK (서열번호: 79), 및 ILDTAGHEEY (서열번호: 82) 각각의 적어도 4회 반복을 코딩하는, 조성물.
제 16항 내지 제 36항 중 어느 한 항에 있어서, 별개의 에피토프-코딩 핵산 서열이 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 각각 코딩하는 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8개의 별개의 에피토프-코딩 핵산 서열을 포함하는, 조성물.
제 16항 내지 제 36항 중 어느 한 항에 있어서, 적어도 하나의 항원-코딩 핵산 서열의 각각의 에피토프-코딩 핵산 서열이 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는, 조성물.
제 16항 내지 제 39항 중 어느 한 항에 있어서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 핵산 서열 중 하나 이상은 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8회 반복을 포함하는, 조성물.
제 16항 내지 제 39항 중 어느 한 항에 있어서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 각각의 핵산 서열이 적어도 2, 적어도 3, 적어도 4, 적어도 5, 적어도 6, 적어도 7 또는 적어도 8회 반복을 포함하는, 조성물.
제 16항 내지 제 39항 중 어느 한 항에 있어서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 핵산 서열 중 하나 이상은 적어도 4회 반복을 포함하는, 조성물.
제 16항 내지 제 39항 중 어느 한 항에 있어서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 각각의 핵산 서열이 적어도 4회 반복을 포함하는, 조성물.
제 16항 내지 제 43항 중 어느 한 항에 있어서, 별개의 KRAS-연관 MHC 클래스 I 네오에피토프 중 하나 이상은 독립적으로 KRAS G12C 돌연변이, KRAS G12V 돌연변이, KRAS G12D 돌연변이 또는 KRAS Q61H 돌연변이를 포함하는, 조성물.
제 1항 내지 제 44항 중 어느 한 항에 있어서, 적어도 2회 반복이 다수의 반복을 포함하거나, z가 에피토프-코딩 핵산 서열의 단일 반복을 포함하는 항원-코딩 핵산 서열에 비해 더 큰 면역 반응을 자극하기에 충분한 수를 포함하는, 조성물.
제 1항 내지 제 45항 중 어느 한 항에 있어서, 적어도 2회 반복이 다수의 반복을 포함하거나, z가 면역 반응을 자극하기에 충분한 수를 포함하고, 에피토프-코딩 핵산 서열의 단일 반복이 면역 반응을 자극하기에 불충분하거나 검출가능한 면역 반응을 자극하기에 불충분한, 조성물.
제 45항 또는 제 46항에 있어서, 상기 면역 반응이 항원 발현 시스템의 전달을 위한 조성물로 생체내 면역화 후 에피토프-특이적 T 세포의 확장인, 조성물.
제 45항 또는 제 46항에 있어서, 상기 면역 반응이 항원 발현 시스템의 전달을 위한 조성물로 생체내 면역화 후 에피토프-특이적 T 세포의 증가된 활성화 및/또는 에피토프-특이적 T 세포에 의한 증가된 에피토프-특이적 사멸인, 조성물.
항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물로서, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 백본은
(i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및
(ii) 임의로 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 벡터 백본; 및
(b) 카세트를 포함하고, 여기서 카세트는
(i) (I) 임의로 (1) 코딩된 에피토프 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경, 임의로 여기서 적어도 하나의 변경은 KRAS 돌연변이이고, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드로 이루어진 군에서 선택된 감염성 질병 유기체 펩티드를 코딩하는 핵산 서열을 포함하는 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서,
여기서 각각의 에피토프-코딩 핵산 서열은;
(A) 임의로 5' 링커 서열, 및
(B) 임의로 3' 링커 서열을 포함하는, 적어도 하나의 항원-코딩 핵산 서열;
(ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및
(iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iv) 임의로, GPGPG 아미노산 링커 서열(서열번호:56)을 코딩하는 적어도 하나의 핵산 서열; 및
(v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고,
여기서 제 2 프로모터가 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 카세트는,
(1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나,
(2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아닌, 조성물.
항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물로서, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 백본은
(i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및
(ii) 임의로 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 벡터 백본; 및
(b) 카세트를 포함하고, 여기서 카세트는,
(i) 다음을 포함하는 적어도 하나의 항원-코딩 핵산 서열:
(I) (1) 코딩된 에피토프 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경, 임의로 여기서 적어도 하나의 변경은 KRAS 돌연변이이고, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드로 이루어진 군에서 선택된 감염성 질병 유기체 펩티드를 코딩하는 핵산 서열을 임의로 포함하는, 서로 작동가능하게 연결된 적어도 2, 3, 4, 5, 6, 7, 8, 9, 또는 10개의 별개의 에피토프-코딩 핵산 서열;
여기서 각각의 에피토프-코딩 핵산 서열은,
(A) 임의로 5' 링커 서열, 및
(B) 임의로 3' 링커 서열을 포함하는, 에피토프-코딩 핵산 서열;
(ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및
(iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및
(v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고,
여기서 제 2 프로모터가 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 카세트는,
(1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나,
(2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아닌, 조성물.
제 50항에 있어서, 적어도 하나의 별개의 에피토프-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는, 조성물.
항원 발현 시스템을 포함하는 항원 발현 시스템의 전달을 위한 조성물로서, 여기서 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 벡터 백본은 침팬지 아데노바이러스 벡터를 포함하고, 임의로 침팬지 아데노바이러스 벡터는 ChAdV68 벡터, 또는 알파바이러스 벡터이고, 임의로 여기서 알파바이러스 벡터는 베네수엘라 말 뇌염 바이러스 벡터인, 벡터 백본; 및
(b) 카세트를 포함하고, 임의로 카세트는 벡터 백본에 천연인 천연 프로모터 뉴클레오티드 서열 및 폴리(A) 서열 사이에 통합되며, 임의로 여기서 폴리(A) 서열은 벡터 백본에 천연이고, 여기서 카세트는,
(i) (I) 서로 선형으로 연결된 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서,
여기서 각각의 에피토프-코딩 핵산 서열은,
(A) 길이가 7-15개 아미노산인 MHC 클래스 I 에피토프를 코딩하는 MHC 클래스 I 에피토프 코딩 핵산 서열;
(B) 5' 링커 서열로서, 여기서 5' 링커 서열은 MHC 클래스 I 에피토프의 천연 N-말단 아미노산 서열을 코딩하고, 여기서 5' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하는, 5' 링커 서열;
(C) 3' 링커 서열로서, 여기서 3' 링커 서열은 MHC 클래스 I 에피토프의 천연 C-말단 산 서열을 코딩하고, 여기서 3' 링커 서열은 적어도 2개의 아미노산 길이인 펩티드를 코딩하는, 3' 링커 서열을 임의로 포함하며,
여기서 카세트는 천연 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고, 여기서 각각의 에피토프-코딩 핵산 서열은 길이가 13 내지 25개 아미노산인 폴리펩티드를 코딩하고, 여기서 각각의 에피토프-코딩 핵산의 각각의 3' 말단은 카세트에서 최종 에피토프-코딩 핵산 서열을 제외하고 다음의 에피토프-코딩 핵산 서열의 5' 말단에 연결되는, 적어도 하나의 항원-코딩 핵산 서열; 및
(ii) 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열로서,
(I) PADRE MHC 클래스 II 서열(서열번호: 48),
(II) 파상풍 톡소이드 MHC 클래스 II 서열(서열번호: 46),
(III) PADRE MHC 클래스 II 서열과 파상풍 톡소이드 MHC 클래스 II 서열을 연결하는 GPGPG 아미노산 링커 서열을 코딩하는 제 1 핵산 서열,
(IV) 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열의 5' 말단을 에피토프-코딩 핵산 서열에 연결하는 GPGPG 아미노산 링커 서열을 코딩하는 제 2 핵산 서열,
(V) 임의로, 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열의 3' 말단에서 GPGPG 아미노산 링커 서열을 코딩하는 제 3 핵산 서열을 포함하는, 적어도 2개의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열을 포함하고;
여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 천연 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 카세트는,
(1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나,
(2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아닌, 조성물.
제 49항 내지 제 52항 중 어느 한 항에 있어서, 상기 면역우성 MHC 클래스 I 에피토프가 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 또 다른 MHC 클래스 I 에피토프에 비해 백신 조성물로 대상체에게 투여될 때 10배, 20배, 30배, 40배, 50배, 100배, 200배, 300배, 400배, 500배, 1000배, 2000배, 3000배, 4000배, 5000배 또는 10,000배 이상의 면역 반응을 자극하는, 조성물.
제 49항 내지 제 52항 중 어느 한 항에 있어서, 상기 면역우성 MHC 클래스 I 에피토프가 다른 MHC 클래스 I 에피토프의 면역 반응을 검출 한계 미만으로 감소시키고/시키거나 치료학적으로 효과적인 반응을 자극하지 않는, 조성물.
제 49항 내지 제 54항 중 어느 한 항에 있어서, 상기 대상체가 면역우성 MHC 클래스 I 에피토프 및 카세트에 코딩된 다른 MHC 클래스 I 에피토프 모두를 제시하는 것으로 알려지거나 예측되는 적어도 하나의 HLA 대립유전자를 발현하는, 조성물.
제 1항 내지 제 55항 중 어느 한 항에 있어서, 하나 이상의 에피토프-코딩 핵산 서열이 대상체의 종양, 감염 또는 감염된 세포로부터 유래되는, 조성물.
제 1항 내지 제 55항 중 어느 한 항에 있어서, 각각의 에피토프-코딩 핵산 서열이 대상체의 종양, 감염 또는 감염된 세포로부터 유래되는, 조성물.
제 1항 내지 제 55항 중 어느 한 항에 있어서, 하나 이상의 에피토프-코딩 핵산 서열이 대상체의 종양, 감염 또는 감염된 세포로부터 유래되지 않은, 조성물.
제 1항 내지 제 55항 중 어느 한 항에 있어서, 각각의 에피토프-코딩 핵산 서열이 대상체의 종양, 감염 또는 감염된 세포로부터 유래되지 않은, 조성물.
제 1항 내지 제 59항 중 어느 한 항에 있어서, 상기 에피토프-코딩 핵산 서열이 세포 표면 상의 MHC 클래스 I에 의해 제시되는 것으로 알려지거나 의심되는 에피토프를 코딩하고, 임의로 상기 세포 표면이 종양 세포 표면 또는 감염된 세포 표면이고, 임의로 여기서 상기 세포는 대상체의 세포인, 조성물.
제 60항에 있어서, 상기 세포는 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 뇌암, B 세포 림프종, 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 비소 세포 폐암 및 소세포 폐암으로 이루어진 군으로부터 선택된 종양세포이거나, 또는
상기 세포는 병원체 감염 세포, 바이러스 감염 세포, 박테리아 감염 세포, 진균 감염 세포 및 기생충 감염 세포로 이루어진 군으로부터 선택된 감염 세포인, 조성물.
제 61항에 있어서, 상기 바이러스 감염된 세포가 HIV 감염 세포, 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS) 감염 세포, 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2) 감염 세포, 에볼라 감염 세포, B형 간염 바이러스(HBV) 감염 세포, 인플루엔자 감염 세포, 오르티믹소바이러스과 바이러스 감염 세포, 인유두종 바이러스(HPV) 감염 세포, 거대세포바이러스(CMV) 감염 세포, 치쿤구니야 바이러스 감염 세포, 호흡기 세포융합 바이러스(RSV) 감염 세포, 뎅기열 바이러스 감염 세포 및 C형 간염 바이러스(HCV) 감염 세포로 이루어진 군으로부터 선택되는, 조성물.
제 1항 내지 제 62항 중 어느 한 항에 있어서, 상기 조성물이 나노입자 전달 비히클을 추가로 포함하는, 조성물.
제 63항에 있어서, 상기 나노입자 전달 비히클이 지질 나노입자(LNP)인, 조성물.
제 64항에 있어서, 상기 LNP가 이온화가능한 아미노 지질을 포함하는, 조성물.
제 65항에 있어서, 상기 이온화가능한 아미노 지질이 MC3-유사(디리놀레일메틸-4-디메틸아미노부티레이트) 분자를 포함하는, 조성물.
제 24항 내지 제 66항 중 어느 한 항에 있어서, 상기 나노입자 전달 비히클이 항원 발현 시스템을 캡슐화하는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 67항 중 어느 한 항에 있어서, 상기 카세트가 적어도 하나의 프로모터 뉴클레오티드 서열과 적어도 하나의 폴리(A) 서열 사이에 통합되는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 68항 중 어느 한 항에 있어서, 상기 제 2 프로모터가 부재하고 적어도 하나의 프로모터 뉴클레오티드 서열이 항원-코딩 핵산 서열에 작동가능하게 연결되는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 69항 중 어느 한 항에 있어서, 상기 하나 이상의 벡터가 하나 이상의 +-가닥 RNA 벡터를 포함하는, 조성물.
제 70항에 있어서, 상기 하나 이상의 +-가닥 RNA 벡터가 5'7-메틸구아노신(m7g) 캡을 포함하는, 조성물.
제 70항 또는 제 71항에 있어서, 상기 하나 이상의 +-가닥 RNA 벡터가 시험관내 전사에 의해 생성되는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 72항 중 어느 한 항에 있어서, 상기 하나 이상의 벡터가 포유동물 세포 내에서 자가-복제하는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 73항 중 어느 한 항에 있어서, 상기 백본이 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 포레스트 바이러스, 신드비스 바이러스 또는 마야로 바이러스의 적어도 하나의 뉴클레오티드 서열을 포함하는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 73항 중 어느 한 항에 있어서, 상기 백본이 베네수엘라 말 뇌염 바이러스의 적어도 하나의 뉴클레오티드 서열을 포함하는, 조성물.
제 74항 또는 제 75항에 있어서, 상기 백본이 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 포레스트 바이러스, 신드비스 바이러스 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 코딩되는 적어도 비구조 단백질-매개 증폭을 위한 서열, 26S 프로모터 서열, 폴리(A) 서열, 비구조 단백질 1(nsP1) 유전자, nsP2 유전자, nsP3 유전자, 및 nsP4 유전자를 포함하는, 조성물.
제 74항 또는 제 75항에 있어서, 상기 백본이 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 포레스트 바이러스, 신드비스 바이러스 또는 마야로 바이러스의 뉴클레오티드 서열에 의해 코딩되는 적어도 비구조적 단백질-매개 증폭을 위한 서열, 26S 프로모터 서열, 및 폴리(A) 서열을 포함하는, 조성물.
제 76항 또는 제 77항에 있어서, 비구조 단백질-매개 증폭을 위한 서열이 알파바이러스 5' UTR, 51-nt CSE, 24-nt CSE, 26S 서브게놈 프로모터 서열, 19-nt CSE, 알파바이러스 3' UTR 또는 이들의 조합으로 이루어진 군으로부터 선택되는, 조성물.
제 76항 내지 제 78항 중 어느 한 항에 있어서, 상기 백본이 구조적 비리온 단백질 캡시드, E2 및 E1을 코딩하지 않는, 조성물.
제 79항에 있어서, 상기 카세트가 아우라 바이러스, 포트 모건 바이러스, 베네수엘라 말 뇌염 바이러스, 로스 리버 바이러스, 셈리키 포레스트 바이러스, 신드비스 바이러스 또는 마야로 바이러스의 뉴클레오티드 서열 내의 구조적 비리온 단백질 대신에 삽입되는, 조성물.
제 74항 또는 제 75항에 있어서, 상기 베네수엘라 말 뇌염 바이러스가 서열번호: 3 또는 서열번호: 5의 서열을 포함하는, 조성물.
제 74항 또는 제 75항에 있어서, 상기 베네수엘라 말 뇌염 바이러스가 염기쌍 7544와 11175 사이의 결실을 추가로 포함하는 서열번호: 3 또는 서열번호: 5의 서열을 포함하는, 조성물.
제 82항에 있어서, 상기 백본이 서열번호: 6 또는 서열번호: 7에 제시된 서열을 포함하는, 조성물.
제 82항 또는 제 83항에 있어서, 상기 카세트가 서열번호: 3 또는 서열번호: 5의 서열에 제시된 염기쌍 7544와 11175 사이의 결실을 대체하기 위해 위치 7544에 삽입되는, 조성물.
제 80항 내지 제 84항 중 어느 한 항에 있어서, 카세트의 삽입이 nsP1-4 유전자 및 적어도 하나의 항원-코딩 핵산 서열을 포함하는 폴리시스트론 RNA의 전사를 제공하고, 여기서 nsP1-4 유전자 및 적어도 하나의 항원 코딩 핵산 서열은 분리된 열린 해독틀에 있는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 73항 중 어느 한 항에 있어서, 상기 백본이 침팬지 아데노바이러스 벡터의 적어도 하나의 뉴클레오티드 서열을 포함하는, 조성물.
제 86항에 있어서, 상기 침팬지 아데노바이러스는 ChAdV68 벡터이고, 임의로 ChAdV68 벡터는,
- 서열번호: 1에 제시된 서열;
- 서열번호: 1에 제시된 서열의 침팬지 아데노바이러스 E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자로 이루어진 군으로부터 선택된 적어도 하나의 유전자에서 완전히 결실되거나 기능적으로 결실된 것을 제외하고, 임의로 여기서 서열은 서열번호: 1에 제시된 서열의 (1) E1A 및 E1B; (2) E1A, E1B 및 E3; 또는 (3) E1A, E1B, E3 및 E4에서 완전히 결실되거나 기능적으로 결실되는, 서열번호: 1에 제시된 서열;
- 임의로 유전자는 서열번호: 1에 제시된 서열의 침팬지 아데노바이러스 역 말단 반복(ITR), E1A, E1B, E2A, E2B, E3, E4, L1, L2, L3, L4 및 L5 유전자로 이루어진 군으로부터 선택되는, 서열번호: 1의 서열로부터 수득한 유전자 또는 조절 서열;
- 결실 또는 부분 결실 E4orf2 영역 및 결실 또는 부분 결실 E4orf3 영역, 및 임의로 결실 또는 부분 결실 E4orf4 영역을 포함하는 부분 결실 E4 유전자;
- (1) 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 577 내지 3403의 E1 결실, (2) 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 27,125 내지 31,825의 E3 결실, 및 (3) 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 34,916 내지 35,642의 E4 결실을 추가로 포함하고; 임의로 여기서 항원 카세트는 E1 결실 내에 삽입되는, 서열번호: 1에 제시된 서열의 적어도 뉴클레오티드 2 내지 36,518;
- 임의로 항원 카세트는 E1 결실 내에 삽입되는, 서열번호: 68에 제시된 서열;
- 임의로 벡터는 서열번호: 1에 제시된 서열의 염기쌍 27,125와 31,825 사이 또는 염기쌍 27,816와 31,333사이에 하나 이상의 결실을 추가로 포함하는, 염기쌍 번호 577과 3403 사이 또는 염기쌍 456과 3014 사이에 하나 이상의 결실; 또는
- 서열번호: 1에 제시된 서열의 염기쌍 번호 3957과 10346, 염기쌍 번호 21787과 23370, 및 염기쌍 번호 33486과 36193 사이에 하나 이상의 결실을 포함하는 ChAdV68 벡터 백본을 포함하고,
여기서 카세트는 E1 영역, E3 영역, 및/또는 카세트의 혼입을 허용하는 임의의 결실된 AdV 영역에서 ChAdV 벡터 백본에 삽입되는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 87항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열이 백본에 의해 코딩되는 천연 26S 프로모터 뉴클레오티드 서열인, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항, 또는 제 24항 내지 제 87항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열이 외인성 RNA 프로모터인, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 89항 중 어느 한 항에 있어서, 상기 제 2 프로모터 뉴클레오티드 서열이 26S 프로모터 뉴클레오티드 서열인, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 89항 중 어느 한 항에 있어서, 상기 제 2 프로모터 뉴클레오티드 서열이 다수의 26S 프로모터 뉴클레오티드 서열을 포함하고, 여기서 각각의 26S 프로모터 뉴클레오티드 서열이 하나 이상의 분리된 열린 해독틀의 전사를 제공하는, 조성물.
제 1항 내지 제 91항 중 어느 한 항에 있어서, 상기 하나 이상의 벡터가 각각 크기가 적어도 300 nt인, 조성물.
제 1항 내지 제 92항 중 어느 한 항에 있어서, 상기 하나 이상의 벡터가 각각 크기가 적어도 1kb인, 조성물.
제 1항 내지 제 93항 중 어느 한 항에 있어서, 상기 하나 이상의 벡터가 각각 크기가 2kb인, 조성물.
제 1항 내지 제 94항 중 어느 한 항에 있어서, 상기 하나 이상의 벡터가 각각 크기가 5kb 미만인, 조성물.
제 1항 내지 제 95항 중 어느 한 항에 있어서, 적어도 하나의 항원-코딩 핵산 서열 중 적어도 하나는 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 클래스 I에 의해 제시되는 폴리펩티드 서열 또는 이의 일부를 코딩하는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 96항 중 어느 한 항에 있어서, 각각의 에피토프-코딩 핵산 서열이 서로 직접 연결되는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 97항 중 어느 한 항에 있어서, 적어도 하나의 에피토프-코딩 핵산 서열이 링커를 코딩하는 핵산 서열을 갖는 별개의 에피토프-코딩 핵산 서열에 연결되는, 조성물.
제 98항에 있어서, 상기 링커가 2개의 MHC 클래스 I 서열 또는 MHC 클래스 I 서열을 MHC 클래스 II 서열에 연결시키는, 조성물.
제 99항에 있어서, 상기 링커는 (1) 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 잔기인 연속 글리신 잔기; (2) 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 잔기인 연속 알라닌 잔기; (3) 2개의 아르기닌 잔기(RR); (4) 알라닌, 알라닌, 티로신(AAY); (5) 포유동물 프로테아좀에 의해 효율적으로 처리되는 적어도 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 잔기 길이의 컨센서스 서열; 및 (6) 기원의 동족 단백질로부터 유래된 항원에 플랭킹하고 길이가 적어도 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 2-20개 아미노산 잔기인 하나 이상의 천연 서열로 이루어진 군으로부터 선택되는, 조성물.
제 98항에 있어서, 상기 링커가 2개의 MHC 클래스 II 서열 또는 MHC 클래스 II 서열을 MHC 클래스 I 서열에 연결시키는, 조성물.
제 101항에 있어서, 상기 링커가 서열 GPGPG를 포함하는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 102항 중 어느 한 항에 있어서, 에피토프-코딩 핵산 서열 중 적어도 하나의 서열은 이로부터 코딩된 에피토프의 에피토프-코딩 핵산 서열의 발현, 안정성, 세포 트래피킹, 처리 및 제시, 및/또는 면역원성을 향상시키는 분리된 또는 인접 서열에 작동가능하게 또는 직접 연결되는, 조성물.
제 103항에 있어서, 상기 분리된 또는 인접 서열이 유비퀴틴 서열, 프로테아좀 표적화를 증가시키기 위해 변형된 유비퀴틴 서열(예를 들어, 유비퀴틴 서열은 위치 76에서 Gly에서 Ala로의 치환을 함유), 면역글로불린 신호 서열(예를 들어, IgK), 주요 조직 적합성 클래스 I 서열, 리소좀-관련 막 단백질(LAMP)-1, 인간 수지상 세포 리소좀-관련 막 단백질 및 주요 조직 적합성 클래스 II 서열 중 적어도 하나를 포함하고; 임의로 여기서 프로테아좀 표적화를 증가시키기 위해 변형된 유비퀴틴 서열은 A76인, 조성물.
제 1항 내지 제 104항 중 어느 한 항에 있어서, 에피토프-코딩 핵산 서열 중 적어도 하나는 번역된 상응하는 야생형 핵산 서열에 비해 이의 상응하는 MHC 대립유전자에 대해 증가된 결합 친화도를 갖는 폴리펩티드 서열 또는 이의 일부를 코딩하는, 조성물.
제 1항 내지 제 105항 중 어느 한 항에 있어서, 에피토프-코딩 핵산 서열 중 적어도 하나는 번역된 상응하는 야생형 핵산 서열에 비해 이의 상응하는 MHC 대립유전자에 대해 증가된 결합 안정성을 갖는 폴리펩티드 서열 또는 이의 일부를 코딩하는, 조성물.
제 1항 내지 제 106항 중 어느 한 항에 있어서, 에피토프-코딩 핵산 서열 중 적어도 하나는 번역된 상응하는 야생형 핵산 서열에 비해 이의 상응하는 MHC 대립유전자에 대해 증가된 제시 가능성을 갖는 폴리펩티드 서열 또는 이의 일부를 코딩하는, 조성물.
제 1항 내지 제 107항 중 어느 한 항에 있어서, 상기 적어도 하나의 변경이 점 돌연변이, 프레임시프트 돌연변이, 비-프레임시프트 돌연변이, 결실 돌연변이, 삽입 돌연변이, 스플라이스 변이, 게놈 재배열, 또는 프로테아좀-생성 스플라이싱된 항원을 포함하는, 조성물.
제 1항 내지 제 108항 중 어느 한 항에 있어서, 상기 종양은 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 방광암, 뇌암, B 세포 림프종, 급성 골수성 백혈병, 성인 급성 림프구성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 비소 세포 폐암 및 소세포 폐암으로 이루어진 군으로부터 선택되고,
또는 감염성 질병 유기체는 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS), 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2), 에볼라, HIV, B형 간염 바이러스(HBV), 인플루엔자, C형 간염 바이러스(HCV), 인유두종바이러스(HPV), 거대세포바이러스(CMV), 치쿤구니아 바이러스, 호흡기 세포융합 바이러스(RSV), 뎅기열 바이러스, 오르티믹소바이러스과 바이러스 및 결핵으로 이루어진 군으로부터 선택되는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 109항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-코딩 핵산 서열은 적어도 2-10, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 에피토프-코딩 핵산 서열을 포함하는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 109항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-코딩 핵산 서열이 적어도 11-20, 15-20, 11-100, 11-200, 11-300, 11-400, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 최대 400개의 에피토프-코딩 핵산 서열을 포함하는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 109항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-코딩 핵산 서열은 적어도 2-400개의 에피토프-코딩 핵산 서열을 포함하고, 여기서 적어도 2개의 에피토프-코딩 핵산 서열은 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 클래스 I에 의해 제시되는 폴리펩티드 서열 또는 이의 일부를 코딩하는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 112항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-코딩 핵산 서열은 적어도 2-10, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 항원-코딩 핵산 서열을 포함하는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 112항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-코딩 핵산 서열이 적어도 11-20, 15-20, 11-100, 11-200, 11-300, 11-400, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 최대 400개의 항원-코딩 핵산 서열을 포함하는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 112항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-코딩 핵산 서열은 적어도 2-400개의 항원-코딩 핵산 서열을 포함하고, 여기서 적어도 2개의 항원-코딩 핵산 서열은 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 클래스 I에 의해 제시되는 폴리펩티드 서열 또는 이의 일부를 코딩하는, 조성물.
제 19항 또는 제 23항에 있어서, 적어도 2개의 에피토프-코딩 핵산 서열은 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상의 MHC 클래스 I에 의해 제시되는 폴리펩티드 서열 또는 이의 일부를 코딩하는, 조성물.
제 1항 내지 제 116항 중 어느 한 항에 있어서, 대상체에게 투여되고 번역될 때, 에피토프-코딩 핵산 서열에 의해 코딩되는 적어도 하나의 에피토프가 항원 제시 세포 상에 제시되어 종양 세포 표면 또는 감염된 세포 표면 상의 적어도 하나의 항원을 표적으로 하는 면역 반응을 야기하는, 조성물.
제 1항 내지 제 117항 중 어느 한 항에 있어서, 상기 적어도 하나의 항원-코딩 핵산 서열이 대상체에게 투여되고 번역될 때, MHC 클래스 I 또는 클래스 II 에피토프 중 적어도 하나가 항원 제시 세포 상에 제시되어 종양 세포 표면 또는 감염된 세포 표면의 적어도 하나의 에피토프를 표적으로 하는 면역 반응을 야기하고, 임의로 여기서 적어도 하나의 항원-코딩 핵산 서열 각각의 발현은 적어도 하나의 프로모터 뉴클레오티드 서열에 의해 구동되는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 118항 중 어느 한 항에 있어서, 각각의 에피토프-코딩 핵산 서열은 8 내지 35 아미노산 길이, 임의로 9-17, 9-25, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34 또는 35개의 아미노산 길이인 폴리펩티드 서열을 코딩하는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 119항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열이 존재하는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 119항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열이 존재하고, 코딩된 펩티드 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경을 포함하는 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열을 포함하는, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 121항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열이 12-20, 12, 13, 14, 15, 16, 17, 18, 19, 20 또는 20-40 아미노산 길이인, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 122항 중 어느 한 항에 있어서, 상기 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열이 존재하고, 적어도 하나의 보편적인 MHC 클래스 II 항원-코딩 핵산 서열을 포함하고, 임의로 적어도 하나의 보편적인 서열은 적어도 하나의 파상풍 톡소이드 및 PADRE를 포함하는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 123항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열 또는 상기 제 2 프로모터 뉴클레오티드 서열이 유도성인, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 123항 중 어느 한 항에 있어서, 상기 적어도 하나의 프로모터 뉴클레오티드 서열 또는 상기 제 2 프로모터 뉴클레오티드 서열이 비-유도성인, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 125항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 백본에 천연인 폴리(A) 서열을 포함하는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 125항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 백본에 외인성인 폴리(A) 서열을 포함하는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 127항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 상기 적어도 하나의 항원-코딩 핵산 서열 중 적어도 하나에 작동가능하게 연결되는, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 128항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 적어도 20, 적어도 30, 적어도 40, 적어도 50, 적어도 60, 적어도 70, 적어도 80, 적어도 90 또는 적어도 100개의 연속 A 뉴클레오티드인, 조성물.
제 16항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 128항 중 어느 한 항에 있어서, 상기 적어도 하나의 폴리(A) 서열이 적어도 80개의 연속 A 뉴클레오티드인, 조성물.
제 1항 내지 제 130항 중 어느 한 항에 있어서, 상기 카세트가 인트론 서열, 우드척 간염 바이러스 전사후 조절 요소(WPRE) 서열, 내부 리보솜 진입 서열(IRES) 서열, 2A 자가-절단 펩티드 서열을 코딩하는 뉴클레오티드 서열, 푸린 절단 부위를 코딩하는 뉴클레오티드 서열, 또는 적어도 하나의 항원-코딩 핵산 서열 중 적어도 하나에 작동가능하게 연결된 mRNA의 핵 수출, 안정성 또는 번역 효율을 향상시키는 것으로 알려진 5' 또는 3' 비-코딩 영역에서 서열 중 적어도 하나를 추가로 포함하는, 조성물.
제 1항 내지 제 131항 중 어느 한 항에 있어서, 상기 카세트가 녹색 형광 단백질(GFP), GFP 변이체, 분비된 알칼리성 포스파타제, 루시퍼라제, 루시퍼라제 변이체, 또는 검출가능한 펩티드 또는 에피토프를 포함하지만 이에 제한되지 않는 리포터 유전자를 추가로 포함하는, 조성물.
제 132항에 있어서, 상기 검출가능한 펩티드 또는 에피토프가 HA 태그, 플래그(Flag) 태그, His-태그 또는 V5 태그로 이루어진 군으로부터 선택되는, 조성물.
제 1항 내지 제 133항 중 어느 한 항에 있어서, 상기 하나 이상의 벡터가 적어도 하나의 면역 조절자를 코딩하는 하나 이상의 핵산 서열을 추가로 포함하는, 조성물.
제 134항에 있어서, 상기 면역 조절자가 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원 결합 단편, 항-4-1BB 항체 또는 이의 항원 결합 단편, 또는 항-OX-40 항체 또는 이의 항원 결합 단편인, 조성물.
제 135항에 있어서, 상기 항체 또는 이의 항원-결합 단편은 Fab 단편, Fab' 단편, 단일 사슬 Fv(scFv), 단일 특이성 또는 다중 특이성으로 서로 연결된 단일 도메인 항체(sdAb)(예를 들어, 낙타 항체 도메인) 또는 전장 단일-사슬 항체(예를 들어, 가요성 링커에 의해 연결된 중쇄 및 경쇄가 있는 전장 IgG)인, 조성물.
제 135항 또는 제 136항에 있어서, 상기 항체의 중쇄 및 경쇄 서열이 2A 또는 IRES와 같은 자가-절단 서열에 의해 분리된 인접 서열이거나; 또는 상기 항체의 중쇄 및 경쇄 서열은 연속적인 글리신 잔기와 같은 가요성 링커에 의해 연결되는, 조성물.
제 134항에 있어서, 상기 면역 조절자가 사이토카인인, 조성물.
제 138항에 있어서, 상기 사이토카인이 IL-2, IL-7, IL-12, IL-15, 또는 IL-21 또는 이들 각각의 변이체 중 적어도 하나인, 조성물.
제 1항 내지 제 18항, 제 20항 내지 제 22항 또는 제 24항 내지 제 139항 중 어느 한 항에 있어서, 적어도 하나의 에피토프-코딩 핵산 서열이 다음 단계를 수행함으로써 선택되는, 조성물:
(a) 종양, 감염된 세포, 또는 감염성 질병 유기체로부터 엑솜, 전사체 또는 전체 게놈 뉴클레오티드 시퀀싱 데이터 중 적어도 하나를 수득하는 단계로서, 여기서 뉴클레오티드 시퀀싱 데이터는 항원 세트 각각의 펩티드 서열을 나타내는 데이터를 수득하기 위해 사용되는, 단계;
(b) 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상에서 각 항원이 하나 이상의 MHC 대립유전자에 의해 제시되는 수치적 가능성 세트를 생성하기 위해 각 항원의 펩티드 서열을 제시 모델에 입력하는 단계로서, 수치적 가능성 세트는 적어도 수신된 질량 분석 데이터에 기반으로 확인되는, 단계; 및
(c) 에피토프-코딩 핵산 서열을 생성하는 데 사용되는 선택된 항원 세트를 생성하기 위한 수치적 가능성 세트를 기반으로 항원 세트의 하위세트를 선택하는 단계.
제 19항 또는 제 23항에 있어서, 각각의 에피토프-코딩 핵산 서열이 다음 단계를 수행함으로써 선택되는, 조성물:
(a) 종양, 감염된 세포, 또는 감염성 질병 유기체로부터 엑솜, 전사체 또는 전체 게놈 뉴클레오티드 시퀀싱 데이터 중 적어도 하나를 수득하는 단계로서, 여기서 뉴클레오티드 시퀀싱 데이터는 항원 세트 각각의 펩티드 서열을 나타내는 데이터를 수득하기 위해 사용되는, 단계;
(b) 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상에서 각 항원이 하나 이상의 MHC 대립유전자에 의해 제시되는 수치적 가능성 세트를 생성하기 위해 각 항원의 펩티드 서열을 제시 모델에 입력하는 단계로서, 수치적 가능성 세트는 적어도 수신된 질량 분석 데이터에 기반으로 확인되는, 단계; 및
(c) 적어도 20개의 에피토프-코딩 핵산 서열을 생성하는 데 사용되는 선택된 항원 세트를 생성하기 위한 수치적 가능성 세트를 기반으로 항원 세트의 하위세트을 선택하는 단계.
제 140항에 있어서, 선택된 항원 세트의 수가 2-20인, 조성물.
제 140항 내지 제 142항 중 어느 한 항에 있어서, 상기 제시 모델은,
(a) 펩티드 서열의 특정 위치에서 MHC 대립유전자 중 특정 하나와 특정 아미노산의 쌍의 존재; 및
(b) 특정 위치에 특정 아미노산을 포함하는 펩티드 서열의 쌍의 MHC 대립유전자 중 특정 하나에 의해 세포 표면, 임의로 종양 세포 표면 또는 감염된 세포 표면 상에 제시될 가능성 사이의 의존성을 나타내는, 조성물.
제 140항 내지 제 143항 중 어느 한 항에 있어서, 선택된 항원 세트를 선택하는 것은 제시 모델을 기반으로 하여 선택되지 않은 항원에 비해 세포 표면 상에 제시될 가능성이 증가된 항원을 선택하는 것을 포함하고, 임의로 여기서 선택된 항원은 하나 이상의 특정 HLA 대립유전자에 의해 제시되는 것으로 검증된, 조성물.
제 140항 내지 제 144항 중 어느 한 항에 있어서, 선택된 항원 세트를 선택하는 것은 제시 모델을 기반으로 하여 선택되지 않은 항원에 비해 대상체에서 종양-특이적 또는 감염성 질병-특이적 면역 반응을 유도할 수 있는 가능성이 증가된 항원을 선택하는 것을 포함하는, 조성물.
제 140항 내지 제 145항 중 어느 한 항에 있어서, 선택된 항원 세트를 선택하는 것은 제시 모델을 기반으로 하여 선택되지 않은 항원에 비해 전문 항원 제시 세포(APC)에 의해 미경험 T 세포에 제시될 수 있는 가능성이 증가된 항원을 선택하는 것을 포함하고, 임의로 여기서 상기 APC가 수지상 세포(DC)인, 조성물.
제 140항 내지 제 146항 중 어느 한 항에 있어서, 선택된 항원 세트를 선택하는 것은 제시 모델을 기반으로 하여 선택되지 않은 항원에 비해 중추 또는 말초 관용을 통해 억제될 가능성이 감소된 항원을 선택하는 것을 포함하는, 조성물.
제 140항 내지 제 147항 중 어느 한 항에 있어서, 선택된 항원 세트를 선택하는 것은 제시 모델을 기반으로 하여 선택되지 않은 항원에 비해 대상체에서 정상 조직에 대한 자가면역 반응을 유도할 수 있는 가능성이 감소된 항원을 선택하는 것을 포함하는, 조성물.
제 140항 내지 제 148항에 있어서, 엑솜 또는 전사체 뉴클레오티드 시퀀싱 데이터는 종양 세포 또는 조직, 감염된 세포 또는 감염성 질병 유기체에서 시퀀싱을 수행함으로써 수득되는, 조성물.
제 149항에 있어서, 상기 시퀀싱이 차세대 시퀀싱(NGS) 또는 임의의 대규모 병렬 시퀀싱 접근법인, 조성물.
제 1항 내지 제 150항 중 어느 한 항에 있어서, 상기 카세트가 카세트에서 인접한 서열에 의해 형성된 접합 에피토프 서열을 포함하는, 조성물.
제 151항에 있어서, 적어도 하나 또는 각각의 접합부 에피토프 서열이 MHC에 대해 500 nM 초과의 친화도를 갖는, 조성물.
제 151항 또는 제 152항에 있어서, 각각의 접합부 에피토프 서열이 비-자기인, 조성물.
제 1항 내지 제 153항 중 어느 한 항에 있어서, 각각의 MHC 클래스 I 에피토프는 집단의 적어도 5%에 존재하는 적어도 하나의 HLA 대립유전자에 의해 제시될 수 있는 것으로 예측되거나 검증된, 조성물.
제 1항 내지 제 154항 중 어느 한 항에 있어서, 각각의 MHC 클래스 I 에피토프는 적어도 하나의 HLA 대립유전자에 의해 제시될 수 있는 것으로 예측되거나 검증되고, 여기서 각각의 항원/HLA 쌍은 집단에서 적어도 0.01%의 항원/HLA 유병률을 갖는, 조성물.
제 1항 내지 제 155항 중 어느 한 항에 있어서, 각각의 MHC 클래스 I 에피토프는 적어도 하나의 HLA 대립유전자에 의해 제시될 수 있는 것으로 예측되거나 검증되고, 여기서 각각의 항원/HLA 쌍은 집단에서 적어도 0.1%의 항원/HLA 유병률을 갖는, 조성물.
제 1항 내지 제 156항 중 어느 한 항에 있어서, 상기 카세트는 번역된 야생형 핵산 서열을 포함하는 비-치료적 MHC 클래스 I 또는 클래스 II 에피토프 핵산 서열을 코딩하지 않으며, 여기서 비-치료적 에피토프는 대상체의 MHC 대립유전자 상에 표시될 것으로 예측되는, 조성물.
제 157항에 있어서, 상기 비-치료적 예측 MHC 클래스 I 또는 클래스 II 에피토프 서열이 카세트에서 인접한 서열에 의해 형성된 접합 에피토프 서열인, 조성물.
제 151항 내지 제 158항 중 어느 한 항에 있어서, 상기 예측이 비-치료적 에피토프의 서열을 제시 모델에 입력함으로써 생성된 제시 가능성을 기반으로 하는, 조성물.
제 151항 내지 제 159항 중 어느 한 항에 있어서, 카세트에서 적어도 하나의 항원-코딩 핵산 서열의 순서는 다음을 포함하는 일련의 단계에 의해 결정되는, 조성물:
(a) 적어도 하나의 항원-코딩 핵산 서열의 상이한 순서에 상응하는 후보 카세트 서열 세트를 생성하는 단계;
(b) 각각의 후보 카세트 서열에 대해, 후보 카세트 서열에서 비-치료적 에피토프의 제시를 기반으로 제시 점수를 결정하는 단계; 및
(c) 항원 백신에 대한 카세트 서열로서 미리결정된 임계값 미만의 제시 점수와 연관된 후보 카세트 서열을 선택하는 단계.
제 1항 내지 제 160항 중 어느 한 항의 조성물 및 약제학적으로 허용되는 담체를 포함하는 약제학적 조성물.
제 161항에 있어서, 상기 조성물이 보조제를 추가로 포함하는, 조성물.
제 161항 또는 제 162항에 있어서, 상기 조성물이 면역 조절자를 추가로 포함하는, 약제학적 조성물.
제 163항에 있어서, 상기 면역 조절제가 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원-결합 단편, 항-4-1BB 항체 또는 이의 항원-결합 단편, 또는 항-OX-40 항체 또는 이의 항원-결합 단편인, 약제학적 조성물.
제 1항 내지 제 160항 중 어느 한 항의 카세트 및 서열번호: 3 또는 서열번호: 5의 서열로부터 수득한 하나 이상의 요소를 포함하는 분리된 뉴클레오티드 서열 또는 분리된 뉴클레오티드 서열 세트로서, 임의로 여기서 상기 하나 이상의 요소는 서열번호: 3 또는 서열번호: 5에 제시된 서열의 비구조적 단백질-매개 증폭에 필요한 서열, 26S 프로모터 뉴클레오티드 서열, 폴리(A) 서열 및 nsP1-4 유전자로 이루어진 군으로부터 선택되고, 임의로 여기서 뉴클레오티드 서열은 cDNA인, 분리된 뉴클레오티드 서열 또는 분리된 뉴클레오티드 서열 세트.
제 165항에 있어서, 상기 분리된 뉴클레오티드 서열의 서열 또는 세트는 서열번호: 6 또는 서열번호: 7에 제시된 서열의 위치 7544에 삽입된 상기 임의의 조성물 청구항의 카세트를 포함하는, 분리된 뉴클레오티드 서열.
제 165항 또는 제 166항에 있어서,
a) 서열번호: 3 또는 서열번호: 5의 서열로부터 수득한 하나 이상의 요소의 T7 또는 SP6 RNA 중합효소 프로모터 뉴클레오티드 서열 5'; 및
b) 임의로, 폴리(A) 서열의 하나 이상의 제한 부위 3'를 추가로 포함하는, 분리된 뉴클레오티드 서열.
제 165항에 있어서, 제 1항 내지 제 160항 중 어느 한 항의 카세트가 서열번호: 8 또는 서열번호: 9의 위치 7563에 삽입되는, 분리된 뉴클레오티드 서열.
제 165항 내지 제 168항 중 어느 한 항의 뉴클레오티드 서열을 포함하는 벡터 또는 벡터 세트.
제 165항 내지 제 169항 중 어느 한 항의 뉴클레오티드 서열 또는 분리된 뉴클레오티드 서열 세트를 포함하는 분리된 세포로서, 임의로 여기서 상기 세포는 BHK-21, CHO, HEK293 또는 이의 변이체, 911, HeLa, A549, LP-293, PER.C6, 또는 AE1-2a 세포인, 분리된 세포.
제 1항 내지 제 160항 중 어느 한 항의 조성물 및 사용 설명서를 포함하는 키트.
제 1항 내지 제 160항 중 어느 한 항의 조성물 또는 제 161항 내지 제 164항 중 어느한 항의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하여, 대상체에서 암을 치료하는 방법.
제 172항에 있어서, 상기 에피토프-코딩 핵산 서열이 암을 갖는 대상체의 종양 또는 감염된 대상체의 세포 또는 샘플로부터 유래되는, 방법.
제 172항에 있어서, 상기 에피토프-코딩 핵산 서열이 암을 갖는 대상체의 종양 또는 감염된 대상체의 세포 또는 샘플로부터 유래되지 않는, 방법.
제 1항 내지 제 160항 중 어느 한 항의 조성물 또는 제 161항 내지 제 164항 중 어느 한 항의 약제학적 조성물을 대상체에게 투여하는 단계를 포함하여, 대상체에서 면역 반응을 자극하는 방법.
제 172항 내지 제 175항 중 어느 한 항에 있어서, 상기 대상체가 MHC 클래스 I 에피토프를 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립유전자를 발현하고, 임의로 여기서 HLA가 A*03:01, A*11:01, A*02:01, C*01:02 및/또는 A*01:01인, 방법.
제 172항 내지 제 176항 중 어느 한 항에 있어서, 상기 조성물이 근육내(IM), 피내(ID), 피하(SC) 또는 정맥내(IV)로 투여되는, 방법.
제 172항 내지 제 176항 중 어느 한 항에 있어서, 상기 조성물이 근육내 투여되는, 방법.
제 172항 내지 제 178항 중 어느 한 항에 있어서, 상기 방법이 하나 이상의 면역 조절자를 투여하는 단계를 추가로 포함하고, 임의로 여기서 면역 조절자는 조성물 또는 약제학적 조성물의 투여 전에, 투여와 동시에 또는 투여 후에 투여되는, 방법.
제 179항에 있어서, 상기 하나 이상의 면역 조절자가 항-CTLA4 항체 또는 이의 항원-결합 단편, 항-PD-1 항체 또는 이의 항원-결합 단편, 항-PD-L1 항체 또는 이의 항원 결합 단편, 항-4-1BB 항체 또는 이의 항원 결합 단편, 또는 항-OX-40 항체 또는 이의 항원 결합 단편으로 이루어진 군으로부터 선택되는, 방법.
제 179항 또는 제 180항에 있어서, 상기 면역 조절자가 정맥내(IV), 근육내(IM), 피내(ID) 또는 피하(SC)로 투여되는, 방법.
제 181항에 있어서, 상기 피하 투여가 상기 조성물 또는 약제학적 조성물 투여 부위 근처에 있거나 림프절을 배출하는 하나 이상의 벡터 또는 조성물에 매우 근접한, 방법.
제 172항 내지 제 182항 중 어느 한 항에 있어서, 상기 대상체에게 제 2 백신 조성물을 투여하는 단계를 추가로 포함하는, 방법.
제 183항에 있어서, 상기 제 2 백신 조성물이 상기 조성물 또는 제 172항 내지 제 182항 중 어느 한 항의 약제학적 조성물의 투여 전에 투여되는, 방법.
제 183항에 있어서, 상기 제 2 백신 조성물이 상기 조성물 또는 제 172항 내지 제 182항 중 어느 한 항의 약제학적 조성물의 투여 후에 투여되는, 방법.
제 184항 또는 제 185항에 있어서, 상기 제 2 백신 조성물이 상기 조성물 또는 제 172항 내지 제 182항 중 어느 한 항의 약제학적 조성물과 동일한, 방법.
제 184항 또는 제 185항에 있어서, 상기 제 2 백신 조성물이 상기 조성물 또는 제 172항 내지 제 182항 중 어느 한 항의 약제학적 조성물과 상이한, 방법.
제 187항에 있어서, 상기 제 2 백신 조성물은 적어도 하나의 항원-코딩 핵산 서열을 코딩하는 침팬지 아데노바이러스 벡터를 포함하는, 방법.
제 188항에 있어서, 침팬지 아데노바이러스 벡터에 의해 코딩된 상기 적어도 하나의 항원-코딩 핵산 서열은 제 1항 내지 제 164항 중 어느 한 항의 적어도 하나의 항원-코딩 핵산 서열과 동일한, 방법.
제 1항 내지 제 164항 중 어느 한 항의 하나 이상의 벡터의 제조 방법으로서,
(a) 백본 및 카세트를 포함하는 선형화된 DNA 서열을 수득하는 단계;
(b) 선형화된 DNA 서열을 RNA로 전사하는데 필요한 모든 성분을 함유하는 시험관내 전사 반응물에 선형화된 DNA 서열을 첨가함으로써 선형화된 DNA 서열을 시험관내 전사하는 단계로서, 임의로 생성된 RNA에 m7g 캡을 시험관내 첨가하는 단계를 추가로 포함하는, 단계; 및
(c) 시험관내 전사 반응물으로부터 하나 이상의 벡터를 분리하는 단계를 포함하는, 방법.
제 190항에 있어서, 상기 선형화된 DNA 서열은 DNA 플라스미드 서열을 선형화하거나 PCR을 사용하여 증폭함으로써 생성되는, 제조 방법.
제 191항에 있어서, 상기 DNA 플라스미드 서열이 박테리아 재조합 또는 전체 게놈 DNA 합성 또는 박테리아 세포에서 합성된 DNA의 증폭과 함께 전체 게놈 DNA 합성 중 하나를 사용하여 생성되는, 제조 방법.
제 190항에 있어서, 시험관내 전사 반응물로부터 하나 이상의 벡터를 분리하는 단계는 페놀 클로로포름 추출, 실리카 컬럼 기반 정제 또는 유사한 RNA 정제 방법 중 하나 이상을 포함하는, 제조 방법.
항원 발현 시스템의 전달을 위한 제 1항 내지 제 164항 중 어느 한 항의 조성물을 제조하는 방법으로서,
(a) 나노입자 전달 비히클을 위한 성분을 제공하는 단계;
(b) 항원 발현 시스템을 제공하는 단계; 및
(c) 나노입자 전달 비히클 및 항원 발현 시스템이 항원 발현 시스템의 전달을 위한 조성물을 생성하기에 충분한 조건을 제공하는 단계를 포함하는, 방법.
제 194항에 있어서, 상기 조건이 미세유체 혼합에 의해 제공되는, 제조 방법.
대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하여, 임의로 질병이 암 또는 감염인 질병을 갖는 대상체를 치료하는 방법으로서, 여기서 상기 항원-기반 백신은 항원-코딩 카세트, 또는 카세트에 의해 코딩된 폴리펩티드 서열을 포함하고, 여기서 항원-코딩 카세트는 5'에서 3'으로 다음식으로 기술된 적어도 하나의 항원-코딩 핵산 서열을 포함하고:
(E _x -(E ^N _n ) _y ) _z
여기서 E는 별개의 에피토프-코딩 핵산 서열을 포함하는 뉴클레오티드 서열을 나타내고,
n은 분리된 별개의 에피토프-코딩 핵산 서열의 수를 나타내고 0을 포함하는 임의의 정수이고,
E^N은 각각의 상응하는 n에 대해 분리된 별개의 에피토프-코딩 핵산을 포함하는 뉴클레오티드 서열을 나타내고,
z의 각 반복에 대해: 각 n에 대해 x = 0 또는 1, y = 0 또는 1이고, 그리고 x 또는 y 중 적어도 하나는 1이고,
z = 2 이상이고, 여기서 항원-코딩 핵산 서열은 E, 주어진 E^N, 또는 이들의 조합의 적어도 2회 반복을 포함하고,
적어도 2회 반복을 포함하는 별개의 에피토프-코딩 핵산 서열 중 적어도 하나는 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는, 방법.
대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하여, 임의로 질병이 암인 질병을 갖는 대상체를 치료하는 방법으로서, 여기서 상기 항원-기반 백신은 항원 발현 시스템을 포함하고, 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 백본은,
(i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및
(ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 벡터 백본; 및
(b) 카세트를 포함하고, 여기서 카세트는:
(i) (I) KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서,
여기서 각각의 에피토프-코딩 핵산 서열은,
(A) 임의로 5' 링커 서열, 및
(B) 임의로 3' 링커 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열;
(ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및
(iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및
(v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고,
여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함하는, 방법.
대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하여, 임의로 질병이 암인 질병을 갖는 대상체를 치료하는 방법으로서, 여기서 상기 항원-기반 백신은 항원 발현 시스템을 포함하고, 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 백본은
(i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및
(ii) 임의로 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 벡터 백본; 및
(b) 카세트를 포함하고, 여기서 카세트는
(i) (I) 임의로 (1) 코딩된 에피토프 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경, 임의로 여기서 적어도 하나의 변경은 KRAS 돌연변이이고, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드로 이루어진 군에서 선택된 감염성 질병 유기체 펩티드를 코딩하는 핵산 서열을 포함하는 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서,
여기서 각각의 에피토프-코딩 핵산 서열은;
(A) 임의로 5' 링커 서열, 및
(B) 임의로 3' 링커 서열을 포함하는, 적어도 하나의 항원-코딩 핵산 서열;
(ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및
(iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iv) 임의로, GPGPG 아미노산 링커 서열(서열번호:56)을 코딩하는 적어도 하나의 핵산 서열; 및
(v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고,
여기서 제 2 프로모터가 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 카세트는,
(1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나,
(2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아닌, 방법.
제 196항 내지 제 198항 중 어느 한 항에 있어서, 상기 에피토프-코딩 핵산 서열이 암을 갖는 대상체의 종양으로부터 또는 감염된 대상체의 세포 또는 샘플로부터 유래되는, 방법.
제 196항 내지 제 198항 중 어느 한 항에 있어서, 상기 에피토프-코딩 핵산 서열이 암을 갖는 대상체의 종양으로부터 또는 감염된 대상체의 세포 또는 샘플로부터 유래되지 않는, 방법.
대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하여, 대상체에서 면역 반응을 자극하는 방법으로서, 여기서 상기 항원-기반 백신은 항원-코딩 카세트, 또는 카세트에 의해 코딩된 폴리펩티드 서열을 포함하고, 여기서 항원-코딩 카세트는 5'에서 3'으로 다음식으로 기술된 적어도 하나의 항원-코딩 핵산 서열을 포함하고:
(E _x -(E ^N _n ) _y ) _z
여기서,
E는 별개의 에피토프-코딩 핵산 서열을 포함하는 뉴클레오티드 서열을 나타내고,
n은 분리된 별개의 에피토프-코딩 핵산 서열의 수를 나타내고 0을 포함하는 임의의 정수이고,
E^N은 각각의 상응하는 n에 대해 분리된 별개의 에피토프-코딩 핵산을 포함하는 뉴클레오티드 서열을 나타내고,
z의 각 반복에 대해: 각 n에 대해 x = 0 또는 1, y = 0 또는 1이고, 그리고 x 또는 y 중 적어도 하나는 1이고,
z = 2 이상이고, 여기서 항원-코딩 핵산 서열은 E, 주어진 E^N, 또는 이들의 조합의 적어도 2회 반복을 포함하고,
적어도 2회 반복을 포함하는 별개의 에피토프-코딩 핵산 서열 중 적어도 하나는 별개의 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는, 방법.
대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하여, 대상체에서 면역 반응을 자극하는 방법으로서, 여기서 상기 항원-기반 백신은 항원 발현 시스템을 포함하고, 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 백본은,
(i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및
(ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 벡터 백본; 및
(b) 카세트를 포함하고, 여기서 카세트는:
(i) (I) KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서,
여기서 각각의 에피토프-코딩 핵산 서열은,
(A) 임의로 5' 링커 서열, 및
(B) 임의로 3' 링커 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열;
(ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및
(iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및
(v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고,
여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 적어도 하나의 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함하는, 방법.
대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하여, 임의로 질병이 암 또는 감염인 질병을 갖는 대상체를 치료하는 방법으로서, 여기서 상기 항원-기반 백신은 항원 발현 시스템을 포함하고, 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 백본은
(i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및
(ii) 임의로 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 벡터 백본; 및
(b) 카세트를 포함하고, 여기서 카세트는
(i) (I) 임의로 (1) 코딩된 에피토프 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경, 임의로 여기서 적어도 하나의 변경은 KRAS 돌연변이이고, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드로 이루어진 군에서 선택된 감염성 질병 유기체 펩티드를 코딩하는 핵산 서열을 포함하는 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서,
여기서 각각의 에피토프-코딩 핵산 서열은;
(A) 임의로 5' 링커 서열, 및
(B) 임의로 3' 링커 서열을 포함하는, 적어도 하나의 항원-코딩 핵산 서열;
(ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및
(iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iv) 임의로, GPGPG 아미노산 링커 서열(서열번호:56)을 코딩하는 적어도 하나의 핵산 서열; 및
(v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고,
여기서 제 2 프로모터가 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 카세트는,
(1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나,
(2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아닌, 방법.
제 196항 내지 제 203항 중 어느 한 항에 있어서, 상기 대상체가 적어도 하나의 에피토프 서열을 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립유전자를 발현하고, 임의로 여기서 제시되는 것으로 예측되거나 알려진 적어도 하나의 에피토프 서열은 (1) KRAS-연관 MHC 클래스 I 네오에피토프, 및/또는 (2) 면역우성 MHC 클래스 I 에피토프 및 카세트에서 코딩된 다른 MHC 클래스 I 에피토프를 포함하는, 방법.
제 196항 내지 제 203항 중 어느 한 항에 있어서, 상기 대상체가 적어도 하나의 에피토프 서열을 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립유전자를 발현하고, 여기서 적어도 하나의 에피토프 서열이 세포 표면 상의 MHC 클래스 I에 의해 제시되는 것으로 알려지거나 의심되는 에피토프를 포함하고, 임의로 여기서 제시되는 것으로 예측되거나 알려진 적어도 하나의 에피토프 서열은 (1) KRAS-연관 MHC 클래스 I 네오에피토프, 및/또는 (2) 면역우성 MHC 클래스 I 에피토프 및 카세트에서 코딩된 다른 MHC 클래스 I 에피토프를 포함하는, 방법.
제 205항에 있어서, 상기 세포의 표면이 종양 세포 표면인, 방법.
제 206항에 있어서, 상기 세포는 폐암, 흑색종, 유방암, 난소암, 전립선암, 신장암, 위암, 대장암, 고환암, 두경부암, 췌장암, 뇌암, B 세포 림프종, 급성 골수성 백혈병, 만성 골수성 백혈병, 만성 림프구성 백혈병, T 세포 림프구성 백혈병, 비소 세포 폐암 및 소세포 폐암으로 이루어진 군으로부터 선택된 종양 세포인, 방법.
제 205항에 있어서, 상기 세포의 표면이 감염된 세포 표면인, 방법.
제 208항에 있어서, 상기 세포는 병원체 감염 세포, 바이러스 감염 세포, 박테리아 감염 세포, 진균 감염 세포 및 기생충 감염 세포로 이루어진 군으로부터 선택된 감염 세포인, 방법.
제 209항에 있어서, 상기 바이러스 감염된 세포가 HIV 감염 세포, 중증 급성 호흡기 증후군 관련 코로나바이러스(SARS) 감염 세포, 중증 급성 호흡기 증후군 코로나바이러스 2(SARS-CoV-2) 감염 세포, 에볼라 감염 세포, B형 간염 바이러스(HBV) 감염 세포, 인플루엔자 감염 세포, 오르티믹소바이러스과 바이러스 감염 세포, 인유두종 바이러스(HPV) 감염 세포, 거대세포바이러스(CMV) 감염 세포, 치쿤구니야 바이러스 감염 세포, 호흡기 세포융합 바이러스(RSV) 감염 세포, 뎅기열 바이러스 감염 세포 및 C형 간염 바이러스(HCV) 감염 세포로 이루어진 군으로부터 선택되는, 방법.
대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하여, 대상체에서 면역 반응을 유도하는 방법으로서, 여기서 상기 항원-기반 백신은 항원-코딩 카세트, 또는 카세트에 의해 코딩된 폴리펩티드 서열을 포함하고, 여기서 항원-코딩 카세트는 5'에서 3'으로 다음식으로 기술된 적어도 하나의 항원-코딩 핵산 서열을 포함하고:
(E _x -(E ^N _n ) _y ) _z
여기서 E는 별개의 에피토프-코딩 핵산 서열을 포함하는 뉴클레오티드 서열을 나타내고,
n은 분리된 별개의 에피토프-코딩 핵산 서열의 수를 나타내고 0을 포함하는 임의의 정수이고,
E^N은 각각의 상응하는 n에 대해 분리된 별개의 에피토프-코딩 핵산을 포함하는 뉴클레오티드 서열을 나타내고,
z의 각 반복에 대해: 각 n에 대해 x = 0 또는 1, y = 0 또는 1이고, 그리고 x 또는 y 중 적어도 하나는 1이고,
z = 2 이상이고, 여기서 항원-코딩 핵산 서열은 E, 주어진 E^N, 또는 이들의 조합의 적어도 2회 반복을 포함하고,
적어도 2회 반복을 포함하는 별개의 에피토프-코딩 핵산 서열 중 적어도 하나는 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는, 방법.
대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하여, 대상체에서 면역 반응을 유도하는 방법으로서, 여기서 상기 항원-기반 백신은 항원 발현 시스템을 포함하고, 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 백본은,
(i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및
(ii) 임의로, 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 벡터 백본; 및
(b) 카세트를 포함하고, 여기서 카세트는:
(i) (I) KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서,
여기서 각각의 에피토프-코딩 핵산 서열은,
(A) 임의로 5' 링커 서열, 및
(B) 임의로 3' 링커 서열을 포함하는, 적어도 하나의 항원-코딩 핵산 서열;
(ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및
(iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iv) 임의로, GPGPG 아미노산 링커 서열(서열번호: 56)을 코딩하는 적어도 하나의 핵산 서열; 및
(v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고,
여기서 제 2 프로모터 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 적어도 하나의 항원-코딩 핵산 서열은 KRAS-연관 MHC 클래스 I 네오에피토프를 코딩하는 에피토프-코딩 핵산 서열의 적어도 2회 반복을 포함하고,
여기서 대상체는 적어도 하나의 KRAS-연관 MHC 클래스 I 네오에피토프를 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립유전자를 발현하는, 방법.
대상체에게 항원-기반 백신을 대상체에게 투여하는 단계를 포함하여, 대상체에서 면역 반응을 유도하는 방법으로서, 여기서 상기 항원-기반 백신은 항원 발현 시스템을 포함하고, 항원 발현 시스템은 하나 이상의 벡터를 포함하고,
하나 이상의 벡터는,
(a) 벡터 백본으로서, 여기서 백본은
(i) 적어도 하나의 프로모터 뉴클레오티드 서열, 및
(ii) 임의로 적어도 하나의 폴리아데닐화(폴리(A)) 서열을 포함하는, 벡터 백본; 및
(b) 카세트를 포함하고, 여기서 카세트는
(i) (I) 임의로 (1) 코딩된 에피토프 서열을 야생형 핵산 서열에 의해 코딩된 상응하는 펩티드 서열과 구별되게 만드는 적어도 하나의 변경, 임의로 여기서 적어도 하나의 변경은 KRAS 돌연변이이고, 또는 (2) 병원체-유래 펩티드, 바이러스-유래 펩티드, 박테리아-유래 펩티드, 진균-유래 펩티드, 기생충-유래 펩티드로 이루어진 군에서 선택된 감염성 질병 유기체 펩티드를 코딩하는 핵산 서열을 포함하고, 임의로 에피토프-코딩 핵산 서열은 MHC 클래스 I 에피토프를 코딩하는, 적어도 2개의 별개의 에피토프-코딩 핵산 서열을 포함하는 적어도 하나의 항원-코딩 핵산 서열로서,
여기서 각각의 에피토프-코딩 핵산 서열은;
(A) 임의로 5' 링커 서열, 및
(B) 임의로 3' 링커 서열을 포함하는, 적어도 하나의 항원-코딩 핵산 서열;
(ii) 임의로, 항원-코딩 핵산 서열에 작동가능하게 연결된 제 2 프로모터 뉴클레오티드 서열; 및
(iii) 임의로, 적어도 하나의 MHC 클래스 II 에피토프-코딩 핵산 서열;
(iv) 임의로, GPGPG 아미노산 링커 서열(서열번호:56)을 코딩하는 적어도 하나의 핵산 서열; 및
(v) 임의로, 적어도 하나의 제 2 폴리(A) 서열을 포함하고, 여기서 제 2 폴리(A) 서열은 벡터 백본에 대해 천연 폴리(A) 서열 또는 외인성 폴리(A) 서열이고,
여기서 제 2 프로모터가 뉴클레오티드 서열이 부재하는 경우, 항원-코딩 핵산 서열은 적어도 하나의 프로모터 뉴클레오티드 서열에 작동가능하게 연결되고,
여기서 카세트는,
(1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나,
(2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아니고,
여기서 대상체는 면역우성 MHC 클래스 I 에피토프 및 카세트에서 코딩된 다른 MHC 클래스 I 에피토프를 모두 제시하는 것으로 예측되거나 알려진 적어도 하나의 HLA 대립유전자를 발현하는, 방법.
제 196항 내지 제 213항 중 어느 한 항에 있어서, 상기 항원 발현 시스템이 제 1항 내지 제 160항 중 어느 한 항의 항원 발현 시스템 중 임의의 하나를 포함하는, 방법.
제 196항 내지 제 213항 중 어느 한 항에 있어서, 상기 항원-기반 백신이 제161항 내지 제 164항 중 어느 한 항의 약제학적 조성물 중 임의의 하나를 포함하는, 방법.
제 196항 내지 제 215항 중 어느 한 항에 있어서, 상기 항원-기반 백신이 프라이밍 용량으로 투여되는, 방법.
제 196항 내지 제 216항 중 어느 한 항에 있어서, 상기 항원-기반 백신이 하나 이상의 부스팅 용량으로 투여되는, 방법.
제 217항에 있어서, 상기 부스팅 용량이 상기 프라이밍 용량과 상이한, 방법.
제 218항에 있어서,
a) 상기 프라이밍 용량은 침팬지 아데노바이러스 벡터를 포함하고 상기 부스팅 용량은 알파바이러스 벡터를 포함하거나; 또는
b) 상기 프라이밍 용량은 알파바이러스 벡터 벡터를 포함하고 상기 부스팅 용량은 침팬지 아데노바이러스 벡터를 포함하는, 방법.
제 217항에 있어서, 상기 부스팅 용량이 상기 프라이밍 용량과 동일한, 방법.
제 217항 내지 제 220항 중 어느 한 항에 있어서, 하나 이상의 부스팅 용량의 주사 부위가 프라이밍 용량의 주사 부위에 가능한 한 가까운, 방법.
상기 방법 청구항 중 어느 한 항에 있어서, 상기 대상체의 HLA-일배체형을 결정하거나 결정했던 것을 추가로 포함하는, 방법.
상기 방법 청구항 중 어느 한 항에 있어서, 상기 항원-기반 백신이 근육내(IM), 피내(ID), 피하(SC) 또는 정맥내(IV)로 투여되는, 방법.
상기 방법 청구항 중 어느 한 항에 있어서, 상기 항원-기반 백신이 근육내(IM) 투여되는, 방법.
제 224항에 있어서, 상기 IM 투여가 분리된 주사 부위에서 투여되는, 방법.
제 225항에 있어서, 상기 분리된 주사 부위가 대향 삼각근에 있는, 방법.
제 226항에 있어서, 상기 분리된 주사 부위가 양쪽의 둔근 또는 대퇴직근 부위에 있는, 방법.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 KRAS-연관 MHC 클래스 I 네오에피토프 또는 KRAS 돌연변이가 KRAS G12C 돌연변이, KRAS G12V 돌연변이, KRAS G12D 돌연변이 또는 KRAS Q61H 돌연변이를 포함하는, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 KRAS-연관 MHC 클래스 I 네오에피토프 또는 KRAS 돌연변이가 서열번호: 75-82에 나타낸 아미노산 서열 중 어느 하나를 포함하는, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 항원-코딩 카세트가 서열번호: 75-82에 나타낸 각각의 아미노산 서열을 포함하는, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 항원-코딩 카세트가 서열번호: 75-82에 나타낸 각각의 아미노산 서열의 2회 이상의 반복을 포함하고, 임의로 서열번호: 75-82에 나타낸 각각의 아미노산 서열의 4회 반복을 포함하는, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 KRAS-연관 MHC 클래스 I 네오에피토프 또는 KRAS 돌연변이는 서열번호: 57, 서열번호: 58, 서열번호: 59, 또는 서열번호: 60에 나타낸 아미노산 서열을 포함하는, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 에피토프-코딩 핵산 서열은 별개의 KRAS-연관 MHC 클래스 I 네오에피토프 또는 별개의 KRAS 돌연변이를 독립적으로 코딩하는 2개 이상의 별개의 에피토프-코딩 핵산 서열을 포함하는, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 각각의 에피토프-코딩 핵산 서열은 별개의 KRAS-연관 MHC 클래스 I 네오에피토프 또는 별개의 KRAS 돌연변이를 독립적으로 코딩하는, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 에피토프-코딩 핵산 서열은 KRAS G12C 돌연변이, KRAS G12V 돌연변이, KRAS G12D 돌연변이, 또는 KRAS Q61H 돌연변이를 독립적으로 코딩하는 2개 이상의 에피토프-코딩 핵산 서열을 포함하는, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 에피토프-코딩 핵산 서열이 각각의 KRAS G12C 돌연변이, KRAS G12V 돌연변이, 및 KRAS G12D 돌연변이, 및 임의로 KRAS Q61H 돌연변이를 독립적으로 코딩하는, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 항원-코딩 핵산 서열이 서열번호: 64 또는 서열번호: 65에 나타낸 아미노산 서열을 포함하는 펩티드를 코딩하는, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 카세트는
(1) 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 다른 MHC 클래스 I 에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하고/하거나,
(2) 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 임의로 여기서 면역 반응은 검출 한계 미만으로 감소되고/되거나 면역 반응이 치료학적으로 효과적인 반응이 아닌, 방법또는 조성물.
제 236항에 있어서, 상기 카세트는 카세트에서 코딩되고 대상체에서 면역 반응을 자극할 수 있는 KRAS-연관 네오에피토프에 비해 대상체에게 백신 조성물로 투여될 때 5배 이상의 면역 반응을 자극하는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않는, 방법 또는 조성물.
제 236항에 있어서, 상기 카세트는 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않는, 방법 또는 조성물.
제 236항에 있어서, 상기 카세트는 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 검출 한계 미만으로 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않는, 방법 또는 조성물.
제 236항에 있어서, 상기 카세트는 다른 MHC 클래스 I 에피토프가 면역우성 MHC 클래스 I 에피토프의 부재하에 투여될 때의 면역 반응에 비해 대상체에게 백신 조성물로 투여될 때 카세트에서 코딩된 또 다른 MHC 클래스 I 에피토프에 대한 면역 반응을 감소시키는 면역우성 MHC 클래스 I 에피토프를 코딩하지 않고, 다른 MHC 클래스 I 에피토프에 대한 면역 반응은 치료학적으로 효과적인 반응이 아닌, 방법 또는 조성물.
상기 방법 또는 조성물 청구항 중 어느 한 항에 있어서, 상기 면역우성 에피토프는 TP53-연관 MHC 클래스 I 네오에피토프이고, 임의로 TP53-연관 MHC 클래스 I 네오에피토프는 S127Y 돌연변이를 포함하는, 방법 또는 조성물.