KR20200079497A

KR20200079497A - 제제

Info

Publication number: KR20200079497A
Application number: KR1020207012309A
Authority: KR
Inventors: 크리스티 엠. 우드; 노아 폴 가드너; 루치 루드라프라사드 샤; 스티븐 에스. 스컬리; 람지 머줍
Original assignee: 인텔리아 테라퓨틱스, 인크.
Priority date: 2017-09-29
Filing date: 2018-09-28
Publication date: 2020-07-03
Also published as: IL273541A; WO2019067992A1; MX2020007148A; JP2023103421A; BR112020006300A2; EP3688162B1; EA202090868A1; EP3688162A1; DK3688162T3; JP7284179B2; EP4385514A2; CA3077413A1; PL3688162T3; AR113031A1; AU2018338915A1; JP2020536125A; TW201924724A; FI3688162T3; CN111406108A; SG11202002653UA

Abstract

본 발명은 생물학적 활성제의 전달을 위한 개선된 특성을 갖는 지질 나노입자-기반 조성물, 조작된 세포, 및 작용제의 전달 방법을 제공한다.

Description

제제

본 출원은 2017년 9월 29일자로 출원된 미국 특허 가출원 제62/566,240호의 우선권의 이익을 주장하며, 그 내용은 전문이 본원에 참조로 포함된다.

생물학적 활성제, 특히 RNA, mRNA, 및 가이드 RNA의 전달을 위한 개선된 특성을 갖는 지질 나노입자("LNP") 조성물이 본원에 제공된다. LNP 조성물은 세포막을 가로질러 RNA 작용제의 전달을 용이하게 하고, 특정 구체예에서, 이들은 유전자 편집을 위한 성분 및 조성물을 살아있는 세포에 주입한다.

세포에 전달하기에 특히 어려운 생물학적 활성제는 단백질, 핵산계 약물, 및 이의 유도체를 포함한다. CRISPR/Cas9 시스템 성분의 전달을 위한 것과 같은 유망한 유전자 편집 기술을 세포에 전달하기 위한 조성물이 특히 관심사이다.

생체 내 세포에서 유전자를 편집하기 위한 다수의 성분 및 시스템이 현재 존재하며, 질병 치료를 위한 큰 잠재력을 제공한다. CRISPR/Cas 유전자 편집 시스템은 세포에서 리보핵산단백질 복합체로서 활성이다. RNA-지시된 뉴클레이스는 세포에서 DNA 서열에 결합하고 절단을 지시한다. 이러한 위치-특이적 뉴클레이스 활성은 세포 자체의 자연적 과정을 통해 유전자 편집을 용이하게 한다. 예를 들어, 세포는 비상동 말단 연결(non-homologous end joining, "NHEJ")으로 알려진 오류가 발생하기 쉬운 복구 과정으로써 이중-가닥 DNA 절단(double-stranded DNA break, DSB)에 반응한다. NHEJ 동안, 뉴클레오타이드는 세포에 의해 DNA 말단에서 첨가되거나 제거되어 절단된 서열로부터 변경된 서열을 생성할 수 있다. 다른 상황에서, 세포는 상동성-지시 복구(homology-directed repair, "HDR") 또는 상동 재조합(homologous recombination, "HR") 메커니즘에 의해 DSB를 복구하고, 여기서 내인성 또는 외인성 주형이 절단의 직접 복구에 사용될 수 있다. 이들 편집 기술 중 몇 가지는 단일-가닥 절단(single-stranded break, SSB) 또는 DSB 복구를 위한 세포 메커니즘을 이용한다.

CRISPR/Cas의 단백질 및 핵산 성분을 세포, 예컨대 환자의 세포에 전달하기 위한 조성물이 필요하다. 특히, CRISPR 단백질 성분을 인코딩하는 mRNA를 전달하고, CRISPR 가이드 RNA를 전달하기 위한 조성물이 특히 관심사이다. RNA 성분을 안정화하고 전달할 수 있는 시험관내 및 생체내 전달을 위한 유용한 특성을 갖는 조성물이 또한 특히 관심사이다.

본 발명자들은 본원에서 특히 CRISPR/Cas 유전자 편집 성분의 전달을 위한 유용한 특성을 갖는 지질 나노입자-기반 조성물을 제공한다.

특정 구체예에서, LNP 조성물은 RNA 성분; 및 지질 성분을 포함하고, 여기서 지질 성분은 다음을 포함한다: (1) 약 50-60 mol-% 아민 지질; (2) 약 8-10 mol-% 중성 지질; 및 (3) 약 2.5-4 mol-% PEG 지질, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 6이다. 추가적인 구체예에서, LNP 조성물은 (1) RNA 성분; (2) 약 50-60 mol-% 아민 지질; (3) 약 27-39.5 mol-% 헬퍼 지질; (4) 약 8-10 mol-% 중성 지질; 및 (5) 약 2.5-4 mol-% PEG 지질을 포함하고, 여기서 LNP 조성물의 N/P 비율은 약 5-7이다.

다른 구체예에서, LNP 조성물은 RNA 성분; 및 지질 성분을 포함하고, 여기서 지질 성분은 다음을 포함한다: (1) 약 50-60 mol-% 아민 지질; (2) 약 5-15 mol-% 중성 지질; 및 (3) 약 2.5-4 mol-% PEG 지질, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 3-10이다. 추가적인 구체예에서, LNP 조성물은 (1) 약 40-60 mol-% 아민 지질; (2) 약 5-15 mol-% 중성 지질; 및 (3) 약 2.5-4 mol-% PEG 지질을 포함하는 지질 성분을 포함하고, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 6이다. 또 다른 구체예에서, LNP 조성물은 (1) 약 50-60 mol-% 아민 지질; (2) 약 5-15 mol-% 중성 지질; 및 (3) 약 1.5-10 mol-% PEG 지질을 포함하는 지질 성분을 포함하고, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 6이다.

일부 구체예에서, LNP 조성물은 RNA 성분; 및 지질 성분을 포함하고, 여기서 지질 성분은 다음을 포함한다: (1) 약 40-60 mol-% 아민 지질; (2) 약 0-5 mol-% 중성 지질, 예를 들어, 인지질; 및 (3) 약 1.5-10 mol-% PEG 지질, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 3-10이다. 일부 구체예에서, LNP 조성물은 RNA 성분; 및 지질 성분을 포함하고, 여기서 지질 성분은 다음을 포함한다: (1) 약 40-60 mol-% 아민 지질; (2) 약 1 mol-% 미만의 중성 지질, 예를 들어, 인지질; 및 (3) 약 1.5-10 mol-% PEG 지질, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 3-10이다. 특정 구체예에서, LNP 조성물에는 중성 지질이 본질적으로 없다. 일부 구체예에서, LNP 조성물은 RNA 성분; 및 지질 성분을 포함하고, 여기서 지질 성분은 다음을 포함한다: (1) 약 40-60 mol-% 아민 지질; 및 (2) 약 1.5-10 mol-% PEG 지질, 여기서 지질 성분의 나머지는 헬퍼 지질이고, 여기서 LNP 조성물의 N/P 비율은 약 3-10이고, 여기서 LNP 조성물에는 중성 지질, 예를 들어, 인지질이 없다. 특정 구체예에서, LNP 조성물에는 중성 인지질이 없거나 본질적으로 없다. 특정 구체예에서, LNP 조성물에는 중성 지질, 예를 들어, 인지질이 없거나 본질적으로 없다.

특정 구체예에서, RNA 성분은 mRNA, 예컨대 RNA-유도 DNA-결합제(예를 들어, Cas 뉴클레이스 또는 클래스 2 Cas 뉴클레이스)를 포함한다. 특정 구체예에서, RNA 성분은 gRNA를 포함한다.

도 1은 1 mpk(도 1A) 또는 0.5 mpk(도 1B)의 단일 용량으로 나타난 LNP 조성물 중의 CRISPR/Cas 유전자 편집 성분 Cas9 mRNA 및 gRNA의 전달 후 마우스 간에서 달성된 TTR 유전자 편집의 백분율을 나타낸다.
도 2는 Cas9 mRNA 및 gRNA를 포함하는 LNP 조성물에 대한 입자 분포 데이터를 나타낸다.
도 3은 조성물에 대한 로그 미분 몰질량(도 3A) 및 평균 분자량 측정치(도 3B)을 비교하는 LNP 조성물의 물리화학적 특성을 나타낸다.
도 4는 도 3의 LNP 조성물을 분석하여, 도 4A에서 다분산도 계산을 나타내고 도 4B에서 Burchard-Stockmeyer 분석을 나타낸다.
도 5는 래트에서 단일 용량 투여 후 혈청 TTR 녹다운, 간에서의 유전자 편집, 및 사이토카인 MCP-1 수준에 대하여 PEG 지질 농도가 증가된 LNP 조성물의 효과를 평가한 실험 결과를 제공한다. 도 5A는 혈청 TTR 수준을 그래프로 나타내며; 도 5B는 간 샘플에서의 편집 퍼센트를 그래프로 나타내며; 도 5C는 pg/mL로 MCP-1 수준을 제공한다.
도 6은 LNP 조성물이 다양한 PEG 지질을 사용한 유전자 편집에 대해 효능을 유지함을 나타낸다 (혈청 TTR 수준에 의해 측정됨 (도 6A 및 6B) 및 편집 퍼센트 (도 6C).
도 7은 지질 A 유사체가 마우스에서 단일 용량 투여 후 간 편집 %에 의해 측정된 바와 같이 LNP 조성물에서 유전자 편집 카르고를 효과적으로 전달함을 나타낸다.
도 8은 일차 시노 간세포에서 다양한 LNP 조성물을 사용한 편집 퍼센트의 용량 반응 곡선을 나타낸다.
도 9A 및 도 9B는 gRNA 대 mRNA의 비율이 변하는 경우 혈청 TTR 및 편집 퍼센트 결과를 나타내고, 도 9C 및 도 9D는 Cas9 mRNA의 양이 일정하게 유지되고 gRNA가 마우스에서 단일 용량 투여 후 변하는 경우 간에서의 혈청 TTR 및 편집 퍼센트 결과를 나타낸다.
도 10A 및 도 10B는 중성 지질을 포함하는 및 포함하지 않는 LNP 조성물의 투여 후 혈청 TTR 및 간 편집 결과를 나타낸다.

상세한 설명

본 발명은 세포로의 전달을 위한 CRISPR/Cas 성분 RNA("카르고")를 포함하는 RNA의 지질 나노입자(LNP) 조성물의 구체예 및 이의 사용 방법을 제공한다. LNP 조성물은 이전의 전달 기술과 비교하여 개선된 특성을 나타낼 수 있다. LNP 조성물은 본원에 정의된 바와 같은 RNA 성분 및 지질 성분을 함유할 수 있다. 특정 구체예에서, RNA 성분은 Cas 뉴클레이스, 예컨대 클래스 2 Cas 뉴클레이스를 포함한다. 특정 구체예에서, 카르고 또는 RNA 성분은 클래스 2 Cas 뉴클레이스를 인코딩하는 mRNA 및 가이드 RNA 또는 가이드 RNA를 인코딩하는 핵산을 포함한다. 유전자 편집 방법 및 조작된 세포 제조 방법이 또한 제공된다.

CRISPR/Cas 카르고

LNP 제제를 통해 전달된 CRISPR/Cas 카르고는 관심 단백질을 인코딩하는 mRNA 분자를 포함할 수 있다. 예를 들어, 녹색 형광 단백질(green fluorescent protein, GFP)과 같은 단백질, 및 RNA-유도 DNA-결합제, 또는 Cas 뉴클레이스를 발현시키기 위한 mRNA가 포함된다. Cas9 단백질의 세포에서의 발현을 허용하는 Cas 뉴클레이스 mRNA, 예를 들어 클래스 2 Cas 뉴클레이스 mRNA를 포함하는 LNP 조성물이 제공된다. 또한, 카르고는 하나 이상의 가이드 RNA 또는 가이드 RNA를 인코딩하는 핵산을 포함할 수 있다. 예를 들어 복구 또는 재조합을 위한 주형 핵산이 조성물에 포함될 수 있거나 주형 핵산이 본원에 기재된 방법에서 사용될 수 있다.

"mRNA"는 폴리펩타이드로 번역될 수 있는 (즉, 리보솜 및 아미노-아실화 tRNA에 의한 번역을 위한 기질로서 작용할 수 있는) 오픈 리딩 프레임을 포함하는 폴리뉴클레오타이드를 지칭한다. mRNA는 리보스 잔기 또는 이의 유사체, 예를 들어, 2'-메톡시 리보스 잔기를 포함하는 포스페이트-당 골격을 포함할 수 있다. 일부 구체예에서, mRNA 포스페이트-당 골격의 당은 리보스 잔기, 2'-메톡시 리보스 잔기, 또는 이들의 조합으로 본질적으로 구성된다. 일반적으로, mRNA는 상당한 양의 티미딘 잔기를 포함하지 않는다 (예를 들어, 0 잔기 또는 30, 20, 10, 5, 4, 3, 또는 2 미만 티미딘 잔기; 또는 10%, 9%, 8%, 7%, 6%, 5%, 4%, 4%, 3%, 2%, 1%, 0.5%, 0.2%, 또는 0.1% 미만 티미딘 함량). mRNA는 이의 우리딘 위치의 일부 또는 전부에서 변형된 우리딘을 포함할 수 있다.

CRISPR/Cas 뉴클레이스 시스템

개시된 제제의 한 성분은 Cas 뉴클레이스와 같은 RNA-유도 DNA-결합제를 인코딩하는 mRNA이다.

본원에서 사용된 "RNA-유도 DNA 결합제"는 RNA 및 DNA 결합 활성을 갖는 폴리펩타이드 또는 폴리펩타이드의 복합체, 또는 그러한 복합체의 DNA-결합 서브유닛을 의미하고, 여기서 DNA 결합 활성은 서열-특이적이고 RNA의 서열에 의존한다. 예시적인 RNA-유도 DNA 결합제는 Cas 클리베이스/닉케이스 및 이의 불활성화 형태("dCas DNA 결합제")를 포함한다. 본원에서 사용된 "Cas 뉴클레이스"는 Cas 클리베이스(cleavase), Cas 닉케이스(nickase), 및 dCas DNA 결합제를 포함한다. Cas 클리베이스/닉케이스 및 dCas DNA 결합제는 타입 III CRISPR 시스템의 Csm 또는 Cmr 복합체, 이의 Cas10, Csm1, 또는 Cmr2 서브유닛, 타입 I CRISPR 시스템의 캐스케이드 복합체, 이의 Cas3 서브유닛, 및 클래스 2 Cas 뉴클레이스를 포함한다. 본원에서 사용된 "클래스 2 Cas 뉴클레이스"는 RNA-유도 DNA 결합 활성을 갖는 단일-사슬 폴리펩타이드이다. 클래스 2 Cas 뉴클레이스는 RNA-유도 DNA 클리베이스 또는 닉케이스 활성을 추가로 갖는 클래스 2 Cas 클리베이스/닉케이스(예를 들어, H840A, D10A, 또는 N863A 변이체), 및 클리베이스/닉케이스 활성이 불활성화되는 클래스 2 dCas DNA 결합제를 포함한다. 클래스 2 Cas 뉴클레이스는, 예를 들어, Cas9, Cpf1, C2c1, C2c2, C2c3, HF Cas9 (예를 들어, N497A, R661A, Q695A, Q926A 변이체), HypaCas9 (예를 들어, N692A, M694A, Q695A, H698A 변이체), eSPCas9(1.0) (예를 들어, K810A, K1003A, R1060A 변이체), 및 eSPCas9(1.1) (예를 들어, K848A, K1003A, R1060A 변이체) 단백질 및 이의 변형을 포함한다. Cpf1 단백질은, Zetsche et al., Cell, 163: 1-13 (2015), Cas9에 상동성이며, RuvC-유사 뉴클레이스 도메인을 포함한다. Zetsche의 Cpf1 서열은 그 전체가 참조로 포함된다. 예를 들어, Zetsche, 표 S1 및 S3을 참조하라. 예를 들어, Makarova et al., Nat Rev Microbiol, 13(11): 722-36 (2015); Shmakov et al., Molecular Cell, 60:385-397 (2015)를 참조하라.

일부 구체예에서, RNA-유도 DNA-결합제는 클래스 2 Cas 뉴클레이스이다. 일부 구체예에서, RNA-유도 DNA-결합제는 이중-가닥 엔도뉴클레이스 활성으로도 지칭될 수 있는 클리베이스 활성을 갖는다. 일부 구체예에서, RNA-유도 DNA-결합제는 Cas 뉴클레이스, 예컨대 클래스 2 Cas 뉴클레이스를 포함한다 (이는, 예를 들어, 타입 II, V, 또는 VI의 Cas 뉴클레이스일 수 있다). 클래스 2 Cas 뉴클레이스는, 예를 들어, Cas9, Cpf1, C2c1, C2c2, 및 C2c3 단백질 및 이의 변형을 포함한다. Cas9 뉴클레이스의 예는 S. 피오게네스, S. 아우레우스, 및 다른 원핵생물(예를 들어, 다음 단락의 목록 참조)의 타입 II CRISPR 시스템, 및 이의 변형된 (예를 들어, 조작된 또는 돌연변이) 버전을 포함한다. 예를 들어, U.S. 2016/0312198 A1; U.S. 2016/0312199 A1을 참조하라. Cas 뉴클레이스의 다른 예는 타입 III CRISPR 시스템의 Csm 또는 Cmr 복합체 또는 이의 Cas10, Csm1, 또는 Cmr2 서브유닛; 및 타입 I CRISPR 시스템의 캐스케이드 복합체, 또는 이의 Cas3 서브유닛을 포함한다. 일부 구체예에서, Cas 뉴클레이스는 타입-IIA, 타입-IIB, 또는 타입-IIC 시스템으로부터 유래할 수 있다. 다양한 CRISPR 시스템 및 Cas 뉴클레이스에 대한 논의에 대해서는, 예를 들어, Makarova et al., Nat. Rev. Microbiol. 9:467-477 (2011); Makarova et al., Nat. Rev. Microbiol, 13: 722-36 (2015); Shmakov et al., Molecular Cell, 60:385-397 (2015)를 참조하라.

Cas 뉴클레이스가 유도될 수 있는 비제한적인 예시적인 종은 스트렙토코쿠스 피오게네스(Streptococcus pyogenes), 스트렙토코쿠스 써모필루스(Streptococcus thermophilus), 스트렙토코쿠스 종, 스타필로코쿠스 아우레우스(Staphylococcus aureus), 리스테리아 이노쿠아(Listeria innocua), 락토바실루스 가세리(Lactobacillus gasseri), 프란시셀라 노비시다(Francisella novicida), 월리넬라 석시노제네스(Wolinella succinogenes), 서터렐라 와드스워텐시스(Sutterella wadsworthensis), 감마프로테오박테리움(Gammaproteobacterium), 네이세리아 메닝티디스(Neisseria meningitidis), 캠필로박터 제주니(Campylobacter jejuni), 파스테우렐라 물토시다(Pasteurella multocida), 피브로박터 석시노젠(Fibrobacter succinogene), 로도스피릴럼 러브럼(Rhodospirillum rubrum), 노카르디옵시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토미세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토미세스 비리도크로모제네스(Streptomyces viridochromogenes), 스트렙토미세스 비리도크로모제네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 알리시클로바실루스 아시도칼다리우스(Alicyclobacillus acidocaldarius), 바실루스 슈도미코이데스(Bacillus pseudomycoides), 바실루스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시시리컴(Exiguobacterium sibiricum), 락토바실루스 델브루에키(Lactobacillus delbrueckii), 락토바실루스 살리바리우스(Lactobacillus salivarius), 락토바실루스 부크네리(Lactobacillus buchneri), 트레포네마 덴티콜라(Treponema denticola), 미크로실라 마리나(Microscilla marina), 버크홀데리알레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 종, 크로코스페라 왓소니(Crocosphaera watsonii), 시아노테세 종(Cyanothece sp.), 미크로시스티스 에루지노사(Microcystis aeruginosa), 시네초코쿠스 종(Synechococcus sp.), 아세토할로비움 아라박티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시(Ammonifex degensii), 칼디셀룰로시룹토르 베크시(Caldicelulosiruptor becscii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리디움 보툴리눔(Clostridium botulinum), 클로스트리디움 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라나에오비스 써모필루스(Natranaerobius thermophilus), 펠로토마쿨룸 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실루스 칼두스(Acidithiobacillus caldus), 아시디티오바실루스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박테르 종(Marinobacter sp.), 니트로소코쿠스 할로필루스(Nitrosococcus halophilus), 니트로소코쿠스 와트소니(Nitrosococcus watsoni), 슈도알테로모나스 할로플랑크티스(Pseudoalteromonas haloplanktis), 크테도노박테르 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나바에나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스토크 종(Nostoc sp.), 아르트로스피라 막시마(Arthrospira maxima), 아르트로스피라 플라텐시스(Arthrospira platensis), 아르트로스피라 종(Arthrospira sp.), 링비아 종(Lyngbya sp.), 미크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 종(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus), 스트렙토코쿠스 파스테우리아누스(Streptococcus pasteurianus), 네이세리아 시네레아(Neisseria cinerea), 캄필로박테르 라리(Campylobacter lari), 파르비바쿨룸 라바멘티보란스(Parvibaculum lavamentivorans), 코리네박테리움 디프테리아(Corynebacterium diphtheria), 아시다미노코쿠스 종(Acidaminococcus sp.), 라크노스피라세 박테리움(Lachnospiraceae bacterium) ND2006, 및 아카리오클로리스 마리나(Acaryochloris marina)를 포함한다.

일부 구체예에서, Cas 뉴클레이스는 스트렙토코쿠스 피오게네스의 Cas9 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 스트렙토코쿠스 써모필루스의 Cas9 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 네이세리아 메닝티디스의 Cas9 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 스타필로코쿠스 아우레우스의 Cas9 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 프란시셀라 노비시다의 Cpf1 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 아시다미노코쿠스 종의 Cpf1 뉴클레이스이다. 일부 구체예에서, Cas 뉴클레이스는 라크노스피라세 박테리움 ND2006의 Cpf1 뉴클레이스이다. 추가의 구체예에서, Cas 뉴클레이스는 프란시셀라 툴라렌시스(Francisella tularensis), 라크노스피라세 박테리움(Lachnospiraceae bacterium), 부티리비브리오 프로테오클라스티쿠스(Butyrivibrio proteoclasticus), 페레그리니박테리움(Peregrinibacteria bacterium), 파르쿠박테리아 박테리움(Parcubacteria bacterium), 스미텔라(Smithella), 아시다미노코쿠스(Acidaminococcus), 칸디다투스 메타노플라스마 테르미툼(Candidatus Methanoplasma termitum), 에우박테리움 엘리겐스(Eubacterium eligens), 모락셀라 보보쿨리(Moraxella bovoculi), 렙토스피라 이나다이(Leptospira inadai), 포르피로모나스 크레비오리카니스(Porphyromonas crevioricanis), 프레보텔라 디시엔스(Prevotella disiens), 또는 포르피로모나스 마카카에(Porphyromonas macacae)의 Cpf1 뉴클레이스이다. 특정 구체예에서, Cas 뉴클레이스는 아시다미노코쿠스 또는 라크노스피라세의 Cpf1 뉴클레이스이다.

야생형 Cas9는 두 가지 뉴클레이스 도메인: RuvC 및 HNH를 갖는다. RuvC 도메인은 비표적 DNA 가닥을 절단하고, HNH 도메인은 DNA의 표적 가닥을 절단한다. 일부 구체예에서, Cas9 뉴클레이스는 하나 초과의 RuvC 도메인 및/또는 하나 초과의 HNH 도메인을 포함한다. 일부 구체예에서, Cas9 뉴클레이스는 야생형 Cas9이다. 일부 구체예에서, Cas9는 표적 DNA에서 이중 가닥 파괴를 유도할 수 있다. 특정 구체예에서, Cas 뉴클레이스는 dsDNA를 절단할 수 있거나, dsDNA의 한 가닥을 절단할 수 있거나, 또는 DNA 클리베이스 또는 닉케이스 활성을 갖지 않을 수 있다. 예시적인 Cas9 아미노산 서열은 서열 식별 번호: 3으로 제공된다. 개시 및 종결 코돈을 포함하는 예시적인 Cas9 mRNA ORF 서열은 서열 식별 번호: 4로 제공된다. 융합 단백질에 포함시키기에 적합한 예시적인 Cas9 mRNA 코딩 서열은 서열 식별 번호: 10으로 제공된다.

일부 구체예에서, 키메라 Cas 뉴클레이스가 사용되는데, 여기서 단백질의 한 도메인 또는 영역이 다른 단백질의 일부에 의해 대체된다. 일부 구체예에서, Cas 뉴클레이스 도메인은 Fok1과 같은 다른 뉴클레이스의 도메인으로 대체될 수 있다. 일부 구체예에서, Cas 뉴클레이스는 변형된 뉴클레이스일 수 있다.

다른 구체예에서, Cas 뉴클레이스는 타입-I CRISPR/Cas 시스템으로부터 유래될 수 있다. 일부 구체예에서, Cas 뉴클레이스는 타입-I CRISPR/Cas 시스템의 캐스케이드 복합체의 성분일 수 있다. 일부 구체예에서, Cas 뉴클레이스는 Cas3 단백질일 수 있다. 일부 구체예에서, Cas 뉴클레이스는 타입-III CRISPR/Cas 시스템으로부터 유래될 수 있다. 일부 구체예에서, Cas 뉴클레이스는 RNA 절단 활성을 가질 수 있다.

일부 구체예에서, RNA-유도 DNA-결합제는 단일-가닥 닉케이스 활성을 가지는데, 즉, 하나의 DNA 가닥을 절단하여 "닉(nick)"으로도 알려진 단일-가닥 절단을 생성할 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 Cas 닉케이스를 포함한다. 닉케이스는 dsDNA에서 닉을 생성하는, 즉, 한 가닥을 절단하지만 DNA 이중 나선의 다른 가닥을 절단하지 않는 효소이다. 일부 구체예에서, Cas 닉케이스는 엔도뉴클레이스 활성 자리가, 예를 들어, 촉매 도메인에서 하나 이상의 변경(예를 들어, 점 돌연변이)에 의해 불활성화된 Cas 뉴클레이스(예를 들어, 위에서 논의된 Cas 뉴클레이스)의 버전이다. Cas 닉케이스 및 예시적인 촉매 도메인 변경의 논의에 대해 예를 들어, 미국 특허 제8,889,356호를 참조하라. 일부 구체예에서, Cas 닉케이스 예컨대 Cas9 닉케이스는 불활성화 RuvC 또는 HNH 도메인을 갖는다. 예시적인 Cas9 닉케이스 아미노산 서열은 서열 식별 번호: 6으로 제공된다. 개시 및 종결 코돈을 포함하는 예시적인 Cas9 닉케이스 mRNA ORF 서열은 서열 식별 번호: 7로 제공된다. 융합 단백질에 포함시키기에 적합한 예시적인 Cas9 닉케이스 mRNA 코딩 서열은 서열 식별 번호: 11로 제공된다.

일부 구체예에서, RNA-유도 DNA-결합제는 하나의 기능성 뉴클레이스 도메인만을 포함하도록 변형된다. 예를 들어, 작용제 단백질은 핵산 절단 활성을 감소시키기 위해 뉴클레이스 도메인 중 하나가 돌연변이되거나 완전히 또는 부분적으로 결손되도록 변형될 수 있다. 일부 구체예에서, 활성이 감소된 RuvC 도메인을 갖는 닉케이스가 사용된다. 일부 구체예에서, 불활성 RuvC 도메인을 갖는 닉케이스가 사용된다. 일부 구체예에서, 활성이 감소된 HNH 도메인을 갖는 닉케이스가 사용된다. 일부 구체예에서, 불활성 HNH 도메인을 갖는 닉케이스가 사용된다.

일부 구체예에서, Cas 단백질 뉴클레이스 도메인 내의 보존된 아미노산은 뉴클레이스 활성을 감소시키거나 변경시키기 위해 치환된다. 일부 구체예에서, Cas 뉴클레이스는 RuvC 또는 RuvC-유사 뉴클레이스 도메인에 아미노산 치환을 포함할 수 있다. RuvC 또는 RuvC-유사 뉴클레이스 도메인 중의 예시적인 아미노산 치환은 (S. 피오게네스 Cas9 단백질에 기초한) D10A를 포함한다. 예를 들어, Zetsche et al. (2015) Cell Oct 22:163(3): 759-771을 참조하라. 일부 구체예에서, Cas 뉴클레이스는 HNH 또는 HNH-유사 뉴클레이스 도메인에 아미노산 치환을 포함할 수 있다. HNH 또는 HNH-유사 뉴클레이스 도메인 중의 예시적인 아미노산 치환은 (S. 피오게네스 Cas9 단백질에 기초한) E762A, H840A, N863A, H983A, 및 D986A를 포함한다. 예를 들어, Zetsche et al. (2015)를 참조하라. 추가의 예시적인 아미노산 치환은 (프란시셀라 노비시다 U112 Cpf1 (FnCpf1) 서열 (UniProtKB - A0Q7Q2 (CPF1_FRATN)에 기초한) D917A, E1006A, 및 D1255A를 포함한다.

일부 구체예에서, 닉케이스를 인코딩하는 mRNA는 각각 표적 서열의 센스 및 안티센스 가닥에 상보적인 한 쌍의 가이드 RNA와 조합하여 제공된다. 이 구체예에서, 가이드 RNA는 닉케이스를 표적 서열로 안내하고 표적 서열의 반대 가닥에 닉을 생성하여 DSB를 도입한다 (즉, 이중 닉킹). 일부 구체예에서, 이중 닉킹의 사용은 특이성을 개선하고 비표적(off-target) 효과를 감소시킬 수 있다. 일부 구체예에서, 닉케이스는 표적 DNA에서 이중 닉을 생성하기 위해 DNA의 반대편 가닥을 표적으로 하는 두 개의 개별 가이드 RNA와 함께 사용된다. 일부 구체예에서, 닉케이스는 표적 DNA에서 이중 닉을 생성하기 위해 근접하게 선택되는 두 개의 개별 가이드 RNA와 함께 사용된다.

일부 구체예에서, RNA-유도 DNA-결합제에는 클리베이스 및 닉케이스 활성이 결여되어 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 dCas DNA-결합 폴리펩타이드를 포함한다. dCas 폴리펩타이드는 DNA-결합 활성을 가지면서도 촉매 (클리베이스/닉케이스) 활성이 본질적으로 결여되어 있다. 일부 구체예에서, dCas 폴리펩타이드는 dCas9 폴리펩타이드이다. 일부 구체예에서, 클리베이스 및 닉케이스 활성이 결여된 RNA-유도 DNA-결합제 또는 dCas DNA-결합 폴리펩타이드는 엔도뉴클레이스 활성 자리가, 예를 들어, 촉매 도메인에서 하나 이상의 변경(예를 들어, 점 돌연변이)에 의해 불활성화된 Cas 뉴클레이스(예를 들어, 위에서 논의된 Cas 뉴클레이스)의 버전이다. 예를 들어, U.S. 2014/0186958 A1; U.S. 2015/0166980 A1을 참조하라. 예시적인 dCas9 아미노산 서열은 서열 식별 번호: 8로 제공된다. 개시 및 종결 코돈을 포함하는 예시적인 Cas9 mRNA ORF 서열은 서열 식별 번호: 9로 제공된다. 융합 단백질에 포함시키기에 적합한 예시적인 Cas9 mRNA 코딩 서열은 서열 식별 번호: 12로 제공된다.

일부 구체예에서, RNA-유도 DNA-결합제는 하나 이상의 이종 기능성 도메인을 포함한다 (예를 들어, 융합 폴리펩타이드이거나 이를 포함한다).

일부 구체예에서, 이종 기능성 도메인은 세포의 핵으로 RNA-유도 DNA-결합제의 수송을 용이하게 할 수 있다. 예를 들어, 이종 기능성 도메인은 핵 위치 신호(nuclear localization signal, NLS)일 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 1-10 개의 NLS(들)와 융합될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 1-5 개의 NLS(들)와 융합될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 하나의 NLS와 융합될 수 있다. 하나의 NLS가 사용되는 경우, NLS는 RNA-유도 DNA-결합제 서열의 N-말단 또는 C-말단에 연결될 수 있다. 이는 또한 RNA-유도 DNA 결합제 서열 내에 삽입될 수 있다. 다른 구체예에서, RNA-유도 DNA-결합제는 하나 초과의 NLS와 융합될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 2, 3, 4, 또는 5 개의 NLS와 융합될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 두 개의 NLS와 융합될 수 있다. 특정 구체예에서, 두 개의 NLS은 동일하거나 (예를 들어, 두 개의 SV40 NLS) 상이할 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 카르복시 말단에서 연결된 두 개의 SV40 NLS 서열에 융합된다. 일부 구체예에서, RNA-유도 DNA-결합제는 두 개의 NLS와 융합될 수 있으며, 하나는 N-말단에, 하나는 C-말단에 연결된다. 일부 구체예에서, RNA-유도 DNA-결합제는 3 개의 NLS와 융합될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 NLS와 융합되지 않을 수 있다. 일부 구체예에서, NLS는 예를 들어, SV40 NLS, PKKKRKV 또는 PKKKRRV와 같은 단일부분 서열일 수 있다. 일부 구체예에서, NLS는 핵플라스민의 NLS, KRPAATKKAGQAKKKK과 같은 이부분 서열일 수 있다. 특정 구체예에서, 단일 PKKKRKV NLS는 RNA-유도 DNA-결합제의 C-말단에 연결될 수 있다. 하나 이상의 링커가 융합 자리에 임의로 포함된다.

일부 구체예에서, 이종 기능성 도메인은 RNA-유도 DNA 결합제의 세포내 반감기를 변경시킬 수 있다. 일부 구체예에서, RNA-유도 DNA 결합제의 반감기는 증가될 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제의 반감기는 감소될 수 있다. 일부 구체예에서, 이종 기능성 도메인은 RNA-유도 DNA-결합제의 안정성을 증가시킬 수 있다. 일부 구체예에서, 이종 기능성 도메인은 RNA-유도 DNA-결합제의 안정성을 감소시킬 수 있다. 일부 구체예에서, 이종 기능성 도메인은 단백질 분해를 위한 신호 펩타이드로서 작용할 수 있다. 일부 구체예에서, 단백질 분해는, 예를 들어, 프로테아솜, 리소좀 프로테이스, 또는 칼페인 프로테이스와 같은 단백질분해 효소에 의해 매개될 수 있다. 일부 구체예에서, 이종 기능성 도메인은 PEST 서열을 포함할 수 있다. 일부 구체예에서, RNA-유도 DNA-결합제는 유비퀴틴 또는 폴리유비퀴틴 사슬의 첨가에 의해 변형될 수 있다. 일부 구체예에서, 유비퀴틴은 유비퀴틴-유사 단백질(UBL)일 수 있다. 유비퀴틴-유사 단백질의 비제한적 예는 소형 유비퀴틴-유사 변형제(SUMO), 유비퀴틴 교차-반응성 단백질(UCRP, 인터페론-자극 유전자-15(ISG15)로도 알려짐), 유비퀴틴-관련 변형제-1(URM1), 뉴런-전구체-세포-발현 발달 하향조절된 단백질-8(NEDD8, S. 세레비시아에서 Rub1로도 지칭됨), 인간 백혈구 항원 F-관련(FAT10), 자가포식-8(ATG8) 및 -12(ATG12), Fau 유비퀴틴-유사 단백질(FUB1), 막-고정 UBL(MUB), 유비퀴틴 폴드-변형제 -1(UFM1), 및 유비퀴틴-유사 단백질-5(UBL5)를 포함한다.

일부 구체예에서, 이종 기능성 도메인은 마커 도메인일 수 있다. 마커 도메인의 비제한적 예는 형광 단백질, 정제 태그, 에피토프 태그, 및 리포터 유전자 서열을 포함한다. 일부 구체예에서, 마커 도메인은 형광 단백질일 수 있다. 적합한 형광 단백질의 비제한적 예는 녹색 형광 단백질(예를 들어, GFP, GFP-2, tagGFP, turboGFP, sfGFP, EGFP, Emerald, Azami Green, Monomeric Azami Green, CopGFP, AceGFP, ZsGreen1), 황색 형광 단백질(예를 들어, YFP, EYFP, Citrine, Venus, YPet, PhiYFP, ZsYellow1), 청색 형광 단백질(예를 들어, EBFP, EBFP2, Azurite, mKalamal, GFPuv, Sapphire, T-sapphire,), 청록색 형광 단백질(예를 들어, ECFP, Cerulean, CyPet, AmCyan1, Midoriishi-Cyan), 적색 형광 단백질(예를 들어, mKate, mKate2, mPlum, DsRed monomer, mCherry, mRFP1, DsRed-Express, DsRed2, DsRed-Monomer, HcRed-Tandem, HcRed1, AsRed2, eqFP611, mRasberry, mStrawberry, Jred), 및 주황색 형광 단백질(mOrange, mKO, Kusabira-Orange, Monomeric Kusabira-Orange, mTangerine, tdTomato) 또는 임의의 다른 적합한 형광 단백질을 포함한다. 다른 구체예에서, 마커 도메인은 정제 태그 및/또는 에피토프 태그일 수있다. 비제한적인 예시적인 태그는 글루타티온-S-트랜스퍼레이스(GST), 키틴 결합 단백질(CBP), 말토스 결합 단백질(MBP), 티오레독신(TRX), 폴리(NANP), 탠덤 친화성 정제(TAP) 태그, myc, AcV5, AU1, AU5, E, ECS, E2, FLAG, HA, nus, Softag 1, Softag 3, Strep, SBP, Glu-Glu, HSV, KT3, S, S1, T7, V5, VSV-G, 6xHis, 8xHis, 비오틴 카르복실 담체 단백질(BCCP), 폴리-His, 및 칼모둘린을 포함한다. 비제한적인 예시적인 리포터 유전자는 글루타치온-S-트랜스퍼레이스(GST), 홀스래디쉬 퍼옥시데이스(HRP), 클로람페니콜 아세틸트랜스퍼레이스(CAT), 베타-갈락토시데이스, 베타-글루쿠로니데이스, 루시퍼레이스, 또는 형광 단백질을 포함한다.

추가적인 구체예에서, 이종 기능성 도메인은 RNA-유도 DNA-결합제를 특정 소기관, 세포 유형, 조직, 또는 기관에 표적화할 수 있다. 일부 구체예에서, 이종 기능성 도메인은 RNA-유도 DNA-결합제를 미토콘드리아에 표적화할 수 있다.

추가의 구체예에서, 이종 기능성 도메인은 이펙터 도메인일 수 있다. RNA-유도 DNA-결합제가 이의 표적 서열에 지시될 경우, 예를 들어, Cas 뉴클레이스가 gRNA에 의해 표적 서열에 지시될 경우, 이펙터 도메인은 표적 서열을 변형시키거나 이에 영향을 미칠 수 있다. 일부 구체예에서, 이펙터 도메인은 핵산 결합 도메인, 뉴클레이스 도메인(예를 들어, 비-Cas 뉴클레이스 도메인), 후성유전적 변형 도메인, 전사 활성화 도메인, 또는 전사 억제 도메인으로부터 선택될 수 있다. 일부 구체예에서, 이종 기능성 도메인은 뉴클레이스, 예컨대 FokI 뉴클레이스이다. 예를 들어, 미국 특허 제9,023,649호를 참조하라. 일부 구체예에서, 이종 기능성 도메인은 전사 활성화제 또는 억제제이다. 예를 들어, Qi et al., "Repurposing CRISPR as an RNA-guided platform for sequence-specific control of gene expression," Cell 152:1173-83 (2013); Perez-Pinera et al., "RNA-guided gene activation by CRISPR-Cas9-based transcription factors," Nat. Methods 10:973-6 (2013); Mali et al., "CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering," Nat. Biotechnol. 31:833-8 (2013); Gilbert et al., "CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes," Cell 154:442-51 (2013)을 참조하라. 이와 같이, RNA-유도 DNA-결합제는 본질적으로 가이드 RNA를 사용하여 원하는 표적 서열에 결합하도록 지시될 수 있는 전사 인자가 된다. 특정 구체예에서, DNA 변형 도메인은 메틸화 도메인, 예컨대 탈메틸화 또는 메틸트랜스퍼레이스 도메인이다. 특정 구체예에서, 이펙터 도메인은 DNA 변형 도메인, 예컨대 염기-편집 도메인이다. 특정 구체예에서, DNA 변형 도메인은 DNA에 특정 변형을 도입하는 핵산 편집 도메인, 예컨대 디아미네이스 도메인이다. 예를 들어, WO 2015/089406; U.S. 2016/0304846을 참조하라. WO 2015/089406 및 U.S. 2016/0304846에 기재된 핵산 편집 도메인, 디아미네이스 도메인, 및 Cas9 변이체는 본원에 참조로 포함된다.

뉴클레이스는 가이드 RNA("gRNA")와 상호작용하는 적어도 하나의 도메인을 포함할 수 있다. 또한, 뉴클레이스는 gRNA에 의해 표적 서열에 지시될 수 있다. 클래스 2 Cas 뉴클레이스 시스템에서, gRNA는 뉴클레이스 및 표적 서열과 상호작용하여, 표적 서열에 대한 결합을 지시한다. 일부 구체예에서, gRNA는 표적화된 절단에 대한 특이성을 제공하고, 뉴클레이스는 보편적이며, 상이한 gRNA와 짝을 이루어 상이한 표적 서열을 절단할 수 있다. 클래스 2 Cas 뉴클레이스는 상기 나열된 유형, 오쏘로그, 및 예시적인 종의 gRNA 스캐폴드 구조와 쌍을 이룰 수 있다.

가이드 RNA (gRNA)

본 발명의 일부 구체예에서, LNP 제제를 위한 카르고는 적어도 하나의 gRNA를 포함한다. gRNA는 Cas 뉴클레이스 또는 클래스 2 Cas 뉴클레이스를 표적 핵산 분자 상의 표적 서열로 안내할 수 있다. 일부 구체예에서, gRNA는 클래스 2 Cas 뉴클레이스와 결합하여 절단의 특이성을 제공한다. 일부 구체예에서, gRNA 및 Cas 뉴클레이스는 리보핵산단백질(RNP), 예를 들어, LNP 조성물에 의해 전달될 수 있는 CRISPR/Cas9 복합체와 같은 CRISPR/Cas 복합체를 형성할 수 있다. 일부 구체예에서, CRISPR/Cas 복합체는 타입-II CRISPR/Cas9 복합체일 수 있다. 일부 구체예에서, CRISPR/Cas 복합체는 타입-V CRISPR/Cas 복합체, 예컨대 Cpf1/가이드 RNA 복합체일 수 있다. Cas 뉴클레이스 및 동족(cognate) gRNA는 쌍을 이룰 수 있다. 각각의 클래스 2 Cas 뉴클레이스와 쌍을 이루는 gRNA 스캐폴드 구조는 특정 CRISPR/Cas 시스템에 따라 다르다.

"가이드 RNA", "gRNA", 및 간단히 "가이드 "는 crRNA(CRISPR RNA로도 알려져 있음), 또는 crRNA 및 trRNA의 조합(tracrRNA로도 알려져 있음)을 지칭하도록 상호 교환적으로 본원에서 사용된다. crRNA 및 trRNA는 단일 RNA 분자(단일 가이드 RNA, sgRNA)로서 또는 두 개의 개별 RNA 분자(이중 가이드 RNA, dgRNA)에서 연관될 수 있다. "가이드 RNA" 또는 "gRNA"는 각각의 유형을 지칭한다. trRNA는 자연-발생 서열, 또는 자연-발생 서열과 비교하여 변형 또는 변이를 갖는 trRNA 서열일 수 있다.

본원에 사용된 "가이드 서열"은 표적 서열에 상보적이고 RNA-유도 DNA 결합제에 의한 결합 또는 변형(예를 들어, 절단)을 위해 가이드 RNA를 표적 서열에 안내하는 기능을 하는 가이드 RNA 내의 서열을 지칭한다. "가이드 서열"은 또한 "표적화 서열," 또는 "스페이서 서열"로 지칭될 수 있다. 가이드 서열은, 예를 들어, 스트렙토코쿠스 피오게네스 (즉, Spy Cas9) 및 관련 Cas9 호모로그/오쏘로그의 경우에 길이가 20 염기쌍 길이일 수 있다. 더 짧거나 더 긴 서열이, 예를 들어, 15-, 16-, 17-, 18-, 19-, 21-, 22-, 23-, 24-, 또는 25-뉴클레오타이드 길이로 가이드로서 또한 사용될 수 있다. 일부 구체예에서, 표적 서열은 유전자에 또는 염색체 상에 있으며, 예를 들어, 가이드 서열에 상보적이다. 일부 구체예에서, 가이드 서열과 이에 상응하는 표적 서열 사이의 상보성 또는 동일성의 정도는 약 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 가이드 서열 및 표적 영역은 100% 상보적이거나 동일할 수 있다. 다른 구체예에서, 가이드 서열 및 표적 영역은 적어도 하나의 불일치를 포함할 수 있다. 예를 들어, 가이드 서열 및 표적 서열은 1, 2, 3, 또는 4 개의 불일치를 포함할 수 있으며, 표적 서열의 총 길이는 적어도 17, 18, 19, 20 개 또는 그 이상의 염기쌍이다. 일부 구체예에서, 가이드 서열 및 표적 영역은 1-4 개의 불일치를 포함할 수 있으며 여기서 가이드 서열은 적어도 17, 18, 19, 20 개 또는 그 이상의 뉴클레오타이드를 포함한다. 일부 구체예에서, 가이드 서열 및 표적 영역은 1, 2, 3, 또는 4 개의 불일치를 포함할 수 있으며 여기서 가이드 서열은 20 개의 뉴클레오타이드를 포함한다.

Cas 단백질에 대한 핵산 기질이 이중 가닥 핵산이므로, Cas 단백질에 대한 표적 서열은 게놈 DNA의 양성 및 음성 가닥(즉, 주어진 서열 및 서열의 역 보체)를 모두 포함한다. 따라서, 가이드 서열이 "표적 서열에 상보적"인 것으로 언급되는 경우, 가이드 서열은 가이드 RNA가 표적 서열의 역 보체에 결합하도록 지시할 수 있음을 이해해야 한다. 따라서, 일부 구체예에서, 가이드 서열이 표적 서열의 역 보체에 결합하는 경우, 가이드 서열에서 T에 대한 U의 치환을 제외하고는 가이드 서열은 표적 서열(예를 들어, PAM을 포함하지 않는 표적 서열)의 특정 뉴클레오타이드와 동일하다.

표적화 서열의 길이는 사용된 CRISPR/Cas 시스템 및 성분에 의존할 수 있다. 예를 들어, 상이한 박테리아 종으로부터의 상이한 클래스 2 Cas 뉴클레이스는 다양한 최적화 표적화 서열 길이를 갖는다. 따라서, 표적화 서열은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50 초과의 뉴클레오타이드 길이를 포함할 수 있다. 일부 구체예에서, 표적화 서열 길이는 자연-발생 CRISPR/Cas 시스템의 가이드 서열보다 0, 1, 2, 3, 4, 또는 5 뉴클레오타이드 더 길거나 더 짧다. 특정 구체예에서, Cas 뉴클레이스 및 gRNA 스캐폴드는 동일한 CRISPR/Cas 시스템으로부터 유래될 것이다. 일부 구체예에서, 표적화 서열은 18-24 개의 뉴클레오타이드를 포함하거나 이로 구성될 수 있다. 일부 구체예에서, 표적화 서열은 19-21 개의 뉴클레오타이드를 포함하거나 이로 구성될 수 있다. 일부 구체예에서, 표적화 서열은 20 개의 뉴클레오타이드를 포함하거나 이로 구성될 수 있다.

일부 구체예에서, sgRNA는 Cas9 단백질에 의한 RNA-유도 DNA 절단을 매개할 수 있는 "Cas9 sgRNA"이다. 일부 구체예에서, sgRNA는 Cpf1 단백질에 의한 RNA-유도 DNA 절단을 매개할 수 있는 "Cpf1 sgRNA"이다. 특정 구체예에서, gRNA는 Cas9 단백질과 활성 복합체를 형성하고 RNA-유도 DNA 절단을 매개하기에 충분한 crRNA 및 tracr RNA를 포함한다. 특정 구체예에서, gRNA는 Cpf1 단백질과 활성 복합체를 형성하고 RNA-유도 DNA 절단을 매개하기에 충분한 crRNA를 포함한다. Zetsche 2015를 참조하라.

본 발명의 특정 구체예는 또한 본원에 기재된 gRNA를 인코딩하는 핵산, 예를 들어, 발현 카세트를 제공한다. "가이드 RNA 핵산"은 가이드 RNA (예를 들어 sgRNA 또는 dgRNA) 및 가이드 RNA 발현 카세트를 지칭하기 위해 사용되며, 이는 하나 이상의 가이드 RNA를 인코딩하는 핵산이다.

일부 구체예에서, 핵산은 DNA 분자일 수 있다. 일부 구체예에서, 핵산은 crRNA를 인코딩하는 뉴클레오타이드 서열을 포함할 수 있다. 일부 구체예에서, crRNA를 인코딩하는 뉴클레오타이드 서열은 자연-발생 CRISPR/Cas 시스템으로부터의 반복 서열의 전부 또는 일부가 측면에 있는 표적화 서열을 포함한다. 일부 구체예에서, 핵산은 tracr RNA를 인코딩하는 뉴클레오타이드 서열을 포함할 수 있다. 일부 구체예에서, crRNA 및 tracr RNA는 둘의 별개의 핵산에 의해 인코딩될 수 있다. 다른 구체예에서, crRNA 및 tracr RNA는 단일 핵산에 의해 인코딩될 수 있다. 일부 구체예에서, crRNA 및 tracr RNA는 단일 핵산의 반대 가닥에 의해 인코딩될 수 있다. 다른 구체예에서, crRNA 및 tracr RNA는 단일 핵산의 동일한 가닥에 의해 인코딩될 수 있다. 일부 구체예에서, gRNA 핵산은 sgRNA를 인코딩한다. 일부 구체예에서, gRNA 핵산은 Cas9 뉴클레이스 sgRNA를 인코딩한다. 일부 구체예에서, gRNA 핵산은 Cpf1 뉴클레이스 sgRNA를 인코딩한다.

가이드 RNA를 인코딩하는 뉴클레오타이드 서열은 적어도 하나의 전사 또는 조절 제어 서열, 예컨대 프로모터, 3' UTR, 또는 5' UTR에 작동 가능하게 연결될 수 있다. 한 예에서, 프로모터는 tRNA 프로모터, 예를 들어, tRNA^Lys3, 또는 tRNA 키메라일 수 있다. Mefferd et al., RNA. 2015 21:1683-9; Scherer et al., Nucleic Acids Res. 2007 35: 2620-2628을 참조하라. 특정 구체예에서, 프로모터는 RNA 폴리머레이스 III(Pol III)에 의해 인식될 수 있다. Pol III 프로모터의 비제한적 예는 또한 U6 및 H1 프로모터를 포함한다. 일부 구체예에서, 가이드 RNA를 인코딩하는 뉴클레오타이드 서열은 마우스 또는 인간 U6 프로모터에 작동 가능하게 연결될 수 있다. 일부 구체예에서, gRNA 핵산은 변형된 핵산이다. 특정 구체예에서, gRNA 핵산은 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함한다. 일부 구체예에서, gRNA 핵산은 핵산의 통합을 안정화 및 방지하기 위한 5' 말단 변형, 예를 들어 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함한다. 일부 구체예에서, gRNA 핵산은 각 가닥에서 5' 말단 변형을 갖는 이중-가닥 DNA를 포함한다. 특정 구체예에서, gRNA 핵산은 5' 말단 변형으로서 역전된 디데옥시-T 또는 역전된 무염기 뉴클레오사이드 또는 뉴클레오타이드를 포함한다. 일부 구체예에서, gRNA 핵산은 비오틴, 데스티오비오텐-TEG, 디곡시제닌, 및 예를 들어 FAM, ROX, TAMRA, 및 AlexaFluor를 포함하는 형광 마커와 같은 표지를 포함한다.

특정 구체예에서, 하나 초과의 gRNA 핵산, 예컨대 gRNA가 CRISPR/Cas 뉴클레이스 시스템와 함께 사용될 수 있다. 각각의 gRNA 핵산은 상이한 표적화 서열을 포함할 수 있어, CRISPR/Cas 시스템이 하나 초과의 표적 서열을 절단한다. 일부 구체예에서, 하나 이상의 gRNA는 CRISPR/Cas 복합체 내에서 활성 또는 안정성과 같은 동일하거나 상이한 특성을 가질 수 있다. 하나 초과의 gRNA가 사용되는 경우, 각각의 gRNA는 동일하거나 상이한 gRNA 핵산에서 인코딩될 수있다. 하나 초과의 gRNA의 발현 유도에 사용되는 프로모터는 동일하거나 상이할 수 있다.

변형된 RNA

특정 구체예에서, LNP 조성물은 변형된 RNA를 포함한다.

변형된 뉴클레오사이드 또는 뉴클레오타이드는 RNA, 예를 들어 gRNA 또는 mRNA에 존재할 수 있다. 예를 들어, 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함하는 gRNA 또는 mRNA는 표준(canonical) A, G, C, 및 U 잔기 대신 또는 이에 추가하여 사용되는 하나 이상의 비자연 및/또는 자연 발생 성분 또는 구성의 존재를 기재하기 위해 "변형된" RNA로 지칭된다. 일부 구체예에서, 변형된 RNA는 여기서 "변형된"으로 지칭되는 비표준(non-canonical) 뉴클레오사이드 또는 뉴클레오타이드로써 합성된다.

변형된 뉴클레오사이드 및 뉴클레오타이드는 다음 중 하나 이상을 포함할 수 있다: (i) 포스포디에스테르 골격 연결에서 비-연결 포스페이트 산소 중 하나 또는 둘 모두 및/또는 연결 포스페이트 산소 중 하나 이상의 변경, 예를 들어, 대체 (예시적인 골격 변형); (ii) 리보스 당의 성분, 예를 들어, 리보스 당의 2' 하이드록실의 변경, 예를 들어, 대체 (예시적인 당 변형); (iii) 포스페이트 모이어티를 "데포스포(dephospho)" 링커로 대규모 대체 (예시적인 골격 변형); (iv) 비표준 핵염기를 포함하여 자연 발생 핵염기의 변형 또는 대체 (예시적인 염기 변형); (v) 리보스-포스페이트 골격의 대체 또는 변형 (예시적인 골격 변형); (vi) 올리고뉴클레오타이드의 3' 말단 또는 5' 말단의 변형, 예를 들어, 말단 포스페이트기 또는 모이어티, 캡 또는 링커의 컨쥬게이션의 제거, 변형 또는 대체 (그러한 3' 또는 5' 캡 변형은 당 및/또는 골격 변형을 포함할 수 있음); 및 (vii) 당의 변형 또는 대체 (예시적인 당 변형). 특정 구체예는 mRNA, gRNA, 또는 핵산에 대한 5' 말단 변형을 포함한다. 특정 구체예는 mRNA, gRNA, 또는 핵산에 대한 3' 말단 변형을 포함한다. 변형된 RNA는 5' 말단 및 3' 말단 변형을 포함할 수 있다. 변형된 RNA는 비-말단 위치에서 하나 이상의 변형된 잔기를 포함할 수 있다. 특정 구체예에서, gRNA는 적어도 하나의 변형된 잔기를 포함한다. 특정 구체예에서, mRNA는 적어도 하나의 변형된 잔기를 포함한다.

본원에 사용된 바와 같이, 제2 서열에 대한 제1 서열의 정렬이 그 전체에서 제2 서열의 위치의 X% 이상이 제1 서열에 일치함을 나타내는 경우, 제1 서열은 제2 서열에 "적어도 X% 동일성을 갖는 서열을 포함하는" 것으로 간주된다. 예를 들어, 서열 AAGA는 서열 AAG와 100% 동일성을 갖는 서열을 포함하는데, 그 이유는 정렬이 제2 서열의 세 위치 모두에 일치한다는 점에서 100% 동일성을 제공하기 때문이다. RNA와 DNA 간의 차이(일반적으로 티미딘으로 우리딘의 교환 또는 그 반대) 및 변형된 우리딘과 같은 뉴클레오사이드 유사체의 존재는 관련 뉴클레오타이드(예컨대 티미딘, 우리딘, 또는 변형된 우리딘)가 동일한 보체를 갖는 한 폴리뉴클레오타이드 간의 동일성 또는 상보성 차이에 기여하지 않는다 (예를 들어, 티미딘, 우리딘, 또는 변형된 우리딘 모두에 대해 아데노신; 또 다른 예는 사이토신 및 5-메틸사이토신이며, 두 가지 모두 보체로서 구아노신 또는 변형된 구아노신을 갖는다). 따라서, 예를 들어, X가 임의의 변형된 우리딘, 예컨대 슈도우리딘, N1-메틸 슈도우리딘, 또는 5-메톡시우리딘인 서열 5'-AXG는 둘 모두가 동일한 서열(5'-CAU)에 대해 완벽하게 상보적이라는 점에서 AUG에 100% 동일한 것으로 간주된다. 예시적인 정렬 알고리즘은 당해 분야에 공지인 Smith-Waterman 및 Needleman-Wunsch 알고리즘이다. 당업자는 정렬될 주어진 서열의 쌍; 일반적으로 유사한 길이 및 아미노산에 대해 >50% 또는 뉴클레오타이드에 대해 >75% 예상되는 동일성의 서열에 대해 어떤 알고리즘 및 파라미터의 설정의 선택이 적합할지 이해할 것이고, www.ebi.ac.uk 웹 서버에서 EBI에 의해 주어진 Needleman-Wunsch 알고리즘 인터페이스의 기본 설정을 갖는 Needleman-Wunsch 알고리즘이 일반적으로 적합하다.

mRNA

일부 구체예에서, 본원에 개시된 조성물 또는 제제는 본원에 기재된 Cas 뉴클레이스, 또는 클래스 2 Cas 뉴클레이스와 같은 RNA-유도 DNA 결합제를 인코딩하는 오픈 리딩 프레임(ORF)을 포함하는 mRNA를 포함한다. 일부 구체예에서, Cas 뉴클레이스 또는 클래스 2 Cas 뉴클레이스와 같은 RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA가 제공, 사용 또는 투여된다. 일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF는 "변형된 RNA-유도 DNA 결합제 ORF" 또는 간단히 "변형된 ORF"이고, 이는 ORF가 다음 방식 중 하나 이상에서 변형됨을 나타내기 위한 약칭으로 사용된다: (1) 변형된 ORF는 최소 우리딘 함량 내지 최소 우리딘 함량의 150% 범위의 우리딘 함량을 갖는다; (2) 변형된 ORF는 최소 우리딘 디뉴클레오타이드 함량 내지 최소 우리딘 디뉴클레오타이드 함량의 150% 범위의 우리딘 디뉴클레오타이드 함량을 갖는다; (3) 변형된 ORF는 서열 식별 번호: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나와 적어도 90% 동일성을 갖는다; (4) 변형된 ORF는 코돈의 적어도 75%가 주어진 아미노산에 대한 최소 우리딘 코돈(들), 예를 들어 가장 적은 우리딘을 갖는 코돈(들) (최소 우리딘 코돈이 2 우리딘을 갖는 페닐알라닌에 대한 코돈을 제외하고 보통 0 또는 1)인 코돈의 세트로 구성된다; 또는 (5) 변형된 ORF는 적어도 하나의 변형된 우리딘을 포함한다. 일부 구체예에서, 변형된 ORF는 상기 방식 중 적어도 둘, 셋, 또는 넷에서 변형된다. 일부 구체예에서, 변형된 ORF는 적어도 하나의 변형된 우리딘을 포함하고 상기 (1)-(4) 중 적어도 하나, 둘, 셋 또는 모두에서 변형된다.

"변형된 우리딘"은 본원에서 우리딘과 동일한 수소 결합 수용체 및 우리딘과 하나 이상의 구조적 차이를 갖는 티미딘 이외의 뉴클레오사이드를 지칭하도록 사용된다. 일부 구체예에서, 변형된 우리딘은 치환된 우리딘, 즉, 하나 이상의 비-양성자 치환기(예를 들어, 메톡시와 같은 알콕시)가 양성자를 대신하는 우리딘이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘이다. 일부 구체예에서, 변형된 우리딘은 치환된 슈도우리딘, 즉, 하나 이상의 비-양성자 치환기(예를 들어, 메틸과 같은 알킬)가 양성자를 대신하는 슈도우리딘이다. 일부 구체예에서, 변형된 우리딘은 치환된 우리딘, 슈도우리딘, 또는 치환된 슈도우리딘 중 임의의 것이다.

본원에서 사용된 "우리딘 위치"는 우리딘 또는 변형된 우리딘이 차지한 폴리뉴클레오타이드에서의 위치를 지칭한다. 따라서, 예를 들어, "우리딘 위치의 100%가 변형된 우리딘"인 폴리뉴클레오타이드는 동일한 서열의 통상적인 RNA(모든 염기가 표준 A, U, C, 또는 G 염기인 경우)에서 우리딘일 모든 위치에서 변형된 우리딘을 포함한다. 달리 지시되지 않는 한, 본 개시 안의 또는 본 개시에 수반하는 서열 표 또는 서열 목록의 폴리뉴클레오타이드 서열에서의 U는 우리딘 또는 변형된 우리딘일 수 있다.

표 1. 최소 우리딘 코돈

	아미노산	최소 우리딘 코돈
A	알라닌	GCA 또는 GCC 또는 GCG
G	글라이신	GGA 또는 GGC 또는 GGG
V	발린	GUC 또는 GUA 또는 GUG
D	아스파트산	GAC
E	글루탐산	GAA 또는 GAG
I	이소류신	AUC 또는 AUA 또는 AUG
T	트레오닌	ACA 또는 ACC 또는 ACG
N	아스파라긴	AAC
K	라이신	AAG 또는 AAA
S	세린	AGC
R	아르기닌	AGA 또는 AGG
L	류신	CUG 또는 CUA 또는 CUC
P	프롤린	CCG 또는 CCA 또는 CCC
H	히스티딘	CAC 또는 CAA 또는 CAG
Q	글루타민	CAG 또는 CAA
F	페닐알라닌	UUC
Y	티로신	UAC
C	시스테인	UGC
W	트립토판	UGG
M	메티오닌	AUG

임의의 상기 구체예에서, 변형된 ORF는 적어도 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100%의 코돈이 최소 우리딘 코돈의 표에 나열된 코돈인 코돈의 세트로 구성될 수 있다. 임의의 상기 구체예에서, 변형된 ORF는 서열 식별 번호: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나와 적어도 90%, 95%, 98%, 99%, 또는 100% 동일성을 갖는 서열을 포함할 수 있다.

임의의 상기 구체예에서, 변형된 ORF는 서열 식별 번호: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나와 적어도 90%, 95%, 98%, 99%, 또는 100% 동일성을 갖는 서열을 포함할 수 있다.

임의의 상기 구체예에서, 변형된 ORF는 최소 우리딘 함량 내지 최소 우리딘 함량의 150%, 145%, 140%, 135%, 130%, 125%, 120%, 115%, 110%, 105%, 104%, 103%, 102%, 또는 101% 범위인 우리딘 함량을 가질 수 있다.

임의의 상기 구체예에서, 변형된 ORF는 최소 디뉴클레오타이드 우리딘 함량 내지 최소 디뉴클레오타이드 우리딘 함량의 150%, 145%, 140%, 135%, 130%, 125%, 120%, 115%, 110%, 105%, 104%, 103%, 102%, 또는 101% 범위인 우리딘 디뉴클레오타이드 함량을 가질 수 있다.

임의의 상기 구체예에서, 변형된 ORF는 적어도 하나의, 복수의, 또는 모든 우리딘 위치에서 변형된 우리딘을 포함할 수 있다. 일부 구체예에서, 변형된 우리딘은 5 위치에서, 예를 들어 할로겐, 메틸, 또는 에틸로 변형된 우리딘이다. 일부 구체예에서, 변형된 우리딘은 1 위치에서, 예를 들어 할로겐, 메틸, 또는 에틸로 변형된 슈도우리딘이다. 변형된 우리딘은, 예를 들어 슈도우리딘, N1-메틸-슈도우리딘, 5-메톡시우리딘, 5-아이오도우리딘, 또는 이들의 조합일 수 있다. 일부 구체예에서, 변형된 우리딘은 5-메톡시우리딘이다. 일부 구체예에서, 변형된 우리딘은 5-아이오도우리딘이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘이다. 일부 구체예에서, 변형된 우리딘은 N1-메틸-슈도우리딘이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 N1-메틸-슈도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 5-메톡시우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 N1-메틸 슈도우리딘 및 5-메톡시우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 5-아이오도우리딘 및 N1-메틸-슈도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 5-아이오도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 5-아이오도우리딘 및 5-메톡시우리딘의 조합이다.

일부 구체예에서, 본 발명에 따른 mRNA에서 적어도 우리딘 위치의 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100%가 변형된 우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 변형된 우리딘, 예를 들어, 5-메톡시우리딘, 5-아이오도우리딘, N1-메틸 슈도우리딘, 슈도우리딘, 또는 이들의 조합이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-메톡시우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 N1-메틸 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-아이오도우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-메톡시우리딘이고, 나머지는 N1-메틸 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 mRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-아이오도우리딘이고, 나머지는 N1-메틸 슈도우리딘이다.

임의의 상기 구체예에서, 변형된 ORF는 감소된 우리딘 디뉴클레오타이드 함량, 예컨대 가능한 가장 낮은 우리딘 디뉴클레오타이드(UU) 함량을 포함할 수 있고, 예를 들어 (a) 모든 위치에서 (위에 논의된 바와 같은) 최소 우리딘 코돈을 사용하고 (b) 주어진 ORF와 동일한 아미노산 서열을 인코딩하는 ORF이다. 우리딘 디뉴클레오타이드(UU) 함량은 ORF에서 UU 디뉴클레오타이드의 열거로서 또는 우리딘 디뉴클레오타이드의 우리딘에 의해 점유되는 위치의 백분율로서 비율 기준으로 절대적인 용어로 표현될 수 있다 (예를 들어, 5 위치 중 2가 우리딘 디뉴클레오타이드의 우리딘에 의해 점유되기 때문에 AUUAU가 40%의 우리딘 디뉴클레오타이드 함량을 가질 것이다). 변형된 우리딘 잔기는 최소 우리딘 디뉴클레오타이드 함량을 평가할 목적에 대해 우리딘과 동등한 것으로 간주된다.

일부 구체예에서, mRNA는 발현된 포유동물 mRNA, 예컨대 구성적으로 발현된 mRNA로부터의 적어도 하나의 UTR을 포함한다. mRNA는 건강한 성체 포유동물의 적어도 하나의 조직에서 지속적으로 전사되는 경우 포유동물에서 구성적으로 발현되는 것으로 간주된다. 일부 구체예에서, mRNA는 발현된 포유동물 RNA, 예컨대 구성적으로 발현된 포유동물 mRNA로부터의 5' UTR, 3' UTR, 또는 5' 및 3' UTR을 포함한다. 액틴 mRNA는 구성적으로 발현된 mRNA의 예이다.

일부 구체예에서, mRNA는 하이드록시스테로이드 17-베타 데하이드로게네이스 4(HSD17B4 또는 HSD)로부터의 적어도 하나의 UTR, 예를 들어, HSD로부터의 5' UTR을 포함한다. 일부 구체예에서, mRNA는 글로빈 mRNA, 예를 들어, 인간 알파 글로빈(HBA) mRNA, 인간 베타 글로빈(HBB) mRNA, 또는 제노푸스 레비스(Xenopus laevis) 베타 글로빈(XBG) mRNA로부터의 적어도 하나의 UTR을 포함한다. 일부 구체예에서, mRNA는 글로빈 mRNA, 예컨대 HBA, HBB, 또는 XBG로부터의 5' UTR, 3' UTR, 또는 5' 및 3' UTR을 포함한다. 일부 구체예에서, mRNA는 소 성장 호르몬, 거대세포바이러스(CMV), 마우스 Hba-a1, HSD, 알부민 유전자, HBA, HBB, 또는 XBG로부터의 5' UTR을 포함한다. 일부 구체예에서, mRNA는 소 성장 호르몬, 거대세포바이러스, 마우스 Hba-a1, HSD, 알부민 유전자, HBA, HBB, 또는 XBG로부터의 3' UTR을 포함한다. 일부 구체예에서, mRNA는 소 성장 호르몬, 거대세포바이러스, 마우스 Hba-a1, HSD, 알부민 유전자, HBA, HBB, XBG, 열 충격 단백질 90(Hsp90), 글리세르알데하이드 3-포스페이트 데하이드로게네이스(GAPDH), 베타-액틴, 알파-튜불린, 종양 단백질(p53), 또는 표피 성장 인자 수용체(EGFR)로부터의 5' 및 3' UTR을 포함한다.

일부 구체예에서, mRNA는 동일한 공급원, 예를 들어, 구성적으로 발현되는 mRNA 예컨대 액틴, 알부민, 또는 글로빈 예컨대 HBA, HBB, 또는 XBG로부터 유래한 5' 및 3' UTR을 포함한다.

일부 구체예에서, mRNA는 5' UTR을 포함하지 않으며, 예를 들어, 5' 캡과 개시 코돈 사이에 추가적인 뉴클레오타이드가 없다. 일부 구체예에서, mRNA는 5' 캡과 개시 코돈 사이에 코작 서열(하기 설명됨)을 포함하지만, 임의의 추가적인 5' UTR을 갖지 않는다. 일부 구체예에서, mRNA는 3' UTR를 포함하지 않으며, 예를 들어, 종결 코돈과 폴리-A 테일 사이에 추가적인 뉴클레오타이드가 없다.

일부 구체예에서, mRNA는 코작 서열을 포함한다. 코작 서열은 번역 개시 및 mRNA로부터 번역된 폴리펩타이드의 전체 수율에 영향을 미칠 수 있다. 코작 서열은 개시 코돈으로서 기능할 수 있는 메티오닌 코돈을 포함한다. 최소 코작 서열은 NNNRUGN이고 여기서 다음 중 적어도 하나가 참이다: 첫 번째 N은 A 또는 G이고 두 번재 N은 G이다. 뉴클레오타이드 서열의 맥락에서, R은 퓨린(A 또는 G)을 의미한다. 일부 구체예에서, 코작 서열은 RNNRUGN, NNNRUGG, RNNRUGG, RNNAUGN, NNNAUGG, 또는 RNNAUGG이다. 일부 구체예에서, 코작 서열은 소문자 위치에 0 개의 불일치 또는 1 또는 2 개의 불일치를 갖는 rccRUGg이다. 일부 구체예에서, 코작 서열은 소문자 위치에 0 개의 불일치 또는 1 또는 2 개의 불일치를 갖는 rccAUGg이다. 일부 구체예에서, 코작 서열은 소문자 위치에 0 개의 불일치 또는 1, 2 또는 3 개의 불일치를 갖는 gccRccAUGG이다. 일부 구체예에서, 코작 서열은 소문자 위치에 0 개의 불일치 또는 1, 2, 3 또는 4 개의 불일치를 갖는 gccAccAUG이다. 일부 구체예에서, 코작 서열은 GCCACCAUG이다. 일부 구체예에서, 코작 서열은 소문자 위치에서 0 개의 불일치 또는 1, 2, 3 또는 4 개의 불일치를 갖는 gccgccRccAUGG이다.

일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 43에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 43의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.

일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 44에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 44의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.

일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 56에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 56의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.

일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 57에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 57의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.

일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 58의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.

일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 59에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 59의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.

일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 60에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 60의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.

일부 구체예에서, RNA-유도 DNA 결합제를 인코딩하는 ORF를 포함하는 mRNA는 서열 식별 번호: 61에 대해 적어도 90% 동일성을 갖는 서열을 포함하고, 임의로 서열 식별 번호: 61의 ORF(즉, 서열 식별 번호: 4)는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF로 치환된다.

일부 구체예에서, mRNA는 서열 식별 번호: 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나의 대안적인 ORF를 포함한다.

일부 구체예에서, 서열 식별 번호 43, 44, 또는 56-61의 임의로 치환된 서열과의 동일성 정도는 95%이다. 일부 구체예에서, 서열 식별 번호 43, 44, 또는 56-61의 임의로 치환된 서열과의 동일성 정도는 98%이다. 일부 구체예에서, 서열 식별 번호 43, 44, 또는 56-61의 임의로 치환된 서열과의 동일성 정도는 99%이다. 일부 구체예에서, 서열 식별 번호 43, 44, 또는 56-61의 임의로 치환된 서열과의 동일성 정도는 100%이다.

일부 구체예에서, 본원에 개시된 mRNA는 5' 캡, 예컨대 Cap0, Cap1, 또는 Cap2를 포함한다. 5' 캡은 일반적으로, 5'-트리포스페이트를 통해 mRNA의 5'-투-3' 사슬의 제1 뉴클레오타이드의 5' 위치, 즉, 제1 캡-근위 뉴클레오타이드에 연결된 7-메틸구아닌 리보뉴클레오타이드이다 (이는 예를 들어 ARCA에 대하여 아래 논의된 바와 같이 추가로 변형될 수 있다). Cap0에서, mRNA의 제1 및 제2 캡-근위 뉴클레오타이드의 리보스는 모두 2'-하이드록실을 포함한다. Cap1에서, mRNA의 제1 및 제2 전사된 뉴클레오타이드의 리보스는 각각 2'-메톡시 및 2'-하이드록실을 포함한다. Cap2에서, mRNA의 제1 및 제2 캡-근위 뉴클레오타이드의 리보스는 모두 2'-메톡시를 포함한다. 예를 들어, Katibah et al. (2014) Proc Natl Acad Sci USA 111(33):12025-30; Abbas et al. (2017) Proc Natl Acad Sci USA 114(11):E2106-E2115를 참조하라. 인간 mRNA와 같은 포유동물 mRNA를 포함하는 대부분의 내인성 고등 진핵 mRNA는 Cap1 또는 Cap2를 포함한다. Cap0 및 Cap1 및 Cap2와 상이한 다른 캡 구조는 IFIT-1 및 IFIT-5와 같은 선천성 면역계의 성분에 의해 "비-자기"로 인식됨으로 인해 인간과 같은 포유동물에서 면역원성일 수 있으며, 이는 타입 I 인터페론을 포함하여 상승된 사이토카인 수준을 야기할 수 있다. IFIT-1 및 IFIT-5와 같은 선천성 면역계의 성분은 또한, mRNA의 번역을 잠재적으로 억제하는 Cap1 또는 Cap2 이외의 캡과 mRNA의 결합에 대해 eIF4E와 경쟁할 수 있다.

캡은 공동-전사적으로 포함될 수 있다. 예를 들어, ARCA(안티-리버스 캡 유사체; Thermo Fisher Scientific Cat. No. AM8045)는 구아닌 리보뉴클레오타이드의 5' 위치에 연결된 7-메틸구아닌 3'-메톡시-5'-트리포스페이트를 포함하는 캡 유사체이며 이는 개시에서 전사물에 시험관내 혼입될 수 있다. ARCA는 첫 번째 캡-근위 뉴클레오타이드의 2' 위치가 하이드록실인 Cap0 캡을 야기한다. 예를 들어, Stepinski et al., (2001) "Synthesis and properties of mRNAs containing the novel 'anti-reverse' cap analogs 7-methyl(3'-O-methyl)GpppG and 7-methyl(3'deoxy)GpppG," RNA 7: 1486-1495를 참조하라. ARCA 구조는 아래에 나타난다.

CleanCap^TM AG (m7G(5')ppp(5')(2'OMeA)pG; TriLink Biotechnologies Cat. No. N-7113) 또는 CleanCap^TM GG (m7G(5')ppp(5')(2'OMeG)pG; TriLink Biotechnologies Cat. No. N-7133)가 Cap1 구조를 공동-전사적으로 제공하기 위해 사용될 수 있다. CleanCap^TM AG 및 CleanCap^TM GG의 3'-O-메틸화 버전은 또한 각각 Cat. Nos. N-7413 및 N-7433으로서 TriLink Biotechnologies로부터 입수 가능하다. CleanCap^TM AG 구조는 아래에 나타난다.

대안으로, 캡은 후-전사적으로 RNA에 첨가될 수 있다. 예를 들어, 백시니아 캡핑 효소는 상업적으로 입수 가능하고 (New England Biolabs Cat. No. M2080S) D1 서브유닛에 의해 제공되는 RNA 트리포스파테이스 및 구아닐릴트랜스퍼레이스 활성, 및 D12 서브유닛에 의해 제공되는 구아닌 메틸트랜스퍼레이스를 갖는다. 그와 같이, 이는 7-메틸구아닌을 RNA에 첨가하여, S-아데노실 메티오닌 및 GTP의 존재에서 Cap0을 제공할 수 있다. 예를 들어, Guo, P. and Moss, B. (1990) Proc. Natl. Acad. Sci. USA 87, 4023-4027; Mao, X. and Shuman, S. (1994) J. Biol. Chem. 269, 24472-24479를 참조하라.

일부 구체예에서, mRNA는 폴리-아데닐화(폴리-A) 테일을 추가로 포함한다. 일부 구체예에서, 폴리-A 테일은 적어도 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 아데닌, 임의로 최대 300 개의 아데닌을 포함한다. 일부 구체예에서, 폴리-A 테일은 95, 96, 97, 98, 99, 또는 100 개의 아데닌 뉴클레오타이드를 포함한다. 일부 예에서, 폴리-A 테일은 폴리-A 테일 내의 하나 이상의 위치에서 하나 이상의 비-아데닌 뉴클레오타이드 "앵커"로써 "중단된다". 폴리-A 테일은 적어도 8개의 연속 아데닌 뉴클레오타이드를 포함할 수 있지만, 또한 하나 이상의 비-아데닌 뉴클레오타이드를 포함할 수 있다. 본원에서 사용된 "비-아데닌 뉴클레오타이드"는 아데닌을 포함하지 않는 임의의 천연 또는 비-천연 뉴클레오타이드를 지칭한다. 구아닌, 타이민, 및 사이토신 뉴클레오타이드는 예시적인 비-아데닌 뉴클레오타이드이다. 따라서, 본원에 기재된 mRNA 상의 폴리-A 테일은 RNA-유도 DNA-결합제 또는 관심 서열을 인코딩하는 뉴클레오타이드에 3' 위치한 연속 아데닌 뉴클레오타이드를 포함할 수 있다. 일부 예에서, mRNA 상의 폴리-A 테일은 RNA-유도 DNA-결합제 또는 관심 서열을 인코딩하는 뉴클레오타이드에 대해 3' 위치의 비-연속 아데닌 뉴클레오타이드를 포함하며, 여기서 비-아데닌 뉴클레오타이드는 아데닌 뉴클레오타이드를 규칙적으로 또는 불규칙적인 간격으로 중단시킨다.

일부 구체예에서, mRNA는 폴리-아데닐화(폴리-A) 테일을 추가로 포함한다. 일부 구체예에서, 폴리-A 테일은 적어도 20, 30, 40, 50, 60, 70, 80, 90, 또는 100 개의 아데닌, 임의로 최대 300 개의 아데닌을 포함한다. 일부 구체예에서, 폴리-A 테일은 95, 96, 97, 98, 99, 또는 100 개의 아데닌 뉴클레오타이드를 포함한다. 일부 예에서, 폴리-A 테일은 폴리-A 테일 내의 하나 이상의 위치에서 하나 이상의 비-아데닌 뉴클레오타이드 "앵커"로써 "중단된다". 폴리-A 테일은 적어도 8개의 연속 아데닌 뉴클레오타이드를 포함할 수 있지만, 또한 하나 이상의 비-아데닌 뉴클레오타이드를 포함할 수 있다. 본원에서 사용된 "비-아데닌 뉴클레오타이드"는 아데닌을 포함하지 않는 임의의 천연 또는 비-천연 뉴클레오타이드를 지칭한다. 구아닌, 타이민, 및 사이토신 뉴클레오타이드는 예시적인 비-아데닌 뉴클레오타이드이다. 따라서, 본원에 기재된 mRNA 상의 폴리-A 테일은 RNA-유도 DNA-결합제 또는 관심 서열을 인코딩하는 뉴클레오타이드에 3' 위치한 연속 아데닌 뉴클레오타이드를 포함할 수 있다. 일부 예에서, mRNA 상의 폴리-A 테일은 RNA-유도 DNA-결합제 또는 관심 서열을 인코딩하는 뉴클레오타이드에 대해 3' 위치의 비-연속 아데닌 뉴클레오타이드를 포함하며, 여기서 비-아데닌 뉴클레오타이드는 아데닌 뉴클레오타이드를 규칙적으로 또는 불규칙적인 간격으로 중단시킨다.

일부 구체예에서, 하나 이상의 비-아데닌 뉴클레오타이드는 연속 아데닌 뉴클레오타이드를 중단시키도록 위치하여 폴리(A) 결합 단백질이 연속 아데닌 뉴클레오타이드의 스트레치에 결합할 수 있다. 일부 구체예에서, 하나 이상의 비-아데닌 뉴클레오타이드(들)는 적어도 8, 9, 10, 11, 또는 12 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다. 일부 구체예에서, 하나 이상의 비-아데닌 뉴클레오타이드는 적어도 8-50 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다. 일부 구체예에서, 하나 이상의 비-아데닌 뉴클레오타이드는 적어도 8-100 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다. 일부 구체예에서, 비-아데닌 뉴클레오타이드는 1, 2, 3, 4, 5, 6 또는 7 개의 아데닌 뉴클레오타이드 뒤에 있으며 적어도 8 개의 연속 아데닌 뉴클레오타이드가 이어진다.

폴리-A 테일은 연속 아데닌 뉴클레오타이드의 한 서열에 이어서 하나 이상의 비-아데닌 뉴클레오타이드, 임으로 이어서 추가의 아데닌 뉴클레오타이드를 포함할 수 있다.

일부 구체예에서, 폴리-A 테일은 하나의 비-아데닌 뉴클레오타이드 또는 2-10 비-아데닌 뉴클레오타이드의 하나의 연속 스트레치를 포함하거나 함유한다. 일부 구체예에서, 비-아데닌 뉴클레오타이드(들)는 적어도 8, 9, 10, 11, 또는 12 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다. 일부 예에서, 하나 이상의 비-아데닌 뉴클레오타이드는 적어도 8-50 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다. 일부 구체예에서, 하나 이상의 비-아데닌 뉴클레오타이드는 적어도 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 또는 50 개의 연속 아데닌 뉴클레오타이드 뒤에 위치한다.

일부 구체예에서, 비-아데닌 뉴클레오타이드는 구아닌, 사이토신, 또는 타이민이다. 일부 예에서, 비-아데닌 뉴클레오타이드는 구아닌 뉴클레오타이드이다. 일부 구체예에서, 비-아데닌 뉴클레오타이드는 사이토신 뉴클레오타이드이다. 일부 구체예에서, 비-아데닌 뉴클레오타이드는 타이민 뉴클레오타이드이다. 일부 예에서, 하나 초과의 비-아데닌 뉴클레오타이드가 존재하는 경우, 비-아데닌 뉴클레오타이드는 a) 구아닌 및 타이민 뉴클레오타이드; b) 구아닌 및 사이토신 뉴클레오타이드; c) 타이민 및 사이토신 뉴클레오타이드; 또는 d) 구아닌, 타이민 및 사이토신 뉴클레오타이드로부터 선택될 수 있다. 비-아데닌 뉴클레오타이드를 포함하는 예시적인 폴리-A 테일은 서열 식별 번호: 62로 제공된다.

일부 구체예에서, mRNA는 정제된다. 일부 구체예에서, mRNA는 침전 방법(예를 들어, LiCl 침전, 알코올 침전, 또는 동등한 방법, 예를 들어, 본원에 기재된 것)을 사용하여 정제된다. 일부 구체예에서, mRNA는 크로마토그래피-기반 방법, 예컨대 HPLC-기반 방법 또는 동등한 방법(예를 들어, 본원에 기재된 것)을 사용하여 정제된다. 일부 구체예에서, mRNA는 침전 방법(예를 들어, LiCl 침전) 및 HPLC-기반 방법 모두를 사용하여 정제된다.

일부 구체예에서, 적어도 하나의 gRNA는 본원에 개시된 mRNA와 조합하여 제공된다. 일부 구체예에서, gRNA는 mRNA와 별개의 분자로서 제공된다. 일부 구체예에서, gRNA는 본원에 개시된 mRNA의 일부, 예컨대 UTR의 일부로서 제공된다.

화학적으로 변형된 gRNA

일부 구체예에서, gRNA는 화학적으로 변형된다. 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함하는 gRNA는 표준 A, G, C, 및 U 잔기 대신 또는 이에 추가하여 사용되는 하나 이상의 비자연 및/또는 자연 발생 성분 또는 구성의 존재를 설명하기 위해 "변형된" gRNA 또는 "화학적으로 변형된" gRNA로 지칭된다. 일부 구체예에서, 변형된 gRNA는 비표준 뉴클레오사이드 또는 뉴클레오타이드로써 합성되며, 여기서 "변형된"으로 지칭된다. 변형된 뉴클레오사이드 및 뉴클레오타이드는 다음 중 하나 이상을 포함할 수 있다: (i) 포스포디에스테르 골격 연결에서 비-연결 포스페이트 산소 중 하나 또는 둘 모두 및/또는 연결 포스페이트 산소 중 하나 이상의 변경, 예를 들어, 대체 (예시적인 골격 변형); (ii) 리보스 당의 성분, 예를 들어, 리보스 당의 2' 하이드록실의 변경, 예를 들어, 대체 (예시적인 당 변형); (iii) 포스페이트 모이어티를 "데포스포(dephospho)" 링커로 대규모 대체 (예시적인 골격 변형); (iv) 비표준 핵염기를 포함하여 자연 발생 핵염기의 변형 또는 대체 (예시적인 염기 변형); (v) 리보스-포스페이트 골격의 대체 또는 변형 (예시적인 골격 변형); (vi) 올리고뉴클레오타이드의 3' 말단 또는 5' 말단의 변형, 예를 들어, 말단 포스페이트기 또는 모이어티, 캡 또는 링커의 컨쥬게이션의 제거, 변형 또는 대체 (그러한 3' 또는 5' 캡 변형은 당 및/또는 골격 변형을 포함할 수 있음); 및 (vii) 당의 변형 또는 대체 (예시적인 당 변형).

일부 구체예에서, gRNA는 일부 또는 모든 우리딘 위치에서 변형된 우리딘을 포함한다. 일부 구체예에서, 변형된 우리딘은 5 위치에서, 예를 들어 할로겐 또는 C1-C6 알콕시로 변형된 우리딘이다. 일부 구체예에서, 변형된 우리딘은 1 위치에서, 예를 들어 C1-C6 알킬로 변형된 슈도우리딘이다. 변형된 우리딘은, 예를 들어 슈도우리딘, N1-메틸-슈도우리딘, 5-메톡시우리딘, 5-아이오도우리딘, 또는 이들의 조합일 수 있다. 일부 구체예에서 변형된 우리딘은 5-메톡시우리딘이다. 일부 구체예에서 변형된 우리딘은 5-아이오도우리딘이다. 일부 구체예에서 변형된 우리딘은 슈도우리딘이다. 일부 구체예에서 변형된 우리딘은 N1-메틸-슈도우리딘이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 N1-메틸-슈도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 5-메톡시우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 N1-메틸 슈도우리딘 및 5-메톡시우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 5-아이오도우리딘 및 N1-메틸-슈도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 슈도우리딘 및 5-아이오도우리딘의 조합이다. 일부 구체예에서, 변형된 우리딘은 5-아이오도우리딘 및 5-메톡시우리딘의 조합이다.

일부 구체예에서, 본 발명에 따른 gRNA에서 적어도 우리딘 위치의 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 98%, 99%, 또는 100%가 변형된 우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 변형된 우리딘, 예를 들어, 5-메톡시우리딘, 5-아이오도우리딘, N1-메틸 슈도우리딘, 슈도우리딘, 또는 이들의 조합이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-메톡시우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 N1-메틸 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-아이오도우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-메톡시우리딘이고, 나머지는 N1-메틸 슈도우리딘이다. 일부 구체예에서, 본 발명에 따른 gRNA에서 우리딘 위치의 10%-25%, 15-25%, 25-35%, 35-45%, 45-55%, 55-65%, 65-75%, 75-85%, 85-95%, 또는 90-100%가 5-아이오도우리딘이고, 나머지는 N1-메틸 슈도우리딘이다.

상기 열거된 것과 같은 화학적 변형은 둘, 셋, 넷 또는 그 이상의 변형을 가질 수 있는 뉴클레오사이드 및 뉴클레오타이드(집합적으로 "잔기")를 포함하는 변형된 gRNA를 제공하도록 조합될 수 있다. 예를 들어, 변형된 잔기는 변형된 당 및 변형된 핵염기를 가질 수 있다. 일부 구체예에서, gRNA의 모든 염기는 변형되며, 예를 들어, 모든 염기는 변형된 포스페이트 기, 예컨대 포스포로티오에이트 기를 갖는다. 특정 구체예에서, gRNA 분자의 포스페이트 기의 전부 또는 실질적으로 전부가 포스포로티오에이트 기로 대체된다. 일부 구체예에서, 변형된 gRNA는 RNA의 5' 말단에서 또는 그 근처에서 적어도 하나의 변형된 잔기를 포함한다. 일부 구체예에서, 변형된 gRNA는 RNA의 3' 말단에서 또는 그 근처에서 적어도 하나의 변형된 잔기를 포함한다.

일부 구체예에서, gRNA는 하나, 둘, 셋 또는 그 이상의 변형된 잔기를 포함한다. 일부 구체예에서, 변형된 gRNA 중의 위치의 적어도 5%(예를 들어, 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 95%, 또는 100%)가 변형된 뉴클레오사이드 또는 뉴클레오타이드이다.

비변형 핵산은, 예를 들어 세포내 뉴클레이스 또는 혈청에서 발견되는 것에 의해 분해되기 쉬울 수 있다. 예를 들어, 뉴클레이스는 핵산 포스포디에스테르 결합을 가수분해할 수 있다. 따라서, 한 양태에서 본원에 기재된 gRNA는, 예를 들어 세포내 또는 혈청-기반 뉴클레이스에 대한 안정성을 도입하기 위해 하나 이상의 변형된 뉴클레오사이드 또는 뉴클레오타이드를 포함할 수 있다. 일부 구체예에서, 본원에 기재된 변형된 gRNA 분자는 생체 내 및 생체 외 모두에서 세포의 집단으로 도입될 때 감소된 선천성 면역 반응을 나타낼 수 있다. 용어 "선천성 면역 반응"은 사이토카인 발현 및 방출, 특히 인터페론, 및 세포 사멸의 유도를 포함하는, 단일 가닥 핵산을 포함하는 외인성 핵산에 대한 세포 반응을 포함한다.

골격 변형의 일부 구체예에서, 변형된 잔기의 포스페이트 기는 하나 이상의 산소를 상이한 치환기로 대체하여 변형될 수 있다. 또한, 변형된 잔기, 예를 들어, 변형된 핵산에 존재하는 변형된 잔기는 본원에 기재된 바와 같이 변형된 포스페이트 기로의 비변형 포스페이트 모이어티의 대규모 대체를 포함할 수 있다. 일부 구체예에서, 포스페이트 골격의 골격 변형은 비하전 링커 또는 비대칭 전하 분포를 갖는 하전된 링커를 야기하는 변경을 포함할 수 있다.

변형된 포스페이트 기의 예는, 포스포로티오에이트, 포스포로셀레네이트, 보라노 포스페이트, 보라노 포스페이트 에스테르, 하이드로젠 포스포네이트, 포스포로아미데이트, 알킬 또는 아릴 포스포네이트 및 포스포트리에스테르를 포함한다. 비변형 포스페이트 기의 인 원자는 비카이랄이다. 그러나, 비-가교 산소 중 하나를 상기 원자 또는 원자의 그룹 중 하나로 대체하는 것이 인 원자를 카이랄이 되게 할 수 있다. 입체발생 인 원자는 "R" 배열(여기서 Rp) 또는 "S" 배열(여기서 Sp)을 보유할 수 있다. 골격은 가교 산소(즉, 포스페이트를 뉴클레오사이드에 연결시키는 산소)를 질소(가교된 포스포로아미데이트), 황(가교된 포스포로티오에이트) 및 탄소(가교된 메틸렌포스포네이트)로 대체하여 변형될 수 있다. 대체는 어느 하나의 연결 산소 또는 연결 산소 둘 모두에서 일어날 수 있다.

포스페이트 기는 특정 골격 변형에서 비-인 함유 연결기에 의해 대체될 수 있다. 일부 구체예에서, 하전된 포스페이트 기는 중성 모이어티로 대체될 수 있다. 포스페이트 기를 대체할 수 있는 모이어티의 예는, 제한 없이, 예를 들어 메틸 포스포네이트, 하이드록실아미노, 실록산, 카르보네이트, 카르복시메틸, 카르바메이트, 아미드, 티오에테르, 에틸렌 옥사이드 링커, 설포네이트, 설폰아미드, 티오포름아세탈, 포름아세탈, 옥심, 메틸렌이미노, 메틸렌메틸이미노, 메틸렌하이드라조, 메틸렌디메틸하이드라조 및 메틸렌옥시메틸이미노를 포함할 수 있다.

주형 핵산

본원에 개시된 조성물 및 방법은 주형 핵산을 포함할 수 있다. 주형은 Cas 뉴클레이스에 대한 표적 자리에서 또는 그 근처에서 핵산 서열을 변경 또는 삽입시키기 위해 사용될 수 있다. 일부 구체예에서, 방법은 주형을 세포에 도입하는 것을 포함한다. 일부 구체예에서, 단일 주형이 제공될 수 있다. 다른 구체예에서, 편집이 둘 이상의 표적 자리에서 일어날 수 있도록 둘 이상의 주형이 제공될 수 있다. 예를 들어, 세포에서 단일 유전자, 또는 세포에서 두 가지의 상이한 유전자를 편집하기 위해 상이한 주형이 제공될 수 있다.

일부 구체예에서, 주형은 상동 재조합에서 사용될 수 있다. 일부 구체예에서, 상동 재조합은 주형 서열 또는 주형 서열의 일부를 표적 핵산 분자로 통합시킬 수 있다. 다른 구체예에서, 주형은 상동성-지시 복구(homology-directed repair)에서 사용될 수 있으며, 이는 핵산의 절단 자리에서 DNA 가닥 침입을 포함한다. 일부 구체예에서, 상동성-지시 복구는 편집된 표적 핵산 분자에서 주형 서열 포함을 야기할 수 있다. 또 다른 구체예에서, 주형은 비-상동 말단 연결에 의해 매개되는 유전자 편집에서 사용될 수 있다. 일부 구체예에서, 주형 서열은 절단 자리 근처의 핵산 서열과 유사성이 없다. 일부 구체예에서, 주형 또는 주형 서열의 일부가 혼입된다. 일부 구체예에서, 주형은 측면 역전된 말단 반복(inverted terminal repeat, ITR) 서열을 포함한다.

일부 구체예에서, 주형은 각각 절단 자리의 상류 및 하류에 위치한 서열에 상보적인 제1 상동성 팔(arm) 및 제2 상동성 팔(제1 및 제2 뉴클레오타이드 서열로도 지칭됨)을 포함할 수 있다. 주형이 두 개의 상동성 팔을 포함하는 경우, 각 팔은 동일한 길이 또는 상이한 길이일 수 있고, 상동성 팔 사이의 서열은 상동성 팔 사이의 표적 서열과 실질적으로 유사하거나 동일할 수 있고, 또는 완전히 무관할 수 있다. 일부 구체예에서, 주형 상의 제1 뉴클레오타이드 서열과 절단 자리의 상류 서열 사이, 주형 상의 제2 뉴클레오타이드 서열과 절단 자리의 하류 서열 사이의 상보성의 정도 또는 동일성 퍼센트는, 예를 들어 주형과 표적 핵산 분자 사이의 고충실성(high-fidelity) 상동 재조합과 같은 상동 재조합을 허용할 수 있다. 일부 구체예에서, 상보성의 정도는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 상보성의 정도는 약 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 상보성의 정도는 적어도 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 상보성의 정도는 100%일 수 있다. 일부 구체예에서, 동일성 퍼센트는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 동일성 퍼센트는 약 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 동일성 퍼센트는 적어도 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 동일성 퍼센트는 100%일 수 있다.

일부 구체예에서, 주형 서열은 표적 세포의 내인성 서열에 상응하거나 이를 포함하거나 이로 구성될 수 있다. 이는 또한 대안으로 표적 세포의 외인성 서열에 상응하거나 이를 포함하거나 이로 구성될 수 있다. 본원에서 사용된 용어 "내인성 서열"은 세포에 고유한 서열을 지칭한다. 용어 "외인성 서열"은 세포에 고유하지 않은 서열, 또는 세포의 게놈에서의 고유 위치가 상이한 위치에 있는 서열을 지칭한다. 일부 구체예에서, 내인성 서열은 세포의 게놈 서열일 수 있다. 일부 구체예에서, 내인성 서열은 염색체 또는 염색체 외 서열일 수 있다. 일부 구체예에서, 내인성 서열은 세포의 플라스미드 서열일 수 있다. 일부 구체예에서, 주형 서열은 절단 자리에서 또는 그 근처에서 세포의 내인성 서열의 일부와 실질적으로 동일할 수 있지만, 적어도 하나의 뉴클레오타이드 변화를 포함한다. 일부 구체예에서, 절단된 표적 핵산 분자를 주형으로 편집하는 것은 표적 핵산 분자의 하나 이상의 뉴클레오타이드의 삽입, 결실 또는 치환을 포함하는 돌연변이를 야기할 수 있다. 일부 구체예에서, 돌연변이는 표적 서열을 포함하는 유전자로부터 발현된 단백질에서 하나 이상의 아미노산 변화를 야기할 수 있다. 일부 구체예에서, 돌연변이는 표적 유전자로부터 발현된 RNA에서 하나 이상의 뉴클레오타이드 변화를 야기할 수 있다. 일부 구체예에서, 돌연변이는 표적 유전자의 발현 수준을 변경시킬 수 있다. 일부 구체예에서, 돌연변이는 표적 유전자의 발현 증가 또는 감소를 야기할 수 있다. 일부 구체예에서, 돌연변이는 유전자 넉다운을 야기할 수 있다. 일부 구체예에서, 돌연변이는 유전자 넉아웃을 야기할 수 있다. 일부 구체예에서, 돌연변이는 복원된 유전자 기능을 야기할 수 있다. 일부 구체예에서, 절단된 표적 핵산 분자를 주형으로 편집하는 것은 표적 핵산 분자, 예컨대 DNA의 엑손 서열, 인트론 서열, 조절 서열, 전사 제어 서열, 번역 제어 서열, 스플라이싱 자리, 또는 비-코딩 서열 변화를 야기할 수 있다.

다른 구체예에서, 주형 서열은 외인성 서열을 포함할 수 있다. 일부 구체예에서, 외인성 서열은 외인성 프로모터 서열에 작동 가능하에 연결된 단백질 또는 RNA 코딩 서열을 포함할 수 있어서, 외인성 서열의 표적 핵산 분자 내로의 통합 시, 세포는 통합 서열에 의해 인코딩된 단백질 또는 RNA를 발현할 수 있다. 다른 구체예에서, 외인성 서열의 표적 핵산 분자 내로의 통합 시, 통합 서열의 발현은 내인성 프로모터 서열에 의해 조절될 수 있다. 일부 구체예에서, 외인성 서열은 단백질 또는 단백질의 일부를 인코딩하는 cDNA 서열을 제공할 수 있다. 또 다른 구체예에서, 외인성 서열은 엑손 서열, 인트론 서열, 조절 서열, 전사 제어 서열, 번역 제어 서열, 스플라이싱 자리, 또는 비-코딩 서열을 포함하거나 이로 구성될 수 있다. 일부 구체예에서, 외인성 서열의 통합은 복원된 유전자 기능을 야기할 수 있다. 일부 구체예에서, 외인성 서열의 통합은 유전자 넉인을 야기할 수 있다. 일부 구체예에서, 외인성 서열의 통합은 유전자 넉아웃을 야기할 수 있다.

주형은 임의의 적절한 길이일 수 있다. 일부 구체예에서, 주형은 10, 15, 20, 25, 50, 75, 100, 150, 200, 500, 1000, 1500, 2000, 2500, 3000, 3500, 4000, 4500, 5000, 5500, 6000, 이상 뉴클레오타이드 길이를 포함할 수 있다. 주형은 단일-가닥 핵산일 수 있다. 주형은 이중-가닥 또는 부분 이중-가닥 핵산일 수 있다. 특정 구체예에서, 단일 가닥 주형은 20, 30, 40, 50, 75, 100, 125, 150, 175, 또는 200 뉴클레오타이드 길이일 수 있다. 일부 구체예에서, 주형은 표적 서열을 포함하는 표적 핵산 분자의 일부에 상보적인 뉴클레오타이드 서열(즉, "상동성 팔")을 포함할 수 있다. 일부 구체예에서, 주형은 표적 핵산 분자상의 절단 자리의 상류 또는 하류에 위치한 서열에 상보적인 상동성 팔을 포함할 수 있다.

일부 구체예에서, 주형은 측면 역전-말단 반복(invert-terminal repeat, ITR) 서열을 포함하는 ssDNA 또는 dsDNA를 포함한다. 일부 구체예에서, 주형은 벡터, 플라스미드, 미니서클, 나노서클, 또는 PCR 생성물로서 제공된다.

핵산의 정제

일부 구체예에서, 핵산은 정제된다. 일부 구체예에서, 핵산은 침전 방법(예를 들어, LiCl 침전, 알코올 침전, 또는 동등한 방법, 예를 들어, 본원에 기재된 것)을 사용하여 정제된다. 일부 구체예에서, 핵산은 크로마토그래피-기반 방법, 예컨대 HPLC-기반 방법 또는 동등한 방법(예를 들어, 본원에 기재된 것)을 사용하여 정제된다. 일부 구체예에서, 핵산은 침전 방법(예를 들어, LiCl 침전) 및 HPLC-기반 방법 모두를 사용하여 정제된다.

표적 서열

일부 구체예에서, 본 발명의 CRISPR/Cas 시스템은 표적 핵산 분자상의 표적 서열에 지시되고 이를 절단할 수 있다. 예를 들어, 표적 서열은 Cas 뉴클레이스에 의해 인식되고 절단될 수 있다. 특정 구체예에서, Cas 뉴클레이스에 대한 표적 서열은 뉴클레이스의 동족 PAM 서열 근처에 위치한다. 일부 구체예에서, 클래스 2 Cas 뉴클레이스는 gRNA에 의해 표적 핵산 분자의 표적 서열에 지시될 수 있으며, 여기서 gRNA는 클래스 2 Cas 단백질과 혼성화되고 표적 서열을 절단한다. 일부 구체예에서, 가이드 RNA는 클래스 2 Cas 뉴클레이스와 혼성화되고 동족 PAM에 인접하거나 이를 포함하는 표적 서열을 절단한다. 일부 구체예에서, 표적 서열은 가이드 RNA의 표적화 서열에 상보적일 수 있다. 일부 구체예에서, 가이드 RNA의 표적화 서열 및 가이드 RNA에 혼성화되는 상응하는 표적 서열의 일부 사이의 상보성의 정도는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 가이드 RNA의 표적화 서열 및 가이드 RNA에 혼성화되는 상응하는 표적 서열의 일부 사이의 동일성 퍼센트는 약 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%, 또는 100%일 수 있다. 일부 구체예에서, 표적의 상동성 영역은 동족 PAM 서열에 인접한다. 일부 구체예에서, 표적 서열은 가이드 RNA의 표적화 서열과 100% 상보적인 서열을 포함할 수 있다. 다른 구체예에서, 표적 서열은 가이드 RNA의 표적화 서열과 비교하여 적어도 하나의 불일치, 결실 또는 삽입을 포함할 수 있다.

표적 서열의 길이는 사용된 뉴클레이스 시스템에 의존할 수 있다. 예를 들어, CRISPR/Cas 시스템에 대한 가이드 RNA의 표적화 서열은 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45, 50, 또는 50 초과의 뉴클레오타이드 길이를 포함할 수 있고 표적 서열은 상응하는 길이이며, 임의로 PAM 서열에 인접한다. 일부 구체예에서, 표적 서열은 15-24 뉴클레오타이드 길이를 포함할 수 있다. 일부 구체예에서, 표적 서열은 17-21 뉴클레오타이드 길이를 포함할 수 있다. 일부 구체예에서, 표적 서열은 20 뉴클레오타이드 길이를 포함할 수 있다. 닉케이스가 사용될 때, 표적 서열은 DNA 분자의 반대 가닥을 절단하는 한 쌍의 닉케이스에 의해 인식되는 한 쌍의 표적 서열을 포함할 수 있다. 일부 구체예에서, 표적 서열은 DNA 분자의 동일한 가닥을 절단하는 한 쌍의 닉케이스에 의해 인식되는 한 쌍의 표적 서열을 포함할 수 있다. 일부 구체예에서, 표적 서열은 하나 이상의 Cas 뉴클레이스에 의해 인식되는 한 쌍의 표적 서열의 일부를 포함할 수 있다.

표적 핵산 분자는 세포에 내인성 또는 외인성인 임의의 DNA 또는 RNA 분자일 수 있다. 일부 구체예에서, 표적 핵산 분자는 세포로부터의 또는 세포 안의 에피솜 DNA, 플라스미드, 게놈 DNA, 바이러스 게놈, 미토콘드리아 DNA, 또는 염색체 DNA일 수 있다. 일부 구체예에서, 표적 핵산 분자의 표적 서열은 인간 세포를 포함하는 세포로부터의 또는 세포 안의 게놈 서열일 수 있다.

추가의 구체예에서, 표적 서열은 바이러스 서열일 수 있다. 추가의 구체예에서, 표적 서열은 병원체 서열일 수 있다. 또 다른 구체예에서, 표적 서열은 합성된 서열일 수 있다. 추가의 구체예에서, 표적 서열은 염색체 서열일 수 있다. 특정 구체예에서, 표적 서열은 전위 접합(translocation junction), 예를 들어, 암과 관련된 전위를 포함할 수 있다. 일부 구체예에서, 표적 서열은 진핵생물 염색체, 예컨대 인간 염색체상에 있을 수 있다. 특정 구체예에서, 표적 서열은 간 세포에서 발현된다는 점에서 간-특이적 서열이다.

일부 구체예에서, 표적 서열은 유전자의 코딩 서열, 유전자의 인트론 서열, 조절 서열, 유전자의 전사 제어 서열, 유전자의 번역 제어 서열, 스플라이싱 자리 또는 유전자 사이의 비-코딩 서열에 위치할 수 있다. 일부 구체예에서, 유전자는 단백질 코딩 유전자일 수 있다. 다른 구체예에서, 유전자는 비-코딩 RNA 유전자일 수 있다. 일부 구체예에서, 표적 서열은 질병-관련 유전자의 전부 또는 일부를 포함할 수 있다. 일부 구체예에서, 표적 서열은 게놈 중의 비유전자 기능성 자리, 예를 들어 염색질 조직화의 양태를 제어하는 자리, 예컨대 스캐폴드 자리 또는 유전자자리 제어 영역에 위치할 수 있다.

클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 포함하는 구체예에서, 표적 서열은 프로토스페이서 인접 모티프(protospacer adjacent motif, "PAM")에 인접할 수 있다. 일부 구체예에서, PAM은 표적 서열의 3' 말단의 1, 2, 3, 또는 4, 뉴클레오타이드에 인접하거나 그 안에 있을 수 있다. PAM의 길이 및 서열은 사용된 Cas 단백질에 의존할 수 있다. 예를 들어, PAM은 Ran et al., Nature, 520: 186-191 (2015)의 도 1, 및 Zetsche 2015의 도 S5에 개시된 것을 포함하여, 특정 Cas9 단백질 또는 Cas9 오쏘로그에 대한 컨센서스 또는 특정 PAM 서열로부터 선택될 수 있으며, 각각의 관련 개시는 본원에 참조로 포함된다. 일부 구체예에서, PAM은 2, 3, 4, 5, 6, 7, 8, 9, 또는 10 뉴클레오타이드 길이일 수 있다. 비제한적인 예시적인 PAM 서열은 NGG, NGGNG, NG, NAAAAN, NNAAAAW, NNNNACA, GNNNCNNA, TTN, 및 NNNNGATT를 포함한다 (여기서 N은 임의의 뉴클레오타이드로 정의되고, W는 A 또는 T로 정의된다). 일부 구체예에서, PAM 서열은 NGG일 수 있다. 일부 구체예에서, PAM 서열은 NGGNG일 수 있다. 일부 구체예에서, PAM 서열은 TTN일 수 있다. 일부 구체예에서, PAM 서열은 NNAAAAW일 수 있다.

지질 제제

CRISPR/Cas 카르고를 포함하여 RNA에 대한 LNP 제제의 다양한 구체예가 본원에 개시된다. 그러한 LNP 제제는 헬퍼 지질, 중성 지질, 및 PEG 지질과 함께 "아민 지질"을 포함한다. 일부 구체예에서, 그러한 LNP 제제는 헬퍼 지질 및 PEG 지질과 함께 "아민 지질"을 포함한다. 일부 구체예에서, LNP 제제는 1 퍼센트 미만의 중성 인지질을 포함한다. 일부 구체예에서, LNP 제제는 0.5 퍼센트 미만의 중성 인지질을 포함한다. "지질 나노입자"는 분자간 힘에 의해 서로 물리적으로 관련된 복수의 (즉 하나 초과의) 지질 분자를 포함하는 입자를 의미한다.

아민 지질

생물학적 활성제의 전달을 위한 LNP 조성물은 "아민 지질"을 포함하며, 이는 지질 A의 아세탈 유사체를 포함하여, 지질 A 또는 이의 등가물로 정의된다.

일부 구체예에서, 아민 지질은 지질 A이고, 이는 (9Z,12Z)-3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸) 프로필 옥타데카-9,12-디에노에이트이고, 3-((4,4-비스(옥틸옥시)부타노일)옥시)-2-((((3-(디에틸아미노)프로폭시)카르보닐)옥시)메틸)프로필 (9Z,12Z)-옥타데카-9,12-디에노에이트로도 지칭된다. 지질 A는 다음과 같이 나타날 수 있다:

.

지질 A는 WO2015/095340(예를 들어, pp. 84-86)에 따라 합성될 수 있다. 특정 구체예에서, 아민 지질은 지질 A와 동등하다.

특정 구체예에서, 아민 지질은 지질 A의 유사체이다. 특정 구체예에서, 지질 A 유사체는 지질 A의 아세탈 유사체이다. 특정 LNP 조성물에서, 아세탈 유사체는 C4-C12 아세탈 유사체이다. 일부 구체예에서, 아세탈 유사체는 C5-C12 아세탈 유사체이다. 추가적인 구체예에서, 아세탈 유사체는 C5-C10 아세탈 유사체이다. 추가의 구체예에서, 아세탈 유사체는 C4, C5, C6, C7, C9, C10, C11, 및 C12 아세탈 유사체로부터 선택된다.

본원에 기재된 LNP에서 사용하기에 적합한 아민 지질은 생체 내에서 생분해성이고 RNA와 같은 생물학적 활성제를 세포에 전달하기에 적합하다. 아민 지질은 낮은 독성을 갖는다 (예를 들어, 10 mg/kg 이상의 RNA 카르고의 양으로 부작용 없이 동물 모델에서 허용된다). 특정 구체예에서, 아민 지질을 포함하는 LNP는 적어도 75%의 아민 지질이 8, 10, 12, 24, 또는 48 시간, 또는 3, 4, 5, 6, 7, 또는 10 일 이내에 혈장으로부터 제거되는 것을 포함한다. 특정 구체예에서, 아민 지질을 포함하는 LNP는 적어도 50%의 mRNA 또는 gRNA가 8, 10, 12, 24, 또는 48 시간, 또는 3, 4, 5, 6, 7, 또는 10 일 이내에 혈장으로부터 제거되는 것을 포함한다. 특정 구체예에서, 아민 지질을 포함하는 LNP는 적어도 50%의 LNP가, 예를 들어 지질(예를 들어, 아민 지질), RNA(예를 들어, mRNA), 또는 다른 성분을 측정함으로써 8, 10, 12, 24, 또는 48 시간, 또는 3, 4, 5, 6, 7, 또는 10 일 이내에 혈장으로부터 제거되는 것을 포함한다. 특정 구체예에서, LNP의 지질-캡슐화 대 유리 지질, RNA, 또는 핵산 성분이 측정된다.

지질 제거(clearance)는 문헌에 기재된 바와 같이 측정될 수 있다. Maier, M.A., et al. Biodegradable Lipids Enabling Rapidly Eliminated Lipid Nanoparticles for Systemic Delivery of RNAi Therapeutics. Mol. Ther. 2013, 21(8), 1570-78 ("Maier")를 참조하라. 예를 들어, Maier에서, 루시퍼레이스-표적화 siRNA를 포함하는 LNP-siRNA 시스템이 측부 꼬리 정맥을 통한 정맥 일시 주사에 의해 0.3 mg/kg으로 6 내지 8 주령 C57Bl/6 마우스 수컷에게 투여되었다. 혈액, 간, 및 비장 샘플이 투여 후 0.083, 0.25, 0.5, 1, 2, 4, 8, 24, 48, 96, 및 168 시간에 수집되었다. 조직 수집 전에 마우스에 식염수를 관류하고 혈액 샘플을 처리하여 혈장을 수득했다. 모든 샘플은 LC-MS에 의해 처리 및 분석되었다. 또한, Maier는 LNP-siRNA 제제의 투여 후 독성 평가를 위한 절차를 설명한다. 예를 들어, 루시퍼레이스-표적화 siRNA는 0, 1, 3, 5, 및 10 mg/kg(5 동물/그룹)로 단일 정맥 일시 주사를 통해 5 mL/kg의 용량 부피로 수컷 Sprague-Dawley 래트에게 투여되었다. 24 시간 후, 약 1 mL의 혈액을 의식이 있는 동물의 경정맥으로부터 수득하고 혈청을 단리했다. 투여 후 72 시간에, 모든 동물을 부검을 위해 안락사시켰다. 임상 징후, 체중, 혈청 화학, 장기 중량 및 조직병리의 평가를 수행했다. 비록 Maier가 siRNA-LNP 제제를 평가하는 방법을 설명하기는 하지만, 이러한 방법은 본 발명의 LNP 조성물 투여의 제거, 약동학, 및 독성을 평가하기 위해 적용될 수 있다.

아민 지질은 증가된 제거율(clearance rate)을 야기할 수 있다. 일부 구체예에서, 제거율은 지질 제거율이고, 예를 들어 지질이 혈액, 혈청, 또는 혈장으로부터 제거되는 속도이다. 일부 구체예에서, 제거율은 RNA 제거율이고, 예를 들어 mRNA 또는 gRNA가 혈액, 혈청, 또는 혈장으로부터 제거되는 속도이다. 일부 구체예에서, 제거율은 LNP가 혈액, 혈청, 또는 혈장으로부터 제거되는 속도이다. 일부 구체예에서, 제거율은 LNP가 조직, 예컨대 간 조직 또는 비장 조직으로부터 제거되는 속도이다. 특정 구체예에서, 높은 제거율은 실질적인 부작용 없이 안전성 프로파일을 유발한다. 아민 지질은 순환 및 조직에서 LNP 축적을 감소시킬 수 있다. 일부 구체예에서, 순환 및 조직에서 LNP 축적의 감소는 실질적인 부작용 없이 안전성 프로파일을 유발한다.

본 발명의 아민 지질은 이들이 존재하는 매질의 pH에 따라 이온화 가능하다 (예를 들어, 염을 형성할 수 있다). 예를 들어, 약간 산성인 매질에서, 아민 지질은 양성자화되어 양전하를 가질 수 있다. 반대로, 예를 들어, pH가 대략 7.35인 혈액과 같은 약간 염기성인 매질에서, 아민 지질은 양성자화되어 전하를 갖지 않을 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 적어도 약 9의 pH에서 양성자화될 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 적어도 약 9의 pH에서 양성자화될 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 적어도 약 10의 pH에서 양성자화될 수 있다.

아민 지질이 주로 양성자화되는 pH는 이의 고유의 pKa와 관련된다. 일부 구체예에서, 본 발명의 아민 지질은 각각 독립적으로 약 5.1 내지 약 7.4 범위의 pKa를 가질 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 각각 독립적으로 약 5.5 내지 약 6.6 범위의 pKa를 가질 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 각각 독립적으로 약 5.6 내지 약 6.4 범위의 pKa를 가질 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 각각 독립적으로 약 5.8 내지 약 6.2 범위의 pKa를 가질 수 있다. 일부 구체예에서, 본 발명의 아민 지질은 각각 독립적으로 약 5.8 내지 약 6.5 범위의 pKa를 가질 수 있다. 아민 지질의 pKa는, 약 5.1 내지 약 7.4 범위의 pKa를 갖는 양이온성 지질이 예를 들어 간으로의 생체 내 카르고의 전달에 효과적인 것으로 밝혀졌으므로, LNP 제제화에서 중요한 고려사항이 될 수 있다. 또한, 약 5.3 내지 약 6.4 범위의 pKa를 갖는 양이온성 지질이, 예를 들어 종양으로의 생체 내 전달에 효과적인 것으로 밝혀졌다. 예를 들어, WO 2014/136086을 참조하라.

추가적인 지질

본 발명의 지질 조성물에서 사용하기에 적합한 "중성 지질"은, 예를 들어 다양한 중성, 비하전 또는 양쪽이온성 지질을 포함한다. 본 발명에서 사용하기에 적합한 중성 인지질의 예는 5-헵타데실벤젠-1,3-디올(레소르시놀), 디팔미토일포스파티딜콜린(DPPC), 디스테아로일포스파티딜콜린(DSPC), 포스포콜린(DOPC), 디미리스토일포스파티딜콜린(DMPC), 포스파티딜콜린(PLPC), 1,2-디스테아로일-sn-글리세로-3-포스포콜린 (DAPC), 포스파티딜에탄올아민(PE), 에그 포스파티딜콜린(EPC), 디라우릴로일포스파티딜콜린(DLPC), 디미리스토일포스파티딜콜린(DMPC), 1-미리스토일-2-팔미토일 포스파티딜콜린(MPPC), 1-팔미토일-2-미리스토일 포스파티딜콜린(PMPC), 1-팔미토일-2-스테아로일 포스파티딜콜린(PSPC), 1,2-디아라키도일-sn-글리세로-3-포스포콜린(DBPC), 1-스테아로일-2-팔미토일 포스파티딜콜린(SPPC), 1,2-디에이코세노일-sn-글리세로-3-포스포콜린(DEPC), 팔미토일올레오일 포스파티딜콜린(POPC), 리소포스파티딜 콜린, 디올레오일 포스파티딜에탄올아민(DOPE), 디리놀레오일포스파티딜콜린 디스테아로일포스파티딜에탄올아민(DSPE), 디미리스토일 포스파티딜에탄올아민(DMPE), 디팔미토일 포스파티딜에탄올아민(DPPE), 팔미토일올레오일 포스파티딜에탄올아민(POPE), 리소포스파티딜에탄올아민 및 이들의 조합을 포함하지만 이에 제한되지 않는다. 한 구체예에서, 중성 인지질은 디스테아로일포스파티딜콜린(DSPC) 및 디미리스토일 포스파티딜 에탄올아민(DMPE)으로 구성된 군으로부터 선택될 수 있다. 다른 구체예에서, 중성 인지질은 디스테아로일포스파티딜콜린(DSPC)일 수 있다. 다른 구체예에서, 중성 인지질은 디팔미토일포스파티딜콜린(DPPC)일 수 있다.

"헬퍼 지질"은 스테로이드, 스테롤, 및 알킬 레소르시놀을 포함한다. 본 발명에서 사용하기에 적합한 헬퍼 지질은 콜레스테롤, 5-헵타데실레소르시놀, 및 콜레스테롤 헤미석시네이트를 포함하지만 이에 제한되지 않는다. 한 구체예에서, 헬퍼 지질은 콜레스테롤일 수 있다. 한 구체예에서, 헬퍼 지질은 콜레스테롤 헤미석시네이트일 수 있다.

PEG 지질은 나노입자가 생체 내 (예를 들어, 혈액에서) 존재할 수 있는 시간의 길이를 변경하는 스텔스(stealth) 지질이다. PEG 지질은, 예를 들어 입자 응집을 감소시키고 입자 크기를 제어함으로써 제제 과정을 보조할 수 있다. 본원에 사용된 PEG 지질은 LNP의 약동학적 특성을 조절할 수 있다. 전형적으로, PEG 지질은 지질 모이어티 및 PEG에 기반한 고분자 모이어티를 포함한다.

일부 구체예에서, 지질 모이어티는 약 C4 내지 약 C40 포화 또는 불포화 탄소 원자를 독립적으로 포함하는 알킬 사슬 길이를 갖는 디알킬글리세롤 또는 디알킬글리카미드 기를 포함하는 것을 포함하여, 디아실글리세롤 또는 디아실글리카미드로부터 유래할 수 있고, 여기서 사슬은 예를 들어 아미드 또는 에스테르와 같은 하나 이상의 작용기를 포함할 수 있다. 일부 구체예에서, 알킬 사슬 길이는 약 C10 내지 C20를 포함한다. 디알킬글리세롤 또는 디알킬글리카미드 기는 하나 이상의 치환된 알킬 기를 추가로 포함할 수 있다. 사슬 길이는 대칭 또는 비대칭일 수 있다.

달리 지시되지 않는 한, 본원에서 사용된 용어 "PEG"는 임의의 폴리에틸렌 글리콜 또는 다른 폴리알킬렌 에테르 고분자를 의미한다. 한 구체예에서, PEG 모이어티는 에틸렌 글리콜 또는 에틸렌 옥사이드의 임의로 치환된 선형 또는 분지형 고분자이다. 특정 구체예에서, PEG 모이어티는 대안적이고, PEG 모이어티는 예를 들어 하나 이상의 알킬, 알콕시, 아실, 하이드록시, 또는 아릴 기에 의해 치환될 수 있다. 한 구체예에서, PEG 모이어티는 PEG 공중합체, 예컨대 PEG-폴리우레탄 또는 PEG-폴리프로필렌을 포함한다 (예를 들어, J. Milton Harris, Poly(ethylene glycol) chemistry: biotechnical and biomedical applications (1992)를 참조하라); 대안적으로, PEG 모이어티는 PEG 공중합체를 포함하지 않으며, 예를 들어, 이는 PEG 단일중합체일 수 있다. 한 구체예에서, PEG는 약 130 내지 약 50,000, 하위구체예에서, 약 150 내지 약 30,000, 하위구체예에서, 약 150 내지 약 20,000, 하위구체예에서 약 150 내지 약 15,000, 하위구체예에서, 약 150 내지 약 10,000, 하위구체예에서, 약 150 내지 약 6,000, 하위구체예에서, 약 150 내지 약 5,000, 하위구체예에서, 약 150 내지 약 4,000, 하위구체예에서, 약 150 내지 약 3,000, 하위구체예에서, 약 300 내지 약 3,000, 하위구체예에서, 약 1,000 내지 약 3,000, 및 하위구체예에서, 약 1,500 내지 약 2,500의 분자량을 갖는다.

특정 구체예에서, (예를 들어, 지질 모이어티 또는 지질, 예컨대 스텔스 지질과 접합된) PEG는 "PEG 2000"로도 명명되는 "PEG-2K"이며 이는 약 2,000 달톤의 평균 분자량을 갖는다. PEG-2K는 본원에서 하기 화학식 (I)로 나타나며, 여기서 n은 45이고, 이는 수평균 중합도가 약 45 서브유닛을 포함함을 의미한다

. 그러나, 예를 들어, 수평균 중합도가 약 23 서브유닛(n=23), 및/또는 68 서브유닛(n=68)을 포함하는 것을 포함하여 당해 분야에 공지인 다른 PEG 구체예가 사용될 수 있다. 일부 구체예에서, n은 약 30 내지 약 60 범위일 수 있다. 일부 구체예에서, n은 약 35 내지 약 55 범위일 수 있다. 일부 구체예에서, n은 약 40 내지 약 50 범위일 수 있다. 일부 구체예에서, n은 약 42 내지 약 48 범위일 수 있다. 일부 구체예에서, n은 45일 수 있다. 일부 구체예에서, R은 H, 치환된 알킬, 및 비치환 알킬로부터 선택될 수 있다. 일부 구체예에서, R은 비치환 알킬일 수 있다. 일부 구체예에서, R은 메틸일 수 있다.

본원에 기재된 임의의 구체예에서, PEG 지질은 PEG-디라우로일글리세롤, PEG-디미리스토일글리세롤 (PEG-DMG) (NOF, Tokyo, Japan의 카탈로그 # GM-020), PEG-디팔미토일글리세롤, PEG-디스테아로일글리세롤 (PEG-DSPE) (카탈로그 # DSPE-020CN, NOF, Tokyo, Japan), PEG-디라우릴글리카미드, PEG-디미리스틸글리카미드, PEG-디팔미토일글리카미드, 및 PEG-디스테아로일글리카미드, PEG-콜레스테롤 (1-[8'-(콜레스트-5-엔-3[베타]-옥시)카르복스아미도-3',6'-디옥사옥타닐]카르바모일-[오메가]-메틸-폴리(에틸렌 글리콜), PEG-DMB (3,4-디테트라데콕실벤질-[오메가]-메틸-폴리(에틸렌 글리콜)에테르), 1,2-디미리스토일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000] (PEG2k-DMG) (Avanti Polar Lipids, Alabaster, Alabama, USA의 cat. #880150P), 1,2-디스테아로일-sn-글리세로-3-포스포에탄올아민-N-[메톡시(폴리에틸렌 글리콜)-2000] (PEG2k-DSPE) (Avanti Polar Lipids, Alabaster, Alabama, USA의 cat. #880120C), 1,2-디스테아로일-sn-글리세롤, 메톡시폴리에틸렌 글리콜 (PEG2k-DSG; GS-020, NOF Tokyo, Japan), 폴리(에틸렌 글리콜)-2000-디메타크릴레이트 (PEG2k-DMA), 및 1,2-디스테아릴옥시프로필-3-아민-N-[메톡시(폴리에틸렌 글리콜)-2000] (PEG2k-DSA)로부터 선택될 수 있다. 한 구체예에서, PEG 지질은 PEG2k-DMG일 수 있다. 일부 구체예에서, PEG 지질은 PEG2k-DSG일 수 있다. 한 구체예에서, PEG 지질은 PEG2k-DSPE일 수 있다. 한 구체예에서, PEG 지질은 PEG2k-DMA일 수 있다. 한 구체예에서, PEG 지질은 PEG2k-C-DMA일 수 있다. 한 구체예에서, PEG 지질은 WO2016/010840에서 단락 [00240] 내지 [00244]에 개시된 화합물 S027일 수 있다. 한 구체예에서, PEG 지질은 PEG2k-DSA일 수 있다. 한 구체예에서, PEG 지질은 PEG2k-C11일 수 있다. 일부 구체예에서, PEG 지질은 PEG2k-C14일 수 있다. 일부 구체예에서, PEG 지질은 PEG2k-C16일 수 있다. 일부 구체예에서, PEG 지질은 PEG2k-C18일 수 있다.

LNP 제제

본 발명의 구체예는 제제 중 성분 지질의 각각의 몰비에 따라 기재된 지질 조성물을 제공한다. 한 구체예에서, 아민 지질의 mol-%는 약 30 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 40 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 45 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 50 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 55 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 50 mol-% 내지 약 55 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 50 mol-%일 수 있다. 한 구체예에서, 아민 지질의 mol-%는 약 55 mol-%일 수 있다. 일부 구체예에서, LNP 배치의 아민 지질 mol-%는 표적 mol-%의 ±30%, ±25%, ±20%, ±15%, ±10%, ±5%, 또는 ±2.5%일 것이다. 일부 구체예에서, LNP 배치의 아민 지질 mol-%는 표적 mol-%의 ±4 mol-%, ±3 mol-%, ±2 mol-%, ±1.5 mol-%, ±1 mol-%, ±0.5 mol-%, 또는 ±0.25 mol-%일 것이다. 모든 mol-% 수는 LNP 조성물의 지질 성분의 분율로서 주어진다. 특정 구체예에서, 아민 지질 mol-% 의 LNP 인터-로트 변동성은 15% 미만, 10% 미만 또는 5% 미만일 것이다.

한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 5 mol-% 내지 약 15 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 7 mol-% 내지 약 12 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 0 mol-% 내지 약 5 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 0 mol-% 내지 약 10 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 5 mol-% 내지 약 10 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 8 mol-% 내지 약 10 mol-%일 수 있다.

한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 5 mol-%, 약 6 mol-%, 약 7 mol-%, 약 8 mol-%, 약 9 mol-%, 약 10 mol-%, 약 11 mol-%, 약 12 mol-%, 약 13 mol-%, 약 14 mol-%, 또는 약 15 mol-%일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 9 mol-%일 수 있다.

한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 1 mol-% 내지 약 5 mol-%일 수 있다. 한 구체예에서, 중성 지질의 mol-%는 약 0.1 mol-% 내지 약 1 mol-%일 수 있다. 한 구체예에서, 중성 인지질과 같은 중성 지질의 mol-%는 약 0.1 mol-%, 약 0.2 mol-%, 약 0.5 mol-%, 1 mol-%, 약 1.5 mol-%, 약 2 mol-%, 약 2.5 mol-%, 약 3 mol-%, 약 3.5 mol-%, 약 4 mol-%, 약 4.5 mol-%, 또는 약 5 mol-%일 수 있다.

한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 1 mol-% 미만일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 0.5 mol-% 미만일 수 있다. 한 구체예에서, 중성 지질, 예를 들어 중성 인지질의 mol-%는 약 0 mol-%, 약 0.1 mol-%, 약 0.2 mol-%, 약 0.3 mol-%, 약 0.4 mol-%, 약 0.5 mol-%, 약 0.6 mol-%, 약 0.7 mol-%, 약 0.8 mol-%, 약 0.9 mol-%, 또는 약 1 mol-%일 수 있다. 일부 구체예에서, 본원에 개시된 제제에는 중성 지질이 없다 (즉, 0 mol-% 중성 지질). 일부 구체예에서, 본원에 개시된 제제에는 중성 지질이 본질적으로 없다 (즉, 약 0 mol-% 중성 지질). 일부 구체예에서, 본원에 개시된 제제에는 중성 인지질이 없다 (즉, 0 mol-% 중성 인지질). 일부 구체예에서, 본원에 개시된 제제에는 중성 인지질이 본질적으로 없다 (즉, 약 0 mol-% 중성 인지질).

일부 구체예에서, LNP 배치의 중성 지질 mol-%는 표적 중성 지질 mol-%의 ±30%, ±25%, ±20%, ±15%, ±10%, ±5%, 또는 ±2.5%일 것이다. 특정 구체예에서, LNP 인터-로트 변동성은 15% 미만, 10% 미만 또는 5% 미만일 것이다.

한 구체예에서, 헬퍼 지질의 mol-%는 약 20 mol-% 내지 약 60 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 약 25 mol-% 내지 약 55 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 약 25 mol-% 내지 약 50 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 약 25 mol-% 내지 약 40 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 약 30 mol-% 내지 약 50 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 약 30 mol-% 내지 약 40 mol-%일 수 있다. 한 구체예에서, 헬퍼 지질의 mol-%는 아민 지질, 중성 지질, 및 PEG 지질 농도를 기준으로 조정되어 지질 성분을 100 mol-%로 만든다. 한 구체예에서, 헬퍼 지질의 mol-%는 아민 지질 및 PEG 지질 농도를 기준으로 조정되어 지질 성분을 100 mol-%로 만든다. 한 구체예에서, 헬퍼 지질의 mol-%는 아민 지질 및 PEG 지질 농도를 기준으로 조정되어 지질 성분을 적어도 99 mol-%로 만든다. 일부 구체예에서, LNP 배치의 헬퍼 mol-%는 표적 mol-%의 ±30%, ±25%, ±20%, ±15%, ±10%, ±5%, 또는 ±2.5%일 것이다. 특정 구체예에서, LNP 인터-로트 변동성은 15% 미만, 10% 미만 또는 5% 미만일 것이다.

한 구체예에서, PEG 지질의 mol-%는 약 1 mol-% 내지 약 10 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 2 mol-% 내지 약 10 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 2 mol-% 내지 약 8 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 2 mol-% 내지 약 4 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 2.5 mol-% 내지 약 4 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 3 mol-%일 수 있다. 한 구체예에서, PEG 지질의 mol-%는 약 2.5 mol-%일 수 있다. 일부 구체예에서, LNP 배치의 PEG 지질 mol-%는 표적 PEG 지질 mol-%의 ±30%, ±25%, ±20%, ±15%, ±10%, ±5%, 또는 ±2.5%일 것이다. 특정 구체예에서, LNP 인터-로트 변동성은 15% 미만, 10% 미만 또는 5% 미만일 것이다.

특정 구체예에서, 카르고는 RNA-유도 DNA-결합제를 인코딩하는 mRNA(예를 들어 Cas 뉴클레이스, 클래스 2 Cas 뉴클레이스, 또는 Cas9), 및 gRNA 또는 gRNA를 인코딩하는 핵산, 또는 mRNA 및 gRNA의 조합을 포함한다. 한 구체예에서, LNP 조성물은 지질 A 또는 이의 등가물을 포함할 수 있다. 일부 양태에서, 아민 지질은 지질 A이다. 일부 양태에서, 아민 지질은 지질 A 등가물, 예를 들어 지질 A의 유사체이다. 특정 양태에서, 아민 지질은 지질 A의 아세탈 유사체이다. 다양한 구체예에서, LNP 조성물은 아민 지질, 중성 지질, 헬퍼 지질, 및 PEG 지질을 포함한다. 특정 구체예에서, 헬퍼 지질은 콜레스테롤이다. 특정 구체예에서, 중성 지질은 DSPC이다. 특정 구체예에서, PEG 지질은 PEG2k-DMG이다. 일부 구체예에서, LNP 조성물은 지질 A, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함할 수 있다. 일부 구체예에서, LNP 조성물은 아민 지질, DSPC, 콜레스테롤, 및 PEG 지질을 포함한다. 일부 구체예에서, LNP 조성물은 DMG를 포함하는 PEG 지질을 포함한다. 특정 구체예에서, 아민 지질은 지질 A, 및 지질 A의 아세탈 유사체를 포함하는 지질 A의 등가물로부터 선택된다. 추가적인 구체예에서, LNP 조성물은 지질 A, 콜레스테롤, DSPC, 및 PEG2k-DMG를 포함한다.

다양한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함한다. 다양한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 인지질, 및 PEG 지질을 포함한다. 다양한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질로 구성된 지질 성분을 포함한다. 다양한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 및 PEG 지질을 포함한다. 특정 구체예에서, LNP 조성물은 중성 인지질과 같은 중성 지질을 포함하지 않는다. 다양한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 및 PEG 지질로 구성된 지질 성분을 포함한다. 특정 구체예에서, 중성 지질은 DSPC, DPPC, DAPC, DMPC, DOPC, DOPE, 및 DSPE 중 하나 이상으로부터 선택된다. 특정 구체예에서, 중성 지질은 DSPC이다. 특정 구체예에서, 중성 지질은 DPPC이다. 특정 구체예에서, 중성 지질은 DAPC이다. 특정 구체예에서, 중성 지질은 DMPC이다. 특정 구체예에서, 중성 지질은 DOPC이다. 특정 구체예에서, 중성 지질은 DOPE이다. 특정 구체예에서, 중성 지질은 DSPE이다. 특정 구체예에서, 헬퍼 지질은 콜레스테롤이다. 특정 구체예에서, PEG 지질은 PEG2k-DMG이다. 일부 구체예에서, LNP 조성물은 지질 A, 헬퍼 지질, 및 PEG 지질을 포함할 수 있다. 일부 구체예에서, LNP 조성물은 지질 A, 헬퍼 지질, 및 PEG 지질로 구성된 지질 성분을 포함할 수 있다. 일부 구체예에서, LNP 조성물은 아민 지질, 콜레스테롤, 및 PEG 지질을 포함한다. 일부 구체예에서, LNP 조성물은 아민 지질, 콜레스테롤, 및 PEG 지질로 구성된 지질 성분을 포함한다. 일부 구체예에서, LNP 조성물은 DMG를 포함하는 PEG 지질을 포함한다. 특정 구체예에서, 아민 지질은 지질 A, 및 지질 A의 아세탈 유사체를 포함하는 지질 A의 등가물로부터 선택된다. 특정 구체예에서, 아민 지질은 지질 A의 C5-C12 또는 C4-C12 아세탈 유사체이다. 추가적인 구체예에서, LNP 조성물은 지질 A, 콜레스테롤, 및 PEG2k-DMG를 포함한다.

본 발명의 구체예는 아민 지질의 양으로 하전된 아민 기(N) 및 캡슐화될 핵산의 음으로 하전된 포스페이트 기(P) 사이의 몰비에 따라 기재된 지질 조성물을 또한 제공한다. 이는 식 N/P에 의해 수학적으로 표현될 수 있다. 일부 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함하는 지질 성분; 및 핵산 성분을 포함할 수 있고, 여기서 N/P 비율은 약 3 내지 10이다. 일부 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 및 PEG 지질을 포함하는 지질 성분; 및 핵산 성분을 포함할 수 있고, 여기서 N/P 비율은 약 3 내지 10이다. 일부 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 지질, 및 헬퍼 지질을 포함하는 지질 성분; 및 RNA 성분을 포함할 수 있고, 여기서 N/P 비율은 약 3 내지 10이다. 일부 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 및 PEG 지질을 포함하는 지질 성분; 및 RNA 성분을 포함할 수 있고, 여기서 N/P 비율은 약 3 내지 10이다. 한 구체예에서, N/P 비율은 약 5 내지 7일 수 있다. 한 구체예에서, N/P 비율은 약 3 내지 7일 수 있다. 한 구체예에서, N/P 비율은 약 4.5 내지 8일 수 있다. 한 구체예에서, N/P 비율은 약 6일 수 있다. 한 구체예에서, N/P 비율은 6 ± 1일 수 있다. 한 구체예에서, N/P 비율은 6 ± 0.5일 수 있다. 일부 구체예에서, N/P 비율은 표적 N/P 비율의 ±30%, ±25%, ±20%, ±15%, ±10%, ±5%, 또는 ±2.5%일 것이다. 특정 구체예에서, LNP 인터-로트 변동성은 15% 미만, 10% 미만 또는 5% 미만일 것이다.

일부 구체예에서, 핵산 성분, 예를 들어 RNA 성분은 mRNA, 예컨대 Cas 뉴클레이스를 인코딩하는 mRNA를 포함할 수 있다. RNA 성분은임의로 추가적인 핵산 및/또는 단백질, 예를 들어 RNP 카르고와 함께 RNA를 포함한다. 한 구체예에서, RNA는 Cas9 mRNA를 포함한다. Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 일부 조성물에서, LNP는 gRNA 핵산, 예컨대 gRNA를 추가로 포함한다. 일부 구체예에서, RNA 성분은 Cas 뉴클레이스 mRNA 및 gRNA를 포함한다. 일부 구체예에서, RNA 성분은 클래스 2 Cas 뉴클레이스 mRNA 및 gRNA를 포함한다.

특정 구체예에서, LNP 조성물은 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA, 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함할 수 있다. 특정 구체예에서, LNP 조성물은 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA, 아민 지질, 헬퍼 지질, 및 PEG 지질을 포함할 수 있다. 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 특정 LNP 조성물에서, 헬퍼 지질은 콜레스테롤이다. 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 다른 조성물에서, 중성 지질은 DSPC이다. 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 추가적인 구체예에서, PEG 지질은 PEG2k-DMG 또는 PEG2k-C11이다. 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 특정 조성물에서, 아민 지질은 지질 A 및 이의 등가물, 예컨대 지질 A의 아세탈 유사체로부터 선택된다.

일부 구체예에서, LNP 조성물은 gRNA를 포함할 수 있다. 특정 구체예에서, LNP 조성물은 아민 지질, gRNA, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함할 수 있다. 특정 구체예에서, LNP 조성물은 아민 지질, gRNA, 헬퍼 지질, 및 PEG 지질을 포함할 수 있다. gRNA를 포함하는 특정 LNP 조성물에서, 헬퍼 지질은 콜레스테롤이다. gRNA를 포함하는 일부 조성물에서, 중성 지질은 DSPC이다. gRNA를 포함하는 추가의 구체예에서, PEG 지질은 PEG2k-DMG 또는 PEG2k-C11이다. 특정 구체예에서, 아민 지질은 지질 A 및 이의 등가물, 예컨대 지질 A의 아세탈 유사체로부터 선택된다.

한 구체예에서, LNP 조성물은 sgRNA를 포함할 수 있다. 한 구체예에서, LNP 조성물은 Cas9 sgRNA를 포함할 수 있다. 한 구체예에서, LNP 조성물은 Cpf1 sgRNA를 포함할 수 있다. sgRNA를 포함하는 일부 조성물에서, LNP는 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함한다. sgRNA를 포함하는 일부 조성물에서, LNP는 아민 지질, 헬퍼 지질, 및 PEG 지질을 포함한다. sgRNA를 포함하는 특정 조성물에서, 헬퍼 지질은 콜레스테롤이다. sgRNA를 포함하는 다른 조성물에서, 중성 지질은 DSPC이다. sgRNA를 포함하는 추가적인 구체예에서, PEG 지질은 PEG2k-DMG 또는 PEG2k-C11이다. 특정 구체예에서, 아민 지질은 지질 A 및 이의 등가물, 예컨대 지질 A의 아세탈 유사체로부터 선택된다.

특정 구체예에서, LNP 조성물은 Cas 뉴클레이스를 인코딩하는 mRNA 및 sgRNA일 수 있는 gRNA를 포함한다. 한 구체예에서, LNP 조성물은 아민 지질, Cas 뉴클레이스를 인코딩하는 mRNA, gRNA, 헬퍼 지질, 중성 지질, 및 PEG 지질을 포함할 수 있다. 한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 중성 지질, 및 PEG 지질로 구성된 지질 성분; 및 Cas 뉴클레이스를 인코딩하는 mRNA, 및 gRNA로 구성된 핵산 성분을 포함할 수 있다. 한 구체예에서, LNP 조성물은 아민 지질, 헬퍼 지질, 및 PEG 지질로 구성된 지질 성분; 및 Cas 뉴클레이스를 인코딩하는 mRNA, 및 gRNA로 구성된 핵산 성분을 포함할 수 있다. Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 특정 조성물에서, 헬퍼 지질은 콜레스테롤이다. Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 일부 조성물에서, 중성 지질은 DSPC이다. Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 특정 조성물은 약 1 mol-% 미만의 중성 지질, 예를 들어 중성 인지질을 포함한다. Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 특정 조성물은 약 0.5 mol-% 미만의 중성 지질, 예를 들어 중성 인지질을 포함한다. 특정 조성물에서, LNP는 중성 지질, 예를 들어, 중성 인지질을 포함하지 않는다. Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 추가적인 구체예에서, PEG 지질은 PEG2k-DMG 또는 PEG2k-C11이다. 특정 구체예에서, 아민 지질은 지질 A 및 이의 등가물, 예컨대 지질 A의 아세탈 유사체로부터 선택된다.

특정 구체예에서, LNP 조성물은 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas mRNA 및 적어도 하나의 gRNA를 포함한다. 특정 구체예에서, LNP 조성물은 약 25:1 내지 약 1:25의 gRNA 대 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas 뉴클레이스 mRNA의 비율을 포함한다. 특정 구체예에서, LNP 제제는 약 10:1 내지 약 1:10의 gRNA 대 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas 뉴클레이스 mRNA의 비율을 포함한다. 특정 구체예에서, LNP 제제는 약 8:1 내지 약 1:8의 gRNA 대 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas 뉴클레이스 mRNA의 비율을 포함한다. 본원에서 측정된 비율은 중량 기준이다. 일부 구체예에서, LNP 제제는 약 5:1 내지 약 1:5의 gRNA 대 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas mRNA의 비율을 포함한다. 일부 구체예에서, 비율 범위는 약 3:1 내지 1:3, 약 2:1 내지 1:2, 약 5:1 내지 1:2, 약 5:1 내지 1:1, 약 3:1 내지 1:2, 약 3:1 내지 1:1, 약 3:1, 약 2:1 내지 1:1이다. 일부 구체예에서, gRNA 대 mRNA 비율은 약 3:1 또는 약 2:1이다. 일부 구체예에서 gRNA 대 Cas 뉴클레이스 mRNA, 예컨대 클래스 2 Cas 뉴클레이스의 비율은 약 1:1이다. 비율은 약 25:1, 10:1, 5:1, 3:1, 1:1, 1:3, 1:5, 1:10, 또는 1:25일 수 있다.

본원에 개시된 LNP 조성물은 주형 핵산을 포함할 수 있다. 주형 핵산은 Cas 뉴클레이스를 인코딩하는 mRNA, 예컨대 클래스 2 Cas 뉴클레이스 mRNA와 공동-제제화될 수 있다. 일부 구체예에서, 주형 핵산은 가이드 RNA와 공동-제제화될 수 있다. 일부 구체예에서, 주형 핵산은 Cas 뉴클레이스를 인코딩하는 mRNA 및 가이드 RNA 둘 모두와 공동-제제화될 수 있다. 일부 구체예에서, 주형 핵산은 Cas 뉴클레이스를 인코딩하는 mRNA 또는 가이드 RNA와 별도로 제제화될 수 있다. 주형 핵산은 LNP 조성물과 함께 또는 별도로 전달될 수 있다. 일부 구체예에서, 주형 핵산은 원하는 복구 메커니즘에 따라 단일- 또는 이중-가닥일 수 있다. 주형은 표적 DNA, 또는 표적 DNA에 인접한 서열에 대한 상동성 영역을 가질 수 있다.

일부 구체예에서, LNP는 수성 RNA 용액을 유기 용매계 지질 용액, 예를 들어, 100% 에탄올과 혼합하여 형성된다. 적합한 용액 또는 용매는 물, PBS, Tris 버퍼, NaCl, 시트레이트 버퍼, 에탄올, 클로로포름, 디에틸에테르, 사이클로헥산, 테트라하이드로퓨란, 메탄올, 이소프로판올을 포함하거나 함유할 수 있다. 예를 들어, LNP의 생체 내 투여를 위한 약제학적으로 허용되는 버퍼가 사용될 수 있다. 특정 구체예에서, 버퍼는 LNP를 포함하는 조성물의 pH를 pH 6.5 이상으로 유지하기 위해 사용된다. 특정 구체예에서, 버퍼는 LNP를 포함하는 조성물의 pH를 pH 7.0 이상으로 유지하기 위해 사용된다. 특정 구체예에서, 조성물은 약 7.2 내지 약 7.7 범위의 pH를 갖는다. 추가적인 구체예에서, 조성물은 약 7.3 내지 약 7.7 범위 또는 약 7.4 내지 약 7.6 범위의 pH를 갖는다. 추가의 구체예에서, 조성물은 약 7.2, 7.3, 7.4, 7.5, 7.6, 또는 7.7의 pH를 갖는다. 조성물의 pH는 마이크로 pH 프로브로 측정될 수 있다. 특정 구체예에서, 동결보호제(cryoprotectant )가 조성물에 포함된다. 동결보호제의 비제한적 예는 수크로스, 트레할로스, 글리세롤, DMSO, 및 에틸렌 글리콜을 포함한다. 예시적인 조성물은 예를 들어, 수크로스와 같은 최대 10% 동결보호제를 포함할 수 있다. 특정 구체예에서, LNP 조성물은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10% 동결보호제를 포함할 수 있다. 특정 구체예에서, LNP 조성물은 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 또는 10% 수크로스를 포함할 수 있다. 일부 구체예에서, LNP 조성물은 버퍼를 포함할 수 있다. 일부 구체예에서, 버퍼는 포스페이트 버퍼(PBS), Tris 버퍼, 시트레이트 버퍼, 또는 이들의 혼합을 포함할 수 있다. 특정한 예시적인 구체예에서, 버퍼는 NaCl을 포함한다. 특정 구체예에서, NaCl이 생략된다. NaCl의 예시적인 양은 약 20 mM 내지 약 45 mM 범위일 수 있다. NaCl의 예시적인 양은 약 40 mM 내지 약 50 mM 범위일 수 있다. 일부 구체예에서, NaCl의 양은 약 45 mM이다. 일부 구체예에서, 버퍼는 Tris 버퍼이다. Tris의 예시적인 양은 약 20 mM 내지 약 60 mM 범위일 수 있다. Tris의 예시적인 양은 약 40 mM 내지 약 60 mM 범위일 수 있다. 일부 구체예에서, Tris의 양은 약 50 mM이다. 일부 구체예에서, 버퍼는 NaCl 및 Tris를 포함한다. LNP 조성물의 특정한 예시적인 구체예는 Tris 버퍼 중에 5% 수크로스 및 45 mM NaCl을 함유한다. 다른 예시적인 구체예에서, 조성물은 약 5% w/v의 양의 수크로스, 약 45 mM NaCl, 및 pH 7.5의 약 50 mM Tris를 함유한다. 염, 버퍼, 및 동결보호제 양은 전체 제제의 삼투질농도(osmolality)가 유지되도록 변할 수 있다. 예를 들어, 최종 삼투질농도는 450 mOsm/L 미만에서 유지될 수 있다. 추가의 구체예에서, 삼투질농도는 350 내지 250 mOsm/L이다. 특정 구체예는 300 +/- 20 mOsm/L의 최종 삼투질농도를 갖는다.

일부 구체예에서, 미세유체 혼합, T-혼합, 또는 교차-혼합이 사용된다. 특정 양태에서, 유량, 접합 크기, 접합 기하구조, 접합 형태, 관 직경, 용액, 및/또는 RNA 및 지질 농도가 변할 수 있다. LNP 또는 LNP 조성물은 예를 들어 투석, 접선 유동 여과, 또는 크로마토그래피를 통해 농축 또는 정제될 수 있다. LNP는 예를 들어 현탁액, 유탁액(emulsion), 또는 동결건조 분말로서 보관될 수 있다. 일부 구체예에서, LNP 조성물은 2-8℃에서 보관되고, 특정 양태에서, LNP 조성물은 실온에서 보관된다. 추가적인 구체예에서, LNP 조성물은 예를 들어 -20℃ 또는 -80℃에서 냉동 보관된다. 다른 구체예에서, LNP 조성물은 약 0℃ 내지 약 -80℃ 범위의 온도에서 보관된다. 냉동된 LNP 조성물은, 예를 들어 얼음에서, 실온에서 또는 25℃에서 사용 전에 해동될 수 있다.

LNP는 예를 들어 미소구체(단층 및 다층 막소포(unilamellar and multilamellar vesicles), 예를 들어, "리포솜" 포함- 일부 구체예에서, 실질적으로 구형인 층상 지질 이중층- 보다 특정한 구체예에서, 예를 들어 상당 부분의 RNA 분자를 포함하는 수성 코어를 포함할 수 있음), 유탁액 중의 분산상, 미셀, 또는 현탁액 중의 내부상일 수 있다.

또한, LNP 조성물은 치료적 유효 용량에서 생체 내 세포독성 수준으로 축적되지 않는다는 점에서 생분해성이다. 일부 구체예에서, LNP 조성물은 치료 용량 수준에서 실질적인 부작용을 유발하는 선천성 면역 반응을 야기하지 않는다. 일부 구체예에서, 본원에 제공된 LNP 조성물은 치료 용량 수준에서 독성을 야기하지 않는다.

일부 구체예에서, pdi는 약 0.005 내지 약 0.75 범위일 수 있다. 일부 구체예에서, pdi는 약 0.01 내지 약 0.5 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.4 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.35 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.35 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.3 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.25 범위일 수 있다. 일부 구체예에서, pdi는 약 0 내지 약 0.2 범위일 수 있다. 일부 구체예에서, pdi는 약 0.08, 0.1, 0.15, 0.2, 또는 0.4 미만일 수 있다.

본원에 개시된 LNP는 약 1 내지 약 250 nm의 크기(예를 들어, Z-평균 직경)를 갖는다. 일부 구체예에서, LNP는 약 10 내지 약 200 nm의 크기를 갖는다. 추가의 구체예에서, LNP는 약 20 내지 약 150nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 50 내지 약 150 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 50 내지 약 100 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 50 내지 약 120 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 60 내지 약 100 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 75 내지 약 150 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 75 내지 약 120 nm의 크기를 갖는다. 일부 구체예에서, LNP는 약 75 내지 약 100 nm의 크기를 갖는다. 달리 지시되지 않는 한, 본원에서 언급된 모든 크기는 Malvern Zetasizer에서 동적 광산란에 의해 측정된 완전히 형성된 나노입자의 평균 크기(직경)이다. 나노입자 샘플은 계수율이 대략 200-400 kcp가 되도록 포스페이트 완충 식염수(PBS)에 희석된다. 데이터는 강도 측정의 가중 평균(Z-평균 직경)으로 나타난다.

일부 구체예에서, LNP는 약 50% 내지 약 100% 범위의 평균 캡슐화 효율로 형성된다. 일부 구체예에서, LNP는 약 50% 내지 약 70% 범위의 평균 캡슐화 효율로 형성된다. 일부 구체예에서, LNP는 약 70% 내지 약 90% 범위의 평균 캡슐화 효율로 형성된다. 일부 구체예에서, LNP는 약 90% 내지 약 100% 범위의 평균 캡슐화 효율로 형성된다. 일부 구체예에서, LNP는 약 75% 내지 약 95% 범위의 평균 캡슐화 효율로 형성된다.

일부 구체예에서, LNP는 약 1.00E+05 g/mol 내지 약 1.00E+10 g/mol 범위의 평균 분자량으로 형성된다. 일부 구체예에서, LNP는 약 5.00E+05 g/mol 내지 약 7.00E+07 g/mol 범위의 평균 분자량으로 형성된다. 일부 구체예에서, LNP는 약 1.00E+06 g/mol 내지 약 1.00E+10 g/mol 범위의 평균 분자량으로 형성된다. 일부 구체예에서, LNP는 약 1.00E+07 g/mol 내지 약 1.00E+09 g/mol 범위의 평균 분자량으로 형성된다. 일부 구체예에서, LNP는 약 5.00E+06 g/mol 내지 약 5.00E+09 g/mol 범위의 평균 분자량으로 형성된다.

일부 구체예에서, 다분산도(Mw/Mn; 중량평균 몰질량(Mw) 대 수평균 몰질량(Mn)의 비율)은 약 1.000 내지 약 2.000 범위일 수 있다. 일부 구체예에서, Mw/Mn은 약 1.00 내지 약 1.500 범위일 수 있다. 일부 구체예에서, Mw/Mn은 약 1.020 내지 약 1.400 범위일 수 있다. 일부 구체예에서, Mw/Mn은 약 1.010 내지 약 1.100 범위일 수 있다. 일부 구체예에서, Mw/Mn은 약 1.100 내지 약 1.350 범위일 수 있다.

세포 조작 방법; 조작된 세포

본원에 개시된 LNP 조성물은 생체내 및 시험관내 모두에서 유전자 편집을 통한 세포 조작 방법에서 사용될 수 있다. 일부 구체예에서, 방법은 세포를 본원에 기재된 LNP 조성물과 접촉시키는 것을 포함한다.

일부 구체예에서, 방법은 대상, 예컨대 포유동물, 예컨대 인간에서 세포를 접촉시키는 것을 포함한다. 일부 구체예에서, 세포는 기관, 예컨대 간, 예컨대 포유동물 간, 예컨대 인간 간에 있다. 일부 구체예에서, 세포는 간 세포(liver cell), 예컨대 포유동물 간 세포, 예컨대 인간 간 세포이다. 일부 구체예에서, 세포는 간세포(hepatocyte), 예컨대 포유동물 간세포, 예컨대 인간 간세포이다. 일부 구체예에서, 간 세포는 줄기 세포이다. 일부 구체예에서, 인간 간 세포는 간 동양 내피세포(liver sinusoidal endothelial cell, LSEC)일 수 있다. 일부 구체예에서, 인간 간 세포는 쿠퍼(Kupffer) 세포일 수 있다. 일부 구체예에서, 인간 간 세포는 간 성상 세포(hepatic stellate cell)일 수 있다. 일부 구체예에서, 인간 간 세포는 종양 세포일 수 있다. 일부 구체예에서, 인간 간 세포는 간 줄기 세포일 수 있다. 추가적인 구체예에서, 세포는 ApoE-결합 수용체를 포함한다. 일부 구체예에서, 간세포(hepatocyte)와 같은 간의 세포(liver cell)는 제자리에 있다(in situ). 일부 구체예에서, 간세포와 같은 간 세포는 예를 들어 배양, 예컨대 일차 배양에서 단리된다. 본원에 개시된 용도에 상응하는 방법이 또한 제공되고, 이는 본원에 개시된 LNP 조성물을 대상에게 투여하는 것 또는 상기 기재된 것과 같은 세포를 본원에 개시된 LNP 조성물과 접촉시키는 것을 포함한다.

일부 구체예에서, 조작된 세포, 예를 들어 이전 단락의 세포 유형 중 임의의 하나로부터 유리한 조작된 세포가 제공된다. 그러한 조작된 세포는 본원에 기재된 방법에 따라 생성된다. 일부 구체예에서, 조작된 세포는 대상 내의 조직 또는 기관, 예를 들어 간 내에 존재한다.

본원에 기재된 일부 방법 및 세포에서, 세포는 표적 서열에서 뉴클레오타이드의 변형, 예를 들어 삽입 또는 결실 ("인델(indel)") 또는 치환을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4 또는 5 개 또는 그 이상의 뉴클레오타이드의 삽입을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 삽입을 포함한다. 다른 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 또는 25 개 또는 그 이상의 뉴클레오타이드의 결실을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 결실을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 틀이동(frameshift) 돌연변이를 야기하는 인델을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 또는 25 개 또는 그 이상의 뉴클레오타이드의 치환을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 치환을 포함한다. 일부 구체예에서, 변형은 주형 핵산, 예를 들어 임의의 본원에 기재된 주형 핵산의 혼입에서 기인한 뉴클레오타이드의 삽입, 결실, 또는 치환 중 하나 이상을 포함한다.

일부 구체예에서, 조작된 세포를 포함하는 세포의 집단, 예를 들어 본원에 기재된 방법에 따라 조작된 세포를 포함하는 세포의 집단이 제공된다. 일부 구체예에서, 집단은 시험관내 배양된 조작된 세포를 포함한다. 일부 구체예에서, 집단은 대상 내의 조직 또는 기관, 예를 들어 간 내에 존재한다. 일부 구체예에서, 집단 내의 세포의 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 또는 그 이상이 조작된다. 특정 구체예에서, 본원에 개시된 방법은 인델의 검출에 의해 정의된 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% 편집 효율(또는 "편집 퍼센트")을 야기한다. 다른 구체예에서, 본원에 개시된 방법은 삽입, 결실, 치환 또는 다른 방식에 의한 서열 변화 검출에 의해 정의된 적어도 5%, 적어도 10%, 적어도 15%, 적어도 20%, 적어도 25%, 적어도 30%, 적어도 35%, 적어도 40%, 적어도 45%, 적어도 50%, 적어도 55%, 적어도 60%, 적어도 65%, 적어도 70%, 적어도 75%, 적어도 80%, 적어도 85%, 적어도 90% 또는 적어도 95% DNA 변형 효율을 야기한다. 특정 구체예에서, 본원에 개시된 방법은 세포 집단에서 약 5% 내지 약 100%, 약 10% 내지 약 50%, 약 20 내지 약 100%, 약 20 내지 약 80%, 약 40 내지 약 100%, 또는 약 40 내지 약 80%의 편집 효율 수준 또는 DNA 변형 효율 수준을 야기한다.

본원에 기대된 방법 및 세포 중 일부에서, 집단 내의 세포는 표적 서열에서 변형, 예를 들어 인델 또는 치환을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4 또는 5 개 또는 그 이상의 뉴클레오타이드의 삽입을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 삽입을 포함한다. 다른 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 또는 25 개 또는 그 이상의 뉴클레오타이드의 결실을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 결실을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 틀이동 돌연변이를 야기한다. 일부 구체예에서, 변형은 표적 서열에서 틀이동 돌연변이를 야기하는 인델을 포함한다. 일부 구체예에서, 적어도 80%, 적어도 85%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 또는 적어도 99% 또는 그 이상의 집단 중의 조작된 세포가 틀이동 돌연변이를 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20 또는 25 개 또는 그 이상의 뉴클레오타이드의 치환을 포함한다. 일부 구체예에서, 변형은 표적 서열에서 1 또는 2 개의 뉴클레오타이드의 치환을 포함한다. 일부 구체예에서, 변형은 주형 핵산, 예를 들어 임의의 본원에 기재된 주형 핵산의 혼입에서 기인한 뉴클레오타이드의 삽입, 결실, 또는 치환 중 하나 이상을 포함한다.

유전자 편집 방법

본원에 개시된 LNP 조성물은 생체내 및 시험관내 유전자 편집에 사용될 수 있다. 한 구체예에서, 본원에 기재된 하나 이상의 LNP 조성물은 이를 필요로 하는 대상에게 투여될 수 있다. 한 구체예에서, 본원에 기재된 하나 이상의 LNP 조성물은 세포와 접촉할 수 있다. 한 구체예에서, 본원에 기재된 치료적 유효량의 조성물이 이를 필요로 하는 대상의 세포와 접촉할 수 있다. 한 구체예에서, 유전자 조작된 세포는 세포를 본원에 기재된 LNP 조성물과 접촉시켜 생성될 수 있다. 다양한 구체예에서, 방법은 상기 제시된 바와 같이 주형 핵산을 세포 또는 대상에게 도입하는 것을 포함한다.

일부 구체예에서, 방법은 LNP 조성물을 간 장애(disorder)와 관련된 세포에 투여하는 것을 포함한다. 일부 구체예에서, 방법은 간 장애를 치료하는 것을 포함한다. 특정 구체예에서, 방법은 간 세포(hepatic cell)를 LNP 조성물과 접촉시키는 것을 포함한다. 특정 구체예에서, 방법은 간세포(hepatocyte)를 LNP 조성물과 접촉시키는 것을 포함한다. 일부 구체예에서, 방법은 ApoE 결합 세포를 LNP 조성물과 접촉시키는 것을 포함한다.

한 구체예에서, 클래스 2 Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 LNP 조성물은 세포, 예컨대 ApoE 결합 세포에 투여될 수 있다. 추가적인 구체예에서, 주형 핵산이 또한 세포에 도입된다. 특정 예에서, 클래스 2 Cas 뉴클레이스 및 sgRNA를 포함하는 LNP 조성물은 세포, 예컨대 ApoE 결합 세포에 투여될 수 있다. 한 구체예에서, 클래스 2 Cas 뉴클레이스를 인코딩하는 mRNA, gRNA, 및 주형을 포함하는 LNP 조성물은 세포에 투여될 수 있다. 특정 예에서, Cas 뉴클레이스 및 sgRNA를 포함하는 LNP 조성물은 간 세포에 투여될 수 있다. 일부 예에서, 간 세포는 대상 안에 있다.

특정 구체예에서, 대상은 단일 용량의 LNP 조성물을 받을 수 있다. 다른 예에서, 대상은 다중 용량의 LNP 조성물을 받을 수 있다. 일부 구체예에서, LNP 조성물은 2-5 회 투여된다. 하나 초과의 용량이 투여되는 경우, 용량은 약 1, 2, 3, 4, 5, 6, 7, 14, 21, 또는 28 일 간격으로; 약 2, 3, 4, 5, 또는 6 개월 간격으로; 또는 약 1, 2, 3, 4, 또는 5 년 간격으로 투여될 수 있다. 특정 구체예에서, 편집은 LNP 조성물의 재투여 시 개선된다.

한 구체예에서, 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 LNP 조성물은 gRNA를 포함하는 조성물의 투여와 별도로 세포에 투여될 수 있다. 한 구체예에서, 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA 및 gRNA를 포함하는 LNP 조성물은 주형 핵산의 세포로의 투여와 별도로 세포에 투여될 수 있다. 한 구체예에서, 클래스 2 Cas 뉴클레이스와 같은 Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 LNP 조성물은 세포에 투여되고, 이어서 세포로의 gRNA를 포함하는 LNP 조성물 및 이후 주형의 연속 투여가 이어질 수 있다. Cas 뉴클레이스를 인코딩하는 mRNA를 포함하는 LNP 조성물이 gRNA를 포함하는 LNP 조성물 전에 투여되는 구체예에서, 투여는 약 4, 6, 8, 12, 또는 24 시간; 또는 2, 3, 4, 5, 6, 또는 7 일 간격일 수 있다.

한 구체예에서, LNP 조성물은 유전자 넉아웃을 야기하도록 유전자를 편집하기 위해 사용될 수 있다. 한 구체예에서, LNP 조성물은 세포의 집단에서 유전자 넉다운을 야기하도록 유전자를 편집하기 위해 사용될 수 있다. 다른 구체예에서, LNP 조성물은 유전자 교정을 야기하도록 유전자를 편집하기 위해 사용될 수 있다. 추가의 구체예에서, LNP 조성물은 유전자 삽입을 야기하도록 유전자를 편집하기 위해 사용될 수 있다.

한 구체예에서, LNP 조성물의 투여는 지속적인 반응을 야기하는 유전자 편집을 야기할 수 있다. 예를 들어, 투여는 하루, 한 달, 일 년 또는 그 이상의 반응 지속기간을 야기할 수 있다. 본원에서 사용된 "반응 지속기간"은, 본원에 개시된 LNP 조성물을 사용하여 세포가 편집된 후, 결과적인 변형이 LNP 조성물의 투여 후 특정 기간 동안 여전히 존재함을 의미한다. 변형은 표적 단백질 수준을 측정하여 검출될 수 있다. 변형은 표적 DNA를 검출하여 검출될 수 있다. 일부 구체예에서, 반응 기간은 적어도 1 주일 수 있다. 다른 구체예에서, 반응 기간은 적어도 2 주일 수 있다. 한 구체예에서, 반응 기간은 적어도 1 개월일 수 있다. 일부 구체예에서, 반응 기간은 적어도 2 개월일 수 있다. 한 구체예에서, 반응 기간은 적어도 4 개월일 수 있다. 한 구체예에서, 반응 기간은 적어도 6 개월일 수 있다. 특정 구체예에서, 반응 기간은 약 26 주일 수 있다. 일부 구체예에서, 반응 기간은 적어도 1 년일 수 있다. 일부 구체예에서, 반응 기간은 적어도 5 년일 수 있다. 일부 구체예에서, 반응 기간은 적어도 10 년일 수 있다. 일부 구체예에서, 지속적인 반응은 적어도 0.5, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 15, 18, 21, 또는 24 개월 후에, 표적 단백질 수준 측정 또는 표적 DNA 검출에 의해 검출 가능하다. 일부 구체예에서, 지속적인 반응은 적어도 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 12, 14, 16, 18, 또는 20 년 후에, 표적 단백질 수준 측정 또는 표적 DNA 검출에 의해 검출 가능하다.

LNP 조성물은 비경구적으로 투여될 수 있다. LNP 조성물은 혈류, 조직, 근육, 또는 내부 기관으로 직접 투여될 수 있다. 투여는 전신, 예를 들어 주사 또는 주입일 수 있다. 투여는 국소적일 수 있다. 투여에 적합한 수단은 정맥내, 동맥내, 척수강내, 심실내, 요도내, 흉골내, 두개내, 망막하, 유리체내, 전실내, 근육내, 활막내, 피내 및 피하를 포함한다. 투여에 적합한 장치는 바늘(미세바늘 포함) 주입기, 무-바늘 주입기, 삼투 펌프, 및 주입 기술을 포함한다.

LNP 조성물은 일반적으로 하나 이상의 약제학적으로 허용되는 부형제와 공동으로 제제로서 투여될 것이지만 반드시 그런 것은 아니다. 용어 "부형제"는 본 발명의 화합물(들) 이외의 임의의 성분, 다른 지질 성분(들) 및 생물학적 활성제를 포함한다. 부형제는 기능성 (예를 들어 약물 방출 속도 제어) 및/또는 비-기능성 (예를 들어 가공 보조제 또는 희석제) 특징을 제제에 부여할 수 있다. 부형제의 선택은 특정 투여 방식, 용해도 및 안정성에 대한 부형제의 효과, 및 제형의 성질과 같은 인자에 크게 의존할 것이다.

비경구 제제는 전형적으로 수성 또는 유성 용액 또는 현탁액이다. 제제가 수성인 경우, 부형제, 예컨대 당 (글루코스, 만니톨, 소르비톨 등을 포함하지만 이에 제한되지 않음) 염, 탄수화물 및 완충제(바람직하게는 3 내지 9의 pH), 그러나, 일부 적용의 경우, 이들은 무균 비수성 용액과 함께 또는 무균, 무발열원 물(pyrogen-free water)(WFI)과 같은 적합한 비히클과 함께 사용될 건조된 형태로서 더욱 적합하게 제제화될 수 있다.

비록 본 발명이 예시된 실시예와 관련하여 설명되었지만, 본 발명을 이러한 실시예로 제한하도록 의도되지 않음이 이해된다. 반대로, 본 발명은 모든 대안, 변형, 및 구체적인 특징의 균등물을 포함한 균등물을 포함하도록 의도되며, 이는 첨부된 청구범위에 의해 정의된 바와 같이 본 발명에 포함될 수 있다.

전술한 일반적인 설명 및 상세한 설명뿐만 아니라, 다음의 실시예는 단지 예시적이고 설명적인 것이며 교시를 제한하지 않는다. 본원에서 사용된 섹션 제목은 단지 조직적 목적을 위한 것이며 어떠한 방식으로든 원하는 발명 대상(subject matter)을 제한하는 것으로 해석되어서는 안된다. 참조로 포함된 임의의 문헌이 본 명세서에 정의된 임의의 용어와 상충하는 경우, 본 명세서가 우선한다. 달리 명시되지 않는 한, 출원에 주어진 모든 범위는 종점을 포함한다.

본 출원에서 사용된 단수 형태 "a", "an" 및 "the"는 문맥상 명백하게 다르게 지시되지 않는 한 복수 지시대상을 포함한다는 점에 유의해야 한다. 따라서, 예를 들어 "조성물"에 대한 언급은 복수의 조성물을 포함하고 "세포"에 대한 언급은 복수의 세포 등을 포함한다. "또는"의 사용은 포괄적이며 달리 명시되지 않는 한 "및/또는"을 의미한다.

수치 범위는 범위를 정의하는 숫자를 포함한다. 측정된 값 및 측정 가능한 값은 유효 숫자 및 측정과 관련된 오차를 고려하여 근사값으로 이해된다. 용어 "약" 또는 "대략"은 당업자에 의해 결정된 특정 값에 대한 허용 가능한 오차를 의미하며, 이는 값이 측정되는 또는 결정되는 방법에 부분적으로 의존한다. 범위 앞 또는 값의 목록 앞의 "약"과 같은 수식어의 사용은, 범위의 각각의 종점 또는 목록 내의 각각의 값을 수식한다. "약"은 값 또는 종점을 또한 포함한다. 예를 들어, "약 50-55"는 "약 50 내지 약 55"를 포함한다. 또한, "포함하다(comprise)", "포함하다(comprises)", "포함하는(comprising)", "함유하다(contain)", "함유하다(contains)", "함유하는(containing)", "포함하다(include)", "포함하다(includes), 및 "포함하는(including)의 사용은 제한적이지 않다.

상기 명세서에서 구체적으로 언급되지 않는 한, 다양한 구성요소를 "포함하는"을 언급하는 본 명세서의 구체예는 본 명세서의 구체예 "구성되는" 또는 "본질적으로 구성되는" 것으로 또한 고려되고; 다양한 구성요소로 "구성되는"을 언급하는 본 명세서의 구체예는 언급된 구성요소를 "포함하는" 또는 "본질적으로 구성되는" 것으로 또한 고려되고; "약" 다양한 구성요소를 언급하는 본 명세서의 구체예는 언급된 구성요소"에서"인 것으로 또한 고려되고; 다양한 구성요소로 "본질적으로 구성되는"을 언급하는 본 명세서의 구체예는 언급된 구성요소로 "구성되는" 또는 이를 "포함하는"으로 또한 고려된다 (이러한 상호교환성은 청구범위에서 이들 용어의 사용에는 적용되지 않는다).

실시예

실시예 1 - 마우스에서의 생체 내 편집을 위한 LNP 조성물

다양한 LNP 조성물의 소규모 제제를 제조하여 특성을 조사했다. 마우스에서의 간 편집 퍼센트에 대한 분석에서, 마우스 TTR 서열을 표적으로 하는 Cas9 mRNA 및 화학적으로 변형된 sgRNA를 하기 표 2에 기재된 바와 같이 다양한 PEG mol-%, 지질 A mol-%, 및 N:P 비율을 갖는 LNP로 제제화했다.

표 2. LNP 조성물.

LNP #	지질 A mol-%	PEG-DMG mol-%	N:P 비율
(다양)	45	2, 2.5, 3, 4, 5	4.5
(다양)	45	2, 2.5, 3, 4, 5	6
(다양)	50	2, 2.5, 3, 4, 5	4.5
(다양)	50	2, 2.5, 3, 4, 5	6
(다양)	55	2, 2.5, 3, 4, 5	4.5
(다양)	55	2, 2.5, 3, 4, 5	6

도 1에서, LNP 제제는 "% CL; N:P"로 표지된 지질 A mol-% 및 N:P 비율에 기초하여 X-축에서 식별된다. 도 1의 범례에 나타난 바와 같이, 2, 2.5, 3, 4, 또는 5 mol-%의 PEG-2k-DMG 농도는 (1) 45 mol-% 지질 A; 4.5 N:P ("45; 4.5"); (2) 45 mol-% 지질 A; 6 N:P ("45; 6"); (3) 50 mol-% 지질 A; 4.5 N:P ("50; 4.5"); (4) 50 mol-% 지질 A; 6 N:P ("50; 6"); (5) 55 mol-% 지질 A; 4.5 N:P ("55; 4.5"); 및 (6) 55 mol-% 지질 A; 6 N:P ("55; 6")로써 제제화되었다. DSPC mol-%를 9 mol-%로 일정하게 유지하고 콜레스테롤 mol-%를 첨가하여 각 제제 지질 성분의 잔부를 100 mol-%로 만들었다. 30 제제 각각을 아래에 기재된 바와 같이 제제화하고, 단일 용량으로 kg당 1 mg 또는 kg당 0.5 mg 용량의 총 RNA(각각 도 1A 및 도 1B)로 투여했다.

LNP 제제 - NanoAssemblr

지질 나노입자 성분을 상기 제시된 지질 성분 몰비로 100% 에탄올에 용해시켰다. RNA 카르고를 25 mM 시트레이트, 100 mM NaCl, pH 5.0에 용해시켜, 대략 0.45 mg/mL의 RNA 카르고 농도가 되었다. LNP는 약 4.5 또는 약 6의 지질 아민 대 RNA 포스페이트 (N:P) 몰비, 중량으로 1:1의 mRNA 대 gRNA의 비율로 제제화되었다.

LNP는 제조사의 프로토콜에 따라 Precision Nanosystems NanoAssemblr^TM Benchtop Instrument를 사용하여 지질 및 RNA 용액의 미세유체 혼합에 의해 형성되었다. 차등 유량을 사용하여 혼합하는 동안 수성 대 유기 용매의 2:1 비율을 유지시켰다. 혼합 후, LNP를 수집하고, 물에 희석하고 (대략 1:1 v/v), 실온에서 1 시간 동안 유지하고, 최종 버퍼 교환 전에 물로 추가로 희석했다 (대략 1:1 v/v). 50 mM Tris, 45 mM NaCl, 5% (w/v) 수크로스, pH 7.5 (TSS)로의 최종 버퍼 교환이 PD-10 탈염 컬럼 (GE)으로 완료되었다. 필요한 경우, 제제를 Amicon 100 kDa 원심분리 필터(Millipore)로 원심분리하여 농축시켰다. 이후 생성된 혼합물을 0.2 μm 멸균 필터를 사용하여 여과했다. 최종 LNP를 추가의 사용까지 -80 ℃에서 보관했다.

제제 분석

동적 광산란("DLS")이 본 발명의 다분산 지수("pdi") 및 LNP의 크기를 특징규명하기 위해 사용된다. DLS는 샘플이 광원에 노출되어 발생하는 빛의 산란을 측정한다. DLS 측정으로부터 결정된 PDI는 집단에서의 입자 크기(대략 평균 입자 크기)의 분포를 나타내며, 완전하게 균일한 집단은 0의 PDI를 갖는다.

전기영동 광산란이 지정된 pH에서 LNP의 표면 전하를 특징분석하기 위해 사용된다. 표면 전하 또는 제타 전위는 LNP 현탁액 중 입자 사이의 정전기적 반발/인력의 크기의 척도이다.

비대칭-유량 필드 흐름 분별 - 다중-각도 광산란(Assymetric-Flow Field Flow Fractionation - Multi-Angle Light Scattering, AF4-MALS)은 수력학적 반경(hydrodynamic radius)에 의해 제제에서 입자를 분리한 다음 분별된 입자의 분자량, 수력학적 반경(hydrodynamic radii) 및 제곱평균제곱근 반경(root mean square radii)을 측정하기 위해 사용된다. 이는 분자량 및 크기 분포 및 이차 특성, 예컨대 Burchard-Stockmeyer 플롯 (입자의 내부 코어 밀도를 암시하는 시간 경과에 따른 제곱평균제곱근("rms") 직경 대 수력학적 반경의 비율) 및 rms 형태 플롯(결과적인 선형 적합의 기울기가 압축 대 신장의 정도를 제공하는 rms 반경의 로그 대 분자량의 로그)을 평가하는 능력을 허용한다.

나노입자 추적 분석(NTA, Malvern Nanosight)이 제제 입자 크기 분포 및 입자 농도를 결정하기 위해 사용될 수 있다. LNP 샘플을 적절하게 희석하여 현미경 슬라이드에 주입한다. 입자가 시야를 통해 천천히 주입될 때 카메라가 산란된 빛을 기록한다. 영상이 캡쳐된 후, 나노입자 추적 분석은 픽셀을 추적하고 확산 계수를 계산하여 영상을 처리한다. 이러한 확산 계수는 입자의 수력학적 반경으로 변환될 수 있다. 기기는 또한 분석에서 계산된 개별 입자의 수를 계수하여 입자 농도를 제공한다.

동결-전자 현미경("cryo-EM")을 사용하여 LNP의 입자 크기, 형태, 및 구조적 특징을 결정할 수 있다.

LNP의 지질 조성물 분석은 액체 크로마토그래피에 이어서 하전 에어로졸 검출(LC-CAD)로부터 결정될 수 있다. 이러한 분석은 실제 지질 함량 대 이론적 지질 함량의 비교를 제공할 수 있다.

LNP 제제는 평균 입자 크기, 다분산 지수(pdi), 총 RNA 함량, RNA의 캡슐화 효율, 및 제타 전위에 대해 분석되었다. LNP 제제는 지질 분석, AF4-MALS, NTA, 및/또는 동결-EM에 의해 추가로 특징규명될 수 있다. 평균 입자 크기 및 다분산도는 Malvern Zetasizer DLS 기기를 사용하여 동적 광산란(DLS)에 의해 측정된다. LNP 샘플을 DLS로 측정하기 전에 PBS에서 30X 희석했다. 평균 입자 크기의 강도-기반 측정인 Z-평균 직경이 수평균 직경 및 pdi와 함께 보고되었다. LNP의 제타 전위를 측정하기 위해 Malvern Zetasizer 기기가 또한 사용된다. 샘플을 측정 전에 0.1X PBS, pH 7.4에서 1:17로 희석한다 (50 μL가 800 μL로).

총 RNA 농도 및 유리 RNA를 결정하기 위해 형광-기반 분석 (Ribogreen® ThermoFisher Scientific)을 사용한다. 캡슐화 효율은 (총 RNA - 유리 RNA)/총 RNA로서 계산된다. LNP 샘플을 0.2% Triton-X 100를 함유하는 1x TE 버퍼로 적절하게 희석하여 총 RNA를 결정하거나 또는 1x TE 버퍼로 유리 RNA를 결정한다. 제제를 제조하기 위해 사용된 출발 RNA 용액을 이용하고 1x TE 버퍼 +/- 0.2% Triton-X 100에서 희석하여 표준 곡선을 제조했다. 이후 (제조사의 지침에 따라) 희석된 RiboGreen® 염료를 표준 및 샘플 각각에 첨가하고 빛이 없는 상태에서 대략 10 분 동안 실온에서 인큐베이션한다. SpectraMax M5 Microplate Reader (Molecular Devices)는 여기, 자동 차단 및 방출 파장이 각각 488 nm, 515 nm, 및 525 nm으로 설정되어 샘플을 판독하도록 사용된다. 총 RNA 및 유리 RNA는 적절한 표준 곡선으로부터 결정된다.

캡슐화 효율은 (총 RNA - 유리 RNA)/총 RNA로서 계산된다. DNA-기반 또는 핵산-함유 카르고 성분의 캡슐화 효율을 결정하기 위해 동일한 절차가 사용될 수 있다. 단일-가닥 DNA에 대해 Oligreen Dye가 사용될 수 있고, 이중-가닥 DNA에 대해 Picogreen Dye가 사용될 수 있다.

AF4-MALS는 분자량 및 크기 분포뿐만 아니라 이러한 계산으로부터의 이차 통계를 보기 위해 사용된다. LNP는 적절하게 희석되고 HPLC 오토샘플러를 사용하여 AF4 분리 채널로 주입되고 여기서 초점을 맞춘 다음 채널을 가로지르는 십자 흐름에서 지수 구배(exponential gradient)로 용리된다. 모든 유체는 HPLC 펌프 및 Wyatt Eclipse 기기에 의해 추진된다. AF4 채널로부터 용리되는 입자는 UV 검출기, 다중-각도 광산란 검출기, 준-탄성 광산란 검출기(quasi-elastic light scattering detector) 및 시차 굴절률 검출기(differential refractive index detector)를 통해 흐른다. 원시 데이터는 Debeye 모델을 사용하여 가공되어 검출기 신호로부터 분자량 및 rms 반경을 결정한다.

LNP 중의 지질 성분은 하전 에어로졸 검출기(CAD)에 연결된 HPLC에 의해 정량적으로 분석된다. 4 지질 성분의 크로마토그래피 분리가 역상 HPLC에 의해 달성된다. CAD는 모든 비-휘발성 화합물을 탐지하는 파괴적인 질량-기반 검출기이며 신호는 분석물 구조에 관계없이 일관된다.

Cas9 mRNA 및 gRNA 카르고

Cas9 mRNA 카르고를 시험관내 전사에 의해 제조했다. 1X NLS를 포함하는 캡핑되고 폴리아데닐화된 Cas9 mRNA(서열 식별 번호:48)를 선형화 플라스미드 DNA 주형 및 T7 RNA 폴리머레이스를 사용하여 시험관내 전사에 의해 생성했다. T7 프로모터 및 100 nt 폴리(A/T) 영역을 포함하는 플라스미드 DNA를 다음 조건: 200 ng/μL 플라스미드, 2 U/μL XbaI(NEB), 및 1x 반응 버퍼에서 37 ℃에서 2 시간 동안 XbaI와 함께 인큐베이션하여 선형화했다. 반응물을 65 ℃에서 20 분 동안 가열하여 XbaI를 불활성화시켰다. 선형화 플라스미드를 실리카 맥시 스핀 컬럼(Epoch Life Sciences)을 사용하여 효소 및 버퍼 염으로부터 정제하고 아가로스 겔로 분석하여 선형화를 확인했다. Cas9 변형된 mRNA를 생성하기 위한 IVT 반응을 다음 조건에서 37 ℃에서 4 시간 동안 인큐베이션했다: 50 ng/μL 선형화 플라스미드; 각각 2 mM의 GTP, ATP, CTP, 및 N1-메틸 슈도-UTP (Trilink); 10 mM ARCA (Trilink); 5 U/μL T7 RNA 폴리머레이스 (NEB); 1 U/μL 뮤린 알엔에이스(RNase) 억제제 (NEB); 0.004 U/μL 무기 대장균 피로포스파테이스 (NEB); 및 1x 반응 버퍼. 4 시간 인큐베이션 후, TURBO 디엔에이스(DNase)(ThermoFisher)를 0.01 U/μL의 최종 농도로 첨가하고, 반응물을 추가 30 분 동안 인큐베이션하여 DNA 주형을 제거했다. Cas9 mRNA를 제조사의 프로토콜(ThermoFisher)에 따라 MegaClear Transcription Clean-up 키트를 사용하여 효소 및 뉴클레오타이드로부터 정제했다. 대안적으로, Cas9 mRNA를 LiCl 침전 방법으로 정제했다.

이 실시예에서 sgRNA는 화학적으로 합성되어 상업적 공급업체로부터 공급받았다. sg282 서열은 하기 제공되고, 하기 제시된 바와 같이 2'-O-메틸 변형 및 포스포로티오에이트 연결을 갖는다 (m = 2'-OMe; * = 포스포로티오에이트):

mU*mU*mA*CAGCCACGUCUACAGCAGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU. (서열 식별 번호:42).

LNP

최종 LNP는 상기 제공된 분석 방법에 따라 캡슐화 효율, 다분산 지수, 및 평균 입자 크기를 결정하도록 특징규명되었다.

LNP를 마우스에게 투여하고 (1 mg/kg 또는 0.5 mg/kg의 단일 용량) 아래에 기재된 바와 같이 NGS 분석을 위해 게놈DNA를 단리했다.

생체내 LNP 전달

6 내지 10 범위 주령의 CD-1 암컷 마우스를 각 연구에서 사용했다. 그룹 평균 중량을 기준으로 투여 용액을 제조하기 위해 동물을 칭량하고 체중에 따라 그룹화했다. LNP를 측면 꼬리 정맥을 통해 동물당 0.2 mL의 부피(체중 킬로그램당 대략 10 mL)로 투여했다. 동물은 부작용에 대해 투약 후 대략 6 시간에 관찰되었다. 투여 후 24 시간에 체중을 측정하고, 이소플루란 마취에서 심장 천자를 통한 실혈에 의해 다양한 시점에 동물을 안락사시켰다. 혈액을 혈청 분리기 튜브 또는 본원에 기재된 바와 같이 혈장용 완충된 소듐 시트레이트를 포함하는 튜브에 수집했다. 생체내 편집을 포함하는 연구를 위해, DNA 추출 및 분석을 위해 각 동물의 중엽 또는 세 개의 독립적인 엽(예를 들어, 우측 중엽, 좌측 중엽, 및 좌측 측엽)으로부터 간 조직을 수집했다.

마우스의 코호트를 차세대 시퀀싱(NGS) 및 혈청 TTR 수준에 의해 간 편집에 대해 측정했다 (데이터는 나타나지 않음).

트랜스티레틴 (TTR) ELISA 분석

지시된 바와 같이 혈액을 수집하고 혈청을 단리했다. 마우스 프리알부민 (Transthyretin) ELISA 키트 (Aviva Systems Biology, Cat. OKIA00111)를 사용하여 총 마우스 TTR 혈청 수준을 결정했다. 제조사의 프로토콜에 따라 래트 특이적 ELISA 키트(Aviva Systems Biology 카탈로그 번호 OKIA00159)를 사용하여 래트 TTR 혈청 수준을 측정했다. 간단히, 혈청을 10,000-배의 최종 희석까지 키트 샘플 희석제로 연속 희석했다. 이후 이러한 희석된 샘플을 ELISA 플레이트에 첨가한 다음 지시에 따라 분석을 수행했다.

NGS 시퀀싱

간단히 말해서, 게놈 안의 표적 위체에서 편집 효율을 정량적으로 결정하기 위해, 게놈 DNA를 단리하고 유전자 편집에 의해 도입된 삽입 및 결실의 존재를 확인하기 위해 딥 시퀀싱을 이용했다.

PCR 프라이머를 표적 자리(예를 들어, TTR) 주위에 설계하고, 관심 게놈 영역을 증폭시켰다. 프라이머 서열은 하기에 제공된다. 추가적인 PCR을 제조사의 프로토콜(Illumina)에 따라 수행하여 시퀀싱에 필요한 화학물질(chemistry)을 추가했다. 앰플리콘은 Illumina MiSeq 기기에서 시퀀싱되었다. 낮은 품질 점수를 갖는 것을 제거한 후 리드(read)를 인간 참조 게놈 (예를 들어, hg38)에 대해 정렬시켰다. 리드를 포함하는 결과 파일을 참조 게놈(BAM 파일)에 매핑하고, 여기서 관심 표적 영역과 중첩되는 리드가 선택되고 야생형 리드의 수 대 삽입, 치환, 또는 결실을 포함하는 리드의 수르 계산했다.

편집 백분율(예를 들어, "편집 효율" 또는 "편집 퍼센트")은 야생형을 포함하여 서열 리드의 총 수에 대한 삽입 또는 결실을 갖는 서열 리드의 총 수로 정의된다.

도 1은 NGS에 의해 측정된 마우스 간에서의 편집 백분율을 나타낸다. 도 1A에 나타난 바와 같이, kg당 1 mg RNA이 투여될 때, 생체내 편집 백분율은 약 20% 내지 60% 이상의 간 편집 범위이다. kg당 0.5 mg 용량, 도 1B에서, 약 10% 내지 60% 간 편집이 관찰되었다. 이러한 마우스 생체내 테스트에서, 모든 조성물은 각 LNP 조성물에 대해 NGS에 의해 측정된 표적 자리에서 활성 CRISPR/Cas 뉴클레이스 활성의 증거와 함께, 간 세포에 효과적으로 Cas9 mRNA 및 gRNA를 전달했다. 5% PEG 지질을 포함하는 LNP는 더 낮은 캡슐화 (데이터는 나타나지 않음), 및 다소 감소된 효능을 갖는다.

실시예 2 - LNP 조성물 분석

LNP의 분석적 특징규명은 증가하는 양의 지질 A 및 PEG-지질로 제제화된 LNP에서 개선된 물리화학적 파라미터를 나타낸다. 2 mol-% 또는 3 mol-% PEG 지질(PEG2k-DMG)을 포함하는 조성물이 하기 표 3에 제공된다.

	LNP898	LNP897	LNP966	LNP969
CL/콜레스테롤/DSPC/PEG(이론적 mol-%)	45/44/9/2	45/43/9/3	50/38/9/3	55/33/9/3
mRNA	Cas9 서열 식별 번호:48	Cas9 서열 식별 번호:48	Cas9 U-dep 서열 식별 번호:43	Cas9 U-dep 서열 식별 번호:43
gRNA	G502서열 식별 번호:70	G502 서열 식별 번호:70	G534 서열 식별 번호:72	G534 서열 식별 번호:72
N/P	4.5	4.5	6.0	6.0

LNP 제제 - 십자 흐름(Cross Flow)

에탄올 중의 지질을 2 부피의 RNA 용액 및 1 부피의 물과 충돌 제트 혼합(impinging jet mixing)하여 LNP를 형성했다. 에탄올 중의 지질은 2 부피의 RNA 용액과의 혼합 십자가(mixing cross)를 통해 혼합된다. 물의 제4 스트림이 인라인 티(inline tee)를 통해 십자의 출구 흐름과 혼합된다. (WO2016010840 도 2 참조.) LNP를 1 시간 동안 실온에서 유지한 다음, 물로 추가로 희석시켰다 (대략 1:1 v/v). 희석된 LNP를 평판 시트 카트리지 (Sartorius, 100kD MWCO)에서 접선 유동 여과(tangential flow filtration)를 사용하여 농축한 다음 50 mM Tris, 45 mM NaCl, 5% (w/v) 수크로스, pH 7.5 (TSS)로의 정용여과(diafiltration)에 의해 버퍼 교환했다. 대안으로, TSS로의 최종 버퍼 교환을 PD-10 탈염 컬럼(GE)으로 완료했다. 필요한 경우, 제제를 Amicon 100 kDa 원심분리 필터(Millipore)로 원심분리하여 농축시켰다. 이후 생성된 혼합물을 0.2 μm 멸균 필터를 사용하여 여과했다. 최종 LNP를 추가의 사용까지 4℃ 또는 -80℃에서 보관했다.

캡핑되고 폴리-아데닐화된 Cas9 U-고갈(Cas9 Udep) mRNA가 서열 식별 번호:43을 포함함을 제외하고, Cas9 mRNA 및 sgRNA를 실시예 1에서와 같이 제조했다. Sg282는 실시예 1에 기재되고, sg534("G534")에 대한 서열이 아래에 제공된다:

mA*mC*mG*CAAAUAUCAGUCCAGCGGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU (서열 식별 번호:72)

LNP 제제는 실시예 1에 기재된 바와 같이 평균 입자 크기, 다분산도(pdi), 총 RNA 함량 및 RNA의 캡슐화 효율에 대해 분석되엇다.

평균 입자 크기, 다분산도(PDI), 총 RNA 함량 및 RNA의 캡슐화 효율의 분석이 표 4에 나타난다. LNP 조성물의 이론적 지질 농도에 추가하여, 지질 분석은 하기 표 5에 나타난 바와 같이 실제 mol-% 지질 수준을 입증했다.

LNP ID #	N/P	Z-평균 (nm)	PDI	수 평균 (nm)	RNA 농도 (mg/mL)	캡슐화 (%)
LNP898	4.5	87.91	0.030	71.33	1.53	98
LNP897	4.5	74.05	0.036	58.55	1.43	98
LNP966	6.0	82.78	0.010	67.86	2.12	98
LNP969	6.0	92.97	0.042	75.52	2.09	97

LNP ID #	지질 비율 (지질 A/콜레스테롤/ DSPC/PEG) (이론 및 실제)	지질 A mg/mL (이론 및 실제)	콜레스테롤 mg/mL (이론 및 실제)	DSPC mg/mL (이론 및 실제)	PEG mg/mL (이론 및 실제)
LNP898	45/44/9/2 46.1/42.6/9.2/2	18.0 18.3	8.0 7.7	3.3 3.4	2.3 2.4
LNP897	45/43/9/3 44.8/42.9/9.2/3.1	18.0 17.8	7.8 7.7	3.3 3.4	3.5 3.6
LNP966	50/38/9/350.0/38.0/8.8/3.1	33.4 35.6	11.5 12.3	5.6 5.8	5.8 6.5
LNP969	55/33/9/354.8/33.2/8.8/3.2	33.4 31.6	9.1 8.7	5.1 4.7	5.3 5.4

물리화학적 특성을 추가로 분석하기 위해, LNP897, LNP898, LNP966, 및 LNP969가 비대칭-유량 필드 흐름 분별 - 다중-각도 광산란(AF4-MALS) 분석을 거쳤다. AF4-MALS 기기는 입자 크기 및 분자량 분포를 측정하고, 입자 형태 및 밀도에 대한 정보를 제공한다.

LNP는 HPLC 오토샘플러를 사용하여 AF4 분리 채널로 주입되고 여기서 초점을 맞춘 다음 채널을 가로지르는 십자 흐름에서 지수 구배(exponential gradient)로 용리된다. 모든 유체는 HPLC 펌프 및 Wyatt Eclipse 기기에 의해 추진된다. AF4 채널로부터 용리되는 입자는 UV 검출기, Wyatt Heleos II 다중-각도 광산란 검출기, 준-탄성 광산란 검출기 및 Wyatt Optilab T-rEX 시차 굴절률 검출기를 통해 흐른다. 원시 데이터는 Debeye 모델을 사용하여 Wyatt Astra 7 소프트웨어에서 가공되어 검출기 신호로부터 분자량 및 rms 반경을 결정한다.

LNP에 대한 로그 미분 몰질량 플롯은 도 2A와 같이 제공된다. 간단히 말해서, X-축은 몰질량(g/mol)을 나타내고, Y-축은 미분 수 분율을 나타낸다. 로그 미분 몰질량 플롯은 특정 제제에 대해 측정된 상이한 분자량의 분포를 나타낸다. 이는 제제 내 분자량의 전체 분포뿐만 아니라 분자량의 모드에 대한 데이터를 제공하며, 이는 평균 분자량보다 더 우수한 입자 이질성의 그림을 제공한다.

상이한 LNP 제제의 이질성은 상이한 몰질량 모멘트를 측정하고 무게평균 몰질량(Mw) 대 수평균 몰질량(Mn)의 비율을 계산하여 Mw/Mn의 다분산도를 제공하여 결정된다. 이들 상이한 제제에 대한 다분산도의 그래프가 도 2B에 제공된다.

데이터는 도 2A에 나타나는 바와 같이 N/P 6.0에서 3 mol-% PEG, 및 50 및 55 mol-% 지질 A를 갖는 더 조밀한 입자 분포를 나타낸다. 이는 도 2B에 나타나는 바와 같이 조밀한 다분산도에 반영된다

실시예 3 - AF4 MALS 데이터 - 추가적 제제

LNP의 분석적 특징규명은 증가하는 양의 지질 A로 제제화된 LNP에서 개선된 물리화학적 파라미터를 나타낸다. 45 mol-%, 50 mol-%, 또는 55 mol-% 지질 A를 두 가지 상이한 gRNA와 함께 포함하는 조성물이 하기 표 6에 제공된다.

	LNP1021	LNP1022	LNP1023	LNP1024	LNP1025
CL/콜레스테롤/DSPC/PEG(이론적 mol-%)	50/38/9/3	55/33/9/3	45/43/9/3	50/38/9/3	55/33/9/3
mRNA	Cas9 Udep 서열 식별 번호:43	Cas9 Udep 서열 식별 번호:43	Cas9 Udep 서열 식별 번호:43	Cas9 Udep 서열 식별 번호:43	Cas9 Udep 서열 식별 번호:43
gRNA	G502 서열 식별 번호:70	G502 서열 식별 번호:70	G502 서열 식별 번호:70	G509 서열 식별 번호:71	G509 서열 식별 번호:71
N/P	6.0	6.0	4.5	6.0	6.0

LNP는 실시예 2에 기재된 바와 같이 형성되었다.

Cas9 mRNA 및 sgRNA를 위에 기재된 바와 같이 제조했다.

LNP 조성물은 실시예 1에 기재된 바와 같이 캡슐화 효율, 다분산 지수, 및 평균 입자 크기를 결정하기 위해 특징규명되었다.

평균 입자 크기, 다분산도(PDI), 총 RNA 함량 및 RNA의 캡슐화 효율의 분석이 표 7에 나타난다. LNP 조성물의 이론적 지질 농도에 추가하여, 지질 분석은 하기 표 8에 나타난 바와 같이 실제 mol-% 지질 수준을 입증했다.

LNP ID #	N/P	Z-평균 (nm)	PDI	수 평균 (nm)	RNA 농도 (mg/mL)	캡슐화 (%)
LNP1021	6.0	83.18	0.027	67.15	1.63	98
LNP1022	6.0	94.08	0.005	78.28	1.60	97
LNP1023	4.5	74.01	0.017	61.11	1.61	97
LNP1024	6.0	85.37	0.002	70.42	1.59	97
LNP1025	6.0	94.47	0.018	77.71	1.60	98

LNP ID #	지질 비율 (지질 A/콜레스테롤/ DSPC/PEG) (이론 및 실제)	지질 A mg/mL (이론 및 실제)	콜레스테롤 mg/mL (이론 및 실제)	DSPC mg/mL (이론 및 실제)	PEG mg/mL (이론 및 실제)
LNP1021	50/38/9/3 50.9/37.4/8.6/3.1	23.6 21.6	8.1 7.2	3.9 3.4	4.1 3.8
LNP1022	55/33/9/3 55.2/33.0/8.7/3.1	23.6 20.4	6.4 5.5	3.6 3.0	3.7 3.4
LNP1023	45/43/9/345.9/42.4/8.6/3.1	17.7 15.3	7.7 6.4	3.3 2.7	3.4 3.0
LNP1024	50/38/9/350.5/37.9/8.5/3.0	23.6 22.4	8.1 7.6	3.9 3.5	4.1 3.9
LNP1024	55/33/9/3 55.5/33.1/8.5/3.0	23.6 21.3	6.4 5.8	3.6 3.0	3.7 3.4

물리화학적 특성을 추가로 분석하기 위해, LNP1021, LNP1022, LNP1023, LNP1024 및 LNP1025가 비대칭-유량 필드 흐름 분별 - 다중-각도 광산란(AF4-MALS) 분석을 거쳤다. AF4-MALS 기기는 입자 크기 및 분자량 분포를 측정하고, 입자 형태 및 밀도에 대한 정보를 제공한다.

LNP는 실시예 1에 기재된 바와 같이 AF4-MALS에서 실행되었다.

LNP에 대한 로그 미분 몰질량 플롯은 도 3A와 같이 제공된다. 간단히 말해서, X-축은 몰질량(g/mol)을 나타내고, Y-축은 미분 수 분율을 나타낸다. 로그 미분 몰질량 플롯은 특정 제제에 대해 계산된 상이한 분자량의 분포를 나타낸다. 이는 제제 내 분자량의 전체 분포뿐만 아니라 분자량의 모드에 대한 데이터를 제공하며, 이는 평균 분자량보다 더 우수한 입자 이질성의 그림을 제공한다.

평균 분자량은 도 3B에 플로팅된다. 평균 분자량은 전체 분포의 평균이지만 분포의 형상에 대한 정보는 제공하지 않는다. LNP1022 및 LNP1025는 동일한 평균 분자량을 갖지만 LNP1022가 약간 더 넓은 분포를 갖는다.

상이한 LNP 제제의 이질성은 상이한 몰질량 모멘트를 보고 무게평균 몰질량(Mw) 대 수평균 몰질량(Mn)의 비율을 계산하여 Mw/Mn의 다분산도를 제공하여 계산된다. 이들 상이한 제제에 대한 다분산도의 그래프가 도 4A에 제공된다.

또한, LNP 제제의 Burchard-Stockmeyer 플롯이 도 4B에 제공된다. Burchard-Stockmeyer 플롯은 AF4 채널로부터의 제제의 용출에 대한 rms 반경 대 수력학적 반경의 비율을 나타낸다. 이는 지질 나노입자의 내부 밀도에 관한 정보를 제공한다. 도 4B는 LNP1021, LNP1022 및 LNP1023이 이러한 측정에서 상이한 프로파일을 가짐을 나타낸다.

실시예 4 - 증가된 PEG 지질은 감소된 사이토카인 반응으로 효능을 유지함

다른 연구에서, PEG DMG 지질을 2 mol-% 또는 3 mol-%의 PEG 지질을 포함하는 LNP 제제에서 비교했다. 2 mol-%, 또는 3 mol-%, PEG DMG를 포함하는 조성물이 하기 표 9에 제공된다.

	LNP809	LNP810
CL/콜레스테롤/DSPC/PEG(이론적 mol-%)	45/44/9/2	45/43/9/3
mRNA	Cas9서열 식별 번호:48	Cas9 서열 식별 번호:48
gRNA	G390서열 식별 번호:69	G390 서열 식별 번호:69
N/P	4.5	4.5

LNP는 실시예 2에 기재된 공정에 의해 형성되었다.

Cas9 mRNA 및 sgRNA는 하기 제공된 sg390 ("G390")의 서열과 함께 실시예 1에서와 같이 제조되었다:

mG*mC*mC*GAGUCUGGAGAGCUGCAGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU (서열 식별 번호:69).

LNP 제제는 실시예 1에 기재된 바와 같이 평균 입자 크기, 다분산도(pdi), 총 RNA 함량 및 RNA의 캡슐화 효율에 대해 분석되었다.

평균 입자 크기, 다분산도(PDI), 총 RNA 함량 및 RNA의 캡슐화 효율의 분석이 표 10에 나타난다. LNP 조성물의 이론적 지질 농도에 추가하여, 지질 분석은 하기 표 11:에 나타난 바와 같이 실제 mol-% 지질 수준을 입증했다.

LNP ID #	N/P	Z-평균 (nm)	PDI	수 평균 (nm)	RNA 농도 (mg/mL)	캡슐화 (%)
LNP809	4.5	89.85	0.060	72.10	2.45	97
LNP810	4.5	75.26	0.025	61.17	2.14	97

LNP ID #	지질 비율 (지질 A/콜레스테롤/ DSPC/PEG) (이론 및 실제)	지질 A mg/mL (이론 및 실제)	콜레스테롤 mg/mL (이론 및 실제)	DSPC mg/mL (이론 및 실제)	PEG mg/mL (이론 및 실제)
LNP809	45/44/9/2 45.7/43.3/9.0/2.1	28.6 30.5	12.7 13.1	5.3 5.6	3.7 4.0
LNP810	45/43/9/3 45.0/42.3/9.7/3.0	25.2 24.7	10.9 10.5	4.7 4.9	4.9 4.7

래트 혈청 사이토카인을 MCP-1, IL-6, TNF-알파 및 IFN-감마를 분석하는 Luminex 자기 비드 다중 분석(Millipore Sigma, 카탈로그 번호 RECYTMAG-65K의 Milliplex MAP 자기 비드 분석)을 사용하여 평가했다. 분석 비드를 BioRad BioPlex-200에서 판독하고 BioPlex Manager Software 버전 6.1과 함께 4 파라미터 로지스틱 적합을 사용하여 표준 곡선으로부터 사이토카인 농도를 계산했다. 데이터는 도 5에 그래프로 표시된다. 도 5A(혈청 TTR), 도 5B(간 편집), 및 도 5C(사이토카인 p MCP1)를 참조하라.

제조사의 프로토콜에 따라 래트 특이적 ELISA 키트 (Aviva Systems Biology 카탈로그 번호 OKIA00159)를 사용하여 래트 TTR 혈청 수준을 측정했다. 간단히, 혈청을 10,000-배의 최종 희석까지 키트 샘플 희석제로 연속 희석했다. 이후 이러한 희석된 샘플을 ELISA 플레이트에 첨가한 다음 지시에 따라 분석을 수행했다.

게놈 DNA를 대략 10 mg의 간 조직으로부터 단리하고 위에 기재된 바와 같이 NGS를 사용하여 분석했다. 증폭을 위한 PCR 프라이머 서열은 아래 기재된다.

도 5A 및 도 5B는 혈청 TTR 녹다운 및 간 편집이 2 mol-% 및 3 mol-% PEG 제제에서 충분함을 나타낸다. 도 5C는 3 mol-% PEG 제제를 사용하여 MCP-1 반응이 감소됨을 나타낸다.

실시예 5 - 비-인간 영장류로의 LNP 전달

실시예 1에 기재된 바와 같이 제조된 LNP 제제로 세 가지 연구를 수행했다. 특정 몰량 및 카르고가 표 12-26에 제공된다. Cas9 mRNA 및 가이드 RNA(gRNA)를 함유하는 각각의 제제는 중량으로 1:1의 mRNA:gRNA 비율을 가졌다. LNP의 용량(mg/kg, 총 RNA 함량), 투여 경로 및 동물이 덱사메타손의 전처리를 받았는지 여부가 표에 나타난다. 덱사메타손(Dex) 전처리를 받은 동물의 경우, Dex가 LNP 또는 비히클 투여 1 시간 전에 IV 일시 주사에 의해 2 mg/kg로 투여되었다.

혈액 화학 분석을 위해, 측정된 각각의 인자에 대해 하기 표에 나타난 바와 같이 때때로 동물로부터 혈액을 채취했다. 사이토카인 유도는 전처리 및 후처리 NHP에서 측정되었다. 억제되고 의식이 있는 동물의 말초 정맥으로부터 최소 0.5 mL의 전혈을 4 mL 혈청 분리기 튜브로 수집했다. 혈액을 최소 30 분 동안 실온에서 응고시키고 이어서 2000 xg에서 15 분 동안 원심분리했다. 혈청을 각각 120 μL의 2 개의 폴리프로필렌 마이크로튜브에 분취하고 분석할 때까지 -60 내지 -86 ℃에서 보관했다. 분석을 위해 Meso Scale Discovery(MSD)의 비인간 영장류 U-Plex 사이토카인 커스텀 키트를 사용했다. IL-6 및 MCP-1에 초점을 맞추어 다음 파라미터가 분석 INF-g, IL-1b, IL-2, IL-4, IL-6, IL-8, IL-10, IL-12p40, MCP-1 및 TNF-a에 포함되었다. 키트 시약 및 표준물질은 제조업체의 프로토콜에 따라 준비되었다. NHP 혈청을 순수(neat)하게 사용했다. 플레이트를 MSD Discovery work bench 소프트웨어 버전 4012로 수행한 분석과 함께 MSD Sector Imager 6000에서 작동시켰다.

효소 면역분석법에 의해 처리 전 및 처리 후 동물에서 보체 수준을 측정했다. 억제되고 의식이 있는 동물의 말초 정맥으로부터 전혈(0.5 mL)을 0.5 mL k₂EDTA를 포함하는 튜브로 수집했다. 혈액을 2000 xg에서 15 분 동안 원심분리했다. 혈장을 각각 120 μL의 2 개의 폴리프로필렌 마이크로튜브에 분취하고 분석할 때까지 -60 내지 -86 ℃에서 보관했다. Quidel MicroVue Complement Plus EIA 키트 (C3a -Cat # A031) 또는 (Bb-Cat # A027)를 분석에 사용했다. 키트 시약 및 표준물질은 제조업체의 프로토콜에 따라 준비되었다. 플레이트를 450 nm에서 광학 밀도로 MSD Sector Imager 6000에서 작동시켰다. 결과는 4-파라미터 곡선 맞춤을 사용하여 분석되었다.

사이토카인 유도 및 보체 활성화에 대한 데이터가 하기 표에 제공된다. "BLQ"는 정량 한계 미만을 의미한다.

표 12. 연구 1.

처리군	몰비 (각각 지질 A, 콜레스테롤, DSPC, 및 PEG2k-DMG	N:P	카르고	샘플 크기 (n)	경로	용량 수준, 총 RNA 함량 (mg/kg)	Dex
(1) TSS (비히클)	n/a	n/a	n/a	3	IV - 주입	n/a	아니오
(2) LNP699 G502	45/44/9/2	4.5	Cas9 mRNA (서열 식별 번호:2); G000502	3	IV - 주입	3	아니오
(3) LNP688 G506	45/44/9/2	4.5	Cas9 mRNA (서열 식별 번호:2); G000506	3	IV - 주입	3	아니오
(4) LNP689 G509	45/44/9/2	4.5	Cas9 mRNA (서열 식별 번호:2); G000509	3	IV - 주입	3	아니오
(5) LNP690 G510	45/44/9/2	4.5	Cas9 mRNA (서열 식별 번호:2); G000510	3	IV - 주입	3	아니오

표 13. 연구 2.

처리군	몰비 (각각 지질 A, 콜레스테롤, DSPC, 및 PEG2k-DMG	N:P	카르고	샘플 크기 (n)	경로	용량 수준, 총 RNA 함량 (mg/kg)	Dex
(1) TSS (비히클)	n/a	n/a		1	IV-일시	n/a	네
(2) TSS (비히클)	n/a	n/a		1	IV-일시	n/a	아니오
(3) LNP898 G502	45/44/9/2	4.5	Cas9 mRNA (서열 식별 번호:2); G000502	1	IV - 주입	3	네
(4) LNP898 G502	45/44/9/2	4.5	Cas9 mRNA (서열 식별 번호:2); G000502	1	IV - 주입	3	아니오
(5) LNP897 G502	45/43/9/3	4.5	Cas9 mRNA (서열 식별 번호:2); G000502	1	IV-일시	3	네
(6) LNP897 G502	45/43/9/3	4.5	Cas9 mRNA (서열 식별 번호:2); G000502	1	IV-일시	3	아니오
(7) LNP897 G502	45/43/9/3	4.5	Cas9 mRNA (서열 식별 번호:2); G000502	1	IV - 주입	3	네
(8) LNP897 G502	45/43/9/3	4.5	Cas9 mRNA (서열 식별 번호:2); G000502	1	IV - 주입	3	아니오
(9)LNP916 GFP	45/43/9/3	4.5	eGFP mRNA (서열 식별 번호:)	1	IV - 주입	6	네
(10) LNP916 GFP	45/43/9/3	4.5	eGFP mRNA (서열 식별 번호:)	1	IV - 주입	6	아니오

표 14. 연구 3.

처리군	몰비 (각각 지질 A, 콜레스테롤, DSPC, 및 PEG2k-DMG	N:P	카르고	샘플 크기 (n)	경로	용량 수준, 총 RNA 함량 (mg/kg)	Dex
(1) TSS	n/a	n/a	n/a	3	IV-일시	n/a	아니오
(2) LNP1021 G502	50/38/9/3	6	Cas9 mRNA (서열 식별 번호:1); G000502	3	IV-일시	1	아니오
(3) LNP1021 G502	50/38/9/4	6	Cas9 mRNA (서열 식별 번호:1); G000502	1	IV-일시	1	네
(4) LNP1022 G502	55/33/9/3	6	Cas9 mRNA (서열 식별 번호:1); G000502	3	IV-일시	1	아니오
(5) LNP1023 G502	45/43/9/3	4.5	Cas9 mRNA (서열 식별 번호:1); G000502	3	IV-일시	3	아니오
(6) LNP1024 G509	50/38/9/3	6	Cas9 mRNA (서열 식별 번호:1); G000509	3	IV-일시	1	아니오
(7) LNP1024 G509	50/38/9/4	6	Cas9 mRNA (서열 식별 번호:1); G000509	1	IV-일시	1	네
(8) LNP1025 G509	55/33/9/3	6	Cas9 mRNA (서열 식별 번호:1); G000509	3	IV-일시	1	아니오
(9) LNP1021 G502	50/38/9/3	6	Cas9 mRNA (서열 식별 번호:1); G000502	1	IV-일시	3	아니오
(10) LNP1022 G502	50/38/9/3	6	Cas9 mRNA (서열 식별 번호:1); G000502	1	IV-일시	3	아니오

표 15. 연구 1의 IL-6 측정.

처리군	사전 출혈	6 시간	24 시간
(1) TSS (비히클)	5.71±2.70	29.1±20.37	7.05±3.49
(2) LNP699 G502	9.73±8.34	1296.41±664.71	5.43±7.68
(3) LNP688 G506	16.83±4.08	1749.47±1727.22	38.57±39.39
(4) LNP689 G509	18.11±11.51	1353.49±766.66	32.42±18.40
(5) LNP690 G510	13.95±1.85	11838±17161.74	90.07±96.02

표 16. 연구 1의 MCP-1 측정.

처리군	사전 출혈	6 시간	24 시간
(1) TSS (비히클)	810.49±178.27	1351.16±397.31	745.25±56.49
(2) LNP699 G502	842.31±350.65	19298.49±11981.14	2092.89±171.21
(3) LNP688 G506	1190.79±383.64	13500.17±12691.60	1414.71±422.43
(4) LNP689 G509	838.63±284.42	14427.7±8715.48	1590±813.23
(5) LNP690 G510	785.32±108.97	52557.24±48034.68	6319.77±983.37

표 17. 연구 1의 보체 C3a측정.

처리군	사전 출혈	6 시간	7 일
(1) TSS (비히클)	23.9±11.95	25.51±14.79	30.67±18.36
(2) LNP699 G502	32.36±11.29	94.33±58.45	38.50±12.69
(3) LNP688 G506	22.30±1.73	127.00±22.34	37.80±6.86
(4) LNP689 G509	35.83±21.94	174.00±44.51	50.83±21.92
(5) LNP690 G510	36.30±8.21	163.00±40.60	42.50±12.44

표 18. 연구 1의 보체 bb 측정.

처리군	04-bb	사전 출혈	6 시간	7 일
(1) TSS (비히클)	대조군	1.53±0.19	3.37±2.13	1.43±0.71
(2) LNP699 G502	G502	1.45±0.39	9.01±5.28	1.57±0.54
(3) LNP688 G506	G506	1.45±0.78	11.78±2.33	1.78±0.84
(4) LNP689 G509	G509	1.95±0.99	15.73±2.23	2.83±0.88
(5) LNP690 G510	G510	2.12±0.44	13.57±1.23	2.21±0.72

표 19. 연구 2의 IL-6 측정.

처리군	사전 출혈	90 분	6 시간	24 시간	7 일
(1) TSS (비히클)	1.77	11.46	4.2	2.76	3.01
(2) TSS (비히클)	5.23	18.11	20.36	13.2	6.36
(3) LNP898 G502	2.02	1305.75	1138.22	383.32	16.02
(4) LNP898 G502	2.34	37.19	91.59	14.11	3.07
(5) LNP897 G502	2.1	55.79	6.89	2.26	2.01
(6) LNP897 G502	6.8	10.1	44.72	5.4	2.01
(7) LNP897 G502	1.97	44.87	32.61	2.97	1.11
(8) LNP897 G502	3.14	37.68	73.41	8.58	2.22
(9) LNP916 GFP	1.6	BLQ	95.32	27.58	BLQ
(10) LNP916 GFP	2.43	BLQ	883.01	66.71	BLQ

표 20. 연구 2의 MCP-1 측정.

처리군	사전 출혈	90 분	6 시간		24 시간		7 일
(1) TSS (비히클)	312.12	197.24	145.36		177.02		403.82
(2) TSS (비히클)	232.44	175.08	187.72		136.64		325.69
(3) LNP898 G502	249.1	2183.5		1814.64		1887.41		372.38
(4) LNP898 G502	349.51	430.49	5635.55		953.05		236.6
(5) LNP897 G502	492.3	989.98	409.08		302.97		506.82
(6) LNP897 G502	283.79	225.1	1141.08		484.59		259.46
(7) LNP897 G502	223.16	349.79	398.57		172.67		287.09
(8) LNP897 G502	584.42	853.51	3880.81		1588.46		692.99
(9) LNP916 GFP	325.84	BLQ	1189.97		2279.82		BLQ
(10) LNP916 GFP	175.47	BLQ	3284.16		2023.53		BLQ

표 21. 연구 2의 보체 C3a측정.

처리군	사전 출혈	90 분	6 시간	24 시간	7 일
(1) TSS (비히클)	0.087	0.096	0.048	0.033	0.038
(2) TSS (비히클)	0.369	0.311	0.146	0.1	0.106
(3) LNP898 G502	0.087	0.953	0.647	0.277	0.065
(4) LNP898 G502	0.099	0.262	0.123	0.049	0.044
(5) LNP897 G502	0.067	0.479	0.209	0.036	0.036
(6) LNP897 G502	0.141	0.433	0.34	0.11	0.074
(7) LNP897 G502	0.1	0.345	0.396	0.096	0.127
(8) LNP897 G502	0.261	0.458	0.409	0.244	0.313
(9) LNP916 GFP	0.149	BLQ	0.714	0.382	BLQ
(10) LNP916 GFP	0.117	BLQ	0.752	0.723	BLQ

표 22. 연구 2의 보체 bb 측정.

표 23. 연구 3의 IL-6 측정.

처리군	사전 출혈	90 분	6 시간	24 시간	7 일
(1) TSS	1.89±0.97	2.56±1.41	0.90±0.71	BLQ	0.08
(2) LNP1021 G502	210±0.35	7.44±5.16	6.94±8.45	1.07±1.11	1.76±0.98
(3) LNP1021 G502	0.79	2.96	4.25	0.67	0.27
(4) LNP1022 G502	1.54±1.32	20.42±31.60	13.94±10.10	0.98±0.41	2.04±0.65
(5) LNP1023 G502	2.92±1.68	6.28±7.18	6.06±2.31	3.62±4.68	2.00±1.21
(6) LNP1024 G509	1.43±0.62	2.64±1.92	7.72±11.96	0.45±0.19	0.88±0.79
(7) LNP1024 G509	1.35±0.74	2.64±2.35	1.71±0.41	0.36±0.58	0.51±0.32
(8) LNP1025 G509	1.64	2.68	25.65	0.58	2.00
(9) LNP1021 G502	0.56	6.15	28.80	0.85	0.61
(10) LNP1022 G502	1.76	8.66	2907.86	11.26	1.72

표 24. 연구 2의 MCP-1 측정.

처리군	사전 출혈	90 분	6 시간	24 시간	7 일
(1) TSS	204.01±46.39	197.62±19.54	310.84±45.87	179.07±20.77	234.61±71.79
(2) LNP1021 G502	303.67±36.37	337.63±195.18	755.20±581.45	339.75±206.20	214.82±40.81
(3) LNP1021 G502	229.30	358.10	3182.00	413.56	178.30
(4) LNP1022 G502	393.63±187.81	467.72±221.61	1852.94±2199.66	497.12±412.30	382.19±67.27
(5) LNP1023 G502	213.72±8.85	196.18±62.81	1722.18±1413.90	197.83±74.01	156.16±18.87
(6) LNP1024 G509	237.76±96.36	210.37±95.17	468.53±250.42	22.32±69.06	141.20±71.90
(7) LNP1024 G509	207.36	183.07	1885.66	235.70	163.11
(8) LNP1025 G509	259.57±112.98	299.21±304.89	1193.10±974.04	258.82±88.53	219.86±219.86
(9) LNP1021 G502	199.29	286.04	2001.23	197.57	196.44
(10) LNP1022 G502	305.81	970.65	7039.06	8379.05	203.47

표 25. 연구 3의 보체 C3a측정.

처리군	사전 출혈	90 분	6 시간	24 시간	7 일
(1) TSS	42.47±10.30	55.40±13.58	29.30±14.46	41.70±23.65	27.43±12.43
(2) LNP1021 G502	34.37±0.50	86.50±3.66	90.07±4.85	56.60±2.25	32.53±0.93
(3) LNP1021 G502	34.30	128.00	93.30	33.40	28.20
(4) LNP1022 G502	41.55±13.51	151.37±109.98	82.00±31.82	45.57±18.58	32.77±6.45
(5) LNP1023 G502	31.67±3.19	74.40±22.08	74.13±48.61	33.83±9.75	27.70±8.05
(6) LNP1024 G509	56.60±25.61	100.37±77.95	74.73±70.15	55.20±48.34	49.97±39.94
(7) LNP1024 G509	33.80	33.90	33.70	26.10	20.90
(8) LNP1025 G509	39.90±13.01	75.73±1.38	46.13±30.56	25.00±3.80	23.90±7.18
(9) LNP1021 G502	34	85.70	133.00	62.00	25.50
(10) LNP1022 G502	29.8	68.10	113.00	71.70	23.30

표 26. 연구 3의 보체 bb 측정.

처리군	사전 출혈	90 분	6 시간	24 시간	7 일
(1) TSS	1.46±0.70	2.18±0.78	1.96±0.64	0.945±0.15	1.34±0.50
(2) LNP1021 G502	1.77±0.60	6.51±3.66	11.00±4.85	3.59±2.25	2.07±0.93
(3) LNP1021 G502	1.24	2.90	11.50	2.97	1.24
(4) LNP1022 G502	1.52±0.34	5.67±2.28	10.2±3.36	3.66±1.68	1.84±0.24
(5) LNP1023 G502	1.65±0.94	4.4±1	7.68±4.67	2.64±1.18	2.08±1.32
(6) LNP1024 G509	1.61±0.13	4.52±1.81	4.50±3.22	1.63±0.84	1.63±0.32
(7) LNP1024 G509	0.96	2.99	2.64	1.13	1.07
(8) LNP1025 G509	1.37±0.17	4.9±4.51	3.79±3.84	1.66±1.43	1.35±0.44
(9) LNP1021 G502	1.41	5.67	11.50	4.64	1.38
(10) LNP1022 G502	1.28	5.22	14.10	5.64	1.87

실시예 6 - PEG 지질 스크린

다른 연구에서, 대안의 PEG 지질을 2 mol-% 또는 3 mol-%의 PEG 지질을 포함하는 LNP 제제에서 비교했다.

세 가지 PEG 지질이 연구에서 사용되었다: 지질 1 (DMG-PEG2k; Nof)은 다음과 같이 나타나고:

Heyes, et al., J. Controlled Release, 107 (2005), pp. 278-279 ("Synthesis of PEG2000-C-DMA" 참조)에 기재된 바와 같이 합성된 지질 2는 다음과 같이 나타나고:

WO2016/010840 (화합물 S027, 단락 [00240] 내지 [00244] 참조) 및 WO2011/076807에 개시된 지질 3은 다음과 같이 나타날 수 있다:

.

지질 A를 각각의 PEG 지질로써 2 mol-% 및 3 mol-%로 제제화했다. 지질 나노입자 성분을 상기 제시된 지질 성분 몰비로 100% 에탄올에 용해시켰다. 요약하면, RNA 카르고를 25 mM 시트레이트, 100 mM NaCl, pH 5.0에서 제조하여, 대략 0.45 mg/mL의 RNA 카르고 농도가 되었다. LNP는 약 4.5의 지질 아민 대 RNA 포스페이트 (N:P) 몰비, 중량으로 1:1의 mRNA 대 gRNA의 비율로 제제화되었다.

LNP #	LNP 784	LNP 785	LNP 786	LNP 787	LNP 788	LNP 789
CL/콜레스테롤/DSPC/PEG (이론적 mol-%)	45/44/9/2	45/43/9/3	45/44/9/2	45/43/9/3	45/44/9/2	45/43/9/3
mRNA	Cas9 서열 식별 번호:48	Cas9 서열 식별 번호:48	Cas9 서열 식별 번호:48	Cas9 서열 식별 번호:48	Cas9 서열 식별 번호:48	Cas9 서열 식별 번호:48
gRNA	G282 서열 식별 번호:42	G282 서열 식별 번호:42	G282 서열 식별 번호:42	G282, 서열 식별 번호:42	G282, 서열 식별 번호:42	G282 서열 식별 번호:42
PEG 유형	지질 1	지질 1	지질 2	지질 2	지질 3	지질 3
N/P	4.5	4.5	4.5	4.5	4.5	4.5

Cas9 mRNA, sg282, 및 LNP를 실시예 1에 기재된 바와 같이 제조했다.지질 1, 지질 2, 또는 지질 3을 포함하는 LNP 조성물을 암컷 CD-1 마우스에게 투여하고 1 mg/kg 및 0.5 mg/kg의 체중으로 실시예 1에 기재된 바와 같이 평가했다 마우스의 코호트를 실시예 1의 방법에 따른 차세대 시퀀싱 (NGS) 및 혈청 TTR 수준에 의해 간 편집에 대해 측정했다.

도 6A 및 도 6B는 PEG 지질 제제 사이의 혈청 TTR 수준을 비교한다. 도 6A는 혈청 TTR을 μg/mL로 나타내고, 도 6B는 녹다운 퍼센트(%TSS)로서 데이터를 나타낸다. 도 6C는 간에서 달성된 편집 퍼센트를 나타낸다. 데이터는 테스트된 PEG 지질 각각을 갖는 LNP 조성물이 2 mol-% 및 3 mol-%에서 효능을 테스트했고, 지질 1이 지질 2 및 지질 3보다 약간 더 일관되게 수행함을 나타낸다.

실시예 7 - 지질 A 유사체

지질 A의 다수의 구조적 유사체를 본원에 기재된 LNP 조성물에서 합성하고 테스트했다.

합성: 지질 A는 4,4-비스(옥틸옥시)부탄산(WO2015/095340의 실시예 13에서 "중간체 13b")을 (9Z,12Z)-3-하이드록시-2-(하이드록시메틸)프로필 옥타데카-9,12-디에노에이트("중간체 13c")와 반응시키고, 그 후 중간체 13b 및 중간체 13c의 생성물을 3-디에틸아미노-1-프로판올과 반응시켜 헤드 그룹을 첨가하여 제조된다. (WO2015/095340의 pp 84-86을 참조하라.)

WO2015/095340의 중간체 13b(4,4 비스(옥틸옥시)부탄산)를 다음과 같이 4,4-비스(옥틸옥시)부탄니트릴을 통해 합성했다:

중간체 13a: 4,4-비스(옥틸옥시)부탄니트릴

4,4-디에톡시부탄니트릴 (9.4 g, 60 mmol) 및 옥탄-1-올 (23.1 g, 178 mmol)의 혼합물에 피리디늄 p-톨루엔설포네이트 (748 mg, 3.0 mmol)를 rt에서 첨가했다. 혼합물을 105℃로 가온하고 반응 용기를 공기 중에 개방하고 환류 응축기가 장착되지 않은 상태에서 18 시간 동안 교반했다. 이후 반응 혼합물을 실온으로 냉각시키고 실리칼 겔에서 정제하여 (헥산 중의 에틸 아세테이트의 0-5% 구배) 10.1 g (31.0 mmol)의 중간체 13a를 투명한 오일로 수득했다. ¹H NMR (400 MHz, CDCl₃) δ 4.55 (t, J = 5.3 Hz, 1H), 3.60 (dt, J = 9.2, 6.6 Hz, 2H), 3.43 (dt, J = 9.2, 6.6 Hz, 2H), 2.42 (t, J = 7.4 Hz, 2H), 1.94 (td, J = 7.4, 5.3 Hz, 2H), 1.63 - 1.50 (m, 4H), 1.38 - 1.19 (m, 20H), 0.93 - 0.82 (m, 6H) ppm.

다음으로, 에탄올 (30 mL) 중의 중간체 13a (8.42 g, 31 mmol)의 용액에 31 mL의 수성 포타슘 하이드록사이드 (2.5 M, 30.9 mL, 77.3 mmol)를 실온에서 첨가했다. 용기에 환류 응축기를 장착하고, 혼합물을 110 ℃까지 가열하고 24 시간 동안 교반했다. 이후 혼합물을 실온으로 냉각시키고, 수성 하이드로클로라이드 산 (1N)으로 pH 5로 산성화하고, 헥산으로 3 회 추출했다. 조합된 유기 추출물을 물 (2 회) 및 염수(brine)로 세척하고, 무수 마그네슘 설페이트로 건조시키고, 진공에서 농축시켜 8.15 g (23.6 mmol)의 중간체 13b를 투명한 오일로 수득했고, 이를 추가의 정제 없이 사용했다. ¹H NMR (400 MHz, CDCl₃) δ 4.50 (t, J = 5.5 Hz, 1H), 3.57 (dt, J = 9.4, 6.7 Hz, 2H), 3.41 (dt, J = 9.3, 6.7 Hz, 2H), 2.40 (t, J = 7.4 Hz, 2H), 1.92 (td, J = 7.4, 5.3 Hz, 2H), 1.56 (m, 4H), 1.37 - 1.21 (m, 20H), 0.92 - 0.83 (m, 6H) ppm (하기 구조).

중간체 13b

상기 기재된 방법을 사용하여, 중간체B3-F3로 지칭되고 아래에 도시된 C(5, 6, 7, 9, 및 10)-아세탈 산 중간체를 적절한 알칸-1-올 시약을 사용하여 제조했다.

중간체 B3 4,4-비스(펜틸옥시)부탄산

¹H NMR (400 MHz, CDCl₃) δ 4.52 (t, J = 5.5 Hz, 1H), 3.58 (dt, J = 9.3, 6.6 Hz, 2H), 3.41 (dt, J = 9.3, 6.7 Hz, 2H), 2.45 (t, J = 7.4 Hz, 2H), 1.94 (m, 2H), 1.57 (m, 4H), 1.32 (m, J = 3.7 Hz, 8H), 0.95 - 0.83 (m, 6H) ppm.

중간체 C3: 4,4-비스(헥실옥시)부탄산

¹H NMR (400 MHz, CDCl₃) δ 4.44 (t, J = 5.6 Hz, 1H), 3.49 (dt, J = 9.3, 6.9 Hz, 2H), 3.39 (dt, J = 9.3, 6.8 Hz, 2H), 2.12 (t, J = 7.6 Hz, 2H), 1.79 (q, J = 7.0 Hz, 2H), 1.54 (m, 4H), 1.29 (m, 12H), 0.94 - 0.82 (m, 6H) ppm.

중간체 D3: 4,4-비스(헵틸옥시)부탄산

¹H NMR (400 MHz, CDCl₃) δ 8.85 (br s, 1H), 4.46 (t, J = 5.6 Hz, 1H), 3.52 (dt, J = 9.4, 6.8 Hz, 2H), 3.39 (dt, J = 9.3, 6.8 Hz, 2H), 2.26 (t, J = 7.6 Hz, 2H), 1.85 (q, J = 7.0 Hz, 2H), 1.53 (m, 4H), 1.29 (m, 16H), 0.94 - 0.80 (m, 6H) ppm.

중간체 E3: 4,4-비스(노닐옥시)부탄산

¹H NMR (400 MHz, CDCl₃) δ 5.32 (br s, 1H), 4.44 (t, J = 5.6 Hz, 1H), 3.49 (dt, J = 9.3, 6.9 Hz, 2H), 3.38 (dt, J = 9.4, 6.9 Hz, 2H), 2.10 (t, J = 7.6 Hz, 2H), 1.78 (q, J = 7.0 Hz, 2H), 1.53 (m, 4H), 1.27 (m, 24H), 0.88 (t, J = 6.6 Hz, 6H) ppm.

중간체 F3: 4,4-비스(데실옥시)부탄산:

¹H NMR (400 MHz, CDCl₃) δ 4.48 (t, J = 5.5 Hz, 1H), 3.55 (m, 2H), 3.42 (m, 2H), 2.29 (dd, J = 10.8, 7.5 Hz, 2H), 1.90 - 1.82 (m, 2H), 1.55 (m, 4H), 1.27 (m, 28H), 0.88 (t, J = 6.7 Hz, 6H) ppm.

지질 A의 아세탈 유사체 (C(8))를 C(5, 6, 7, 9, 또는 10)-아세탈 산 중간체 (B3-F3)를 중간체 13c과 반응시키고, 그 후 그 단계의 생성물을 3-디에틸아미노-1-프로판올과 반응시켜 합성했다. (WO2015/095340의 pp 84-86을 참조하라.) 각 유사체를 합성하고 ¹H NMR (데이터는 나타나지 않음)로 특징규명했다.

C7, C9, 및 C10 유사체를 45 mol-% 지질 A 유사체, 2 mol-% DMG-PEG2k, 9 mol-% DSPC, 및 44 mol-% 콜레스테롤에서, 4.5의 N:P 비율로 제제화했다. 각 유사체를 또한 55 mol-% 지질 A 유사체, 2.5 mol-% DMG-PEG2k, 9 mol-% DSPC, 및 38.5 mol-% 콜레스테롤에서, 6의 N:P 비율로 제제화했다. 지질 나노입자 성분을 상기 제시된 지질 성분 몰비로 100% 에탄올에 용해시켰다. RNA 카르고를 25 mM 시트레이트, 100 mM NaCl, pH 5.0에서 제조하여, 대략 0.45 mg/mL의 RNA 카르고 농도가 되었다.

RNA 카르고는 위에 기재된 바와 같이 제조된 서열 식별 번호:43 및 sg282를 포함하는 Cas9 mRNA를 포함했다. LNP는 실시예 1에 기재된 바와 같이 형성되었다.

C(5) 및 C(6) 지질 A 유사체를 포함하는 LNP 조성물을 포함하는 아세탈 유사체의 확장된 패널을 이전 패널과 함께 테스트했다. 두 가지 새로운 유사체를 위에 기재된 바와 같이 55 mol-% 지질 A 유사체, 2.5 mol-% DMG-PEG2k, 9 mol-% DPSC, 및 33.5 mol-% 콜레스테롤에서, 6의 N/P 비율로 제제화했다. 분석은 모든 LNP의 크기가 120 nm 미만이고, PDI가 0.2 미만이고 캡슐화된 RNA %가 80% 초과임을 나타냈다. 제제에 대한 분석 결과는 하기 표 28에 있다.

LNP ID	지질 A 유사체	유사체 mol-%	PEG%	N/P	RNA 농도 (mg/mL)	%EE	Z-평균 (nm)	PDI	수 평균 (nm)
LNP 1122	C5 유사체 (LP000030-001)	55	2.5	6	0.063	88	118.8	0.103	88.17
LNP 1123	C6 유사체(LP000031-001)	55	2.5	6	0.067	95	107.6	0.038	88.1
LNP 1004	C7 유사체 (LP000020-001)	55	2.5	6	0.068	98	100	0.012	81.55
LNP 1002	LP000001-011	55	2.5	6	0.067	98	95.06	0.01	78.95
LNP 1006	C9 유사체(LP000021-001)	55	2.5	6	0.067	97	95.43	0.022	80.35
LNP 1008	C10 유사체 (LP000022-001)	55	2.5	6	0.069	95	103.9	0.008	86.79

물에 용해된 6-(p-톨루이디노)-6-나프탈렌 설폰산 ("TNS")을 사용하여 pKa에 대해 유사체를 평가했다. 이 분석에서 0.1 M 포스페이트 버퍼를 4.5 내지 10.5 범위의 상이한 pH 값에서 제조했다. 각각의 유사체를 100% 에탄올에서 개별적으로 제조했다. 이후 지질 및 TNS를 개별 pH 버퍼에 첨가하고 플레이트로 옮겨 321-488 nm 파장에서 SpectraMax 플레이트 판독기에서 분석했다. pKa를 생성하기 위해 값을 플로팅했고, logIC₅₀을 pKa로서 사용한다.

실시예 1에 기재된 바에 따라 암컷 CD-1 마우스에게 0.3 mg/kg (도 7A-도 7E), 또는 kg당 0.1 mg (도 7F-도 7G) 투여했다. 요약하면, 그룹당 n=5인 Charles River Laboratories의 CD-1 암컷 마우스에 다양한 용량으로 LNP 조성물을 투여했다. 부검에서 (투여 후 7 일), TTR 분석을 위해 혈청을 수집하고 편집 분석을 위해 간을 수집했다. 혈청 TTR 및 편집 퍼센트 분석을 실시예 1에 기재된 바와 같이 수행했다. 도 7A-도 7E의 혈청 TTR 수준 및 간 편집은 모든 유사체가 체중 킬로그램당 0.3 밀리그램에서 지질 A에 필적하게 수행했음을 나타낸다. 도 7F-도 7G는 지질 A가 가장 높은 효능을 가지지만, 새로 합성된 유사체가 모두 적합한 TTR 녹다운 및 간 편집을 갖는다는 것을 나타낸다.

실시예 8 - 용량 반응 곡선 - 일차 시노 간세포

일차 간 간세포. 일차 시노몰구스 간 간세포(PCH)(Gibco)를 해동하고 보충제(Gibco, Cat. CM7000)를 포함한 간세포 해동 배지에 재현탁시킨 후 80 g에서 4 분 동안 원심분리했다. 상청액을 버리고 펠렛화된 세포를 간세포 플레이팅 배지 더하기 보충제 팩 (Invitrogen, Cat. A1217601 및 CM3000)에 재현탁시켰다. 세포를 계수하고 50,000 세포/웰의 밀도로 Bio-코트 콜라겐 I 코팅된 96-웰 플레이트 (ThermoFisher, Cat. 877272)에 플레이팅했다. LNP 투여 전에 플레이팅된 세포를 조직 배양 인큐베이터 (37℃ 및 5% CO₂ 대기)에서 24 시간 동안 침강 및 부착시켰다. 인큐베이션 후 세포를 단층 형성으로 확인하고 배지를 간세포 배양 배지를 무혈청 보충제 팩(Invitrogen, Cat. A1217601 및 CM4000)로 교체했다.

이 연구를 위한 LNP 제제(LNP1021, LNP1022, LNP1023, LNP1024, LNP1025, 및 LNP897)를 위에 기재된 바와 같이 제조했다.

변형된 sgRNA를 포함하는 다양한 용량의 지질 나노입자 제제를 일차 시노 간세포에서 테스트하여 용량 반응 곡선을 생성했다. 플레이팅 및 24 시간 배양 후, LNP를 6% 시노 혈청을 함유하는 간세포 유지 배지에서 37℃에서 5 분 동안 인큐베이션했다. 인큐베이션 후 LNP를 100 ng mRNA에서 시작하여 8 점 2-배 용량 반응 곡선에서 일차 사이노 간세포에 첨가했다. 실시예 1에 기재된 바와 같이 NGS 분석을 위한 처리 후 72 시간에 세포를 용해시켰다. 다양한 LNP 조성물에 대해 편집 퍼센트를 측정했고 데이터는 도 8A에 그래프로 나타난다. Cas9 mRNA(서열 식별 번호 48) 및 U-고갈된 Cas9 mRNA(SEQ I NO:43)에 의한 편집 %가 도 8B에 제시된다. LNP 조성물은 표 2(LNP 897) 및 표 5(LNP 1021, 1022, 1023, 1024, 및 1025)에 기재되어 있다.

결과는 비교 효능 평가에 대한 정량 분석을 보여주며, mRNA 및 LNP 조성물 두 가지 모두 효능에 영향을 준다는 것을 입증한다.

실시예 9 - RNA 카르고: mRNA 및 gRNA 공제제

이 연구는 gRNA 대 mRNA의 상이한 비율의 마우스에서 생체내 효능을 평가했다. 서열 식별 번호: 4의 ORF, HSD 5' UTR, 인간 알부민 3' UTR, 코작 서열, 및 폴리-A 테일을 갖는 CleanCap™ 캡핑된 Cas9 mRNA를 우리딘 트리포스페이트 대신 N1-메틸슈도우리딘 트리포스페이트를 사용하여 실시예 1에서 지시된 바와 같이 IVT 합성에 의해 제조했다.

50:38:9:3 몰비의 지질 A, 콜레스테롤, DSPC, 및 PEG2k-DMG 및 6의 N:P 비율을 갖는, 실시예 2에 기재된 바와 같은 기재된 mRNA 및 sg282(서열 식별 번호: 42; G282)로부터 제조된 LNP 제제. 제제의 gRNA:Cas9 mRNA 중량비가 표 29에 나타났다.

LNP ID	가이드 : Cas9 mRNA 비율 (w/w)	RNA 농도 (mg/mL)	EE (%)	Z-평균 크기 (nm)	입자 PDI	수 평균 (nm)
1110	8:1	0.92	99	69.52	0.022	56.47
1111	4:1	0.86	97	76.65	0.065	57.36
1112	2:1	0.90	99	76.58	0.036	63.11
1113	1:1	0.97	99	76.60	0.071	58.92
1114	1:2	1.05	99	76.34	0.018	62.82
1115	1:4	0.65	99	82.64	0.018	66.63
1116	1:8	0.75	100	82.01	0.039	65.05

생체내 특징규명을 위해, 상기 LNP는 kg당 0.1 mg 총 RNA(mg 가이드 RNA + mg mRNA)로 마우스에게 투여되었다 (그룹당 n=5). 투여 후 7 내지 9 일에, 동물을 희생시키고, 혈액 및 간을 수집하고, 혈청 TTR 및 간 편집을 실시예 1에 기재된 바와 같이 측정했다. 혈청 TTR 및 간 편집 결과는 도 9A 및 9B에 나타난다. 음성 대조군 마우스에 TSS 비히클을 투여했다.

또한, 상기 LNP를 kg당 0.06 mg 내지 kg당 0.4 mg로 gRNA 용량을 변화시키면서 kg당 0.05 mg mRNA의 일정 mRNA 용량에서 마우스에게 투여했다 (그룹당 n=5). 투여 후 7 내지 9 일에, 동물을 희생시키고, 혈액 및 간을 수집하고, 혈청 TTR 및 간 편집을 측정했다. 혈청 TTR 및 간 편집 결과는 도 9C 및 도 9D에 나타난다. 음성 대조군 마우스에 TSS 비히클을 투여했다.

실시예 10 - 중성 지질

LNP의 생체내 효능을 평가하기 위해, LNP 제제는 실시예 2에 기재된 바와 같이 실시예 2의 mRNA 및 sg534(서열 식별 번호: 72; G534)로써 제조되었다. 지질 나노입자 성분을 하기 제시된 지질 성분 몰비로 100% 에탄올에 용해시켰다. 간단히 말하면, RNA 카르고는 pH 5.0에서 25 mM 시트레이트 및 100 mM NaCl의 버퍼에서 제조되어, 대략 0.45 mg/mL의 RNA 카르고 농도가 되었다. LNP는 약 6의 지질 아민 대 RNA 포스페이트 (N:P) 몰비로 중량으로 1:2 gRNA 대 mRNA의 비율로 제제화되었다.

LNP 제제는 실시예 1에 기재된 바와 같이 평균 입자 크기, 다분산도(pdi), 총 RNA 함량 및 RNA의 캡슐화 효율에 대해 분석되엇다. 평균 입자 크기, 다분산도(PDI), 총 RNA 함량 및 RNA의 캡슐화 효율의 분석이 표 30에 나타난다. 지질의 몰비는 아민 지질 (지질 A)/중성 지질/헬퍼 지질 (콜레스테롤)/PEG 지질 (PEG2k-DMG)로서 제공된다. 중성 지질은 명시된 바와 같이 DSP, DPPC이거나 부재했다.

표 30. LNP 조성물 및 데이터. (지질의 몰비는 아민 지질 (지질 A)/중성 지질/헬퍼 지질 (콜레스테롤)/PEG 지질 (PEG2k-DMG)로 제공됨.)

샘플 ID	중성 지질	몰비	RNA 농도 (mg/mL)	%EE	Z-평균 (nm)	PDI	수 평균 (nm)	간 편집 %	혈청 TTR (μg/mL)	% TTR KD
TSS 대조군								0.0	1248.9
CO241	-	50.0/0.0/47.0/3.0	1.46	94	75.64	0.090	54.21	1.8	1070.2	14.3
CO242	-	59.0/0.0/38.0/3.0	1.51	94	92.25	0.019	75.56	12.0	819.6	34.4
CO243	-	54.5/0.0/42.5/3.0	1.62	94	78.90	0.052	61.49	3.3	1260.5	-0.9
CO244	DSPC	50.0/9.0/39.0/2.0	1.50	93	101.3	0.044	80.73	27.4	741.0	40.7
CO034	DSPC	50.0/9.0/38.0/3.0	1.48	97	84.23	0.040	66.96	34.2	630.1	49.6
CO245	DSPC	52.5/4.0/42.5/3.0	1.55	95	81.88	0.054	64.54	5.8	846.6	32.2
CO246	DPPC	50.0/9.0/38.0/3.0	1.52	96	87.11	0.040	70.04	35.9	528.6	57.7
CO247	DPPC	52.5/4.0/42.5/3.0	1.54	97	83.67	0.050	66.43	18.3	726.6	41.8

생체내 특징규명을 위해, 상기 LNP를 암컷 Sprague Dawley 래트에게 kg 체중당 0.3 mg 총 RNA(가이드 RNA 및 mRNA)로 정맥내 투여했다. 그룹당 다섯 마리의 래트가 있었다. 투여 후 7일에, 동물을 희생시키고, 혈액 및 간을 수집하고, 혈청 TTR 및 간 편집을 실시예 1에 기재된 바와 같이 측정했다. 음성 대조군 동물에 TSS 비히클을 투여했다. 혈청 TTR 및 간 편집 결과는 도 10A 및 10B, 및 (상기) 표 30에 나타난다.

공개된 서열의 간단한 설명

서열 자체에 대해 하기 서열 표를 참조하라. 전사물 서열은 일반적으로 ARCA와 함께 사용하기 위한 최초 세 개의 뉴클레오타이드로서 GGG 또는 CleanCap^TM와 함께 사용하기 위한 최초 세 개의 뉴클레오타이드로서 AGG를 포함한다. 따라서, 최초 세 개의 뉴클레오타이드는 백시니아(Vaccinia) 캡핑 효소와 같은 다른 캡핑 접근법과 함께 사용하기 위해 변형될 수 있다. 프로모터 및 폴리-A 서열은 전사물 서열에 포함되지 않는다. 프로모터, 예컨대 T7 프로모터 (서열 식별 번호: 31) 및 폴리-A 서열, 예컨대 서열 식별 번호: 62 또는 63이 5' 및 3' 말단에서 각각 개시된 전사물 서열에 부가될 수 있다. 대부분의 뉴클레오타이드 서열이 DNA로서 제공되지만 Ts를 Us로 변경하여 RNA로 용이하게 전환될 수 있다.

서열 표

다음 서열 표는 본원에 개시된 서열의 목록을 제공한다. DNA 서열 (Ts 포함)이 RNA와 관련하여 참조되는 경우, Ts가 (맥락에 따라 변형된 또는 비변형일 수 있는) Us로 대체되어야 하고, 그 반대도 마찬가지인 것으로 이해된다.

* = PS 연결; 'm' = 2'-O-Me 뉴클레오타이드

마우스 G000282 NGS 프라이머 서열

정방향 프라이머:

CACTCTTTCCCTACACGACGCTCTTCCGATCTGTTTTGTTCCAGAGTCTATCACCG

역방향 프라이머:

GGAGTTCAGACGTGTGCTCTTCCGATCTACACGAATAAGAGCAAATGGGAAC

래트 G000390 NGS 프라이머 서열

정방향 프라이머:

CACTCTTTCCCTACACGACGCTCTTCCGATCTTGCATTTCATGAGACCGAAAACA

역방향 프라이머:

GGAGTTCAGACGTGTGCTCTTCCGATCTGCTACAGTAGAGCTGTACATAAAACTT

GFP 서열:

TCGCGCGTTTCGGTGATGACGGTGAAAACCTCTGACACATGCAGCTCCCGGAGACGGTCACAGCTTGTCTGTAAGCGGATGCCGGGAGCAGACAAGCCCGTCAGGGCGCGTCAGCGGGTGTTGGCGGGTGTCGGGGCTGGCTTAACTATGCGGCATCAGAGCAGATTGTACTGAGAGTGCACCATATGCGGTGTGAAATACCGCACAGATGCGTAAGGAGAAAATACCGCATCAGGCGCCATTCGCCATTCAGGCTGCGCAACTGTTGGGAAGGGCGATCGGTGCGGGCCTCTTCGCTATTACGCCAGCTGGCGAAAGGGGGATGTGCTGCAAGGCGATTAAGTTGGGTAACGCCAGGGTTTTCCCAGTCACGACGTTGTAAAACGACGGCCAGTGAATTCTAATACGACTCACTATAGGGTCCCGCAGTCGGCGTCCAGCGGCTCTGCTTGTTCGTGTGTGTGTCGTTGCAGGCCTTATTCGGATCCATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAATAGGAATTATGCAGTCTAGCCATCACATTTAAAAGCATCTCAGCCTACCATGAGAATAAGAGAAAGAAAATGAAGATCAATAGCTTATTCATCTCTTTTTCTTTTTCGTTGGTGTAAAGCCAACACCCTGTCTAAAAAACATAAATTTCTTTAATCATTTTGCCTCTTTTCTCTGTGCTTCAATTAATAAAAAATGGAAAGAACCTCGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAATCTAGACTTAAGCTTGATGAGCTCTAGCTTGGCGTAATCATGGTCATAGCTGTTTCCTGTGTGAAATTGTTATCCGCTCACAATTCCACACAACATACGAGCCGGAAGCATAAAGTGTAAAGCCTGGGGTGCCTAATGAGTGAGCTAACTCACATTAATTGCGTTGCGCTCACTGCCCGCTTTCCAGTCGGGAAACCTGTCGTGCCAGCTGCATTAATGAATCGGCCAACGCGCGGGGAGAGGCGGTTTGCGTATTGGGCGCTCTTCCGCTTCCTCGCTCACTGACTCGCTGCGCTCGGTCGTTCGGCTGCGGCGAGCGGTATCAGCTCACTCAAAGGCGGTAATACGGTTATCCACAGAATCAGGGGATAACGCAGGAAAGAACATGTGAGCAAAAGGCCAGCAAAAGGCCAGGAACCGTAAAAAGGCCGCGTTGCTGGCGTTTTTCCATAGGCTCCGCCCCCCTGACGAGCATCACAAAAATCGACGCTCAAGTCAGAGGTGGCGAAACCCGACAGGACTATAAAGATACCAGGCGTTTCCCCCTGGAAGCTCCCTCGTGCGCTCTCCTGTTCCGACCCTGCCGCTTACCGGATACCTGTCCGCCTTTCTCCCTTCGGGAAGCGTGGCGCTTTCTCATAGCTCACGCTGTAGGTATCTCAGTTCGGTGTAGGTCGTTCGCTCCAAGCTGGGCTGTGTGCACGAACCCCCCGTTCAGCCCGACCGCTGCGCCTTATCCGGTAACTATCGTCTTGAGTCCAACCCGGTAAGACACGACTTATCGCCACTGGCAGCAGCCACTGGTAACAGGATTAGCAGAGCGAGGTATGTAGGCGGTGCTACAGAGTTCTTGAAGTGGTGGCCTAACTACGGCTACACTAGAAGAACAGTATTTGGTATCTGCGCTCTGCTGAAGCCAGTTACCTTCGGAAAAAGAGTTGGTAGCTCTTGATCCGGCAAACAAACCACCGCTGGTAGCGGTGGTTTTTTTGTTTGCAAGCAGCAGATTACGCGCAGAAAAAAAGGATCTCAAGAAGATCCTTTGATCTTTTCTACGGGGTCTGACGCTCAGTGGAACGAAAACTCACGTTAAGGGATTTTGGTCATGAGATTATCAAAAAGGATCTTCACCTAGATCCTTTTAAATTAAAAATGAAGTTTTAAATCAATCTAAAGTATATATGAGTAAACTTGGTCTGACAGTTACCAATGCTTAATCAGTGAGGCACCTATCTCAGCGATCTGTCTATTTCGTTCATCCATAGTTGCCTGACTCCCCGTCGTGTAGATAACTACGATACGGGAGGGCTTACCATCTGGCCCCAGTGCTGCAATGATACCGCGAGACCCACGCTCACCGGCTCCAGATTTATCAGCAATAAACCAGCCAGCCGGAAGGGCCGAGCGCAGAAGTGGTCCTGCAACTTTATCCGCCTCCATCCAGTCTATTAATTGTTGCCGGGAAGCTAGAGTAAGTAGTTCGCCAGTTAATAGTTTGCGCAACGTTGTTGCCATTGCTACAGGCATCGTGGTGTCACGCTCGTCGTTTGGTATGGCTTCATTCAGCTCCGGTTCCCAACGATCAAGGCGAGTTACATGATCCCCCATGTTGTGCAAAAAAGCGGTTAGCTCCTTCGGTCCTCCGATCGTTGTCAGAAGTAAGTTGGCCGCAGTGTTATCACTCATGGTTATGGCAGCACTGCATAATTCTCTTACTGTCATGCCATCCGTAAGATGCTTTTCTGTGACTGGTGAGTACTCAACCAAGTCATTCTGAGAATAGTGTATGCGGCGACCGAGTTGCTCTTGCCCGGCGTCAATACGGGATAATACCGCGCCACATAGCAGAACTTTAAAAGTGCTCATCATTGGAAAACGTTCTTCGGGGCGAAAACTCTCAAGGATCTTACCGCTGTTGAGATCCAGTTCGATGTAACCCACTCGTGCACCCAACTGATCTTCAGCATCTTTTACTTTCACCAGCGTTTCTGGGTGAGCAAAAACAGGAAGGCAAAATGCCGCAAAAAAGGGAATAAGGGCGACACGGAAATGTTGAATACTCATACTCTTCCTTTTTCAATATTATTGAAGCATTTATCAGGGTTATTGTCTCATGAGCGGATACATATTTGAATGTATTTAGAAAAATAAACAAATAGGGGTTCCGCGCACATTTCCCCGAAAAGTGCCACCTGACGTCTAAGAAACCATTATTATCATGACATTAACCTATAAAAATAGGCGTATCACGAGGCCCTTTCGTCG

SEQUENCE LISTING <110> INTELLIA THERAPEUTICS, INC. <120> FORMULATIONS <130> 12793.0014-00304 <140> PCT/US2018/053559 <141> 2018-09-28 <150> 62/566,240 <151> 2017-09-29 <160> 84 <170> PatentIn version 3.5 <210> 1 <211> 4140 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 1 atggacaaga agtacagcat cggactggac atcggaacaa acagcgtcgg atgggcagtc 60 atcacagacg aatacaaggt cccgagcaag aagttcaagg tcctgggaaa cacagacaga 120 cacagcatca agaagaacct gatcggagca ctgctgttcg acagcggaga aacagcagaa 180 gcaacaagac tgaagagaac agcaagaaga agatacacaa gaagaaagaa cagaatctgc 240 tacctgcagg aaatcttcag caacgaaatg gcaaaggtcg acgacagctt cttccacaga 300 ctggaagaaa gcttcctggt cgaagaagac aagaagcacg aaagacaccc gatcttcgga 360 aacatcgtcg acgaagtcgc ataccacgaa aagtacccga caatctacca cctgagaaag 420 aagctggtcg acagcacaga caaggcagac ctgagactga tctacctggc actggcacac 480 atgatcaagt tcagaggaca cttcctgatc gaaggagacc tgaacccgga caacagcgac 540 gtcgacaagc tgttcatcca gctggtccag acatacaacc agctgttcga agaaaacccg 600 atcaacgcaa gcggagtcga cgcaaaggca atcctgagcg caagactgag caagagcaga 660 agactggaaa acctgatcgc acagctgccg ggagaaaaga agaacggact gttcggaaac 720 ctgatcgcac tgagcctggg actgacaccg aacttcaaga gcaacttcga cctggcagaa 780 gacgcaaagc tgcagctgag caaggacaca tacgacgacg acctggacaa cctgctggca 840 cagatcggag accagtacgc agacctgttc ctggcagcaa agaacctgag cgacgcaatc 900 ctgctgagcg acatcctgag agtcaacaca gaaatcacaa aggcaccgct gagcgcaagc 960 atgatcaaga gatacgacga acaccaccag gacctgacac tgctgaaggc actggtcaga 1020 cagcagctgc cggaaaagta caaggaaatc ttcttcgacc agagcaagaa cggatacgca 1080 ggatacatcg acggaggagc aagccaggaa gaattctaca agttcatcaa gccgatcctg 1140 gaaaagatgg acggaacaga agaactgctg gtcaagctga acagagaaga cctgctgaga 1200 aagcagagaa cattcgacaa cggaagcatc ccgcaccaga tccacctggg agaactgcac 1260 gcaatcctga gaagacagga agacttctac ccgttcctga aggacaacag agaaaagatc 1320 gaaaagatcc tgacattcag aatcccgtac tacgtcggac cgctggcaag aggaaacagc 1380 agattcgcat ggatgacaag aaagagcgaa gaaacaatca caccgtggaa cttcgaagaa 1440 gtcgtcgaca agggagcaag cgcacagagc ttcatcgaaa gaatgacaaa cttcgacaag 1500 aacctgccga acgaaaaggt cctgccgaag cacagcctgc tgtacgaata cttcacagtc 1560 tacaacgaac tgacaaaggt caagtacgtc acagaaggaa tgagaaagcc ggcattcctg 1620 agcggagaac agaagaaggc aatcgtcgac ctgctgttca agacaaacag aaaggtcaca 1680 gtcaagcagc tgaaggaaga ctacttcaag aagatcgaat gcttcgacag cgtcgaaatc 1740 agcggagtcg aagacagatt caacgcaagc ctgggaacat accacgacct gctgaagatc 1800 atcaaggaca aggacttcct ggacaacgaa gaaaacgaag acatcctgga agacatcgtc 1860 ctgacactga cactgttcga agacagagaa atgatcgaag aaagactgaa gacatacgca 1920 cacctgttcg acgacaaggt catgaagcag ctgaagagaa gaagatacac aggatgggga 1980 agactgagca gaaagctgat caacggaatc agagacaagc agagcggaaa gacaatcctg 2040 gacttcctga agagcgacgg attcgcaaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacat tcaaggaaga catccagaag gcacaggtca gcggacaggg agacagcctg 2160 cacgaacaca tcgcaaacct ggcaggaagc ccggcaatca agaagggaat cctgcagaca 2220 gtcaaggtcg tcgacgaact ggtcaaggtc atgggaagac acaagccgga aaacatcgtc 2280 atcgaaatgg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 atgaagagaa tcgaagaagg aatcaaggaa ctgggaagcc agatcctgaa ggaacacccg 2400 gtcgaaaaca cacagctgca gaacgaaaag ctgtacctgt actacctgca gaacggaaga 2460 gacatgtacg tcgaccagga actggacatc aacagactga gcgactacga cgtcgaccac 2520 atcgtcccgc agagcttcct gaaggacgac agcatcgaca acaaggtcct gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacgtc ccgagcgaag aagtcgtcaa gaagatgaag 2640 aactactgga gacagctgct gaacgcaaag ctgatcacac agagaaagtt cgacaacctg 2700 acaaaggcag agagaggagg actgagcgaa ctggacaagg caggattcat caagagacag 2760 ctggtcgaaa caagacagat cacaaagcac gtcgcacaga tcctggacag cagaatgaac 2820 acaaagtacg acgaaaacga caagctgatc agagaagtca aggtcatcac actgaagagc 2880 aagctggtca gcgacttcag aaaggacttc cagttctaca aggtcagaga aatcaacaac 2940 taccaccacg cacacgacgc atacctgaac gcagtcgtcg gaacagcact gatcaagaag 3000 tacccgaagc tggaaagcga attcgtctac ggagactaca aggtctacga cgtcagaaag 3060 atgatcgcaa agagcgaaca ggaaatcgga aaggcaacag caaagtactt cttctacagc 3120 aacatcatga acttcttcaa gacagaaatc acactggcaa acggagaaat cagaaagaga 3180 ccgctgatcg aaacaaacgg agaaacagga gaaatcgtct gggacaaggg aagagacttc 3240 gcaacagtca gaaaggtcct gagcatgccg caggtcaaca tcgtcaagaa gacagaagtc 3300 cagacaggag gattcagcaa ggaaagcatc ctgccgaaga gaaacagcga caagctgatc 3360 gcaagaaaga aggactggga cccgaagaag tacggaggat tcgacagccc gacagtcgca 3420 tacagcgtcc tggtcgtcgc aaaggtcgaa aagggaaaga gcaagaagct gaagagcgtc 3480 aaggaactgc tgggaatcac aatcatggaa agaagcagct tcgaaaagaa cccgatcgac 3540 ttcctggaag caaagggata caaggaagtc aagaaggacc tgatcatcaa gctgccgaag 3600 tacagcctgt tcgaactgga aaacggaaga aagagaatgc tggcaagcgc aggagaactg 3660 cagaagggaa acgaactggc actgccgagc aagtacgtca acttcctgta cctggcaagc 3720 cactacgaaa agctgaaggg aagcccggaa gacaacgaac agaagcagct gttcgtcgaa 3780 cagcacaagc actacctgga cgaaatcatc gaacagatca gcgaattcag caagagagtc 3840 atcctggcag acgcaaacct ggacaaggtc ctgagcgcat acaacaagca cagagacaag 3900 ccgatcagag aacaggcaga aaacatcatc cacctgttca cactgacaaa cctgggagca 3960 ccggcagcat tcaagtactt cgacacaaca atcgacagaa agagatacac aagcacaaag 4020 gaagtcctgg acgcaacact gatccaccag agcatcacag gactgtacga aacaagaatc 4080 gacctgagcc agctgggagg agacggagga ggaagcccga agaagaagag aaaggtctag 4140 <210> 2 <211> 4143 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 2 atggataaga agtactcaat cgggctggat atcggaacta attccgtggg ttgggcagtg 60 atcacggatg aatacaaagt gccgtccaag aagttcaagg tcctggggaa caccgataga 120 cacagcatca agaaaaatct catcggagcc ctgctgtttg actccggcga aaccgcagaa 180 gcgacccggc tcaaacgtac cgcgaggcga cgctacaccc ggcggaagaa tcgcatctgc 240 tatctgcaag agatcttttc gaacgaaatg gcaaaggtcg acgacagctt cttccaccgc 300 ctggaagaat ctttcctggt ggaggaggac aagaagcatg aacggcatcc tatctttgga 360 aacatcgtcg acgaagtggc gtaccacgaa aagtacccga ccatctacca tctgcggaag 420 aagttggttg actcaactga caaggccgac ctcagattga tctacttggc cctcgcccat 480 atgatcaaat tccgcggaca cttcctgatc gaaggcgatc tgaaccctga taactccgac 540 gtggataagc ttttcattca actggtgcag acctacaacc aactgttcga agaaaaccca 600 atcaatgcta gcggcgtcga tgccaaggcc atcctgtccg cccggctgtc gaagtcgcgg 660 cgcctcgaaa acctgatcgc acagctgccg ggagagaaaa agaacggact tttcggcaac 720 ttgatcgctc tctcactggg actcactccc aatttcaagt ccaattttga cctggccgag 780 gacgcgaagc tgcaactctc aaaggacacc tacgacgacg acttggacaa tttgctggca 840 caaattggcg atcagtacgc ggatctgttc cttgccgcta agaacctttc ggacgcaatc 900 ttgctgtccg atatcctgcg cgtgaacacc gaaataacca aagcgccgct tagcgcctcg 960 atgattaagc ggtacgacga gcatcaccag gatctcacgc tgctcaaagc gctcgtgaga 1020 cagcaactgc ctgaaaagta caaggagatc ttcttcgacc agtccaagaa tgggtacgca 1080 gggtacatcg atggaggcgc tagccaggaa gagttctata agttcatcaa gccaatcctg 1140 gaaaagatgg acggaaccga agaactgctg gtcaagctga acagggagga tctgctccgg 1200 aaacagagaa cctttgacaa cggatccatt ccccaccaga tccatctggg tgagctgcac 1260 gccatcttgc ggcgccagga ggacttttac ccattcctca aggacaaccg ggaaaagatc 1320 gagaaaattc tgacgttccg catcccgtat tacgtgggcc cactggcgcg cggcaattcg 1380 cgcttcgcgt ggatgactag aaaatcagag gaaaccatca ctccttggaa tttcgaggaa 1440 gttgtggata agggagcttc ggcacaaagc ttcatcgaac gaatgaccaa cttcgacaag 1500 aatctcccaa acgagaaggt gcttcctaag cacagcctcc tttacgaata cttcactgtc 1560 tacaacgaac tgactaaagt gaaatacgtt actgaaggaa tgaggaagcc ggcctttctg 1620 tccggagaac agaagaaagc aattgtcgat ctgctgttca agaccaaccg caaggtgacc 1680 gtcaagcagc ttaaagagga ctacttcaag aagatcgagt gtttcgactc agtggaaatc 1740 agcggggtgg aggacagatt caacgcttcg ctgggaacct atcatgatct cctgaagatc 1800 atcaaggaca aggacttcct tgacaacgag gagaacgagg acatcctgga agatatcgtc 1860 ctgaccttga cccttttcga ggatcgcgag atgatcgagg agaggcttaa gacctacgct 1920 catctcttcg acgataaggt catgaaacaa ctcaagcgcc gccggtacac tggttggggc 1980 cgcctctccc gcaagctgat caacggtatt cgcgataaac agagcggtaa aactatcctg 2040 gatttcctca aatcggatgg cttcgctaat cgtaacttca tgcaattgat ccacgacgac 2100 agcctgacct ttaaggagga catccaaaaa gcacaagtgt ccggacaggg agactcactc 2160 catgaacaca tcgcgaatct ggccggttcg ccggcgatta agaagggaat tctgcaaact 2220 gtgaaggtgg tcgacgagct ggtgaaggtc atgggacggc acaaaccgga gaatatcgtg 2280 attgaaatgg cccgagaaaa ccagactacc cagaagggcc agaaaaactc ccgcgaaagg 2340 atgaagcgga tcgaagaagg aatcaaggag ctgggcagcc agatcctgaa agagcacccg 2400 gtggaaaaca cgcagctgca gaacgagaag ctctacctgt actatttgca aaatggacgg 2460 gacatgtacg tggaccaaga gctggacatc aatcggttgt ctgattacga cgtggaccac 2520 atcgttccac agtcctttct gaaggatgac tcgatcgata acaaggtgtt gactcgcagc 2580 gacaagaaca gagggaagtc agataatgtg ccatcggagg aggtcgtgaa gaagatgaag 2640 aattactggc ggcagctcct gaatgcgaag ctgattaccc agagaaagtt tgacaatctc 2700 actaaagccg agcgcggcgg actctcagag ctggataagg ctggattcat caaacggcag 2760 ctggtcgaga ctcggcagat taccaagcac gtggcgcaga tcttggactc ccgcatgaac 2820 actaaatacg acgagaacga taagctcatc cgggaagtga aggtgattac cctgaaaagc 2880 aaacttgtgt cggactttcg gaaggacttt cagttttaca aagtgagaga aatcaacaac 2940 taccatcacg cgcatgacgc atacctcaac gctgtggtcg gtaccgccct gatcaaaaag 3000 taccctaaac ttgaatcgga gtttgtgtac ggagactaca aggtctacga cgtgaggaag 3060 atgatagcca agtccgaaca ggaaatcggg aaagcaactg cgaaatactt cttttactca 3120 aacatcatga actttttcaa gactgaaatt acgctggcca atggagaaat caggaagagg 3180 ccactgatcg aaactaacgg agaaacgggc gaaatcgtgt gggacaaggg cagggacttc 3240 gcaactgttc gcaaagtgct ctctatgccg caagtcaata ttgtgaagaa aaccgaagtg 3300 caaaccggcg gattttcaaa ggaatcgatc ctcccaaaga gaaatagcga caagctcatt 3360 gcacgcaaga aagactggga cccgaagaag tacggaggat tcgattcgcc gactgtcgca 3420 tactccgtcc tcgtggtggc caaggtggag aagggaaaga gcaaaaagct caaatccgtc 3480 aaagagctgc tggggattac catcatggaa cgatcctcgt tcgagaagaa cccgattgat 3540 ttcctcgagg cgaagggtta caaggaggtg aagaaggatc tgatcatcaa actccccaag 3600 tactcactgt tcgaactgga aaatggtcgg aagcgcatgc tggcttcggc cggagaactc 3660 caaaaaggaa atgagctggc cttgcctagc aagtacgtca acttcctcta tcttgcttcg 3720 cactacgaaa aactcaaagg gtcaccggaa gataacgaac agaagcagct tttcgtggag 3780 cagcacaagc attatctgga tgaaatcatc gaacaaatct ccgagttttc aaagcgcgtg 3840 atcctcgccg acgccaacct cgacaaagtc ctgtcggcct acaataagca tagagataag 3900 ccgatcagag aacaggccga gaacattatc cacttgttca ccctgactaa cctgggagcc 3960 ccagccgcct tcaagtactt cgatactact atcgatcgca aaagatacac gtccaccaag 4020 gaagttctgg acgcgaccct gatccaccaa agcatcactg gactctacga aactaggatc 4080 gatctgtcgc agctgggtgg cgatggcggt ggatctccga aaaagaagag aaaggtgtaa 4140 tga 4143 <210> 3 <211> 1379 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Cas9 sequence" <400> 3 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1370 1375 <210> 4 <211> 4140 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 4 auggacaaga aguacagcau cggacuggac aucggaacaa acagcgucgg augggcaguc 60 aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120 cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180 gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240 uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300 cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360 aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420 aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480 augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540 gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600 aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660 agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720 cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780 gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840 cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900 cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960 augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020 cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080 ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140 gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200 aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260 gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320 gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380 agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440 gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500 aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560 uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620 agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680 gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740 agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800 aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860 cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920 caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980 agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040 gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100 agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160 cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220 gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280 aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400 gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460 gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520 aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640 aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700 acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760 cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820 acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880 aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940 uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000 uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060 augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120 aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180 ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240 gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300 cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360 gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420 uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480 aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540 uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600 uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660 cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720 cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780 cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840 auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900 ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960 ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020 gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080 gaccugagcc agcugggagg agacggagga ggaagcccga agaagaagag aaaggucuag 4140 <210> 5 <211> 4143 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 5 auggauaaga aguacucaau cgggcuggau aucggaacua auuccguggg uugggcagug 60 aucacggaug aauacaaagu gccguccaag aaguucaagg uccuggggaa caccgauaga 120 cacagcauca agaaaaaucu caucggagcc cugcuguuug acuccggcga aaccgcagaa 180 gcgacccggc ucaaacguac cgcgaggcga cgcuacaccc ggcggaagaa ucgcaucugc 240 uaucugcaag agaucuuuuc gaacgaaaug gcaaaggucg acgacagcuu cuuccaccgc 300 cuggaagaau cuuuccuggu ggaggaggac aagaagcaug aacggcaucc uaucuuugga 360 aacaucgucg acgaaguggc guaccacgaa aaguacccga ccaucuacca ucugcggaag 420 aaguugguug acucaacuga caaggccgac cucagauuga ucuacuuggc ccucgcccau 480 augaucaaau uccgcggaca cuuccugauc gaaggcgauc ugaacccuga uaacuccgac 540 guggauaagc uuuucauuca acuggugcag accuacaacc aacuguucga agaaaaccca 600 aucaaugcua gcggcgucga ugccaaggcc auccuguccg cccggcuguc gaagucgcgg 660 cgccucgaaa accugaucgc acagcugccg ggagagaaaa agaacggacu uuucggcaac 720 uugaucgcuc ucucacuggg acucacuccc aauuucaagu ccaauuuuga ccuggccgag 780 gacgcgaagc ugcaacucuc aaaggacacc uacgacgacg acuuggacaa uuugcuggca 840 caaauuggcg aucaguacgc ggaucuguuc cuugccgcua agaaccuuuc ggacgcaauc 900 uugcuguccg auauccugcg cgugaacacc gaaauaacca aagcgccgcu uagcgccucg 960 augauuaagc gguacgacga gcaucaccag gaucucacgc ugcucaaagc gcucgugaga 1020 cagcaacugc cugaaaagua caaggagauc uucuucgacc aguccaagaa uggguacgca 1080 ggguacaucg auggaggcgc uagccaggaa gaguucuaua aguucaucaa gccaauccug 1140 gaaaagaugg acggaaccga agaacugcug gucaagcuga acagggagga ucugcuccgg 1200 aaacagagaa ccuuugacaa cggauccauu ccccaccaga uccaucuggg ugagcugcac 1260 gccaucuugc ggcgccagga ggacuuuuac ccauuccuca aggacaaccg ggaaaagauc 1320 gagaaaauuc ugacguuccg caucccguau uacgugggcc cacuggcgcg cggcaauucg 1380 cgcuucgcgu ggaugacuag aaaaucagag gaaaccauca cuccuuggaa uuucgaggaa 1440 guuguggaua agggagcuuc ggcacaaagc uucaucgaac gaaugaccaa cuucgacaag 1500 aaucucccaa acgagaaggu gcuuccuaag cacagccucc uuuacgaaua cuucacuguc 1560 uacaacgaac ugacuaaagu gaaauacguu acugaaggaa ugaggaagcc ggccuuucug 1620 uccggagaac agaagaaagc aauugucgau cugcuguuca agaccaaccg caaggugacc 1680 gucaagcagc uuaaagagga cuacuucaag aagaucgagu guuucgacuc aguggaaauc 1740 agcggggugg aggacagauu caacgcuucg cugggaaccu aucaugaucu ccugaagauc 1800 aucaaggaca aggacuuccu ugacaacgag gagaacgagg acauccugga agauaucguc 1860 cugaccuuga cccuuuucga ggaucgcgag augaucgagg agaggcuuaa gaccuacgcu 1920 caucucuucg acgauaaggu caugaaacaa cucaagcgcc gccgguacac ugguuggggc 1980 cgccucuccc gcaagcugau caacgguauu cgcgauaaac agagcgguaa aacuauccug 2040 gauuuccuca aaucggaugg cuucgcuaau cguaacuuca ugcaauugau ccacgacgac 2100 agccugaccu uuaaggagga cauccaaaaa gcacaagugu ccggacaggg agacucacuc 2160 caugaacaca ucgcgaaucu ggccgguucg ccggcgauua agaagggaau ucugcaaacu 2220 gugaaggugg ucgacgagcu ggugaagguc augggacggc acaaaccgga gaauaucgug 2280 auugaaaugg cccgagaaaa ccagacuacc cagaagggcc agaaaaacuc ccgcgaaagg 2340 augaagcgga ucgaagaagg aaucaaggag cugggcagcc agauccugaa agagcacccg 2400 guggaaaaca cgcagcugca gaacgagaag cucuaccugu acuauuugca aaauggacgg 2460 gacauguacg uggaccaaga gcuggacauc aaucgguugu cugauuacga cguggaccac 2520 aucguuccac aguccuuucu gaaggaugac ucgaucgaua acaagguguu gacucgcagc 2580 gacaagaaca gagggaaguc agauaaugug ccaucggagg aggucgugaa gaagaugaag 2640 aauuacuggc ggcagcuccu gaaugcgaag cugauuaccc agagaaaguu ugacaaucuc 2700 acuaaagccg agcgcggcgg acucucagag cuggauaagg cuggauucau caaacggcag 2760 cuggucgaga cucggcagau uaccaagcac guggcgcaga ucuuggacuc ccgcaugaac 2820 acuaaauacg acgagaacga uaagcucauc cgggaaguga aggugauuac ccugaaaagc 2880 aaacuugugu cggacuuucg gaaggacuuu caguuuuaca aagugagaga aaucaacaac 2940 uaccaucacg cgcaugacgc auaccucaac gcuguggucg guaccgcccu gaucaaaaag 3000 uacccuaaac uugaaucgga guuuguguac ggagacuaca aggucuacga cgugaggaag 3060 augauagcca aguccgaaca ggaaaucggg aaagcaacug cgaaauacuu cuuuuacuca 3120 aacaucauga acuuuuucaa gacugaaauu acgcuggcca auggagaaau caggaagagg 3180 ccacugaucg aaacuaacgg agaaacgggc gaaaucgugu gggacaaggg cagggacuuc 3240 gcaacuguuc gcaaagugcu cucuaugccg caagucaaua uugugaagaa aaccgaagug 3300 caaaccggcg gauuuucaaa ggaaucgauc cucccaaaga gaaauagcga caagcucauu 3360 gcacgcaaga aagacuggga cccgaagaag uacggaggau ucgauucgcc gacugucgca 3420 uacuccgucc ucgugguggc caagguggag aagggaaaga gcaaaaagcu caaauccguc 3480 aaagagcugc uggggauuac caucauggaa cgauccucgu ucgagaagaa cccgauugau 3540 uuccucgagg cgaaggguua caaggaggug aagaaggauc ugaucaucaa acuccccaag 3600 uacucacugu ucgaacugga aaauggucgg aagcgcaugc uggcuucggc cggagaacuc 3660 caaaaaggaa augagcuggc cuugccuagc aaguacguca acuuccucua ucuugcuucg 3720 cacuacgaaa aacucaaagg gucaccggaa gauaacgaac agaagcagcu uuucguggag 3780 cagcacaagc auuaucugga ugaaaucauc gaacaaaucu ccgaguuuuc aaagcgcgug 3840 auccucgccg acgccaaccu cgacaaaguc cugucggccu acaauaagca uagagauaag 3900 ccgaucagag aacaggccga gaacauuauc cacuuguuca cccugacuaa ccugggagcc 3960 ccagccgccu ucaaguacuu cgauacuacu aucgaucgca aaagauacac guccaccaag 4020 gaaguucugg acgcgacccu gauccaccaa agcaucacug gacucuacga aacuaggauc 4080 gaucugucgc agcugggugg cgauggcggu ggaucuccga aaaagaagag aaagguguaa 4140 uga 4143 <210> 6 <211> 1379 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 6 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1370 1375 <210> 7 <211> 4140 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 7 auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60 aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120 cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180 gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240 uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300 cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360 aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420 aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480 augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540 gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600 aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660 agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720 cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780 gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840 cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900 cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960 augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020 cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080 ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140 gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200 aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260 gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320 gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380 agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440 gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500 aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560 uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620 agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680 gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740 agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800 aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860 cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920 caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980 agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040 gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100 agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160 cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220 gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280 aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400 gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460 gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520 aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640 aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700 acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760 cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820 acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880 aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940 uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000 uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060 augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120 aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180 ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240 gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300 cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360 gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420 uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480 aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540 uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600 uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660 cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720 cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780 cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840 auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900 ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960 ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020 gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080 gaccugagcc agcugggagg agacggagga ggaagcccga agaagaagag aaaggucuag 4140 <210> 8 <211> 1379 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 8 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 Gly Gly Gly Ser Pro Lys Lys Lys Arg Lys Val 1370 1375 <210> 9 <211> 4140 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 9 auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60 aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120 cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180 gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240 uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300 cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360 aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420 aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480 augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540 gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600 aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660 agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720 cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780 gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840 cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900 cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960 augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020 cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080 ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140 gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200 aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260 gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320 gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380 agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440 gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500 aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560 uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620 agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680 gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740 agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800 aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860 cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920 caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980 agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040 gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100 agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160 cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220 gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280 aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400 gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460 gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgacgca 2520 aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640 aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700 acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760 cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820 acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880 aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940 uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000 uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060 augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120 aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180 ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240 gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300 cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360 gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420 uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480 aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540 uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600 uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660 cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720 cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780 cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840 auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900 ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960 ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020 gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080 gaccugagcc agcugggagg agacggagga ggaagcccga agaagaagag aaaggucuag 4140 <210> 10 <211> 4134 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 10 gacaagaagu acagcaucgg acuggacauc ggaacaaaca gcgucggaug ggcagucauc 60 acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120 agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180 acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240 cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300 gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360 aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420 cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480 aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540 gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600 aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660 cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720 aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780 gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840 aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900 cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960 aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020 cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080 uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140 aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200 cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260 auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320 aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380 uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440 gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500 cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560 aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620 ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680 aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740 ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800 aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860 acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920 cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980 cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040 uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100 cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160 gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220 aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280 gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340 aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400 gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460 auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520 gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580 aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640 uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700 aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760 gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820 aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880 cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940 caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000 ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060 aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120 aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180 cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240 acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300 acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360 agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420 agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480 gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540 cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600 agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660 aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720 uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780 cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840 cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900 aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960 gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020 guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080 cugagccagc ugggaggaga cggaggagga agcccgaaga agaagagaaa gguc 4134 <210> 11 <211> 4134 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 11 gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60 acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120 agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180 acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240 cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300 gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360 aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420 cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480 aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540 gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600 aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660 cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720 aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780 gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840 aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900 cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960 aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020 cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080 uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140 aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200 cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260 auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320 aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380 uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440 gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500 cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560 aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620 ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680 aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740 ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800 aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860 acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920 cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980 cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040 uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100 cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160 gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220 aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280 gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340 aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400 gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460 auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520 gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580 aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640 uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700 aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760 gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820 aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880 cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940 caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000 ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060 aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120 aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180 cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240 acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300 acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360 agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420 agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480 gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540 cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600 agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660 aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720 uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780 cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840 cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900 aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960 gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020 guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080 cugagccagc ugggaggaga cggaggagga agcccgaaga agaagagaaa gguc 4134 <210> 12 <211> 4134 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 12 gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60 acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120 agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180 acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240 cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300 gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360 aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420 cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480 aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540 gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600 aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660 cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720 aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780 gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840 aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900 cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960 aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020 cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080 uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140 aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200 cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260 auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320 aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380 uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440 gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500 cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560 aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620 ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680 aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740 ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800 aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860 acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920 cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980 cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040 uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100 cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160 gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220 aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280 gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340 aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400 gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460 auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgacgcaauc 2520 gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580 aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640 uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700 aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760 gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820 aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880 cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940 caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000 ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060 aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120 aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180 cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240 acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300 acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360 agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420 agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480 gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540 cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600 agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660 aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720 uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780 cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840 cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900 aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960 gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020 guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080 cugagccagc ugggaggaga cggaggagga agcccgaaga agaagagaaa gguc 4134 <210> 13 <211> 1368 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 13 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 14 <211> 4107 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 14 auggacaaga aguacagcau cggacuggac aucggaacaa acagcgucgg augggcaguc 60 aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120 cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180 gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240 uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300 cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360 aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420 aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480 augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540 gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600 aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660 agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720 cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780 gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840 cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900 cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960 augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020 cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080 ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140 gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200 aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260 gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320 gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380 agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440 gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500 aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560 uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620 agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680 gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740 agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800 aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860 cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920 caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980 agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040 gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100 agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160 cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220 gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280 aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400 gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460 gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520 aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640 aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700 acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760 cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820 acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880 aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940 uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000 uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060 augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120 aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180 ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240 gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300 cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360 gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420 uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480 aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540 uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600 uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660 cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720 cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780 cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840 auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900 ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960 ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020 gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080 gaccugagcc agcugggagg agacuag 4107 <210> 15 <211> 4101 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 15 gacaagaagu acagcaucgg acuggacauc ggaacaaaca gcgucggaug ggcagucauc 60 acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120 agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180 acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240 cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300 gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360 aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420 cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480 aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540 gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600 aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660 cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720 aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780 gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840 aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900 cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960 aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020 cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080 uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140 aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200 cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260 auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320 aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380 uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440 gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500 cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560 aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620 ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680 aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740 ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800 aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860 acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920 cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980 cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040 uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100 cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160 gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220 aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280 gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340 aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400 gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460 auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520 gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580 aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640 uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700 aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760 gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820 aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880 cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940 caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000 ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060 aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120 aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180 cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240 acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300 acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360 agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420 agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480 gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540 cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600 agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660 aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720 uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780 cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840 cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900 aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960 gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020 guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080 cugagccagc ugggaggaga c 4101 <210> 16 <211> 1368 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 16 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 17 <211> 4107 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 17 auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60 aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120 cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180 gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240 uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300 cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360 aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420 aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480 augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540 gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600 aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660 agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720 cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780 gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840 cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900 cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960 augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020 cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080 ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140 gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200 aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260 gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320 gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380 agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440 gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500 aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560 uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620 agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680 gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740 agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800 aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860 cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920 caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980 agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040 gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100 agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160 cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220 gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280 aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400 gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460 gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520 aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640 aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700 acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760 cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820 acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880 aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940 uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000 uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060 augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120 aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180 ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240 gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300 cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360 gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420 uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480 aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540 uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600 uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660 cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720 cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780 cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840 auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900 ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960 ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020 gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080 gaccugagcc agcugggagg agacuag 4107 <210> 18 <211> 4101 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 18 gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60 acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120 agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180 acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240 cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300 gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360 aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420 cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480 aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540 gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600 aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660 cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720 aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780 gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840 aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900 cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960 aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020 cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080 uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140 aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200 cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260 auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320 aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380 uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440 gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500 cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560 aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620 ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680 aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740 ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800 aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860 acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920 cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980 cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040 uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100 cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160 gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220 aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280 gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340 aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400 gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460 auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520 gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580 aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640 uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700 aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760 gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820 aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880 cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940 caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000 ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060 aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120 aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180 cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240 acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300 acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360 agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420 agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480 gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540 cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600 agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660 aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720 uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780 cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840 cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900 aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960 gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020 guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080 cugagccagc ugggaggaga c 4101 <210> 19 <211> 1368 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 19 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 <210> 20 <211> 4107 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 20 auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60 aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120 cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180 gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240 uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300 cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360 aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420 aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480 augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540 gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600 aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660 agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720 cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780 gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840 cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900 cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960 augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020 cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080 ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140 gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200 aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260 gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320 gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380 agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440 gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500 aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560 uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620 agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680 gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740 agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800 aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860 cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920 caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980 agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040 gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100 agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160 cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220 gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280 aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400 gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460 gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgacgca 2520 aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640 aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700 acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760 cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820 acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880 aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940 uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000 uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060 augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120 aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180 ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240 gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300 cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360 gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420 uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480 aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540 uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600 uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660 cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720 cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780 cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840 auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900 ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960 ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020 gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080 gaccugagcc agcugggagg agacuag 4107 <210> 21 <211> 4113 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 21 gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60 acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120 agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180 acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240 cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300 gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360 aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420 cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480 aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540 gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600 aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660 cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720 aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780 gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840 aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900 cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960 aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020 cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080 uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140 aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200 cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260 auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320 aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380 uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440 gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500 cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560 aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620 ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680 aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740 ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800 aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860 acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920 cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980 cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040 uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100 cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160 gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220 aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280 gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340 aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400 gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460 auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgacgcaauc 2520 gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580 aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640 uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700 aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760 gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820 aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880 cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940 caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000 ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060 aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120 aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180 cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240 acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300 acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360 agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420 agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480 gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540 cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600 agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660 aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720 uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780 cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840 cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900 aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960 gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020 guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080 cugagccagc ugggaggaga cggaggagga agc 4113 <210> 22 <211> 1392 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 22 Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro 1370 1375 1380 Lys Lys Lys Arg Lys Val Asp Ser Gly 1385 1390 <210> 23 <211> 4179 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 23 auggacaaga aguacagcau cggacuggac aucggaacaa acagcgucgg augggcaguc 60 aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120 cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180 gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240 uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300 cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360 aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420 aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480 augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540 gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600 aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660 agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720 cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780 gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840 cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900 cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960 augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020 cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080 ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140 gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200 aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260 gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320 gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380 agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440 gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500 aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560 uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620 agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680 gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740 agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800 aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860 cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920 caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980 agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040 gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100 agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160 cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220 gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280 aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400 gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460 gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520 aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640 aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700 acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760 cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820 acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880 aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940 uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000 uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060 augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120 aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180 ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240 gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300 cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360 gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420 uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480 aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540 uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600 uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660 cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720 cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780 cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840 auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900 ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960 ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020 gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080 gaccugagcc agcugggagg agacggaagc ggaagcccga agaagaagag aaaggucgac 4140 ggaagcccga agaagaagag aaaggucgac agcggauag 4179 <210> 24 <211> 4173 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 24 gacaagaagu acagcaucgg acuggacauc ggaacaaaca gcgucggaug ggcagucauc 60 acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120 agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180 acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240 cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300 gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360 aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420 cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480 aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540 gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600 aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660 cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720 aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780 gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840 aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900 cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960 aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020 cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080 uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140 aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200 cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260 auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320 aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380 uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440 gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500 cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560 aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620 ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680 aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740 ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800 aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860 acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920 cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980 cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040 uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100 cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160 gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220 aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280 gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340 aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400 gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460 auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520 gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580 aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640 uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700 aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760 gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820 aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880 cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940 caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000 ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060 aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120 aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180 cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240 acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300 acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360 agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420 agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480 gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540 cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600 agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660 aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720 uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780 cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840 cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900 aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960 gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020 guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080 cugagccagc ugggaggaga cggaagcgga agcccgaaga agaagagaaa ggucgacgga 4140 agcccgaaga agaagagaaa ggucgacagc gga 4173 <210> 25 <211> 1392 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 25 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro 1370 1375 1380 Lys Lys Lys Arg Lys Val Asp Ser Gly 1385 1390 <210> 26 <211> 4179 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 26 auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60 aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120 cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180 gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240 uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300 cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360 aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420 aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480 augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540 gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600 aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660 agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720 cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780 gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840 cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900 cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960 augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020 cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080 ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140 gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200 aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260 gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320 gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380 agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440 gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500 aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560 uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620 agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680 gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740 agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800 aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860 cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920 caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980 agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040 gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100 agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160 cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220 gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280 aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400 gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460 gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgaccac 2520 aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640 aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700 acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760 cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820 acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880 aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940 uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000 uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060 augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120 aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180 ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240 gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300 cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360 gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420 uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480 aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540 uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600 uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660 cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720 cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780 cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840 auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900 ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960 ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020 gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080 gaccugagcc agcugggagg agacggaagc ggaagcccga agaagaagag aaaggucgac 4140 ggaagcccga agaagaagag aaaggucgac agcggauag 4179 <210> 27 <211> 4173 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 27 gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60 acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120 agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180 acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240 cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300 gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360 aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420 cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480 aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540 gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600 aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660 cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720 aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780 gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840 aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900 cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960 aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020 cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080 uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140 aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200 cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260 auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320 aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380 uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440 gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500 cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560 aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620 ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680 aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740 ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800 aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860 acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920 cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980 cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040 uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100 cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160 gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220 aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280 gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340 aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400 gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460 auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgaccacauc 2520 gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580 aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640 uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700 aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760 gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820 aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880 cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940 caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000 ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060 aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120 aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180 cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240 acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300 acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360 agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420 agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480 gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540 cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600 agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660 aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720 uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780 cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840 cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900 aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960 gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020 guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080 cugagccagc ugggaggaga cggaagcgga agcccgaaga agaagagaaa ggucgacgga 4140 agcccgaaga agaagagaaa ggucgacagc gga 4173 <210> 28 <211> 1392 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 28 Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val 1 5 10 15 Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe 20 25 30 Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile 35 40 45 Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu 50 55 60 Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys 65 70 75 80 Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser 85 90 95 Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys 100 105 110 His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr 115 120 125 His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp 130 135 140 Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His 145 150 155 160 Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro 165 170 175 Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr 180 185 190 Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala 195 200 205 Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn 210 215 220 Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn 225 230 235 240 Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe 245 250 255 Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp 260 265 270 Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp 275 280 285 Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp 290 295 300 Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser 305 310 315 320 Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys 325 330 335 Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe 340 345 350 Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser 355 360 365 Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp 370 375 380 Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg 385 390 395 400 Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu 405 410 415 Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe 420 425 430 Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile 435 440 445 Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp 450 455 460 Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu 465 470 475 480 Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr 485 490 495 Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser 500 505 510 Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys 515 520 525 Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln 530 535 540 Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr 545 550 555 560 Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp 565 570 575 Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly 580 585 590 Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp 595 600 605 Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr 610 615 620 Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala 625 630 635 640 His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr 645 650 655 Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp 660 665 670 Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe 675 680 685 Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe 690 695 700 Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu 705 710 715 720 His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly 725 730 735 Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly 740 745 750 Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln 755 760 765 Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile 770 775 780 Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro 785 790 795 800 Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu 805 810 815 Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg 820 825 830 Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys 835 840 845 Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg 850 855 860 Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys 865 870 875 880 Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys 885 890 895 Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp 900 905 910 Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr 915 920 925 Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp 930 935 940 Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser 945 950 955 960 Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg 965 970 975 Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val 980 985 990 Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe 995 1000 1005 Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala 1010 1015 1020 Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe 1025 1030 1035 Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala 1040 1045 1050 Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu 1055 1060 1065 Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val 1070 1075 1080 Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr 1085 1090 1095 Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys 1100 1105 1110 Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro 1115 1120 1125 Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val 1130 1135 1140 Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys 1145 1150 1155 Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser 1160 1165 1170 Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys 1175 1180 1185 Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu 1190 1195 1200 Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly 1205 1210 1215 Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val 1220 1225 1230 Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser 1235 1240 1245 Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys 1250 1255 1260 His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys 1265 1270 1275 Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala 1280 1285 1290 Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn 1295 1300 1305 Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala 1310 1315 1320 Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser 1325 1330 1335 Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr 1340 1345 1350 Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp 1355 1360 1365 Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Asp Gly Ser Pro 1370 1375 1380 Lys Lys Lys Arg Lys Val Asp Ser Gly 1385 1390 <210> 29 <211> 4179 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 29 auggacaaga aguacagcau cggacuggca aucggaacaa acagcgucgg augggcaguc 60 aucacagacg aauacaaggu cccgagcaag aaguucaagg uccugggaaa cacagacaga 120 cacagcauca agaagaaccu gaucggagca cugcuguucg acagcggaga aacagcagaa 180 gcaacaagac ugaagagaac agcaagaaga agauacacaa gaagaaagaa cagaaucugc 240 uaccugcagg aaaucuucag caacgaaaug gcaaaggucg acgacagcuu cuuccacaga 300 cuggaagaaa gcuuccuggu cgaagaagac aagaagcacg aaagacaccc gaucuucgga 360 aacaucgucg acgaagucgc auaccacgaa aaguacccga caaucuacca ccugagaaag 420 aagcuggucg acagcacaga caaggcagac cugagacuga ucuaccuggc acuggcacac 480 augaucaagu ucagaggaca cuuccugauc gaaggagacc ugaacccgga caacagcgac 540 gucgacaagc uguucaucca gcugguccag acauacaacc agcuguucga agaaaacccg 600 aucaacgcaa gcggagucga cgcaaaggca auccugagcg caagacugag caagagcaga 660 agacuggaaa accugaucgc acagcugccg ggagaaaaga agaacggacu guucggaaac 720 cugaucgcac ugagccuggg acugacaccg aacuucaaga gcaacuucga ccuggcagaa 780 gacgcaaagc ugcagcugag caaggacaca uacgacgacg accuggacaa ccugcuggca 840 cagaucggag accaguacgc agaccuguuc cuggcagcaa agaaccugag cgacgcaauc 900 cugcugagcg acauccugag agucaacaca gaaaucacaa aggcaccgcu gagcgcaagc 960 augaucaaga gauacgacga acaccaccag gaccugacac ugcugaaggc acuggucaga 1020 cagcagcugc cggaaaagua caaggaaauc uucuucgacc agagcaagaa cggauacgca 1080 ggauacaucg acggaggagc aagccaggaa gaauucuaca aguucaucaa gccgauccug 1140 gaaaagaugg acggaacaga agaacugcug gucaagcuga acagagaaga ccugcugaga 1200 aagcagagaa cauucgacaa cggaagcauc ccgcaccaga uccaccuggg agaacugcac 1260 gcaauccuga gaagacagga agacuucuac ccguuccuga aggacaacag agaaaagauc 1320 gaaaagaucc ugacauucag aaucccguac uacgucggac cgcuggcaag aggaaacagc 1380 agauucgcau ggaugacaag aaagagcgaa gaaacaauca caccguggaa cuucgaagaa 1440 gucgucgaca agggagcaag cgcacagagc uucaucgaaa gaaugacaaa cuucgacaag 1500 aaccugccga acgaaaaggu ccugccgaag cacagccugc uguacgaaua cuucacaguc 1560 uacaacgaac ugacaaaggu caaguacguc acagaaggaa ugagaaagcc ggcauuccug 1620 agcggagaac agaagaaggc aaucgucgac cugcuguuca agacaaacag aaaggucaca 1680 gucaagcagc ugaaggaaga cuacuucaag aagaucgaau gcuucgacag cgucgaaauc 1740 agcggagucg aagacagauu caacgcaagc cugggaacau accacgaccu gcugaagauc 1800 aucaaggaca aggacuuccu ggacaacgaa gaaaacgaag acauccugga agacaucguc 1860 cugacacuga cacuguucga agacagagaa augaucgaag aaagacugaa gacauacgca 1920 caccuguucg acgacaaggu caugaagcag cugaagagaa gaagauacac aggaugggga 1980 agacugagca gaaagcugau caacggaauc agagacaagc agagcggaaa gacaauccug 2040 gacuuccuga agagcgacgg auucgcaaac agaaacuuca ugcagcugau ccacgacgac 2100 agccugacau ucaaggaaga cauccagaag gcacagguca gcggacaggg agacagccug 2160 cacgaacaca ucgcaaaccu ggcaggaagc ccggcaauca agaagggaau ccugcagaca 2220 gucaaggucg ucgacgaacu ggucaagguc augggaagac acaagccgga aaacaucguc 2280 aucgaaaugg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 augaagagaa ucgaagaagg aaucaaggaa cugggaagcc agauccugaa ggaacacccg 2400 gucgaaaaca cacagcugca gaacgaaaag cuguaccugu acuaccugca gaacggaaga 2460 gacauguacg ucgaccagga acuggacauc aacagacuga gcgacuacga cgucgacgca 2520 aucgucccgc agagcuuccu gaaggacgac agcaucgaca acaagguccu gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacguc ccgagcgaag aagucgucaa gaagaugaag 2640 aacuacugga gacagcugcu gaacgcaaag cugaucacac agagaaaguu cgacaaccug 2700 acaaaggcag agagaggagg acugagcgaa cuggacaagg caggauucau caagagacag 2760 cuggucgaaa caagacagau cacaaagcac gucgcacaga uccuggacag cagaaugaac 2820 acaaaguacg acgaaaacga caagcugauc agagaaguca aggucaucac acugaagagc 2880 aagcugguca gcgacuucag aaaggacuuc caguucuaca aggucagaga aaucaacaac 2940 uaccaccacg cacacgacgc auaccugaac gcagucgucg gaacagcacu gaucaagaag 3000 uacccgaagc uggaaagcga auucgucuac ggagacuaca aggucuacga cgucagaaag 3060 augaucgcaa agagcgaaca ggaaaucgga aaggcaacag caaaguacuu cuucuacagc 3120 aacaucauga acuucuucaa gacagaaauc acacuggcaa acggagaaau cagaaagaga 3180 ccgcugaucg aaacaaacgg agaaacagga gaaaucgucu gggacaaggg aagagacuuc 3240 gcaacaguca gaaagguccu gagcaugccg caggucaaca ucgucaagaa gacagaaguc 3300 cagacaggag gauucagcaa ggaaagcauc cugccgaaga gaaacagcga caagcugauc 3360 gcaagaaaga aggacuggga cccgaagaag uacggaggau ucgacagccc gacagucgca 3420 uacagcgucc uggucgucgc aaaggucgaa aagggaaaga gcaagaagcu gaagagcguc 3480 aaggaacugc ugggaaucac aaucauggaa agaagcagcu ucgaaaagaa cccgaucgac 3540 uuccuggaag caaagggaua caaggaaguc aagaaggacc ugaucaucaa gcugccgaag 3600 uacagccugu ucgaacugga aaacggaaga aagagaaugc uggcaagcgc aggagaacug 3660 cagaagggaa acgaacuggc acugccgagc aaguacguca acuuccugua ccuggcaagc 3720 cacuacgaaa agcugaaggg aagcccggaa gacaacgaac agaagcagcu guucgucgaa 3780 cagcacaagc acuaccugga cgaaaucauc gaacagauca gcgaauucag caagagaguc 3840 auccuggcag acgcaaaccu ggacaagguc cugagcgcau acaacaagca cagagacaag 3900 ccgaucagag aacaggcaga aaacaucauc caccuguuca cacugacaaa ccugggagca 3960 ccggcagcau ucaaguacuu cgacacaaca aucgacagaa agagauacac aagcacaaag 4020 gaaguccugg acgcaacacu gauccaccag agcaucacag gacuguacga aacaagaauc 4080 gaccugagcc agcugggagg agacggaagc ggaagcccga agaagaagag aaaggucgac 4140 ggaagcccga agaagaagag aaaggucgac agcggauag 4179 <210> 30 <211> 4173 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 30 gacaagaagu acagcaucgg acuggcaauc ggaacaaaca gcgucggaug ggcagucauc 60 acagacgaau acaagguccc gagcaagaag uucaaggucc ugggaaacac agacagacac 120 agcaucaaga agaaccugau cggagcacug cuguucgaca gcggagaaac agcagaagca 180 acaagacuga agagaacagc aagaagaaga uacacaagaa gaaagaacag aaucugcuac 240 cugcaggaaa ucuucagcaa cgaaauggca aaggucgacg acagcuucuu ccacagacug 300 gaagaaagcu uccuggucga agaagacaag aagcacgaaa gacacccgau cuucggaaac 360 aucgucgacg aagucgcaua ccacgaaaag uacccgacaa ucuaccaccu gagaaagaag 420 cuggucgaca gcacagacaa ggcagaccug agacugaucu accuggcacu ggcacacaug 480 aucaaguuca gaggacacuu ccugaucgaa ggagaccuga acccggacaa cagcgacguc 540 gacaagcugu ucauccagcu gguccagaca uacaaccagc uguucgaaga aaacccgauc 600 aacgcaagcg gagucgacgc aaaggcaauc cugagcgcaa gacugagcaa gagcagaaga 660 cuggaaaacc ugaucgcaca gcugccggga gaaaagaaga acggacuguu cggaaaccug 720 aucgcacuga gccugggacu gacaccgaac uucaagagca acuucgaccu ggcagaagac 780 gcaaagcugc agcugagcaa ggacacauac gacgacgacc uggacaaccu gcuggcacag 840 aucggagacc aguacgcaga ccuguuccug gcagcaaaga accugagcga cgcaauccug 900 cugagcgaca uccugagagu caacacagaa aucacaaagg caccgcugag cgcaagcaug 960 aucaagagau acgacgaaca ccaccaggac cugacacugc ugaaggcacu ggucagacag 1020 cagcugccgg aaaaguacaa ggaaaucuuc uucgaccaga gcaagaacgg auacgcagga 1080 uacaucgacg gaggagcaag ccaggaagaa uucuacaagu ucaucaagcc gauccuggaa 1140 aagauggacg gaacagaaga acugcugguc aagcugaaca gagaagaccu gcugagaaag 1200 cagagaacau ucgacaacgg aagcaucccg caccagaucc accugggaga acugcacgca 1260 auccugagaa gacaggaaga cuucuacccg uuccugaagg acaacagaga aaagaucgaa 1320 aagauccuga cauucagaau cccguacuac gucggaccgc uggcaagagg aaacagcaga 1380 uucgcaugga ugacaagaaa gagcgaagaa acaaucacac cguggaacuu cgaagaaguc 1440 gucgacaagg gagcaagcgc acagagcuuc aucgaaagaa ugacaaacuu cgacaagaac 1500 cugccgaacg aaaagguccu gccgaagcac agccugcugu acgaauacuu cacagucuac 1560 aacgaacuga caaaggucaa guacgucaca gaaggaauga gaaagccggc auuccugagc 1620 ggagaacaga agaaggcaau cgucgaccug cuguucaaga caaacagaaa ggucacaguc 1680 aagcagcuga aggaagacua cuucaagaag aucgaaugcu ucgacagcgu cgaaaucagc 1740 ggagucgaag acagauucaa cgcaagccug ggaacauacc acgaccugcu gaagaucauc 1800 aaggacaagg acuuccugga caacgaagaa aacgaagaca uccuggaaga caucguccug 1860 acacugacac uguucgaaga cagagaaaug aucgaagaaa gacugaagac auacgcacac 1920 cuguucgacg acaaggucau gaagcagcug aagagaagaa gauacacagg auggggaaga 1980 cugagcagaa agcugaucaa cggaaucaga gacaagcaga gcggaaagac aauccuggac 2040 uuccugaaga gcgacggauu cgcaaacaga aacuucaugc agcugaucca cgacgacagc 2100 cugacauuca aggaagacau ccagaaggca caggucagcg gacagggaga cagccugcac 2160 gaacacaucg caaaccuggc aggaagcccg gcaaucaaga agggaauccu gcagacaguc 2220 aaggucgucg acgaacuggu caaggucaug ggaagacaca agccggaaaa caucgucauc 2280 gaaauggcaa gagaaaacca gacaacacag aagggacaga agaacagcag agaaagaaug 2340 aagagaaucg aagaaggaau caaggaacug ggaagccaga uccugaagga acacccgguc 2400 gaaaacacac agcugcagaa cgaaaagcug uaccuguacu accugcagaa cggaagagac 2460 auguacgucg accaggaacu ggacaucaac agacugagcg acuacgacgu cgacgcaauc 2520 gucccgcaga gcuuccugaa ggacgacagc aucgacaaca agguccugac aagaagcgac 2580 aagaacagag gaaagagcga caacgucccg agcgaagaag ucgucaagaa gaugaagaac 2640 uacuggagac agcugcugaa cgcaaagcug aucacacaga gaaaguucga caaccugaca 2700 aaggcagaga gaggaggacu gagcgaacug gacaaggcag gauucaucaa gagacagcug 2760 gucgaaacaa gacagaucac aaagcacguc gcacagaucc uggacagcag aaugaacaca 2820 aaguacgacg aaaacgacaa gcugaucaga gaagucaagg ucaucacacu gaagagcaag 2880 cuggucagcg acuucagaaa ggacuuccag uucuacaagg ucagagaaau caacaacuac 2940 caccacgcac acgacgcaua ccugaacgca gucgucggaa cagcacugau caagaaguac 3000 ccgaagcugg aaagcgaauu cgucuacgga gacuacaagg ucuacgacgu cagaaagaug 3060 aucgcaaaga gcgaacagga aaucggaaag gcaacagcaa aguacuucuu cuacagcaac 3120 aucaugaacu ucuucaagac agaaaucaca cuggcaaacg gagaaaucag aaagagaccg 3180 cugaucgaaa caaacggaga aacaggagaa aucgucuggg acaagggaag agacuucgca 3240 acagucagaa agguccugag caugccgcag gucaacaucg ucaagaagac agaaguccag 3300 acaggaggau ucagcaagga aagcauccug ccgaagagaa acagcgacaa gcugaucgca 3360 agaaagaagg acugggaccc gaagaaguac ggaggauucg acagcccgac agucgcauac 3420 agcguccugg ucgucgcaaa ggucgaaaag ggaaagagca agaagcugaa gagcgucaag 3480 gaacugcugg gaaucacaau cauggaaaga agcagcuucg aaaagaaccc gaucgacuuc 3540 cuggaagcaa agggauacaa ggaagucaag aaggaccuga ucaucaagcu gccgaaguac 3600 agccuguucg aacuggaaaa cggaagaaag agaaugcugg caagcgcagg agaacugcag 3660 aagggaaacg aacuggcacu gccgagcaag uacgucaacu uccuguaccu ggcaagccac 3720 uacgaaaagc ugaagggaag cccggaagac aacgaacaga agcagcuguu cgucgaacag 3780 cacaagcacu accuggacga aaucaucgaa cagaucagcg aauucagcaa gagagucauc 3840 cuggcagacg caaaccugga caagguccug agcgcauaca acaagcacag agacaagccg 3900 aucagagaac aggcagaaaa caucauccac cuguucacac ugacaaaccu gggagcaccg 3960 gcagcauuca aguacuucga cacaacaauc gacagaaaga gauacacaag cacaaaggaa 4020 guccuggacg caacacugau ccaccagagc aucacaggac uguacgaaac aagaaucgac 4080 cugagccagc ugggaggaga cggaagcgga agcccgaaga agaagagaaa ggucgacgga 4140 agcccgaaga agaagagaaa ggucgacagc gga 4173 <210> 31 <211> 17 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 31 taatacgact cactata 17 <210> 32 <211> 50 <212> DNA <213> Homo sapiens <400> 32 acatttgctt ctgacacaac tgtgttcact agcaacctca aacagacacc 50 <210> 33 <211> 132 <212> DNA <213> Homo sapiens <400> 33 gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa gtccaactac 60 taaactgggg gatattatga agggccttga gcatctggat tctgcctaat aaaaaacatt 120 tattttcatt gc 132 <210> 34 <211> 66 <212> DNA <213> Homo sapiens <400> 34 cataaaccct ggcgcgctcg cggcccggca ctcttctggt ccccacagac tcagagagaa 60 cccacc 66 <210> 35 <211> 110 <212> DNA <213> Homo sapiens <400> 35 gctggagcct cggtggccat gcttcttgcc ccttgggcct ccccccagcc cctcctcccc 60 ttcctgcacc cgtacccccg tggtctttga ataaagtctg agtgggcggc 110 <210> 36 <211> 29 <212> DNA <213> Xenopus laevis <400> 36 aagctcagaa taaacgctca actttggcc 29 <210> 37 <211> 130 <212> DNA <213> Xenopus laevis <400> 37 accagcctca agaacacccg aatggagtct ctaagctaca taataccaac ttacacttta 60 caaaatgttg tcccccaaaa tgtagccatt cgtatctgct cctaataaaa agaaagtttc 120 ttcacattct 130 <210> 38 <211> 27 <212> DNA <213> Bos sp. <400> 38 cagggtcctg tggacagctc accagct 27 <210> 39 <211> 102 <212> DNA <213> Bos sp. <400> 39 ttgccagcca tctgttgttt gcccctcccc cgtgccttcc ttgaccctgg aaggtgccac 60 tcccactgtc ctttcctaat aaaatgagga aattgcatcg ca 102 <210> 40 <211> 93 <212> DNA <213> Mus musculus <400> 40 gctgccttct gcggggcttg ccttctggcc atgcccttct tctctccctt gcacctgtac 60 ctcttggtct ttgaataaag cctgagtagg aag 93 <210> 41 <211> 61 <212> DNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: HSD17B4 5' UTR sequence" <400> 41 tcccgcagtc ggcgtccagc ggctctgctt gttcgtgtgt gtgtcgttgc aggccttatt 60 c 61 <210> 42 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(3) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (1)..(4) <223> Phosphorothioate linkage <220> <221> modified_base <222> (29)..(40) <223> 2'-O-methyl modified <220> <221> modified_base <222> (69)..(100) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (97)..(100) <223> Phosphorothioate linkage <400> 42 uuacagccac gucuacagca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 43 <211> 4411 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 43 gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120 cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180 gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240 cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300 aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360 cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420 acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480 ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540 cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600 cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660 gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720 actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780 cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840 cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900 ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960 cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020 accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080 gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140 caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200 catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260 agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320 cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380 caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440 ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500 gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560 gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620 cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680 aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740 aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800 cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860 cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920 cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980 actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040 atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100 cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160 gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220 acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280 gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340 gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400 gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460 cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520 cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580 ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640 ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700 cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760 aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820 attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880 ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940 catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000 cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060 agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120 ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180 gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240 agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300 caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360 caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420 cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480 cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540 gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600 aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660 catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720 aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780 cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840 gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900 attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960 caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020 gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080 atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140 gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200 gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260 gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320 ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380 tcaattaata aaaaatggaa agaacctcga g 4411 <210> 44 <211> 4405 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 44 gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatcc atggacaaga agtacagcat cggactggac atcggaacaa acagcgtcgg 120 atgggcagtc atcacagacg aatacaaggt cccgagcaag aagttcaagg tcctgggaaa 180 cacagacaga cacagcatca agaagaacct gatcggagca ctgctgttcg acagcggaga 240 aacagcagaa gcaacaagac tgaagagaac agcaagaaga agatacacaa gaagaaagaa 300 cagaatctgc tacctgcagg aaatcttcag caacgaaatg gcaaaggtcg acgacagctt 360 cttccacaga ctggaagaaa gcttcctggt cgaagaagac aagaagcacg aaagacaccc 420 gatcttcgga aacatcgtcg acgaagtcgc ataccacgaa aagtacccga caatctacca 480 cctgagaaag aagctggtcg acagcacaga caaggcagac ctgagactga tctacctggc 540 actggcacac atgatcaagt tcagaggaca cttcctgatc gaaggagacc tgaacccgga 600 caacagcgac gtcgacaagc tgttcatcca gctggtccag acatacaacc agctgttcga 660 agaaaacccg atcaacgcaa gcggagtcga cgcaaaggca atcctgagcg caagactgag 720 caagagcaga agactggaaa acctgatcgc acagctgccg ggagaaaaga agaacggact 780 gttcggaaac ctgatcgcac tgagcctggg actgacaccg aacttcaaga gcaacttcga 840 cctggcagaa gacgcaaagc tgcagctgag caaggacaca tacgacgacg acctggacaa 900 cctgctggca cagatcggag accagtacgc agacctgttc ctggcagcaa agaacctgag 960 cgacgcaatc ctgctgagcg acatcctgag agtcaacaca gaaatcacaa aggcaccgct 1020 gagcgcaagc atgatcaaga gatacgacga acaccaccag gacctgacac tgctgaaggc 1080 actggtcaga cagcagctgc cggaaaagta caaggaaatc ttcttcgacc agagcaagaa 1140 cggatacgca ggatacatcg acggaggagc aagccaggaa gaattctaca agttcatcaa 1200 gccgatcctg gaaaagatgg acggaacaga agaactgctg gtcaagctga acagagaaga 1260 cctgctgaga aagcagagaa cattcgacaa cggaagcatc ccgcaccaga tccacctggg 1320 agaactgcac gcaatcctga gaagacagga agacttctac ccgttcctga aggacaacag 1380 agaaaagatc gaaaagatcc tgacattcag aatcccgtac tacgtcggac cgctggcaag 1440 aggaaacagc agattcgcat ggatgacaag aaagagcgaa gaaacaatca caccgtggaa 1500 cttcgaagaa gtcgtcgaca agggagcaag cgcacagagc ttcatcgaaa gaatgacaaa 1560 cttcgacaag aacctgccga acgaaaaggt cctgccgaag cacagcctgc tgtacgaata 1620 cttcacagtc tacaacgaac tgacaaaggt caagtacgtc acagaaggaa tgagaaagcc 1680 ggcattcctg agcggagaac agaagaaggc aatcgtcgac ctgctgttca agacaaacag 1740 aaaggtcaca gtcaagcagc tgaaggaaga ctacttcaag aagatcgaat gcttcgacag 1800 cgtcgaaatc agcggagtcg aagacagatt caacgcaagc ctgggaacat accacgacct 1860 gctgaagatc atcaaggaca aggacttcct ggacaacgaa gaaaacgaag acatcctgga 1920 agacatcgtc ctgacactga cactgttcga agacagagaa atgatcgaag aaagactgaa 1980 gacatacgca cacctgttcg acgacaaggt catgaagcag ctgaagagaa gaagatacac 2040 aggatgggga agactgagca gaaagctgat caacggaatc agagacaagc agagcggaaa 2100 gacaatcctg gacttcctga agagcgacgg attcgcaaac agaaacttca tgcagctgat 2160 ccacgacgac agcctgacat tcaaggaaga catccagaag gcacaggtca gcggacaggg 2220 agacagcctg cacgaacaca tcgcaaacct ggcaggaagc ccggcaatca agaagggaat 2280 cctgcagaca gtcaaggtcg tcgacgaact ggtcaaggtc atgggaagac acaagccgga 2340 aaacatcgtc atcgaaatgg caagagaaaa ccagacaaca cagaagggac agaagaacag 2400 cagagaaaga atgaagagaa tcgaagaagg aatcaaggaa ctgggaagcc agatcctgaa 2460 ggaacacccg gtcgaaaaca cacagctgca gaacgaaaag ctgtacctgt actacctgca 2520 gaacggaaga gacatgtacg tcgaccagga actggacatc aacagactga gcgactacga 2580 cgtcgaccac atcgtcccgc agagcttcct gaaggacgac agcatcgaca acaaggtcct 2640 gacaagaagc gacaagaaca gaggaaagag cgacaacgtc ccgagcgaag aagtcgtcaa 2700 gaagatgaag aactactgga gacagctgct gaacgcaaag ctgatcacac agagaaagtt 2760 cgacaacctg acaaaggcag agagaggagg actgagcgaa ctggacaagg caggattcat 2820 caagagacag ctggtcgaaa caagacagat cacaaagcac gtcgcacaga tcctggacag 2880 cagaatgaac acaaagtacg acgaaaacga caagctgatc agagaagtca aggtcatcac 2940 actgaagagc aagctggtca gcgacttcag aaaggacttc cagttctaca aggtcagaga 3000 aatcaacaac taccaccacg cacacgacgc atacctgaac gcagtcgtcg gaacagcact 3060 gatcaagaag tacccgaagc tggaaagcga attcgtctac ggagactaca aggtctacga 3120 cgtcagaaag atgatcgcaa agagcgaaca ggaaatcgga aaggcaacag caaagtactt 3180 cttctacagc aacatcatga acttcttcaa gacagaaatc acactggcaa acggagaaat 3240 cagaaagaga ccgctgatcg aaacaaacgg agaaacagga gaaatcgtct gggacaaggg 3300 aagagacttc gcaacagtca gaaaggtcct gagcatgccg caggtcaaca tcgtcaagaa 3360 gacagaagtc cagacaggag gattcagcaa ggaaagcatc ctgccgaaga gaaacagcga 3420 caagctgatc gcaagaaaga aggactggga cccgaagaag tacggaggat tcgacagccc 3480 gacagtcgca tacagcgtcc tggtcgtcgc aaaggtcgaa aagggaaaga gcaagaagct 3540 gaagagcgtc aaggaactgc tgggaatcac aatcatggaa agaagcagct tcgaaaagaa 3600 cccgatcgac ttcctggaag caaagggata caaggaagtc aagaaggacc tgatcatcaa 3660 gctgccgaag tacagcctgt tcgaactgga aaacggaaga aagagaatgc tggcaagcgc 3720 aggagaactg cagaagggaa acgaactggc actgccgagc aagtacgtca acttcctgta 3780 cctggcaagc cactacgaaa agctgaaggg aagcccggaa gacaacgaac agaagcagct 3840 gttcgtcgaa cagcacaagc actacctgga cgaaatcatc gaacagatca gcgaattcag 3900 caagagagtc atcctggcag acgcaaacct ggacaaggtc ctgagcgcat acaacaagca 3960 cagagacaag ccgatcagag aacaggcaga aaacatcatc cacctgttca cactgacaaa 4020 cctgggagca ccggcagcat tcaagtactt cgacacaaca atcgacagaa agagatacac 4080 aagcacaaag gaagtcctgg acgcaacact gatccaccag agcatcacag gactgtacga 4140 aacaagaatc gacctgagcc agctgggagg agacggagga ggaagcccga agaagaagag 4200 aaaggtctag ctagccatca catttaaaag catctcagcc taccatgaga ataagagaaa 4260 gaaaatgaag atcaatagct tattcatctc tttttctttt tcgttggtgt aaagccaaca 4320 ccctgtctaa aaaacataaa tttctttaat cattttgcct cttttctctg tgcttcaatt 4380 aataaaaaat ggaaagaacc tcgag 4405 <210> 45 <211> 4188 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 45 atggataaga agtactcgat cgggctggat atcggaacta attccgtggg ttgggcagtg 60 atcacggatg aatacaaagt gccgtccaag aagttcaagg tcctggggaa caccgataga 120 cacagcatca agaagaatct catcggagcc ctgctgtttg actccggcga aaccgcagaa 180 gcgacccggc tcaaacgtac cgcgaggcga cgctacaccc ggcggaagaa tcgcatctgc 240 tatctgcaag aaatcttttc gaacgaaatg gcaaaggtgg acgacagctt cttccaccgc 300 ctggaagaat ctttcctggt ggaggaggac aagaagcatg aacggcatcc tatctttgga 360 aacatcgtgg acgaagtggc gtaccacgaa aagtacccga ccatctacca tctgcggaag 420 aagttggttg actcaactga caaggccgac ctcagattga tctacttggc cctcgcccat 480 atgatcaaat tccgcggaca cttcctgatc gaaggcgatc tgaaccctga taactccgac 540 gtggataagc tgttcattca actggtgcag acctacaacc aactgttcga agaaaaccca 600 atcaatgcca gcggcgtcga tgccaaggcc atcctgtccg cccggctgtc gaagtcgcgg 660 cgcctcgaaa acctgatcgc acagctgccg ggagagaaga agaacggact tttcggcaac 720 ttgatcgctc tctcactggg actcactccc aatttcaagt ccaattttga cctggccgag 780 gacgcgaagc tgcaactctc aaaggacacc tacgacgacg acttggacaa tttgctggca 840 caaattggcg atcagtacgc ggatctgttc cttgccgcta agaacctttc ggacgcaatc 900 ttgctgtccg atatcctgcg cgtgaacacc gaaataacca aagcgccgct tagcgcctcg 960 atgattaagc ggtacgacga gcatcaccag gatctcacgc tgctcaaagc gctcgtgaga 1020 cagcaactgc ctgaaaagta caaggagatt ttcttcgacc agtccaagaa tgggtacgca 1080 gggtacatcg atggaggcgc cagccaggaa gagttctata agttcatcaa gccaatcctg 1140 gaaaagatgg acggaaccga agaactgctg gtcaagctga acagggagga tctgctccgc 1200 aaacagagaa cctttgacaa cggaagcatt ccacaccaga tccatctggg tgagctgcac 1260 gccatcttgc ggcgccagga ggacttttac ccattcctca aggacaaccg ggaaaagatc 1320 gagaaaattc tgacgttccg catcccgtat tacgtgggcc cactggcgcg cggcaattcg 1380 cgcttcgcgt ggatgactag aaaatcagag gaaaccatca ctccttggaa tttcgaggaa 1440 gttgtggata agggagcttc ggcacaatcc ttcatcgaac gaatgaccaa cttcgacaag 1500 aatctcccaa acgagaaggt gcttcctaag cacagcctcc tttacgaata cttcactgtc 1560 tacaacgaac tgactaaagt gaaatacgtt actgaaggaa tgaggaagcc ggcctttctg 1620 agcggagaac agaagaaagc gattgtcgat ctgctgttca agaccaaccg caaggtgacc 1680 gtcaagcagc ttaaagagga ctacttcaag aagatcgagt gtttcgactc agtggaaatc 1740 agcggagtgg aggacagatt caacgcttcg ctgggaacct atcatgatct cctgaagatc 1800 atcaaggaca aggacttcct tgacaacgag gagaacgagg acatcctgga agatatcgtc 1860 ctgaccttga cccttttcga ggatcgcgag atgatcgagg agaggcttaa gacctacgct 1920 catctcttcg acgataaggt catgaaacaa ctcaagcgcc gccggtacac tggttggggc 1980 cgcctctccc gcaagctgat caacggtatt cgcgataaac agagcggtaa aactatcctg 2040 gatttcctca aatcggatgg cttcgctaat cgtaacttca tgcagttgat ccacgacgac 2100 agcctgacct ttaaggagga catccagaaa gcacaagtga gcggacaggg agactcactc 2160 catgaacaca tcgcgaatct ggccggttcg ccggcgatta agaagggaat cctgcaaact 2220 gtgaaggtgg tggacgagct ggtgaaggtc atgggacggc acaaaccgga gaatatcgtg 2280 attgaaatgg cccgagaaaa ccagactacc cagaagggcc agaagaactc ccgcgaaagg 2340 atgaagcgga tcgaagaagg aatcaaggag ctgggcagcc agatcctgaa agagcacccg 2400 gtggaaaaca cgcagctgca gaacgagaag ctctacctgt actatttgca aaatggacgg 2460 gacatgtacg tggaccaaga gctggacatc aatcggttgt ctgattacga cgtggaccac 2520 atcgttccac agtcctttct gaaggatgac tccatcgata acaaggtgtt gactcgcagc 2580 gacaagaaca gagggaagtc agataatgtg ccatcggagg aggtcgtgaa gaagatgaag 2640 aattactggc ggcagctcct gaatgcgaag ctgattaccc agagaaagtt tgacaatctc 2700 actaaagccg agcgcggcgg actctcagag ctggataagg ctggattcat caaacggcag 2760 ctggtcgaga ctcggcagat taccaagcac gtggcgcaga tcctggactc ccgcatgaac 2820 actaaatacg acgagaacga taagctcatc cgggaagtga aggtgattac cctgaaaagc 2880 aaacttgtgt cggactttcg gaaggacttt cagttttaca aagtgagaga aatcaacaac 2940 taccatcacg cgcatgacgc atacctcaac gctgtggtcg gcaccgccct gatcaagaag 3000 taccctaaac ttgaatcgga gtttgtgtac ggagactaca aggtctacga cgtgaggaag 3060 atgatagcca agtccgaaca ggaaatcggg aaagcaactg cgaaatactt cttttactca 3120 aacatcatga acttcttcaa gactgaaatt acgctggcca atggagaaat caggaagagg 3180 ccactgatcg aaactaacgg agaaacgggc gaaatcgtgt gggacaaggg cagggacttc 3240 gcaactgttc gcaaagtgct ctctatgccg caagtcaata ttgtgaagaa aaccgaagtg 3300 caaaccggcg gattttcaaa ggaatcgatc ctcccaaaga gaaatagcga caagctcatt 3360 gcacgcaaga aagactggga cccgaagaag tacggaggat tcgattcgcc gactgtcgca 3420 tactccgtcc tcgtggtggc caaggtggag aagggaaaga gcaagaagct caaatccgtc 3480 aaagagctgc tggggattac catcatggaa cgatcctcgt tcgagaagaa cccgattgat 3540 ttcctggagg cgaagggtta caaggaggtg aagaaggatc tgatcatcaa actgcccaag 3600 tactcactgt tcgaactgga aaatggtcgg aagcgcatgc tggcttcggc cggagaactc 3660 cagaaaggaa atgagctggc cttgcctagc aagtacgtca acttcctcta tcttgcttcg 3720 cactacgaga aactcaaagg gtcaccggaa gataacgaac agaagcagct tttcgtggag 3780 cagcacaagc attatctgga tgaaatcatc gaacaaatct ccgagttttc aaagcgcgtg 3840 atcctcgccg acgccaacct cgacaaagtc ctgtcggcct acaataagca tagagataag 3900 ccgatcagag aacaggccga gaacattatc cacttgttca ccctgactaa cctgggagct 3960 ccagccgcct tcaagtactt cgatactact atcgaccgca aaagatacac gtccaccaag 4020 gaagttctgg acgcgaccct gatccaccaa agcatcactg gactctacga aactaggatc 4080 gatctgtcgc agctgggtgg cgatggtggc ggtggatcct acccatacga cgtgcctgac 4140 tacgcctccg gaggtggtgg ccccaagaag aaacggaagg tgtgatag 4188 <210> 46 <211> 4459 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 46 gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatct gccaccatgg ataagaagta ctcgatcggg ctggatatcg gaactaattc 120 cgtgggttgg gcagtgatca cggatgaata caaagtgccg tccaagaagt tcaaggtcct 180 ggggaacacc gatagacaca gcatcaagaa gaatctcatc ggagccctgc tgtttgactc 240 cggcgaaacc gcagaagcga cccggctcaa acgtaccgcg aggcgacgct acacccggcg 300 gaagaatcgc atctgctatc tgcaagaaat cttttcgaac gaaatggcaa aggtggacga 360 cagcttcttc caccgcctgg aagaatcttt cctggtggag gaggacaaga agcatgaacg 420 gcatcctatc tttggaaaca tcgtggacga agtggcgtac cacgaaaagt acccgaccat 480 ctaccatctg cggaagaagt tggttgactc aactgacaag gccgacctca gattgatcta 540 cttggccctc gcccatatga tcaaattccg cggacacttc ctgatcgaag gcgatctgaa 600 ccctgataac tccgacgtgg ataagctgtt cattcaactg gtgcagacct acaaccaact 660 gttcgaagaa aacccaatca atgccagcgg cgtcgatgcc aaggccatcc tgtccgcccg 720 gctgtcgaag tcgcggcgcc tcgaaaacct gatcgcacag ctgccgggag agaagaagaa 780 cggacttttc ggcaacttga tcgctctctc actgggactc actcccaatt tcaagtccaa 840 ttttgacctg gccgaggacg cgaagctgca actctcaaag gacacctacg acgacgactt 900 ggacaatttg ctggcacaaa ttggcgatca gtacgcggat ctgttccttg ccgctaagaa 960 cctttcggac gcaatcttgc tgtccgatat cctgcgcgtg aacaccgaaa taaccaaagc 1020 gccgcttagc gcctcgatga ttaagcggta cgacgagcat caccaggatc tcacgctgct 1080 caaagcgctc gtgagacagc aactgcctga aaagtacaag gagattttct tcgaccagtc 1140 caagaatggg tacgcagggt acatcgatgg aggcgccagc caggaagagt tctataagtt 1200 catcaagcca atcctggaaa agatggacgg aaccgaagaa ctgctggtca agctgaacag 1260 ggaggatctg ctccgcaaac agagaacctt tgacaacgga agcattccac accagatcca 1320 tctgggtgag ctgcacgcca tcttgcggcg ccaggaggac ttttacccat tcctcaagga 1380 caaccgggaa aagatcgaga aaattctgac gttccgcatc ccgtattacg tgggcccact 1440 ggcgcgcggc aattcgcgct tcgcgtggat gactagaaaa tcagaggaaa ccatcactcc 1500 ttggaatttc gaggaagttg tggataaggg agcttcggca caatccttca tcgaacgaat 1560 gaccaacttc gacaagaatc tcccaaacga gaaggtgctt cctaagcaca gcctccttta 1620 cgaatacttc actgtctaca acgaactgac taaagtgaaa tacgttactg aaggaatgag 1680 gaagccggcc tttctgagcg gagaacagaa gaaagcgatt gtcgatctgc tgttcaagac 1740 caaccgcaag gtgaccgtca agcagcttaa agaggactac ttcaagaaga tcgagtgttt 1800 cgactcagtg gaaatcagcg gagtggagga cagattcaac gcttcgctgg gaacctatca 1860 tgatctcctg aagatcatca aggacaagga cttccttgac aacgaggaga acgaggacat 1920 cctggaagat atcgtcctga ccttgaccct tttcgaggat cgcgagatga tcgaggagag 1980 gcttaagacc tacgctcatc tcttcgacga taaggtcatg aaacaactca agcgccgccg 2040 gtacactggt tggggccgcc tctcccgcaa gctgatcaac ggtattcgcg ataaacagag 2100 cggtaaaact atcctggatt tcctcaaatc ggatggcttc gctaatcgta acttcatgca 2160 gttgatccac gacgacagcc tgacctttaa ggaggacatc cagaaagcac aagtgagcgg 2220 acagggagac tcactccatg aacacatcgc gaatctggcc ggttcgccgg cgattaagaa 2280 gggaatcctg caaactgtga aggtggtgga cgagctggtg aaggtcatgg gacggcacaa 2340 accggagaat atcgtgattg aaatggcccg agaaaaccag actacccaga agggccagaa 2400 gaactcccgc gaaaggatga agcggatcga agaaggaatc aaggagctgg gcagccagat 2460 cctgaaagag cacccggtgg aaaacacgca gctgcagaac gagaagctct acctgtacta 2520 tttgcaaaat ggacgggaca tgtacgtgga ccaagagctg gacatcaatc ggttgtctga 2580 ttacgacgtg gaccacatcg ttccacagtc ctttctgaag gatgactcca tcgataacaa 2640 ggtgttgact cgcagcgaca agaacagagg gaagtcagat aatgtgccat cggaggaggt 2700 cgtgaagaag atgaagaatt actggcggca gctcctgaat gcgaagctga ttacccagag 2760 aaagtttgac aatctcacta aagccgagcg cggcggactc tcagagctgg ataaggctgg 2820 attcatcaaa cggcagctgg tcgagactcg gcagattacc aagcacgtgg cgcagatcct 2880 ggactcccgc atgaacacta aatacgacga gaacgataag ctcatccggg aagtgaaggt 2940 gattaccctg aaaagcaaac ttgtgtcgga ctttcggaag gactttcagt tttacaaagt 3000 gagagaaatc aacaactacc atcacgcgca tgacgcatac ctcaacgctg tggtcggcac 3060 cgccctgatc aagaagtacc ctaaacttga atcggagttt gtgtacggag actacaaggt 3120 ctacgacgtg aggaagatga tagccaagtc cgaacaggaa atcgggaaag caactgcgaa 3180 atacttcttt tactcaaaca tcatgaactt cttcaagact gaaattacgc tggccaatgg 3240 agaaatcagg aagaggccac tgatcgaaac taacggagaa acgggcgaaa tcgtgtggga 3300 caagggcagg gacttcgcaa ctgttcgcaa agtgctctct atgccgcaag tcaatattgt 3360 gaagaaaacc gaagtgcaaa ccggcggatt ttcaaaggaa tcgatcctcc caaagagaaa 3420 tagcgacaag ctcattgcac gcaagaaaga ctgggacccg aagaagtacg gaggattcga 3480 ttcgccgact gtcgcatact ccgtcctcgt ggtggccaag gtggagaagg gaaagagcaa 3540 gaagctcaaa tccgtcaaag agctgctggg gattaccatc atggaacgat cctcgttcga 3600 gaagaacccg attgatttcc tggaggcgaa gggttacaag gaggtgaaga aggatctgat 3660 catcaaactg cccaagtact cactgttcga actggaaaat ggtcggaagc gcatgctggc 3720 ttcggccgga gaactccaga aaggaaatga gctggccttg cctagcaagt acgtcaactt 3780 cctctatctt gcttcgcact acgagaaact caaagggtca ccggaagata acgaacagaa 3840 gcagcttttc gtggagcagc acaagcatta tctggatgaa atcatcgaac aaatctccga 3900 gttttcaaag cgcgtgatcc tcgccgacgc caacctcgac aaagtcctgt cggcctacaa 3960 taagcataga gataagccga tcagagaaca ggccgagaac attatccact tgttcaccct 4020 gactaacctg ggagctccag ccgccttcaa gtacttcgat actactatcg accgcaaaag 4080 atacacgtcc accaaggaag ttctggacgc gaccctgatc caccaaagca tcactggact 4140 ctacgaaact aggatcgatc tgtcgcagct gggtggcgat ggtggcggtg gatcctaccc 4200 atacgacgtg cctgactacg cctccggagg tggtggcccc aagaagaaac ggaaggtgtg 4260 atagctagcc atcacattta aaagcatctc agcctaccat gagaataaga gaaagaaaat 4320 gaagatcaat agcttattca tctctttttc tttttcgttg gtgtaaagcc aacaccctgt 4380 ctaaaaaaca taaatttctt taatcatttt gcctcttttc tctgtgcttc aattaataaa 4440 aaatggaaag aacctcgag 4459 <210> 47 <211> 4453 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 47 gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatct atggataaga agtactcgat cgggctggat atcggaacta attccgtggg 120 ttgggcagtg atcacggatg aatacaaagt gccgtccaag aagttcaagg tcctggggaa 180 caccgataga cacagcatca agaagaatct catcggagcc ctgctgtttg actccggcga 240 aaccgcagaa gcgacccggc tcaaacgtac cgcgaggcga cgctacaccc ggcggaagaa 300 tcgcatctgc tatctgcaag aaatcttttc gaacgaaatg gcaaaggtgg acgacagctt 360 cttccaccgc ctggaagaat ctttcctggt ggaggaggac aagaagcatg aacggcatcc 420 tatctttgga aacatcgtgg acgaagtggc gtaccacgaa aagtacccga ccatctacca 480 tctgcggaag aagttggttg actcaactga caaggccgac ctcagattga tctacttggc 540 cctcgcccat atgatcaaat tccgcggaca cttcctgatc gaaggcgatc tgaaccctga 600 taactccgac gtggataagc tgttcattca actggtgcag acctacaacc aactgttcga 660 agaaaaccca atcaatgcca gcggcgtcga tgccaaggcc atcctgtccg cccggctgtc 720 gaagtcgcgg cgcctcgaaa acctgatcgc acagctgccg ggagagaaga agaacggact 780 tttcggcaac ttgatcgctc tctcactggg actcactccc aatttcaagt ccaattttga 840 cctggccgag gacgcgaagc tgcaactctc aaaggacacc tacgacgacg acttggacaa 900 tttgctggca caaattggcg atcagtacgc ggatctgttc cttgccgcta agaacctttc 960 ggacgcaatc ttgctgtccg atatcctgcg cgtgaacacc gaaataacca aagcgccgct 1020 tagcgcctcg atgattaagc ggtacgacga gcatcaccag gatctcacgc tgctcaaagc 1080 gctcgtgaga cagcaactgc ctgaaaagta caaggagatt ttcttcgacc agtccaagaa 1140 tgggtacgca gggtacatcg atggaggcgc cagccaggaa gagttctata agttcatcaa 1200 gccaatcctg gaaaagatgg acggaaccga agaactgctg gtcaagctga acagggagga 1260 tctgctccgc aaacagagaa cctttgacaa cggaagcatt ccacaccaga tccatctggg 1320 tgagctgcac gccatcttgc ggcgccagga ggacttttac ccattcctca aggacaaccg 1380 ggaaaagatc gagaaaattc tgacgttccg catcccgtat tacgtgggcc cactggcgcg 1440 cggcaattcg cgcttcgcgt ggatgactag aaaatcagag gaaaccatca ctccttggaa 1500 tttcgaggaa gttgtggata agggagcttc ggcacaatcc ttcatcgaac gaatgaccaa 1560 cttcgacaag aatctcccaa acgagaaggt gcttcctaag cacagcctcc tttacgaata 1620 cttcactgtc tacaacgaac tgactaaagt gaaatacgtt actgaaggaa tgaggaagcc 1680 ggcctttctg agcggagaac agaagaaagc gattgtcgat ctgctgttca agaccaaccg 1740 caaggtgacc gtcaagcagc ttaaagagga ctacttcaag aagatcgagt gtttcgactc 1800 agtggaaatc agcggagtgg aggacagatt caacgcttcg ctgggaacct atcatgatct 1860 cctgaagatc atcaaggaca aggacttcct tgacaacgag gagaacgagg acatcctgga 1920 agatatcgtc ctgaccttga cccttttcga ggatcgcgag atgatcgagg agaggcttaa 1980 gacctacgct catctcttcg acgataaggt catgaaacaa ctcaagcgcc gccggtacac 2040 tggttggggc cgcctctccc gcaagctgat caacggtatt cgcgataaac agagcggtaa 2100 aactatcctg gatttcctca aatcggatgg cttcgctaat cgtaacttca tgcagttgat 2160 ccacgacgac agcctgacct ttaaggagga catccagaaa gcacaagtga gcggacaggg 2220 agactcactc catgaacaca tcgcgaatct ggccggttcg ccggcgatta agaagggaat 2280 cctgcaaact gtgaaggtgg tggacgagct ggtgaaggtc atgggacggc acaaaccgga 2340 gaatatcgtg attgaaatgg cccgagaaaa ccagactacc cagaagggcc agaagaactc 2400 ccgcgaaagg atgaagcgga tcgaagaagg aatcaaggag ctgggcagcc agatcctgaa 2460 agagcacccg gtggaaaaca cgcagctgca gaacgagaag ctctacctgt actatttgca 2520 aaatggacgg gacatgtacg tggaccaaga gctggacatc aatcggttgt ctgattacga 2580 cgtggaccac atcgttccac agtcctttct gaaggatgac tccatcgata acaaggtgtt 2640 gactcgcagc gacaagaaca gagggaagtc agataatgtg ccatcggagg aggtcgtgaa 2700 gaagatgaag aattactggc ggcagctcct gaatgcgaag ctgattaccc agagaaagtt 2760 tgacaatctc actaaagccg agcgcggcgg actctcagag ctggataagg ctggattcat 2820 caaacggcag ctggtcgaga ctcggcagat taccaagcac gtggcgcaga tcctggactc 2880 ccgcatgaac actaaatacg acgagaacga taagctcatc cgggaagtga aggtgattac 2940 cctgaaaagc aaacttgtgt cggactttcg gaaggacttt cagttttaca aagtgagaga 3000 aatcaacaac taccatcacg cgcatgacgc atacctcaac gctgtggtcg gcaccgccct 3060 gatcaagaag taccctaaac ttgaatcgga gtttgtgtac ggagactaca aggtctacga 3120 cgtgaggaag atgatagcca agtccgaaca ggaaatcggg aaagcaactg cgaaatactt 3180 cttttactca aacatcatga acttcttcaa gactgaaatt acgctggcca atggagaaat 3240 caggaagagg ccactgatcg aaactaacgg agaaacgggc gaaatcgtgt gggacaaggg 3300 cagggacttc gcaactgttc gcaaagtgct ctctatgccg caagtcaata ttgtgaagaa 3360 aaccgaagtg caaaccggcg gattttcaaa ggaatcgatc ctcccaaaga gaaatagcga 3420 caagctcatt gcacgcaaga aagactggga cccgaagaag tacggaggat tcgattcgcc 3480 gactgtcgca tactccgtcc tcgtggtggc caaggtggag aagggaaaga gcaagaagct 3540 caaatccgtc aaagagctgc tggggattac catcatggaa cgatcctcgt tcgagaagaa 3600 cccgattgat ttcctggagg cgaagggtta caaggaggtg aagaaggatc tgatcatcaa 3660 actgcccaag tactcactgt tcgaactgga aaatggtcgg aagcgcatgc tggcttcggc 3720 cggagaactc cagaaaggaa atgagctggc cttgcctagc aagtacgtca acttcctcta 3780 tcttgcttcg cactacgaga aactcaaagg gtcaccggaa gataacgaac agaagcagct 3840 tttcgtggag cagcacaagc attatctgga tgaaatcatc gaacaaatct ccgagttttc 3900 aaagcgcgtg atcctcgccg acgccaacct cgacaaagtc ctgtcggcct acaataagca 3960 tagagataag ccgatcagag aacaggccga gaacattatc cacttgttca ccctgactaa 4020 cctgggagct ccagccgcct tcaagtactt cgatactact atcgaccgca aaagatacac 4080 gtccaccaag gaagttctgg acgcgaccct gatccaccaa agcatcactg gactctacga 4140 aactaggatc gatctgtcgc agctgggtgg cgatggtggc ggtggatcct acccatacga 4200 cgtgcctgac tacgcctccg gaggtggtgg ccccaagaag aaacggaagg tgtgatagct 4260 agccatcaca tttaaaagca tctcagccta ccatgagaat aagagaaaga aaatgaagat 4320 caatagctta ttcatctctt tttctttttc gttggtgtaa agccaacacc ctgtctaaaa 4380 aacataaatt tctttaatca ttttgcctct tttctctgtg cttcaattaa taaaaaatgg 4440 aaagaacctc gag 4453 <210> 48 <211> 4403 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 48 gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatcc atgcctaaga aaaagcggaa ggtcgacggg gataagaagt actcaatcgg 120 gctggatatc ggaactaatt ccgtgggttg ggcagtgatc acggatgaat acaaagtgcc 180 gtccaagaag ttcaaggtcc tggggaacac cgatagacac agcatcaaga aaaatctcat 240 cggagccctg ctgtttgact ccggcgaaac cgcagaagcg acccggctca aacgtaccgc 300 gaggcgacgc tacacccggc ggaagaatcg catctgctat ctgcaagaga tcttttcgaa 360 cgaaatggca aaggtcgacg acagcttctt ccaccgcctg gaagaatctt tcctggtgga 420 ggaggacaag aagcatgaac ggcatcctat ctttggaaac atcgtcgacg aagtggcgta 480 ccacgaaaag tacccgacca tctaccatct gcggaagaag ttggttgact caactgacaa 540 ggccgacctc agattgatct acttggccct cgcccatatg atcaaattcc gcggacactt 600 cctgatcgaa ggcgatctga accctgataa ctccgacgtg gataagcttt tcattcaact 660 ggtgcagacc tacaaccaac tgttcgaaga aaacccaatc aatgctagcg gcgtcgatgc 720 caaggccatc ctgtccgccc ggctgtcgaa gtcgcggcgc ctcgaaaacc tgatcgcaca 780 gctgccggga gagaaaaaga acggactttt cggcaacttg atcgctctct cactgggact 840 cactcccaat ttcaagtcca attttgacct ggccgaggac gcgaagctgc aactctcaaa 900 ggacacctac gacgacgact tggacaattt gctggcacaa attggcgatc agtacgcgga 960 tctgttcctt gccgctaaga acctttcgga cgcaatcttg ctgtccgata tcctgcgcgt 1020 gaacaccgaa ataaccaaag cgccgcttag cgcctcgatg attaagcggt acgacgagca 1080 tcaccaggat ctcacgctgc tcaaagcgct cgtgagacag caactgcctg aaaagtacaa 1140 ggagatcttc ttcgaccagt ccaagaatgg gtacgcaggg tacatcgatg gaggcgctag 1200 ccaggaagag ttctataagt tcatcaagcc aatcctggaa aagatggacg gaaccgaaga 1260 actgctggtc aagctgaaca gggaggatct gctccggaaa cagagaacct ttgacaacgg 1320 atccattccc caccagatcc atctgggtga gctgcacgcc atcttgcggc gccaggagga 1380 cttttaccca ttcctcaagg acaaccggga aaagatcgag aaaattctga cgttccgcat 1440 cccgtattac gtgggcccac tggcgcgcgg caattcgcgc ttcgcgtgga tgactagaaa 1500 atcagaggaa accatcactc cttggaattt cgaggaagtt gtggataagg gagcttcggc 1560 acaaagcttc atcgaacgaa tgaccaactt cgacaagaat ctcccaaacg agaaggtgct 1620 tcctaagcac agcctccttt acgaatactt cactgtctac aacgaactga ctaaagtgaa 1680 atacgttact gaaggaatga ggaagccggc ctttctgtcc ggagaacaga agaaagcaat 1740 tgtcgatctg ctgttcaaga ccaaccgcaa ggtgaccgtc aagcagctta aagaggacta 1800 cttcaagaag atcgagtgtt tcgactcagt ggaaatcagc ggggtggagg acagattcaa 1860 cgcttcgctg ggaacctatc atgatctcct gaagatcatc aaggacaagg acttccttga 1920 caacgaggag aacgaggaca tcctggaaga tatcgtcctg accttgaccc ttttcgagga 1980 tcgcgagatg atcgaggaga ggcttaagac ctacgctcat ctcttcgacg ataaggtcat 2040 gaaacaactc aagcgccgcc ggtacactgg ttggggccgc ctctcccgca agctgatcaa 2100 cggtattcgc gataaacaga gcggtaaaac tatcctggat ttcctcaaat cggatggctt 2160 cgctaatcgt aacttcatgc aattgatcca cgacgacagc ctgaccttta aggaggacat 2220 ccaaaaagca caagtgtccg gacagggaga ctcactccat gaacacatcg cgaatctggc 2280 cggttcgccg gcgattaaga agggaattct gcaaactgtg aaggtggtcg acgagctggt 2340 gaaggtcatg ggacggcaca aaccggagaa tatcgtgatt gaaatggccc gagaaaacca 2400 gactacccag aagggccaga aaaactcccg cgaaaggatg aagcggatcg aagaaggaat 2460 caaggagctg ggcagccaga tcctgaaaga gcacccggtg gaaaacacgc agctgcagaa 2520 cgagaagctc tacctgtact atttgcaaaa tggacgggac atgtacgtgg accaagagct 2580 ggacatcaat cggttgtctg attacgacgt ggaccacatc gttccacagt cctttctgaa 2640 ggatgactcg atcgataaca aggtgttgac tcgcagcgac aagaacagag ggaagtcaga 2700 taatgtgcca tcggaggagg tcgtgaagaa gatgaagaat tactggcggc agctcctgaa 2760 tgcgaagctg attacccaga gaaagtttga caatctcact aaagccgagc gcggcggact 2820 ctcagagctg gataaggctg gattcatcaa acggcagctg gtcgagactc ggcagattac 2880 caagcacgtg gcgcagatct tggactcccg catgaacact aaatacgacg agaacgataa 2940 gctcatccgg gaagtgaagg tgattaccct gaaaagcaaa cttgtgtcgg actttcggaa 3000 ggactttcag ttttacaaag tgagagaaat caacaactac catcacgcgc atgacgcata 3060 cctcaacgct gtggtcggta ccgccctgat caaaaagtac cctaaacttg aatcggagtt 3120 tgtgtacgga gactacaagg tctacgacgt gaggaagatg atagccaagt ccgaacagga 3180 aatcgggaaa gcaactgcga aatacttctt ttactcaaac atcatgaact ttttcaagac 3240 tgaaattacg ctggccaatg gagaaatcag gaagaggcca ctgatcgaaa ctaacggaga 3300 aacgggcgaa atcgtgtggg acaagggcag ggacttcgca actgttcgca aagtgctctc 3360 tatgccgcaa gtcaatattg tgaagaaaac cgaagtgcaa accggcggat tttcaaagga 3420 atcgatcctc ccaaagagaa atagcgacaa gctcattgca cgcaagaaag actgggaccc 3480 gaagaagtac ggaggattcg attcgccgac tgtcgcatac tccgtcctcg tggtggccaa 3540 ggtggagaag ggaaagagca aaaagctcaa atccgtcaaa gagctgctgg ggattaccat 3600 catggaacga tcctcgttcg agaagaaccc gattgatttc ctcgaggcga agggttacaa 3660 ggaggtgaag aaggatctga tcatcaaact ccccaagtac tcactgttcg aactggaaaa 3720 tggtcggaag cgcatgctgg cttcggccgg agaactccaa aaaggaaatg agctggcctt 3780 gcctagcaag tacgtcaact tcctctatct tgcttcgcac tacgaaaaac tcaaagggtc 3840 accggaagat aacgaacaga agcagctttt cgtggagcag cacaagcatt atctggatga 3900 aatcatcgaa caaatctccg agttttcaaa gcgcgtgatc ctcgccgacg ccaacctcga 3960 caaagtcctg tcggcctaca ataagcatag agataagccg atcagagaac aggccgagaa 4020 cattatccac ttgttcaccc tgactaacct gggagcccca gccgccttca agtacttcga 4080 tactactatc gatcgcaaaa gatacacgtc caccaaggaa gttctggacg cgaccctgat 4140 ccaccaaagc atcactggac tctacgaaac taggatcgat ctgtcgcagc tgggtggcga 4200 ttgatagtct agccatcaca tttaaaagca tctcagccta ccatgagaat aagagaaaga 4260 aaatgaagat caatagctta ttcatctctt tttctttttc gttggtgtaa agccaacacc 4320 ctgtctaaaa aacataaatt tctttaatca ttttgcctct tttctctgtg cttcaattaa 4380 taaaaaatgg aaagaacctc gag 4403 <210> 49 <211> 4409 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 49 gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatcc gccaccatgc ctaagaaaaa gcggaaggtc gacggggata agaagtactc 120 aatcgggctg gatatcggaa ctaattccgt gggttgggca gtgatcacgg atgaatacaa 180 agtgccgtcc aagaagttca aggtcctggg gaacaccgat agacacagca tcaagaaaaa 240 tctcatcgga gccctgctgt ttgactccgg cgaaaccgca gaagcgaccc ggctcaaacg 300 taccgcgagg cgacgctaca cccggcggaa gaatcgcatc tgctatctgc aagagatctt 360 ttcgaacgaa atggcaaagg tcgacgacag cttcttccac cgcctggaag aatctttcct 420 ggtggaggag gacaagaagc atgaacggca tcctatcttt ggaaacatcg tcgacgaagt 480 ggcgtaccac gaaaagtacc cgaccatcta ccatctgcgg aagaagttgg ttgactcaac 540 tgacaaggcc gacctcagat tgatctactt ggccctcgcc catatgatca aattccgcgg 600 acacttcctg atcgaaggcg atctgaaccc tgataactcc gacgtggata agcttttcat 660 tcaactggtg cagacctaca accaactgtt cgaagaaaac ccaatcaatg ctagcggcgt 720 cgatgccaag gccatcctgt ccgcccggct gtcgaagtcg cggcgcctcg aaaacctgat 780 cgcacagctg ccgggagaga aaaagaacgg acttttcggc aacttgatcg ctctctcact 840 gggactcact cccaatttca agtccaattt tgacctggcc gaggacgcga agctgcaact 900 ctcaaaggac acctacgacg acgacttgga caatttgctg gcacaaattg gcgatcagta 960 cgcggatctg ttccttgccg ctaagaacct ttcggacgca atcttgctgt ccgatatcct 1020 gcgcgtgaac accgaaataa ccaaagcgcc gcttagcgcc tcgatgatta agcggtacga 1080 cgagcatcac caggatctca cgctgctcaa agcgctcgtg agacagcaac tgcctgaaaa 1140 gtacaaggag atcttcttcg accagtccaa gaatgggtac gcagggtaca tcgatggagg 1200 cgctagccag gaagagttct ataagttcat caagccaatc ctggaaaaga tggacggaac 1260 cgaagaactg ctggtcaagc tgaacaggga ggatctgctc cggaaacaga gaacctttga 1320 caacggatcc attccccacc agatccatct gggtgagctg cacgccatct tgcggcgcca 1380 ggaggacttt tacccattcc tcaaggacaa ccgggaaaag atcgagaaaa ttctgacgtt 1440 ccgcatcccg tattacgtgg gcccactggc gcgcggcaat tcgcgcttcg cgtggatgac 1500 tagaaaatca gaggaaacca tcactccttg gaatttcgag gaagttgtgg ataagggagc 1560 ttcggcacaa agcttcatcg aacgaatgac caacttcgac aagaatctcc caaacgagaa 1620 ggtgcttcct aagcacagcc tcctttacga atacttcact gtctacaacg aactgactaa 1680 agtgaaatac gttactgaag gaatgaggaa gccggccttt ctgtccggag aacagaagaa 1740 agcaattgtc gatctgctgt tcaagaccaa ccgcaaggtg accgtcaagc agcttaaaga 1800 ggactacttc aagaagatcg agtgtttcga ctcagtggaa atcagcgggg tggaggacag 1860 attcaacgct tcgctgggaa cctatcatga tctcctgaag atcatcaagg acaaggactt 1920 ccttgacaac gaggagaacg aggacatcct ggaagatatc gtcctgacct tgaccctttt 1980 cgaggatcgc gagatgatcg aggagaggct taagacctac gctcatctct tcgacgataa 2040 ggtcatgaaa caactcaagc gccgccggta cactggttgg ggccgcctct cccgcaagct 2100 gatcaacggt attcgcgata aacagagcgg taaaactatc ctggatttcc tcaaatcgga 2160 tggcttcgct aatcgtaact tcatgcaatt gatccacgac gacagcctga cctttaagga 2220 ggacatccaa aaagcacaag tgtccggaca gggagactca ctccatgaac acatcgcgaa 2280 tctggccggt tcgccggcga ttaagaaggg aattctgcaa actgtgaagg tggtcgacga 2340 gctggtgaag gtcatgggac ggcacaaacc ggagaatatc gtgattgaaa tggcccgaga 2400 aaaccagact acccagaagg gccagaaaaa ctcccgcgaa aggatgaagc ggatcgaaga 2460 aggaatcaag gagctgggca gccagatcct gaaagagcac ccggtggaaa acacgcagct 2520 gcagaacgag aagctctacc tgtactattt gcaaaatgga cgggacatgt acgtggacca 2580 agagctggac atcaatcggt tgtctgatta cgacgtggac cacatcgttc cacagtcctt 2640 tctgaaggat gactcgatcg ataacaaggt gttgactcgc agcgacaaga acagagggaa 2700 gtcagataat gtgccatcgg aggaggtcgt gaagaagatg aagaattact ggcggcagct 2760 cctgaatgcg aagctgatta cccagagaaa gtttgacaat ctcactaaag ccgagcgcgg 2820 cggactctca gagctggata aggctggatt catcaaacgg cagctggtcg agactcggca 2880 gattaccaag cacgtggcgc agatcttgga ctcccgcatg aacactaaat acgacgagaa 2940 cgataagctc atccgggaag tgaaggtgat taccctgaaa agcaaacttg tgtcggactt 3000 tcggaaggac tttcagtttt acaaagtgag agaaatcaac aactaccatc acgcgcatga 3060 cgcatacctc aacgctgtgg tcggtaccgc cctgatcaaa aagtacccta aacttgaatc 3120 ggagtttgtg tacggagact acaaggtcta cgacgtgagg aagatgatag ccaagtccga 3180 acaggaaatc gggaaagcaa ctgcgaaata cttcttttac tcaaacatca tgaacttttt 3240 caagactgaa attacgctgg ccaatggaga aatcaggaag aggccactga tcgaaactaa 3300 cggagaaacg ggcgaaatcg tgtgggacaa gggcagggac ttcgcaactg ttcgcaaagt 3360 gctctctatg ccgcaagtca atattgtgaa gaaaaccgaa gtgcaaaccg gcggattttc 3420 aaaggaatcg atcctcccaa agagaaatag cgacaagctc attgcacgca agaaagactg 3480 ggacccgaag aagtacggag gattcgattc gccgactgtc gcatactccg tcctcgtggt 3540 ggccaaggtg gagaagggaa agagcaaaaa gctcaaatcc gtcaaagagc tgctggggat 3600 taccatcatg gaacgatcct cgttcgagaa gaacccgatt gatttcctcg aggcgaaggg 3660 ttacaaggag gtgaagaagg atctgatcat caaactcccc aagtactcac tgttcgaact 3720 ggaaaatggt cggaagcgca tgctggcttc ggccggagaa ctccaaaaag gaaatgagct 3780 ggccttgcct agcaagtacg tcaacttcct ctatcttgct tcgcactacg aaaaactcaa 3840 agggtcaccg gaagataacg aacagaagca gcttttcgtg gagcagcaca agcattatct 3900 ggatgaaatc atcgaacaaa tctccgagtt ttcaaagcgc gtgatcctcg ccgacgccaa 3960 cctcgacaaa gtcctgtcgg cctacaataa gcatagagat aagccgatca gagaacaggc 4020 cgagaacatt atccacttgt tcaccctgac taacctggga gccccagccg ccttcaagta 4080 cttcgatact actatcgatc gcaaaagata cacgtccacc aaggaagttc tggacgcgac 4140 cctgatccac caaagcatca ctggactcta cgaaactagg atcgatctgt cgcagctggg 4200 tggcgattga tagtctagcc atcacattta aaagcatctc agcctaccat gagaataaga 4260 gaaagaaaat gaagatcaat agcttattca tctctttttc tttttcgttg gtgtaaagcc 4320 aacaccctgt ctaaaaaaca taaatttctt taatcatttt gcctcttttc tctgtgcttc 4380 aattaataaa aaatggaaag aacctcgag 4409 <210> 50 <211> 4140 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 50 atggacaaga agtacagcat cggactggac atcggaacaa acagcgtcgg atgggcagtc 60 atcacagacg aatacaaggt cccgagcaag aagttcaagg tcctgggaaa cacagacaga 120 cacagcatca agaagaacct gatcggagca ctgctgttcg acagcggaga aacagcagaa 180 gcaacaagac tgaagagaac agcaagaaga agatacacaa gaagaaagaa cagaatctgc 240 tacctgcagg aaatcttcag caacgaaatg gcaaaggtcg acgacagctt cttccaccgg 300 ctggaagaaa gcttcctggt cgaagaagac aagaagcacg aaagacaccc gatcttcgga 360 aacatcgtcg acgaagtcgc ataccacgaa aagtacccga caatctacca cctgagaaag 420 aagctggtcg acagcacaga caaggcagac ctgagactga tctacctggc actggcacac 480 atgatcaagt tcagaggaca cttcctgatc gaaggagacc tgaacccgga caacagcgac 540 gtcgacaagc tgttcatcca gctggtccag acatacaacc agctgttcga agaaaacccg 600 atcaacgcaa gcggagtcga cgcaaaggca atcctgagcg caagactgag caagagcaga 660 agactggaaa acctgatcgc acagctgccg ggagaaaaga agaacggact gttcggaaac 720 ctgatcgcac tgagcctggg actgacaccg aacttcaaga gcaacttcga cctggcagaa 780 gacgcaaagc tgcagctgag caaggacaca tacgacgacg acctggacaa cctgctggca 840 cagatcggag accagtacgc agacctgttc ctggcagcaa agaacctgag cgacgcaatc 900 ctgctgagcg acatcctgag agtcaacaca gaaatcacaa aggcaccgct gagcgcaagc 960 atgatcaaga gatacgacga acaccaccag gacctgacac tgctgaaggc actggtcaga 1020 cagcagctgc cggaaaagta caaggaaatc ttcttcgacc agagcaagaa cggatacgca 1080 ggatacatcg acggaggagc aagccaggaa gaattctaca agttcatcaa gccgatcctg 1140 gaaaagatgg acggaacaga agaactgctg gtcaagctga acagagaaga cctgctgaga 1200 aagcagagaa cattcgacaa cggaagcatc ccgcaccaga tccacctggg agaactgcac 1260 gcaatcctga gaagacagga agacttctac ccgttcctga aggacaacag agaaaagatc 1320 gaaaagatcc tgacattcag aatcccgtac tacgtcggac cgctggcaag aggaaacagc 1380 agattcgcat ggatgacaag aaagagcgaa gaaacaatca caccgtggaa cttcgaagaa 1440 gtcgtcgaca agggagcaag cgcacagagc ttcatcgaaa gaatgacaaa cttcgacaag 1500 aacctgccga acgaaaaggt cctgccgaag cacagcctgc tgtacgaata cttcacagtc 1560 tacaacgaac tgacaaaggt caagtacgtc acagaaggaa tgagaaagcc ggcattcctg 1620 agcggagaac agaagaaggc aatcgtcgac ctgctgttca agacaaacag aaaggtcaca 1680 gtcaagcagc tgaaggaaga ctacttcaag aagatcgaat gcttcgacag cgtcgaaatc 1740 agcggagtcg aagacagatt caacgcaagc ctgggaacat accacgacct gctgaagatc 1800 atcaaggaca aggacttcct ggacaacgaa gaaaacgaag acatcctgga agacatcgtc 1860 ctgacactga cactgttcga agacagagaa atgatcgaag aaagactgaa gacatacgca 1920 cacctgttcg acgacaaggt catgaagcag ctgaagagaa gaagatacac aggatgggga 1980 agactgagca gaaagctgat caacggaatc agagacaagc agagcggaaa gacaatcctg 2040 gacttcctga agagcgacgg attcgcaaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacat tcaaggaaga catccagaag gcacaggtca gcggacaggg agacagcctg 2160 cacgaacaca tcgcaaacct ggcaggaagc ccggcaatca agaagggaat cctgcagaca 2220 gtcaaggtcg tcgacgaact ggtcaaggtc atgggaagac acaagccgga aaacatcgtc 2280 atcgaaatgg caagagaaaa ccagacaaca cagaagggac agaagaacag cagagaaaga 2340 atgaagagaa tcgaagaagg aatcaaggaa ctgggaagcc agatcctgaa ggaacacccg 2400 gtcgaaaaca cacagctgca gaacgaaaag ctgtacctgt actacctgca aaacggaaga 2460 gacatgtacg tcgaccagga actggacatc aacagactga gcgactacga cgtcgaccac 2520 atcgtcccgc agagcttcct gaaggacgac agcatcgaca acaaggtcct gacaagaagc 2580 gacaagaaca gaggaaagag cgacaacgtc ccgagcgaag aagtcgtcaa gaagatgaag 2640 aactactgga gacagctgct gaacgcaaag ctgatcacac agagaaagtt cgacaacctg 2700 acaaaggcag agagaggagg actgagcgaa ctggacaagg caggattcat caagagacag 2760 ctggtcgaaa caagacagat cacaaagcac gtcgcacaga tcctggacag cagaatgaac 2820 acaaagtacg acgaaaacga caagctgatc agagaagtca aggtcatcac actgaagagc 2880 aagctggtca gcgacttcag aaaggacttc cagttctaca aggtcagaga aatcaacaac 2940 taccaccacg cacacgacgc atacctgaac gcagtcgtcg gaacagcact gatcaagaag 3000 tacccgaagc tggaaagcga attcgtctac ggagactaca aggtctacga cgtcagaaag 3060 atgatcgcaa agagcgaaca ggaaatcgga aaggcaacag caaagtactt cttctacagc 3120 aacatcatga acttcttcaa gacagaaatc acactggcaa acggagaaat cagaaagaga 3180 ccgctgatcg aaacaaacgg agaaacagga gaaatcgtct gggacaaggg aagagacttc 3240 gcaacagtca gaaaggtcct gagcatgccg caggtcaaca tcgtcaagaa gacagaagtc 3300 cagacaggag gattcagcaa ggaaagcatc ctgccgaaga gaaacagcga caagctgatc 3360 gcaagaaaga aggactggga cccgaagaag tacggaggat tcgacagccc gacagtcgca 3420 tacagcgtcc tggtcgtcgc aaaggtcgaa aagggaaaga gcaagaagct gaagagcgtc 3480 aaggaactgc tgggaatcac aatcatggaa agaagcagct tcgaaaagaa cccgatcgac 3540 ttcctggaag caaagggata caaggaagtc aagaaggacc tgatcatcaa gctgccgaag 3600 tacagcctgt tcgaactgga aaacggaaga aagagaatgc tggcaagcgc aggagaactg 3660 cagaagggaa acgaactggc actgccgagc aagtacgtca acttcctgta cctggcaagc 3720 cactacgaaa agctgaaggg aagcccggaa gacaacgaac agaagcagct gttcgtcgaa 3780 cagcacaagc actacctgga cgaaatcatc gaacagatca gcgaattcag caagagagtc 3840 atcctggcag acgcaaacct ggacaaggtc ctgagcgcat acaacaagca cagagacaag 3900 ccgatcagag aacaggcaga aaacatcatc cacctgttca cactgacaaa cctgggagca 3960 ccggcagcat tcaagtactt cgacacaaca atcgacagaa agagatacac aagcacaaag 4020 gaagtcctgg acgcaacact gatccaccag agcatcacag gactgtacga aacaagaatc 4080 gacctgagcc agctgggagg agacggagga ggaagcccga agaagaagag aaaggtctag 4140 <210> 51 <211> 4411 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 51 gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120 cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180 gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240 cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300 aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360 cagcttcttc caccggctgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420 acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480 ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540 cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600 cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660 gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720 actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780 cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840 cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900 ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960 cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020 accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080 gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140 caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200 catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260 agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320 cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380 caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440 ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500 gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560 gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620 cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680 aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740 aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800 cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860 cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920 cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980 actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040 atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100 cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160 gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220 acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280 gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340 gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400 gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460 cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520 cctgcaaaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580 ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640 ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700 cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760 aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820 attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880 ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940 catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000 cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060 agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120 ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180 gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240 agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300 caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360 caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420 cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480 cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540 gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600 aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660 catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720 aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780 cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840 gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900 attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960 caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020 gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080 atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140 gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200 gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260 gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320 ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380 tcaattaata aaaaatggaa agaacctcga g 4411 <210> 52 <211> 4140 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 52 atggacaaga agtacagcat cggcctggac atcggcacca acagcgtggg ctgggccgtg 60 atcaccgacg agtacaaggt gcccagcaag aagttcaagg tgctgggcaa caccgacaga 120 cacagcatca agaagaacct gatcggcgcc ctgctgttcg acagcggcga gaccgccgag 180 gccaccagac tgaagagaac cgccagaaga agatacacca gaagaaagaa cagaatctgc 240 tacctgcagg agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacaga 300 ctggaggaga gcttcctggt ggaggaggac aagaagcacg agagacaccc catcttcggc 360 aacatcgtgg acgaggtggc ctaccacgag aagtacccca ccatctacca cctgagaaag 420 aagctggtgg acagcaccga caaggccgac ctgagactga tctacctggc cctggcccac 480 atgatcaagt tcagaggcca cttcctgatc gagggcgacc tgaaccccga caacagcgac 540 gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccc 600 atcaacgcca gcggcgtgga cgccaaggcc atcctgagcg ccagactgag caagagcaga 660 agactggaga acctgatcgc ccagctgccc ggcgagaaga agaacggcct gttcggcaac 720 ctgatcgccc tgagcctggg cctgaccccc aacttcaaga gcaacttcga cctggccgag 780 gacgccaagc tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840 cagatcggcg accagtacgc cgacctgttc ctggccgcca agaacctgag cgacgccatc 900 ctgctgagcg acatcctgag agtgaacacc gagatcacca aggcccccct gagcgccagc 960 atgatcaaga gatacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgaga 1020 cagcagctgc ccgagaagta caaggagatc ttcttcgacc agagcaagaa cggctacgcc 1080 ggctacatcg acggcggcgc cagccaggag gagttctaca agttcatcaa gcccatcctg 1140 gagaagatgg acggcaccga ggagctgctg gtgaagctga acagagagga cctgctgaga 1200 aagcagagaa ccttcgacaa cggcagcatc ccccaccaga tccacctggg cgagctgcac 1260 gccatcctga gaagacagga ggacttctac cccttcctga aggacaacag agagaagatc 1320 gagaagatcc tgaccttcag aatcccctac tacgtgggcc ccctggccag aggcaacagc 1380 agattcgcct ggatgaccag aaagagcgag gagaccatca ccccctggaa cttcgaggag 1440 gtggtggaca agggcgccag cgcccagagc ttcatcgaga gaatgaccaa cttcgacaag 1500 aacctgccca acgagaaggt gctgcccaag cacagcctgc tgtacgagta cttcaccgtg 1560 tacaacgagc tgaccaaggt gaagtacgtg accgagggca tgagaaagcc cgccttcctg 1620 agcggcgagc agaagaaggc catcgtggac ctgctgttca agaccaacag aaaggtgacc 1680 gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgacag cgtggagatc 1740 agcggcgtgg aggacagatt caacgccagc ctgggcacct accacgacct gctgaagatc 1800 atcaaggaca aggacttcct ggacaacgag gagaacgagg acatcctgga ggacatcgtg 1860 ctgaccctga ccctgttcga ggacagagag atgatcgagg agagactgaa gacctacgcc 1920 cacctgttcg acgacaaggt gatgaagcag ctgaagagaa gaagatacac cggctggggc 1980 agactgagca gaaagctgat caacggcatc agagacaagc agagcggcaa gaccatcctg 2040 gacttcctga agagcgacgg cttcgccaac agaaacttca tgcagctgat ccacgacgac 2100 agcctgacct tcaaggagga catccagaag gcccaggtga gcggccaggg cgacagcctg 2160 cacgagcaca tcgccaacct ggccggcagc cccgccatca agaagggcat cctgcagacc 2220 gtgaaggtgg tggacgagct ggtgaaggtg atgggcagac acaagcccga gaacatcgtg 2280 atcgagatgg ccagagagaa ccagaccacc cagaagggcc agaagaacag cagagagaga 2340 atgaagagaa tcgaggaggg catcaaggag ctgggcagcc agatcctgaa ggagcacccc 2400 gtggagaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaacggcaga 2460 gacatgtacg tggaccagga gctggacatc aacagactga gcgactacga cgtggaccac 2520 atcgtgcccc agagcttcct gaaggacgac agcatcgaca acaaggtgct gaccagaagc 2580 gacaagaaca gaggcaagag cgacaacgtg cccagcgagg aggtggtgaa gaagatgaag 2640 aactactgga gacagctgct gaacgccaag ctgatcaccc agagaaagtt cgacaacctg 2700 accaaggccg agagaggcgg cctgagcgag ctggacaagg ccggcttcat caagagacag 2760 ctggtggaga ccagacagat caccaagcac gtggcccaga tcctggacag cagaatgaac 2820 accaagtacg acgagaacga caagctgatc agagaggtga aggtgatcac cctgaagagc 2880 aagctggtga gcgacttcag aaaggacttc cagttctaca aggtgagaga gatcaacaac 2940 taccaccacg cccacgacgc ctacctgaac gccgtggtgg gcaccgccct gatcaagaag 3000 taccccaagc tggagagcga gttcgtgtac ggcgactaca aggtgtacga cgtgagaaag 3060 atgatcgcca agagcgagca ggagatcggc aaggccaccg ccaagtactt cttctacagc 3120 aacatcatga acttcttcaa gaccgagatc accctggcca acggcgagat cagaaagaga 3180 cccctgatcg agaccaacgg cgagaccggc gagatcgtgt gggacaaggg cagagacttc 3240 gccaccgtga gaaaggtgct gagcatgccc caggtgaaca tcgtgaagaa gaccgaggtg 3300 cagaccggcg gcttcagcaa ggagagcatc ctgcccaaga gaaacagcga caagctgatc 3360 gccagaaaga aggactggga ccccaagaag tacggcggct tcgacagccc caccgtggcc 3420 tacagcgtgc tggtggtggc caaggtggag aagggcaaga gcaagaagct gaagagcgtg 3480 aaggagctgc tgggcatcac catcatggag agaagcagct tcgagaagaa ccccatcgac 3540 ttcctggagg ccaagggcta caaggaggtg aagaaggacc tgatcatcaa gctgcccaag 3600 tacagcctgt tcgagctgga gaacggcaga aagagaatgc tggccagcgc cggcgagctg 3660 cagaagggca acgagctggc cctgcccagc aagtacgtga acttcctgta cctggccagc 3720 cactacgaga agctgaaggg cagccccgag gacaacgagc agaagcagct gttcgtggag 3780 cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttcag caagagagtg 3840 atcctggccg acgccaacct ggacaaggtg ctgagcgcct acaacaagca cagagacaag 3900 cccatcagag agcaggccga gaacatcatc cacctgttca ccctgaccaa cctgggcgcc 3960 cccgccgcct tcaagtactt cgacaccacc atcgacagaa agagatacac cagcaccaag 4020 gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gaccagaatc 4080 gacctgagcc agctgggcgg cgacggcggc ggcagcccca agaagaagag aaaggtgtga 4140 <210> 53 <211> 4411 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 53 gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatcc gccaccatgg acaagaagta cagcatcggc ctggacatcg gcaccaacag 120 cgtgggctgg gccgtgatca ccgacgagta caaggtgccc agcaagaagt tcaaggtgct 180 gggcaacacc gacagacaca gcatcaagaa gaacctgatc ggcgccctgc tgttcgacag 240 cggcgagacc gccgaggcca ccagactgaa gagaaccgcc agaagaagat acaccagaag 300 aaagaacaga atctgctacc tgcaggagat cttcagcaac gagatggcca aggtggacga 360 cagcttcttc cacagactgg aggagagctt cctggtggag gaggacaaga agcacgagag 420 acaccccatc ttcggcaaca tcgtggacga ggtggcctac cacgagaagt accccaccat 480 ctaccacctg agaaagaagc tggtggacag caccgacaag gccgacctga gactgatcta 540 cctggccctg gcccacatga tcaagttcag aggccacttc ctgatcgagg gcgacctgaa 600 ccccgacaac agcgacgtgg acaagctgtt catccagctg gtgcagacct acaaccagct 660 gttcgaggag aaccccatca acgccagcgg cgtggacgcc aaggccatcc tgagcgccag 720 actgagcaag agcagaagac tggagaacct gatcgcccag ctgcccggcg agaagaagaa 780 cggcctgttc ggcaacctga tcgccctgag cctgggcctg acccccaact tcaagagcaa 840 cttcgacctg gccgaggacg ccaagctgca gctgagcaag gacacctacg acgacgacct 900 ggacaacctg ctggcccaga tcggcgacca gtacgccgac ctgttcctgg ccgccaagaa 960 cctgagcgac gccatcctgc tgagcgacat cctgagagtg aacaccgaga tcaccaaggc 1020 ccccctgagc gccagcatga tcaagagata cgacgagcac caccaggacc tgaccctgct 1080 gaaggccctg gtgagacagc agctgcccga gaagtacaag gagatcttct tcgaccagag 1140 caagaacggc tacgccggct acatcgacgg cggcgccagc caggaggagt tctacaagtt 1200 catcaagccc atcctggaga agatggacgg caccgaggag ctgctggtga agctgaacag 1260 agaggacctg ctgagaaagc agagaacctt cgacaacggc agcatccccc accagatcca 1320 cctgggcgag ctgcacgcca tcctgagaag acaggaggac ttctacccct tcctgaagga 1380 caacagagag aagatcgaga agatcctgac cttcagaatc ccctactacg tgggccccct 1440 ggccagaggc aacagcagat tcgcctggat gaccagaaag agcgaggaga ccatcacccc 1500 ctggaacttc gaggaggtgg tggacaaggg cgccagcgcc cagagcttca tcgagagaat 1560 gaccaacttc gacaagaacc tgcccaacga gaaggtgctg cccaagcaca gcctgctgta 1620 cgagtacttc accgtgtaca acgagctgac caaggtgaag tacgtgaccg agggcatgag 1680 aaagcccgcc ttcctgagcg gcgagcagaa gaaggccatc gtggacctgc tgttcaagac 1740 caacagaaag gtgaccgtga agcagctgaa ggaggactac ttcaagaaga tcgagtgctt 1800 cgacagcgtg gagatcagcg gcgtggagga cagattcaac gccagcctgg gcacctacca 1860 cgacctgctg aagatcatca aggacaagga cttcctggac aacgaggaga acgaggacat 1920 cctggaggac atcgtgctga ccctgaccct gttcgaggac agagagatga tcgaggagag 1980 actgaagacc tacgcccacc tgttcgacga caaggtgatg aagcagctga agagaagaag 2040 atacaccggc tggggcagac tgagcagaaa gctgatcaac ggcatcagag acaagcagag 2100 cggcaagacc atcctggact tcctgaagag cgacggcttc gccaacagaa acttcatgca 2160 gctgatccac gacgacagcc tgaccttcaa ggaggacatc cagaaggccc aggtgagcgg 2220 ccagggcgac agcctgcacg agcacatcgc caacctggcc ggcagccccg ccatcaagaa 2280 gggcatcctg cagaccgtga aggtggtgga cgagctggtg aaggtgatgg gcagacacaa 2340 gcccgagaac atcgtgatcg agatggccag agagaaccag accacccaga agggccagaa 2400 gaacagcaga gagagaatga agagaatcga ggagggcatc aaggagctgg gcagccagat 2460 cctgaaggag caccccgtgg agaacaccca gctgcagaac gagaagctgt acctgtacta 2520 cctgcagaac ggcagagaca tgtacgtgga ccaggagctg gacatcaaca gactgagcga 2580 ctacgacgtg gaccacatcg tgccccagag cttcctgaag gacgacagca tcgacaacaa 2640 ggtgctgacc agaagcgaca agaacagagg caagagcgac aacgtgccca gcgaggaggt 2700 ggtgaagaag atgaagaact actggagaca gctgctgaac gccaagctga tcacccagag 2760 aaagttcgac aacctgacca aggccgagag aggcggcctg agcgagctgg acaaggccgg 2820 cttcatcaag agacagctgg tggagaccag acagatcacc aagcacgtgg cccagatcct 2880 ggacagcaga atgaacacca agtacgacga gaacgacaag ctgatcagag aggtgaaggt 2940 gatcaccctg aagagcaagc tggtgagcga cttcagaaag gacttccagt tctacaaggt 3000 gagagagatc aacaactacc accacgccca cgacgcctac ctgaacgccg tggtgggcac 3060 cgccctgatc aagaagtacc ccaagctgga gagcgagttc gtgtacggcg actacaaggt 3120 gtacgacgtg agaaagatga tcgccaagag cgagcaggag atcggcaagg ccaccgccaa 3180 gtacttcttc tacagcaaca tcatgaactt cttcaagacc gagatcaccc tggccaacgg 3240 cgagatcaga aagagacccc tgatcgagac caacggcgag accggcgaga tcgtgtggga 3300 caagggcaga gacttcgcca ccgtgagaaa ggtgctgagc atgccccagg tgaacatcgt 3360 gaagaagacc gaggtgcaga ccggcggctt cagcaaggag agcatcctgc ccaagagaaa 3420 cagcgacaag ctgatcgcca gaaagaagga ctgggacccc aagaagtacg gcggcttcga 3480 cagccccacc gtggcctaca gcgtgctggt ggtggccaag gtggagaagg gcaagagcaa 3540 gaagctgaag agcgtgaagg agctgctggg catcaccatc atggagagaa gcagcttcga 3600 gaagaacccc atcgacttcc tggaggccaa gggctacaag gaggtgaaga aggacctgat 3660 catcaagctg cccaagtaca gcctgttcga gctggagaac ggcagaaaga gaatgctggc 3720 cagcgccggc gagctgcaga agggcaacga gctggccctg cccagcaagt acgtgaactt 3780 cctgtacctg gccagccact acgagaagct gaagggcagc cccgaggaca acgagcagaa 3840 gcagctgttc gtggagcagc acaagcacta cctggacgag atcatcgagc agatcagcga 3900 gttcagcaag agagtgatcc tggccgacgc caacctggac aaggtgctga gcgcctacaa 3960 caagcacaga gacaagccca tcagagagca ggccgagaac atcatccacc tgttcaccct 4020 gaccaacctg ggcgcccccg ccgccttcaa gtacttcgac accaccatcg acagaaagag 4080 atacaccagc accaaggagg tgctggacgc caccctgatc caccagagca tcaccggcct 4140 gtacgagacc agaatcgacc tgagccagct gggcggcgac ggcggcggca gccccaagaa 4200 gaagagaaag gtgtgactag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260 gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320 ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380 tcaattaata aaaaatggaa agaacctcga g 4411 <210> 54 <211> 4140 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 54 atggacaaaa aatacagcat agggctagac atagggacga acagcgtagg gtgggcggta 60 ataacggacg aatacaaagt accgagcaaa aaattcaaag tactagggaa cacggaccga 120 cacagcataa aaaaaaacct aataggggcg ctactattcg acagcgggga aacggcggaa 180 gcgacgcgac taaaacgaac ggcgcgacga cgatacacgc gacgaaaaaa ccgaatatgc 240 tacctacaag aaatattcag caacgaaatg gcgaaagtag acgacagctt cttccaccga 300 ctagaagaaa gcttcctagt agaagaagac aaaaaacacg aacgacaccc gatattcggg 360 aacatagtag acgaagtagc gtaccacgaa aaatacccga cgatatacca cctacgaaaa 420 aaactagtag acagcacgga caaagcggac ctacgactaa tatacctagc gctagcgcac 480 atgataaaat tccgagggca cttcctaata gaaggggacc taaacccgga caacagcgac 540 gtagacaaac tattcataca actagtacaa acgtacaacc aactattcga agaaaacccg 600 ataaacgcga gcggggtaga cgcgaaagcg atactaagcg cgcgactaag caaaagccga 660 cgactagaaa acctaatagc gcaactaccg ggggaaaaaa aaaacgggct attcgggaac 720 ctaatagcgc taagcctagg gctaacgccg aacttcaaaa gcaacttcga cctagcggaa 780 gacgcgaaac tacaactaag caaagacacg tacgacgacg acctagacaa cctactagcg 840 caaatagggg accaatacgc ggacctattc ctagcggcga aaaacctaag cgacgcgata 900 ctactaagcg acatactacg agtaaacacg gaaataacga aagcgccgct aagcgcgagc 960 atgataaaac gatacgacga acaccaccaa gacctaacgc tactaaaagc gctagtacga 1020 caacaactac cggaaaaata caaagaaata ttcttcgacc aaagcaaaaa cgggtacgcg 1080 gggtacatag acgggggggc gagccaagaa gaattctaca aattcataaa accgatacta 1140 gaaaaaatgg acgggacgga agaactacta gtaaaactaa accgagaaga cctactacga 1200 aaacaacgaa cgttcgacaa cgggagcata ccgcaccaaa tacacctagg ggaactacac 1260 gcgatactac gacgacaaga agacttctac ccgttcctaa aagacaaccg agaaaaaata 1320 gaaaaaatac taacgttccg aataccgtac tacgtagggc cgctagcgcg agggaacagc 1380 cgattcgcgt ggatgacgcg aaaaagcgaa gaaacgataa cgccgtggaa cttcgaagaa 1440 gtagtagaca aaggggcgag cgcgcaaagc ttcatagaac gaatgacgaa cttcgacaaa 1500 aacctaccga acgaaaaagt actaccgaaa cacagcctac tatacgaata cttcacggta 1560 tacaacgaac taacgaaagt aaaatacgta acggaaggga tgcgaaaacc ggcgttccta 1620 agcggggaac aaaaaaaagc gatagtagac ctactattca aaacgaaccg aaaagtaacg 1680 gtaaaacaac taaaagaaga ctacttcaaa aaaatagaat gcttcgacag cgtagaaata 1740 agcggggtag aagaccgatt caacgcgagc ctagggacgt accacgacct actaaaaata 1800 ataaaagaca aagacttcct agacaacgaa gaaaacgaag acatactaga agacatagta 1860 ctaacgctaa cgctattcga agaccgagaa atgatagaag aacgactaaa aacgtacgcg 1920 cacctattcg acgacaaagt aatgaaacaa ctaaaacgac gacgatacac ggggtggggg 1980 cgactaagcc gaaaactaat aaacgggata cgagacaaac aaagcgggaa aacgatacta 2040 gacttcctaa aaagcgacgg gttcgcgaac cgaaacttca tgcaactaat acacgacgac 2100 agcctaacgt tcaaagaaga catacaaaaa gcgcaagtaa gcgggcaagg ggacagccta 2160 cacgaacaca tagcgaacct agcggggagc ccggcgataa aaaaagggat actacaaacg 2220 gtaaaagtag tagacgaact agtaaaagta atggggcgac acaaaccgga aaacatagta 2280 atagaaatgg cgcgagaaaa ccaaacgacg caaaaagggc aaaaaaacag ccgagaacga 2340 atgaaacgaa tagaagaagg gataaaagaa ctagggagcc aaatactaaa agaacacccg 2400 gtagaaaaca cgcaactaca aaacgaaaaa ctatacctat actacctaca aaacgggcga 2460 gacatgtacg tagaccaaga actagacata aaccgactaa gcgactacga cgtagaccac 2520 atagtaccgc aaagcttcct aaaagacgac agcatagaca acaaagtact aacgcgaagc 2580 gacaaaaacc gagggaaaag cgacaacgta ccgagcgaag aagtagtaaa aaaaatgaaa 2640 aactactggc gacaactact aaacgcgaaa ctaataacgc aacgaaaatt cgacaaccta 2700 acgaaagcgg aacgaggggg gctaagcgaa ctagacaaag cggggttcat aaaacgacaa 2760 ctagtagaaa cgcgacaaat aacgaaacac gtagcgcaaa tactagacag ccgaatgaac 2820 acgaaatacg acgaaaacga caaactaata cgagaagtaa aagtaataac gctaaaaagc 2880 aaactagtaa gcgacttccg aaaagacttc caattctaca aagtacgaga aataaacaac 2940 taccaccacg cgcacgacgc gtacctaaac gcggtagtag ggacggcgct aataaaaaaa 3000 tacccgaaac tagaaagcga attcgtatac ggggactaca aagtatacga cgtacgaaaa 3060 atgatagcga aaagcgaaca agaaataggg aaagcgacgg cgaaatactt cttctacagc 3120 aacataatga acttcttcaa aacggaaata acgctagcga acggggaaat acgaaaacga 3180 ccgctaatag aaacgaacgg ggaaacgggg gaaatagtat gggacaaagg gcgagacttc 3240 gcgacggtac gaaaagtact aagcatgccg caagtaaaca tagtaaaaaa aacggaagta 3300 caaacggggg ggttcagcaa agaaagcata ctaccgaaac gaaacagcga caaactaata 3360 gcgcgaaaaa aagactggga cccgaaaaaa tacggggggt tcgacagccc gacggtagcg 3420 tacagcgtac tagtagtagc gaaagtagaa aaagggaaaa gcaaaaaact aaaaagcgta 3480 aaagaactac tagggataac gataatggaa cgaagcagct tcgaaaaaaa cccgatagac 3540 ttcctagaag cgaaagggta caaagaagta aaaaaagacc taataataaa actaccgaaa 3600 tacagcctat tcgaactaga aaacgggcga aaacgaatgc tagcgagcgc gggggaacta 3660 caaaaaggga acgaactagc gctaccgagc aaatacgtaa acttcctata cctagcgagc 3720 cactacgaaa aactaaaagg gagcccggaa gacaacgaac aaaaacaact attcgtagaa 3780 caacacaaac actacctaga cgaaataata gaacaaataa gcgaattcag caaacgagta 3840 atactagcgg acgcgaacct agacaaagta ctaagcgcgt acaacaaaca ccgagacaaa 3900 ccgatacgag aacaagcgga aaacataata cacctattca cgctaacgaa cctaggggcg 3960 ccggcggcgt tcaaatactt cgacacgacg atagaccgaa aacgatacac gagcacgaaa 4020 gaagtactag acgcgacgct aatacaccaa agcataacgg ggctatacga aacgcgaata 4080 gacctaagcc aactaggggg ggacgggggg gggagcccga aaaaaaaacg aaaagtatga 4140 <210> 55 <211> 4411 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 55 gggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatcc gccaccatgg acaaaaaata cagcataggg ctagacatag ggacgaacag 120 cgtagggtgg gcggtaataa cggacgaata caaagtaccg agcaaaaaat tcaaagtact 180 agggaacacg gaccgacaca gcataaaaaa aaacctaata ggggcgctac tattcgacag 240 cggggaaacg gcggaagcga cgcgactaaa acgaacggcg cgacgacgat acacgcgacg 300 aaaaaaccga atatgctacc tacaagaaat attcagcaac gaaatggcga aagtagacga 360 cagcttcttc caccgactag aagaaagctt cctagtagaa gaagacaaaa aacacgaacg 420 acacccgata ttcgggaaca tagtagacga agtagcgtac cacgaaaaat acccgacgat 480 ataccaccta cgaaaaaaac tagtagacag cacggacaaa gcggacctac gactaatata 540 cctagcgcta gcgcacatga taaaattccg agggcacttc ctaatagaag gggacctaaa 600 cccggacaac agcgacgtag acaaactatt catacaacta gtacaaacgt acaaccaact 660 attcgaagaa aacccgataa acgcgagcgg ggtagacgcg aaagcgatac taagcgcgcg 720 actaagcaaa agccgacgac tagaaaacct aatagcgcaa ctaccggggg aaaaaaaaaa 780 cgggctattc gggaacctaa tagcgctaag cctagggcta acgccgaact tcaaaagcaa 840 cttcgaccta gcggaagacg cgaaactaca actaagcaaa gacacgtacg acgacgacct 900 agacaaccta ctagcgcaaa taggggacca atacgcggac ctattcctag cggcgaaaaa 960 cctaagcgac gcgatactac taagcgacat actacgagta aacacggaaa taacgaaagc 1020 gccgctaagc gcgagcatga taaaacgata cgacgaacac caccaagacc taacgctact 1080 aaaagcgcta gtacgacaac aactaccgga aaaatacaaa gaaatattct tcgaccaaag 1140 caaaaacggg tacgcggggt acatagacgg gggggcgagc caagaagaat tctacaaatt 1200 cataaaaccg atactagaaa aaatggacgg gacggaagaa ctactagtaa aactaaaccg 1260 agaagaccta ctacgaaaac aacgaacgtt cgacaacggg agcataccgc accaaataca 1320 cctaggggaa ctacacgcga tactacgacg acaagaagac ttctacccgt tcctaaaaga 1380 caaccgagaa aaaatagaaa aaatactaac gttccgaata ccgtactacg tagggccgct 1440 agcgcgaggg aacagccgat tcgcgtggat gacgcgaaaa agcgaagaaa cgataacgcc 1500 gtggaacttc gaagaagtag tagacaaagg ggcgagcgcg caaagcttca tagaacgaat 1560 gacgaacttc gacaaaaacc taccgaacga aaaagtacta ccgaaacaca gcctactata 1620 cgaatacttc acggtataca acgaactaac gaaagtaaaa tacgtaacgg aagggatgcg 1680 aaaaccggcg ttcctaagcg gggaacaaaa aaaagcgata gtagacctac tattcaaaac 1740 gaaccgaaaa gtaacggtaa aacaactaaa agaagactac ttcaaaaaaa tagaatgctt 1800 cgacagcgta gaaataagcg gggtagaaga ccgattcaac gcgagcctag ggacgtacca 1860 cgacctacta aaaataataa aagacaaaga cttcctagac aacgaagaaa acgaagacat 1920 actagaagac atagtactaa cgctaacgct attcgaagac cgagaaatga tagaagaacg 1980 actaaaaacg tacgcgcacc tattcgacga caaagtaatg aaacaactaa aacgacgacg 2040 atacacgggg tgggggcgac taagccgaaa actaataaac gggatacgag acaaacaaag 2100 cgggaaaacg atactagact tcctaaaaag cgacgggttc gcgaaccgaa acttcatgca 2160 actaatacac gacgacagcc taacgttcaa agaagacata caaaaagcgc aagtaagcgg 2220 gcaaggggac agcctacacg aacacatagc gaacctagcg gggagcccgg cgataaaaaa 2280 agggatacta caaacggtaa aagtagtaga cgaactagta aaagtaatgg ggcgacacaa 2340 accggaaaac atagtaatag aaatggcgcg agaaaaccaa acgacgcaaa aagggcaaaa 2400 aaacagccga gaacgaatga aacgaataga agaagggata aaagaactag ggagccaaat 2460 actaaaagaa cacccggtag aaaacacgca actacaaaac gaaaaactat acctatacta 2520 cctacaaaac gggcgagaca tgtacgtaga ccaagaacta gacataaacc gactaagcga 2580 ctacgacgta gaccacatag taccgcaaag cttcctaaaa gacgacagca tagacaacaa 2640 agtactaacg cgaagcgaca aaaaccgagg gaaaagcgac aacgtaccga gcgaagaagt 2700 agtaaaaaaa atgaaaaact actggcgaca actactaaac gcgaaactaa taacgcaacg 2760 aaaattcgac aacctaacga aagcggaacg aggggggcta agcgaactag acaaagcggg 2820 gttcataaaa cgacaactag tagaaacgcg acaaataacg aaacacgtag cgcaaatact 2880 agacagccga atgaacacga aatacgacga aaacgacaaa ctaatacgag aagtaaaagt 2940 aataacgcta aaaagcaaac tagtaagcga cttccgaaaa gacttccaat tctacaaagt 3000 acgagaaata aacaactacc accacgcgca cgacgcgtac ctaaacgcgg tagtagggac 3060 ggcgctaata aaaaaatacc cgaaactaga aagcgaattc gtatacgggg actacaaagt 3120 atacgacgta cgaaaaatga tagcgaaaag cgaacaagaa atagggaaag cgacggcgaa 3180 atacttcttc tacagcaaca taatgaactt cttcaaaacg gaaataacgc tagcgaacgg 3240 ggaaatacga aaacgaccgc taatagaaac gaacggggaa acgggggaaa tagtatggga 3300 caaagggcga gacttcgcga cggtacgaaa agtactaagc atgccgcaag taaacatagt 3360 aaaaaaaacg gaagtacaaa cgggggggtt cagcaaagaa agcatactac cgaaacgaaa 3420 cagcgacaaa ctaatagcgc gaaaaaaaga ctgggacccg aaaaaatacg gggggttcga 3480 cagcccgacg gtagcgtaca gcgtactagt agtagcgaaa gtagaaaaag ggaaaagcaa 3540 aaaactaaaa agcgtaaaag aactactagg gataacgata atggaacgaa gcagcttcga 3600 aaaaaacccg atagacttcc tagaagcgaa agggtacaaa gaagtaaaaa aagacctaat 3660 aataaaacta ccgaaataca gcctattcga actagaaaac gggcgaaaac gaatgctagc 3720 gagcgcgggg gaactacaaa aagggaacga actagcgcta ccgagcaaat acgtaaactt 3780 cctataccta gcgagccact acgaaaaact aaaagggagc ccggaagaca acgaacaaaa 3840 acaactattc gtagaacaac acaaacacta cctagacgaa ataatagaac aaataagcga 3900 attcagcaaa cgagtaatac tagcggacgc gaacctagac aaagtactaa gcgcgtacaa 3960 caaacaccga gacaaaccga tacgagaaca agcggaaaac ataatacacc tattcacgct 4020 aacgaaccta ggggcgccgg cggcgttcaa atacttcgac acgacgatag accgaaaacg 4080 atacacgagc acgaaagaag tactagacgc gacgctaata caccaaagca taacggggct 4140 atacgaaacg cgaatagacc taagccaact agggggggac ggggggggga gcccgaaaaa 4200 aaaacgaaaa gtatgactag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260 gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320 ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380 tcaattaata aaaaatggaa agaacctcga g 4411 <210> 56 <211> 4411 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 56 aggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120 cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180 gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240 cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300 aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360 cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420 acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480 ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540 cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600 cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660 gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720 actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780 cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840 cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900 ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960 cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020 accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080 gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140 caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200 catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260 agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320 cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380 caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440 ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500 gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560 gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620 cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680 aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740 aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800 cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860 cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920 cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980 actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040 atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100 cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160 gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220 acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280 gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340 gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400 gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460 cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520 cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580 ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640 ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700 cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760 aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820 attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880 ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940 catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000 cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060 agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120 ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180 gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240 agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300 caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360 caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420 cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480 cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540 gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600 aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660 catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720 aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780 cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840 gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900 attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960 caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020 gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080 atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140 gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200 gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260 gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320 ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380 tcaattaata aaaaatggaa agaacctcga g 4411 <210> 57 <211> 4481 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 57 gggcagatcg cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac 60 cgatccagcc tccgcggccg ggaacggtgc attggaacgc ggattccccg tgccaagagt 120 gactcaccgt ccttgacacg gccaccatgg acaagaagta cagcatcgga ctggacatcg 180 gaacaaacag cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt 240 tcaaggtcct gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc 300 tgttcgacag cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat 360 acacaagaag aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa 420 aggtcgacga cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga 480 agcacgaaag acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt 540 acccgacaat ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga 600 gactgatcta cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag 660 gagacctgaa cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat 720 acaaccagct gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc 780 tgagcgcaag actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag 840 aaaagaagaa cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact 900 tcaagagcaa cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg 960 acgacgacct ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg 1020 cagcaaagaa cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa 1080 tcacaaaggc accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc 1140 tgacactgct gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct 1200 tcgaccagag caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat 1260 tctacaagtt catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca 1320 agctgaacag agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc 1380 accagatcca cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt 1440 tcctgaagga caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg 1500 tcggaccgct ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa 1560 caatcacacc gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca 1620 tcgaaagaat gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca 1680 gcctgctgta cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag 1740 aaggaatgag aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc 1800 tgttcaagac aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga 1860 tcgaatgctt cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg 1920 gaacatacca cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa 1980 acgaagacat cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga 2040 tcgaagaaag actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga 2100 agagaagaag atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag 2160 acaagcagag cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa 2220 acttcatgca gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac 2280 aggtcagcgg acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg 2340 caatcaagaa gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg 2400 gaagacacaa gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga 2460 agggacagaa gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg 2520 gaagccagat cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt 2580 acctgtacta cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca 2640 gactgagcga ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca 2700 tcgacaacaa ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga 2760 gcgaagaagt cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga 2820 tcacacagag aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg 2880 acaaggcagg attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg 2940 cacagatcct ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag 3000 aagtcaaggt catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt 3060 tctacaaggt cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag 3120 tcgtcggaac agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag 3180 actacaaggt ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg 3240 caacagcaaa gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac 3300 tggcaaacgg agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa 3360 tcgtctggga caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg 3420 tcaacatcgt caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc 3480 cgaagagaaa cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg 3540 gaggattcga cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg 3600 gaaagagcaa gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa 3660 gcagcttcga aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga 3720 aggacctgat catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga 3780 gaatgctggc aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt 3840 acgtcaactt cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca 3900 acgaacagaa gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac 3960 agatcagcga attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga 4020 gcgcatacaa caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc 4080 tgttcacact gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg 4140 acagaaagag atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca 4200 tcacaggact gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa 4260 gcccgaagaa gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc 4320 atgagaataa gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt 4380 tggtgtaaag ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt 4440 tctctgtgct tcaattaata aaaaatggaa agaacctcga g 4481 <210> 58 <211> 4348 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 58 gggacatttg cttctgacac aactgtgttc actagcaacc tcaaacagac accggatctg 60 ccaccatgga caagaagtac agcatcggac tggacatcgg aacaaacagc gtcggatggg 120 cagtcatcac agacgaatac aaggtcccga gcaagaagtt caaggtcctg ggaaacacag 180 acagacacag catcaagaag aacctgatcg gagcactgct gttcgacagc ggagaaacag 240 cagaagcaac aagactgaag agaacagcaa gaagaagata cacaagaaga aagaacagaa 300 tctgctacct gcaggaaatc ttcagcaacg aaatggcaaa ggtcgacgac agcttcttcc 360 acagactgga agaaagcttc ctggtcgaag aagacaagaa gcacgaaaga cacccgatct 420 tcggaaacat cgtcgacgaa gtcgcatacc acgaaaagta cccgacaatc taccacctga 480 gaaagaagct ggtcgacagc acagacaagg cagacctgag actgatctac ctggcactgg 540 cacacatgat caagttcaga ggacacttcc tgatcgaagg agacctgaac ccggacaaca 600 gcgacgtcga caagctgttc atccagctgg tccagacata caaccagctg ttcgaagaaa 660 acccgatcaa cgcaagcgga gtcgacgcaa aggcaatcct gagcgcaaga ctgagcaaga 720 gcagaagact ggaaaacctg atcgcacagc tgccgggaga aaagaagaac ggactgttcg 780 gaaacctgat cgcactgagc ctgggactga caccgaactt caagagcaac ttcgacctgg 840 cagaagacgc aaagctgcag ctgagcaagg acacatacga cgacgacctg gacaacctgc 900 tggcacagat cggagaccag tacgcagacc tgttcctggc agcaaagaac ctgagcgacg 960 caatcctgct gagcgacatc ctgagagtca acacagaaat cacaaaggca ccgctgagcg 1020 caagcatgat caagagatac gacgaacacc accaggacct gacactgctg aaggcactgg 1080 tcagacagca gctgccggaa aagtacaagg aaatcttctt cgaccagagc aagaacggat 1140 acgcaggata catcgacgga ggagcaagcc aggaagaatt ctacaagttc atcaagccga 1200 tcctggaaaa gatggacgga acagaagaac tgctggtcaa gctgaacaga gaagacctgc 1260 tgagaaagca gagaacattc gacaacggaa gcatcccgca ccagatccac ctgggagaac 1320 tgcacgcaat cctgagaaga caggaagact tctacccgtt cctgaaggac aacagagaaa 1380 agatcgaaaa gatcctgaca ttcagaatcc cgtactacgt cggaccgctg gcaagaggaa 1440 acagcagatt cgcatggatg acaagaaaga gcgaagaaac aatcacaccg tggaacttcg 1500 aagaagtcgt cgacaaggga gcaagcgcac agagcttcat cgaaagaatg acaaacttcg 1560 acaagaacct gccgaacgaa aaggtcctgc cgaagcacag cctgctgtac gaatacttca 1620 cagtctacaa cgaactgaca aaggtcaagt acgtcacaga aggaatgaga aagccggcat 1680 tcctgagcgg agaacagaag aaggcaatcg tcgacctgct gttcaagaca aacagaaagg 1740 tcacagtcaa gcagctgaag gaagactact tcaagaagat cgaatgcttc gacagcgtcg 1800 aaatcagcgg agtcgaagac agattcaacg caagcctggg aacataccac gacctgctga 1860 agatcatcaa ggacaaggac ttcctggaca acgaagaaaa cgaagacatc ctggaagaca 1920 tcgtcctgac actgacactg ttcgaagaca gagaaatgat cgaagaaaga ctgaagacat 1980 acgcacacct gttcgacgac aaggtcatga agcagctgaa gagaagaaga tacacaggat 2040 ggggaagact gagcagaaag ctgatcaacg gaatcagaga caagcagagc ggaaagacaa 2100 tcctggactt cctgaagagc gacggattcg caaacagaaa cttcatgcag ctgatccacg 2160 acgacagcct gacattcaag gaagacatcc agaaggcaca ggtcagcgga cagggagaca 2220 gcctgcacga acacatcgca aacctggcag gaagcccggc aatcaagaag ggaatcctgc 2280 agacagtcaa ggtcgtcgac gaactggtca aggtcatggg aagacacaag ccggaaaaca 2340 tcgtcatcga aatggcaaga gaaaaccaga caacacagaa gggacagaag aacagcagag 2400 aaagaatgaa gagaatcgaa gaaggaatca aggaactggg aagccagatc ctgaaggaac 2460 acccggtcga aaacacacag ctgcagaacg aaaagctgta cctgtactac ctgcagaacg 2520 gaagagacat gtacgtcgac caggaactgg acatcaacag actgagcgac tacgacgtcg 2580 accacatcgt cccgcagagc ttcctgaagg acgacagcat cgacaacaag gtcctgacaa 2640 gaagcgacaa gaacagagga aagagcgaca acgtcccgag cgaagaagtc gtcaagaaga 2700 tgaagaacta ctggagacag ctgctgaacg caaagctgat cacacagaga aagttcgaca 2760 acctgacaaa ggcagagaga ggaggactga gcgaactgga caaggcagga ttcatcaaga 2820 gacagctggt cgaaacaaga cagatcacaa agcacgtcgc acagatcctg gacagcagaa 2880 tgaacacaaa gtacgacgaa aacgacaagc tgatcagaga agtcaaggtc atcacactga 2940 agagcaagct ggtcagcgac ttcagaaagg acttccagtt ctacaaggtc agagaaatca 3000 acaactacca ccacgcacac gacgcatacc tgaacgcagt cgtcggaaca gcactgatca 3060 agaagtaccc gaagctggaa agcgaattcg tctacggaga ctacaaggtc tacgacgtca 3120 gaaagatgat cgcaaagagc gaacaggaaa tcggaaaggc aacagcaaag tacttcttct 3180 acagcaacat catgaacttc ttcaagacag aaatcacact ggcaaacgga gaaatcagaa 3240 agagaccgct gatcgaaaca aacggagaaa caggagaaat cgtctgggac aagggaagag 3300 acttcgcaac agtcagaaag gtcctgagca tgccgcaggt caacatcgtc aagaagacag 3360 aagtccagac aggaggattc agcaaggaaa gcatcctgcc gaagagaaac agcgacaagc 3420 tgatcgcaag aaagaaggac tgggacccga agaagtacgg aggattcgac agcccgacag 3480 tcgcatacag cgtcctggtc gtcgcaaagg tcgaaaaggg aaagagcaag aagctgaaga 3540 gcgtcaagga actgctggga atcacaatca tggaaagaag cagcttcgaa aagaacccga 3600 tcgacttcct ggaagcaaag ggatacaagg aagtcaagaa ggacctgatc atcaagctgc 3660 cgaagtacag cctgttcgaa ctggaaaacg gaagaaagag aatgctggca agcgcaggag 3720 aactgcagaa gggaaacgaa ctggcactgc cgagcaagta cgtcaacttc ctgtacctgg 3780 caagccacta cgaaaagctg aagggaagcc cggaagacaa cgaacagaag cagctgttcg 3840 tcgaacagca caagcactac ctggacgaaa tcatcgaaca gatcagcgaa ttcagcaaga 3900 gagtcatcct ggcagacgca aacctggaca aggtcctgag cgcatacaac aagcacagag 3960 acaagccgat cagagaacag gcagaaaaca tcatccacct gttcacactg acaaacctgg 4020 gagcaccggc agcattcaag tacttcgaca caacaatcga cagaaagaga tacacaagca 4080 caaaggaagt cctggacgca acactgatcc accagagcat cacaggactg tacgaaacaa 4140 gaatcgacct gagccagctg ggaggagacg gaggaggaag cccgaagaag aagagaaagg 4200 tctagctagc gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa 4260 gtccaactac taaactgggg gatattatga agggccttga gcatctggat tctgcctaat 4320 aaaaaacatt tattttcatt gcctcgag 4348 <210> 59 <211> 4325 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 59 gggaagctca gaataaacgc tcaactttgg ccggatctgc caccatggac aagaagtaca 60 gcatcggact ggacatcgga acaaacagcg tcggatgggc agtcatcaca gacgaataca 120 aggtcccgag caagaagttc aaggtcctgg gaaacacaga cagacacagc atcaagaaga 180 acctgatcgg agcactgctg ttcgacagcg gagaaacagc agaagcaaca agactgaaga 240 gaacagcaag aagaagatac acaagaagaa agaacagaat ctgctacctg caggaaatct 300 tcagcaacga aatggcaaag gtcgacgaca gcttcttcca cagactggaa gaaagcttcc 360 tggtcgaaga agacaagaag cacgaaagac acccgatctt cggaaacatc gtcgacgaag 420 tcgcatacca cgaaaagtac ccgacaatct accacctgag aaagaagctg gtcgacagca 480 cagacaaggc agacctgaga ctgatctacc tggcactggc acacatgatc aagttcagag 540 gacacttcct gatcgaagga gacctgaacc cggacaacag cgacgtcgac aagctgttca 600 tccagctggt ccagacatac aaccagctgt tcgaagaaaa cccgatcaac gcaagcggag 660 tcgacgcaaa ggcaatcctg agcgcaagac tgagcaagag cagaagactg gaaaacctga 720 tcgcacagct gccgggagaa aagaagaacg gactgttcgg aaacctgatc gcactgagcc 780 tgggactgac accgaacttc aagagcaact tcgacctggc agaagacgca aagctgcagc 840 tgagcaagga cacatacgac gacgacctgg acaacctgct ggcacagatc ggagaccagt 900 acgcagacct gttcctggca gcaaagaacc tgagcgacgc aatcctgctg agcgacatcc 960 tgagagtcaa cacagaaatc acaaaggcac cgctgagcgc aagcatgatc aagagatacg 1020 acgaacacca ccaggacctg acactgctga aggcactggt cagacagcag ctgccggaaa 1080 agtacaagga aatcttcttc gaccagagca agaacggata cgcaggatac atcgacggag 1140 gagcaagcca ggaagaattc tacaagttca tcaagccgat cctggaaaag atggacggaa 1200 cagaagaact gctggtcaag ctgaacagag aagacctgct gagaaagcag agaacattcg 1260 acaacggaag catcccgcac cagatccacc tgggagaact gcacgcaatc ctgagaagac 1320 aggaagactt ctacccgttc ctgaaggaca acagagaaaa gatcgaaaag atcctgacat 1380 tcagaatccc gtactacgtc ggaccgctgg caagaggaaa cagcagattc gcatggatga 1440 caagaaagag cgaagaaaca atcacaccgt ggaacttcga agaagtcgtc gacaagggag 1500 caagcgcaca gagcttcatc gaaagaatga caaacttcga caagaacctg ccgaacgaaa 1560 aggtcctgcc gaagcacagc ctgctgtacg aatacttcac agtctacaac gaactgacaa 1620 aggtcaagta cgtcacagaa ggaatgagaa agccggcatt cctgagcgga gaacagaaga 1680 aggcaatcgt cgacctgctg ttcaagacaa acagaaaggt cacagtcaag cagctgaagg 1740 aagactactt caagaagatc gaatgcttcg acagcgtcga aatcagcgga gtcgaagaca 1800 gattcaacgc aagcctggga acataccacg acctgctgaa gatcatcaag gacaaggact 1860 tcctggacaa cgaagaaaac gaagacatcc tggaagacat cgtcctgaca ctgacactgt 1920 tcgaagacag agaaatgatc gaagaaagac tgaagacata cgcacacctg ttcgacgaca 1980 aggtcatgaa gcagctgaag agaagaagat acacaggatg gggaagactg agcagaaagc 2040 tgatcaacgg aatcagagac aagcagagcg gaaagacaat cctggacttc ctgaagagcg 2100 acggattcgc aaacagaaac ttcatgcagc tgatccacga cgacagcctg acattcaagg 2160 aagacatcca gaaggcacag gtcagcggac agggagacag cctgcacgaa cacatcgcaa 2220 acctggcagg aagcccggca atcaagaagg gaatcctgca gacagtcaag gtcgtcgacg 2280 aactggtcaa ggtcatggga agacacaagc cggaaaacat cgtcatcgaa atggcaagag 2340 aaaaccagac aacacagaag ggacagaaga acagcagaga aagaatgaag agaatcgaag 2400 aaggaatcaa ggaactggga agccagatcc tgaaggaaca cccggtcgaa aacacacagc 2460 tgcagaacga aaagctgtac ctgtactacc tgcagaacgg aagagacatg tacgtcgacc 2520 aggaactgga catcaacaga ctgagcgact acgacgtcga ccacatcgtc ccgcagagct 2580 tcctgaagga cgacagcatc gacaacaagg tcctgacaag aagcgacaag aacagaggaa 2640 agagcgacaa cgtcccgagc gaagaagtcg tcaagaagat gaagaactac tggagacagc 2700 tgctgaacgc aaagctgatc acacagagaa agttcgacaa cctgacaaag gcagagagag 2760 gaggactgag cgaactggac aaggcaggat tcatcaagag acagctggtc gaaacaagac 2820 agatcacaaa gcacgtcgca cagatcctgg acagcagaat gaacacaaag tacgacgaaa 2880 acgacaagct gatcagagaa gtcaaggtca tcacactgaa gagcaagctg gtcagcgact 2940 tcagaaagga cttccagttc tacaaggtca gagaaatcaa caactaccac cacgcacacg 3000 acgcatacct gaacgcagtc gtcggaacag cactgatcaa gaagtacccg aagctggaaa 3060 gcgaattcgt ctacggagac tacaaggtct acgacgtcag aaagatgatc gcaaagagcg 3120 aacaggaaat cggaaaggca acagcaaagt acttcttcta cagcaacatc atgaacttct 3180 tcaagacaga aatcacactg gcaaacggag aaatcagaaa gagaccgctg atcgaaacaa 3240 acggagaaac aggagaaatc gtctgggaca agggaagaga cttcgcaaca gtcagaaagg 3300 tcctgagcat gccgcaggtc aacatcgtca agaagacaga agtccagaca ggaggattca 3360 gcaaggaaag catcctgccg aagagaaaca gcgacaagct gatcgcaaga aagaaggact 3420 gggacccgaa gaagtacgga ggattcgaca gcccgacagt cgcatacagc gtcctggtcg 3480 tcgcaaaggt cgaaaaggga aagagcaaga agctgaagag cgtcaaggaa ctgctgggaa 3540 tcacaatcat ggaaagaagc agcttcgaaa agaacccgat cgacttcctg gaagcaaagg 3600 gatacaagga agtcaagaag gacctgatca tcaagctgcc gaagtacagc ctgttcgaac 3660 tggaaaacgg aagaaagaga atgctggcaa gcgcaggaga actgcagaag ggaaacgaac 3720 tggcactgcc gagcaagtac gtcaacttcc tgtacctggc aagccactac gaaaagctga 3780 agggaagccc ggaagacaac gaacagaagc agctgttcgt cgaacagcac aagcactacc 3840 tggacgaaat catcgaacag atcagcgaat tcagcaagag agtcatcctg gcagacgcaa 3900 acctggacaa ggtcctgagc gcatacaaca agcacagaga caagccgatc agagaacagg 3960 cagaaaacat catccacctg ttcacactga caaacctggg agcaccggca gcattcaagt 4020 acttcgacac aacaatcgac agaaagagat acacaagcac aaaggaagtc ctggacgcaa 4080 cactgatcca ccagagcatc acaggactgt acgaaacaag aatcgacctg agccagctgg 4140 gaggagacgg aggaggaagc ccgaagaaga agagaaaggt ctagctagca ccagcctcaa 4200 gaacacccga atggagtctc taagctacat aataccaact tacactttac aaaatgttgt 4260 cccccaaaat gtagccattc gtatctgctc ctaataaaaa gaaagtttct tcacattctc 4320 tcgag 4325 <210> 60 <211> 4325 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 60 aggaagctca gaataaacgc tcaactttgg ccggatctgc caccatggac aagaagtaca 60 gcatcggact ggacatcgga acaaacagcg tcggatgggc agtcatcaca gacgaataca 120 aggtcccgag caagaagttc aaggtcctgg gaaacacaga cagacacagc atcaagaaga 180 acctgatcgg agcactgctg ttcgacagcg gagaaacagc agaagcaaca agactgaaga 240 gaacagcaag aagaagatac acaagaagaa agaacagaat ctgctacctg caggaaatct 300 tcagcaacga aatggcaaag gtcgacgaca gcttcttcca cagactggaa gaaagcttcc 360 tggtcgaaga agacaagaag cacgaaagac acccgatctt cggaaacatc gtcgacgaag 420 tcgcatacca cgaaaagtac ccgacaatct accacctgag aaagaagctg gtcgacagca 480 cagacaaggc agacctgaga ctgatctacc tggcactggc acacatgatc aagttcagag 540 gacacttcct gatcgaagga gacctgaacc cggacaacag cgacgtcgac aagctgttca 600 tccagctggt ccagacatac aaccagctgt tcgaagaaaa cccgatcaac gcaagcggag 660 tcgacgcaaa ggcaatcctg agcgcaagac tgagcaagag cagaagactg gaaaacctga 720 tcgcacagct gccgggagaa aagaagaacg gactgttcgg aaacctgatc gcactgagcc 780 tgggactgac accgaacttc aagagcaact tcgacctggc agaagacgca aagctgcagc 840 tgagcaagga cacatacgac gacgacctgg acaacctgct ggcacagatc ggagaccagt 900 acgcagacct gttcctggca gcaaagaacc tgagcgacgc aatcctgctg agcgacatcc 960 tgagagtcaa cacagaaatc acaaaggcac cgctgagcgc aagcatgatc aagagatacg 1020 acgaacacca ccaggacctg acactgctga aggcactggt cagacagcag ctgccggaaa 1080 agtacaagga aatcttcttc gaccagagca agaacggata cgcaggatac atcgacggag 1140 gagcaagcca ggaagaattc tacaagttca tcaagccgat cctggaaaag atggacggaa 1200 cagaagaact gctggtcaag ctgaacagag aagacctgct gagaaagcag agaacattcg 1260 acaacggaag catcccgcac cagatccacc tgggagaact gcacgcaatc ctgagaagac 1320 aggaagactt ctacccgttc ctgaaggaca acagagaaaa gatcgaaaag atcctgacat 1380 tcagaatccc gtactacgtc ggaccgctgg caagaggaaa cagcagattc gcatggatga 1440 caagaaagag cgaagaaaca atcacaccgt ggaacttcga agaagtcgtc gacaagggag 1500 caagcgcaca gagcttcatc gaaagaatga caaacttcga caagaacctg ccgaacgaaa 1560 aggtcctgcc gaagcacagc ctgctgtacg aatacttcac agtctacaac gaactgacaa 1620 aggtcaagta cgtcacagaa ggaatgagaa agccggcatt cctgagcgga gaacagaaga 1680 aggcaatcgt cgacctgctg ttcaagacaa acagaaaggt cacagtcaag cagctgaagg 1740 aagactactt caagaagatc gaatgcttcg acagcgtcga aatcagcgga gtcgaagaca 1800 gattcaacgc aagcctggga acataccacg acctgctgaa gatcatcaag gacaaggact 1860 tcctggacaa cgaagaaaac gaagacatcc tggaagacat cgtcctgaca ctgacactgt 1920 tcgaagacag agaaatgatc gaagaaagac tgaagacata cgcacacctg ttcgacgaca 1980 aggtcatgaa gcagctgaag agaagaagat acacaggatg gggaagactg agcagaaagc 2040 tgatcaacgg aatcagagac aagcagagcg gaaagacaat cctggacttc ctgaagagcg 2100 acggattcgc aaacagaaac ttcatgcagc tgatccacga cgacagcctg acattcaagg 2160 aagacatcca gaaggcacag gtcagcggac agggagacag cctgcacgaa cacatcgcaa 2220 acctggcagg aagcccggca atcaagaagg gaatcctgca gacagtcaag gtcgtcgacg 2280 aactggtcaa ggtcatggga agacacaagc cggaaaacat cgtcatcgaa atggcaagag 2340 aaaaccagac aacacagaag ggacagaaga acagcagaga aagaatgaag agaatcgaag 2400 aaggaatcaa ggaactggga agccagatcc tgaaggaaca cccggtcgaa aacacacagc 2460 tgcagaacga aaagctgtac ctgtactacc tgcagaacgg aagagacatg tacgtcgacc 2520 aggaactgga catcaacaga ctgagcgact acgacgtcga ccacatcgtc ccgcagagct 2580 tcctgaagga cgacagcatc gacaacaagg tcctgacaag aagcgacaag aacagaggaa 2640 agagcgacaa cgtcccgagc gaagaagtcg tcaagaagat gaagaactac tggagacagc 2700 tgctgaacgc aaagctgatc acacagagaa agttcgacaa cctgacaaag gcagagagag 2760 gaggactgag cgaactggac aaggcaggat tcatcaagag acagctggtc gaaacaagac 2820 agatcacaaa gcacgtcgca cagatcctgg acagcagaat gaacacaaag tacgacgaaa 2880 acgacaagct gatcagagaa gtcaaggtca tcacactgaa gagcaagctg gtcagcgact 2940 tcagaaagga cttccagttc tacaaggtca gagaaatcaa caactaccac cacgcacacg 3000 acgcatacct gaacgcagtc gtcggaacag cactgatcaa gaagtacccg aagctggaaa 3060 gcgaattcgt ctacggagac tacaaggtct acgacgtcag aaagatgatc gcaaagagcg 3120 aacaggaaat cggaaaggca acagcaaagt acttcttcta cagcaacatc atgaacttct 3180 tcaagacaga aatcacactg gcaaacggag aaatcagaaa gagaccgctg atcgaaacaa 3240 acggagaaac aggagaaatc gtctgggaca agggaagaga cttcgcaaca gtcagaaagg 3300 tcctgagcat gccgcaggtc aacatcgtca agaagacaga agtccagaca ggaggattca 3360 gcaaggaaag catcctgccg aagagaaaca gcgacaagct gatcgcaaga aagaaggact 3420 gggacccgaa gaagtacgga ggattcgaca gcccgacagt cgcatacagc gtcctggtcg 3480 tcgcaaaggt cgaaaaggga aagagcaaga agctgaagag cgtcaaggaa ctgctgggaa 3540 tcacaatcat ggaaagaagc agcttcgaaa agaacccgat cgacttcctg gaagcaaagg 3600 gatacaagga agtcaagaag gacctgatca tcaagctgcc gaagtacagc ctgttcgaac 3660 tggaaaacgg aagaaagaga atgctggcaa gcgcaggaga actgcagaag ggaaacgaac 3720 tggcactgcc gagcaagtac gtcaacttcc tgtacctggc aagccactac gaaaagctga 3780 agggaagccc ggaagacaac gaacagaagc agctgttcgt cgaacagcac aagcactacc 3840 tggacgaaat catcgaacag atcagcgaat tcagcaagag agtcatcctg gcagacgcaa 3900 acctggacaa ggtcctgagc gcatacaaca agcacagaga caagccgatc agagaacagg 3960 cagaaaacat catccacctg ttcacactga caaacctggg agcaccggca gcattcaagt 4020 acttcgacac aacaatcgac agaaagagat acacaagcac aaaggaagtc ctggacgcaa 4080 cactgatcca ccagagcatc acaggactgt acgaaacaag aatcgacctg agccagctgg 4140 gaggagacgg aggaggaagc ccgaagaaga agagaaaggt ctagctagca ccagcctcaa 4200 gaacacccga atggagtctc taagctacat aataccaact tacactttac aaaatgttgt 4260 cccccaaaat gtagccattc gtatctgctc ctaataaaaa gaaagtttct tcacattctc 4320 tcgag 4325 <210> 61 <211> 4411 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 61 aggtcccgca gtcggcgtcc agcggctctg cttgttcgtg tgtgtgtcgt tgcaggcctt 60 attcggatcc gccaccatgg acaagaagta cagcatcgga ctggacatcg gaacaaacag 120 cgtcggatgg gcagtcatca cagacgaata caaggtcccg agcaagaagt tcaaggtcct 180 gggaaacaca gacagacaca gcatcaagaa gaacctgatc ggagcactgc tgttcgacag 240 cggagaaaca gcagaagcaa caagactgaa gagaacagca agaagaagat acacaagaag 300 aaagaacaga atctgctacc tgcaggaaat cttcagcaac gaaatggcaa aggtcgacga 360 cagcttcttc cacagactgg aagaaagctt cctggtcgaa gaagacaaga agcacgaaag 420 acacccgatc ttcggaaaca tcgtcgacga agtcgcatac cacgaaaagt acccgacaat 480 ctaccacctg agaaagaagc tggtcgacag cacagacaag gcagacctga gactgatcta 540 cctggcactg gcacacatga tcaagttcag aggacacttc ctgatcgaag gagacctgaa 600 cccggacaac agcgacgtcg acaagctgtt catccagctg gtccagacat acaaccagct 660 gttcgaagaa aacccgatca acgcaagcgg agtcgacgca aaggcaatcc tgagcgcaag 720 actgagcaag agcagaagac tggaaaacct gatcgcacag ctgccgggag aaaagaagaa 780 cggactgttc ggaaacctga tcgcactgag cctgggactg acaccgaact tcaagagcaa 840 cttcgacctg gcagaagacg caaagctgca gctgagcaag gacacatacg acgacgacct 900 ggacaacctg ctggcacaga tcggagacca gtacgcagac ctgttcctgg cagcaaagaa 960 cctgagcgac gcaatcctgc tgagcgacat cctgagagtc aacacagaaa tcacaaaggc 1020 accgctgagc gcaagcatga tcaagagata cgacgaacac caccaggacc tgacactgct 1080 gaaggcactg gtcagacagc agctgccgga aaagtacaag gaaatcttct tcgaccagag 1140 caagaacgga tacgcaggat acatcgacgg aggagcaagc caggaagaat tctacaagtt 1200 catcaagccg atcctggaaa agatggacgg aacagaagaa ctgctggtca agctgaacag 1260 agaagacctg ctgagaaagc agagaacatt cgacaacgga agcatcccgc accagatcca 1320 cctgggagaa ctgcacgcaa tcctgagaag acaggaagac ttctacccgt tcctgaagga 1380 caacagagaa aagatcgaaa agatcctgac attcagaatc ccgtactacg tcggaccgct 1440 ggcaagagga aacagcagat tcgcatggat gacaagaaag agcgaagaaa caatcacacc 1500 gtggaacttc gaagaagtcg tcgacaaggg agcaagcgca cagagcttca tcgaaagaat 1560 gacaaacttc gacaagaacc tgccgaacga aaaggtcctg ccgaagcaca gcctgctgta 1620 cgaatacttc acagtctaca acgaactgac aaaggtcaag tacgtcacag aaggaatgag 1680 aaagccggca ttcctgagcg gagaacagaa gaaggcaatc gtcgacctgc tgttcaagac 1740 aaacagaaag gtcacagtca agcagctgaa ggaagactac ttcaagaaga tcgaatgctt 1800 cgacagcgtc gaaatcagcg gagtcgaaga cagattcaac gcaagcctgg gaacatacca 1860 cgacctgctg aagatcatca aggacaagga cttcctggac aacgaagaaa acgaagacat 1920 cctggaagac atcgtcctga cactgacact gttcgaagac agagaaatga tcgaagaaag 1980 actgaagaca tacgcacacc tgttcgacga caaggtcatg aagcagctga agagaagaag 2040 atacacagga tggggaagac tgagcagaaa gctgatcaac ggaatcagag acaagcagag 2100 cggaaagaca atcctggact tcctgaagag cgacggattc gcaaacagaa acttcatgca 2160 gctgatccac gacgacagcc tgacattcaa ggaagacatc cagaaggcac aggtcagcgg 2220 acagggagac agcctgcacg aacacatcgc aaacctggca ggaagcccgg caatcaagaa 2280 gggaatcctg cagacagtca aggtcgtcga cgaactggtc aaggtcatgg gaagacacaa 2340 gccggaaaac atcgtcatcg aaatggcaag agaaaaccag acaacacaga agggacagaa 2400 gaacagcaga gaaagaatga agagaatcga agaaggaatc aaggaactgg gaagccagat 2460 cctgaaggaa cacccggtcg aaaacacaca gctgcagaac gaaaagctgt acctgtacta 2520 cctgcagaac ggaagagaca tgtacgtcga ccaggaactg gacatcaaca gactgagcga 2580 ctacgacgtc gaccacatcg tcccgcagag cttcctgaag gacgacagca tcgacaacaa 2640 ggtcctgaca agaagcgaca agaacagagg aaagagcgac aacgtcccga gcgaagaagt 2700 cgtcaagaag atgaagaact actggagaca gctgctgaac gcaaagctga tcacacagag 2760 aaagttcgac aacctgacaa aggcagagag aggaggactg agcgaactgg acaaggcagg 2820 attcatcaag agacagctgg tcgaaacaag acagatcaca aagcacgtcg cacagatcct 2880 ggacagcaga atgaacacaa agtacgacga aaacgacaag ctgatcagag aagtcaaggt 2940 catcacactg aagagcaagc tggtcagcga cttcagaaag gacttccagt tctacaaggt 3000 cagagaaatc aacaactacc accacgcaca cgacgcatac ctgaacgcag tcgtcggaac 3060 agcactgatc aagaagtacc cgaagctgga aagcgaattc gtctacggag actacaaggt 3120 ctacgacgtc agaaagatga tcgcaaagag cgaacaggaa atcggaaagg caacagcaaa 3180 gtacttcttc tacagcaaca tcatgaactt cttcaagaca gaaatcacac tggcaaacgg 3240 agaaatcaga aagagaccgc tgatcgaaac aaacggagaa acaggagaaa tcgtctggga 3300 caagggaaga gacttcgcaa cagtcagaaa ggtcctgagc atgccgcagg tcaacatcgt 3360 caagaagaca gaagtccaga caggaggatt cagcaaggaa agcatcctgc cgaagagaaa 3420 cagcgacaag ctgatcgcaa gaaagaagga ctgggacccg aagaagtacg gaggattcga 3480 cagcccgaca gtcgcataca gcgtcctggt cgtcgcaaag gtcgaaaagg gaaagagcaa 3540 gaagctgaag agcgtcaagg aactgctggg aatcacaatc atggaaagaa gcagcttcga 3600 aaagaacccg atcgacttcc tggaagcaaa gggatacaag gaagtcaaga aggacctgat 3660 catcaagctg ccgaagtaca gcctgttcga actggaaaac ggaagaaaga gaatgctggc 3720 aagcgcagga gaactgcaga agggaaacga actggcactg ccgagcaagt acgtcaactt 3780 cctgtacctg gcaagccact acgaaaagct gaagggaagc ccggaagaca acgaacagaa 3840 gcagctgttc gtcgaacagc acaagcacta cctggacgaa atcatcgaac agatcagcga 3900 attcagcaag agagtcatcc tggcagacgc aaacctggac aaggtcctga gcgcatacaa 3960 caagcacaga gacaagccga tcagagaaca ggcagaaaac atcatccacc tgttcacact 4020 gacaaacctg ggagcaccgg cagcattcaa gtacttcgac acaacaatcg acagaaagag 4080 atacacaagc acaaaggaag tcctggacgc aacactgatc caccagagca tcacaggact 4140 gtacgaaaca agaatcgacc tgagccagct gggaggagac ggaggaggaa gcccgaagaa 4200 gaagagaaag gtctagctag ccatcacatt taaaagcatc tcagcctacc atgagaataa 4260 gagaaagaaa atgaagatca atagcttatt catctctttt tctttttcgt tggtgtaaag 4320 ccaacaccct gtctaaaaaa cataaatttc tttaatcatt ttgcctcttt tctctgtgct 4380 tcaattaata aaaaatggaa agaacctcga g 4411 <210> 62 <211> 105 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 62 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa gcgaaaaaaa aaaaaaaaaa aaaaaaaaaa 60 aaaccgaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 105 <210> 63 <211> 93 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic oligonucleotide" <400> 63 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 60 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 93 <210> 64 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(3) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (1)..(4) <223> Phosphorothioate linkage <220> <221> modified_base <222> (97)..(99) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (97)..(100) <223> Phosphorothioate linkage <400> 64 ccaguccagc gaggcaaagg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 65 <211> 3312 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 65 atggcagcat tcaagccgaa ctcgatcaac tacatcctgg gactggacat cggaatcgca 60 tcggtcggat gggcaatggt cgaaatcgac gaagaagaaa acccgatcag actgatcgac 120 ctgggagtca gagtcttcga aagagcagaa gtcccgaaga caggagactc gctggcaatg 180 gcaagaagac tggcaagatc ggtcagaaga ctgacaagaa gaagagcaca cagactgctg 240 agaacaagaa gactgctgaa gagagaagga gtcctgcagg cagcaaactt cgacgaaaac 300 ggactgatca agtcgctgcc gaacacaccg tggcagctga gagcagcagc actggacaga 360 aagctgacac cgctggaatg gtcggcagtc ctgctgcacc tgatcaagca cagaggatac 420 ctgtcgcaga gaaagaacga aggagaaaca gcagacaagg aactgggagc actgctgaag 480 ggagtcgcag gaaacgcaca cgcactgcag acaggagact tcagaacacc ggcagaactg 540 gcactgaaca agttcgaaaa ggaatcggga cacatcagaa accagagatc ggactactcg 600 cacacattct cgagaaagga cctgcaggca gaactgatcc tgctgttcga aaagcagaag 660 gaattcggaa acccgcacgt ctcgggagga ctgaaggaag gaatcgaaac actgctgatg 720 acacagagac cggcactgtc gggagacgca gtccagaaga tgctgggaca ctgcacattc 780 gaaccggcag aaccgaaggc agcaaagaac acatacacag cagaaagatt catctggctg 840 acaaagctga acaacctgag aatcctggaa cagggatcgg aaagaccgct gacagacaca 900 gaaagagcaa cactgatgga cgaaccgtac agaaagtcga agctgacata cgcacaggca 960 agaaagctgc tgggactgga agacacagca ttcttcaagg gactgagata cggaaaggac 1020 aacgcagaag catcgacact gatggaaatg aaggcatacc acgcaatctc gagagcactg 1080 gaaaaggaag gactgaagga caagaagtcg ccgctgaacc tgtcgccgga actgcaggac 1140 gaaatcggaa cagcattctc gctgttcaag acagacgaag acatcacagg aagactgaag 1200 gacagaatcc agccggaaat cctggaagca ctgctgaagc acatctcgtt cgacaagttc 1260 gtccagatct cgctgaaggc actgagaaga atcgtcccgc tgatggaaca gggaaagaga 1320 tacgacgaag catgcgcaga aatctacgga gaccactacg gaaagaagaa cacagaagaa 1380 aagatctacc tgccgccgat cccggcagac gaaatcagaa acccggtcgt cctgagagca 1440 ctgtcgcagg caagaaaggt catcaacgga gtcgtcagaa gatacggatc gccggcaaga 1500 atccacatcg aaacagcaag agaagtcgga aagtcgttca aggacagaaa ggaaatcgaa 1560 aagagacagg aagaaaacag aaaggacaga gaaaaggcag cagcaaagtt cagagaatac 1620 ttcccgaact tcgtcggaga accgaagtcg aaggacatcc tgaagctgag actgtacgaa 1680 cagcagcacg gaaagtgcct gtactcggga aaggaaatca acctgggaag actgaacgaa 1740 aagggatacg tcgaaatcga ccacgcactg ccgttctcga gaacatggga cgactcgttc 1800 aacaacaagg tcctggtcct gggatcggaa aaccagaaca agggaaacca gacaccgtac 1860 gaatacttca acggaaagga caactcgaga gaatggcagg aattcaaggc aagagtcgaa 1920 acatcgagat tcccgagatc gaagaagcag agaatcctgc tgcagaagtt cgacgaagac 1980 ggattcaagg aaagaaacct gaacgacaca agatacgtca acagattcct gtgccagttc 2040 gtcgcagaca gaatgagact gacaggaaag ggaaagaaga gagtcttcgc atcgaacgga 2100 cagatcacaa acctgctgag aggattctgg ggactgagaa aggtcagagc agaaaacgac 2160 agacaccacg cactggacgc agtcgtcgtc gcatgctcga cagtcgcaat gcagcagaag 2220 atcacaagat tcgtcagata caaggaaatg aacgcattcg acggaaagac aatcgacaag 2280 gaaacaggag aagtcctgca ccagaagaca cacttcccgc agccgtggga attcttcgca 2340 caggaagtca tgatcagagt cttcggaaag ccggacggaa agccggaatt cgaagaagca 2400 gacacactgg aaaagctgag aacactgctg gcagaaaagc tgtcgtcgag accggaagca 2460 gtccacgaat acgtcacacc gctgttcgtc tcgagagcac cgaacagaaa gatgtcggga 2520 cagggacaca tggaaacagt caagtcggca aagagactgg acgaaggagt ctcggtcctg 2580 agagtcccgc tgacacagct gaagctgaag gacctggaaa agatggtcaa cagagaaaga 2640 gaaccgaagc tgtacgaagc actgaaggca agactggaag cacacaagga cgacccggca 2700 aaggcattcg cagaaccgtt ctacaagtac gacaaggcag gaaacagaac acagcaggtc 2760 aaggcagtca gagtcgaaca ggtccagaag acaggagtct gggtcagaaa ccacaacgga 2820 atcgcagaca acgcaacaat ggtcagagta gacgtcttcg aaaagggaga caagtactac 2880 ctggtcccga tctactcgtg gcaggtcgca aagggaatcc tgccggacag agcagtcgtc 2940 cagggaaagg acgaagaaga ctggcagctg atcgacgact cgttcaactt caagttctcg 3000 ctgcacccga acgacctggt cgaagtcatc acaaagaagg caagaatgtt cggatacttc 3060 gcatcgtgcc acagaggaac aggaaacatc aacatcagaa tccacgacct ggaccacaag 3120 atcggaaaga acggaatcct ggaaggaatc ggagtcaaga cagcactgtc gttccagaag 3180 taccagatcg acgaactggg aaaggaaatc agaccgtgca gactgaagaa gagaccgccg 3240 gtcagatccg gaaagagaac agcagacgga tcggaattcg aatcgccgaa gaagaagaga 3300 aaggtcgaat ga 3312 <210> 66 <211> 3306 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 66 gcagcattca agccgaactc gatcaactac atcctgggac tggacatcgg aatcgcatcg 60 gtcggatggg caatggtcga aatcgacgaa gaagaaaacc cgatcagact gatcgacctg 120 ggagtcagag tcttcgaaag agcagaagtc ccgaagacag gagactcgct ggcaatggca 180 agaagactgg caagatcggt cagaagactg acaagaagaa gagcacacag actgctgaga 240 acaagaagac tgctgaagag agaaggagtc ctgcaggcag caaacttcga cgaaaacgga 300 ctgatcaagt cgctgccgaa cacaccgtgg cagctgagag cagcagcact ggacagaaag 360 ctgacaccgc tggaatggtc ggcagtcctg ctgcacctga tcaagcacag aggatacctg 420 tcgcagagaa agaacgaagg agaaacagca gacaaggaac tgggagcact gctgaaggga 480 gtcgcaggaa acgcacacgc actgcagaca ggagacttca gaacaccggc agaactggca 540 ctgaacaagt tcgaaaagga atcgggacac atcagaaacc agagatcgga ctactcgcac 600 acattctcga gaaaggacct gcaggcagaa ctgatcctgc tgttcgaaaa gcagaaggaa 660 ttcggaaacc cgcacgtctc gggaggactg aaggaaggaa tcgaaacact gctgatgaca 720 cagagaccgg cactgtcggg agacgcagtc cagaagatgc tgggacactg cacattcgaa 780 ccggcagaac cgaaggcagc aaagaacaca tacacagcag aaagattcat ctggctgaca 840 aagctgaaca acctgagaat cctggaacag ggatcggaaa gaccgctgac agacacagaa 900 agagcaacac tgatggacga accgtacaga aagtcgaagc tgacatacgc acaggcaaga 960 aagctgctgg gactggaaga cacagcattc ttcaagggac tgagatacgg aaaggacaac 1020 gcagaagcat cgacactgat ggaaatgaag gcataccacg caatctcgag agcactggaa 1080 aaggaaggac tgaaggacaa gaagtcgccg ctgaacctgt cgccggaact gcaggacgaa 1140 atcggaacag cattctcgct gttcaagaca gacgaagaca tcacaggaag actgaaggac 1200 agaatccagc cggaaatcct ggaagcactg ctgaagcaca tctcgttcga caagttcgtc 1260 cagatctcgc tgaaggcact gagaagaatc gtcccgctga tggaacaggg aaagagatac 1320 gacgaagcat gcgcagaaat ctacggagac cactacggaa agaagaacac agaagaaaag 1380 atctacctgc cgccgatccc ggcagacgaa atcagaaacc cggtcgtcct gagagcactg 1440 tcgcaggcaa gaaaggtcat caacggagtc gtcagaagat acggatcgcc ggcaagaatc 1500 cacatcgaaa cagcaagaga agtcggaaag tcgttcaagg acagaaagga aatcgaaaag 1560 agacaggaag aaaacagaaa ggacagagaa aaggcagcag caaagttcag agaatacttc 1620 ccgaacttcg tcggagaacc gaagtcgaag gacatcctga agctgagact gtacgaacag 1680 cagcacggaa agtgcctgta ctcgggaaag gaaatcaacc tgggaagact gaacgaaaag 1740 ggatacgtcg aaatcgacca cgcactgccg ttctcgagaa catgggacga ctcgttcaac 1800 aacaaggtcc tggtcctggg atcggaaaac cagaacaagg gaaaccagac accgtacgaa 1860 tacttcaacg gaaaggacaa ctcgagagaa tggcaggaat tcaaggcaag agtcgaaaca 1920 tcgagattcc cgagatcgaa gaagcagaga atcctgctgc agaagttcga cgaagacgga 1980 ttcaaggaaa gaaacctgaa cgacacaaga tacgtcaaca gattcctgtg ccagttcgtc 2040 gcagacagaa tgagactgac aggaaaggga aagaagagag tcttcgcatc gaacggacag 2100 atcacaaacc tgctgagagg attctgggga ctgagaaagg tcagagcaga aaacgacaga 2160 caccacgcac tggacgcagt cgtcgtcgca tgctcgacag tcgcaatgca gcagaagatc 2220 acaagattcg tcagatacaa ggaaatgaac gcattcgacg gaaagacaat cgacaaggaa 2280 acaggagaag tcctgcacca gaagacacac ttcccgcagc cgtgggaatt cttcgcacag 2340 gaagtcatga tcagagtctt cggaaagccg gacggaaagc cggaattcga agaagcagac 2400 acactggaaa agctgagaac actgctggca gaaaagctgt cgtcgagacc ggaagcagtc 2460 cacgaatacg tcacaccgct gttcgtctcg agagcaccga acagaaagat gtcgggacag 2520 ggacacatgg aaacagtcaa gtcggcaaag agactggacg aaggagtctc ggtcctgaga 2580 gtcccgctga cacagctgaa gctgaaggac ctggaaaaga tggtcaacag agaaagagaa 2640 ccgaagctgt acgaagcact gaaggcaaga ctggaagcac acaaggacga cccggcaaag 2700 gcattcgcag aaccgttcta caagtacgac aaggcaggaa acagaacaca gcaggtcaag 2760 gcagtcagag tcgaacaggt ccagaagaca ggagtctggg tcagaaacca caacggaatc 2820 gcagacaacg caacaatggt cagagtagac gtcttcgaaa agggagacaa gtactacctg 2880 gtcccgatct actcgtggca ggtcgcaaag ggaatcctgc cggacagagc agtcgtccag 2940 ggaaaggacg aagaagactg gcagctgatc gacgactcgt tcaacttcaa gttctcgctg 3000 cacccgaacg acctggtcga agtcatcaca aagaaggcaa gaatgttcgg atacttcgca 3060 tcgtgccaca gaggaacagg aaacatcaac atcagaatcc acgacctgga ccacaagatc 3120 ggaaagaacg gaatcctgga aggaatcgga gtcaagacag cactgtcgtt ccagaagtac 3180 cagatcgacg aactgggaaa ggaaatcaga ccgtgcagac tgaagaagag accgccggtc 3240 agatccggaa agagaacagc agacggatcg gaattcgaat cgccgaagaa gaagagaaag 3300 gtcgaa 3306 <210> 67 <211> 3636 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 67 gggagaccca agctggctag cgtttaaact taagcttgga tccgccacca tggcagcatt 60 caagccgaac tcgatcaact acatcctggg actggacatc ggaatcgcat cggtcggatg 120 ggcaatggtc gaaatcgacg aagaagaaaa cccgatcaga ctgatcgacc tgggagtcag 180 agtcttcgaa agagcagaag tcccgaagac aggagactcg ctggcaatgg caagaagact 240 ggcaagatcg gtcagaagac tgacaagaag aagagcacac agactgctga gaacaagaag 300 actgctgaag agagaaggag tcctgcaggc agcaaacttc gacgaaaacg gactgatcaa 360 gtcgctgccg aacacaccgt ggcagctgag agcagcagca ctggacagaa agctgacacc 420 gctggaatgg tcggcagtcc tgctgcacct gatcaagcac agaggatacc tgtcgcagag 480 aaagaacgaa ggagaaacag cagacaagga actgggagca ctgctgaagg gagtcgcagg 540 aaacgcacac gcactgcaga caggagactt cagaacaccg gcagaactgg cactgaacaa 600 gttcgaaaag gaatcgggac acatcagaaa ccagagatcg gactactcgc acacattctc 660 gagaaaggac ctgcaggcag aactgatcct gctgttcgaa aagcagaagg aattcggaaa 720 cccgcacgtc tcgggaggac tgaaggaagg aatcgaaaca ctgctgatga cacagagacc 780 ggcactgtcg ggagacgcag tccagaagat gctgggacac tgcacattcg aaccggcaga 840 accgaaggca gcaaagaaca catacacagc agaaagattc atctggctga caaagctgaa 900 caacctgaga atcctggaac agggatcgga aagaccgctg acagacacag aaagagcaac 960 actgatggac gaaccgtaca gaaagtcgaa gctgacatac gcacaggcaa gaaagctgct 1020 gggactggaa gacacagcat tcttcaaggg actgagatac ggaaaggaca acgcagaagc 1080 atcgacactg atggaaatga aggcatacca cgcaatctcg agagcactgg aaaaggaagg 1140 actgaaggac aagaagtcgc cgctgaacct gtcgccggaa ctgcaggacg aaatcggaac 1200 agcattctcg ctgttcaaga cagacgaaga catcacagga agactgaagg acagaatcca 1260 gccggaaatc ctggaagcac tgctgaagca catctcgttc gacaagttcg tccagatctc 1320 gctgaaggca ctgagaagaa tcgtcccgct gatggaacag ggaaagagat acgacgaagc 1380 atgcgcagaa atctacggag accactacgg aaagaagaac acagaagaaa agatctacct 1440 gccgccgatc ccggcagacg aaatcagaaa cccggtcgtc ctgagagcac tgtcgcaggc 1500 aagaaaggtc atcaacggag tcgtcagaag atacggatcg ccggcaagaa tccacatcga 1560 aacagcaaga gaagtcggaa agtcgttcaa ggacagaaag gaaatcgaaa agagacagga 1620 agaaaacaga aaggacagag aaaaggcagc agcaaagttc agagaatact tcccgaactt 1680 cgtcggagaa ccgaagtcga aggacatcct gaagctgaga ctgtacgaac agcagcacgg 1740 aaagtgcctg tactcgggaa aggaaatcaa cctgggaaga ctgaacgaaa agggatacgt 1800 cgaaatcgac cacgcactgc cgttctcgag aacatgggac gactcgttca acaacaaggt 1860 cctggtcctg ggatcggaaa accagaacaa gggaaaccag acaccgtacg aatacttcaa 1920 cggaaaggac aactcgagag aatggcagga attcaaggca agagtcgaaa catcgagatt 1980 cccgagatcg aagaagcaga gaatcctgct gcagaagttc gacgaagacg gattcaagga 2040 aagaaacctg aacgacacaa gatacgtcaa cagattcctg tgccagttcg tcgcagacag 2100 aatgagactg acaggaaagg gaaagaagag agtcttcgca tcgaacggac agatcacaaa 2160 cctgctgaga ggattctggg gactgagaaa ggtcagagca gaaaacgaca gacaccacgc 2220 actggacgca gtcgtcgtcg catgctcgac agtcgcaatg cagcagaaga tcacaagatt 2280 cgtcagatac aaggaaatga acgcattcga cggaaagaca atcgacaagg aaacaggaga 2340 agtcctgcac cagaagacac acttcccgca gccgtgggaa ttcttcgcac aggaagtcat 2400 gatcagagtc ttcggaaagc cggacggaaa gccggaattc gaagaagcag acacactgga 2460 aaagctgaga acactgctgg cagaaaagct gtcgtcgaga ccggaagcag tccacgaata 2520 cgtcacaccg ctgttcgtct cgagagcacc gaacagaaag atgtcgggac agggacacat 2580 ggaaacagtc aagtcggcaa agagactgga cgaaggagtc tcggtcctga gagtcccgct 2640 gacacagctg aagctgaagg acctggaaaa gatggtcaac agagaaagag aaccgaagct 2700 gtacgaagca ctgaaggcaa gactggaagc acacaaggac gacccggcaa aggcattcgc 2760 agaaccgttc tacaagtacg acaaggcagg aaacagaaca cagcaggtca aggcagtcag 2820 agtcgaacag gtccagaaga caggagtctg ggtcagaaac cacaacggaa tcgcagacaa 2880 cgcaacaatg gtcagagtag acgtcttcga aaagggagac aagtactacc tggtcccgat 2940 ctactcgtgg caggtcgcaa agggaatcct gccggacaga gcagtcgtcc agggaaagga 3000 cgaagaagac tggcagctga tcgacgactc gttcaacttc aagttctcgc tgcacccgaa 3060 cgacctggtc gaagtcatca caaagaaggc aagaatgttc ggatacttcg catcgtgcca 3120 cagaggaaca ggaaacatca acatcagaat ccacgacctg gaccacaaga tcggaaagaa 3180 cggaatcctg gaaggaatcg gagtcaagac agcactgtcg ttccagaagt accagatcga 3240 cgaactggga aaggaaatca gaccgtgcag actgaagaag agaccgccgg tcagatccgg 3300 aaagagaaca gcagacggat cggaattcga atcgccgaag aagaagagaa aggtcgaatg 3360 atagctagct cgagtctaga gggcccgttt aaacccgctg atcagcctcg actgtgcctt 3420 ctagttgcca gccatctgtt gtttgcccct cccccgtgcc ttccttgacc ctggaaggtg 3480 ccactcccac tgtcctttcc taataaaatg aggaaattgc atcgcattgt ctgagtaggt 3540 gtcattctat tctggggggt ggggtggggc aggacagcaa gggggaggat tgggaagaca 3600 atagcaggca tgctggggat gcggtgggct ctatgg 3636 <210> 68 <211> 1103 <212> PRT <213> Neisseria meningitidis <400> 68 Met Ala Ala Phe Lys Pro Asn Ser Ile Asn Tyr Ile Leu Gly Leu Asp 1 5 10 15 Ile Gly Ile Ala Ser Val Gly Trp Ala Met Val Glu Ile Asp Glu Glu 20 25 30 Glu Asn Pro Ile Arg Leu Ile Asp Leu Gly Val Arg Val Phe Glu Arg 35 40 45 Ala Glu Val Pro Lys Thr Gly Asp Ser Leu Ala Met Ala Arg Arg Leu 50 55 60 Ala Arg Ser Val Arg Arg Leu Thr Arg Arg Arg Ala His Arg Leu Leu 65 70 75 80 Arg Thr Arg Arg Leu Leu Lys Arg Glu Gly Val Leu Gln Ala Ala Asn 85 90 95 Phe Asp Glu Asn Gly Leu Ile Lys Ser Leu Pro Asn Thr Pro Trp Gln 100 105 110 Leu Arg Ala Ala Ala Leu Asp Arg Lys Leu Thr Pro Leu Glu Trp Ser 115 120 125 Ala Val Leu Leu His Leu Ile Lys His Arg Gly Tyr Leu Ser Gln Arg 130 135 140 Lys Asn Glu Gly Glu Thr Ala Asp Lys Glu Leu Gly Ala Leu Leu Lys 145 150 155 160 Gly Val Ala Gly Asn Ala His Ala Leu Gln Thr Gly Asp Phe Arg Thr 165 170 175 Pro Ala Glu Leu Ala Leu Asn Lys Phe Glu Lys Glu Ser Gly His Ile 180 185 190 Arg Asn Gln Arg Ser Asp Tyr Ser His Thr Phe Ser Arg Lys Asp Leu 195 200 205 Gln Ala Glu Leu Ile Leu Leu Phe Glu Lys Gln Lys Glu Phe Gly Asn 210 215 220 Pro His Val Ser Gly Gly Leu Lys Glu Gly Ile Glu Thr Leu Leu Met 225 230 235 240 Thr Gln Arg Pro Ala Leu Ser Gly Asp Ala Val Gln Lys Met Leu Gly 245 250 255 His Cys Thr Phe Glu Pro Ala Glu Pro Lys Ala Ala Lys Asn Thr Tyr 260 265 270 Thr Ala Glu Arg Phe Ile Trp Leu Thr Lys Leu Asn Asn Leu Arg Ile 275 280 285 Leu Glu Gln Gly Ser Glu Arg Pro Leu Thr Asp Thr Glu Arg Ala Thr 290 295 300 Leu Met Asp Glu Pro Tyr Arg Lys Ser Lys Leu Thr Tyr Ala Gln Ala 305 310 315 320 Arg Lys Leu Leu Gly Leu Glu Asp Thr Ala Phe Phe Lys Gly Leu Arg 325 330 335 Tyr Gly Lys Asp Asn Ala Glu Ala Ser Thr Leu Met Glu Met Lys Ala 340 345 350 Tyr His Ala Ile Ser Arg Ala Leu Glu Lys Glu Gly Leu Lys Asp Lys 355 360 365 Lys Ser Pro Leu Asn Leu Ser Pro Glu Leu Gln Asp Glu Ile Gly Thr 370 375 380 Ala Phe Ser Leu Phe Lys Thr Asp Glu Asp Ile Thr Gly Arg Leu Lys 385 390 395 400 Asp Arg Ile Gln Pro Glu Ile Leu Glu Ala Leu Leu Lys His Ile Ser 405 410 415 Phe Asp Lys Phe Val Gln Ile Ser Leu Lys Ala Leu Arg Arg Ile Val 420 425 430 Pro Leu Met Glu Gln Gly Lys Arg Tyr Asp Glu Ala Cys Ala Glu Ile 435 440 445 Tyr Gly Asp His Tyr Gly Lys Lys Asn Thr Glu Glu Lys Ile Tyr Leu 450 455 460 Pro Pro Ile Pro Ala Asp Glu Ile Arg Asn Pro Val Val Leu Arg Ala 465 470 475 480 Leu Ser Gln Ala Arg Lys Val Ile Asn Gly Val Val Arg Arg Tyr Gly 485 490 495 Ser Pro Ala Arg Ile His Ile Glu Thr Ala Arg Glu Val Gly Lys Ser 500 505 510 Phe Lys Asp Arg Lys Glu Ile Glu Lys Arg Gln Glu Glu Asn Arg Lys 515 520 525 Asp Arg Glu Lys Ala Ala Ala Lys Phe Arg Glu Tyr Phe Pro Asn Phe 530 535 540 Val Gly Glu Pro Lys Ser Lys Asp Ile Leu Lys Leu Arg Leu Tyr Glu 545 550 555 560 Gln Gln His Gly Lys Cys Leu Tyr Ser Gly Lys Glu Ile Asn Leu Gly 565 570 575 Arg Leu Asn Glu Lys Gly Tyr Val Glu Ile Asp His Ala Leu Pro Phe 580 585 590 Ser Arg Thr Trp Asp Asp Ser Phe Asn Asn Lys Val Leu Val Leu Gly 595 600 605 Ser Glu Asn Gln Asn Lys Gly Asn Gln Thr Pro Tyr Glu Tyr Phe Asn 610 615 620 Gly Lys Asp Asn Ser Arg Glu Trp Gln Glu Phe Lys Ala Arg Val Glu 625 630 635 640 Thr Ser Arg Phe Pro Arg Ser Lys Lys Gln Arg Ile Leu Leu Gln Lys 645 650 655 Phe Asp Glu Asp Gly Phe Lys Glu Arg Asn Leu Asn Asp Thr Arg Tyr 660 665 670 Val Asn Arg Phe Leu Cys Gln Phe Val Ala Asp Arg Met Arg Leu Thr 675 680 685 Gly Lys Gly Lys Lys Arg Val Phe Ala Ser Asn Gly Gln Ile Thr Asn 690 695 700 Leu Leu Arg Gly Phe Trp Gly Leu Arg Lys Val Arg Ala Glu Asn Asp 705 710 715 720 Arg His His Ala Leu Asp Ala Val Val Val Ala Cys Ser Thr Val Ala 725 730 735 Met Gln Gln Lys Ile Thr Arg Phe Val Arg Tyr Lys Glu Met Asn Ala 740 745 750 Phe Asp Gly Lys Thr Ile Asp Lys Glu Thr Gly Glu Val Leu His Gln 755 760 765 Lys Thr His Phe Pro Gln Pro Trp Glu Phe Phe Ala Gln Glu Val Met 770 775 780 Ile Arg Val Phe Gly Lys Pro Asp Gly Lys Pro Glu Phe Glu Glu Ala 785 790 795 800 Asp Thr Leu Glu Lys Leu Arg Thr Leu Leu Ala Glu Lys Leu Ser Ser 805 810 815 Arg Pro Glu Ala Val His Glu Tyr Val Thr Pro Leu Phe Val Ser Arg 820 825 830 Ala Pro Asn Arg Lys Met Ser Gly Gln Gly His Met Glu Thr Val Lys 835 840 845 Ser Ala Lys Arg Leu Asp Glu Gly Val Ser Val Leu Arg Val Pro Leu 850 855 860 Thr Gln Leu Lys Leu Lys Asp Leu Glu Lys Met Val Asn Arg Glu Arg 865 870 875 880 Glu Pro Lys Leu Tyr Glu Ala Leu Lys Ala Arg Leu Glu Ala His Lys 885 890 895 Asp Asp Pro Ala Lys Ala Phe Ala Glu Pro Phe Tyr Lys Tyr Asp Lys 900 905 910 Ala Gly Asn Arg Thr Gln Gln Val Lys Ala Val Arg Val Glu Gln Val 915 920 925 Gln Lys Thr Gly Val Trp Val Arg Asn His Asn Gly Ile Ala Asp Asn 930 935 940 Ala Thr Met Val Arg Val Asp Val Phe Glu Lys Gly Asp Lys Tyr Tyr 945 950 955 960 Leu Val Pro Ile Tyr Ser Trp Gln Val Ala Lys Gly Ile Leu Pro Asp 965 970 975 Arg Ala Val Val Gln Gly Lys Asp Glu Glu Asp Trp Gln Leu Ile Asp 980 985 990 Asp Ser Phe Asn Phe Lys Phe Ser Leu His Pro Asn Asp Leu Val Glu 995 1000 1005 Val Ile Thr Lys Lys Ala Arg Met Phe Gly Tyr Phe Ala Ser Cys 1010 1015 1020 His Arg Gly Thr Gly Asn Ile Asn Ile Arg Ile His Asp Leu Asp 1025 1030 1035 His Lys Ile Gly Lys Asn Gly Ile Leu Glu Gly Ile Gly Val Lys 1040 1045 1050 Thr Ala Leu Ser Phe Gln Lys Tyr Gln Ile Asp Glu Leu Gly Lys 1055 1060 1065 Glu Ile Arg Pro Cys Arg Leu Lys Lys Arg Pro Pro Val Arg Ser 1070 1075 1080 Gly Lys Arg Thr Ala Asp Gly Ser Glu Phe Glu Ser Pro Lys Lys 1085 1090 1095 Lys Arg Lys Val Glu 1100 <210> 69 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(3) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (1)..(4) <223> Phosphorothioate linkage <220> <221> modified_base <222> (29)..(40) <223> 2'-O-methyl modified <220> <221> modified_base <222> (69)..(100) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (97)..(100) <223> Phosphorothioate linkage <400> 69 gccgagucug gagagcugca guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 70 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(3) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (1)..(4) <223> Phosphorothioate linkage <220> <221> modified_base <222> (29)..(40) <223> 2'-O-methyl modified <220> <221> modified_base <222> (69)..(100) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (97)..(100) <223> Phosphorothioate linkage <400> 70 acacaaauac caguccagcg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 71 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(3) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (1)..(4) <223> Phosphorothioate linkage <220> <221> modified_base <222> (29)..(40) <223> 2'-O-methyl modified <220> <221> modified_base <222> (69)..(100) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (97)..(100) <223> Phosphorothioate linkage <400> 71 aaaguucuag augccguccg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 72 <211> 100 <212> RNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <220> <221> modified_base <222> (1)..(3) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (1)..(4) <223> Phosphorothioate linkage <220> <221> modified_base <222> (29)..(40) <223> 2'-O-methyl modified <220> <221> modified_base <222> (69)..(100) <223> 2'-O-methyl modified <220> <221> misc_feature <222> (97)..(100) <223> Phosphorothioate linkage <400> 72 acgcaaauau caguccagcg guuuuagagc uagaaauagc aaguuaaaau aaggcuaguc 60 cguuaucaac uugaaaaagu ggcaccgagu cggugcuuuu 100 <210> 73 <211> 7 <212> PRT <213> Simian virus 40 <400> 73 Pro Lys Lys Lys Arg Lys Val 1 5 <210> 74 <211> 7 <212> PRT <213> Simian virus 40 <400> 74 Pro Lys Lys Lys Arg Arg Val 1 5 <210> 75 <211> 16 <212> PRT <213> Unknown <220> <221> source <223> /note="Description of Unknown: Nucleoplasmin bipartite NLS sequence" <400> 75 Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys 1 5 10 15 <210> 76 <211> 6 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic 6xHis tag" <400> 76 His His His His His His 1 5 <210> 77 <211> 8 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic 8xHis tag" <400> 77 His His His His His His His His 1 5 <210> 78 <211> 10 <212> RNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Kozak sequence" <400> 78 gccrccaugg 10 <210> 79 <211> 13 <212> RNA <213> Unknown <220> <221> source <223> /note="Description of Unknown: Kozak sequence" <400> 79 gccgccrcca ugg 13 <210> 80 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 80 cactctttcc ctacacgacg ctcttccgat ctgttttgtt ccagagtcta tcaccg 56 <210> 81 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 81 ggagttcaga cgtgtgctct tccgatctac acgaataaga gcaaatggga ac 52 <210> 82 <211> 55 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 82 cactctttcc ctacacgacg ctcttccgat cttgcatttc atgagaccga aaaca 55 <210> 83 <211> 55 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 83 ggagttcaga cgtgtgctct tccgatctgc tacagtagag ctgtacataa aactt 55 <210> 84 <211> 3783 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 84 tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca 60 cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg 120 ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc 180 accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgcc 240 attcgccatt caggctgcgc aactgttggg aagggcgatc ggtgcgggcc tcttcgctat 300 tacgccagct ggcgaaaggg ggatgtgctg caaggcgatt aagttgggta acgccagggt 360 tttcccagtc acgacgttgt aaaacgacgg ccagtgaatt ctaatacgac tcactatagg 420 gtcccgcagt cggcgtccag cggctctgct tgttcgtgtg tgtgtcgttg caggccttat 480 tcggatccat ggtgagcaag ggcgaggagc tgttcaccgg ggtggtgccc atcctggtcg 540 agctggacgg cgacgtaaac ggccacaagt tcagcgtgtc cggcgagggc gagggcgatg 600 ccacctacgg caagctgacc ctgaagttca tctgcaccac cggcaagctg cccgtgccct 660 ggcccaccct cgtgaccacc ctgacctacg gcgtgcagtg cttcagccgc taccccgacc 720 acatgaagca gcacgacttc ttcaagtccg ccatgcccga aggctacgtc caggagcgca 780 ccatcttctt caaggacgac ggcaactaca agacccgcgc cgaggtgaag ttcgagggcg 840 acaccctggt gaaccgcatc gagctgaagg gcatcgactt caaggaggac ggcaacatcc 900 tggggcacaa gctggagtac aactacaaca gccacaacgt ctatatcatg gccgacaagc 960 agaagaacgg catcaaggtg aacttcaaga tccgccacaa catcgaggac ggcagcgtgc 1020 agctcgccga ccactaccag cagaacaccc ccatcggcga cggccccgtg ctgctgcccg 1080 acaaccacta cctgagcacc cagtccgccc tgagcaaaga ccccaacgag aagcgcgatc 1140 acatggtcct gctggagttc gtgaccgccg ccgggatcac tctcggcatg gacgagctgt 1200 acaagtaata ggaattatgc agtctagcca tcacatttaa aagcatctca gcctaccatg 1260 agaataagag aaagaaaatg aagatcaata gcttattcat ctctttttct ttttcgttgg 1320 tgtaaagcca acaccctgtc taaaaaacat aaatttcttt aatcattttg cctcttttct 1380 ctgtgcttca attaataaaa aatggaaaga acctcgagaa aaaaaaaaaa aaaaaaaaaa 1440 aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 1500 aaaaaaaaaa aaaaaaaatc tagacttaag cttgatgagc tctagcttgg cgtaatcatg 1560 gtcatagctg tttcctgtgt gaaattgtta tccgctcaca attccacaca acatacgagc 1620 cggaagcata aagtgtaaag cctggggtgc ctaatgagtg agctaactca cattaattgc 1680 gttgcgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc attaatgaat 1740 cggccaacgc gcggggagag gcggtttgcg tattgggcgc tcttccgctt cctcgctcac 1800 tgactcgctg cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt 1860 aatacggtta tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca 1920 gcaaaaggcc aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc 1980 ccctgacgag catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact 2040 ataaagatac caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct 2100 gccgcttacc ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcatag 2160 ctcacgctgt aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca 2220 cgaacccccc gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa 2280 cccggtaaga cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc 2340 gaggtatgta ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag 2400 aagaacagta tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg 2460 tagctcttga tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca 2520 gcagattacg cgcagaaaaa aaggatctca agaagatcct ttgatctttt ctacggggtc 2580 tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagat tatcaaaaag 2640 gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata 2700 tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat 2760 ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg 2820 ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc 2880 tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc 2940 aactttatcc gcctccatcc agtctattaa ttgttgccgg gaagctagag taagtagttc 3000 gccagttaat agtttgcgca acgttgttgc cattgctaca ggcatcgtgg tgtcacgctc 3060 gtcgtttggt atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc 3120 ccccatgttg tgcaaaaaag cggttagctc cttcggtcct ccgatcgttg tcagaagtaa 3180 gttggccgca gtgttatcac tcatggttat ggcagcactg cataattctc ttactgtcat 3240 gccatccgta agatgctttt ctgtgactgg tgagtactca accaagtcat tctgagaata 3300 gtgtatgcgg cgaccgagtt gctcttgccc ggcgtcaata cgggataata ccgcgccaca 3360 tagcagaact ttaaaagtgc tcatcattgg aaaacgttct tcggggcgaa aactctcaag 3420 gatcttaccg ctgttgagat ccagttcgat gtaacccact cgtgcaccca actgatcttc 3480 agcatctttt actttcacca gcgtttctgg gtgagcaaaa acaggaaggc aaaatgccgc 3540 aaaaaaggga ataagggcga cacggaaatg ttgaatactc atactcttcc tttttcaata 3600 ttattgaagc atttatcagg gttattgtct catgagcgga tacatatttg aatgtattta 3660 gaaaaataaa caaatagggg ttccgcgcac atttccccga aaagtgccac ctgacgtcta 3720 agaaaccatt attatcatga cattaaccta taaaaatagg cgtatcacga ggccctttcg 3780 tcg 3783

Claims

다음을 포함하는 지질 나노입자("LNP") 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함:
약 50-60 mol-% 아민 지질;
약 8-10 mol-% 중성 지질; 및
약 2.5-4 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 6임.
다음을 포함하는 LNP 조성물:
RNA 성분;
약 50-60 mol-% 아민 지질;
약 27-39.5 mol-% 헬퍼 지질;
약 8-10 mol-% 중성 지질; 및
약 2.5-4 mol-% PEG 지질,
여기서 LNP 조성물의 N/P 비율은 약 5-7임.
제2항에 있어서, N/P 비율은 약 6인 LNP 조성물.
다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함
약 50-60 mol-% 아민 지질;
약 5-15 mol-% 중성 지질; 및
약 2.5-4 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 3-10임.
다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함
약 40-60 mol-% 아민 지질;
약 5-15 mol-% 중성 지질; 및
약 2.5-4 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 6임.
다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함
약 50-60 mol-% 아민 지질;
약 5-15 mol-% 중성 지질; 및
약 1.5-10 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 6임.
다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함
약 40-60 mol-% 아민 지질;
약 0-10 mol-% 중성 지질; 및
약 1.5-10 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 3-10임.
다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함:
약 40-60 mol-% 아민 지질;
약 1 mol-% 미만의 중성 지질; 및
약 1.5-10 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 3-10임.
다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함:
약 40-60 mol-% 아민 지질; 및
약 1.5-10 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 3-10이고,
여기서 LNP 조성물에는 중성 인지질이 본질적으로 없거나 없음.
다음을 포함하는 LNP 조성물:
RNA 성분; 및
지질 성분, 여기서 지질 성분은 다음을 포함함:
약 50-60 mol-% 아민 지질;
약 8-10 mol-% 중성 지질; 및
약 2.5-4 mol-% PEG 지질,
여기서 지질 성분의 나머지는 헬퍼 지질이고,
여기서 LNP 조성물의 N/P 비율은 약 3-7임.
전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 mRNA를 포함하는 조성물.
전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 RNA-유도 DNA-결합제, 예컨대 Cas 뉴클레이스 mRNA를 포함하는 조성물.
전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 클래스 2 Cas 뉴클레이스 mRNA를 포함하는 조성물.
전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 Cas9 뉴클레이스 mRNA를 포함하는 조성물.
제11항 내지 제14항 중 어느 한 항에 있어서, mRNA는 변형된 mRNA인 조성물.
전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 RNA-유도 DNA-결합제를 인코딩하는 오픈 리딩 프레임을 포함하는 RNA를 포함하고, 여기서 오픈 리딩 프레임은 최소 우리딘 함량 내지 최소 우리딘 함량의 150% 범위의 우리딘 함량을 갖는 조성물.
전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 RNA-유도 DNA-결합제를 인코딩하는 오픈 리딩 프레임을 포함하는 mRNA를 포함하고, 여기서 오픈 리딩 프레임은 최소 우리딘 디뉴클레오타이드 함량 내지 최소 우리딘 디뉴클레오타이드 함량의 150% 범위의 우리딘 디뉴클레오타이드 함량을 갖는 조성물.
전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 서열 식별 번호: 1, 4, 7, 9, 10, 11, 12, 14, 15, 17, 18, 20, 21, 23, 24, 26, 27, 29, 30, 50, 52, 54, 65, 또는 66 중 어느 하나와 적어도 90% 동일성을 갖는 서열을 포함하는 mRNA를 포함하고, 여기서 mRNA는 RNA-유도 DNA-결합제를 인코딩하는 오픈 리딩 프레임을 포함하는 조성물.
전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 gRNA 핵산을 포함하는 조성물.
제19항에 있어서, gRNA 핵산은 gRNA인 조성물.
전술한 청구항 중 어느 한 항에 있어서, RNA 성분은 클래스 2 Cas 뉴클레이스 mRNA 및 gRNA를 포함하는 조성물.
제19항 내지 제21항 중 어느 한 항에 있어서, gRNA 핵산은 이중-가이드 RNA(dgRNA)이거나 이를 인코딩하는 조성물.
제19항 내지 제21항 중 어느 한 항에 있어서, gRNA 핵산은 sgRNA이거나 이를 인코딩하는 조성물.
제19항 내지 제23항 중 어느 한 항에 있어서, gRNA는 변형된 조성물.
제24항에 있어서, gRNA는 2'-O-메틸(2'-O-Me) 변형된 뉴클레오타이드, 뉴클레오타이드 사이의 포스포로티오에이트(PS) 결합; 및 2'-플루오로(2'-F) 변형된 뉴클레오타이드로부터 선택된 변형을 포함하는 조성물.
제24항 내지 제25항 중 어느 한 항에 있어서, gRNA는 5' 말단에서 최초 다섯 개의 뉴클레오타이드 중 하나 이상에서 변형을 포함하는 조성물.
제24항 내지 제26항 중 어느 한 항에 있어서, gRNA는 3' 말단에서 최종 다섯 개의 뉴클레오타이드 중 하나 이상에서 변형을 포함하는 조성물.
제24항 내지 제27항 중 어느 한 항에 있어서, gRNA는 최초 네 개의 뉴클레오타이드 사이의 PS 결합을 포함하는 조성물.
제24항 내지 제28항 중 어느 한 항에 있어서, gRNA는 최종 네 개의 뉴클레오타이드 사이의 PS 결합을 포함하는 조성물.
제24항 내지 제29항 중 어느 한 항에 있어서, 5' 말단에서 최초 세 개의 뉴클레오타이드에서 2'-O-Me 변형된 뉴클레오타이드를 추가로 포함하는 조성물.
제24항 내지 제30항 중 어느 한 항에 있어서, 3' 말단에서 최종 세 개의 뉴클레오타이드에서 2'-O-Me 변형된 뉴클레오타이드를 추가로 포함하는 조성물.
제19항 내지 제31항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 10:1 내지 약 1:10 범위의 비율로 존재하는 조성물.
제19항 내지 제31항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 5:1 내지 약 1:5 범위의 비율로 존재하는 조성물.
제19항 내지 제33항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 3:1 내지 약 1:1 범위의 비율로 존재하는 조성물.
제19항 내지 제34항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 2:1 내지 약 1:1 범위의 비율로 존재하는 조성물.
제19항 내지 제35항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 2:1의 비율로 존재하는 조성물.
제19항 내지 제35항 중 어느 한 항에 있어서, gRNA 및 클래스 2 Cas 뉴클레이스 mRNA는 중량으로 약 1:1의 비율로 존재하는 조성물.
전술한 청구항 중 어느 한 항에 있어서, 적어도 하나의 주형을 추가로 포함하는 조성물.
전술한 청구항 중 어느 한 항에 있어서, mol-% PEG 지질은 약 3인 조성물
전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 약 50인 조성물
전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 약 55 조성물
전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 ± 3 mol-%인 조성물.
전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 ± 2 mol-%인 조성물.
전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 47-53 mol-%인 조성물
전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 48-53 mol-%인 조성물
전술한 청구항 중 어느 한 항에 있어서, mol-% 아민 지질은 53-57 mol-%인 조성물
전술한 청구항 중 어느 한 항에 있어서, N/P 비율은 6 ± 1인 조성물.
전술한 청구항 중 어느 한 항에 있어서, N/P 비율은 6 ± 0.5인 조성물.
전술한 청구항 중 어느 한 항에 있어서, 아민 지질은 지질 A인 조성물.
전술한 청구항 중 어느 한 항에 있어서, 아민 지질은 지질 A의 유사체인 조성물.
제50항에 있어서, 유사체는 아세탈 유사체인 조성물.
제51항에 있어서, 아세탈 유사체는 C4-C12 아세탈 유사체인 조성물.
제50항에 있어서, 아세탈 유사체는 C5-C12 아세탈 유사체인 조성물.
제50항에 있어서, 아세탈 유사체는 C5-C10 아세탈 유사체인 조성물.
제50항에 있어서, 아세탈 유사체는 C4, C5, C6, C7, C9, C10, C11, 및 C12 유사체로부터 선택되는 조성물.
전술한 청구항 중 어느 한 항에 있어서, 헬퍼 지질은 콜레스테롤인 조성물.
전술한 청구항 중 어느 한 항에 있어서, 중성 지질은 DSPC인 조성물.
전술한 청구항 중 어느 한 항에 있어서, 중성 지질은 DPPC인 조성물.
전술한 청구항 중 어느 한 항에 있어서, PEG 지질은 디미리스토일글리세롤(DMG)을 포함하는 조성물.
전술한 청구항 중 어느 한 항에 있어서, PEG 지질은 PEG-2k를 포함하는 조성물.
전술한 청구항 중 어느 한 항에 있어서, PEG 지질은 PEG-DMG인 조성물.
제61항에 있어서, PEG-DMG는 PEG2k-DMG인 조성물.
제9항에 있어서, LNP 조성물에는 중성 지질이 본질적으로 없는 조성물.
제63항에 있어서, 중성 지질은 인지질인 조성물.
세포를 제12항 내지 제64항 중 어느 한 항의 LNP 조성물과 접촉시키는 것을 포함하는 유전자 편집 방법.
클래스 2 Cas 뉴클레이스 mRNA 및 가이드 RNA 핵산을 세포에 전달하는 것을 포함하고, 여기서 클래스 2 Cas mRNA 및 가이드 RNA 핵산은 제13항 내지 제64항 중 어느 한 항의 적어도 하나의 LNP 조성물로서 제제화되는 유전자 편집 방법.
세포를 제12항 내지 제64항 중 어느 한 항의 적어도 하나의 LNP 조성물과 접촉시키는 것을 포함하는 유전자 조작된 세포 제조 방법.
제65항 내지 제67항 중 어느 한 항에 있어서, LNP 조성물은 적어도 2 회 투여되는 방법.
제68항에 있어서, LNP 조성물은 2-5 회 투여되는 방법.
제68항 또는 제69항에 있어서, 편집은 재투여 시 개선되는 방법.
제65항 내지 제70항 중 어느 한 항에 있어서, 적어도 하나의 주형 핵산을 세포에 도입하는 것을 추가로 포함하는 방법.
제65항 내지 제71항 중 어느 한 항에 있어서, mRNA은 제1 LNP 조성물로 제제화되고 가이드 RNA 핵산은 제2 LNP 조성물로 제제화되는 방법.
제72항에 있어서, 제1 및 제2 LNP 조성물은 동시에 투여되는 방법.
제72항에 있어서, 제1 및 제2 LNP 조성물은 연속적으로 투여되는 방법.
제65항 내지 제73항 중 어느 한 항에 있어서, mRNA 및 가이드 RNA 핵산은 단일 LNP 조성물로 제제화되는 방법.