KR20110034650A

KR20110034650A - 헤마글루티닌을 포함하는 인플루엔자 바이러스-유사 입자(ｖｌｐｓ)

Info

Publication number: KR20110034650A
Application number: KR1020117001798A
Authority: KR
Inventors: 마르크-안드레 다우스트; 마농 꾸뛰르; 프레데릭 오르스; 소니아 트레파니어; 피에르-올리비에르 라보이; 미켈레 다지스; 루이스-필리페 베지나; 나탈리에 란드리
Original assignee: 메디카고 인코포레이티드
Priority date: 2008-07-11
Filing date: 2009-07-02
Publication date: 2011-04-05
Also published as: BRPI0915896A2; JP5921884B2; EP2307549A4; AU2009267759A1; IL210215A0; ES2525177T3; EA034733B1; RU2011105073A; CN102272308A; SG187500A1; EP2570484B1; EP2570484A1; NZ590144A; IL210215A; WO2010003225A1; WO2010003225A8; KR20160049061A; KR101956910B1; EP2307549A1; MX2011000459A

Abstract

식물 또는 식물의 일부에서 인플루엔자 바이러스-유사 입자(VLP)를 합성하는 방법이 제공된다. 상기 방법은 식물에서 타입 A/California/04/09의 인플루엔자 HA의 발현과 크기 배제 크로마토그래피에 의한 정제를 포함한다. 또한, 본 발명은 타입 A/California/04/09의 인플루엔자 HA 단백질과 식물 지질을 포함하는 VLP에 관한 것이다. 또한, 본 발명은 타입 A/California/04/09의 인플루엔자 HA를 암호화하는 핵산 및 벡터에 관한 것이다. VLP는 인플루엔자 백신을 제조하는데 사용될 수 있거나, 또는 기존 백신을 부화시키는데 사용될 수 있다.

Description

헤마글루티닌을 포함하는 인플루엔자 바이러스-유사 입자(ＶＬＰＳ){INFLUENZA VIRUS-LIKE PARTICLES(VLPS) COMPRISING HEMAGGLUTININ}

본 출원은 2008년 1월 21일 제출된 캐나다 출원 No. 2,615,327; 2008년 1월 22일 제출된 미국 출원 No. 61/022.775; 2007년 7월 13일 제출된 미국 출원 No. 61/959.414; 2007년 11월 27일 제출된 미국 출원 No. 60/990,603; 및 2007년 12월 12일 제출된 미국 출원 No. 61/013,272로부터 우선권을 주장하는 2008년 7월 11일 제출된 PCT 출원 No. PCT/CA2008/001281의 일부 계속 출원이며 그로부터 우선권을 주장하는 2009년 1월 12일 제출된 PCT 출원 No. PCT/CA2009/000032의 일부 계속 출원이다.

기술분야

본 발명은 바이러스-유사 입자의 제조에 관한 것이다. 보다 구체적으로, 본 발명은 인플루엔자 항원을 포함하는 바이러스-유사 입자의 제조에 관한 것이다.

인플루엔자는 호흡기 바이러스로 인한 인간의 사망에 있어서 제일의 원인이다. 일반적인 증상은 특히 발열, 인후통, 숨가쁨 및 근육통을 포함한다. 독감 시즌에 인플루엔자 바이러스는 세계 인구의 10-20%를 감염시키고 사망자는 연간 250-500,000명에 이른다.

인플루엔자 바이러스는 감염된 포유류 및 조류 세포의 원형질막으로부터 발아하는 외피보유 바이러스이다. 이들은 존재하는 핵단백질 및 바탕질 단백질 항원에 기초하여 A, B 또는 C 타입으로 분류된다. 인플루엔자 A 타입 바이러스는 출현한 헤마글루티닌(HA)과 뉴라미니다제(NA) 표면 당단백질의 조합에 따라서 서브타입들로 더 세분될 수 있다. HA는 숙주 세포에 결합하여 세포로 침투하는 바이러스의 능력을 좌우한다. NA는 숙주 세포 및 바이러스 표면 단백질 상의 글리칸 사슬로부터 말단 시알산 잔기를 제거하여 바이러스 응집을 방지하고 바이러스 이동을 촉진한다. 현재 16개의 HA(H1-H16)와 9개의 NA(N1-N9) 서브타입이 인정된다. 각 A 타입 인플루엔자 바이러스는 HA 중 1개 타입과 NA 당단백질 중 1개 타입을 제시한다. 일반적으로 각 서브타입은 종 특이성을 나타내는데, 예를 들어 모든 HA 및 NA 서브타입은 조류를 감염시킬 수 있는 것으로 알려져 있지만, 인간은 서브타입 H1, H2, H3, H5, H7, H9, H10, N1, N2, N3 및 N7 만이 감염시킬 수 있는 것으로 나타났다 (Horimoto 2006; Suzuki 2005). H5, H7 및 H9를 포함하는 인플루엔자 바이러스는 인플루엔자 A 바이러스의 가장 고도한 병원성 형태라고 생각되며, 앞으로 대유행을 일으킬 가능성이 크다.

인플루엔자의 대유행은 일반적으로 전염성과 바이러스성이 높은 인플루엔자 바이러스에 의해 일어나며, 전세계에서 질병 및 사망의 수준을 상승시킬 수 있다. 새로운 인플루엔자 A 서브타입의 출현은 20세기에 4번의 주요한 대유행을 초래하였다. 1918-1919년에 H1N1 바이러스에 의해 일어난 스페인 독감은 1917년과 1920년 사이에 전세계에서 5,000만 명 이상의 사망자를 냈다. 새로운 서브타입 출현에 대한 위험이나 동물에 특유한 서브타입이 사람에게 전염되는 것의 위험이 현재 항상 존재하고 있다. 특히 우려되는 것은 바이러스성이 매우 높은 형태의 조류 인플루엔자("조류독감"이라고도 한다)로서, 이것은 출현은 세계 각지에서 몇 세기 전부터 보고되었다. 많은 경우 이 조류독감은 48시간 내에 100%에 근접하는 사망률을 초래할 수 있다. 조류 인플루엔자 바이러스(H5N1)는 1997년에 홍콩에서 최초로 확인된 후, 야생 조류의 이주 패턴과 연계되어 다른 아시아 국가들과 유럽으로 전파되었다.

현재 인간이 인플루엔자와 싸우는 방법은 연례적인 예방접종이다. 일반적으로 백신은 다가오는 "독감 시즌"에서 유력한 균주일 것으로 예상되는 몇 가지 균주들의 조합이다. 이런 예상은 세계보건기구에 의해 조정된다. 일반적으로 매년 많은 백신 용량이 생산되지만 전세계 인구에 예방접종하기에는 충분하지 않다. 예를 들어, 캐나다와 미국은 인구의 약 1/3을 면역화할 수 있는 충분한 백신 용량을 획득하지만, 유럽연합에서는 인구의 단지 17%에만 예방접종할 수 있다. 현재 인플루엔자 백신의 세계적 생산은 전 세계적인 독감 대유행에 직면해서는 불충분함에 틀림없다. 해당하는 해에는 필요한 연간 생산량이 다소 충족될 수 있다 해도, 유력한 균주는 매년 변화하므로 당해에 필요성이 적을 때 비축하는 것은 비실용적이다. 효과적인 인플루엔자 백신의 경제적인 대규모 생산은 정부와 민간 사업자에게 똑같이 중요한 관심거리이다.

백신에 사용되는 바이러스 스톡은 수정된 난에서 생산된다. 바이러스 입자를 수거하여, 비활성화 바이러스 백신을 위해 세정제로 파괴하여 비활성화시킨다. 감독된 생백신은 저온 성장에 적합하게 된 인플루엔자 바이러스로 제조되는데, 이것은 정상 체온에서는 백신이 감독된다는 것을 의미한다. 5-49세의 개체에 사용하기 위한 이러한 백신은 미국에서 라이센스를 갖고 있다. 비활성화 전 바이러스 백신은 화학 제제를 사용한 비활성화에 의해서 무해하게 되며, 이들은 배아기 난이나 포유류 세포 배양물에서 생산된다. 이런 모든 타입의 백신은 어떤 특정한 이점과 단점을 나타낸다. 전 바이러스로부터 유래하는 백신의 한 이점은 이러한 백신에 의해서 유도되는 면역성의 타입이다. 일반적으로 분할 백신은 강한 항체 반응을 유도하는데 비해, 전 바이러스로 만든 백신은 항체(체액성) 반응과 세포성 반응을 모두 유도한다. 백신에 의해 유도되는 방어력과 서로 관련되는 기능적 항체 반응이 라이센스를 얻기 위한 기준이지만, 인플루엔자 면역성에서 T-세포 반응 역시 중요하다는 증거가 점점 증가하고 있으며, 이것은 또한 노인층에서 더 나은 방어력을 제공할 수 있다.

세포성 면역반응을 유도하기 위해서 전 바이러스로 만든 백신이 개발되었다. 인플루엔자 균주(예를 들어, H5N1)의 높은 병원성으로 인해 이들 백신은 BL3+ 시설에서 생산된다. H5N1과 같은 병원성이 높은 인플루엔자 균주에 대해, 일부 제조자들은 인플루엔자 균주의 병원성이 감소하여 독성이 없어지고, 배아기 난이나 포유류 세포 배양물에서 더 쉽게 생산될 수 있도록 헤마글루티닌 유전자 서열을 변형하였다. 또한, 헤마글루티닌과 뉴라미니다제 단백질의 유전자 서열을 고-수율 저 병원성 인플루엔자 도너 균주(A/PR/8/34; Quan F-S et al, 2007)에서 클로닝한 재배열 인플루엔자 균주를 사용하는 제조자들도 있다. 이런 방법들은 유용한 백신을 생산할 수는 있지만, 정상적인 해의 전 세계적 필요를 충족하는데 필요한 규모로서 백신의 고-용적, 저-비용 및 신속 생산에 대한 필요성의 해결책을 제공하지는 못하며, 대유행에 직면해서는 불충분하다는 것이 거의 확실하다.

이러한 역 유전자 기술을 사용하여 HA 단백질의 유전자 서열을 돌연변이시켜 독성을 없애는 것이 필요할 수도 있다. 병원성이 높은 인플루엔자 균주에 대한 전 바이러스 백신의 생산은 구속 과정을 요하거나, 또는 얻어진 백신이 순환 바이러스의 유전자 서열과 정확하게 일치하지 않기도 한다. 감독된 생백신의 경우에는 투여된 백신이 숙주의 인플루엔자 바이러스와 재조합되어 새로운 인플루엔자 바이러스를 유도할 수 있는 위험이 여전히 존재한다.

이 방법은 항원 에피토프 및 번역-후 변형을 유지하지만, 전 바이러스의 사용으로 인한 오염의 위험과 바이러스 균주에 따른 수율의 가변성을 비롯한 많은 단점이 있다. 바이러스를 난에 도입함으로 인한 바이러스에서의 유전자 이종성으로 인해 방어력이 최적 수준을 약간 밑돌 수 있다. 다른 단점은 난을 획득하기 위한 광범한 계획, 정제에 사용되는 화학물질에 의한 오염 위험, 및 긴 생산 시간을 포함한다. 또한, 난 단백질에 과민성인 사람은 백신을 맞기 위한 적격한 후보가 될 수 없다.

대유행의 경우, 분할 백신 제품은 난에서 성장하도록 균주를 개조해야 할 필요성과 달성되는 생산 수율이 가변적이라는 것 때문에 한계가 있다. 계절 백신의 제조를 위해 수년 동안 이 기술이 사용되었지만, 대유행에 시의적절하게 대응하는 것은 어려울 수 있으며, 전 세계적인 제조 용량도 제한적이다.

난의 사용을 피하기 위해서 인플루엔자 바이러스는 또한 포유류 세포 배양물, 예를 들어 MDCK 또는 PERC.6 세포 등에서 생산되었다. 또 다른 접근법은 바이러스 유전자를 사용한 세포 형질전환에 의해 바이러스를 생산하는 역 유전학이다. 그러나, 이런 방법들은 역시 전 바이러스의 사용을 요할 뿐만 아니라, 정교한 방법과 특수한 배양 환경이 필요하다.

재조합 인플루엔자 백신 후보로서 몇 가지 재조합 산물이 개발되었다. 이런 접근법은 인플루엔자 A 타입 HA 및 NA 단백질의 발현, 생산, 및 정제에 초점을 맞추고 있으며, 바쿨로바이러스 감염된 곤충 세포(Crawford et al, 1999; Johansson, 1999), 바이러스 벡터, 및 DNA 백신 구성물(Olsen et al., 1997)을 사용한 이들 단백질의 발현을 포함한다.

최근의 관심은 "돼지 독감"(균주 A/California/04/09)의 출현이다. 이 바이러스 균주는 멕시코에서 처음 출현한 후 수일 만에 전 세계의 시선을 끌게 되었으며, 전 세계 여러 국가들에서 발견되었는데, 이것은 인플루엔자가 어느 정도로 빨리 전염될 수 있느냐에 대한 증거가 될 뿐만 아니라, 검역 시험, 항바이러스제 생산, 감염 통제 그리고 궁극적으로는 백신 제조와 관련된다.

인플루엔자 바이러스 감염의 상세한 내용은 잘 알려져 있다. 간단히 말하자면, 시알산-함유 세포 수용체(당단백질 및 당지질)에 비리온 표면 HA 단백질이 부착됨으로써 감염 사이클이 개시된다. NA 단백질이 시알산 수용체의 프로세싱을 매개하며, 세포로의 바이러스 침투는 HA-의존성 수용체-매개 세포내이입에 좌우된다. 인플루엔자 비리온을 함유하는 내재화된 엔도솜의 산성 경계에서 HA 단백질이 입체형태적으로 변화되어 바이러스와 세포막이 융합되고, 뉴클레오캡시드-회합된 리보뉴클레오단백질(RNP)로부터 바이러스로 코팅되지 않은 MI 단백질이 M2-매개 방출되며, 이것이 세포핵으로 이동하여 바이러스 RNA가 합성된다. HA 단백질에 대한 항체는 바이러스 감염성을 중화함으로써 바이러스 감염을 방어하는 반면, NA 단백질에 대한 항체는 바이러스 복제의 초기 단계에서 이들의 효과를 매개한다.

Crawford 등(1999)은 바쿨로바이러스 감염된 곤충 세포에서 인플루엔자 HA의 발현을 개시한다. 발현된 단백질은 조류 H5 및 H7 인플루엔자 서브타입에 의해 야기되는 치명적인 인플루엔자 질환을 예방할 수 있는 것으로 설명된다. Johansson 등(1999)은 바쿨로바이러스-발현된 인플루엔자 HA 및 NA 단백질이 동물에서 종래의 백신에 의해 유도된 것보다 우수한 면역반응을 유도한다고 교시한다. 말 인플루엔자 바이러스의 바쿨로바이러스-발현된 헤마글루티닌의 면역원성 및 효능이 동종성 DNA 백신 후보와 비교되었다(Olsen et al., 1997). 종합적으로 이들 데이터는 다양한 실험 접근법을 사용했을 때 상이한 동물 모델에서 재조합 HA 또는 NA 단백질에 의해 인플루엔자 바이러스 시험감염에 대한 높은 정도의 방어력이 유도될 수 있음을 증명한다.

표면 인플루엔자 당단백질 HA 및 NA가 인플루엔자 바이러스에 대한 방어 면역성을 유도하는데 있어서 일차 표적이며, M1이 인플루엔자에 대한 세포 면역성의 보존된 표적을 제공한다는 것이 이전 연구에서 밝혀졌기 때문에, 새로운 백신 후보는 단백질 거대분자 입자, 예를 들어 바이러스-유사 입자(VLP)로서 이들 바이러스 항원을 포함할 수 있다. 백신 제품으로서 VLP는 체액성 면역반응과 세포성 면역반응을 모두 자극할 수 있으며, 서브유닛이나 재조합 항원보다 더 면역원성이라는 이점을 제공한다(Grgacic and Anderson, 2006). 더욱이, 이들 인플루엔자 항원을 가진 입자는 다수의 인플루엔자 바이러스 균주에 대한 중화 항체들을 도출하는 입체형태적 에피토프를 나타낼 수 있다.

백신 목적을 위해 비-감염성 인플루엔자 바이러스 균주를 생산하는 것이 우연한 감염을 피하기 위한 한 방식이 된다. 대안으로서, 배양된 바이러스의 대용물로서 바이러스-유사 입자(VLP)가 조사되었다. VLP는 바이러스 캡시드의 구조를 모방하지만, 게놈을 결여하기 때문에 복제할 수 없거나 또는 이차 감염 수단을 제공할 수 없다.

재조합 인플루엔자 단백질이 포유류 발현 플라스미드 또는 바쿨로바이러스 백터를 사용한 세포 배양물에서 VLP로 자체 회합된다는 것이 몇몇 연구에서 증명되었다(Gomez-Puertas et al., 1999; Neumann et al., 2000; Latham and Galarza, 2001). Gomez-Puertas 등(1999)은 인플루엔자 VLP의 효과적인 형성이 몇 가지 바이러스 단백질의 발현 수준에 좌우된다는 것을 개시한다. Neumann 등(2000)은 클로닝된 cDNA로부터 전체적으로 감염성 인플루엔자 바이러스-유사 입자를 생성하기 위한 포유류 발현 플라스미드-기반 시스템을 확립하였다. Latham and Galarza (2001)는 HA, NA, M1 및 M2 유전자를 공-발현하는 재조합 바쿨로바이러스로 감염된 곤충 세포에서 인플루엔자 VLP의 형성을 보고했다. 이들 연구는 인플루엔자 비리온 단백질들이 진핵 세포에서 공-발현될 때 자체 회합될 수 있음을 증명하였다.

Gomez-Puertas 등(2000)은 헤마글루티닌(HA)에 더하여 인플루엔자 바이러스의 바탕질 단백질(M1)이 곤충 세포로부터 VLP가 발아되는데 필수적임을 교시한다. 그러나, Chen 등(2007)은 VLP 형성에 M1이 필요하지 않을 수도 있다고 교시하며, M1과 VLP의 효과적인 방출에는 HA 및 NA에 의해 제공된 시알리다제 활성의 존재가 필요했다는 것을 관찰했다. NA는 VLP를 생산하는 세포의 표면에서 당단백질의 시알산을 절단하여 VLP를 배지로 방출한다.

Quan 등(2007)은 바쿨로바이러스 발현 시스템(곤충 세포)에서 생산된 VLP 백신이 일부 인플루엔자 바이러스 균주(A/PR8/34(H1N1)에 대한 방어 면역성을 유도한다는 것을 교시한다. Quan에 의해 연구된 VLP는 원형질막으로부터 발아하는 것으로 관찰되었고, 포유류 시스템(MDCK 세포)에서 얻어진 것들과 유사한 정확한 크기와 형태를 가진다고 생각되었다.

PCT 공개 WO 2004/098530 및 WO 2004/098533은 배양물 중의 형질전환된 NT-1(담배) 세포에서 뉴캐슬병 바이러스 HN 또는 조류 인플루엔자 A/turkey/Wisconsin /68(H5N9)의 발현을 교시한다. 식물 세포 배양물-발현된 폴리펩티드를 포함하는 조성물은 토끼와 닭에게서 다양한 면역반응을 도출한다.

외피보유 바이러스는 감염된 세포로부터 "발아할" 때 지질 외피를 획득할 수 있으며, 원형질막으로부터, 또는 내부 소기관의 원형질막으로부터 막을 획득할 수 있다. 인플루엔자 바이러스 입자 및 VLP는 숙주 세포의 원형질막으로부터 발아한다. 포유류 또는 바쿨로바이러스 세포 시스템에서, 예를 들어 인플루엔자는 원형질막으로부터 발아한다(Quan et al., 2007). 단지 소수의 외피보유 바이러스만이 식물을 감염시킬 수 있다고 알려져 있다(예를 들어, 토포바이러스 및 랍도바이러스 류). 공지된 식물 외피보유 바이러스 중에서도 이들은 숙주 세포의 내부 막으로부터 발아하고, 원형질막으로부터는 발아하지 않는 것을 특징으로 한다. 소수의 재조합 VLP가 식물 숙주에서 생산되었지만, 어느 것도 원형질막으로부터 유래하지는 않았는데, 이것은 인플루엔자 VLP를 비롯한 원형질막-유래 VLP가 식물에서 생산될 수 있는지의 문제를 야기한다.

현재 인플루엔자 VLP 제조 기술은 다수 바이러스 단백질의 공-발현에 의존하는데, 대유행 및 연례적인 유행 시기에는 백신접종에 있어서 대응시간이 중요하므로 이러한 의존성은 이들 기술의 단점으로 나타난다. 더 간단한 VLP 제조 시스템, 예를 들어 비-구조 바이러스 단백질 발현의 필요 없이 단지 하나나 소수의 바이러스 단백질의 발현에 의존하는 시스템이 백신 개발을 가속하는데 바람직할 수 있다.

인플루엔자로부터 전세계 인구를 보호하고 앞으로의 대유행을 저지하기 위하여 백신 제조자들은 백신 용량을 생산하는 효과적이고 신속한 방법을 개발할 필요가 있을 것이다. 현재 백신 제조에 수정된 난을 사용하는 것으로는 불충분하며 긴 과정을 수반한다.

본 발명은 개선된 인플루엔자 바이러스-유사 입자(VLP)를 제공하는 것을 목적으로 한다.

본 발명에 따라서, 식물에서 활성인 조절 영역에 작동 가능하게 연결된 외피보유 바이러스로부터의 항원을 암호화(encoding)하는 뉴클레오티드 서열을 포함하는 핵산이 제공되며, 상기 항원은 인플루엔자 헤마글루티닌(HA)이다. 바람직하게, 항원은 인플루엔자 A/California/04/09로부터의 HA이다.

HA는 자생, 또는 비-자생 신호 펩티드를 포함할 수 있고, 비-자생 신호 펩티드는 단백질 이황화물 이소머라제 신호 펩티드일 수 있다.

핵산에 의해 암호화된 HA는 타입 A 인플루엔자, 타입 B 인플루엔자일 수 있거나, 또는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 및 H16을 포함하는 군으로부터 선택된, 타입 A 인플루엔자의 서브타입이다. 본 발명의 어떤 양태에서, 핵산에 의해 암호화된 HA는 타입 A 인플루엔자에서 유래하는 것일 수 있으며, H1, H2, H3, H5, H6, H7 및 H9를 포함하는 군으로부터 선택된다. 바람직하게, 인플루엔자 HA는 균주 A/California/04/09로부터 유래한다.

또한, 본 발명은 식물에서 인플루엔자 바이러스-유사 입자(VLP)를 생산하는 방법을 제공하며, 상기 방법은

a) 식물에서 활성인 조절 영역에 작동 가능하게 연결된, 외피보유 바이러스로부터의 항원, 예를 들어 균주 A/California/04/09 유래의 인플루엔자 헤마글루티닌(HA)을 암호화하는 핵산을 식물 또는 식물의 일부에 도입하는 단계, 및

b) 핵산의 발현을 허용하는 조건하에서 식물 또는 식물의 일부를 인큐베이션하여 VLP를 생산하는 단계

를 포함한다.

상기 방법은 식물을 수거하는 단계, 및 식물 조직으로부터 VLP를 정제 또는 분리하는 단계를 더 포함할 수 있다.

상기 방법은 도입 단계(단계 a)에서 하나 이상의 샤프롱(chaperone) 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 더 포함할 수 있다.

하나 이상의 샤프롱 단백질은 Hsp40 및 Hsp70을 포함하는 군으로부터 선택될 수 있다.

본 발명은 상기 방법에 있어서, 도입 단계(단계 a)에서 핵산이 식물에서 일시적으로 발현되거나, 또는 식물에서 안정하게 발현될 수 있는 것을 포함한다. 더욱이, VLP는 크기 배제 크로마토그래피를 이용하여 정제될 수 있다.

본 발명의 또 다른 양태에 따라서, 식물에서 인플루엔자 바이러스-유사 입자(VLP)를 생산하는 방법이 제공되며, 상기 방법은 식물에서 활성인 조절 영역에 작동 가능하게 연결된 인플루엔자 A/California/04/09 유래의 HA를 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 포함하는 식물 또는 식물의 일부를 제공하는 단계, 및 핵산의 발현을 허용하는 조건하에서 식물 또는 식물의 일부를 인큐베이션하여 VLP를 생산하는 단계를 포함한다.

본 발명은 제공 단계 후에, 식물에서 활성인 조절 영역에 작동 가능하게 연결된 하나 이상의 샤프롱 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 도입하고, 핵산의 발현을 허용하는 조건하에서 식물 또는 식물의 일부를 인큐베이션하여 VLP를 생산하는 상기 방법을 포함한다.

본 발명은 도입 단계(단계 a)에서 인플루엔자 A/California/04/09 유래의 HA를 암호화하는 핵산이 식물에서 안정하게 발현되는 상기 방법을 포함한다. 또한, VLP는 크기 배제 크로마토그래피를 이용하여 정제될 수 있다.

또한, 본 발명은 균주 A/California/04/09로부터의 인플루엔자 바이러스 HA 단백질 및 식물에서 유래된 하나 이상의 지질을 포함하는 바이러스-유사 입자(VLP)를 제공한다.

VLP의 HA 단백질은 타입 A 인플루엔자, 타입 B 인플루엔자의 것일 수 있거나, 또는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H1O, H11, H12, H13, H14, H15 및 H16으로 구성되는 군으로부터 선택된 타입 A 인플루엔자 HA의 서브타입이다. 본 발명의 어떤 양태에서, HA는 H1, H2, H3, H5, H6, H7 및 H9를 포함하는 군으로부터 선택되는 타입 A 인플루엔자에서 유래하는 것이다.

또한, 인플루엔자 바이러스 HA 단백질, 하나 이상의 식물 지질 및 제약학적으로 허용되는 담체를 포함하는 VLP의 유효 용량을 포함하는 조성물이 본 발명에 포함된다.

또한, 본 발명은 식물에서 VLP를 형성하는 HA 단백질의 단편 또는 일부분을 고찰한다.

또한, 본 발명은 식물-특이적 N-글리칸, 또는 변형된 N-글리칸을 지닌 인플루엔자 바이러스 HA를 포함하는 VLP에 관한 것이다. VLP의 HA 단백질은 타입 A 인플루엔자, 타입 B 인플루엔자의 것일 수 있거나, 또는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 및 H16으로 구성되는 군으로부터 선택된 타입 A 인플루엔자 HA의 서브타입이다. 본 발명의 어떤 양태에서, HA는 H1, H2, H3, H5, H6, H7 및 H9를 포함하는 군으로부터 선택된 타입 A 인플루엔자로부터 유래하는 것이다.

VLP는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15 또는 H16을 포함하는 하나 이상의 서브타입의 HA 단백질, 또는 이들의 단편 또는 일부분을 포함할 수 있다. 이러한 HA 단백질을 포함하는 서브타입의 예는 A/New Caledonia/20/99(H1N1), A/Indonesia/5/2006(H5N1), A/chicken/New York/1995, A/ herring gull/DE/677/88(H2N8), A/Texas/32/2003, A/mallard/MN/33/00, A/northern pintail/TX/828189/02, A/duck/Shanghai/1/2000, A/Turkey/Ontario/6118/68(H8N4), A/shoveler/Iran/G54/03, A/chicken/Germany/N/1949(H10N7), A/duck/England/56(H 11N6), A/duck/Alberta/60/76(H12N5), A/Gull/Maryland/704/77(H13N6), A/Mallard/ Gurjev/263/82, A/duck/Australia/341/83(H15N8), A/black-headed gull/Sweden/5/ 99(H16N3), B/Lee/40, C/Johannesburg/66, A/PuertoRico/8/34(H1N1), A/Brisbane/ 59/2007(H1N1), A/Solomon Islands 3/2006(H1N1), A/Brisbane 10/2007(H3N2), A/ Wisconsin/67/2005(H3N2), B/Malaysia/2506/2004, B/Florida/4/2006, A/Singapore/ 1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/ W312/97(H6N1), A/Equine/Prague/56(H7N7), A/HongKong/1073/99(H9N2), A/California/04/09(H1N1)를 포함한다.

본 발명의 한 양태에서, HA 단백질은 H1, H2, H3, H5, H6, H7 또는 H9 서브타입일 수 있다. 다른 양태에서, H1 단백질은 A/New Caledonia/20/99(H1N1), A/ PuertoRico/8/34(H1N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands 3/2006(H1 N1) 또는 A/California/04/09(H1N1) 균주로부터 유래할 수 있다. 또한, H3 단백질은 A/Brisbane10/2007(H3N2) 또는 A/Wisconsin/67/2005(H3N2) 균주로부터 유래할 수 있다. 본 발명의 또 다른 양태에서, H2 단백질은 A/Singapore/1/57(H2N2) 균주로부터 유래할 수 있다. H5 단백질은 A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004 (H5N1) 또는 A/Indonesia/5/2005 균주로부터 유래할 수 있다. 본 발명의 한 양태에서, H6 단백질은 A/Teal/HongKong/W312/97(H6N1) 균주로부터 유래할 수 있다. H7 단백질은 A/Equine/Prague/56(H7N7) 균주로부터 유래할 수 있다. 본 발명의 한 양태에서, H9 단백질은 A/HongKong/1073/99(H9N2) 균주로부터 유래할 수 있다. 본 발명의 추가의 양태에서, HA 단백질은 B/Malaysia/2506/2004 또는 B/Florida/4/ 2006를 포함하는 B 타입 바이러스일 수 있는 인플루엔자 바이러스로부터 유래할 수 있다. H1, H2, H3, H5, H6, H7, H9 또는 B 서브타입으로부터의 HA 단백질의 아미노산 서열의 예는 SEQ ID NO: 48-59 및 128을 포함한다.

인플루엔자 바이러스 HA 단백질은 균주 A/Indonesia/05/05(H5N1) 유래의 H5 또는 A/Califonia/04/09(H1N1) 유래의 H1일 수 있다.

또한, 본 발명은 HA 단백질을 암호화하는 서열을 포함하는 핵산 분자를 제공한다. 핵산 분자는 HA 단백질을 암호화하는 서열에 작동 가능하게 연결된 하나 이상의 조절 영역을 더 포함할 수 있다. 핵산 분자는 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, B 또는 C를 암호화하는 서열을 포함할 수 있다. 본 발명의 또 다른 양태에서, 핵산 분자에 의해서 암호화된 HA 단백질은 H1, H2, H3, H5, H6, H7, H9, 또는 B 서브타입일 수 있다. 핵산 분자에 의해 암호화된 H1 단백질은 A/New Caledonia/20/99(H1N1), A/PuertoRico/8/34(H1N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands 3/2006(H1N1) 또는 A/Califonia/04/ 09(H1N1) 균주로부터 유래한다. 본 발명의 한 양태에서, 핵산 분자에 의해 암호화된 H3 단백질은 A/Brisbane 10/2007(H3N2) 또는 A/Wisconsin/67/2005(H3N2) 균주로부터 유래할 수 있다. 본 발명의 또 다른 양태에서, 핵산 분자에 의해 암호화된 H2 단백질은 A/Singapore/1/57(H2N2) 균주로부터 유래할 수 있다. 핵산 분자에 의해 암호화된 H5 단백질은 A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1) 또는 A/Indonesia/5/2005 균주로부터 유래할 수 있다. 본 발명의 한 양태에서, 핵산 분자에 의해 암호화된 H6 단백질은 A/Teal/HongKong/W312/97(H6N1) 균주로부터 유래할 수 있다. 또한, 핵산 분자에 의해 암호화된 H7 단백질은 A/Equine/Prague/56 (H7N7) 균주로부터 유래할 수 있다. 이에 더하여, 핵산 분자에 의해 암호화된 H9 단백질은 A/HongKong/1073/99(H9N2) 균주로부터 유래할 수 있다. 핵산에 의해 암호화된 B 서브타입 유래의 HA 단백질은 B/Florida/4/2006, 또는 B/Malaysia/2506/ 2004 균주로부터 유래할 수 있다. H1, H2, H3, H5, H6, H7, H9 또는 B 서브타입으로부터의 이러한 HA 단백질을 암호화하는 핵산 분자의 서열의 예는 SEQ ID NO: 36-47 및 60-73 및 127을 포함한다.

핵산 서열은 균주 A/Indonesia/05/05(H5N1) 또는 균주 A/Califonia/04/09(H1 N1) 유래의 인플루엔자 바이러스 HA 단백질을 암호화할 수 있다.

HA 단백질을 암호화하는 서열에 작동 가능하게 연결될 수 있는 조절 영역은 식물 세포, 곤충 세포 또는 효모 세포에서 작동하는 것들을 포함한다. 이러한 조절 영역은 플라스토시아닌 조절 영역, 리불로오스 1,5-비스포스페이트 카르복실라제/옥시게나제(RuBisCO)의 조절 영역, 클로로필 a/b 결합 단백질(CAB), ST-LS1, 폴리헤드린 조절 영역 또는 gp64 조절 영역을 포함할 수 있다. 다른 조절 영역은 5' UTR, 3' UTR 또는 터미네이터 서열을 포함한다. 플라스토시아닌 조절 영역은 자주개자리 플라스토시아닌 조절 영역일 수 있다. 또한, 5' UTR, 3' UTR 또는 터미네이터 서열도 자주개자리 서열일 수 있다.

또한, 피험체에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법이 제공되며, 상기 방법은 인플루엔자 바이러스 HA 단백질, 하나 이상의 식물 지질 및 제약학적으로 허용되는 담체를 포함하는 바이러스-유사 입자를 투여하는 단계를 포함한다. 바이러스-유사 입자는 피험체에게 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로로 투여될 수 있다.

또한, 본 발명은 인플루엔자, 홍역, 에볼라, 마르부르크 및 HIV로 구성되는 군으로부터 선택된 바이러스로부터 유래된 하나 이상의 단백질, 및 비-시알릴화 숙주 생산 세포로부터 유래된 하나 이상의 지질을 포함하는 바이러스-유사 입자(VLP)에 관한 것이다. HIV 단백질은 p24, gp120 또는 gp41일 수 있다. 에볼라 바이러스 단백질은 VP30 또는 VP35일 수 있다. 마르부르크 바이러스 단백질은 Gp/SGP일 수 있다. 홍역 바이러스 단백질은 H-단백질 또는 F-단백질일 수 있다.

이에 더하여, 본 발명은 인플루엔자 바이러스 HA 단백질 및 하나 이상의 숙주 지질을 포함하는 바이러스-유사 입자(VLP)에 관한 것이다. 예를 들어, 숙주가 곤충인 경우, 바이러스-유사 입자(VLP)는 인플루엔자 바이러스 HA 단백질 및 하나 이상의 곤충 지질을 포함할 수 있고, 또는 숙주가 효모인 경우, 바이러스-유사 입자(VLP)는 인플루엔자 바이러스 HA 단백질 및 하나 이상의 효모 지질을 포함할 수 있다.

또한, 본 발명은 인플루엔자의 둘 이상의 균주 또는 서브타입의 VLP를 포함하는 조성물에 관한 것이다. 둘 이상의 서브타입 또는 균주는 A/New Caledonia/20 /99(H1N1), A/Indonesia/5/2006(H5N1), A/chicken/New York/1995, A/herring gull/ DE/677/88(H2N8), A/Texas/32/2003, A/mallard/MN/33/00, A/duck/Shanghai/1/2000, A/northern pintail/TX/828189/02, A/Turkey/Ontario/6118/68(H8N4), A/shoveler/ Iran/G54/03, A/chicken/Germany/N/1949(H10N7), A/duck/England/56(H11N6), A/ duck/Alberta/60/76(H12N5), A/Gull/Maryland/704/77(H13N6), A/Mallard/Gurjev/ 263/82, A/duck/Australia/341/83(H15N8), A/black-headed gull/Sweden/5/99(H16 N3), B/Lee/40, C/Johannesburg/66, A/PuertoRico/8/34(H1N1), A/Brisbane/59/2007 (H1N1), A/Solomon Islands 3/2006(H1N1), A/Brisbane 10/2007(H3N2), A/Wisconsin /67/2005(H3N2), B/Malaysia/2506/2004, B/Florida/4/2006, A/Singapore/1/57(H2 N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/W312/97 (H6N1), A/Equine/Prague/56(H7N7), A/HongKong/1073/99(H9N2) 또는 A/Califonia/ 04/09(H1N1)를 포함하는 군으로부터 선택될 수 있다. VLP의 둘 이상의 서브타입 또는 균주는 대략 등량으로 존재할 수 있다. 또는 달리, 서브타입 또는 균주 중 하나 이상이 제시된 균주 또는 서브타입의 대부분일 수 있다.

본 발명은 동물 또는 표적 생물에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법에 관한 것이며, 상기 방법은 비-시알릴화 숙주, 예를 들어 식물 숙주, 곤충 숙주 또는 효모 숙주를 사용하여 생산된 하나 이상의 VLP를 포함하는 백신의 유효 용량을 투여하는 단계를 포함한다. 백신은 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로로 투여될 수 있다. 표적 생물은 인간, 영장류, 말, 돼지, 새(조류), 물새, 철새, 매추라기, 오리, 거위, 가금류, 닭, 낙타, 개과, 개, 고양이과, 고양이, 호랑이, 표범, 사향고양이, 밍크, 흰가슴담비, 흰족제비, 애완동물, 가축, 생쥐, 래트, 바다표범, 고래 등을 포함하는 군으로부터 선택될 수 있다.

본 발명은 VLP를 생산할 수 있는 적합한 숙주, 예를 들어 식물, 곤충 또는 효모에서 상이한 인플루엔자 균주로부터의 헤마글루티닌(HA)을 함유하는 VLP를 생산하는 방법을 제공한다. 식물에서 생산된 VLP는 식물 기원의 지질을 함유하고, 곤충 세포에서 생산된 VLP는 곤충 세포의 원형질막으로부터의 지질(일반적으로 "곤충 지질"이라고 한다)을 포함하며, 효모에서 생산된 VLP는 효모 세포의 원형질막으로부터의 지질(일반적으로 "효모 지질"이라고 한다)을 포함한다.

또한, 본 발명은 식물에서 활성인 조절 영역에 작동 가능하게 연결된 외피보유 바이러스로부터의 항원을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 포함하는 식물, 식물 조직 또는 식물 세포에 관한 것이다. 항원은 인플루엔자 헤마글루티닌(HA)일 수 있다. 바람직하게, 항원은 인플루엔자 A/Califonia/04/09 유래의 HA이다.

식물은 식물에서 활성인 조절 영역에 작동 가능하게 연결된 하나 이상의 샤프롱 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 더 포함할 수 있다. 하나 이상의 샤프롱 단백질은 Hsp40 및 Hsp70을 포함하는 군으로부터 선택될 수 있다.

식물에서 VLP의 생산은 곤충 세포 배양물에서 이들 입자를 생산하는 것에 비해 몇 가지 이점을 나타낸다. 식물 지질은 특정 면역세포를 자극하여 유도된 면역반응을 증진시킬 수 있다. 식물 막은 지질, 포스파티딜콜린(PC) 및 포스파티딜에탄올아민(PE)으로 이루어지며, 또한 식물 및 일부 박테리아와 원생동물에 특유한 글리코스핑고지질을 함유한다. 스핑고지질은 PC나 PE처럼 글리세롤의 에스테르가 아니라, 18개를 초과하는 탄소를 함유하는 지방산 사슬과 아미드 결합을 형성하는 장쇄 아미노 알코올로 구성된다는 점에서 일반적이지 않다. PC 및 PE뿐만 아니라 글리코스핑고지질도 수지상세포 및 대식세포와 같은 항원-제시 세포(APC) 및 흉선과 간의 B 및 T 림프구를 포함하는 다른 세포들과 마찬가지로 포유류 면역세포에 의해서 발현된 CD1 분자와 결합할 수 있다(Tsuji M., 2006). 더욱이, 식물 지질 존재의 잠재적 애쥬번트 효과에 더하여, 항원-제시 세포에 의한 당단백질 항원의 포착을 촉진하는 식물 N-글리칸의 능력(Saint-Jore-Dupas, 2007)이 식물에서 VLP를 생산하는 것의 이점일 수 있다.

이론과 결부시키고 싶지는 않지만, 다른 제조 시스템에서 제조된 VLP보다 식물-제조 VLP가 더 강한 면역반응을 유도할 것이며, 이들 식물-제조 VLP에 의해 유도된 면역반응은 생백신 또는 감독된 전 바이러스 백신에 의해 유도된 면역반응에 비하여 더 강할 것이라고 예상된다.

전 바이러스로 만든 백신과는 반대로, VLP는 비-감염성이라는 이점을 제공하며, 따라서 구속적인 생물학적 봉쇄가 감염성인 전 바이러스를 사용하여 작업하는 경우처럼 중요한 문제는 아니며 생산에 필요하지도 않다. 식물-제조 VLP는 발현 시스템을 온실이나 야외에서 성장시킬 수 있다는 것을 또 다른 이점으로 제공하며, 따라서 상당히 더 경제적이고 대규모화에 적합하다.

이에 더하여, 식물은 시알산 잔기를 합성하거나 단백질에 시알산 잔기를 부가하는데 연루되는 효소를 포함하지 않는다. VLP는 뉴라미니다제(NA) 없이 생산될 수 있으며, NA의 공-발현이나, 또는 생산된 세포 또는 추출물을 시알리다제(뉴라미니다제)로 처리하는 것 없이도 식물에서 VLP 생산이 보장된다.

본 발명에 따라서 생산된 VLP는 RNA와 결합한다고 알려진 M1 단백질을 포함하지 않는다. RNA는 VLP 제제에서 오염물질이며, VLP 제품에 대해 규제당국의 승인을 얻는데 있어서 바람직하지 않다.

본 발명의 개요가 반드시 본 발명의 모든 특징을 설명하지는 않는다.

본 발명의 이들 및 다른 특징들이 첨부된 도면을 참조하여 다음의 설명으로부터 더 명백해질 것이다.
도 1a는 본 발명의 구체예에 따라서 균주 A/New Caledonia/20/99(H1N1) 유래의 H1의 발현에 사용된 자주개자리 플라스토시아닌-기반 발현 카세트의 서열을 도시한다(SEQ ID NO: 8). 단백질 이황화 이소머라제(PDI) 신호 펩티드에 밑줄이 쳐있다. 클로닝에 사용된 BglII(AGATCT) 및 SacI(GAGCTC) 제한 부위는 볼드체로 나타낸다. 도 1b는 인플루엔자 헤마글루티닌의 기능 도메인의 도식적 다이아그램을 도시한다. HA0의 절단 후, HA1과 HA2 단편이 이황화 다리에 의해 함께 결합되어 남는다.
도 2a는 균주 A/New Caledonia/20/99(H1N1) 유래의 HA 서브타입 H1의 발현을 위해 조립된 플라스미드 540을 도시한다. 도 2b는 균주 A/Indonesia/5/2005(H5N1) 유래의 HA 서브타입 H5의 발현을 위해 조립된 플라스미드 660을 도시한다.
도 3은 헤마글루티닌 H1 또는 H5를 생산하는 잎으로부터의 단백질 추출물의 크기 배제 크로마토그래피를 도시한다. 도 3a는 블루 덱스트란 2000(삼각형) 및 단백질(다이아몬드)의 용출 프로파일을 도시한다. 도 3b는 크기 배제 크로마토그래피(S500HR 비드) 후에 H1(A/New Caledonia/20/99(H1N1)) 용출 분획의 면역검출(웨스턴 블롯; 항 H1)을 도시한다. 도 3c는 H5의 용출 프로파일을 도시한다; 블루 덱스트란 2000(삼각형) 및 단백질(다이아몬드). 도 3d는 크기 배제 크로마토그래피(S500HR 비드) 후에 H5(A/Indonesia/5/2005(H5N1)) 용출 분획의 면역검출(웨스턴 블롯; 항 H5)을 도시한다.
도 4a는 H1(A/New Caledonia/20/99(H1N1))의 N-말단 단편을 암호화하는 서열을 도시한다(SEQ ID NO: 1). 도 4b는 H1(A/New Caledonia/20/99(H1N1))의 C-말단 단편을 암호화하는 서열을 도시한다(SEQ ID NO: 2).
도 5는 H1(A/New Caledonia/20/99(H1N1))의 HA0을 암호화하는 완전한 서열을 도시한다(SEQ ID NO: 28).
도 6은 초기 ATG의 바로 상류의 HindIII 부위와 중단(TAA) 코돈의 바로 하류의 SacI 부위가 측면에 위치한 H5(A/Indonesia/5/2005(H5N1))를 암호화하는 서열을 도시한다(SEQ ID NO: 3).
도 7a는 프라이머 Plasto-443c의 서열을 도시한다(SEQ ID NO: 4). 도 7b는 프라이머 SpHA(Ind)-Plasto.r의 서열을 도시한다(SEQ ID NO: 5). 도 7c는 프라이머 SpHA(Ind)-Plasto.r의 서열을 도시한다(SEQ ID NO: 6). 도 7d는 프라이머 HA(Ind)-Sac.r의 서열을 도시한다(SEQ ID NO: 7).
도 8a는 H1(A/New Caledonia/20/99(H1N1))의 아미노산 서열을 도시한다(SEQ ID NO: 9). 도 8b는 H5(A/Indonesia/5/2005(H5N1))의 아미노산 서열을 도시한다(SEQ ID NO: 10). 자생 신호 펩티드를 볼드체로 나타낸다.
도 9는 인플루엔자 A 서브타입 H7의 HA의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 11).
도 10a는 인플루엔자 A HA 서브타입 H2의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 12). 도 10b는 인플루엔자 A HA 서브타입 H3의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 13). 도 10c는 인플루엔자 A HA 서브타입 H4의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 14). 도 10d는 인플루엔자 A HA 서브타입 H5의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 15). 도 10e는 인플루엔자 A HA 서브타입 H6의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 16). 도 10f는 인플루엔자 A HA 서브타입 H8의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 17). 도 10g는 인플루엔자 A HA 서브타입 H9의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 18). 도 10h는 인플루엔자 A HA 서브타입 H10의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 19). 도 10i는 인플루엔자 A HA 서브타입 H11의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 20). 도 10j는 인플루엔자 A HA 서브타입 H12의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 21). 도 10k는 인플루엔자 A HA 서브타입 H13의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 22). 도 10l은 인플루엔자 A HA 서브타입 H14의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 23). 도 10m은 인플루엔자 A HA 서브타입 H15의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 24). 도 10n은 인플루엔자 A HA 서브타입 H16의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 25). 도 10o는 인플루엔자 B HA의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 26). 도 10p는 인플루엔자 C HA의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 27). 도 10q는 프라이머 XmaI-pPlas.c의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 29). 도 10r은 프라이머 SacI-ATG-pPlas.r의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 30). 도 10s는 프라이머 SacI-PlasTer. c의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 31). 도 10t는 프라이머 EcoRI-PlasTer.r의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 32).
도 11은 본원에서 사용된 몇몇 구성물을 도식화하여 나타낸 것이다. 구성물 660은 플라스토시아닌 프로모터(Plasto)와 터미네이터(Pter)에 작동 가능하게 연결된 HA 서브타입 H5(A/Indonesia/5/2005(H5N1))를 암호화할 수 있는 뉴클레오티드 서열을 포함한다; 구성물 540은 자주개자리 단백질 이황화 이소머라제 신호 펩티드(SP PDI)와 조합하여 HA 서브타입 H1(A/New Caledonia/20/99(H1N1))을 암호화할 수 있는 뉴클레오티드 서열을 포함하며, 플라스토시아닌 프로모터(Plasto)와 터미네이터(Pter)에 작동 가능하게 연결된다; H1을 암호화하는 뉴클레오티드 서열인 HA 서브타입 H1의 발현을 위해 조립된 구성물 544는 자주개자리 단백질 이황화 이소머라제 신호 펩티드(SP PDI) 및 GCN4pII 로이신 지퍼(HI의 막통과 도메인 및 세포질 꼬리를 대신)와 조합되고, 플라스토시아닌 프로모터(Plasto)와 터미네이터(Pter)에 작동 가능하게 연결된다; 인플루엔자 A/PR/8/34로부터의 M1 코딩 영역의 발현을 위한 구성물 750은 담배 식각 바이러스(TEV) 5' UTR과 조합되고, 이중 35S 프로모터와 Nos 터미네이터에 작동 가능하게 연결된다.
도 12는 구성물 660으로 형질전환된 N. benthamiana 잎으로부터의 단백질 추출물에서 항-H5(Vietnam) 항체를 사용한 H5(A/Indonesia/5/2005(H5N1))의 면역검출을 도시한다(레인 3). 검출시 인플루엔자 A/Vietnam/1203/2004로부터의 시판되는 H5를 양성 대조군으로 사용했고(레인 1), 빈 벡터로 형질전환된 잎으로부터의 단백질 추출물을 음성 대조군으로 사용했다(레인 2).
도 13은 크기 배제 크로마토그래피에 의한 헤마글루티닌 구조의 특성화를 도시한다. H5(A/Indonesia/5/2005(H5N1)), H1(A/New Caledonia/20/99(H1N1)), 가용성 H1 또는 H1과 M1를 생산하는 별도의 바이오매스로부터의 단백질 추출물을 S-500 HR에서 겔 여과하여 분리했다. 또, 로제트 형태의 시판되는 H1(A/New Caledonia /20/99(H1N1))을 분별했다(H1 로제트). 도 13a는 상대 단백질 함량에 대해 분석된 용출 분획을 도시한다(상대 단백질 수준 - 바이오매스 분별의 표준 단백질 용출 프로파일이 도시된다). 블루 덱스트란 2000(2MDa 기준 표준물질)의 용출 피크가 표시된다. 도 13b는 항-H5(Vietnam) 항체(H5에 대한)를 사용한 면역블롯팅에 의해서 헤마글루티닌의 존재에 대해 분석된 용출 분획을 도시한다. 도 13c는 H1에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다. 도 13d는 가용성 H1에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다. 도 13e는 H1 로제트에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다. 도 13f는 H1+M1에 대한 항-인플루엔자 A 항체에 대해 분석된 용출 분획을 도시한다.
도 14는 농도차 수크로오스 원심분리에 의한 인플루엔자 H5(A/Indonesia/5/ 2005(H5N1)) 구조의 농도 및 헤마글루티닌-농축 분획의 전자현미경 검사를 도시한다. 도 14a는 수크로오스 밀도 구배 원심분리에 따른 분획의 특징을 도시한다. 각 분획은 항-H5(Vietnam) 항체를 사용한 면역블롯팅에 의해서 H5의 존재에 대해(위쪽 패널), 그리고 상대 단백질 함량 및 혈구응집 능력(그래프)에 대해 분석되었다. 도 14b는 수크로오스 구배 원심분리로부터의 분획 17, 18 및 19를 모은 것의 음성 염색 투과 전자현미경 검사를 도시한다. 바는 100nm이다.
도 15는 인플루엔자 H5 VLP의 정제를 도시한다. 도 15a는 정화 단계에서 단백질 함량의 코마시 블루 염색된 SDS-PAGE 분석을 도시한다 - 레인 1, 조 추출물; 레인 2, pH 6-조정된 추출물; 레인 3, 열처리된 추출물; 레인 4, DE-여과된 추출물; 페투인 친화성 정제 단계: 레인 5, 로딩; 레인 6, 통과; 레인 7, 용출(10x 농축). 도 15b는 정제된 H5 VLP 샘플의 음성 염색 투과 전자현미경 검사를 도시한다. 바는 100nm이다. 도 15c는 분리된 H5 VLP를 확대한 것으로서 구조를 상세히 볼 수 있다. 도 15d는 균주 A/Vietnam/1203/2004(H5N1)로부터의 HA에 대해 생긴 토끼 다클론성 항체를 사용한 코마시-염색된 환원 SDS-PAGE(레인 A) 및 웨스턴 블롯(레인 B) 상의 H5 VLP 산물을 도시한다.
도 16은 인플루엔자 A 바이러스(A/New Caledonia/20/99(H1N1)) 헤마글루티닌 (HA) 유전자, 완성형 cds의 뉴클레오티드 서열을 도시한다. GenBank Accession No. AY289929(SEQ ID NO: 33).
도 17은 단백질 이황화 이소머라제에 대한 Medicago sativa mRNA에 대한 뉴클레오티드 서열을 도시한다. GenBank Accession No. Z11499(SEQ ID NO: 34).
도 18은 인플루엔자 A 바이러스(A/Puerto Rico/8/34(H1N1)) 세그먼트 7의 뉴클레오티드 서열, 완성형 서열을 도시한다. GenBank Accession No. NC_002016.1 (SEQ ID NO: 35).
도 19는 H5 생산 조직의 양성 염색 투과 전자현미경 관찰에 의한 VLP 축적의 국부화를 도시한다. CW: 세포벽, ch: 엽록체, pm: 원형질막, VLP: 바이러스-유사 입자. 바는 100nm이다.
도 20은 식물-제조 인플루엔자 H5 VLP(A/Indonesia/5/2005(H5N1)) 또는 재조합 가용성 H5(A/Indonesia/5/2005(H5N1))로 백신접종한 Balb/c 마우스에 추가접종한 후 제14일의 혈청 항체 반응의 유도를 도시한다. 도 20a는 근육내 주사를 통해 면역화된 마우스의 항체 반응이다. 도 20b는 비내 투여를 통해 면역화된 마우의 항체 반응이다. 항체 반응은 불활성화된 전체 H5N1 바이러스(A/Indonesia/5/05)에 대해 측정하였다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 재조합 가용성 H5와 비교하여 * p<0.05.
도 21은 식물-제조 인플루엔자 H5 VLP(A/Indonesia/5/2005(H5N1)) 또는 재조합 가용성 H5(A/Indonesia/5/2005(H5N1))로 백신접종한 Balb/c 마우스에 추가접종한 후 제14일의 혈구응집 억제 항체 반응(HAI)을 도시한다. 도 21a는 근육내 주사를 통해 면역화된 마우스의 항체 반응이다. 도 21b는 비내 투여를 통해 면역화된 마우스의 항체 반응이다. HAI 항체 반응은 불활성화된 전체 H5N1 바이러스(A/ Indonesia/5/05)를 사용하여 측정하였다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 재조합 가용성 H5와 비교하여 * p<0.05 및 ** p<0.01.
도 22는 Balb/c 마우스에서 VLP의 면역원성에 대한 애쥬번트의 효과를 도시한다. 도 22a는 근육내 주사를 통해 면역화된 마우스에 대한 명반의 효과이다. 도 22b는 비내 투여를 통해 면역화된 마우스에 대한 키토산의 효과이다. HAI 항체 반응은 불활성화된 전체 H5N1 바이러스(A/Indonesia/5/05)를 사용하여 측정하였다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 재조합 가용성 H5와 비교하여 * p<0.05.
도 23은 H5 VLP(A/Indonesia/5/2005(H5N1)) 투여에 대한 항체 반응을 도시한다. 도 23a는 추가접종 후 제30일에 근육내 투여에 의해 백신접종한 마우스에서의 항-Indonesia/5/05 면역글로불린 이소타입이다. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(log2)이다. 불활성화된 전 H5N1(A/Indonesia/5/2005) 바이러스를 코팅제로서 사용하여 ELISA를 수행하였다. 바는 평균 편차를 나타낸다. 상응하는 재조합 가용성 H5(A/Indonesia/5/2005(H5N1))와 비교하여 * p<0.05, ** p<0.001. 도 23b는 불활성화된 전 바이러스(A/Indonesia/5/2005(H5N1) 및 A/Vietnam/1194/04(H5N1))에 대한 항체 역가이다. 모든 그룹은 음성 대조군과 통계적으로 상이하다.
도 24는 H5 VLP(A/Indonesia/5/2005(H5N1))로 면역화된 Balb/c 마우스로부터 1차 용량 후 제14일(2주), 추가접종 후 제14일(5주) 또는 추가접종 후 제30일(7주)의 동종성 불활성화된 전 바이러스(A/Indonesia/5/05)에 대한 항체 역가를 도시한다. GMT: 기하 평균 역가. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 재조합 가용성 H5와 비교하여 * p<0.05.
도 25는 추가 접종 후 제30일에 H5 VLP(A/Indonesia/5/2005(H5N1))로 면역화된 Balb/c 마우스로부터 혈청 항체의 시험관내 교차-반응성을 도시한다. 도 25a는 불활성화된 전 바이러스에 대한 항체 역가이다. 도 25b는 다양한 불활성화된 전 바이러스에 대한 혈구응집 억제 역가이다. 값들은 그룹 당 5마리 마우스의 상호 종점 역가의 GMT(ln)이다. 바는 평균 편차를 나타낸다. 모든 그룹은 음성 대조군과 통계적으로 상이하다. 상응하는 재조합 가용성 H5와 비교하여 * p<0.05. 10 미만의 모든 값은 임의의 값 5fh 주어지며(ln으로는 1.6), 음성으로 간주된다.
도 26은 식물에서 제조된 H5 VLP(A/Indonesia/5/2005(H5N1))의 효능을 도시한다. 도 26a는 인플루엔자 균주 A/Turkey/582/06(H5N1)의 1000 LD50(4.09 x 10⁶ CCID50)으로 시험감염한 후 마우스의 생존율이다. 도 26b는 시험감염 후 면역화된 마우스의 체중이다. 값들은 생존한 마우스의 평균 체중이다.
도 27은 식물-유래 인플루엔자 VLP의 기원을 도시한다. 도 27a는 정제된 인플루엔자 VLP의 극성 지질 조성이다. 40μg 단백질의 등량에 함유된 지질을 설명된 대로 VLP로부터 추출하고 HP-TLC에 의해서 분리하여 고도로 정제된 담배 원형질막(PM)으로부터 분리된 지질의 이동 프로파일과 비교했다. 지질들의 약자는 다음과 같다: DGDG, 디갈락토실디아실글리세롤; gluCER, 글루코실세라마이드; PA, 포스파트산; PC, 포스파티딜콜린; PE, 포스파티딜에탄올아민; PG, 포스파티딜글리세롤; PI, 포스파티딜이노시톨; PS, 포스파티딜세린; SG, 스테릴글리코시드. 도 27b는 정제된 인플루엔자 VLP의 중성 지질 조성이다. 20μg 단백질의 등량에 함유된 지질을 설명된 대로 VLP로부터 추출하고 HP-TLC에 의해서 분리하여 시토스테롤의 이동과 비교했다. 도 27c는 정제된 VLP와 담배 잎(PM_L) 및 BY2 담배 세포(PM_BY2)로부터의 고도로 정제된 PM 중 원형질막 마커 프로톤 펌프 ATPase(PMA)의 면역검출이다. 18μg의 단백질을 각 레인에 로딩했다.
도 28은 클론 774의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Brisbane/59/2007(H1N1)의 뉴클레오티드 서열(SEQ ID NO: 36). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 29는 클론 775의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Solomon Islans 3/2006(H1N1)의 뉴클레오티드 서열(SEQ ID NO: 37). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 30은 클론 776의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Brisbane 10/2007(H3N2)의 뉴클레오티드 서열(SEQ ID NO: 38). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 31은 클론 777의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Wisconsin/67/2005(H3N2)의 뉴클레오티드 서열(SEQ ID NO: 39). 코딩 서열 측면에플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 32는 클론 778의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Malaysia/2506/2004의 뉴클레오티드 서열(SEQ ID NO: 40). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 33은 클론 779의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Florida/4/2006의 뉴클레오티드 서열(SEQ ID NO: 41). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 34는 클론 780의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Singapore/1/57(H2N2)의 뉴클레오티드 서열(SEQ ID NO: 42). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 35는 클론 781의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Anhui/1/2005(H5N1)의 뉴클레오티드 서열(SEQ ID NO: 43). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 36은 클론 782의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Vietnam/1194/2004(H5N1)의 뉴클레오티드 서열(SEQ ID NO: 44). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 37은 클론 783의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ /Teal/HongKong/W312/97(H6N1)의 뉴클레오티드 서열(SEQ ID NO: 45). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 38은 클론 784의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ Equine/Prague/56(H7N7)의 뉴클레오티드 서열(SEQ ID NO: 46). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 39는 클론 785의 DraIII에서부터 SacI 부위에 걸친 서열을 도시한다 - A/ HongKong/1073/99(H9N2)의 뉴클레오티드 서열(SEQ ID NO: 47). 코딩 서열 측면에 플라스토시아닌 조절 영역이 5' 단부의 DraIII 제한 부위에서 시작하여 위치하고, 3' 단부에 중단 코돈과 SacI 부위가 위치한다. 제한 부위에 밑줄이 쳐있다. ATG는 볼드체로 나타내고 밑줄이 쳐있다.
도 40a는 클론 774(A/Brisbane/59/2007(H1N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 48)을 도시한다. 클론 774의 오픈 리딩 프레임은 도 28에 나타낸 ATG에서 시작한다. 도 40b는 클론 775(A/Solomon Islands 3/2006(H1N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 49)을 도시한다. 클론 775의 오픈 리딩 프레임은 도 29에 나타낸 ATG에서 시작한다.
도 41a는 클론 776(A/Brisbane/10/2007(H3N2))으로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 50)을 도시한다. 클론 776의 오픈 리딩 프레임은 도 30에 나타낸 ATG에서 시작한다. 도 41b는 클론 777(A/Wisconsin/67/2005(H3N2))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 51)을 도시한다. 클론 777의 오픈 리딩 프레임은 도 31에 나타낸 ATG에서 시작한다.
도 42a는 클론 778(B/Malaysia/2506/2004)로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 52)을 도시한다. 클론 778의 오픈 리딩 프레임은 도 32에 나타낸 ATG에서 시작한다. 도 42b는 클론 779(B/Florida/4/2006)로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 53)을 도시한다. 클론 779의 오픈 리딩 프레임은 도 33에 나타낸 ATG에서 시작한다.
도 43a는 클론 780(A/Singapore/1/57(H2N2))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 54)을 도시한다. 클론 780의 오픈 리딩 프레임은 도 34에 나타낸 ATG에서 시작한다. 도 43b는 클론 781(A/Anhui/1/2005(H5N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 55)을 도시한다. 클론 781의 오픈 리딩 프레임은 도 35에 나타낸 ATG에서 시작한다.
도 44a는 클론 782(A/Vietnam/1194/2004(H5N1))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 56)을 도시한다. 클론 782의 오픈 리딩 프레임은 도 36에 나타낸 ATG에서 시작한다. 도 44b는 클론 783(A/Teal/HongKong/W312/97(H6N1))으로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 57)을 도시한다. 클론 783의 오픈 리딩 프레임은 도 37에 나타낸 ATG에서 시작한다.
도 45a는 클론 784(A/Equine/Prague/56(H7N7))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 58)을 도시한다. 클론 784의 오픈 리딩 프레임은 도 38에 나타낸 ATG에서 시작한다. 도 45b는 클론 785(A/HongKong/1073/99(H9N2))로부터 번역된 폴리펩티드의 아미노산 서열(SEQ ID NO: 59)을 도시한다. 클론 785의 오픈 리딩 프레임은 도 39에 나타낸 ATG에서 시작한다.
도 46은 크기 배제 크로마토그래피 후 식물에서 생산된 VLP의 용출 분획 7-17의 면역검출(웨스턴 블롯)을 도시한다. 블루 덱스트란의 용출 피크(분획 10)를 화살표로 나타낸다. 헤마글루티닌 서브타입 H1, H2, H3, H5, H6 및 H9가 도시된다. 헤마글루티닌이 분획 7-14에서 검출되며, 이것은 VLP의 용출에 해당한다.
도 47은 연례적인 유행성 균주로부터 일련의 H1 헤마글루티닌의 발현에 대한 면역블롯 분석을 도시한다. 다양한 인플루엔자 균주(면역블롯 위에 나타냄) 유래의 HA를 발현하는 식물에 대해서 10μg 및 20μg의 잎 단백질 추출물을 각각 레인 1 및 2에 로딩했다.
도 48a는 잠재적인 대유행 균주로부터 일련의 H5 헤마글루티닌의 발현에 대한 면역블롯 분석을 도시한다. 10μg 및 20μg의 단백질 추출물을 각각 레인 1 및 2에 로딩했다. 도 48b는 선택된 인플루엔자 균주로부터의 H2, H7 및 H9 헤마글루티닌의 발현에 대한 면역블롯 분석을 도시한다. 10μg 및 20μg의 단백질 추출물을 각각 레인 1 및 2에 로딩했다.
도 49는 AGL1/660으로 아그로-침윤시킨 Nicotiana tabacum 잎으로부터의 단백질 추출물 중의 A/Indonesia/5/2005 균주로부터의 H5에 대한 면역블롯을 도시한다. 2개 식물(식물 1 및 식물 2)을 침윤시켰고, 각 식물로부터 추출된 가용성 단백질 10μg 및 20μg을 각각 레인 1 및 2에 로딩했다.
도 50은 혈청 항체의 시험관내 교차-반응성을 도시한다. 흰족제비 혈청에서 혈구응집-억제(HI) 역가, 1차 면역화 후 제14일(도 50a) 및 식물-제조 인플루엔자 H5 VLP(A/Indonesia/5/2005(H5N1))로 2차 추가접종(도 50b). 다음의 불활성화된 전체 H5N1 바이러스를 사용하여 HAI 항체 반응을 측정했다: A/turkey/Turkey/1/05, A/Vietnam/1194/04, A/Anhui /5/05 및 동종성 균주 A/Indonesia/5/05. 값들은 그룹 당 5마리 흰족제비의 상호 종점 역가의 GMT(log2)이다. 사선 - A/Indonesia/ 6/06(clade 2.1.3); 체크 - A/ turkey/Turkey/1/05(clade 2.2); 흰색 바 - A/ Vietnam/1194/04(clade 1); 흑색 바 - A/Anhui/5/05. 반응자를 표시한다. 바는 평균 편차를 나타낸다.
도 51은 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Indonesia/5/2005로부터의 H5(구성물 # 660)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 60)을 도시한다.
도 52는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/New Caledonia/ 20/1999로부터의 H1(구성물 # 540)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 61)을 도시한다.
도 53은 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Brisbane/59/2007로부터의 H1(구성물 # 774)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 62)을 도시한다.
도 54는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Solomon Islands /3/2006(H1N1)로부터의 H1(구성물 # 775)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 63)을 도시한다.
도 55는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Singapore/1/57 (H2N2)로부터의 H2(구성물 # 780)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 64)을 도시한다.
도 56은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Anhui/1/2005 (H5N1)로부터의 H5(구성물 # 781)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 65)을 도시한다.
도 57은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Vietnam/1194/ 2004(H5N1)로부터의 H5(구성물 # 782)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열 (SEQ ID NO: 66)을 도시한다.
도 58은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Teal/Hong Kong/ W312/97(H6N1)로부터의 H6(구성물 # 783)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 67)을 도시한다.
도 59는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Hong Kong/ 1073/99(H9N2)로부터의 H9(구성물 # 785)의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 68)을 도시한다.
도 60은 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Brisbane/10/2007 (H3N2)로부터의 H3의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 69)을 도시한다.
도 61은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, A/Wisconsin/67/ 2005(H3N2)로부터의 H3의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 70)을 도시한다.
도 62는 자주개자리 플라스토시아닌 프로모터 및 5'UTR, A/Equine/Prague/56 (H7N7)로부터의 H7의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 71)을 도시한다.
도 63은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, B/Malaysia/2506/ 2004로부터의 HA의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 72)을 도시한다.
도 64는 자주개자리 플라스토시아닌 프로모터 및 5' UTR, B/Florida/4/2006로부터의 HA의 헤마글루티닌 코딩 서열, 자주개자리 플라스토시아닌 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트의 핵산 서열(SEQ ID NO: 73)을 도시한다.
도 65는 A/New Caledonia/20/99(H1N1)(SEQ ID NO: 33에 의해서 암호화된다), A/Brisbane/59/2007(H1N1)(SEQ ID NO:48), A/Solomon Islands/3/2006(H1N1)(SEQ ID NO: 49) 및 SEQ ID NO: 9의 HA의 컨센서스 아미노산 서열(SEQ ID NO: 74)을 도시한다. X1(위치 3)은 A 또는 V; X2(위치 52)는 D 또는 N; X3(위치 90)은 K 또는 R; X4(위치 99)는 K 또는 T; X5(위치 111)는 Y 또는 H; X6(위치 145)은 V 또는 T; X7 (위치 154)은 E 또는 K; X8(위치 161)은 R 또는 K; X9(위치 181)는 V 또는 A; X1O (위치 203)은 D 또는 N; X11(위치 205)는 R 또는 K; X12(위치 210)는 T 또는 K; X13(위치 225)은 R 또는 K; X14(위치 268)는 W 또는 R; X15(위치 283)는 T 또는 N; X16(위치 290)은 E 또는 K; X17(위치 432)은 I 또는 L; X18(위치 489)은 N 또는 D이다.
도 66은 SEQ ID NO: 33에 의해서 암호화된 H1 New Caledonia(AAP34324.1)의 아미노산 서열(SEQ ID NO: 75)을 도시한다.
도 67은 SEQ ID NO: 35에 의해서 암호화된 H1 Puerto Rico(NC_0409878.1)의 아미노산 서열(SEQ ID NO: 76)을 도시한다.
도 68은 PacI(프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 발현 카세트 번호 828의 일부분의 핵산 서열을 도시한다. CPMV HT 5'UTR 서열에 밑줄이 쳐있고, 돌연변이된 ATG가 있다. ApaI 제한 부위(발현될 단백질 코딩 서열, 이 경우에는 C5-1 kappa 경쇄의 ATG의 바로 상류).
도 69는 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 663의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H5(A/Indonesia/5/2005 유래) 코딩 서열에 밑줄이 쳐있다.
도 70은 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 787의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H1(A/Brisbane/59/2007 유래) 코딩 서열에 밑줄이 쳐있다.
도 71은 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 790의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H3(A/Brisbane/10/2007 유래) 코딩 서열에 밑줄이 쳐있다.
도 72는 HindIII(다중 클로닝 부위 내, 플라스토시아닌 프로모터 상류)에서 EcoRI(플라스토시아닌 터미네이터 바로 하류)까지, 구성물 번호 798의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 HA(B/Florida/4/2006 유래) 코딩 서열에 밑줄이 쳐있다.
도 73은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 580의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 H1(A /New Caledonia/20/1999 유래)의 코딩 서열에 밑줄이 쳐있다.
도 74는 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 685의 일부분의 핵산 서열을 도시한다. A/Indonesia/5/2005 유래의 H5의 코딩 서열에 밑줄이 쳐있다.
도 75는 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 686의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 A/ Indonesia/5/2005 유래의 H5의 코딩 서열에 밑줄이 쳐있다.
도 76은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 732의 일부분의 핵산 서열을 도시한다. A/Brisbane/59/2007 유래의 H1의 코딩 서열에 밑줄이 쳐있다.
도 77은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 733의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 A/ Brisbane/59/2007 유래의 H1의 코딩 서열에 밑줄이 쳐있다.
도 78은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 735의 일부분의 핵산 서열을 도시한다. A/Brisbane/10/2007 유래의 H3의 코딩 서열에 밑줄이 쳐있다.
도 79는 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 736의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 A/ Brisbane/10/2007 유래의 H3의 코딩 서열에 밑줄이 쳐있다.
도 80은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 738의 일부분의 핵산 서열을 도시한다. B/Florida/4/2006 유래의 HA의 코딩 서열에 밑줄이 쳐있다.
도 81은 PacI(35S 프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지, 구성물 번호 739의 일부분의 핵산 서열을 도시한다. PDI SP와 융합되어 있는 B/ Florida/4/2006 유래의 HA의 코딩 서열에 밑줄이 쳐있다.
도 82는 Msj1을 암호화하는 핵산 서열을 도시한다(SEQ ID NO: 114).
도 83은 HindIII(다중 클로닝 부위 내, 프로모터 상류)에서 EcoRI(NOS 터미네이터 바로 하류)까지, 구성물 번호 R850의 일부분의 핵산 서열을 도시한다. HSP40 코딩 서열에 밑줄이 쳐있다.
도 84는 HindIII(다중 클로닝 부위 내, 프로모터 상류)에서 EcoRI(NOS 터미네이터 바로 하류)까지, 구성물 번호 R860의 일부분의 핵산 서열을 도시한다. HSP70 코딩 서열에 밑줄이 쳐있다.
도 85는 HindIII(다중 클로닝 부위 내, 프로모터 상류)에서 EcoRI(NOS 터미네이터 바로 하류)까지, 구성물 번호 R870의 일부분의 핵산 서열을 도시한다. HSP40 코딩 서열은 이탤릭체로 나타내며 밑줄이 쳐있고, HSP70 코딩 서열은 밑줄이 쳐있다. a) 뉴클레오티드 1-5003; b) 뉴클레오티드 5004-9493.
도 86은 구성물 R472의 도식적 도면을 도시한다.
도 87은 자주개자리 단백질 이황화물 이소머라제로부터의 신호 펩티드를 사용한 HA의 발현에 대한 면역블롯 분석을 도시한다. 별도의 3개 식물로부터 얻어진 잎 단백질 추출물 20㎍을 SDS-PAGE에 로딩했고, H1(A/New Caledonia/20/99(H1N1))에 대해서만 5㎍을 사용했다. 표시된 대조군(동종성 균주의 불활성화된 전 바이러스(WIV))을 Mock-침윤된 식물 5㎍ 또는 20㎍에 스파이크했다. a) A/New Caledonia /20/99 유래 H1의 발현, b) A/Brisbane/59/2007 유래 H1의 발현, c) A/Brisbane/ 10/2007 유래 H3의 발현, d) A/Indonesia/5/2005 유래 H5의 발현, e) B/Florida /4/2006의 HA의 발현. 화살표는 HA0에 해당하는 면역밴드를 표시한다. SP WT: 자생 신호 펩티드, PS PDI: 자주개자리 PDI 신호 펩티드.
도 88은 잎 단백질 추출물의 면역블롯 분석에 의한 HA 발현 전략의 비교를 도시한다. HA는 플라스토시아닌- 또는 CPMV-HT-기반 카세트를 사용하여 생산했다. CPMV-HT에 대해서는 야생형 HA 신호 펩티드와 자주개자리 PDI로부터의 신호 펩티드를 또한 비교했다. 단백질 추출물 20㎍을 분석된 HA 서브타입에 따라 SDS-PAGE에 로딩했고, H1 New Caledonia만 단백질 5㎍을 로딩했다. a) A/New Caledonia/20/ 1999 유래 H1의 발현, b) A/Brisbane/59/2007 유래 H1의 발현, c) A/Brisbane/10/ 2007 유래 H3의 발현, d) A/Indonesia/5/2005 유래 H5의 발현, 및 e) B/Florida/4/ 2006 유래 B의 발현. 화살표는 HA0에 해당하는 면역밴드를 표시한다; HA 발현에 사용된 특정 벡터를 포함하는 특이적 아그로박테리움 균주가 레인의 윗부분에 표시된다.
도 89는 Hsp40과 Hsp70으로 공-발현되었을 때 HA 축적의 면역블롯을 도시한다. H1 New Caledonia(AGL1/540)와 H3 Brisbane(AGL1/790)가 단독으로 발현되었거나, 또는 AGL1/R870와 공-발현되었다. HA 축적 수준을 침윤된 잎으로부터의 단백질 추출물의 면역블롯 분석에 의해서 평가했다. 균주 A/New Caledonia/20/99 또는 Brisbane/10/2007의 불활성화된 전 바이러스(WIV)를 대조군으로 사용했다.
도 90은 A/California/04/09 유래의 H1에 대한 CPMV-HT 기반 발현 카세트를 도시한다(구성물 # 560).
도 91은 침윤 2일 후 아그로 침윤된 식물의 단백질 추출물에서 A/California /04/09 유래의 H1에 대한 웨스턴 블롯 분석을 도시한다. 각 레인에서 전개된 샘플을 표 20에 나타낸다.
도 92a는 A/California/04/09 유래의 H1에 대한 CPMV-HT 기반 발현 카세트(구성물 # 560)의 뉴클레오티드 서열(SEQ ID NO: 127)을 도시한다. 자주개자리 단백질 이황화물 이소머라제 신호 펩티드 코딩 서열에 밑줄이 쳐있고, 성숙한 H1 코팅 서열을 볼드체로 강조한다. 도 92b는 A/California/04/09 유래의 H1의 아미노산 서열(SEQ ID NO: 128)을 도시한다(SEQ ID NO: 127에 의해 암호화된). 자주개자리 단백질 이황화물 이소머라제 신호 펩티드에 밑줄이 쳐있다.
도 93은 2X35S 프로모터의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 129).
도 94는 PacI(프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지 중간 발현 카세트 번호 972의 뉴클레오티드 서열(SEQ ID NO: 134)을 도시한다. 2X35S 프로모터 서열에 밑줄이 쳐있다. 돌연변이된 ATG는 상자로 표시된다. ApaI 제한 부위(발현될 단백질 코딩 서열, 이 경우에는 H5 A/Indonesia의 HA0의 ATG 바로 하류)는 음영으로 표시된다.
도 95는 자생 H1 A/California/4/2009 서열의 뉴클레오티드 서열을 도시한다(SEQ ID NO: 135). 자생 H1 A/California/4/2009 신호 펩티드에 밑줄이 쳐있다. SacI 및 StuI 제한 부위는 상자로 표시된다.
도 96은 H1 A/California/4/2009 서열을 함유하는 합성된 최종 서열의 뉴클레오티드 서열(SEQ ID NO: 136)을 도시한다. DraIII에서 ApaI 제한 부위까지 M 단백질 부분에 밑줄이 쳐있다. PDISP는 볼드체로 표시된다. 돌연변이된 SacI 및 StuI 제한 부위는 상자로 표시된다.
도 97은 PCR-기반 라이게이션을 사용하여 H1 A/California/4/2009 서열을 합성하는데 사용된 단편 1(SEQ ID NO: 137), 2(SEQ ID NO: 138) 및 3(SEQ ID NO: 139)의 뉴클레오티드 서열을 도시한다.
도 98은 PacI(프로모터 상류)에서 AscI(NOS 터미네이터 바로 하류)까지 발현 카세트 번호 560의 뉴클레오티드 서열(SEQ ID NO: 146)을 도시한다. PDISP-HAO H1 A/California/4/2009 서열에 밑줄이 쳐있다.

본 발명은 바이러스-유사 입자의 생산에 관한 것이다. 더욱 구체적으로, 본 발명은 인플루엔자 항원을 포함하는 바이러스-유사 입자의 생산에 관한 것이다.

이후 바람직한 구체예를 설명한다.

본 발명은 식물에서 활성인 조절 영역에 작동 가능하게 연결된, 외피보유 바이러스로부터의 항원, 예를 들어 인플루엔자 헤마글루티닌(HA)을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 제공한다.

더욱이, 본 발명은 식물에서 바이러스-유사 입자(VLP)를 생산하는 방법을 제공한다. 상기 방법은 식물에서 활성인 조절 영역에 작동 가능하게 연결된 항원을 암호화하는 핵산을 식물 또는 식물의 일부에 도입하는 단계, 및 핵산의 발현을 허용하는 조건하에서 식물 또는 식물의 일부를 인큐베이션하여 VLP를 생산하는 단계를 포함한다.

VLP는 인플루엔자 바이러스로부터 생산될 수 있으며, 제한되는 것은 아니지만, 홍역, 에볼라, 마르부르크 및 HIV를 포함하는 다른 원형질막에서 유래하는 바이러스로부터 생산될 수도 있다.

본 발명은 인간을 감염시킬 수 있는 모든 타입의 인플루엔자 바이러스의 VLP를 포함하며, 제한되는 것은 아니지만, 예를 들어 대단히 유행성인 A(H1N1) 서브타입(예를 들어, A/New Caledonia/20/99(H1N1)), A/Indonesia/5/05 서브타입(H5N1) (SEQ ID NO:60) 및 덜 흔한 B 타입(예를 들어, SEQ ID NO:26, 도 10o) 및 C 타입 (SEQ ID NO:27, 도 10p), 그리고 다른 인플루엔자 서브타입으로부터 획득된 HA들을 포함한다. 또한, 다른 인플루엔자 서브타입의 VLP도 본 발명에 포함되는데, 예를 들어 A/Brisbane/59/2007(H1N1; SEQ ID NO:48), A/Solomon Islands/3/2006(H1N1; SEQ ID NO:49), A/Singapore/1/57(H2N2; SEQ ID NO:54), A/Anhui/1/2005(H5N1; SEQ ID NO:55), A/Vietnam/1194/2004(H5N1; SEQ ID NO:56), A/Teal/Hong Kong/W312/97 (H6N1; SEQ ID NO:57), A/Hong Kong/1073/99(H9N2; SEQ ID NO:59), A/Brisbane/10/ 2007(H3N2; SEQ ID NO:50), A/Wisconsin/67/2005(H3N2; SEQ ID NO:51), A/Equine/ Prague/56(H7N7; SEQ ID NO:58), B/Malaysia/2506/2004(SEQ ID NO:52), B/Florida/ 4/2006(SEQ ID NO:53) 또는 A/California/04/09(H1N1)(SEQ ID NO: 127)이 있다.

또한, 본 발명은, 예를 들어 인간, 영장류, 말, 돼지, 새, 조류, 물새, 철새, 메추라기, 오리, 거위, 가금류, 닭, 낙타, 개과, 개, 고양이과, 고양이, 호랑이, 표범, 사향고양이, 밍크, 흰가슴담비, 흰족제비, 애완동물, 가축, 생쥐, 래트, 바다표범, 고래 등의 다른 포유류 또는 숙주 동물을 감염시키는 인플루엔자 바이러스에 관한 것이다.

원형질막 유래 바이러스에서 발현될 수 있는 다른 항원의 비제한적 예는 HIV의 캡시드 단백질 - p24; gp120, gp41 - 외피 단백질, 구조 단백질 VP30 및 VP35; 필로바이러스, 예를 들어 에볼라 또는 마르부르크의 Gp/SGP(글리코실화된 통합 막 단백질), 또는 파라믹소바이러스, 예를 들어 홍역의 H 단백질 및 F 단백질을 포함한다.

또한, 제한되는 것은 아니지만, 본 발명은 VLP 단백질이 발현되는 세포의 원형질막으로부터 지질 외피를 획득하는 인플루엔자 유래 VLP를 포함한다. 예를 들어, VLP가 식물-기반 시스템에서 발현된다면, VLP는 세포의 원형질막으로부터 지질 외피를 획득할 수 있다.

일반적으로 용어 "지질"은 지용성(친지질성) 자연 발생 분자를 말한다. 또한, 이 용어는 더 구체적으로 지방산과 그 유도체들(트리-, 디- 및 모노글리세리드 및 인지질)을 말할 뿐만 아니라, 다른 지용성 스테롤-함유 대사산물 또는 스테롤을 말하는데도 사용된다. 인지질은 당지질, 스테롤 및 단백질과 함께 모든 생물학적 막의 주요 성분이다. 인지질의 예는 포스파티딜에탄올아민, 포스파티딜콜린, 포스파티딜이노시톨, 포스파티딜세린, 포스파티딜글리세롤 등을 포함한다. 스테롤의 예는 주스테롤(예를 들어, 콜레스테롤) 및 피토스테롤(예를 들어, 시토스테롤) 및 스테릴-글리코시드를 포함한다. 다양한 식물 종에서 200개 이상의 피토스테롤이 확인되었으며, 가장 흔한 것은 캄페스테롤, 스티그마스테롤, 에르고스테롤, 브라시카스테롤, 델타-7-스티그마스테롤, 델타-7-아베나스테롤, 다우노스테롤, 시토스테롤, 24-메틸콜레스테롤, 콜레스테롤 또는 베타-시토스테롤이다. 당업자는 세포의 원형질막의 지질 조성이 세포 또는 세포가 얻어진 유기물의 배양 또는 성장 조건에 따라서 변할 수 있다는 것을 이해할 것이다.

세포막은 일반적으로 지질 이중층뿐만 아니라 다양한 기능의 단백질을 포함한다. 특정한 지질이 국부적으로 농축되어 있는 것이 지질 이중층에서 발견될 수 있는데, 이것을 '지질 라프트'라고 한다. 이론과 결부시키고 싶지는 않지만, 지질 라프트는 세포내이입 및 세포외유출, 바이러스 또는 다른 감염성 인자의 진입 또는 유출, 세포간 신호 변환, 세포내 및 세포외 바탕질과 같은 세포 또는 유기물의 다른 구조 성분과의 상호작용에 있어서 중요한 역할을 할 수 있다.

인플루엔자 바이러스에 관해서, 용어 "헤마글루티닌" 또는 "HA"는 본원에서 사용될 때 인플루엔자 바이러스 입자의 바깥쪽에서 발견된 당단백질을 말한다. HA는 동종삼량체 막 타입 I 당단백질로서, 일반적으로 신호 펩티드, HA1 도메인, 및 C-말단에 막-연결 고정 부위 및 작은 세포질 꼬리를 포함하는 HA2 도메인을 포함한다(도 1b). HA를 암호화하는 뉴클레오티드 서열은 잘 공지되어 있어서 이용할 수 있다 - 예를 들어, BioDefence Public Health base(Influenza Virus; URL: bioheal thbase.org) 또는 National Center for Biotechnology Information(URL: ncbi.nlm. nih.gov)를 참조하며, 이들은 모두 본원에 참고자료로 포함된다.

용어 "동종삼량체" 또는 "동종삼량체의"는 3개의 HA 단백질 분자에 의해 형성된 올리고머를 말한다. 이론과 결부시키고 싶지는 않지만, HA 단백질은 약 75 kDa의 단량체 전구물질 단백질(HA0)로서 합성되고, 이것이 표면에서 삼량체 단백질로 길게 회합된다. 삼량체화가 일어나기 전에 전구물질 단백질이 보존성 활성화 절단 부위(융합 펩티드라고도 한다)에서 2개의 폴리펩티드 사슬 HA1 및 HA2(막통과 영역을 포함한다)로 절단되며, 이들은 이황화 결합에 의해 연결된다. HA1 세그먼트는 328개 아미노산 길이일 수 있고, HA2 세그먼트는 221개 아미노산 길이일 수 있다. 이 절단은 바이러스 감염성에는 중요할 수 있지만 단백질의 삼량체화에 필수적인 것은 아니다. 숙주 세포의 세포질세망(ER) 막 안으로 HA의 삽입, 신호 펩티드 절단 및 단백질 글리코실화가 동시 번역되는 사건이다. HA의 정확한 리폴딩에는 단백질의 글리코실화와 6개의 사슬내 이황화 결합의 형성이 필요하다. HA 삼량체는 시스- 및 트랜스-Golgi 복합체 내에서 회합되며, 막통과 도메인이 삼량체화 과정에서 어떤 역할을 한다. 막통과 도메인이 상실된 브로멜라인-처리된 HA 단백질의 결정 구조는 인플루엔자 균주들 중에서도 가장 보존성 구조를 나타냈다. 또한, HA는 감염 과정 동안 중요한 입체형태적 변화를 겪는다는 것이 입증되었으며, 이것에는 전구물질 HA0가 2개의 폴리펩티드 사슬 HA1 및 HA2로 절단되는 것이 필요하다. HA 단백질은 가공될 수도 있고(즉, HA1 및 HA2 도메인을 포함한다) 가공되지 않을 수도 있다(즉, HA0 도메인을 포함한다).

본 발명은 막통과 도메인을 포함하는 HA 단백질의 사용에 관한 것이며, HA1 및 HA2 도메인을 포함하는데, 예를 들어 HA 단백질은 HA0이거나, 또는 HA1 및 HA2를 포함하는 가공된 HA일 수 있다. HA 단백질은 식물, 또는 식물 세포 발현 시스템을 사용하여 VLP를 생산 또는 형성하는데 사용될 수 있다.

본 발명의 HA는 어떤 서브타입으로부터도 획득될 수 있다. 예를 들어, HA는 서브타입 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, 또는 인플루엔자 타입 B의 것일 수 있다. 또한, 본 발명의 재조합 HA는 본 분야에 공지된 모든 헤마글루티닌 서열에 기초한 아미노산 서열을 포함할 수 있다 - BioDefence Public Health base(Influenza Virus; URL: biohealthbase.org) 또는 National Center for Biotechnology Information(URL: ncbi.nlm.nih.gov) 참조. 더욱이, HA는 하나 이상의 출현해 있는 또는 새로 확인된 인플루엔자 바이러스로부터 분리된 헤마글루티닌의 서열에 기초할 수 있다.

또한, 본 발명은 하나 이상의 인플루엔자 서브타입으로부터 획득된 HA를 포함하는 VLP를 포함한다. 예를 들어, VLP는 서브타입 H1(SEQ ID NO:28에 의해서 암호화), H2(SEQ ID NO:12에 의해서 암호화), H3(SEQ ID NO:13에 의해서 암호화), H4 (SEQ ID NO:14에 의해서 암호화), H5(SEQ ID NO:15에 의해서 암호화), H6(SEQ ID NO:16에 의해서 암호화), H7(SEQ ID NO:11에 의해서 암호화), H8(SEQ ID NO:17에 의해서 암호화), H9(SEQ ID NO:18에 의해서 암호화), H10(SEQ ID NO:19에 의해서 암호화), H11(SEQ ID NO:20에 의해서 암호화), H12(SEQ ID NO:21에 의해서 암호화), H13(SEQ ID NO:27에 의해서 암호화), H14(SEQ ID NO:23에 의해서 암호화), H15 (SEQ ID NO:24에 의해서 암호화), H16(SEQ ID NO:25에 의해서 암호화), 또는 인플루엔자 타입 B(SEQ ID NO:26에 의해서 암호화), 또는 이들의 조합으로부터 하나 이상의 HA를 포함할 수 있다. 하나 이상의 인플루엔자 서브타입으로부터의 하나 이상의 HA는 식물 또는 곤충 세포에서 공-발현될 수 있으며, 이로써 하나 이상의 HA가 합성된 결과로서 하나 이상의 인플루엔자 서브타입으로부터 획득된 HA들의 조합을 포함하는 VLP의 형성이 보장된다. HA의 조합의 선택은 VLP로부터 제조된 백신의 의도된 용도에 의해 결정될 수 있다. 예를 들어, 새 접종용 백신은 HA 서브타입의 어떤 조합이라도 포함할 수 있고, 인간을 접종하는데 유용한 VLP는 서브타입 H1, H2, H3, H5, H7, H9, H10, N1, N2, N3 및 N7 중 하나 이상의 서브타입을 포함할 수 있다. 그러나, 접종물의 용도에 따라서 다른 HA 서브타입 조합도 제조될 수 있다.

따라서, 본 발명은 하나 또는 하나 이상의 HA 서브타입, 예를 들어 2개, 3개, 4개, 5개, 6개, 또는 그 이상의 HA 서브타입을 포함하는 VLP에 관한 것이다.

또한, 본 발명은 식물에서 발현되었을 때 VLP를 형성하는 헤마글루티닌을 암호화하는 핵산을 제공한다.

전형적인 핵산은 인플루엔자 서브타입의 선택된 균주 유래의 헤마글루티닌의 뉴클레오티드 서열을 포함할 수 있다. 예를 들어, A/New Caledonia/20/99(H1N1) (SEQ ID NO: 33)과 같은 A (H1N1) 서브타입, A/Indonesia/5/05 서브타입(H5N1)(구성물 # 660을 포함함; SEQ ID NO: 60) 및 덜 흔하지만 B 타입(예를 들어, SEQ ID NO: 26, 도 10o), 및 C 타입(SEQ ID NO: 27, 도 10p), 및 다른 인플루엔자 서브타입으로부터 얻어진 HA들이다. 또한, 다른 인플루엔자 서브타입의 VLP도 본 발명에 포함되며, 예를 들어 A/Brisbane/59/2007(H1N1; SEQ ID NO:36), A/Solomon Islands /3/2006(H1N1; SEQ ID NO: 37), A/Singapore/1/57(H2N2; SEQ ID NO: 42), A/Anhui/ 1/2005(H5N1; SEQ ID NO: 43), A/Vietnam/1194/2004(H5N1; SEQ ID NO: 44), A/Teal /Hong Kong/W312/97(H6N1; SEQ ID NO: 45), A/Hong Kong/1073/99(H9N2; SEQ ID NO: 47), A/Brisbane/10/2007(H3N2; SEQ ID NO: 38), A/Wisconsin/67/2005(H3N2; SEQ ID NO: 39), A/Equine/Prague/56(H7N7; SEQ ID NO: 46), B/Malaysia/2506/2004(SEQ ID NO: 40), B/Florida/4/2006(SEQ ID NO: 41) 또는 A/California/04/09(H1N1)(SEQ ID NO: 127)이다.

헤마글루티닌의 정확한 폴딩은 인플루엔자 헤마글루티닌의 여러 특징들 중에서도 단백질의 안정성, 멀티머의 형성, VLP의 형성 및 HA의 기능(적혈구 응집 능력)에 중요할 수 있다. 단백질의 폴딩은, 제한되지는 않지만, 단백질의 서열, 단백질의 상대적 풍부성, 세포내 군집화 정도, 폴딩된, 부분적으로 폴딩된 또는 언폴딩된 단백질과 결합하거나 일시적으로 회합될 수 있는 보조인자들의 활용성, 하나 이상의 샤프롱 단백질의 존재 등을 포함하는 하나 이상의 요인들에 의해 영향을 받을 수 있다.

열충격 단백질(Hsp) 또는 스트레스 단백질이 단백질 합성, 세포내 이동, 미스폴딩 방지, 단백질 응집 방지, 단백질 복합체의 조립 및 해체, 단백질 폴딩, 및 단백질 응집장애를 포함하는 다양한 세포 과정에 참여할 수 있는 샤프롱 단백질의 예이다. 이러한 샤프롱 단백질의 예는, 제한되지는 않지만, Hsp60, Hsp65, Hsp70, Hsp90, Hsp100, Hsp20-30, Hsp10, Hsp100-200, Hsp100, Hsp90, Lon, TF55, FKBPs, 시클로필린, ClpP, GrpE, 유비퀴틴, 칼넥신, 및 단백질 이황화물 이소머라제를 포함한다. 예를 들어, Macario, A. J. L., Cold Spring Harbor Laboratory Res. 25:59-70. 1995; Parsell, D.A. & Lindquist, S. Ann. Rev. Genet. 27:437-496 (1993); 미국특허 No. 5,232,833를 참조한다. 일부 예에서, 샤프롱 단백질의 특정 그룹은 Hsp40 및 Hsp70을 포함한다.

Hsp70의 예는 포유류 세포 유래의 Hsp72 및 Hsc73, 박테리아, 특히 미코박테리아, 예를 들어 Mycobacterium leprae , Mycobacterium bovis , 및 Mycobacterium tuberculosis 유래의 DnaK(Bacille-Calmette Guerin 등: 본원에서는 Hsp71라고도 한다), Escherichia coli, 효모, 및 다른 원핵생물 유래의 DnaK, 및 진핵생물, 예를 들어 A. thaliana 유래의 BiP 및 Grp78을 포함한다(Cell Stress and Chaperones 6:201-208). Hsp70의 특정 예는 A. thaliana Hsp70(SEQ ID NO:122, 또는 SEQ ID NO:123에 의해 암호화)이다. Hsp70은 ATP뿐만 아니라 언폴딩 폴리펩티드 및 펩티드와 특이적으로 결합할 수 있으며, 이로써 단백질 폴딩 및 언폴딩에 참여하고, 단백질 복합체의 조립 및 해체에도 참여한다.

Hsp40의 예는 원핵생물, 예를 들어 E. coli 및 미코박테리아 유래의 DnaJ 및 진핵생물, 예를 들어 자주개자리 유래의 HSJ1, HDJ1 및 Hsp40을 포함한다(Frugis et al., 1999. Plant Molecular Biology 40:397-408). Hsp40의 특정 예는 M. sativa MsJ1(SEQ ID NO:121, 123 또는 114에 의해 암호화)이다. Hsp40은 여러 세포 활성 중에서도 단백질 폴딩, 열내성 및 DNA 복제에서 분자 샤프롱으로서의 역할을 한다.

Hsp 중에서도 Hsp70과 그것의 보조-샤프롱인 Hsp40은 합성이 완료되기 전에 번역중인 새로 합성되는 폴리펩티드의 안정화에 관련된다. 이론과 결부시키고 싶지는 않지만, Hsp40은 언폴딩(발생중이거나 새로 전달된) 폴리펩티드의 소수성 패치에 결합하여 Hsp70-ATP 복합체와 폴리펩티드의 상호작용을 촉진한다. ATP 가수분해는 폴리펩티드, Hsp70 및 ADP 사이의 안정한 복합체의 형성과 Hsp40의 방출을 유도한다. Hsp70-ADP 복합체와 폴리펩티드의 소수성 패치의 회합은 다른 소수성 패치와의 상호작용을 방지하고, 이로써 부정확한 폴딩 및 다른 단백질과의 응집물 형성이 방지된다(Hartl, FU. 1996. Nature 381:571-579 참조).

다시, 이론과 결부시키고 싶지는 않지만, 재조합 단백질 발현 시스템에서 단백질 생산이 증가함에 따라서, 재조합 단백질 발현에 대한 군집화의 영향은 미스폴딩 폴리펩티드의 분해로 인한 재조합 단백질의 응집 및/또는 감소된 축적을 초래할 수 있다. 자생 샤프롱 단백질은 낮은 수준의 재조합 단백질에서는 정확한 폴딩을 촉진할 수 있지만, 발현 수준이 증가함에 따라, 자생 샤프롱은 제한 요인이 될 수 있다. 아그로-침윤된 잎에서 헤마글루티닌의 높은 수준의 발현은 시토졸에 헤마글루티닌 폴리펩티드의 축적을 유도할 수 있고, 하나 이상의 샤프롱 단백질, 예를 들어 Hsp70, Hsp40, 또는 Hsp70와 Hsp40 모두의 공-발현이 폴리펩티드를 발현하는 세포의 시토졸에서 안정성을 증가시킬 수 있으며, 이로써 미스폴딩 또는 응집된 헤마글루티닌 폴리펩티드의 수준이 감소하고, 안정한 헤마글루티닌으로서 축적되는 폴리펩티드의 수가 증가하여, 혈구응집 및/또는 바이러스-유사 입자의 형성을 허용하는 3차 및 4차 구조적 특징을 나타내게 된다.

따라서, 본 발명은 또한 식물에서 인플루엔자 VLP를 생산하는 방법을 제공하며, 여기서는 인플루엔자 HA를 암호화하는 제 1 핵산이 샤프롱을 암호화하는 제 2 핵산과 공-발현된다. 제 1 및 제 2 핵산은 같은 단계에서 식물에 도입될 수도 있고, 또는 순차적으로 식물에 도입될 수도 있다. 또한, 본 발명은 식물에서 인플루엔자 VLP를 생산하는 방법을 제공하며, 이 경우에는 식물이 제 1 핵산을 포함하고, 제 2 핵산은 순차적으로 도입된다.

또한, 본 발명은 하나 이상의 인플루엔자 헤마글루티닌을 암호화하는 핵산과 하나 이상의 샤프롱을 암호화하는 핵산을 포함하는 식물을 제공한다.

인플루엔자 헤마글루티닌의 발현 및/또는 분비 동안 N-말단 신호 펩티드(SP) 서열의 가공이 폴딩 과정에서 어떤 역할을 한다고 제안되었다. 일반적으로 용어 "신호 펩티드"는 새로 번역되는 폴리펩티드의 특정 소기관으로의 전위를 지시하거나, 또는 폴리펩티드의 특정 도메인의 배치를 보조할 수 있는 헤마글루티닌 폴리펩티드의 N-말단에서 일반적으로 발견되는 짧은 아미노산 서열(약 5-30개 아미노산)을 말한다. 헤마글루티닌의 신호 펩티드는 단백질의 세포질세망으로의 전위를 표적으로 하며, 발생중인 헤마글루티닌 폴리펩티드의 막-고정 도메인에 대하여 N-말단에 가까운 도메인의 배치를 보조함으로써 성숙한 헤마글루티닌의 절단 및 폴딩을 보조한다고 제안되었다. 성숙한 헤마글루티닌을 제공하기 위한 신호 펩티드의 제거(예를 들어, 신호 펩티다제에 의한)는 신호 펩티드의 정확한 절단 및 제거를 필요로 할 수 있다. 이런 정확한 절단은 신호 펩티드의 일부 또는 전부, 절단 부위 측면의 아미노산 서열, 신호 펩티드의 길이, 또는 이들의 조합을 포함하는 몇 가지 요인들 중 어느 것에 의존할 수 있으며, 이들 요인이 전부 어떤 주어진 서열에 적용되는 것은 아닐 수도 있다.

신호 펩티드는 발현될 헤마글루티닌에 자생할 수 있거나, 또는 재조합 헤마글루티닌은 제 2 인플루엔자 타입, 서브타입 또는 균주 유래의 헤마글루티닌과 균형을 이루어 제 1 인플루엔자 타입, 서브타입 또는 균주 유래의 신호 펩티드를 포함할 수 있다. 예를 들어, HA 서브타입 H1, H2, H3, H5, H6, H7, H9 또는 인플루엔자 타입 B의 자생 SP를 사용하여 식물 시스템에서 HA를 발현할 수 있다.

또한, 신호 펩티드는, 예를 들어 인플루엔자 이외의 다른 바이러스의 구조 단백질 또는 헤마글루티닌 유래의, 또는 식물, 동물 또는 박테리아 폴리펩티드 유래의 비-자생 신호 펩티드일 수도 있다. 전형적인 신호 펩티드의 예는 자주개자리 단백질 이황화물 이소머라제(PDISP)(Accession No. Z11499의 뉴클레오티드 32-103; SEQ ID NO: 34; 도 17; 아미노산 서열 MAKNVAIFGLLFSLLLLVPSQIFAEE)의 신호 펩티드이다.

또한, 본 발명은 자생, 또는 비-자생 신호 펩티드, 및 헤마글루티닌을 암호화하는 핵산을 포함하는 인플루엔자 헤마글루티닌을 제공한다.

인플루엔자 HA 단백질들은 분자량, 등전점, 크기, 글리칸 보체 등과 관련하여 일련의 유사성 및 차이를 나타낸다. 다양한 헤마글루티닌의 물리화학적 특성이 식물, 곤충 세포 또는 효모 시스템에서 발현된 HA들의 구별을 가능하게 하는데 유용할 수 있으며, 단일 시스템에서 1개를 초과하는 HA가 공-발현되는 경우에 특별히 사용될 수 있다. 이러한 물리화학적 특성의 예가 표 1에 제공된다.

또한, 본 발명은 H1, H5 또는 H7로부터의 HA를 각각 암호화하는 뉴클레오티드 서열 SEQ ID NO:28; SEQ ID NO:3; SEQ ID NO:11을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO:28; SEQ ID NO:3; SEQ ID NO:11과 혼성화하는 뉴클레오티드 서열을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO: 28; SEQ ID NO:3; SEQ ID NO:1의 보체와 혼성화하는 뉴클레오티드 서열을 포함한다. SEQ ID 또는 SEQ ID의 보체와 혼성화하는 이들 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 피험체에게 투여되었을 때 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 하나 이상의 인플루엔자 타입 또는 서브타입의 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. 피험체에게 투여되었을 때 VLP는 면역반응을 유도한다.

또한, 본 발명은 뉴클레오티드 서열 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO: 18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO: 35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO: 46, SEQ ID NO: 127 또는 SEQ ID NO:47과 혼성화하는 뉴클레오티드 서열을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47의 보체와 혼성화하는 뉴클레오티드 서열을 포함한다. SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47, 또는 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO:26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47의 보체와 혼성화하는 이들 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 피험체에 투여되었을 때 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 하나 이상의 인플루엔자 타입 또는 서브타입의 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에 투여되었을 때 면역반응을 유도한다.

어떤 구체예에서, 본 발명은 또한 인플루엔자 A의 H1, H2, H3, H5, H7 또는 H9 서브타입 유래의 HA, 또는 타입 B 인플루엔자 유래의 HA를 암호화하는 뉴클레오티드 서열 SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO: 38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47과 혼성화하는 뉴클레오티드 서열을 포함한다. 또한, 본 발명은 긴축 혼성화 조건에서 SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47의 보체와 혼성화하는 뉴클레오티드 서열을 포함한다. SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47, 또는 SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47의 보체와 혼성화하는 이들 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 피험체에 투여되었을 때 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 하나 이상의 인플루엔자 타입 또는 서브타입의 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에 투여되었을 때 면역반응을 유도한다.

긴축 혼성화 조건에서의 혼성화는 본 분야에 공지되어 있다(예를 들어, 본원에 참고자료로 포함되는 Current Protocols in Molecular Biology, Ausubel et al, eds. 1995 and supplements; Maniatis et al., Molecular Cloning(A Laboratory Manual), Cold Spring Harbor Laboratory, 1982; Sambrook and Russell, Molecular Cloning: A Laboratory Manual, 3rd edition 2001 참조). 한 이러한 긴축 혼성화 조건의 예는 65℃에서 4x SSC에서 약 16-20시간 혼성화한 후, 65℃에서 0.1x SSC에서 1시간 세척, 또는 65℃에서 0.1x SSC에서 각각 20분 또는 30분씩 2번 세척하는 것일 수 있다. 대안으로서, 전형적인 긴축 혼성화 조건은 42℃에서 50% 포름아미드, 4x SSC에서 하룻밤(16-20시간) 혼성화하고, 65℃에서 0.1x SSC에서 1시간, 또는 65℃에서 0.1x SSC에서 각각 20분 또는 30분씩 2번 세척하는 것, 또는 65℃에서 Church 수성 포스페이트 버퍼(7% SDS; 0.5M NaPO4 버퍼 pH 7.2; 10mM EDTA)에서 하룻밤(16-20시간) 혼성화하고, 50℃에서 0.1x SSC, 0.1% SDS에서 각각 20분 또는 30분씩 2번 세척하거나, 또는 65℃에서 2x SSC, 0.1% SDS에서 각각 20분 또는 30분씩 2번 세척하는 것일 수 있다.

추가하여, 본 발명은 H1(SEQ ID NO:28 또는 SEQ ID NO: 127), H5(SEQ ID NO:3) 또는 H7(SEQ ID NO:11)로부터의 HA를 암호화하는 뉴클레오티드 서열과 약 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% 또는 이 사이의 임의의 값의 서열 동일성 또는 서열 유사성을 갖는 것을 특징으로 하는 뉴클레오티드 서열을 포함하며, 상기 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하며, 상기 VLP는 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에게 투여되었을 때 면역반응을 유도한다.

추가하여, 본 발명은 SEQ ID NO:12, SEQ ID NO:13, SEQ ID NO:14, SEQ ID NO:15, SEQ ID NO:16, SEQ ID NO:17, SEQ ID NO:18, SEQ ID NO:19, SEQ ID NO:20, SEQ ID NO:21, SEQ ID NO:22, SEQ ID NO:23, SEQ ID NO:24, SEQ ID NO:25, SEQ ID NO: 26, SEQ ID NO:27, SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO: 43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO: 127 또는 SEQ ID NO:47의 뉴클레오티드 서열과 약 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% 또는 그 사이의 임의의 값의 서열 동일성 또는 서열 유사성을 갖는 것을 특징으로 하는 뉴클레오티드 서열을 포함하며, 상기 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에 투여되었을 때 면역반응을 유도한다.

추가하여, 본 발명은 SEQ ID NO:33, SEQ ID NO:35, SEQ ID NO:36, SEQ ID NO:37, SEQ ID NO:38, SEQ ID NO:39, SEQ ID NO:40, SEQ ID NO:41, SEQ ID NO:42, SEQ ID NO:43, SEQ ID NO:44, SEQ ID NO:45, SEQ ID NO:46, SEQ ID NO:127 또는 SEQ ID NO:47의 뉴클레오티드 서열과 약 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% 또는 그 사이의 임의의 값의 서열 동일성 또는 서열 유사성을 갖는 것을 특징으로 하는 뉴클레오티드 서열을 포함하며, 상기 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하고, 이 VLP를 사용하여 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에 투여되었을 때 면역반응을 유도한다.

유사하게, 본 발명은 다음의 서브타입 H1(SEQ ID NO:28 또는 SEQ ID NO:127에 의해서 암호화), H2(SEQ ID NO:12에 의해서 암호화), H3(SEQ ID NO:13에 의해서 암호화), H4(SEQ ID NO:14에 의해서 암호화), H5(SEQ ID NO:15에 의해서 암호화), H6(SEQ ID NO:16에 의해서 암호화), H7(SEQ ID NO:11에 의해서 암호화), H8(SEQ ID NO:17에 의해서 암호화), H9(SEQ ID NO:18에 의해서 암호화), H10(SEQ ID NO:19에 의해서 암호화), H11(SEQ ID NO:20에 의해서 암호화), H12(SEQ ID NO:21에 의해서 암호화), H13(SEQ ID NO:27에 의해서 암호화), H14(SEQ ID NO:23에 의해서 암호화), H15 (SEQ ID NO:24에 의해서 암호화), H16(SEQ ID NO:25에 의해서 암호화), 또는 인플루엔자 타입 B(SEQ ID NO:26에 의해서 암호화)(도 10a 내지 10o 참조)과 관련된 HA, 및 H1(SEQ ID NO:28 또는 SEQ ID NO:127), H2(SEQ ID NO:12), H3(SEQ ID NO:13), H4(SEQ ID NO:14), H5(SEQ ID NO:15), H6(SEQ ID NO:16), H7(SEQ ID NO:11), H8(SEQ ID NO:17), H9(SEQ ID NO:18), H10(SEQ ID NO:19), H11(SEQ ID NO:20), H12(SEQ ID NO:21), H13(SEQ ID NO:27), H14(SEQ ID NO:23), H15(SEQ ID NO:24), H16(SEQ ID NO:25)과 약 70 내지 100% 또는 그 사이의 임의의 값, 80 내지 100% 또는 그 사이의 임의의 값, 90 내지 100% 또는 그 사이의 임의의 값, 또는 95 내지 100% 또는 그 사이의 임의의 값의 서열 동일성을 갖는 것을 특징으로 하는 뉴클레오티드 서열을 포함하며, 이때 상기 뉴클레오티드 서열은 발현되었을 때 VLP를 형성하는 헤마글루티닌 단백질을 암호화하고, 상기 VLP는 항체의 생산을 유도한다. 예를 들어, 식물 세포에서 상기 뉴클레오티드 서열의 발현은 VLP를 형성하며, 이 VLP를 사용하여 성숙한 HA, HA0, HA1 또는 HA2를 포함하는 HA와 결합할 수 있는 항체를 생산할 수 있다. VLP는 피험체에게 투여되었을 때 면역반응을 유도한다.

"면역반응"은 일반적으로 후천적 면역 시스템의 반응을 말한다. 후천적 면역 시스템은 일반적으로 체액성 반응 및 세포-매개 반응을 포함한다. 체액성 반응은 B 림프구 계통의 세포(B 세포)에서 생산되어 분비된 항체에 의해 매개되는 면역성의 양태이다. 분비된 항체는 침입한 세균(바이러스 또는 박테리아 같은)의 표면에 존재하는 항원과 결합하여 이들을 파괴하라는 신호를 보낸다. 체액성 면역성은 일반적으로 항체 생산 및 항체 생산을 수반하는 과정을 말할 때 사용될 뿐만 아니라, Th2 세포 활성화 및 사이토카인 생산, 기억 세포 생성, 포식작용의 옵소닌 촉진, 병원체 제거 등을 포함하는 항체의 이펙터 기능을 말할 때도 사용된다. 용어 "조정하다" 또는 "조정" 등은 일반적으로 사용되거나 알려진, 일부는 본원에 예시되기도 한 몇 가지 분석법 중에서 임의의 것으로 측정했을 때 특정한 반응 또는 변수가 증가하거나 또는 감소하는 것을 말한다.

세포-매개 반응은 항체가 수반되는 것이 아니라, 자연살상세포(NK), 대식세포, 항원-특이적 세포독성 T-림프구의 활성화, 및 항원에 대한 반응으로 다양한 사이토카인의 방출을 수반하는 면역반응이다. 세포-매개 면역성은 일반적으로 어떤 Th 세포 활성화, Tc 세포 활성화 및 T-세포 매개 반응을 말할 때 사용된다. 세포-매개 면역성은 바이러스 감염에 대한 반응에서 특히 중요하다.

예를 들어, 항원 특이적 CD8 양성 T 림프구의 유도는 ELISPOT 분석을 사용하여 측정될 수 있고, CD4 양성 T-림프구의 자극은 증식 분석을 사용하여 측정될 수 있다. 항-인플루엔자 항체 역가는 ELISA 분석을 사용하여 정량될 수 있고, 항원-특이적 또는 교차-반응성 항체의 이소타입은 항-이소타입 항체(예를 들어, 항-IgG, IgA, IgE 또는 IgM)을 사용하여 측정될 수 있다. 이러한 분석을 수행하기 위한 방법 및 기술은 본 분야에 잘 공지되어 있다.

또한, 혈구응집 억제(HI 또는 HAI) 분석을 사용하여 백신에 의해 유도된 항체의 효능을 증명할 수 있거나, 또는 백신 조성물은 재조합 HA에 의한 적혈구(RBC)의 응집을 억제할 수 있다. 혈청 샘플의 혈구응집 억제 항체 역가는 마이크로타이터 HAI에 의해 평가될 수 있다(Aymard et al., 1973). 몇 가지 종들 중에서 어느 것으로부터 적혈구가 사용될 수 있다 - 예를 들어, 말, 칠면조, 닭 등. 이 분석은 VLP의 표면에서 HA 삼량체의 회합에 대한 간접적인 정보를 제공하며, HA 상에 항원 부위가 적절히 제시되는지 확인된다.

또한, 교차-반응성 HAI 역가를 사용하여 백신 서브타입과 관련된 다른 바이러스 균주들에 대한 면역반응의 효능을 증명할 수 있다. 예를 들어, 제 1 균주의 백신 조성물(예를 들어, A/Indonesia 5/05의 VLP)로 면역화한 피험체의 혈청이 전 바이러스 또는 바이러스 입자의 제 2 균주(예를 들어, A/Vietnam/1194/2004)와 함께 HAI 분석에 사용될 수 있으며, HAI 역가가 결정된다.

또한, 사이토카인의 존재 또는 수준이 정량될 수 있다. 예를 들어, T-헬퍼 세포 반응(Th1/Th2)은 ELISA(예를 들어, BD Biosciences OptEIA 키트)를 사용하여 IFN-γ 및 IL-4 분비 세포를 측정하는 것에 의해서 특정될 것이다. 피험체로부터 획득한 말초혈액 단핵세포(PBMC) 또는 비장세포를 배양하여 상청액을 분석할 수 있다. 또한, 마커 특이적 형광물질 표지와 본 분야에 공지된 방법을 사용한 형광-활성화 세포 정렬(FACS)에 의해 T 림프구가 정량될 수 있다.

또한, 피험체에서의 면역반응을 특정하기 위해서 마이크로중화 분석이 수행될 수 있는데, 예를 들어 Rowe 등(1973)의 방법을 참조한다. 바이러스 중화 역가가 몇 가지 방식으로 획득될 수 있으며, 이것은 1) 세포의 크리스탈 바이올렛 고정/착색 후 세포용해 플라크의 나열(플라크 분석); 2) 배양물에서 세포 용해의 현미경 관찰; 3) NP 바이러스 단백질의 ELISA 및 분광광도기 검출(숙주 세포의 바이러스 감염과 상호관련)을 포함한다.

서열 동일성 또는 서열 유사성은 뉴클레오티드 서열 비교 프로그램을 사용하여 결정될 수 있으며, 예를 들어 DNASIS(제한되는 것은 아니지만, 예를 들어 파라미터로서 GAP 패널티 5, 상부 대각선의 수 5, 고정 GAP 패널티 10, k-tuple 2, 플로팅 갭 10, 및 창 크기 5를 사용한다)가 있다. 그러나, 비교를 위한 서열 정렬의 다른 방법들도 본 분야에 잘 공지되어 있으며, 예를 들어 Smith & Waterman 알고리즘(1981, Adv. Appl. Math. 2:482), Needleman & Wunsch 알고리즘(J. Mol. Biol. 48:443, 1970), Pearson & Lipman 알고리즘(1988, Proc. Nat'l. Acad. Sci. USA 85:2444), 및 이들 알고리즘의 컴퓨터 실행(예를 들어, GAP, BESTFIT, FASTA, 및 BLAST), 또는 수동 정렬 및 육안 검사가 있다.

용어 "헤마글루티닌 도메인"은 HA0 도메인, 또는 HA1과 HA2 도메인(또는 HA1 및 HA2 단편이라고도 한다)을 포함하는 펩티드를 말한다. HA0는 HA1 및 HA2 단편의 전구체이다. HA 단량체는 일반적으로 2개의 기능 도메인, 즉 스템 도메인과 구상 헤드, 또는 헤드 도메인으로 세분될 수 있다. 스템 도메인은 산성 pH에 노출되었을 때 겪을 수 있는 입체구조적 변화를 통해서 바이러스의 감염성 및 병원성에 관련된다. 스템 도메인은 4개의 서브도메인 또는 단편, 즉 융합 서브도메인 또는 펩티드(산성 pH 입체구조 상태에서 숙주 막과 융합되어 관련되는 아미노산의 소수성 스트레치), 스템 서브도메인(2 이상의 입체구조를 수용할 수 있음), 막통과 도메인 또는 서브도메인(TmD)(지질 판에 대한 HA의 친화성에 관련됨), 및 세포질 꼬리(세포질 꼬리 서브도메인)(Ctail)(HA의 분비에 관련됨)으로 더 세분될 수 있다. 구상 헤드는 2개의 서브도메인, 즉 RB 서브도메인과 퇴화된 에스테라제 도메인(E)으로 나눠진다. E 서브도메인은 부분적으로 또는 완전히 매장되어 있을 수 있고, 구상 헤드의 표면에는 노출되지 않으므로, HA에 대해 발생된 일부 항체는 RB 서브도메인과 결합한다.

용어 "바이러스-유사 입자"(VLP) 또는 "바이러스-유사 입자들" 또는 "VLPs"는 자체 회합하며 인플루엔자 HA 단백질과 같은 구조 단백질을 포함하는 구조를 말한다. 일반적으로 VLP는 감염시 생산되는 비리온과 형태적으로도 항원적으로도 유사하지만, 복제에 필요한 유전자 정보가 충분하지 않기 때문에 비감염성이다. 일부 예에서, VLP는 단일 단백질 종을 포함하거나, 또는 1개를 초과하는 단백질 종을 포함할 수 있다. 1개를 초과하는 단백질 종을 포함하는 VLP에 대해서, 단백질 종은 동일한 바이러스 종으로부터 유래할 수도 있고, 상이한 종, 속, 아과 또는 과의 바이러스(ICTV 명명법에 의해 지정된다)로부터 유래하는 단백질을 포함할 수도 있다. 다른 예에서, VLP를 포함하는 단백질 종들 중 하나 이상은 자연 발생 서열로부터 변형될 수 있다. VLP는 식물 및 곤충 숙주 세포를 포함하는 적합한 숙주 세포에서 생산될 수 있다. 숙주 세포로부터 추출하여 분리하고 적합한 조건에서 더 정제한 후, VLP는 무손상 구조로서 정제될 수 있다.

본 발명에 따라서 인플루엔자 유래 단백질로부터 생산된 VLP는 M1 단백질을 포함하지 않는다. M1 단백질은 VLP 제제의 오염물질인 RNA와 결합하는 것으로 알려져 있다(Wakefield and Brownlee, 1989). RNA의 존재는 VLP 제품에 대해 규제당국의 승인을 얻을 때 바람직하지 않으며, 따라서 RNA가 없는 VLP 제제가 유리할 수 있다.

본 발명의 VLP는 단백질을 시알릴화하는 능력을 결여한 것을 특징으로 하는, 예를 들어 시알리다제가 없는 숙주 세포, 예를 들어 식물 세포, 곤충 세포, 진균, 및 해면, 강장동물문, 환형동물문, 절지동물문, 연체동물문, 선형동물문, 트로켈민테스, 편충동물문, 모악동물문, 유촉수강, 클라미디아, 스피로헤타, 그람-양성 박테리아, 시아노박테리아, 고세균 등에서 생산될 수 있다. 예를 들어, 글리코포럼 (URL: glycofomm.gr.jp/science/word/evolution/ES-A03E.html) 또는 Gupta et al., 1999. Nucleic Acids Research 27:370-372; 또는 Toukach et al., 2007. Nucleic Acids Research 35: D280-D286; 또는 URL: glycostructures.jp(Nakahara et al., 2008. Nucleic Acids Research 36:D368-D371; 2007년 10월 11일 온라인 공개 doi: 10.1093/NAR/gkm833)를 참조한다. 본원에 설명된 대로 생산된 VLP는 전형적으로 뉴라미니다제(NA)를 포함하지 않는다. 그러나, HA와 NA를 포함하는 VLP가 바람직하다면 NA가 HA와 함께 공-발현될 수 있다.

본 발명의 어떤 양태에 따라서 식물에서 생산된 VLP는 식물-유래 지질과 복합체를 이룰 수 있다. VLP는 HA0, HA1 또는 HA2 펩티드를 포함할 수 있다. 식물-유래 지질은 지질 이중층의 형태일 수 있으며, VLP를 둘러싼 외피를 더 포함할 수 있다. 식물-유래 지질은 VLP가 생산되는 식물의 원형질막의 지질 성분을 포함할 수 있으며, 제한되는 것은 아니지만, 이들은 포스파티딜콜린(PC), 포스파티딜에탄올아민(PE), 글리코스핑고지질, 피토스테롤 또는 이들의 조합을 포함한다. 식물-유래 지질은 "식물 지질"이라고도 할 수 있다. 피토스테롤의 예는 본 분야에 공지되어 있으며, 예를 들어 스티그마스테롤, 시토스테롤, 24-메틸콜레스테롤 및 콜레스테롤을 포함한다 - 예를 들어, Mongrand et al., 2004 참조.

VLP는, 예를 들어 혈구응집 분석, 전자현미경, 또는 크기 배제 크로마토그래피에 의해서 구조와 크기에 대해 평가될 수 있다.

크기 배제 크로마토그래피에서는, 동결 분쇄한 식물 구성물질의 샘플을 추출 버퍼 중에서 균질화하고(Polytron), 원심분리에 의해 불용성 물질을 제거함으로써 식물 조직으로부터 총 가용성 단백질이 추출될 수 있다. 또한, PEG를 사용한 침전도 유리할 수 있다. 가용성 단백질을 정량하고 추출물을 Sephacryl™ 칼럼을 통과시킨다. 블루 덱스트란 2000이 캘리브레이션 표준물질로서 사용될 수 있다. 크로마토그래피 후 면역블롯에 의해 분획들을 더 분석하여 분획의 단백질 보체를 결정할 수 있다.

이론과 결부시키고 싶지는 않지만, 상이한 동물로부터의 RBC와 결합하는 HA의 능력은 시알산 α2,3 또는 α2,3에 대한 HA의 친화성, 및 RBC의 표면에 있는 이들 시알산의 존재에 의해 유도된다. 인플루엔자 바이러스로부터의 말 및 조류 HA는 칠면조, 닭, 오리, 기니아피그, 인간, 양, 말 및 소를 포함하는 몇몇 종들 전부에서 적혈구를 교착시키는 반면에, 인간 HA는 칠면조, 닭, 오리, 기니아피그, 인간 및 양의 적혈구와 결합할 것이다(Ito T. et al, 1997, Virology, vol 227, p493-499; 및 Medeiros R et al., 2001, Virology, vol. 289 p.74-85 참조). 상이한 인플루엔자 균주의 HA의 종 반응성의 예를 표 2A 및 2B에 나타낸다.

단백질, 융합 단백질 또는 폴리펩티드의 단편 또는 일부분은 특정한 단백질 또는 폴리펩티드의 아미노산 보체의 하위단위를 포함하는 펩티드 또는 폴리펩티드를 포함하며, 단 상기 단편은 발현되었을 때 VLP를 형성할 수 있어야 한다. 단편은, 예를 들어 항원성 영역, 스트레스-반응-유도 영역, 또는 단백질 또는 폴리펩티드의 기능 도메인을 포함하는 영역을 포함할 수 있다. 또한, 단편은 동일한 속에 속하는 일족의 단백질에 공통적인 영역 또는 도메인을 포함하거나, 또는 단편은 단편이 유래된 전장 단백질을 구체적으로 확인할 수 있는 충분한 아미노산 서열을 포함할 수 있다.

예를 들어, 단편 또는 일부분은 단백질의 전장 길이의 약 60% 내지 약 100%, 또는 그 사이의 임의의 값을 포함할 수 있으며, 단 상기 단편은 발현되었을 때 VLP를 형성할 수 있어야 한다. 예를 들어, 단편 또는 일부분은 단백질의 전장 길이의 약 60% 내지 약 100%, 약 70% 내지 약 100%, 약 80% 내지 약 100%, 약 90% 내지 약 100%, 약 95% 내지 약 100%, 또는 그 사이의 임의의 값을 포함할 수 있다. 대안으로서, 단편 또는 일부분은 HA에 따라서 약 150개 내지 약 500개 아미노산 또는 그 사이의 임의의 값일 수 있으며, 단 상기 단편은 발현되었을 때 VLP를 형성할 수 있어야 한다. 예를 들어, 단편은 HA에 따라서 약 150개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 200개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 250개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 300개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 350개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 400개 내지 약 500개 아미노산 또는 그 사이의 임의의 값, 약 450개 내지 약 500개 아미노산 또는 그 사이의 임의의 값일 수 있으며, 단 상기 단편은 발현되었을 때 VLP를 형성할 수 있어야 한다. 예를 들어, 약 5, 10, 20, 30, 40 또는 50개 아미노산, 또는 그 사이의 어떤 임의의 값이 HA 단백질의 C-말단, N-말단 또는 N-말단과 C-말단 양쪽으로부터 제거될 수 있으며, 단 상기 단편은 발현되었을 때 VLP를 형성할 수 있어야 한다.

어떤 주어진 서열에서 아미노산의 넘버링은 특정 서열에 따라 상대적이지만, 당업자는 구조 및/또는 순서에 기초하여 서열에 있는 특정 아미노산의 "등가성"을 쉽게 결정할 수 있다. 예를 들어, 결정학용 클론을 구성하면서 6개의 N-말단 아미노산을 제거한 경우, 이것은 아미노산의 구체적인 번호 동일성을 변경할 수는 있지만(예를 들어, 전장 단백질에 상대적으로), 구조 내에서 아미노산의 상대적 위치를 변경하지는 않을 것이다.

서열 또는 서열들의 비교는 BLAST 알고리즘(Altschul et al., 1990. J. Mol. Biol. 215:403-410)을 사용하여 수행할 수 있다. BLAST 탐색은 쿼리 서열과 특정 서열 또는 서열 그룹의 비교, 또는 쿼리 서열과 더 큰 서열 라이브러리 또는 데이터베이스(예를 들어, GenBank 또는 GenPept)의 비교를 허용하며, 100% 동일성을 나타내는 서열뿐만 아니라 동일성의 정도가 더 적은 서열들도 확인한다. BLAST 알고리즘을 사용하여 핵산 또는 아미노산 서열을 비교할 수 있다. 또한, 2 이상의 서열 간의 동일성은 서열들을 함께 정렬하고 서열 간의 동일성 %를 결정함으로써 결정될 수 있다. 정렬은 BLAST 알고리즘(예를 들어, GenBank를 통해 입수가능; URL: ncbi.nlm.nih.gov/cgi-bin/BLAST/ 디폴트 파라미터 사용: 프로그램: blastn; 데이터베이스: nr; 익스펙트 10; 필터: 디폴트; 얼라인먼트: 페어와이즈; 쿼리 유전자 코드: 표준(1)), 또는 BLAST2(EMBL를 통해 입수가능; URL: embl-heidelberg.de/ Services/index.html 디폴트 파라미터 사용: 매트릭스 BLOSUM62; 필터: 디폴트, 에코필터: on, 익스펙트: 10, 컷오프: 디폴트; 스트랜드: 양쪽; 디스크립션: 50, 얼라인먼트: 50); 또는 FASTA(디폴트 파라미터 사용)을 사용하여, 또는 서열을 수동 비교하고 동일성 %를 계산함으로써 수행될 수 있다.

제한되는 것은 아니지만, 본 발명은 식물 발현 벡터로의 HA를 암호화하는 핵산의 클로닝, 및 식물로부터 백신 생산에 적합한 인플루엔자 VLP의 생산을 설명한다. 이러한 핵산의 예는, 제한되는 것은 아니지만, 예를 들어 인플루엔자 A/New Caledonia/20/99(H1N1) 바이러스 HA(예를 들어, SEQ ID NO:61), A/California/04/ 09 유래의 HA(SEQ ID NO:127), A/Indonesia/5/05 서브타입(H5N1)(예를 들어, SEQ ID NO:60), A/Brisbane/59/2007(H1N1)(예를 들어, SEQ ID NO:36,48,62), A/Solomon Islands/3/2006(H1N1)(예를 들어, SEQ ID NO: 37,49,63), A/Singapore/1/57(H2N2) (예를 들어, SEQ ID NO:42,54,64), A/Anhui/1/2005(H5N1)(예를 들어, SEQ ID NO: 43,55,65), A/Vietnam/1194/2004(H5N1)(예를 들어, SEQ ID NO:44,56,66), A/Teal/ Hong Kong/W312/97(H6N1)(예를 들어, SEQ ID NO:45,57,67), A/Hong Kong/1073/99 (H9N2)(예를 들어, SEQ ID NO:47,59,68), A/Brisbane/10/2007(H3N2)(예를 들어, SEQ ID NO:38,50,69), A/Wisconsin/67/2005(H3N2)(예를 들어, SEQ ID NO:39, 51, 70), A/Equine/Prague/56(H7N7)(예를 들어, SEQ ID NO:46,58,71), B/Malaysia/2506 /2004(예를 들어, SEQ ID NO:40,52,72), B/Florida/4/2006(예를 들어, SEQ ID NO: 41,53,73)로부터의 HA를 포함한다. 이들 균주에 대한 상응하는 클론 또는 구성물 번호가 표 1에 제공된다. 도 28 내지 39에 예시된 대로, SEQ ID NO:36-47에 해당하는 핵산 서열은 플라스토시아닌 상류를 포함하며, 각 타입 또는 서브타입에 맞는 HA의 코딩 서열에 작동 가능하게 연결된다. 도 51 내지 64에 예시된 대로, SEQ ID NO:60-73에 해당하는 핵산 서열은 자주개자리 플라스토시아닌 프로모터 및 5' UTR, HA의 헤마글루티닌 코딩 서열, 자주개자리 3' UTR 및 터미네이터 서열을 포함하는 HA 발현 카세트를 포함한다.

또한, VLP를 사용하여, 형질전환된 숙주 세포, 예를 들어 식물 세포 또는 곤충 세포에서 서브바이러스 인플루엔자 입자 및 인플루엔자 VLP를 포함하여, 기능성이며 면역원성인 동종타입 거대분자 단백질 구조로 자체 회합하는 재조합 인플루엔자 구조 단백질들로 이루어진 시약을 제조할 수 있다.

따라서, 본 발명은 단일 외피 단백질의 발현으로 인한, VLP, 및 식물 발현 시스템에서 바이러스 VLP를 생산하는 방법을 제공한다. VLP는 인플루엔자 VLP, 또는 제한되는 것은 아니지만, 홍역, 에볼라, 마르부르크 및 HIV를 포함하는 다른 원형질막-유래 바이러스로부터 생산된 VLP일 수 있다.

다른 외피보유 바이러스로부터의 단백질, 제한되는 것은 아니지만, 예를 들어 필로비리다에(예를 들어, 에볼라 바이러스, 마르부르크 바이러스 등), 파라믹소비리다에(예를 들어, 홍역 바이러스, 유행성 이하선염 바이러스, 호흡기 세포융합 바이러스, 뉴모바이러스 등), 레트로비리다에(예를 들어, 인간 면역결핍 바이러스-1, 인간 면역결핍 바이러스-2, 인간 T-세포 백혈병 바이러스-1 등), 플라비비리다에(예를 들어, 웨스트나일 뇌염, 댕기 바이러스, C형 간염 바이러스, 황열병 바이러스 등), 분야비리다에(예를 들어, 한타바이러스 등), 코로나비리다에(예를 들어, 코로나바이러스, SARS 등)로부터의 단백질들도 당업자에게 알려진 대로 사용될 수 있다. 원형질막 유래 바이러스에서 발현될 수 있는 항원의 비제한적 예는 HIV의 캡시드 단백질 - p24; HIV 당단백질 gp120 또는 gp41, 에볼라 바이러스의 VP30 또는 VP35 또는 마르부르크 바이러스의 Gp/SGP를 포함하는 필로바이러스 단백질 또는 홍역 파라믹소바이러스의 H 단백질 또는 F 단백질을 포함한다. 예를 들어, HIV의 P24(예를 들어, GenBank 레퍼런스 gi:19172948)는 HIV 바이러스 게놈(예를 들어, GenBank 레퍼런스 gi:9629357)의 gag 서열의 번역과 절단에 의해서 얻어진 단백질이고; HIV의 gp120 및 gp41은 HIV 바이러스 게놈의 env에 의해 암호화된 gp160 단백질(예를 들어, GenBank 레퍼런스 gi:9629363)의 번역과 절단에 의해서 얻어진 당단백질이다. 에볼라 바이러스의 VP30(GenPept 레퍼런스 gi:55770813)은 에볼라 바이러스 게놈(예를 들어, GenBank 레퍼런스 gi:55770807)의 vp30 서열의 번역에 의해서 얻어진 단백질이고, 에볼라 바이러스의 VP35(GenPept 레퍼런스 gi:55770809)는 에볼라 바이러스 게놈의 vp35 서열의 번역에 의해서 얻어진 단백질이다. 마르부르크 바이러스의 Gp/SGP(GenPept 레퍼런스 gi:296965)는 마르부르크 바이러스 게놈(GenBank 레퍼런스 gi:158539108)의 (서열)의 번역에 의해서 얻어진 단백질이다. H 단백질(GenPept 레퍼런스 gi:9626951)은 홍역 바이러스 게놈(GenBank 레퍼런스 gi:9626945)의 H 서열의 단백질이고, F 단백질(GenPept 레퍼런스 gi:9626950)은 홍역 바이러스 게놈의 F 서열의 단백질이다.

그러나, 당업자에게 알려진 대로 본 발명의 방법에서는 다른 외피보유 단백질도 사용될 수 있다.

따라서, 본 발명은 HIV-p24, HIV-gp120, HIV-gp41, 에볼라 바이러스-VP30, 에볼라 바이러스-VP35, 마르부르크 바이러스 Gp/SGP, 홍역 바이러스-H 단백질 또는 -F 단백질을 암호화하는 서열을 포함하는 핵산 분자를 제공한다. 이 핵산 분자는 곤충, 효모 또는 식물 세포, 또는 특히 식물 조직에서 활성인 조절 영역에 작동 가능하게 연결될 수 있다.

더욱이, 본 발명은 HA, 제한되는 것은 아니지만, 예를 들어 인간 인플루엔자 A/Indonesia/5/05 바이러스 HA(H5N1) 또는 인플루엔자 균주 A/California/04/09 유래의 HA를 암호화하는 핵산을 식물 또는 곤충 발현 벡터(예를 들어, 바쿨로바이러스 발현 벡터)에서 클로닝하는 것, 및 형질전환된 식물 세포 또는 형질전환된 곤충 세포에서, 서브바이러스 인플루엔자 입자 및 인플루엔자 VLP를 포함하여, 기능적이며 면역원성인 동종타입 거대분자 단백질 구조로 자체 회합하는 재조합 인플루엔자 구조 단백질들로 이루어진 인플루엔자 백신 후보 또는 시약을 생산하는 것을 제공한다.

인플루엔자 서브타입, 제한되지는 않지만, 예를 들어 A/New Caledonia/20/99 (H1N1), A/California/04/09(H1N1), A/Indonesia/5/05 서브타입(H5N1), A/Brisbane /59/2007(H1N1), A/Solomon Islands/3/2006(H1N1), A/Singapore/1/57(H2N2), A/ Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/W312/97(H6N1), A/HongKong/1073/99(H9N2), A/Brisbane/10/2007(H3N2), A/Wisconsin/67/2005(H3 N2), A/Equine/Prague/56(H7N7), B/Malaysia/2506/2004, B/Florida/4/2006의 HA를 암호화하는 핵산이, 예를 들어 바쿨로바이러스 발현 시스템을 사용하여 적합한 셀라인에서, 예를 들어 Spodoptera frugiperda 세포(예를 들어, Sf-9 셀라인; ATCC PTA-4047)에서 발현될 수 있다. 또한, 다른 곤충 셀라인도 사용될 수 있다.

대안으로서, HA를 암호화하는 핵산은 식물 세포 또는 식물에서 발현될 수 있다. HA를 암호화하는 핵산은 HA RNA를 사용한 역전사와 폴리머라제 연쇄반응(PCR)에 의해 합성될 수 있다. 예로서, 인간 인플루엔자 A/New Caledonia/20/99(H1N1) 바이러스 또는 인간 인플루엔자 A/Indonesia/5/05(H5N1) 바이러스, 또는 다른 인플루엔자 바이러스, 예컨대 A/California/04/09(H1N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands/3/2006(H1N1), A/Singapore/1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/W312/97(H6N1), A/Hong Kong/1073/99 (H9N2), A/Brisbane/10/2007(H3N2), A/Wisconsin/67/2005(H3N2), A/Equine/Prague/ 56(H7N7), B/Malaysia/2506/2004, B/Florida/4/2006로부터, 또는 인플루엔자 바이러스로 감염된 세포로부터 RNA가 분리될 수 있다. 역전사와 PCR에서 HA RNA, 제한되는 것은 아니지만, 예를 들어 인간 인플루엔자 A/New Caledonia/20/99(H1N1) 바이러스 HA 서열 또는 인간 인플루엔자 A/Indonesia/5/05 (H5N1) 바이러스 HA0 서열, 또는 인플루엔자 서브타입 A/California/04/09(H1N1), A/Brisbane/59/2007 (H1N1), A/Solomon Islands/3/2006(H1N1), A/Singapore/1/57(H2N2), A/Anhui/1/ 2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/W312/97(H6N1), A/Hong Kong/1073/99(H9N2), A/Brisbane/10/2007(H3N2), A/Wisconsin/67/2005(H3N2), A/ Equine/Prague/56(H7N7), B/Malaysia/2506/2004, B/Florida/4/2006로부터의 HA 서열에 특이적인 올리고뉴클레오티드 프라이머가 사용될 수 있다. 추가하여, HA를 암호화하는 핵산은 당업자에게 알려진 방법을 사용하여 화학적으로 합성될 수 있다.

이들 유전자의 얻어진 cDNA 카피들은 숙주 발현 시스템에 필요하다면 적합한 발현 벡터에서 클로닝될 수 있다. 식물에서 적합한 발현 벡터의 예가 아래 설명되며, 대안으로서 바쿨로바이러스 발현 벡터, 예를 들어 pFastBacl(InVitrogen)를 사용하여 공지된 방법 및 제조자의 설명서에 제공된 정보에 따라서 pFastBacl-기반 플라스미드를 얻을 수 있다.

또한, 본 발명은 식물에서 작동가능한 조절 요소에 작동 가능하게 연결된 상기 설명된 HA를 암호화하는 핵산을 포함하는 유전자 구성물에 관한 것이다. 식물 세포에서 작동 가능하고 본 발명에 따라서 사용될 수 있는 조절 요소의 예는, 제한되는 것은 아니지만, 플라스토시아닌 조절 영역(US 7,125,978; 본원에 참고자료로 포함된다), 또는 리불로오스 1,5-비스포스페이트 카르복실라제/옥시게나제의 조절 영역(RuBisCO; US 4,962,028; 본원에 참고자료로 포함된다), 클로로필 a/b 결합 단백질(CAB; Leutwiler et al., 1986; 본원에 참고자료로 포함된다), ST-LS1(광계 II의 산소-방출 복합체와 결합된다, Stockhaus et al., 1987, 1989; 본원에 참고자료로 포함된다)를 포함한다. 플라스토시아닌 조절 영역의 예는 SEQ ID NO:36의 뉴클레오티드 10-85를 포함하는 서열, 또는 SEQ ID NO:37-47 중 어느 하나의 유사한 영역을 포함한다. 조절 요소 또는 조절 영역은 그것이 작동 가능하게 연결된 뉴클레오티드 서열의 번역을 증진시킬 수 있고, 뉴클레오티드 서열은 단백질 또는 폴리펩티드를 암호화할 수 있다. 조절 영역의 또 다른 예는 동부 모자이크병 바이러스 (CPMV)의 미번역 영역으로부터 유래된 것이며, 이것을 사용하여 작동 가능하게 연결된 뉴클레오티드 서열을 우선적으로 번역할 수 있다. 이 CPMV 조절 영역은 CMPV-HT 시스템을 포함한다. 예를 들어, Sainsbury et al, 2008, Plant Physiology 148:1212-1218를 참조한다.

만일 구성물이 곤충 세포에서 발현되는 경우, 곤충 세포에서 작동가능한 조절 요소의 예는, 제한되는 것은 아니지만, 폴리헤드린 프로모터(Possee and Howard 1987. Nucleic Acids Research 15:10233-10248), gp64 프로모터(Kogan et al., 1995. J. Virology 69:1452-1461) 등을 포함한다.

따라서, 본 발명의 한 양태는 조절 영역 및 인플루엔자 HA를 암호화하는 서열을 포함하는 핵산을 제공한다. 조절 영역은 플라스토시아닌 조절 요소일 수 있고, 인플루엔자 HA는 A/California/04/09(H1N1), A/New Caledonia/20/99(H1N1), A/Indonesia/5/05 서브타입(H5N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands/ 3/2006(H1N1), A/Singapore/1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/ 2004(H5N1), A/Teal/Hong Kong/W312/97(H6N1), A/Brisbane/10/2007(H3N2), A/Wisconsin/67/2005(H3N2), A/Equine/Prague/56(H7N7), B/Malaysia/2506/2004, B/Florida/4/2006, A/Hong Kong/1073/99(H9N2)를 포함하는 인플루엔자 균주 또는 서브타입의 군으로부터 선택될 수 있다. 플라스토시아닌 조절 요소와 인플루엔자 HA를 포함하는 핵산 서열은 SEQ ID NO:36-47로 본원에 예시된다.

인플루엔자 바이러스가 난, 또는 포유류 세포(예를 들어, MDCK 세포)에서 배양되었을 때, 또는 감염된 피험체로부터 분리되었을 때, 인플루엔자 헤마글루티닌 아미노산 서열들, 또는 이들을 암호화하는 핵산들의 서열에는 서열 차이가 있을 수 있다는 것이 알려져 있다. 이러한 차이의 비제한적 예가 실시예 18을 포함하여 본원에 예시된다. 더욱이, 당업자가 이해하고 있는 대로, 새로운 균주로부터 얻어진 인플루엔자 헤마글루티닌에서는 추가 돌연변이가 계속해서 발생할 수 있기 때문에 추가의 변이도 관찰될 수 있다. 상이한 인플루엔자 헤마글루티닌들 간의 공지된 서열 변동성으로 인해, 본 발명은 본원에 설명된 대로 숙주에서 발현되었을 때 인플루엔자 헤마글루틴이 VLP를 형성하기만 한다면 어떤 인플루엔자 헤마글루틴을 사용해서도 제조될 수 있는 VLP를 포함한다.

서열 정렬 및 컨센서스 서열은 본 분야에 공지된 몇몇 소프트웨어 패키지 중 어느 것을 사용하여, 예를 들어 MULTALIN(F. CORPET, 1988, Nucl. Acids Res., 16 (22), 10881-10890)를 사용하여 결정될 수 있거나, 또는 서열들이 수동으로 정렬되고 서열들 간의 유사성 및 차이가 결정될 수 있다.

헤마글루티닌의 구조는 잘 연구되고 있으며, 그 구조는 매우 보존성인 것으로 알려져 있다. 헤마글루티닌 구조가 중첩된 경우, 높은 정도의 구조 보존이 관찰된다(rmsd <2A). 이 구조 보존은 일부 위치에서 아미노산 서열이 변경될 수 있을 때도 관찰된다(예를 들어, Skehel and Wiley, 2000 Ann. Rev. Biochem. 69:531-69; Vaccaro et al., 2005). 또한, 다음과 같이 헤마글루티닌의 영역들도 잘 보존된다.

● 구조 도메인: HA0 폴리단백질이 절단되어 성숙한 HA가 제공된다. HA는 동종삼량체이며, 각 단량체는 1개의 이황화 결합에 의해서 연결된 수용체 결합 도메인(HA1)과 막-고정 도메인(HA2)을 포함한다. 또한, HA2 서브유닛의 N-말단 20개 잔기는 HA 융합 도메인 또는 서열로서 언급될 수 있다. '꼬리' 영역(막 외피의 내부)도 존재한다. 각 헤마글루티닌은 이들 영역 또는 도메인을 포함한다. 개별 영역 또는 도메인은 전형적으로 길이가 보존된다.

● 모든 헤마글루티닌은 동일한 수의 분자간 및 분자내 이황화물 다리를 동일한 위치에 함유한다. 이황화물 다리 망구조에 참여하는 시스테인의 아미노산 서열에서의 양 및 위치는 HA들에서 보존된다. 특징적인 분자내 및 분자간 이황화물 다리 그리고 다른 보존된 아미노산 및 이들의 상대 위치를 예시하는 구조의 예가, 예를 들어 Gamblin 등(2004, Science 303:1838-1842)에 설명된다. 전형적인 구조 및 서열은 1RVZ, 1RVX, 1RVT, 1RV0, 1RUY, 1RU7을 포함하며, Protein Data Bank (Berman et al. 2003. Nature Structural Biology 10:980; URL: www.rcsb.org)로부터 입수가능하다.

● 세포질 꼬리 - 대부분의 헤마글루티닌은 보존된 위치에 3개의 시스테인을 포함한다. 이들 시스테인 중 하나 이상이 번역-후 변형으로서 팔미토일화될 수 있다.

인플루엔자 바이러스의 헤마글루티닌에서는 아미노산 변이가 허용된다. 이런 변이가 계속해서 확인되는 새로운 균주를 제공한다. 새로운 균주들의 감염성은 다양할 수 있다. 그러나, 헤마글루티닌 삼량체의 형성과 그에 이어지는 VLP의 형성은 유지된다. 따라서, 본 발명은 공지된 서열 및 발생할 수 있는 변이체 서열을 포함하며, 식물에서 VLP를 형성하는 헤마글루티닌 아미노산 서열, 또는 헤마글루티닌 아미노산 서열을 암호화하는 핵산을 제공한다.

도 65는 이러한 공지된 변이의 예를 예시한다. 이 도면은 다음 H1N1 균주의 HA에 대한 컨센서스 아미노산 서열(SEQ ID NO:74)을 도시한다: A/New Caledonia/20 /99(H1N1)(SEQ ID NO:33에 의해 암호화), A/Brisbane/59/2007(H1N)(SEQ ID NO:48), A/Solomon Islands/3/2006(H1N1)(SEQ ID NO:49) 및 SEQ ID NO:9. X1(위치 3)은 A 또는 V; X2(위치 52)는 D 또는 N; X3(위치 90)은 K 또는 R; X4(위치 99)는 K 또는 T; X5(위치 111)는 Y 또는 H; X6(위치 145)은 V 또는 T; X7(위치 154)은 E 또는 K; X8(위치 161)은 R 또는 K; X9(위치 181)는 V 또는 A; X1O(위치 203)은 D 또는 N; X11(위치 205)은 R 또는 K; X12(위치 210)는 T 또는 K; X13(위치 225)은 R 또는 K; X14(위치 268)는 W 또는 R; X15(위치 283)는 T 또는 N; X16(위치 290)은 E 또는 K; X17(위치 432)은 I 또는 L; X18(위치 489)은 N 또는 D이다.

이러한 변이의 또 다른 예로서, A/New Caledonia/20/99(H1N)(SEQ ID NO:33에 의해 암호화), A/Brisbane/59/2007(H1N1)(SEQ ID NO:48), A/Solomon Islands/3/ 2006(H1N1)(SEQ ID NO:49), A/ PuertoRico/8/34(H1N1) 및 SEQ ID NO:9의 HA에 대한 서열 정렬 및 컨센서스 서열이 아래 표 3에 제시된다.

컨센서스 서열에서 대문자는 지정된 위치에 있는 모든 서열에 공통된 아미노산을 나타내고, 소문자는 적어도 절반의 서열 또는 대부분의 서열에 공통된 아미노산을 나타낸다. 기호 !는 I 또는 V 중 어느 하나이고, 기호 $는 L 또는 M 중 어느 하나이고, 기호 %는 F 또는 Y 중 어느 하나이고, 기호 #는 N, D, Q, E, B 또는 Z 중 어느 하나이고, 기호 "."는 아미노산이 없는 것이다(예를 들어, 결실). 위치 3의 X는 A 또는 V 중 어느 하나이고, 위치 52의 X는 E 또는 N 중 어느 하나이고, 위치 90의 X는 K 또는 R이고, 위치 99의 X는 T 또는 K이고, 위치 111의 X는 Y 또는 H 중 어느 하나이고, 위치 145의 X는 V 또는 T 중 어느 하나이고, 위치 157의 X는 K 또는 E이고, 위치 162의 X는 R 또는 K이고, 위치 182의 X는 V 또는 A이고, 위치 203의 X는 N 또는 D이고, 위치 205의 X는 R 또는 K이고, 위치 210의 X는 T 또는 K이고, 위치 225의 X는 K 또는 Y이고, 위치 333의 X는 H 또는 결실이고, 위치 433의 X는 I 또는 L이고, 위치 49)의 X는 N 또는 D이다.

이러한 변이의 또 다른 예로서, A/Anhui/1/2005(H5N1)(SEQ ID NO:55), A/ Vietnam/1194/2004(H5N1) 및 A/Indonesia/5/2006(H5N1)(SEQ ID NO:10)의 HA에 대한 서열 정렬 및 컨센서스 서열이 아래 표 4에 제시된다.

컨센서스 서열에서 대문자는 지정된 위치에 있는 모든 서열에 공통된 아미노산을 나타내고, 소문자는 적어도 절반의 서열 또는 대부분의 서열에 공통된 아미노산을 나타낸다. 기호 !는 I 또는 V 중 어느 하나이고, 기호 $는 L 또는 M 중 어느 하나이고, 기호 %는 F 또는 Y 중 어느 하나이고, 기호 #는 N, D, Q, E, B 또는 Z 중 어느 하나이다. 위치 102의 X는 T, V 또는 A 중 어느 것이고, 위치 110의 X는 S, D 또는 N 중 어느 것이고, 위치 156의 X는 S, K 또는 T 중 어느 것이다.

상기 예시되고 설명된 정렬 및 컨센서스 서열은 식물에서 VLP의 생산을 위해 본 발명의 다양한 구체예에서 사용될 수 있는 헤마글루티닌 아미노산 서열에 존재하는 변이들의 비제한적 예들이다.

아미노산 서열을 암호화하는 핵산은 각 아미노산에 대한 코돈이 본 분야에 알려져 있으므로 쉽게 결정될 수 있다. 따라서, 아미노산 서열이 제공되면 그것을 암호화하는 축퇴 핵산 서열을 알 수 있다. 따라서, 본 발명은 본원에 개시된 인플루엔자 균주 및 서브타입(예를 들어, A/California/04/09(H1N1), A/New Caledonia /20/99(H1N1), A/Indonesia/5/2006(H5N1), A/chicken/New York/1995, A/herring gull/DE/677/88(H2N8), A/Texas/32/2003, A/mallard/MN/33/00, A/duck/Shanghai/1/ 2000, A/northem pintail/TX/828189/02, A/Turkey/Ontario/6118/68(H8N4), A/ shoveler/Iran/G54/03, A/chicken/Germany/N/1949(H10N7), A/duck/England/56(H11 N6), A/duck/Alberta/60/76(H12N5), A/Gull/Maryland/704/77(H13N6), A/Mallard/ Gurjev/263/82, A/duck/Australia/341/83(H15N8), A/black-headed gull/Sweden/5/ 99(H16N3), C/Johannesburg/66, B/Lee/40, A/PuertoRico/8/34(H1N1), A/Brisbane/ 59/2007(H1N1), A/Solomon Islands 3/2006(H1N1), A/Brisbane10/2007(H3N2), A/ Wisconsin/67/2005(H3N2), B/Malaysia/2506/2004, B/Florida/4/2006, A/Singapore /1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong /W312/97(H6N1), A/Equine/Prague/56(H7N7), A/HongKong/1073/99(H9N2))의 헤마글루티닌을 암호화하는 핵산 서열과 상기 헤마글루티닌을 암호화하는 축퇴 서열을 제공한다.

핵산에 의해 암호화된 아미노산 서열도 각 아미노산에 대한 코돈 또는 코돈들이 알려져 있으므로 쉽게 결정될 수 있다. 따라서, 핵산이 제공되면 그것에 의해 암호화된 아미노산 서열을 알 수 있다. 따라서, 본 발명은 본원에 개시된 인플루엔자 균주 및 서브타입의 헤마글루티닌의 아미노산 서열을 제공한다(예를 들어, A/California/04/09(H1N1), A/New Caledonia/20/99(H1N1), A/Indonesia/5/2006(H5 N1), A/chicken/New York/1995, A/herring gull/DE/677/88(H2N8), A/Texas/32/ 2003, A/mallard/MN/33/00, A/duck/Shanghai/1/2000, A/northern pintail/TX/ 828189/02, A/Turkey/Ontario/6118/68(H8N4), A/shoveler/Iran/G54/03, A/chicken/ Germany/N/1949(H10N7), A/duck/England/56(H11N6), A/duck/Alberta/60/76(H12N5), A/Gull/Maryland/7O4/77(H13N6), A/Mallard/Gurjev/263/82, A/duck/Australia/341/ 83(H15N8), A/black-headed gull/Sweden/5/99(H16N3), B/Lee/40, C/Johannesburg /66, A/PuertoRico/8/34(H1N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands 3/2006(H1N1), A/Brisbane 10/2007(H3N2), A/Wisconsin/67/2005(H3N2), B/Malaysia /2506/2004, B/Florida/4/2006, A/Singapore/1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/1194/2004(H5N1), A/Teal/HongKong/W312/97(H6N1), A/Equine/Prague/56 (H7N7), A/Hong Kong/1073/99(H9N2)).

식물에서 인플루엔자 VLP는 원형질막(실시예 5 및 도 19 참조)으로부터 발아하며, 따라서 VLP의 지질 조성은 그것의 기원을 반영한다. 본 발명에 따라서 생산된 VLP는 식물 유래 지질과 복합체를 이룬 하나 이상의 인플루엔자 타입 또는 서브타입의 HA를 포함한다. 식물 지질은 특정 면역세포를 자극하여 유도된 면역반응을 증진시킬 수 있다. 식물의 막은 지질, 포스파티딜콜린(PC) 및 포스파티딜에탄올아민(PE)로 이루어지며, 또한 글리코스핑고지질, 사포닌 및 피토스테롤을 함유한다. 추가로, 식물 원형질막에서는 지질 라프트가 또한 발견된다 - 이러한 미세 도메인은 스핑고지질 및 스테롤이 풍부하다. 식물에서는 여러 가지의 피토스테롤이 발생한다고 알려져 있으며, 이것은 스티그마스테롤, 시토스테롤, 24-메틸콜레스테롤 및 콜레스테롤을 포함한다(Mongrand et al., 2004).

PC 및 PE뿐만 아니라 글리코스핑고지질도 수지상세포 및 대식세포와 같은 항원-제시 세포(APC) 및 흉선과 간에 존재하는 B 및 T 림프구를 포함하는 다른 세포들과 마찬가지로 포유류 면역세포에 의해서 발현되는 CD1 분자와 결합할 수 있다 (Tsuji M., 2006). CD1 분자는 제I류에 속하는 주요 조직적합성 복합체(MHC) 분자와 구조적으로 유사하며, 이들의 역할은 NKT 세포(자연살상 T 세포)에 대한 당지질 항원을 제시하는 것이다. 활성화되면 NKT 세포는 NK 세포 및 수지상세포와 같은 선천적 면역세포를 활성화하며, 또 항체-생산 B 세포 및 T 세포 같은 후천적 면역세포도 활성화한다.

여러 가지 피토스테롤이 원형질막에서 발견될 수 있다 - 특정 보체는 몇 가지 요인으로 말하자면 종, 성장 조건, 영양물 기원 또는 병원성 상태에 따라서 다양할 수 있다. 일반적으로 베타-시토스테롤이 가장 풍부한 피토스테롤이다.

원형질막 유래 외피와 같은 지질 이중층과 복합체를 이룬 인플루엔자 VLP에 존재하는 피토스테롤은 유리한 백신 조성물을 제공할 수 있다. 이론과 결부시키고 싶지는 않지만, 원형질막 유래 외피와 같은 지질 이중층과 복합체를 이룬 식물-제조 VLP는 다른 발현 시스템에서 제조된 VLP보다 더 강한 면역반응을 유도할 수 있으며, 생 바이러스 백신 또는 감독된 전 바이러스 백신에 의해 유도되는 면역반응과 유사할 수 있다.

따라서, 어떤 구체예에서, 본 발명은 식물-유래 지질 이중층과 복합체를 이룬 VLP를 제공한다. 어떤 구체예에서, 식물-유래 지질 이중층은 VLP의 외피를 포함할 수 있다.

식물에서 생산된 VLP는 식물-특이적 N-글리칸을 포함하는 HA를 포함할 수 있다. 따라서, 본 발명은 또한 식물-특이적 N-글리칸을 갖는 HA를 포함하는 VLP를 제공한다.

더욱이, 식물에서의 N-글리칸의 변형이 공지되어 있으며(예를 들어, 본원에 참고자료로 포함되는 U.S. 60/944,344 참조), 변형된 N-글리칸을 갖는 HA도 생산될 수 있다. 글리코실화 패턴이 변형된, 예를 들어 푸코실화가 감소되거나, 자일로실화가 감소되거나, 또는 푸코실화와 자일로실화가 모두 감소된 N-글리칸을 포함하는 HA가 얻어지거나, 또는 단백질이 푸코실화, 자일로실화 또는 둘 다를 결여하고 증가된 갈락토실화를 포함하도록 글리코실화 패턴이 변형된 HA가 얻어질 수 있다. 더욱이, 번역-후 변형의 조정, 예를 들어 말단 갈락토오스의 부가에 의해 HA를 발현하는 야생형 식물과 비교하여 발현된 HA의 푸코실화 및 자일로실화가 감소할 수 있다.

제한되는 것은 아니지만, 예를 들어 글리코실화 패턴이 변형된 HA의 합성은 베타-1,4-갈락토실트랜스페라제(GalT), 제한되는 것은 아니지만, 예를 들어 포유류 GalT, 또는 인간 GalT를 암호화하는 뉴클레오티드 서열과 함께 관심의 단백질을 공-발현시킴으로써 달성될 수 있으며, 다른 출처로부터의 GalT도 사용될 수 있다. 또한, GalT의 촉매 도메인을 N-아세틸글루코사미닐트랜스페라제(GNT1)의 CTS 도메인(즉, 세포질 꼬리, 막통과 도메인, 줄기 영역)과 융합시켜 GNT1-GalT 하이브리드 효소를 생산할 수 있으며, 이 하이브리드 효소가 HA와 공-발현될 수 있다. 또한, HA는 N-아세틸글루코사미닐트랜스페라제 III(GnT-III), 제한되는 것은 아니지만, 예를 들어 포유류 GnT-III 또는 인간 GnT-III를 암호화하는 뉴클레오티드 서열과 함께 공-발현될 수 있으며, 다른 출처로부터의 GnT-III도 사용될 수 있다. 추가하여, GnT-III과 융합된 GNT1의 CTS를 포함하는 GNT1-GnT-III 하이브리드 효소가 또한 사용될 수 있다.

따라서, 본 발명은 또한 변형된 N-글리칸을 갖는 HA를 포함하는 VLP를 포함한다.

이론과 결부시키고 싶지는 않지만, HA 상에 식물 N-글리칸의 존재는 항원-제시 세포에 의한 HA의 결합을 촉진함으로써 면역반응을 자극할 수 있다. 식물 N-글리칸을 사용한 면역반응의 자극은 Saint-jore-Dupas 등(2007)에 의해 제안되었다. 더욱이, VLP의 입체형태가 항원의 제시에 유리할 수 있으며, 식물 유래 지질 층과 복합체를 이루었을 때 VLP의 애쥬번트 효과가 증진될 수 있다.

"조절 영역", "조절 요소" 또는 "프로모터"는 항상 그런 것은 아니지만 전형적으로 유전자의 단백질 코딩 영역의 상류에 있는 핵산의 일부분을 의미하며, 이것은 DNA 또는 RNA, 또는 DNA와 RNA로 이루질 수 있다. 조절 영역이 활성이고, 관심의 유전자와 작동 가능하게 결합되거나, 또는 작동 가능하게 연결된 경우, 이것은 관심의 유전자의 발현을 가져올 수 있다. 조절 요소는 기관 특이성을 매개하거나, 또는 발생적 또는 시간적 유전자 활성화를 제어할 수 있다. "조절 영역"은 프로모터 요소, 기본적 프로모터 활성을 나타내는 코어 프로모터 요소, 외부 자극에 대한 반응으로서 유도될 수 있는 요소, 음성 조절 요소와 같은 프로모터 활성을 매개하는 요소 또는 전사 인핸서를 포함한다. 또한, "조절 영역"은 본원에서 사용되었을 때 전사 후 활성인 요소, 예를 들어 번역 및 전사 인핸서, 번역 및 전사 리프레서, 상류 활성화 서열, 및 mRNA 불안정성 결정소와 같은 유전자 발현을 조정하는 조절 요소를 포함한다. 이러한 후자의 요소들 중 몇 개는 코딩 영역 근처에 위치될 수 있다.

본 명세서의 맥락에서, 전형적으로 용어 "조절 요소" 또는 "조절 영역"은 항상 그런 것은 아니지만 일반적으로 구조 유전자의 코딩 서열에 대해 상류(5')에 있는 DNA의 서열을 말하며, 이것은 RNA 폴리머라제 및/또는 특정 부위에서 전사가 시작되는데 필요한 다른 인자들에 대한 인식을 제공함으로써 코딩 영역의 발현을 제어한다. 그러나, 서열의 인트론 내에, 또는 서열의 3'에 위치한 다른 뉴클레오티드 서열도 관심의 코딩 영역의 발현의 조절에 기여할 수 있다. RNA 폴리머라제 또는 다른 전사 인자들에 대한 인식을 제공함으로써 특정 부위에서의 개시를 보장하는 조절 요소의 예는 프로모터 요소이다. 전부 그런 것은 아니지만 대부분의 진핵 프로모터 요소는 일반적으로 전사 시작 부위에서 대략 25개 염기쌍 상류에 위치한 아데노신과 티미딘 뉴클레오티드 염기쌍으로 이루어진 보존성 핵산 서열인 TATA 상자를 함유한다. 프로모터 요소는 전사의 개시를 책임진 기본적 프로모터 요소뿐만 아니라, 유전자 발현을 변형하는 다른 조절 요소들(상기 열거된)도 포함한다.

발생적으로 조절되는, 유도성 또는 구성성인 것들을 포함하여, 몇 가지 타입의 조절 영역이 있다. 발생적으로 조절되거나, 또는 조절 영역의 제어하에 유전자의 차등 발현을 제어하는 조절 영역은 해당 기관 또는 조직의 발생 도중의 특정 시기에 어떤 기관 또는 기관의 조직에서 활성화된다. 그러나, 발생적으로 조절되는 일부 조절 영역은 특정 발생 단계에서 어떤 기관 또는 조직에서 우선적으로 활성화될 수 있으며, 이들 역시 발생학적으로 조절되는 방식으로 활성화되거나, 또는 식물의 다른 기관 또는 조직에서도 기본적 수준으로는 활성화될 수 있다. 조직-특이적 조절 영역, 예를 들어 종자-특이적 조절 영역의 예는 나핀 프로모터, 및 크루시페린 프로모터를 포함한다(Rask et al., 1998, J. Plant Physiol. 152: 595-599; Bilodeau et al., 1994, Plant Cell 14: 125-130). 잎-특이적 프로모터의 예는 플라스토시아닌 프로모터를 포함한다(도 1b; US 7,125,978, 본원에 참고자료로 포함된다).

유도성 조절 영역은 유도제에 반응하여 하나 이상의 DNA 서열 또는 유전자의 전사를 직접 또는 간접적으로 활성화할 수 있는 것이다. 유도제가 없으면 DNA 서열 또는 유전자는 전사되지 않을 것이다. 전형적으로 유도성 조절 영역과 특이적으로 결합하여 전사를 활성화하는 단백질 인자는 비활성화 형태로 존재할 수 있으며, 이것이 이후 유도제에 의해 활성 형태로 직접 또는 간접적으로 전환된다. 그러나, 단백질 인자는 없을 수도 있다. 유도체는 단백질, 대사산물, 성장 조절제, 제초제 또는 페놀계 화합물과 같은 화학제제 또는 가열, 냉각, 염, 또는 독성 원소에 의해 직접적으로, 또는 바이러스와 같은 병원체 또는 질환 인자의 작용을 통해 간접적으로 부여되는 생리학적 스트레스일 수 있다. 유도성 조절 영역을 함유하는 식물 세포는 분무, 물주기, 가열 또는 유사한 방법에 의해 세포 또는 식물에 유도체를 외부적으로 적용함으로써 유도제에 노출될 수 있다. 유도성 조절 요소는 식물 또는 비-식물 유전자로부터 유래될 수 있다(예를 들어, 본원에 참고자료로 포함되는 Gatz, C. and Lenk, I.R.P., 1998, Trends Plant Sci. 3, 352-358 참조). 잠재적인 유도성 프로모터의 예는, 제한되는 것은 아니지만, 테트라시클린-유도성 프로모터(Gatz, C., 1997, Ann. Rev. Plant Physiol. Plant Mol. Biol. 48, 89-108; 본원에 참고자료로 포함된다), 스테로이드 유도성 프로모터(Aoyama, T. and Chua, N.H., 1997, Plant J. 2, 397-404; 본원에 참고자료로 포함된다) 및 에탄올-유도성 프로모터(Salter, M.G., et al, 1998, Plant Journal 16, 127-132; Caddick, M.X., et al, 1998, Nature Biotech. 16, 177-180, 본원에 참고자료로 포함된다), 사이토키닌 유도성 IB6 및 CKI1 유전자(Brandstatter, I. and Kieber, J.J., 1998, Plant Cell 10, 1009-1019; Kakimoto, T., 1996, Science 274, 982-985; 본원에 참고자료로 포함된다) 및 아우신 유도성 요소 DR5(Ulmasov, T., et al., 1997, Plant Cell 9, 1963-1971; 본원에 참고자료로 포함된다)를 포함한다.

구성성 조절 영역은 식물의 발생 도중에 계속해서 식물의 여러 부분을 아울러서 유전자의 발현을 지시한다. 공지된 구성성 조절 요소의 예는 CaMV 35S 전사체(Odell et al., 1985, Nature, 313:810-812), 쌀 액틴 1(Zhang et al., 1991, Plant Cell, 3:1155-1165), 액틴 2(An et al., 1996, Plant J., 10:107-121), 또는 tms 2(본원에 참고자료로 포함된 U.S. 5,428,147), 및 트리오스포스페이트 이소머라제 1(Xu et al., 1994, Plant Physiol. 106:459-467) 유전자, 옥수수 유비퀴틴 1 유전자(Cornejo et al., 1993, Plant Mol. Biol. 29:637-646), Arabidopsis 유비퀴틴 1 및 6 유전자(Holtorf et al., 1995, Plant Mol. Biol. 29:637-646), 및 담배 번역 개시 인자 4A 유전자(Mandel et al., 1995, Plant Mol. Biol. 29:995-1004)와 관련된 프로모터를 포함한다. 용어 "구성성"은 본원에서 사용되었을 때 구성성 조절 영역의 제어하에 유전자가 모든 세포 타입에서 동일한 수준으로 발현된다는 것을 반드시 의미하지는 않으며, 유전자는 광범한 세포 타입에서 발현되기는 하지만 대체로 변이도 풍부하게 관찰된다. 구성성 조절 요소는 이들이 작동 가능하게 연결되는 뉴클레오티드 서열의 전사 및/또는 번역을 더욱 증진시키기 위해서 다른 서열과 결합될 수 있다. 예를 들어, CMPV-HT 시스템(Sainsbury et al, 2008, Plant Physiology 148:1212-1218)이 동부 모자이크병 바이러스(COMV)의 미번역 영역으로부터 유래되며, 관련된 코딩 서열의 번역을 증진시켰다는 것이 증명되었다.

"자생"은 핵산 또는 아미노산 서열이 자연 발생, 또는 " 야생형"임을 의미한다.

"작동 가능하게 연결된"은 특정 서열, 예를 들어 조절 요소 및 관심의 코딩 영역이 직접 또는 간접적으로 상호작용하여 유전자 발현의 매개 또는 조정과 같은 의도된 기능을 수행한다는 것을 의미한다. 작동 가능하게 연결된 서열들의 상호작용은, 예를 들어 작동 가능하게 연결된 서열들과 상호작용하는 단백질에 의해 매개될 수 있다.

본 발명의 하나 이상의 뉴클레오티드 서열은 본 발명의 뉴클레오티드 서열, 또는 구성물, 또는 벡터에 의해 형질전환된 어떤 적합한 식물 숙주에서 발현될 수 있다. 적합한 숙주의 예는, 제한되는 것은 아니지만, 자주개자리, 캐놀라, 옥수수, Brassica 종, Nicotiana 종, 자주개자리, 감자, 인삼, 완두콩, 귀리, 쌀, 대두, 밀, 보리, 해바라기, 목화 등을 포함하는 농작물을 포함한다.

본 발명의 하나 이상의 키메라 유전자 구성물은 3' 미번역 영역을 더 포함할 수 있다. 3' 미번역 영역은 폴리아데닐화 신호 및 mRNA 프로세싱 또는 유전자 발현을 행할 수 있는 어떤 다른 조절 신호를 함유하는 DNA 세그먼트를 포함하는 유전자의 일부분을 말한다. 폴리아데닐화 신호는 일반적으로 mRNA 전구물질의 3' 단부에 폴리아데닐산 트랙의 부가를 행하는 것을 특징으로 한다. 폴리아데닐화 신호는 통상 정규 형태인 5'-AATAAA-3'에 대한 상동체의 존재에 의해 인식되며, 변이도 드물지는 않다. 또한, 본 발명의 키메라 유전자 구성물 중 하나 이상은 필요에 따라서 번역 인핸서든 전사 인핸서든 인핸서를 더 포함할 수 있다. 이러한 인핸서 영역은 당업자에게 잘 알려져 있으며, ATG 개시 코돈과 인접 서열을 포함할 수 있다. 개시 코돈은 코딩 서열의 리딩 프레임과 동일 위상이어야 하며, 그래야 전체 서열의 번역이 보장된다.

적합한 3' 영역의 비제한적 예는 아그로박테리움 종양 유도(Ti) 플라스미드 유전자, 예를 들어 노팔린 신타제(Nos 유전자) 및 식물 유전자, 예를 들어 대두 저장 단백질 유전자, 리불로오스-1,5-비스포스페이트 카르복실라제(ssRUBISCO; US 4,962,028; 본원에 참고자료로 포함된다) 유전자의 작은 서브유닛, 플라스토시아닌 발현을 조절하는데 사용되는 프로모터(Pwee and Gray 1993; 본원에 참고자료로 포함된다)의 폴리아데닐화 신호를 함유하는 3'-전사된 미번역 영역이다. 플라스토시아닌 프로모터의 예는 US 7,125,978(본원에 참고자료로 포함된다)에 설명된다.

본원에 설명된 대로, 잎 발현에서 효능이 증명된 인핸서 서열을 포함하는 프로모터가 일시 발현에 효과적인 것으로 판명되었다. 이론과 결부시키고 싶지는 않지만, 핵 바탕질에의 부착에 의한 광합성 유전자의 상류 조절 요소의 부착이 강한 발현을 매개할 수 있다. 예를 들어, 완두콩 플라스토시아닌 유전자의 번역 시작 부위로부터 -784까지를 사용하여 강한 리포터 유전자 발현을 매개할 수 있다.

형질전환된 식물 세포의 확인을 돕기 위해서 본 발명의 구성물은 식물 선택성 마커를 포함하도록 더 조작될 수 있다. 유용한 선택성 마커는 항생제, 예를 들어 젠타마이신, 히그로마이신, 카나마이신, 또는 제초제, 예를 들어 포스피노트리신, 글리포세이트, 클로로술푸론 등과 같은 화학물질에 대한 내성을 제공하는 효소를 포함한다. 유사하게, GUS(베타-글루쿠로니다제), 또는 루시페라제나 GFP 등의 발광물질과 같은 색 변화에 의해 확인가능한 화합물의 생산을 제공하는 효소가 사용될 수 있다.

또, 본 발명의 키메라 유전자 구성물을 함유하는 트랜스제닉 식물, 식물 세포 또는 종자가 본 발명의 일부로서 고려된다. 또한, 식물 세포로부터 전체 식물을 재생하는 방법도 본 분야에 공지되어 있다. 일반적으로 형질전환된 식물 세포를 항생제와 같은 선택제를 함유할 수 있는 적합한 배지에서 배양하며, 이 경우 선택성 마커를 사용하여 형질전환된 식물 세포의 확인을 용이하게 한다. 일단 유합조직이 형성되면, 공지된 방법에 따라서 적합한 식물 호르몬을 사용하여 신초 형성을 촉진한 다음, 신초를 식물 재생용 발근 배지로 옮긴다. 다음에, 이 식물을 사용하여 종자로부터나 아니면 식물 증식기술을 사용해서 반복하여 세대를 확립할 수 있다. 또한, 트랜스제닉 식물은 조직 배양을 사용하지 않고도 생성될 수 있다.

또한, 본 발명에 따라서, VLP 생산을 위한 재조합 HA0를 암호화하는 핵산을 포함하는 키메라 유전자 구성물을 함유하는 트랜스제닉 식물, 나무, 효모, 박테리아, 진균, 곤충 및 동물 세포가 본 발명의 일부분으로 고려된다.

또한, 본 발명의 조절 요소는 형질전환, 또는 일시 발현을 행할 수 있는 일련의 숙주 생물에서의 발현에 알맞은 관심의 코딩 영역과 조합될 수 있다. 이러한 생물은, 제한되는 것은 아니지만, 외떡잎식물과 쌍떡잎식물을 모두 포함하며, 제한되는 것은 아니지만, 예를 들어 옥수수, 곡식, 밀, 보리, 귀리, Nicotiana 종, Brassica 종, Arabidopsis, 대두, 콩, 완두콩, 자주개자리, 감자, 토마토, 및 인삼을 포함한다.

이들 유기물의 안정한 형질전환, 및 재생 방법은 본 분야에 정립되어 있으며 당업자에게 잘 알려져 있다. 형질전환되고 재생된 식물을 획득하는 방법은 본 발명에서 중요하지 않다.

"형질전환"은 유전형적으로, 표현형적으로 또는 양쪽 모두의 분명한 유전자 정보(뉴클레오티드 서열)의 안정한 종간 전달을 의미한다. 키메라 구성물로부터의 유전자 정보가 숙주로 종간 전달되는 것은 유전일 수 있고, 유전자 정보의 전달은 안정하다고 간주되며, 또는 전달은 일시적일 수 있고, 유전자 정보의 전달은 유전이 아니다.

용어 "식물 물질"은 식물로부터 유래된 어떤 재료를 의미한다. 식물 물질은 전체 식물, 조직, 세포, 또는 이들의 어떤 단편을 포함할 수 있다. 또한, 식물 물질은 세포내 식물 성분, 세포외 식물 성분, 식물의 액체 또는 고체 추출물 또는 이들의 조합을 포함할 수 있다. 또한, 식물 물질은 식물 잎, 줄기, 열매, 뿌리 또는 이들의 조합으로부터의 식물, 식물 세포, 조직, 액체 추출물 또는 이들의 조합을 포함할 수 있다. 식물 물질은 어떤 가공 단계를 거치지 않는 식물 또는 식물의 일부분을 포함할 수 있다. 식물의 일부가 식물 물질을 포함할 수 있다. 그러나, 식물 구성물질은 아래 정의된 최소한의 가공 단계, 또는 더 엄격한 가공을 거칠 수도 있다는 것이 또한 고려되며, 이것은 제한되는 것은 아니지만, 크로마토그래피, 전기영동 등을 포함하는 본 분야에 일반적으로 알려진 기술을 사용한 부분적 또는 실질적 단백질 정제를 포함한다.

용어 "최소 가공"은 식물 물질, 예를 들어 관심의 단백질을 포함하는 식물 또는 식물의 일부를 부분적으로 정제하여 식물 추출물, 균질물, 식물 균질물의 단편 등을 수득하는 것을 의미한다(즉, 최소한으로 가공). 부분적 정제는, 제한되는 것은 아니지만, 식물 세포의 구조를 파괴함으로써 가용성 식물 성분, 및 불용성 식물 성분을 포함하는 조성물을 만드는 것을 포함할 수 있으며, 불용성 식물 성분은, 제한되는 것은 아니지만, 예를 들어 원심분리, 여과 또는 이들의 조합에 의해 분리될 수 있다. 이와 관련하여, 잎이나 다른 조직의 세포외 공간 내에 분비된 단백질이 진공 또는 원심분리 추출을 사용하여 쉽게 획득될 수 있거나, 또는 롤러를 통해 통과시키거나 분쇄함으로써 가압하에 조직을 추출하여 세포외 공간 내로부터 자유 단백질을 압착하거나 유리시킬 수 있다. 또, 최소 가공은 가용성 단백질의 조 추출물의 제조를 수반할 수 있는데, 이들 제조에서 부수적인 식물 산물로부터의 오염은 무시할 만하다. 더욱이, 최소 가공은 잎으로부터 가용성 단백질을 수성 추출한 후 어떤 적합한 염으로 침전시키는 것을 포함할 수 있다. 다른 방법은 대규모 침출과 즙 추출을 포함할 수 있으며, 이 추출물은 직접 사용할 수 있다.

식물 구성물질 또는 조직 형태의 식물 물질은 피험체에게 경구 송달될 수 있다. 식물 물질은 다른 음식과 함께 식이보충제의 일부로서, 또는 캡슐화되어 투여될 수 있다. 또한, 식물 물질 또는 조직은 식감을 개선하거나 증가시키기 위해 농축되거나, 또는 필요에 따라 다른 재료, 성분 또는 제약학적 부형제와 함께 제공될 수 있다.

본 발명의 VLP가 투여될 수 있는 피험체나 표적 생물의 예는, 제한되는 것은 아니지만, 인간, 영장류, 새, 물새, 철새, 메추라기, 오리, 거위, 가금류, 닭, 돼지, 양, 말과, 말, 낙타, 개과, 개, 고양이과, 고양이, 호랑이, 표범, 사향고양이, 밍크, 흰가슴담비, 흰족제비, 애완동물, 가축, 토끼, 생쥐, 래트, 기니아피그 또는 다른 설치류, 바다표범, 고래 등을 포함한다. 이러한 표적 생물은 예시이며 본 발명의 적용 및 용도를 제한하는 것으로 간주되지 않는다.

관심의 단백질을 포함하거나, 또는 관심의 단백질을 포함하는 VLP를 발현하는 식물은 필요와 상황에 따라서 다양한 방식으로 피험체 또는 표적 생물에 투여될 수 있다. 예를 들어, 식물로부터 획득된 관심의 단백질은 사용하기 전에 조 형태, 부분 정제된 형태, 또는 정제된 형태로 추출될 수 있다. 단백질이 정제된다면, 그것은 식용이나 비식용 식물에서 생산될 수 있다. 또한, 단백질이 경구 투여될 경우, 식물 조직을 수거하여 피험체에게 직접 공급하거나, 또는 공급 전에 수거된 조직을 건조하거나, 또는 수거하지 않고 동물로 하여금 식물을 뜯어먹도록 할 수 있다. 또한, 수거된 식물 조직을 동물 사료의 식품보충제로서 제공하는 것이 본 발명의 범위로 고려된다. 거의 또는 전혀 더 가공하지 않고 식물 조직을 동물에 공급하는 경우, 투여되는 식물 조직은 식용인 것이 바람직하다.

전사-후 유전자 침묵화(PTGS)가 식물에서 트랜스젠의 발현을 제한하는데 관련될 수 있으며, 감자 바이러스 Y(HcPro)로부터 침묵화 억제인자를 공-발현시킴으로써 트랜스젠 mRNA의 특이적 변성을 상쇄할 수 있다(Brigneti et al., 1998). 다른 침묵화 억제인자들도 본 분야에 잘 공지되어 있고, 본원에 설명된 대로 사용될 수 있으며(Chiba et al., 2006, Virology 346:7-14; 본원에 참고자료로 포함된다), 제한되는 것은 아니지만, 예를 들어 TEV-p1/HC-Pro(담배식각 바이러스-p1/HC-Pro), BYV-p21, 토마토 덤불위축 바이러스 p19(TBSV p19), 토마토 축엽 바이러스 캡시드 단백질(TCV-CP), 오이 모자이크 바이러스 2b(CMV-2b), 감자 바이러스 X p25(PVX-p25), 감자 바이러스 M p11(PVM-p11), 감자 바이러스 S p11(PVS-p11), 블루베리 스코치 바이러스 p16(BScV-p16), 감귤 트리스테자 바이러스 p23(CTV-p23), 포도나무 잎말림-관련 바이러스-2 p24(GLRaV-2 p24), 포도나무 바이러스 A p10(GVA-p1O), 포도나무 바이러스 B p14(GVB-p14), 어수리 잠복 바이러스 p10(HLV-p1O), 또는 마늘 공통 잠복 바이러스 p16(GCLV-p16)을 포함한다. 따라서, 침묵화 억제인자, 제한되는 것은 아니지만, 예를 들어 HcPro, TEV-p1/HC-Pro, BYV-p21, TBSV p29, TCV-CP, CMV-2b, PVX-p25, PVM-p11, PVS-p11, BScV-p16, CTV-p23, GLRaV-2 p24, GBV-p14, HLV-p1O, GCLV-p16 또는 GVA-p1O이 관심의 단백질을 암호화하는 핵산 서열과 함께 공발현될 수 있으며, 이로써 식물에서 높은 수준의 단백질 생산이 보장된다.

더욱이, HA 서브타입의 조합을 포함하는 VLP가 생산될 수 있다. 예를 들어, VLP는 서브타입 H1, H2, H3, H4, H5, H6, H7, H8, H9, H10, H11, H12, H13, H14, H15, H16, 타입 B 또는 이들의 조합으로부터 하나 이상의 HA를 포함할 수 있다. HA의 조합의 선택은 VLP로부터 제조된 백신의 의도된 용도에 의해 결정될 수 있다. 예를 들어, 새에 접종하기 위한 백신은 HA 서브타입의 어떤 조합이라도 포함할 수 있지만, 사람을 접종하는데 유용한 VLP는 서브타입 H1, H2, H3, H5, H6, H7, H9 또는 B 중 하나 이상의 서브타입을 포함할 수 있다. 그러나, VLP의 용도에 따라서 다른 HA 서브타입 조합도 제조될 수 있다. HA 서브타입의 조합을 포함하는 VLP를 생산하기 위해서 원하는 HA 서브타입이 동일한 세포, 예를 들어 식물 세포에서 공-발현될 수 있다.

더욱이, 본원에 설명된 대로 생산된 VLP는 뉴라미니다제(NA)를 포함하지 않는다. 그러나, HA와 NA를 포함하는 VLP가 바람직하다면 NA가 HA와 함께 공-발현될 수 있다.

따라서, 본 발명은 안정한 또는 일시적 발현 시스템과 함께 사용하기 적합한 키메라 구성물을 포함하는 적합한 벡터를 더 포함한다. 또한, 하나 이상의 구성물에는 유전자 정보가 제공될 수 있다. 예를 들어, 관심의 단백질을 암호화하는 뉴클레오티드 서열이 한 구성물에 도입될 수 있고, 관심의 단백질의 글리코실화를 변형하는 단백질을 암호화하는 제 2 뉴클레오티드 서열이 별도의 구성물을 사용하여 도입될 수 있다. 다음에, 이들 뉴클레오티드 서열이 식물에서 공-발현될 수 있다. 그러나, 관심의 단백질과 관심의 단백질의 글리코실화 프로파일을 변형하는 단백질을 둘 다 암호화하는 뉴클레오티드 서열을 포함하는 구성물도 사용될 수 있다. 이 경우, 뉴클레오티드 서열은 프로모터 또는 조절 영역에 작동 가능하게 연결된 관심의 단백질을 암호화하는 제 1 핵산 서열을 포함하는 제 1 서열, 및 프로모터 또는 조절 영역에 작동 가능하게 연결된 관심의 단백질의 글리코실화 프로파일을 변형하는 단백질을 암호화하는 제 2 핵산 서열을 포함하는 제 2 서열을 포함할 것이다.

"공-발현"은 2 이상의 뉴클레오티드 서열이 식물, 및 식물의 동일한 조직에서 대략 동시에 발현되는 것을 의미한다. 그러나, 뉴클레오티드 서열들이 정확히 동시에 발현될 필요는 없다. 오히려 2 이상의 뉴클레오티드 서열은 암호화된 산물들이 상호작용할 기회를 가질 수 있는 방식으로 발현된다. 예를 들어, 관심의 단백질이 발현되는 시기 전에 또는 도중에 관심의 단백질의 글리코실화를 변형하는 단백질을 발현시킴으로써 관심의 단백질의 글리코실화의 변형이 일어날 수 있다. 2 이상의 뉴클레오티드 서열은 일시 발현 시스템을 사용하여 공-발현될 수 있고, 이 경우 2 이상의 서열은 두 서열이 모두 발현되는 조건하에 대략 동시에 식물에 도입된다. 대안으로서, 뉴클레오티드 서열 중 하나, 예를 들어 관심의 단백질의 글리코실화 프로파일을 변형하는 단백질을 암호화하는 서열을 포함하는 플랫폼 식물이 관심의 단백질을 암호화하는 추가 서열과 함께 일시적으로 또는 안정한 방식으로 형질전환될 수 있다. 이 경우, 관심의 단백질의 글리코실화 프로파일을 변형하는 단백질을 암호화하는 서열은 원하는 발생 단계 동안 원하는 조직에서 발현될 수 있거나, 또는 그것의 발현은 유도성 프로모터를 사용하여 유도될 수 있고, 관심의 단백질을 암호화하는 추가 서열은 유사한 조건하에 동일한 조직에서 발현될 수 있으며, 이로써 뉴클레오티드 서열의 공-발현이 보장된다.

본 발명의 구성물은 Ti 플라스미드, Ri 플라스미드, 식물 바이러스 벡터, 직접 DNA 형질전환, 마이크로인젝션, 전기천공, 침윤 등을 사용하여 식물 세포에 도입될 수 있다. 이러한 기술에 관한 리뷰는, 예를 들어 Weissbach and Weissbach, Methods for Plant Molecular Biology, Academy Press, New York VIII, pp. 421-463(1988); Geierson and Corey, Plant Molecular Biology, 2d Ed. (1988); 및 Miki and Iyer, Fundamentals of Gene Transfer in Plants. In Plant Metabolism, 2d Ed. DT. Dennis, DH Turpin, DD Lefebrve, DB Layzell (eds), Addison Wesly, Langmans Ltd. London, pp. 561-579(1997)를 참조한다. 다른 방법은 직접 DNA 흡수, 리포솜의 사용, 원형질체를 사용하는 등의 전기천공, 마이크로인젝션, 마이크로프로젝타일 또는 휘스커, 및 진공 침윤을 포함한다. 예를 들어, Bilang, et al.(Gene 100: 247-250(1991), Scheid et al.(Mol. Gen. Genet. 228:104-112, 1991), Guerche et al.(Plant Science 52:111-116, 1987), Neuhause et al.(Theor. Appl Genet. 75:30 -36, 1987), Klein et al., Nature 327:70-73(1987); Howell et al.(Science 208: 1265, 1980), Horsch et al.(Science 227:1229-1231, 1985), DeBlock et al, Plant Physiology 91:694-701, 1989), Methods for Plant Molecular Biology(Weissbach and Weissbach, eds., Academic Press Inc., 1988), Methods in Plant Molecular Biology(Schuler and Zielinski, eds., Academic Press Inc., 1989), Liu and Lomonossoff(J. Virol Meth, 105:343-348, 2002), U.S. Pat. Nos. 4,945,050; 5,036,006; 5,100,792; 6,403,865; 5,625,136을 참조한다(모두 본원에 참고자료로 포함된다).

일시 발현 방법을 사용하여 본 발명의 구성물을 발현할 수 있다(본원에 참고자료로 포함되는 Liu and Lomonossoff, 2002, Journal of Virological Methods, 105:343-348 참조). 대안으로서, Kapila 등(1997, 본원에 참고자료로 포함된다)에 의해 설명된 진공-기반 일시 발현 방법이 사용될 수 있다. 이들 방법은, 제한되는 것은 아니지만, 예를 들어 아그로-접종 또는 아그로-침윤의 방법을 포함할 수 있으며, 다른 일시 방법도 상기 주지된 대로 사용될 수 있다. 아그로-접종 또는 아그로-침윤에서는 원하는 핵산을 포함하는 아그로박테리아의 혼합물을 조직, 예를 들어 잎, 식물의 기생부(줄기, 잎 및 꽃을 포함), 다른 식물 부분(줄기, 뿌리, 꽃), 또는 전체 식물의 세포간 공간에 도입한다. 표피의 교차 후 아그로박테리움이 세포를 감염시켜 세포로 t-DNA 카피를 전달한다. t-DNA가 에피솜 전사되고 mRNA 번역되어 감염된 세포에서 관심의 단백질이 생산되며, t-DNA의 핵 내부 통과는 일시적이다.

관심의 뉴클레오티드 서열이 식물에 간접 또는 직접적으로 독성인 산물을 암호화하는 경우, 본 발명의 방법을 사용해서 원하는 조직에서 또는 원하는 식물 발생 단계에서 관심의 뉴클레오티드 서열을 선택적으로 발현시킴으로써 이러한 독성을 식물 전체에서 감소시킬 수 있다. 이에 더하여, 일시 발현으로 인한 한정된 발현 기간은 식물에서 독성 산물이 생산될 때의 영향을 감소시킬 수 있다. 유도성 프로모터, 조직-특이적 프로모터 또는 세포-특이적 프로모터를 사용하여 관심의 서열을 선택적으로 직접 발현할 수 있다.

본 발명의 재조합 HA VLP는 기존 인플루엔자 백신과 함께 사용될 수 있으며, 이로써 백신을 보충하고, 백신을 더 효과적으로 만들고, 필요한 투여량을 줄일 수 있다. 당업자에게 알려진 대로, 백신은 하나 이상의 인플루엔자 바이러스에 대해 작용할 수 있다. 적합한 백신의 예는, 제한되는 것은 아니지만, Sanofi-Pasteur, ID Biomedical, Merial, Sinovac, Chiron, Roche, Medlmmune, GlaxoSmithKline, Novartis, Sanofi-Aventis, Serono, Shire Pharmaceuticals 등으로부터 상업적으로 입수가능한 것들을 포함한다.

원한다면, 본 발명의 VLP는 당업자에게 알려진 적합한 애쥬번트와 함께 혼합될 수 있다. 더욱이, VLP는 상기 정의된 표적 생물의 치료를 위한 VLP의 유효 용량을 포함하는 백신 조성물에 사용될 수 있다. 더욱이, 본 발명에 따라서 생산된 VLP는 상이한 인플루엔자 단백질, 예를 들어 뉴라미니다제(NA)를 사용하여 얻어진 VLP와 조합될 수 있다.

따라서, 본 발명은 하나 이상의 VLP를 포함하는 백신의 유효 용량을 투여하는 것을 포함하는 동물 또는 표적 생물에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법을 제공한다. 백신은 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로로 투여될 수 있다.

본 발명에 따라서 생산된 VLP의 투여는 실시예 6에 설명된다. 식물-제조 H5 VLP 투여는 가용성 HA의 투여와 비교하여 상당히 더 높은 반응을 가져왔다(도 21a 및 21b 참조).

도 26a 및 26b에 도시된 대로, A/Indonesia/5/05 H5 VLP를 투여한 피험체에는 인플루엔자 A/Turkey/582/06(H5N1; "Turkey H5N1")로의 시험감염에 대해 교차-방어가 제공된다. 시험감염 전에 Indonesia H5 VLP의 투여는 어떤 체중 손실도 가져오지 않았다. 그러나, H5 VLP를 투여하지 않은 피험체에서는 Turkey H5N1로 시험감염시키자 상당한 체중 손실을 나타냈고 몇몇 피험체는 죽었다.

따라서, 이들 데이터는 H5 헤마글루티닌 바이러스 단백질을 포함하는 식물-제조 인플루엔자 VLP가 병원성 인플루엔자 균주에 특이적인 면역반응을 유도하며, 바이러스-유사 입자는 식물 원형질막으로부터 발아할 수 있다는 것을 증명한다.

따라서, 본 발명은 인플루엔자 바이러스 HA 단백질, 하나 이상의 식물 지질, 및 제약학적으로 허용되는 담체를 포함하는 VLP의 유효 용량을 포함하는 조성물을 제공한다. 인플루엔자 바이러스 HA 단백질은 H5 Indonesia/5/2006, A/Brisbane/50 /2007, A/Sololmon Islands 3/2006, A/Brisbane/10/2007, A/Wisconsin/67/2005, B/Malaysia/2506/2005, B/Florida/4/2006, A/Singapore/1/57, A/Anhui/1/2005, A/Vietnam/1194/2004, A/Teal/HongKong/W312/97, A/Equine/Prague/56, A/California/04/09(H1N1) 또는 A/Hong Kong/1073/99일 수 있다. 또한, 피험체에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법이 제공된다. 상기 방법은 인플루엔자 바이러스 HA 단백질, 하나 이상의 식물 지질 및 제약학적으로 허용되는 담체를 포함하는 바이러스-유사 입자의 투여를 포함한다. 바이러스-유사 입자는 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로에 의해 피험체에게 투여될 수 있다.

본 발명의 다양한 구체예에 따른 조성물은 2 이상의 인플루엔자 균주 또는 서브타입의 VLP를 포함할 수 있다. "2 이상"은 2, 3, 4, 5, 6, 7, 8, 9, 10 또는 그 이상의 균주 또는 서브타입을 말한다. 제시된 균주 또는 서브타입들은 단일 서브타입(예를 들어, 모두 H1N1 또는 모두 H5N1)이거나, 또는 서브타입의 조합일 수 있다. 예시적인 서브타입 및 균주는, 제한되는 것은 아니지만 본원에 개시된 것들을 포함한다(예를 들어, A/New Caledonia/20/99(H1N1), A/Indonesia/5/2006(H5N1), A/chicken/New York/1995, A/herring gull/DE/677/88(H2N8), A/Texas/32/2003, A/ mallard/MN/33/00, A/duck/Shanghai/1/2000, A/northern pintail/TX/828189/02, A/ Turkey/Ontario/6118/68(H8N4), A/shoveler/Iran/G54/03, A/chicken/Germany/N/ 1949(H10N7), A/duck/England/56(H11N6), A/duck/Alberta/60/76(H12N5), A/Gull/ Maryland/704/77(H13N6), A/Mallard/Gurjev/263/82, A/duck/Australia/341/83(H15N 8), A/black-headed gull/Sweden/5/99(H16N3), B/Lee/40, C/Johannesburg/66, A/ PuertoRico/8/34(H1N1), A/Brisbane/59/2007(H1N1), A/Solomon Islands 3/2006(H1N 1), A/Brisbane10/2007(H3N2), A/Wisconsin/67/2005(H3N2), B/Malaysia/2506/2004, B/Florida/4/2006, A/Singapore/1/57(H2N2), A/Anhui/1/2005(H5N1), A/Vietnam/ 1194/2004(H5N1), A/Teal/Hong Kong/W312/97(H6N1), A/Equine/Prague/56(H7N7), A/California/04/09(H1N1) 또는 A/Hong Kong/1073/99(H9N2)).

균주 및 서브타입의 조합의 선택은 인플루엔자에 노출될 가능성이 있는 피험체의 지리적 위치, 면역화될 인간 집단에 가까이 있는 동물 종들(예를 들어, 물새, 돼지 등의 농사 동물) 및 노출되었거나 노출될 가능성이 있는 이들이 지닌 균주, 서브타입 또는 균주 내에서 항원 표류의 소인, 또는 이들 요인들의 조합에 의존할 수 있다. 과거에 사용된 조합의 예를 이용할 수 있다(URL: who.int/csr/dieease/ influenza/vaccine recommendations 1/en 참조). 백신 조성물의 제조에서 이들 균주의 일부 또는 전부를 나타낸 조합으로, 또는 다른 조합으로 사용할 수 있다.

더 구체적으로, 예시적인 조합은 A/California/04/09(H1N1), A/Brisbane/59/ 2007(H1N1), A/Brisbane/59/2007(H1N1)-유사 바이러스, A/Brisbane/10/2007(H3N2), A/Brisbane/10/2007(H3N2)-유사 바이러스, B/Florida/4/2006 또는 B/Florida/4/ 2006-유사 바이러스를 포함하는 군에서 선택된 2 이상의 균주 또는 서브타입으로부터의 VLP를 포함할 수 있다.

다른 예시적인 조합은 A/Indonesia/5/2005, A/Indonesia/5/2005-유사 바이러스, A/Vietnam/1194/2004, A/Vietnam/1194/2004-유사 바이러스, A/Anhui/1/05, A/ Anhui/1/05-유사 바이러스, A/goose/Guiyang/337/2006, A/goose/Guiyang/337/2006-유사 바이러스, A/chicken/Shanxi/2/2006, 또는 A/chicken/Shanxi/2/2006-유사 바이러스, A/California/04/09(H1N1) 또는 A/California/04/09(H1N1)-유사 바이러스를 포함하는 군에서 선택된 2 이상의 균주 또는 서브타입으로부터의 VLP를 포함할 수 있다.

다른 예시적인 조합은 A/Chicken/Italy/13474/99(H7 타입) 또는 A/Chicken/ British Columbia/04(H7N3) 인플루엔자 균주의 VLP를 포함할 수 있다.

다른 예시적인 조합은 A/Chicken/HongKong/G9/97 또는 A/HongKong/1073/99의 VLP를 포함할 수 있다. 다른 예시적인 조합은 A/Solomon Islands/3/2006의 VLP를 포함할 수 있다. 다른 예시적인 조합은 A/Brisbane/10/2007의 VLP를 포함할 수 있다. 다른 예시적인 조합은 A/Wisconsin/67/2005의 VLP를 포함할 수 있다. 다른 예시적인 조합은 B/Malaysia/2506/2004, B/Florida/4/2006 또는 B/Brisbane/3/2007 균주 또는 서브타입의 VLP를 포함할 수 있다.

2 이상의 VLP는 개별적으로 발현된 다음, 정제 또는 반-정제된 VLP가 조합될 수 있다. 대안으로서, VLP는 동일한 숙주, 예를 들어 식물에서 공-발현될 수 있다. VLP는 원하는 비율로, 예를 들어 대략 등가의 비율로 조합되거나 생산될 수도 있고, 또는 한 서브타입 또는 균주가 조성물의 VLP의 대부분을 이루는 방식으로 조합될 수도 있다.

따라서, 본 발명은 2 이상의 균주 또는 서브타입의 VLP를 포함하는 조성물을 제공한다.

외피보유 바이러스의 VLP는 일반적으로 이들이 발아한 막으로부터 이들의 외피를 획득한다. 식물 원형질막은 면역자극 효과를 가질 수 있는 피토스테롤 보체를 가진다. 이 가능성을 조사하기 위해 식물-제조 H5 VLP를 애쥬번트의 존재 또는 부재하에 동물에 투여하고 HAI(혈구응집 억제 항체반응)을 측정했다(도 22a, 22b). 애쥬번트를 첨가하지 않은 경우, 식물-제조 H5 VLP는 상당한 HAI를 나타내는데, 이것은 항원의 투여에 대한 전신적 면역반응의 징표이다. 더욱이, 애쥬번트의 존재 또는 부재하에 투여된 VLP의 항체 이소타입 프로파일은 유사하다(도 23a).

표 5는 본 발명의 다양한 구체예에서 제공된 서열들의 리스트이다.

이제 본 발명을 다음의 비제한적 예를 참조하여 상세히 설명한다.

방법 및 재료

1. 자생 HA 를 위한 플라스토시아닌 -기반 발현 카세트의 조립

모든 조작은 Sambrook and Russell(2001; 본원에 참고자료로 포함된다)의 일반 분자생물학 프로토콜에 따라서 수행하였다. 첫 번째 클로닝 단계는 자주개자리 플라스토시아닌 유전자의 상류 및 하류 조절 요소를 함유하는 수용체 플라스미드를 조립하는 것이었다. 플라스토시아닌 프로모터와 5' UTR 서열을 올리고뉴클레오티드 프라이머 XmaI-pPlas.c(SEQ ID NO: 29; 도 10q)와 SacI-ATG-pPlas.r(SEQ ID NO: 30; 도 10r)을 사용하여 자주개자리 게놈 DNA로부터 증폭시켰다. 얻어진 증폭 산물을 XmaI와 ScaI로 절단하고, 동일한 효소로 미리 절단해 둔 pCAMBIA2300(Cambia, 호주 캔버라)에 라이게이션하여 pCAMBIApromoPlasto를 만들었다. 유사하게, 플라스토시아닌 유전자의 3' UTR 서열과 터미네이터를 프라이머 SacI-PlasTer.c(SEQ ID NO: 31; 도 10s)와 EcoRI-PlasTer.r(SEQ ID NO: 32; 도 10t)을 사용하여 자주개자리 게놈 DNA로부터 증폭시키고, 산물을 ScaI와 EcoRI로 절단한 다음, pCAMBIApromo Plasto의 동일 부위에 삽입하여 pCAMBIAPlasto를 만들었다.

인플루엔자 균주 A/Indonesia/5/05(H5N1; Ace. No. LANL ISDN125873) 유래의 헤마글루티닌을 암호화하는 단편을 Epoch Biolabs(Sugar Land, TX, USA)에 의해 합성했다. 생산된 단편은 초기 ATG의 바로 상류에 HindIII 부위가 측면 위치되고 중단(TAA) 코돈의 바로 하류에 SacI 부위가 위치된 자생 신호 펩티드를 포함하는 완전한 H5 코딩 영역을 함유하며, 이것을 SEQ ID NO:3(도 6)에 도시한다. H5 코딩 영역을 Darveau 등(1995)에 제시된 PCR-기반 라이게이션 방법에 의해 플라스토시아닌-기반 발현 카세트에서 클로닝했다. 간단히 말해서, 1차 PCR 증폭에서는 프라이머로서 Plato-443c(SEQ ID NO:4; 도 7a)와 SpHA(Ind)-Plasto.r(SEQ ID NO:5; 도 7b), 주형으로서 pCAMBIApromoPlasto를 사용했다. 병행하여, 2차 증폭은 프라이머로서 Plasto-SpHA(Ind).c(SEQ ID NO:6; 도 7c)와 HA(Ind)-Sac.r(SEQ ID NO:7; 도 7d), 주형으로서 H5 코딩 단편을 사용하여 수행했다. 두 반응으로부터 얻어진 증폭 산물을 혼합하고, 혼합물을 3차 반응(조립 반응)의 주형으로서 사용했으며, 이때 프라이머는 Plato-443c(SEQ ID NO:4; 도 7a)와 HA(Ind)-Sac.r(SEQ ID NO:7; 도 7d)를 사용했다. 얻어진 단편을 BamHI(플라스토시아닌 프로모터 내)와 SacI(단편의 3' 단부)로 절단하고, 동일한 효소로 미리 절단해 둔 pCAMBIAPlasto에서 클로닝했다. 얻어진 플라스미드를 660으로 명명하며, 도 2b에 도시한다(도 11도 참조).

헤마글루티닌 발현 카세트 번호 774-785가 다음과 같이 조립되었다. 플라스토시아닌 ATG의 상류의 처음 84개 뉴클레오티드에 상응하고 DraIII 제한 부위에서 끝나는 자주개자리 플라스토시아닌 유전자 서열이 3' 측면에 위치된 완전한 헤마글루티닌 코딩 서열(ATG에서 중단 코돈까지)을 포함하는 합성 단편을 합성했다. 이 합성 단편은 또한 중단 코돈 바로 뒤에 SacI 부위를 포함했다.

합성 헤마글루티닌 단편들은 Top Gene 기술(Montreal, QC, 캐나다) 및 Epoch Biolabs(Sugar Land, TX, USA)에 의해 합성되었다. 합성된 단편을 도 28-39에 나타내며, 이들은 SEQ ID NO:36 내지 SEQ ID NO:47에 해당한다. 완전한 발현 카세트의 조립을 위하여, 합성 단편을 DraIII와 SacI로 절단하고, 동일한 효소로 미리 절단해 둔 pCAMBIAPlasto에서 클로닝했다. 표 6에 상응하는 HA와 본문의 다른 참조내용들에 따라서 생성된 카세트들을 나타낸다.

플라스토시아닌 -기반 PDISP / HA -융합 발현 카세트의 조립

H1 A/ New Caledonia /20/99 (구성물 번호 540)

인플루엔자 균주 A/New Caledonia/20/99(H1N1)의 H1 유전자 유래의 오픈 리딩 프레임을 2개의 단편으로 합성하였다(Plant Biotechnology Institute, National Research Council, Saskatoon, Canada). 합성된 제 1 단편은 5' 단부에서 신호 펩티드 코딩 서열과 3' 단부에서 막통과 도메인 코딩 서열을 결여한 야생형 H1 코딩 서열(GenBank ace. No. AY289929; SEQ ID NO:33; 도 16)에 상응한다. 이 단편의 코딩 서열의 5' 단부에 BglII 제한 부위를 부가하고, 3' 말단 단부에는 중단 코돈의 바로 하류에 이중 SacI/StuI 부위를 부가하여 SEQ ID NO:1(도 5a)를 얻었다. 또, SacI 및 StuI 제한 부위가 3' 단부 측면에 위치된, KpnI 부위에서 중단 코돈까지 H1 단백질(막통과 도메인 및 세포질 꼬리를 포함함)의 C-말단 단부를 암호화하는 제 2 단편을 합성했다(SEQ ID NO:2; 도 5b).

제 1 H1 단편을 BalII 및 SacI로 절단하고, 자주개자리 단백질 이황화물 이소머라제(PDI) 유전자의 신호 펩티드(뉴클레오티드 32-103; Accession No. Z11499; SEQ ID NO:34; 도 17)에 융합된 플라스토시아닌 프로모터 및 5' UTR을 함유하는 바이너리 벡터(pCAMBIAPlasto)의 동일한 부위에서 클로닝하여, 플라스토시아닌 조절 요소의 하류에서 PDI-H1 키메라 유전자를 만들었다. PDI 신호 펩티드를 함유하는 플라스토시아닌-기반 카세트의 서열을 도 1에 나타낸다(SEQ ID NO:8). 얻어진 플라스미드는 PDI 신호 펩티드와 융합되고 플라스토시아닌 조절 요소가 측면에 위치된 H1 코딩 영역을 함유했다. KpnI 및 SacI로 미리 절단해 둔 합성된 단편(SEQ ID NO:2; 도 5b)을 H1 발현 플라스미드에 삽입함으로써 C-말단 단부 코딩 영역(막통과 도메인 및 세포질 꼬리를 암호화)을 부가했다. 얻어진 플라스미드를 540으로 명명하며, 도 11에 나타낸다(도 2a도 참조).

H5 A/ Indonesia /5/2005 (구성물 번호 663)

자주개자리 단백질 이황화물 이소머라제의 신호 펩티드(PDISP)(뉴클레오티드 32-103; Accession No. Z11499; SEQ ID NO:34; 도 17)를 A/Indonesia/5/2005 유래의 H5의 HA0 코딩 서열에 다음과 같이 연결했다. H5 코딩 서열을 주형으로서 구성물 번호 660(SEQ ID NO:60; 도 51)을 사용하고, 프라이머 SpPDI-HA(Ind).c(SEQ ID NO:82) 및 HA(Ind)-SacI.r(SEQ ID NO:7; 도 7d)를 사용하여 증폭시켰다. 얻어진 단편은 5' 측면에 PDISP를 암호화하는 마지막 뉴클레오티드(BalII 제한 부위 포함)가 위치되고, 3' 측면에 SacI 제한 부위가 위치된 H5 코딩 서열을 포함했다. 이 단편을 BalII 및 SacI로 절단하고, 동일한 제한 효소로 미리 절단해 둔 구성물 번호 540(SEQ ID NO:61; 도 52)에서 클로닝했다. 최종 카세트를 구성물 번호 663 (SEQ ID NO:83)으로 명명하며, 도 69에 나타낸다.

H1 A/ Brisbane /59/2007 (구성물 787)

자주개자리 단백질 이황화물 이소머라제의 신호 펩티드(PDISP)(뉴클레오티드 32-103; Accession No. Z11499; SEQ ID NO:34; 도 17)를 A/Brisbane/59/2007 유래의 H1의 HA0 코딩 서열에 다음과 같이 연결했다. H1 코딩 서열을 주형으로서 구성물 774(SEQ ID NO:62; 도 53)을 사용하고, 프라이머 SpPDI-H1B.c(SEQ ID NO:84) 및 SacI-H1B.r(SEQ ID NO:85)를 사용하여 증폭시켰다. 얻어진 단편은 5' 측면에 PDISP를 암호화하는 마지막 뉴클레오티드(BalII 제한 부위 포함)가 위치되고, 3' 측면에 SacI 제한 부위가 위치된 H1 코딩 서열을 포함했다. 이 단편을 BalII 및 SacI로 절단하고, 동일한 제한 효소로 미리 절단해 둔 구성물 번호 540(SEQ ID NO:61; 도 52)에서 클로닝했다. 최종 카세트를 구성물 번호 787(SEQ ID NO:86)로 명명하며, 도 70에 나타낸다.

H3 A/ Brisbane /10/2007 (구성물 번호 790)

자주개자리 단백질 이황화물 이소머라제의 신호 펩티드(PDISP)(뉴클레오티드 32-103; Accession No. Z11499; SEQ ID NO:34; 도 17)를 A/Brisbane/10/2007 유래의 H3의 HA0 코딩 서열에 다음과 같이 연결했다. PDISP는 Darveau 등(Methods in Neuroscience 26:77-85(1995))에 제시된 PCR-기반 라이게이션 방법에 의해 H3 코딩 서열에 연결되었다. 1차 PCR 라운드에서, PDISP에 융합된 플라스토시아닌 프로모터의 세그먼트를 주형으로서 구성물 540(SEQ ID NO:61; 도 52)을 사용하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 H3B-SpPDI.r(SEQ ID NO:87)을 사용하여 증폭시켰다. 병행하여, H3 A/Brisbane/10/2007의 코딩 서열의 일부분을 함유하는 또 다른 단편(코돈 17에서 SpeI 제한 부위까지)을 주형으로서 구성물 776(SEQ ID NO: 69; 도 60)을 사용하고, 프라이머 SpPDI-H3B.c(SEQ ID NO:88) 및 H3(A-Bri).982r (SEQ ID NO:89)를 사용하여 증폭시켰다. 다음에, 증폭 산물을 혼합하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 H3(A-Bri).982r(SEQ ID NO:89)와 함께 2차 증폭 라운드(조립 반응)의 주형으로서 사용했다. 얻어진 단편을 BamHI(플라스토시아닌 프로모터 내) 및 SpeI(H3 코딩 서열 내)로 절단하고, 동일한 제한 효소로 미리 절단해 둔 구성물 번호 776(SEQ ID NO:69; 도 60)에서 클로닝하여, 구성물 번호 790(SEQ ID NO:90)을 얻었다. 이 구성물을 도 71에 나타낸다.

HA B/ Florida /4/2006 (구성물 번호 798)

자주개자리 단백질 이황화물 이소머라제의 신호 펩티드(PDISP)(뉴클레오티드 32-103; Accession No. Z11499; SEQ ID NO:34; 도 17)를 HA B/Florida/4/2006 유래의 HA의 HA0 코딩 서열에 Darveau 등(Methods in Neuroscience 26:77-85(1995))에 제시된 PCR-기반 라이게이션 방법에 의해 연결했다. 1차 증폭 라운드에서, PDISP에 융합된 플라스토시아닌 프로모터의 일부분을 주형으로서 구성물 540(SEQ ID NO: 61; 도 52)을 사용하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 HBF-Sp PDI.r(SEQ ID NO:91)을 사용하여 증폭시켰다. 병행하여, 플라스토시아닌 터미네이터에 융합된 HB B/Flo의 코딩 서열의 일부분을 함유하는 또 다른 단편을 주형으로서 구성물 779(SEQ ID NO:73; 도 64)을 사용하고, SpPDI-HBF.c(SEQ ID NO:92) 및 Plaster80r(SEQ ID NO:93)을 사용하여 증폭시켰다. 다음에, PCR 산물을 혼합하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 Plaster80r(SEQ ID NO:93)과 함께 2차 증폭 라운드(조립 반응)의 주형으로서 사용했다. 얻어진 단편을 BamHI(플라스토시아닌 프로모터 내) 및 AflII(HA B/Florida/4/2006 코딩 서열 내)로 절단하고, 동일한 제한 효소로 미리 절단해 둔 구성물 번호 779(SEQ ID NO:73; 도 64)에서 클로닝하여, 구성물 번호 798(SEQ ID NO:94)을 얻었다. 얻어진 발현 카세트를 도 72에 나타낸다.

CPMV - HT -기반 발현 카세트의 조립

CPMV-HT 발현 카세트는 위치 115와 161에 돌연변이 ATG가 있는 동부 모자이크병 바이러스(CPMV) RNA2의 뉴클레오티드 1-512가 5' 측면에 위치되고, CPMV RNA2의 뉴클레오티드 3330-3481(3' UTR에 해당)과 그 뒤로 NOS 터미네이터가 3' 측면에 위치된 관심의 코딩 서열을 포함하는 mRNA의 발현을 제어하기 위해 35S 프로모터를 사용한다. CPMV-HT-기반 헤마글루티닌 발현 카세트의 조립에는 플라스미드 pBD-C5-1LC(Sainsbury et al. 2008; Plant Biotechnology Journal 6:82-92 및 PCT 공보 WO 2007/135480)를 사용했다. CPMV RNA2의 위치 115와 161에서 ATG의 돌연변이는 Darveau 등(Methods in Neuroscience 26:77-85 (1995))에 제시된 PCR-기반 라이게이션 방법을 이용하여 수행했다. 2회의 별도의 PCR을 주형으로서 pBD-C5-1LC를 사용하여 수행했다. 1차 증폭의 프라이머는 pBinPlus.2613c(SEQ ID NO:77) 및 Mut-ATG115.r(SEQ ID NO:78)이다. 2차 증폭의 프라이머는 Mut-ATG161.c(SEQ ID NO:79) 및 LC-C5-1.110r(SEQ ID NO:80)이다. 다음에, 얻어진 2개의 단편을 혼합하고, 프라이머로서 pBinPlus.2613c(SEQ ID NO:77) 및 LC-C5-1.110r(SEQ ID NO:80)를 사용하는 3차 증폭의 주형으로서 사용한다. 얻어진 단편을 PacI 및 ApaI로 절단하고, 동일한 효소로 절단된 pBD-C5-1LC에서 클로닝했다. 생성된 발현 카세트의 서열을 828로 명명하며, 도 68(SEQ ID NO:81)에 나타낸다.

CPMV - HT 발현 카세트에서 SpPDI - H1 A/ New Caledonia /20/99의 조립 (구성물 번호 580)

H1 A/New Caledonia/20/99 유래의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-Sp PDI.c(SEQ ID NO:95) 및 StuI-H1(A-NC).r(SEQ ID NO:96)을 사용하고, 구성물 번호 540(SEQ ID NO:61; 도 52)를 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 580(SEQ ID NO:97)으로 명명했다.

2 X35S / CPMV - HT 발현 카세트(구성물 # 560)로부터 SpPDI - H1 A/ California / 4/2009의 조립

H1 A/California/4/2009로부터의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 단편을 다음과 같이 2X35S-CPMV-HT에서 클로닝했다.

이전에 사용된 35S 프로모터 대신 CPMV-HT 발현 카세트에 2X35S 프로모터를 함유하는 중간 벡터를 먼저 만들었다. 프로모터의 변경은 Darveau 등(Methods in Neuroscience 26:77-85(1995))에서 제시된 PCR-기반 리게이션 방법을 사용하여 수행했다. 2X35S 프로모터 SEQ ID NO: 129(도 93)을 함유하는 제 1 단편을 주형으로서 2X35S 프로모터를 함유하는 플라스미드와 아래 프라이머를 사용하여 증폭했다:

PacI-MCS-2X35S.c(SEQ ID NO: 130):

AATTGTTAATTAA GTCGACAAGCTTGCATGCCTGCAGGTCAAC

및 CPMV 5'UTR-2 X35S.r(SEQ ID NO: 131):

TCAAAACCTATTAAGATTTTAATA CCTCTCCAAATGAAATGAACTTCC

병행하여, 제 2 PCR을 주형으로서 구성물 685(SEQ ID NO: 100; 도 74)와 아래 프라이머를 사용하여 수행했다:

2 X35S -CPMV 5'UTR.c(SEQ ID NO: 132):

TTGGAGAGG TATTAAAATCTTAATAGGTTTTGATAAAAGCGAACGTGGG

및 ApaI -M prot.r(SEQ ID NO: 133):

TCTCCAT GGGCCC GACAAATTTGGGCAGAATATACAGAAGCTTA

다음에, 얻어진 두 단편을 혼합하고, 이것을 프라이머 PacI-MCS-2X35S.c(SEQ ID NO:130)와 ApaI-M prot.r(SEQ ID NO: 133)를 사용하는 2차 라운드 PCR(조립 반응)의 주형으로서 사용했다. 다음에, 결과의 단편을 PacI와 ApaI로 절단하고, 동일한 제한 효소로 절단된 구성물 685(SEQ ID NO: 100; 도 74)에서 클로닝했다. 972(SEQ ID NO: 134)로 명명된 중간 벡터의 서열을 도 94에 나타낸다.

GISAID 데이터베이스로부터 자생 H1 A/California/4/2009 서열을 얻었고(수탁 번호 EPI176470), 이것을 도 95(SEQ ID NO: 135)에 나타낸다. 자주개자리 단백질 이황화물 이소머라제(PDISP)(뉴클레오티드 32-103; 수탁 번호 Z21499; SEQ ID NO: 34; 도 17)과 함께 DraIII에서 ApaI 제한 부위까지의 CPMV M 단백질(CPMV-HT 발현 카세트에서)의 일부와 돌연변이 ScaI와 StuI 제한 부위를 가진 A/California /4/2009 헤마글루티닌의 HA0를 포함하는 뉴클레오티드 서열을 도 96(SEQ ID NO: 136)에 나타낸다. 이 서열은 3개의 상이한 단편에서 DNA2.0(Menlo Park, CA, USA)에 의해 합성되었다. 단편 1(SEQ ID NO: 137; 도 97), 2(SEQ ID NO: 138; 도 97) 및 3(SEQ ID NO: 139; 도 97)을 Darveau 등(Methods in Neuroscience 26:77-85(1995))에 제시된 PCR-기반 리게이션 방법을 사용하여 조립했다. 1차 증폭 라운드에서는 주형으로서 단편 1을 함유하는 pJ201 벡터(DNA2.0 독점 벡터)(SEQ ID NO: 139)와 아래 프라이머를 사용하여 증폭했다:

DraIII -MProt#2.c(SEQ ID NO: 140)

ATGCTAATAT CACGTAGTG CGGCGCCATTAAATAACGTGTACTTGTCC

및 H1 Cal.390r(SEQ ID NO: 141)

GCTTAATTGCTCTCTTAGCTCCTCATAATCGATGAAATCTCC

제 2 단편은 주형으로서 단편 2를 함유하는 pJ201 벡터(DNA2.0 독점 벡터 (SEQ ID NO:138)와 아래 프라이머를 사용하여 증폭했다:

H1 Cal.310c(SEQ ID NO: 142)

TGGAAACACCTAGTTCAGACAATGGAACGTGTTACCCAGGAG

및 H1 Cal.1159r(SEQ ID NO: 143)

CTGCATATCCTGACCCCTGCTCATTTTGATGGTGATAACCGT

마지막으로 마지막 단편을 주형으로서 단편 3을 함유하는 pJ201 벡터(DNA2.0 독점 벡터)(SEQ ID NO: 139)와 아래 프라이머를 사용하여 증폭했다:

H1 Cal.1081c(SEQ ID NO: 144)

TTGAAGGGGGGTGGACAGGGATGGTAGATGGATGGTACGGTT

및 StuI -H1 Cal.r(SEQ ID NO: 145)

TATT AGGCCT TTAAATACATATTCTACACTGTAGAGACCCATTAG

2차 PCR 라운드(조립 반응)에서 3개의 증폭 단편을 혼합하고, 이것을 프라이머 DraIII-MProt#2.c(SEQ ID NO: 140) 및 StuI-H1 Cal.r(SEQ ID NO: 145)와 함께 주형으로서 사용했다. 결과의 단편을 DraIII와 StuI로 절단하고, 동일한 제한 효소로 절단된 구성물 972(SEQ ID NO: 134)에 삽입했다. 결과의 구성물의 뉴클레오티드 서열을 560(SEQ ID NO: 146; 도 98)으로 명명했다.

CPMV - HT 발현 카세트에서 H5 A/ Indonesia /5/2005의 조립 (구성물 번호 685)

A/Indonesia/5/2005 유래의 H5의 코딩 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-H5(A-Indo).1c(SEQ ID NO:98) 및 H5(A-Indo)-StuI.1707r (SEQ ID NO:99)을 사용하고, 구성물 번호 660(SEQ ID NO:60; 도 51)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO: 81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 685(SEQ ID NO:100)로 명명했다.

CPMV - HT 발현 카세트에서 SpPDI - H5 A/ Indonesia /5/2005의 조립 (구성물 번호 686)

H5 A/Indonesia/5/2005 유래의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-SpPDI.c (SEQ ID NO:95) 및 H5(A-Indo)-StuI.1707r(SEQ ID NO:99)을 사용하고, 구성물 번호 663(SEQ ID NO:83)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 686(SEQ ID NO:101)으로 명명했다.

CPMV - HT 발현 카세트에서 H1 A/ Brisbane /59/2007의 조립 (구성물 번호 732)

H1 A/brisbane/59/2007 유래의 HA의 코딩 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-H1B.c(SEQ ID NO:102) 및 StuI-H1B.r(SEQ ID NO:103)을 사용하고, 구성물 번호 774(SEQ ID NO:62; 도 53)를 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 732(SEQ ID NO:104)로 명명했다.

CPMV - HT 발현 카세트에서 SpPDI - H1 A/ Brisbane /59/2007의 조립 (구성물 번호 733)

H1 A/Brisbane/59/2007 유래의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-SpPDI.c (SEQ ID NO:95) 및 StuI-H1B.r(SEQ ID NO:103)을 사용하고, 구성물 번호 787(SEQ ID NO:86)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 733 (SEQ ID NO:105)으로 명명했다.

CPMV - HT 발현 카세트에서 H3 A/ Brisbane /10/2007의 조립 (구성물 번호 735)

H3 A/brisbane/10/2007 유래의 HA의 코딩 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-H3B.c(SEQ ID NO:106) 및 StuI-H3B.r(SEQ ID NO:107)을 사용하고, 구성물 번호 776(SEQ ID NO:69)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 735(SEQ ID NO:108)로 명명했다.

CPMV - HT 발현 카세트에서 SpPDI - H3 A/ Brisbane /10/2007의 조립 (구성물 번호736)

H3 A/Brisbane/10/2007 유래의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-SpPDI.c (SEQ ID NO:95) 및 StuI-H3B.r(SEQ ID NO:107)을 사용하고, 구성물 번호 790(SEQ ID NO:90)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 736 (SEQ ID NO:109)으로 명명했다.

CPMV - HT 발현 카세트에서 HA B/ Florida /4/2006의 조립 (구성물 번호 738)

B/Florida/4/2006 유래의 HA의 코딩 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-HBF.c(SEQ ID NO:110) 및 StuI-HBF.r(SEQ ID NO:111)을 사용하고, 구성물 번호 779(SEQ ID NO:73; 도 64)를 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 738(SEQ ID NO:112)로 명명했다.

CPMV - HT 발현 카세트에서 SpPDI - HA B/ Florida /4/2006의 조립 (구성물 번호 739)

B/Florida/4/2006 유래의 HA0에 융합된 자주개자리 PDI 신호 펩티드를 암호화하는 서열을 다음과 같이 CPMV-HT에서 클로닝했다. 프라이머 ApaI-SpPDI.c(SEQ ID NO:95) 및 StuI-HBF.r(SEQ ID NO:111)을 사용하고, 구성물 번호 798(SEQ ID NO: 94)을 주형으로서 사용하여 PCR 증폭을 수행하여 제한 부위 ApaI(초기 ATG의 바로 상류) 및 StuI(중단 코돈의 바로 하류)를 헤마글루티닌 코딩 서열에 부가했다. 얻어진 단편을 ApaI 및 StuI 제한 효소로 절단하고, 동일한 효소로 절단된 구성물 번호 828(SEQ ID NO:81)에서 클로닝했다. 얻어진 카세트를 구성물 번호 739(SEQ ID NO:113)로 명명했다.

샤프롱 발현 카세트의 조립

2개의 열충격 단백질(Hsp) 발현 카세트가 조립되었다. 제 1 카세트에서는, 자주개자리 아질산염 환원효소(Nir)와 자주개자리 플라스토시아닌 프로모터의 요소들을 조합한 키메라 프로모터(Nir/Plasto)에 의해서 Arabidopsis thaliana(생태형 Columbia) 시토졸 HSP70(Athsp70-1, Lin et al, 2001, Cell Stress and Chaperones 6:201-208)의 발현이 제어된다. 키메라 Nir/Plasto 프로모터의 제어하에 자주개자리 시토졸 HSP40(MsJ1; Frugis et al, 1999, Plant Molecular Biology 40:397-408)의 코딩 영역을 포함하는 제 2 카세트가 또한 조립되었다.

식물 바이너리 벡터에서 자주개자리 아질산염 환원효소 프로모터(Nir), GUS 리포터 유전자 및 NOS 터미네이터를 함유하는 어셉터 플라스미드가 먼저 조립되었다. 플라스미드 pNir3K51(미국특허 No. 6,420,548에 설명됨)를 HindIII 및 EcoRI로 절단했다. 얻어진 단편을 동일한 제한 효소로 절단된 pCAMBIA2300(Cambia, 호주 캔버라)에서 클로닝하여 pCAMBIA-Nir3K51를 얻었다.

Darveau 등(Methods in Neuroscience 26:77-85 (1995))에 제시된 PCR-기반 라이게이션 방법에 의해 Hsp70 및 Hsp40의 코딩 서열을 개별적으로 어셉터 플라스미드 pCAMBIANir3K51에서 클로닝했다.

Hsp40에 대해, Msj1 코딩 서열(SEQ ID NO:114)을 프라이머 Hsp40Luz.1c(SEQ ID NO:115) 및 Hsp40Luz-SacI.1272r(SEQ ID NO:116)을 사용하여 자주개자리(생태형 Rangelander) 잎 전체 RNA로부터 RT-PCR에 의해서 증폭시켰다. 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 Hsp40Luz-Plasto.r(SEQ ID NO:117)를 사용하고, 구성물 660(SEQ ID NO:60; 도 51)을 주형으로서 사용하여 2차 증폭을 수행했다. 다음에, PCR 산물을 혼합하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 Hsp40Luz -SacI.1272r(SEQ ID NO:116)를 사용하는 3차 증폭(조립 반응)의 주형으로서 사용했다. 얻어진 단편을 HpaI(플라스토시아닌 프로모터 내)로 절단하고, HpaI(Nir 프로모터 내) 및 SacI로 미리 절단해 둔 pCAMBIANir3K51에서 클로닝하고, T4 DNA 폴리머라제로 파일링하여 블런트 단부를 만들었다. 얻어진 클론들을 정확한 배향에 대해 스크리닝하고, 서열 완전성에 대해 서열화했다. 결과의 플라스미드를 R850으로 명명하며, 도 83(SEQ ID NO:121)에 나타낸다. 프라이머 Hsp70Ara.1c(SEQ ID NO: 118) 및 Hsp70Ara-SacI.1956r(SEQ ID NO:119)를 사용하여 Arabidopsis 잎 RNA로부터 RT-PCR에 의해 Athsp70-1의 코딩 영역을 증폭시켰다. 프라이머 Plato-443c(SEQ ID NO:4; 도 7a) 및 Hsp70Ara-Plasto.r(SEQ ID NO:120)를 사용하고, 구성물 660 (SEQ ID NO: 60; 도 51)을 주형으로서 사용하여 2차 증폭을 수행했다. 다음에, PCR 산물을 혼합하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 Hsp70ARA-SacI.1956r(SEQ ID NO:119)를 사용하는 3차 증폭(조립 반응)의 주형으로서 사용했다. 얻어진 단편을 HpaI(플라스토시아닌 프로모터 내)로 절단하고, HpaI(Nir 프로모터 내) 및 SacI로 절단된 pCAMBIANir3K51에서 클로닝하고, T4 DNA 폴리머라제로 파일링하여 블런트 단부를 만들었다. 얻어진 클론들을 정확한 배향에 대해 스크리닝하고, 서열 완전성에 대해 서열화했다. 결과의 플라스미드를 R860로 명명하며, 도 84(SEQ ID NO:122)에 나타낸다.

이중 Hsp 발현 플라스미드가 다음과 같이 조립되었다. R860을 BsrBI(NOS 터미네이터 하류)로 절단하고, T4 DNA 폴리머라제로 처리하여 블런트 단부를 만들고, SbfI(키메라 NIR/Plasto 프로모터 상류)로 절단했다. 얻어진 단편(키메라 Nir/ Plasto 프로모터-HSP70 코딩 서열-Nos 터미네이터)을 SbfI 및 SmaI(모두 키메라 Nir/Plasto 프로모터 상류의 다중 클로닝 부위에 위치함)로 미리 절단해 둔 R850에서 클로닝했다. 얻어진 플라스미드를 R870으로 명명하며, 도 85(SEQ ID NO:123)에 나타낸다.

다른 발현 카세트들의 조립

가용성 H1 발현 카세트

540에서 막통과 도메인 및 세포질 꼬리의 코딩 영역을 류신 지퍼 GCN4 pII 변이체를 암호화하는 단편으로 치환함으로써 H1의 가용성 형태를 암호화하는 카세트를 제조하였다(Harbury et al, 1993, Science 1993; 262:1401-1407). 이 단편은 클로닝을 촉진하는 측면 KpnI 및 SacI 부위와 함께 합성되었다. 이 치환으로부터 얻어진 플라스미드를 544로 명명하며, 이 발현 카세트가 도 11에 도시된다.

M1 A/ Puerto Rico /8/34 발현 카세트

담베 식각 바이러스(TEV) 5' UTR과 인플루엔자 A/PR/8/34 M1 유전자(Ace. # NC 002016)의 오픈 리딩 프레임의 융합체가 중단 코돈의 하류에 부가된 측면 SacI 부위와 함께 합성되었다. 이 단편을 SwaI(TEV 5' UTR 내) 및 SacI로 분해하고, pCAMBIA 바이너리 플라스미드에서 2X35S/TEV-기반 발현 카세트에서 클로닝했다. 얻어진 플라스미드는 2X35S/TEV 프로모터 및 5' UTR 및 NOS 터미네이터의 제어하에 M1 코딩 영역을 지녔다(구성물 750; 도 11).

HcPro 발현 카세트

HcPro 구성물(35HcPro)이 Hamilton 등(2002)에 설명된 대로 제조되었다. 모든 클론을 서열화하여 구성물의 완전성을 확인했다. 이 플라스미드를 사용하여 전기천공(Mattanovich et al., 1989)에 의해 Agrobacteium tumefaciens(AGL1; ATCC, Manassas, VA 20108, USA)를 형질전환했다. 제한 맵핑으로 모든 A. tumefaciens 균주의 완전성을 확인했다.

P19 발현 카세트

Darveau 등(Methods in Neuroscience 26: 77-85(1995))에 제시된 PCR-기반 라이게이션 방법에 의해 자주개자리 플라스토시아닌 발현 카세트에 토마토 덤불위축 바이러스(TBSV)의 p19 단백질의 코딩 서열을 연결했다. 1차 PCR 라운드에서, 플라스토시아닌 프로모터의 세그먼트를 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 supP19-plasto.r(SEQ ID NO:124)를 사용하고, 주형으로서 구성물 660(SEQ ID NO:60; 도 51)을 사용하여 증폭시켰다. 병행하여, p19의 코딩 서열을 함유하는 또 다른 단편을 프라이머 supP19-1c(SEQ ID NO:125) 및 SupP19-SacI.r(SEQ ID NO:126)를 사용하고, 주형으로서 Voinnet 등(The Plant Journal 33:949-956 (2003))에 설명된 구성물 35S:p19를 사용하여 증폭시켰다. 다음에, 증폭 산물을 혼합하고, 프라이머 Plasto-443c(SEQ ID NO:4; 도 7a) 및 SupP19-SacI.r(SEQ ID NO:126)를 사용하는 2차 증폭 라운드(조립 반응)의 주형으로서 사용했다. 얻어진 단편을 BamHI(플라스토시아닌 프로모터 내) 및 SacI(p19 코딩 서열의 단부)로 절단하고, 동일한 제한 효소로 미리 절단해 둔 구성물 번호 660(SEQ ID NO:60; 도 51)에서 클로닝하여 구성물 번호 R472를 얻었다. 플라스미드 R472를 도 86에 나타낸다.

3. 식물 바이오매스의 제조, 접종물 , 아그로 -침윤, 및 수거

시판 피트모스 용토로 채운 플랫에서 Nicotiana benthamiana 또는 Nicotiana tabacum 식물을 종자로부터 성장시켰다. 식물은 16/8 광주기 및 25℃ 주/20℃ 야의 온도 체제의 온실에서 성장시켰다. 파종 3주 후에 각 묘목을 선별하여 화분에 옮겨 심고 온실에서 동일한 환경 조건하에 3주 더 성장시켰다. 형질전환 전에 하기 나타낸 여러 시점에서 식물로부터 싹을 잘라내거나 식물을 화학적으로 처리하여 정아와 액아를 제거하였다.

각 구성물로 트랜스펙션한 Agrobacteria를 10mM 2-[N-모르폴리노]에탄올술폰(MES), 20μM 아세토시링곤, 50μg/ml 카나마이신 및 25μg/ml 카르베니실린 pH 5.6으로 보충한 YEB 배지에서 OD600이 0.6 내지 1.6에 도달할 때까지 성장시켰다. 사용하기 전에 Agrobacterium 현탁액을 원심분리한 다음, 침윤 배지(10mM MgCl2 및 10mM MES pH 5.6)에 다시 현탁시켰다. 주사기-침윤을 Liu and Lomonossoff(2002, Journal of Virological Methods, 105:343-348)에 의해 설명된 대로 수행했다. 진공-침윤시에는 A. tumefaciens 현탁액을 원심분리하고 침윤 배지에 다시 현탁시킨 다음, 4℃에서 하룻밤 보관했다. 침윤일에 배양물 배치를 2.5 배양물 부피로 희석하고 가온하여 사용하였다. N. benthamiana 또는 N. tabacumw 전체 식물을 20-40 Torr의 진공 기밀 스테인리스 스틸 탱크 안의 박테리아 현탁액 중에 2분간 거꾸로 두었다. 주사기 또는 진공 침윤 후 식물을 온실로 다시 보내서 2-6일간 인큐베이션한 다음 수거하였다. 달리 명시되지 않는다면, 모든 침윤은 AGL1/35S-HcPro와 1:1 비율로 공-침윤으로서 수행하였고, 예외적으로 CPMV-HT 카세트-보유 균주만 균주 AGL1/R472와 1:1 비율로 공-침윤되었다.

4. 잎 표본채취 및 총 단백질 추출

인큐베이션 후, 식물의 기생부를 수거하고 -80℃에서 냉동시켜 조각으로 분쇄했다. 차가운 50mM Tris pH 7.4, 0.15M NaCl 및 1mM 불화 페닐메탄술포닐 3 부피 중에서 냉동-분쇄된 식물 구성물질의 각 샘플을 균질화(Polytron)하여 총 가용성 단백질을 추출했다. 균질화 후, 슬러리를 4℃에서 20분간 20,000g로 원심분리하고, 맑은 조 추출물(상청액)을 분석용으로 간수했다. 맑은 조 추출물의 총 단백질 함량을 소 혈청 알부민 기준물질을 사용하여 Bradford 분석(Bio-Rad, Hercules, CA)에 의해 측정했다.

5. 단백질 추출물의 크기 배제 크로마토그래피

32mL Sephacryl™ S-500 고 분해 비드(S-500 HR: GE Healthcare, 스웨덴 웁살라, Cat. No.17-0613-10)의 크기 배제 크로마토그래피(SEC) 칼럼을 충전하고, 평형화/용출 버퍼(50mM Tris pH 8, 150mM NaCl)를 사용하여 평형으로 만들었다. 조 단백질 추출물 1.5mL를 컬럼에 로딩하고, 45mL 평형화/용출 버퍼를 사용하여 용출 단계를 시작했다. 용출물을 1.5ml 분획씩 수집하고, 분획 10μL와 희석된 Bio-Rad 단백질 염료 시약(Bio-Rad, Hercules, CA) 200μL를 혼합하여 용출된 분획의 상대 단백질 함량을 모니터했다. 2 칼럼 부피의 0.2N NaOH와 10 칼럼 부피의 50mM Tris pH 8, 150mM NaCl, 20% 에탄올로 차례로 칼럼을 세척했다. 분리 후에는 매번 블루 덱스트란 2000(GE Healthcare Bio-Science Corp., Piscataway, NJ, USA)으로 칼럼을 캘리브레이션했다. 매 분리 사이에 블루 덱스트란 2000과 숙주 가용성 단백질의 용출 프로파일을 비교하여 사용된 칼럼들 간의 용출 프로파일의 균일성을 확보했다.

6. 단백질 분석 및 면역블롯팅

BCA 단백질 분석(Pierce Biochemicals, Rockport, IL)에 의해 단백질 농도를 측정했다. 단백질을 환원 조건하에 SDS-PAGE로 분리하고 코마시 블루로 염색했다. 염색된 겔을 스캔하고, ImageJ Software(NIH)를 사용하여 농도계 분석을 수행했다.

SEC 용출 분획으로부터의 단백질을 아세톤을 사용하여 침전시키고(Bollag et al, 1996), 평형화/용출 버퍼 1/5 부피에 다시 현탁시켜 환원 조건하에 SDS-PAGE로 분리한 다음, 이불화 폴리비닐렌(PVDF) 멤브레인(Roche Diagnostics Corporation, Indianapolis, IN) 위에 전기전달하여 면역검출하였다. 면역블로팅 전에 멤브레인을 4℃에서 5% 탈지유 및 Tris-완충 식염수 중의 0.5% Tween-20(TBS-T)으로 16-18시간 차단시켰다

TBS-Tween 20 0.1% 중의 2% 탈지유 중에 2μg/mL로 하여 적합한 항체(표 6)와 함께 인큐베이션하여 면역블롯팅을 수행했다. 화학발광 검출에 사용된 2차 항체는 표 4에 제시된 것들과 같으며, TBS-Tween 20 0.1% 중의 2% 탈지유 중에서 제시된 대로 희석하였다. 기질로서 루미놀(Roche Diagnostics Corporation)을 사용한 화학발광에 의해 면역반응성 복합체가 검출되었다. EZ-Link Plus® 활성화 퍼옥시다제 콘쥬게이션 키트(Pierce, Rockford, IL)를 사용하여 인간 IgG 항체의 양고추냉이 퍼옥시다제-효소 콘쥬게이션을 수행했다. H1, H3 및 B 서브타입의 검출에 대한 대조군으로서 사용된 불활성화된 전 바이러스(WIV)는 National Institute for Biological Standards and Control(NIBSC)로부터 구입했다.

H5에 대한 혈구응집 분석은 Nayak. and Reichl(2004)의 방법을 기초로 하였다. 간단히 말해서, 100μL PBS를 함유하는 V-바닥 96-웰 마이크로타이터 플레이트에서 웰 당 희석된 샘플이 100μL 남도록 시험 샘플(100μL)의 연속 2배 희석물을 제조했다. 0.25% 칠면조 적혈구 현탁액(Bio Link Inc., Syracuse, NY) 100μL를 각 웰에 가하고, 플레이트를 실온에서 2시간 인큐베이션했다. 완전한 혈구응집을 보인 최고 희석값의 역수를 HA 활성으로 기록했다. 병행해서 재조합 HA 표준물질을 PBS에 희석하여 각 플레이트에서 대조군으로 사용했다.

7. 수크로오스 구배 초원심분리

H5-함유 바이오매스 겔 여과 크로마토그래피로부터 용출된 분획 9, 10 및 11을 1mL씩 모아서 20-60%(w/v) 불연속 수크로오스 밀도 구배 위에 로딩하고, 17.5시간 125,000g로 원심분리했다(4℃). 이 구배에 의해 맨 위에서 시작하여 3mL씩 19개 분획으로 분별되었고, 면역학적 분석 및 혈구응집 분석 전에 투석하여 수크로오스를 제거하였다.

8. 전자현미경

Airfuge 초원심분리 관(Beckman Instruments, Palo Alto, CA, USA)에 시험할 샘플 100μL를 넣었다. 관 바닥에 그리드를 배치한 다음 120,000g로 5분간 원심분리했다. 그리드를 꺼내고 살짝 말린 다음, pH 6의 3% 텅스토인산 1 방울 위에 놓아 염색했다. 그리드를 Hitachi 7100 투과 전자현미경(TEM)에서 검사하였다(도 14b, 15b 및 15c의 이미지).

도 19는 약 1㎣의 잎 블록을 2.5% 글루타르알데히드를 함유하는 PBS 중에서 고정시키고, 3% 수크로오스를 함유하는 PBS로 세척한 다음, 1.33% 사산화오스뮴 중에서 고정-후 단계를 수행한 것의 이미지이다. 고정된 샘플을 Spurr 수지에 매립하고, 초박형 층을 그리드 위에 놓았다. 5% 우라닐 아세테이트와 0.2% 시트르산납을 사용하여 샘플을 양성 염색한 후 관찰하였다. 그리드를 Hitachi 7100 투과 전자현미경(TEM)에서 검사하였다.

9. 원형질막 지질 분석

원형질막(PM)을 담배 잎으로부터 얻어서, Mongrand 등에 따라서 폴리에틸렌글리콜 3350/덱스트란 T-500(각 6.6%)를 가진 수성 고분자 2-상 시스템 중에서 나누어 세포 분별한 후 BY2 세포를 배양했다. 모든 단계는 4℃에서 수행했다.

Bligh 및 Dyer에 따라서 상이한 분획들로부터 지질을 추출한 후에 정제했다. Lefebvre 등에 설명된 용매 시스템을 사용하는 일차원 HP-TLC에 의해 극성 지질과 중성 지질을 분리했다. Macala 등에 의해 설명된 대로 아세트산구리로 염색한 후 PM 분획의 지질을 검출했다. 지질의 이동 시간을 표준물질과 비교하여 지질을 확인했다(모든 표준물질은 Sigma-Aldrich(St-Louis, MO, USA)로부터 입수했고, SG만 Matreya, Pleasant Gap(PA, USA)에서 입수했다).

10. H5 VLP (A/ Indonesia /5/2005) 정제

N. benthamiana의 660-침윤된 냉동 잎을 시판 블렌더를 사용하여 50mM Tris pH 8, NaCl 150mM 및 0.04% 나트륨 메타-바이술파이트 1.5 부피 중에서 균질화하였다. 얻어진 추출물을 1mM PMSF로 보충하고 1M 아세트산으로 pH 6으로 조정한 다음, 42℃에서 5분간 가열했다. 열처리된 추출물에 규조토(DE)를 가하여 pH 이동과 열처리로 인해 침전된 오염물질을 흡착시키고, 슬러리를 Whatman 종이 필터로 여과했다. 얻어진 맑은 추출물을 실온에서 10분간 10,000g로 원심분리하여 잔류 DE를 제거하고, 0.8/0.2μm Acropack 20 필터를 통과시키고, 페투인-아가로오스 친화성 칼럼(Sigma-Aldrich, St-Louis, MO, USA)에 로딩했다. 400mM NaCl, 25mM Tris pH 6에서 세척한 후, 결합된 단백질을 1.5M NaCl, 50mM MES pH 6을 사용하여 용출시켰다. 용출된 VLP를 최종 농도 0.0005%(v/v)로 Tween-80으로 보충했다. VLP를 100 kDa MWCO Amicon 멤브레인 상에서 농축하고 4℃에서 30분간 10,000g로 원심분리한 다음, 0.01% Tween-80 및 0.01% 티메로살을 함유한 PBS pH 7.4에 다시 현탁시켰다. 사용하기 전에 현탁된 VLP를 여과 멸균했다.

11. 동물 연구

마우스

6-8주 된 암컷 BALB/c 마우스(Charles River Laboratories)를 사용하여 인플루엔자 VLP 투여에 따른 면역반응에 관한 연구를 수행했다. 70마리의 마우스를 5마리씩 14개 그룹으로 무작위로 나누었다. 8개 그룹은 근육내 면역화에 사용했고, 6개 그룹은 비내 투여 경로를 시험하는데 사용했다. 모든 그룹은 2회-용량 섭생으로 면역화했고, 추가 면역화는 1차 면역화 후 제3주에 수행했다.

뒷다리에 근육내 투여하는 것에 있어서, 마취하지 않은 마우스를 식물-제조 H5 VLP(A/Indonesia/5/2005(H5N1)) 백신(0.1, 1, 5 또는 12μg), 또는 대조군 헤마글루티닌(H5) 항원으로 면역화했다. 대조군 H5는 균주 A/Indonesia/5/05 H5N1에 기초하여 생산되고 293 세포 배양물(Immune Technology Corp., New York, USA)로부터 정제된 재조합 가용성 헤마글루티닌을 포함했다(달리 지시되지 않는다면 주사 당 5μg 사용). 버퍼 대조군은 PBS였다. 이 항원은 HA 단백질의 아미노산 18-530으로 구성되며, His-택과 변형된 절단 부위를 가진다. 전자현미경으로 이 시판 제품은 VLP의 형태가 아니라는 것을 확인했다.

애쥬번트의 효과를 측정하기 위해서 5μg 식물-제조 VLP H5 백신과 1 부피의 Alhydrogel 2%(명반, Accurate Chemical & Scientific Corporation, Westbury, NY, US) 또는 293 세포 배양물로부터 정제된 5μg 재조합 헤마글루티닌과 1 부피의 명반으로 두 그룹의 동물을 면역화했다. 70마리의 마우스를 5마리씩 14개 그룹으로 무작위로 나누었다. 8개 그룹은 근육내 면역화에 사용했고, 6개 그룹은 비내 투여 경로를 시험하는데 사용했다. 모든 그룹은 초회-추가 섭생에 따라서 면역화했고, 추가 면역화는 최초 면역화 후 제3주에 수행했다.

뒷다리에 근육내 투여하는 것에 있어서, 마취하지 않은 마우스를 식물-제조 H5 VLP(0.1, 1, 5 또는 12μg), 또는 대조군 헤마글루티닌(HA) 항원(5μg) 또는 PBS로 면역화했다. 모든 항원 제제는 면역화 전에 1:1의 부피비로 Alhydrogel 1% (명반, Accurate Chemical & Scientific Corporation, Westbury, NY, US)과 혼합했다. 애쥬번트의 효과를 측정하기 위해서 두 그룹의 동물을 5μg 식물-제조 VLP H5 백신 또는 5μg 대조군 HA 항원으로 어떤 애쥬번트도 없이 면역화했다.

비내 투여에 있어서, 자동 유도 챔버를 사용하여 이소플루란을 흡입시켜 마우스를 간단히 마취시켰다. 다음에, 식물-제조 VLP 백신(0.1 또는 1μg) 또는 대조군 HA 항원(1μg), 또는 PBS를 콧구멍 당 4μl 방울을 가하여 마우스를 면역화했다. 모든 항원 제제는 면역화 전에 키토산 글루타메이트 1%(Protosan, Novamatrix /FMC BioPolymer, 노르웨이)와 혼합했다. 다음에, 마우스를 용액 중에서 호흡시켰다. 비내 투여 경로에 있어서 애쥬번트의 효과를 확인하기 위하여 두 그룹의 동물을 1μg 식물-제조 VLP H5 백신 또는 1μg 대조군 HA 항원으로 면역화했다.

흰족제비

5마리씩 10개 그룹(수컷, 18-24주령, 질량 약 1kg)을 사용했다. 각 그룹에 대한 치료는 표 7에 설명한 대로이다. Alhydrogel(명반)(Superfos Biosector, 덴마크) 2%(최종 = 1%)를 애쥬번트로 사용하였다. 백신 조성물은 설명된 대로 생산된 막-관련 A/Indonesia/5/05(H5N1) VLP였다. 백신 대조군(양성 대조군)은 Immune Technology Corporation(ITC)에 의해 293 세포 배양물 중에서 아데노바이러스를 사용하여 생산된 Indonesia 균주로부터의 완전히 글리코실화된 막-결합 재조합 H5였다.

전반적인 건강 및 상태(체중, 직장 온도, 자세, 털, 운동 패턴, 호흡, 배설물)에 대해 연구하는 동안 규칙적으로 흰족제비를 평가했다. 제0일, 제14일 및 제28일에 사두근에 근육내 주사(총 부피 0.5-1.0)하여 동물을 면역화했다. 애쥬번트를 포함하는 프로토콜에 있어서는 면역화 직전에 1:1의 부피비로 Alhydrogel와 백신 조성물을 혼합했다. 면역화 전 제0일, 제21일 및 제35일에 혈청 샘플을 획득했다. 제40-45일에 동물을 죽이고(방혈/심장천공), 비장을 수거하여 검시를 수행했다.

동종성 또는 이종성 불활성화 H5N1 바이러스를 사용하는 ELISA 분석에 의해 항-인플루엔자 항체 역가를 정량할 수 있다.

혈청 샘플(면역화-전, 제21일 및 제35일)의 혈구응집 억제 항체 역가를 설명된 대로 마이크로타이터 HAI에 의해 평가했다(Aymard et al., 1973). 간단히 말해서, 혈청을 수용체-파괴 효소로 전처리하고 열 불활성화시킨 다음, 적혈구(세척된 적혈구-RBC) 현탁액과 혼합했다. Lampire로부터의 말의 세척된 RBC(10%)가 권장되며, RBC(말-의존성)의 출처에 따라서 분석법은 다양할 수 있다고 생각되는데, 10마리의 말로부터 세척된 RBC를 시험하여 가장 민감한 배치를 선택했다. 대안으로서, 칠면조 RBC가 사용될 수 있다. 항체 역가는 혈구응집을 완전히 억제한 최고 희석값의 역수로서 표시하였다.

교차-반응성 HAI 역가: A/Indonesia/5/05(clade 2.1)에 대한 백신으로 면역화된 흰족제비의 HAI 역가를 클레이드 1 Vietnam 균주 A/Vietnam/1203/2004 및 A/ Vietnam/1194/2004 또는 A/Anhui/01/2005(subclade 2.3) 또는 A/turkey/Turkey/1/ 05(subclade 2.2) 등의 다른 서브클레이드 또는 클레이드로부터의 불활성화된 H5N1 인플루엔자 균주를 사용하여 측정했다. 모든 분석은 개별 샘플에 대해 수행했다.

데이터 분석: 그룹 간 차이가 통계적으로 유의한지를 입증하기 위하여 모든 데이터에 대해 통계적 분석(ANOVA)이 수행되었다.

치사적 시험감염에 대한 실험 디자인(마우스)

128마리의 마우스를 8마리씩 16개 그룹으로 무작위로 나누었고, 1개 그룹은 면역화하지 않고 시험감염시키지 않았다(음성 대조군). 모든 그룹을 2-용량 섭생으로 근육내 투여에 의해 면역화했고, 2차 면역화는 1차 면역화 후 제2주에 수행했다.

뒷다리에 근육내 투여하는 것에 있어서, 마취하지 않은 마우스를 식물-제조 H5 VLP(1, 5 또는 15μg), 또는 15μg 대조군 HA 항원 또는 PBS로 면역화했다. 모든 항원 제제는 면역화 전에 1 부피의 Alhydrogel 1%(명반, Accurate Chemical & Scientific Corporation, Westbury, NY, US)와 혼합했다.

면역화 기간 동안 주 1회 마우스의 체중을 재고, 주사 부위에서 국소 반응을 관찰하여 모니터하였다.

인플루엔자 A/Turkey/582/06 바이러스(Dr. Bruno Lina(Lyon University, 프랑스 리용)에 의해 제공)의 4.09 x 10⁶ 50% 세포 배양물 감염 용량(CCID50)을 사용하여 2차 면역화 후 제22일에 BL4 봉쇄 연구실(P4-Jean Merieux-INSERM, 프랑스 리용)에서 마취된 마우스를 비내 경로(i.n.)로 시험감염시켰다. 시험감염 후 14일에 걸쳐서 마우스의 질병 임상 증상 및 체중을 매일 관찰했다. 중증 감염 증상과 25% 이상의 체중 손실을 나타낸 마우스를 마취한 후 안락사시켰다.

혈액 채취, 폐 및 코 세척 및 비장 수거

1차 면역화 후 제14일과 2차 면역화 후 제14일에 마취하지 않은 동물에서 외측 복재 정맥혈을 채취했다. 10분간 8,000g으로 원심분리하여 혈청을 수집했다.

2차 면역화 후 제4주에 마우스를 이산화탄소 가스로 마취하고, 종결 즉시 심장을 천공하여 혈액을 채취했다.

마지막 방혈 후, 카테테르를 폐 쪽으로 기관으로 삽입하고, 차가운 PBS-프로테아제 억제제 칵테일 용액 1mL를 카테테르에 부착된 얼음 주사기에 넣어 폐에 주사한 다음 분석을 위해 인출했다. 이 세척 과정을 2번 수행했다. 폐 세척액을 원심분리하여 세포 파편을 제거했다. 코 세척을 위해서는 카테테르를 코 부분 쪽으로 삽입하고, PBS-프로테아제 억제제 칵테일 용액 0.5mL를 카테테르를 통해 비강에 집어넣은 다음 수집했다. 코 세척액을 원심분리하여 세포 파편을 제거했다. 애쥬번트 첨가 식물-제조 백신 5μg 또는 애쥬번트 첨가 재조합 H5 항원 5μg으로 근육내 면역화한 마우스와 애쥬번트 첨가 식물-제조 백신 1μg 또는 애쥬번트 첨가 재조합 H5 항원 1μg으로 비내 면역화한 마우스에서 비장을 수거했다. 수거한 비장을 젠타마이신 보충된 RPMI에 두고, 50mL 원뿔형 시험관에서 10mL 주사기의 플런저로 짓이겼다. 짓이긴 비장을 2번 헹구고 5분간 2,000rpm으로 원심분리한 다음, 실온에서 5분간 ACK 세포용해 버퍼에 다시 현탁시켰다. 비장세포를 PBS-젠타마이신으로 세척하고 5% RPMI에 다시 현탁시킨 다음 계수했다. 비장세포를 증식 분석에 사용했다.

항체 역가

혈청의 항-인플루엔자 항체 역가를 1차 면역화 후 제14일과 2차 면역화 후 제14일 및 제28일에 측정했다. 불활성화 바이러스 A/Indonesia/5/05를 코팅 항원으로서 사용하여 효소-결합 면역흡착 분석(ELISA)에 의해 역가를 결정했다. 종말점 역가는 음성 대조군 샘플보다 적어도 0.1 더 높은 OD 값에 도달했던 최고 희석값의 역수로서 표시하였다.

항체 부류 결정(IgG1, IgG2a, IgG2b, IgG3, IgM)을 위해서 앞서 설명된 대로 ELISA에 의해 역가를 평가했다.

혈구응집 억제( HI ) 역가

앞서 설명된 대로 2차 면역화 후 제14일 및 제28일에 혈청의 혈구응집 억제(HI) 역가를 측정했다(WHO 2002; Kendal 1982). 균주 A/Indonesia/5/05 또는 A/ Vietnam/1203/2004로부터의 불활성화된 바이러스 제제를 사용하여 마우스 혈청 샘플을 HI 활성에 대해서 시험했다. Vibrio cholerae로부터 제조된 수용체-파괴 효소 II(RDE II)(Denka Seiken Co., 일본 도쿄)로 혈청을 전처리했다((Kendal 1982). 0.5% 칠면조 적혈구를 사용하여 HI 분석을 수행했다. HI 항체 역가는 완전한 응집 억제를 야기한 최고 희석값의 역수로서 정의하였다.

실시예

실시예 1: N. benthamiana 식물에서 아그로 -침윤에 의한 인플루엔자 바이러스 A/Indonesia/5/05(H5N1) 헤마글루티닌의 일시 발현

균주 A/Indonesia/5/05(H5N1)로부터의 H5 서브타입의 발현을 통해 인플루엔자 헤마글루티닌을 생산하는 일시 발현 시스템을 능력을 측정했다. 도 11에 나타낸 대로, 먼저 자생 신호 펩티드와 막통과 도메인을 갖는 헤마글루티닌 유전자 코딩 서열(GenBank Accession No. EF541394)을 플라스토시아닌 발현 카세트 - 자주개자리 플라스토시아닌 유전자로부터의 프로모터, 5' UTR, 3' UTR 및 전사 종결 서열 - 에서 조립하고, 조립된 카세트(660)를 pCAMBIA 바이너리 플라스미드에 삽입했다. 다음에, 이 플라스미드를 Agrobacterium(AGL1)에서 트랜스펙션하여 재조합 균주 AGL1/660을 만들어 일시 발현에 사용했다.

N. benthamiana 식물을 AGL1/660로 침윤시키고, 잎을 수거하여 6일간 인큐베이션했다. 아그로-침윤된 잎에 H5가 축적되었는지 결정하기 위해, 먼저 침윤된 잎 조직으로부터 단백질을 추출한 다음, 항-H5(Vietnam) 다클론성 항체를 사용하여 웨스턴 블롯팅에 의해 분석했다. 추출물에서는 약 72kDa에서 독특한 밴드가 검출되었는데(도 12), 이것은 인플루엔자 헤마글루티닌의 미절단 HA0 형태의 크기에 해당한다. 양성 대조군으로서 사용된 시판 H5(A/Vietnam/1203/2004; Protein Science Corp., Meriden, CT, USA)는 약 48kDa와 28kDa에 2개의 밴드로서 검출되었으며, 이것은 각각 HA1과 HA2의 분자량에 해당한다. 이로써 침윤된 잎에서 H5의 발현이 절단되지 않은 번역 산물의 축적을 가져온다는 것이 증명되었다.

AGL1/660-형질전환된 잎으로부터의 조 단백질 추출물이 칠면조 적혈구를 응집시키는 능력에 의해 활성 HA 삼량체의 형성이 증명되었다(데이터 나타내지 않음).

실시예 2: 크기 배제 크로마토그래피를 사용한 식물 추출물 중의 헤마글루티닌-함유 구조의 특성화

식물에서 생산된 인플루엔자 헤마글루티닌의 고 분자량 구조로의 회합을 겔 여과에 의해 평가했다. AGL1/660-침윤된 식물로부터의 조 단백질 추출물(1.5mL)을 Sephacryl™ S-500 HR 칼럼(GE Healthcare Bio-Science Corp., Piscataway, NJ, USA)에서 크기 배제 크로마토그래피(SEC)에 의해 분별했다. 항-HA 항체를 사용한 면역검출에 의해서 총 단백질 함량과 HA 양에 대해 용출 분획을 평가했다(도 13a). 도 13a에 도시된 대로, 블루 덱스트란(2MDa) 용출은 분획 10에서 이른 피크를 나타냈지만, 숙주 단백질의 벌크는 칼럼에 보유되었다가 분획 14 내지 22에서 용출되었다. 각 SEC 용출 분획 200μL로부터 단백질을 아세톤 침전에 의해 농축(5배)하여 웨스턴 블롯팅에 의해서 분석했을 때(도 15a, H5), 헤마글루티닌(H5)은 주로 분획 9 내지 14에서 발견되었다(도 13b). 이론과 결부시키고 싶지는 않지만, 이것은 HA 단백질이 커다란 수퍼구조로 회합되었거나, 또는 고 분자량 구조에 부착된 것을 시사한다.

A/New Caledonia/20/99(H1N1)(SEQ ID NO: 33; 도 16; GenBank Accession No. AY289929)로부터의 H1 핵산 서열을 사용하여 두 번째 발현 카세트를 조립하여 구성물 540(도 11)을 만들었다. 식물 단백질 이황화물 이소머라제 유전자로부터 기원하는 신호 펩티드, 및 H1의 막통과 도메인을 삼량체로 자체 조립하는 것으로 밝혀진 펩티드인 GCN4 로이신 지퍼의 pII로 치환하여 H1의 가용성 삼량체 형태를 생산하도록 키메라 유전자 구성물을 디자인했다(카세트 544, 도 11). 막통과 도메인을 결여하기는 하지만 이 가용성 삼량체 형태도 혈구응집을 할 수 있었다(데이터 나타내지 않음).

AGL1/540 또는 AGL1/544로 침윤된 식물로부터의 단백질 추출물을 SEC에 의해 분별하고, 항-인플루엔자 항체를 사용하여 웨스턴 블롯팅에 의해 H1 용출된 분획의 존재를 시험했다(Fitzgerald, Concord, MA, USA). AGL1/540-침윤된 잎에서는 H1이 상당한 고 분자량 구조로서 주로 축적되었고, 피크는 더 작은 크기의 구조 쪽에서 비대칭으로 나타난다(H1; 도 13c). AGL1/544-침윤된 잎에서는 H1의 가용성 구조가 분리된 삼량체로서 축적되었는데, 이것은 숙주 단백질 용출 프로파일과 평행인 겔 여과로부터의 용출 패턴에 의해 증명된다(가용성 H1; 도 13d). 비교하면 H1 로제트(Protein Science Corp., Meriden, CT, USA)는 H1의 가용성 형태(도 13d)보다는 이르고 자생 H1(도 13c)보다는 늦게 분획 12 내지 16(도 13e)에서 용출된 헤마글루티닌의 5-6개 삼량체의 미셀에 존재한다.

헤마글루티닌의 구조체 회합에 대한 M1 공-발현의 영향을 평가하기 위해, A/ PR/8/34(H1N1) M1(SEQ ID NO: 35; 도 18; GenBank Accession No. NC_002016)의 코딩 서열에 해당하는 핵산을 사용하여 M1 발현 카세트를 조립했다. 이 구성물은 750으로 명명했고 도 11에 나타낸다. M1과 H1의 공-발현을 위해 침윤 전에 AGL1/540과 AGL1/750의 현탁액을 동 부피로 혼합했다. 다수 Agrobacterium 현탁액의 공-침윤은 다수 트랜스젠의 공-발현을 허용한다. SEC 용출 분획의 웨스턴 블롯 분석은 M1의 공-발현이 H1 구조의 용출 프로파일을 바꾸지는 않았지만, 아그로-침윤된 잎에서 H1의 축적을 감소시켰음을 나타낸다(도 13f 참조).

실시예 3: 농도차 수크로오스 중 원심분리에 의한 H5 구조의 분리 및 전자현미경 관찰

전자현미경(EM)에서 헤마글루티닌의 구조를 관찰하려면 잎 단백질 조 추출물에 대한 SEC로부터 획득된 것보다 높은 농도 및 순도 수준이 필요하다. H5 구조의 EM 관찰을 가능하게 하기 위해서 잎 단백질 조 추출물을 먼저 PEG 침전(20% PEG)에 의해 농축한 다음, 1/10 부피의 추출 버퍼에 다시 현탁시켰다. 농축된 단백질 추출물을 S-500 HR 겔 여과에 의해 분별하고, 용출 분획 9, 10 및 11(빈 칼럼 부피에 해당)을 모은 다음, 20-60% 수크로오스 밀도 구배로 초원심분리하여 해당 단백질로부터 더 분리했다. 농도차 수크로오스를 맨 위부터 시작하여 분별한 다음, 분획을 투석하고, 100 NMWL 원심분리 필터 유닛에서 농축하여 분석했다. 웨스턴 블롯 및 혈구응집 결과(도 14a)에서 나타난 대로, H5는 약 60% 수크로오스를 함유했던 분획 16 내지 19에 주로 축적되었고, 숙주 단백질은 대부분 분획 13에서 피크를 나타냈다. 분획 17, 18 및 19를 모아서 음성 염색하고 EM으로 관찰했다. 이 샘플의 시험은 인플루엔자 VLP의 형태학적 특징과 일치하는 80 내지 300nm 크기 범위의 스파이크된 구형 구조의 존재를 분명히 증명했다(도 14b).

실시예 4: 식물 바이오매스로부터 인플루엔자 H5 VLP 의 정제

가용성 단백질의 풍부한 함량에 더하여, 식물 잎 추출물은 가용성 당, 핵산 및 지질의 복잡한 혼합물을 함유한다. pH를 이동시키고 열처리한 다음, 규조토로 여과하여 조 추출물을 정화하였다(정화 방법의 상세한 설명은 재료 및 방법 섹션을 참조한다). 도 15a(레인 1-4)는 여러 정화 단계에서의 단백질 함량을 비교한 코마시 블루 염색된 겔을 나타낸다. 조 추출물(레인 1)과 정화된 추출물(레인 4) 중의 단백질 함량의 비교는 전반적인 단백질 함량을 감소시키고 잎 조 추출물에서 50kDa에서 보이는 주 오염물질을 대부분 제거하는 정화 단계의 능력을 드러낸다. 50kDa 밴드는 큰 RuBisCO 서브유닛에 해당하며, 총 잎 단백질의 30%까지 나타난다.

이들 정화된 추출물로부터 인플루엔자 H5 VLP를 페투인 칼럼에서 친화성 크로마토그래피에 의해 정제했다. 통과하면서 로딩된 분획(도 15a, 레인 5)과 용출된 VLP(도 15a, 레인 7)의 비교는 정화된 식물 추출물에서 인플루엔자 H5 VLP에 대한 페투인 친화성 칼럼의 특이성을 증명한다.

정제 과정은 H5에서 75%를 넘는 순도를 가져왔으며, 이것은 코마시 블루 염색된 SDS-PAGE 겔 상에서 밀도계에 의해 측정된다(도 15a, 레인 7). 정제된 산물의 구조적 특질을 평가하기 위해, 정제된 H5를 100 NMWL(공칭 분자량 한계) 원심분리 필터 유닛에서 농축하고 음성 염색하여 EM에서 검사하였다. 도 15b는 VLP의 존재가 풍부하게 보이는 대표적인 섹터를 도시한다. 근접 검사에 의해 VLP 상의 스파이크의 존재가 확인되었다(도 15c).

도 15d에 도시된 대로, 코마시 블루 염색된 H5 헤마글루티닌의 밀도 및 BCA 방법에 의한 총 단백질 결정에 기초하여, 페투인 칼럼에서 친화성 크로마토그래피에 의해 정화된 잎 추출물로부터 H5 VLP를 약 89% 순도까지 정제했다.

칠면조 적혈구를 응집시키는 능력에 의해 HA VLP의 생물활성을 확인하였다(데이터 나타내지 않음).

또한, 도 15d에서는 항-H5 다클론성 혈청(A/Vietnam/1203/2004)을 사용한 웨스턴 블롯팅 및 면역검출에 의해서 시각화된 정제된 VLP의 정체가 확인된다. 대략 72kDa에서 독특한 밴드가 검출되며, 이것은 인플루엔자 헤마글루티닌의 미절단 HA0 형태의 크기에 해당한다. 도 15c는 헤마글루티닌 스파이크가 구조를 덮고 있는 백신의 VLP 구조를 도시한다.

VLP를 0.22μm 필터를 통해 여과하여 마우스의 면역화에 알맞게 제형화하고, 내독소 LAL(리물루스 유주세포 용해물) 검출 키트(Lonza, Walkserville, MS, USA)를 사용하여 내독소 함량을 측정하였다. 여과된 백신은 105.8±11.6% EU/mL(내독소 유닛/mL)를 함유했다.

실시예 5: 식물에서 인플루엔자 VLP 의 국부화

VLP를 국부화하고 이들의 원형질막 기원을 확인하기 위해, H5-생산 식물의 얇은 잎 절편을 고정한 다음, 양성 염색하여 TEM으로 검사했다. 잎 세포의 관찰에서 원형질막의 함입에 의해 형성된 세포외 공동 내에 VLP가 존재하는 것으로 나타났다(도 19). 관찰된 VLP의 모양 및 위치에 의해 세포벽 상에 이들의 원형질막이 나란히 놓임에도 식물 세포가 이들의 원형질막으로부터 유래하는 인플루엔자 VLP를 생산하여 이들을 아포플라스트 공간에 축적하는데 필요한 형성성을 가진다는 것이 증명되었다.

실시예 6: 원형질막 지질 분석

지질 함량의 분석으로부터 식물 인플루엔자 VLP의 조성 및 기원을 추가로 확인하였다. 정제된 VLP로부터 지질을 추출하고, 이들의 조성을 고성능 박층 크로마토그래피(HP-TLC)에 의해 고도 정제된 담배 원형질막의 조성과 비교했다. VLP 및 대조군 원형질막의 극성 지질과 중성 지질의 이동 패턴은 유사했다. 정제된 VLP는 원형질막에서 발견되는 주요 인지질(포스파티딜콜린 및 포스파티딜에탄올아민)과 스핑고지질(글루코실-세라마이드)를 함유했으며(도 27a), 양쪽 다 유일한 중성 지질로서 자유 스테롤을 함유했다(도 27b). 그러나, 정제된 VLP 추출물에서 원형질막 단백질 마커(ATPase)의 면역검출은 VLP 지질 이중층이 식물 원형질막과 관련된 주요 단백질 중 하나를 함유하지 않는다는 것을 나타냈으며, 이것은 숙주 단백질이 VLP가 식물 세포로부터 발아하는 과정 동안 원형질막으로부터 배제되지 않았을 가능성을 시사한다(도 27c).

실시예 7: H5 VLP 의 면역원성 및 투여 경로의 영향

식물에서 제조된 H5 VLP를 근육내 주사 또는 비내 경로(흡입)에 의해 마우스에 투여했다. 설명된 방법에 따라서 애쥬번트로서 명반과 함께 VLP 0.1 내지 12ug을 근육내 주사했다. 5ug 재조합 가용성 헤마글루티닌(H5)와 유사한 크기로 최저 항원 양에서 최고 항체 역가가 관찰되었다(도 20a).

0.1 내지 1ug의 식물에서 제조된 H5 VLP를 키토산 애쥬번트와 함께 비내 투여했는데, 이것은 명반 애쥬번트를 함께 투여한 재조합 가용성 H5보다 큰 항체 반응을 제공했다(도 20b).

두 투여 경로 모두에서 일련의 항원 양에 걸쳐서 시험된 모든 마우스에서 혈청 전환이 관찰되었다. 재조합 H5 가용성 항원은 낮은(< 1/40) 또는 무시할만한(1 < 1/10, 애쥬번트 없는 재조합 H5) HI 역가를 부여했다.

실시예 8: 혈구응집 억제 항체 역가 ( HAI ) H5 VLP

도 21a 및 21b는 식물-제조 H5 VLP, 또는 재조합 가용성 H5로 "추가접종"한 후 제14일의 혈구응집 억제(HAI) 항체 반응을 예시한다. 근육내 투여했을 때 최저 항원 용량(0.1ug)은 재조합 가용성 H5의 10배 양의 투여(5ug)에 비해서 우수한 HAI 반응을 야기했다. H5 VLP의 용량 증가는 최저 용량에 비해 HAI의 그다지 많지 않은 증가를 제공했다.

비내 투여 후 HAI 반응은 1ug 재조합 가용성 H5를 투여한 마우스와 비교하여 식물-제조 H5 VLP(1.0 또는 0.1ug)를 투여한 마우스에서 상당히 증가했으며, 재조합 가용성 HA는 음성 대조군과 유사했다. H5 VLP(0.1에서 12μg)의 근육내 주사에 의해서 면역화된 모든 마우스는 대조군 H5 항원으로 면역화된 마우스보다 더 높은 HAI 역가를 가졌다(도 21a). 동일한 5μg 용량에서 VLP는 대조군 H5 항원의 상응하는 용량보다 20배 더 높은 HAI 역가를 유도했다. 또한, VLP는 비내 경로를 통해 송달되었을 때도 대조군 HA 항원보다 상당히 더 높은 HAI 역가를 유도했다(도 21b). 주어진 H5 VLP 용량에서 HAI 역가의 수준은 근육내 면역화된 마우스보다 비내 면역화된 마우스에서 더 낮았는데, 1μg VLP가 근육내 투여되었을 때 210의 평균 HAI 역가를 유도했지만, 동일한 용량이 비내 투여되었을 때는 34의 평균 HAI 역가를 유도했다.

근육내 투여되었을 때 모든 VLP 용량은 동종성의 불활성화된 전체 바이러스와 결합할 수 있는 항체를 높은 수준으로 유도했다(도 20a 및 24). 식물-제조 VLP 백신과 대조군 H5 항원 사이에 유의한 차이는 발견되지 않았으며(추가접종 제14일 후 12μg VLP 그룹을 제외하고), 두 항원 제제 모두 동종성 균주에 대해 높은 결합 항체 역가를 유도한다. 그러나, 비내 투여되었을 때는 대조군 H5 항원보다 VLP가 더 높은 결합 항체 역가를 유도했다(도 20b). 키토산과 혼합되었을 때 1μg VLP를 사용한 면역화는 5,500의 상호 평균 Ab 역가를 유도했으며, 이것은 대조군 HA 항원 1μg로 면역화된 마우스에서 발견된 수준(920의 상호 평균 Ab 역가)보다 8.6배 더 높은 것이었다.

다음에, 식물-유래 인플루엔자 VLP의 면역원성을 마우스에서 용량-범위 연구를 통해 조사했다. 5마리씩의 BALB/c 마우스의 그룹을 명반 중에서 조제된(1:1의 비율) 인플루엔자 A/Indonesia/5/05(H5N1)로부터의 HA를 함유한 VLP를 0.1μg 내지 12μg 을 사용하여 3주 간격으로 2번 근육내 면역화했다. 불활성화된 전 바이러스 항원(A/Indonesia/5/05(H5N1))을 사용하여 2차 면역화 후 제14일에 수집된 혈청에 대해 혈구응집 억제 역가(HI 또는 HAI)를 측정했다. 0.1μg 정도의 sjw은 VLP 용량을 사용한 면역화가 항체 생산을 유도했으며, 이것은 높은 희석값에서 바이러스가 적혈구를 응집하는 것을 억제했다(도 21a). 병행하여 5μg의 비-VLP 명반-애쥬번트 대조군 H5 항원(역시 A/Indonesia/5/05 유래)으로 마우스를 면역화한 것은 최저 VLP 용량에서 달성된 것보다 2-3 log 더 낮은 HI 반응을 유도한다.

두 투여 경로 모두에서 일련의 항원 양에 걸쳐서 HAI 반응은 VLP 투여한 마우스에서 우수하다.

실시예 9

H5 VLP 의 면역원성에 대한 애쥬번트의 효과

식물-제조 H5 VLP는 원형질막 기원을 가진다(도 19, 실시예 5). 이론과 결부시키고 싶지는 않지만, 외피보유 바이러스 또는 외피보유 바이러스의 VLP는 일반적으로 그들이 발아한 막으로부터 외피를 획득한다. 식물 원형질막은 동물 세포에서도 드물게 발견되는 피토스테롤 성분을 가지며, 이들 스테롤 중 몇 가지는 면역자극 효과를 나타내는 것으로 증명되었다.

식물-제조 H5 VLP를 애쥬번트의 존재 또는 부재하에 근육내(도 22a) 또는 비내(도 22b) 경로에 의해 마우스에 투여하고 HAI(혈구응집 억제 항체 반응)를 측정했다. 첨가된 애쥬번트(명반 또는 키토산, 실시예에서와 같이)의 존재 또는 부재하에 VLP는 양쪽 투여 시스템에서 재조합 가용성 H5보다 상당히 더 큰 HAI 헤마글루티닌 억제를 나타냈다. 애쥬번트(즉, 명반 또는 키토산)를 첨가하지 않았을 때도 식물-제조 H5 VLP는 상당한 HAI를 나타내는데, 이것은 항원 투여에 대한 전신적 면역반응의 징표이다.

명반은 HAI 역가의 평균 수준을 VLP의 근육내 투여(도 22a)에서 5배까지, 대조군 H5 항원에 대해서는 3.7배까지 증진시켰다. 근육내 투여되었을 때 5μg VLP는 상응하는 용량의 대조군 H5 항원보다 12배 더 높은 평균 HAI 역가를 유도했다. 키토산은 대조군 H5 항원(도 22b)의 평균 HAI 수준은 증가시키지 않았지만, VLP를 1μg 비내 투여하여 면역화한 마우스의 평균 HAI 수준을 5배까지 증가시켰다.

실시예 10: 항체 이소타입

첨가된 애쥬번트로서 명반의 존재 또는 부재하에 식물-제조 H5 VLP 또는 재조합 가용성 H5를 투여한 마우스는 여러 가지 면역글로불린 이소타입을 나타낸다(도 23a).

애쥬번트를 첨가했을 때는 VLP 및 재조합 H5의 항체 이소타입 프로파일이 유사하며, IgG1이 우세한 이소타입이다. VLP 또는 재조합 H5를 애쥬번트를 첨가하지 않고 투여했을 때는 IgG1 반응이 감소하기는 하지만 VLP에 대해서 여전히 우세한 이소타입 반응이며, IgM, IgG2a, IgG2B 및 IgG3는 애쥬번트를 첨가했을 때와 유사한 역가를 유지한다. IgG1, IgG2a 및 IgG2b 역가는 애쥬번트를 첨가하지 않고 재조합 H5를 투여했을 때 현저히 감소한다(도 23a).

따라서, 이들 데이터는 식물-제조 VLP에서는 숙주에서 항체반응을 도출하기 위해 애쥬번트를 첨가할 필요가 없다는 것을 증명한다.

첨가된 항원의 존재하에 식물-제조 VLP 또는 가용성 재조합 HA를 근육내 투여한 마우스에서 불활성화된 전체 인플루엔자 바이러스 균주(A/Indonesia/5/05; A/ Vietnam/1203/04)에 대한 항체 역가를 도 23b에 예시한다. 1ug 또는 5ug VLP 또는 5ug 가용성 HA를 투여한 마우스에서 이들 인플루엔자 균주에 대한 항체 역가에 있어서 유의한 차이는 관찰되지 않는다.

실시예 11: H5 VLP 백신에 의해 유도된 혈청 항체의 교차-반응성

상이한 균주의 불활성화된 전체 인플루엔자 바이러스에 대해 H5 VLP에 의해 유도된 혈청 항체의 교차-반응성을 평가했다. 모든 VLP 용량(0.1 내지 12μg)과 5μg의 대조군 HA 항원이 클레이드 1 균주(A/Vietnam/1194/04), 클레이드 2.1의 동종성 균주 A/Indonesia/5/05, 및 클레이드 2.2 균주 A/turkey/Turkey/1/05에 대해서 높은 결합 항체 역가를 유도했다(도 25a).

그러나, A/turkey/Turkey/1/05 균주에 대해서는 식물-제조 VLP만이 HAI 역가를 유도했다(도 25b). A/Indonesia/5/05에 대한 HAI 역가는 VLP에서 높았다.

실시예 12: 식물-제조 H5 VLP 를 사용한 면역화에 의해 부여된 교차-방어

설명된 2-용량 섭생에 따라서 A/Indonesia/5/05 H5 VLP를 미리 투여한 마우스를 이어서 인플루엔자 A/Turkey/582/06(H5N1)("Turkey H5N1") 감염성 바이러스로 비내 경로에 의해 시험감염시키고 관찰했다. 동물 당 투여된 용량은 10 LD50(4.09 X 10⁵ CCID50)이었다.

시험감염 후 제7일까지 PBS 백신 대조군을 투여한 마우스의 단지 37.5%만이 Turkey H5N1에 노출된 후에 생존했다(도 26a). 대조군 항원(HA), 또는 1, 5 또는 15ug의 Indonesia H5 VLP를 투여한 동물의 100%가 실험 종료일인 시험감염 후 제17일까지 생존했다.

또한, 실험하는 동안 마우스의 체중을 모니터하고, 생존한 마우스의 평균 체중을 그래프화했다(도 26b). 시험감염 전에 1, 5 또는 15ug의 Indonesia H5 VLP를 투여한 마우스는 실험 과정 도중에 알아챌 만한 체중 손실이 없었으며, 특히 5ug의 VLP를 투여한 마우스는 체중이 상당히 증가한 것으로 나타난다. 음성 대조군 마우스(Turkey H5N1 시험감염 무)도 알아챌 만한 체중의 증가나 손실이 없었다. 양성 대조군 마우스(VLP를 투여하지 않고 Turkey H5N1로 시험감염)는 시험 과정 동안 상당한 체중 손실을 나타냈으며 이들 중 3마리는 죽었다. 체중은 코호트 내 전체 마우스의 평균이므로, "가장 위중한" 마우스(죽은 3마리)의 제거는 겉보기에 체중의 전체적인 증가를 가져올 수 있지만, 양성 대조군 코호트의 평균 체중은 음성 또는 VLP-처리 코호트보다 상당히 아래라는 점을 유의한다.

따라서, 이들 데이터는 H5 헤마글루티닌 바이러스 단백질을 포함하는 식물-제조 인플루엔자 VLP가 병원성 인플루엔자 균주에 특이적인 면역반응을 유도하며, 바이러스-유사 입자가 식물 원형질막으로부터 발아할 수 있다는 것을 증명한다.

따라서, 이들 데이터는 식물이 인플루엔자 바이러스-유사 입자를 생산할 수 있으며, 또한 바이러스-유사 입자가 식물 원형질막으로부터 발아할 수 있다는 것을 최초로 증명한다.

또한, 현재의 일시 발현 기술을 사용하여 표적 HA의 서열이 획득된 후 단지 16일 만에 최초의 항원 로트가 생산되었다. H5 VLP에 대한 현재의 수율에서 전형적인 용량을 피험체 당 5μg이라 하면 침윤된 잎의 매 kg 당 약 20,000의 백신 용량을 생산할 수 있다. 플랫폼의 간단함, 상승한 용량 및 강력한 면역원성의 이런 독특한 조합은 다른 구체예들 중에서도 특히 대유행에 관련한 새로운 대응 방법을 제공한다.

실시예 13: 크기 배제 크로마토그래피에 의한 식물 추출물 중의 헤마글루티 닌-함유 ( H1 , H2 , H3 , H5 , H6 및 H9 ) 구조의 특성화

겔 여과에 의해서 식물에서 생산된 상이한 서브타입의 인플루엔자 헤마글루티닌의 고 분자량 구조로의 회합을 평가했다. AGL1/660-, AGL1/540-, AGL1/783-, AGL1/780-, AGL1/785- 및 AGL1/790-침윤된 식물로부터의 조 단백질 또는 농축 단백질 추출물(1.5mL)을 Sephacryl™ S-500 HR 칼럼(GE Healthcare Bio-Science Corp., Piscataway, NJ, USA)에서 크기 배제 크로마토그래피(SEC)에 의해 분별했다. 도 46에 도시된 대로, 블루 덱스트란(2MDa) 용출은 분획 10에서 이른 피크를 나타냈다. 각 SEC 용출 분획 200μL로부터 단백질을 아세톤-침전에 의해 농축(5배)하여 웨스턴 블롯팅에 의해서 분석했을 때(도 46), 헤마글루티닌은 주로 분획 7 내지 14에서 발견되었으며, 이것은 HA가 VLP로 편입된 것을 나타낸다. 이론과 결부시키고 싶지는 않지만, 이것은 HA 단백질이 생산된 서브타입과는 무관하게 커다란 수퍼구조로 회합되었거나, 또는 고 분자량 구조에 부착된 것을 시사한다. 도 46에서, 균주 A/New Caledonia/20/1999 유래의 H1 및 균주 A/Brisbane/10/2007 유래의 H3이 PDI 신호 펩티드-함유 카세트를 사용하여 생산되었다. 얻어진 결과는 자주개자리 PDI의 신호 펩티드에 의한 자생 신호 펩티드의 치환이 입자로 조립되는 HA의 능력에 영향을 미치지 않은 것을 나타낸다.

실시예 14: 야생형 뉴클레오티드 서열을 사용한 N. benthamiana 식물에서 아그로 -침윤에 의한 계절 인플루엔자 바이러스 헤마글루티닌의 일시 발현

균주 A/Brisbane/59/2007(H1N1)(플라스미드 #774), A/New Caledonia/20/1999 (H1N1)(플라스미드 #540) 및 A/Solomon Islands/3/2006(H1N1)(플라스미드 #775)으로부터 H1 서브타입, 균주 A/Brisbane/10/2007(플라스미드 #776) 및 A/Wisconsin/ 67/2005(플라스미드 #777)로부터 H3 서브타입, 그리고 균주 B/Malaysia/2506/2004 (Victoria 계통)(플라스미드 #778) 및 B/Florida/4/2006(Yamagata 계통)(플라스미드 #779)로부터 B 타입의 발현을 통해 계절 인플루엔자 헤마글루티닌을 생산하는 일시 발현 시스템의 능력을 측정했다. 먼저 플라스토시아닌 발현 카세트 - 자주개자리 플라스토시아닌 유전자로부터의 프로모터, 5'UTR, 3'UTR 및 전사 종결 서열 - 에서 헤마글루티닌 유전자 코딩 서열을 조립하고, 조립된 카세트를 pCAMBIA 바이너리 플라스미드에 삽입했다. 다음에, 이 플라스미드들을 Agrobacterium(AGL1)에서 트랜스펙션하여, Agrobacterium 균주인 AGL1/774, AGL1/540, AGL1/775, AGL1/776, AGL1/777, AGL1/778 및 AGL1/779를 각각 만들었다.

N. benthamiana 식물을 AGL1/774, AGL1/540, AGL1/775, AGL1/776, AGL1/777, AGL1/778 및 AGL1/779로 침윤시키고, 잎을 수거하여 6일간 인큐베이션했다. 아그로-침윤된 잎에 H1이 축적되었는지 결정하기 위해, 먼저 침윤된 잎 조직으로부터 단백질을 추출한 다음, 항-H1 항체를 사용하여 웨스턴 블롯팅에 의해 분석했다(각 HA 서브타입의 검출에서 사용된 항체 및 조건에 대해서는 표 6을 참조한다). H1 균주 유래의 HA에 대해서, 약 72kDa에서 독특한 밴드가 추출물에서 검출되었는데(도 47), 이것은 인플루엔자 헤마글루티닌의 미절단 HA0 형태의 크기에 해당한다. 이로써 침윤된 잎에서 상이한 연례적인 유행성 균주의 헤마글루티닌의 발현이 미절단 번역 산물의 축적을 가져온다는 것이 증명되었다. 이들 발현 및 면역검출 전략을 이용해서는 H3 서브타입 또는 B 타입 유래의 인플루엔자 HA의 발현은 조 단백질 추출물에서 검출되지 않았다(도 47).

실시예 15: 야생형 뉴클레오티드 서열을 사용한 N. benthamiana 식물에서 아그로-침윤에 의한 잠재적 대유행 인플루엔자 바이러스 헤마글루티닌의 일시 발현

균주 A/Anhui/1/2005(H5N1)(플라스미드 #781), A/Indonesia/5/2005(H5N1)(플라스미드 #660) 및 A/Vietnam/1194/2004(H5N1)(플라스미드 #782)에서 H5 서브타입, 균주 A/Singapore/1/1975(H2N2)(플라스미드 #780)에서 H2 서브타입, 균주 A/Teal/ Hong Kong/W312/1997(H6N1)(플라스미드 #783)에서 H6, 균주 A/Equipe/Prague/1956 (H7N7)(플라스미드 #784)에서 H7, 그리고 마지막으로 균주 A/Hong Kong/1073/1999 (H9N2)(플라스미드 #785)에서 H9의 발현을 통해 잠재적 인플루엔자 헤마글루니틴을 생산하는 일시 발현 시스템의 능력을 측정했다. 먼저 플라스토시아닌 발현 카세트 - 자주개자리 플라스토시아닌 유전자로부터의 프로모터, 5'UTR, 3'UTR 및 전사 종결 서열 - 에서 헤마글루티닌 유전자 코딩 서열을 조립하고, pCMABIA 바이너리 플라스미드에 조립된 카세트를 삽입했다. 다음에, 이 플라스미드들을 Agrobacterium (AGL1)에서 트랜스펙션하여, Agrobacterium 균주인 AGL1/781, AGL1/660, AGL1/782, AGL1/780, AGL1/783, AGL1/784 및 AGL1/785를 각각 만들었다.

N. benthamiana 식물을 AGL1/781, AGL1/660, AGL1/782, AGL1/780, AGL1/783, AGL1/784 및 AGL1/785로 침윤시키고, 잎을 수거하여 6일간 인큐베이션했다. 아그로-침윤된 잎에 H5가 축적되었는지 결정하기 위해, 먼저 침윤된 잎 조직으로부터 단백질을 추출한 다음, 적합한 항-H5 항체를 사용하여 웨스턴 블롯팅에 의해 분석했다(각 HA 서브타입의 검출에서 사용된 항체 및 조건에 대해서는 표 6을 참조한다). H5 및 H2 발현 구성물로 형질전환된 식물의 추출물에서는 약 72kDa에서 독특한 밴드가 검출되었는데(도 48a 및 b), 이것은 인플루엔자 헤마글루티닌의 미절단 HA0 형태의 크기에 해당한다. 이로써 침윤된 잎에서 상이한 잠재적 대유행 균주의 헤마글루티닌의 발현이 미절단 번역 산물의 축적을 가져온다는 것이 증명되었다. 이들 발현 및 면역검출 전략을 이용해서는 H7 및 H9 유래의 인플루엔자 HA의 발현은 조 단백질 추출물에서 검출되지 않았다(도 48b).

실시예 16: N. tabacum 식물에서 아그로 -침윤에 의한 H5 의 일시 발현

균주 A/Indonesia/5/2005(H5N1)(플라스미드 #660)으로부터 H5 서브타입의 발현을 통해 Nicotiana tabacum의 잎에서 인플루엔자 헤마글루티닌을 생산하는 일시 발현 시스템의 능력을 분석했다. 먼저 플라스토시아닌 발현 카세트 - 자주개자리 플라스토시아닌 유전자로부터의 프로모터, 5'UTR, 3'UTR 및 전사 종결 서열 - 에서 헤마글루티닌 유전자 코딩 서열을 조립하고, 조립된 카세트를 pCMABIA 바이너리 플라스미드에 삽입했다. 다음에, 이 플라스미드를 Agrobacterium(AGL1)에서 트랜스펙션하여 균주 AGL1/660을 만들었다.

N. tabacum 식물을 AGL1/660으로 침윤시키고, 잎을 수거하여 6일간 인큐베이션했다. 아그로-침윤된 잎에 H5가 축적되었는지 결정하기 위해, 먼저 침윤된 잎으로부터 단백질을 추출한 다음, 항-H5 항체를 사용하여 웨스턴 블롯팅에 의해 분석했다. 추출물에서는 약 72kDa에서 독특한 밴드가 검출되었는데(도 49), 이것은 인플루엔자 헤마글루티닌의 미절단 HA0 형태의 크기에 해당한다. 이로써 침윤된 N. tabacum 잎에서 헤마글루티닌의 발현이 미절단 HA0 전구체의 축적을 가져온다는 것이 증명되었다.

실시예 17: 흰족제비에서 A/ Indonesia /5/05( H5N1 )로부터 식물-제조 H5N1 VLP 백신의 면역원성

흰족제비에서 용량의 단계적 확대 연구를 수행하여 식물 유래 VLP의 면역원성을 평가했다. 1차 백신 용량 후 제14일(도 50a), 그리고 2차 용량 후 제14일(도 50b)에 채집한 혈청을 사용하여 세 가지 다른 H5N1 균주 - A/turkey/Turkey/1/05 (clade 2.2), A/Vietnam/1194/04(clade 1) 및 A/Anhui/5/05(모두 불활성화된 전체 바이러스)의 혈구응집 억제에 의하여 3개 용량(1, 5 및 15ug)의 H5 VLP 백신에 의해 유도된 혈청 항체의 시험관내 교차-반응성을 평가했다. 3개 용량 농도 모두에서 교차-반응성이 관찰된다.

실시예 18: CHMP 기준에 따른 면역원성 결과의 분석

인체용 의약품에 대한 EMEA 위원회(CHMP)(http://www.emea.europa.eu/htms/ general/contacts/CHMP/CHMP.html)는 백신 효능에 대해 세 가지 기준(2차 용량 후 적용됨)을 설정하고 있다: 1 - 혈청전환의 수 또는 HI 역가의 상당한 증가(4배) > 40%; 2 - 적어도 2.5의 평균 기하 증가; 3 - 1/40의 HI 역가를 달성한 피험체의 비율이 적어도 70%여야 한다. 흰족제비 모델에서 이들 기준을 분석한 것을 표 8-11에 나타낸다. (*)는 CHMP 기준을 충족하거나 초과한 것을 표시한다. 라이센스를 위한 CHMP 기준과 관련된 교차-면역원성 분석에 대한 요약은 표 12에 나타낸다.

동물의 체중, 체온 및 전반적인 상태를 매일 평가했다. 연구하는 동안 질병이나 불편함의 징후는 기록되지 않았다. 연구 동안 체중 및 체온은 정상 범위 내였다. 백신은 안전하고 동물에 의해 허용되었다.

실시예 19: 헤마글루티닌 뉴클레오티드 서열의 선택

HA의 뉴클레오티드 서열을 인플루엔자 서열 데이터베이스(URL: flu.lanl.gov 참조), 또는 NCBI 인플루엔자 바이러스 리소스(Bao et al., 2008, J. Virology 82 (2): 596-601; URL: ncbi.n.m.hih.gov/genomes/FLU /FLU.html 참조)에서 검색했다. HA 핵산 서열 중 몇 개에 대하여 복수 엔트리가 데이터베이스에 나열된다(표 13). 일부 변이는 배양 시스템과 주로 관련된다(기원 - MDCK, 난, 불명, 바이러스 RNA/임상 분리물); 예를 들어, HA의 위치 194(성숙 단백질 넘버링)에 글리코실화 부위가 부재한다면, 난의 요막액에서 B 타입 인플루엔자 바이러스가 발현된다(Chen et al., 2008 참조). 일부 서열에는 도메인이 부재할 수 있다(예를 들어, 불완전 클론, 인공산물 서열화 등). 인플루엔자 헤마글루티닌의 도메인 및 서브도메인은 설명 단락에서 일반적으로 논의된다. 제 1 서열의 도메인 또는 서브도메인은 제 2의 기존 서열의 도메인과 조합될 수 있는데, 예를 들어 제 1 균주 서열의 신호 펩티드가 제 2 균주로부터의 헤마글루티닌 코딩 서열의 나머지와 조합되어 완전한 코딩 서열을 제공할 수 있다.

균주: A/ Solomon Islands /3/2006로부터의 H1

8개 아미노산 서열을 비교하여 변이를 확인했다(표 14). 일부 서열에서 위치 171에 글리신(G) 또는 아르기닌(R)의 변이가 나타났다.

균주: A/ Brisbane /59/2007로부터의 H1

위치 203에서 아스파르트산(D), 이소로이신(I) 또는 아스파라긴(N)의 변이가 나타났다.

균주: A/ Brisbane /10/2007로부터의 H3

5개 위치에서 서열 변이가 관찰되었다(표 15). 2개의 샘플링한 서열에서 위치 215에 결실이 관찰된다.

균주: A/ Wisconsin /67/2005로부터의 H3

이 균주에서는 4개 위치에서 서열 변이가 관찰되었다(표 16).

균주: B/ Malaysia /2506/2004로부터의 B

2개 위치에서 변이가 관찰된다(표 17). 위치 120이 글리코실화 부위가 아니고, 위치 210이 글리코실화에 연루된다. 이 글리코실화는 난에서의 배양 후 없어진다.

균주: B/ Florida /4/2006으로부터의 헤마글루티닌 ; ISDN261649

관찰된 변이는 배양 시스템에 따라서 위치 211에 아미노산 서열 변이를 포함한다. MDCK 세포로부터 분리된 서열에서는 아스파라긴(N)이 발견되고, 난으로부터 분리된 서열에서는 글루탐산(D)이 발견된다. 위치 211이 글리코실화 부이이며, 이것은 난에서의 배양 후 없어진다.

균주: A/ Singapore /1/1957로부터의 H2

6개 위치에서 서열 변이가 관찰되었다(표 18).

균주: A/ Vietnam /1194/2004로부터의 H5 및 A/ Anhui /1/2005로부터의 H5

이들 H5 균주 모두 1차 서열의 정렬시 아미노산 서열에 변이가 관찰되지 않았다.

균주: A/ Teal / Hong Kong / W312 /1997로부터의 H6

균주에 대해 단지 하나의 엔트리를 이용할 수 있었다(AF250179).

균주: A/ Equine / Prague /56로부터의 H7

데이터베이스에서 총 2개의 서열 엔트리를 찾았다. 연구실 재조합이 필요하므로 엔트리 AB298877은 제외했다.

균주: A/ Hong Kong /1073/1999로부터의 H9 ; AJ404626

데이터베이스에서 총 2개의 서열 엔트리를 찾았다. 단지 1개만 완전했다.

실시예 20: 식물 분비 단백질 유래의 신호 펩티드에 융합된 인플루엔자 바이러스 헤마글루티닌의 일시 발현

또한, 자주개자리 단백질 이황화물 이소머라제(PDI; Accession No. Z11499; SEQ ID NO:34; 도 17)의 신호 펩티드(SP; 뉴클레오티드 32-103)에 융합된 균주 A/ Brisbane/59/2007(H1N1)(플라스미드 #787), A/New Caledonia/20/1999(H1N1)(플라스미드 #540), 균주 A/Brisbane/10/2007(H3N2)(플라스미드 #790) 및 A/Indonesia/5/ 2005(H5N1)(플라스미드 #663)로부터 A 서브타입 HA, 그리고 균주 B/Florida/4/2006 (plasmid #798)로부터 B 타입의 발현을 통해 다른 헤마글루티닌의 HA 축적 수준에 대한 신호 펩티드 변경 효과를 조사했다. 플라스토시아닌 발현 카세트 - 자주개자리 플라스토시아닌 유전자로부터의 프로모터, 5'UTR, 3'UTR 및 전사 종결 서열 - 에서 PDI SP-헤마글루티닌 유전자 융합체를 조립하고, pCMABIA 바이너리 플라스미드에 조립된 카세트를 삽입했다. 다음에, 이 플라스미드들을 Agrobacterium(AGL1)에서 트랜스펙션하여, Agrobacterium 균주인 AGL1/787, AGL1/540, AGL1/790, AGL1/ 663 및 AGL1/798를 각각 만들었다.

AGL1/787, AGL1/540, AGL1/790, AGL1/663 및 AGL1/798로 N. benthamiana 식물을 침윤시켰다. 병행하여, 비교를 위해 일련의 식물을 AGL1/774, AGL776, AGL1/ 660 및 AGL1/779로 침윤시켰다. 6일의 인큐베이션 기간 후에 잎을 수거하고, 침윤된 잎으로부터 단백질을 추출하여, 적합한 항-HA 항체를 사용하여 웨스턴 블롯에 의해 분석했다. 자생 신호 펩티드를 가진 동일한 HA에서 관찰된 발현과 비교하여 PDI로부터의 SP를 사용해서는 H1/Brisbane 및 H3/Brisbane으로부터 HA의 발현이 상당히 개선되었다(각각 도 87b 및 c). 서브타입 H1(균주 A/New Caledonia/20/1999)로부터 세 번째 HA의 발현이 이 SP 치환 전략을 이용하여 확인되었다(도 87a). 신호 펩티드의 변경은 H5(A/Indonesia/5/2005)에 대해서는 HA 축적의 실질적인 증가를 유도하지 않았으며(도 87d), 발현에 사용된 신호 펩티드와 상관없이 균주 B/ Florida/4/2006로부터의 HA에 대해서는 어떤 신호도 검출되지 않았다(도 87e). HA의 발현이 검출된 모든 조건에서, 약 72kDa의 분자량에서 독특한 면역반응 밴드가 관찰되었는데(도 87a 내지 d), 이것은 미절단 HA0 전구체의 크기에 해당한다.

실시예 21: CPMV - HY 발현 카세트 제어하의 HA 발현

동부 모자이크병 바이러스(CPMV) RNA2로부터의 미번역 서열을 포함하는 발현 카세트 CPMV-HT(Sainsbury et al. 2008 Plant Physiology 148:1212-1218; 또한 WO 2007/135480 참조)를 트랜스제닉 식물에서 어떤 헤마글루티닌의 발현에 사용했다. A/New Caledonia/20/1999(H1), A/Brisbane/59/2007(H1), A/Brisbane/10/2007(H3), A/Indonesia/5/2005(H5) 및 B/Florida/4/2006(B)로부터의 HA를 설명된 대로 아그로-침윤된 N. benthamiana 식물에서 CPMV-HT의 제어하에 발현시켰다. 인큐베이션 후 잎을 수거하고 추출하여, 단백질 추출물 중의 HA 함량을 웨스턴 블롯에 의해 비교했다. 도 88에 나타낸 대로, CPMV-HT 발현 카세트는 사용된 신호 펩티드와 상관없이 플라스토시아닌 카세트보다 더욱 높은 HA 발현 수준을 유도했다. 또한, 균주 B/Florida/4/2006로부터의 B에 대해서는, CPMV-HT 발현 카세트의 사용이 플라스토시아닌 카세트에서 발현되었을 때는 이들 면역검출 조건에서 검출되지 않은 채로 있었던 HA 축적의 검출을 허용했다.

실시예 22: 신호 펩티드 변경과 조합된 Hsp70 및 Hsp40 과의 공-발현

식물 기원의 시토졸 Hsp70 및 Hsp40(구성물 번호 R870)을 둘 다 식물 기원의 신호 펩티드(자주개자리 PDI 신호 펩티드)를 보유한 H1 New Caledonia(구성물 번호 540) 또는 H3 Brisbane(구성물 번호 790)과 함께 공-발현시켰다. AGL1/540, AGL1/ R870, AGL1/35SHcPro(H1에 대해) 또는 AGL1/790, AGL1/R870 및 AGL1/35SHcPro(H3에 대해)의 혼합물(1:1:1 비율)을 함유하는 박테리아 현탁액으로 N. benthamiana 식물을 아그로-침윤시켜 공-발현을 수행하였다. 대조군 식물은 AGL1/540, AGL1/35SHc Pro(H1에 대해) 또는 AGL1/790, AGL1/35SHcPro(H3에 대해)의 혼합물(1:2 비율)로 아그로-침윤시켰다. 인큐베이션 후 잎을 수거하고 추출하여, 단백질 추출물 중의 HA 함량을 웨스턴 블롯에 의해 비교했다(도 89). 시험된 조건에서 얻어진 결과는 Hsp70 및 Hsp40의 공-발현이 H1 New Caledonia에서 헤마글루티닌 축적 수준을 증가시키지 않았다는 것을 나타낸다. 그러나, H3 Brisbane에 대해서는, 시토졸 Hsp70 및 Hsp40의 공-발현이 헤마글루티닌 축적 수준에 상당한 증가를 가져왔음이 웨스턴 블롯에 의해 분명히 나타났다.

실시예 23

2 X35S / CPMV - HT 발현 카세트의 제어하에 H1 A/ California /04/09의 발현

CPMV-HT 발현 카세트를 사용하여 설명된 대로 아그로 침윤된 N. benthamiana 식물에서 H1 A/California/04/09(구성물 # 560, 도 90, 98)를 또한 발현시켰다. 2일간 인큐베이션한 후, 잎들을 수거하고 추출한 다음, 단백질 추출물 중의 HA 함량을 웨스턴 블롯에 의해 비교했다. 도 91에 나타낸 대로, CPMV-HT 발현 카세트는 침윤 2일째에 상당한 HA 발현을 유도했다. 식물에서 HA 발현으로부터 생산된 VLP는 적혈구의 응집을 증명한다.

모든 인용문헌은 본원에 참고자료로 포함된다.

본 발명은 하나 이상의 구체예에 관하여 설명되었다. 그러나, 청구항에 한정 본 발명의 범위로부터 벗어나지 않고 다수의 변화 및 변형이 만들어질 수 있다는 것이 당업자에게 분명할 것이다.

참고자료

SEQUENCE LISTING <110> Medicago Inc. D'AOUST, Marc-Andre; COUTURE, Manon ORS, Frederic TREPANIER, Sonia LAVOIE, Pierre-Olivier DARGIS, Michele VEZINA, Louis-Philippe LANDRY, Nathalie <120> Influenza Virus-Like Particles (VLPS) Comprising Hemagglutinin <130> V81270WO2 <140> PCT/CA2009/000926 <141> 2009-07-02 <150> PCT/CA2008/001281 <151> 2008-07-11 <150> PCT/CA2008/000032 <151> 2009-01-12 <160> 146 <170> PatentIn version 3.4 <210> 1 <211> 1556 <212> DNA <213> Influenza virus <400> 1 agatcttcgc tgacacaata tgtataggct accatgccaa caactcaacc gacactgttg 60 acacagtact tgagaagaat gtgacagtga cacactctgt caacctactt gaggacagtc 120 acaatggaaa actatgtcta ctaaaaggaa tagccccact acaattgggt aattgcagcg 180 ttgccggatg gatcttagga aacccagaat gcgaattact gatttccaag gaatcatggt 240 cctacattgt agaaacacca aatcctgaga atggaacatg ttacccaggg tatttcgccg 300 actatgagga actgagggag caattgagtt cagtatcttc atttgagaga ttcgaaatat 360 tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg agtatcagca tcatgctccc 420 ataatgggaa aagcagtttt tacagaaatt tgctatggct gacggggaag aatggtttgt 480 acccaaacct gagcaagtcc tatgtaaaca acaaagagaa agaagtcctt gtactatggg 540 gtgttcatca cccgcctaac atagggaacc aaagggcact ctatcataca gaaaatgctt 600 atgtctctgt agtgtcttca cattatagca gaagattcac cccagaaata gccaaaagac 660 ccaaagtaag agatcaggaa ggaagaatca actactactg gactctgctg gaacctgggg 720 atacaataat atttgaggca aatggaaatc taatagcgcc atggtatgct tttgcactga 780 gtagaggctt tggatcagga atcatcacct caaatgcacc aatggatgaa tgtgatgcga 840 agtgtcaaac acctcaggga gctataaaca gcagtcttcc tttccagaat gtacacccag 900 tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa attaaggatg gttacaggac 960 taaggaacat cccatccatt caatccagag gtttgtttgg agccattgcc ggtttcattg 1020 aaggggggtg gactggaatg gtagatgggt ggtatggtta tcatcatcag aatgagcaag 1080 gatctggcta tgctgcagat caaaaaagta cacaaaatgc cattaacggg attacaaaca 1140 aggtcaattc tgtaattgag aaaatgaaca ctcaattcac agctgtgggc aaagagttca 1200 acaaattgga aagaaggatg gaaaacttaa ataaaaaagt tgatgatggg tttctagaca 1260 tttggacata taatgcagaa ttgttggttc tactggaaaa tgaaaggact ttggatttcc 1320 atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag ccaattaaag aataatgcca 1380 aagaaatagg aaacgggtgt tttgagttct atcacaagtg taacaatgaa tgcatggaga 1440 gtgtgaaaaa tggtacctat gactatccaa aatattccga agaatcaaag ttaaacaggg 1500 agaaaattga tggagtgaaa ttggaatcaa tgggagtata ctaagagctc aggcct 1556 <210> 2 <211> 219 <212> DNA <213> Influenza virus <400> 2 ggtacctatg actatccaaa atattccgaa gaatcaaagt taaacaggga gaaaattgat 60 ggagtgaaat tggaatcaat gggagtatac cagattctgg cgatctactc aactgtcgcc 120 agttccctgg ttcttttggt ctccctgggg gcaatcagct tctggatgtg ttccaatggg 180 tctttgcagt gtagaatatg catctaagag ctcaggcct 219 <210> 3 <211> 1719 <212> DNA <213> Influenza virus <400> 3 aagcttatgg agaaaatagt gcttcttctt gcaatagtca gtcttgttaa aagtgatcag 60 atttgcattg gttaccatgc aaacaattca acagagcagg ttgacacaat catggaaaag 120 aacgttactg ttacacatgc ccaagacata ctggaaaaga cacacaacgg gaagctctgc 180 gatctagatg gagtgaagcc tctaatttta agagattgta gtgtagctgg atggctcctc 240 gggaacccaa tgtgtgacga attcatcaat gtaccggaat ggtcttacat agtggagaag 300 gccaatccaa ccaatgacct ctgttaccca gggagtttca acgactatga agaactgaaa 360 cacctattga gcagaataaa ccattttgag aaaattcaaa tcatccccaa aagttcttgg 420 tccgatcatg aagcctcatc aggagttagc tcagcatgtc catacctggg aagtccctcc 480 ttttttagaa atgtggtatg gcttatcaaa aagaacagta catacccaac aataaagaaa 540 agctacaata ataccaacca agaggatctt ttggtactgt ggggaattca ccatcctaat 600 gatgcggcag agcagacaag gctatatcaa aacccaacca cctatatttc cattgggaca 660 tcaacactaa accagagatt ggtaccaaaa atagctacta gatccaaagt aaacgggcaa 720 agtggaagga tggagttctt ctggacaatt ttaaaaccta atgatgcaat caacttcgag 780 agtaatggaa atttcattgc tccagaatat gcatacaaaa ttgtcaagaa aggggactca 840 gcaattatga aaagtgaatt ggaatatggt aactgcaaca ccaagtgtca aactccaatg 900 ggggcgataa actctagtat gccattccac aacatacacc ctctcaccat cggggaatgc 960 cccaaatatg tgaaatcaaa cagattagtc cttgcaacag ggctcagaaa tagccctcaa 1020 agagagagca gaagaaaaaa gagaggacta tttggagcta tagcaggttt tatagaggga 1080 ggatggcagg gaatggtaga tggttggtat gggtaccacc atagcaatga gcaggggagt 1140 gggtacgctg cagacaaaga atccactcaa aaggcaatag atggagtcac caataaggtc 1200 aactcaatca ttgacaaaat gaacactcag tttgaggccg ttggaaggga atttaataac 1260 ttagaaagga gaatagagaa tttaaacaag aagatggaag acgggtttct agatgtctgg 1320 acttataatg ccgaacttct ggttctcatg gaaaatgaga gaactctaga ctttcatgac 1380 tcaaatgtta agaacctcta cgacaaggtc cgactacagc ttagggataa tgcaaaggag 1440 ctgggtaacg gttgtttcga gttctatcac aaatgtgata atgaatgtat ggaaagtata 1500 agaaacggaa cgtacaacta tccgcagtat tcagaagaag caagattaaa aagagaggaa 1560 ataagtgggg taaaattgga atcaatagga acttaccaaa tactgtcaat ttattcaaca 1620 gtggcgagtt ccctagcact ggcaatcatg atggctggtc tatctttatg gatgtgctcc 1680 aatggatcgt tacaatgcag aatttgcatt taagagctc 1719 <210> 4 <211> 25 <212> DNA <213> Artificial sequence <220> <223> primer Plasto-443c <400> 4 gtattagtaa ttagaatttg gtgtc 25 <210> 5 <211> 44 <212> DNA <213> Artificial sequence <220> <223> primer SpHA(Ind)-Plasto.r <400> 5 gcaagaagaa gcactatttt ctccattttc tctcaagatg atta 44 <210> 6 <211> 45 <212> DNA <213> Artificial sequence <220> <223> primer SpHA(Ind)-Plasto.r <400> 6 ttaatcatct tgagagaaaa tggagaaaat agtgcttctt cttgc 45 <210> 7 <211> 38 <212> DNA <213> Artificial sequence <220> <223> primer HA(Ind)-Sac.r <400> 7 actttgagct cttaaatgca aattctgcat tgtaacga 38 <210> 8 <211> 1471 <212> DNA <213> Artificial sequence <220> <223> alfalfa plastocyanin-based expression cassette <400> 8 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt 1020 ttcggcttat tgttttctct tcttgtgttg gttccttctc agatctgagc tctaagttaa 1080 aatgcttctt cgtctcctat ttataatatg gtttgttatt gttaattttg ttcttgtaga 1140 agagcttaat taatcgttgt tgttatgaaa tactatttgt atgagatgaa ctggtgtaat 1200 gtaattcatt tacataagtg gagtcagaat cagaatgttt cctccataac taactagaca 1260 tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac taaaattgaa catcttttgc 1320 cacaacttta taagtggtta atatagctca aatatatggt caagttcaat agattaataa 1380 tggaaatatc agttatcgaa attcattaac aatcaactta acgttattaa ctactaattt 1440 tatatcatcc cctttgataa atgatagtac a 1471 <210> 9 <211> 565 <212> PRT <213> Influenza virus <400> 9 Met Lys Ala Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr 1 5 10 15 Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr 20 25 30 Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn 35 40 45 Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile 50 55 60 Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly 65 70 75 80 Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile 85 90 95 Val Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe 100 105 110 Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe 115 120 125 Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr 130 135 140 Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe 145 150 155 160 Tyr Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn 165 170 175 Leu Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu 180 185 190 Trp Gly Val His His Pro Pro Asn Ile Gly Asn Gln Arg Ala Leu Tyr 195 200 205 His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg 210 215 220 Arg Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu 225 230 235 240 Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile 245 250 255 Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Phe Ala 260 265 270 Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Pro Met 275 280 285 Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser 290 295 300 Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro 305 310 315 320 Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn 325 330 335 Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe 340 345 350 Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His 355 360 365 His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr 370 375 380 Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu 385 390 395 400 Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu 405 410 415 Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu 420 425 430 Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu 435 440 445 Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys 450 455 460 Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys 465 470 475 480 Phe Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys 485 490 495 Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn 500 505 510 Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln 515 520 525 Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val 530 535 540 Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln 545 550 555 560 Cys Arg Ile Cys Ile 565 <210> 10 <211> 568 <212> PRT <213> Influenza virus <400> 10 Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser 1 5 10 15 Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val 20 25 30 Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile 35 40 45 Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 50 55 60 Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 65 70 75 80 Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val 85 90 95 Glu Lys Ala Asn Pro Thr Asn Asp Leu Cys Tyr Pro Gly Ser Phe Asn 100 105 110 Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu 115 120 125 Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser 130 135 140 Ser Gly Val Ser Ser Ala Cys Pro Tyr Leu Gly Ser Pro Ser Phe Phe 145 150 155 160 Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile 165 170 175 Lys Lys Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp 180 185 190 Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Arg Leu Tyr Gln 195 200 205 Asn Pro Thr Thr Tyr Ile Ser Ile Gly Thr Ser Thr Leu Asn Gln Arg 210 215 220 Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly 225 230 235 240 Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn 245 250 255 Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile 260 265 270 Val Lys Lys Gly Asp Ser Ala Ile Met Lys Ser Glu Leu Glu Tyr Gly 275 280 285 Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser 290 295 300 Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys 305 310 315 320 Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser 325 330 335 Pro Gln Arg Glu Ser Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile 340 345 350 Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr 355 360 365 Gly Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys 370 375 380 Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser 385 390 395 400 Ile Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe 405 410 415 Asn Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp 420 425 430 Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met 435 440 445 Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu 450 455 460 Tyr Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly 465 470 475 480 Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu 485 490 495 Ser Ile Arg Asn Gly Thr Tyr Asn Tyr Pro Gln Tyr Ser Glu Glu Ala 500 505 510 Arg Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly 515 520 525 Thr Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala 530 535 540 Leu Ala Ile Met Met Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly 545 550 555 560 Ser Leu Gln Cys Arg Ile Cys Ile 565 <210> 11 <211> 1629 <212> DNA <213> Influenza virus <400> 11 gacaaaatat gtcttgggca ccatgctgtg gcaaatggaa caaaagtgaa cacattaaca 60 gagaggggga ttgaagtagt gaacgccaca gagacggtgg aaactgcgaa tatcaagaaa 120 atatgtattc aagggaaaag gccaacagat ctgggacaat gtggacttct aggaacccta 180 ataggacctc cccaatgtga tcaattcctg gagttttact ctgatttgat aattgagcga 240 agagaaggaa ccgatgtgtg ctatcccggt aaattcacaa atgaagaatc actgaggcag 300 atccttcgag ggtcaggagg aattgataag gagtcaatgg gtttcaccta tagtggaata 360 agaaccaatg gagcgacaag tgcctgcaaa agatcaggtt cttctttcta tgcagagatg 420 aagtggttgc tgtcgaattc agacaatgcg gcattccctc aaatgacaaa gtcgtataga 480 aatcccagaa acaaaccagc tctgataatt tggggagttc atcactctgg atcggttagc 540 gagcagacca aactctatgg aagtggaaac aagttgataa cagtaggaag ctcaaaatac 600 cagcaatcat tcaccccaag tccgggagca cggccacaag tgaatggaca atcagggaga 660 atcgattttc actggctact ccttgatccc aatgacacag tgaccttcac tttcaatggg 720 gcattcatag cccctgacag ggcaagtttc tttagaggag aatcactagg agtccagagt 780 gatgttcctc tggattctag ttgtggaggg gattgctttc acagtggggg tacgatagtc 840 agttccctgc cattccaaaa catcaaccct agaactgtgg ggagatgccc tcggtatgtc 900 aaacagacaa gcctcctttt ggctacagga atgagaaatg ttccagagaa tccaaagccc 960 agaggccttt ttggagcaat tgctggattc atagagaatg gatgggaggg tctcatcgat 1020 ggatggtatg gtttcagaca tcaaaatgca caaggggaag gaactgcagc tgactacaaa 1080 agcacccaat ctgcaataga tcagatcaca ggcaaattga atcgtctgat tgacaaaaca 1140 aatcagcagt ttgagctgat agacaatgag ttcaatgaga tagaacaaca aataggaaat 1200 gtcattaatt ggacacgaga cgcaatgact gaggtatggt cgtataatgc tgagctgttg 1260 gtggcaatgg aaaatcagca tacaatagat cttgcggact cagaaatgaa caaactttat 1320 gagcgtgtca gaaaacaact aagggagaat gctgaagaag atggaactgg atgttttgag 1380 atattccata agtgtgatga tcagtgcatg gagagcataa ggaacaacac ttatgaccat 1440 actcaataca gaacagagtc attgcagaat agaatacaga tagacccagt gaaattgagt 1500 agtggataca aagacataat cttatggttt agcttcgggg catcatgttt tcttcttcta 1560 gccgttgtaa tgggattggt tttcatttgc ataaagaatg gaaacatgcg gtgcaccatt 1620 tgtatataa 1629 <210> 12 <211> 1773 <212> DNA <213> Influenza virus <400> 12 agcaaaagca ggggttatac catagacaac caaaggcaag acaatggcca tcatttatct 60 aattcttctg ttcacagcag tgagagggga ccaaatatgc attggatacc attccaacaa 120 ttccacagaa aaggttgaca caatcctaga gagaaatgtc actgtgactc acgctgagga 180 cattcttgag aagactcaca atgggaagtt atgcaaacta aatggaatcc ctccacttga 240 attaagggat tgcagcattg ccggatggct ccttgggaat ccagaatgtg atatacttct 300 aactgtgcca gaatggtcat acataataga aaaagaaaat ccaaggaacg gcttgtgcta 360 cccaggcagt ttcaatgatt atgaagaatt gaagcatctt atcagcagcg tgacacattt 420 tgagaaagta aagattctgc ccagaaatga atggacacag catacaacaa ctggaggttc 480 acaggcttgc gcagactatg gtggtccgtc attcttccgg aacatggtct ggttgacaaa 540 gaaagggtcg aattatccaa ttgccaaaag atcttacaac aatacaagtg gggaacaaat 600 gctgatcatt tgggggatac atcaccccaa tgatgaaagt gaacaaagag cattgtatca 660 gaatgtgggg acctatgtgt cagtaggaac atcaacactg aacaaaagat catccccaga 720 aatagcaaca agacctaaag tgaatggaca aggaggcaga atggaattct cgtggactat 780 cttagatata tgggacacaa taaattttga gagtactggc aatctaattg caccagaata 840 tggtttcaaa atatccaaac gaggtagttc agggatcatg aaaacagaag gaaaacttga 900 aaactgcgag accaagtgcc aaactccttt gggagcaata aatacaacat taccctttca 960 caatatccac ccactgacca ttggtgagtg ccccaaatat gtaaaatcgg aaagattagt 1020 cttagcaaca ggactaagaa acgtccctca gattgagtca aggggattgt ttggggcaat 1080 agctggtttt atagagggtg gatggcaagg aatggttgat ggttggtatg ggtatcatca 1140 cagcaatgac cagggatctg ggtatgcagc agacaaagaa tccactcaaa aggcaattga 1200 tggaatcacc aacaaggtaa attctgtgat cgaaaagatg aacacccaat tcggagctgt 1260 tggaaaagaa ttcagtaact tggagagaag actggagaac ttgaataaaa agatggagga 1320 cggatttcta gatgtgtgga catacaatgc cgagctccta gttctaatgg aaaatgagag 1380 gacacttgac tttcatgatt ctaatgtcaa gaatctatat gataaagtca gaatgcaact 1440 gagagacaat gcaaaagaac tagggaatgg atgttttgaa ttttatcaca aatgtgatga 1500 tgaatgcatg aacagtgtga agaatgggac atatgattat tccaagtatg aagaggagtc 1560 taaactaaac aggactgaaa tcaaaggggt taaattgagc aatatggggg tttatcaaat 1620 ccttgccatc tatgctacag tagcaggttc cctgtcactg gcaatcatga tagctgggat 1680 ttctatatgg atgtgctcca acgggtctct gcaatgcaga atctgcatat gatcatcagt 1740 cattttgtaa ttaaaaacac ccttgtttct act 1773 <210> 13 <211> 1086 <212> DNA <213> Influenza virus <400> 13 caaaaacttc ccggaaatga caacagcacg gcaacgctgt gccttgggca ccatgcagta 60 ccaaacggaa cgatagtgaa aacaatcacg aatgaccaaa ttgaagttac taatgctact 120 gagctggtac agagttcctc aacaggtgga atatgcgaca gtcctcatca gatccttgat 180 ggagaaaact gcacactaat agatgctcta ttgggagacc ctcagtgtga tggcttccaa 240 aataagaaat gggacctttt tgttgaacgc agcaaagcct acagcaactg ttacccttat 300 gatgtgccgg attatgcctc ccttaggtca ctagttgcct catccggcac actggagttt 360 aacaatgaaa gcttcgattg gactggagtc actcagaatg gaacaagctc tgcttgcaaa 420 aggagatcta ataaaagttt ctttagtaga ttgaattggt tgacccactt aaaatacaaa 480 tacccagcat tgaacgtgac tatgccaaac aatgaaaaat ttgacaaatt gtacatttgg 540 ggggttcacc acccgggtac ggacagtgac caaatcagcc tatatgctca agcatcagga 600 agaatcacag tctctaccaa aagaagccaa caaactgtaa tcccgaatat cggatctaga 660 cccagggtaa gggatgtctc cagccgaata agcatctatt ggacaatagt aaaaccggga 720 gacatacttt tgattaacag cacagggaat ctaattgctc ctcggggtta cttcaaaata 780 cgaagtggga aaagctcaat aatgagatca gatgcaccca ttggcaaatg caattccgaa 840 tgcatcactc caaatggaag cattcccaat gacaaaccat ttcaaaatgt aaacaggatc 900 acatatgggg cctgtcccag atatgttaag caaaacactc tgaaattggc aacagggatg 960 cgaaatgtac cagagaaaca aactagaggc atatttggcg caatcgcggg tttcatagaa 1020 aatggttggg agggaatggt ggacggttgg tacggtttca ggcatcaaaa ttctgagggc 1080 acagga 1086 <210> 14 <211> 1048 <212> DNA <213> Influenza virus <400> 14 atgctatcaa tcacgattct gtttctgctc atagcagagg gttcctctca gaattacaca 60 gggaatcccg tgatatgcct gggacatcat gccgtatcca atgggacaat ggtgaaaacc 120 ctgactgatg accaagtaga agttgtcact gcccaagaat tagtggaatc gcaacatcta 180 ccggagttgt gtcctagccc tttaagatta gtagatggac aaacttgtga catcgtcaat 240 ggtgccttgg ggagtccagg ctgtgatcac ttgaatggtg cagaatggga tgtcttcata 300 gaacgaccca ctgctgtgga cacttgttat ccatttgatg tgccggatta ccagagccta 360 cggagtatcc tagcaaacaa tgggaaattt gagttcattg ctgaggaatt ccaatggaac 420 acagtcaaac aaaatgggaa atccggagca tgcaaaagag caaatgtgaa tgactttttc 480 aacagattga actggctgac caaatctgat gggaatgcat acccacttca aaacctgaca 540 aaggttaaca acggggacta tgcaagactt tacatatggg gagttcatca tccttcaact 600 gacacagaac aaaccaactt gtataagaac aaccctggga gagtaactgt ttccaccaaa 660 accagtcaaa caagtgtggt accaaacatt ggcagtagac catgggtaag aggccaaagc 720 ggcaggatta gcttctattg gacaattgtg gagccaggag acctcatagt cttcaacacc 780 atagggaatt taattgctcc gagaggtcat tacaagctta acagtcaaaa gaagagcaca 840 attctgaata ctgcaattcc cataggatct tgtgttagta aatgtcacac agataggggt 900 tcaatctcta caaccaaacc ctttcagaac atctcaagaa tatcaattgg ggactgtccc 960 aagtatgtca aacagggatc cttgaaacta gctacaggaa tgaggaatat ccctgagaaa 1020 gcaaccagag gcctgtttgg tgcaattg 1048 <210> 15 <211> 1707 <212> DNA <213> Influenza virus <400> 15 atggagaaaa tagtgcttct tcttgcaata gtcagtcttg ttaaaagtga tcagatttgc 60 attggttacc atgcaaacaa ctcgacagag caggttgaca caataatgga aaagaacgtt 120 actgttacac atgcccaaga catactggaa aagacacaca acgggaaact ctgcgatcta 180 gatggagtga agcctctaat tttgagagat tgtagtgtag ctggatggct cctcggaaac 240 cctatgtgtg acgaattcat caatgtgccg gaatggtctt acatagtgga gaaggccagt 300 ccagccaatg acctctgtta cccaggggat ttcaacgact atgaagaact gaaacaccta 360 ttgagcagaa taaaccactt tgagaaaatt cagatcatcc ccaaaagttc ttggtccaat 420 catgaagcct catcaggggt gagcgcagca tgtccatacc atgggaagcc ctcctttttc 480 agaaatgtgg tatggcttat caaaaagaac agtgcatacc caacaataaa gaggagctac 540 aataatacca accaagaaga tcttttggta ctgtggggga ttcaccatcc taatgatgcg 600 gcagagcaga caaagctcta tcaaaaccca accacctata tttccgttgg aacatcaaca 660 ctaaaccaga gattggtccc aaaaatagct actagatcca aagtaaacgg gcaaagtgga 720 agaatggagt tcttctggac aattttaaag ccgaatgatg ccataaattt cgagagtaat 780 ggaaatttca ttgctccaga atatgcatac aaaattgtca agaaagggga ctcagcaatt 840 atgaaaagtg aattggaata tggtaactgc aacaccaagt gtcaaactcc aatgggggcg 900 ataaactcta gtatgccatt ccacaacata caccctctca caatcgggga atgccccaaa 960 tatgtgaaat caaacagatt agtccttgcg actggactca gaaatacccc tcaaagagat 1020 agaagaagaa aaaagagagg actatttgga gctatagcag gttttataga gggaggatgg 1080 caaggaatgg tagatggttg gtatgggtac caccatagca atgagcaggg gagtggatac 1140 gctgcagaca aagaatccac tcaaaaggca atagatggag tcaccaataa ggtcaactcg 1200 atcattgaca aaatgaacac tcagtttgag gccgttggaa gggaatttaa taacttagaa 1260 aggaggatag aaaatttaaa caagaagatg gaagacggat tcctagatgt ctggacttat 1320 aatgctgaac ttctggttct catggaaaat gagagaactc tagactttca tgattcaaat 1380 gtcaagaacc tttacaacaa ggtccgacta cagcttaggg ataatgcaaa ggagctgggt 1440 aatggttgtt tcgagttcta tcacaaatgt gataatgaat gtatggaaag tgtaaaaaac 1500 gggacgtatg actacccgca gtattcagaa gaagcaagac taaacagaga ggaaataagt 1560 ggagtaaaat tggaatcaat gggaacttac caaatactgt caatttattc aacagtggcg 1620 agttccctag cactggcaat catggtagct ggtctatctt tatggatgtg ctccaatggg 1680 tcgttacaat gcagaatttg catttaa 1707 <210> 16 <211> 1050 <212> DNA <213> Influenza virus <400> 16 atgattgcaa tcattgtaat agcgatactg gcagcagccg gaaagtcaga caagatctgc 60 attgggtatc atgccaacaa ttcaacaaca caggtggata cgatacttga gaagaatgta 120 accgtcacac actcagttga attgctggag aatcagaagg aagaaagatt ctgcaagatc 180 ttgaacaagg cccctctcga cctaaaggga tgcaccatag agggttggat cttggggaat 240 ccccaatgcg atctgttgct tggtgaccaa agctggtcat atatagtgga aagacctact 300 gcccaaaatg ggatatgcta cccaggagct ttgaatgagg tagaagaact gaaagcattt 360 atcggatcag gagaaagggt agagagattt gagatgtttc ccaaaagcac atgggcaggg 420 gtagacacca gcagtggggt aacaaaagct tgtccttata atagtggttc atctttctac 480 agaaacctcc tatggataat aaagaccaag tcagcagcgt atccagtaat taagggaact 540 tacagcaaca ctggaaacca gccaatcctc tatttctggg gtgtgcacca tcctcctgac 600 accaatgagc aaaatactct gtatggctct ggcgatcggt atgttaggat gggaactgag 660 agcatgaatt ttgccaagag cccagaaatt gcggcaagac ccgctgtgaa tggccaaaga 720 ggtcgaattg attattactg gtctgtttta aaaccaggag aaaccttgaa tgtggaatct 780 aatggaaatc taatcgctcc ttggtatgca tacaaatttg tcaacacaaa taataaggga 840 gccgtcttca agtcaaattt accaatcgag aattgcgatg ccacatgcca gactattgca 900 ggagtcctaa ggaccaataa aacatttcag aatgtgagcc ctctgtggat aggagaatgc 960 cccaagtatg tgaaaagtga aagtctaagg cttgctactg gactaagaaa tgttccacag 1020 attgaaacca gagggctttt cggagctatc 1050 <210> 17 <211> 1698 <212> DNA <213> Influenza virus <400> 17 atggaaaaat tcatcgcaat agcaaccttg gcgagcacaa atgcatacga taggatatgc 60 attgggtacc aatcaaacaa ctccacagac acagtgaaca ctctcataga acagaatgta 120 ccagtcaccc aaacaatgga gctcgtggaa acagagaaac atcccgctta ttgtaacact 180 gatttaggtg ccccattgga actgcgagac tgcaagattg aggcagtaat ctatgggaac 240 cccaagtgtg acatccatct gaaggatcaa ggttggtcat acatagtgga gaggcccagc 300 gcaccagaag ggatgtgtta ccctggatct gtggaaaatc tagaagaact gaggtttgtc 360 ttctccagtg ctgcatctta caagagaata agactatttg actattccag gtggaatgtg 420 actagatctg gaacgagtaa agcatgcaat gcatcaacag gtggccaatc cttctatagg 480 agcatcaatt ggttgaccaa aaaggaacca gacacttatg acttcaatga aggagcttat 540 gttaataatg aagatggaga catcattttc ttatggggga tccatcatcc gccggacaca 600 aaagagcaga caacactata taaaaatgca aacactttga gtagtgttac tactaacact 660 ataaacagaa gctttcaacc aaatattggt cccagaccat tagtaagagg acagcaaggg 720 aggatggatt actattgggg cattctgaaa agaggggaga ctctgaagat caggaccaac 780 ggaaatttaa tcgcacctga atttggctat ctgctcaaag gtgaaagcta cggcagaata 840 attcaaaatg aggatatacc catcgggaac tgtaacacaa aatgtcaaac atatgcggga 900 gcaatcaata gcagcaaacc ctttcagaat gcaagtaggc attacatggg agaatgtccc 960 aaatatgtga agaaggcaag cttgcgactt gcagttgggc ttaggaatac gccttctgtt 1020 gaacccagag gactgtttgg agccattgct ggtttcattg aaggaggatg gtctggaatg 1080 attgatgggt ggtatggatt tcatcacagc aattcagagg gaacaggaat ggcagctgac 1140 cagaaatcaa cacaagaagc catcgataag atcaccaata aagtcaacaa tatagttgac 1200 aagatgaaca gggagtttga agttgtgaat catgagttct ctgaagttga aaaaagaata 1260 aacatgataa acgataaaat agatgaccaa attgaagatc tttgggctta caatgcagag 1320 ctccttgtgc tcttagagaa ccagaaaacg ctagacgaac atgattccaa tgtcaaaaac 1380 ctttttgatg aagtgaaaag gagactgtca gccaatgcaa tagatgctgg gaacggttgc 1440 tttgacatac ttcacaaatg cgacaatgag tgtatggaaa ctataaagaa cggaacttac 1500 gatcataagg aatatgaaga ggaggctaaa ctagaaagga gcaagataaa tggagtaaaa 1560 ctagaagaga acaccactta caaaattctt agcatttaca gtacagtggc ggccagtctt 1620 tgcttggcaa tcctgattgc tggaggttta atcctgggca tgcaaaatgg atcttgtaga 1680 tgcatgttct gtatttga 1698 <210> 18 <211> 1363 <212> DNA <213> Influenza virus <400> 18 atggaaacag tatcactaat gactatacta ctagtagcaa cagcaagcaa tgcagacaaa 60 atctgcatcg gccaccagtc aacaaactcc acagaaactg tggacacgct aacagaaacc 120 aatgttcctg tgacacatgc caaagaattg ctccacacag agcacaatgg aatgctgtgt 180 gcaacaaatc tgggacatcc cctaatctta gacacgtgca ctattgaagg actgatctat 240 ggtaaccctt cttgtgactt gctgttggga ggaagagaat ggtcctacat cgtcgaaagg 300 tcatcagctg taaatggaac gtgttaccct gggaatgtag agaacctaga ggaactcagg 360 acacttttta gttccgctag ttcctaccga agaatccaaa tcttcccaga cacaatctgg 420 aatgtgactt acactggaac aagcaaagca tgttcagatt cattctacag gagtatgaga 480 tggctgactc aaaaaagcgg gtcttaccct gttcaagacg ctcaatacac aaataatatg 540 ggaaagagca ttcttttcgt gtggggcata catcacccac ccactgaagc tgcacagaca 600 aatttgtaca caagaaccga cacaacaaca agcgtgacaa cagaagactt aaataggatc 660 ttcaaaccga tggtagggcc aaggcccctt gtcaatggtc tgcagggaag aattaattat 720 tattggtcgg tactaaaacc aggccagaca ctgcgagtaa gatccaatgg gaatctaatt 780 gctccatggt atggacacat tctttcggga gggagccatg gaagaatcct gaagactgat 840 ttaaaaagta gtaattgcgt agtgcaatgt cagactgaaa aaggcggctt aaacagtaca 900 ttgccgttcc acaatatcag taaatatgca tttggaaact gtcccaaata tgttagagtt 960 aaaagtctca aactggcagt agggttgagg aacgtgcctg ctagatcaag tagaggacta 1020 ttcggagcca tagctggatt catagaagga ggttggccag gactagtcgc tggttggtat 1080 ggtttccagc attcaaatga tcaaggggtt ggtattgcgg cagataggga ttcaactcaa 1140 aaggcaattg atagaataac aaccaaggtg aataatatag tcgacaaaat gaacaaacaa 1200 tatgaaataa ttgatcatga attcagtgag gttgaaacta ggctcaacat gatcaataat 1260 aagattgatg accaaataca agacatatgg gcatataatg cagagttgct agtactactt 1320 gaaaaccaga aaacactcga tgagcatgac gcaaatgtga aga 1363 <210> 19 <211> 1727 <212> DNA <213> Influenza virus <400> 19 agcaaaagca ggggtcacaa tgtacaaagt agtagtaata attgcgctcc ttggagcagt 60 gaaaggtctt gacagaatct gcctaggaca ccatgcggtt gccaatggaa ccattgtgaa 120 gacccttaca aatgaacaag aggaagtgac caatgctact gagacggtag agagcacaaa 180 tttgaataaa ttgtgtatga aaggaagaag ctacaaggac ttgggcaatt gtcacccggt 240 aggaatgttg ataggaacac ctgtttgtga tccgcacttg accgggacct gggacactct 300 cattgagcga gagaatgcca ttgcccactg ttatccaggg gcaaccataa atgaagaagc 360 attgaggcag aaaataatgg aaagtggagg aatcagcaag atgagcactg gcttcactta 420 tgggtcttcc atcacctcag ctgggaccac taaggcatgc atgagaaatg gaggagatag 480 tttctatgca gagctcaaat ggctagtgtc aaagacaaag ggacaaaatt tccctcagac 540 aacaaacacc tatcggaata cggacacagc agaacatctc ataatatggg gaattcatca 600 cccttccagc acacaggaaa agaatgactt atacggaact cagtcactat ctatatcagt 660 tgagagttct acatatcaga acaactttgt tccagttgtt ggggcaagac ctcaggtcaa 720 tggacaaagt gggcgaattg actttcactg gacactagta cagccgggtg acaacataac 780 cttctcagac aatggaggtc taatagcacc aagtcgagtt agcaaattaa ctggaaggga 840 tttgggaatc caatcagaag cgttgataga caacagttgt gaatccaaat gcttttggag 900 agggggttct ataaatacaa agctcccttt tcaaaatctg tcacccagaa cagtaggtca 960 atgccccaaa tacgtaaatc agaggagttt actgcttgca acagggatga ggaatgtgcc 1020 agaagtggtg cagggaaggg gtctgtttgg tgcaatagca gggttcatag aaaacggatg 1080 ggaaggaatg gtagacggct ggtatggttt cagacaccaa aatgcccagg gcacaggcca 1140 agctgctgat tacaagagta ctcaagcagc tattgaccaa atcacaggga aactgaacag 1200 gttgattgag aagaccaaca ctgagtttga gtcaatagaa tctgaattca gtgagactga 1260 gcatcaaatt ggtaacgtca ttaattggac caaagattca ataaccgaca tttggactta 1320 caacgcagag ctattagtgg caatggagaa tcagcacaca attgacatgg ctgattcaga 1380 gatgctaaat ctgtatgaaa gggtaagaaa gcaactcaga cagaatgcag aagaagacgg 1440 aaagggatgt tttgagatat atcatacttg tgatgattcg tgcatggaga gtataaggaa 1500 caatacttat gaccattcac aatacagaga ggaggctctt ctgaatagac tgaacatcaa 1560 cccagtgaaa ctttcttcgg ggtacaaaga catcatactt tggtttagct tcggggaatc 1620 atgctttgtt cttctagccg ttgttatggg tcttgttttc ttctgcctga aaaatggaaa 1680 catgcgatgc acaatctgta tttagttaaa aacaccttgt ttctact 1727 <210> 20 <211> 1698 <212> DNA <213> Influenza virus <400> 20 atggagaaaa cactgctatt tgcagctatt ttcctttgtg tgaaagcaga tgagatctgt 60 atcgggtatt taagcaacaa ctcgacagac aaagttgaca caataattga gaacaatgtc 120 acggtcacta gctcagtgga actggttgag acagaacaca ctggatcatt ctgttcaatc 180 aatggaaaac aaccaataag ccttggagat tgttcatttg ctggatggat attaggaaac 240 cctatgtgtg atgaactaat tggaaagact tcatggtctt acattgtgga aaaacccaat 300 ccaacaaatg gaatctgtta cccaggaact ttagagagtg aagaagaact aagactgaaa 360 ttcagtggag ttttagaatt taacaaattc gaagtattca catcaaatgg atggggtgct 420 gtaaattcag gagtaggagt aaccgctgca tgcaaattcg ggggttctaa ttctttcttt 480 cgaaacatgg tatggctgat acaccaatca ggaacatatc ctgtaataaa gagaaccttt 540 aacaacacca aagggagaga tgtactgatt gtttggggaa ttcatcatcc tgctacactg 600 acagaacatc aagatctgta taaaaaggac agctcctatg tagcagtggg ttcagagacc 660 tacaacagaa gattcactcc agaaatcaac actaggccca gagtcaatgg acaggccgga 720 cggatgacat tctactggaa gatagtcaaa ccaggagaat caataacatt cgaatctaat 780 ggggcgttcc tagctcctag atatgctttt gagattgtct ctgttggaaa tgggaaactg 840 ttcaggagcg aactgaacat tgaatcatgc tctaccaaat gtcaaacaga aataggagga 900 attaatacga acaaaagctt ccacaatgtt cacagaaaca ctatcgggga ttgccccaag 960 tatgtgaatg tcaaatcctt aaagcttgca acaggaccta gaaatgtccc agcaatagca 1020 tcgagaggct tgtttggagc aatagctgga ttcatagaag ggggatggcc tggactgatc 1080 aatggatggt atgggttcca acacagggac gaagaaggaa caggcattgc agcagacaag 1140 gagtcaactc aaaaggcaat agaccagata acatccaagg taaataacat cgttgacagg 1200 atgaatacaa actttgagtc tgtgcaacac gaattcagtg aaatagagga aagaataaat 1260 caattatcaa aacacgtaga tgattctgtg gttgacatct ggtcatataa tgcacagctt 1320 ctcgttttac ttgaaaatga gaagacactg gacctccatg actcaaatgt caggaacctc 1380 catgagaaag tcagaagaat gctaaaggac aatgccaaag atgaggggaa cggatgcttc 1440 accttttacc ataagtgtga caataaatgc attgaacgag ttagaaacgg aacatatgat 1500 cataaagaat tcgaggagga atcaaaaatc aatcgccagg agattgaagg ggtgaaacta 1560 gattctagtg ggaatgtgta taaaatactg tcaatttaca gctgcattgc aagcagtctt 1620 gtattggcag cactcatcat ggggttcatg ttttgggcat gcagtaatgg atcatgtaga 1680 tgtaccattt gcatttag 1698 <210> 21 <211> 1695 <212> DNA <213> Influenza virus <400> 21 atggaaaaat tcatcatttt gagtactgtc ttggcagcaa gctttgcata tgacaaaatt 60 tgcattggat accaaacaaa caactcgact gaaacggtaa acacactaag tgaacaaaac 120 gttccggtga cgcaggtgga agaacttgta catcgtggga ttgatccgat cctgtgtgga 180 acggaactag gatcaccact agtgcttgat gactgttcat tagagggtct aatcctaggc 240 aatcccaaat gtgatcttta tttgaatggc agggaatggt catacatagt agagaggccc 300 aaagagatgg aaggagtttg ctatccaggg tcaattgaaa accaggaaga gctaagatct 360 ctgttttctt ccatcaaaaa atatgaaaga gtgaagatgt ttgatttcac caaatggaat 420 gtcacataca ctgggaccag caaggcctgc aataatacat caaaccaagg ctcattctat 480 aggagcatga gatggttgac cttaaaatca ggacaatttc cagtccaaac agatgagtac 540 aagaacacca gagattcaga cattgtattc acctgggcca ttcaccaccc accaacatct 600 gatgaacaag taaaattata caaaaatcct gatactctct cttcagtcac caccgtagaa 660 atcaatagga gcttcaagcc taatataggg ccaagaccac tcgtgagagg acaacaaggg 720 agaatggatt actactgggc tgttcttaaa cctggacaaa cagtcaaaat acaaaccaat 780 ggtaatctta ttgcacctga atatggtcac ttaatcacag ggaaatcaca tggcaggata 840 ctcaagaata atttgcccat gggacagtgt gtgactgaat gtcaattgaa cgagggtgta 900 atgaacacaa gcaaaccttt ccagaacact agtaagcact atattgggaa atgccccaaa 960 tacataccat cagggagttt aaaattggca atagggctca ggaatgtccc acaagttcaa 1020 gatcgggggc tctttggagc aattgcaggt ttcatagaag gcggatggcc agggctagtg 1080 gctggttggt acggatttca gcatcaaaat gcggagggga caggcatagc tgcagacaga 1140 gacagcaccc aaagggcaat agacaatatg caaaacaaac tcaacaatgt catcgacaaa 1200 atgaataaac aatttgaagt ggtgaatcat gagttttcag aagtggaaag cagaataaac 1260 atgattaatt ccaaaattga tgatcagata actgacatat gggcatacaa tgctgaattg 1320 cttgtcctat tggaaaatca gaagacatta gatgagcatg acgctaatgt aaggaatcta 1380 catgatcggg tcagaagagt cctgagggaa aatgcaattg acacaggaga cggctgcttt 1440 gagattttac ataaatgtga caacaattgt atggacacga ttagaaacgg gacatacaat 1500 cacaaagagt atgaggaaga aagcaaaatc gaacgacaga aagtcaatgg tgtgaaactt 1560 gaggagaatt ctacatataa aattctgagc atctacagca gtgttgcctc aagcttagtt 1620 ctactgctca tgattattgg gggtttcatt ttcgggtgtc aaaatggaaa tgttcgttgt 1680 actttctgta tttaa 1695 <210> 22 <211> 1701 <212> DNA <213> Influenza virus <400> 22 atggctctaa atgtcattgc aactttgaca cttataagtg tatgtgtaca tgcagacaga 60 atatgcgtgg ggtatctgag caccaattca tcagaaaggg tcgacacgct ccttgaaaat 120 ggggtcccag tcaccagctc cattgatctg attgagacaa accacacagg aacatactgt 180 tctctaaatg gagtcagtcc agtgcatttg ggagattgca gctttgaagg atggattgta 240 ggaaacccag cctgcaccag caactttggg atcagagagt ggtcatacct gattgaggac 300 cccgcggccc ctcatgggct ttgctaccct ggagaattaa acaacaatgg tgaactcaga 360 cacttgttca gtggaatcag gtcattcagt agaacggaat tgatcccacc tacctcctgg 420 ggggaagtac ttgacggtac aacatctgct tgcagagata acacgggaac caacagcttc 480 tatcgaaatt tagtttggtt tataaagaag aatactagat atccagttat cagtaagacc 540 tacaacaata caacgggaag ggatgtttta gttttatggg gaatacatca cccagtgtct 600 gtggatgaga caaagactct gtatgtcaat agtgatccat acacactggt ttccaccaag 660 tcttggagcg agaaatataa actagaaacg ggagtccgac ctggctataa tggacagagg 720 agctggatga aaatttattg gtctttgata catccagggg agatgattac tttcgagagt 780 aatggtggat ttttagcccc aagatatggg tacataattg aagaatatgg aaaaggaagg 840 attttccaga gtcgcatcag aatgtctagg tgcaacacca agtgccagac ttcggttgga 900 gggataaaca caaacagaac gttccaaaac atcgataaga atgctcttgg tgactgtccc 960 aaatacataa agtctggcca actcaagcta gccactggac tcagaaatgt gccagctata 1020 tcgaatagag gattgttcgg agcaattgca gggttcatag aaggaggctg gccaggttta 1080 atcaatggtt ggtacggttt tcagcatcaa aatgaacagg gaacaggaat agctgcagac 1140 aaagaatcaa cacagaaagc tatagaccag ataacaacca aaataaataa cattattgat 1200 aaaatgaatg ggaactatga ttcaattagg ggtgaattca atcaagttga gaagcgtata 1260 aacatgcttg cagacagaat agatgatgcc gtgacggaca tttggtcata caatgccaaa 1320 cttcttgtat tgctggaaaa tgataaaact ttagatatgc atgatgctaa tgtaaagaat 1380 ttacatgagc aagtacgaag agaattgaag gacaatgcaa ttgacgaagg aaatggctgt 1440 tttgaactcc ttcataaatg caatgactcc tgcatggaaa ctataagaaa tggaacgtat 1500 gaccacactg agtatgcaga ggagtcaaag ttaaagaggc aagaaatcga tgggatcaaa 1560 ctcaaatcag aagacaacgt ttacaaagca ttatcaatat acagttgcat tgcaagtagt 1620 gttgtactag taggactcat actctctttc atcatgtggg cctgtagtag tgggaattgc 1680 cgattcaatg tttgtatata a 1701 <210> 23 <211> 1749 <212> DNA <213> Influenza virus <400> 23 agcaaaagca ggggaaaatg attgcactca tattggttgc actggctctg agccacactg 60 cttattctca gatcacaaat gggacaacag gaaaccccat tatatgcttg gggcatcatg 120 cagtggaaaa cggcacatct gttaaaacac taacagacaa tcacgtagaa gttgtgtcag 180 ctaaagaatt agttgagacg aaccacactg atgaactgtg cccaagcccc ttgaagcttg 240 tcgacgggca agactgccac ctcatcaatg gtgcattggg gagtccaggc tgtgaccgtt 300 tgcaggacac cacttgggat gtcttcattg aaaggcccac tgcagtagac acatgttatc 360 cattcgacgt cccagattac cagagtctca gaagcatcct agcaagcagt gggagtttgg 420 agttcatcgc cgaacaattc acctggaatg gtgtcaaagt tgacggatca agcagtgctt 480 gtttgagggg cggtcgcaac agcttcttct cccgactaaa ctggctaacc aaagcaacaa 540 atggaaacta tggacctatt aacgtcacta aagaaaatac gggctcttat gtcaggctct 600 atctctgggg agtgcatcac ccatcaagcg ataatgagca aacggatctc tacaaggtgg 660 caacagggag agtaacagta tctacccgct cggaccaaat cagtattgtt cccaatatag 720 gaagtagacc gagggtaagg aatcagagcg gcaggataag catctactgg accctagtaa 780 acccagggga ctccatcatt ttcaacagta ttgggaattt gattgcacca agaggccact 840 acaaaataag caaatctact aagagcacag tgcttaaaag tgacaaaagg attgggtcat 900 gcacaagccc ttgcttaact gataaaggtt cgatccaaag tgacaaacct tttcagaatg 960 tatcaaggat tgctatagga aactgcccga aatatgtaaa gcaagggtcc ctgatgttag 1020 caactggaat gcgcaacatc cctggcaaac aggcaaaggg cttatttggg gcaattgctg 1080 gattcattga aaatggttgg caaggcctga ttgatgggtg gtatggattc aggcaccaaa 1140 atgctgaagg aacaggaact gctgcagacc tgaagtcaac tcaggcagcc attgatcaga 1200 taaatggcaa gctgaacaga ttgatagaga agacaaatga aaaatatcac caaatagaaa 1260 aggaattcga acaggtggaa ggaagaatac aagaccttga gaagtacgtt gaggacacta 1320 agattgattt gtggtcatac aatgctgaat tgctagtagc actagagaat cagcacacaa 1380 tagatgtcac agactccgaa atgaacaagc tttttgaaag agtaagaagg caattaagag 1440 agaatgcaga agatcaaggc aacggttgtt tcgagatatt ccatcagtgt gacaacaatt 1500 gtatagaaag cattagaaac ggaacttatg accacaacat ctacagggat gaagccatca 1560 acaatcgaat caaaataaat cctgtcactt tgacgatggg gtacaaggac ataatcctgt 1620 ggatttcttt ctccatgtca tgctttgtct tcgtggcact gattctggga tttgttctat 1680 gggcttgtca aaacgggaat atccgatgcc aaatctgtat ataaagaaaa aacacccttg 1740 tttctactc 1749 <210> 24 <211> 1762 <212> DNA <213> Influenza virus <400> 24 agcaaaagca ggggatacaa aatgaacact caaatcatcg tcattctagt cctcggactg 60 tcgatggtga gatctgacaa gatttgtctc gggcaccatg ccgtagcaaa tgggacaaaa 120 gtcaacacac taactgagaa aggagtggaa gtggtcaatg ccacggagac agtggagatt 180 acaggaataa ataaagtgtg cacaaaaggg aagaaagcgg tggacttggg atcttgtgga 240 atactgggaa ctatcattgg gcctccacaa tgtgactctc atcttaaatt caaagctgat 300 ctgataatag aaagaagaaa ttcaagtgac atctgttacc cagggaaatt cactaatgag 360 gaagcactga gacaaataat cagagaatct ggtggaattg acaaagagcc aatgggattt 420 agatattcag gaataaaaac agacggggca accagtgcgt gtaagagaac agtgtcctct 480 ttctactcag aaatgaaatg gcttttatcc agcaaggcta accaggtgtt cccacaactg 540 aatcagacat acaggaacaa cagaaaagaa ccagccctaa ttgtttgggg agtacatcat 600 tcaagttcct tggatgagca aaataagcta tatggagctg ggaacaagct gataacagta 660 ggaagctcaa aataccaaca atcgttttca ccaagtccag gggacaggcc caaagtgaat 720 ggtcaggccg ggaggatcga ctttcattgg atgctattgg acccagggga tacagtcact 780 tttaccttca atggtgcatt catagcccca gatagagcca cctttctccg ctctaatgcc 840 ccatcgggag ttgagtacaa tgggaagtca ctgggaatac agagtgatgc acaaattgat 900 gaatcatgtg aaggggaatg cttctacagt ggagggacaa taaacagccc tttgccattt 960 caaaacatcg atagttgggc tgtcggaagg tgccccagat atgtaaagca atcaagcctg 1020 ccgctggcct taggaatgaa aaatgtacca gagaaaatac atactagggg actgttcggt 1080 gcaattgcag gattcatcga gaatggatgg gaaggactca ttgatggatg gtatggattt 1140 aggcatcaaa atgcacaggg gcagggaaca gctgctgact acaagagtac tcaggctgca 1200 attgaccaga taacagggaa acttaataga ttaattgaaa aaaccaacac acagtttgaa 1260 ctcatagaca atgagttcac tgaagtggag cagcagatag gcaatgtaat aaactggaca 1320 agggactcct tgactgagat ctggtcatac aatgctgaac ttctagtagc aatggaaaat 1380 cagcatacaa ttgaccttgc agattctgaa atgaacaaac tctatgagag agtgagaaga 1440 cagctaaggg agaatgccga ggaggatgga actggatgtt ttgagatttt ccaccgatgt 1500 gacgatcaat gtatggagag catacgaaat aatacttaca atcacactga atatcgacag 1560 gaagccttac agaataggat aatgatcaat ccggtaaagc ttagtggtgg gtacaaagat 1620 gtgatactat ggtttagctt cggggcatca tgtgtaatgc ttctagccat tgctatgggt 1680 cttattttca tgtgtgtgaa aaacgggaat ctgcggtgca ctatctgtat ataattattt 1740 gaaaaacacc cttgtttcta ct 1762 <210> 25 <211> 1760 <212> DNA <213> Influenza virus <400> 25 agcaaaagca ggggatattg tcaaaacaac agaatggtga tcaaagtgct ctactttctc 60 atcgtattgt taagtaggta ttcgaaagca gacaaaatat gcataggata tctaagcaac 120 aacgccacag acacagtaga cacactgaca gagaacggag ttccagtgac cagctcagtt 180 gatctcgttg aaacaaacca cacaggaaca tactgctcac tgaatggaat cagcccaatt 240 catcttggtg actgcagctt tgagggatgg atcgtaggaa acccttcctg tgccaccaac 300 atcaacatca gagagtggtc gtatctaatt gaggacccca atgcccccaa caaactctgc 360 ttcccaggag agttagataa taatggagaa ttacgacatc tcttcagcgg agtgaactct 420 tttagcagaa cagaattaat aagtcccaac aaatggggag acattctgga tggagtcacc 480 gcttcttgcc gcgataatgg ggcaagcagt ttttacagaa atttggtctg gatagtgaag 540 aataaaaatg gaaaataccc tgtcataaag ggggattaca ataacacaac aggcagagat 600 gttctagtac tctggggcat tcaccatccg gatacagaaa caacagccat aaacttgtac 660 gcaagcaaaa acccctacac attagtatca acaaaggaat ggagcaaaag atatgaacta 720 gaaattggca ccagaatagg tgatggacag agaagttgga tgaaactata ttggcacctc 780 atgcgccctg gagagaggat aatgtttgaa agcaacgggg gccttatagc gcccagatac 840 ggatacatca ttgagaagta cggtacagga cgaattttcc aaagtggagt gagaatggcc 900 aaatgcaaca caaagtgtca aacatcatta ggtgggataa acaccaacaa aactttccaa 960 aacatagaga gaaatgctct tggagattgc ccaaagtaca taaagtctgg acagctgaag 1020 cttgcaactg ggctgagaaa tgtcccatcc gttggtgaaa gaggtttgtt tggtgcaatt 1080 gcaggcttca tagaaggagg gtggcctggg ctaattaatg gatggtatgg tttccagcat 1140 cagaatgaac aggggactgg cattgctgca gacaaagcct ccactcagaa agcgatagat 1200 gaaataacaa caaaaattaa caatataata gagaagatga acggaaacta tgattcaata 1260 agaggggaat tcaatcaagt agaaaagagg atcaacatgc tcgctgatcg agttgatgat 1320 gcagtaactg acatatggtc gtacaatgct aaacttcttg tactgcttga aaatgggaga 1380 acattggact tacacgacgc aaatgtcagg aacttacacg atcaggtcaa gagaatattg 1440 aaaagtaatg ctattgatga aggagatggt tgcttcaatc ttcttcacaa atgtaatgac 1500 tcatgcatgg aaactattag aaatgggacc tacaatcatg aagattacag ggaagaatca 1560 caactgaaaa ggcaggaaat tgagggaata aaattgaagt ctgaagacaa tgtgtataaa 1620 gtactgtcga tttatagctg cattgcaagc agtattgtgc tggtaggtct catacttgcg 1680 ttcataatgt gggcatgcag caatggaaat tgccggttta atgtttgtat atagtcggaa 1740 aaaataccct tgtttctact 1760 <210> 26 <211> 1882 <212> DNA <213> Influenza virus <400> 26 agcagaagcg ttgcattttc taatatccac aaaatgaagg caataattgt actactcatg 60 gtagtaacat ccaatgcaga tcgaatctgc actgggataa catcgtcaaa ctcacctcat 120 gtggttaaaa ctgccactca aggggaagtc aatgtgactg gtgtgatacc actaacaaca 180 acacctacca aatctcattt tgcaaatctc aaaggaacac agaccagagg aaaactatgc 240 ccaaactgtt ttaactgcac agatctggac gtggccctag gcagaccaaa atgcatgggg 300 aacacaccct ccgcaaaagt ctcaatactc catgaagtca aacctgctac atctggatgc 360 tttcctataa tgcacgacag aacaaaaatc agacaactac ctaatcttct cagaggatat 420 gaaaacatca ggttatcaac cagtaatgtt atcaatacag agacggcacc aggaggaccc 480 tacaaggtgg ggacctcagg atcttgccct aacgttgcta atgggaacgg cttcttcaac 540 acaatggctt gggttatccc aaaagacaac aacaagacag caataaatcc agtaacagta 600 gaagtaccat acatttgttc agaaggggaa gaccaaatta ctgtttgggg gttccactct 660 gatgacaaaa cccaaatgga aagactctat ggagactcaa atcctcaaaa gttcacctca 720 tctgccaatg gagtaaccac acattatgtt tctcagattg gtggcttccc aaatcaaaca 780 gaagacgaag ggctaaaaca aagcggcaga attgttgttg attacatggt acaaaaacct 840 ggaaaaacag gaacaattgt ttatcaaaga ggcattttat tgcctcaaaa agtgtggtgc 900 gcaagtggca ggagcaaggt aataaaaggg tccttgcctt taattggtga agcagattgc 960 ctccacgaaa agtacggtgg attaaataaa agcaagcctt actacacagg agagcatgca 1020 aaggccatag gaaattgccc aatatgggtg aaaacaccct tgaagctggc caatggaacc 1080 aaatatagac cgcctgcaaa actattaaag gaaagaggtt tcttcggagc tattgctggt 1140 ttcttggaag gaggatggga aggaatgatt gcaggttggc acggatacac atctcatgga 1200 gcacatggag tggcagtggc agcagacctt aagagtacac aagaagctat aaacaagata 1260 acaaaaaatc tcaactattt aagtgagcta gaagtaaaaa accttcaaag actaagcgga 1320 gcaatgaatg agcttcacga cgaaatactc gagctagacg aaaaagtgga tgatctaaga 1380 gctgatacaa taagctcaca aatagagctt gcagtcttgc tttccaacga agggataata 1440 aacagtgaag atgagcatct cttggcactt gaaagaaaac tgaagaaaat gcttggcccc 1500 tctgctgtag aaatagggaa tgggtgcttt gaaaccaaac acaaatgcaa ccagacttgc 1560 ctagacagga tagctgctgg cacctttaat gcaggagatt tttctcttcc cacttttgat 1620 tcattaaaca ttactgctgc atctttaaat gatgatggct tggataatca tactatactg 1680 ctctactact caactgctgc ttctagcttg gctgtaacat taatgatagc tatcttcatt 1740 gtctacatgg tctccagaga caatgtttct tgttccatct gtctgtgagg gagattaagc 1800 cctgtgtttt cctttactgt agtgctcatt tgcttgtcac cattacaaag aaacgttatt 1860 gaaaaatgct cttgttacta ct 1882 <210> 27 <211> 2073 <212> DNA <213> Influenza virus <400> 27 agcagaagca gggggttaat aatgtttttc tcattactct tggtgttggg cctcacagag 60 gctgaaaaaa taaagatatg ccttcaaaag caagtgaaca gtagcttcag cctacacaat 120 ggcttcggag gaaatttgta tgccacagaa gaaaaaagaa tgtttgagct tgttaagccc 180 aaagctggag cctctgtctt gaatcaaagt acatggattg gctttggaga ttcaaggact 240 gacaaaagca attcagcttt tcctaggtct gctgatgttt cagcaaaaac tgctgataag 300 tttcgttttt tgtctggtgg atccttaatg ttgagtatgt ttggcccacc tgggaaggta 360 gactaccttt accaaggatg tggaaaacat aaagtttttt atgaaggagt taactggagt 420 ccacatgctg ctataaattg ttacagaaaa aattggactg atatcaaact gaatttccag 480 aaaaacattt atgaattggc ttcacaatca cattgcatga gcttggtgaa tgccttggac 540 aaaactattc ctttacaagt gactgctggg actgcaggaa attgcaacaa cagcttctta 600 aaaaatccag cattgtacac acaagaagtc aagccttcag aaaacaaatg tgggaaagaa 660 aatcttgctt tcttcacact tccaacccaa tttggaacct atgagtgcaa actgcatctt 720 gtggcttctt gctatttcat ctatgatagt aaagaagtgt acaataaaag aggatgtgac 780 aactactttc aagtgatcta tgattcattt ggaaaagtcg ttggaggact agataacagg 840 gtatcacctt acacagggaa ttctggagac accccaacaa tgcaatgtga catgctccag 900 ctgaaacctg gaagatattc agtaagaagc tctccaagat tccttttaat gcctgaaaga 960 agttattgct ttgacatgaa agaaaaagga ccagtcactg ctgtccaatc catttgggga 1020 aaaggcagag aatctgacta tgcagtggat caagcttgct tgagcactcc agggtgcatg 1080 ttgatccaaa agcaaaagcc atacattgga gaagctgatg atcaccatgg agatcaagaa 1140 atgagggagt tgctgtcagg actggactat gaagctagat gcatatcaca atcagggtgg 1200 gtgaatgaaa ccagtccttt tacggagaaa tacctccttc ctcccaaatt tggaagatgc 1260 cctttggctg caaaggaaga atccattcca aaaatcccag atggccttct aattcccacc 1320 agtggaaccg ataccactgt aaccaaacct aagagcagaa tttttggaat cgatgacctc 1380 attattggtg tgctctttgt tgcaatcgtt gaaacaggaa ttggaggcta tctgcttgga 1440 agtagaaaag aatcaggagg aggtgtgaca aaagaatcag ctgaaaaagg gtttgagaaa 1500 attggaaatg acatacaaat tttaaaatct tctataaata tcgcaataga aaaactaaat 1560 gacagaattt ctcatgatga gcaagccatc agagatctaa ctttagaaat tgaaaatgca 1620 agatctgaag ctttattggg agaattggga ataataagag ccttattggt aggaaatata 1680 agcataggat tacaggaatc tttatgggaa ctagcttcag aaataacaaa tagagcagga 1740 gatctagcag ttgaagtctc cccaggttgc tggataattg acaataacat ttgtgatcaa 1800 agctgtcaaa attttatttt caagttcaac gaaactgcac ctgttccaac cattccccct 1860 cttgacacaa aaattgatct gcaatcagat cctttttact ggggaagcag cttgggctta 1920 gcaataactg ctactatttc attggcagct ttggtgatct ctgggatcgc catctgcaga 1980 actaaatgat tgagacaatt ttgaaaaatg gataatgtgt tggtcaatat tttgtacagt 2040 tttataaaaa acaaaaatcc ccttgctact gct 2073 <210> 28 <211> 1670 <212> DNA <213> Artificial sequence <220> <223> sequence encoding HA0 of H1 (A/New Caledonia/20/99 (H1N1) <400> 28 agatcttcgc tgacacaata tgtataggct accatgccaa caactcaacc gacactgttg 60 acacagtact tgagaagaat gtgacagtga cacactctgt caacctactt gaggacagtc 120 acaatggaaa actatgtcta ctaaaaggaa tagccccact acaattgggt aattgcagcg 180 ttgccggatg gatcttagga aacccagaat gcgaattact gatttccaag gaatcatggt 240 cctacattgt agaaacacca aatcctgaga atggaacatg ttacccaggg tatttcgccg 300 actatgagga actgagggag caattgagtt cagtatcttc atttgagaga ttcgaaatat 360 tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg agtatcagca tcatgctccc 420 ataatgggaa aagcagtttt tacagaaatt tgctatggct gacggggaag aatggtttgt 480 acccaaacct gagcaagtcc tatgtaaaca acaaagagaa agaagtcctt gtactatggg 540 gtgttcatca cccgcctaac atagggaacc aaagggcact ctatcataca gaaaatgctt 600 atgtctctgt agtgtcttca cattatagca gaagattcac cccagaaata gccaaaagac 660 ccaaagtaag agatcaggaa ggaagaatca actactactg gactctgctg gaacctgggg 720 atacaataat atttgaggca aatggaaatc taatagcgcc atggtatgct tttgcactga 780 gtagaggctt tggatcagga atcatcacct caaatgcacc aatggatgaa tgtgatgcga 840 agtgtcaaac acctcaggga gctataaaca gcagtcttcc tttccagaat gtacacccag 900 tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa attaaggatg gttacaggac 960 taaggaacat cccatccatt caatccagag gtttgtttgg agccattgcc ggtttcattg 1020 aaggggggtg gactggaatg gtagatgggt ggtatggtta tcatcatcag aatgagcaag 1080 gatctggcta tgctgcagat caaaaaagta cacaaaatgc cattaacggg attacaaaca 1140 aggtcaattc tgtaattgag aaaatgaaca ctcaattcac agctgtgggc aaagagttca 1200 acaaattgga aagaaggatg gaaaacttaa ataaaaaagt tgatgatggg tttctagaca 1260 tttggacata taatgcagaa ttgttggttc tactggaaaa tgaaaggact ttggatttcc 1320 atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag ccaattaaag aataatgcca 1380 aagaaatagg aaacgggtgt tttgagttct atcacaagtg taacaatgaa tgcatggaga 1440 gtgtgaaaaa tggtacctat gactatccaa aatattccga agaatcaaag ttaaacaggg 1500 agaaaattga tggagtgaaa ttggaatcaa tgggagtata ccagattctg gcgatctact 1560 caactgtcgc cagttccctg gttcttttgg tctccctggg ggcaatcagc ttctggatgt 1620 gttccaatgg gtctttgcag tgtagaatat gcatctaaga gctcaggcct 1670 <210> 29 <211> 32 <212> DNA <213> Artificial sequence <220> <223> primer XmaI-pPlas.c <400> 29 agttccccgg gctggtatat ttatatgttg tc 32 <210> 30 <211> 46 <212> DNA <213> Artificial sequence <220> <223> primer SacI-ATG-pPlas.r <400> 30 aatagagctc cattttctct caagatgatt aattaattaa ttagtc 46 <210> 31 <211> 46 <212> DNA <213> Artificial sequence <220> <223> primer SacI-PlasTer.c <400> 31 aatagagctc gttaaaatgc ttcttcgtct cctatttata atatgg 46 <210> 32 <211> 48 <212> DNA <213> Artificial sequence <220> <223> primer EcoRI-PlasTer.r <400> 32 ttacgaattc tccttcctaa ttggtgtact atcatttatc aaagggga 48 <210> 33 <211> 1711 <212> DNA <213> Influenza virus <400> 33 atgaaagcaa aactactggt cctgttatgt acatttacag ctacatatgc agacacaata 60 tgtataggct accatgccaa caactcaacc gacactgttg acacagtact tgagaagaat 120 gtgacagtga cacactctgt caacctactt gaggacagtc acaatggaaa actatgtcta 180 ctaaaaggaa tagccccact acaattgggt aattgcagcg ttgccggatg gatcttagga 240 aacccagaat gcgaattact gatttccaag gaatcatggt cctacattgt agaaacacca 300 aatcctgaga atggaacatg ttacccaggg tatttcgccg actatgagga actgagggag 360 caattgagtt cagtatcttc atttgagaga ttcgaaatat tccccaaaga aagctcatgg 420 cccaaccaca ccgtaaccgg agtatcagca tcatgctccc ataatgggaa aagcagtttt 480 tacagaaatt tgctatggct gacggggaag aatggtttgt acccaaacct gagcaagtcc 540 tatgtaaaca acaaagagaa agaagtcctt gtactatggg gtgttcatca cccgcctaac 600 atagggaacc aaagggccct ctatcataca gaaaatgctt atgtctctgt agtgtcttca 660 cattatagca gaagattcac cccagaaata gccaaaagac ccaaagtaag agatcaggaa 720 ggaagaatca actactactg gactctgctg gaacctgggg atacaataat atttgaggca 780 aatggaaatc taatagcgcc atggtatgct tttgcactga gtagaggctt tggatcagga 840 atcatcacct caaatgcacc aatggatgaa tgtgatgcga agtgtcaaac acctcaggga 900 gctataaaca gcagtcttcc tttccagaat gtacacccag tcacaatagg agagtgtcca 960 aagtatgtca ggagtgcaaa attaaggatg gttacaggac taaggaacat cccatccatt 1020 caatccagag gtttgtttgg agccattgcc ggtttcattg aaggggggtg gactggaatg 1080 gtagatgggt ggtatggtta tcatcatcag aatgagcaag gatctggcta tgctgcagat 1140 caaaaaagta cacaaaatgc cattaacggg attacaaaca aggtgaattc tgtaattgag 1200 aaaatgaaca ctcaattcac agctgtgggc aaagaattca acaaattgga aagaaggatg 1260 gaaaacttaa ataaaaaagt tgatgatggg tttctagaca tttggacata taatgcagaa 1320 ttgttggttc tactggaaaa tgaaaggact ttggatttcc atgactccaa tgtgaagaat 1380 ctgtatgaga aagtaaaaag ccaattaaag aataatgcca aagaaatagg aaacgggtgt 1440 tttgaattct atcacaagtg taacaatgaa tgcatggaga gtgtgaaaaa tggaacttat 1500 gactatccaa aatattccga agaatcaaag ttaaacaggg agaaaattga tggagtgaaa 1560 ttggaatcaa tgggagtcta tcagattctg gcgatctact caactgtcgc cagttccctg 1620 gttcttttgg tctccctggg ggcaatcagc ttctggatgt gttccaatgg gtctttgcag 1680 tgtagaatat gcatctgaga ccagaatttc a 1711 <210> 34 <211> 1781 <212> DNA <213> Medicago sativa <400> 34 ccaaatcctt aacattcttt caacaccaac aatggcgaaa aacgttgcga ttttcggttt 60 attgttttct cttcttctgt tggttccttc tcagatcttc gctgaggaat catcaactga 120 cgctaaggaa tttgttctta cattggataa cactaatttc catgacactg ttaagaagca 180 cgatttcatc gtcgttgaat tctacgcacc ttggtgtgga cactgtaaga agctagcccc 240 agagtatgag aaggctgctt ctatcttgag cactcacgag ccaccagttg ttttggctaa 300 agttgatgcc aatgaggagc acaacaaaga cctcgcatcg gaaaatgatg ttaagggatt 360 cccaaccatt aagattttta ggaatggtgg aaagaacatt caagaataca aaggtccccg 420 tgaagctgaa ggtattgttg agtatttgaa aaaacaaagt ggccctgcat ccacagaaat 480 taaatctgct gatgatgcga ccgcttttgt tggtgacaac aaagttgtta ttgtcggagt 540 tttccctaaa ttttctggtg aggagtacga taacttcatt gcattagcag agaagttgcg 600 ttctgactat gactttgctc acactttgaa tgccaaacac cttccaaagg gagactcatc 660 agtgtctggg cctgtggtta ggttatttaa gccatttgac gagctctttg ttgactcaaa 720 ggatttcaat gtagaagctc tagagaaatt cattgaagaa tccagtaccc caattgtgac 780 tgtcttcaac aatgagccta gcaatcaccc ttttgttgtc aaattcttta actctcccaa 840 cgcaaaggct atgttgttca tcaactttac taccgaaggt gctgaatctt tcaaaacaaa 900 ataccatgaa gtggctgagc aatacaaaca acagggagtt agctttcttg ttggagatgt 960 tgagtctagt caaggtgcct tccagtattt tggactgaag gaagaacaag tacctctaat 1020 tattattcag cataatgatg gcaagaagtt tttcaaaccc aatttggaac ttgatcaact 1080 cccaacttgg ttgaaggcat acaaggatgg caaggttgaa ccatttgtca agtctgaacc 1140 tattcctgaa actaacaacg agcctgttaa agtggtggtt gggcaaactc ttgaggacgt 1200 tgttttcaag tctgggaaga atgttttgat agagttttat gctccttggt gtggtcactg 1260 caagcagttg gctccaatct tggatgaagt tgctgtctca ttccaaagcg atgctgatgt 1320 tgttattgca aaactggatg caactgccaa cgatatccca accgacacct ttgatgtcca 1380 aggctatcca accttgtact tcaggtcagc aagtggaaaa ctatcacaat acgacggtgg 1440 taggacaaag gaagacatca tagaattcat tgaaaagaac aaggataaaa ctggtgctgc 1500 tcatcaagaa gtagaacaac caaaagctgc tgctcagcca gaagcagaac aaccaaaaga 1560 tgagctttga aaagttccgc ttggaggata tcggcacaca gtcatctgcg ggctttacaa 1620 ctcttttgta tctcagaatc agaagttagg aaatcttagt gccaatctat ctatttttgc 1680 gtttcatttt atctttttgg tttactctaa tgtattactg aataatgtga gttttggcgg 1740 agtttagtac tggaactttt gtttctgtaa aaaaaaaaaa a 1781 <210> 35 <211> 1027 <212> DNA <213> Influenza virus <400> 35 agcgaaagca ggtagatatt gaaagatgag tcttctaacc gaggtcgaaa cgtacgttct 60 ctctatcatc ccgtcaggcc ccctcaaagc cgagatcgca cagagacttg aagatgtctt 120 tgcagggaag aacaccgatc ttgaggttct catggaatgg ctaaagacaa gaccaatcct 180 gtcacctctg actaagggga ttttaggatt tgtgttcacg ctcaccgtgc ccagtgagcg 240 aggactgcag cgtagacgct ttgtccaaaa tgcccttaat gggaacgggg atccaaataa 300 catggacaaa gcagttaaac tgtataggaa gctcaagagg gagataacat tccatggggc 360 caaagaaatc tcactcagtt attctgctgg tgcacttgcc agttgtatgg gcctcatata 420 caacaggatg ggggctgtga ccactgaagt ggcatttggc ctggtatgtg caacctgtga 480 acagattgct gactcccagc atcggtctca taggcaaatg gtgacaacaa ccaacccact 540 aatcagacat gagaacagaa tggttttagc cagcactaca gctaaggcta tggagcaaat 600 ggctggatcg agtgagcaag cagcagaggc catggaggtt gctagtcagg ctaggcaaat 660 ggtgcaagcg atgagaacca ttgggactca tcctagctcc agtgctggtc tgaaaaatga 720 tcttcttgaa aatttgcagg cctatcagaa acgaatgggg gtgcagatgc aacggttcaa 780 gtgatcctct cgctattgcc gcaaatatca ttgggatctt gcacttgata ttgtggattc 840 ttgatcgtct ttttttcaaa tgcatttacc gtcgctttaa atacggactg aaaggagggc 900 cttctacgga aggagtgcca aagtctatga gggaagaata tcgaaaggaa cagcagagtg 960 ctgtggatgc tgacgatggt cattttgtca gcatagagct ggagtaaaaa actaccttgt 1020 ttctact 1027 <210> 36 <211> 1788 <212> DNA <213> Artificial sequence <220> <223> clone 774 - nucleotide sequence of A/Brisbane/59/2007 (H1N1) <400> 36 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgaaa gtaaaactac tggtcctgtt atgcacattt 120 acagctacat atgcagacac aatatgtata ggctaccatg ctaacaactc gaccgacact 180 gttgacacag tacttgaaaa gaatgtgaca gtgacacact ctgtcaacct gcttgagaac 240 agtcacaatg gaaaactatg tctattaaaa ggaatagccc cactacaatt gggtaattgc 300 agcgttgccg ggtggatctt aggaaaccca gaatgcgaat tactgatttc caaggagtca 360 tggtcctaca ttgtagaaaa accaaatcct gagaatggaa catgttaccc agggcatttc 420 gctgactatg aggaactgag ggagcaattg agttcagtat cttcatttga gaggttcgaa 480 atattcccca aagaaagctc atggcccaac cacaccgtaa ccggagtgtc agcatcatgc 540 tcccataatg gggaaagcag tttttacaga aatttgctat ggctgacggg gaagaatggt 600 ttgtacccaa acctgagcaa gtcctatgca aacaacaaag aaaaagaagt ccttgtacta 660 tggggtgttc atcacccgcc aaacataggt gaccaaaagg ccctctatca tacagaaaat 720 gcttatgtct ctgtagtgtc ttcacattat agcagaaaat tcaccccaga aatagccaaa 780 agacccaaag taagagatca agaaggaaga atcaattact actggactct gcttgaaccc 840 ggggatacaa taatatttga ggcaaatgga aatctaatag cgccaagata tgctttcgca 900 ctgagtagag gctttggatc aggaatcatc aactcaaatg caccaatgga taaatgtgat 960 gcgaagtgcc aaacacctca gggagctata aacagcagtc ttcctttcca gaacgtacac 1020 ccagtcacaa taggagagtg tccaaagtat gtcaggagtg caaaattaag gatggttaca 1080 ggactaagga acatcccatc cattcaatcc agaggtttgt ttggagccat tgccggtttc 1140 attgaagggg ggtggactgg aatggtagat ggttggtatg gttatcatca tcagaatgag 1200 caaggatctg gctatgctgc agatcaaaaa agcacacaaa atgccattaa tgggattaca 1260 aacaaggtca attctgtaat tgagaaaatg aacactcaat tcacagcagt gggcaaagag 1320 ttcaacaaat tggaaagaag gatggaaaac ttgaataaaa aagttgatga tgggtttata 1380 gacatttgga catataatgc agaactgttg gttctactgg aaaatgaaag gactttggat 1440 ttccatgact ccaatgtgaa gaatctgtat gagaaagtaa aaagccagtt aaagaataat 1500 gctaaagaaa taggaaatgg gtgttttgag ttctatcaca agtgtaacga tgaatgcatg 1560 gagagtgtaa agaatggaac ttatgactat ccaaaatatt ccgaagaatc aaagttaaac 1620 agggagaaaa ttgatggagt gaaattggaa tcaatgggag tctatcagat tctggcgatc 1680 tactcaacag tcgccagttc tctggttctt ttggtctccc tgggggcaat cagcttctgg 1740 atgtgttcca atgggtcttt acagtgtaga atatgcatct aagagctc 1788 <210> 37 <211> 1788 <212> DNA <213> Artificial sequence <220> <223> clone 775 - nucleotide sequence of A/Solomon Islands 3/2006 (H1N1) <400> 37 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgaaa gtaaaactac tggtcctgtt atgcacattt 120 acagctacat atgcagacac aatatgtata ggctaccatg ccaacaactc aaccgacact 180 gttgacacag tacttgagaa gaatgtgaca gtgacacact ctgtcaacct gcttgaggac 240 agtcacaatg gaaaattatg tctattaaaa ggaatagccc cactacaatt gggtaattgc 300 agcgttgccg gatggatctt aggaaaccca gaatgcgaat tactgatttc cagggaatca 360 tggtcctaca ttgtagaaaa accaaatcct gagaatggaa catgttaccc agggcatttc 420 gccgactatg aggaactgag ggagcaattg agttcagtat cttcatttga gagattcgaa 480 atattcccca aagaaagctc atggcccaac cacaccacaa ccggagtatc agcatcatgc 540 tcccataatg gggaaagcag tttttacaaa aatttgctat ggctgacggg gaagaatggt 600 ttgtacccaa acctgagcaa gtcctatgca aacaacaaag agaaagaagt ccttgtacta 660 tggggtgttc atcacccgcc taacataggt gaccaaaggg ctctctatca taaagaaaat 720 gcttatgtct ctgtagtgtc ttcacattat agcagaaaat tcaccccaga aatagccaaa 780 agacccaaag taagagatca agaaggaaga atcaactact actggactct acttgaaccc 840 ggggatacaa taatatttga ggcaaatgga aatctaatag cgccaagata tgctttcgca 900 ctgagtagag gctttggatc aggaatcatc aactcaaatg caccaatgga tgaatgtgat 960 gcgaagtgcc aaacacctca gggagctata aacagcagtc ttcctttcca gaatgtacac 1020 cctgtcacaa taggagagtg tccaaagtat gtcaggagtg caaaattaag gatggttaca 1080 ggactaagga acatcccatc cattcaatcc agaggtttgt ttggagccat tgccggtttc 1140 attgaagggg ggtggactgg aatggtagat ggttggtatg gttatcatca tcagaatgag 1200 caaggatctg gctatgctgc agatcaaaaa agcacacaaa atgccattaa tgggattaca 1260 aacaaggtca attctgtaat tgagaaaatg aacactcaat tcacagctgt gggcaaagag 1320 ttcaacaaat tggaaagaag gatggaaaac ttaaataaaa aagttgatga tgggtttata 1380 gacatttgga catataatgc agaattgttg gttctactgg aaaatgaaag gactttggat 1440 ttccatgact ccaatgtgaa gaatctgtat gagaaagtaa aaagccaatt aaagaataat 1500 gccaaagaaa taggaaatgg gtgttttgag ttctatcata agtgtaacga tgaatgcatg 1560 gagagtgtaa aaaatggaac ttatgactat ccaaaatatt ccgaagaatc aaagttaaac 1620 agggagaaaa ttgatggagt gaaattggaa tcaatgggag tctatcagat tctggcgatc 1680 tactcaacag tcgccagttc tctggttctt ttggtctccc tgggggcaat cagcttctgg 1740 atgtgttcca atgggtcttt gcagtgtaga atatgcatct gagagctc 1788 <210> 38 <211> 1791 <212> DNA <213> Artificial sequence <220> <223> clone 776 - nucleotide sequence of A/Brisbane 10/2007 (H3N2) <400> 38 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgaag actatcattg ctttgagcta cattctatgt 120 ctggttttca ctcaaaaact tcccggaaat gacaacagca cggcaacgct gtgccttggg 180 caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 240 actaatgcta ctgagctggt tcagagttcc tcaacaggtg aaatatgcga cagtcctcat 300 cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 360 gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac 420 tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 480 acactggagt ttaacaatga aagtttcaat tggactggag tcactcaaaa cggaacaagc 540 tctgcttgca taaggagatc taataacagt ttctttagta gattgaattg gttgacccac 600 ttaaaattca aatacccagc attgaacgtg actatgccaa acaatgaaaa atttgacaaa 660 ttgtacattt ggggggttca ccacccgggt acggacaatg accaaatctt cctgtatgct 720 caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaactgt aatcccgaat 780 atcggatcta gacccagagt aaggaatatc cccagcagaa taagcatcta ttggacaata 840 gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 900 tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 960 tgcaattctg aatgcatcac tccaaacgga agcattccca atgacaaacc attccaaaat 1020 gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1080 gcaacaggga tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatcgcg 1140 ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtatggttt caggcatcaa 1200 aattctgagg gaataggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1260 atcaatggga agctgaatag gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1320 aaagagttct cagaagtcga agggagaatc caggaccttg agaaatatgt tgaggacacc 1380 aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1440 attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1500 gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1560 tgcataggat caatcagaaa tggaacttat gaccacgatg tatacagaga tgaagcatta 1620 aacaaccggt tccagatcaa gggcgttgag ctgaagtcag gatacaaaga ttggatacta 1680 tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1740 tgggcctgcc aaaaaggcaa cattaggtgc aacatttgca tttgagagct c 1791 <210> 39 <211> 1791 <212> DNA <213> Artificial sequence <220> <223> clone 777 - nucleotide sequence of A/Wisconsin/67/2005 (H3N2) <400> 39 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgaag actatcattg ctttgagcta cattctatgt 120 ctggttttca ctcaaaaact tcccggaaat gacaacagca cggcaacgct gtgccttggg 180 caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgacca aattgaagtt 240 actaatgcta ctgagctggt tcagagttcc tcaacaggtg gaatatgcga cagtcctcat 300 cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 360 gatggcttcc aaaataagaa atgggacctt tttgttgaac gcagcaaagc ctacagcaac 420 tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 480 acactggagt ttaacgatga aagtttcaat tggactggag tcactcaaaa tggaacaagc 540 tctgcttgca aaaggagatc taataacagt ttctttagta gattgaattg gttgacccac 600 ttaaaattca aatacccagc attgaacgtg actatgccaa acaatgaaaa atttgacaaa 660 ttgtacattt ggggggttca ccacccgggt acggacaatg accaaatctt cctgcatgct 720 caagcatcag gaagaatcac agtctctacc aaaagaagcc aacaaactgt aatcccgaat 780 atcggatcta gacccagaat aaggaatatc cccagcagaa taagcatcta ttggacaata 840 gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 900 tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 960 tgcaattctg aatgcatcac tccaaatgga agcattccca atgacaaacc atttcaaaat 1020 gtaaacagga tcacatatgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1080 gcaacaggga tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatcgcg 1140 ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1200 aattctgagg gaataggaca agcagcagat ctcaaaagca ctcaagcagc aatcaatcaa 1260 atcaatggga agctgaatag gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1320 aaagagttct cagaagtaga agggagaatc caggacctcg agaaatatgt tgaggacact 1380 aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1440 attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa gaacaaagaa gcaactgagg 1500 gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1560 tgcataggat caatcagaaa tggaacttat gaccatgatg tatacagaga tgaagcatta 1620 aacaaccggt tccagatcaa aggcgttgag ctgaagtcag gatacaaaga ttggatacta 1680 tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1740 tgggcctgcc aaaaaggcaa cattaggtgc aacatttgca tttgagagct c 1791 <210> 40 <211> 1848 <212> DNA <213> Artificial sequence <220> <223> clone 778 - nucleotide sequence of B/Malaysia/2506/2004 <400> 40 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgaag gcaataattg tactactcat ggtagtaaca 120 tccaatgcag atcgaatctg cactgggata acatcgtcaa actcaccaca tgttgtcaaa 180 actgctactc aaggggaggt caatgtgact ggtgtaatac cactgacaac aacacccacc 240 aaatctcatt ttgcaaatct caaaggaaca gaaaccagag ggaaactatg cccaaaatgc 300 ctcaactgca cagatctgga cgtggccttg ggcagaccaa aatgcacggg gaacataccc 360 tcggcaagag tttcaatact ccatgaagtc agacctgtta catctgggtg ctttcctata 420 atgcacgaca gaacaaaaat tagacagctg cctaaacttc tcagaggata cgaacatatc 480 aggttatcaa ctcataacgt tatcaatgca gaaaatgcac caggaggacc ctacaaaatt 540 ggaacctcag ggtcttgccc taacgttacc aatggaaacg gatttttcgc aacaatggct 600 tgggccgtcc caaaaaacga caacaacaaa acagcaacaa attcattaac aatagaagta 660 ccatacattt gtacagaagg agaagaccaa attaccgttt gggggttcca ctctgataac 720 gaaacccaaa tggcaaagct ctatggggac tcaaagcccc agaagttcac ctcatctgcc 780 aacggagtga ccacacatta cgtttcacag attggtggct tcccaaatca aacagaagac 840 ggaggactac cacaaagcgg tagaattgtt gttgattaca tggtgcaaaa atctgggaaa 900 acaggaacaa ttacctatca aagaggtatt ttattgcctc aaaaagtgtg gtgcgcaagt 960 ggcaggagca aggtaataaa aggatcgttg cctttaattg gagaagcaga ttgcctccac 1020 gaaaaatacg gtggattaaa caaaagcaag ccttactaca caggggaaca tgcaaaggcc 1080 ataggaaatt gcccaatatg ggtgaaaaca cccttgaagc tggccaatgg aaccaaatat 1140 agacctcctg caaaactatt aaaggaaagg ggtttcttcg gagctattgc tggtttctta 1200 gaaggaggat gggaaggaat gattgcaggt tggcacggat acacatccca tggggcacat 1260 ggagtagcgg tggcagcaga ccttaagagc actcaagagg ccataaacaa gataacaaaa 1320 aatctcaact ctttgagtga gctggaagta aagaatcttc aaagactaag cggtgccatg 1380 gatgaactcc acaacgaaat actagaacta gacgagaaag tggatgatct cagagctgat 1440 acaataagct cacaaataga actcgcagtc ctgctttcca atgaaggaat aataaacagt 1500 gaagatgagc atctcttggc gcttgaaaga aagctgaaga aaatgctggg cccctctgct 1560 gtagagatag ggaatggatg ctttgaaacc aaacacaagt gcaaccagac ctgtctcgac 1620 agaatagctg ctggtacctt tgatgcagga gaattttctc tccccacttt tgattcactg 1680 aatattactg ctgcatcttt aaatgacgat ggattggata atcatactat actgctttac 1740 tactcaactg ctgcctccag tttggctgta acattgatga tagctatctt tgttgtttat 1800 atggtctcca gagacaatgt ttcttgctcc atctgtctat aagagctc 1848 <210> 41 <211> 1845 <212> DNA <213> Artificial sequence <220> <223> clone 779 - nucleotide sequence of B/Florida/4/2006 <400> 41 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgaag gcaataattg tactactcat ggtagtaaca 120 tccaatgcag atcgaatctg cactggaata acatcttcaa actcacctca tgtggtcaaa 180 acagccactc aaggggaggt caatgtgact ggtgtgatac cactaacaac aacaccaaca 240 aaatcttatt ttgcaaatct caaaggaaca aggaccagag ggaaactatg cccagactgt 300 ctcaactgca cagatctgga tgtggctttg ggcagaccaa tgtgtgtggg gaccacacct 360 tcggcgaagg cttcaatact ccacgaagtc aaacctgtta catccgggtg ctttcctata 420 atgcacgaca gaacaaaaat caggcaacta cccaatcttc tcagaggata tgaaaatatc 480 aggctatcaa cccaaaacgt catcgatgcg gaaaaggcac caggaggacc ctacagactt 540 ggaacctcag gatcttgccc taacgctacc agtaagagcg gatttttcgc aacaatggct 600 tgggctgtcc caaaggacaa caacaaaaat gcaacgaacc cactaacagt agaagtacca 660 tacatttgta cagaagggga agaccaaatc actgtttggg ggttccattc agataacaaa 720 acccaaatga agaacctcta tggagactca aatcctcaaa agttcacctc atctgctaat 780 ggagtaacca cacactatgt ttctcagatt ggcagcttcc cagatcaaac agaagacgga 840 ggactaccac aaagcggcag gattgttgtt gattacatga tgcaaaaacc tgggaaaaca 900 ggaacaattg tctaccaaag aggtgttttg ttgcctcaaa aggtgtggtg cgcgagtggc 960 aggagcaaag taataaaagg gtccttgcct ttaattggtg aagcagattg ccttcatgaa 1020 aaatacggtg gattaaacaa aagcaagcct tactacacag gagaacatgc aaaagccata 1080 ggaaattgcc caatatgggt gaaaacacct ttgaagctcg ccaatggaac caaatataga 1140 cctcctgcaa aactattaaa ggaaaggggt ttcttcggag ctattgctgg tttcctagaa 1200 ggaggatggg aaggaatgat tgcaggctgg cacggataca catctcacgg agcacatgga 1260 gtggcagtgg cggcggacct taagagtacg caagaagcta taaacaagat aacaaaaaat 1320 ctcaattctt tgagtgagct agaagtaaag aatcttcaaa gactaagtgg tgccatggat 1380 gaactccaca acgaaatact cgagctggat gagaaagtgg atgatctcag agctgacact 1440 ataagctcgc aaatagaact tgcagtcttg ctttccaacg aaggaataat aaacagtgaa 1500 gatgagcatc tattggcact tgagagaaaa ctaaagaaaa tgctgggtcc ctctgctgta 1560 gagataggaa atggatgctt cgaaaccaaa cacaagtgca accagacctg cttagacagg 1620 atagctgctg gcacctttaa tgcaggagaa ttttctctcc ccacttttga ttcactgaac 1680 attactgctg catctttaaa tgatgatgga ttggataacc atactatact gctctattac 1740 tcaactgctg cttctagttt ggctgtaaca ttgatgctag ctatttttat tgtttatatg 1800 gtctccagag acaacgtttc atgctccatc tgtctataag agctc 1845 <210> 42 <211> 1779 <212> DNA <213> Artificial sequence <220> <223> clone 780 - nucleotide sequence of A/Singapore/1/57 (H2N2) <400> 42 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatggcc atcatttatc taattctcct gttcacagca 120 gtgagagggg accaaatatg cattggatac catgccaata attccacaga gaaggtcgac 180 acaattctag agcggaacgt cactgtgact catgccaagg acattcttga gaagacccat 240 aacggaaagt tatgcaaact aaacggaatc cctccacttg aactagggga ctgtagcatt 300 gccggatggc tccttggaaa tccagaatgt gataggcttc taagtgtgcc agaatggtcc 360 tatataatgg agaaagaaaa cccgagagac ggtttgtgtt atccaggcag cttcaatgat 420 tatgaagaat tgaaacatct cctcagcagc gtgaaacatt tcgagaaagt aaagattctg 480 cccaaagata gatggacaca gcatacaaca actggaggtt cacgggcctg cgcggtgtct 540 ggtaatccat cattcttcag gaacatggtc tggctgacaa agaaagaatc aaattatccg 600 gttgccaaag gatcgtacaa caatacaagc ggagaacaaa tgctaataat ttggggggtg 660 caccatccca atgatgagac agaacaaaga acattgtacc agaatgtggg aacctatgtt 720 tccgtaggca catcaacatt gaacaaaagg tcaaccccag acatagcaac aaggcctaaa 780 gtgaatggac taggaagtag aatggagttc tcttggaccc tattggatat gtgggacacc 840 ataaattttg agagtactgg taatctaatt gcaccagagt atggattcaa aatatcgaaa 900 agaggtagtt cagggatcat gaaaacagaa ggaacacttg agaactgtga gaccaaatgc 960 caaactcctt tgggagcaat aaatacaaca ttgccttttc acaatgtcca cccactgaca 1020 ataggtgagt gccccaaata tgtaaaatcg gagaagttgg tcttagcaac aggactaagg 1080 aatgttcccc agattgaatc aagaggattg tttggggcaa tagctggttt tatagaagga 1140 ggatggcaag gaatggttga tggttggtat ggataccatc acagcaatga ccagggatca 1200 gggtatgcag cagacaaaga atccactcaa aaggcatttg atggaatcac caacaaggta 1260 aattctgtga ttgaaaagat gaacacccaa tttgaagctg ttgggaaaga gttcagtaac 1320 ttagagagaa gactggagaa cttgaacaaa aagatggaag acgggtttct agatgtgtgg 1380 acatacaatg ctgagcttct agttctgatg gaaaatgaga ggacacttga ctttcatgat 1440 tctaatgtca agaatctgta tgataaagtc agaatgcagc tgagagacaa cgtcaaagaa 1500 ctaggaaatg gatgttttga attttatcac aaatgtgatg atgaatgcat gaatagtgtg 1560 aaaaacggga cgtatgatta tcccaagtat gaagaagagt ctaaactaaa tagaaatgaa 1620 atcaaagggg taaaattgag cagcatgggg gtttatcaaa tccttgccat ttatgctaca 1680 gtagcaggtt ctctgtcact ggcaatcatg atggctggga tctctttctg gatgtgctcc 1740 aacgggtctc tgcagtgcag gatctgcata tgagagctc 1779 <210> 43 <211> 1794 <212> DNA <213> Artificial sequence <220> <223> clone 781 - nucleotide sequence of A/Anhui/1/2005 (H5N1) <400> 43 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatggag aaaatagtgc ttcttcttgc aatagtcagc 120 cttgttaaaa gtgatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 180 gacacaataa tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 240 cacaacggga agctctgcga tctagatgga gtgaagcctc tgattttaag agattgtagt 300 gtagctggat ggctcctcgg aaacccaatg tgtgacgagt tcatcaatgt gccggaatgg 360 tcttacatag tggagaaggc caacccagcc aatgacctct gttacccagg gaatttcaac 420 gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 480 atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gggtcagctc agcatgtcca 540 taccagggaa cgccctcctt tttcagaaat gtggtatggc ttatcaaaaa gaacaataca 600 tacccaacaa taaagagaag ctacaataat accaaccagg aagatctttt gatactgtgg 660 gggattcatc attctaatga tgcggcagag cagacaaagc tctatcaaaa cccaaccacc 720 tatatttccg ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 780 tccaaagtaa acgggcaaag tggaaggatg gatttcttct ggacaatttt aaaaccgaat 840 gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 900 gtcaagaaag gggactcagc aattgttaaa agtgaagtgg aatatggtaa ctgcaataca 960 aagtgtcaaa ctccaatagg ggcgataaac tctagtatgc cattccacaa catacaccct 1020 ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca aattagtcct tgcgactggg 1080 ctcagaaata gtcctctaag agaaagaaga agaaaaagag gactatttgg agctatagca 1140 gggtttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc 1200 aatgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaaaggc aatagatgga 1260 gtcaccaata aggtcaactc gatcattgac aaaatgaaca ctcagtttga ggccgttgga 1320 agggaattta ataacttaga aaggagaata gagaatttaa acaagaaaat ggaagacgga 1380 ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact 1440 ctagacttcc atgattcaaa tgtcaagaac ctttacgaca aggtccgact acagcttagg 1500 gataatgcaa aggagctggg taacggttgt ttcgagttct atcacaaatg tgataatgaa 1560 tgtatggaaa gtgtaagaaa cggaacgtat gactacccgc agtattcaga agaagcaaga 1620 ttaaaaagag aggaaataag tggagtaaaa ttggaatcaa taggaactta ccaaatactg 1680 tcaatttatt caacagttgc gagttctcta gcactggcaa tcatggtggc tggtctatct 1740 ttgtggatgt gctccaatgg gtcgttacaa tgcagaattt gcatttaaga gctc 1794 <210> 44 <211> 1797 <212> DNA <213> Artificial sequence <220> <223> clone 782 - nucleotide sequence of A/Vietnam/1194/2004 (H5N1) <400> 44 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatggag aaaatagtgc ttctttttgc aatagtcagt 120 cttgttaaaa gtgatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 180 gacacaataa tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 240 cacaatggga agctctgcga tctagatgga gtgaagcctc taattttgag agattgtagt 300 gtagctggat ggctcctcgg aaacccaatg tgtgacgagt tcatcaatgt gccggaatgg 360 tcttacatag tggagaaggc caatccagtc aatgacctct gttacccagg ggatttcaat 420 gactatgaag aattgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 480 atccccaaaa gttcttggtc cagtcatgaa gcctcattgg gggtcagctc agcatgtcca 540 taccagggaa agtcctcctt tttcagaaat gtggtatggc ttatcaaaaa gaacagtaca 600 tacccaacaa taaagaggag ctacaataat accaaccaag aagatctttt ggtactgtgg 660 gggattcacc atcctaatga tgcggcagag cagacaaagc tctatcaaaa cccaaccacc 720 tatatttccg ttgggacatc tacactaaac cagagattgg taccaagaat agctactaga 780 tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaaccgaat 840 gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 900 gtcaagaaag gggactcaac aattatgaaa agtgaattgg aatatggtaa ctgcaatacc 960 aagtgtcaaa ctccaatggg ggcgataaac tctagcatgc cattccacaa tatacaccct 1020 ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcgactggg 1080 ctcagaaata gccctcaaag agagagaaga agaaaaaaga gaggattatt tggagctata 1140 gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat 1200 agcaacgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat 1260 ggagtcacca ataaggtcaa ctcgattatt gacaaaatga acactcagtt tgaggccgtt 1320 ggaagggaat ttaacaactt agaaaggaga atagagaatt taaacaagaa gatggaagac 1380 gggttcctag atgtctggac ttataatgct gaacttctag ttctcatgga aaacgagaga 1440 actctagact ttcatgactc aaatgtcaag aacctttacg acaaggtccg actacagctt 1500 agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcataa atgtgataat 1560 gaatgtatgg aaagtgtaag aaacggaacg tatgactacc cgcagtattc agaagaagca 1620 agactaaaaa gagaggaaat aagtggagta aaattggaat caataggaat ttaccaaata 1680 ttgtcaattt attctacagt ggccagctcc ctagcactgg caatcatggt agctggtcta 1740 tccttatgga tgtgctccaa tgggtcgtta caatgcagaa tttgcattta agagctc 1797 <210> 45 <211> 1791 <212> DNA <213> Artificial sequence <220> <223> clone 783 - nucleotide sequence of A/Teal/HongKong/W312/97 (H6N1) <400> 45 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgatt gcaatcattg taatagcaat actggcagca 120 gccggaaagt cagacaagat ctgcattggg tatcatgcca acaattcaac aacacaggta 180 gatacgatac ttgagaagaa tgtgactgtc acacactcaa ttgaattgct ggaaaatcag 240 aaggaagaaa gattctgcaa gatattgaac aaggcccctc tcgacttaag ggaatgtacc 300 atagagggtt ggatcttggg gaatccccaa tgcgacctat tgcttggtga tcaaagctgg 360 tcatacattg tggaaagacc tactgctcaa aacgggatct gctacccagg aaccttaaat 420 gaggtagaag aactgagggc acttattgga tcaggagaaa gggtagagag atttgagatg 480 tttccccaaa gcacctggca aggagttgac accaacagtg gaacaacaag atcctgccct 540 tattctactg gtgcgtcttt ctacagaaac ctcctatgga taataaaaac caagacagca 600 gaatatccag taattaaggg aatttacaac aacactggaa cccagccaat cctctatttc 660 tggggtgtgc atcatcctcc taacaccgac gagcaagata ctctgtatgg ctctggtgat 720 cgatacgtta gaatgggaac tgaaagcatg aattttgcca agagtccgga aattgcggca 780 aggcctgctg tgaatggaca aagaggcaga attgattatt attggtcggt tttaaaacca 840 ggggaaacct tgaatgtgga atctaatgga aatctaatcg ccccttggta tgcatacaaa 900 tttgtcaaca caaatagtaa aggagccgtc ttcaggtcag atttaccaat cgagaactgc 960 gatgccacat gccagactat tgcaggggtt ctaaggacca ataaaacatt tcagaatgtg 1020 agtcccctgt ggataggaga atgtcccaaa tacgtgaaaa gtgaaagtct gaggcttgca 1080 actggactaa gaaatgttcc acagattgaa actagaggac tcttcggagc tattgcaggg 1140 tttattgaag gaggatggac tgggatgata gatgggtggt atggctatca ccatgaaaat 1200 tctcaagggt caggatatgc agcagacaga gaaagcactc aaaaggctgt aaacagaatt 1260 acaaataagg tcaattccat catcaacaaa atgaacacac aatttgaagc tgtcgatcac 1320 gaattttcaa atctggagag gagaattgac aatctgaaca aaagaatgca agatggattt 1380 ctggatgttt ggacatacaa tgctgaactg ttggttcttc ttgaaaacga aagaacacta 1440 gacatgcatg acgcaaatgt gaagaaccta catgaaaagg tcaaatcaca actaagggac 1500 aatgctacga tcttagggaa tggttgcttt gaattttggc ataagtgtga caatgaatgc 1560 atagagtctg tcaaaaatgg tacatatgac tatcccaaat accagactga aagcaaatta 1620 aacaggctaa aaatagaatc agtaaagcta gagaaccttg gtgtgtatca aattcttgcc 1680 atttatagta cggtatcgag cagcctagtg ttggtagggc tgatcatggc aatgggtctt 1740 tggatgtgtt caaatggttc aatgcagtgc aggatatgta tataagagct c 1791 <210> 46 <211> 1803 <212> DNA <213> Artificial sequence <220> <223> clone 784 - nucleotide sequence of A/Equine/Prague/56 (H7N7) <400> 46 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatgaac actcaaattc taatattagc cacttcggca 120 ttcttctatg tacgtgcaga taaaatctgc ctaggacatc atgctgtgtc taatggaacc 180 aaagtagaca cccttactga aaaaggaata gaagttgtca atgcaacaga aacagttgaa 240 caaacaaaca tccctaagat ctgctcaaaa ggaaaacaga ctgttgacct tggtcaatgt 300 ggattactag ggaccgttat tggtcctccc caatgtgacc aatttcttga gttctctgct 360 aatttaatag ttgaaagaag ggaaggtaat gacatttgtt atccaggcaa atttgacaat 420 gaagaaacat tgagaaaaat actcagaaaa tccggaggaa ttaaaaagga gaatatggga 480 ttcacatata ccggagtgag aaccaatgga gagactagcg catgtagaag gtcaagatct 540 tccttttatg cagagatgaa atggcttcta tccagcacag acaatgggac atttccacaa 600 atgacaaagt cctacaagaa cactaagaag gtaccagctc tgataatctg gggaatccac 660 cactcaggat caactactga acagactaga ttatatggaa gtgggaataa attgataaca 720 gtttggagtt ccaaatacca acaatctttt gtcccaaatc ctggaccaag accgcaaatg 780 aatggtcaat caggaagaat tgactttcac tggctgatgc tagatcccaa tgatactgtc 840 actttcagtt ttaatggggc ctttatagca cctgaccgcg ccagttttct aagaggtaaa 900 tctctaggaa tccaaagtga tgcacaactt gacaataatt gtgaaggtga atgctatcat 960 attggaggta ctataattag caacttgccc tttcaaaaca ttaatagtag ggcaatcgga 1020 aaatgcccca gatacgtgaa gcagaagagc ttaatgctag caacaggaat gaaaaatgtt 1080 cctgaagctc ctgcacataa acaactaact catcacatgc gcaaaaaaag aggtttattt 1140 ggtgcaatag caggattcat tgaaaatggg tgggaaggat taatagacgg atggtatgga 1200 tataagcatc agaatgcaca aggagaaggg actgctgcag actacaaaag tacacaatct 1260 gctatcaacc aaataaccgg aaaattgaac agactaatag aaaaaaccaa ccagcaattc 1320 gaactaatag ataatgagtt caatgaaata gaaaaacaaa ttggcaatgt tattaactgg 1380 actagagatt ctatcatcga agtatggtca tataatgcag agttcctcgt agcagtggag 1440 aatcaacaca ctattgattt aactgactca gaaatgaaca aactatatga aaaggtaaga 1500 agacaactga gagaaaatgc tgaggaagat ggtaatggct gttttgaaat attccaccaa 1560 tgtgacaatg attgcatggc cagcattaga aacaacacat atgaccataa aaaatacaga 1620 aaagaggcaa tacaaaacag aatccagatt gacgcagtaa agttgagcag tggttacaaa 1680 gatataatac tttggtttag cttcggggca tcatgtttct tatttcttgc cattgcaatg 1740 ggtcttgttt tcatatgtat aaaaaatgga aacatgcggt gcactatttg tatataagag 1800 ctc 1803 <210> 47 <211> 1773 <212> DNA <213> Artificial sequence <220> <223> clone 785 - nucleotide sequence of A/HongKong/1073/99 (H9N2) <400> 47 cactttgtga gtctacactt tgattccctt caaacacata caaagagaag agactaatta 60 attaattaat catcttgaga gaaaatggaa acaatatcac taataactat actactagta 120 gtaacagcaa gcaatgcaga taaaatctgc atcggccacc agtcaacaaa ctccacagaa 180 actgtggaca cgctaacaga aaccaatgtt cctgtgacac atgccaaaga attgctccac 240 acagagcata atggaatgct gtgtgcaaca agcctgggac atcccctcat tctagacaca 300 tgcactattg aaggactagt ctatggcaac ccttcttgtg acctgctgtt gggaggaaga 360 gaatggtcct acatcgtcga aagatcatca gctgtaaatg gaacgtgtta ccctgggaat 420 gtagaaaacc tagaggaact caggacactt tttagttccg ctagttccta ccaaagaatc 480 caaatcttcc cagacacaac ctggaatgtg acttacactg gaacaagcag agcatgttca 540 ggttcattct acaggagtat gagatggctg actcaaaaga gcggttttta ccctgttcaa 600 gacgcccaat acacaaataa caggggaaag agcattcttt tcgtgtgggg catacatcac 660 ccacccacct ataccgagca aacaaatttg tacataagaa acgacacaac aacaagcgtg 720 acaacagaag atttgaatag gaccttcaaa ccagtgatag ggccaaggcc ccttgtcaat 780 ggtctgcagg gaagaattga ttattattgg tcggtactaa aaccaggcca aacattgcga 840 gtacgatcca atgggaatct aattgctcca tggtatggac acgttctttc aggagggagc 900 catggaagaa tcctgaagac tgatttaaaa ggtggtaatt gtgtagtgca atgtcagact 960 gaaaaaggtg gcttaaacag tacattgcca ttccacaata tcagtaaata tgcatttgga 1020 acctgcccca aatatgtaag agttaatagt ctcaaactgg cagtcggtct gaggaacgtg 1080 cctgctagat caagtagagg actatttgga gccatagctg gattcataga aggaggttgg 1140 ccaggactag tcgctggctg gtatggtttc cagcattcaa atgatcaagg ggttggtatg 1200 gctgcagata gggattcaac tcaaaaggca attgataaaa taacatccaa ggtgaataat 1260 atagtcgaca agatgaacaa gcaatatgaa ataattgatc atgaatttag tgaggttgaa 1320 actagactca atatgatcaa taataagatt gatgaccaaa tacaagacgt atgggcatat 1380 aatgcagaat tgctagtact acttgaaaat caaaaaacac tcgatgagca tgatgcgaac 1440 gtgaacaatc tatataacaa ggtgaagagg gcactgggct ccaatgctat ggaagatggg 1500 aaaggctgtt tcgagctata ccataaatgt gatgatcagt gcatggaaac aattcggaac 1560 gggacctata ataggagaaa gtatagagag gaatcaagac tagaaaggca gaaaatagag 1620 ggggttaagc tggaatctga gggaacttac aaaatcctca ccatttattc gactgtcgcc 1680 tcatctcttg tgcttgcaat ggggtttgct gccttcctgt tctgggccat gtccaatgga 1740 tcttgcagat gcaacatttg tatataagag ctc 1773 <210> 48 <211> 565 <212> PRT <213> Artificial sequence <220> <223> clone 774 (A/Brisbane/59/2007 (H1N1) <400> 48 Met Lys Val Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr 1 5 10 15 Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr 20 25 30 Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn 35 40 45 Leu Leu Glu Asn Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile 50 55 60 Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly 65 70 75 80 Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile 85 90 95 Val Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe 100 105 110 Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe 115 120 125 Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr 130 135 140 Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe 145 150 155 160 Tyr Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn 165 170 175 Leu Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu 180 185 190 Trp Gly Val His His Pro Pro Asn Ile Gly Asp Gln Lys Ala Leu Tyr 195 200 205 His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg 210 215 220 Lys Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu 225 230 235 240 Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile 245 250 255 Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Arg Tyr Ala Phe Ala 260 265 270 Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Asn Ser Asn Ala Pro Met 275 280 285 Asp Lys Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser 290 295 300 Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro 305 310 315 320 Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn 325 330 335 Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe 340 345 350 Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His 355 360 365 His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr 370 375 380 Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu 385 390 395 400 Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu 405 410 415 Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Ile 420 425 430 Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu 435 440 445 Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys 450 455 460 Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys 465 470 475 480 Phe Glu Phe Tyr His Lys Cys Asn Asp Glu Cys Met Glu Ser Val Lys 485 490 495 Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn 500 505 510 Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln 515 520 525 Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val 530 535 540 Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln 545 550 555 560 Cys Arg Ile Cys Ile 565 <210> 49 <211> 565 <212> PRT <213> Artificial sequence <220> <223> clone 775 (A/Solomon Islands 3/2006 (H1N1) <400> 49 Met Lys Val Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr 1 5 10 15 Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr 20 25 30 Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn 35 40 45 Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile 50 55 60 Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly 65 70 75 80 Asn Pro Glu Cys Glu Leu Leu Ile Ser Arg Glu Ser Trp Ser Tyr Ile 85 90 95 Val Glu Lys Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly His Phe 100 105 110 Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe 115 120 125 Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr 130 135 140 Thr Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Glu Ser Ser Phe 145 150 155 160 Tyr Lys Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn 165 170 175 Leu Ser Lys Ser Tyr Ala Asn Asn Lys Glu Lys Glu Val Leu Val Leu 180 185 190 Trp Gly Val His His Pro Pro Asn Ile Gly Asp Gln Arg Ala Leu Tyr 195 200 205 His Lys Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg 210 215 220 Lys Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu 225 230 235 240 Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile 245 250 255 Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Arg Tyr Ala Phe Ala 260 265 270 Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Asn Ser Asn Ala Pro Met 275 280 285 Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser 290 295 300 Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro 305 310 315 320 Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn 325 330 335 Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe 340 345 350 Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His 355 360 365 His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr 370 375 380 Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu 385 390 395 400 Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu 405 410 415 Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Ile 420 425 430 Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu 435 440 445 Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys 450 455 460 Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys 465 470 475 480 Phe Glu Phe Tyr His Lys Cys Asn Asp Glu Cys Met Glu Ser Val Lys 485 490 495 Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn 500 505 510 Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln 515 520 525 Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val 530 535 540 Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln 545 550 555 560 Cys Arg Ile Cys Ile 565 <210> 50 <211> 566 <212> PRT <213> Artificial sequence <220> <223> clone 776 (A/Brisbane/10/2007 (H3N2) <400> 50 Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Leu Cys Leu Val Phe Thr 1 5 10 15 Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly 20 25 30 His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp 35 40 45 Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr 50 55 60 Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys 65 70 75 80 Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln 85 90 95 Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn 100 105 110 Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val 115 120 125 Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Thr 130 135 140 Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Asn 145 150 155 160 Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Lys Phe Lys 165 170 175 Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Lys Phe Asp Lys 180 185 190 Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Asn Asp Gln Ile 195 200 205 Phe Leu Tyr Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg 210 215 220 Ser Gln Gln Thr Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Val Arg 225 230 235 240 Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly 245 250 255 Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly 260 265 270 Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala 275 280 285 Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile 290 295 300 Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala 305 310 315 320 Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met 325 330 335 Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala 340 345 350 Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly 355 360 365 Phe Arg His Gln Asn Ser Glu Gly Ile Gly Gln Ala Ala Asp Leu Lys 370 375 380 Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu 385 390 395 400 Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser 405 410 415 Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr 420 425 430 Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu 435 440 445 Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe 450 455 460 Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn 465 470 475 480 Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser 485 490 495 Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu 500 505 510 Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys 515 520 525 Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys 530 535 540 Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile 545 550 555 560 Arg Cys Asn Ile Cys Ile 565 <210> 51 <211> 566 <212> PRT <213> Artificial sequence <220> <223> clone 777 (A/Wisconsin/67/2005 (H3N2) <400> 51 Met Lys Thr Ile Ile Ala Leu Ser Tyr Ile Leu Cys Leu Val Phe Thr 1 5 10 15 Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly 20 25 30 His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp 35 40 45 Gln Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Ser Ser Ser Thr 50 55 60 Gly Gly Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys 65 70 75 80 Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln 85 90 95 Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn 100 105 110 Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val 115 120 125 Ala Ser Ser Gly Thr Leu Glu Phe Asn Asp Glu Ser Phe Asn Trp Thr 130 135 140 Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Lys Arg Arg Ser Asn 145 150 155 160 Asn Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Lys Phe Lys 165 170 175 Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Lys Phe Asp Lys 180 185 190 Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Asn Asp Gln Ile 195 200 205 Phe Leu His Ala Gln Ala Ser Gly Arg Ile Thr Val Ser Thr Lys Arg 210 215 220 Ser Gln Gln Thr Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg 225 230 235 240 Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly 245 250 255 Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly 260 265 270 Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala 275 280 285 Pro Ile Gly Lys Cys Asn Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile 290 295 300 Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala 305 310 315 320 Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met 325 330 335 Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala 340 345 350 Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly 355 360 365 Phe Arg His Gln Asn Ser Glu Gly Ile Gly Gln Ala Ala Asp Leu Lys 370 375 380 Ser Thr Gln Ala Ala Ile Asn Gln Ile Asn Gly Lys Leu Asn Arg Leu 385 390 395 400 Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser 405 410 415 Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr 420 425 430 Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu 435 440 445 Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe 450 455 460 Glu Arg Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn 465 470 475 480 Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser 485 490 495 Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu 500 505 510 Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys 515 520 525 Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys 530 535 540 Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile 545 550 555 560 Arg Cys Asn Ile Cys Ile 565 <210> 52 <211> 585 <212> PRT <213> Artificial sequence <220> <223> clone 778 (B/Malaysia/2506/2004) <400> 52 Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp 1 5 10 15 Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys 20 25 30 Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr 35 40 45 Thr Thr Pro Thr Lys Ser His Phe Ala Asn Leu Lys Gly Thr Glu Thr 50 55 60 Arg Gly Lys Leu Cys Pro Lys Cys Leu Asn Cys Thr Asp Leu Asp Val 65 70 75 80 Ala Leu Gly Arg Pro Lys Cys Thr Gly Asn Ile Pro Ser Ala Arg Val 85 90 95 Ser Ile Leu His Glu Val Arg Pro Val Thr Ser Gly Cys Phe Pro Ile 100 105 110 Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Lys Leu Leu Arg Gly 115 120 125 Tyr Glu His Ile Arg Leu Ser Thr His Asn Val Ile Asn Ala Glu Asn 130 135 140 Ala Pro Gly Gly Pro Tyr Lys Ile Gly Thr Ser Gly Ser Cys Pro Asn 145 150 155 160 Val Thr Asn Gly Asn Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro 165 170 175 Lys Asn Asp Asn Asn Lys Thr Ala Thr Asn Ser Leu Thr Ile Glu Val 180 185 190 Pro Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe 195 200 205 His Ser Asp Asn Glu Thr Gln Met Ala Lys Leu Tyr Gly Asp Ser Lys 210 215 220 Pro Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val 225 230 235 240 Ser Gln Ile Gly Gly Phe Pro Asn Gln Thr Glu Asp Gly Gly Leu Pro 245 250 255 Gln Ser Gly Arg Ile Val Val Asp Tyr Met Val Gln Lys Ser Gly Lys 260 265 270 Thr Gly Thr Ile Thr Tyr Gln Arg Gly Ile Leu Leu Pro Gln Lys Val 275 280 285 Trp Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu 290 295 300 Ile Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys 305 310 315 320 Ser Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys 325 330 335 Pro Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr 340 345 350 Arg Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile 355 360 365 Ala Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His 370 375 380 Gly Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu 385 390 395 400 Lys Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser 405 410 415 Leu Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met 420 425 430 Asp Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp 435 440 445 Leu Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu 450 455 460 Ser Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu 465 470 475 480 Glu Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly 485 490 495 Asn Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp 500 505 510 Arg Ile Ala Ala Gly Thr Phe Asp Ala Gly Glu Phe Ser Leu Pro Thr 515 520 525 Phe Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu 530 535 540 Asp Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu 545 550 555 560 Ala Val Thr Leu Met Ile Ala Ile Phe Val Val Tyr Met Val Ser Arg 565 570 575 Asp Asn Val Ser Cys Ser Ile Cys Leu 580 585 <210> 53 <211> 584 <212> PRT <213> Artificial <220> <223> clone 779 (B/Florida/4/2006) <400> 53 Met Lys Ala Ile Ile Val Leu Leu Met Val Val Thr Ser Asn Ala Asp 1 5 10 15 Arg Ile Cys Thr Gly Ile Thr Ser Ser Asn Ser Pro His Val Val Lys 20 25 30 Thr Ala Thr Gln Gly Glu Val Asn Val Thr Gly Val Ile Pro Leu Thr 35 40 45 Thr Thr Pro Thr Lys Ser Tyr Phe Ala Asn Leu Lys Gly Thr Arg Thr 50 55 60 Arg Gly Lys Leu Cys Pro Asp Cys Leu Asn Cys Thr Asp Leu Asp Val 65 70 75 80 Ala Leu Gly Arg Pro Met Cys Val Gly Thr Thr Pro Ser Ala Lys Ala 85 90 95 Ser Ile Leu His Glu Val Lys Pro Val Thr Ser Gly Cys Phe Pro Ile 100 105 110 Met His Asp Arg Thr Lys Ile Arg Gln Leu Pro Asn Leu Leu Arg Gly 115 120 125 Tyr Glu Asn Ile Arg Leu Ser Thr Gln Asn Val Ile Asp Ala Glu Lys 130 135 140 Ala Pro Gly Gly Pro Tyr Arg Leu Gly Thr Ser Gly Ser Cys Pro Asn 145 150 155 160 Ala Thr Ser Lys Ser Gly Phe Phe Ala Thr Met Ala Trp Ala Val Pro 165 170 175 Lys Asp Asn Asn Lys Asn Ala Thr Asn Pro Leu Thr Val Glu Val Pro 180 185 190 Tyr Ile Cys Thr Glu Gly Glu Asp Gln Ile Thr Val Trp Gly Phe His 195 200 205 Ser Asp Asn Lys Thr Gln Met Lys Asn Leu Tyr Gly Asp Ser Asn Pro 210 215 220 Gln Lys Phe Thr Ser Ser Ala Asn Gly Val Thr Thr His Tyr Val Ser 225 230 235 240 Gln Ile Gly Ser Phe Pro Asp Gln Thr Glu Asp Gly Gly Leu Pro Gln 245 250 255 Ser Gly Arg Ile Val Val Asp Tyr Met Met Gln Lys Pro Gly Lys Thr 260 265 270 Gly Thr Ile Val Tyr Gln Arg Gly Val Leu Leu Pro Gln Lys Val Trp 275 280 285 Cys Ala Ser Gly Arg Ser Lys Val Ile Lys Gly Ser Leu Pro Leu Ile 290 295 300 Gly Glu Ala Asp Cys Leu His Glu Lys Tyr Gly Gly Leu Asn Lys Ser 305 310 315 320 Lys Pro Tyr Tyr Thr Gly Glu His Ala Lys Ala Ile Gly Asn Cys Pro 325 330 335 Ile Trp Val Lys Thr Pro Leu Lys Leu Ala Asn Gly Thr Lys Tyr Arg 340 345 350 Pro Pro Ala Lys Leu Leu Lys Glu Arg Gly Phe Phe Gly Ala Ile Ala 355 360 365 Gly Phe Leu Glu Gly Gly Trp Glu Gly Met Ile Ala Gly Trp His Gly 370 375 380 Tyr Thr Ser His Gly Ala His Gly Val Ala Val Ala Ala Asp Leu Lys 385 390 395 400 Ser Thr Gln Glu Ala Ile Asn Lys Ile Thr Lys Asn Leu Asn Ser Leu 405 410 415 Ser Glu Leu Glu Val Lys Asn Leu Gln Arg Leu Ser Gly Ala Met Asp 420 425 430 Glu Leu His Asn Glu Ile Leu Glu Leu Asp Glu Lys Val Asp Asp Leu 435 440 445 Arg Ala Asp Thr Ile Ser Ser Gln Ile Glu Leu Ala Val Leu Leu Ser 450 455 460 Asn Glu Gly Ile Ile Asn Ser Glu Asp Glu His Leu Leu Ala Leu Glu 465 470 475 480 Arg Lys Leu Lys Lys Met Leu Gly Pro Ser Ala Val Glu Ile Gly Asn 485 490 495 Gly Cys Phe Glu Thr Lys His Lys Cys Asn Gln Thr Cys Leu Asp Arg 500 505 510 Ile Ala Ala Gly Thr Phe Asn Ala Gly Glu Phe Ser Leu Pro Thr Phe 515 520 525 Asp Ser Leu Asn Ile Thr Ala Ala Ser Leu Asn Asp Asp Gly Leu Asp 530 535 540 Asn His Thr Ile Leu Leu Tyr Tyr Ser Thr Ala Ala Ser Ser Leu Ala 545 550 555 560 Val Thr Leu Met Leu Ala Ile Phe Ile Val Tyr Met Val Ser Arg Asp 565 570 575 Asn Val Ser Cys Ser Ile Cys Leu 580 <210> 54 <211> 562 <212> PRT <213> Artificial sequence <220> <223> clone 780 (A/Singapore/1/57 (H2N2)) <400> 54 Met Ala Ile Ile Tyr Leu Ile Leu Leu Phe Thr Ala Val Arg Gly Asp 1 5 10 15 Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Lys Val Asp 20 25 30 Thr Ile Leu Glu Arg Asn Val Thr Val Thr His Ala Lys Asp Ile Leu 35 40 45 Glu Lys Thr His Asn Gly Lys Leu Cys Lys Leu Asn Gly Ile Pro Pro 50 55 60 Leu Glu Leu Gly Asp Cys Ser Ile Ala Gly Trp Leu Leu Gly Asn Pro 65 70 75 80 Glu Cys Asp Arg Leu Leu Ser Val Pro Glu Trp Ser Tyr Ile Met Glu 85 90 95 Lys Glu Asn Pro Arg Asp Gly Leu Cys Tyr Pro Gly Ser Phe Asn Asp 100 105 110 Tyr Glu Glu Leu Lys His Leu Leu Ser Ser Val Lys His Phe Glu Lys 115 120 125 Val Lys Ile Leu Pro Lys Asp Arg Trp Thr Gln His Thr Thr Thr Gly 130 135 140 Gly Ser Arg Ala Cys Ala Val Ser Gly Asn Pro Ser Phe Phe Arg Asn 145 150 155 160 Met Val Trp Leu Thr Lys Lys Glu Ser Asn Tyr Pro Val Ala Lys Gly 165 170 175 Ser Tyr Asn Asn Thr Ser Gly Glu Gln Met Leu Ile Ile Trp Gly Val 180 185 190 His His Pro Asn Asp Glu Thr Glu Gln Arg Thr Leu Tyr Gln Asn Val 195 200 205 Gly Thr Tyr Val Ser Val Gly Thr Ser Thr Leu Asn Lys Arg Ser Thr 210 215 220 Pro Asp Ile Ala Thr Arg Pro Lys Val Asn Gly Leu Gly Ser Arg Met 225 230 235 240 Glu Phe Ser Trp Thr Leu Leu Asp Met Trp Asp Thr Ile Asn Phe Glu 245 250 255 Ser Thr Gly Asn Leu Ile Ala Pro Glu Tyr Gly Phe Lys Ile Ser Lys 260 265 270 Arg Gly Ser Ser Gly Ile Met Lys Thr Glu Gly Thr Leu Glu Asn Cys 275 280 285 Glu Thr Lys Cys Gln Thr Pro Leu Gly Ala Ile Asn Thr Thr Leu Pro 290 295 300 Phe His Asn Val His Pro Leu Thr Ile Gly Glu Cys Pro Lys Tyr Val 305 310 315 320 Lys Ser Glu Lys Leu Val Leu Ala Thr Gly Leu Arg Asn Val Pro Gln 325 330 335 Ile Glu Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly 340 345 350 Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn 355 360 365 Asp Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala 370 375 380 Phe Asp Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn 385 390 395 400 Thr Gln Phe Glu Ala Val Gly Lys Glu Phe Ser Asn Leu Glu Arg Arg 405 410 415 Leu Glu Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp 420 425 430 Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu 435 440 445 Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Met 450 455 460 Gln Leu Arg Asp Asn Val Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe 465 470 475 480 Tyr His Lys Cys Asp Asp Glu Cys Met Asn Ser Val Lys Asn Gly Thr 485 490 495 Tyr Asp Tyr Pro Lys Tyr Glu Glu Glu Ser Lys Leu Asn Arg Asn Glu 500 505 510 Ile Lys Gly Val Lys Leu Ser Ser Met Gly Val Tyr Gln Ile Leu Ala 515 520 525 Ile Tyr Ala Thr Val Ala Gly Ser Leu Ser Leu Ala Ile Met Met Ala 530 535 540 Gly Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile 545 550 555 560 Cys Ile <210> 55 <211> 567 <212> PRT <213> Artificial sequence <220> <223> clone 781 (A/Anhui/1/2005 (H5N1)) <400> 55 Met Glu Lys Ile Val Leu Leu Leu Ala Ile Val Ser Leu Val Lys Ser 1 5 10 15 Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val 20 25 30 Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile 35 40 45 Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 50 55 60 Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 65 70 75 80 Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val 85 90 95 Glu Lys Ala Asn Pro Ala Asn Asp Leu Cys Tyr Pro Gly Asn Phe Asn 100 105 110 Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu 115 120 125 Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Asp His Glu Ala Ser 130 135 140 Ser Gly Val Ser Ser Ala Cys Pro Tyr Gln Gly Thr Pro Ser Phe Phe 145 150 155 160 Arg Asn Val Val Trp Leu Ile Lys Lys Asn Asn Thr Tyr Pro Thr Ile 165 170 175 Lys Arg Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Ile Leu Trp 180 185 190 Gly Ile His His Ser Asn Asp Ala Ala Glu Gln Thr Lys Leu Tyr Gln 195 200 205 Asn Pro Thr Thr Tyr Ile Ser Val Gly Thr Ser Thr Leu Asn Gln Arg 210 215 220 Leu Val Pro Lys Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly 225 230 235 240 Arg Met Asp Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn 245 250 255 Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile 260 265 270 Val Lys Lys Gly Asp Ser Ala Ile Val Lys Ser Glu Val Glu Tyr Gly 275 280 285 Asn Cys Asn Thr Lys Cys Gln Thr Pro Ile Gly Ala Ile Asn Ser Ser 290 295 300 Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys 305 310 315 320 Tyr Val Lys Ser Asn Lys Leu Val Leu Ala Thr Gly Leu Arg Asn Ser 325 330 335 Pro Leu Arg Glu Arg Arg Arg Lys Arg Gly Leu Phe Gly Ala Ile Ala 340 345 350 Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr Gly 355 360 365 Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys Glu 370 375 380 Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser Ile 385 390 395 400 Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe Asn 405 410 415 Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp Gly 420 425 430 Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met Glu 435 440 445 Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr 450 455 460 Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly Asn 465 470 475 480 Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu Ser 485 490 495 Val Arg Asn Gly Thr Tyr Asp Tyr Pro Gln Tyr Ser Glu Glu Ala Arg 500 505 510 Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly Thr 515 520 525 Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala Leu 530 535 540 Ala Ile Met Val Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly Ser 545 550 555 560 Leu Gln Cys Arg Ile Cys Ile 565 <210> 56 <211> 568 <212> PRT <213> Artificial sequence <220> <223> clone 782 (A/Vietnam/1194/2004 (H5N1)) <400> 56 Met Glu Lys Ile Val Leu Leu Phe Ala Ile Val Ser Leu Val Lys Ser 1 5 10 15 Asp Gln Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Glu Gln Val 20 25 30 Asp Thr Ile Met Glu Lys Asn Val Thr Val Thr His Ala Gln Asp Ile 35 40 45 Leu Glu Lys Thr His Asn Gly Lys Leu Cys Asp Leu Asp Gly Val Lys 50 55 60 Pro Leu Ile Leu Arg Asp Cys Ser Val Ala Gly Trp Leu Leu Gly Asn 65 70 75 80 Pro Met Cys Asp Glu Phe Ile Asn Val Pro Glu Trp Ser Tyr Ile Val 85 90 95 Glu Lys Ala Asn Pro Val Asn Asp Leu Cys Tyr Pro Gly Asp Phe Asn 100 105 110 Asp Tyr Glu Glu Leu Lys His Leu Leu Ser Arg Ile Asn His Phe Glu 115 120 125 Lys Ile Gln Ile Ile Pro Lys Ser Ser Trp Ser Ser His Glu Ala Ser 130 135 140 Leu Gly Val Ser Ser Ala Cys Pro Tyr Gln Gly Lys Ser Ser Phe Phe 145 150 155 160 Arg Asn Val Val Trp Leu Ile Lys Lys Asn Ser Thr Tyr Pro Thr Ile 165 170 175 Lys Arg Ser Tyr Asn Asn Thr Asn Gln Glu Asp Leu Leu Val Leu Trp 180 185 190 Gly Ile His His Pro Asn Asp Ala Ala Glu Gln Thr Lys Leu Tyr Gln 195 200 205 Asn Pro Thr Thr Tyr Ile Ser Val Gly Thr Ser Thr Leu Asn Gln Arg 210 215 220 Leu Val Pro Arg Ile Ala Thr Arg Ser Lys Val Asn Gly Gln Ser Gly 225 230 235 240 Arg Met Glu Phe Phe Trp Thr Ile Leu Lys Pro Asn Asp Ala Ile Asn 245 250 255 Phe Glu Ser Asn Gly Asn Phe Ile Ala Pro Glu Tyr Ala Tyr Lys Ile 260 265 270 Val Lys Lys Gly Asp Ser Thr Ile Met Lys Ser Glu Leu Glu Tyr Gly 275 280 285 Asn Cys Asn Thr Lys Cys Gln Thr Pro Met Gly Ala Ile Asn Ser Ser 290 295 300 Met Pro Phe His Asn Ile His Pro Leu Thr Ile Gly Glu Cys Pro Lys 305 310 315 320 Tyr Val Lys Ser Asn Arg Leu Val Leu Ala Thr Gly Leu Arg Asn Ser 325 330 335 Pro Gln Arg Glu Arg Arg Arg Lys Lys Arg Gly Leu Phe Gly Ala Ile 340 345 350 Ala Gly Phe Ile Glu Gly Gly Trp Gln Gly Met Val Asp Gly Trp Tyr 355 360 365 Gly Tyr His His Ser Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Lys 370 375 380 Glu Ser Thr Gln Lys Ala Ile Asp Gly Val Thr Asn Lys Val Asn Ser 385 390 395 400 Ile Ile Asp Lys Met Asn Thr Gln Phe Glu Ala Val Gly Arg Glu Phe 405 410 415 Asn Asn Leu Glu Arg Arg Ile Glu Asn Leu Asn Lys Lys Met Glu Asp 420 425 430 Gly Phe Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Met 435 440 445 Glu Asn Glu Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu 450 455 460 Tyr Asp Lys Val Arg Leu Gln Leu Arg Asp Asn Ala Lys Glu Leu Gly 465 470 475 480 Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp Asn Glu Cys Met Glu 485 490 495 Ser Val Arg Asn Gly Thr Tyr Asp Tyr Pro Gln Tyr Ser Glu Glu Ala 500 505 510 Arg Leu Lys Arg Glu Glu Ile Ser Gly Val Lys Leu Glu Ser Ile Gly 515 520 525 Ile Tyr Gln Ile Leu Ser Ile Tyr Ser Thr Val Ala Ser Ser Leu Ala 530 535 540 Leu Ala Ile Met Val Ala Gly Leu Ser Leu Trp Met Cys Ser Asn Gly 545 550 555 560 Ser Leu Gln Cys Arg Ile Cys Ile 565 <210> 57 <211> 566 <212> PRT <213> Artificial sequence <220> <223> clone 783 (A/Teal/HongKong/W312/97 (H6N1)) <400> 57 Met Ile Ala Ile Ile Val Ile Ala Ile Leu Ala Ala Ala Gly Lys Ser 1 5 10 15 Asp Lys Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Thr Gln Val 20 25 30 Asp Thr Ile Leu Glu Lys Asn Val Thr Val Thr His Ser Ile Glu Leu 35 40 45 Leu Glu Asn Gln Lys Glu Glu Arg Phe Cys Lys Ile Leu Asn Lys Ala 50 55 60 Pro Leu Asp Leu Arg Glu Cys Thr Ile Glu Gly Trp Ile Leu Gly Asn 65 70 75 80 Pro Gln Cys Asp Leu Leu Leu Gly Asp Gln Ser Trp Ser Tyr Ile Val 85 90 95 Glu Arg Pro Thr Ala Gln Asn Gly Ile Cys Tyr Pro Gly Thr Leu Asn 100 105 110 Glu Val Glu Glu Leu Arg Ala Leu Ile Gly Ser Gly Glu Arg Val Glu 115 120 125 Arg Phe Glu Met Phe Pro Gln Ser Thr Trp Gln Gly Val Asp Thr Asn 130 135 140 Ser Gly Thr Thr Arg Ser Cys Pro Tyr Ser Thr Gly Ala Ser Phe Tyr 145 150 155 160 Arg Asn Leu Leu Trp Ile Ile Lys Thr Lys Thr Ala Glu Tyr Pro Val 165 170 175 Ile Lys Gly Ile Tyr Asn Asn Thr Gly Thr Gln Pro Ile Leu Tyr Phe 180 185 190 Trp Gly Val His His Pro Pro Asn Thr Asp Glu Gln Asp Thr Leu Tyr 195 200 205 Gly Ser Gly Asp Arg Tyr Val Arg Met Gly Thr Glu Ser Met Asn Phe 210 215 220 Ala Lys Ser Pro Glu Ile Ala Ala Arg Pro Ala Val Asn Gly Gln Arg 225 230 235 240 Gly Arg Ile Asp Tyr Tyr Trp Ser Val Leu Lys Pro Gly Glu Thr Leu 245 250 255 Asn Val Glu Ser Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Tyr Lys 260 265 270 Phe Val Asn Thr Asn Ser Lys Gly Ala Val Phe Arg Ser Asp Leu Pro 275 280 285 Ile Glu Asn Cys Asp Ala Thr Cys Gln Thr Ile Ala Gly Val Leu Arg 290 295 300 Thr Asn Lys Thr Phe Gln Asn Val Ser Pro Leu Trp Ile Gly Glu Cys 305 310 315 320 Pro Lys Tyr Val Lys Ser Glu Ser Leu Arg Leu Ala Thr Gly Leu Arg 325 330 335 Asn Val Pro Gln Ile Glu Thr Arg Gly Leu Phe Gly Ala Ile Ala Gly 340 345 350 Phe Ile Glu Gly Gly Trp Thr Gly Met Ile Asp Gly Trp Tyr Gly Tyr 355 360 365 His His Glu Asn Ser Gln Gly Ser Gly Tyr Ala Ala Asp Arg Glu Ser 370 375 380 Thr Gln Lys Ala Val Asn Arg Ile Thr Asn Lys Val Asn Ser Ile Ile 385 390 395 400 Asn Lys Met Asn Thr Gln Phe Glu Ala Val Asp His Glu Phe Ser Asn 405 410 415 Leu Glu Arg Arg Ile Asp Asn Leu Asn Lys Arg Met Gln Asp Gly Phe 420 425 430 Leu Asp Val Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn 435 440 445 Glu Arg Thr Leu Asp Met His Asp Ala Asn Val Lys Asn Leu His Glu 450 455 460 Lys Val Lys Ser Gln Leu Arg Asp Asn Ala Thr Ile Leu Gly Asn Gly 465 470 475 480 Cys Phe Glu Phe Trp His Lys Cys Asp Asn Glu Cys Ile Glu Ser Val 485 490 495 Lys Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Gln Thr Glu Ser Lys Leu 500 505 510 Asn Arg Leu Lys Ile Glu Ser Val Lys Leu Glu Asn Leu Gly Val Tyr 515 520 525 Gln Ile Leu Ala Ile Tyr Ser Thr Val Ser Ser Ser Leu Val Leu Val 530 535 540 Gly Leu Ile Met Ala Met Gly Leu Trp Met Cys Ser Asn Gly Ser Met 545 550 555 560 Gln Cys Arg Ile Cys Ile 565 <210> 58 <211> 570 <212> PRT <213> Artificial sequence <220> <223> clone 784 (A/Equine/Prague/56 (H7N7)) <400> 58 Met Asn Thr Gln Ile Leu Ile Leu Ala Thr Ser Ala Phe Phe Tyr Val 1 5 10 15 Arg Ala Asp Lys Ile Cys Leu Gly His His Ala Val Ser Asn Gly Thr 20 25 30 Lys Val Asp Thr Leu Thr Glu Lys Gly Ile Glu Val Val Asn Ala Thr 35 40 45 Glu Thr Val Glu Gln Thr Asn Ile Pro Lys Ile Cys Ser Lys Gly Lys 50 55 60 Gln Thr Val Asp Leu Gly Gln Cys Gly Leu Leu Gly Thr Val Ile Gly 65 70 75 80 Pro Pro Gln Cys Asp Gln Phe Leu Glu Phe Ser Ala Asn Leu Ile Val 85 90 95 Glu Arg Arg Glu Gly Asn Asp Ile Cys Tyr Pro Gly Lys Phe Asp Asn 100 105 110 Glu Glu Thr Leu Arg Lys Ile Leu Arg Lys Ser Gly Gly Ile Lys Lys 115 120 125 Glu Asn Met Gly Phe Thr Tyr Thr Gly Val Arg Thr Asn Gly Glu Thr 130 135 140 Ser Ala Cys Arg Arg Ser Arg Ser Ser Phe Tyr Ala Glu Met Lys Trp 145 150 155 160 Leu Leu Ser Ser Thr Asp Asn Gly Thr Phe Pro Gln Met Thr Lys Ser 165 170 175 Tyr Lys Asn Thr Lys Lys Val Pro Ala Leu Ile Ile Trp Gly Ile His 180 185 190 His Ser Gly Ser Thr Thr Glu Gln Thr Arg Leu Tyr Gly Ser Gly Asn 195 200 205 Lys Leu Ile Thr Val Trp Ser Ser Lys Tyr Gln Gln Ser Phe Val Pro 210 215 220 Asn Pro Gly Pro Arg Pro Gln Met Asn Gly Gln Ser Gly Arg Ile Asp 225 230 235 240 Phe His Trp Leu Met Leu Asp Pro Asn Asp Thr Val Thr Phe Ser Phe 245 250 255 Asn Gly Ala Phe Ile Ala Pro Asp Arg Ala Ser Phe Leu Arg Gly Lys 260 265 270 Ser Leu Gly Ile Gln Ser Asp Ala Gln Leu Asp Asn Asn Cys Glu Gly 275 280 285 Glu Cys Tyr His Ile Gly Gly Thr Ile Ile Ser Asn Leu Pro Phe Gln 290 295 300 Asn Ile Asn Ser Arg Ala Ile Gly Lys Cys Pro Arg Tyr Val Lys Gln 305 310 315 320 Lys Ser Leu Met Leu Ala Thr Gly Met Lys Asn Val Pro Glu Ala Pro 325 330 335 Ala His Lys Gln Leu Thr His His Met Arg Lys Lys Arg Gly Leu Phe 340 345 350 Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu Gly Leu Ile Asp 355 360 365 Gly Trp Tyr Gly Tyr Lys His Gln Asn Ala Gln Gly Glu Gly Thr Ala 370 375 380 Ala Asp Tyr Lys Ser Thr Gln Ser Ala Ile Asn Gln Ile Thr Gly Lys 385 390 395 400 Leu Asn Arg Leu Ile Glu Lys Thr Asn Gln Gln Phe Glu Leu Ile Asp 405 410 415 Asn Glu Phe Asn Glu Ile Glu Lys Gln Ile Gly Asn Val Ile Asn Trp 420 425 430 Thr Arg Asp Ser Ile Ile Glu Val Trp Ser Tyr Asn Ala Glu Phe Leu 435 440 445 Val Ala Val Glu Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met 450 455 460 Asn Lys Leu Tyr Glu Lys Val Arg Arg Gln Leu Arg Glu Asn Ala Glu 465 470 475 480 Glu Asp Gly Asn Gly Cys Phe Glu Ile Phe His Gln Cys Asp Asn Asp 485 490 495 Cys Met Ala Ser Ile Arg Asn Asn Thr Tyr Asp His Lys Lys Tyr Arg 500 505 510 Lys Glu Ala Ile Gln Asn Arg Ile Gln Ile Asp Ala Val Lys Leu Ser 515 520 525 Ser Gly Tyr Lys Asp Ile Ile Leu Trp Phe Ser Phe Gly Ala Ser Cys 530 535 540 Phe Leu Phe Leu Ala Ile Ala Met Gly Leu Val Phe Ile Cys Ile Lys 545 550 555 560 Asn Gly Asn Met Arg Cys Thr Ile Cys Ile 565 570 <210> 59 <211> 560 <212> PRT <213> Artificial sequence <220> <223> clone 785 (A/HongKong/1073/99 (H9N2)) <400> 59 Met Glu Thr Ile Ser Leu Ile Thr Ile Leu Leu Val Val Thr Ala Ser 1 5 10 15 Asn Ala Asp Lys Ile Cys Ile Gly His Gln Ser Thr Asn Ser Thr Glu 20 25 30 Thr Val Asp Thr Leu Thr Glu Thr Asn Val Pro Val Thr His Ala Lys 35 40 45 Glu Leu Leu His Thr Glu His Asn Gly Met Leu Cys Ala Thr Ser Leu 50 55 60 Gly His Pro Leu Ile Leu Asp Thr Cys Thr Ile Glu Gly Leu Val Tyr 65 70 75 80 Gly Asn Pro Ser Cys Asp Leu Leu Leu Gly Gly Arg Glu Trp Ser Tyr 85 90 95 Ile Val Glu Arg Ser Ser Ala Val Asn Gly Thr Cys Tyr Pro Gly Asn 100 105 110 Val Glu Asn Leu Glu Glu Leu Arg Thr Leu Phe Ser Ser Ala Ser Ser 115 120 125 Tyr Gln Arg Ile Gln Ile Phe Pro Asp Thr Thr Trp Asn Val Thr Tyr 130 135 140 Thr Gly Thr Ser Arg Ala Cys Ser Gly Ser Phe Tyr Arg Ser Met Arg 145 150 155 160 Trp Leu Thr Gln Lys Ser Gly Phe Tyr Pro Val Gln Asp Ala Gln Tyr 165 170 175 Thr Asn Asn Arg Gly Lys Ser Ile Leu Phe Val Trp Gly Ile His His 180 185 190 Pro Pro Thr Tyr Thr Glu Gln Thr Asn Leu Tyr Ile Arg Asn Asp Thr 195 200 205 Thr Thr Ser Val Thr Thr Glu Asp Leu Asn Arg Thr Phe Lys Pro Val 210 215 220 Ile Gly Pro Arg Pro Leu Val Asn Gly Leu Gln Gly Arg Ile Asp Tyr 225 230 235 240 Tyr Trp Ser Val Leu Lys Pro Gly Gln Thr Leu Arg Val Arg Ser Asn 245 250 255 Gly Asn Leu Ile Ala Pro Trp Tyr Gly His Val Leu Ser Gly Gly Ser 260 265 270 His Gly Arg Ile Leu Lys Thr Asp Leu Lys Gly Gly Asn Cys Val Val 275 280 285 Gln Cys Gln Thr Glu Lys Gly Gly Leu Asn Ser Thr Leu Pro Phe His 290 295 300 Asn Ile Ser Lys Tyr Ala Phe Gly Thr Cys Pro Lys Tyr Val Arg Val 305 310 315 320 Asn Ser Leu Lys Leu Ala Val Gly Leu Arg Asn Val Pro Ala Arg Ser 325 330 335 Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp 340 345 350 Pro Gly Leu Val Ala Gly Trp Tyr Gly Phe Gln His Ser Asn Asp Gln 355 360 365 Gly Val Gly Met Ala Ala Asp Arg Asp Ser Thr Gln Lys Ala Ile Asp 370 375 380 Lys Ile Thr Ser Lys Val Asn Asn Ile Val Asp Lys Met Asn Lys Gln 385 390 395 400 Tyr Glu Ile Ile Asp His Glu Phe Ser Glu Val Glu Thr Arg Leu Asn 405 410 415 Met Ile Asn Asn Lys Ile Asp Asp Gln Ile Gln Asp Val Trp Ala Tyr 420 425 430 Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Gln Lys Thr Leu Asp Glu 435 440 445 His Asp Ala Asn Val Asn Asn Leu Tyr Asn Lys Val Lys Arg Ala Leu 450 455 460 Gly Ser Asn Ala Met Glu Asp Gly Lys Gly Cys Phe Glu Leu Tyr His 465 470 475 480 Lys Cys Asp Asp Gln Cys Met Glu Thr Ile Arg Asn Gly Thr Tyr Asn 485 490 495 Arg Arg Lys Tyr Arg Glu Glu Ser Arg Leu Glu Arg Gln Lys Ile Glu 500 505 510 Gly Val Lys Leu Glu Ser Glu Gly Thr Tyr Lys Ile Leu Thr Ile Tyr 515 520 525 Ser Thr Val Ala Ser Ser Leu Val Leu Ala Met Gly Phe Ala Ala Phe 530 535 540 Leu Phe Trp Ala Met Ser Asn Gly Ser Cys Arg Cys Asn Ile Cys Ile 545 550 555 560 <210> 60 <211> 3111 <212> DNA <213> Artificial sequence <220> <223> H5 from A/Indonesia/5/2005 (Construct # 660) <400> 60 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt 1020 cttgcaatag tcagtcttgt taaaagtgat cagatttgca ttggttacca tgcaaacaat 1080 tcaacagagc aggttgacac aatcatggaa aagaacgtta ctgttacaca tgcccaagac 1140 atactggaaa agacacacaa cgggaagctc tgcgatctag atggagtgaa gcctctaatt 1200 ttaagagatt gtagtgtagc tggatggctc ctcgggaacc caatgtgtga cgaattcatc 1260 aatgtaccgg aatggtctta catagtggag aaggccaatc caaccaatga cctctgttac 1320 ccagggagtt tcaacgacta tgaagaactg aaacacctat tgagcagaat aaaccatttt 1380 gagaaaattc aaatcatccc caaaagttct tggtccgatc atgaagcctc atcaggagtt 1440 agctcagcat gtccatacct gggaagtccc tcctttttta gaaatgtggt atggcttatc 1500 aaaaagaaca gtacataccc aacaataaag aaaagctaca ataataccaa ccaagaggat 1560 cttttggtac tgtggggaat tcaccatcct aatgatgcgg cagagcagac aaggctatat 1620 caaaacccaa ccacctatat ttccattggg acatcaacac taaaccagag attggtacca 1680 aaaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggagtt cttctggaca 1740 attttaaaac ctaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa 1800 tatgcataca aaattgtcaa gaaaggggac tcagcaatta tgaaaagtga attggaatat 1860 ggtaactgca acaccaagtg tcaaactcca atgggggcga taaactctag tatgccattc 1920 cacaacatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacagatta 1980 gtccttgcaa cagggctcag aaatagccct caaagagaga gcagaagaaa aaagagagga 2040 ctatttggag ctatagcagg ttttatagag ggaggatggc agggaatggt agatggttgg 2100 tatgggtacc accatagcaa tgagcagggg agtgggtacg ctgcagacaa agaatccact 2160 caaaaggcaa tagatggagt caccaataag gtcaactcaa tcattgacaa aatgaacact 2220 cagtttgagg ccgttggaag ggaatttaat aacttagaaa ggagaataga gaatttaaac 2280 aagaagatgg aagacgggtt tctagatgtc tggacttata atgccgaact tctggttctc 2340 atggaaaatg agagaactct agactttcat gactcaaatg ttaagaacct ctacgacaag 2400 gtccgactac agcttaggga taatgcaaag gagctgggta acggttgttt cgagttctat 2460 cacaaatgtg ataatgaatg tatggaaagt ataagaaacg gaacgtacaa ctatccgcag 2520 tattcagaag aagcaagatt aaaaagagag gaaataagtg gggtaaaatt ggaatcaata 2580 ggaacttacc aaatactgtc aatttattca acagtggcga gttccctagc actggcaatc 2640 atgatggctg gtctatcttt atggatgtgc tccaatggat cgttacaatg cagaatttgc 2700 atttaagagc tctaagttaa aatgcttctt cgtctcctat ttataatatg gtttgttatt 2760 gttaattttg ttcttgtaga agagcttaat taatcgttgt tgttatgaaa tactatttgt 2820 atgagatgaa ctggtgtaat gtaattcatt tacataagtg gagtcagaat cagaatgttt 2880 cctccataac taactagaca tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac 2940 taaaattgaa catcttttgc cacaacttta taagtggtta atatagctca aatatatggt 3000 caagttcaat agattaataa tggaaatatc agttatcgaa attcattaac aatcaactta 3060 acgttattaa ctactaattt tatatcatcc cctttgataa atgatagtac a 3111 <210> 61 <211> 3123 <212> DNA <213> Artificial sequence <220> <223> H1 from A/New Caledonia/20/1999 (Construct # 540) <400> 61 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt 1020 ttcggcttat tgttttctct tcttgtgttg gttccttctc agatcttcgc tgacacaata 1080 tgtataggct accatgccaa caactcaacc gacactgttg acacagtact tgagaagaat 1140 gtgacagtga cacactctgt caacctactt gaggacagtc acaatggaaa actatgtcta 1200 ctaaaaggaa tagccccact acaattgggt aattgcagcg ttgccggatg gatcttagga 1260 aacccagaat gcgaattact gatttccaag gaatcatggt cctacattgt agaaacacca 1320 aatcctgaga atggaacatg ttacccaggg tatttcgccg actatgagga actgagggag 1380 caattgagtt cagtatcttc atttgagaga ttcgaaatat tccccaaaga aagctcatgg 1440 cccaaccaca ccgtaaccgg agtatcagca tcatgctccc ataatgggaa aagcagtttt 1500 tacagaaatt tgctatggct gacggggaag aatggtttgt acccaaacct gagcaagtcc 1560 tatgtaaaca acaaagagaa agaagtcctt gtactatggg gtgttcatca cccgcctaac 1620 atagggaacc aaagggcact ctatcataca gaaaatgctt atgtctctgt agtgtcttca 1680 cattatagca gaagattcac cccagaaata gccaaaagac ccaaagtaag agatcaggaa 1740 ggaagaatca actactactg gactctgctg gaacctgggg atacaataat atttgaggca 1800 aatggaaatc taatagcgcc atggtatgct tttgcactga gtagaggctt tggatcagga 1860 atcatcacct caaatgcacc aatggatgaa tgtgatgcga agtgtcaaac acctcaggga 1920 gctataaaca gcagtcttcc tttccagaat gtacacccag tcacaatagg agagtgtcca 1980 aagtatgtca ggagtgcaaa attaaggatg gttacaggac taaggaacat cccatccatt 2040 caatccagag gtttgtttgg agccattgcc ggtttcattg aaggggggtg gactggaatg 2100 gtagatgggt ggtatggtta tcatcatcag aatgagcaag gatctggcta tgctgcagat 2160 caaaaaagta cacaaaatgc cattaacggg attacaaaca aggtcaattc tgtaattgag 2220 aaaatgaaca ctcaattcac agctgtgggc aaagagttca acaaattgga aagaaggatg 2280 gaaaacttaa ataaaaaagt tgatgatggg tttctagaca tttggacata taatgcagaa 2340 ttgttggttc tactggaaaa tgaaaggact ttggatttcc atgactccaa tgtgaagaat 2400 ctgtatgaga aagtaaaaag ccaattaaag aataatgcca aagaaatagg aaacgggtgt 2460 tttgagttct atcacaagtg taacaatgaa tgcatggaga gtgtgaaaaa tggtacctat 2520 gactatccaa aatattccga agaatcaaag ttaaacaggg agaaaattga tggagtgaaa 2580 ttggaatcaa tgggagtata ccagattctg gcgatctact caactgtcgc cagttccctg 2640 gttcttttgg tctccctggg ggcaatcagc ttctggatgt gttccaatgg gtctttgcag 2700 tgtagaatat gcatctaaga gctctaagtt aaaatgcttc ttcgtctcct atttataata 2760 tggtttgtta ttgttaattt tgttcttgta gaagagctta attaatcgtt gttgttatga 2820 aatactattt gtatgagatg aactggtgta atgtaattca tttacataag tggagtcaga 2880 atcagaatgt ttcctccata actaactaga catgaagacc tgccgcgtac aattgtctta 2940 tatttgaaca actaaaattg aacatctttt gccacaactt tataagtggt taatatagct 3000 caaatatatg gtcaagttca atagattaat aatggaaata tcagttatcg aaattcatta 3060 acaatcaact taacgttatt aactactaat tttatatcat cccctttgat aaatgatagt 3120 aca 3123 <210> 62 <211> 3088 <212> DNA <213> Artificial <220> <223> H1 from A/Brisbane/59/2007 (construct #774) <400> 62 ctggtatatt tatatgttgt caaataactc aaaaaccata aaagtttaag ttagcaagtg 60 tgtacatttt tacttgaaca aaaatattca cctactactg ttataaatca ttattaaaca 120 ttagagtaaa gaaatatgga tgataagaac aagagtagtg atattttgac aacaattttg 180 ttgcaacatt tgagaaaatt ttgttgttct ctcttttcat tggtcaaaaa caatagagag 240 agaaaaagga agagggagaa taaaaacata atgtgagtat gagagagaaa gttgtacaaa 300 agttgtacca aaatagttgt acaaatatca ttgaggaatt tgacaaaagc tacacaaata 360 agggttaatt gctgtaaata aataaggatg acgcattaga gagatgtacc attagagaat 420 ttttggcaag tcattaaaaa gaaagaataa attattttta aaattaaaag ttgagtcatt 480 tgattaaaca tgtgattatt taatgaattg atgaaagagt tggattaaag ttgtattagt 540 aattagaatt tggtgtcaaa tttaatttga catttgatct tttcctatat attgccccat 600 agagtcagtt aactcatttt tatatttcat agatcaaata agagaaataa cggtatatta 660 atccctccaa aaaaaaaaaa cggtatattt actaaaaaat ctaagccacg taggaggata 720 acaggatccc cgtaggagga taacatccaa tccaaccaat cacaacaatc ctgatgagat 780 aacccacttt aagcccacgc atctgtggca catctacatt atctaaatca cacattcttc 840 cacacatctg agccacacaa aaaccaatcc acatctttat cacccattct ataaaaaatc 900 acactttgtg agtctacact ttgattccct tcaaacacat acaaagagaa gagactaatt 960 aattaattaa tcatcttgag agaaaatgaa agtaaaacta ctggtcctgt tatgcacatt 1020 tacagctaca tatgcagaca caatatgtat aggctaccat gctaacaact cgaccgacac 1080 tgttgacaca gtacttgaaa agaatgtgac agtgacacac tctgtcaacc tgcttgagaa 1140 cagtcacaat ggaaaactat gtctattaaa aggaatagcc ccactacaat tgggtaattg 1200 cagcgttgcc gggtggatct taggaaaccc agaatgcgaa ttactgattt ccaaggagtc 1260 atggtcctac attgtagaaa aaccaaatcc tgagaatgga acatgttacc cagggcattt 1320 cgctgactat gaggaactga gggagcaatt gagttcagta tcttcatttg agaggttcga 1380 aatattcccc aaagaaagct catggcccaa ccacaccgta accggagtgt cagcatcatg 1440 ctcccataat ggggaaagca gtttttacag aaatttgcta tggctgacgg ggaagaatgg 1500 tttgtaccca aacctgagca agtcctatgc aaacaacaaa gaaaaagaag tccttgtact 1560 atggggtgtt catcacccgc caaacatagg tgaccaaaag gccctctatc atacagaaaa 1620 tgcttatgtc tctgtagtgt cttcacatta tagcagaaaa ttcaccccag aaatagccaa 1680 aagacccaaa gtaagagatc aagaaggaag aatcaattac tactggactc tgcttgaacc 1740 cggggataca ataatatttg aggcaaatgg aaatctaata gcgccaagat atgctttcgc 1800 actgagtaga ggctttggat caggaatcat caactcaaat gcaccaatgg ataaatgtga 1860 tgcgaagtgc caaacacctc agggagctat aaacagcagt cttcctttcc agaacgtaca 1920 cccagtcaca ataggagagt gtccaaagta tgtcaggagt gcaaaattaa ggatggttac 1980 aggactaagg aacatcccat ccattcaatc cagaggtttg tttggagcca ttgccggttt 2040 cattgaaggg gggtggactg gaatggtaga tggttggtat ggttatcatc atcagaatga 2100 gcaaggatct ggctatgctg cagatcaaaa aagcacacaa aatgccatta atgggattac 2160 aaacaaggtc aattctgtaa ttgagaaaat gaacactcaa ttcacagcag tgggcaaaga 2220 gttcaacaaa ttggaaagaa ggatggaaaa cttgaataaa aaagttgatg atgggtttat 2280 agacatttgg acatataatg cagaactgtt ggttctactg gaaaatgaaa ggactttgga 2340 tttccatgac tccaatgtga agaatctgta tgagaaagta aaaagccagt taaagaataa 2400 tgctaaagaa ataggaaatg ggtgttttga gttctatcac aagtgtaacg atgaatgcat 2460 ggagagtgta aagaatggaa cttatgacta tccaaaatat tccgaagaat caaagttaaa 2520 cagggagaaa attgatggag tgaaattgga atcaatggga gtctatcaga ttctggcgat 2580 ctactcaaca gtcgccagtt ctctggttct tttggtctcc ctgggggcaa tcagcttctg 2640 gatgtgttcc aatgggtctt tacagtgtag aatatgcatc taagagctct aagttaaaat 2700 gcttcttcgt ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga 2760 gcttaattaa tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta 2820 attcatttac ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga 2880 agacctgccg cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac 2940 aactttataa gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg 3000 aaatatcagt tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat 3060 atcatcccct ttgataaatg atagtaca 3088 <210> 63 <211> 3102 <212> DNA <213> Artificial <220> <223> H1 from A/Solomon Islands/3/2006 (H1N1) (Construct # 775) <400> 63 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaagtaaa actactggtc 1020 ctgttatgca catttacagc tacatatgca gacacaatat gtataggcta ccatgccaac 1080 aactcaaccg acactgttga cacagtactt gagaagaatg tgacagtgac acactctgtc 1140 aacctgcttg aggacagtca caatggaaaa ttatgtctat taaaaggaat agccccacta 1200 caattgggta attgcagcgt tgccggatgg atcttaggaa acccagaatg cgaattactg 1260 atttccaggg aatcatggtc ctacattgta gaaaaaccaa atcctgagaa tggaacatgt 1320 tacccagggc atttcgccga ctatgaggaa ctgagggagc aattgagttc agtatcttca 1380 tttgagagat tcgaaatatt ccccaaagaa agctcatggc ccaaccacac cacaaccgga 1440 gtatcagcat catgctccca taatggggaa agcagttttt acaaaaattt gctatggctg 1500 acggggaaga atggtttgta cccaaacctg agcaagtcct atgcaaacaa caaagagaaa 1560 gaagtccttg tactatgggg tgttcatcac ccgcctaaca taggtgacca aagggctctc 1620 tatcataaag aaaatgctta tgtctctgta gtgtcttcac attatagcag aaaattcacc 1680 ccagaaatag ccaaaagacc caaagtaaga gatcaagaag gaagaatcaa ctactactgg 1740 actctacttg aacccgggga tacaataata tttgaggcaa atggaaatct aatagcgcca 1800 agatatgctt tcgcactgag tagaggcttt ggatcaggaa tcatcaactc aaatgcacca 1860 atggatgaat gtgatgcgaa gtgccaaaca cctcagggag ctataaacag cagtcttcct 1920 ttccagaatg tacaccctgt cacaatagga gagtgtccaa agtatgtcag gagtgcaaaa 1980 ttaaggatgg ttacaggact aaggaacatc ccatccattc aatccagagg tttgtttgga 2040 gccattgccg gtttcattga aggggggtgg actggaatgg tagatggttg gtatggttat 2100 catcatcaga atgagcaagg atctggctat gctgcagatc aaaaaagcac acaaaatgcc 2160 attaatggga ttacaaacaa ggtcaattct gtaattgaga aaatgaacac tcaattcaca 2220 gctgtgggca aagagttcaa caaattggaa agaaggatgg aaaacttaaa taaaaaagtt 2280 gatgatgggt ttatagacat ttggacatat aatgcagaat tgttggttct actggaaaat 2340 gaaaggactt tggatttcca tgactccaat gtgaagaatc tgtatgagaa agtaaaaagc 2400 caattaaaga ataatgccaa agaaatagga aatgggtgtt ttgagttcta tcataagtgt 2460 aacgatgaat gcatggagag tgtaaaaaat ggaacttatg actatccaaa atattccgaa 2520 gaatcaaagt taaacaggga gaaaattgat ggagtgaaat tggaatcaat gggagtctat 2580 cagattctgg cgatctactc aacagtcgcc agttctctgg ttcttttggt ctccctgggg 2640 gcaatcagct tctggatgtg ttccaatggg tctttgcagt gtagaatatg catctgagag 2700 ctctaagtta aaatgcttct tcgtctccta tttataatat ggtttgttat tgttaatttt 2760 gttcttgtag aagagcttaa ttaatcgttg ttgttatgaa atactatttg tatgagatga 2820 actggtgtaa tgtaattcat ttacataagt ggagtcagaa tcagaatgtt tcctccataa 2880 ctaactagac atgaagacct gccgcgtaca attgtcttat atttgaacaa ctaaaattga 2940 acatcttttg ccacaacttt ataagtggtt aatatagctc aaatatatgg tcaagttcaa 3000 tagattaata atggaaatat cagttatcga aattcattaa caatcaactt aacgttatta 3060 actactaatt ttatatcatc ccctttgata aatgatagta ca 3102 <210> 64 <211> 3093 <212> DNA <213> Artificial sequence <220> <223> H2 from A/Singapore/1/57 (H2N2) (construct # 780) <400> 64 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tggccatcat ttatctaatt 1020 ctcctgttca cagcagtgag aggggaccaa atatgcattg gataccatgc caataattcc 1080 acagagaagg tcgacacaat tctagagcgg aacgtcactg tgactcatgc caaggacatt 1140 cttgagaaga cccataacgg aaagttatgc aaactaaacg gaatccctcc acttgaacta 1200 ggggactgta gcattgccgg atggctcctt ggaaatccag aatgtgatag gcttctaagt 1260 gtgccagaat ggtcctatat aatggagaaa gaaaacccga gagacggttt gtgttatcca 1320 ggcagcttca atgattatga agaattgaaa catctcctca gcagcgtgaa acatttcgag 1380 aaagtaaaga ttctgcccaa agatagatgg acacagcata caacaactgg aggttcacgg 1440 gcctgcgcgg tgtctggtaa tccatcattc ttcaggaaca tggtctggct gacaaagaaa 1500 gaatcaaatt atccggttgc caaaggatcg tacaacaata caagcggaga acaaatgcta 1560 ataatttggg gggtgcacca tcccaatgat gagacagaac aaagaacatt gtaccagaat 1620 gtgggaacct atgtttccgt aggcacatca acattgaaca aaaggtcaac cccagacata 1680 gcaacaaggc ctaaagtgaa tggactagga agtagaatgg agttctcttg gaccctattg 1740 gatatgtggg acaccataaa ttttgagagt actggtaatc taattgcacc agagtatgga 1800 ttcaaaatat cgaaaagagg tagttcaggg atcatgaaaa cagaaggaac acttgagaac 1860 tgtgagacca aatgccaaac tcctttggga gcaataaata caacattgcc ttttcacaat 1920 gtccacccac tgacaatagg tgagtgcccc aaatatgtaa aatcggagaa gttggtctta 1980 gcaacaggac taaggaatgt tccccagatt gaatcaagag gattgtttgg ggcaatagct 2040 ggttttatag aaggaggatg gcaaggaatg gttgatggtt ggtatggata ccatcacagc 2100 aatgaccagg gatcagggta tgcagcagac aaagaatcca ctcaaaaggc atttgatgga 2160 atcaccaaca aggtaaattc tgtgattgaa aagatgaaca cccaatttga agctgttggg 2220 aaagagttca gtaacttaga gagaagactg gagaacttga acaaaaagat ggaagacggg 2280 tttctagatg tgtggacata caatgctgag cttctagttc tgatggaaaa tgagaggaca 2340 cttgactttc atgattctaa tgtcaagaat ctgtatgata aagtcagaat gcagctgaga 2400 gacaacgtca aagaactagg aaatggatgt tttgaatttt atcacaaatg tgatgatgaa 2460 tgcatgaata gtgtgaaaaa cgggacgtat gattatccca agtatgaaga agagtctaaa 2520 ctaaatagaa atgaaatcaa aggggtaaaa ttgagcagca tgggggttta tcaaatcctt 2580 gccatttatg ctacagtagc aggttctctg tcactggcaa tcatgatggc tgggatctct 2640 ttctggatgt gctccaacgg gtctctgcag tgcaggatct gcatatgaga gctctaagtt 2700 aaaatgcttc ttcgtctcct atttataata tggtttgtta ttgttaattt tgttcttgta 2760 gaagagctta attaatcgtt gttgttatga aatactattt gtatgagatg aactggtgta 2820 atgtaattca tttacataag tggagtcaga atcagaatgt ttcctccata actaactaga 2880 catgaagacc tgccgcgtac aattgtctta tatttgaaca actaaaattg aacatctttt 2940 gccacaactt tataagtggt taatatagct caaatatatg gtcaagttca atagattaat 3000 aatggaaata tcagttatcg aaattcatta acaatcaact taacgttatt aactactaat 3060 tttatatcat cccctttgat aaatgatagt aca 3093 <210> 65 <211> 3108 <212> DNA <213> Artificial sequence <220> <223> H5 from A/Anhui/1/2005 (H5N1) (Construct# 781) <400> 65 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt 1020 cttgcaatag tcagccttgt taaaagtgat cagatttgca ttggttacca tgcaaacaac 1080 tcgacagagc aggttgacac aataatggaa aagaacgtta ctgttacaca tgcccaagac 1140 atactggaaa agacacacaa cgggaagctc tgcgatctag atggagtgaa gcctctgatt 1200 ttaagagatt gtagtgtagc tggatggctc ctcggaaacc caatgtgtga cgagttcatc 1260 aatgtgccgg aatggtctta catagtggag aaggccaacc cagccaatga cctctgttac 1320 ccagggaatt tcaacgacta tgaagaactg aaacacctat tgagcagaat aaaccatttt 1380 gagaaaattc agatcatccc caaaagttct tggtccgatc atgaagcctc atcaggggtc 1440 agctcagcat gtccatacca gggaacgccc tcctttttca gaaatgtggt atggcttatc 1500 aaaaagaaca atacataccc aacaataaag agaagctaca ataataccaa ccaggaagat 1560 cttttgatac tgtgggggat tcatcattct aatgatgcgg cagagcagac aaagctctat 1620 caaaacccaa ccacctatat ttccgttggg acatcaacac taaaccagag attggtacca 1680 aaaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggattt cttctggaca 1740 attttaaaac cgaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa 1800 tatgcataca aaattgtcaa gaaaggggac tcagcaattg ttaaaagtga agtggaatat 1860 ggtaactgca atacaaagtg tcaaactcca ataggggcga taaactctag tatgccattc 1920 cacaacatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacaaatta 1980 gtccttgcga ctgggctcag aaatagtcct ctaagagaaa gaagaagaaa aagaggacta 2040 tttggagcta tagcagggtt tatagaggga ggatggcagg gaatggtaga tggttggtat 2100 gggtaccacc atagcaatga gcaggggagt gggtacgctg cagacaaaga atccactcaa 2160 aaggcaatag atggagtcac caataaggtc aactcgatca ttgacaaaat gaacactcag 2220 tttgaggccg ttggaaggga atttaataac ttagaaagga gaatagagaa tttaaacaag 2280 aaaatggaag acggattcct agatgtctgg acttataatg ctgaacttct ggttctcatg 2340 gaaaatgaga gaactctaga cttccatgat tcaaatgtca agaaccttta cgacaaggtc 2400 cgactacagc ttagggataa tgcaaaggag ctgggtaacg gttgtttcga gttctatcac 2460 aaatgtgata atgaatgtat ggaaagtgta agaaacggaa cgtatgacta cccgcagtat 2520 tcagaagaag caagattaaa aagagaggaa ataagtggag taaaattgga atcaatagga 2580 acttaccaaa tactgtcaat ttattcaaca gttgcgagtt ctctagcact ggcaatcatg 2640 gtggctggtc tatctttgtg gatgtgctcc aatgggtcgt tacaatgcag aatttgcatt 2700 taagagctct aagttaaaat gcttcttcgt ctcctattta taatatggtt tgttattgtt 2760 aattttgttc ttgtagaaga gcttaattaa tcgttgttgt tatgaaatac tatttgtatg 2820 agatgaactg gtgtaatgta attcatttac ataagtggag tcagaatcag aatgtttcct 2880 ccataactaa ctagacatga agacctgccg cgtacaattg tcttatattt gaacaactaa 2940 aattgaacat cttttgccac aactttataa gtggttaata tagctcaaat atatggtcaa 3000 gttcaataga ttaataatgg aaatatcagt tatcgaaatt cattaacaat caacttaacg 3060 ttattaacta ctaattttat atcatcccct ttgataaatg atagtaca 3108 <210> 66 <211> 3111 <212> DNA <213> Artificial sequence <220> <223> H5 from A/Vietnam/1194/2004 (H5N1) (Construct # 782) <400> 66 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tggagaaaat agtgcttctt 1020 tttgcaatag tcagtcttgt taaaagtgat cagatttgca ttggttacca tgcaaacaac 1080 tcgacagagc aggttgacac aataatggaa aagaacgtta ctgttacaca tgcccaagac 1140 atactggaaa agacacacaa tgggaagctc tgcgatctag atggagtgaa gcctctaatt 1200 ttgagagatt gtagtgtagc tggatggctc ctcggaaacc caatgtgtga cgagttcatc 1260 aatgtgccgg aatggtctta catagtggag aaggccaatc cagtcaatga cctctgttac 1320 ccaggggatt tcaatgacta tgaagaattg aaacacctat tgagcagaat aaaccatttt 1380 gagaaaattc agatcatccc caaaagttct tggtccagtc atgaagcctc attgggggtc 1440 agctcagcat gtccatacca gggaaagtcc tcctttttca gaaatgtggt atggcttatc 1500 aaaaagaaca gtacataccc aacaataaag aggagctaca ataataccaa ccaagaagat 1560 cttttggtac tgtgggggat tcaccatcct aatgatgcgg cagagcagac aaagctctat 1620 caaaacccaa ccacctatat ttccgttggg acatctacac taaaccagag attggtacca 1680 agaatagcta ctagatccaa agtaaacggg caaagtggaa ggatggagtt cttctggaca 1740 attttaaaac cgaatgatgc aatcaacttc gagagtaatg gaaatttcat tgctccagaa 1800 tatgcataca aaattgtcaa gaaaggggac tcaacaatta tgaaaagtga attggaatat 1860 ggtaactgca ataccaagtg tcaaactcca atgggggcga taaactctag catgccattc 1920 cacaatatac accctctcac catcggggaa tgccccaaat atgtgaaatc aaacagatta 1980 gtccttgcga ctgggctcag aaatagccct caaagagaga gaagaagaaa aaagagagga 2040 ttatttggag ctatagcagg ttttatagag ggaggatggc agggaatggt agatggttgg 2100 tatgggtacc accatagcaa cgagcagggg agtgggtacg ctgcagacaa agaatccact 2160 caaaaggcaa tagatggagt caccaataag gtcaactcga ttattgacaa aatgaacact 2220 cagtttgagg ccgttggaag ggaatttaac aacttagaaa ggagaataga gaatttaaac 2280 aagaagatgg aagacgggtt cctagatgtc tggacttata atgctgaact tctagttctc 2340 atggaaaacg agagaactct agactttcat gactcaaatg tcaagaacct ttacgacaag 2400 gtccgactac agcttaggga taatgcaaag gagctgggta acggttgttt cgagttctat 2460 cataaatgtg ataatgaatg tatggaaagt gtaagaaacg gaacgtatga ctacccgcag 2520 tattcagaag aagcaagact aaaaagagag gaaataagtg gagtaaaatt ggaatcaata 2580 ggaatttacc aaatattgtc aatttattct acagtggcca gctccctagc actggcaatc 2640 atggtagctg gtctatcctt atggatgtgc tccaatgggt cgttacaatg cagaatttgc 2700 atttaagagc tctaagttaa aatgcttctt cgtctcctat ttataatatg gtttgttatt 2760 gttaattttg ttcttgtaga agagcttaat taatcgttgt tgttatgaaa tactatttgt 2820 atgagatgaa ctggtgtaat gtaattcatt tacataagtg gagtcagaat cagaatgttt 2880 cctccataac taactagaca tgaagacctg ccgcgtacaa ttgtcttata tttgaacaac 2940 taaaattgaa catcttttgc cacaacttta taagtggtta atatagctca aatatatggt 3000 caagttcaat agattaataa tggaaatatc agttatcgaa attcattaac aatcaactta 3060 acgttattaa ctactaattt tatatcatcc cctttgataa atgatagtac a 3111 <210> 67 <211> 3105 <212> DNA <213> Artificial <220> <223> H6 from A/Teal/Hong Kong/W312/97 (H6N1) (Construct # 783) <400> 67 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tgattgcaat cattgtaata 1020 gcaatactgg cagcagccgg aaagtcagac aagatctgca ttgggtatca tgccaacaat 1080 tcaacaacac aggtagatac gatacttgag aagaatgtga ctgtcacaca ctcaattgaa 1140 ttgctggaaa atcagaagga agaaagattc tgcaagatat tgaacaaggc ccctctcgac 1200 ttaagggaat gtaccataga gggttggatc ttggggaatc cccaatgcga cctattgctt 1260 ggtgatcaaa gctggtcata cattgtggaa agacctactg ctcaaaacgg gatctgctac 1320 ccaggaacct taaatgaggt agaagaactg agggcactta ttggatcagg agaaagggta 1380 gagagatttg agatgtttcc ccaaagcacc tggcaaggag ttgacaccaa cagtggaaca 1440 acaagatcct gcccttattc tactggtgcg tctttctaca gaaacctcct atggataata 1500 aaaaccaaga cagcagaata tccagtaatt aagggaattt acaacaacac tggaacccag 1560 ccaatcctct atttctgggg tgtgcatcat cctcctaaca ccgacgagca agatactctg 1620 tatggctctg gtgatcgata cgttagaatg ggaactgaaa gcatgaattt tgccaagagt 1680 ccggaaattg cggcaaggcc tgctgtgaat ggacaaagag gcagaattga ttattattgg 1740 tcggttttaa aaccagggga aaccttgaat gtggaatcta atggaaatct aatcgcccct 1800 tggtatgcat acaaatttgt caacacaaat agtaaaggag ccgtcttcag gtcagattta 1860 ccaatcgaga actgcgatgc cacatgccag actattgcag gggttctaag gaccaataaa 1920 acatttcaga atgtgagtcc cctgtggata ggagaatgtc ccaaatacgt gaaaagtgaa 1980 agtctgaggc ttgcaactgg actaagaaat gttccacaga ttgaaactag aggactcttc 2040 ggagctattg cagggtttat tgaaggagga tggactggga tgatagatgg gtggtatggc 2100 tatcaccatg aaaattctca agggtcagga tatgcagcag acagagaaag cactcaaaag 2160 gctgtaaaca gaattacaaa taaggtcaat tccatcatca acaaaatgaa cacacaattt 2220 gaagctgtcg atcacgaatt ttcaaatctg gagaggagaa ttgacaatct gaacaaaaga 2280 atgcaagatg gatttctgga tgtttggaca tacaatgctg aactgttggt tcttcttgaa 2340 aacgaaagaa cactagacat gcatgacgca aatgtgaaga acctacatga aaaggtcaaa 2400 tcacaactaa gggacaatgc tacgatctta gggaatggtt gctttgaatt ttggcataag 2460 tgtgacaatg aatgcataga gtctgtcaaa aatggtacat atgactatcc caaataccag 2520 actgaaagca aattaaacag gctaaaaata gaatcagtaa agctagagaa ccttggtgtg 2580 tatcaaattc ttgccattta tagtacggta tcgagcagcc tagtgttggt agggctgatc 2640 atggcaatgg gtctttggat gtgttcaaat ggttcaatgc agtgcaggat atgtatataa 2700 gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat 2760 tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga 2820 tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca 2880 taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat 2940 tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt 3000 caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta 3060 ttaactacta attttatatc atcccctttg ataaatgata gtaca 3105 <210> 68 <211> 3087 <212> DNA <213> Artificial sequence <220> <223> H9 from A/Hong Kong/1073/99 (H9N2) (Construct # 785) <400> 68 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tggaaacaat atcactaata 1020 actatactac tagtagtaac agcaagcaat gcagataaaa tctgcatcgg ccaccagtca 1080 acaaactcca cagaaactgt ggacacgcta acagaaacca atgttcctgt gacacatgcc 1140 aaagaattgc tccacacaga gcataatgga atgctgtgtg caacaagcct gggacatccc 1200 ctcattctag acacatgcac tattgaagga ctagtctatg gcaacccttc ttgtgacctg 1260 ctgttgggag gaagagaatg gtcctacatc gtcgaaagat catcagctgt aaatggaacg 1320 tgttaccctg ggaatgtaga aaacctagag gaactcagga cactttttag ttccgctagt 1380 tcctaccaaa gaatccaaat cttcccagac acaacctgga atgtgactta cactggaaca 1440 agcagagcat gttcaggttc attctacagg agtatgagat ggctgactca aaagagcggt 1500 ttttaccctg ttcaagacgc ccaatacaca aataacaggg gaaagagcat tcttttcgtg 1560 tggggcatac atcacccacc cacctatacc gagcaaacaa atttgtacat aagaaacgac 1620 acaacaacaa gcgtgacaac agaagatttg aataggacct tcaaaccagt gatagggcca 1680 aggccccttg tcaatggtct gcagggaaga attgattatt attggtcggt actaaaacca 1740 ggccaaacat tgcgagtacg atccaatggg aatctaattg ctccatggta tggacacgtt 1800 ctttcaggag ggagccatgg aagaatcctg aagactgatt taaaaggtgg taattgtgta 1860 gtgcaatgtc agactgaaaa aggtggctta aacagtacat tgccattcca caatatcagt 1920 aaatatgcat ttggaacctg ccccaaatat gtaagagtta atagtctcaa actggcagtc 1980 ggtctgagga acgtgcctgc tagatcaagt agaggactat ttggagccat agctggattc 2040 atagaaggag gttggccagg actagtcgct ggctggtatg gtttccagca ttcaaatgat 2100 caaggggttg gtatggctgc agatagggat tcaactcaaa aggcaattga taaaataaca 2160 tccaaggtga ataatatagt cgacaagatg aacaagcaat atgaaataat tgatcatgaa 2220 tttagtgagg ttgaaactag actcaatatg atcaataata agattgatga ccaaatacaa 2280 gacgtatggg catataatgc agaattgcta gtactacttg aaaatcaaaa aacactcgat 2340 gagcatgatg cgaacgtgaa caatctatat aacaaggtga agagggcact gggctccaat 2400 gctatggaag atgggaaagg ctgtttcgag ctataccata aatgtgatga tcagtgcatg 2460 gaaacaattc ggaacgggac ctataatagg agaaagtata gagaggaatc aagactagaa 2520 aggcagaaaa tagagggggt taagctggaa tctgagggaa cttacaaaat cctcaccatt 2580 tattcgactg tcgcctcatc tcttgtgctt gcaatggggt ttgctgcctt cctgttctgg 2640 gccatgtcca atggatcttg cagatgcaac atttgtatat aagagctcta agttaaaatg 2700 cttcttcgtc tcctatttat aatatggttt gttattgtta attttgttct tgtagaagag 2760 cttaattaat cgttgttgtt atgaaatact atttgtatga gatgaactgg tgtaatgtaa 2820 ttcatttaca taagtggagt cagaatcaga atgtttcctc cataactaac tagacatgaa 2880 gacctgccgc gtacaattgt cttatatttg aacaactaaa attgaacatc ttttgccaca 2940 actttataag tggttaatat agctcaaata tatggtcaag ttcaatagat taataatgga 3000 aatatcagtt atcgaaattc attaacaatc aacttaacgt tattaactac taattttata 3060 tcatcccctt tgataaatga tagtaca 3087 <210> 69 <211> 3105 <212> DNA <213> Artificial sequence <220> <223> H3 from A/Brisbane/10/2007 (H3N2) <400> 69 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tgaagactat cattgctttg 1020 agctacattc tatgtctggt tttcactcaa aaacttcccg gaaatgacaa cagcacggca 1080 acgctgtgcc ttgggcacca tgcagtacca aacggaacga tagtgaaaac aatcacgaat 1140 gaccaaattg aagttactaa tgctactgag ctggttcaga gttcctcaac aggtgaaata 1200 tgcgacagtc ctcatcagat ccttgatgga gaaaactgca cactaataga tgctctattg 1260 ggagaccctc agtgtgatgg cttccaaaat aagaaatggg acctttttgt tgaacgcagc 1320 aaagcctaca gcaactgtta cccttatgat gtgccggatt atgcctccct taggtcacta 1380 gttgcctcat ccggcacact ggagtttaac aatgaaagtt tcaattggac tggagtcact 1440 caaaacggaa caagctctgc ttgcataagg agatctaata acagtttctt tagtagattg 1500 aattggttga cccacttaaa attcaaatac ccagcattga acgtgactat gccaaacaat 1560 gaaaaatttg acaaattgta catttggggg gttcaccacc cgggtacgga caatgaccaa 1620 atcttcctgt atgctcaagc atcaggaaga atcacagtct ctaccaaaag aagccaacaa 1680 actgtaatcc cgaatatcgg atctagaccc agagtaagga atatccccag cagaataagc 1740 atctattgga caatagtaaa accgggagac atacttttga ttaacagcac agggaatcta 1800 attgctccta ggggttactt caaaatacga agtgggaaaa gctcaataat gagatcagat 1860 gcacccattg gcaaatgcaa ttctgaatgc atcactccaa acggaagcat tcccaatgac 1920 aaaccattcc aaaatgtaaa caggatcaca tacggggcct gtcccagata tgttaagcaa 1980 aacactctga aattggcaac agggatgcga aatgtaccag agaaacaaac tagaggcata 2040 tttggcgcaa tcgcgggttt catagaaaat ggttgggagg gaatggtgga tggttggtat 2100 ggtttcaggc atcaaaattc tgagggaata ggacaagcag cagatctcaa aagcactcaa 2160 gcagcaatcg atcaaatcaa tgggaagctg aataggttga tcgggaaaac caacgagaaa 2220 ttccatcaga ttgaaaaaga gttctcagaa gtcgaaggga gaatccagga ccttgagaaa 2280 tatgttgagg acaccaaaat agatctctgg tcatacaacg cggagcttct tgttgccctg 2340 gagaaccaac atacaattga tctaactgac tcagaaatga acaaactgtt tgaaaaaaca 2400 aagaagcaac tgagggaaaa tgctgaggat atgggcaatg gttgtttcaa aatataccac 2460 aaatgtgaca atgcctgcat aggatcaatc agaaatggaa cttatgacca cgatgtatac 2520 agagatgaag cattaaacaa ccggttccag atcaagggcg ttgagctgaa gtcaggatac 2580 aaagattgga tactatggat ttcctttgcc atatcatgtt ttttgctttg tgttgctttg 2640 ttggggttca tcatgtgggc ctgccaaaaa ggcaacatta ggtgcaacat ttgcatttga 2700 gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat 2760 tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga 2820 tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca 2880 taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat 2940 tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt 3000 caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta 3060 ttaactacta attttatatc atcccctttg ataaatgata gtaca 3105 <210> 70 <211> 3105 <212> DNA <213> Artificial sequence <220> <223> H3 from A/Wisconsin/67/2005 (H3N2) <400> 70 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tgaagactat cattgctttg 1020 agctacattc tatgtctggt tttcactcaa aaacttcccg gaaatgacaa cagcacggca 1080 acgctgtgcc ttgggcacca tgcagtacca aacggaacga tagtgaaaac aatcacgaat 1140 gaccaaattg aagttactaa tgctactgag ctggttcaga gttcctcaac aggtggaata 1200 tgcgacagtc ctcatcagat ccttgatgga gaaaactgca cactaataga tgctctattg 1260 ggagaccctc agtgtgatgg cttccaaaat aagaaatggg acctttttgt tgaacgcagc 1320 aaagcctaca gcaactgtta cccttatgat gtgccggatt atgcctccct taggtcacta 1380 gttgcctcat ccggcacact ggagtttaac gatgaaagtt tcaattggac tggagtcact 1440 caaaatggaa caagctctgc ttgcaaaagg agatctaata acagtttctt tagtagattg 1500 aattggttga cccacttaaa attcaaatac ccagcattga acgtgactat gccaaacaat 1560 gaaaaatttg acaaattgta catttggggg gttcaccacc cgggtacgga caatgaccaa 1620 atcttcctgc atgctcaagc atcaggaaga atcacagtct ctaccaaaag aagccaacaa 1680 actgtaatcc cgaatatcgg atctagaccc agaataagga atatccccag cagaataagc 1740 atctattgga caatagtaaa accgggagac atacttttga ttaacagcac agggaatcta 1800 attgctccta ggggttactt caaaatacga agtgggaaaa gctcaataat gagatcagat 1860 gcacccattg gcaaatgcaa ttctgaatgc atcactccaa atggaagcat tcccaatgac 1920 aaaccatttc aaaatgtaaa caggatcaca tatggggcct gtcccagata tgttaagcaa 1980 aacactctga aattggcaac agggatgcga aatgtaccag agaaacaaac tagaggcata 2040 tttggcgcaa tcgcgggttt catagaaaat ggttgggagg gaatggtgga tggttggtac 2100 ggtttcaggc atcaaaattc tgagggaata ggacaagcag cagatctcaa aagcactcaa 2160 gcagcaatca atcaaatcaa tgggaagctg aataggttga tcgggaaaac caacgagaaa 2220 ttccatcaga ttgaaaaaga gttctcagaa gtagaaggga gaatccagga cctcgagaaa 2280 tatgttgagg acactaaaat agatctctgg tcatacaacg cggagcttct tgttgccctg 2340 gagaaccaac atacaattga tctaactgac tcagaaatga acaaactgtt tgaaagaaca 2400 aagaagcaac tgagggaaaa tgctgaggat atgggcaatg gttgtttcaa aatataccac 2460 aaatgtgaca atgcctgcat aggatcaatc agaaatggaa cttatgacca tgatgtatac 2520 agagatgaag cattaaacaa ccggttccag atcaaaggcg ttgagctgaa gtcaggatac 2580 aaagattgga tactatggat ttcctttgcc atatcatgtt ttttgctttg tgttgctttg 2640 ttggggttca tcatgtgggc ctgccaaaaa ggcaacatta ggtgcaacat ttgcatttga 2700 gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt tattgttaat 2760 tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat ttgtatgaga 2820 tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat gtttcctcca 2880 taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa caactaaaat 2940 tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata tggtcaagtt 3000 caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa cttaacgtta 3060 ttaactacta attttatatc atcccctttg ataaatgata gtaca 3105 <210> 71 <211> 3117 <212> DNA <213> Artificial sequence <220> <223> H7 from A/Equine/Prague/56 (H7N7) <400> 71 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tgaacactca aattctaata 1020 ttagccactt cggcattctt ctatgtacgt gcagataaaa tctgcctagg acatcatgct 1080 gtgtctaatg gaaccaaagt agacaccctt actgaaaaag gaatagaagt tgtcaatgca 1140 acagaaacag ttgaacaaac aaacatccct aagatctgct caaaaggaaa acagactgtt 1200 gaccttggtc aatgtggatt actagggacc gttattggtc ctccccaatg tgaccaattt 1260 cttgagttct ctgctaattt aatagttgaa agaagggaag gtaatgacat ttgttatcca 1320 ggcaaatttg acaatgaaga aacattgaga aaaatactca gaaaatccgg aggaattaaa 1380 aaggagaata tgggattcac atataccgga gtgagaacca atggagagac tagcgcatgt 1440 agaaggtcaa gatcttcctt ttatgcagag atgaaatggc ttctatccag cacagacaat 1500 gggacatttc cacaaatgac aaagtcctac aagaacacta agaaggtacc agctctgata 1560 atctggggaa tccaccactc aggatcaact actgaacaga ctagattata tggaagtggg 1620 aataaattga taacagtttg gagttccaaa taccaacaat cttttgtccc aaatcctgga 1680 ccaagaccgc aaatgaatgg tcaatcagga agaattgact ttcactggct gatgctagat 1740 cccaatgata ctgtcacttt cagttttaat ggggccttta tagcacctga ccgcgccagt 1800 tttctaagag gtaaatctct aggaatccaa agtgatgcac aacttgacaa taattgtgaa 1860 ggtgaatgct atcatattgg aggtactata attagcaact tgccctttca aaacattaat 1920 agtagggcaa tcggaaaatg ccccagatac gtgaagcaga agagcttaat gctagcaaca 1980 ggaatgaaaa atgttcctga agctcctgca cataaacaac taactcatca catgcgcaaa 2040 aaaagaggtt tatttggtgc aatagcagga ttcattgaaa atgggtggga aggattaata 2100 gacggatggt atggatataa gcatcagaat gcacaaggag aagggactgc tgcagactac 2160 aaaagtacac aatctgctat caaccaaata accggaaaat tgaacagact aatagaaaaa 2220 accaaccagc aattcgaact aatagataat gagttcaatg aaatagaaaa acaaattggc 2280 aatgttatta actggactag agattctatc atcgaagtat ggtcatataa tgcagagttc 2340 ctcgtagcag tggagaatca acacactatt gatttaactg actcagaaat gaacaaacta 2400 tatgaaaagg taagaagaca actgagagaa aatgctgagg aagatggtaa tggctgtttt 2460 gaaatattcc accaatgtga caatgattgc atggccagca ttagaaacaa cacatatgac 2520 cataaaaaat acagaaaaga ggcaatacaa aacagaatcc agattgacgc agtaaagttg 2580 agcagtggtt acaaagatat aatactttgg tttagcttcg gggcatcatg tttcttattt 2640 cttgccattg caatgggtct tgttttcata tgtataaaaa atggaaacat gcggtgcact 2700 atttgtatat aagagctcta agttaaaatg cttcttcgtc tcctatttat aatatggttt 2760 gttattgtta attttgttct tgtagaagag cttaattaat cgttgttgtt atgaaatact 2820 atttgtatga gatgaactgg tgtaatgtaa ttcatttaca taagtggagt cagaatcaga 2880 atgtttcctc cataactaac tagacatgaa gacctgccgc gtacaattgt cttatatttg 2940 aacaactaaa attgaacatc ttttgccaca actttataag tggttaatat agctcaaata 3000 tatggtcaag ttcaatagat taataatgga aatatcagtt atcgaaattc attaacaatc 3060 aacttaacgt tattaactac taattttata tcatcccctt tgataaatga tagtaca 3117 <210> 72 <211> 3162 <212> DNA <213> Artificial sequence <220> <223> HA from B/Malaysia/2506/2004 <400> 72 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaggcaat aattgtacta 1020 ctcatggtag taacatccaa tgcagatcga atctgcactg ggataacatc gtcaaactca 1080 ccacatgttg tcaaaactgc tactcaaggg gaggtcaatg tgactggtgt aataccactg 1140 acaacaacac ccaccaaatc tcattttgca aatctcaaag gaacagaaac cagagggaaa 1200 ctatgcccaa aatgcctcaa ctgcacagat ctggacgtgg ccttgggcag accaaaatgc 1260 acggggaaca taccctcggc aagagtttca atactccatg aagtcagacc tgttacatct 1320 gggtgctttc ctataatgca cgacagaaca aaaattagac agctgcctaa acttctcaga 1380 ggatacgaac atatcaggtt atcaactcat aacgttatca atgcagaaaa tgcaccagga 1440 ggaccctaca aaattggaac ctcagggtct tgccctaacg ttaccaatgg aaacggattt 1500 ttcgcaacaa tggcttgggc cgtcccaaaa aacgacaaca acaaaacagc aacaaattca 1560 ttaacaatag aagtaccata catttgtaca gaaggagaag accaaattac cgtttggggg 1620 ttccactctg ataacgaaac ccaaatggca aagctctatg gggactcaaa gccccagaag 1680 ttcacctcat ctgccaacgg agtgaccaca cattacgttt cacagattgg tggcttccca 1740 aatcaaacag aagacggagg actaccacaa agcggtagaa ttgttgttga ttacatggtg 1800 caaaaatctg ggaaaacagg aacaattacc tatcaaagag gtattttatt gcctcaaaaa 1860 gtgtggtgcg caagtggcag gagcaaggta ataaaaggat cgttgccttt aattggagaa 1920 gcagattgcc tccacgaaaa atacggtgga ttaaacaaaa gcaagcctta ctacacaggg 1980 gaacatgcaa aggccatagg aaattgccca atatgggtga aaacaccctt gaagctggcc 2040 aatggaacca aatatagacc tcctgcaaaa ctattaaagg aaaggggttt cttcggagct 2100 attgctggtt tcttagaagg aggatgggaa ggaatgattg caggttggca cggatacaca 2160 tcccatgggg cacatggagt agcggtggca gcagacctta agagcactca agaggccata 2220 aacaagataa caaaaaatct caactctttg agtgagctgg aagtaaagaa tcttcaaaga 2280 ctaagcggtg ccatggatga actccacaac gaaatactag aactagacga gaaagtggat 2340 gatctcagag ctgatacaat aagctcacaa atagaactcg cagtcctgct ttccaatgaa 2400 ggaataataa acagtgaaga tgagcatctc ttggcgcttg aaagaaagct gaagaaaatg 2460 ctgggcccct ctgctgtaga gatagggaat ggatgctttg aaaccaaaca caagtgcaac 2520 cagacctgtc tcgacagaat agctgctggt acctttgatg caggagaatt ttctctcccc 2580 acttttgatt cactgaatat tactgctgca tctttaaatg acgatggatt ggataatcat 2640 actatactgc tttactactc aactgctgcc tccagtttgg ctgtaacatt gatgatagct 2700 atctttgttg tttatatggt ctccagagac aatgtttctt gctccatctg tctataagag 2760 ctctaagtta aaatgcttct tcgtctccta tttataatat ggtttgttat tgttaatttt 2820 gttcttgtag aagagcttaa ttaatcgttg ttgttatgaa atactatttg tatgagatga 2880 actggtgtaa tgtaattcat ttacataagt ggagtcagaa tcagaatgtt tcctccataa 2940 ctaactagac atgaagacct gccgcgtaca attgtcttat atttgaacaa ctaaaattga 3000 acatcttttg ccacaacttt ataagtggtt aatatagctc aaatatatgg tcaagttcaa 3060 tagattaata atggaaatat cagttatcga aattcattaa caatcaactt aacgttatta 3120 actactaatt ttatatcatc ccctttgata aatgatagta ca 3162 <210> 73 <211> 3159 <212> DNA <213> Artificial sequence <220> <223> HA from B/Florida/4/2006 <400> 73 agaggtaccc cgggctggta tatttatatg ttgtcaaata actcaaaaac cataaaagtt 60 taagttagca agtgtgtaca tttttacttg aacaaaaata ttcacctact actgttataa 120 atcattatta aacattagag taaagaaata tggatgataa gaacaagagt agtgatattt 180 tgacaacaat tttgttgcaa catttgagaa aattttgttg ttctctcttt tcattggtca 240 aaaacaatag agagagaaaa aggaagaggg agaataaaaa cataatgtga gtatgagaga 300 gaaagttgta caaaagttgt accaaaatag ttgtacaaat atcattgagg aatttgacaa 360 aagctacaca aataagggtt aattgctgta aataaataag gatgacgcat tagagagatg 420 taccattaga gaatttttgg caagtcatta aaaagaaaga ataaattatt tttaaaatta 480 aaagttgagt catttgatta aacatgtgat tatttaatga attgatgaaa gagttggatt 540 aaagttgtat tagtaattag aatttggtgt caaatttaat ttgacatttg atcttttcct 600 atatattgcc ccatagagtc agttaactca tttttatatt tcatagatca aataagagaa 660 ataacggtat attaatccct ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc 720 cacgtaggag gataacagga tccccgtagg aggataacat ccaatccaac caatcacaac 780 aatcctgatg agataaccca ctttaagccc acgcatctgt ggcacatcta cattatctaa 840 atcacacatt cttccacaca tctgagccac acaaaaacca atccacatct ttatcaccca 900 ttctataaaa aatcacactt tgtgagtcta cactttgatt cccttcaaac acatacaaag 960 agaagagact aattaattaa ttaatcatct tgagagaaaa tgaaggcaat aattgtacta 1020 ctcatggtag taacatccaa tgcagatcga atctgcactg gaataacatc ttcaaactca 1080 cctcatgtgg tcaaaacagc cactcaaggg gaggtcaatg tgactggtgt gataccacta 1140 acaacaacac caacaaaatc ttattttgca aatctcaaag gaacaaggac cagagggaaa 1200 ctatgcccag actgtctcaa ctgcacagat ctggatgtgg ctttgggcag accaatgtgt 1260 gtggggacca caccttcggc gaaggcttca atactccacg aagtcaaacc tgttacatcc 1320 gggtgctttc ctataatgca cgacagaaca aaaatcaggc aactacccaa tcttctcaga 1380 ggatatgaaa atatcaggct atcaacccaa aacgtcatcg atgcggaaaa ggcaccagga 1440 ggaccctaca gacttggaac ctcaggatct tgccctaacg ctaccagtaa gagcggattt 1500 ttcgcaacaa tggcttgggc tgtcccaaag gacaacaaca aaaatgcaac gaacccacta 1560 acagtagaag taccatacat ttgtacagaa ggggaagacc aaatcactgt ttgggggttc 1620 cattcagata acaaaaccca aatgaagaac ctctatggag actcaaatcc tcaaaagttc 1680 acctcatctg ctaatggagt aaccacacac tatgtttctc agattggcag cttcccagat 1740 caaacagaag acggaggact accacaaagc ggcaggattg ttgttgatta catgatgcaa 1800 aaacctggga aaacaggaac aattgtctac caaagaggtg ttttgttgcc tcaaaaggtg 1860 tggtgcgcga gtggcaggag caaagtaata aaagggtcct tgcctttaat tggtgaagca 1920 gattgccttc atgaaaaata cggtggatta aacaaaagca agccttacta cacaggagaa 1980 catgcaaaag ccataggaaa ttgcccaata tgggtgaaaa cacctttgaa gctcgccaat 2040 ggaaccaaat atagacctcc tgcaaaacta ttaaaggaaa ggggtttctt cggagctatt 2100 gctggtttcc tagaaggagg atgggaagga atgattgcag gctggcacgg atacacatct 2160 cacggagcac atggagtggc agtggcggcg gaccttaaga gtacgcaaga agctataaac 2220 aagataacaa aaaatctcaa ttctttgagt gagctagaag taaagaatct tcaaagacta 2280 agtggtgcca tggatgaact ccacaacgaa atactcgagc tggatgagaa agtggatgat 2340 ctcagagctg acactataag ctcgcaaata gaacttgcag tcttgctttc caacgaagga 2400 ataataaaca gtgaagatga gcatctattg gcacttgaga gaaaactaaa gaaaatgctg 2460 ggtccctctg ctgtagagat aggaaatgga tgcttcgaaa ccaaacacaa gtgcaaccag 2520 acctgcttag acaggatagc tgctggcacc tttaatgcag gagaattttc tctccccact 2580 tttgattcac tgaacattac tgctgcatct ttaaatgatg atggattgga taaccatact 2640 atactgctct attactcaac tgctgcttct agtttggctg taacattgat gctagctatt 2700 tttattgttt atatggtctc cagagacaac gtttcatgct ccatctgtct ataagagctc 2760 taagttaaaa tgcttcttcg tctcctattt ataatatggt ttgttattgt taattttgtt 2820 cttgtagaag agcttaatta atcgttgttg ttatgaaata ctatttgtat gagatgaact 2880 ggtgtaatgt aattcattta cataagtgga gtcagaatca gaatgtttcc tccataacta 2940 actagacatg aagacctgcc gcgtacaatt gtcttatatt tgaacaacta aaattgaaca 3000 tcttttgcca caactttata agtggttaat atagctcaaa tatatggtca agttcaatag 3060 attaataatg gaaatatcag ttatcgaaat tcattaacaa tcaacttaac gttattaact 3120 actaatttta tatcatcccc tttgataaat gatagtaca 3159 <210> 74 <211> 565 <212> PRT <213> Influenza virus <220> <221> misc_feature <222> (3)..(3) <223> Xaa can be Ala or Val <220> <221> misc_feature <222> (52)..(52) <223> Xaa can be Asp or Asn <220> <221> misc_feature <222> (90)..(90) <223> Xaa can be Lys or Arg <220> <221> misc_feature <222> (99)..(99) <223> Xaa can be Lys or Thr <220> <221> misc_feature <222> (111)..(111) <223> Xaa can be Tyr or His <220> <221> misc_feature <222> (145)..(145) <223> Xaa can be Val or Thr <220> <221> misc_feature <222> (157)..(157) <223> Xaa can be Glu Lys <220> <221> misc_feature <222> (162)..(162) <223> Xaa can be Arg or Lys <220> <221> misc_feature <222> (182)..(182) <223> Xaa can be Val or Ala <220> <221> misc_feature <222> (203)..(203) <223> Xaa can be Asp or Asn <220> <221> misc_feature <222> (205)..(205) <223> Xaa can be Arg or Lys <220> <221> misc_feature <222> (210)..(210) <223> Xaa can be Thr or Lys <220> <221> misc_feature <222> (225)..(225) <223> Xaa can be Arg or Lys <220> <221> misc_feature <222> (268)..(268) <223> Xaa can be Trp or Arg <220> <221> misc_feature <222> (283)..(283) <223> Xaa can be Thr or Asn <220> <221> misc_feature <222> (290)..(290) <223> Xaa can be Glu or Gly <220> <221> misc_feature <222> (432)..(432) <223> Xaa can be Ile or Leu <220> <221> misc_feature <222> (489)..(489) <223> Xaa can be Asn or Asp <400> 74 Met Lys Xaa Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr 1 5 10 15 Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr 20 25 30 Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn 35 40 45 Leu Leu Glu Xaa Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile 50 55 60 Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly 65 70 75 80 Asn Pro Glu Cys Glu Leu Leu Ile Ser Xaa Glu Ser Trp Ser Tyr Ile 85 90 95 Val Glu Xaa Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Xaa Phe 100 105 110 Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe 115 120 125 Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr 130 135 140 Xaa Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Xaa Ser Ser Phe 145 150 155 160 Tyr Xaa Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn 165 170 175 Leu Ser Lys Ser Tyr Xaa Asn Asn Lys Glu Lys Glu Val Leu Val Leu 180 185 190 Trp Gly Val His His Pro Pro Asn Ile Gly Xaa Gln Xaa Ala Leu Tyr 195 200 205 His Xaa Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg 210 215 220 Xaa Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu 225 230 235 240 Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile 245 250 255 Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Xaa Tyr Ala Phe Ala 260 265 270 Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Xaa Ser Asn Ala Pro Met 275 280 285 Asp Xaa Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser 290 295 300 Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro 305 310 315 320 Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn 325 330 335 Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe 340 345 350 Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His 355 360 365 His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr 370 375 380 Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu 385 390 395 400 Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu 405 410 415 Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Xaa 420 425 430 Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu 435 440 445 Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys 450 455 460 Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys 465 470 475 480 Phe Glu Phe Tyr His Lys Cys Asn Xaa Glu Cys Met Glu Ser Val Lys 485 490 495 Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn 500 505 510 Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln 515 520 525 Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val 530 535 540 Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln 545 550 555 560 Cys Arg Ile Cys Ile 565 <210> 75 <211> 565 <212> PRT <213> Influenza virus <400> 75 Met Lys Ala Lys Leu Leu Val Leu Leu Cys Thr Phe Thr Ala Thr Tyr 1 5 10 15 Ala Asp Thr Ile Cys Ile Gly Tyr His Ala Asn Asn Ser Thr Asp Thr 20 25 30 Val Asp Thr Val Leu Glu Lys Asn Val Thr Val Thr His Ser Val Asn 35 40 45 Leu Leu Glu Asp Ser His Asn Gly Lys Leu Cys Leu Leu Lys Gly Ile 50 55 60 Ala Pro Leu Gln Leu Gly Asn Cys Ser Val Ala Gly Trp Ile Leu Gly 65 70 75 80 Asn Pro Glu Cys Glu Leu Leu Ile Ser Lys Glu Ser Trp Ser Tyr Ile 85 90 95 Val Glu Thr Pro Asn Pro Glu Asn Gly Thr Cys Tyr Pro Gly Tyr Phe 100 105 110 Ala Asp Tyr Glu Glu Leu Arg Glu Gln Leu Ser Ser Val Ser Ser Phe 115 120 125 Glu Arg Phe Glu Ile Phe Pro Lys Glu Ser Ser Trp Pro Asn His Thr 130 135 140 Val Thr Gly Val Ser Ala Ser Cys Ser His Asn Gly Lys Ser Ser Phe 145 150 155 160 Tyr Arg Asn Leu Leu Trp Leu Thr Gly Lys Asn Gly Leu Tyr Pro Asn 165 170 175 Leu Ser Lys Ser Tyr Val Asn Asn Lys Glu Lys Glu Val Leu Val Leu 180 185 190 Trp Gly Val His His Pro Pro Asn Ile Gly Asn Gln Arg Ala Leu Tyr 195 200 205 His Thr Glu Asn Ala Tyr Val Ser Val Val Ser Ser His Tyr Ser Arg 210 215 220 Arg Phe Thr Pro Glu Ile Ala Lys Arg Pro Lys Val Arg Asp Gln Glu 225 230 235 240 Gly Arg Ile Asn Tyr Tyr Trp Thr Leu Leu Glu Pro Gly Asp Thr Ile 245 250 255 Ile Phe Glu Ala Asn Gly Asn Leu Ile Ala Pro Trp Tyr Ala Phe Ala 260 265 270 Leu Ser Arg Gly Phe Gly Ser Gly Ile Ile Thr Ser Asn Ala Pro Met 275 280 285 Asp Glu Cys Asp Ala Lys Cys Gln Thr Pro Gln Gly Ala Ile Asn Ser 290 295 300 Ser Leu Pro Phe Gln Asn Val His Pro Val Thr Ile Gly Glu Cys Pro 305 310 315 320 Lys Tyr Val Arg Ser Ala Lys Leu Arg Met Val Thr Gly Leu Arg Asn 325 330 335 Ile Pro Ser Ile Gln Ser Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe 340 345 350 Ile Glu Gly Gly Trp Thr Gly Met Val Asp Gly Trp Tyr Gly Tyr His 355 360 365 His Gln Asn Glu Gln Gly Ser Gly Tyr Ala Ala Asp Gln Lys Ser Thr 370 375 380 Gln Asn Ala Ile Asn Gly Ile Thr Asn Lys Val Asn Ser Val Ile Glu 385 390 395 400 Lys Met Asn Thr Gln Phe Thr Ala Val Gly Lys Glu Phe Asn Lys Leu 405 410 415 Glu Arg Arg Met Glu Asn Leu Asn Lys Lys Val Asp Asp Gly Phe Leu 420 425 430 Asp Ile Trp Thr Tyr Asn Ala Glu Leu Leu Val Leu Leu Glu Asn Glu 435 440 445 Arg Thr Leu Asp Phe His Asp Ser Asn Val Lys Asn Leu Tyr Glu Lys 450 455 460 Val Lys Ser Gln Leu Lys Asn Asn Ala Lys Glu Ile Gly Asn Gly Cys 465 470 475 480 Phe Glu Phe Tyr His Lys Cys Asn Asn Glu Cys Met Glu Ser Val Lys 485 490 495 Asn Gly Thr Tyr Asp Tyr Pro Lys Tyr Ser Glu Glu Ser Lys Leu Asn 500 505 510 Arg Glu Lys Ile Asp Gly Val Lys Leu Glu Ser Met Gly Val Tyr Gln 515 520 525 Ile Leu Ala Ile Tyr Ser Thr Val Ala Ser Ser Leu Val Leu Leu Val 530 535 540 Ser Leu Gly Ala Ile Ser Phe Trp Met Cys Ser Asn Gly Ser Leu Gln 545 550 555 560 Cys Arg Ile Cys Ile 565 <210> 76 <211> 252 <212> PRT <213> Influenza virus <400> 76 Met Ser Leu Leu Thr Glu Val Glu Thr Tyr Val Leu Ser Ile Ile Pro 1 5 10 15 Ser Gly Pro Leu Lys Ala Glu Ile Ala Gln Arg Leu Glu Asp Val Phe 20 25 30 Ala Gly Lys Asn Thr Asp Leu Glu Val Leu Met Glu Trp Leu Lys Thr 35 40 45 Arg Pro Ile Leu Ser Pro Leu Thr Lys Gly Ile Leu Gly Phe Val Phe 50 55 60 Thr Leu Thr Val Pro Ser Glu Arg Gly Leu Gln Arg Arg Arg Phe Val 65 70 75 80 Gln Asn Ala Leu Asn Gly Asn Gly Asp Pro Asn Asn Met Asp Lys Ala 85 90 95 Val Lys Leu Tyr Arg Lys Leu Lys Arg Glu Ile Thr Phe His Gly Ala 100 105 110 Lys Glu Ile Ser Leu Ser Tyr Ser Ala Gly Ala Leu Ala Ser Cys Met 115 120 125 Gly Leu Ile Tyr Asn Arg Met Gly Ala Val Thr Thr Glu Val Ala Phe 130 135 140 Gly Leu Val Cys Ala Thr Cys Glu Gln Ile Ala Asp Ser Gln His Arg 145 150 155 160 Ser His Arg Gln Met Val Thr Thr Thr Asn Pro Leu Ile Arg His Glu 165 170 175 Asn Arg Met Val Leu Ala Ser Thr Thr Ala Lys Ala Met Glu Gln Met 180 185 190 Ala Gly Ser Ser Glu Gln Ala Ala Glu Ala Met Glu Val Ala Ser Gln 195 200 205 Ala Arg Gln Met Val Gln Ala Met Arg Thr Ile Gly Thr His Pro Ser 210 215 220 Ser Ser Ala Gly Leu Lys Asn Asp Leu Leu Glu Asn Leu Gln Ala Tyr 225 230 235 240 Gln Lys Arg Met Gly Val Gln Met Gln Arg Phe Lys 245 250 <210> 77 <211> 24 <212> DNA <213> Artificial sequence <220> <223> pBinPlus.2613c <400> 77 aggaagggaa gaaagcgaaa ggag 24 <210> 78 <211> 56 <212> DNA <213> Artificial sequence <220> <223> Mut-ATG115.r <400> 78 gtgccgaagc acgatctgac aacgttgaag atcgctcacg caagaaagac aagaga 56 <210> 79 <211> 52 <212> DNA <213> Artificial sequence <220> <223> Mut-ATG161.c <400> 79 gttgtcagat cgtgcttcgg caccagtaca acgttttctt tcactgaagc ga 52 <210> 80 <211> 25 <212> DNA <213> Artificial sequence <220> <223> LC-C5-1.110r <400> 80 tctcctggag tcacagacag ggtgg 25 <210> 81 <211> 2065 <212> DNA <213> Artificial sequence <220> <223> Expression cassette number 828 <400> 81 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggttttcaca cctcagatac ttggacttat gcttttttgg 900 atttcagcct ccagaggtga tattgtgcta actcagtctc cagccaccct gtctgtgact 960 ccaggagata gtgtcagtct ttcctgcagg gccagccaaa gtattagcaa caacctacac 1020 tggtttcaac aaaaatcgca tgagtctcca aggcttctca tcaagtatgc ttcccagtcc 1080 atatctggga tcccctccag gttcagtggc agtggatctg ggacagattt cactctcagt 1140 atcaacagtg tgaagactga agattttgga atgtttttct gtcaacagag taacagctgg 1200 cctctcacgt tcggtgatgg gacaaagctg gagctgaaac gggctgatgc tgcaccaact 1260 gtatccatct tcccaccatc cagtgagcag ttaacatctg gaggtgcctc agtcgtgtgc 1320 ttcttgaaca acttctaccc caaagacatc aatgtcaagt ggaagattga tggcagtgaa 1380 cgacaaaatg gcgtcctgaa cagttggact gatcaggaca gcaaagacag cacctacagc 1440 atgagcagca ccctcacgtt gaccaaggac gagtatgaac gacataacag ctatacctgt 1500 gaggccactc acaagacatc aacttcaccc attgtcaaga gcttcaacag gaatgagtgt 1560 tagaggccta ttttctttag tttgaattta ctgttattcg gtgtgcattt ctatgtttgg 1620 tgagcggttt tctgtgctca gagtgtgttt attttatgta atttaatttc tttgtgagct 1680 cctgtttagc aggtcgtccc ttcagcaagg acacaaaaag attttaattt tattaaaaaa 1740 aaaaaaaaaa aagaccggga attcgatatc aagcttatcg acctgcagat cgttcaaaca 1800 tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat 1860 aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta 1920 tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca 1980 aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatt 2040 ctagagtctc aagcttcggc gcgcc 2065 <210> 82 <211> 48 <212> DNA <213> Artificial sequence <220> <223> SpPDI-HA(Ind).c <400> 82 gttccttctc agatcttcgc tgatcagatt tgcattggtt accatgca 48 <210> 83 <211> 3218 <212> DNA <213> Artificial sequence <220> <223> Construct number 663, from HindIII <400> 83 aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60 tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120 tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180 taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240 catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300 aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360 accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420 aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480 caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540 aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600 aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660 agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720 ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780 tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840 ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900 tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960 tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020 ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1080 tcttgtgttg gttccttctc agatcttcgc tgatcagatt tgcattggtt accatgcaaa 1140 caattcaaca gagcaggttg acacaatcat ggaaaagaac gttactgtta cacatgccca 1200 agacatactg gaaaagacac acaacgggaa gctctgcgat ctagatggag tgaagcctct 1260 aattttaaga gattgtagtg tagctggatg gctcctcggg aacccaatgt gtgacgaatt 1320 catcaatgta ccggaatggt cttacatagt ggagaaggcc aatccaacca atgacctctg 1380 ttacccaggg agtttcaacg actatgaaga actgaaacac ctattgagca gaataaacca 1440 ttttgagaaa attcaaatca tccccaaaag ttcttggtcc gatcatgaag cctcatcagg 1500 agttagctca gcatgtccat acctgggaag tccctccttt tttagaaatg tggtatggct 1560 tatcaaaaag aacagtacat acccaacaat aaagaaaagc tacaataata ccaaccaaga 1620 ggatcttttg gtactgtggg gaattcacca tcctaatgat gcggcagagc agacaaggct 1680 atatcaaaac ccaaccacct atatttccat tgggacatca acactaaacc agagattggt 1740 accaaaaata gctactagat ccaaagtaaa cgggcaaagt ggaaggatgg agttcttctg 1800 gacaatttta aaacctaatg atgcaatcaa cttcgagagt aatggaaatt tcattgctcc 1860 agaatatgca tacaaaattg tcaagaaagg ggactcagca attatgaaaa gtgaattgga 1920 atatggtaac tgcaacacca agtgtcaaac tccaatgggg gcgataaact ctagtatgcc 1980 attccacaac atacaccctc tcaccatcgg ggaatgcccc aaatatgtga aatcaaacag 2040 attagtcctt gcaacagggc tcagaaatag ccctcaaaga gagagcagaa gaaaaaagag 2100 aggactattt ggagctatag caggttttat agagggagga tggcagggaa tggtagatgg 2160 ttggtatggg taccaccata gcaatgagca ggggagtggg tacgctgcag acaaagaatc 2220 cactcaaaag gcaatagatg gagtcaccaa taaggtcaac tcaatcattg acaaaatgaa 2280 cactcagttt gaggccgttg gaagggaatt taataactta gaaaggagaa tagagaattt 2340 aaacaagaag atggaagacg ggtttctaga tgtctggact tataatgccg aacttctggt 2400 tctcatggaa aatgagagaa ctctagactt tcatgactca aatgttaaga acctctacga 2460 caaggtccga ctacagctta gggataatgc aaaggagctg ggtaacggtt gtttcgagtt 2520 ctatcacaaa tgtgataatg aatgtatgga aagtataaga aacggaacgt acaactatcc 2580 gcagtattca gaagaagcaa gattaaaaag agaggaaata agtggggtaa aattggaatc 2640 aataggaact taccaaatac tgtcaattta ttcaacagtg gcgagttccc tagcactggc 2700 aatcatgatg gctggtctat ctttatggat gtgctccaat ggatcgttac aatgcagaat 2760 ttgcatttaa gagctctaag ttaaaatgct tcttcgtctc ctatttataa tatggtttgt 2820 tattgttaat tttgttcttg tagaagagct taattaatcg ttgttgttat gaaatactat 2880 ttgtatgaga tgaactggtg taatgtaatt catttacata agtggagtca gaatcagaat 2940 gtttcctcca taactaacta gacatgaaga cctgccgcgt acaattgtct tatatttgaa 3000 caactaaaat tgaacatctt ttgccacaac tttataagtg gttaatatag ctcaaatata 3060 tggtcaagtt caatagatta ataatggaaa tatcagttat cgaaattcat taacaatcaa 3120 cttaacgtta ttaactacta attttatatc atcccctttg ataaatgata gtacaccaat 3180 taggaaggag catgctcgag gcctggctgg ccgaattc 3218 <210> 84 <211> 49 <212> DNA <213> Artificial sequence <220> <223> SpPDI-H1B.c <400> 84 ttctcagatc ttcgctgaca caatatgtat aggctaccat gctaacaac 49 <210> 85 <211> 47 <212> DNA <213> Artificial sequence <220> <223> SacI-H1B.r <400> 85 cttagagctc ttagatgcat attctacact gtaaagaccc attggaa 47 <210> 86 <211> 3206 <212> DNA <213> Artificial sequence <220> <223> Construct number 787, from HindIII <400> 86 aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60 tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120 tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180 taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240 catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300 aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360 accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420 aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480 caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540 aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600 aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660 agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720 ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780 tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840 ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900 tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960 tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020 ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1080 tcttgtgttg gttccttctc agatcttcgc tgacacaata tgtataggct accatgctaa 1140 caactcgacc gacactgttg acacagtact tgaaaagaat gtgacagtga cacactctgt 1200 caacctgctt gagaacagtc acaatggaaa actatgtcta ttaaaaggaa tagccccact 1260 acaattgggt aattgcagcg ttgccgggtg gatcttagga aacccagaat gcgaattact 1320 gatttccaag gagtcatggt cctacattgt agaaaaacca aatcctgaga atggaacatg 1380 ttacccaggg catttcgctg actatgagga actgagggag caattgagtt cagtatcttc 1440 atttgagagg ttcgaaatat tccccaaaga aagctcatgg cccaaccaca ccgtaaccgg 1500 agtgtcagca tcatgctccc ataatgggga aagcagtttt tacagaaatt tgctatggct 1560 gacggggaag aatggtttgt acccaaacct gagcaagtcc tatgcaaaca acaaagaaaa 1620 agaagtcctt gtactatggg gtgttcatca cccgccaaac ataggtgacc aaaaggccct 1680 ctatcataca gaaaatgctt atgtctctgt agtgtcttca cattatagca gaaaattcac 1740 cccagaaata gccaaaagac ccaaagtaag agatcaagaa ggaagaatca attactactg 1800 gactctgctt gaacccgggg atacaataat atttgaggca aatggaaatc taatagcgcc 1860 aagatatgct ttcgcactga gtagaggctt tggatcagga atcatcaact caaatgcacc 1920 aatggataaa tgtgatgcga agtgccaaac acctcaggga gctataaaca gcagtcttcc 1980 tttccagaac gtacacccag tcacaatagg agagtgtcca aagtatgtca ggagtgcaaa 2040 attaaggatg gttacaggac taaggaacat cccatccatt caatccagag gtttgtttgg 2100 agccattgcc ggtttcattg aaggggggtg gactggaatg gtagatggtt ggtatggtta 2160 tcatcatcag aatgagcaag gatctggcta tgctgcagat caaaaaagca cacaaaatgc 2220 cattaatggg attacaaaca aggtcaattc tgtaattgag aaaatgaaca ctcaattcac 2280 agcagtgggc aaagagttca acaaattgga aagaaggatg gaaaacttga ataaaaaagt 2340 tgatgatggg tttatagaca tttggacata taatgcagaa ctgttggttc tactggaaaa 2400 tgaaaggact ttggatttcc atgactccaa tgtgaagaat ctgtatgaga aagtaaaaag 2460 ccagttaaag aataatgcta aagaaatagg aaatgggtgt tttgagttct atcacaagtg 2520 taacgatgaa tgcatggaga gtgtaaagaa tggaacttat gactatccaa aatattccga 2580 agaatcaaag ttaaacaggg agaaaattga tggagtgaaa ttggaatcaa tgggagtcta 2640 tcagattctg gcgatctact caacagtcgc cagttctctg gttcttttgg tctccctggg 2700 ggcaatcagc ttctggatgt gttccaatgg gtctttacag tgtagaatat gcatctaaga 2760 gctctaagtt aaaatgcttc ttcgtctcct atttataata tggtttgtta ttgttaattt 2820 tgttcttgta gaagagctta attaatcgtt gttgttatga aatactattt gtatgagatg 2880 aactggtgta atgtaattca tttacataag tggagtcaga atcagaatgt ttcctccata 2940 actaactaga catgaagacc tgccgcgtac aattgtctta tatttgaaca actaaaattg 3000 aacatctttt gccacaactt tataagtggt taatatagct caaatatatg gtcaagttca 3060 atagattaat aatggaaata tcagttatcg aaattcatta acaatcaact taacgttatt 3120 aactactaat tttatatcat cccctttgat aaatgatagt acaccaatta ggaaggagca 3180 tgctcgaggc ctggctggcc gaattc 3206 <210> 87 <211> 45 <212> DNA <213> Artificial sequence <220> <223> H3B-SpPDI.r <400> 87 tgtcatttcc gggaagtttt tgagcgaaga tctgagaagg aacca 45 <210> 88 <211> 45 <212> DNA <213> Artificial sequence <220> <223> SpPDI-H3B.c <400> 88 tctcagatct tcgctcaaaa acttcccgga aatgacaaca gcacg 45 <210> 89 <211> 23 <212> DNA <213> Artificial sequence <220> <223> H3(A-Bri).982r <400> 89 ttgcttaaca tatctgggac agg 23 <210> 90 <211> 3212 <212> DNA <213> Artificial sequence <220> <223> Construct number 790, from HindIII <400> 90 aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60 tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120 tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180 taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240 catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300 aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360 accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420 aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480 caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540 aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600 aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660 agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720 ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780 tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840 ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900 tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960 tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020 ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1080 tcttgtgttg gttccttctc agatcttcgc tcaaaaactt cccggaaatg acaacagcac 1140 ggcaacgctg tgccttgggc accatgcagt accaaacgga acgatagtga aaacaatcac 1200 gaatgaccaa attgaagtta ctaatgctac tgagctggtt cagagttcct caacaggtga 1260 aatatgcgac agtcctcatc agatccttga tggagaaaac tgcacactaa tagatgctct 1320 attgggagac cctcagtgtg atggcttcca aaataagaaa tgggaccttt ttgttgaacg 1380 cagcaaagcc tacagcaact gttaccctta tgatgtgccg gattatgcct cccttaggtc 1440 actagttgcc tcatccggca cactggagtt taacaatgaa agtttcaatt ggactggagt 1500 cactcaaaac ggaacaagct ctgcttgcat aaggagatct aataacagtt tctttagtag 1560 attgaattgg ttgacccact taaaattcaa atacccagca ttgaacgtga ctatgccaaa 1620 caatgaaaaa tttgacaaat tgtacatttg gggggttcac cacccgggta cggacaatga 1680 ccaaatcttc ctgtatgctc aagcatcagg aagaatcaca gtctctacca aaagaagcca 1740 acaaactgta atcccgaata tcggatctag acccagagta aggaatatcc ccagcagaat 1800 aagcatctat tggacaatag taaaaccggg agacatactt ttgattaaca gcacagggaa 1860 tctaattgct cctaggggtt acttcaaaat acgaagtggg aaaagctcaa taatgagatc 1920 agatgcaccc attggcaaat gcaattctga atgcatcact ccaaacggaa gcattcccaa 1980 tgacaaacca ttccaaaatg taaacaggat cacatacggg gcctgtccca gatatgttaa 2040 gcaaaacact ctgaaattgg caacagggat gcgaaatgta ccagagaaac aaactagagg 2100 catatttggc gcaatcgcgg gtttcataga aaatggttgg gagggaatgg tggatggttg 2160 gtatggtttc aggcatcaaa attctgaggg aataggacaa gcagcagatc tcaaaagcac 2220 tcaagcagca atcgatcaaa tcaatgggaa gctgaatagg ttgatcggga aaaccaacga 2280 gaaattccat cagattgaaa aagagttctc agaagtcgaa gggagaatcc aggaccttga 2340 gaaatatgtt gaggacacca aaatagatct ctggtcatac aacgcggagc ttcttgttgc 2400 cctggagaac caacatacaa ttgatctaac tgactcagaa atgaacaaac tgtttgaaaa 2460 aacaaagaag caactgaggg aaaatgctga ggatatgggc aatggttgtt tcaaaatata 2520 ccacaaatgt gacaatgcct gcataggatc aatcagaaat ggaacttatg accacgatgt 2580 atacagagat gaagcattaa acaaccggtt ccagatcaag ggcgttgagc tgaagtcagg 2640 atacaaagat tggatactat ggatttcctt tgccatatca tgttttttgc tttgtgttgc 2700 tttgttgggg ttcatcatgt gggcctgcca aaaaggcaac attaggtgca acatttgcat 2760 ttgagagctc taagttaaaa tgcttcttcg tctcctattt ataatatggt ttgttattgt 2820 taattttgtt cttgtagaag agcttaatta atcgttgttg ttatgaaata ctatttgtat 2880 gagatgaact ggtgtaatgt aattcattta cataagtgga gtcagaatca gaatgtttcc 2940 tccataacta actagacatg aagacctgcc gcgtacaatt gtcttatatt tgaacaacta 3000 aaattgaaca tcttttgcca caactttata agtggttaat atagctcaaa tatatggtca 3060 agttcaatag attaataatg gaaatatcag ttatcgaaat tcattaacaa tcaacttaac 3120 gttattaact actaatttta tatcatcccc tttgataaat gatagtacac caattaggaa 3180 ggagcatgct cgaggcctgg ctggccgaat tc 3212 <210> 91 <211> 50 <212> DNA <213> Artificial sequence <220> <223> HBF-SpPDI.r <400> 91 gttattccag tgcagattcg atcagcgaag atctgagaag gaaccaacac 50 <210> 92 <211> 50 <212> DNA <213> Artificial sequence <220> <223> SpPDI-HBF.c <400> 92 cagatcttcg ctgatcgaat ctgcactgga ataacatctt caaactcacc 50 <210> 93 <211> 28 <212> DNA <213> Artificial sequence <220> <223> Plaster80r <400> 93 caaatagtat ttcataacaa caacgatt 28 <210> 94 <211> 3269 <212> DNA <213> Artificial sequence <220> <223> Construct number 798, from HindIII <400> 94 aagcttgcta gcggcctcaa tggccctgca ggtcgactct agaggtaccc cgggctggta 60 tatttatatg ttgtcaaata actcaaaaac cataaaagtt taagttagca agtgtgtaca 120 tttttacttg aacaaaaata ttcacctact actgttataa atcattatta aacattagag 180 taaagaaata tggatgataa gaacaagagt agtgatattt tgacaacaat tttgttgcaa 240 catttgagaa aattttgttg ttctctcttt tcattggtca aaaacaatag agagagaaaa 300 aggaagaggg agaataaaaa cataatgtga gtatgagaga gaaagttgta caaaagttgt 360 accaaaatag ttgtacaaat atcattgagg aatttgacaa aagctacaca aataagggtt 420 aattgctgta aataaataag gatgacgcat tagagagatg taccattaga gaatttttgg 480 caagtcatta aaaagaaaga ataaattatt tttaaaatta aaagttgagt catttgatta 540 aacatgtgat tatttaatga attgatgaaa gagttggatt aaagttgtat tagtaattag 600 aatttggtgt caaatttaat ttgacatttg atcttttcct atatattgcc ccatagagtc 660 agttaactca tttttatatt tcatagatca aataagagaa ataacggtat attaatccct 720 ccaaaaaaaa aaaacggtat atttactaaa aaatctaagc cacgtaggag gataacagga 780 tccccgtagg aggataacat ccaatccaac caatcacaac aatcctgatg agataaccca 840 ctttaagccc acgcatctgt ggcacatcta cattatctaa atcacacatt cttccacaca 900 tctgagccac acaaaaacca atccacatct ttatcaccca ttctataaaa aatcacactt 960 tgtgagtcta cactttgatt cccttcaaac acatacaaag agaagagact aattaattaa 1020 ttaatcatct tgagagaaaa tggcgaaaaa cgttgcgatt ttcggcttat tgttttctct 1080 tcttgtgttg gttccttctc agatcttcgc tgatcgaatc tgcactggaa taacatcttc 1140 aaactcacct catgtggtca aaacagccac tcaaggggag gtcaatgtga ctggtgtgat 1200 accactaaca acaacaccaa caaaatctta ttttgcaaat ctcaaaggaa caaggaccag 1260 agggaaacta tgcccagact gtctcaactg cacagatctg gatgtggctt tgggcagacc 1320 aatgtgtgtg gggaccacac cttcggcgaa ggcttcaata ctccacgaag tcaaacctgt 1380 tacatccggg tgctttccta taatgcacga cagaacaaaa atcaggcaac tacccaatct 1440 tctcagagga tatgaaaata tcaggctatc aacccaaaac gtcatcgatg cggaaaaggc 1500 accaggagga ccctacagac ttggaacctc aggatcttgc cctaacgcta ccagtaagag 1560 cggatttttc gcaacaatgg cttgggctgt cccaaaggac aacaacaaaa atgcaacgaa 1620 cccactaaca gtagaagtac catacatttg tacagaaggg gaagaccaaa tcactgtttg 1680 ggggttccat tcagataaca aaacccaaat gaagaacctc tatggagact caaatcctca 1740 aaagttcacc tcatctgcta atggagtaac cacacactat gtttctcaga ttggcagctt 1800 cccagatcaa acagaagacg gaggactacc acaaagcggc aggattgttg ttgattacat 1860 gatgcaaaaa cctgggaaaa caggaacaat tgtctaccaa agaggtgttt tgttgcctca 1920 aaaggtgtgg tgcgcgagtg gcaggagcaa agtaataaaa gggtccttgc ctttaattgg 1980 tgaagcagat tgccttcatg aaaaatacgg tggattaaac aaaagcaagc cttactacac 2040 aggagaacat gcaaaagcca taggaaattg cccaatatgg gtgaaaacac ctttgaagct 2100 cgccaatgga accaaatata gacctcctgc aaaactatta aaggaaaggg gtttcttcgg 2160 agctattgct ggtttcctag aaggaggatg ggaaggaatg attgcaggct ggcacggata 2220 cacatctcac ggagcacatg gagtggcagt ggcggcggac cttaagagta cgcaagaagc 2280 tataaacaag ataacaaaaa atctcaattc tttgagtgag ctagaagtaa agaatcttca 2340 aagactaagt ggtgccatgg atgaactcca caacgaaata ctcgagctgg atgagaaagt 2400 ggatgatctc agagctgaca ctataagctc gcaaatagaa cttgcagtct tgctttccaa 2460 cgaaggaata ataaacagtg aagatgagca tctattggca cttgagagaa aactaaagaa 2520 aatgctgggt ccctctgctg tagagatagg aaatggatgc ttcgaaacca aacacaagtg 2580 caaccagacc tgcttagaca ggatagctgc tggcaccttt aatgcaggag aattttctct 2640 ccccactttt gattcactga acattactgc tgcatcttta aatgatgatg gattggataa 2700 ccatactata ctgctctatt actcaactgc tgcttctagt ttggctgtaa cattgatgct 2760 agctattttt attgtttata tggtctccag agacaacgtt tcatgctcca tctgtctata 2820 agagctctaa gttaaaatgc ttcttcgtct cctatttata atatggtttg ttattgttaa 2880 ttttgttctt gtagaagagc ttaattaatc gttgttgtta tgaaatacta tttgtatgag 2940 atgaactggt gtaatgtaat tcatttacat aagtggagtc agaatcagaa tgtttcctcc 3000 ataactaact agacatgaag acctgccgcg tacaattgtc ttatatttga acaactaaaa 3060 ttgaacatct tttgccacaa ctttataagt ggttaatata gctcaaatat atggtcaagt 3120 tcaatagatt aataatggaa atatcagtta tcgaaattca ttaacaatca acttaacgtt 3180 attaactact aattttatat catccccttt gataaatgat agtacaccaa ttaggaagga 3240 gcatgctcga ggcctggctg gccgaattc 3269 <210> 95 <211> 45 <212> DNA <213> Artificial sequence <220> <223> ApaI-SpPDI.c <400> 95 ttgtcgggcc catggcgaaa aacgttgcga ttttcggctt attgt 45 <210> 96 <211> 42 <212> DNA <213> Artificial sequence <220> <223> StuI-H1(A-NC).r <400> 96 aaaataggcc tttagatgca tattctacac tgcaaagacc ca 42 <210> 97 <211> 3079 <212> DNA <213> Artificial sequence <220> <223> Construct number 580, from PacI <400> 97 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900 cttgtgttgg ttccttctca gatcttcgct gacacaatat gtataggcta ccatgccaac 960 aactcaaccg acactgttga cacagtactt gagaagaatg tgacagtgac acactctgtc 1020 aacctacttg aggacagtca caatggaaaa ctatgtctac taaaaggaat agccccacta 1080 caattgggta attgcagcgt tgccggatgg atcttaggaa acccagaatg cgaattactg 1140 atttccaagg aatcatggtc ctacattgta gaaacaccaa atcctgagaa tggaacatgt 1200 tacccagggt atttcgccga ctatgaggaa ctgagggagc aattgagttc agtatcttca 1260 tttgagagat tcgaaatatt ccccaaagaa agctcatggc ccaaccacac cgtaaccgga 1320 gtatcagcat catgctccca taatgggaaa agcagttttt acagaaattt gctatggctg 1380 acggggaaga atggtttgta cccaaacctg agcaagtcct atgtaaacaa caaagagaaa 1440 gaagtccttg tactatgggg tgttcatcac ccgcctaaca tagggaacca aagggcactc 1500 tatcatacag aaaatgctta tgtctctgta gtgtcttcac attatagcag aagattcacc 1560 ccagaaatag ccaaaagacc caaagtaaga gatcaggaag gaagaatcaa ctactactgg 1620 actctgctgg aacctgggga tacaataata tttgaggcaa atggaaatct aatagcgcca 1680 tggtatgctt ttgcactgag tagaggcttt ggatcaggaa tcatcacctc aaatgcacca 1740 atggatgaat gtgatgcgaa gtgtcaaaca cctcagggag ctataaacag cagtcttcct 1800 ttccagaatg tacacccagt cacaatagga gagtgtccaa agtatgtcag gagtgcaaaa 1860 ttaaggatgg ttacaggact aaggaacatc ccatccattc aatccagagg tttgtttgga 1920 gccattgccg gtttcattga aggggggtgg actggaatgg tagatgggtg gtatggttat 1980 catcatcaga atgagcaagg atctggctat gctgcagatc aaaaaagtac acaaaatgcc 2040 attaacggga ttacaaacaa ggtcaattct gtaattgaga aaatgaacac tcaattcaca 2100 gctgtgggca aagagttcaa caaattggaa agaaggatgg aaaacttaaa taaaaaagtt 2160 gatgatgggt ttctagacat ttggacatat aatgcagaat tgttggttct actggaaaat 2220 gaaaggactt tggatttcca tgactccaat gtgaagaatc tgtatgagaa agtaaaaagc 2280 caattaaaga ataatgccaa agaaatagga aacgggtgtt ttgagttcta tcacaagtgt 2340 aacaatgaat gcatggagag tgtgaaaaat ggtacctatg actatccaaa atattccgaa 2400 gaatcaaagt taaacaggga gaaaattgat ggagtgaaat tggaatcaat gggagtatac 2460 cagattctgg cgatctactc aactgtcgcc agttccctgg ttcttttggt ctccctgggg 2520 gcaatcagct tctggatgtg ttccaatggg tctttgcagt gtagaatatg catctaaagg 2580 cctattttct ttagtttgaa tttactgtta ttcggtgtgc atttctatgt ttggtgagcg 2640 gttttctgtg ctcagagtgt gtttatttta tgtaatttaa tttctttgtg agctcctgtt 2700 tagcaggtcg tcccttcagc aaggacacaa aaagatttta attttattaa aaaaaaaaaa 2760 aaaaaagacc gggaattcga tatcaagctt atcgacctgc agatcgttca aacatttggc 2820 aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc 2880 tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat 2940 gggtttttat gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat 3000 agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gattctagag 3060 tctcaagctt cggcgcgcc 3079 <210> 98 <211> 39 <212> DNA <213> Artificial sequence <220> <223> ApaI-H5 (A-Indo).1c <400> 98 tgtcgggccc atggagaaaa tagtgcttct tcttgcaat 39 <210> 99 <211> 37 <212> DNA <213> Artificial sequence <220> <223> H5 (A-Indo)-StuI.1707r <400> 99 aaataggcct ttaaatgcaa attctgcatt gtaacga 37 <210> 100 <211> 3067 <212> DNA <213> Artificial sequence <220> <223> Construct number 685, from PacI <400> 100 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggagaaaata gtgcttcttc ttgcaatagt cagtcttgtt 900 aaaagtgatc agatttgcat tggttaccat gcaaacaatt caacagagca ggttgacaca 960 atcatggaaa agaacgttac tgttacacat gcccaagaca tactggaaaa gacacacaac 1020 gggaagctct gcgatctaga tggagtgaag cctctaattt taagagattg tagtgtagct 1080 ggatggctcc tcgggaaccc aatgtgtgac gaattcatca atgtaccgga atggtcttac 1140 atagtggaga aggccaatcc aaccaatgac ctctgttacc cagggagttt caacgactat 1200 gaagaactga aacacctatt gagcagaata aaccattttg agaaaattca aatcatcccc 1260 aaaagttctt ggtccgatca tgaagcctca tcaggagtta gctcagcatg tccatacctg 1320 ggaagtccct ccttttttag aaatgtggta tggcttatca aaaagaacag tacataccca 1380 acaataaaga aaagctacaa taataccaac caagaggatc ttttggtact gtggggaatt 1440 caccatccta atgatgcggc agagcagaca aggctatatc aaaacccaac cacctatatt 1500 tccattggga catcaacact aaaccagaga ttggtaccaa aaatagctac tagatccaaa 1560 gtaaacgggc aaagtggaag gatggagttc ttctggacaa ttttaaaacc taatgatgca 1620 atcaacttcg agagtaatgg aaatttcatt gctccagaat atgcatacaa aattgtcaag 1680 aaaggggact cagcaattat gaaaagtgaa ttggaatatg gtaactgcaa caccaagtgt 1740 caaactccaa tgggggcgat aaactctagt atgccattcc acaacataca ccctctcacc 1800 atcggggaat gccccaaata tgtgaaatca aacagattag tccttgcaac agggctcaga 1860 aatagccctc aaagagagag cagaagaaaa aagagaggac tatttggagc tatagcaggt 1920 tttatagagg gaggatggca gggaatggta gatggttggt atgggtacca ccatagcaat 1980 gagcagggga gtgggtacgc tgcagacaaa gaatccactc aaaaggcaat agatggagtc 2040 accaataagg tcaactcaat cattgacaaa atgaacactc agtttgaggc cgttggaagg 2100 gaatttaata acttagaaag gagaatagag aatttaaaca agaagatgga agacgggttt 2160 ctagatgtct ggacttataa tgccgaactt ctggttctca tggaaaatga gagaactcta 2220 gactttcatg actcaaatgt taagaacctc tacgacaagg tccgactaca gcttagggat 2280 aatgcaaagg agctgggtaa cggttgtttc gagttctatc acaaatgtga taatgaatgt 2340 atggaaagta taagaaacgg aacgtacaac tatccgcagt attcagaaga agcaagatta 2400 aaaagagagg aaataagtgg ggtaaaattg gaatcaatag gaacttacca aatactgtca 2460 atttattcaa cagtggcgag ttccctagca ctggcaatca tgatggctgg tctatcttta 2520 tggatgtgct ccaatggatc gttacaatgc agaatttgca tttaaaggcc tattttcttt 2580 agtttgaatt tactgttatt cggtgtgcat ttctatgttt ggtgagcggt tttctgtgct 2640 cagagtgtgt ttattttatg taatttaatt tctttgtgag ctcctgttta gcaggtcgtc 2700 ccttcagcaa ggacacaaaa agattttaat tttattaaaa aaaaaaaaaa aaaagaccgg 2760 gaattcgata tcaagcttat cgacctgcag atcgttcaaa catttggcaa taaagtttct 2820 taagattgaa tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg 2880 ttaagcatgt aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga 2940 ttagagtccc gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact 3000 aggataaatt atcgcgcgcg gtgtcatcta tgttactaga ttctagagtc tcaagcttcg 3060 gcgcgcc 3067 <210> 101 <211> 3091 <212> DNA <213> Artificial sequence <220> <223> Construct number 686, from PacI <400> 101 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900 cttgtgttgg ttccttctca gatcttcgct gatcagattt gcattggtta ccatgcaaac 960 aattcaacag agcaggttga cacaatcatg gaaaagaacg ttactgttac acatgcccaa 1020 gacatactgg aaaagacaca caacgggaag ctctgcgatc tagatggagt gaagcctcta 1080 attttaagag attgtagtgt agctggatgg ctcctcggga acccaatgtg tgacgaattc 1140 atcaatgtac cggaatggtc ttacatagtg gagaaggcca atccaaccaa tgacctctgt 1200 tacccaggga gtttcaacga ctatgaagaa ctgaaacacc tattgagcag aataaaccat 1260 tttgagaaaa ttcaaatcat ccccaaaagt tcttggtccg atcatgaagc ctcatcagga 1320 gttagctcag catgtccata cctgggaagt ccctcctttt ttagaaatgt ggtatggctt 1380 atcaaaaaga acagtacata cccaacaata aagaaaagct acaataatac caaccaagag 1440 gatcttttgg tactgtgggg aattcaccat cctaatgatg cggcagagca gacaaggcta 1500 tatcaaaacc caaccaccta tatttccatt gggacatcaa cactaaacca gagattggta 1560 ccaaaaatag ctactagatc caaagtaaac gggcaaagtg gaaggatgga gttcttctgg 1620 acaattttaa aacctaatga tgcaatcaac ttcgagagta atggaaattt cattgctcca 1680 gaatatgcat acaaaattgt caagaaaggg gactcagcaa ttatgaaaag tgaattggaa 1740 tatggtaact gcaacaccaa gtgtcaaact ccaatggggg cgataaactc tagtatgcca 1800 ttccacaaca tacaccctct caccatcggg gaatgcccca aatatgtgaa atcaaacaga 1860 ttagtccttg caacagggct cagaaatagc cctcaaagag agagcagaag aaaaaagaga 1920 ggactatttg gagctatagc aggttttata gagggaggat ggcagggaat ggtagatggt 1980 tggtatgggt accaccatag caatgagcag gggagtgggt acgctgcaga caaagaatcc 2040 actcaaaagg caatagatgg agtcaccaat aaggtcaact caatcattga caaaatgaac 2100 actcagtttg aggccgttgg aagggaattt aataacttag aaaggagaat agagaattta 2160 aacaagaaga tggaagacgg gtttctagat gtctggactt ataatgccga acttctggtt 2220 ctcatggaaa atgagagaac tctagacttt catgactcaa atgttaagaa cctctacgac 2280 aaggtccgac tacagcttag ggataatgca aaggagctgg gtaacggttg tttcgagttc 2340 tatcacaaat gtgataatga atgtatggaa agtataagaa acggaacgta caactatccg 2400 cagtattcag aagaagcaag attaaaaaga gaggaaataa gtggggtaaa attggaatca 2460 ataggaactt accaaatact gtcaatttat tcaacagtgg cgagttccct agcactggca 2520 atcatgatgg ctggtctatc tttatggatg tgctccaatg gatcgttaca atgcagaatt 2580 tgcatttaaa ggcctatttt ctttagtttg aatttactgt tattcggtgt gcatttctat 2640 gtttggtgag cggttttctg tgctcagagt gtgtttattt tatgtaattt aatttctttg 2700 tgagctcctg tttagcaggt cgtcccttca gcaaggacac aaaaagattt taattttatt 2760 aaaaaaaaaa aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct gcagatcgtt 2820 caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta 2880 tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt 2940 tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag 3000 aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac 3060 tagattctag agtctcaagc ttcggcgcgc c 3091 <210> 102 <211> 45 <212> DNA <213> Artificial sequence <220> <223> ApaI-H1B.c <400> 102 tgtcgggccc atgaaagtaa aactactggt cctgttatgc acatt 45 <210> 103 <211> 46 <212> DNA <213> Artificial sequence <220> <223> StuI-H2B.r <400> 103 aaataggcct ttagatgcat attctacact gtaaagaccc attgga 46 <210> 104 <211> 3058 <212> DNA <213> Artificial sequence <220> <223> Construct 732, from PacI <400> 104 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat gaaagtaaaa ctactggtcc tgttatgcac atttacagct 900 acatatgcag acacaatatg tataggctac catgctaaca actcgaccga cactgttgac 960 acagtacttg aaaagaatgt gacagtgaca cactctgtca acctgcttga gaacagtcac 1020 aatggaaaac tatgtctatt aaaaggaata gccccactac aattgggtaa ttgcagcgtt 1080 gccgggtgga tcttaggaaa cccagaatgc gaattactga tttccaagga gtcatggtcc 1140 tacattgtag aaaaaccaaa tcctgagaat ggaacatgtt acccagggca tttcgctgac 1200 tatgaggaac tgagggagca attgagttca gtatcttcat ttgagaggtt cgaaatattc 1260 cccaaagaaa gctcatggcc caaccacacc gtaaccggag tgtcagcatc atgctcccat 1320 aatggggaaa gcagttttta cagaaatttg ctatggctga cggggaagaa tggtttgtac 1380 ccaaacctga gcaagtccta tgcaaacaac aaagaaaaag aagtccttgt actatggggt 1440 gttcatcacc cgccaaacat aggtgaccaa aaggccctct atcatacaga aaatgcttat 1500 gtctctgtag tgtcttcaca ttatagcaga aaattcaccc cagaaatagc caaaagaccc 1560 aaagtaagag atcaagaagg aagaatcaat tactactgga ctctgcttga acccggggat 1620 acaataatat ttgaggcaaa tggaaatcta atagcgccaa gatatgcttt cgcactgagt 1680 agaggctttg gatcaggaat catcaactca aatgcaccaa tggataaatg tgatgcgaag 1740 tgccaaacac ctcagggagc tataaacagc agtcttcctt tccagaacgt acacccagtc 1800 acaataggag agtgtccaaa gtatgtcagg agtgcaaaat taaggatggt tacaggacta 1860 aggaacatcc catccattca atccagaggt ttgtttggag ccattgccgg tttcattgaa 1920 ggggggtgga ctggaatggt agatggttgg tatggttatc atcatcagaa tgagcaagga 1980 tctggctatg ctgcagatca aaaaagcaca caaaatgcca ttaatgggat tacaaacaag 2040 gtcaattctg taattgagaa aatgaacact caattcacag cagtgggcaa agagttcaac 2100 aaattggaaa gaaggatgga aaacttgaat aaaaaagttg atgatgggtt tatagacatt 2160 tggacatata atgcagaact gttggttcta ctggaaaatg aaaggacttt ggatttccat 2220 gactccaatg tgaagaatct gtatgagaaa gtaaaaagcc agttaaagaa taatgctaaa 2280 gaaataggaa atgggtgttt tgagttctat cacaagtgta acgatgaatg catggagagt 2340 gtaaagaatg gaacttatga ctatccaaaa tattccgaag aatcaaagtt aaacagggag 2400 aaaattgatg gagtgaaatt ggaatcaatg ggagtctatc agattctggc gatctactca 2460 acagtcgcca gttctctggt tcttttggtc tccctggggg caatcagctt ctggatgtgt 2520 tccaatgggt ctttacagtg tagaatatgc atctaaaggc ctattttctt tagtttgaat 2580 ttactgttat tcggtgtgca tttctatgtt tggtgagcgg ttttctgtgc tcagagtgtg 2640 tttattttat gtaatttaat ttctttgtga gctcctgttt agcaggtcgt cccttcagca 2700 aggacacaaa aagattttaa ttttattaaa aaaaaaaaaa aaaaagaccg ggaattcgat 2760 atcaagctta tcgacctgca gatcgttcaa acatttggca ataaagtttc ttaagattga 2820 atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac gttaagcatg 2880 taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg attagagtcc 2940 cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac taggataaat 3000 tatcgcgcgc ggtgtcatct atgttactag attctagagt ctcaagcttc ggcgcgcc 3058 <210> 105 <211> 3079 <212> DNA <213> Artificial sequence <220> <223> Construct number 733, from PacI <400> 105 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900 cttgtgttgg ttccttctca gatcttcgct gacacaatat gtataggcta ccatgctaac 960 aactcgaccg acactgttga cacagtactt gaaaagaatg tgacagtgac acactctgtc 1020 aacctgcttg agaacagtca caatggaaaa ctatgtctat taaaaggaat agccccacta 1080 caattgggta attgcagcgt tgccgggtgg atcttaggaa acccagaatg cgaattactg 1140 atttccaagg agtcatggtc ctacattgta gaaaaaccaa atcctgagaa tggaacatgt 1200 tacccagggc atttcgctga ctatgaggaa ctgagggagc aattgagttc agtatcttca 1260 tttgagaggt tcgaaatatt ccccaaagaa agctcatggc ccaaccacac cgtaaccgga 1320 gtgtcagcat catgctccca taatggggaa agcagttttt acagaaattt gctatggctg 1380 acggggaaga atggtttgta cccaaacctg agcaagtcct atgcaaacaa caaagaaaaa 1440 gaagtccttg tactatgggg tgttcatcac ccgccaaaca taggtgacca aaaggccctc 1500 tatcatacag aaaatgctta tgtctctgta gtgtcttcac attatagcag aaaattcacc 1560 ccagaaatag ccaaaagacc caaagtaaga gatcaagaag gaagaatcaa ttactactgg 1620 actctgcttg aacccgggga tacaataata tttgaggcaa atggaaatct aatagcgcca 1680 agatatgctt tcgcactgag tagaggcttt ggatcaggaa tcatcaactc aaatgcacca 1740 atggataaat gtgatgcgaa gtgccaaaca cctcagggag ctataaacag cagtcttcct 1800 ttccagaacg tacacccagt cacaatagga gagtgtccaa agtatgtcag gagtgcaaaa 1860 ttaaggatgg ttacaggact aaggaacatc ccatccattc aatccagagg tttgtttgga 1920 gccattgccg gtttcattga aggggggtgg actggaatgg tagatggttg gtatggttat 1980 catcatcaga atgagcaagg atctggctat gctgcagatc aaaaaagcac acaaaatgcc 2040 attaatggga ttacaaacaa ggtcaattct gtaattgaga aaatgaacac tcaattcaca 2100 gcagtgggca aagagttcaa caaattggaa agaaggatgg aaaacttgaa taaaaaagtt 2160 gatgatgggt ttatagacat ttggacatat aatgcagaac tgttggttct actggaaaat 2220 gaaaggactt tggatttcca tgactccaat gtgaagaatc tgtatgagaa agtaaaaagc 2280 cagttaaaga ataatgctaa agaaatagga aatgggtgtt ttgagttcta tcacaagtgt 2340 aacgatgaat gcatggagag tgtaaagaat ggaacttatg actatccaaa atattccgaa 2400 gaatcaaagt taaacaggga gaaaattgat ggagtgaaat tggaatcaat gggagtctat 2460 cagattctgg cgatctactc aacagtcgcc agttctctgg ttcttttggt ctccctgggg 2520 gcaatcagct tctggatgtg ttccaatggg tctttacagt gtagaatatg catctaaagg 2580 cctattttct ttagtttgaa tttactgtta ttcggtgtgc atttctatgt ttggtgagcg 2640 gttttctgtg ctcagagtgt gtttatttta tgtaatttaa tttctttgtg agctcctgtt 2700 tagcaggtcg tcccttcagc aaggacacaa aaagatttta attttattaa aaaaaaaaaa 2760 aaaaaagacc gggaattcga tatcaagctt atcgacctgc agatcgttca aacatttggc 2820 aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc atataatttc 2880 tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta tttatgagat 2940 gggtttttat gattagagtc ccgcaattat acatttaata cgcgatagaa aacaaaatat 3000 agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta gattctagag 3060 tctcaagctt cggcgcgcc 3079 <210> 106 <211> 48 <212> DNA <213> Artificial sequence <220> <223> ApaI-H3B.c <400> 106 ttgtcgggcc catgaagact atcattgctt tgagctacat tctatgtc 48 <210> 107 <211> 44 <212> DNA <213> Artificial sequence <220> <223> StuI-H3B.r <400> 107 aaaataggcc ttcaaatgca aatgttgcac ctaatgttgc cttt 44 <210> 108 <211> 3061 <212> DNA <213> Artificial sequence <220> <223> Construct number 735, from PacI <400> 108 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat gaagactatc attgctttga gctacattct atgtctggtt 900 ttcactcaaa aacttcccgg aaatgacaac agcacggcaa cgctgtgcct tgggcaccat 960 gcagtaccaa acggaacgat agtgaaaaca atcacgaatg accaaattga agttactaat 1020 gctactgagc tggttcagag ttcctcaaca ggtgaaatat gcgacagtcc tcatcagatc 1080 cttgatggag aaaactgcac actaatagat gctctattgg gagaccctca gtgtgatggc 1140 ttccaaaata agaaatggga cctttttgtt gaacgcagca aagcctacag caactgttac 1200 ccttatgatg tgccggatta tgcctccctt aggtcactag ttgcctcatc cggcacactg 1260 gagtttaaca atgaaagttt caattggact ggagtcactc aaaacggaac aagctctgct 1320 tgcataagga gatctaataa cagtttcttt agtagattga attggttgac ccacttaaaa 1380 ttcaaatacc cagcattgaa cgtgactatg ccaaacaatg aaaaatttga caaattgtac 1440 atttgggggg ttcaccaccc gggtacggac aatgaccaaa tcttcctgta tgctcaagca 1500 tcaggaagaa tcacagtctc taccaaaaga agccaacaaa ctgtaatccc gaatatcgga 1560 tctagaccca gagtaaggaa tatccccagc agaataagca tctattggac aatagtaaaa 1620 ccgggagaca tacttttgat taacagcaca gggaatctaa ttgctcctag gggttacttc 1680 aaaatacgaa gtgggaaaag ctcaataatg agatcagatg cacccattgg caaatgcaat 1740 tctgaatgca tcactccaaa cggaagcatt cccaatgaca aaccattcca aaatgtaaac 1800 aggatcacat acggggcctg tcccagatat gttaagcaaa acactctgaa attggcaaca 1860 gggatgcgaa atgtaccaga gaaacaaact agaggcatat ttggcgcaat cgcgggtttc 1920 atagaaaatg gttgggaggg aatggtggat ggttggtatg gtttcaggca tcaaaattct 1980 gagggaatag gacaagcagc agatctcaaa agcactcaag cagcaatcga tcaaatcaat 2040 gggaagctga ataggttgat cgggaaaacc aacgagaaat tccatcagat tgaaaaagag 2100 ttctcagaag tcgaagggag aatccaggac cttgagaaat atgttgagga caccaaaata 2160 gatctctggt catacaacgc ggagcttctt gttgccctgg agaaccaaca tacaattgat 2220 ctaactgact cagaaatgaa caaactgttt gaaaaaacaa agaagcaact gagggaaaat 2280 gctgaggata tgggcaatgg ttgtttcaaa atataccaca aatgtgacaa tgcctgcata 2340 ggatcaatca gaaatggaac ttatgaccac gatgtataca gagatgaagc attaaacaac 2400 cggttccaga tcaagggcgt tgagctgaag tcaggataca aagattggat actatggatt 2460 tcctttgcca tatcatgttt tttgctttgt gttgctttgt tggggttcat catgtgggcc 2520 tgccaaaaag gcaacattag gtgcaacatt tgcatttgaa ggcctatttt ctttagtttg 2580 aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg tgctcagagt 2640 gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt cgtcccttca 2700 gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga ccgggaattc 2760 gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt ttcttaagat 2820 tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc 2880 atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag 2940 tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata 3000 aattatcgcg cgcggtgtca tctatgttac tagattctag agtctcaagc ttcggcgcgc 3060 c 3061 <210> 109 <211> 3085 <212> DNA <213> Artificial sequence <220> <223> Construct number 736, from PacI <400> 109 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900 cttgtgttgg ttccttctca gatcttcgct caaaaacttc ccggaaatga caacagcacg 960 gcaacgctgt gccttgggca ccatgcagta ccaaacggaa cgatagtgaa aacaatcacg 1020 aatgaccaaa ttgaagttac taatgctact gagctggttc agagttcctc aacaggtgaa 1080 atatgcgaca gtcctcatca gatccttgat ggagaaaact gcacactaat agatgctcta 1140 ttgggagacc ctcagtgtga tggcttccaa aataagaaat gggacctttt tgttgaacgc 1200 agcaaagcct acagcaactg ttacccttat gatgtgccgg attatgcctc ccttaggtca 1260 ctagttgcct catccggcac actggagttt aacaatgaaa gtttcaattg gactggagtc 1320 actcaaaacg gaacaagctc tgcttgcata aggagatcta ataacagttt ctttagtaga 1380 ttgaattggt tgacccactt aaaattcaaa tacccagcat tgaacgtgac tatgccaaac 1440 aatgaaaaat ttgacaaatt gtacatttgg ggggttcacc acccgggtac ggacaatgac 1500 caaatcttcc tgtatgctca agcatcagga agaatcacag tctctaccaa aagaagccaa 1560 caaactgtaa tcccgaatat cggatctaga cccagagtaa ggaatatccc cagcagaata 1620 agcatctatt ggacaatagt aaaaccggga gacatacttt tgattaacag cacagggaat 1680 ctaattgctc ctaggggtta cttcaaaata cgaagtggga aaagctcaat aatgagatca 1740 gatgcaccca ttggcaaatg caattctgaa tgcatcactc caaacggaag cattcccaat 1800 gacaaaccat tccaaaatgt aaacaggatc acatacgggg cctgtcccag atatgttaag 1860 caaaacactc tgaaattggc aacagggatg cgaaatgtac cagagaaaca aactagaggc 1920 atatttggcg caatcgcggg tttcatagaa aatggttggg agggaatggt ggatggttgg 1980 tatggtttca ggcatcaaaa ttctgaggga ataggacaag cagcagatct caaaagcact 2040 caagcagcaa tcgatcaaat caatgggaag ctgaataggt tgatcgggaa aaccaacgag 2100 aaattccatc agattgaaaa agagttctca gaagtcgaag ggagaatcca ggaccttgag 2160 aaatatgttg aggacaccaa aatagatctc tggtcataca acgcggagct tcttgttgcc 2220 ctggagaacc aacatacaat tgatctaact gactcagaaa tgaacaaact gtttgaaaaa 2280 acaaagaagc aactgaggga aaatgctgag gatatgggca atggttgttt caaaatatac 2340 cacaaatgtg acaatgcctg cataggatca atcagaaatg gaacttatga ccacgatgta 2400 tacagagatg aagcattaaa caaccggttc cagatcaagg gcgttgagct gaagtcagga 2460 tacaaagatt ggatactatg gatttccttt gccatatcat gttttttgct ttgtgttgct 2520 ttgttggggt tcatcatgtg ggcctgccaa aaaggcaaca ttaggtgcaa catttgcatt 2580 tgaaggccta ttttctttag tttgaattta ctgttattcg gtgtgcattt ctatgtttgg 2640 tgagcggttt tctgtgctca gagtgtgttt attttatgta atttaatttc tttgtgagct 2700 cctgtttagc aggtcgtccc ttcagcaagg acacaaaaag attttaattt tattaaaaaa 2760 aaaaaaaaaa aagaccggga attcgatatc aagcttatcg acctgcagat cgttcaaaca 2820 tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat 2880 aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta 2940 tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca 3000 aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatt 3060 ctagagtctc aagcttcggc gcgcc 3085 <210> 110 <211> 46 <212> DNA <213> Artificial sequence <220> <223> ApI-HBF.c <400> 110 ttgtcgggcc catgaaggca ataattgtac tactcatggt agtaac 46 <210> 111 <211> 46 <212> DNA <213> Artificial sequence <220> <223> StuI-HBF.r <400> 111 aaaataggcc tttatagaca gatggagcat gaaacgttgt ctctgg 46 <210> 112 <211> 3115 <212> DNA <213> Artificial sequence <220> <223> Construct number 738, from PacI <400> 112 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat gaaggcaata attgtactac tcatggtagt aacatccaat 900 gcagatcgaa tctgcactgg aataacatct tcaaactcac ctcatgtggt caaaacagcc 960 actcaagggg aggtcaatgt gactggtgtg ataccactaa caacaacacc aacaaaatct 1020 tattttgcaa atctcaaagg aacaaggacc agagggaaac tatgcccaga ctgtctcaac 1080 tgcacagatc tggatgtggc tttgggcaga ccaatgtgtg tggggaccac accttcggcg 1140 aaggcttcaa tactccacga agtcaaacct gttacatccg ggtgctttcc tataatgcac 1200 gacagaacaa aaatcaggca actacccaat cttctcagag gatatgaaaa tatcaggcta 1260 tcaacccaaa acgtcatcga tgcggaaaag gcaccaggag gaccctacag acttggaacc 1320 tcaggatctt gccctaacgc taccagtaag agcggatttt tcgcaacaat ggcttgggct 1380 gtcccaaagg acaacaacaa aaatgcaacg aacccactaa cagtagaagt accatacatt 1440 tgtacagaag gggaagacca aatcactgtt tgggggttcc attcagataa caaaacccaa 1500 atgaagaacc tctatggaga ctcaaatcct caaaagttca cctcatctgc taatggagta 1560 accacacact atgtttctca gattggcagc ttcccagatc aaacagaaga cggaggacta 1620 ccacaaagcg gcaggattgt tgttgattac atgatgcaaa aacctgggaa aacaggaaca 1680 attgtctacc aaagaggtgt tttgttgcct caaaaggtgt ggtgcgcgag tggcaggagc 1740 aaagtaataa aagggtcctt gcctttaatt ggtgaagcag attgccttca tgaaaaatac 1800 ggtggattaa acaaaagcaa gccttactac acaggagaac atgcaaaagc cataggaaat 1860 tgcccaatat gggtgaaaac acctttgaag ctcgccaatg gaaccaaata tagacctcct 1920 gcaaaactat taaaggaaag gggtttcttc ggagctattg ctggtttcct agaaggagga 1980 tgggaaggaa tgattgcagg ctggcacgga tacacatctc acggagcaca tggagtggca 2040 gtggcggcgg accttaagag tacgcaagaa gctataaaca agataacaaa aaatctcaat 2100 tctttgagtg agctagaagt aaagaatctt caaagactaa gtggtgccat ggatgaactc 2160 cacaacgaaa tactcgagct ggatgagaaa gtggatgatc tcagagctga cactataagc 2220 tcgcaaatag aacttgcagt cttgctttcc aacgaaggaa taataaacag tgaagatgag 2280 catctattgg cacttgagag aaaactaaag aaaatgctgg gtccctctgc tgtagagata 2340 ggaaatggat gcttcgaaac caaacacaag tgcaaccaga cctgcttaga caggatagct 2400 gctggcacct ttaatgcagg agaattttct ctccccactt ttgattcact gaacattact 2460 gctgcatctt taaatgatga tggattggat aaccatacta tactgctcta ttactcaact 2520 gctgcttcta gtttggctgt aacattgatg ctagctattt ttattgttta tatggtctcc 2580 agagacaacg tttcatgctc catctgtcta taaaggccta ttttctttag tttgaattta 2640 ctgttattcg gtgtgcattt ctatgtttgg tgagcggttt tctgtgctca gagtgtgttt 2700 attttatgta atttaatttc tttgtgagct cctgtttagc aggtcgtccc ttcagcaagg 2760 acacaaaaag attttaattt tattaaaaaa aaaaaaaaaa aagaccggga attcgatatc 2820 aagcttatcg acctgcagat cgttcaaaca tttggcaata aagtttctta agattgaatc 2880 ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt aagcatgtaa 2940 taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt agagtcccgc 3000 aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag gataaattat 3060 cgcgcgcggt gtcatctatg ttactagatt ctagagtctc aagcttcggc gcgcc 3115 <210> 113 <211> 3142 <212> DNA <213> Artificial sequence <220> <223> Construct number 739, from PacI <400> 113 ttaattaaga attcgagctc caccgcggaa acctcctcgg attccattgc ccagctatct 60 gtcactttat tgagaagata gtggaaaagg aaggtggctc ctacaaatgc catcattgcg 120 ataaaggaaa ggccatcgtt gaagatgcct ctgccgacag tggtcccaaa gatggacccc 180 cacccacgag gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg 240 attgatgtga tatctccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag 300 acccttcctc tatataagga agttcatttc atttggagag gtattaaaat cttaataggt 360 tttgataaaa gcgaacgtgg ggaaacccga accaaacctt cttctaaact ctctctcatc 420 tctcttaaag caaacttctc tcttgtcttt cttgcgtgag cgatcttcaa cgttgtcaga 480 tcgtgcttcg gcaccagtac aacgttttct ttcactgaag cgaaatcaaa gatctctttg 540 tggacacgta gtgcggcgcc attaaataac gtgtacttgt cctattcttg tcggtgtggt 600 cttgggaaaa gaaagcttgc tggaggctgc tgttcagccc catacattac ttgttacgat 660 tctgctgact ttcggcgggt gcaatatctc tacttctgct tgacgaggta ttgttgcctg 720 tacttctttc ttcttcttct tgctgattgg ttctataaga aatctagtat tttctttgaa 780 acagagtttt cccgtggttt tcgaacttgg agaaagattg ttaagcttct gtatattctg 840 cccaaatttg tcgggcccat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt 900 cttgtgttgg ttccttctca gatcttcgct gatcgaatct gcactggaat aacatcttca 960 aactcacctc atgtggtcaa aacagccact caaggggagg tcaatgtgac tggtgtgata 1020 ccactaacaa caacaccaac aaaatcttat tttgcaaatc tcaaaggaac aaggaccaga 1080 gggaaactat gcccagactg tctcaactgc acagatctgg atgtggcttt gggcagacca 1140 atgtgtgtgg ggaccacacc ttcggcgaag gcttcaatac tccacgaagt caaacctgtt 1200 acatccgggt gctttcctat aatgcacgac agaacaaaaa tcaggcaact acccaatctt 1260 ctcagaggat atgaaaatat caggctatca acccaaaacg tcatcgatgc ggaaaaggca 1320 ccaggaggac cctacagact tggaacctca ggatcttgcc ctaacgctac cagtaagagc 1380 ggatttttcg caacaatggc ttgggctgtc ccaaaggaca acaacaaaaa tgcaacgaac 1440 ccactaacag tagaagtacc atacatttgt acagaagggg aagaccaaat cactgtttgg 1500 gggttccatt cagataacaa aacccaaatg aagaacctct atggagactc aaatcctcaa 1560 aagttcacct catctgctaa tggagtaacc acacactatg tttctcagat tggcagcttc 1620 ccagatcaaa cagaagacgg aggactacca caaagcggca ggattgttgt tgattacatg 1680 atgcaaaaac ctgggaaaac aggaacaatt gtctaccaaa gaggtgtttt gttgcctcaa 1740 aaggtgtggt gcgcgagtgg caggagcaaa gtaataaaag ggtccttgcc tttaattggt 1800 gaagcagatt gccttcatga aaaatacggt ggattaaaca aaagcaagcc ttactacaca 1860 ggagaacatg caaaagccat aggaaattgc ccaatatggg tgaaaacacc tttgaagctc 1920 gccaatggaa ccaaatatag acctcctgca aaactattaa aggaaagggg tttcttcgga 1980 gctattgctg gtttcctaga aggaggatgg gaaggaatga ttgcaggctg gcacggatac 2040 acatctcacg gagcacatgg agtggcagtg gcggcggacc ttaagagtac gcaagaagct 2100 ataaacaaga taacaaaaaa tctcaattct ttgagtgagc tagaagtaaa gaatcttcaa 2160 agactaagtg gtgccatgga tgaactccac aacgaaatac tcgagctgga tgagaaagtg 2220 gatgatctca gagctgacac tataagctcg caaatagaac ttgcagtctt gctttccaac 2280 gaaggaataa taaacagtga agatgagcat ctattggcac ttgagagaaa actaaagaaa 2340 atgctgggtc cctctgctgt agagatagga aatggatgct tcgaaaccaa acacaagtgc 2400 aaccagacct gcttagacag gatagctgct ggcaccttta atgcaggaga attttctctc 2460 cccacttttg attcactgaa cattactgct gcatctttaa atgatgatgg attggataac 2520 catactatac tgctctatta ctcaactgct gcttctagtt tggctgtaac attgatgcta 2580 gctattttta ttgtttatat ggtctccaga gacaacgttt catgctccat ctgtctataa 2640 aggcctattt tctttagttt gaatttactg ttattcggtg tgcatttcta tgtttggtga 2700 gcggttttct gtgctcagag tgtgtttatt ttatgtaatt taatttcttt gtgagctcct 2760 gtttagcagg tcgtcccttc agcaaggaca caaaaagatt ttaattttat taaaaaaaaa 2820 aaaaaaaaag accgggaatt cgatatcaag cttatcgacc tgcagatcgt tcaaacattt 2880 ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt atcatataat 2940 ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg ttatttatga 3000 gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata gaaaacaaaa 3060 tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta ctagattcta 3120 gagtctcaag cttcggcgcg cc 3142 <210> 114 <211> 1272 <212> DNA <213> Medicago sativa <400> 114 atgtttgggc gcggaccaac aaggaagagt gataacacca aatattacga tattcttggt 60 gtttcaaaaa gtgctagtga agatgaaatc aagaaagcct atagaaaggc agcgatgaag 120 aaccatccag ataagggtgg ggatcctgag aagttcaagg agttgggcca agcatatgaa 180 gtgttgagcg atcctgaaaa gaaagaactg tatgatcaat atggtgaaga tgcccttaaa 240 gaaggaatgg ggggaggcgc aggaagctca tttcataatc cgtttgatat tttcgaatca 300 ttttttggtg caggctttgg tggtggtggt ccttcacgcg caagaagaca gaagcaagga 360 gaagatgtgg tgcattctat aaaggtttcc ttggaggatg tgtataacgg cactacaaag 420 aagctatcac tttctaggaa tgcactgtgc tcaaaatgta aagggaaagg ttcaaaaagt 480 ggaactgctg gaaggtgttt tggatgccag ggcacaggta tgaagattac cagaaggcaa 540 attggactgg gcatgattca acaaatgcaa cacgtctgtc ctgactgcaa aggaacaggc 600 gaggtcatta gtgagagaga tagatgccct caatgcaagg gaaacaagat tactcaagaa 660 aagaaggtgc tggaggtgca tgtggaaaag gggatgcagc agggtcacaa gattgtattc 720 gaaggacaag ctgatgaagc tcctgataca atcacaggag acatagtttt tgtcttgcaa 780 gtaaagggac atccgaagtt tcggagggag cgtgatgacc tccacattga acacaatttg 840 agcttaactg aggctctctg tggcttccag tttaatgtca cacatcttga tggaaggcaa 900 ctattggtca aatcgaaccc cggcgaagtc atcaagccag gtcaacataa agctataaat 960 gatgagggaa tgccacaaca tggtaggccg ttcatgaagg gacgcctata catcaagttt 1020 agtgttgatt tcccggattc gggttttctt tccccaagcc aaagcctgga attagaaaag 1080 atattacctc aaaagacaag caagaacttg tcccaaaagg aggtagatga ttgtgaggag 1140 accaccctgc atgatgtcaa tattgcagag gagatgagtc gaaagaagca acaataccgt 1200 gaggcatatg atgacgatga tgatgaagat gatgagcact cgcagcctcg ggtgcaatgc 1260 gctcaacagt ag 1272 <210> 115 <211> 20 <212> DNA <213> Artificial sequence <220> <223> Hsp-40Luz.1c <400> 115 atgtttgggc gcggaccaac 20 <210> 116 <211> 31 <212> DNA <213> Artificial sequence <220> <223> Hsp40Luz-SacI.1272r <400> 116 agctgagctc ctactgttga gcgcattgca c 31 <210> 117 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Hsp40Luz-Plasto.r <400> 117 gttggtccgc gcccaaacat tttctctcaa gatgat 36 <210> 118 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Hsp70Ara.1c <400> 118 atgtcgggta aaggagaagg a 21 <210> 119 <211> 33 <212> DNA <213> Artificial sequence <220> <223> Hsp70Ara-SacI.1956r <400> 119 agctgagctc ttagtcgacc tcctcgatct tag 33 <210> 120 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Hsp70Ara-Plasto.r <400> 120 tccttctcct ttacccgaca ttttctctca agatgat 37 <210> 121 <211> 4402 <212> DNA <213> Artificial sequence <220> <223> Construct number R850, from HindIII <400> 121 aagcttgcat gcctgcaggt cgactctaga ggatccccgg gctggtctgt acattcatct 60 tgccgccttt gcattcactt ggccacaaag agtagagaga aggaagagaa gagcccagac 120 ttcaagaagc gaccttgcaa gtgcactcga gggtcagaaa ctgtatatca tatctatgtg 180 agagaaaggg gaacatttga gatggagtcc atttacttga ggtatactta ttattttgat 240 caataaattt gtatacttct tatttagatc aataaatttg tcattaagct ataatccaaa 300 ataaattacg atcaaatatg caaatgttag ccagtacttg tgttaaactt gatggcatct 360 cttggtttct ttggcaatca catgcctaag aaataaatag tatcatatga ttgtgtttgg 420 tcagacttca gagtcagatg actctgtttg gataaacagc ttaattaagc gcttatagaa 480 tatcatatga ttgtgtttgg tcagacttca gagcatctct tggtttctct ggcaatcata 540 tgcctaagaa ataaatagta tcatatgatt gtgtttggtc agacttcaga gtcagatgac 600 cctgtttggg taaacagctt aattaagtgc ttatagaata agcgcttatc atataagtgc 660 ttttgtacag ttatttctat gaaagtagaa gaaatagtca tattgtttta atataagcta 720 tcctggagag cttgtggaaa taaccagaaa agaacttatg gacacgtcat gagctgttta 780 cataagatct ccctaacagt ctcaaaagtg tttatgccag tagataaatt caaataagtc 840 aatctaaaca gaccctaaat ccattatggt acctatcatt ttagcttatt ccatctttat 900 taagaatgtc atgagataac ataatgataa cacattattt tgacacaaat gggcagatct 960 agcaatttaa ctctggagtc cttcaagact gctgttctta cgaagttcac gtccctgaat 1020 catgttcctg tatggaagcc tgaaagacct caaattctaa aaggtggcga taaattgaag 1080 gtttacaaaa tataccctgc gggcttgaca cagaggcaag ctctttatac cttccagttc 1140 aacggggatg ttgatttcag aagtcacttg gagagcaatc cttgtgccaa gtttgaagta 1200 atttttgtgt agcatatgtt gagctaccta caatttacat gatcacctag cattagctct 1260 ttcacttaac tgagagaatg aagttttagg aatgagtatg accatggagt cggcatggct 1320 ttgtaatgcc taccctactt tggccaactc atcggggatt tacattcaga aaatatacat 1380 gacttcaacc atacttaaac ccctttttgt aagataactg aatgttcata tttaatgttg 1440 ggttgtagtg tttttacttg attatatcca gacagttaca agttggacaa caagattgtg 1500 ggtctgtact gttatttatt tatttttttt ttagcagaaa caccttatct tttgtttcgt 1560 ttgaatgtag aatgaaaata aaagaaagaa aatataacat catcggccgc gcttgtctaa 1620 tttcgggcag ttaggatcct ctccggtcac cggaaagttt cagtagaaga aacaaaacac 1680 cgtgactaaa atgatactat tattttattt attgtgtttt tcttttttct accggaactt 1740 tttagaacgg atcccaactc gttccggggc cgctacaact gaaacaaaag aagatatttt 1800 ctctctcttc agaaatgtaa gttttccttt acagataccc attcaccatt tgattcagat 1860 gtggtgacta gagataaagc atactaattt gactcttgga aacccataaa gtttatgtta 1920 tccgtgttct ggaccaatcc acttgggggc ataacctgtg tctatgtgtg gtttggtttc 1980 cattctgatt tatgcggcga cttgtaattt aaaatctagg aggggcagac attgaacaat 2040 cccaatattt taataactta tgcaagattt tttttattaa tgagatgatg tgtttgtgac 2100 tgagattgag tcatacattt cactaagaaa tggttccaag taccaaacta tcatgaccca 2160 gttgcaaaca tgacgttcgg gagtggtcac tttgatagtt caatttcatc ttggcttctt 2220 attcctttta taattctaat tcttcttgtg taaactattt catgtattat ttttctttaa 2280 aatttacatg tcatttattt tgcctcacta actcaatttt gcatataaca atgataagtg 2340 atattttgac tcacaaaatt tacatcaaat ttcgacatcg tttattatgt tcattggatg 2400 attaacaaat ataacaaact ttgcaactaa ttaaccacca actgaatata attaactata 2460 actgtgaaag tagttaactc atttttatat ttcatagatc aaataagaga aataacggta 2520 tattaatccc tccaaaaaaa aaaaacggta tatttactaa aaaatctaag ccacgtagga 2580 ggataacagg atccccgtag gaggataaca tccaatccaa ccaatcacaa caatcctgat 2640 gagataaccc actttaagcc cacgcatctg tggcacatct acattatcta aatcacacat 2700 tcttccacac atctgagcca cacaaaaacc aatccacatc tttatcaccc attctataaa 2760 aaatcacact ttgtgagtct acactttgat tcccttcaaa cacatacaaa gagaagagac 2820 taattaatta attaatcatc ttgagagaaa atgtttgggc gcggaccaac aaggaagagt 2880 gataacacca aatattacga tattcttggt gtttcaaaaa gtgctagtga agatgaaatc 2940 aagaaagcct atagaaaggc agcgatgaag aaccatccag ataagggtgg ggatcctgag 3000 aagttcaagg agttgggcca agcatatgaa gtgttgagcg atcctgaaaa gaaagaactg 3060 tatgatcaat atggtgaaga tgcccttaaa gaaggaatgg ggggaggcgc aggaagctca 3120 tttcataatc cgtttgatat tttcgaatca ttttttggtg caggctttgg tggtggtggt 3180 ccttcacgcg caagaagaca gaagcaagga gaagatgtgg tgcattctat aaaggtttcc 3240 ttggaggatg tgtataacgg cactacaaag aagctatcac tttctaggaa tgcactgtgc 3300 tcaaaatgta aagggaaagg ttcaaaaagt ggaactgctg gaaggtgttt tggatgccag 3360 ggcacaggta tgaagattac cagaaggcaa attggactgg gcatgattca acaaatgcaa 3420 cacgtctgtc ctgactgcaa aggaacaggc gaggtcatta gtgagagaga tagatgccct 3480 caatgcaagg gaaacaagat tactcaagaa aagaaggtgc tggaggtgca tgtggaaaag 3540 gggatgcagc agggtcacaa gattgtattc gaaggacaag ctgatgaagc tcctgataca 3600 atcacaggag acatagtttt tgtcttgcaa gtaaagggac atccgaagtt tcggagggag 3660 cgtgatgacc tccacattga acacaatttg agcttaactg aggctctctg tggcttccag 3720 tttaatgtca cacatcttga tggaaggcaa ctattggtca aatcgaaccc cggcgaagtc 3780 atcaagccag gtcaacataa agctataaat gatgagggaa tgccacaaca tggtaggccg 3840 ttcatgaagg gacgcctata catcaagttt agtgttgatt tcccggattc gggttttctt 3900 tccccaagcc aaagcctgga attagaaaag atattacctc aaaagacaag caagaacttg 3960 tcccaaaagg aggtagatga ttgtgaggag accaccctgc atgatgtcaa tattgcagag 4020 gagatgagtc gaaagaagca acaataccgt gaggcatatg atgacgatga tgatgaagat 4080 gatgagcact cgcagcctcg ggtgcaatgc gctcaacagt aggagctcag ctcgaatttc 4140 cccgatcgtt caaacatttg gcaataaagt ttcttaagat tgaatcctgt tgccggtctt 4200 gcgatgatta tcatataatt tctgttgaat tacgttaagc atgtaataat taacatgtaa 4260 tgcatgacgt tatttatgag atgggttttt atgattagag tcccgcaatt atacatttaa 4320 tacgcgatag aaaacaaaat atagcgcgca aactaggata aattatcgcg cgcggtgtca 4380 tctatgttac tagatcgaat tc 4402 <210> 122 <211> 5086 <212> DNA <213> Artificial sequence <220> <223> Construct number R860, from HindIII <400> 122 aagcttgcat gcctgcaggt cgactctaga ggatccccgg gctggtctgt acattcatct 60 tgccgccttt gcattcactt ggccacaaag agtagagaga aggaagagaa gagcccagac 120 ttcaagaagc gaccttgcaa gtgcactcga gggtcagaaa ctgtatatca tatctatgtg 180 agagaaaggg gaacatttga gatggagtcc atttacttga ggtatactta ttattttgat 240 caataaattt gtatacttct tatttagatc aataaatttg tcattaagct ataatccaaa 300 ataaattacg atcaaatatg caaatgttag ccagtacttg tgttaaactt gatggcatct 360 cttggtttct ttggcaatca catgcctaag aaataaatag tatcatatga ttgtgtttgg 420 tcagacttca gagtcagatg actctgtttg gataaacagc ttaattaagc gcttatagaa 480 tatcatatga ttgtgtttgg tcagacttca gagcatctct tggtttctct ggcaatcata 540 tgcctaagaa ataaatagta tcatatgatt gtgtttggtc agacttcaga gtcagatgac 600 cctgtttggg taaacagctt aattaagtgc ttatagaata agcgcttatc atataagtgc 660 ttttgtacag ttatttctat gaaagtagaa gaaatagtca tattgtttta atataagcta 720 tcctggagag cttgtggaaa taaccagaaa agaacttatg gacacgtcat gagctgttta 780 cataagatct ccctaacagt ctcaaaagtg tttatgccag tagataaatt caaataagtc 840 aatctaaaca gaccctaaat ccattatggt acctatcatt ttagcttatt ccatctttat 900 taagaatgtc atgagataac ataatgataa cacattattt tgacacaaat gggcagatct 960 agcaatttaa ctctggagtc cttcaagact gctgttctta cgaagttcac gtccctgaat 1020 catgttcctg tatggaagcc tgaaagacct caaattctaa aaggtggcga taaattgaag 1080 gtttacaaaa tataccctgc gggcttgaca cagaggcaag ctctttatac cttccagttc 1140 aacggggatg ttgatttcag aagtcacttg gagagcaatc cttgtgccaa gtttgaagta 1200 atttttgtgt agcatatgtt gagctaccta caatttacat gatcacctag cattagctct 1260 ttcacttaac tgagagaatg aagttttagg aatgagtatg accatggagt cggcatggct 1320 ttgtaatgcc taccctactt tggccaactc atcggggatt tacattcaga aaatatacat 1380 gacttcaacc atacttaaac ccctttttgt aagataactg aatgttcata tttaatgttg 1440 ggttgtagtg tttttacttg attatatcca gacagttaca agttggacaa caagattgtg 1500 ggtctgtact gttatttatt tatttttttt ttagcagaaa caccttatct tttgtttcgt 1560 ttgaatgtag aatgaaaata aaagaaagaa aatataacat catcggccgc gcttgtctaa 1620 tttcgggcag ttaggatcct ctccggtcac cggaaagttt cagtagaaga aacaaaacac 1680 cgtgactaaa atgatactat tattttattt attgtgtttt tcttttttct accggaactt 1740 tttagaacgg atcccaactc gttccggggc cgctacaact gaaacaaaag aagatatttt 1800 ctctctcttc agaaatgtaa gttttccttt acagataccc attcaccatt tgattcagat 1860 gtggtgacta gagataaagc atactaattt gactcttgga aacccataaa gtttatgtta 1920 tccgtgttct ggaccaatcc acttgggggc ataacctgtg tctatgtgtg gtttggtttc 1980 cattctgatt tatgcggcga cttgtaattt aaaatctagg aggggcagac attgaacaat 2040 cccaatattt taataactta tgcaagattt tttttattaa tgagatgatg tgtttgtgac 2100 tgagattgag tcatacattt cactaagaaa tggttccaag taccaaacta tcatgaccca 2160 gttgcaaaca tgacgttcgg gagtggtcac tttgatagtt caatttcatc ttggcttctt 2220 attcctttta taattctaat tcttcttgtg taaactattt catgtattat ttttctttaa 2280 aatttacatg tcatttattt tgcctcacta actcaatttt gcatataaca atgataagtg 2340 atattttgac tcacaaaatt tacatcaaat ttcgacatcg tttattatgt tcattggatg 2400 attaacaaat ataacaaact ttgcaactaa ttaaccacca actgaatata attaactata 2460 actgtgaaag tagttaactc atttttatat ttcatagatc aaataagaga aataacggta 2520 tattaatccc tccaaaaaaa aaaaacggta tatttactaa aaaatctaag ccacgtagga 2580 ggataacagg atccccgtag gaggataaca tccaatccaa ccaatcacaa caatcctgat 2640 gagataaccc actttaagcc cacgcatctg tggcacatct acattatcta aatcacacat 2700 tcttccacac atctgagcca cacaaaaacc aatccacatc tttatcaccc attctataaa 2760 aaatcacact ttgtgagtct acactttgat tcccttcaaa cacatacaaa gagaagagac 2820 taattaatta attaatcatc ttgagagaaa atgtcgggta aaggagaagg accagctatc 2880 ggtatcgatc ttggtaccac ttactcttgc gtcggagtat ggcaacacga ccgtgttgag 2940 atcattgcta atgatcaagg aaacagaacc acgccatctt acgttgcttt caccgactcc 3000 gagaggttga tcggtgacgc agctaagaat caggtcgcca tgaaccccgt taacaccgtt 3060 ttcgacgcta agaggttgat cggtcgtcgt ttctctgaca gctctgttca gagtgacatg 3120 aaattgtggc cattcaagat tcaagccgga cctgccgata agccaatgat ctacgtcgaa 3180 tacaagggtg aagagaaaga gttcgcagct gaggagattt cttccatggt tcttattaag 3240 atgcgtgaga ttgctgaggc ttaccttggt gtcacaatca agaacgccgt tgttaccgtt 3300 ccagcttact tcaacgactc tcagcgtcag gctacaaagg atgctggtgt catcgctggt 3360 ttgaacgtta tgcgaatcat caacgagcct acagccgccg ctattgccta cggtcttgac 3420 aaaaaggcta ccagcgttgg agagaagaat gttcttatct tcgatcttgg tggtggcact 3480 tttgatgtct ctcttcttac cattgaagag ggtatctttg aggtgaaggc aactgctggt 3540 gacacccatc ttggtgggga agattttgac aacagaatgg ttaaccactt tgtccaagag 3600 ttcaagagga agagtaagaa ggatatcacc ggtaacccaa gagctcttag gaggttgaga 3660 acttcctgtg agagagcgaa gaggactctt tcttccactg ctcagaccac catcgagatt 3720 gactctctat acgagggtat cgacttctac tccaccatca cccgtgctag atttgaggag 3780 ctcaacatgg atctcttcag gaagtgtatg gagccagttg agaagtgtct tcgtgatgct 3840 aagatggaca agagcactgt tcatgatgtt gtccttgttg gtggttctac ccgtatccct 3900 aaggttcagc aattgctcca ggacttcttc aacggcaaag agctttgcaa gtctattaac 3960 cctgatgagg ctgttgccta cggtgctgct gtccagggag ctattctcag cggtgaagga 4020 aacgagaagg ttcaagatct tctattgctc gatgtcactc ctctctccct tggtttggaa 4080 actgccggtg gtgtcatgac cactttgatc ccaaggaaca caaccatccc aaccaagaag 4140 gaacaagtct tctccaccta ctcagacaac caacccggtg tgttgatcca ggtgtacgaa 4200 ggagagagag ccagaaccaa ggacaacaac cttcttggta aatttgagct ctccggaatt 4260 cctccagctc ctcgtggtgt cccccagatc acagtctgct ttgacattga tgccaatggt 4320 atcctcaatg tctctgctga ggacaagacc accggacaga agaacaagat caccatcacc 4380 aatgacaagg gtcgtctctc caaggatgag attgagaaga tggttcaaga ggctgagaag 4440 tacaagtccg aagacgagga gcacaagaag aaggttgaag ccaagaacgc tctcgagaac 4500 tacgcttaca acatgaggaa caccatccaa gacgagaaga ttggtgagaa gctcccggct 4560 gcagacaaga agaagatcga ggattctatt gagcaggcga ttcaatggct cgagggtaac 4620 cagttggctg aggctgatga gttcgaagac aagatgaagg aattggagag catctgcaac 4680 ccaatcattg ccaagatgta ccaaggagct ggtggtgaag ccggtggtcc aggtgcctct 4740 ggtatggacg atgatgctcc ccctgcttca ggcggtgctg gacctaagat cgaggaggtc 4800 gactaagagc tcagctcgaa tttccccgat cgttcaaaca tttggcaata aagtttctta 4860 agattgaatc ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt 4920 aagcatgtaa taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt 4980 agagtcccgc aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag 5040 gataaattat cgcgcgcggt gtcatctatg ttactagatc gaattc 5086 <210> 123 <211> 9493 <212> DNA <213> Artificial sequence <220> <223> Construct number R870, from HindIII <400> 123 aagcttgcat gcctgcaggt cgactctaga ggatccccgg gctggtctgt acattcatct 60 tgccgccttt gcattcactt ggccacaaag agtagagaga aggaagagaa gagcccagac 120 ttcaagaagc gaccttgcaa gtgcactcga gggtcagaaa ctgtatatca tatctatgtg 180 agagaaaggg gaacatttga gatggagtcc atttacttga ggtatactta ttattttgat 240 caataaattt gtatacttct tatttagatc aataaatttg tcattaagct ataatccaaa 300 ataaattacg atcaaatatg caaatgttag ccagtacttg tgttaaactt gatggcatct 360 cttggtttct ttggcaatca catgcctaag aaataaatag tatcatatga ttgtgtttgg 420 tcagacttca gagtcagatg actctgtttg gataaacagc ttaattaagc gcttatagaa 480 tatcatatga ttgtgtttgg tcagacttca gagcatctct tggtttctct ggcaatcata 540 tgcctaagaa ataaatagta tcatatgatt gtgtttggtc agacttcaga gtcagatgac 600 cctgtttggg taaacagctt aattaagtgc ttatagaata agcgcttatc atataagtgc 660 ttttgtacag ttatttctat gaaagtagaa gaaatagtca tattgtttta atataagcta 720 tcctggagag cttgtggaaa taaccagaaa agaacttatg gacacgtcat gagctgttta 780 cataagatct ccctaacagt ctcaaaagtg tttatgccag tagataaatt caaataagtc 840 aatctaaaca gaccctaaat ccattatggt acctatcatt ttagcttatt ccatctttat 900 taagaatgtc atgagataac ataatgataa cacattattt tgacacaaat gggcagatct 960 agcaatttaa ctctggagtc cttcaagact gctgttctta cgaagttcac gtccctgaat 1020 catgttcctg tatggaagcc tgaaagacct caaattctaa aaggtggcga taaattgaag 1080 gtttacaaaa tataccctgc gggcttgaca cagaggcaag ctctttatac cttccagttc 1140 aacggggatg ttgatttcag aagtcacttg gagagcaatc cttgtgccaa gtttgaagta 1200 atttttgtgt agcatatgtt gagctaccta caatttacat gatcacctag cattagctct 1260 ttcacttaac tgagagaatg aagttttagg aatgagtatg accatggagt cggcatggct 1320 ttgtaatgcc taccctactt tggccaactc atcggggatt tacattcaga aaatatacat 1380 gacttcaacc atacttaaac ccctttttgt aagataactg aatgttcata tttaatgttg 1440 ggttgtagtg tttttacttg attatatcca gacagttaca agttggacaa caagattgtg 1500 ggtctgtact gttatttatt tatttttttt ttagcagaaa caccttatct tttgtttcgt 1560 ttgaatgtag aatgaaaata aaagaaagaa aatataacat catcggccgc gcttgtctaa 1620 tttcgggcag ttaggatcct ctccggtcac cggaaagttt cagtagaaga aacaaaacac 1680 cgtgactaaa atgatactat tattttattt attgtgtttt tcttttttct accggaactt 1740 tttagaacgg atcccaactc gttccggggc cgctacaact gaaacaaaag aagatatttt 1800 ctctctcttc agaaatgtaa gttttccttt acagataccc attcaccatt tgattcagat 1860 gtggtgacta gagataaagc atactaattt gactcttgga aacccataaa gtttatgtta 1920 tccgtgttct ggaccaatcc acttgggggc ataacctgtg tctatgtgtg gtttggtttc 1980 cattctgatt tatgcggcga cttgtaattt aaaatctagg aggggcagac attgaacaat 2040 cccaatattt taataactta tgcaagattt tttttattaa tgagatgatg tgtttgtgac 2100 tgagattgag tcatacattt cactaagaaa tggttccaag taccaaacta tcatgaccca 2160 gttgcaaaca tgacgttcgg gagtggtcac tttgatagtt caatttcatc ttggcttctt 2220 attcctttta taattctaat tcttcttgtg taaactattt catgtattat ttttctttaa 2280 aatttacatg tcatttattt tgcctcacta actcaatttt gcatataaca atgataagtg 2340 atattttgac tcacaaaatt tacatcaaat ttcgacatcg tttattatgt tcattggatg 2400 attaacaaat ataacaaact ttgcaactaa ttaaccacca actgaatata attaactata 2460 actgtgaaag tagttaactc atttttatat ttcatagatc aaataagaga aataacggta 2520 tattaatccc tccaaaaaaa aaaaacggta tatttactaa aaaatctaag ccacgtagga 2580 ggataacagg atccccgtag gaggataaca tccaatccaa ccaatcacaa caatcctgat 2640 gagataaccc actttaagcc cacgcatctg tggcacatct acattatcta aatcacacat 2700 tcttccacac atctgagcca cacaaaaacc aatccacatc tttatcaccc attctataaa 2760 aaatcacact ttgtgagtct acactttgat tcccttcaaa cacatacaaa gagaagagac 2820 taattaatta attaatcatc ttgagagaaa atgtcgggta aaggagaagg accagctatc 2880 ggtatcgatc ttggtaccac ttactcttgc gtcggagtat ggcaacacga ccgtgttgag 2940 atcattgcta atgatcaagg aaacagaacc acgccatctt acgttgcttt caccgactcc 3000 gagaggttga tcggtgacgc agctaagaat caggtcgcca tgaaccccgt taacaccgtt 3060 ttcgacgcta agaggttgat cggtcgtcgt ttctctgaca gctctgttca gagtgacatg 3120 aaattgtggc cattcaagat tcaagccgga cctgccgata agccaatgat ctacgtcgaa 3180 tacaagggtg aagagaaaga gttcgcagct gaggagattt cttccatggt tcttattaag 3240 atgcgtgaga ttgctgaggc ttaccttggt gtcacaatca agaacgccgt tgttaccgtt 3300 ccagcttact tcaacgactc tcagcgtcag gctacaaagg atgctggtgt catcgctggt 3360 ttgaacgtta tgcgaatcat caacgagcct acagccgccg ctattgccta cggtcttgac 3420 aaaaaggcta ccagcgttgg agagaagaat gttcttatct tcgatcttgg tggtggcact 3480 tttgatgtct ctcttcttac cattgaagag ggtatctttg aggtgaaggc aactgctggt 3540 gacacccatc ttggtgggga agattttgac aacagaatgg ttaaccactt tgtccaagag 3600 ttcaagagga agagtaagaa ggatatcacc ggtaacccaa gagctcttag gaggttgaga 3660 acttcctgtg agagagcgaa gaggactctt tcttccactg ctcagaccac catcgagatt 3720 gactctctat acgagggtat cgacttctac tccaccatca cccgtgctag atttgaggag 3780 ctcaacatgg atctcttcag gaagtgtatg gagccagttg agaagtgtct tcgtgatgct 3840 aagatggaca agagcactgt tcatgatgtt gtccttgttg gtggttctac ccgtatccct 3900 aaggttcagc aattgctcca ggacttcttc aacggcaaag agctttgcaa gtctattaac 3960 cctgatgagg ctgttgccta cggtgctgct gtccagggag ctattctcag cggtgaagga 4020 aacgagaagg ttcaagatct tctattgctc gatgtcactc ctctctccct tggtttggaa 4080 actgccggtg gtgtcatgac cactttgatc ccaaggaaca caaccatccc aaccaagaag 4140 gaacaagtct tctccaccta ctcagacaac caacccggtg tgttgatcca ggtgtacgaa 4200 ggagagagag ccagaaccaa ggacaacaac cttcttggta aatttgagct ctccggaatt 4260 cctccagctc ctcgtggtgt cccccagatc acagtctgct ttgacattga tgccaatggt 4320 atcctcaatg tctctgctga ggacaagacc accggacaga agaacaagat caccatcacc 4380 aatgacaagg gtcgtctctc caaggatgag attgagaaga tggttcaaga ggctgagaag 4440 tacaagtccg aagacgagga gcacaagaag aaggttgaag ccaagaacgc tctcgagaac 4500 tacgcttaca acatgaggaa caccatccaa gacgagaaga ttggtgagaa gctcccggct 4560 gcagacaaga agaagatcga ggattctatt gagcaggcga ttcaatggct cgagggtaac 4620 cagttggctg aggctgatga gttcgaagac aagatgaagg aattggagag catctgcaac 4680 ccaatcattg ccaagatgta ccaaggagct ggtggtgaag ccggtggtcc aggtgcctct 4740 ggtatggacg atgatgctcc ccctgcttca ggcggtgctg gacctaagat cgaggaggtc 4800 gactaagagc tcagctcgaa tttccccgat cgttcaaaca tttggcaata aagtttctta 4860 agattgaatc ctgttgccgg tcttgcgatg attatcatat aatttctgtt gaattacgtt 4920 aagcatgtaa taattaacat gtaatgcatg acgttattta tgagatgggt ttttatgatt 4980 agagtcccgc aattatacat ttaatacgcg atagaaaaca aaatatagcg cgcaaactag 5040 gataaattat cgcgcgcggt gtcatctatg ttactagatc gaattcgtaa tcatggtcat 5100 agctgtttcc tgtgtgaaat tgttatccgg ggctggtctg tacattcatc ttgccgcctt 5160 tgcattcact tggccacaaa gagtagagag aaggaagaga agagcccaga cttcaagaag 5220 cgaccttgca agtgcactcg agggtcagaa actgtatatc atatctatgt gagagaaagg 5280 ggaacatttg agatggagtc catttacttg aggtatactt attattttga tcaataaatt 5340 tgtatacttc ttatttagat caataaattt gtcattaagc tataatccaa aataaattac 5400 gatcaaatat gcaaatgtta gccagtactt gtgttaaact tgatggcatc tcttggtttc 5460 tttggcaatc acatgcctaa gaaataaata gtatcatatg attgtgtttg gtcagacttc 5520 agagtcagat gactctgttt ggataaacag cttaattaag cgcttataga atatcatatg 5580 attgtgtttg gtcagacttc agagcatctc ttggtttctc tggcaatcat atgcctaaga 5640 aataaatagt atcatatgat tgtgtttggt cagacttcag agtcagatga ccctgtttgg 5700 gtaaacagct taattaagtg cttatagaat aagcgcttat catataagtg cttttgtaca 5760 gttatttcta tgaaagtaga agaaatagtc atattgtttt aatataagct atcctggaga 5820 gcttgtggaa ataaccagaa aagaacttat ggacacgtca tgagctgttt acataagatc 5880 tccctaacag tctcaaaagt gtttatgcca gtagataaat tcaaataagt caatctaaac 5940 agaccctaaa tccattatgg tacctatcat tttagcttat tccatcttta ttaagaatgt 6000 catgagataa cataatgata acacattatt ttgacacaaa tgggcagatc tagcaattta 6060 actctggagt ccttcaagac tgctgttctt acgaagttca cgtccctgaa tcatgttcct 6120 gtatggaagc ctgaaagacc tcaaattcta aaaggtggcg ataaattgaa ggtttacaaa 6180 atataccctg cgggcttgac acagaggcaa gctctttata ccttccagtt caacggggat 6240 gttgatttca gaagtcactt ggagagcaat ccttgtgcca agtttgaagt aatttttgtg 6300 tagcatatgt tgagctacct acaatttaca tgatcaccta gcattagctc tttcacttaa 6360 ctgagagaat gaagttttag gaatgagtat gaccatggag tcggcatggc tttgtaatgc 6420 ctaccctact ttggccaact catcggggat ttacattcag aaaatataca tgacttcaac 6480 catacttaaa cccctttttg taagataact gaatgttcat atttaatgtt gggttgtagt 6540 gtttttactt gattatatcc agacagttac aagttggaca acaagattgt gggtctgtac 6600 tgttatttat ttattttttt tttagcagaa acaccttatc ttttgtttcg tttgaatgta 6660 gaatgaaaat aaaagaaaga aaatataaca tcatcggccg cgcttgtcta atttcgggca 6720 gttaggatcc tctccggtca ccggaaagtt tcagtagaag aaacaaaaca ccgtgactaa 6780 aatgatacta ttattttatt tattgtgttt ttcttttttc taccggaact ttttagaacg 6840 gatcccaact cgttccgggg ccgctacaac tgaaacaaaa gaagatattt tctctctctt 6900 cagaaatgta agttttcctt tacagatacc cattcaccat ttgattcaga tgtggtgact 6960 agagataaag catactaatt tgactcttgg aaacccataa agtttatgtt atccgtgttc 7020 tggaccaatc cacttggggg cataacctgt gtctatgtgt ggtttggttt ccattctgat 7080 ttatgcggcg acttgtaatt taaaatctag gaggggcaga cattgaacaa tcccaatatt 7140 ttaataactt atgcaagatt ttttttatta atgagatgat gtgtttgtga ctgagattga 7200 gtcatacatt tcactaagaa atggttccaa gtaccaaact atcatgaccc agttgcaaac 7260 atgacgttcg ggagtggtca ctttgatagt tcaatttcat cttggcttct tattcctttt 7320 ataattctaa ttcttcttgt gtaaactatt tcatgtatta tttttcttta aaatttacat 7380 gtcatttatt ttgcctcact aactcaattt tgcatataac aatgataagt gatattttga 7440 ctcacaaaat ttacatcaaa tttcgacatc gtttattatg ttcattggat gattaacaaa 7500 tataacaaac tttgcaacta attaaccacc aactgaatat aattaactat aactgtgaaa 7560 gtagttaact catttttata tttcatagat caaataagag aaataacggt atattaatcc 7620 ctccaaaaaa aaaaaacggt atatttacta aaaaatctaa gccacgtagg aggataacag 7680 gatccccgta ggaggataac atccaatcca accaatcaca acaatcctga tgagataacc 7740 cactttaagc ccacgcatct gtggcacatc tacattatct aaatcacaca ttcttccaca 7800 catctgagcc acacaaaaac caatccacat ctttatcacc cattctataa aaaatcacac 7860 tttgtgagtc tacactttga ttcccttcaa acacatacaa agagaagaga ctaattaatt 7920 aattaatcat cttgagagaa aatgtttggg cgcggaccaa caaggaagag tgataacacc 7980 aaatattacg atattcttgg tgtttcaaaa agtgctagtg aagatgaaat caagaaagcc 8040 tatagaaagg cagcgatgaa gaaccatcca gataagggtg gggatcctga gaagttcaag 8100 gagttgggcc aagcatatga agtgttgagc gatcctgaaa agaaagaact gtatgatcaa 8160 tatggtgaag atgcccttaa agaaggaatg gggggaggcg caggaagctc atttcataat 8220 ccgtttgata ttttcgaatc attttttggt gcaggctttg gtggtggtgg tccttcacgc 8280 gcaagaagac agaagcaagg agaagatgtg gtgcattcta taaaggtttc cttggaggat 8340 gtgtataacg gcactacaaa gaagctatca ctttctagga atgcactgtg ctcaaaatgt 8400 aaagggaaag gttcaaaaag tggaactgct ggaaggtgtt ttggatgcca gggcacaggt 8460 atgaagatta ccagaaggca aattggactg ggcatgattc aacaaatgca acacgtctgt 8520 cctgactgca aaggaacagg cgaggtcatt agtgagagag atagatgccc tcaatgcaag 8580 ggaaacaaga ttactcaaga aaagaaggtg ctggaggtgc atgtggaaaa ggggatgcag 8640 cagggtcaca agattgtatt cgaaggacaa gctgatgaag ctcctgatac aatcacagga 8700 gacatagttt ttgtcttgca agtaaaggga catccgaagt ttcggaggga gcgtgatgac 8760 ctccacattg aacacaattt gagcttaact gaggctctct gtggcttcca gtttaatgtc 8820 acacatcttg atggaaggca actattggtc aaatcgaacc ccggcgaagt catcaagcca 8880 ggtcaacata aagctataaa tgatgaggga atgccacaac atggtaggcc gttcatgaag 8940 ggacgcctat acatcaagtt tagtgttgat ttcccggatt cgggttttct ttccccaagc 9000 caaagcctgg aattagaaaa gatattacct caaaagacaa gcaagaactt gtcccaaaag 9060 gaggtagatg attgtgagga gaccaccctg catgatgtca atattgcaga ggagatgagt 9120 cgaaagaagc aacaataccg tgaggcatat gatgacgatg atgatgaaga tgatgagcac 9180 tcgcagcctc gggtgcaatg cgctcaacag taggagctca gctcgaattt ccccgatcgt 9240 tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt 9300 atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg 9360 ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata 9420 gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta 9480 ctagatcgaa ttc 9493 <210> 124 <211> 34 <212> DNA <213> Artificial sequence <220> <223> supP19-plasto.r <400> 124 ccttgtatag ctcgttccat tttctctcaa gatg 34 <210> 125 <211> 20 <212> DNA <213> Artificial sequence <220> <223> supP19-1c <400> 125 atggaacgag ctatacaagg 20 <210> 126 <211> 32 <212> DNA <213> Artificial sequence <220> <223> SupP19-SacI.r <400> 126 agtcgagctc ttactcgctt tctttttcga ag 32 <210> 127 <211> 3462 <212> DNA <213> Artificial <220> <223> A/California/04/09 (cassette number 560) <400> 127 gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60 gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120 ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180 tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240 ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300 acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360 tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420 agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480 aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540 atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600 atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660 tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720 taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780 acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840 cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900 cagtacaacg ttttctttca ctgaagcgaa atcaaagatc tctttgtgga cacgtagtgc 960 ggcgccatta aataacgtgt acttgtccta ttcttgtcgg tgtggtcttg ggaaaagaaa 1020 gcttgctgga ggctgctgtt cagccccata cattacttgt tacgattctg ctgactttcg 1080 gcgggtgcaa tatctctact tctgcttgac gaggtattgt tgcctgtact tctttcttct 1140 tcttcttgct gattggttct ataagaaatc tagtattttc tttgaaacag agttttcccg 1200 tggttttcga acttggagaa agattgttaa gcttctgtat attctgccca aatttgtcgg 1260 gcccatggcg aaaaacgttg cgattttcgg cttattgttt tctcttcttg tgttggttcc 1320 ttctcagatc ttcgctgaca cattatgtat aggttatcat gcgaacaatt caacagacac 1380 tgtagacaca gtactagaaa agaatgtaac agtaacacac tctgttaacc ttctagaaga 1440 caagcataac gggaaactat gcaaactaag aggggtagcc ccattgcatt tgggtaaatg 1500 taacattgct ggctggatcc tgggaaatcc agagtgtgaa tcactctcca cagcaagctc 1560 atggtcctac attgtggaaa cacctagttc agacaatgga acgtgttacc caggagattt 1620 catcgattat gaggagctaa gagagcaatt aagctcagtg tcatcatttg aaaggtttga 1680 gatattcccc aagacaagtt catggcccaa tcatgactcg aacaaaggtg taacggcagc 1740 atgtcctcat gctggagcaa aaagcttcta caaaaattta atatggctag ttaaaaaagg 1800 aaattcatac ccaaagctca gcaaatccta cattaatgat aaagggaaag aagtcctcgt 1860 gctatggggc attcaccatc catctactag tgctgaccaa caaagtctct atcagaatgc 1920 agatacatat gtttttgtgg ggtcatcaag atacagcaag aagttcaagc cggaaatagc 1980 aataagaccc aaagtgaggg atcaagaagg gagaatgaac tattactgga cactagtaga 2040 gccgggagac aaaataacat tcgaagcaac tggaaatcta gtggtaccga gatatgcatt 2100 cgcaatggaa agaaatgctg gatctggtat tatcatttca gatacaccag tccacgattg 2160 caatacaact tgtcaaacac ccaagggtgc tataaacacc agcctcccat ttcagaatat 2220 acatccgatc acaattggaa aatgtccaaa atatgtaaaa agcacaaaat tgagactggc 2280 cacaggattg aggaatatcc cgtctattca atctagagga ctatttgggg ccattgccgg 2340 tttcattgaa ggggggtgga cagggatggt agatggatgg tacggttatc accatcaaaa 2400 tgagcagggg tcaggatatg cagccgacct gaagagcaca cagaatgcca ttgacgagat 2460 tactaacaaa gtaaattctg ttattgaaaa gatgaataca cagttcacag cagtaggtaa 2520 agagttcaac cacctggaaa aaagaataga gaatttaaat aaaaaagttg atgatggttt 2580 cctggacatt tggacttaca atgccgaact gttggttcta ttggaaaatg aaagaacttt 2640 ggactaccac gattcaaatg tgaagaactt atatgaaaag gtaagaagcc agctaaaaaa 2700 caatgccaag gaaattggaa acggctgctt tgaattttac cacaaatgcg ataacacgtg 2760 catggaaagt gtcaaaaatg ggacttatga ctacccaaaa tactcagagg aagcaaaatt 2820 aaacagagaa gaaatagatg gggtaaagct ggaatcaaca aggatttacc agattttggc 2880 gatctattca actgtcgcca gttcattggt actggtagtc tccctggggg caatcagttt 2940 ctggatgtgc tctaatgggt ctctacagtg tagaatatgt atttaaaggc ctattttctt 3000 tagtttgaat ttactgttat tcggtgtgca tttctatgtt tggtgagcgg ttttctgtgc 3060 tcagagtgtg tttattttat gtaatttaat ttctttgtga gctcctgttt agcaggtcgt 3120 cccttcagca aggacacaaa aagattttaa ttttattaaa aaaaaaaaaa aaaaagaccg 3180 ggaattcgat atcaagctta tcgacctgca gatcgttcaa acatttggca ataaagtttc 3240 ttaagattga atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac 3300 gttaagcatg taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg 3360 attagagtcc cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac 3420 taggataaat tatcgcgcgc ggtgtcatct atgttactag at 3462 <210> 128 <211> 573 <212> PRT <213> Artificial sequence <220> <223> A/California/04/09 <400> 128 Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val 1 5 10 15 Leu Val Pro Ser Gln Ile Phe Ala Asp Thr Leu Cys Ile Gly Tyr His 20 25 30 Ala Asn Asn Ser Thr Asp Thr Val Asp Thr Val Leu Glu Lys Asn Val 35 40 45 Thr Val Thr His Ser Val Asn Leu Leu Glu Asp Lys His Asn Gly Lys 50 55 60 Leu Cys Lys Leu Arg Gly Val Ala Pro Leu His Leu Gly Lys Cys Asn 65 70 75 80 Ile Ala Gly Trp Ile Leu Gly Asn Pro Glu Cys Glu Ser Leu Ser Thr 85 90 95 Ala Ser Ser Trp Ser Tyr Ile Val Glu Thr Pro Ser Ser Asp Asn Gly 100 105 110 Thr Cys Tyr Pro Gly Asp Phe Ile Asp Tyr Glu Glu Leu Arg Glu Gln 115 120 125 Leu Ser Ser Val Ser Ser Phe Glu Arg Phe Glu Ile Phe Pro Lys Thr 130 135 140 Ser Ser Trp Pro Asn His Asp Ser Asn Lys Gly Val Thr Ala Ala Cys 145 150 155 160 Pro His Ala Gly Ala Lys Ser Phe Tyr Lys Asn Leu Ile Trp Leu Val 165 170 175 Lys Lys Gly Asn Ser Tyr Pro Lys Leu Ser Lys Ser Tyr Ile Asn Asp 180 185 190 Lys Gly Lys Glu Val Leu Val Leu Trp Gly Ile His His Pro Ser Thr 195 200 205 Ser Ala Asp Gln Gln Ser Leu Tyr Gln Asn Ala Asp Thr Tyr Val Phe 210 215 220 Val Gly Ser Ser Arg Tyr Ser Lys Lys Phe Lys Pro Glu Ile Ala Ile 225 230 235 240 Arg Pro Lys Val Arg Asp Gln Glu Gly Arg Met Asn Tyr Tyr Trp Thr 245 250 255 Leu Val Glu Pro Gly Asp Lys Ile Thr Phe Glu Ala Thr Gly Asn Leu 260 265 270 Val Val Pro Arg Tyr Ala Phe Ala Met Glu Arg Asn Ala Gly Ser Gly 275 280 285 Ile Ile Ile Ser Asp Thr Pro Val His Asp Cys Asn Thr Thr Cys Gln 290 295 300 Thr Pro Lys Gly Ala Ile Asn Thr Ser Leu Pro Phe Gln Asn Ile His 305 310 315 320 Pro Ile Thr Ile Gly Lys Cys Pro Lys Tyr Val Lys Ser Thr Lys Leu 325 330 335 Arg Leu Ala Thr Gly Leu Arg Asn Ile Pro Ser Ile Gln Ser Arg Gly 340 345 350 Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Thr Gly Met 355 360 365 Val Asp Gly Trp Tyr Gly Tyr His His Gln Asn Glu Gln Gly Ser Gly 370 375 380 Tyr Ala Ala Asp Leu Lys Ser Thr Gln Asn Ala Ile Asp Glu Ile Thr 385 390 395 400 Asn Lys Val Asn Ser Val Ile Glu Lys Met Asn Thr Gln Phe Thr Ala 405 410 415 Val Gly Lys Glu Phe Asn His Leu Glu Lys Arg Ile Glu Asn Leu Asn 420 425 430 Lys Lys Val Asp Asp Gly Phe Leu Asp Ile Trp Thr Tyr Asn Ala Glu 435 440 445 Leu Leu Val Leu Leu Glu Asn Glu Arg Thr Leu Asp Tyr His Asp Ser 450 455 460 Asn Val Lys Asn Leu Tyr Glu Lys Val Arg Ser Gln Leu Lys Asn Asn 465 470 475 480 Ala Lys Glu Ile Gly Asn Gly Cys Phe Glu Phe Tyr His Lys Cys Asp 485 490 495 Asn Thr Cys Met Glu Ser Val Lys Asn Gly Thr Tyr Asp Tyr Pro Lys 500 505 510 Tyr Ser Glu Glu Ala Lys Leu Asn Arg Glu Glu Ile Asp Gly Val Lys 515 520 525 Leu Glu Ser Thr Arg Ile Tyr Gln Ile Leu Ala Ile Tyr Ser Thr Val 530 535 540 Ala Ser Ser Leu Val Leu Val Val Ser Leu Gly Ala Ile Ser Phe Trp 545 550 555 560 Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile 565 570 <210> 129 <211> 747 <212> DNA <213> Artificial sequence <220> <223> 2X35S promoter <400> 129 gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60 gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120 ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180 tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240 ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300 acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360 tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420 agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480 aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540 atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600 atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660 tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720 taaggaagtt catttcattt ggagagg 747 <210> 130 <211> 43 <212> DNA <213> Artificial sequence <220> <223> primer PacI-MCS-2X35S.c <400> 130 aattgttaat taagtcgaca agcttgcatg cctgcaggtc aac 43 <210> 131 <211> 48 <212> DNA <213> Artificial sequence <220> <223> primer CPMV 5'UTR-2X35S.r <400> 131 tcaaaaccta ttaagatttt aatacctctc caaatgaaat gaacttcc 48 <210> 132 <211> 49 <212> DNA <213> Artificial sequence <220> <223> primer 2X35S-CPMV 5'UTR.c <400> 132 ttggagaggt attaaaatct taataggttt tgataaaagc gaacgtggg 49 <210> 133 <211> 44 <212> DNA <213> Artificial sequence <220> <223> primer ApaI-M prot.r <400> 133 tctccatggg cccgacaaat ttgggcagaa tatacagaag ctta 44 <210> 134 <211> 3505 <212> DNA <213> Artificial sequence <220> <223> expression cassette number 972 <400> 134 ttaattaagt cgacaagctt gcatgcctgc aggtcaacat ggtggagcac gacacacttg 60 tctactccaa aaatatcaaa gatacagtct cagaagacca aagggcaatt gagacttttc 120 aacaaagggt aatatccgga aacctcctcg gattccattg cccagctatc tgtcacttta 180 ttgtgaagat agtggaaaag gaaggtggct cctacaaatg ccatcattgc gataaaggaa 240 aggccatcgt tgaagatgcc tctgccgaca gtggtcccaa agatggaccc ccacccacga 300 ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc aaagcaagtg gattgatgtg 360 ataacatggt ggagcacgac acacttgtct actccaaaaa tatcaaagat acagtctcag 420 aagaccaaag ggcaattgag acttttcaac aaagggtaat atccggaaac ctcctcggat 480 tccattgccc agctatctgt cactttattg tgaagatagt ggaaaaggaa ggtggctcct 540 acaaatgcca tcattgcgat aaaggaaagg ccatcgttga agatgcctct gccgacagtg 600 gtcccaaaga tggaccccca cccacgagga gcatcgtgga aaaagaagac gttccaacca 660 cgtcttcaaa gcaagtggat tgatgtgata tctccactga cgtaagggat gacgcacaat 720 cccactatcc ttcgcaagac ccttcctcta tataaggaag ttcatttcat ttggagaggt 780 attaaaatct taataggttt tgataaaagc gaacgtgggg aaacccgaac caaaccttct 840 tctaaactct ctctcatctc tcttaaagca aacttctctc ttgtctttct tgcgtgagcg 900 atcttcaacg ttgtcagatc gtgcttcggc accagtacaa cgttttcttt cactgaagcg 960 aaatcaaaga tctctttgtg gacacgtagt gcggcgccat taaataacgt gtacttgtcc 1020 tattcttgtc ggtgtggtct tgggaaaaga aagcttgctg gaggctgctg ttcagcccca 1080 tacattactt gttacgattc tgctgacttt cggcgggtgc aatatctcta cttctgcttg 1140 acgaggtatt gttgcctgta cttctttctt cttcttcttg ctgattggtt ctataagaaa 1200 tctagtattt tctttgaaac agagttttcc cgtggttttc gaacttggag aaagattgtt 1260 aagcttctgt atattctgcc caaatttgtc gggcccatgg agaaaatagt gcttcttctt 1320 gcaatagtca gtcttgttaa aagtgatcag atttgcattg gttaccatgc aaacaattca 1380 acagagcagg ttgacacaat catggaaaag aacgttactg ttacacatgc ccaagacata 1440 ctggaaaaga cacacaacgg gaagctctgc gatctagatg gagtgaagcc tctaatttta 1500 agagattgta gtgtagctgg atggctcctc gggaacccaa tgtgtgacga attcatcaat 1560 gtaccggaat ggtcttacat agtggagaag gccaatccaa ccaatgacct ctgttaccca 1620 gggagtttca acgactatga agaactgaaa cacctattga gcagaataaa ccattttgag 1680 aaaattcaaa tcatccccaa aagttcttgg tccgatcatg aagcctcatc aggagttagc 1740 tcagcatgtc catacctggg aagtccctcc ttttttagaa atgtggtatg gcttatcaaa 1800 aagaacagta catacccaac aataaagaaa agctacaata ataccaacca agaggatctt 1860 ttggtactgt ggggaattca ccatcctaat gatgcggcag agcagacaag gctatatcaa 1920 aacccaacca cctatatttc cattgggaca tcaacactaa accagagatt ggtaccaaaa 1980 atagctacta gatccaaagt aaacgggcaa agtggaagga tggagttctt ctggacaatt 2040 ttaaaaccta atgatgcaat caacttcgag agtaatggaa atttcattgc tccagaatat 2100 gcatacaaaa ttgtcaagaa aggggactca gcaattatga aaagtgaatt ggaatatggt 2160 aactgcaaca ccaagtgtca aactccaatg ggggcgataa actctagtat gccattccac 2220 aacatacacc ctctcaccat cggggaatgc cccaaatatg tgaaatcaaa cagattagtc 2280 cttgcaacag ggctcagaaa tagccctcaa agagagagca gaagaaaaaa gagaggacta 2340 tttggagcta tagcaggttt tatagaggga ggatggcagg gaatggtaga tggttggtat 2400 gggtaccacc atagcaatga gcaggggagt gggtacgctg cagacaaaga atccactcaa 2460 aaggcaatag atggagtcac caataaggtc aactcaatca ttgacaaaat gaacactcag 2520 tttgaggccg ttggaaggga atttaataac ttagaaagga gaatagagaa tttaaacaag 2580 aagatggaag acgggtttct agatgtctgg acttataatg ccgaacttct ggttctcatg 2640 gaaaatgaga gaactctaga ctttcatgac tcaaatgtta agaacctcta cgacaaggtc 2700 cgactacagc ttagggataa tgcaaaggag ctgggtaacg gttgtttcga gttctatcac 2760 aaatgtgata atgaatgtat ggaaagtata agaaacggaa cgtacaacta tccgcagtat 2820 tcagaagaag caagattaaa aagagaggaa ataagtgggg taaaattgga atcaatagga 2880 acttaccaaa tactgtcaat ttattcaaca gtggcgagtt ccctagcact ggcaatcatg 2940 atggctggtc tatctttatg gatgtgctcc aatggatcgt tacaatgcag aatttgcatt 3000 taaaggccta ttttctttag tttgaattta ctgttattcg gtgtgcattt ctatgtttgg 3060 tgagcggttt tctgtgctca gagtgtgttt attttatgta atttaatttc tttgtgagct 3120 cctgtttagc aggtcgtccc ttcagcaagg acacaaaaag attttaattt tattaaaaaa 3180 aaaaaaaaaa aagaccggga attcgatatc aagcttatcg acctgcagat cgttcaaaca 3240 tttggcaata aagtttctta agattgaatc ctgttgccgg tcttgcgatg attatcatat 3300 aatttctgtt gaattacgtt aagcatgtaa taattaacat gtaatgcatg acgttattta 3360 tgagatgggt ttttatgatt agagtcccgc aattatacat ttaatacgcg atagaaaaca 3420 aaatatagcg cgcaaactag gataaattat cgcgcgcggt gtcatctatg ttactagatt 3480 ctagagtctc aagcttcggc gcgcc 3505 <210> 135 <211> 1701 <212> DNA <213> Influenza virus <400> 135 atgaaggcaa tactagtagt tctgctatat acatttgcaa ccgcaaatgc agacacatta 60 tgtataggtt atcatgcgaa caattcaaca gacactgtag acacagtact agaaaagaat 120 gtaacagtaa cacactctgt taaccttcta gaagacaagc ataacgggaa actatgcaaa 180 ctaagagggg tagccccatt gcatttgggt aaatgtaaca ttgctggctg gatcctggga 240 aatccagagt gtgaatcact ctccacagca agctcatggt cctacattgt ggaaacacct 300 agttcagaca atggaacgtg ttacccagga gatttcatcg attatgagga gctaagagag 360 caattgagct cagtgtcatc atttgaaagg tttgagatat tccccaagac aagttcatgg 420 cccaatcatg actcgaacaa aggtgtaacg gcagcatgtc ctcatgctgg agcaaaaagc 480 ttctacaaaa atttaatatg gctagttaaa aaaggaaatt catacccaaa gctcagcaaa 540 tcctacatta atgataaagg gaaagaagtc ctcgtgctat ggggcattca ccatccatct 600 actagtgctg accaacaaag tctctatcag aatgcagata catatgtttt tgtggggtca 660 tcaagataca gcaagaagtt caagccggaa atagcaataa gacccaaagt gagggatcaa 720 gaagggagaa tgaactatta ctggacacta gtagagccgg gagacaaaat aacattcgaa 780 gcaactggaa atctagtggt accgagatat gcattcgcaa tggaaagaaa tgctggatct 840 ggtattatca tttcagatac accagtccac gattgcaata caacttgtca aacacccaag 900 ggtgctataa acaccagcct cccatttcag aatatacatc cgatcacaat tggaaaatgt 960 ccaaaatatg taaaaagcac aaaattgaga ctggccacag gattgaggaa tatcccgtct 1020 attcaatcta gaggcctatt tggggccatt gccggtttca ttgaaggggg gtggacaggg 1080 atggtagatg gatggtacgg ttatcaccat caaaatgagc aggggtcagg atatgcagcc 1140 gacctgaaga gcacacagaa tgccattgac gagattacta acaaagtaaa ttctgttatt 1200 gaaaagatga atacacagtt cacagcagta ggtaaagagt tcaaccacct ggaaaaaaga 1260 atagagaatt taaataaaaa agttgatgat ggtttcctgg acatttggac ttacaatgcc 1320 gaactgttgg ttctattgga aaatgaaaga actttggact accacgattc aaatgtgaag 1380 aacttatatg aaaaggtaag aagccagcta aaaaacaatg ccaaggaaat tggaaacggc 1440 tgctttgaat tttaccacaa atgcgataac acgtgcatgg aaagtgtcaa aaatgggact 1500 tatgactacc caaaatactc agaggaagca aaattaaaca gagaagaaat agatggggta 1560 aagctggaat caacaaggat ttaccagatt ttggcgatct attcaactgt cgccagttca 1620 ttggtactgg tagtctccct gggggcaatc agtttctgga tgtgctctaa tgggtctcta 1680 cagtgtagaa tatgtattta a 1701 <210> 136 <211> 2056 <212> DNA <213> Artificial sequence <220> <223> to be synthesized containing H1 A/California/4/2009 <400> 136 atgctaatat cacgtagtgc ggcgccatta aataacgtgt acttgtccta ttcttgtcgg 60 tgtggtcttg ggaaaagaaa gcttgctgga ggctgctgtt cagccccata cattacttgt 120 tacgattctg ctgactttcg gcgggtgcaa tatctctact tctgcttgac gaggtattgt 180 tgcctgtact tctttcttct tcttcttgct gattggttct ataagaaatc tagtattttc 240 tttgaaacag agttttcccg tggttttcga acttggagaa agattgttaa gcttctgtat 300 attctgccca aatttgtcgg gcccatggcg aaaaacgttg cgattttcgg cttattgttt 360 tctcttcttg tgttggttcc ttctcagatc ttcgctgaca cattatgtat aggttatcat 420 gcgaacaatt caacagacac tgtagacaca gtactagaaa agaatgtaac agtaacacac 480 tctgttaacc ttctagaaga caagcataac gggaaactat gcaaactaag aggggtagcc 540 ccattgcatt tgggtaaatg taacattgct ggctggatcc tgggaaatcc agagtgtgaa 600 tcactctcca cagcaagctc atggtcctac attgtggaaa cacctagttc agacaatgga 660 acgtgttacc caggagattt catcgattat gaggagctaa gagagcaatt aagctcagtg 720 tcatcatttg aaaggtttga gatattcccc aagacaagtt catggcccaa tcatgactcg 780 aacaaaggtg taacggcagc atgtcctcat gctggagcaa aaagcttcta caaaaattta 840 atatggctag ttaaaaaagg aaattcatac ccaaagctca gcaaatccta cattaatgat 900 aaagggaaag aagtcctcgt gctatggggc attcaccatc catctactag tgctgaccaa 960 caaagtctct atcagaatgc agatacatat gtttttgtgg ggtcatcaag atacagcaag 1020 aagttcaagc cggaaatagc aataagaccc aaagtgaggg atcaagaagg gagaatgaac 1080 tattactgga cactagtaga gccgggagac aaaataacat tcgaagcaac tggaaatcta 1140 gtggtaccga gatatgcatt cgcaatggaa agaaatgctg gatctggtat tatcatttca 1200 gatacaccag tccacgattg caatacaact tgtcaaacac ccaagggtgc tataaacacc 1260 agcctcccat ttcagaatat acatccgatc acaattggaa aatgtccaaa atatgtaaaa 1320 agcacaaaat tgagactggc cacaggattg aggaatatcc cgtctattca atctagagga 1380 ctatttgggg ccattgccgg tttcattgaa ggggggtgga cagggatggt agatggatgg 1440 tacggttatc accatcaaaa tgagcagggg tcaggatatg cagccgacct gaagagcaca 1500 cagaatgcca ttgacgagat tactaacaaa gtaaattctg ttattgaaaa gatgaataca 1560 cagttcacag cagtaggtaa agagttcaac cacctggaaa aaagaataga gaatttaaat 1620 aaaaaagttg atgatggttt cctggacatt tggacttaca atgccgaact gttggttcta 1680 ttggaaaatg aaagaacttt ggactaccac gattcaaatg tgaagaactt atatgaaaag 1740 gtaagaagcc agctaaaaaa caatgccaag gaaattggaa acggctgctt tgaattttac 1800 cacaaatgcg ataacacgtg catggaaagt gtcaaaaatg ggacttatga ctacccaaaa 1860 tactcagagg aagcaaaatt aaacagagaa gaaatagatg gggtaaagct ggaatcaaca 1920 aggatttacc agattttggc gatctattca actgtcgcca gttcattggt actggtagtc 1980 tccctggggg caatcagttt ctggatgtgc tctaatgggt ctctacagtg tagaatatgt 2040 atttaaaggc ctaata 2056 <210> 137 <211> 714 <212> DNA <213> Artificial sequence <220> <223> synthesized fragment 1 <400> 137 atgctaatat cacgtagtgc ggcgccatta aataacgtgt acttgtccta ttcttgtcgg 60 tgtggtcttg ggaaaagaaa gcttgctgga ggctgctgtt cagccccata cattacttgt 120 tacgattctg ctgactttcg gcgggtgcaa tatctctact tctgcttgac gaggtattgt 180 tgcctgtact tctttcttct tcttcttgct gattggttct ataagaaatc tagtattttc 240 tttgaaacag agttttcccg tggttttcga acttggagaa agattgttaa gcttctgtat 300 attctgccca aatttgtcgg gcccatggcg aaaaacgttg cgattttcgg cttattgttt 360 tctcttcttg tgttggttcc ttctcagatc ttcgctgaca cattatgtat aggttatcat 420 gcgaacaatt caacagacac tgtagacaca gtactagaaa agaatgtaac agtaacacac 480 tctgttaacc ttctagaaga caagcataac gggaaactat gcaaactaag aggggtagcc 540 ccattgcatt tgggtaaatg taacattgct ggctggatcc tgggaaatcc agagtgtgaa 600 tcactctcca cagcaagctc atggtcctac attgtggaaa cacctagttc agacaatgga 660 acgtgttacc caggagattt catcgattat gaggagctaa gagagcaatt aagc 714 <210> 138 <211> 849 <212> DNA <213> Artificial sequence <220> <223> synthesized fragment 2 <400> 138 tggaaacacc tagttcagac aatggaacgt gttacccagg agatttcatc gattatgagg 60 agctaagaga gcaattaagc tcagtgtcat catttgaaag gtttgagata ttccccaaga 120 caagttcatg gcccaatcat gactcgaaca aaggtgtaac ggcagcatgt cctcatgctg 180 gagcaaaaag cttctacaaa aatttaatat ggctagttaa aaaaggaaat tcatacccaa 240 agctcagcaa atcctacatt aatgataaag ggaaagaagt cctcgtgcta tggggcattc 300 accatccatc tactagtgct gaccaacaaa gtctctatca gaatgcagat acatatgttt 360 ttgtggggtc atcaagatac agcaagaagt tcaagccgga aatagcaata agacccaaag 420 tgagggatca agaagggaga atgaactatt actggacact agtagagccg ggagacaaaa 480 taacattcga agcaactgga aatctagtgg taccgagata tgcattcgca atggaaagaa 540 atgctggatc tggtattatc atttcagata caccagtcca cgattgcaat acaacttgtc 600 aaacacccaa gggtgctata aacaccagcc tcccatttca gaatatacat ccgatcacaa 660 ttggaaaatg tccaaaatat gtaaaaagca caaaattgag actggccaca ggattgagga 720 atatcccgtc tattcaatct agaggactat ttggggccat tgccggtttc attgaagggg 780 ggtggacagg gatggtagat ggatggtacg gttatcacca tcaaaatgag caggggtcag 840 gatatgcag 849 <210> 139 <211> 651 <212> DNA <213> Artificial sequence <220> <223> synthesized fragment 3 <400> 139 ttgaaggggg gtggacaggg atggtagatg gatggtacgg ttatcaccat caaaatgagc 60 aggggtcagg atatgcagcc gacctgaaga gcacacagaa tgccattgac gagattacta 120 acaaagtaaa ttctgttatt gaaaagatga atacacagtt cacagcagta ggtaaagagt 180 tcaaccacct ggaaaaaaga atagagaatt taaataaaaa agttgatgat ggtttcctgg 240 acatttggac ttacaatgcc gaactgttgg ttctattgga aaatgaaaga actttggact 300 accacgattc aaatgtgaag aacttatatg aaaaggtaag aagccagcta aaaaacaatg 360 ccaaggaaat tggaaacggc tgctttgaat tttaccacaa atgcgataac acgtgcatgg 420 aaagtgtcaa aaatgggact tatgactacc caaaatactc agaggaagca aaattaaaca 480 gagaagaaat agatggggta aagctggaat caacaaggat ttaccagatt ttggcgatct 540 attcaactgt cgccagttca ttggtactgg tagtctccct gggggcaatc agtttctgga 600 tgtgctctaa tgggtctcta cagtgtagaa tatgtattta aaggcctaat a 651 <210> 140 <211> 48 <212> DNA <213> Artificial sequence <220> <223> primer DraIII-MProt#2.c <400> 140 atgctaatat cacgtagtgc ggcgccatta aataacgtgt acttgtcc 48 <210> 141 <211> 42 <212> DNA <213> Artificial sequence <220> <223> primer H1 Cal.390r <400> 141 gcttaattgc tctcttagct cctcataatc gatgaaatct cc 42 <210> 142 <211> 42 <212> DNA <213> Artificial sequence <220> <223> primer H1 Cal.310c <400> 142 tggaaacacc tagttcagac aatggaacgt gttacccagg ag 42 <210> 143 <211> 42 <212> DNA <213> Artificial sequence <220> <223> primer H1 Cal.1159r <400> 143 ctgcatatcc tgacccctgc tcattttgat ggtgataacc gt 42 <210> 144 <211> 42 <212> DNA <213> Artificial sequence <220> <223> primer H1 Cal.1081c <400> 144 ttgaaggggg gtggacaggg atggtagatg gatggtacgg tt 42 <210> 145 <211> 45 <212> DNA <213> Artificial sequence <220> <223> primer StuI-H1 Cal.r <400> 145 tattaggcct ttaaatacat attctacact gtagagaccc attag 45 <210> 146 <211> 3520 <212> DNA <213> Artificial sequence <220> <223> expression cassette number 560 <400> 146 ttaattaagt cgacaagctt gcatgcctgc aggtcaacat ggtggagcac gacacacttg 60 tctactccaa aaatatcaaa gatacagtct cagaagacca aagggcaatt gagacttttc 120 aacaaagggt aatatccgga aacctcctcg gattccattg cccagctatc tgtcacttta 180 ttgtgaagat agtggaaaag gaaggtggct cctacaaatg ccatcattgc gataaaggaa 240 aggccatcgt tgaagatgcc tctgccgaca gtggtcccaa agatggaccc ccacccacga 300 ggagcatcgt ggaaaaagaa gacgttccaa ccacgtcttc aaagcaagtg gattgatgtg 360 ataacatggt ggagcacgac acacttgtct actccaaaaa tatcaaagat acagtctcag 420 aagaccaaag ggcaattgag acttttcaac aaagggtaat atccggaaac ctcctcggat 480 tccattgccc agctatctgt cactttattg tgaagatagt ggaaaaggaa ggtggctcct 540 acaaatgcca tcattgcgat aaaggaaagg ccatcgttga agatgcctct gccgacagtg 600 gtcccaaaga tggaccccca cccacgagga gcatcgtgga aaaagaagac gttccaacca 660 cgtcttcaaa gcaagtggat tgatgtgata tctccactga cgtaagggat gacgcacaat 720 cccactatcc ttcgcaagac ccttcctcta tataaggaag ttcatttcat ttggagaggt 780 attaaaatct taataggttt tgataaaagc gaacgtgggg aaacccgaac caaaccttct 840 tctaaactct ctctcatctc tcttaaagca aacttctctc ttgtctttct tgcgtgagcg 900 atcttcaacg ttgtcagatc gtgcttcggc accagtacaa cgttttcttt cactgaagcg 960 aaatcaaaga tctctttgtg gacacgtagt gcggcgccat taaataacgt gtacttgtcc 1020 tattcttgtc ggtgtggtct tgggaaaaga aagcttgctg gaggctgctg ttcagcccca 1080 tacattactt gttacgattc tgctgacttt cggcgggtgc aatatctcta cttctgcttg 1140 acgaggtatt gttgcctgta cttctttctt cttcttcttg ctgattggtt ctataagaaa 1200 tctagtattt tctttgaaac agagttttcc cgtggttttc gaacttggag aaagattgtt 1260 aagcttctgt atattctgcc caaatttgtc gggcccatgg cgaaaaacgt tgcgattttc 1320 ggcttattgt tttctcttct tgtgttggtt ccttctcaga tcttcgctga cacattatgt 1380 ataggttatc atgcgaacaa ttcaacagac actgtagaca cagtactaga aaagaatgta 1440 acagtaacac actctgttaa ccttctagaa gacaagcata acgggaaact atgcaaacta 1500 agaggggtag ccccattgca tttgggtaaa tgtaacattg ctggctggat cctgggaaat 1560 ccagagtgtg aatcactctc cacagcaagc tcatggtcct acattgtgga aacacctagt 1620 tcagacaatg gaacgtgtta cccaggagat ttcatcgatt atgaggagct aagagagcaa 1680 ttaagctcag tgtcatcatt tgaaaggttt gagatattcc ccaagacaag ttcatggccc 1740 aatcatgact cgaacaaagg tgtaacggca gcatgtcctc atgctggagc aaaaagcttc 1800 tacaaaaatt taatatggct agttaaaaaa ggaaattcat acccaaagct cagcaaatcc 1860 tacattaatg ataaagggaa agaagtcctc gtgctatggg gcattcacca tccatctact 1920 agtgctgacc aacaaagtct ctatcagaat gcagatacat atgtttttgt ggggtcatca 1980 agatacagca agaagttcaa gccggaaata gcaataagac ccaaagtgag ggatcaagaa 2040 gggagaatga actattactg gacactagta gagccgggag acaaaataac attcgaagca 2100 actggaaatc tagtggtacc gagatatgca ttcgcaatgg aaagaaatgc tggatctggt 2160 attatcattt cagatacacc agtccacgat tgcaatacaa cttgtcaaac acccaagggt 2220 gctataaaca ccagcctccc atttcagaat atacatccga tcacaattgg aaaatgtcca 2280 aaatatgtaa aaagcacaaa attgagactg gccacaggat tgaggaatat cccgtctatt 2340 caatctagag gactatttgg ggccattgcc ggtttcattg aaggggggtg gacagggatg 2400 gtagatggat ggtacggtta tcaccatcaa aatgagcagg ggtcaggata tgcagccgac 2460 ctgaagagca cacagaatgc cattgacgag attactaaca aagtaaattc tgttattgaa 2520 aagatgaata cacagttcac agcagtaggt aaagagttca accacctgga aaaaagaata 2580 gagaatttaa ataaaaaagt tgatgatggt ttcctggaca tttggactta caatgccgaa 2640 ctgttggttc tattggaaaa tgaaagaact ttggactacc acgattcaaa tgtgaagaac 2700 ttatatgaaa aggtaagaag ccagctaaaa aacaatgcca aggaaattgg aaacggctgc 2760 tttgaatttt accacaaatg cgataacacg tgcatggaaa gtgtcaaaaa tgggacttat 2820 gactacccaa aatactcaga ggaagcaaaa ttaaacagag aagaaataga tggggtaaag 2880 ctggaatcaa caaggattta ccagattttg gcgatctatt caactgtcgc cagttcattg 2940 gtactggtag tctccctggg ggcaatcagt ttctggatgt gctctaatgg gtctctacag 3000 tgtagaatat gtatttaaag gcctattttc tttagtttga atttactgtt attcggtgtg 3060 catttctatg tttggtgagc ggttttctgt gctcagagtg tgtttatttt atgtaattta 3120 atttctttgt gagctcctgt ttagcaggtc gtcccttcag caaggacaca aaaagatttt 3180 aattttatta aaaaaaaaaa aaaaaaagac cgggaattcg atatcaagct tatcgacctg 3240 cagatcgttc aaacatttgg caataaagtt tcttaagatt gaatcctgtt gccggtcttg 3300 cgatgattat catataattt ctgttgaatt acgttaagca tgtaataatt aacatgtaat 3360 gcatgacgtt atttatgaga tgggttttta tgattagagt cccgcaatta tacatttaat 3420 acgcgataga aaacaaaata tagcgcgcaa actaggataa attatcgcgc gcggtgtcat 3480 ctatgttact agatctctag agtctcaagc ttggcgcgcc 3520

Claims

식물에서 활성인 조절 영역에 작동 가능하게 연결된 타입 A/California/04/09의 인플루엔자 헤마글루티닌(HA)을 암호화하는 뉴클레오티드 서열을 포함하는 핵산.
제 1 항에 있어서, HA가 자생 또는 비-자생 신호 펩티드를 포함하는 것을 특징으로 하는 핵산.
제 2 항에 있어서, 비-자생 신호 펩티드가 단백질 이황화물 이소머라제 신호 펩티드인 것을 특징으로 하는 핵산.
a) 제 1 항의 핵산을 식물, 또는 식물의 일부에 도입하는 단계, 및
b) 핵산의 발현을 허용하는 조건에서 식물 또는 식물의 일부를 인큐베이션하여 바이러스-유사 입자(VLP)를 생산하는 단계
를 포함하는, 식물에서 인플루엔자 바이러스-유사 입자(VLP)를 생산하는 방법.
제 4 항에 있어서, 도입 단계(단계 a)에서, 핵산을 식물에 일시 방식으로 도입하는 것을 특징으로 하는 방법.
제 4 항에 있어서, 도입 단계(단계 a)에서, 핵산을 식물에 안정하게 도입하는 것을 특징으로 하는 방법.
제 4 항에 있어서,
c) 숙주를 수거하고 바이러스-유사 입자(VLP)를 정제하는 단계
를 더 포함하는 것을 특징으로 하는 방법.
제 4 항에 있어서, 도입 단계(단계 a)에서, 하나 이상의 샤프롱(chaperone) 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 제 2 핵산을 식물에 도입하는 것을 특징으로 하는 방법.
제 8 항에 있어서, 하나 이상의 샤프롱 단백질은 Hsp40 및 Hsp70으로 구성되는 군으로부터 선택되는 것을 특징으로 하는 방법.
a) 제 1 항의 핵산을 포함하는 식물 또는 식물의 일부를 제공하는 단계, 및
b) 핵산의 발현을 허용하는 조건에서 식물 또는 식물의 일부를 인큐베이션하여 바이러스-유사 입자(VLP)를 생산하는 단계
를 포함하는, 식물에서 인플루엔자 바이러스-유사 입자(VLP)를 생산하는 방법.
제 1 항의 핵산을 포함하는 식물.
제 11 항에 있어서, 식물에서 활성인 조절 영역에 작동 가능하게 연결된 하나 이상의 샤프롱 단백질을 암호화하는 뉴클레오티드 서열을 포함하는 핵산을 더 포함하는 것을 특징으로 하는 식물. 15. 제 14 항에 있어서, 하나 이상의 샤프롱 단백질은 Hsp40 및 Hsp70으로 구성되는 군으로부터 선택되는 것을 특징으로 하는 식물.
타입 A/California/04/09의 인플루엔자 바이러스 헤마글루티닌(HA) 단백질과 식물로부터 유래된 하나 이상의 지질을 포함하는 바이러스-유사 입자(VLP).
제 13 항의 바이러스-유사 입자(VLP)의 유효 용량과 제약학적으로 허용되는 담체를 포함하는 조성물.
제 13 항의 바이러스-유사 입자를 투여하는 단계를 포함하는, 피험체에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법.
제 15 항에 있어서, 바이러스-유사 입자를 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로로 피험체에게 투여하는 것을 특징으로 하는 방법.
식물-특이적 N-글리칸, 또는 변형된 N-글리칸을 보유한 타입 A/California/04/09의 인플루엔자 바이러스 HA를 포함하는 바이러스-유사 입자(VLP).
제 17 항의 바이러스-유사 입자(VLP)의 유효 용량과 제약학적으로 허용되는 담체를 포함하는 조성물.
제 18 항의 조성물을 투여하는 단계를 포함하는, 피험체에서 인플루엔자 바이러스 감염에 대한 면역성을 유도하는 방법.
제 19 항에 있어서, 조성물을 경구, 피내, 비내, 근육내, 복강내, 정맥내, 또는 피하 경로로 피험체에게 투여하는 것을 특징으로 하는 방법.