RU2813731C2

RU2813731C2 - Новый коронавирус рыб

Info

Publication number: RU2813731C2
Application number: RU2021122162A
Authority: RU
Inventors: Стиан НЮЛУНН; Лив САННЛУНН; Арнфинн Л. ЭКЛАНН
Original assignee: Фармак Ас
Priority date: 2019-02-05
Filing date: 2020-02-04
Publication date: 2024-02-16

Abstract

Изобретение относится к биотехнологии. Описан олигонуклеотидный праймер, который: (a) включает по меньшей мере 18 последовательных нуклеотидов последовательности, которая представляет собой часть или комплементарна части, референсной последовательности нуклеиновой кислоты, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 или SEQ ID NO: 6, или (b) включает по меньшей мере 18 последовательных нуклеотидов последовательности, которая по меньшей мере на 80% идентична последовательности, которая представляет собой или комплементарна последовательности, выбранной из группы, состоящей из SEQ ID NO: 12 - SEQ ID NO: 80; при условии, что указанный олигонуклеотидный праймер не включает последовательность, выбранную из группы, состоящей из SEQ ID NO: 21 - SEQ ID NO: 23. Раскрыто применение по меньшей мере одного указанного олигонуклеотидного праймера в способе обнаружения вируса, который инфицирует и способен вызывать гибель пинагора (Cyclopterus lumpus), где вирусный геном включает последовательность нуклеиновой кислоты, которая по меньшей мере на 90% идентична любой из SEQ ID NO: 1, 2, 3, 4, 5, 6, и где указанная последовательность нуклеиновой кислоты содержит основание урацил (U) вместо основания тимин (T). Представляен способ обнаружения вируса, который инфицирует и способен вызывать гибель рыбы, включающий следующие стадии: (a) контакт нуклеиновой кислоты, выделенной из биологического образца рыбы, по меньшей мере с одним олигонуклеотидным праймером по п.1 с получением смеси, (b) определение, присутствует ли после амплификации смеси a) продукт амплификации, где присутствие продукта амплификации указывает на присутствие РНК, ассоциированной с вирусом, и, следовательно, на присутствие вируса в биологическом образце. Раскрыт набор для обнаружения вируса в биологическом образце рыбы, где набор включает олигонуклеотидный праймер. Изобретение расширяет арсенал средств для выявления болезней рыб. 4 н. и 1 з.п. ф-лы, 12 ил., 6 табл., 4 пр.

Description

Область техники, к которой относится изобретение

Изобретение, помимо прочего, относится к новому вирусу рыб, указанному как коронавирус, который является причиной гибели рыбы, а также к способам обнаружения указанного вируса у рыбы и защиты рыбы от заражения указанным вирусом, и к связанным с этим средствам (реагентам) и применениям.

Уровень техники

Рыба является основным источником пищи, и рыбоводство стало важной отраслью, в частности потому, что показатели вылова дикой рыбы невысоки или снижаются из-за чрезмерного вылова рыбы и сокращения естественной среды обитания. Примеры выращиваемой в рыбоводческих хозяйствах рыбы включают атлантического лосося (Salmo salar) и пинагора (Cyclopterus lumpus).

Однако производству рыбы в аквакультуре угрожают инфекционные заболевания, которые также могут влиять на природные популяции рыбы. Например, известно, что воспаление сердца и скелетных мышц (HSMI) часто является смертельным заболеванием у выращиваемого в рыбоводческих хозяйствах атлантического лосося. У пораженной рыбы часто наблюдают пониженный аппетит, и впоследствии аномальное поведение при плавании и, в некоторых случаях, внезапную смерть. Внешние поражения обычно не наблюдаются. При вскрытии сердце часто выглядит бледным и несколько рыхлым. В некоторых случаях перикард наполнен кровью. Гистологические исследования показывают, что у большинства рыб в пораженных сетных садках обнаруживают серьезные повреждения, хотя рыбы выглядят здоровыми. Впервые обнаруженное в Норвегии в 1999 году (Kongtorp et al., J Fish Dis 27, 2004), HSMI впоследствии было связано с несколькими вспышками на других фермах Норвегии и Великобритании. Считается, что реовирус рыб (PRV) принадлежит к семейству Reoviridae, подсемейству Spinareovirinae, и является вероятным возбудителем HSMI (Kibenge et al., Virol J. 10, 2013). С 1999 года наблюдается рост числа вспышек заболевания, при этом считается, что это заболевание оказывает негативное экономическое воздействие на лососеводство.

Синдром кардиомиопатии (CMS) является тяжелым заболеванием сердца, поражающим главным образом крупного атлантического лосося на второй год в морской воде перед сбором. Пораженные рыбы могут внезапно гибнуть без проявления внешних признаков заболевания, или могут демонстрировать такие симптомы, как нарушенное поведение плавания и анорексию. Заболевание впервые было выявлено у выращиваемого атлантического лосося в Норвегии в 1985 году, а затем у выращиваемого лосося на Фарерских островах, в Великобритании и Ирландии. CMS также был описан у атлантического лосося в естественной среде в Норвегии. В 2010 году двухцепочечный РНК-вирус семейства Totiviridae, названный вирусом миокардита рыб (PMCV), был описан как возбудитель CMS (Haugland et al, J. Virol, 85, 2011). PMCV считается одной из самых крупных проблем в производстве атлантического лосося, приводящей к крупным финансовым потерям компаний-производителей лосося.

Проблемы, связанные с болезнями при производстве пинагора (Cyclopterus lumpus), в некоторой степени обусловлены бактериальными инфекциями. Из них наиболее значимыми видами являлись подвиды Aeromonas salmonicida (атипичный фурункулез), виды Pasteurella, Vibrio anguillarum и виды Tenacibaculum. Применение программ целевой вакцинации, систематический мониторинг заболеваний и улучшение процесса производства привели к постепенному снижению числа случаев атипичного фурунколоза, вибриоза и пастереллеза. Однако несколько видов вирусов были обнаружены у диких пинагоров, включая вирусную геморрагическую септицемию (VHSV) (Guðmundsdóttir et al, J. Fish Dis, 42, 2019), вирусный некроз нервов (VNN) и новый ранавирус. Недавно был обнаружен вирус, поражающий пинагора в аквакультуре: флавивирус пинагора (LFV/CLuV) (Skoge et al, Arch Virol, 163, 2018). Вирус LFV/CLuV демонстрирует низкое, но четкое сходство с неклассифцированным вирусом летучих мышей Тамана (TABV). Было обнаружено, что LFV/CLuV присутствует во всех видах тканей пораженных пинагоров, однако патология в основном наблюдалась в печени и почках. Вирус связывают с серьезным заболеванием пинагора. После изучения свойств LFV/CLuV, определение мирового распространения вируса и его связи с заболеванием показало, что он широко распространен с относительно высокой ассоциированной распространенностью.

Некоторые рыбоводческие хозяйства в настоящее время сталкиваются с высокой смертностью, например, до 80% в некоторых популяциях пинагора, хотя ОТ-ПЦР в реальном времени и гистологическое исследование не подтверждали присутствие каких-либо известных патогенов у рыбы.

Таким образом, сохраняется потребность в идентификации других патогенов, которые инфицируют и вызывают гибель рыбы, особенно выращиваемого в аквакультуре пинагора. Кроме того, сохраняется потребность в способах контроля при производстве рыбы в аквакультуре на присутствие инфицирования патогенами, чтобы предотвратить вспышки инфекции и потенциально лечить зараженную рыбу.

Сущность изобретения

В настоящем изобретении был неожиданно обнаружен новый вирус пинагора, именуемый в настоящем изобретении коронавирус Cyclopterus lumpus (CLuCV). Длина и организация генома вместе с анализом последовательности показывают, что CLuCV является торовирусом из семейства Coronaviridae, ближайшим родственником которого является вирус Берн. Вирусы рода Torovirus обычно поражают кишечник и могут вызывать тяжелую диарею у пораженных животных. Вирус, раскрытый в настоящем изобретении, является первым торовирусом, обнаруженным у рыб.

Таким образом, в одном аспекте изобретение относится к нуклеиновая кислота, включающая по меньшей мере одну последовательность открытой рамки считывания (ORF), выбранной из группы, состоящей из ORF-1, ORF-2, ORF-3, ORF-4 и ORF-5; где

ORF-1 по меньшей мере на 80% идентична последовательности нуклеиновой кислоты SEQ ID NO: 1,

ORF-2 по меньшей мере на 80% идентична последовательности нуклеиновой кислоты SEQ ID NO: 2,

ORF-3 по меньшей мере на 80% идентична последовательности нуклеиновой кислоты SEQ ID NO: 3,

ORF-4 по меньшей мере на 80% идентична последовательности нуклеиновой кислоты SEQ ID NO: 4, и

ORF-5 по меньшей мере на 80% идентична последовательности нуклеиновой кислоты SEQ ID NO: 5.

В другом аспекте изобретение относится к нуклеиновой кислоте, где: (a) последовательность указанной нуклеиновой кислоты комплементарна любой из SEQ ID NO: 1 - SEQ ID NO: 5; и/или (b) последовательность указанной нуклеиновой кислоты комплементарна SEQ ID NO: 6.

В другом аспекте изобретение относится к вирусному полипептиду, включающему аминокислотную последовательность, которая по меньшей мере на 80%, по меньшей мере на 90% или по меньшей мере на 95% идентична любой из SEQ ID NO 7-11, или является любой из SEQ ID NO 7-11, или их вариантом, содержащим консервативную замену.

В другом аспекте изобретение относится к вирусу, который инфицирует и способен вызывать гибель пинагора (Cyclopterus lumpus), где вирусный геном включает последовательность нуклеиновой кислоты, раскрытую в настоящем изобретении, где указанная последовательность нуклеиновой кислоты содержит основание урацил (U) вместо основания тимина (T), и/или где вирус включает вирусный полипептид, включающий аминокислотную последовательность, которая по меньшей мере на 80%, по меньшей мере на 90% или по меньшей мере на 95% идентична любой из SEQ ID NO 7-11, или которая является любой из SEQ ID NO 7-11, или их вариантом, содержащим консервативную замену.

В другом аспекте изобретение относится к олигонуклеотидному праймеру, включающему последовательность по меньшей мере из 9 нуклеотидов, где указанная последовательность комплементарна последовательности нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении.

В другом аспекте изобретение относится к олигонуклеотидному праймеру, который включает: (a) последовательность по меньшей мере из 9 последовательных нуклеотидов, где указанная последовательность комплементарна последовательности нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении, (b) включает по меньшей мере 9 последовательных нуклеотидов последовательности, которая представляет собой или комплементарна части референсной последовательности нуклеиновой кислоты, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 или SEQ ID NO: 6, или (c) включает по меньшей мере 9 последовательных нуклеотидов последовательности, которая по меньшей мере на 80% идентична последовательности, которая представляет собой или комплементарна последовательности, выбранной из группы, состоящей из SEQ ID NO: 12 - SEQ ID NO: 80; предпочтительно при условии, что олигонуклеотидный праймер не включает последовательность, выбранную из группы, состоящей из SEQ ID NO: 21 - SEQ ID NO: 23.

В другом аспекте изобретение относится к способу обнаружения вируса, который инфицирует и способен вызывать гибель рыбы, включающему следующие стадии:

(a) контакт нуклеиновой кислоты, выделенной из биологического образца рыбы, по меньшей мере с одним олигонуклеотидным праймером, с образованием смеси, где по меньшей мере один олигонуклеотидный праймер комплементарен последовательности нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении, и

(b) определение, присутствует ли после амплификации смеси из a) продукт амплификации, где присутствие продукта амплификации указывает на присутствие РНК, ассоциированной с вирусом, и следовательно, присутствие вируса в биологическом образце.

В другом аспекте изобретение относится к способу обнаружения вируса, который инфицирует и способен вызывать гибель рыбы, включающий следующие стадии:

(a) секвенирование нуклеиновой кислоты, выделенной из биологического образца рыбы, и

(b) сравнение полученной последовательности нуклеиновой кислоты с последовательностью нуклеиновой кислоты, которая представляет собой или комплементарна референсной последовательности, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 и SEQ ID NO: 6, где по меньшей мере 80% идентичность последовательности двух последовательностей указывает на присутствие вируса в биологическом образце.

(b) трансляцию полученной последовательности нуклеиновой кислоты в аминокислотную последовательность или трансляцию последовательности нуклеиновой кислоты, комплементарной указанной полученной последовательности нуклеиновой кислоты, в аминокислотную последовательность, и

(c) сравнение полученной аминокислотной последовательности с референсной последовательностью, выбранной из группы, состоящей из SEQ ID NO 7-11, где по меньшей мере 80% идентичность последовательности двух последовательностей указывает на присутствие вируса в биологическом образце.

В другом аспекте изобретение относится ко антителу, которое связывает полипептид, где полипептид кодируется последовательностью нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении, и/или где полипептид включает аминокислотную последовательность, которая по меньшей мере на 80%, по меньшей мере на 90% или по меньшей мере на 95% идентична любой из SEQ ID NO 7-11, или которая является любой из SEQ ID NO 7-11, или их вариантом, содержащим консервативную замену.

В другом аспекте изобретение относится к набору для обнаружения вируса в биологическом образце рыбы, где набор включает олигонуклеотидный праймер, раскрытый в настоящем изобретении, и/или антитело, раскрытое в настоящем изобретении.

В другом аспекте изобретение относится к антителу для применения в лечении рыбы, инфицированной вирусом, раскрытым в настоящем изобретении.

В другом аспекте изобретение относится к применению вируса, раскрытого в настоящем изобретении, для получения вакцины.

В другом аспекте изобретение относится к вакцине, включающей:

(i) последовательность нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении;

(ii) последовательность нуклеиновой кислоты, раскрытую в настоящем изобретении;

(iii) вирусный полипептид, кодируемый последовательностью нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении;

(iv) вирусный полипептид, включающий аминокислотную последовательность, которая по меньшей мере на 80%, по меньшей мере на 90% или по меньшей мере на 95% идентична любой из SEQ ID NO 7-11, или которая является любой из SEQ ID NO 7-11, или их вариантом, содержащим консервативную замену; или

(v) вирус, раскрытый в настоящем изобретении.

В еще одном аспекте изобретение относится к молекуле интерферирующей РНК (иРНК) для применения в лечении рыбы, инфицированной вирусом, где молекула иРНК включает по меньшей мере 12 последовательных нуклеотидов или комплементарна последовательности нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении.

Краткое описание фигур

Фигура 1: Схема из последовательности CluCV, идентифицированной в настоящем изобретении, которая имеет длину 24613 нуклеотидов и содержит пять возможных открытых рамок считывания (ORF).

Фигура 2: Геномная нуклеотидная последовательность CLuCV.

Фигура 3: Нуклеотидная последовательность ORF-1 CLuCV.

Фигура 4: Нуклеотидная последовательность ORF-2 CLuCV.

Фигура 5: Нуклеотидная последовательность ORF-3, ORF-4 и ORF-5 CLuCV.

Фигура 6: Аминокислотная последовательность ORF-1 CLuCV.

Фигура 7: Аминокислотная последовательность ORF-2 CLuCV.

Фигура 8: Аминокислотная последовательность ORF-3, ORF-4 и ORF-5 CLuCV.

Фигура 9: Окрашивание гематоксилином и эозином целого среза пораженного пинагора, на котором показано накопление жидкости в желудке (стрелка).

Фигура 10: Окрашивание гематоксилином и эозином среза кишечника пинагора, на котором показано накопление слизи и выброс клеточного содержимого (стрелки).

Фигура 11: Окрашивание гематоксилином и эозином среза кишечника пинагора, на котором показано накопление слизи (стрелка) и выброс клеточного содержимого.

Фигура 12: Окрашивание гематоксилином и эозином среза кишечника пинагора, на котором показано накопление слизи (стрелка).

Подробное описание изобретения

Определения

Для облегчения понимания настоящего изобретения ниже представлены несколько определений терминов, используемых при описании изобретения.

При использовании в настоящем изобретении термин "пинагор" предназначен для обозначения любых видов, выбранных из всего семейства Пинагоровые (Cyclopteridae). Наиболее предпочтительным видом согласно изобретению является Cyclopterus lumpus.

Термин "нуклеиновая кислота" включает молекулы ДНК (например, кДНК или геномную ДНК), молекулы РНК (например, мРНК), аналоги ДНК или РНК, созданные с использованием аналогов нуклеотидов (например, пептидонуклеиновые кислоты и неприродные аналоги нуклеотидов), а также их гибриды. Таким образом, хотя в последовательностях нуклеиновых кислот, представленных на Фигурах 2-5 и SEQ ID NO: 1-6, используются основания гуанин, цитозин, аденин и тимин, варианты осуществления изобретения относятся к соответствующим последовательностям РНК, в которых используются основания гуанин, цитозин, аденин и урацил (т.е. урацил вместо тимина), поэтому такие последовательности РНК также представлены в настоящем изобретении. Молекула нуклеиновой кислоты может быть одноцепочечной или двухцепочечной. Если не определено иное, левый конец любой одноцепочечной последовательности нуклеиновой кислоты, обсуждаемой в настоящем изобретении, является 5'-концом. Направление 5'→3' присоединения растущих РНК-транскриптов является направлением транскрипции.

Термин "олигонуклеотид" означает нуклеиновую кислоту, включающую 200 или меньше нуклеотидов. Олигонуклеотиды могут быть одноцепочечными, например, при использовании в качестве праймеров, клонирующих праймеров или гибридизационных зондов, или они могут быть двухцепочечными, например, при использовании в конструировании мутантного гена. Олигонуклеотиды могут быть смысловыми или антисмысловыми олигонуклеотидами. Олигонуклеотид может включать метку, в том числе радиоактивную метку, флуоресцентную метку, гаптен или антигенную метку, для анализов обнаружения.

При использовании в настоящем изобретении следует понимать, что термины "олигонуклеотидный праймер" или "праймер" относятся к нуклеиновой кислоте (например, длиной по меньшей мере 9 нуклеотидов и меньше 60 нуклеотидов), подходящей для направления активности в области нуклеиновой кислоты, например, для амплификации последовательности нуклеиновой кислоты-мишени с помощью полимеразной цепной реакции (ПЦР), или для гибридизации in situ.

При использовании в настоящем изобретении термин "комплементарный" в отношении последовательностей нуклеиновой кислоты означает последовательности нуклеиновых кислот, которые формируют двухцепочечную структуру при совпадении пар оснований (A с T (или U); и G с C). Например, последовательностью нуклеиновой кислоты, комплементарной G-T-A-C, является C-A-T-G. Другие примеры комплементарных последовательностей нуклеиновых кислот являются следующими:

Комплементарная последовательность нуклеиновой кислоты (например, в случае, если нуклеиновой кислотой является ДНК):

5'-ATTCGCTTAACGCAA-3'

3'-TAAGCGAATTGCGTT-5'

Соответствующие комплементарные последовательности, в которых тимин заменен урацилом (например, в случае, если нуклеиновой кислотой является РНК):

5'-AUUCGCUUAACGCAA-3'

3'-UAAGCGAAUUGCGUU-5'

При использовании в настоящем изобретении термин "аминокислота" относится к одной из 20 природных аминокислот или любым неприродным аналогам. Предпочтительно термин "аминокислота" относится к одной из 20 природных аминокислот.

Термины "полипептид" или "белок" означают макромолекулу, состоящую из последовательности аминокислот. Белок может быть нативным белком, то есть белком, продуцированным природной и нерекомбинантной клеткой; или он может быть продуцирован генетически модифицированной или рекомбинантной клеткой, и включает молекулы, имеющие аминокислотную последовательность нативного белка, или молекулы, имеющие делеции, вставки и/или замены одной или более аминокислот в сравнении с нативной последовательностью. Термины также включают полимеры аминокислот, в которых одна или больше аминокислот являются химическими аналогами соответствующего природного полимера аминокислот.

Термин "идентичность последовательностей" указывает количественный показатель степени гомологии между двумя последовательностями, которые могут быть последовательностями нуклеиновых кислот (также называемыми нуклеотидными последовательностями) или аминокислотными последовательностями. Если две сравниваемые последовательности имеют разную длину, требуется произвести их выравнивание с получением наилучшего соответствия, допуская вставку пропусков или, в альтернативе, усечение на концах последовательностей нуклеиновых кислот или аминокислотных последовательностей.

В случае нуклеотидной последовательности, например, термин "по меньшей мере на 80% идентичный" таким образом означает, что по меньшей мере 80% нуклеотидов во всей последовательности могут быть выровнены с идентичными нуклеотидами из другой последовательности. Указанный процент нуклеотидов может упоминаться как, например, идентичный на 80%, идентичный на 85%, идентичный на 90%, идентичный на 95%, идентичный на 99% или больше на протяжении указанной области, при сравнении и выравнивании с максимальным соответствием. Например, последовательность, которая имеет длину 10 нуклеотидов, например GGGAAACCTT, может быть на 80% идентична непрерывной последовательности (например, GGGAAACCGG) или ненепрерывной последовательности (например, GGGACCCCTT):

пример 100% идентичности:

пример 80% идентичности:

В случае если основание, обозначенное "N", найдено в конкретном положении в референсной нуклеотидной последовательности, идентичность последовательностей дается для любого из оснований аденина (A), цитозина (C), гуанина (G) и тимина (T) или урацила (U) в соответствующем положении на сравниваемой последовательности. См. следующий пример идентичности. То же относится к сравнениям аминокислотных последовательностей, т.е. в случае, если аминокислота, обозначенная "X", найдена в конкретном положении в референсной аминокислотной последовательности, идентичность последовательностей дается для любой аминокислоты в соответствующем положении в сравниваемой последовательности.

пример 80% идентичности:

Специалисту известно, что доступны разные средства для сравнения последовательностей (см. ниже).

При использовании в настоящем изобретении термин "содержащий консервативную замену" в отношении аминокислоты означает, что аминокислота может быть заменена другой аминокислотой в ее соответствующей группе, согласно следующим шести группам: [1] Аланин (A), Серин (S), Треонин (T); [2] Аспарагиновая кислота (D), Глутаминовая кислота (E); [3] Аспарагин (N), Глутамин (Q); [4] Аргинин (R), Лизин (K); [5] Изолейцин (I), Лейцин (L), Метионин (M), Валин (V); и [6] Фенилаланин (F), Тирозин (Y), Триптофан (W). "Вариант, содержащий консервативную замену", в отношении полипептида или белка означает, что любая из аминокислот в указанном полипептиде или белке может быть консервативно заменена, как определено выше.

При использовании в настоящем изобретении термин "антитело" относится к гликопротеину, включающему по меньшей мере две тяжелых (H) цепи и две легких (L) цепи, соединенные дисульфидными связями, или соответствующему фрагменту антитела (антигенсвязывающей части). Каждая тяжелая цепь состоит из вариабельной области тяжелой цепи (VH) и константной области тяжелой цепи (CH). Константная область тяжелой цепи состоит из трех доменов, CH1, CH2 и CH3. Каждая легкая цепь состоит из вариабельной области легкой цепи (VL) и константной области легкой цепи (CL). Константная область легкой цепи состоит из одного домена, CL. Области VH и VL можно далее подразделить на области гипервариабельности, называемые определяющими комплементарность областями (CDR), которые чередуются с областями, которые являются более консервативными, называемыми каркасными областями (FR). Каждая VH и VL состоит из трех CDR-областей и четырех FR-областей, расположенных от N-конца к C-концу в следующем порядке: FR1, CDR1, FR2, CDR2, FR3, CDR3, FR4. Вариабельные области тяжелой и легкой цепи содержат связывающий домен, который взаимодействует с антигеном. Константные области антител могут опосредовать связывание иммуноглобулина с клетками-хозяевам или факторами, включая различные клетки иммунной системы (например, эффекторные клетки) и первый компонент (C1q) классической системы комплемента. Антитела согласно изобретению включают моноклональные антитела (включая полноразмерные моноклональные антитела) и поликлональные антитела, целые антитела, химерные антитела, гуманизированные антитела, человеческие антитела или гибридные антитела с двойной или множественной антигенной или эпитопной специфичностью, фрагменты антител и субфрагменты антител, например, Fab, Fab', F(ab')₂, фрагменты и т.п., включая гибридные фрагменты любого иммуноглобулина или любого природного, синтетического или генетически модифицированного белка, действующего как антитело путем связывания со специфическим антигеном с образованием комплекса. Антитела согласно изобретению могут быть также Fc-слитыми белками.

"Вектор" представляет собой нуклеиновую кислоту, которая может использоваться для введения другой нуклеиновой кислоты (или "конструкции"), связанной с ней, в клетку. Одним из типов вектора является "плазмида", которая относится к линейной или кольцевой двухцепочечной молекуле ДНК, в которой могут быть лигированы дополнительные сегменты нуклеиновой кислоты. Другим типом вектора является вирусный вектор (например, репликационно-дефектные ретровирусы, аденовирусы и аденоассоциированные вирусы), где в вирусный геном могут быть введены дополнительные сегменты ДНК. Некоторые векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, содержащие бактериальную точку начала репликации и эписомные векторы млекопитающих). Другие векторы (например, неэписомные векторы млекопитающих) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и культивирования под селективным давлением и, таким образом, реплицируются вместе с геномом хозяина. Вектор может использоваться для направления экспрессии выбранной нуклеиновой кислоты в клетке.

"Клетка-хозяин" является клеткой, которая может использоваться для экспрессии нуклеиновой кислоты, например, нуклеиновой кислоты, раскрытой в настоящем изобретении. Клетка-хозяин может быть прокариотом, например E. coli, или она может быть эукариотом, например одноклеточным эукариотом (например, дрожжами или другим грибом), клеткой растения (например, клеткой растения табака или томата), клеткой животного (например, клеткой человека, клеткой обезьяны, клеткой хомяка, клеткой крысы, клеткой мыши или клеткой насекомого) или гибридомой. Примеры клеток-хозяев включают линии клеток яичников китайского хомячка (CHO) или их производные. Как правило, клетка-хозяин представляет собой культивируемую клетку, которая может быть трансформирована или трансфицирована кодирующей полипептид нуклеиновой кислотой, которая может затем экспрессироваться в клетке-хозяине. Следует понимать, что термин клетка-хозяин относится не только к клетке конкретного субъекта, но и к потомству или потенциальному потомству такой клетки. Поскольку некоторые модификации могут произойти в последующих поколениях, например, в результате мутации или воздействия факторов внешней среды, такое потомство может не быть, по существу, идентичным родительской клетке, но при этом все еще будет включено в рамки данного термина, используемого в настоящем изобретении.

Термины "лечить" и "лечение" включают терапевтическое лечение, профилактическое лечение и применения, которые уменьшают симптомы нарушения или снижают риск развития у субъекта (например, рыбы) нарушения (например, симптомов вирусной инфекции).

Термин "вакцина" при использовании в настоящем изобретении относится к материалу, который может вызывать иммунный ответ, который блокирует, частично или полностью, инфекционность возбудителя инфекции, который в отношении настоящего изобретения является вирусом, воздействующим на рыбу, например пинагоров. Таким образом, при введении рыбе, вакцина согласно изобретению иммунизирует рыбу против заболевания, вызванного вирусом. Иммунизирующим компонентом вакцины может быть, например, ДНК, как в вакцине ДНК, РНК, как в вакцине РНК, рекомбинантный белок или его фрагмент согласно настоящему изобретению, или живой или ослабленный рекомбинантный вирус.

"Средство иРНК" (сокращение от "средства интерферирующей РНК") при использовании в настоящем изобретении представляет собой средство на основе РНК, которое может даунрегулировать (снижать) экспрессию целевого гена, например, белка, кодируемого ORF-1, ORF-2, ORF-3, ORF-4 или ORF-5. Средство иРНК может действовать по одному или более механизмам, включая посттранскрипционное расщепление мРНК-мишени, иногда именуемое в уровне техники как "РНКи", или предтранскрипционные или предтрансляционные механизмы. Средство иРНК может быть двухцепочечным (дц) средством иРНК. Средство иРНК также может быть "малой интерферирующей РНК" (миРНК).

Термины "изобретения" или "согласно изобретению" при использовании в настоящем изобретении обозначают все аспекты и варианты осуществления изобретения, раскрытого и/или заявленного в настоящем изобретении. С другой стороны любые аспекты, объекты или варианты осуществления, указанные в настоящем изобретении как "раскрытые в настоящем изобретении" или "описанные в настоящем изобретении", следует понимать как аспекты, объекты или варианты осуществления "изобретения" или "согласно изобретению".

При использовании в настоящем изобретении термин "содержащий" следует рассматривать как охватывающий "включающий" и "состоящий из", причем оба этих значения являются специально предусмотренными и, следовательно, индивидуально раскрытыми вариантами осуществления согласно настоящему изобретению.

При использовании в настоящем изобретении формы единственного числа не должны ограничивать число случаев (т.е. случаев появления) элемента или компонента. Таким образом, формы единственного числа следует читать как включающие один или по меньшей мере один, при этом форма единственного числа элемента или компонента также включает множественное число, если в явной форме не подразумевается, что такое число должно быть единственным.

При использовании в настоящем изобретении термин "приблизительно", дополняющий количество используемого вещества, ингредиента, компонента или параметра, относится к вариации числового количества, которая может возникать, например, в результате стандартных процедур измерения и обработки, например, процедуры обработки жидкости, используемых при изготовлении концентратов или растворов. Кроме того, вариация может возникать вследствие непреднамеренной погрешности в процедурах измерения, различий в производстве, источника или чистоты ингредиентов, используемых для выполнения способов, и т.п. В одном варианте осуществления термин "приблизительно" означает в пределах 10% от приведенного числового значения. В более конкретном варианте осуществления термин "приблизительно" означает в пределах 5% от приведенного числового значения.

Вирусные последовательности нуклеиновых кислот и вирусные полипептиды

В одном аспекте изобретение относится к нуклеиновой кислоте, включающей по меньшей мере одну последовательность открытой рамки считывания (ORF), выбранную из группы, состоящей из ORF-1, ORF-2, ORF-3, ORF-4 и ORF-5; где

В некоторых вариантах осуществления:

ORF-1 по меньшей мере на 85% идентична последовательности нуклеиновой кислоты SEQ ID NO: 1,

ORF-2 по меньшей мере на 85% идентична последовательности нуклеиновой кислоты SEQ ID NO: 2,

ORF-3 по меньшей мере на 85% идентична последовательности нуклеиновой кислоты SEQ ID NO: 3,

ORF-4 по меньшей мере на 85% идентична последовательности нуклеиновой кислоты SEQ ID NO: 4, и

ORF-5 по меньшей мере на 85% идентична последовательности нуклеиновой кислоты SEQ ID NO: 5.

В предпочтительных вариантах осуществления:

ORF-1 по меньшей мере на 90% идентична последовательности нуклеиновой кислоты SEQ ID NO: 1,

ORF-2 по меньшей мере на 90% идентична последовательности нуклеиновой кислоты SEQ ID NO: 2,

ORF-3 по меньшей мере на 90% идентична последовательности нуклеиновой кислоты SEQ ID NO: 3,

ORF-4 по меньшей мере на 90% идентична последовательности нуклеиновой кислоты SEQ ID NO: 4, и

ORF-5 по меньшей мере на 90% идентична последовательности нуклеиновой кислоты SEQ ID NO: 5.

В более предпочтительных вариантах осуществления:

ORF-1 по меньшей мере на 95% идентична последовательности нуклеиновой кислоты SEQ ID NO: 1,

ORF-2 по меньшей мере на 95% идентична последовательности нуклеиновой кислоты SEQ ID NO: 2,

ORF-3 по меньшей мере на 95% идентична последовательности нуклеиновой кислоты SEQ ID NO: 3,

ORF-4 по меньшей мере на 95% идентична последовательности нуклеиновой кислоты SEQ ID NO: 4, и

ORF-5 по меньшей мере на 95% идентична последовательности нуклеиновой кислоты SEQ ID NO: 5.

В еще более предпочтительных вариантах осуществления:

ORF-1 по меньшей мере на 98% идентична последовательности нуклеиновой кислоты SEQ ID NO: 1,

ORF-2 по меньшей мере на 98% идентична последовательности нуклеиновой кислоты SEQ ID NO: 2,

ORF-3 по меньшей мере на 98% идентична последовательности нуклеиновой кислоты SEQ ID NO: 3,

ORF-4 по меньшей мере на 98% идентична последовательности нуклеиновой кислоты SEQ ID NO: 4, и

ORF-5 по меньшей мере на 98% идентична последовательности нуклеиновой кислоты SEQ ID NO: 5.

ORF-1 по меньшей мере на 99% идентична последовательности нуклеиновой кислоты SEQ ID NO: 1,

ORF-2 по меньшей мере на 99% идентична последовательности нуклеиновой кислоты SEQ ID NO: 2,

ORF-3 по меньшей мере на 99% идентична последовательности нуклеиновой кислоты SEQ ID NO: 3,

ORF-4 по меньшей мере на 99% идентична последовательности нуклеиновой кислоты SEQ ID NO: 4, и

ORF-5 по меньшей мере на 99% идентична последовательности нуклеиновой кислоты SEQ ID NO: 5.

В особенно предпочтительных вариантах осуществления:

ORF-1 представляет собой последовательность нуклеиновой кислоты SEQ ID NO: 1,

ORF-2 представляет собой последовательность нуклеиновой кислоты SEQ ID NO: 2,

ORF-3 представляет собой последовательность нуклеиновой кислоты SEQ ID NO: 3,

ORF-4 представляет собой последовательность нуклеиновой кислоты SEQ ID NO: 4, и

ORF-5 представляет собой последовательность нуклеиновой кислоты SEQ ID NO: 5.

В конкретных вариантах осуществления нуклеиновая кислота, раскрытая в настоящем изобретении, включает по меньшей мере ORF-1, ORF-2, ORF-3 и/или ORF-4, согласно любому из их вариантов осуществления, раскрытых в настоящем изобретении.

Последовательность нуклеиновой кислоты, раскрытой в настоящем изобретении, может быть по меньшей мере на 80% идентична вирусному геному согласно SEQ ID NO: 6. В некоторых вариантах осуществления последовательность нуклеиновой кислоты, раскрытой в настоящем изобретении, по меньшей мере на 85% идентична вирусному геному согласно SEQ ID NO: 6. В предпочтительных вариантах осуществления последовательность нуклеиновой кислоты, раскрытой в настоящем изобретении, по меньшей мере на 90% идентична вирусному геному согласно SEQ ID NO: 6. В более предпочтительных вариантах осуществления последовательность нуклеиновой кислоты, раскрытой в настоящем изобретении, по меньшей мере на 95% идентична вирусному геному согласно SEQ ID NO: 6. В еще более предпочтительных вариантах осуществления последовательность нуклеиновой кислоты, раскрытой в настоящем изобретении, по меньшей мере на 98% идентична вирусному геному согласно SEQ ID NO: 6. В еще более предпочтительных вариантах осуществления последовательность нуклеиновой кислоты, раскрытой в настоящем изобретении, по меньшей мере на 99% идентична вирусному геному согласно SEQ ID NO: 6. В наиболее предпочтительных вариантах осуществления последовательность нуклеиновой кислоты, раскрытой в настоящем изобретении, обладает 100% идентичностью с последовательностью вирусного генома согласно SEQ ID NO: 6 (CLuCV).

Также изобретение относится к нуклеиновой кислоте, последовательность которой комплементарна последовательности любой из нуклеиновых кислот, раскрытых в настоящем изобретении.

Последовательность указанной нуклеиновой кислоты может быть комплементарна ORF-1, ORF-2, ORF-3, ORF-4 или ORF-5 согласно любому из соответствующих вариантов осуществления, раскрытых в настоящем изобретении. Последовательность нуклеиновой кислоты также может быть комплементарна последовательности нуклеиновой кислоты, которая по меньшей мере на 80% идентична, в некоторых вариантах осуществления по меньшей мере на 85% идентична, в предпочтительных вариантах осуществления по меньшей мере на 90% идентична, в более предпочтительных вариантах осуществления по меньшей мере на 95% идентична, в еще более предпочтительных вариантах осуществления по меньшей мере на 98% идентична, в еще более предпочтительных вариантах осуществления по меньшей мере на 99% идентична, и в наиболее предпочтительных вариантах осуществления на 100% идентична последовательности вирусного генома согласно SEQ ID NO: 6 (CLuCV).

Таким образом, изобретение также относится к нуклеиновой кислоте, где: (a) последовательность указанной нуклеиновой кислоты комплементарна любой из SEQ ID NO: 1 - SEQ ID NO: 5; и/или (b) последовательность указанной нуклеиновой кислоты комплементарна SEQ ID NO: 6.

В предпочтительных вариантах осуществления последовательности нуклеиновых кислот, раскрытые в настоящем изобретении, представляют собой РНК-последовательности нуклеиновых кислот, т.е. они содержат основание урацил (U) вместо основания тимина (T). Таким образом, вирусы, раскрытые в настоящем изобретении, содержат свою генетическую информацию в форме таких РНК-последовательностей нуклеиновых кислот.

Специалисту будет известно, что изменения последовательности нуклеиновой кислоты, приводящие к модификациям кодируемой ею аминокислотной последовательности белка, могут оказывать малое, если таковое вообще будет присутствовать, воздействие на конечную трехмерную структуру белка. Например, кодон аминокислоты аланина, гидрофобной аминокислоты, может быть заменен кодоном, кодирующим другой менее гидрофобный остаток, такой как глицин, или более гидрофобный остаток, такой как валин, лейцин или изолейцин. Аналогичным образом, можно также ожидать, что изменения, которые приводят к замене одного отрицательно заряженного остатка другим остатком, таким как аспарагиновая кислота вместо глутаминовой кислоты, или одного положительно заряженного остатка другим остатком, таким как лизин вместо аргинина, будут давать белок, обладающий по существу такой же функциональной активностью.

Каждая из следующих шести групп содержит аминокислоты, которые являются типичными консервативными заменами друг для друга: [1] Аланин (A), Серин (S), Треонин (T); [2] Аспарагиновая кислота (D), Глутаминовая кислота (E); [3] Аспарагин (N), Глутамин (Q); [4] Аргинин(R), Лизин (K); [5] Изолейцин (I), Лейцин (L), Метионин (M), Валин (V); и [6] Фенилаланин (F), Тирозин (Y), Триптофан (W) (см., например, патентную публикацию США 20100291549).

Предпочтительно ORF 1-5 в настоящем изобретении кодируют вирусные полипептиды, включающие аминокислотные последовательности SEQ ID NO: 7-11, соответственно, или аминокислотные последовательности, которые по меньшей мере на 80% идентичны (например, по меньшей мере на 85% идентичны или по меньшей мере на 90% идентичны, или по меньшей мере на 91% идентичны, по меньшей мере на 92% идентичны, по меньшей мере на 93% идентичны, по меньшей мере на 94% идентичны, по меньшей мере на 95% идентичны, по меньшей мере на 96% идентичны, по меньшей мере на 97% идентичны, по меньшей мере на 98% идентичны или по меньшей мере на 99% идентичны) аминокислотным последовательностям SEQ ID NO: 7-11, соответственно. В некоторых вариантах осуществления ORF 1-5 кодируют вирусные полипептиды, которые являются содержащими консервативную замену вариантами SEQ ID NO 7-11, соответственно, как описано выше.

Таким образом, в другом аспекте изобретение относится к вирусным полипептидам, включающим аминокислотные последовательности SEQ ID NO: 7-11, соответственно, или аминокислотные последовательности, которые по меньшей мере на 80% идентичны (например, по меньшей мере на 85% идентичны или по меньшей мере на 90% идентичны, или по меньшей мере на 91% идентичны, по меньшей мере на 92% идентичны, по меньшей мере на 93% идентичны, по меньшей мере на 94% идентичны, по меньшей мере на 95% идентичны, по меньшей мере на 96% идентичны, по меньшей мере на 97% идентичны, по меньшей мере на 98% идентичны или по меньшей мере на 99% идентичны) аминокислотным последовательностям SEQ ID NO: 7-11, соответственно. В некоторых вариантах осуществления вирусные полипептиды являются содержащими консервативную замену вариантами SEQ ID NO 7-11, соответственно, как описано выше. Также предложены векторы, например, плазмидные векторы или вирусные векторы, включающие последовательности нуклеиновых кислот, кодирующие вирусные полипептиды согласно изобретению, как описано выше.

Идентичность (гомологию) последовательностей белков и/или нуклеиновых кислот можно оценивать при использовании любых из множества известных алгоритмов и программ для сравнения последовательностей. Для сравнения последовательностей обычно одна последовательность выступает в качестве референсной последовательности (например, последовательности, раскрытой в настоящем изобретении), с которой сравнивают тестируемые последовательности. Затем алгоритм сравнения последовательностей вычисляет процент идентичности последовательностей для тестируемых последовательностей по отношению к референсной последовательности на основе параметров программы.

Процент идентичности двух аминокислотных последовательностей или двух последовательностей нуклеиновых кислот можно определить, например, путем сравнения информации о последовательностях при использовании компьютерной программы GAP, т.е. Genetics Computer Group (GCG; Мэдисон, Висконсин), версии 10.0 в пакете Wisconsin, GAP (Devereux et al. (1984), Nucleic Acids Res. 12:387-95). При вычислении процента идентичности сравниваемые последовательности обычно выравнивают таким образом, чтобы получить наибольшее совпадение между последовательностями. Предпочтительные параметры по умолчанию для программы GAP включают следующее: (1) Реализация GCG унарной матрицы сравнения (содержащей значение 1 для идентичностей и 0 для неидентичностей) для нуклеотидов и матрица сравнения аминокислот Грибскова и Берджесса (Gribskov and Burgess (1986) Nucleic Acids Res. 14:6745), как описано в Atlas of Polypeptide Sequence and Structure, Schwartz and Dayhoff, eds., National Biomedical Research Foundation, pp. 353-358 (1979), или другие сопоставимые матрицы сравнения; (2) штраф 8 баллов за каждый пропуск и дополнительный штраф 2 балла за каждый символ в каждом пропуске для аминокислотных последовательностей или штраф 50 баллов за каждый пропуск и дополнительный штраф 3 балла за каждый символ в каждом пропуске для нуклеотидных последовательностей; (3) отсутствие штрафа за пропуски на концах; и (4) отсутствие максимального штрафа за длинные пропуски.

Идентичность и/или подобие последовательностей также можно определить при использовании алгоритма локальной идентичности последовательностей Смита и Уотермана (Smith and Waterman, 1981, Adv. Appl. Math. 2:482), алгоритма выравнивания идентичности последовательностей Нидлмана и Вунша (Needleman and Wunsch, 1970, J. Mol. Biol. 48:443), метода поиска подобия Пирсона и Липмана (Pearson and Lipman, 1988, Proc. Nat. Acad. Sci. U.S.A. 85:2444), компьютерных реализаций этих алгоритмов (BESTFIT, FASTA и TFASTA в пакете программ Wisconsin Genetics, Genetics Computer Group, 575 Science Drive, Madison, Wis.).

Другим примером полезного алгоритма является PILEUP. PILEUP создает множественное выравнивание последовательностей из группы родственных последовательностей при использовании прогрессивных парных выравниваний. Он также позволяет построить дерево, показывающее отношения кластеризации, используемые при создании выравнивания. В PILEUP используется упрощение метода прогрессивного выравнивания Фенга и Дулитла (Feng & Doolittle, 1987, J. Mol. Evol. 35:351-360); метод подобен описанному в публикации Higgins and Sharp, 1989, CABIOS 5:151-153. Полезные параметры PILEUP включают вес пропуска по умолчанию 3,00, вес длины пропуска по умолчанию 0,10 и взвешенные концевые пропуски.

Другим примером полезного алгоритма является алгоритм BLAST, описанный в публикации Altschul et al., 1990, J. Mol. Biol. 215:403-410; Altschul et al., 1997, Nucleic Acids Res. 25:3389-3402; и Karin et al., 1993, Proc. Natl. Acad. Sci. U.S.A. 90:5873-5787. Особенно полезной программой BLAST является программа WU-BLAST-2, созданная на основе публикации Altschul et al., 1996, Methods in Enzymology 266:460-480. В WU-BLAST-2 используется несколько параметров поиска, значения большинства из которых установлены по умолчанию. Изменяемые параметры устанавливают со следующими значениями: размах перекрывания=1, доля перекрывания=0,125, порог слова (T) = II. Параметры HSP S и HSP S2 являются динамическими значениями и устанавливаются самой программой в зависимости от состава конкретной последовательности и состава конкретной базы данных, в которой производят поиск интересующей последовательности; однако значения можно изменять для повышения чувствительности.

Дополнительным полезным алгоритмом является gapped BLAST, описанный в публикации Altschul et al., 1993, Nucl. Acids Res. 25:3389-3402. В gapped BLAST используется матрица замен BLOSUM-62; пороговый параметр T, равный 9; метод с двумя совпадениями, способствующий выбору продолжаемых последовательностей без пропусков, штрафы за длину пропуска k в размере 10+k; X_u, равный 16, и X_g, равный 40 для стадии поиска по базе данных и 67 для стадии вычисления результата алгоритмов. Выравнивания с пропусками инициируются баллом, соответствующим приблизительно 22 битам.

Способы получения вирусных полипептидов, описанных в настоящем изобретении, хорошо известны специалистам в данной области. В качестве примера и без ограничения, последовательности нуклеиновых кислот, кодирующие вирусные полипептиды, включающие SEQ ID NO 7-11, или последовательности, идентичные им по меньшей мере на 80%, включая содержащие консервативную замену варианты SEQ ID NO 7-11, можно клонировать в вектор, такой как, например, плазмидный или вирусный вектор, и экспрессировать в подходящем хозяине, таком как клетки рыб, клетки млекопитающих, клетки бактерий, клетки растений и клетки насекомых, а затем выделять из них экспрессированные вирусные полипептиды.

Вирусы

В другом аспекте изобретение относится к вирусу, который инфицирует и способен вызывать гибель пинагора (Cyclopterus lumpus), где вирусный геном включает последовательность нуклеиновой кислоты, раскрытую в настоящем изобретении, где указанная последовательность нуклеиновой кислоты содержит основание урацил (U) вместо основания тимина (T).

В другом аспекте изобретение относится к вирусу, который инфицирует и способен вызывать гибель пинагора (Cyclopterus lumpus), где вирус включает вирусный полипептид, включающий аминокислотную последовательность, которая по меньшей мере на 80%, по меньшей мере на 90% или по меньшей мере на 95% идентична любой из SEQ ID NO 7-11, или которая является любой из SEQ ID NO 7-11, или их вариантом, содержащим консервативную замену.

В другом аспекте изобретение относится к вирусу, который инфицирует и способен вызывать гибель пинагора (Cyclopterus lumpus), где вирусный геном включает последовательность нуклеиновой кислоты, раскрытую в настоящем изобретении, где указанная последовательность нуклеиновой кислоты содержит основание урацил (U) вместо основания тимина (T), и где вирус включает вирусный полипептид, включающий аминокислотную последовательность, которая по меньшей мере на 80%, по меньшей мере на 90% или по меньшей мере на 95% идентична любой из SEQ ID NO 7-11, или которая является любой из SEQ ID NO 7-11, или их вариантом, содержащим консервативную замену.

В предпочтительных вариантах осуществления нуклеиновая кислота, содержащаяся в вирусе, находится в форме одноцепочечной РНК (оцРНК).

В некоторых вариантах осуществления вирусный геном включает последовательность нуклеиновой кислоты, включающую по меньшей мере одну из ORF-1, ORF-2, ORF-3, ORF-4 или ORF-5 согласно любому из их вариантов осуществления, раскрытых в настоящем изобретении. В предпочтительных вариантах осуществления последовательность вирусного генома включает по меньшей мере ORF-1, ORF-2, ORF-3 и ORF-4 согласно любому из их вариантов осуществления, раскрытых в настоящем изобретении. В некоторых вариантах осуществления вирусный геном включает последовательность нуклеиновой кислоты, которая представляет собой или комплементарна последовательности нуклеиновой кислоты, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно на 98%, наиболее предпочтительно на 99% или даже на 100% идентична последовательности вирусного генома согласно SEQ ID NO: 6 (CLuCV).

В некоторых вариантах осуществления вирус включает ORF-1, ORF-2, ORF-3, ORF-4 и ORF-5; где

ORF-5 по меньшей мере на 80% идентична последовательности нуклеиновой кислоты SEQ ID NO: 5;

и где ORF-1, ORF-2, ORF-3, ORF-4 и ORF-5 кодируют вирусные полипептиды, включающие SEQ ID NO 7-11, соответственно, или последовательности, которые по меньшей мере на 80% идентичны SEQ ID NO 7-11, соответственно.

В некоторых вариантах осуществления ORF-1, ORF-2, ORF-3, ORF-4 или ORF-5 кодируют вирусные полипептиды, включающие соответствующие аминокислотные последовательности, включающие SEQ ID NO 7-11, или последовательности, которые по меньшей мере на 80% идентичны им (например, по меньшей мере на 85%, по меньшей мере на 90%, по меньшей мере на 91%, по меньшей мере на 92%, по меньшей мере на 93%, по меньшей мере на 94%, по меньшей мере на 95%, по меньшей мере на 96%, по меньшей мере на 97%, по меньшей мере на 98% или по меньшей мере на 99% идентичны SEQ ID NO 7-11). Предпочтительно вирус включает ORF-1, ORF-2, ORF-3, ORF-4 и ORF-5, как определено в настоящем изобретении, где указанные ORF-1, ORF-2, ORF-3, ORF-4 и ORF-5 кодируют вирусные полипептиды, которые по меньшей мере на 95% идентичны SEQ ID NO 7-11, соответственно. Более предпочтительно вирус включает ORF-1, ORF-2, ORF-3, ORF-4 и ORF-5, как определено в настоящем изобретении, где указанные ORF-1, ORF-2, ORF-3, ORF-4 и ORF-5 кодируют вирусные полипептиды, которые являются содержащими консервативные замены вариантами SEQ ID NO 7-11, соответственно, или вирусные полипептиды, включающие аминокислотные последовательности SEQ ID NO 7-11, соответственно.

В некоторых вариантах осуществления инфицирование пинагора вирусом, раскрытым в настоящем изобретении, вызывает следующие симптомы у рыбы:

(i) повреждение ткани в кишечнике, и/или

(ii) диарею.

В других вариантах осуществления инфицирование пинагора вирусом, раскрытым в настоящем изобретении, дополнительно вызывает анорексию.

Повреждение ткани в кишечнике можно диагностировать с помощью гистологического исследования или электронной микроскопии, которые позволяют наблюдать разрушение ткани кишечника, например, разрушение структуры ворсинок, увеличенную толщину других слоев. Предпочтительно срезы ткани окрашивают с использованием гистологической окраски гематоксилином и эозином (ГЭ). При использовании такой окраски у инфицированных особей можно наблюдать накопление жидкостей и непереваренных частиц корма, как в желудке, так и в кишечнике (см., например, Фигуры 9-12), что приводит к диареяподобному состоянию у этих рыб. Кроме того, может наблюдаться повреждение стенки кишечника с выбросом клеточного содержимого и увеличением продукции слизи (см., например, Фигуры 10-12). Диарея рыб может наблюдаться в резервуарах с водой у разводимой рыбы.

Изменения биомакромолекулярных компонентов (белков в целом, сидерофильных белков, нейтральных мукополисахаридов, гликогена и кислых мукополисахаридов) также можно наблюдать в образцах ткани кишечника с помощью стандартных методов, например, вестерн-блоттинга, ИФА, окрашивания срезов тканей и т.д.

Анорексию у рыб можно наблюдать, когда рыба отказывается от корма.

В некоторых вариантах осуществления вирус представляет собой оболочечный вирус. Оболоченные вирусы имеют защитный слой (оболочку), покрывающий их белковые капсиды. Оболочки обычно образуются из частей мембран клетки-хозяина (фосфолипидов и белков), но также включают некоторые вирусные гликопротеины. Они могут помогать вирусам уклоняться от иммунной системы хозяина.

В некоторых вариантах осуществления вирус является коронавирусом. В предпочтительных вариантах осуществления вирусом является торовирусом. Такие вирусы имеют оболочку круглой формы, но плеоморфную, диаметром приблизительно 100-150 нм. Вирусная частица, как правило, имеет поверхностные спайковые белки, которые являются булавовидными и равномерно распределены по поверхности.

В некоторых вариантах осуществления вирус, раскрытый в настоящем изобретении, включает 5'-нетранслируемую область (5'-UTR), которая функционирует в качестве участка внутренней посадки рибосомы (IRES).

В предпочтительных вариантах осуществления ORF-1 кодирует полипротеин, ORF-2 кодирует спайковый гликопротеин, ORF-3 кодирует мембранный белок, и ORF-4 кодирует белок нуклеокапсида.

Также изобретение относится к вектору, включающему нуклеиновую кислоту, кодирующую по меньшей мере одну ORF, как раскрыто в настоящем изобретении, со всеми соответствующими вариантами осуществления. В некоторых вариантах осуществления вектор содержит нуклеиновую кислоту, которая кодирует полный вирус, раскрытый в данном документе. Вектор может использоваться для введения указанной нуклеиновой кислоты (кислот) в клетку, такую как клетка-хозяин.

Также изобретение относится к клетке-хозяину, включающей вирус, раскрытый в настоящем изобретении. Клетка-хозяин может быть клеткой бактерии, клеткой рыбы или клеткой млекопитающего.

Олигонуклеотидные праймеры

В другом аспекте изобретение относится к олигонуклеотидному праймеру, который включает: (a) последовательность по меньшей мере из 9 последовательных нуклеотидов, где указанная последовательность комплементарна последовательности нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении, (b) включает по меньшей мере 9 последовательных нуклеотидов последовательности, которая представляет собой часть или комплементарна части референсной последовательности нуклеиновой кислоты, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 или SEQ ID NO: 6, или (c) включает по меньшей мере 9 последовательных нуклеотидов последовательности, которая по меньшей мере на 80% идентична последовательности, которая представляет собой или комплементарна последовательности, выбранной из группы, состоящей из SEQ ID NO: 12 - SEQ ID NO: 80; предпочтительно при условии, что указанный олигонуклеотидный праймер не включает последовательность, выбранную из группы, состоящей из SEQ ID NO: 21 - SEQ ID NO: 23.

В некоторых вариантах осуществления олигонуклеотидный праймер имеет длину 9-60 нуклеотидов. В предпочтительных вариантах осуществления олигонуклеотидный праймер имеет длину 12-40 нуклеотидов. В более предпочтительных вариантах осуществления олигонуклеотидный праймер имеет длину 15-30 нуклеотидов. В еще более предпочтительных вариантах осуществления олигонуклеотидный праймер имеет длину 18-25 нуклеотидов.

Для специалиста будет очевидно, что олигонуклеотидный праймер, который комплементарен последовательности нуклеиновой кислоты, будет гибридизоваться с этой последовательностью в строгих условиях. "Строгие условия" относятся к условиям температуры, ионной силы и присутствия других соединений, таких как органические растворители, при которых проводят гибридизацию нуклеиновых кислот. В строгих условиях спаривание оснований нуклеиновых кислот будет происходить только между последовательностями нуклеиновых кислот, имеющими высокую частоту комплементарных оснований. Строгие условия гибридизации известны специалисту (см., например, Green M. R., Sambrook, J., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory Press; 4th edition, 2012). Точные условия строгой гибридизации обычно зависят от последовательности и будут отличаться в разных обстоятельствах, что сумеет легко понять специалист. Более длинные последовательности гибридизуются при более высоких температурах по сравнению с более короткими последовательностями. Обычно строгие условия выбирают примерно на 5°C ниже температуры плавления (Тп) конкретной последовательности. Тп определяют как температуру, при которой 50% дуплексных молекул диссоциировали на составляющие их одиночные цепи. Поскольку последовательности-мишени обычно присутствуют в избытке, при Тп 50% нуклеотидных праймеров обычно будут заняты при равновесии. Как правило, строгие условия будут такими, при которых концентрация соли составляет меньше чем приблизительно 1,0 М ионов натрия, обычно приблизительно от 0,01 до 1,0 М ионов натрия (или других солей), при рН 6,8-8,3, и температура составляет по меньшей мере приблизительно 30°C для коротких праймеров (например, от 10 нуклеотидов до 50 нуклеотидов) и по меньшей мере приблизительно 60°C для более длинных праймеров. Строгие условия также могут быть достигнуты путем добавления дестабилизирующих агентов, таких как формамид. Для специалиста будет очевидно, что из-за комплементарности последовательностей олигонуклеотидный праймер согласно изобретению, таким образом, гибридизуется с последовательностью нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении.

Олигонуклеотидный праймер согласно настоящему изобретению может быть помечен молекулярным маркером, чтобы обеспечить возможность визуализации гибридизации с последовательностью-мишенью или количественного определения амплификации последовательности-мишени. Различные молекулярные маркеры или метки известны специалисту.

В конкретном варианте осуществления изобретение относится к олигонуклеотидному праймеру, который включает по меньшей мере 9 последовательных нуклеотидов последовательности, которая представляет собой или комплементарна части (например, длиной 9-60 нуклеотидов, предпочтительно длиной 12-40 нуклеотидов, более предпочтительно длиной 15-30 нуклеотидов, еще более предпочтительно длиной 18-25 нуклеотидов) референсной последовательности нуклеиновой кислоты, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 или SEQ ID NO: 6; предпочтительно при условии, что указанный олигонуклеотидный праймер не включает последовательность, выбранную из группы, состоящей из SEQ ID NO: 21 - SEQ ID NO: 23. В наиболее предпочтительном варианте осуществления последовательность указанного олигонуклеотидного праймера состоит из указанной последовательности последовательных нуклеотидов.

В другом конкретном варианте осуществления изобретение относится к олигонуклеотидному праймеру, который включает по меньшей мере 9 (предпочтительно по меньшей мере 12, более предпочтительно по меньшей мере 15, еще более предпочтительно по меньшей мере 18) последовательных нуклеотидов последовательности, которая по меньшей мере на 80% идентична последовательности, которая представляет собой или комплементарна последовательности, выбранной из группы, состоящей из SEQ ID NO: 12 - SEQ ID NO: 80; предпочтительно при условии, что указанный олигонуклеотидный праймер не включает последовательность, выбранную из группы, состоящей из SEQ ID NO: 21 - SEQ ID NO: 23.

В другом аспекте изобретение относится к применению по меньшей мере одного олигонуклеотидного праймера в способе обнаружения вируса, раскрытого в настоящем изобретении, где по меньшей мере один праймер включает последовательность по меньшей мере из 9 нуклеотидов, например из 9 последовательных нуклеотидов, (предпочтительно по меньшей мере 12, более предпочтительно по меньшей мере 15, еще более предпочтительно по меньшей мере 18), и где указанная последовательность комплементарна последовательности нуклеиновой кислоты, которая содержится в геноме указанного вируса.

В некоторых вариантах осуществления по меньшей мере один олигонуклеотидный праймер представляет собой пару праймеров, т.е. два праймера, один прямой праймер и один обратный праймер, которые комплементарны двум областям в последовательности нуклеиновой кислоты, и которые могут использоваться для амплификации последовательности между двумя указанными областями. Специалисту хорошо известно и находится в рамках его/ее компетенции, как проводить поиск олигонуклеотидных праймеров, подходящих для составления пары. Согласно применению изобретения, "пара праймеров" может использоваться для амплификации последовательности нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении.

В некоторых вариантах осуществления применение включает синтез кДНК в способе обнаружения вируса, раскрытого в настоящем изобретении. Например, случайные олигонуклеотидные праймеры (например, гексануклеотиды) используют для синтеза кДНК с последовательности нуклеиновой кислоты, которая содержится в геноме указанного вируса.

В некоторых вариантах осуществления применение включает ПЦР в способе обнаружения вируса, раскрытого в настоящем изобретении. В некоторых вариантах осуществления применение включает ОТ-ПЦР в способе обнаружения вируса, раскрытого в настоящем изобретении. В некоторых вариантах осуществления применение включает ОТ-кПЦР в способе обнаружения вируса, раскрытого в настоящем изобретении. В некоторых вариантах осуществления применение включает случайную мультиплексную ОТ-ПЦР в способе обнаружения вируса, раскрытого в настоящем изобретении; в данном способе используют смесь праймеров, подобранных так, что они устойчивы к образованию димеров праймеров при амплификации (см. Clem et al, Virol J, 4, 2007). В некоторых вариантах осуществления применение включает транскрипционно-опосредованную амплификацию (TMA) в способе обнаружения вируса, раскрытого в настоящем изобретении. В некоторых вариантах осуществления применение включает амплификацию с замещением цепей (SDA) в способе обнаружения вируса, раскрытого в настоящем изобретении.

В некоторых вариантах осуществления применение включает обнаружение in situ, которое также называют гибридизацией in situ (ISH), в способе обнаружения вируса, раскрытого в настоящем изобретении, например, флуоресцентную гибридизацию in situ (FISH). В ISH используется меченая комплементарная ДНК, РНК или модифицированная последовательность олигонуклеотидного праймера (зонд), которые позволяют проводить визуализацию спецфических нуклеиновых кислот в морфологически сохраненных клетках и срезах ткани. Зонд может быть помечен радиоизотопными, флуоресцентными или антигенными метками (например, дигоксигенином), локализацию которых затем можно установить и количественно определить в ткани с помощью ауторадиографии, флуоресцентной микроскопии или иммуногистохимического исследования, соответственно.

Диагностические методы

(b) определение, присутствует ли после амплификации смеси из a) продукт амплификации, где присутствие продукта амплификации указывает на присутствие РНК, ассоциированной с вирусом, и, следовательно, на присутствие вируса в биологическом образце.

В некоторых вариантах осуществления нуклеиновую кислоту на стадии (a) способа, например РНК, выделяют из биологических образцов при помощи твердофазной экстракции, например, очистки на колонке с использованием твердой фазы мембраны с силикагелем. В некоторых вариантах осуществления нуклеиновую кислоту на стадии (a) способа, например РНК, выделяют из биологических образцов при помощи экстракции фенолом/хлороформом.

В способе может использоваться любой подходящий олигонуклеотидный праймер, раскрытый в настоящем изобретении. Как равило, по меньшей мере один олигонуклеотидный праймер стадии (a) способа выбирают для получения продукта амплификации согласно стадии (b), имеющего длину от 45 нуклеотидов до 3000 нуклеотидов. Однако продукты амплификации даже меньшей или большей длины могут быть соответственно получены с применением способов и олигонуклеотидного праймера, раскрытых в настоящем изобретении.

В некоторых вариантах осуществления по меньшей мере один олигонуклеотидный праймер стадии (a) способа выбирают для получения продукта амплификации согласно стадии (b) для анализа ПЦР или ОТ-ПЦР, который имеет длину от 100 нуклеотидов до 2500 нуклеотидов. В предпочтительных вариантах осуществления по меньшей мере один олигонуклеотидный праймер стадии (a) способа выбирают для получения продукта амплификации согласно стадии (b) для анализа ПЦР или ОТ-ПЦР, который имеет длину от 200 нуклеотидов до 1500 нуклеотидов. В более предпочтительных вариантах осуществления по меньшей мере один олигонуклеотидный праймер стадии (a) способа выбирают для получения продукта амплификации согласно стадии (b) для анализа ПЦР или ОТ-ПЦР, который имеет длину от 300 нуклеотидов до 1000 нуклеотидов.

В некоторых вариантах осуществления по меньшей мере один олигонуклеотидный праймер стадии (a) способа выбирают для получения продукта амплификации согласно стадии (b) для анализа ОТ-ПЦР в реальном времени, который имеет длину от 45 нуклеотидов до 500 нуклеотидов. В предпочтительных вариантах осуществления по меньшей мере один олигонуклеотидный праймер стадии (a) способа выбирают для получения продукта амплификации согласно стадии (b) для анализа ОТ-ПЦР в реальном времени, который имеет длину от 50 нуклеотидов до 350 нуклеотидов. В более предпочтительных вариантах осуществления по меньшей мере один олигонуклеотидный праймер стадии (a) способа выбирают для получения продукта амплификации согласно стадии (b) для анализа ОТ-ПЦР в реальном времени, который имеет длину от 55 нуклеотидов до 250 нуклеотидов.

В некоторых вариантах осуществления для амплификации на стадии (b) способа используют ПЦР. В некоторых вариантах осуществления для амплификации на стадии (b) способа используют ОТ-ПЦР. В некоторых вариантах осуществления для амплификации на стадии (b) способа используют ОТ-кПЦР.

В некоторых вариантах осуществления продукт амплификации стадии (b) способа определяют с помощью Саузерн-блоттинга. В некоторых вариантах осуществления продукт амплификации стадии (b) способа определяют с помощью Нозерн-блоттинга. В некоторых вариантах осуществления продукт амплификации стадии (b) способа определяют с помощью спектрофотометрии. В некоторых вариантах осуществления продукт амплификации стадии (b) способа определяют с использованием красителя для ДНК. В некоторых вариантах осуществления продукт амплификации стадии (b) способа определяют путем количественного определения присутствия меченого олигонуклеотидного праймера, например, количественного определения присутствия флуоресцентно-меченного олигонуклеотидного праймера.

(b) сравнение полученной последовательности нуклеиновой кислоты с последовательностью нуклеиновой кислоты, которая представляет собой или комплементарна референсной последовательности, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 и SEQ ID NO: 6, где по меньшей мере 80% идентичность последовательности двух указанных последовательностей указывает на присутствие вируса в биологическом образце.

В некоторых вариантах осуществления нуклеиновую кислоту на стадии (a) способа, например РНК, выделяют из биологических образцов при помощи твердофазной экстракции, например, очистки на колонке с использованием твердой фазы мембраны с силикагелем. В некоторых вариантах осуществления нуклеиновую кислоту на стадии (a) метода, например РНК, выделяют из биологических образцов с помощью экстракции фенолом/хлороформом.

В предпочтительных вариантах осуществления секвенирование на стадии (a) способа дает последовательность ДНК, которую можно непосредственно сравнивать с референсными последовательностями ДНК, выбранными из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 и SEQ ID NO: 6.

В некоторых вариантах осуществления секвенирование на стадии (a) способа выполняют методом секвенирования по Сэнгеру (метод обрыва цепи). В предпочтительных вариантах осуществления секвенирование на стадии (a) способа выполняют методом секвенирования следующего поколения (NGS), предпочтительно секвенирования на платформе Illumina (Solexa), секвенирования Roche 454, Ion Torrent или секвенирования SOLiD (Goodwin S, et al., (2016) Coming of age: Ten years of next-generation sequencing technologies. Nature reviews, Genetics, 17, 333-351).

В некоторых вариантах осуществления по меньшей мере 85% идентичность последовательности двух указанных последовательностей на стадии (b) способа указывает на присутствие вируса в биологическом образце.

В предпочтительных вариантах осуществления по меньшей мере 90% идентичность последовательности двух указанных последовательностей на стадии (b) способа указывает на присутствие вируса в биологическом образце.

В более предпочтительных вариантах осуществления по меньшей мере 95% идентичность последовательности двух указанных последовательностей на стадии (b) способа указывает на присутствие вируса в биологическом образце.

В еще более предпочтительных вариантах осуществления по меньшей мере 98% идентичность последовательности двух указанных последовательностей на стадии (b) способа указывает на присутствие вируса в биологическом образце.

В еще более предпочтительных вариантах осуществления по меньшей мере 99% идентичность последовательности двух указанных последовательностей на стадии (b) способа указывает на присутствие вируса в биологическом образце.

В особенно предпочтительном варианте осуществления 100% идентичность последовательности двух указанных последовательностей на стадии (b) способа указывает на присутствие вируса в биологическом образце.

(b) трансляцию полученной последовательности нуклеиновой кислоты в аминокислотную последовательность или трансляцию последовательности нуклеиновой кислоты, комплементарной указанной полученной последовательности нуклеиновой кислоты, с получением аминокислотной последовательности, и

(c) сравнение полученной аминокислотной последовательности с референсной последовательностью, выбранной из группы, состоящей из SEQ ID NO 7-11, где по меньшей мере 80% идентичность последовательности двух указанных последовательностей указывает на присутствие вируса в биологическом образце.

Антитела

В другом аспекте изобретение относится к антителу, которое связывает полипептид, где полипептид кодируется последовательностью нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении, и/или где полипептид включает аминокислотную последовательность, которая по меньшей мере на 80%, по меньшей мере на 90% или по меньшей мере на 95% идентична любой из SEQ ID NO 7-11, или которая является любой из SEQ ID NO 7-11, или их вариантом, содержащим консервативную замену.

В некоторых вариантах осуществления полипептид выбран из группы, состоящей из:

(i) полипептида, включающего аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична, или представляет собой, SEQ ID NO: 7;

(ii) полипептида, включающего аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична, или представляет собой, SEQ ID NO: 8;

(iii) полипептида, включающего аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична, или представляет собой, SEQ ID NO: 9;

(iv) полипептида, включающего аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична, или представляет собой, SEQ ID NO: 10; и

(v) полипептида, включающего аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична, или представляет собой, SEQ ID NO: 11.

В некоторых вариантах осуществления антитело является поликлональным антителом. В некоторых вариантах осуществления антитело является моноклональным антителом.

Антитела, раскрытые в настоящем изобретении, могут быть получены методами генетической иммунизации, в которых нативные белки экспрессируются in vivo с обычными посттранскрипционными модификациями, избегая выделения или синтеза антигена. Например, гидродинамическая доставка в хвостовую вену или вену конечности голых плазмидных ДНК векторов экспрессии может использоваться для получения представляющего интерес антигена in vivo у мышей, крыс и кроликов, и, таким образом, индуцирует антигенспецифичные антитела (Tang et al, Nature 356(6365): 152-4 (1992); Tighe et al, Immunol. Today 19(2) 89-97 (1998); Bates et al, Biotechniques, 40(2) 199-208 (2006)). Это обеспечивает эффективное получение высокого титра антигенспецифичных антител. Антитела также могут быть получены методами in vitro. Подходящие примеры включают, без ограничения этим, технологии гибридом, фаговый дисплей, дрожжевой дисплей и т.п.

Наборы

В некоторых вариантах осуществления набор представляет собой тест ОТ-ПЦР в реальном времени, например, набор является тестом ОТ-кПЦР в реальном времени.

В некоторых вариантах осуществления набор предназначен для обнаружения коронавируса в биологическом образце рыбы. В предпочтительных вариантах осуществления набор предназначен для обнаружения торовируса в биологическом образце рыбы. В более предпочтительных вариантах осуществления набор предназначен для обнаружения торовируса в биологическом образце пинагора.

Медицинские применения и вакцины

В другом аспекте изобретение относится к антителу для применения в лечении рыбы, в частности пинагора, от заболевания, вызванного коронавирусной, в частности торовирусной, инфекцией. В предпочтительном варианте осуществления антитело предназначено для применения в лечении рыбы, в частности пинагора, от заболевания, вызванного вирусом, раскрытым в настоящем изобретении (CLuCV). Антитело связывает полипептид, кодируемый последовательностью нуклеиновой кислоты, содержащейся в геноме вируса, раскрытого в настоящем изобретении.

В предпочтительных вариантах осуществления рыбой является пинагор.

В некоторых вариантах осуществления у рыбы наблюдаются следующие симптомы:

(i) повреждение ткани в кишечнике, и/или

(ii) диарея.

В других вариантах осуществления у рыбы дополнительно наблюдаются симптомы анорексии.

Симптомы могут быть определены, как описано выше.

В другом аспекте изобретение относится к применению вируса, раскрытого в настоящем изобретении, для получения вакцины против заболевания, вызванного указанным вирусом.

В некоторых вариантах осуществления вакцина содержит несколько вирусных полипептидов, например, первый полипептид, включающий аминокислотную последовательность, которая по меньшей мере на 80% идентична SEQ ID NO: 7, и второй полипептид, включающий аминокислотную последовательность, которая по меньшей мере на 80% идентична SEQ ID NO: 8. Вакцина может содержать один, два, три, четыре или пять вирусных полипептидов.

Вакцина для защиты рыбы, в частности пинагора, от заболевания, вызванного коронавирусной, в частности торовирусной, инфекцией. В предпочтительном варианте осуществления вакцина предназначена для защиты рыбы, в частности пинагора, от заболевания, вызванного заражением вирусом, раскрытым в настоящем изобретении (CLuCV).

В некоторых вариантах осуществления, где вакцина включает последовательность нуклеиновой кислоты, содержащуюся в геноме вируса, раскрытого в настоящем изобретении, указанная последовательность нуклеиновой кислоты включает по меньшей мере одну из ORF-1, ORF-2, ORF-3, ORF-4 или ORF-5 согласно любому из их вариантов осуществления, раскрытых в настоящем изобретении. В предпочтительных вариантах осуществления, где вакцина включает последовательность нуклеиновой кислоты, содержащуюся в геноме вируса, раскрытого в настоящем изобретении, указанная последовательность нуклеиновой кислоты включает по меньшей мере ORF-1, ORF-2, ORF-3 и ORF-4 согласно любому из их вариантов осуществления, раскрытых в настоящем изобретении. В некоторых вариантах осуществления, где вакцина включает последовательность нуклеиновой кислоты, содержащуюся в геноме вируса, раскрытого в настоящем изобретении, указанная последовательность нуклеиновой кислоты является или комплементарна последовательности нуклеиновой кислоты, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична последовательности вирусного генома согласно SEQ ID NO: 6 (CLuCV).

Нуклеиновой кислотой может быть ДНК или РНК.

В некоторых вариантах осуществления, где вакцина включает вирусный полипептид, кодируемый последовательностью нуклеиновой кислоты, которая содержится в геноме вируса, раскрытого в настоящем изобретении, указанный полипептид выбран из группы, состоящей из:

В некоторых вариантах осуществления, где вакцина включает вирус, раскрытый в настоящем изобретении, геном указанного вируса включает последовательность нуклеиновой кислоты, которая является РНК последовательностью нуклеиновой кислоты, включающей по меньшей мере одну из ORF-1, ORF-2, ORF-3, ORF-4 или ORF-5 согласно любому из их вариантов осуществления, раскрытых в настоящем изобретении. В некоторых вариантах осуществления, где вакцина включает вирус, раскрытый в настоящем изобретении, геном указанного вируса включает последовательность нуклеиновой кислоты, которая является РНК последовательностью нуклеиновой кислоты, которая представляет собой или комплементарна последовательности нуклеиновой кислоты, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно на 98%, особенно предпочтительно на 99% или даже на 100% идентична последовательности вирусного генома согласно SEQ ID NO: 6 (CLuCV).

В некоторых вариантах осуществления вакцина включает количество антигена, которое составляет в пределах 0,05-1,0 мг/мл, такое как от 0,1 до 0,5 мг/мл, от 0,15 до 0,4 мг/мл или от 0,2 до 0,3 мг/мл. Вакцина может быть предназначена для введения в дозах 0,005-0,5 мг/индивид, предпочтительно 0,01-0,05 мг/индивид, более предпочтительно 0,01-0,02 мг/индивид.

В некоторых вариантах осуществления вакцина включает количество антигена, соответствующее TCID₅₀ 10⁵-10¹⁰ на дозу, предпочтительно TCID₅₀ 10⁶-10⁹ на дозу.

Вакцина может находиться в форме суспензии вируса или может быть лиофилизированной. В лиофилизированную вакцину может потребоваться добавить один или больше стабилизаторов. Подходящие стабилизаторы представляют собой, например, углеводы, такие как сорбит, маннит, крахмал, сахарозу, декстран; белоксодержащие вещества, такие как бычья сыворотка или обезжиренное молоко; и буферные вещества, такие как фосфаты щелочных металлов.

Вакцина согласно изобретению также может быть в составе, включающем адъювант. Примерами адъювантов, часто применяемых при разведении рыбы и моллюсков, является мурамилдипептиды, липолисахариды, некоторые глюканы и гликаны, минеральное масло, Montanide™ и Carbopol^®. Обзор вспомогательных веществ, подходящих для применения в вакцинах для рыб, приведен в обзоре Sommerset (Expert Rev. Vaccines 4(1), 89-101 (2005)).

Вакцина согласно изобретению может дополнительно содержать подходящий фармацевтический носитель. В некоторых вариантах осуществления вакцина изготовлена в форме эмульсии типа вода в масле. Вакцина также может содержать так называемый "носитель". Носителем является такое средство, к которому прикреплен антиген, но не связан с ним ковалентно. Такие носители, помимо прочего, представляют собой биоразлагаемые нано/микрочастицы или капсулы PLGA (сополимер лактида и гликолевой кислоты), альгината или хитозана, липосомы, ниосомы, мицеллы, множественные эмульсии и макрозоли, известные в уровне техники. Особой формой такого носителя, в котором антиген частично заключен в носитель, является так называемый ISCOM.

Кроме того, вакцина может включать одно или больше подходящих поверхностно-активных соединений или эмульгаторов, например, Cremophore^®, Tween^® и Span^®. Кроме того, могут использоваться адъюванты, такие как интерлейкин, CpG и гликопротеины.

В некоторых вариантах осуществления вакцина представлена в виде корма для рыбы, при этом указанный корм может быть, например, гранулированным или экструдированным кормом.

В другом аспекте изобретение относится к молекуле интерферирующей РНК (иРНК) для применения в лечении рыбы, в частности пинагора, от заболевания, вызванного коронавирусной, в частности торовирусной, инфекцией. В предпочтительном варианте осуществления иРНК предназначена для применения в лечении рыбы, в частности пинагора, от заболевания, вызванного вирусом, раскрытым в настоящем изобретении (CLuCV). В конкретном варианте молекула иРНК включает по меньшей мере 12 (предпочтительно смежных) нуклеотидов из, или комплементарных, последовательности нуклеиновой кислоты, содержащейся в геноме вируса, раскрытого в настоящем изобретении.

(i) повреждение ткани в кишечнике, и/или

(ii) диарея.

В некоторых вариантах осуществления молекула иРНК включает по меньшей мере 12 (предпочтительно смежных) нуклеотидов из, или комплементарных, последовательности нуклеиновой кислоты, включающей ORF-1, ORF-2, ORF-3, ORF-4 или ORF-5 согласно любому из соответствующих вариантов осуществления, раскрытых в настоящем изобретении. В некоторых вариантах осуществления молекула иРНК включает по меньшей мере 12 (предпочтительно смежных) нуклеотидов из, или комплементарных, последовательности нуклеиновой кислоты, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно на 98%, особенно предпочтительно на 99% или даже на 100% идентична последовательности вирусного генома согласно SEQ ID NO: 6 (CLuCV).

Последовательности

Последовательности, указанные в настоящем описании, являются следующими (см. также Фигуры и список последовательностей):

Таблица 1

Sequence	Description
SEQ ID NO: 1	Нуклеотидная последовательность CLuCV_ORF-1 (полипротеин)
SEQ ID NO: 2	Нуклеотидная последовательность CLuCV_ORF-2 (спайковый гликопротеин)
SEQ ID NO: 3	Нуклеотидная последовательность CLuCV_ORF-3 (мембранный белок)
SEQ ID NO: 4	Нуклеотидная последовательность CLuCV_ORF-4 (нуклеокапсид)
SEQ ID NO: 5	Нуклеотидная последовательность CLuCV_ORF-5 (неизвестный)
SEQ ID NO: 6	Нуклеотидная последовательность генома CLuCV
SEQ ID NO: 7	Аминокислотная последовательность CLuCV_ORF-1 (полипротеин)
SEQ ID NO: 8	Аминокислотная последовательность CLuCV_ORF-2 (спайковый гликопротеин)
SEQ ID NO: 9	Аминокислотная последовательность CLuCV_ORF-3 (мембранный белок)
SEQ ID NO: 10	Аминокислотная последовательность CLuCV_ORF-4 (нуклеокапсид)
SEQ ID NO: 11	Аминокислотная последовательность CLuCV_ORF-5 (неизвестный)
SEQ ID NO: 12	Прямой праймер TCL-ORF-1
SEQ ID NO: 13	Taqman зонд TCL-ORF-1
SEQ ID NO: 14	Обратный праймер TCL-ORF-1
SEQ ID NO: 15	Прямой праймер TCL-M
SEQ ID NO: 16	Taqman зонд TCL-M
SEQ ID NO: 17	Обратный праймер TCL-M
SEQ ID NO: 18	Прямой праймер TCL-S
SEQ ID NO: 19	Taqman зонд TCL-S
SEQ ID NO: 20	Обратный праймер TCL-S

Дополнительные полезные праймеры, указанные в настоящем изобретении, представлены в Таблице 2 ниже:

SEQ ID NO:	Название праймера	последовательность праймера
24	TCL_F1	CAGTCCACCAACACAACGTG
25	TCL_R1	CCCAAGTGTCGCTTTGCATC
26	TCL_F2	CCAACAAAGGAGCCGCAATC
27	TCL_R2	GCACATGTTTGGTGGGTGTC
28	TCL_F3	GACACCCACCAAACATGTGC
29	TCL_R3	GCCAAACGGAGGTCTGGATT
30	TCL_F4	AATCCAGACCTCCGTTTGGC
31	TCL_R4	TCAATACCTCGAGCGCAGAC
32	TCL_F5	TGTCTGCGCTCGAGGTATTG
33	TCL_R5	TTTGTTCAGGGGTGGTGTCC
34	TCL_F6	TCTGACGACAAACCGGACAC
35	TCL_R6	AGCCGCTGGGATTACTTCAC
36	TCL_F7	TTCCTAGCAACCCGCTTTCA
37	TCL_R7	AGCGGTTTTCTTTTCCGTCG
38	TCL_F8	CGACGGAAAAGAAAACCGCT
39	TCL_R8	ACTACGGCTACTGGGGTTC
40	TCL_F9	CCCCAGTAGCCGTAGTTGAC
41	TCL_R9	TCATGCCGGAGATTTTGCCT
42	TCL_F10	AGGCAAAATCTCCGGCATGA
43	TCL_R10	AGATGAGCCGTCAGCAAACA
44	TCL_F11	TGTTTGCTGACGGCTCATCT
45	TCL_R11	TGCGTTTGCTCTGTCGTAGT
46	TCL_F12	ACTACGACAGAGCAAACGCA
47	TCL_R12	ATAGAGCGCAAGCCGTAGAC
48	TCL_F13	GTCTACGGCTTGCGCTCTAT
49	TCL_R13	GCCAGTAACACCATGTCCCA
50	TCL_F14	TGGGACATGGTGTTACTGGC
51	TCL_R14	AACGCTGTTACGCGGTTTTC
52	TCL_F15	GAAAACCGCGTAACAGCGTT
53	TCL_R15	CTGGCATCGTGTTGTGTGTG
54	TCL_F16	CACACACAACACGATGCCAG
55	TCL_R16	TAGACCCGCACTACCACACT
56	TCL_F17	AGTGTGGTAGTGCGGGTCTA
57	TCL_R17	TTTTATGACCACGTCCGCCA
58	TCL_F18	TGGCGGACGTGGTCATAAAA
59	TCL_R18	CTGCAGCTCCTCTGGTTTCA
60	TCL_F19	TGAAACCAGAGGAGCTGCAG
61	TCL_R19	GCCGAAGCTATTGTGAGGGT
62	TCL_F20	ACCCTCACAATAGCTTCGGC
63	TCL_R20	CGGAAAAACAACAGCCGAGG
64	TCL_F21	CCTCGGCTGTTGTTTTTCCG
65	TCL_R21	TGGGTCAGTAGGTGCGAGTA
66	TCL_F22	TACTCGCACCTACTGACCCA
67	TCL_R22	GGAGCCAACCGAGGATAAGG
68	TCL_F23	TGGCATGGGTTCGTCCTTTT
69	TCL_R23	GGTACCTTTCGCAATGACGC
70	TCL_F24	GCGTCATTGCGAAAGGTACC
71	TCL_R24	ACCCTCCGCCATTGTTGAAT
72	TCL_F25	ATTCCAACCATCGCGGTTCT
73	TCL_R25	TTCGCCTTGATACCAGCGTT
74	TCL_F26	ACGCTGGTATCAAGGCGAAA
75	TCL_R26	ATCCAGGAGTTAACGTCGGC
76	TCL_F27	GCCGACGTTAACTCCTGGAT
77	TCL_R27	AGGTCAGAACAAGGGAGGCTA
78	Анализ 1 мембраны праймер 1	CATCTACCTCTCCCATACTC
79	Анализ 1 мембраны праймер 2	ACTGCTTCCAAAACTGATTACCT
80	Анализ 1 мембраны праймер 3	GGGCGTAAAGAGAATGTAAG

Другие олигонуклеотидные праймеры, указанные в настоящем изобретении, представлены в Таблице 3:

SEQ ID NO	последовательность праймера
21	TAATTTGACTGACTATAG
22	TAAGAAACTATACCAGTCCATGTCG
23	AGTTTAAGTGAG

Примеры

Следующие примеры иллюстрируют настоящее изобретение. Они предназначены для помощи в понимании изобретения и не должны рассматриваться в качестве какого-либо ограничения объема изобретения.

Пример 1: Идентификация CLuCV

Образцы рыбы получали на предприятии по разведению пинагора (Cyclopterus lumpus), которое столкнулось с высокой смертностью (60-80%). Образцы исследовали с помощью стандартного ОТ-ПЦР в реальном времени и гистологического исследования. С помощью ОТ-ПЦР в реальном времени не обнаружили никаких известных патогенов. Гистологическое исследование показало симптомы повреждения ткани в кишечнике у пораженных особей, однако при этом не наблюдали никаких потенциально патогенных бактерий и микропаразитов.

Суммарную РНК выделяли из погибающей рыбы с использованием методики экстракции фенолом/хлороформом (набор Qiagen RNeasy® 96 Universal Tissue Kit) и использовали эту РНК в качестве матрицы в анализе методом секвенирования следующего поколения (NGS). Анализ NGS, который проводили в компании BaseClear (https://www.baseclear.com/), дал приблизительно 98 миллионов чтений последовательностей, большинство из которых происходили из транскриптома хозяина. Приблизительно 28600 собранных чтений, полученных в анализе NGS, как обнаружили, не показали никакого значимого совпадения нуклеотидов в базе GenBank Национального центра биотехнологической информации США (NCBI). На основе этих чтений авторами изобретения была идентифицирована и исследована последовательность нового вируса, называемого в настоящем изобретении коронавирусом Cyclopterus lumpus или CLuCV. Последовательности ДНК, полученные в результате анализа NGS, предоставлены на Фигурах 2-5 (см. также SEQ ID NO: 1-6). Однако следует понимать, что в вирусе CLuCV присутствуют соответствующие последовательности РНК.

Было установлено, что последовательность CLuCV имеет длину 24613 нуклеотидов и содержит пять возможных открытых рамок считывания (ORF). Схема показана на Фигуре 1. Родство между CLuCV и другими известными вирусами может быть определено только при сравнении транслированных аминокислотных последовательностей. Длина и организация генома в сочетании с последующим анализом последовательности указывают, что это - новый торовирус из семейства Coronaviridae, к которому наиболее близок вирус Берн (выделенный у лошадей).

Предварительные результаты указывают, что, по меньшей мере в Норвегии, CLuCV демонстрирует значимое присутствие в аквакультурах пинагора.

Патология, связанная с CLuTV у пинагора, показана на Фигурах 9-12. Секционный материал пинагора окрашивали с использованием гистологической окраски гематоксилином и эозином (Г-Э). Фигура 9 представляет собой цельный срез пораженного пинагора, на котором показано накопление жидкости в желудке (стрелка). Фигура 10 представляет собой срез кишечника пинагора, на котором показано накопление слизи и выброс клеточного содержимого (стрелки). Фигура 11 представляет собой срез кишечника пинагора, на котором показано накопление слизи (стрелка) и выброс клеточного содержимого. Фигура 12 представляет собой срез кишечника пинагора, на котором показано накопление слизи (стрелка).

Пример 2: Анализ нуклеотидой последовательности CLuCV

При выполнении стандартного поиска нуклеотидных последовательностей в BLAST с использованием последовательности CLuCV, в базе GeneBank NCBI не было обнаружено никаких совпадений. При изменении параметров поиска с включением в поиск более отличающихся последовательностей, были обнаружены некоторые области последовательности из других известных вирусов. Процент идентичности нуклеотидной последовательности ("Seq. Id.") между этими областями CLuCV и областями из других известных вирусов показан в Таблице 2.

Таблица 2. Наилучшее совпадение нуклеотидной последовательности, обнаруженное между CLuCV и известными вирусами в GeneBank NCBI

CL_VirusB область		Наилучшее совпадение областей последовательности (NCBI GeneBank)
Начало	Конец	Начало	Конец	пн	Seq. Id. (%)	Рег. номер	Описание
11266	12315	15788	16837	1069	64%	MG996765	Вирус Берн, изолят P138/72
11266	12315	2314	3363	1069	64%	X52374	мРНК RdRp вируса Берн
11366	11893	15040	15931	535	67%	KM403390	Торовирус свиней, штамм PToV/NPL/2014
11366	11893	15400	15874	536	66%	JQ860350	Торовирус свиней, штамм SHI
11256	11849	15443	16036	601	65%	AY427798	Вирус Бреда, штамм Breda 1

Пример 3: Анализ аминокислотной последовательности CLuCV

Трансляция последовательностей ORF CLuCV дает в общей сложности пять потенциальных белков. Идентичность аминокислотных последовательностей ORF CLuCV с другими известными белками других вирусов показана в Таблице 3. Представлены только наилучшие совпадения для каждой ORF.

Таблица 3. Наилучшие совпадения аминокислотной последовательности, обнаруженные между CLuCV и известными вирусами в NCBI GeneBank

CL_VirusB		Наилучшее совпадение ак последовательности (NCBI GeneBank)
ORF	Амино-кислоты	Общий балл	Охват запроса	E-значение	Id. (%)	Рег. номер	Описание
ORF01	5867	2017	64%	0,0	39%	AWV66923	Полипротеин 1ab, вирус Берн
ORF02	1391	435	54%	8,00E-125	34%	CAE01338	Спайковый гликопротеин, торовирус свиней
ORF03	260	42,4	71%	0,007	26%	YP337908	Мембранный гликопротеин, вирус Бреда
ORF04	201	NA	NA	NA	NA	NA	Нет совпадений
ORF05	113	NA	NA	NA	NA	NA	Нет совпадений

ORF-1 соответствует полипротеину. ORF-2 соответствует спайковому гликопротеину. ORF-3 соответствует мембранному гликопротеину. ORF-4 соответствует белку нуклеокапсида. ORF-5 соответствует неизвестному белку.

Пример 4: Оценка присутствия CLuCV в культурных популяциях пинагора

Были разработаны три отдельных анализа ОТ-ПЦР в реальном времени (TCL-ORF-1, TCL-M и TCL-S) с использованием праймеров согласно SEQ ID NO: 12-14, 15-17 и 18-20, соответственно. TCL-ORF-1 направлен на ORF-1, TCL-M направлен на ORF-3 (мембранный белок), и TCL-S направлен на ORF-2 (спайковый гликопротеин). С помощью всех трех анализов было подтверждено, что исходный материал образцов рыбы был положительным на CLuCV.

Для более широкого исследования анализ TCL-ORF-1 выбрали для оценки присутствия CLuCV в существующих культурных популяциях пинагора. Результаты скрининга различных популяций пинагора в Норвегии показаны в Таблице 4.

Таблица 4. Результаты тестирования материала NGS и полевого материала

Скрининг популяций пинагора (Норвегия)
Округ	Образцы (N)	Положительные (N)	Распространение (%)
Финнмарк	60	5	8,3
Тромс	28	0	0,0
Мере	67	4	6,0
Тренделаг	64	19	29,7
Рогаланд	20	11	55,0
Вест-Агдер	60	3	5,0

Как показано в таблице, в некоторых популяциях пинагора, в особенности в округах Тренделаг и Рогаланд, наблюдается высокая распространенность CLuCV.

Ввиду представленного в настоящем изобретении описания нужно понимать, что настоящее изобретение также охватывает следующие объекты :

1. Нуклеиновая кислота, где последовательность указанной нуклеиновой кислоты включает:

(a) по меньшей мере одну последовательность открытой рамки считывания (ORF), выбранной из группы, состоящей из ORF-1, ORF-2, ORF-3, ORF-4 и ORF-5, или

(b) последовательность, комплементарную ей;

где

2. Нуклеиновая кислота по пункту 1, где:

3. Нуклеиновая кислота по пункту 1 или 2, где:

4. Нуклеиновая кислота по любому из пунктов 1-3, где:

5. Нуклеиновая кислота по любому из пунктов 1-4, где:

6. Нуклеиновая кислота по любому из пунктов 1-5, где:

7. Нуклеиновая кислота по любому из пунктов 1-6, где:

ORF-1 на 100% идентична последовательности нуклеиновой кислоты SEQ ID NO: 1,

ORF-2 на 100% идентична последовательности нуклеиновой кислоты SEQ ID NO: 2,

ORF-3 на 100% идентичен последовательности нуклеиновой кислоты SEQ ID NO: 3,

ORF-4 на 100% идентична последовательности нуклеиновой кислоты SEQ ID NO: 4, и

ORF-5 на 100% идентична последовательности нуклеиновой кислоты SEQ ID NO: 5.

8. Нуклеиновая кислота, где последовательность указанной нуклеиновой кислоты по меньшей мере на 80% идентична соответствующей последовательности, присутствующей в SEQ ID NO: 6, предпочтительно по меньшей мере на 85% идентична, более предпочтительно по меньшей мере на 90% идентична, еще более предпочтительно по меньшей мере на 95% идентична, еще более предпочтительно по меньшей мере на 98% идентична, еще более предпочтительно по меньшей мере на 99% идентична, и особенно предпочтительно на 100% идентична.

9. Нуклеиновая кислота, где последовательность указанной нуклеиновой кислоты по меньшей мере на 80% идентична соответствующей последовательности, присутствующей в последовательности, которая комплементарна SEQ ID NO: 6, предпочтительно по меньшей мере на 85% идентична, более предпочтительно по меньшей мере на 90% идентична, еще более предпочтительно по меньшей мере на 95% идентична, еще более предпочтительно по меньшей мере на 98% идентична, еще более предпочтительно по меньшей мере на 99% идентична, и особенно предпочтительно на 100% идентична.

10. Нуклеиновая кислота по пунктам 8 или 9, где последовательность указанной нуклеиновой кислоты включает 200 нуклеотидов или меньше.

11. Нуклеиновая кислота по любому из пунктов 8-10, где последовательность указанной нуклеиновой кислоты включает по меньшей мере 60 нуклеотидов.

12. Нуклеиновая кислота по пункту 11, где последовательность указанной нуклеиновой кислоты включает по меньшей мере 100 нуклеотидов, предпочтительно по меньшей мере 150 нуклеотидов.

13. Нуклеиновая кислота по пункту 8 или 9, где последовательность указанной нуклеиновой кислоты включает по меньшей мере 200 нуклеотидов.

14. Применение нуклеиновой кислоты по любому из пунктов 1-13:

(a) в качестве гибридизационного зонда;

(b) для обнаружения вируса, раскрытого в настоящем изобретении, в биологическом образце рыбы, в частности пинагора;

(c) в способе обнаружения вируса, который инфицирует и способен вызывать гибель рыбы, в частности пинагора;

(d) в способе обнаружения вируса, который инфицирует и способен вызывать гибель рыбы, в частности пинагора, согласно любому из соответствующих способов, раскрытых в настоящем изобретении;

(e) для изготовления вакцины для защиты рыбы, в частности пинагора, от заболевания, вызванного коронавирусной, в частности торовирусной, инфекцией; или

(f) для изготовления вакцины для защиты рыбы, в частности пинагора, от заболевания, вызванного вирусом, раскрытым в настоящем изобретении, таким как вирус по пунктам 18-25 ниже.

15. Нуклеиновая кислота по пункту 1, где последовательность указанной нуклеиновой кислоты включает по меньшей мере ORF-1, ORF-2, ORF-3 и ORF-4, как определено в любом из пунктов 1-7, или последовательность, которая комплементарна ей.

16. Нуклеиновая кислота по пункту 1, где последовательность указанной нуклеиновой кислоты по меньшей мере на 80% идентична вирусному геному согласно SEQ ID NO: 6, предпочтительно по меньшей мере на 85% идентична, более предпочтительно по меньшей мере на 90% идентична, еще более предпочтительно по меньшей мере на 95% идентична, еще более предпочтительно по меньшей мере на 98% идентична, еще более предпочтительно по меньшей мере на 99% идентична, и особенно предпочтительно на 100% идентична.

17. Нуклеиновая кислота по пункту 1, где последовательность указанной нуклеиновой кислоты по меньшей мере на 80% идентична последовательности, которая комплементарна SEQ ID NO: 6, предпочтительно по меньшей мере на 85% идентична, более предпочтительно по меньшей мере на 90% идентична, еще более предпочтительно по меньшей мере на 95% идентична, еще более предпочтительно по меньшей мере на 98% идентична, еще более предпочтительно по меньшей мере на 99% идентична, и особенно предпочтительно на 100% идентична.

18. Вирус, в частности вирус, который инфицирует и способен вызывать гибель пинагора (такого как Cyclopterus lumpus), где вирусный геном включает последовательность нуклеиновой кислоты по любому из пунктов 1-13 и 15-17, где указанная последовательность нуклеиновой кислоты, содержащаяся в вирусном геноме, содержит основание урацил (U) вместо основания тимина (T).

19. Вирус по пункту 18, где заражение пинагора вирусом вызывает у рыбы следующие симптомы:

(i) повреждение ткани в кишечнике, и/или

(ii) диарею.

20. Вирус, включающий одну или больше, предпочтительно две или больше, более предпочтительно три или больше, более предпочтительно четыре или больше, еще более предпочтительно пять из ORF 1-5, где указанные ORF 1-5 кодируют вирусные полипептиды SEQ ID NO 7-11, соответственно, или вирусные полипептиды, которые по меньшей мере на 80% идентичны SEQ ID NO 7-11, соответственно.

21. Вирус по пункту 20, где указанные ORF 1-5 кодируют вирусные полипептиды SEQ ID NO 7-11, соответственно, или вирусные полипептиды, которые по меньшей мере на 90% идентичны SEQ ID NO 7-11, соответственно.

22. Вирус по пункту 20, где указанные ORF 1-5 кодируют вирусные полипептиды SEQ ID NO 7-11, соответственно, или вирусные полипептиды, которые по меньшей мере на 95% идентичны SEQ ID NO 7-11, соответственно.

23. Вирус по любому из пунктов 20-22, где указанные ORF 1-5 кодируют вирусные полипептиды, которые представляют собой содержащие консервативные замены варианты SEQ ID NO 7-11, соответственно.

24. Вирус по любому из пунктов 18-23, где вирус является оболочечным вирусом.

25. Вирус по любому из пунктов 18-24, где вирус является коронавирусом, предпочтительно торовирусом.

26. Олигонуклеотидный праймер, включающий последовательность по меньшей мере из 9 последовательных нуклеотидов, предпочтительно по меньшей мере из 12 последовательных нуклеотидов, более предпочтительно по меньшей мере из 15 последовательных нуклеотидов, и особенно предпочтительно по меньшей мере из 18 последовательных нуклеотидов, где указанная последовательность содержится в геноме вируса по любому из пунктов 18-25, предпочтительно при условии, что указанный праймер не включает SEQ ID NO 21-23.

27. Олигонуклеотидный праймер, включающий последовательность по меньшей мере из 9 последовательных нуклеотидов, предпочтительно по меньшей мере из 12 последовательных нуклеотидов, более предпочтительно по меньшей мере из 15 последовательных нуклеотидов, и особенно предпочтительно по меньшей мере из 18 последовательных нуклеотидов, где указанная последовательность комплементарна последовательности нуклеиновой кислоты, содержащейся в геноме вируса по любому из пунктов 18-25, предпочтительно при условии, что указанный праймер не включает SEQ ID NO 21-23.

28. Олигонуклеотидный праймер, включающий последовательность по меньшей мере из 9 последовательных нуклеотидов, предпочтительно по меньшей мере из 12 последовательных нуклеотидов, более предпочтительно по меньшей мере из 15 последовательных нуклеотидов, и особенно предпочтительно по меньшей мере из 18 последовательных нуклеотидов, где указанная последовательность по меньшей мере на 80% идентична последовательности, содержащейся в SEQ ID NO: 6, предпочтительно при условии, что указанный праймер не включает SEQ ID NO 21-23.

29. Олигонуклеотидный праймер, включающий последовательность по меньшей мере из 9 последовательных нуклеотидов, предпочтительно по меньшей мере из 12 последовательных нуклеотидов, более предпочтительно по меньшей мере из 15 последовательных нуклеотидов, и особенно предпочтительно по меньшей мере из 18 последовательных нуклеотидов, где указанная последовательность по меньшей мере на 80% идентична последовательности, содержащейся в последовательности, комплементарной SEQ ID NO: 6, предпочтительно при условии, что указанный праймер не включает SEQ ID NO 21-23.

30. Олигонуклеотидный праймер по пункту 28 или 29, где указанный процент идентичности последовательности составляет по меньшей мере 85%, предпочтительно по меньшей мере 90%, более предпочтительно по меньшей мере 95%, еще более предпочтительно по меньшей мере 98%, еще более предпочтительно по меньшей мере 99% и особенно предпочтительно 100%.

31. Олигонуклеотидный праймер по любому из пунктов 26-30, где указанный олигонуклеотидный праймер имеет длину 9-60 нуклеотидов, предпочтительно длину 12-40 нуклеотидов, более предпочтительно длину 15-30 нуклеотидов, особенно предпочтительно длину 18-25 нуклеотидов.

32. Олигонуклеотидный праймер по любому из пунктов 26-28, где указанная последовательность, содержащаяся в нем, представляет собой часть или комплементарна части референсной последовательности нуклеиновой кислоты, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 или SEQ ID NO: 6.

33. Олигонуклеотидный праймер, который включает по меньшей мере 9 последовательных нуклеотидов, предпочтительно по меньшей мере 12 последовательных нуклеотидов, более предпочтительно по меньшей мере 15 последовательных нуклеотидов и особенно предпочтительно по меньшей мере 18 последовательных нуклеотидов последовательности, которая по меньшей мере на 80% идентична последовательности, которая представляет собой или комплементарна последовательности, выбранной из группы, состоящей из SEQ ID NO: 12 - SEQ ID NO: 80, предпочтительно при условии, что указанный праймер не включает SEQ ID NO 21-23.

34. Применение по меньшей мере одного олигонуклеотидного праймера в способе обнаружения вируса по любому из пунктов 18-25, где по меньшей мере один праймер включает последовательность по меньшей мере из 9 последовательных нуклеотидов, предпочтительно по меньшей мере из 12 последовательных нуклеотидов, более предпочтительно по меньшей мере из 15 последовательных нуклеотидов, и особенно предпочтительно по меньшей мере из 18 последовательных нуклеотидов, и где указанная последовательность комплементарна последовательности нуклеиновой кислоты, которая содержится в геноме указанного вируса, предпочтительно при условии, что указанный праймер не включает SEQ ID NO 21-23.

35. Применение по меньшей мере одной нуклеиновой кислоты по любому из пунктов 1-13 или 15-17, или по меньшей мере одного олигонуклеотидного праймера по любому из пунктов 26-34, в способе обнаружения вируса рыб, необязательно где вирус инфицирует и способен вызывать гибель пинагора.

36. Применение по пункту 35, где указанная нуклеиновая кислота или указанный олигонуклеотидный праймер применяется в способе обнаружения вируса по любому из пунктов 18-24.

37. Способ обнаружения вируса, который инфицирует и способен вызывать гибель рыбы, в частности пинагора, включающий следующие стадии:

(a) контакт нуклеиновой кислоты, выделенной из биологического образца рыбы, по меньшей мере с одним олигонуклеотидным праймером, с получением смеси, где по меньшей мере один олигонуклеотидный праймер комплементарен последовательности нуклеиновой кислоты, которая содержится в геноме вируса по любому из пунктов 18-24,

(b) определение, присутствует ли при амплификации смеси a) продукт амплификации, где присутствие продукта амплификации указывает на присутствие РНК, ассоциированной с вирусом, и, следовательно, на присутствие вируса в биологическом образце.

38. Способ по пункту 37, где олигонуклеотидный праймер является олигонуклеотидным праймером по любому из пунктов 26-34.

39. Способ по пунктам 37 или 38, где нуклеиновую кислоту на стадии (a) способа, например РНК, выделяют из биологических образцов при помощи твердофазной экстракции, например, очистки на колонке с помощью твердой фазы мембраны с силикагелем.

40. Способ по любому из пунктов 37-38, где нуклеиновую кислоту на стадии (a) способа, например РНК, выделяют из биологических образцов с помощью экстракции фенолом/хлороформом.

41. Способ обнаружения вируса, который инфицирует и способен вызывать гибель рыбы, в частности пинагора, включающий следующие стадии:

(b) сравнение полученной последовательности нуклеиновой кислоты с последовательностью нуклеиновой кислоты, которая представляет собой или комплементарна референсной последовательности, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 и SEQ ID NO: 6, где по меньшей мере 80% идентичность последовательности между двумя последовательностями указывает на присутствие вируса в биологическом образце.

42. Способ по пункту 41, где процент идентичности последовательности между двумя последовательностями, который указывает на присутствие вируса в биологическом образце, составляет по меньшей мере 85%, предпочтительно по меньшей мере 90%, более предпочтительно по меньшей мере 95%, еще более предпочтительно по меньшей мере 98%, еще более предпочтительно по меньшей мере 99% и наиболее предпочтительно 100%.

43. Вирусный полипептид, включающий аминокислотную последовательность, которая по меньшей мере на 80% идентична любой из SEQ ID NO 7-11.

44. Вирусный полипептид по пункту 43, включающий аминокислотную последовательность, которая по меньшей мере на 90% идентична любой из SEQ ID NO 7-11.

45. Вирусный полипептид по пункту 43 или 44, включающий аминокислотную последовательность, которая по меньшей мере на 95% идентична любой из SEQ ID NO 7-11.

46. Вирусный полипептид по любому из пунктов 43-45, включающий аминокислотную последовательность, включающую любую из SEQ ID NO: 7-11, или ее вариант, содержащий консервативную замену.

47. Вирусный полипептид по любому из пунктов 43-45, включающий аминокислотную последовательность, включающую SEQ ID NO 7-11.

48. Антитело, которое связывает полипептид, где полипептид кодируется последовательностью нуклеиновой кислоты, которая содержится в геноме вируса по любому из пунктов 18-25, или является вирусным полипептидом, кодируемым нуклеиновой кислотой по любому из пунктов 1-13 и 15-17.

49. Антитело, которое связывает полипептид, выбранный из группы, состоящей из:

(i) полипептида, включающего аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична SEQ ID NO: 7;

(ii) полипептида, включающего аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична SEQ ID NO: 8;

(iii) полипептида, включающего аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична SEQ ID NO: 9;

(iv) полипептида, включающего аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична SEQ ID NO: 10; и

(v) полипептида, включающего аминокислотную последовательность, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно по меньшей мере на 98%, особенно предпочтительно по меньшей мере на 99% или даже на 100% идентична SEQ ID NO: 11.

50. Набор для обнаружения вируса в биологическом образце рыбы, где набор включает нуклеиновую кислоту по любому из пунктов 1-13 или 15-17, олигонуклеотидный праймер по любому из пунктов 26-34 и/или антитело по пункту 48 или по пункту 49.

51. Набор по пункту 50, где набор подходит для поведения или предназначен для применения при проведении анализа ОТ-ПЦР в реальном времени.

52. Антитело по пункту 49 или по пункту 48 для применения в лечении рыбы, инфицированной вирусом, в частности пинагора.

53. Антитело по пункту 452, где вирус является вирусом по любому из пунктов 18-25.

54. Применение вируса по любому из пунктов 18-25 для изготовления вакцины.

55. Вакцина, включающая:

(i) последовательность нуклеиновой кислоты, которая содержится в геноме вируса по любому из пунктов 18-25;

(ii) последовательность нуклеиновой кислоты по любому из пунктов 1-13 или 15-17;

(iii) вирусный полипептид, кодируемый последовательностью нуклеиновой кислоты, содержащейся в геноме вируса по любому из пунктов 18-25;

(iv) вирусный полипептид, кодируемый последовательностью нуклеиновой кислоты по любому из пунктов 1-13 или 15-17;

(v) вирусный полипептид по любому из пунктов 43-47, или

(vi) вирус по любому из пунктов 18-25.

56. Вакцина по пункту 55, где последовательность нуклеиновой кислоты является последовательностью нуклеиновой кислоты, указанной в любом из пунктов 1-13 или 17, где указанная последовательность нуклеиновой кислоты содержит основание урацил (U) вместо основания тимина (T).

57. Молекула интерферирующей РНК (иРНК) для применения в лечении рыбы, инфицированной вирусом, в частности пинагора, где молекула иРНК включает по меньшей мере 12 (предпочтительно смежных) нуклеотидов, или комплементарна, последовательности нуклеиновой кислоты, содержащейся в геноме вируса по любому из пунктов 18-25.

58. Молекула интерферирующей РНК (иРНК) для применения в лечении рыбы, инфицированной вирусом, в частности пинагора, где молекула иРНК включает по меньшей мере 12 (предпочтительно смежных) нуклеотидов, или комплементарна, последовательности нуклеиновой кислоты, которая по меньшей мере на 80%, предпочтительно по меньшей мере на 85%, более предпочтительно по меньшей мере на 90%, еще более предпочтительно по меньшей мере на 95%, еще более предпочтительно на 98%, особенно предпочтительно на 99% или даже на 100% идентична последовательности вирусного генома согласно SEQ ID NO: 6 (CLuCV).

59. Интерферирующая РНК по пункту 58 или по пункту 57, где указанная молекула иРНК включает по меньшей мере 15 и более предпочтительно по меньшей мере 18 из указанных (предпочтительно смежных) нуклеотидов.

Специалисты в данной области поймут или смогут определить, при использовании не более чем рутинных экспериментов и/или общедоступных знаний, многочисленные эквиваленты конкретных аспектов, объектов и вариантов осуществления, раскрытых в настоящем изобретении как в примерах, так и в основной части всего патентного описания. Предполагается, что такие эквиваленты входят в объем данного изобретения и должны быть охвачены следующей формулой изобретения, или любой формулой изобретения, которой могут придерживаться на основании настоящего описания.

--->

СПИСОК ПОСЛЕДОВАТЕЛЬНОСТЕЙ

<110> Pharmaq Analytiq

<120> Новый коронавирус рыб

<130> ZOE20235PCT

<160> 80

<170> BiSSAP 1.3.6

<210> 1

<211> 17601

<212> ДНК

<213> Вирусы

<220>

<223> нуклеотидная последовательность ORF-1 ("n" в положениях 2490-2503, 2523,

2524 и 9771 обозначает любое основание)

<400> 1

atgaaaaaaa ttgaagatgc tttaggaaca cttaaacctg cctttaaggc acacatagac 60

tctctacctc ctttcatggg aaaactagcc acaatgctag ctgagacaag acgaggaaaa 120

actccccctc ttttgatcta tgtcatatca acaattttgg aaacgaatat tacagttcat 180

tatgtcagcc acacaataac ttcataccat tcttcaaacg cacacactca cactcatgaa 240

ttcgactcag aagattacac tcctgacaat cagattttaa ctaaagtcaa ccgacatggt 300

aatgacctta atcattcata tatccatggc gccaccaata tgtacaaccc tgtctaccag 360

agacacccac caaacatgtg ctacatgctt acgggactgt acatgttgtc aggcttacag 420

gaattgtatg ccatggctga agacaacttg acaacatgcc aaatcaacct tctcagatgt 480

ctgtttgatt tgaatcaaga tgaatttgat gtagattaca catttgtaat atacactcct 540

agcaaatctc aggagtgtgc cttcaaatat cttcaggaga tagtccacca ctgtgaactc 600

accattttta gacatacaac aacaagtgtc ttcagttgca acaaatgcaa ccatgtggaa 660

actgtcattt ctagttgttc tttgaatctt gtatatataa ctgattctat tgaaaaagca 720

tttcaaccca ctgtagaagc taataccgac tacatgtgtg aaaactgcgg tctacgcgac 780

cataaactta aaacaacagt aacaaatcca gacctccgtt tggcacaact aaactatcca 840

acggattcaa aatacactat ctttcttgat gaacaagctc cttttgtctt ccattccatt 900

gcaaaacacg ttggaactgc taattccgga cattggagtg cattgaatgt aaattcagat 960

atgttgtcag actctaacga gcgacaacat tattatacaa cacctagtat tgttttgctt 1020

gcatttcttc ctgaggaaga gctacagaac attagaaatt catcacctct tcaggaccat 1080

caaccagatg atgttgaaga cgttgaatct cccctaccag gttctatatt ttatactaca 1140

gatgacattt tttctactaa gagtctatcc atagctcact gtgtagcccg cgactttcac 1200

atgtccggcg gcatagcaaa aattttctca gataaattcg gctctaaaac tttcttgaaa 1260

tcacaaaacc ccgttatagg cggtttttcc attttactta gagagtgtcg tgacatgtac 1320

tacctcgtca caaaagagaa aacttcagat aagccgacat accaagacct taaaaactcc 1380

ttgggttcta tgacagagaa tttggttcgc aagaatcata atactctttc aattccatat 1440

ataggctgtg ggattgatgg tttacaatgg gcaaccgttg aaaaacaagt caaagaaatt 1500

gtctgcgctc gaggtattga tgtaacagtc caccacctcg aaaatgaagt taaacacact 1560

ccagaacaac aaacagcttc tgacaattca gtcaaattag ttcaaaaact ctttacagaa 1620

acacctcaag ctatacctat agttgttcct tcagatgact cagacagcga catagatgag 1680

tcagccgatg tctttttacc aggacctgaa tctgaatctg attcaaaatc agaatctggg 1740

tcagattacg actttaaatc ggcttctgaa ccagaagatg aattggagcc cactccaatc 1800

tctgaacttg aactaacacc agcgtcaagt ttaactgtag agtccgatga caatccagac 1860

acaagccagg aaacattacc agaatcaaac tctgaggaaa ccaaacctga gcaaacacct 1920

gacacaacat caaaggtgtc ctccgattcg aagcttgatc cacaatcaga attagaagaa 1980

gaactggcca acaaaccaga atcggcttct gaaccacaat ctgagactga atcgagttct 2040

gaatctgaag aggagcttga gccacaatca gaatcagagg aagaaccggc caacaaaccg 2100

gaatctcctt ctgaatcaca atctgaaaat ggatcgagtt ctgaacccga agaggagtct 2160

gaaaaaccat cggagtctgc tgaaacagca acagaggata gcccggaaac aacaccggaa 2220

acaaccttag agttaaccac acaactcaaa cctgcttcag aatctgacga caaaccggac 2280

acaccagcac catcaccttc accaattcaa ccagagaaaa acttggacac cacccctgaa 2340

caaacttcac aaccaaccac acaactggaa ttgacgttag aaacacagga acaaccagac 2400

actacaccag aagtgccatc tgtctcagaa gataaaccag acacacttga agaatcttct 2460

gaatcaacac cagaactctc agaattggan nnnnnnnnnn nnnccaccag taccaagacc 2520

tanngaacca gacctccaac acctagacca agatctgcac gtggagctag gactagatcc 2580

tgtgctggca cacctatacc agttattttt gatattatag ataatacaag ccagcctcaa 2640

gttccccttg acttcccaga agcactgcaa gaactgaaca aacctagtga agtaatccca 2700

gcggctagtg aaaaacctgt ggaaaaacaa ataatccata gttttgtaag tgtcgaaaca 2760

ccttgcaaac ccaaagccac taaagttacg aattatgtag ctgcacaatc taatgcaatt 2820

ctaaattgta ttaaggcttt cattcctagc aacccgcttt cactattcaa tagaaaacca 2880

gcttttagaa aaataatatt cactgaagac acttcagaac cagatagcga tgatgatgat 2940

tgtgaataca ctccaccaac atcaccattc cctgaacttc tggcattggt agatgaagac 3000

attgaagtag aacaaactca atctgtaatt ccaaaaacag actctgcttc aattgtggag 3060

gatcttaaaa aacaagaatc ctctactttg tcattggaca ccaacacatc gaaacctaca 3120

agctctccgc gaagacagcc tagggaagta gaaagtgttg atgaatccag tgatgactca 3180

tctaaaccaa aaacaatttc aacattagac aaacctgcta tgaatagtga cacgaaacct 3240

acagactctt cgcgaaaaga gcctctggaa gtaccagtta ctacatcttt aagcacccct 3300

gctaaaaacc aagataaaaa atcttcaaaa tctgcaaaag taataaaaga ctattctttg 3360

acccctaaca cagtcaaaca gcaagtctat tcactctacg gtgaatcagt agatgcagtt 3420

aaataccttg ttcaaacata cccagacagg gctaaacaaa cagctggtat tgcttatttc 3480

cttataacta cttatttaat atggaccatc ggtctcatag gagtaccaat ggcctttaaa 3540

ataccaatgt ttttatgtct tttataccaa gttaatggat taaatatagc accatttgtt 3600

actaaccaaa agttacaata tgttgcattt ccactttggt ataagctcta tgaagtaata 3660

tcagtccgtt ttgtggcgaa tatagcacaa tttattgtta aaacaccacc tatagatgtt 3720

ttaaacaagc taattcgttc taataaagac aagccagtca aattaacacc aaataaacat 3780

actttgatgt taattcatga cttagcttta gagtctgtcg acggaaaaga aaaccgctat 3840

tataatactg atgttacaac tttcacaaaa aggcatagca cttctaatat ttcatatgtt 3900

ctaaagtcta ctttaatcaa atatgtcatg gaccattgtt atgtaaatat tgcagttttt 3960

actttagtta gatacttaac tttattagtg tttattcaac atttctctaa tccttatgtt 4020

cttgaagcaa atagccaatc acataccgtt ttacagtatc tgttttcaca cttgagacca 4080

tttggaaggc ctttgtgccc aaccctcaat gactacatga cgacagcaac accacgcgat 4140

gcacatgtac aagcaggttc tcacttcagt gaattttgtg ttcctattca ttatacaaca 4200

ccaatcatta aaagcacaat ggcagaacca tcactttttc tactttttaa cccagtctta 4260

tggcctttgg ttatggttgt atatttttat cctccaatga tgtttatagc aaatgcagtc 4320

gcttattcat gccttccttt agtggtcttg ttacaatggc tttatgccat gtggttttct 4380

tgtacatgct atggcaccaa aagatgtgcc aagcatttgc ataaaaatga agtggttaaa 4440

ccaatggaat ccacttcaac taagaaccgc atgacattta ctccatcaac gaccttttgt 4500

agtaaacata acttcttctg tccagatgca ccacatataa tgactcttgc aatggctagg 4560

caacttacaa actactacaa tttgacagat acagtaatac ctgacatcca ggaatactcc 4620

cacgagaacc ctactgtaca atttattcac tttgatccac ttaaacacgg tgccgacaca 4680

attttggaac caattacaag cgctagcgcc agttcaattg ttgcatggta ctctctcctc 4740

tttaatcaaa agtttgtcct ttcacattat agctacagaa ccccagtagc cgtagttgac 4800

aaaccagagg aaacagatgg tgatgataca aaatcattag catctgacac ttctgataac 4860

tttgagtcta ttagaaagac caaccataag aatcagagca aacaacagtt taggccaaac 4920

ggtcaccaaa gaccaagtaa gactttcaaa cgccattcaa gaataatgac atctgaacag 4980

aagaacagct taattgaaac ttttaagggt ttaacaaatg gcacagcagc catcccacag 5040

cctttaatca tttttatttg ggttatcctt atggtaatac caacactctt tttagtcgcc 5100

agttccagca gaacagctgc aacaatgcct ttaaaccgct actcaggcgt caaccccact 5160

ggaattatgt ttcaccaagc acctccttac atccattcgg aaccaccaaa ggaaacttac 5220

tacaaactca gttatcctta tccgtcagca acagttgtga gaaccttgaa aggccatctc 5280

tattaccata gcgatgatac cgttcaacaa aattgtacca tgcaatattc acttatagct 5340

gcttctacaa agcacgtgtg tggcaaggta gtttacacta taccagccca tgtctcaatt 5400

ggctcactta aactgttgct tgtccacccg gatcaaacaa atttaccatt tgaactacca 5460

gtttcagatg aagtccgtct ttgctacctc acaaccttga acgcaccaag atgcatgccc 5520

tctcaactag ccatgtcaaa taaccaattt gccgctgtaa gccttgtttt gttaataaca 5580

ttagtttctt taattaaagt ttatataatg ttttttactg tttttaaaca ctacacaaca 5640

actgttttta tacttgtagc tgtgactact atcacaatgt tggtgtcctt cttagctcct 5700

ccacttctca tagtcgttct tctttcacta gcatggctat ggtacggcaa tacaattgta 5760

ttgtgccata tcatgctttt gatagtctta gtcgtctcat ggaaagtggc tgctgtctgt 5820

ttcatcttcg ccttattgta ctttggaaaa tgtgctatgc ttagcaagaa cattaaatac 5880

gtacagggtg gagttaaatt ttcaggaacc tttgaagaaa tagctcagtc aaccttcttc 5940

attaactacg gagtagcttg tcagcttctg gaacatactg gacagacaat tgaggatata 6000

atgcaactta gaaccgcggg tggagcccca gcaaggcttg cgcgctcaat atacgattgc 6060

ttttccacaa atgcctctgt cttgtacagt cccaggtcat tttcaccaca gtcacttata 6120

acaaaatatt tatacccagg ttcgatccct gtcggcagag cccctgtctt attaggcaaa 6180

atctccggca tgacttgctt agggcgtgaa cagtccacct gtttccaatc atcagctaca 6240

accattacta cgtgtaccca tgctgtaaat actgctggaa cattcatgtc tcaaattaaa 6300

tgtgttatag ataataaaat atatacagtt caacccgaga atataaccat aaccggaatg 6360

aaagctacat ttgaagttga aggactacct ccattcacca acgatgtaac agtggcccca 6420

aagccgctga agcattacat ggatggaaag agacaccttg ttctctacac taaaagtgag 6480

agcatagtct actcttcaat aatgtggccg actgaaaacg gtttattctc gtcatcagtt 6540

tctgacccag gagattcagg tgcaccctac ttttcagaca atgtcatagt aggaatacac 6600

caaggtcgca acgaagcaac caacaatcct gccattttag caagtggtat ggatggtgag 6660

tctccctgtg taggttacga tgaccaatca tatggccttc cacttcaaga atatttcact 6720

cacattgtct tatcaaataa gccaagtgac tttggtgctc catctaacgt ggcgccaaat 6780

aaatactaca acaaaaaatc atttgaacaa ttagctgacg aagataagac ttatttaaat 6840

agtttatcat atcccctgtc ctcatctaat tattgttact ttaatagctt caaaacccaa 6900

tcaagcacaa caatgctcga caacgctgaa gttattaaat atgtagtttt gcttctcatg 6960

atcttggatt atttcttttc aatcatttgc gaagatgctt taaacccagc atcttacgct 7020

atgttagtta tcgttttggt tcaggctttt attacaaaaa ttacagtttt cagaacaggt 7080

atctatatcc aggcagccgt ttttcaagca tttattgtac ctatagtcag tcaaattaca 7140

ttgatactgg ctgcagatac tgcaagaagt tttttaacgt tccacttttt tgtacttgct 7200

gttttgacat atttcgttct ttgccgtatt gctgtagatt tttggcgttc catgtttttg 7260

ctatttttga caagcgtctt tgcaaccatc atatggacta caaagaatga cttcaatatt 7320

ttacatgaaa ctggcgtggt tctaacaccc acggcagaat tagctcttat agtagctttt 7380

acttatataa tttatgcttc atgtatgtta acacctgtac cactgtatac tatttgtgtt 7440

ttcttttcat ttttatcaaa tgctccactc taccttgccg tcctctcatt cggcattcta 7500

gtttctttca aaacaaacca agattttgga cgtctagtgg ataaagtgtt ttctttaaat 7560

atgctctatg aataccatgc ttaccaaaac tatgttattc aaaactcagg tcaacaccca 7620

ggattttaca ggtcactctt tgcttttttt atcaatttga ccacccaacc aaaaacaaca 7680

tacaaatgtt tcaaacccca gacagcaagt ggttacagag taatatatca aactcccact 7740

acagagttca ataaatctct gcaacatgcc agtatcacaa aagatgacaa ctccaaccat 7800

ataattatgt ttgctgacgg ctcatctgat aatctcaatt gggcaaaaga aatggtcgca 7860

accattcatc taaccaaccc aaatttgcag ccactcatca ttggatacta ccacaactcc 7920

atggacgtca taaccaaggg aacttacatg caacatgaat tcataaaaat gccagctgtt 7980

atcttaactc aagatcctct aactgaacca atcagtcatt tagcagcagc agcatttact 8040

tcaatttctg gaaaacctca ggcacagaaa aacaacgttg tttcaaactc caaagcgcgc 8100

ataaacacag ccgttcacga cgctgtcgaa agcgtttatt caggagaaac atacgttgcc 8160

cccaaaccta tagtctcagg aaaaactgtt gtagagaaac cattctctac aaccgaaacc 8220

accatgtaca taatgcgtgg tttacccggt tctggaaaat ctttcaaagt tagtcaatta 8280

gttgctaaag atccaaattt agtcgtagct tccgcagacc actttagata ttcaaatgac 8340

aaaactggaa aagccgtata cacctacatt ccagaagcaa ctagttctgt acatttacaa 8400

tgtcagaata gagcccgcaa agctctagaa aacggccaat ctgtgtgcat tgataataca 8460

aatctaacac tcttagaaat gagaccttac gtcttattag cccgttcttt taactataac 8520

attgaattca tacactcaga ctctccctgg gccttaaacc ttgacctgtt acatgctaaa 8580

ggtgtacata atgttcctag agcaaagctc gtaatcatgt atgatagatt ctttgaccgt 8640

gataatcaaa tcgatgcaga cagtcttata cagtatgtta ttgaagcaat tgatccaaaa 8700

cttgttgctc caatcatgaa ccgtttccct gccgactgtg atcttatcct tcaatctgcc 8760

ctaacaccag accttgaagt attaaagcaa aactacgaca gagcaaacgc aacataccaa 8820

gatgtttctt tagatgatcc tccggcttta aaggcagcac gtcgtgctat gaatatagct 8880

aaatctgaat atgaggcagg cgaagcaggc cagcgtcgca ttgagaaatt tttagaaaga 8940

caggatgtag cagcactcaa ccaaacgctc acaactgtca atcaatctaa attcatagca 9000

gcgatccgtt ccatctacct aagcaccatt agcaatttga gactaaaaac ccgtcatatg 9060

ggtgaaggat catatgcagt tacatcaggt actaatacta ccgataaagt tttagttaac 9120

acgccacaac gtatgactag aattgaagat ggcatttata agcttgttgc aaacggtttt 9180

gaaatcacaa tgtgcgacgg cagcaactta gccggtgtta cttttgaaca ggatataaat 9240

cctagcatgt acccttttgt ttttacatta atgtcaaata tagctgtacc tgttttaacc 9300

cgccaagcaa atgttggcta tcttgatatg tcaaataaat tcatctgtaa agatggcact 9360

gttcaatttc aaggtgtcat ctatgcctac cacactccat caaatgagag tgctgacttc 9420

aaagtaggca ataccagttg gaccctccag aaaaacatca atttgactgc ttttattcct 9480

gcaattcata aaactgcaac cttcgcagca caatcagtgt tcttaggagg actacccatg 9540

gaagagcacc aagccttttc cgacacaccc acagcctcaa acaaatttaa agtttttgtt 9600

tcatccacag tctgcgcctc aaccgtgtgc aaagtaaatc ataaaactta tgtacagata 9660

ccagatgaca ttcaagatcc ttttacatat atgcatcaca gcgtttgttc acacaacaaa 9720

tttttatcaa accatgaaac cagatgtcaa atctgtcctt taaactgtta nagcgcaaat 9780

ccgtgtgtgt ctacggcttg cgctctattt gataatggca cattacctcg gtcaacacat 9840

tatattaatg ttagcaccac ttcaaatgtt ggcttgttta aggcagtaaa gaagtctact 9900

cgtcaactaa acattgacgg ttttccttac atgctaaagc aggttaaaga cgactcagaa 9960

cttgtaagtt ctcttaaaat aggtctacct aatatcctcc cacatcacat ggtggaaact 10020

aagtcaaaaa cataccttct taggggcccc acaacggctt actcacttgg cgatttatgc 10080

tacgcactct ttaatggcga ctttgattat attcgcgaaa atataaactc tgatttcgtt 10140

ttggaccgtg aagccggaat gcctgataca gaaacacgta cgtggctgtt cagcatttta 10200

aactttgcag tacctagagt gtgtgctata attgaccaga tgatttctga gaacgtcttc 10260

tataaactga ctttggataa cttagatcta tacggatcac tctatgattt tgacgactat 10320

cctactgaag gctttaacag gcctgatgat gtgatacgta tgttaaagga gatatggtcc 10380

ttctgtagac gtccactacc tgccgacctt cttaaatacc atgaagacat cggtgcagca 10440

gccactcaag aaatattgct gcatgcaccc ttcattgata aagtttgtgc tctaaatgac 10500

agattagctg ttgttgataa tagagcaagt caatactttt tctgtgaaga agaaggtgtc 10560

tttacccata tttacaatcc agtctacgga actttagcat tcgataacaa gttgatccaa 10620

tcaaaggatc cttcatgtac attacagcgc ctcattacta tacaaggccc tttgtctacg 10680

aatgctagtc ccgtgatctc tatttctgat tccactcata ttgccaacaa tattaatcca 10740

tctaaccaaa agacaacacc gttgtactac gatttggaac ttgcgcaaga attcattgac 10800

gcaggtttaa atattgatgg cgtttccaac tacttcttct atggaccgtc tagagcgggt 10860

gtagtgtctg atttcttact atatgaattc caaggaactc aatggtttga caataacatg 10920

ctgcgctctc tttattcttt catattgaag aattcagagt gttacagaac aacagatcaa 10980

ctggacttta gaggtggaaa accccgtaaa tcctcaatgg gacatggtgt tactggcttt 11040

aagcaagacg tcgtgtacgc tgctttaggc cctgatatga ttgaaacctt gtatgaaacg 11100

gcaaaacaaa caccattgcc gttttgtaca aaaataactg ccaagtatgc attaacagca 11160

aagcctagag ctcgtacagt tgcagcatgc tcctttgtag cctcaactat ttttaggtac 11220

gctcacaagc ctctaactaa taatatggtc tcaaaagcac agcagggttt gggttattgt 11280

ttaattggaa tttctaaatt ccacggtcga tttaataaat ttgttaagtc tagggtaggc 11340

actgtcgaag actttaatgt tttcggtagt gactacacta aatgtgaccg tacatttccc 11400

ttagctttgc gtgctctttc agctgccctt attttcgatc ttggcggcca tgacccagac 11460

aactgtcttt ttattaacga gcttaatgca tacatgctag acattgtttc agtcgaagac 11520

tcctttgcaa ataaaccagg aggtacttca tcaggagatg ccactacagc atactccaac 11580

actctgtata actttgcagt ccactatatt atcatgtgga aaacattctt gacagtcaat 11640

gacccttcta ccaaggtcat acgcagtgca gctcatcacg ccctaacaag tggtgacttc 11700

tctatgtaca atgacatgat acaagacatg ttggatgtag actatacact caacttcctc 11760

tctgacgatt catacatctg ttcaaaacca agcgcttttc cgatctttac gctcgagaac 11820

tatccttcta aactgcagtc tatactccac acagcagtag atagcaaaaa atcctgggaa 11880

gcaaagggtg agattaaaga attctgttcc tctcacatag tcaacgttga cggcgactac 11940

cactttaaac cagaaaagga tagaatattg gcttcattgc tgatattatc gaaaatcgct 12000

gacatggaca tcttctttat gaggttcgtt gcgttattgg ctgaatccgc cgtatatata 12060

cgcatcgatc ctacattttg gctggccctg tttggtgttt tcgaaaaccg cgtaacagcg 12120

tttaaatctg aaacattgct ctcacctgtt cctgaacaac tcatgaaggt ggctttttat 12180

gaatcgcttg tctttgccga cgtggatgct acagccttat atggtttcct tgatggtttt 12240

aaaatgcaaa gtcaaactct ccacccagac ggtgttgagg gttttgacaa gcaaagtgac 12300

cgagtaaaac actgttttgc ttgtgacaat atatcagttg gacactgttc gatttgtccc 12360

gttccccttc ctttgtgctc tttttgcttc tatgagcatg ctctgctcaa tgaacattat 12420

gaagcttctg gaattgcgtg tgaatgcgga gacgctgaca ttagacaact tcacttaaaa 12480

ataaccaatc aaccatcctc gcacaatttt atctgtgctg aatgtcccac tgtagctatg 12540

aagctgccaa tcttcaactc tttccaagga aaagtactgc ttccaatgtt ccgtatgaat 12600

acgccattgc cttcctcagt ctctgtaatt gttgatgtac gttccaaccc aaaagcacct 12660

aagatgctgt gggacgacgt ccagaatttc agagaaaatt gtactaggat agcatacgaa 12720

tccgtttcgt gtgctgaact agctagggag gtggtttact atccatatga agtgattgaa 12780

tccaaagcag gtcaagcacg acttagaata cagaacttta aatgttcacc aactacttat 12840

gttcagttct acaaagtccg tcaaaatgga aagtattgtc tagtagccaa agcaactcta 12900

acgccggctt ttgaaaacca aacagacatt ttctccgttt ttcaaccaaa caacttttca 12960

ccttggaata catcatcagt gtttgcagta gaacaatacg ctgcaatata ccctcccata 13020

ccaaaggaac cagtcaatgc tacgttcgtc ttaggacctc caggctgtgg taaaacatac 13080

tacatagcca aaacgtactt ttcacaggct tctgagacat gtccggtcgt atactgcgca 13140

cctactcaca gattagtttt agatatggac gcagaatata gtggtgtagt ttcaaaatct 13200

ctctacaata atagagtgta caaaaatcca gcctacaaaa caggcgaacc attcaaatta 13260

tgtttcacca cacacaacac gatgccagtt caaaagaaag cgatcctcat tatagatgaa 13320

gtgtctttaa ttacacccca ctctctattt tcgatcattg gtaaagggtt ctatgagata 13380

gtactcgtag gagacccttt tcagctctcg gctgtttttc caggttttgt tgtcaatcac 13440

acatatgacg ggttttacat ccgccggcta gtaaataagg tcaaacacct aacagtttgt 13500

taccgttgtc cacaagaaat cttggacata ttttctaagc cctatcatga tgttgggatt 13560

gacctcacaa ccggaaatac caatccagga aaggcatcca tttatacact aaattggctt 13620

caagcagatg taggtactaa aaatccggac aaactcagac aactctttgc gcaatatcca 13680

ggctttaaaa ttatcaccaa ctacagatgt gttgttgatg cagctaaaag ttacggtatt 13740

aacgtcgaaa ccatcgactc atcccaagga accaccggag ataggcatct ggtggtaatt 13800

tgcggcagta ccaacttttc taaactttta aacaggttta tagtagcagc ctctcgttca 13860

acaactgaac tagttatagt catgttgcca gagctttaca actatttaac agagacgttt 13920

aacttcaaac cgttacaatt gcaaaatgtg catgtaccga tcgcagtatc ttctacagca 13980

ttctgcgata tagaatttta tcactttcaa aagaagttct atgttggtga aataagcgta 14040

agcacaagta ccactatgac atgtcagttg ggttgttata ttaatggctc ctacatgctc 14100

ccacctgtgc ttgaaaactc tgaagaccgt ctctacgttc cttctagatg gagacgtatg 14160

ataagaaaat accctactga atctatgcac atttccttac tggacagact tctgaggcac 14220

attttattaa caactactgg agaaattcat ttcgtaatgt tctctgcaga caatgatctc 14280

attgcactgg atccgtactt tataccaccc actctatgtg agtgtggtag tgcgggtcta 14340

gtggaagtag acatcactgt tttctgccgc aattgtttgc ctaaagatgg taaagccact 14400

cgtttggtaa aaccgtctac actagatgtc cagactgaaa aactcagact tgcaaaagtt 14460

catgctaagg tttgtaaaat caagcatggc agtgctcaca acgctgatgt tgatgctatt 14520

atgactcaat gtatatatgc taatagctta acattcacac caacaaccca actagttgtt 14580

aacactgatg agttcacctt ttacatgcta cctaggccgt caaaccgtca tttgagaatc 14640

attcataaga acgacaaacg tttctatgct atcactcatg aagaagaaga tctcttcttt 14700

actaacatct cagcagtggt agacccaatt cctgcaaaat tcaacattgc acactctaca 14760

agcttcctca ccatcaaaag tggttgcgca ggtaataaga cttgtaccag atgctattat 14820

ttacacttag catacacgga atttgtttct caacacaagt atgaaccatt cacttgtgtg 14880

tcttttaaga tacggtttga cttttcacaa ttcactgact cagtagatac tttcctccga 14940

caaggcttaa taacctttca tccggagatg aattcactgc aaaaatcact tttattagca 15000

gtggataagg tctattgtga taacttcacc tcaaacggta gaaggtttag actttacgac 15060

aacaatttgg ttaaatccat aatcaaaggt tcagtggctc aaaactccat catcatgcca 15120

ctcgactcag ttttacacgg gttgaacatt gatttcacag tcggatgtgc cgtagataac 15180

ttttcctgca aagaagcagc gagtgttagg tactcagaag tagtactttc catcaccaag 15240

ttgcccccag gcacttgcca gttatactac gtcatatctt acggcctgaa ctctcccaag 15300

accacttatg ctggtcacca attgttcgac ggctttgaga ctgttattgt tgttaatcgt 15360

aaagataaac ccccttacgt cctcacacag tatattaatg atgttgtagt tgcaatgcca 15420

gagtccctct tttcaacagg tcgattctac agagaaaaac catatcccgt ccttatgaac 15480

gaggatttaa gtggcttaaa ccatcacatt ttctctggtg actatacaga cgaatctctt 15540

acattaggag gtgtccatca tatagtaact ttaaacacct atgaccacaa gctcaactat 15600

atccaaacga aagctacatg tgccgcctca gtttcaactg gcggacgtgg tcataaaatt 15660

actacactgt ttgacgttca tgcaaatcaa cttgctgatg aaattaccag agttacatct 15720

gttgttacaa cacagtctaa agttattaat ttgacaatag attatcagca agttccttgt 15780

atgtactggt cttcaccgac cggcataaga accttctacc ctcaggctgt tagactggac 15840

gcaaagttta taccatacta cgtagaatat cccaatattc taccggcagt tgttgaagac 15900

caggtgtacg atttgtctaa ttacaatcaa ccacctttag gccaaaactg ccctgtaaac 15960

tttcacaagt acgtccagct aactcacttt attttagatc atgtgaaaat ccccgaaaag 16020

ggtttgatat atcatatcgg tgcagcaggt actaagcaat gttcacctgg agacttaata 16080

ttggaacaat ttttcaataa atccatcata tactcaagtg accttcttcc ttaccaatca 16140

cctgctgtgc aggttgcatt ggatgtaagg ttttcggctt cactcatcat ttcagactgc 16200

tattcgaaag aaccgcagcc tgatttgttg agtaagttga ttaacaaact agtgtatggt 16260

ggaactctca tttttaagac caccgagact ttcacatgtg acccagcctt ttatgttgct 16320

cattttaact gtataaagtt ttttactgcc gctgttaatc actcatcatc agaagtttat 16380

attgcgttca tcggaaaact ccctaaacca aacaacaact ttttagcctc agactatttc 16440

cagagattaa ctcaacatag aaataaagta gttaaacagc cttacgctca cacatgggac 16500

acatctttta cgtacccata cccctcaaat gttcttcaag ttagtcgtaa aaacctttta 16560

tatctatttg aaaccagagg agctgcagta ggtactttga tttttgaaga accatcaaaa 16620

cctgctgtaa agatacctac aaagtgtcaa accacacaac cctcgtgtgt cattgaggtt 16680

ggtaaccaat acgattgttg cattcaagac atcattaccc tcctcaatgg aaaatccttc 16740

acagtgaagg tgcccaactc agaatcctta ctgcgcgata tctgcacact tgcgcttagc 16800

cagagttatt ccatcaatat tcgcggaaaa acactctaca cccttagttc cctacttaga 16860

attaggcaac aatccttact gttttacgga gagaaggtca aaaaccctcg accccgtaat 16920

gtcttgaaca aatataccaa ctacctcaag gcaaaagtga ttaggcatta caccaagcct 16980

caatcaacag ttttggacat tggtacagga aaaggacaag atttgagaaa atactcgtta 17040

gcaggggtta aatccctcac ttgtgtcgag cctagtcccg agtctgtgac tgaactttca 17100

ataatagcta gtccccttga tatggagaca cacacagtta tgagttctgc ccagaaattc 17160

gagacctcgc tgacgtttga cttggctttc tctttctttg ccttgcacta tgcattggat 17220

gacgtttgta tgtctgaaac actcaacaat gttttttgca aacttaacag taattcacag 17280

ttgatcttag tagttccaaa tgctggcagg atgcaatcca taccttccct tggtttaaca 17340

gtcactcatc tagatgatga taaagtttgg tttaaatact cagactatat agactgcgaa 17400

gaaccgttag tagacaaaga aaaactactt acgtgtttag ctacatatgg aacaattgtt 17460

actgactcac cattctatga cggtgcaaac aaaatcctag accaaaaatg ctcatccatg 17520

tatagagcat cgacagccca tctaaatccc gatgaaattc aatatattaa tatgtatgat 17580

ttaattgttg tcattaagaa t 17601

<210> 2

<211> 4173

<212> ДНК

<213> Вирусы

<220>

<223> нуклеотидная последовательность ORF-2

<400> 2

atgttcgcgc tcgttctaac cctcacaata gcttcggcta ttgcccaaga tttccccgca 60

tatgacccgt gtcctacttg ctcaaccccc ggtaataaaa taccggctcc gagcacagtt 120

gcccagtatt caacaaacta cggtgcgaac ttctttaccg tagtctttga tggtattatc 180

ttcaaccaat ttagggagag ttattaccac caatgtagac caacacctga atactgccca 240

gatgcaatca attgcgcctt aaacagaaca ggcgcatcct gcaaaccttt cgcaactggc 300

ccgaattcac aatgtcagaa cagtttcgag ggcaacatcg acatatgtgc aacatgtagc 360

cctctaaaac aagaaactcc attcatctgc tacaatagat acgggataat tatatacccg 420

acagcagata tcgttctctc cgctaggttt aagataggct ctttttcacc caaggcttgt 480

gataactacc taaacgactt aaattgtgat tcaaaaacgg caaggtcata tgtcatttcc 540

cgaccgcagt ctttttcact gcaatatcct aactcattag gcccctatca gctgaaacga 600

ttttctcttg caaaggagat cgttgactta cgtgctggcg ttttaacctc actcccaaac 660

cgaggttata agggtagaac aacatactct tatcccgtca ctgcactctc actcttggct 720

cgttccaaag tggctgaagc cgacaaattc ttttatatcg aggctaaaat tctactgtac 780

gcttggtcac agaaacctca aatccgcttt ctaggtgcat actgtcccac agacgtgtca 840

tgccctgatt caactgccct cggctgttgt ttttccggaa gtggatctga gttttactac 900

gcctttcgcc agtggtacta cgcaagcctg ggtatggaag acctagtcga ctttgataat 960

tcaacagtct taagtctctc gcctgatact cctcaaatta cacccgttgt gtcttatttt 1020

ctagaaaaag ttttaccttt gtttaaatca catgtacccg gacgtgtttt ttactgccat 1080

tcacttatgt ctaacggtgt atgtactttt gaccatgttg ttgtaaatat taatgccgag 1140

gccgtctttt ttgacctcga agtagacata ggcagcataa ttgctgacgc atatcgcgtt 1200

gaaaggccta atactttatg ttatgataca aactgtactc ttgccacaag caggaccact 1260

gagtataatt acgctgctta tgttgtttat atactcttca atttgtattc tagtaatcgc 1320

attgcgatag atttcaacac acactcaatc ttgcaaggat tactacaaca caatagcaac 1380

taccagactg ctaatttaga ctatctgttt gttggagcac tttttacagg tacttttaaa 1440

catattacaa gcaatcaagc ttacccagta cctttaactt atccaattgt taagacatat 1500

gtagggccgt caaaccaata ctcaatgtca aataaactgt tttcatatac tcacaatttg 1560

acggctcaag cccattcagg catatgtaac tctttttact gttataaacc acgttttgta 1620

ccaattgatg tttttattca tagtgcttta acccctgaca gcttgatgga aacagaatct 1680

tttgtttgtg tctctttgcg ttcaccatct gcaggatcaa catccgcagg tagtttttat 1740

ttgcaatgtc tcaattcttc catcgatttg catccaggtt catttgtacc cgtttcctca 1800

agtccagagt cttccagccg cgtaacagct gagctggctt ttaatactag aaatggtata 1860

ttttctcctt gtcttaacgg tacatgtgta ctcgcaccta ctgacccaat tgtttttatg 1920

cgtcagggtg cctggtttac aaaatcttta cactttgatg tttcaccatg caaacctatg 1980

cattttccag acatagatat acagccccca acatacaatg tctcctctat caagatggac 2040

gacaatgctg tattggttca agaccttact tcgggtttag taattgacca caatttaggc 2100

tccatactca gaccgaaagg tagagctttg gaagtttcgt attatgctca ctccatttta 2160

cgttaccttg aaccggattc ttgtctacct gacaactttc ttaactttgt cacttgttta 2220

gactatatct gttcagactc gtcaccttgc cgtgctgccg caagccagta ctgtcaggca 2280

ggcatttatt ttgagtctgc atttaataag tctaggtatt ctttgcttaa cgcttacacg 2340

ctttttaaca caagtcttca aaccttattg cctgagactt ttcttgagat agaagatgat 2400

gaaccccata gcagatcaaa gagatcaatt gatactacaa gcaatattcg ccctagtcaa 2460

ttgcttgtta atggacgtat tccgtctaca agttcagctt ttgctgttaa cgtcgctcgt 2520

ggtcgaggaa cgattatgcc tcgtcctgga actggtggca tgggttcgtc cttttctgct 2580

gtttctaggt cgggtagtat ttcttcctta tcctcggttg gctcctcaac acctttgatc 2640

tctaattgga gaacatcttc atctcaactc aaaactctca acctcaacat taacactaaa 2700

attcctaaga tttcaacaaa gtcaggtttt gccagtatta catctttgtt tgcttcaggt 2760

ttaggagtcg tcgatctagg tctatctatt ttcaacatga tagaacagcg tagagttgct 2820

gagatcactc agatgcaaat tagccaactg gctgactcta tagtgtatct tgctgatgtg 2880

acatttgaag ctatcaagaa tttggaactc tcggttaact ccttgggtac gttcttatcg 2940

gaattttcca ctcagatgtc gatcaccata agccaaatac aatcatcatt tgaagagcag 3000

caagatgcta caaatgatgc gttgtactac actaacgctg ctgcgtcata ccaagcctcc 3060

atggcgtatg tcatttcaga gttaaacgca atatctctgt ctgtcactag atcctacgac 3120

tcttacacca gttgcatcac ttctggcatt aatgggctca ttacaccatc atgcttgcca 3180

gcccaccagt tgttacagtt actcgacacc gttatcaatt ccacagcagg aacaggatgc 3240

cgtcccatct acggcagaga agaagtggtg aaatactaca ctttacctct aatcaatcaa 3300

ggttattcct ttaacgggtc gattttcttc gtctttaaca ttcccatcac ttgccaggga 3360

attgccggag atgtatatga agtagaacca cctatacttg tagatgtacc atcaaagact 3420

gctttacgca tgattacacc atcaaacgta gtcgcaacac aagcaggatt agctgaatta 3480

gatttgcgtc attgcgaaag gtaccataac gagttcctat gcgattcttc agcattcctt 3540

tctacacctt caaaatacat agactgttta acaaacgcaa ctgactgttc tttgcaattc 3600

atcacacaac acgttccaga tccttgcgtt tacacatcgc cagcttcttt atattgttat 3660

tattcaccca tatgtgatca atgtcacata gtagccggtt gtaatgaatc tcagcagtac 3720

aacttcactt ctgctgatgg cggcgtagtc ttttattcca tacaagacag agactgtggc 3780

cacttccccc acatcactgt tactacgcct gcagccatac aagaagactt cactgtcgga 3840

ccgtatttac catcgctgcc aattcacacc gcctacgtca atgttacctg gaatgtaaca 3900

ctaccaggaa attggacctg ggaaaatatc accctaacag ccaattggac ccaacacttc 3960

attgagatga aaaaaaacat cacaatgatg gctgaagaaa tagataacct taccaacttc 4020

ggtaaggttt tagttggcca gctaaatagc tttttatcat ctttgtttaa cataccatta 4080

ggtttgatga cgttttgctt ttctgtagcc gctttaggcc tgtccattat tgctttactt 4140

gtgttatgtt ttccacagaa gccacataaa tta 4173

<210> 3

<211> 780

<212> ДНК

<213> Вирусы

<220>

<223> нуклеотидная последовательность ORF-3

<400> 3

atgatgttta ccctagtagt gctttttacc ctcctcggcc tttccatggc ctccacagag 60

ctgaatttcg atcctactct acccctcccc tctcctataa atgccctcgt cgacattttc 120

ggaaacaaca gcttgtttct caaagagtcc ctgctcggca aatccaccgg agccgtctac 180

gcatacttgt acagcagtgc catctctctc ctgctgctac tttgggtaac tgtatggagt 240

attgctactt cacactttaa cgtaactcgc attccaacca tcgcggttct cactaatgcg 300

agtatgtttt tgctgttggc atcggctact gttacaacct ggtttctccc aactgtgacg 360

aacgtcttct tttatacact cactgcgctg ttcaccttct tttcctttgt gttcttactg 420

tggttggttt actatatgtt tactaccatt agggcatatc gaagggtcgg ttcatggcgc 480

gttgtgttta acggaaaata ttctctactt gctggaactc aggctgtttg cctttgcaga 540

cccgccatac atctggttct aaccaaaacg aacacagata catactggtg tctagatgga 600

acccccatct acaatgttga cttactacaa ttagttggcc ccaaaggatt atatccttac 660

aaaagaatga ctacaatcac tgcaccaaaa ggcacaaaaa catctgctgc cgtttacacc 720

cttcaaaaag aagaagtttg tgctctctca gaaatcacag tacataatga tactgatttt 780

<210> 4

<211> 603

<212> ДНК

<213> Вирусы

<220>

<223> нуклеотидная последовательность ORF-4

<400> 4

atgtcttacc cggtttacta cgaacagcgt cgttattccc cccgccaatt caacaatggc 60

ggagggtata atcctacacc tcaacctaga gtagttcgta ctaatcctgg taaccaagct 120

tacaaccccc ggcgtaaccg aaacgccact ccgaaccaac aacaaatggt tccttaccag 180

cctcagtatc aagcacctcc tcagccaagg gtggtctatg tagatcgccc tcaagaacct 240

gtagtaattt acagagctcc tccacaagga aaaaaacaat caggcaaacg ccacacagca 300

gaagaacgct ggtatcaagg cgaaaaacct gtgcagaaga aacaggcacc caaaggaaaa 360

tcaaagaaag cagcaacacc tgctaatcct aaaaagcagc ctacacaatc tgacaaagtt 420

cccatcgcct acccagacaa tcatcccttc catgacctcg caccagctga catccgcgct 480

ttcaaaaagc agctgatcca aaatctggac cttggacatg gtgaaatgaa tcaactgcgg 540

ctttcaatcg atctgttgcc catcaagaaa ccagcaccaa caccagcggt gccagctcct 600

ctg 603

<210> 5

<211> 339

<212> ДНК

<213> Вирусы

<220>

<223> нуклеотидная последовательность ORF-5

<400> 5

atgtttaccc ttgtgcttat tatcctgctt agtttttcta tggcttttaa tgcttttaca 60

tttctgctgt tattattttt tacttttaag tgcattataa cccgcacttt agtcgtagtt 120

cccattgact acccagaaaa tcatcctttc aatggcctct caccagagga aatcatcagc 180

tacaaatcac agctgatcca aaatctcgat cttggacatg gtgaagtaat taaacatcga 240

ttctcaattg atttacttcc cctcaaaaca acaagcactc ctaccaccag tgctatttta 300

tggaaaaggt tcaaaacctc ccataaagaa aacaaccac 339

<210> 6

<211> 24613

<212> ДНК

<213> Вирусы

<220>

<223> Геномная нуклеотидная последовательность ("n" в положениях 2748-2761, 2781, 2782 и 10029 обозначает любое основание)

<400> 6

gcagtccacc aacacaacgt ggctctctgc ttacctgtaa gggcacgccc ttatgctgaa 60

ataatcattc aggaacacct ttttgtttca agaaatagta ggagttttaa accatccttc 120

tatcttgttc caacaaagga gccgcaatca aacactctaa cccttcatgg gggtgatttt 180

gatgcaaagc gacacttggg taagaaacca gtaaagtgca atattcttga cattgttgac 240

aaaaaccaca caatagcaat gaaaaaaatt gaagatgctt taggaacact taaacctgcc 300

tttaaggcac acatagactc tctacctcct ttcatgggaa aactagccac aatgctagct 360

gagacaagac gaggaaaaac tccccctctt ttgatctatg tcatatcaac aattttggaa 420

acgaatatta cagttcatta tgtcagccac acaataactt cataccattc ttcaaacgca 480

cacactcaca ctcatgaatt cgactcagaa gattacactc ctgacaatca gattttaact 540

aaagtcaacc gacatggtaa tgaccttaat cattcatata tccatggcgc caccaatatg 600

tacaaccctg tctaccagag acacccacca aacatgtgct acatgcttac gggactgtac 660

atgttgtcag gcttacagga attgtatgcc atggctgaag acaacttgac aacatgccaa 720

atcaaccttc tcagatgtct gtttgatttg aatcaagatg aatttgatgt agattacaca 780

tttgtaatat acactcctag caaatctcag gagtgtgcct tcaaatatct tcaggagata 840

gtccaccact gtgaactcac catttttaga catacaacaa caagtgtctt cagttgcaac 900

aaatgcaacc atgtggaaac tgtcatttct agttgttctt tgaatcttgt atatataact 960

gattctattg aaaaagcatt tcaacccact gtagaagcta ataccgacta catgtgtgaa 1020

aactgcggtc tacgcgacca taaacttaaa acaacagtaa caaatccaga cctccgtttg 1080

gcacaactaa actatccaac ggattcaaaa tacactatct ttcttgatga acaagctcct 1140

tttgtcttcc attccattgc aaaacacgtt ggaactgcta attccggaca ttggagtgca 1200

ttgaatgtaa attcagatat gttgtcagac tctaacgagc gacaacatta ttatacaaca 1260

cctagtattg ttttgcttgc atttcttcct gaggaagagc tacagaacat tagaaattca 1320

tcacctcttc aggaccatca accagatgat gttgaagacg ttgaatctcc cctaccaggt 1380

tctatatttt atactacaga tgacattttt tctactaaga gtctatccat agctcactgt 1440

gtagcccgcg actttcacat gtccggcggc atagcaaaaa ttttctcaga taaattcggc 1500

tctaaaactt tcttgaaatc acaaaacccc gttataggcg gtttttccat tttacttaga 1560

gagtgtcgtg acatgtacta cctcgtcaca aaagagaaaa cttcagataa gccgacatac 1620

caagacctta aaaactcctt gggttctatg acagagaatt tggttcgcaa gaatcataat 1680

actctttcaa ttccatatat aggctgtggg attgatggtt tacaatgggc aaccgttgaa 1740

aaacaagtca aagaaattgt ctgcgctcga ggtattgatg taacagtcca ccacctcgaa 1800

aatgaagtta aacacactcc agaacaacaa acagcttctg acaattcagt caaattagtt 1860

caaaaactct ttacagaaac acctcaagct atacctatag ttgttccttc agatgactca 1920

gacagcgaca tagatgagtc agccgatgtc tttttaccag gacctgaatc tgaatctgat 1980

tcaaaatcag aatctgggtc agattacgac tttaaatcgg cttctgaacc agaagatgaa 2040

ttggagccca ctccaatctc tgaacttgaa ctaacaccag cgtcaagttt aactgtagag 2100

tccgatgaca atccagacac aagccaggaa acattaccag aatcaaactc tgaggaaacc 2160

aaacctgagc aaacacctga cacaacatca aaggtgtcct ccgattcgaa gcttgatcca 2220

caatcagaat tagaagaaga actggccaac aaaccagaat cggcttctga accacaatct 2280

gagactgaat cgagttctga atctgaagag gagcttgagc cacaatcaga atcagaggaa 2340

gaaccggcca acaaaccgga atctccttct gaatcacaat ctgaaaatgg atcgagttct 2400

gaacccgaag aggagtctga aaaaccatcg gagtctgctg aaacagcaac agaggatagc 2460

ccggaaacaa caccggaaac aaccttagag ttaaccacac aactcaaacc tgcttcagaa 2520

tctgacgaca aaccggacac accagcacca tcaccttcac caattcaacc agagaaaaac 2580

ttggacacca cccctgaaca aacttcacaa ccaaccacac aactggaatt gacgttagaa 2640

acacaggaac aaccagacac tacaccagaa gtgccatctg tctcagaaga taaaccagac 2700

acacttgaag aatcttctga atcaacacca gaactctcag aattggannn nnnnnnnnnn 2760

nccaccagta ccaagaccta nngaaccaga cctccaacac ctagaccaag atctgcacgt 2820

ggagctagga ctagatcctg tgctggcaca cctataccag ttatttttga tattatagat 2880

aatacaagcc agcctcaagt tccccttgac ttcccagaag cactgcaaga actgaacaaa 2940

cctagtgaag taatcccagc ggctagtgaa aaacctgtgg aaaaacaaat aatccatagt 3000

tttgtaagtg tcgaaacacc ttgcaaaccc aaagccacta aagttacgaa ttatgtagct 3060

gcacaatcta atgcaattct aaattgtatt aaggctttca ttcctagcaa cccgctttca 3120

ctattcaata gaaaaccagc ttttagaaaa ataatattca ctgaagacac ttcagaacca 3180

gatagcgatg atgatgattg tgaatacact ccaccaacat caccattccc tgaacttctg 3240

gcattggtag atgaagacat tgaagtagaa caaactcaat ctgtaattcc aaaaacagac 3300

tctgcttcaa ttgtggagga tcttaaaaaa caagaatcct ctactttgtc attggacacc 3360

aacacatcga aacctacaag ctctccgcga agacagccta gggaagtaga aagtgttgat 3420

gaatccagtg atgactcatc taaaccaaaa acaatttcaa cattagacaa acctgctatg 3480

aatagtgaca cgaaacctac agactcttcg cgaaaagagc ctctggaagt accagttact 3540

acatctttaa gcacccctgc taaaaaccaa gataaaaaat cttcaaaatc tgcaaaagta 3600

ataaaagact attctttgac ccctaacaca gtcaaacagc aagtctattc actctacggt 3660

gaatcagtag atgcagttaa ataccttgtt caaacatacc cagacagggc taaacaaaca 3720

gctggtattg cttatttcct tataactact tatttaatat ggaccatcgg tctcatagga 3780

gtaccaatgg cctttaaaat accaatgttt ttatgtcttt tataccaagt taatggatta 3840

aatatagcac catttgttac taaccaaaag ttacaatatg ttgcatttcc actttggtat 3900

aagctctatg aagtaatatc agtccgtttt gtggcgaata tagcacaatt tattgttaaa 3960

acaccaccta tagatgtttt aaacaagcta attcgttcta ataaagacaa gccagtcaaa 4020

ttaacaccaa ataaacatac tttgatgtta attcatgact tagctttaga gtctgtcgac 4080

ggaaaagaaa accgctatta taatactgat gttacaactt tcacaaaaag gcatagcact 4140

tctaatattt catatgttct aaagtctact ttaatcaaat atgtcatgga ccattgttat 4200

gtaaatattg cagtttttac tttagttaga tacttaactt tattagtgtt tattcaacat 4260

ttctctaatc cttatgttct tgaagcaaat agccaatcac ataccgtttt acagtatctg 4320

ttttcacact tgagaccatt tggaaggcct ttgtgcccaa ccctcaatga ctacatgacg 4380

acagcaacac cacgcgatgc acatgtacaa gcaggttctc acttcagtga attttgtgtt 4440

cctattcatt atacaacacc aatcattaaa agcacaatgg cagaaccatc actttttcta 4500

ctttttaacc cagtcttatg gcctttggtt atggttgtat atttttatcc tccaatgatg 4560

tttatagcaa atgcagtcgc ttattcatgc cttcctttag tggtcttgtt acaatggctt 4620

tatgccatgt ggttttcttg tacatgctat ggcaccaaaa gatgtgccaa gcatttgcat 4680

aaaaatgaag tggttaaacc aatggaatcc acttcaacta agaaccgcat gacatttact 4740

ccatcaacga ccttttgtag taaacataac ttcttctgtc cagatgcacc acatataatg 4800

actcttgcaa tggctaggca acttacaaac tactacaatt tgacagatac agtaatacct 4860

gacatccagg aatactccca cgagaaccct actgtacaat ttattcactt tgatccactt 4920

aaacacggtg ccgacacaat tttggaacca attacaagcg ctagcgccag ttcaattgtt 4980

gcatggtact ctctcctctt taatcaaaag tttgtccttt cacattatag ctacagaacc 5040

ccagtagccg tagttgacaa accagaggaa acagatggtg atgatacaaa atcattagca 5100

tctgacactt ctgataactt tgagtctatt agaaagacca accataagaa tcagagcaaa 5160

caacagttta ggccaaacgg tcaccaaaga ccaagtaaga ctttcaaacg ccattcaaga 5220

ataatgacat ctgaacagaa gaacagctta attgaaactt ttaagggttt aacaaatggc 5280

acagcagcca tcccacagcc tttaatcatt tttatttggg ttatccttat ggtaatacca 5340

acactctttt tagtcgccag ttccagcaga acagctgcaa caatgccttt aaaccgctac 5400

tcaggcgtca accccactgg aattatgttt caccaagcac ctccttacat ccattcggaa 5460

ccaccaaagg aaacttacta caaactcagt tatccttatc cgtcagcaac agttgtgaga 5520

accttgaaag gccatctcta ttaccatagc gatgataccg ttcaacaaaa ttgtaccatg 5580

caatattcac ttatagctgc ttctacaaag cacgtgtgtg gcaaggtagt ttacactata 5640

ccagcccatg tctcaattgg ctcacttaaa ctgttgcttg tccacccgga tcaaacaaat 5700

ttaccatttg aactaccagt ttcagatgaa gtccgtcttt gctacctcac aaccttgaac 5760

gcaccaagat gcatgccctc tcaactagcc atgtcaaata accaatttgc cgctgtaagc 5820

cttgttttgt taataacatt agtttcttta attaaagttt atataatgtt ttttactgtt 5880

tttaaacact acacaacaac tgtttttata cttgtagctg tgactactat cacaatgttg 5940

gtgtccttct tagctcctcc acttctcata gtcgttcttc tttcactagc atggctatgg 6000

tacggcaata caattgtatt gtgccatatc atgcttttga tagtcttagt cgtctcatgg 6060

aaagtggctg ctgtctgttt catcttcgcc ttattgtact ttggaaaatg tgctatgctt 6120

agcaagaaca ttaaatacgt acagggtgga gttaaatttt caggaacctt tgaagaaata 6180

gctcagtcaa ccttcttcat taactacgga gtagcttgtc agcttctgga acatactgga 6240

cagacaattg aggatataat gcaacttaga accgcgggtg gagccccagc aaggcttgcg 6300

cgctcaatat acgattgctt ttccacaaat gcctctgtct tgtacagtcc caggtcattt 6360

tcaccacagt cacttataac aaaatattta tacccaggtt cgatccctgt cggcagagcc 6420

cctgtcttat taggcaaaat ctccggcatg acttgcttag ggcgtgaaca gtccacctgt 6480

ttccaatcat cagctacaac cattactacg tgtacccatg ctgtaaatac tgctggaaca 6540

ttcatgtctc aaattaaatg tgttatagat aataaaatat atacagttca acccgagaat 6600

ataaccataa ccggaatgaa agctacattt gaagttgaag gactacctcc attcaccaac 6660

gatgtaacag tggccccaaa gccgctgaag cattacatgg atggaaagag acaccttgtt 6720

ctctacacta aaagtgagag catagtctac tcttcaataa tgtggccgac tgaaaacggt 6780

ttattctcgt catcagtttc tgacccagga gattcaggtg caccctactt ttcagacaat 6840

gtcatagtag gaatacacca aggtcgcaac gaagcaacca acaatcctgc cattttagca 6900

agtggtatgg atggtgagtc tccctgtgta ggttacgatg accaatcata tggccttcca 6960

cttcaagaat atttcactca cattgtctta tcaaataagc caagtgactt tggtgctcca 7020

tctaacgtgg cgccaaataa atactacaac aaaaaatcat ttgaacaatt agctgacgaa 7080

gataagactt atttaaatag tttatcatat cccctgtcct catctaatta ttgttacttt 7140

aatagcttca aaacccaatc aagcacaaca atgctcgaca acgctgaagt tattaaatat 7200

gtagttttgc ttctcatgat cttggattat ttcttttcaa tcatttgcga agatgcttta 7260

aacccagcat cttacgctat gttagttatc gttttggttc aggcttttat tacaaaaatt 7320

acagttttca gaacaggtat ctatatccag gcagccgttt ttcaagcatt tattgtacct 7380

atagtcagtc aaattacatt gatactggct gcagatactg caagaagttt tttaacgttc 7440

cacttttttg tacttgctgt tttgacatat ttcgttcttt gccgtattgc tgtagatttt 7500

tggcgttcca tgtttttgct atttttgaca agcgtctttg caaccatcat atggactaca 7560

aagaatgact tcaatatttt acatgaaact ggcgtggttc taacacccac ggcagaatta 7620

gctcttatag tagcttttac ttatataatt tatgcttcat gtatgttaac acctgtacca 7680

ctgtatacta tttgtgtttt cttttcattt ttatcaaatg ctccactcta ccttgccgtc 7740

ctctcattcg gcattctagt ttctttcaaa acaaaccaag attttggacg tctagtggat 7800

aaagtgtttt ctttaaatat gctctatgaa taccatgctt accaaaacta tgttattcaa 7860

aactcaggtc aacacccagg attttacagg tcactctttg ctttttttat caatttgacc 7920

acccaaccaa aaacaacata caaatgtttc aaaccccaga cagcaagtgg ttacagagta 7980

atatatcaaa ctcccactac agagttcaat aaatctctgc aacatgccag tatcacaaaa 8040

gatgacaact ccaaccatat aattatgttt gctgacggct catctgataa tctcaattgg 8100

gcaaaagaaa tggtcgcaac cattcatcta accaacccaa atttgcagcc actcatcatt 8160

ggatactacc acaactccat ggacgtcata accaagggaa cttacatgca acatgaattc 8220

ataaaaatgc cagctgttat cttaactcaa gatcctctaa ctgaaccaat cagtcattta 8280

gcagcagcag catttacttc aatttctgga aaacctcagg cacagaaaaa caacgttgtt 8340

tcaaactcca aagcgcgcat aaacacagcc gttcacgacg ctgtcgaaag cgtttattca 8400

ggagaaacat acgttgcccc caaacctata gtctcaggaa aaactgttgt agagaaacca 8460

ttctctacaa ccgaaaccac catgtacata atgcgtggtt tacccggttc tggaaaatct 8520

ttcaaagtta gtcaattagt tgctaaagat ccaaatttag tcgtagcttc cgcagaccac 8580

tttagatatt caaatgacaa aactggaaaa gccgtataca cctacattcc agaagcaact 8640

agttctgtac atttacaatg tcagaataga gcccgcaaag ctctagaaaa cggccaatct 8700

gtgtgcattg ataatacaaa tctaacactc ttagaaatga gaccttacgt cttattagcc 8760

cgttctttta actataacat tgaattcata cactcagact ctccctgggc cttaaacctt 8820

gacctgttac atgctaaagg tgtacataat gttcctagag caaagctcgt aatcatgtat 8880

gatagattct ttgaccgtga taatcaaatc gatgcagaca gtcttataca gtatgttatt 8940

gaagcaattg atccaaaact tgttgctcca atcatgaacc gtttccctgc cgactgtgat 9000

cttatccttc aatctgccct aacaccagac cttgaagtat taaagcaaaa ctacgacaga 9060

gcaaacgcaa cataccaaga tgtttcttta gatgatcctc cggctttaaa ggcagcacgt 9120

cgtgctatga atatagctaa atctgaatat gaggcaggcg aagcaggcca gcgtcgcatt 9180

gagaaatttt tagaaagaca ggatgtagca gcactcaacc aaacgctcac aactgtcaat 9240

caatctaaat tcatagcagc gatccgttcc atctacctaa gcaccattag caatttgaga 9300

ctaaaaaccc gtcatatggg tgaaggatca tatgcagtta catcaggtac taatactacc 9360

gataaagttt tagttaacac gccacaacgt atgactagaa ttgaagatgg catttataag 9420

cttgttgcaa acggttttga aatcacaatg tgcgacggca gcaacttagc cggtgttact 9480

tttgaacagg atataaatcc tagcatgtac ccttttgttt ttacattaat gtcaaatata 9540

gctgtacctg ttttaacccg ccaagcaaat gttggctatc ttgatatgtc aaataaattc 9600

atctgtaaag atggcactgt tcaatttcaa ggtgtcatct atgcctacca cactccatca 9660

aatgagagtg ctgacttcaa agtaggcaat accagttgga ccctccagaa aaacatcaat 9720

ttgactgctt ttattcctgc aattcataaa actgcaacct tcgcagcaca atcagtgttc 9780

ttaggaggac tacccatgga agagcaccaa gccttttccg acacacccac agcctcaaac 9840

aaatttaaag tttttgtttc atccacagtc tgcgcctcaa ccgtgtgcaa agtaaatcat 9900

aaaacttatg tacagatacc agatgacatt caagatcctt ttacatatat gcatcacagc 9960

gtttgttcac acaacaaatt tttatcaaac catgaaacca gatgtcaaat ctgtccttta 10020

aactgttana gcgcaaatcc gtgtgtgtct acggcttgcg ctctatttga taatggcaca 10080

ttacctcggt caacacatta tattaatgtt agcaccactt caaatgttgg cttgtttaag 10140

gcagtaaaga agtctactcg tcaactaaac attgacggtt ttccttacat gctaaagcag 10200

gttaaagacg actcagaact tgtaagttct cttaaaatag gtctacctaa tatcctccca 10260

catcacatgg tggaaactaa gtcaaaaaca taccttctta ggggccccac aacggcttac 10320

tcacttggcg atttatgcta cgcactcttt aatggcgact ttgattatat tcgcgaaaat 10380

ataaactctg atttcgtttt ggaccgtgaa gccggaatgc ctgatacaga aacacgtacg 10440

tggctgttca gcattttaaa ctttgcagta cctagagtgt gtgctataat tgaccagatg 10500

atttctgaga acgtcttcta taaactgact ttggataact tagatctata cggatcactc 10560

tatgattttg acgactatcc tactgaaggc tttaacaggc ctgatgatgt gatacgtatg 10620

ttaaaggaga tatggtcctt ctgtagacgt ccactacctg ccgaccttct taaataccat 10680

gaagacatcg gtgcagcagc cactcaagaa atattgctgc atgcaccctt cattgataaa 10740

gtttgtgctc taaatgacag attagctgtt gttgataata gagcaagtca atactttttc 10800

tgtgaagaag aaggtgtctt tacccatatt tacaatccag tctacggaac tttagcattc 10860

gataacaagt tgatccaatc aaaggatcct tcatgtacat tacagcgcct cattactata 10920

caaggccctt tgtctacgaa tgctagtccc gtgatctcta tttctgattc cactcatatt 10980

gccaacaata ttaatccatc taaccaaaag acaacaccgt tgtactacga tttggaactt 11040

gcgcaagaat tcattgacgc aggtttaaat attgatggcg tttccaacta cttcttctat 11100

ggaccgtcta gagcgggtgt agtgtctgat ttcttactat atgaattcca aggaactcaa 11160

tggtttgaca ataacatgct gcgctctctt tattctttca tattgaagaa ttcagagtgt 11220

tacagaacaa cagatcaact ggactttaga ggtggaaaac cccgtaaatc ctcaatggga 11280

catggtgtta ctggctttaa gcaagacgtc gtgtacgctg ctttaggccc tgatatgatt 11340

gaaaccttgt atgaaacggc aaaacaaaca ccattgccgt tttgtacaaa aataactgcc 11400

aagtatgcat taacagcaaa gcctagagct cgtacagttg cagcatgctc ctttgtagcc 11460

tcaactattt ttaggtacgc tcacaagcct ctaactaata atatggtctc aaaagcacag 11520

cagggtttgg gttattgttt aattggaatt tctaaattcc acggtcgatt taataaattt 11580

gttaagtcta gggtaggcac tgtcgaagac tttaatgttt tcggtagtga ctacactaaa 11640

tgtgaccgta catttccctt agctttgcgt gctctttcag ctgcccttat tttcgatctt 11700

ggcggccatg acccagacaa ctgtcttttt attaacgagc ttaatgcata catgctagac 11760

attgtttcag tcgaagactc ctttgcaaat aaaccaggag gtacttcatc aggagatgcc 11820

actacagcat actccaacac tctgtataac tttgcagtcc actatattat catgtggaaa 11880

acattcttga cagtcaatga cccttctacc aaggtcatac gcagtgcagc tcatcacgcc 11940

ctaacaagtg gtgacttctc tatgtacaat gacatgatac aagacatgtt ggatgtagac 12000

tatacactca acttcctctc tgacgattca tacatctgtt caaaaccaag cgcttttccg 12060

atctttacgc tcgagaacta tccttctaaa ctgcagtcta tactccacac agcagtagat 12120

agcaaaaaat cctgggaagc aaagggtgag attaaagaat tctgttcctc tcacatagtc 12180

aacgttgacg gcgactacca ctttaaacca gaaaaggata gaatattggc ttcattgctg 12240

atattatcga aaatcgctga catggacatc ttctttatga ggttcgttgc gttattggct 12300

gaatccgccg tatatatacg catcgatcct acattttggc tggccctgtt tggtgttttc 12360

gaaaaccgcg taacagcgtt taaatctgaa acattgctct cacctgttcc tgaacaactc 12420

atgaaggtgg ctttttatga atcgcttgtc tttgccgacg tggatgctac agccttatat 12480

ggtttccttg atggttttaa aatgcaaagt caaactctcc acccagacgg tgttgagggt 12540

tttgacaagc aaagtgaccg agtaaaacac tgttttgctt gtgacaatat atcagttgga 12600

cactgttcga tttgtcccgt tccccttcct ttgtgctctt tttgcttcta tgagcatgct 12660

ctgctcaatg aacattatga agcttctgga attgcgtgtg aatgcggaga cgctgacatt 12720

agacaacttc acttaaaaat aaccaatcaa ccatcctcgc acaattttat ctgtgctgaa 12780

tgtcccactg tagctatgaa gctgccaatc ttcaactctt tccaaggaaa agtactgctt 12840

ccaatgttcc gtatgaatac gccattgcct tcctcagtct ctgtaattgt tgatgtacgt 12900

tccaacccaa aagcacctaa gatgctgtgg gacgacgtcc agaatttcag agaaaattgt 12960

actaggatag catacgaatc cgtttcgtgt gctgaactag ctagggaggt ggtttactat 13020

ccatatgaag tgattgaatc caaagcaggt caagcacgac ttagaataca gaactttaaa 13080

tgttcaccaa ctacttatgt tcagttctac aaagtccgtc aaaatggaaa gtattgtcta 13140

gtagccaaag caactctaac gccggctttt gaaaaccaaa cagacatttt ctccgttttt 13200

caaccaaaca acttttcacc ttggaataca tcatcagtgt ttgcagtaga acaatacgct 13260

gcaatatacc ctcccatacc aaaggaacca gtcaatgcta cgttcgtctt aggacctcca 13320

ggctgtggta aaacatacta catagccaaa acgtactttt cacaggcttc tgagacatgt 13380

ccggtcgtat actgcgcacc tactcacaga ttagttttag atatggacgc agaatatagt 13440

ggtgtagttt caaaatctct ctacaataat agagtgtaca aaaatccagc ctacaaaaca 13500

ggcgaaccat tcaaattatg tttcaccaca cacaacacga tgccagttca aaagaaagcg 13560

atcctcatta tagatgaagt gtctttaatt acaccccact ctctattttc gatcattggt 13620

aaagggttct atgagatagt actcgtagga gacccttttc agctctcggc tgtttttcca 13680

ggttttgttg tcaatcacac atatgacggg ttttacatcc gccggctagt aaataaggtc 13740

aaacacctaa cagtttgtta ccgttgtcca caagaaatct tggacatatt ttctaagccc 13800

tatcatgatg ttgggattga cctcacaacc ggaaatacca atccaggaaa ggcatccatt 13860

tatacactaa attggcttca agcagatgta ggtactaaaa atccggacaa actcagacaa 13920

ctctttgcgc aatatccagg ctttaaaatt atcaccaact acagatgtgt tgttgatgca 13980

gctaaaagtt acggtattaa cgtcgaaacc atcgactcat cccaaggaac caccggagat 14040

aggcatctgg tggtaatttg cggcagtacc aacttttcta aacttttaaa caggtttata 14100

gtagcagcct ctcgttcaac aactgaacta gttatagtca tgttgccaga gctttacaac 14160

tatttaacag agacgtttaa cttcaaaccg ttacaattgc aaaatgtgca tgtaccgatc 14220

gcagtatctt ctacagcatt ctgcgatata gaattttatc actttcaaaa gaagttctat 14280

gttggtgaaa taagcgtaag cacaagtacc actatgacat gtcagttggg ttgttatatt 14340

aatggctcct acatgctccc acctgtgctt gaaaactctg aagaccgtct ctacgttcct 14400

tctagatgga gacgtatgat aagaaaatac cctactgaat ctatgcacat ttccttactg 14460

gacagacttc tgaggcacat tttattaaca actactggag aaattcattt cgtaatgttc 14520

tctgcagaca atgatctcat tgcactggat ccgtacttta taccacccac tctatgtgag 14580

tgtggtagtg cgggtctagt ggaagtagac atcactgttt tctgccgcaa ttgtttgcct 14640

aaagatggta aagccactcg tttggtaaaa ccgtctacac tagatgtcca gactgaaaaa 14700

ctcagacttg caaaagttca tgctaaggtt tgtaaaatca agcatggcag tgctcacaac 14760

gctgatgttg atgctattat gactcaatgt atatatgcta atagcttaac attcacacca 14820

acaacccaac tagttgttaa cactgatgag ttcacctttt acatgctacc taggccgtca 14880

aaccgtcatt tgagaatcat tcataagaac gacaaacgtt tctatgctat cactcatgaa 14940

gaagaagatc tcttctttac taacatctca gcagtggtag acccaattcc tgcaaaattc 15000

aacattgcac actctacaag cttcctcacc atcaaaagtg gttgcgcagg taataagact 15060

tgtaccagat gctattattt acacttagca tacacggaat ttgtttctca acacaagtat 15120

gaaccattca cttgtgtgtc ttttaagata cggtttgact tttcacaatt cactgactca 15180

gtagatactt tcctccgaca aggcttaata acctttcatc cggagatgaa ttcactgcaa 15240

aaatcacttt tattagcagt ggataaggtc tattgtgata acttcacctc aaacggtaga 15300

aggtttagac tttacgacaa caatttggtt aaatccataa tcaaaggttc agtggctcaa 15360

aactccatca tcatgccact cgactcagtt ttacacgggt tgaacattga tttcacagtc 15420

ggatgtgccg tagataactt ttcctgcaaa gaagcagcga gtgttaggta ctcagaagta 15480

gtactttcca tcaccaagtt gcccccaggc acttgccagt tatactacgt catatcttac 15540

ggcctgaact ctcccaagac cacttatgct ggtcaccaat tgttcgacgg ctttgagact 15600

gttattgttg ttaatcgtaa agataaaccc ccttacgtcc tcacacagta tattaatgat 15660

gttgtagttg caatgccaga gtccctcttt tcaacaggtc gattctacag agaaaaacca 15720

tatcccgtcc ttatgaacga ggatttaagt ggcttaaacc atcacatttt ctctggtgac 15780

tatacagacg aatctcttac attaggaggt gtccatcata tagtaacttt aaacacctat 15840

gaccacaagc tcaactatat ccaaacgaaa gctacatgtg ccgcctcagt ttcaactggc 15900

ggacgtggtc ataaaattac tacactgttt gacgttcatg caaatcaact tgctgatgaa 15960

attaccagag ttacatctgt tgttacaaca cagtctaaag ttattaattt gacaatagat 16020

tatcagcaag ttccttgtat gtactggtct tcaccgaccg gcataagaac cttctaccct 16080

caggctgtta gactggacgc aaagtttata ccatactacg tagaatatcc caatattcta 16140

ccggcagttg ttgaagacca ggtgtacgat ttgtctaatt acaatcaacc acctttaggc 16200

caaaactgcc ctgtaaactt tcacaagtac gtccagctaa ctcactttat tttagatcat 16260

gtgaaaatcc ccgaaaaggg tttgatatat catatcggtg cagcaggtac taagcaatgt 16320

tcacctggag acttaatatt ggaacaattt ttcaataaat ccatcatata ctcaagtgac 16380

cttcttcctt accaatcacc tgctgtgcag gttgcattgg atgtaaggtt ttcggcttca 16440

ctcatcattt cagactgcta ttcgaaagaa ccgcagcctg atttgttgag taagttgatt 16500

aacaaactag tgtatggtgg aactctcatt tttaagacca ccgagacttt cacatgtgac 16560

ccagcctttt atgttgctca ttttaactgt ataaagtttt ttactgccgc tgttaatcac 16620

tcatcatcag aagtttatat tgcgttcatc ggaaaactcc ctaaaccaaa caacaacttt 16680

ttagcctcag actatttcca gagattaact caacatagaa ataaagtagt taaacagcct 16740

tacgctcaca catgggacac atcttttacg tacccatacc cctcaaatgt tcttcaagtt 16800

agtcgtaaaa accttttata tctatttgaa accagaggag ctgcagtagg tactttgatt 16860

tttgaagaac catcaaaacc tgctgtaaag atacctacaa agtgtcaaac cacacaaccc 16920

tcgtgtgtca ttgaggttgg taaccaatac gattgttgca ttcaagacat cattaccctc 16980

ctcaatggaa aatccttcac agtgaaggtg cccaactcag aatccttact gcgcgatatc 17040

tgcacacttg cgcttagcca gagttattcc atcaatattc gcggaaaaac actctacacc 17100

cttagttccc tacttagaat taggcaacaa tccttactgt tttacggaga gaaggtcaaa 17160

aaccctcgac cccgtaatgt cttgaacaaa tataccaact acctcaaggc aaaagtgatt 17220

aggcattaca ccaagcctca atcaacagtt ttggacattg gtacaggaaa aggacaagat 17280

ttgagaaaat actcgttagc aggggttaaa tccctcactt gtgtcgagcc tagtcccgag 17340

tctgtgactg aactttcaat aatagctagt ccccttgata tggagacaca cacagttatg 17400

agttctgccc agaaattcga gacctcgctg acgtttgact tggctttctc tttctttgcc 17460

ttgcactatg cattggatga cgtttgtatg tctgaaacac tcaacaatgt tttttgcaaa 17520

cttaacagta attcacagtt gatcttagta gttccaaatg ctggcaggat gcaatccata 17580

ccttcccttg gtttaacagt cactcatcta gatgatgata aagtttggtt taaatactca 17640

gactatatag actgcgaaga accgttagta gacaaagaaa aactacttac gtgtttagct 17700

acatatggaa caattgttac tgactcacca ttctatgacg gtgcaaacaa aatcctagac 17760

caaaaatgct catccatgta tagagcatcg acagcccatc taaatcccga tgaaattcaa 17820

tatattaata tgtatgattt aattgttgtc attaagaatt agcacaacaa aatgttcgcg 17880

ctcgttctaa ccctcacaat agcttcggct attgcccaag atttccccgc atatgacccg 17940

tgtcctactt gctcaacccc cggtaataaa ataccggctc cgagcacagt tgcccagtat 18000

tcaacaaact acggtgcgaa cttctttacc gtagtctttg atggtattat cttcaaccaa 18060

tttagggaga gttattacca ccaatgtaga ccaacacctg aatactgccc agatgcaatc 18120

aattgcgcct taaacagaac aggcgcatcc tgcaaacctt tcgcaactgg cccgaattca 18180

caatgtcaga acagtttcga gggcaacatc gacatatgtg caacatgtag ccctctaaaa 18240

caagaaactc cattcatctg ctacaataga tacgggataa ttatataccc gacagcagat 18300

atcgttctct ccgctaggtt taagataggc tctttttcac ccaaggcttg tgataactac 18360

ctaaacgact taaattgtga ttcaaaaacg gcaaggtcat atgtcatttc ccgaccgcag 18420

tctttttcac tgcaatatcc taactcatta ggcccctatc agctgaaacg attttctctt 18480

gcaaaggaga tcgttgactt acgtgctggc gttttaacct cactcccaaa ccgaggttat 18540

aagggtagaa caacatactc ttatcccgtc actgcactct cactcttggc tcgttccaaa 18600

gtggctgaag ccgacaaatt cttttatatc gaggctaaaa ttctactgta cgcttggtca 18660

cagaaacctc aaatccgctt tctaggtgca tactgtccca cagacgtgtc atgccctgat 18720

tcaactgccc tcggctgttg tttttccgga agtggatctg agttttacta cgcctttcgc 18780

cagtggtact acgcaagcct gggtatggaa gacctagtcg actttgataa ttcaacagtc 18840

ttaagtctct cgcctgatac tcctcaaatt acacccgttg tgtcttattt tctagaaaaa 18900

gttttacctt tgtttaaatc acatgtaccc ggacgtgttt tttactgcca ttcacttatg 18960

tctaacggtg tatgtacttt tgaccatgtt gttgtaaata ttaatgccga ggccgtcttt 19020

tttgacctcg aagtagacat aggcagcata attgctgacg catatcgcgt tgaaaggcct 19080

aatactttat gttatgatac aaactgtact cttgccacaa gcaggaccac tgagtataat 19140

tacgctgctt atgttgttta tatactcttc aatttgtatt ctagtaatcg cattgcgata 19200

gatttcaaca cacactcaat cttgcaagga ttactacaac acaatagcaa ctaccagact 19260

gctaatttag actatctgtt tgttggagca ctttttacag gtacttttaa acatattaca 19320

agcaatcaag cttacccagt acctttaact tatccaattg ttaagacata tgtagggccg 19380

tcaaaccaat actcaatgtc aaataaactg ttttcatata ctcacaattt gacggctcaa 19440

gcccattcag gcatatgtaa ctctttttac tgttataaac cacgttttgt accaattgat 19500

gtttttattc atagtgcttt aacccctgac agcttgatgg aaacagaatc ttttgtttgt 19560

gtctctttgc gttcaccatc tgcaggatca acatccgcag gtagttttta tttgcaatgt 19620

ctcaattctt ccatcgattt gcatccaggt tcatttgtac ccgtttcctc aagtccagag 19680

tcttccagcc gcgtaacagc tgagctggct tttaatacta gaaatggtat attttctcct 19740

tgtcttaacg gtacatgtgt actcgcacct actgacccaa ttgtttttat gcgtcagggt 19800

gcctggttta caaaatcttt acactttgat gtttcaccat gcaaacctat gcattttcca 19860

gacatagata tacagccccc aacatacaat gtctcctcta tcaagatgga cgacaatgct 19920

gtattggttc aagaccttac ttcgggttta gtaattgacc acaatttagg ctccatactc 19980

agaccgaaag gtagagcttt ggaagtttcg tattatgctc actccatttt acgttacctt 20040

gaaccggatt cttgtctacc tgacaacttt cttaactttg tcacttgttt agactatatc 20100

tgttcagact cgtcaccttg ccgtgctgcc gcaagccagt actgtcaggc aggcatttat 20160

tttgagtctg catttaataa gtctaggtat tctttgctta acgcttacac gctttttaac 20220

acaagtcttc aaaccttatt gcctgagact tttcttgaga tagaagatga tgaaccccat 20280

agcagatcaa agagatcaat tgatactaca agcaatattc gccctagtca attgcttgtt 20340

aatggacgta ttccgtctac aagttcagct tttgctgtta acgtcgctcg tggtcgagga 20400

acgattatgc ctcgtcctgg aactggtggc atgggttcgt ccttttctgc tgtttctagg 20460

tcgggtagta tttcttcctt atcctcggtt ggctcctcaa cacctttgat ctctaattgg 20520

agaacatctt catctcaact caaaactctc aacctcaaca ttaacactaa aattcctaag 20580

atttcaacaa agtcaggttt tgccagtatt acatctttgt ttgcttcagg tttaggagtc 20640

gtcgatctag gtctatctat tttcaacatg atagaacagc gtagagttgc tgagatcact 20700

cagatgcaaa ttagccaact ggctgactct atagtgtatc ttgctgatgt gacatttgaa 20760

gctatcaaga atttggaact ctcggttaac tccttgggta cgttcttatc ggaattttcc 20820

actcagatgt cgatcaccat aagccaaata caatcatcat ttgaagagca gcaagatgct 20880

acaaatgatg cgttgtacta cactaacgct gctgcgtcat accaagcctc catggcgtat 20940

gtcatttcag agttaaacgc aatatctctg tctgtcacta gatcctacga ctcttacacc 21000

agttgcatca cttctggcat taatgggctc attacaccat catgcttgcc agcccaccag 21060

ttgttacagt tactcgacac cgttatcaat tccacagcag gaacaggatg ccgtcccatc 21120

tacggcagag aagaagtggt gaaatactac actttacctc taatcaatca aggttattcc 21180

tttaacgggt cgattttctt cgtctttaac attcccatca cttgccaggg aattgccgga 21240

gatgtatatg aagtagaacc acctatactt gtagatgtac catcaaagac tgctttacgc 21300

atgattacac catcaaacgt agtcgcaaca caagcaggat tagctgaatt agatttgcgt 21360

cattgcgaaa ggtaccataa cgagttccta tgcgattctt cagcattcct ttctacacct 21420

tcaaaataca tagactgttt aacaaacgca actgactgtt ctttgcaatt catcacacaa 21480

cacgttccag atccttgcgt ttacacatcg ccagcttctt tatattgtta ttattcaccc 21540

atatgtgatc aatgtcacat agtagccggt tgtaatgaat ctcagcagta caacttcact 21600

tctgctgatg gcggcgtagt cttttattcc atacaagaca gagactgtgg ccacttcccc 21660

cacatcactg ttactacgcc tgcagccata caagaagact tcactgtcgg accgtattta 21720

ccatcgctgc caattcacac cgcctacgtc aatgttacct ggaatgtaac actaccagga 21780

aattggacct gggaaaatat caccctaaca gccaattgga cccaacactt cattgagatg 21840

aaaaaaaaca tcacaatgat ggctgaagaa atagataacc ttaccaactt cggtaaggtt 21900

ttagttggcc agctaaatag ctttttatca tctttgttta acataccatt aggtttgatg 21960

acgttttgct tttctgtagc cgctttaggc ctgtccatta ttgctttact tgtgttatgt 22020

tttccacaga agccacataa attataatcg tggtttcgct tgtaaatatt gatcaattga 22080

ggttttttac actttagtgt ttttcctcaa ccaattagac cagaggtttt tttacaccaa 22140

agtgtttttc ctctacaaag aattgaggtt ttttacactc tagtgttttt cctcaaactt 22200

atatatataa aatttcatta gtttgacatt tcattataaa tagcacaaca aatacattca 22260

ggcgacttgc atgatgttta ccctagtagt gctttttacc ctcctcggcc tttccatggc 22320

ctccacagag ctgaatttcg atcctactct acccctcccc tctcctataa atgccctcgt 22380

cgacattttc ggaaacaaca gcttgtttct caaagagtcc ctgctcggca aatccaccgg 22440

agccgtctac gcatacttgt acagcagtgc catctctctc ctgctgctac tttgggtaac 22500

tgtatggagt attgctactt cacactttaa cgtaactcgc attccaacca tcgcggttct 22560

cactaatgcg agtatgtttt tgctgttggc atcggctact gttacaacct ggtttctccc 22620

aactgtgacg aacgtcttct tttatacact cactgcgctg ttcaccttct tttcctttgt 22680

gttcttactg tggttggttt actatatgtt tactaccatt agggcatatc gaagggtcgg 22740

ttcatggcgc gttgtgttta acggaaaata ttctctactt gctggaactc aggctgtttg 22800

cctttgcaga cccgccatac atctggttct aaccaaaacg aacacagata catactggtg 22860

tctagatgga acccccatct acaatgttga cttactacaa ttagttggcc ccaaaggatt 22920

atatccttac aaaagaatga ctacaatcac tgcaccaaaa ggcacaaaaa catctgctgc 22980

cgtttacacc cttcaaaaag aagaagtttg tgctctctca gaaatcacag tacataatga 23040

tactgatttt taggtcatat aaaaaagcta acacatctaa aaaatgtctt acccggttta 23100

ctacgaacag cgtcgttatt ccccccgcca attcaacaat ggcggagggt ataatcctac 23160

acctcaacct agagtagttc gtactaatcc tggtaaccaa gcttacaacc cccggcgtaa 23220

ccgaaacgcc actccgaacc aacaacaaat ggttccttac cagcctcagt atcaagcacc 23280

tcctcagcca agggtggtct atgtagatcg ccctcaagaa cctgtagtaa tttacagagc 23340

tcctccacaa ggaaaaaaac aatcaggcaa acgccacaca gcagaagaac gctggtatca 23400

aggcgaaaaa cctgtgcaga agaaacaggc acccaaagga aaatcaaaga aagcagcaac 23460

acctgctaat cctaaaaagc agcctacaca atctgacaaa gttcccatcg cctacccaga 23520

caatcatccc ttccatgacc tcgcaccagc tgacatccgc gctttcaaaa agcagctgat 23580

ccaaaatctg gaccttggac atggtgaaat gaatcaactg cggctttcaa tcgatctgtt 23640

gcccatcaag aaaccagcac caacaccagc ggtgccagct cctctgtaat ttatggaaaa 23700

ggtgcaagac ctcccataaa taagtagata tgttcattac cctcattatg atcttcgcca 23760

tcttggcttt cccttcaaca tctgaaggag cagcccaaga actactcaaa gctgtaaaat 23820

ctgctgctat catggaaaag gtgcaagacc tcccatgaaa atagtagccg gtttcaaaag 23880

ttgataatta ttgcattatg tttacccttg tgcttattat cctgcttagt ttttctatgg 23940

cttttaatgc ttttacattt ctgctgttat tattttttac ttttaagtgc attataaccc 24000

gcactttagt cgtagttccc attgactacc cagaaaatca tcctttcaat ggcctctcac 24060

cagaggaaat catcagctac aaatcacagc tgatccaaaa tctcgatctt ggacatggtg 24120

aagtaattaa acatcgattc tcaattgatt tacttcccct caaaacaaca agcactccta 24180

ccaccagtgc tattttatgg aaaaggttca aaacctccca taaagaaaac aaccactaaa 24240

caaccatgga aaaggtgcaa gacctcccat gaaattagtg gttgctttca aaaattaata 24300

aatattgtga taaatgtcta tttctaacca cccttaaaaa taggtacccc cactatatct 24360

agccgacgtt aactcctgga tatgttatag tgttctctcc ccaatcgttc atctgctcgc 24420

ttttagaact gctaggctgt atctgttaaa tgtttaatct ttagactcaa tttacgttct 24480

tttttacata aaatcctcct attttgctat cccttatttt aattaaaccc ctttagtatc 24540

accagtatcc ctaatcactc ccctagcctc ccttgttctg acctgtatga aatgtcaaaa 24600

aactaaatga aaa 24613

<210> 7

<211> 5867

<212> БЕЛОК

<213> Вирусы

<220>

<223> аминокислотная последовательность ORF-1 ("X" в положениях 830-835, 841, 842 и 3257 обозначает любую аминокислоту)

<400> 7

Met Lys Lys Ile Glu Asp Ala Leu Gly Thr Leu Lys Pro Ala Phe Lys

1 5 10 15

Ala His Ile Asp Ser Leu Pro Pro Phe Met Gly Lys Leu Ala Thr Met

20 25 30

Leu Ala Glu Thr Arg Arg Gly Lys Thr Pro Pro Leu Leu Ile Tyr Val

35 40 45

Ile Ser Thr Ile Leu Glu Thr Asn Ile Thr Val His Tyr Val Ser His

50 55 60

Thr Ile Thr Ser Tyr His Ser Ser Asn Ala His Thr His Thr His Glu

65 70 75 80

Phe Asp Ser Glu Asp Tyr Thr Pro Asp Asn Gln Ile Leu Thr Lys Val

85 90 95

Asn Arg His Gly Asn Asp Leu Asn His Ser Tyr Ile His Gly Ala Thr

100 105 110

Asn Met Tyr Asn Pro Val Tyr Gln Arg His Pro Pro Asn Met Cys Tyr

115 120 125

Met Leu Thr Gly Leu Tyr Met Leu Ser Gly Leu Gln Glu Leu Tyr Ala

130 135 140

Met Ala Glu Asp Asn Leu Thr Thr Cys Gln Ile Asn Leu Leu Arg Cys

145 150 155 160

Leu Phe Asp Leu Asn Gln Asp Glu Phe Asp Val Asp Tyr Thr Phe Val

165 170 175

Ile Tyr Thr Pro Ser Lys Ser Gln Glu Cys Ala Phe Lys Tyr Leu Gln

180 185 190

Glu Ile Val His His Cys Glu Leu Thr Ile Phe Arg His Thr Thr Thr

195 200 205

Ser Val Phe Ser Cys Asn Lys Cys Asn His Val Glu Thr Val Ile Ser

210 215 220

Ser Cys Ser Leu Asn Leu Val Tyr Ile Thr Asp Ser Ile Glu Lys Ala

225 230 235 240

Phe Gln Pro Thr Val Glu Ala Asn Thr Asp Tyr Met Cys Glu Asn Cys

245 250 255

Gly Leu Arg Asp His Lys Leu Lys Thr Thr Val Thr Asn Pro Asp Leu

260 265 270

Arg Leu Ala Gln Leu Asn Tyr Pro Thr Asp Ser Lys Tyr Thr Ile Phe

275 280 285

Leu Asp Glu Gln Ala Pro Phe Val Phe His Ser Ile Ala Lys His Val

290 295 300

Gly Thr Ala Asn Ser Gly His Trp Ser Ala Leu Asn Val Asn Ser Asp

305 310 315 320

Met Leu Ser Asp Ser Asn Glu Arg Gln His Tyr Tyr Thr Thr Pro Ser

325 330 335

Ile Val Leu Leu Ala Phe Leu Pro Glu Glu Glu Leu Gln Asn Ile Arg

340 345 350

Asn Ser Ser Pro Leu Gln Asp His Gln Pro Asp Asp Val Glu Asp Val

355 360 365

Glu Ser Pro Leu Pro Gly Ser Ile Phe Tyr Thr Thr Asp Asp Ile Phe

370 375 380

Ser Thr Lys Ser Leu Ser Ile Ala His Cys Val Ala Arg Asp Phe His

385 390 395 400

Met Ser Gly Gly Ile Ala Lys Ile Phe Ser Asp Lys Phe Gly Ser Lys

405 410 415

Thr Phe Leu Lys Ser Gln Asn Pro Val Ile Gly Gly Phe Ser Ile Leu

420 425 430

Leu Arg Glu Cys Arg Asp Met Tyr Tyr Leu Val Thr Lys Glu Lys Thr

435 440 445

Ser Asp Lys Pro Thr Tyr Gln Asp Leu Lys Asn Ser Leu Gly Ser Met

450 455 460

Thr Glu Asn Leu Val Arg Lys Asn His Asn Thr Leu Ser Ile Pro Tyr

465 470 475 480

Ile Gly Cys Gly Ile Asp Gly Leu Gln Trp Ala Thr Val Glu Lys Gln

485 490 495

Val Lys Glu Ile Val Cys Ala Arg Gly Ile Asp Val Thr Val His His

500 505 510

Leu Glu Asn Glu Val Lys His Thr Pro Glu Gln Gln Thr Ala Ser Asp

515 520 525

Asn Ser Val Lys Leu Val Gln Lys Leu Phe Thr Glu Thr Pro Gln Ala

530 535 540

Ile Pro Ile Val Val Pro Ser Asp Asp Ser Asp Ser Asp Ile Asp Glu

545 550 555 560

Ser Ala Asp Val Phe Leu Pro Gly Pro Glu Ser Glu Ser Asp Ser Lys

565 570 575

Ser Glu Ser Gly Ser Asp Tyr Asp Phe Lys Ser Ala Ser Glu Pro Glu

580 585 590

Asp Glu Leu Glu Pro Thr Pro Ile Ser Glu Leu Glu Leu Thr Pro Ala

595 600 605

Ser Ser Leu Thr Val Glu Ser Asp Asp Asn Pro Asp Thr Ser Gln Glu

610 615 620

Thr Leu Pro Glu Ser Asn Ser Glu Glu Thr Lys Pro Glu Gln Thr Pro

625 630 635 640

Asp Thr Thr Ser Lys Val Ser Ser Asp Ser Lys Leu Asp Pro Gln Ser

645 650 655

Glu Leu Glu Glu Glu Leu Ala Asn Lys Pro Glu Ser Ala Ser Glu Pro

660 665 670

Gln Ser Glu Thr Glu Ser Ser Ser Glu Ser Glu Glu Glu Leu Glu Pro

675 680 685

Gln Ser Glu Ser Glu Glu Glu Pro Ala Asn Lys Pro Glu Ser Pro Ser

690 695 700

Glu Ser Gln Ser Glu Asn Gly Ser Ser Ser Glu Pro Glu Glu Glu Ser

705 710 715 720

Glu Lys Pro Ser Glu Ser Ala Glu Thr Ala Thr Glu Asp Ser Pro Glu

725 730 735

Thr Thr Pro Glu Thr Thr Leu Glu Leu Thr Thr Gln Leu Lys Pro Ala

740 745 750

Ser Glu Ser Asp Asp Lys Pro Asp Thr Pro Ala Pro Ser Pro Ser Pro

755 760 765

Ile Gln Pro Glu Lys Asn Leu Asp Thr Thr Pro Glu Gln Thr Ser Gln

770 775 780

Pro Thr Thr Gln Leu Glu Leu Thr Leu Glu Thr Gln Glu Gln Pro Asp

785 790 795 800

Thr Thr Pro Glu Val Pro Ser Val Ser Glu Asp Lys Pro Asp Thr Leu

805 810 815

Glu Glu Ser Ser Glu Ser Thr Pro Glu Leu Ser Glu Leu Xaa Xaa Xaa

820 825 830

Xaa Xaa Xaa Thr Ser Thr Lys Thr Xaa Xaa Thr Arg Pro Pro Thr Pro

835 840 845

Arg Pro Arg Ser Ala Arg Gly Ala Arg Thr Arg Ser Cys Ala Gly Thr

850 855 860

Pro Ile Pro Val Ile Phe Asp Ile Ile Asp Asn Thr Ser Gln Pro Gln

865 870 875 880

Val Pro Leu Asp Phe Pro Glu Ala Leu Gln Glu Leu Asn Lys Pro Ser

885 890 895

Glu Val Ile Pro Ala Ala Ser Glu Lys Pro Val Glu Lys Gln Ile Ile

900 905 910

His Ser Phe Val Ser Val Glu Thr Pro Cys Lys Pro Lys Ala Thr Lys

915 920 925

Val Thr Asn Tyr Val Ala Ala Gln Ser Asn Ala Ile Leu Asn Cys Ile

930 935 940

Lys Ala Phe Ile Pro Ser Asn Pro Leu Ser Leu Phe Asn Arg Lys Pro

945 950 955 960

Ala Phe Arg Lys Ile Ile Phe Thr Glu Asp Thr Ser Glu Pro Asp Ser

965 970 975

Asp Asp Asp Asp Cys Glu Tyr Thr Pro Pro Thr Ser Pro Phe Pro Glu

980 985 990

Leu Leu Ala Leu Val Asp Glu Asp Ile Glu Val Glu Gln Thr Gln Ser

995 1000 1005

Val Ile Pro Lys Thr Asp Ser Ala Ser Ile Val Glu Asp Leu Lys Lys

1010 1015 1020

Gln Glu Ser Ser Thr Leu Ser Leu Asp Thr Asn Thr Ser Lys Pro Thr

1025 1030 1035 1040

Ser Ser Pro Arg Arg Gln Pro Arg Glu Val Glu Ser Val Asp Glu Ser

1045 1050 1055

Ser Asp Asp Ser Ser Lys Pro Lys Thr Ile Ser Thr Leu Asp Lys Pro

1060 1065 1070

Ala Met Asn Ser Asp Thr Lys Pro Thr Asp Ser Ser Arg Lys Glu Pro

1075 1080 1085

Leu Glu Val Pro Val Thr Thr Ser Leu Ser Thr Pro Ala Lys Asn Gln

1090 1095 1100

Asp Lys Lys Ser Ser Lys Ser Ala Lys Val Ile Lys Asp Tyr Ser Leu

1105 1110 1115 1120

Thr Pro Asn Thr Val Lys Gln Gln Val Tyr Ser Leu Tyr Gly Glu Ser

1125 1130 1135

Val Asp Ala Val Lys Tyr Leu Val Gln Thr Tyr Pro Asp Arg Ala Lys

1140 1145 1150

Gln Thr Ala Gly Ile Ala Tyr Phe Leu Ile Thr Thr Tyr Leu Ile Trp

1155 1160 1165

Thr Ile Gly Leu Ile Gly Val Pro Met Ala Phe Lys Ile Pro Met Phe

1170 1175 1180

Leu Cys Leu Leu Tyr Gln Val Asn Gly Leu Asn Ile Ala Pro Phe Val

1185 1190 1195 1200

Thr Asn Gln Lys Leu Gln Tyr Val Ala Phe Pro Leu Trp Tyr Lys Leu

1205 1210 1215

Tyr Glu Val Ile Ser Val Arg Phe Val Ala Asn Ile Ala Gln Phe Ile

1220 1225 1230

Val Lys Thr Pro Pro Ile Asp Val Leu Asn Lys Leu Ile Arg Ser Asn

1235 1240 1245

Lys Asp Lys Pro Val Lys Leu Thr Pro Asn Lys His Thr Leu Met Leu

1250 1255 1260

Ile His Asp Leu Ala Leu Glu Ser Val Asp Gly Lys Glu Asn Arg Tyr

1265 1270 1275 1280

Tyr Asn Thr Asp Val Thr Thr Phe Thr Lys Arg His Ser Thr Ser Asn

1285 1290 1295

Ile Ser Tyr Val Leu Lys Ser Thr Leu Ile Lys Tyr Val Met Asp His

1300 1305 1310

Cys Tyr Val Asn Ile Ala Val Phe Thr Leu Val Arg Tyr Leu Thr Leu

1315 1320 1325

Leu Val Phe Ile Gln His Phe Ser Asn Pro Tyr Val Leu Glu Ala Asn

1330 1335 1340

Ser Gln Ser His Thr Val Leu Gln Tyr Leu Phe Ser His Leu Arg Pro

1345 1350 1355 1360

Phe Gly Arg Pro Leu Cys Pro Thr Leu Asn Asp Tyr Met Thr Thr Ala

1365 1370 1375

Thr Pro Arg Asp Ala His Val Gln Ala Gly Ser His Phe Ser Glu Phe

1380 1385 1390

Cys Val Pro Ile His Tyr Thr Thr Pro Ile Ile Lys Ser Thr Met Ala

1395 1400 1405

Glu Pro Ser Leu Phe Leu Leu Phe Asn Pro Val Leu Trp Pro Leu Val

1410 1415 1420

Met Val Val Tyr Phe Tyr Pro Pro Met Met Phe Ile Ala Asn Ala Val

1425 1430 1435 1440

Ala Tyr Ser Cys Leu Pro Leu Val Val Leu Leu Gln Trp Leu Tyr Ala

1445 1450 1455

Met Trp Phe Ser Cys Thr Cys Tyr Gly Thr Lys Arg Cys Ala Lys His

1460 1465 1470

Leu His Lys Asn Glu Val Val Lys Pro Met Glu Ser Thr Ser Thr Lys

1475 1480 1485

Asn Arg Met Thr Phe Thr Pro Ser Thr Thr Phe Cys Ser Lys His Asn

1490 1495 1500

Phe Phe Cys Pro Asp Ala Pro His Ile Met Thr Leu Ala Met Ala Arg

1505 1510 1515 1520

Gln Leu Thr Asn Tyr Tyr Asn Leu Thr Asp Thr Val Ile Pro Asp Ile

1525 1530 1535

Gln Glu Tyr Ser His Glu Asn Pro Thr Val Gln Phe Ile His Phe Asp

1540 1545 1550

Pro Leu Lys His Gly Ala Asp Thr Ile Leu Glu Pro Ile Thr Ser Ala

1555 1560 1565

Ser Ala Ser Ser Ile Val Ala Trp Tyr Ser Leu Leu Phe Asn Gln Lys

1570 1575 1580

Phe Val Leu Ser His Tyr Ser Tyr Arg Thr Pro Val Ala Val Val Asp

1585 1590 1595 1600

Lys Pro Glu Glu Thr Asp Gly Asp Asp Thr Lys Ser Leu Ala Ser Asp

1605 1610 1615

Thr Ser Asp Asn Phe Glu Ser Ile Arg Lys Thr Asn His Lys Asn Gln

1620 1625 1630

Ser Lys Gln Gln Phe Arg Pro Asn Gly His Gln Arg Pro Ser Lys Thr

1635 1640 1645

Phe Lys Arg His Ser Arg Ile Met Thr Ser Glu Gln Lys Asn Ser Leu

1650 1655 1660

Ile Glu Thr Phe Lys Gly Leu Thr Asn Gly Thr Ala Ala Ile Pro Gln

1665 1670 1675 1680

Pro Leu Ile Ile Phe Ile Trp Val Ile Leu Met Val Ile Pro Thr Leu

1685 1690 1695

Phe Leu Val Ala Ser Ser Ser Arg Thr Ala Ala Thr Met Pro Leu Asn

1700 1705 1710

Arg Tyr Ser Gly Val Asn Pro Thr Gly Ile Met Phe His Gln Ala Pro

1715 1720 1725

Pro Tyr Ile His Ser Glu Pro Pro Lys Glu Thr Tyr Tyr Lys Leu Ser

1730 1735 1740

Tyr Pro Tyr Pro Ser Ala Thr Val Val Arg Thr Leu Lys Gly His Leu

1745 1750 1755 1760

Tyr Tyr His Ser Asp Asp Thr Val Gln Gln Asn Cys Thr Met Gln Tyr

1765 1770 1775

Ser Leu Ile Ala Ala Ser Thr Lys His Val Cys Gly Lys Val Val Tyr

1780 1785 1790

Thr Ile Pro Ala His Val Ser Ile Gly Ser Leu Lys Leu Leu Leu Val

1795 1800 1805

His Pro Asp Gln Thr Asn Leu Pro Phe Glu Leu Pro Val Ser Asp Glu

1810 1815 1820

Val Arg Leu Cys Tyr Leu Thr Thr Leu Asn Ala Pro Arg Cys Met Pro

1825 1830 1835 1840

Ser Gln Leu Ala Met Ser Asn Asn Gln Phe Ala Ala Val Ser Leu Val

1845 1850 1855

Leu Leu Ile Thr Leu Val Ser Leu Ile Lys Val Tyr Ile Met Phe Phe

1860 1865 1870

Thr Val Phe Lys His Tyr Thr Thr Thr Val Phe Ile Leu Val Ala Val

1875 1880 1885

Thr Thr Ile Thr Met Leu Val Ser Phe Leu Ala Pro Pro Leu Leu Ile

1890 1895 1900

Val Val Leu Leu Ser Leu Ala Trp Leu Trp Tyr Gly Asn Thr Ile Val

1905 1910 1915 1920

Leu Cys His Ile Met Leu Leu Ile Val Leu Val Val Ser Trp Lys Val

1925 1930 1935

Ala Ala Val Cys Phe Ile Phe Ala Leu Leu Tyr Phe Gly Lys Cys Ala

1940 1945 1950

Met Leu Ser Lys Asn Ile Lys Tyr Val Gln Gly Gly Val Lys Phe Ser

1955 1960 1965

Gly Thr Phe Glu Glu Ile Ala Gln Ser Thr Phe Phe Ile Asn Tyr Gly

1970 1975 1980

Val Ala Cys Gln Leu Leu Glu His Thr Gly Gln Thr Ile Glu Asp Ile

1985 1990 1995 2000

Met Gln Leu Arg Thr Ala Gly Gly Ala Pro Ala Arg Leu Ala Arg Ser

2005 2010 2015

Ile Tyr Asp Cys Phe Ser Thr Asn Ala Ser Val Leu Tyr Ser Pro Arg

2020 2025 2030

Ser Phe Ser Pro Gln Ser Leu Ile Thr Lys Tyr Leu Tyr Pro Gly Ser

2035 2040 2045

Ile Pro Val Gly Arg Ala Pro Val Leu Leu Gly Lys Ile Ser Gly Met

2050 2055 2060

Thr Cys Leu Gly Arg Glu Gln Ser Thr Cys Phe Gln Ser Ser Ala Thr

2065 2070 2075 2080

Thr Ile Thr Thr Cys Thr His Ala Val Asn Thr Ala Gly Thr Phe Met

2085 2090 2095

Ser Gln Ile Lys Cys Val Ile Asp Asn Lys Ile Tyr Thr Val Gln Pro

2100 2105 2110

Glu Asn Ile Thr Ile Thr Gly Met Lys Ala Thr Phe Glu Val Glu Gly

2115 2120 2125

Leu Pro Pro Phe Thr Asn Asp Val Thr Val Ala Pro Lys Pro Leu Lys

2130 2135 2140

His Tyr Met Asp Gly Lys Arg His Leu Val Leu Tyr Thr Lys Ser Glu

2145 2150 2155 2160

Ser Ile Val Tyr Ser Ser Ile Met Trp Pro Thr Glu Asn Gly Leu Phe

2165 2170 2175

Ser Ser Ser Val Ser Asp Pro Gly Asp Ser Gly Ala Pro Tyr Phe Ser

2180 2185 2190

Asp Asn Val Ile Val Gly Ile His Gln Gly Arg Asn Glu Ala Thr Asn

2195 2200 2205

Asn Pro Ala Ile Leu Ala Ser Gly Met Asp Gly Glu Ser Pro Cys Val

2210 2215 2220

Gly Tyr Asp Asp Gln Ser Tyr Gly Leu Pro Leu Gln Glu Tyr Phe Thr

2225 2230 2235 2240

His Ile Val Leu Ser Asn Lys Pro Ser Asp Phe Gly Ala Pro Ser Asn

2245 2250 2255

Val Ala Pro Asn Lys Tyr Tyr Asn Lys Lys Ser Phe Glu Gln Leu Ala

2260 2265 2270

Asp Glu Asp Lys Thr Tyr Leu Asn Ser Leu Ser Tyr Pro Leu Ser Ser

2275 2280 2285

Ser Asn Tyr Cys Tyr Phe Asn Ser Phe Lys Thr Gln Ser Ser Thr Thr

2290 2295 2300

Met Leu Asp Asn Ala Glu Val Ile Lys Tyr Val Val Leu Leu Leu Met

2305 2310 2315 2320

Ile Leu Asp Tyr Phe Phe Ser Ile Ile Cys Glu Asp Ala Leu Asn Pro

2325 2330 2335

Ala Ser Tyr Ala Met Leu Val Ile Val Leu Val Gln Ala Phe Ile Thr

2340 2345 2350

Lys Ile Thr Val Phe Arg Thr Gly Ile Tyr Ile Gln Ala Ala Val Phe

2355 2360 2365

Gln Ala Phe Ile Val Pro Ile Val Ser Gln Ile Thr Leu Ile Leu Ala

2370 2375 2380

Ala Asp Thr Ala Arg Ser Phe Leu Thr Phe His Phe Phe Val Leu Ala

2385 2390 2395 2400

Val Leu Thr Tyr Phe Val Leu Cys Arg Ile Ala Val Asp Phe Trp Arg

2405 2410 2415

Ser Met Phe Leu Leu Phe Leu Thr Ser Val Phe Ala Thr Ile Ile Trp

2420 2425 2430

Thr Thr Lys Asn Asp Phe Asn Ile Leu His Glu Thr Gly Val Val Leu

2435 2440 2445

Thr Pro Thr Ala Glu Leu Ala Leu Ile Val Ala Phe Thr Tyr Ile Ile

2450 2455 2460

Tyr Ala Ser Cys Met Leu Thr Pro Val Pro Leu Tyr Thr Ile Cys Val

2465 2470 2475 2480

Phe Phe Ser Phe Leu Ser Asn Ala Pro Leu Tyr Leu Ala Val Leu Ser

2485 2490 2495

Phe Gly Ile Leu Val Ser Phe Lys Thr Asn Gln Asp Phe Gly Arg Leu

2500 2505 2510

Val Asp Lys Val Phe Ser Leu Asn Met Leu Tyr Glu Tyr His Ala Tyr

2515 2520 2525

Gln Asn Tyr Val Ile Gln Asn Ser Gly Gln His Pro Gly Phe Tyr Arg

2530 2535 2540

Ser Leu Phe Ala Phe Phe Ile Asn Leu Thr Thr Gln Pro Lys Thr Thr

2545 2550 2555 2560

Tyr Lys Cys Phe Lys Pro Gln Thr Ala Ser Gly Tyr Arg Val Ile Tyr

2565 2570 2575

Gln Thr Pro Thr Thr Glu Phe Asn Lys Ser Leu Gln His Ala Ser Ile

2580 2585 2590

Thr Lys Asp Asp Asn Ser Asn His Ile Ile Met Phe Ala Asp Gly Ser

2595 2600 2605

Ser Asp Asn Leu Asn Trp Ala Lys Glu Met Val Ala Thr Ile His Leu

2610 2615 2620

Thr Asn Pro Asn Leu Gln Pro Leu Ile Ile Gly Tyr Tyr His Asn Ser

2625 2630 2635 2640

Met Asp Val Ile Thr Lys Gly Thr Tyr Met Gln His Glu Phe Ile Lys

2645 2650 2655

Met Pro Ala Val Ile Leu Thr Gln Asp Pro Leu Thr Glu Pro Ile Ser

2660 2665 2670

His Leu Ala Ala Ala Ala Phe Thr Ser Ile Ser Gly Lys Pro Gln Ala

2675 2680 2685

Gln Lys Asn Asn Val Val Ser Asn Ser Lys Ala Arg Ile Asn Thr Ala

2690 2695 2700

Val His Asp Ala Val Glu Ser Val Tyr Ser Gly Glu Thr Tyr Val Ala

2705 2710 2715 2720

Pro Lys Pro Ile Val Ser Gly Lys Thr Val Val Glu Lys Pro Phe Ser

2725 2730 2735

Thr Thr Glu Thr Thr Met Tyr Ile Met Arg Gly Leu Pro Gly Ser Gly

2740 2745 2750

Lys Ser Phe Lys Val Ser Gln Leu Val Ala Lys Asp Pro Asn Leu Val

2755 2760 2765

Val Ala Ser Ala Asp His Phe Arg Tyr Ser Asn Asp Lys Thr Gly Lys

2770 2775 2780

Ala Val Tyr Thr Tyr Ile Pro Glu Ala Thr Ser Ser Val His Leu Gln

2785 2790 2795 2800

Cys Gln Asn Arg Ala Arg Lys Ala Leu Glu Asn Gly Gln Ser Val Cys

2805 2810 2815

Ile Asp Asn Thr Asn Leu Thr Leu Leu Glu Met Arg Pro Tyr Val Leu

2820 2825 2830

Leu Ala Arg Ser Phe Asn Tyr Asn Ile Glu Phe Ile His Ser Asp Ser

2835 2840 2845

Pro Trp Ala Leu Asn Leu Asp Leu Leu His Ala Lys Gly Val His Asn

2850 2855 2860

Val Pro Arg Ala Lys Leu Val Ile Met Tyr Asp Arg Phe Phe Asp Arg

2865 2870 2875 2880

Asp Asn Gln Ile Asp Ala Asp Ser Leu Ile Gln Tyr Val Ile Glu Ala

2885 2890 2895

Ile Asp Pro Lys Leu Val Ala Pro Ile Met Asn Arg Phe Pro Ala Asp

2900 2905 2910

Cys Asp Leu Ile Leu Gln Ser Ala Leu Thr Pro Asp Leu Glu Val Leu

2915 2920 2925

Lys Gln Asn Tyr Asp Arg Ala Asn Ala Thr Tyr Gln Asp Val Ser Leu

2930 2935 2940

Asp Asp Pro Pro Ala Leu Lys Ala Ala Arg Arg Ala Met Asn Ile Ala

2945 2950 2955 2960

Lys Ser Glu Tyr Glu Ala Gly Glu Ala Gly Gln Arg Arg Ile Glu Lys

2965 2970 2975

Phe Leu Glu Arg Gln Asp Val Ala Ala Leu Asn Gln Thr Leu Thr Thr

2980 2985 2990

Val Asn Gln Ser Lys Phe Ile Ala Ala Ile Arg Ser Ile Tyr Leu Ser

2995 3000 3005

Thr Ile Ser Asn Leu Arg Leu Lys Thr Arg His Met Gly Glu Gly Ser

3010 3015 3020

Tyr Ala Val Thr Ser Gly Thr Asn Thr Thr Asp Lys Val Leu Val Asn

3025 3030 3035 3040

Thr Pro Gln Arg Met Thr Arg Ile Glu Asp Gly Ile Tyr Lys Leu Val

3045 3050 3055

Ala Asn Gly Phe Glu Ile Thr Met Cys Asp Gly Ser Asn Leu Ala Gly

3060 3065 3070

Val Thr Phe Glu Gln Asp Ile Asn Pro Ser Met Tyr Pro Phe Val Phe

3075 3080 3085

Thr Leu Met Ser Asn Ile Ala Val Pro Val Leu Thr Arg Gln Ala Asn

3090 3095 3100

Val Gly Tyr Leu Asp Met Ser Asn Lys Phe Ile Cys Lys Asp Gly Thr

3105 3110 3115 3120

Val Gln Phe Gln Gly Val Ile Tyr Ala Tyr His Thr Pro Ser Asn Glu

3125 3130 3135

Ser Ala Asp Phe Lys Val Gly Asn Thr Ser Trp Thr Leu Gln Lys Asn

3140 3145 3150

Ile Asn Leu Thr Ala Phe Ile Pro Ala Ile His Lys Thr Ala Thr Phe

3155 3160 3165

Ala Ala Gln Ser Val Phe Leu Gly Gly Leu Pro Met Glu Glu His Gln

3170 3175 3180

Ala Phe Ser Asp Thr Pro Thr Ala Ser Asn Lys Phe Lys Val Phe Val

3185 3190 3195 3200

Ser Ser Thr Val Cys Ala Ser Thr Val Cys Lys Val Asn His Lys Thr

3205 3210 3215

Tyr Val Gln Ile Pro Asp Asp Ile Gln Asp Pro Phe Thr Tyr Met His

3220 3225 3230

His Ser Val Cys Ser His Asn Lys Phe Leu Ser Asn His Glu Thr Arg

3235 3240 3245

Cys Gln Ile Cys Pro Leu Asn Cys Xaa Ser Ala Asn Pro Cys Val Ser

3250 3255 3260

Thr Ala Cys Ala Leu Phe Asp Asn Gly Thr Leu Pro Arg Ser Thr His

3265 3270 3275 3280

Tyr Ile Asn Val Ser Thr Thr Ser Asn Val Gly Leu Phe Lys Ala Val

3285 3290 3295

Lys Lys Ser Thr Arg Gln Leu Asn Ile Asp Gly Phe Pro Tyr Met Leu

3300 3305 3310

Lys Gln Val Lys Asp Asp Ser Glu Leu Val Ser Ser Leu Lys Ile Gly

3315 3320 3325

Leu Pro Asn Ile Leu Pro His His Met Val Glu Thr Lys Ser Lys Thr

3330 3335 3340

Tyr Leu Leu Arg Gly Pro Thr Thr Ala Tyr Ser Leu Gly Asp Leu Cys

3345 3350 3355 3360

Tyr Ala Leu Phe Asn Gly Asp Phe Asp Tyr Ile Arg Glu Asn Ile Asn

3365 3370 3375

Ser Asp Phe Val Leu Asp Arg Glu Ala Gly Met Pro Asp Thr Glu Thr

3380 3385 3390

Arg Thr Trp Leu Phe Ser Ile Leu Asn Phe Ala Val Pro Arg Val Cys

3395 3400 3405

Ala Ile Ile Asp Gln Met Ile Ser Glu Asn Val Phe Tyr Lys Leu Thr

3410 3415 3420

Leu Asp Asn Leu Asp Leu Tyr Gly Ser Leu Tyr Asp Phe Asp Asp Tyr

3425 3430 3435 3440

Pro Thr Glu Gly Phe Asn Arg Pro Asp Asp Val Ile Arg Met Leu Lys

3445 3450 3455

Glu Ile Trp Ser Phe Cys Arg Arg Pro Leu Pro Ala Asp Leu Leu Lys

3460 3465 3470

Tyr His Glu Asp Ile Gly Ala Ala Ala Thr Gln Glu Ile Leu Leu His

3475 3480 3485

Ala Pro Phe Ile Asp Lys Val Cys Ala Leu Asn Asp Arg Leu Ala Val

3490 3495 3500

Val Asp Asn Arg Ala Ser Gln Tyr Phe Phe Cys Glu Glu Glu Gly Val

3505 3510 3515 3520

Phe Thr His Ile Tyr Asn Pro Val Tyr Gly Thr Leu Ala Phe Asp Asn

3525 3530 3535

Lys Leu Ile Gln Ser Lys Asp Pro Ser Cys Thr Leu Gln Arg Leu Ile

3540 3545 3550

Thr Ile Gln Gly Pro Leu Ser Thr Asn Ala Ser Pro Val Ile Ser Ile

3555 3560 3565

Ser Asp Ser Thr His Ile Ala Asn Asn Ile Asn Pro Ser Asn Gln Lys

3570 3575 3580

Thr Thr Pro Leu Tyr Tyr Asp Leu Glu Leu Ala Gln Glu Phe Ile Asp

3585 3590 3595 3600

Ala Gly Leu Asn Ile Asp Gly Val Ser Asn Tyr Phe Phe Tyr Gly Pro

3605 3610 3615

Ser Arg Ala Gly Val Val Ser Asp Phe Leu Leu Tyr Glu Phe Gln Gly

3620 3625 3630

Thr Gln Trp Phe Asp Asn Asn Met Leu Arg Ser Leu Tyr Ser Phe Ile

3635 3640 3645

Leu Lys Asn Ser Glu Cys Tyr Arg Thr Thr Asp Gln Leu Asp Phe Arg

3650 3655 3660

Gly Gly Lys Pro Arg Lys Ser Ser Met Gly His Gly Val Thr Gly Phe

3665 3670 3675 3680

Lys Gln Asp Val Val Tyr Ala Ala Leu Gly Pro Asp Met Ile Glu Thr

3685 3690 3695

Leu Tyr Glu Thr Ala Lys Gln Thr Pro Leu Pro Phe Cys Thr Lys Ile

3700 3705 3710

Thr Ala Lys Tyr Ala Leu Thr Ala Lys Pro Arg Ala Arg Thr Val Ala

3715 3720 3725

Ala Cys Ser Phe Val Ala Ser Thr Ile Phe Arg Tyr Ala His Lys Pro

3730 3735 3740

Leu Thr Asn Asn Met Val Ser Lys Ala Gln Gln Gly Leu Gly Tyr Cys

3745 3750 3755 3760

Leu Ile Gly Ile Ser Lys Phe His Gly Arg Phe Asn Lys Phe Val Lys

3765 3770 3775

Ser Arg Val Gly Thr Val Glu Asp Phe Asn Val Phe Gly Ser Asp Tyr

3780 3785 3790

Thr Lys Cys Asp Arg Thr Phe Pro Leu Ala Leu Arg Ala Leu Ser Ala

3795 3800 3805

Ala Leu Ile Phe Asp Leu Gly Gly His Asp Pro Asp Asn Cys Leu Phe

3810 3815 3820

Ile Asn Glu Leu Asn Ala Tyr Met Leu Asp Ile Val Ser Val Glu Asp

3825 3830 3835 3840

Ser Phe Ala Asn Lys Pro Gly Gly Thr Ser Ser Gly Asp Ala Thr Thr

3845 3850 3855

Ala Tyr Ser Asn Thr Leu Tyr Asn Phe Ala Val His Tyr Ile Ile Met

3860 3865 3870

Trp Lys Thr Phe Leu Thr Val Asn Asp Pro Ser Thr Lys Val Ile Arg

3875 3880 3885

Ser Ala Ala His His Ala Leu Thr Ser Gly Asp Phe Ser Met Tyr Asn

3890 3895 3900

Asp Met Ile Gln Asp Met Leu Asp Val Asp Tyr Thr Leu Asn Phe Leu

3905 3910 3915 3920

Ser Asp Asp Ser Tyr Ile Cys Ser Lys Pro Ser Ala Phe Pro Ile Phe

3925 3930 3935

Thr Leu Glu Asn Tyr Pro Ser Lys Leu Gln Ser Ile Leu His Thr Ala

3940 3945 3950

Val Asp Ser Lys Lys Ser Trp Glu Ala Lys Gly Glu Ile Lys Glu Phe

3955 3960 3965

Cys Ser Ser His Ile Val Asn Val Asp Gly Asp Tyr His Phe Lys Pro

3970 3975 3980

Glu Lys Asp Arg Ile Leu Ala Ser Leu Leu Ile Leu Ser Lys Ile Ala

3985 3990 3995 4000

Asp Met Asp Ile Phe Phe Met Arg Phe Val Ala Leu Leu Ala Glu Ser

4005 4010 4015

Ala Val Tyr Ile Arg Ile Asp Pro Thr Phe Trp Leu Ala Leu Phe Gly

4020 4025 4030

Val Phe Glu Asn Arg Val Thr Ala Phe Lys Ser Glu Thr Leu Leu Ser

4035 4040 4045

Pro Val Pro Glu Gln Leu Met Lys Val Ala Phe Tyr Glu Ser Leu Val

4050 4055 4060

Phe Ala Asp Val Asp Ala Thr Ala Leu Tyr Gly Phe Leu Asp Gly Phe

4065 4070 4075 4080

Lys Met Gln Ser Gln Thr Leu His Pro Asp Gly Val Glu Gly Phe Asp

4085 4090 4095

Lys Gln Ser Asp Arg Val Lys His Cys Phe Ala Cys Asp Asn Ile Ser

4100 4105 4110

Val Gly His Cys Ser Ile Cys Pro Val Pro Leu Pro Leu Cys Ser Phe

4115 4120 4125

Cys Phe Tyr Glu His Ala Leu Leu Asn Glu His Tyr Glu Ala Ser Gly

4130 4135 4140

Ile Ala Cys Glu Cys Gly Asp Ala Asp Ile Arg Gln Leu His Leu Lys

4145 4150 4155 4160

Ile Thr Asn Gln Pro Ser Ser His Asn Phe Ile Cys Ala Glu Cys Pro

4165 4170 4175

Thr Val Ala Met Lys Leu Pro Ile Phe Asn Ser Phe Gln Gly Lys Val

4180 4185 4190

Leu Leu Pro Met Phe Arg Met Asn Thr Pro Leu Pro Ser Ser Val Ser

4195 4200 4205

Val Ile Val Asp Val Arg Ser Asn Pro Lys Ala Pro Lys Met Leu Trp

4210 4215 4220

Asp Asp Val Gln Asn Phe Arg Glu Asn Cys Thr Arg Ile Ala Tyr Glu

4225 4230 4235 4240

Ser Val Ser Cys Ala Glu Leu Ala Arg Glu Val Val Tyr Tyr Pro Tyr

4245 4250 4255

Glu Val Ile Glu Ser Lys Ala Gly Gln Ala Arg Leu Arg Ile Gln Asn

4260 4265 4270

Phe Lys Cys Ser Pro Thr Thr Tyr Val Gln Phe Tyr Lys Val Arg Gln

4275 4280 4285

Asn Gly Lys Tyr Cys Leu Val Ala Lys Ala Thr Leu Thr Pro Ala Phe

4290 4295 4300

Glu Asn Gln Thr Asp Ile Phe Ser Val Phe Gln Pro Asn Asn Phe Ser

4305 4310 4315 4320

Pro Trp Asn Thr Ser Ser Val Phe Ala Val Glu Gln Tyr Ala Ala Ile

4325 4330 4335

Tyr Pro Pro Ile Pro Lys Glu Pro Val Asn Ala Thr Phe Val Leu Gly

4340 4345 4350

Pro Pro Gly Cys Gly Lys Thr Tyr Tyr Ile Ala Lys Thr Tyr Phe Ser

4355 4360 4365

Gln Ala Ser Glu Thr Cys Pro Val Val Tyr Cys Ala Pro Thr His Arg

4370 4375 4380

Leu Val Leu Asp Met Asp Ala Glu Tyr Ser Gly Val Val Ser Lys Ser

4385 4390 4395 4400

Leu Tyr Asn Asn Arg Val Tyr Lys Asn Pro Ala Tyr Lys Thr Gly Glu

4405 4410 4415

Pro Phe Lys Leu Cys Phe Thr Thr His Asn Thr Met Pro Val Gln Lys

4420 4425 4430

Lys Ala Ile Leu Ile Ile Asp Glu Val Ser Leu Ile Thr Pro His Ser

4435 4440 4445

Leu Phe Ser Ile Ile Gly Lys Gly Phe Tyr Glu Ile Val Leu Val Gly

4450 4455 4460

Asp Pro Phe Gln Leu Ser Ala Val Phe Pro Gly Phe Val Val Asn His

4465 4470 4475 4480

Thr Tyr Asp Gly Phe Tyr Ile Arg Arg Leu Val Asn Lys Val Lys His

4485 4490 4495

Leu Thr Val Cys Tyr Arg Cys Pro Gln Glu Ile Leu Asp Ile Phe Ser

4500 4505 4510

Lys Pro Tyr His Asp Val Gly Ile Asp Leu Thr Thr Gly Asn Thr Asn

4515 4520 4525

Pro Gly Lys Ala Ser Ile Tyr Thr Leu Asn Trp Leu Gln Ala Asp Val

4530 4535 4540

Gly Thr Lys Asn Pro Asp Lys Leu Arg Gln Leu Phe Ala Gln Tyr Pro

4545 4550 4555 4560

Gly Phe Lys Ile Ile Thr Asn Tyr Arg Cys Val Val Asp Ala Ala Lys

4565 4570 4575

Ser Tyr Gly Ile Asn Val Glu Thr Ile Asp Ser Ser Gln Gly Thr Thr

4580 4585 4590

Gly Asp Arg His Leu Val Val Ile Cys Gly Ser Thr Asn Phe Ser Lys

4595 4600 4605

Leu Leu Asn Arg Phe Ile Val Ala Ala Ser Arg Ser Thr Thr Glu Leu

4610 4615 4620

Val Ile Val Met Leu Pro Glu Leu Tyr Asn Tyr Leu Thr Glu Thr Phe

4625 4630 4635 4640

Asn Phe Lys Pro Leu Gln Leu Gln Asn Val His Val Pro Ile Ala Val

4645 4650 4655

Ser Ser Thr Ala Phe Cys Asp Ile Glu Phe Tyr His Phe Gln Lys Lys

4660 4665 4670

Phe Tyr Val Gly Glu Ile Ser Val Ser Thr Ser Thr Thr Met Thr Cys

4675 4680 4685

Gln Leu Gly Cys Tyr Ile Asn Gly Ser Tyr Met Leu Pro Pro Val Leu

4690 4695 4700

Glu Asn Ser Glu Asp Arg Leu Tyr Val Pro Ser Arg Trp Arg Arg Met

4705 4710 4715 4720

Ile Arg Lys Tyr Pro Thr Glu Ser Met His Ile Ser Leu Leu Asp Arg

4725 4730 4735

Leu Leu Arg His Ile Leu Leu Thr Thr Thr Gly Glu Ile His Phe Val

4740 4745 4750

Met Phe Ser Ala Asp Asn Asp Leu Ile Ala Leu Asp Pro Tyr Phe Ile

4755 4760 4765

Pro Pro Thr Leu Cys Glu Cys Gly Ser Ala Gly Leu Val Glu Val Asp

4770 4775 4780

Ile Thr Val Phe Cys Arg Asn Cys Leu Pro Lys Asp Gly Lys Ala Thr

4785 4790 4795 4800

Arg Leu Val Lys Pro Ser Thr Leu Asp Val Gln Thr Glu Lys Leu Arg

4805 4810 4815

Leu Ala Lys Val His Ala Lys Val Cys Lys Ile Lys His Gly Ser Ala

4820 4825 4830

His Asn Ala Asp Val Asp Ala Ile Met Thr Gln Cys Ile Tyr Ala Asn

4835 4840 4845

Ser Leu Thr Phe Thr Pro Thr Thr Gln Leu Val Val Asn Thr Asp Glu

4850 4855 4860

Phe Thr Phe Tyr Met Leu Pro Arg Pro Ser Asn Arg His Leu Arg Ile

4865 4870 4875 4880

Ile His Lys Asn Asp Lys Arg Phe Tyr Ala Ile Thr His Glu Glu Glu

4885 4890 4895

Asp Leu Phe Phe Thr Asn Ile Ser Ala Val Val Asp Pro Ile Pro Ala

4900 4905 4910

Lys Phe Asn Ile Ala His Ser Thr Ser Phe Leu Thr Ile Lys Ser Gly

4915 4920 4925

Cys Ala Gly Asn Lys Thr Cys Thr Arg Cys Tyr Tyr Leu His Leu Ala

4930 4935 4940

Tyr Thr Glu Phe Val Ser Gln His Lys Tyr Glu Pro Phe Thr Cys Val

4945 4950 4955 4960

Ser Phe Lys Ile Arg Phe Asp Phe Ser Gln Phe Thr Asp Ser Val Asp

4965 4970 4975

Thr Phe Leu Arg Gln Gly Leu Ile Thr Phe His Pro Glu Met Asn Ser

4980 4985 4990

Leu Gln Lys Ser Leu Leu Leu Ala Val Asp Lys Val Tyr Cys Asp Asn

4995 5000 5005

Phe Thr Ser Asn Gly Arg Arg Phe Arg Leu Tyr Asp Asn Asn Leu Val

5010 5015 5020

Lys Ser Ile Ile Lys Gly Ser Val Ala Gln Asn Ser Ile Ile Met Pro

5025 5030 5035 5040

Leu Asp Ser Val Leu His Gly Leu Asn Ile Asp Phe Thr Val Gly Cys

5045 5050 5055

Ala Val Asp Asn Phe Ser Cys Lys Glu Ala Ala Ser Val Arg Tyr Ser

5060 5065 5070

Glu Val Val Leu Ser Ile Thr Lys Leu Pro Pro Gly Thr Cys Gln Leu

5075 5080 5085

Tyr Tyr Val Ile Ser Tyr Gly Leu Asn Ser Pro Lys Thr Thr Tyr Ala

5090 5095 5100

Gly His Gln Leu Phe Asp Gly Phe Glu Thr Val Ile Val Val Asn Arg

5105 5110 5115 5120

Lys Asp Lys Pro Pro Tyr Val Leu Thr Gln Tyr Ile Asn Asp Val Val

5125 5130 5135

Val Ala Met Pro Glu Ser Leu Phe Ser Thr Gly Arg Phe Tyr Arg Glu

5140 5145 5150

Lys Pro Tyr Pro Val Leu Met Asn Glu Asp Leu Ser Gly Leu Asn His

5155 5160 5165

His Ile Phe Ser Gly Asp Tyr Thr Asp Glu Ser Leu Thr Leu Gly Gly

5170 5175 5180

Val His His Ile Val Thr Leu Asn Thr Tyr Asp His Lys Leu Asn Tyr

5185 5190 5195 5200

Ile Gln Thr Lys Ala Thr Cys Ala Ala Ser Val Ser Thr Gly Gly Arg

5205 5210 5215

Gly His Lys Ile Thr Thr Leu Phe Asp Val His Ala Asn Gln Leu Ala

5220 5225 5230

Asp Glu Ile Thr Arg Val Thr Ser Val Val Thr Thr Gln Ser Lys Val

5235 5240 5245

Ile Asn Leu Thr Ile Asp Tyr Gln Gln Val Pro Cys Met Tyr Trp Ser

5250 5255 5260

Ser Pro Thr Gly Ile Arg Thr Phe Tyr Pro Gln Ala Val Arg Leu Asp

5265 5270 5275 5280

Ala Lys Phe Ile Pro Tyr Tyr Val Glu Tyr Pro Asn Ile Leu Pro Ala

5285 5290 5295

Val Val Glu Asp Gln Val Tyr Asp Leu Ser Asn Tyr Asn Gln Pro Pro

5300 5305 5310

Leu Gly Gln Asn Cys Pro Val Asn Phe His Lys Tyr Val Gln Leu Thr

5315 5320 5325

His Phe Ile Leu Asp His Val Lys Ile Pro Glu Lys Gly Leu Ile Tyr

5330 5335 5340

His Ile Gly Ala Ala Gly Thr Lys Gln Cys Ser Pro Gly Asp Leu Ile

5345 5350 5355 5360

Leu Glu Gln Phe Phe Asn Lys Ser Ile Ile Tyr Ser Ser Asp Leu Leu

5365 5370 5375

Pro Tyr Gln Ser Pro Ala Val Gln Val Ala Leu Asp Val Arg Phe Ser

5380 5385 5390

Ala Ser Leu Ile Ile Ser Asp Cys Tyr Ser Lys Glu Pro Gln Pro Asp

5395 5400 5405

Leu Leu Ser Lys Leu Ile Asn Lys Leu Val Tyr Gly Gly Thr Leu Ile

5410 5415 5420

Phe Lys Thr Thr Glu Thr Phe Thr Cys Asp Pro Ala Phe Tyr Val Ala

5425 5430 5435 5440

His Phe Asn Cys Ile Lys Phe Phe Thr Ala Ala Val Asn His Ser Ser

5445 5450 5455

Ser Glu Val Tyr Ile Ala Phe Ile Gly Lys Leu Pro Lys Pro Asn Asn

5460 5465 5470

Asn Phe Leu Ala Ser Asp Tyr Phe Gln Arg Leu Thr Gln His Arg Asn

5475 5480 5485

Lys Val Val Lys Gln Pro Tyr Ala His Thr Trp Asp Thr Ser Phe Thr

5490 5495 5500

Tyr Pro Tyr Pro Ser Asn Val Leu Gln Val Ser Arg Lys Asn Leu Leu

5505 5510 5515 5520

Tyr Leu Phe Glu Thr Arg Gly Ala Ala Val Gly Thr Leu Ile Phe Glu

5525 5530 5535

Glu Pro Ser Lys Pro Ala Val Lys Ile Pro Thr Lys Cys Gln Thr Thr

5540 5545 5550

Gln Pro Ser Cys Val Ile Glu Val Gly Asn Gln Tyr Asp Cys Cys Ile

5555 5560 5565

Gln Asp Ile Ile Thr Leu Leu Asn Gly Lys Ser Phe Thr Val Lys Val

5570 5575 5580

Pro Asn Ser Glu Ser Leu Leu Arg Asp Ile Cys Thr Leu Ala Leu Ser

5585 5590 5595 5600

Gln Ser Tyr Ser Ile Asn Ile Arg Gly Lys Thr Leu Tyr Thr Leu Ser

5605 5610 5615

Ser Leu Leu Arg Ile Arg Gln Gln Ser Leu Leu Phe Tyr Gly Glu Lys

5620 5625 5630

Val Lys Asn Pro Arg Pro Arg Asn Val Leu Asn Lys Tyr Thr Asn Tyr

5635 5640 5645

Leu Lys Ala Lys Val Ile Arg His Tyr Thr Lys Pro Gln Ser Thr Val

5650 5655 5660

Leu Asp Ile Gly Thr Gly Lys Gly Gln Asp Leu Arg Lys Tyr Ser Leu

5665 5670 5675 5680

Ala Gly Val Lys Ser Leu Thr Cys Val Glu Pro Ser Pro Glu Ser Val

5685 5690 5695

Thr Glu Leu Ser Ile Ile Ala Ser Pro Leu Asp Met Glu Thr His Thr

5700 5705 5710

Val Met Ser Ser Ala Gln Lys Phe Glu Thr Ser Leu Thr Phe Asp Leu

5715 5720 5725

Ala Phe Ser Phe Phe Ala Leu His Tyr Ala Leu Asp Asp Val Cys Met

5730 5735 5740

Ser Glu Thr Leu Asn Asn Val Phe Cys Lys Leu Asn Ser Asn Ser Gln

5745 5750 5755 5760

Leu Ile Leu Val Val Pro Asn Ala Gly Arg Met Gln Ser Ile Pro Ser

5765 5770 5775

Leu Gly Leu Thr Val Thr His Leu Asp Asp Asp Lys Val Trp Phe Lys

5780 5785 5790

Tyr Ser Asp Tyr Ile Asp Cys Glu Glu Pro Leu Val Asp Lys Glu Lys

5795 5800 5805

Leu Leu Thr Cys Leu Ala Thr Tyr Gly Thr Ile Val Thr Asp Ser Pro

5810 5815 5820

Phe Tyr Asp Gly Ala Asn Lys Ile Leu Asp Gln Lys Cys Ser Ser Met

5825 5830 5835 5840

Tyr Arg Ala Ser Thr Ala His Leu Asn Pro Asp Glu Ile Gln Tyr Ile

5845 5850 5855

Asn Met Tyr Asp Leu Ile Val Val Ile Lys Asn

5860 5865

<210> 8

<211> 1391

<212> БЕЛОК

<213> Вирусы

<220>

<223> аминокислотная последовательность ORF-2

<400> 8

Met Phe Ala Leu Val Leu Thr Leu Thr Ile Ala Ser Ala Ile Ala Gln

1 5 10 15

Asp Phe Pro Ala Tyr Asp Pro Cys Pro Thr Cys Ser Thr Pro Gly Asn

20 25 30

Lys Ile Pro Ala Pro Ser Thr Val Ala Gln Tyr Ser Thr Asn Tyr Gly

35 40 45

Ala Asn Phe Phe Thr Val Val Phe Asp Gly Ile Ile Phe Asn Gln Phe

50 55 60

Arg Glu Ser Tyr Tyr His Gln Cys Arg Pro Thr Pro Glu Tyr Cys Pro

65 70 75 80

Asp Ala Ile Asn Cys Ala Leu Asn Arg Thr Gly Ala Ser Cys Lys Pro

85 90 95

Phe Ala Thr Gly Pro Asn Ser Gln Cys Gln Asn Ser Phe Glu Gly Asn

100 105 110

Ile Asp Ile Cys Ala Thr Cys Ser Pro Leu Lys Gln Glu Thr Pro Phe

115 120 125

Ile Cys Tyr Asn Arg Tyr Gly Ile Ile Ile Tyr Pro Thr Ala Asp Ile

130 135 140

Val Leu Ser Ala Arg Phe Lys Ile Gly Ser Phe Ser Pro Lys Ala Cys

145 150 155 160

Asp Asn Tyr Leu Asn Asp Leu Asn Cys Asp Ser Lys Thr Ala Arg Ser

165 170 175

Tyr Val Ile Ser Arg Pro Gln Ser Phe Ser Leu Gln Tyr Pro Asn Ser

180 185 190

Leu Gly Pro Tyr Gln Leu Lys Arg Phe Ser Leu Ala Lys Glu Ile Val

195 200 205

Asp Leu Arg Ala Gly Val Leu Thr Ser Leu Pro Asn Arg Gly Tyr Lys

210 215 220

Gly Arg Thr Thr Tyr Ser Tyr Pro Val Thr Ala Leu Ser Leu Leu Ala

225 230 235 240

Arg Ser Lys Val Ala Glu Ala Asp Lys Phe Phe Tyr Ile Glu Ala Lys

245 250 255

Ile Leu Leu Tyr Ala Trp Ser Gln Lys Pro Gln Ile Arg Phe Leu Gly

260 265 270

Ala Tyr Cys Pro Thr Asp Val Ser Cys Pro Asp Ser Thr Ala Leu Gly

275 280 285

Cys Cys Phe Ser Gly Ser Gly Ser Glu Phe Tyr Tyr Ala Phe Arg Gln

290 295 300

Trp Tyr Tyr Ala Ser Leu Gly Met Glu Asp Leu Val Asp Phe Asp Asn

305 310 315 320

Ser Thr Val Leu Ser Leu Ser Pro Asp Thr Pro Gln Ile Thr Pro Val

325 330 335

Val Ser Tyr Phe Leu Glu Lys Val Leu Pro Leu Phe Lys Ser His Val

340 345 350

Pro Gly Arg Val Phe Tyr Cys His Ser Leu Met Ser Asn Gly Val Cys

355 360 365

Thr Phe Asp His Val Val Val Asn Ile Asn Ala Glu Ala Val Phe Phe

370 375 380

Asp Leu Glu Val Asp Ile Gly Ser Ile Ile Ala Asp Ala Tyr Arg Val

385 390 395 400

Glu Arg Pro Asn Thr Leu Cys Tyr Asp Thr Asn Cys Thr Leu Ala Thr

405 410 415

Ser Arg Thr Thr Glu Tyr Asn Tyr Ala Ala Tyr Val Val Tyr Ile Leu

420 425 430

Phe Asn Leu Tyr Ser Ser Asn Arg Ile Ala Ile Asp Phe Asn Thr His

435 440 445

Ser Ile Leu Gln Gly Leu Leu Gln His Asn Ser Asn Tyr Gln Thr Ala

450 455 460

Asn Leu Asp Tyr Leu Phe Val Gly Ala Leu Phe Thr Gly Thr Phe Lys

465 470 475 480

His Ile Thr Ser Asn Gln Ala Tyr Pro Val Pro Leu Thr Tyr Pro Ile

485 490 495

Val Lys Thr Tyr Val Gly Pro Ser Asn Gln Tyr Ser Met Ser Asn Lys

500 505 510

Leu Phe Ser Tyr Thr His Asn Leu Thr Ala Gln Ala His Ser Gly Ile

515 520 525

Cys Asn Ser Phe Tyr Cys Tyr Lys Pro Arg Phe Val Pro Ile Asp Val

530 535 540

Phe Ile His Ser Ala Leu Thr Pro Asp Ser Leu Met Glu Thr Glu Ser

545 550 555 560

Phe Val Cys Val Ser Leu Arg Ser Pro Ser Ala Gly Ser Thr Ser Ala

565 570 575

Gly Ser Phe Tyr Leu Gln Cys Leu Asn Ser Ser Ile Asp Leu His Pro

580 585 590

Gly Ser Phe Val Pro Val Ser Ser Ser Pro Glu Ser Ser Ser Arg Val

595 600 605

Thr Ala Glu Leu Ala Phe Asn Thr Arg Asn Gly Ile Phe Ser Pro Cys

610 615 620

Leu Asn Gly Thr Cys Val Leu Ala Pro Thr Asp Pro Ile Val Phe Met

625 630 635 640

Arg Gln Gly Ala Trp Phe Thr Lys Ser Leu His Phe Asp Val Ser Pro

645 650 655

Cys Lys Pro Met His Phe Pro Asp Ile Asp Ile Gln Pro Pro Thr Tyr

660 665 670

Asn Val Ser Ser Ile Lys Met Asp Asp Asn Ala Val Leu Val Gln Asp

675 680 685

Leu Thr Ser Gly Leu Val Ile Asp His Asn Leu Gly Ser Ile Leu Arg

690 695 700

Pro Lys Gly Arg Ala Leu Glu Val Ser Tyr Tyr Ala His Ser Ile Leu

705 710 715 720

Arg Tyr Leu Glu Pro Asp Ser Cys Leu Pro Asp Asn Phe Leu Asn Phe

725 730 735

Val Thr Cys Leu Asp Tyr Ile Cys Ser Asp Ser Ser Pro Cys Arg Ala

740 745 750

Ala Ala Ser Gln Tyr Cys Gln Ala Gly Ile Tyr Phe Glu Ser Ala Phe

755 760 765

Asn Lys Ser Arg Tyr Ser Leu Leu Asn Ala Tyr Thr Leu Phe Asn Thr

770 775 780

Ser Leu Gln Thr Leu Leu Pro Glu Thr Phe Leu Glu Ile Glu Asp Asp

785 790 795 800

Glu Pro His Ser Arg Ser Lys Arg Ser Ile Asp Thr Thr Ser Asn Ile

805 810 815

Arg Pro Ser Gln Leu Leu Val Asn Gly Arg Ile Pro Ser Thr Ser Ser

820 825 830

Ala Phe Ala Val Asn Val Ala Arg Gly Arg Gly Thr Ile Met Pro Arg

835 840 845

Pro Gly Thr Gly Gly Met Gly Ser Ser Phe Ser Ala Val Ser Arg Ser

850 855 860

Gly Ser Ile Ser Ser Leu Ser Ser Val Gly Ser Ser Thr Pro Leu Ile

865 870 875 880

Ser Asn Trp Arg Thr Ser Ser Ser Gln Leu Lys Thr Leu Asn Leu Asn

885 890 895

Ile Asn Thr Lys Ile Pro Lys Ile Ser Thr Lys Ser Gly Phe Ala Ser

900 905 910

Ile Thr Ser Leu Phe Ala Ser Gly Leu Gly Val Val Asp Leu Gly Leu

915 920 925

Ser Ile Phe Asn Met Ile Glu Gln Arg Arg Val Ala Glu Ile Thr Gln

930 935 940

Met Gln Ile Ser Gln Leu Ala Asp Ser Ile Val Tyr Leu Ala Asp Val

945 950 955 960

Thr Phe Glu Ala Ile Lys Asn Leu Glu Leu Ser Val Asn Ser Leu Gly

965 970 975

Thr Phe Leu Ser Glu Phe Ser Thr Gln Met Ser Ile Thr Ile Ser Gln

980 985 990

Ile Gln Ser Ser Phe Glu Glu Gln Gln Asp Ala Thr Asn Asp Ala Leu

995 1000 1005

Tyr Tyr Thr Asn Ala Ala Ala Ser Tyr Gln Ala Ser Met Ala Tyr Val

1010 1015 1020

Ile Ser Glu Leu Asn Ala Ile Ser Leu Ser Val Thr Arg Ser Tyr Asp

1025 1030 1035 1040

Ser Tyr Thr Ser Cys Ile Thr Ser Gly Ile Asn Gly Leu Ile Thr Pro

1045 1050 1055

Ser Cys Leu Pro Ala His Gln Leu Leu Gln Leu Leu Asp Thr Val Ile

1060 1065 1070

Asn Ser Thr Ala Gly Thr Gly Cys Arg Pro Ile Tyr Gly Arg Glu Glu

1075 1080 1085

Val Val Lys Tyr Tyr Thr Leu Pro Leu Ile Asn Gln Gly Tyr Ser Phe

1090 1095 1100

Asn Gly Ser Ile Phe Phe Val Phe Asn Ile Pro Ile Thr Cys Gln Gly

1105 1110 1115 1120

Ile Ala Gly Asp Val Tyr Glu Val Glu Pro Pro Ile Leu Val Asp Val

1125 1130 1135

Pro Ser Lys Thr Ala Leu Arg Met Ile Thr Pro Ser Asn Val Val Ala

1140 1145 1150

Thr Gln Ala Gly Leu Ala Glu Leu Asp Leu Arg His Cys Glu Arg Tyr

1155 1160 1165

His Asn Glu Phe Leu Cys Asp Ser Ser Ala Phe Leu Ser Thr Pro Ser

1170 1175 1180

Lys Tyr Ile Asp Cys Leu Thr Asn Ala Thr Asp Cys Ser Leu Gln Phe

1185 1190 1195 1200

Ile Thr Gln His Val Pro Asp Pro Cys Val Tyr Thr Ser Pro Ala Ser

1205 1210 1215

Leu Tyr Cys Tyr Tyr Ser Pro Ile Cys Asp Gln Cys His Ile Val Ala

1220 1225 1230

Gly Cys Asn Glu Ser Gln Gln Tyr Asn Phe Thr Ser Ala Asp Gly Gly

1235 1240 1245

Val Val Phe Tyr Ser Ile Gln Asp Arg Asp Cys Gly His Phe Pro His

1250 1255 1260

Ile Thr Val Thr Thr Pro Ala Ala Ile Gln Glu Asp Phe Thr Val Gly

1265 1270 1275 1280

Pro Tyr Leu Pro Ser Leu Pro Ile His Thr Ala Tyr Val Asn Val Thr

1285 1290 1295

Trp Asn Val Thr Leu Pro Gly Asn Trp Thr Trp Glu Asn Ile Thr Leu

1300 1305 1310

Thr Ala Asn Trp Thr Gln His Phe Ile Glu Met Lys Lys Asn Ile Thr

1315 1320 1325

Met Met Ala Glu Glu Ile Asp Asn Leu Thr Asn Phe Gly Lys Val Leu

1330 1335 1340

Val Gly Gln Leu Asn Ser Phe Leu Ser Ser Leu Phe Asn Ile Pro Leu

1345 1350 1355 1360

Gly Leu Met Thr Phe Cys Phe Ser Val Ala Ala Leu Gly Leu Ser Ile

1365 1370 1375

Ile Ala Leu Leu Val Leu Cys Phe Pro Gln Lys Pro His Lys Leu

1380 1385 1390

<210> 9

<211> 260

<212> БЕЛОК

<213> Вирусы

<220>

<223> аминокислотная последовательность ORF-3

<400> 9

Met Met Phe Thr Leu Val Val Leu Phe Thr Leu Leu Gly Leu Ser Met

1 5 10 15

Ala Ser Thr Glu Leu Asn Phe Asp Pro Thr Leu Pro Leu Pro Ser Pro

20 25 30

Ile Asn Ala Leu Val Asp Ile Phe Gly Asn Asn Ser Leu Phe Leu Lys

35 40 45

Glu Ser Leu Leu Gly Lys Ser Thr Gly Ala Val Tyr Ala Tyr Leu Tyr

50 55 60

Ser Ser Ala Ile Ser Leu Leu Leu Leu Leu Trp Val Thr Val Trp Ser

65 70 75 80

Ile Ala Thr Ser His Phe Asn Val Thr Arg Ile Pro Thr Ile Ala Val

85 90 95

Leu Thr Asn Ala Ser Met Phe Leu Leu Leu Ala Ser Ala Thr Val Thr

100 105 110

Thr Trp Phe Leu Pro Thr Val Thr Asn Val Phe Phe Tyr Thr Leu Thr

115 120 125

Ala Leu Phe Thr Phe Phe Ser Phe Val Phe Leu Leu Trp Leu Val Tyr

130 135 140

Tyr Met Phe Thr Thr Ile Arg Ala Tyr Arg Arg Val Gly Ser Trp Arg

145 150 155 160

Val Val Phe Asn Gly Lys Tyr Ser Leu Leu Ala Gly Thr Gln Ala Val

165 170 175

Cys Leu Cys Arg Pro Ala Ile His Leu Val Leu Thr Lys Thr Asn Thr

180 185 190

Asp Thr Tyr Trp Cys Leu Asp Gly Thr Pro Ile Tyr Asn Val Asp Leu

195 200 205

Leu Gln Leu Val Gly Pro Lys Gly Leu Tyr Pro Tyr Lys Arg Met Thr

210 215 220

Thr Ile Thr Ala Pro Lys Gly Thr Lys Thr Ser Ala Ala Val Tyr Thr

225 230 235 240

Leu Gln Lys Glu Glu Val Cys Ala Leu Ser Glu Ile Thr Val His Asn

245 250 255

Asp Thr Asp Phe

260

<210> 10

<211> 201

<212> БЕЛОК

<213> Вирусы

<220>

<223> аминокислотная последовательность ORF-4

<400> 10

Met Ser Tyr Pro Val Tyr Tyr Glu Gln Arg Arg Tyr Ser Pro Arg Gln

1 5 10 15

Phe Asn Asn Gly Gly Gly Tyr Asn Pro Thr Pro Gln Pro Arg Val Val

20 25 30

Arg Thr Asn Pro Gly Asn Gln Ala Tyr Asn Pro Arg Arg Asn Arg Asn

35 40 45

Ala Thr Pro Asn Gln Gln Gln Met Val Pro Tyr Gln Pro Gln Tyr Gln

50 55 60

Ala Pro Pro Gln Pro Arg Val Val Tyr Val Asp Arg Pro Gln Glu Pro

65 70 75 80

Val Val Ile Tyr Arg Ala Pro Pro Gln Gly Lys Lys Gln Ser Gly Lys

85 90 95

Arg His Thr Ala Glu Glu Arg Trp Tyr Gln Gly Glu Lys Pro Val Gln

100 105 110

Lys Lys Gln Ala Pro Lys Gly Lys Ser Lys Lys Ala Ala Thr Pro Ala

115 120 125

Asn Pro Lys Lys Gln Pro Thr Gln Ser Asp Lys Val Pro Ile Ala Tyr

130 135 140

Pro Asp Asn His Pro Phe His Asp Leu Ala Pro Ala Asp Ile Arg Ala

145 150 155 160

Phe Lys Lys Gln Leu Ile Gln Asn Leu Asp Leu Gly His Gly Glu Met

165 170 175

Asn Gln Leu Arg Leu Ser Ile Asp Leu Leu Pro Ile Lys Lys Pro Ala

180 185 190

Pro Thr Pro Ala Val Pro Ala Pro Leu

195 200

<210> 11

<211> 113

<212> БЕЛОК

<213> Вирусы

<220>

<223> аминокислотная последовательность ORF-5

<400> 11

Met Phe Thr Leu Val Leu Ile Ile Leu Leu Ser Phe Ser Met Ala Phe

1 5 10 15

Asn Ala Phe Thr Phe Leu Leu Leu Leu Phe Phe Thr Phe Lys Cys Ile

20 25 30

Ile Thr Arg Thr Leu Val Val Val Pro Ile Asp Tyr Pro Glu Asn His

35 40 45

Pro Phe Asn Gly Leu Ser Pro Glu Glu Ile Ile Ser Tyr Lys Ser Gln

50 55 60

Leu Ile Gln Asn Leu Asp Leu Gly His Gly Glu Val Ile Lys His Arg

65 70 75 80

Phe Ser Ile Asp Leu Leu Pro Leu Lys Thr Thr Ser Thr Pro Thr Thr

85 90 95

Ser Ala Ile Leu Trp Lys Arg Phe Lys Thr Ser His Lys Glu Asn Asn

100 105 110

His

<210> 12

<211> 18

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Прямой праймер TCL-ORF-1

<400> 12

acactatacc agcccatg 18

<210> 13

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Taqman зонд TCL-ORF-1

<400> 13

caagcaacag tttaagtgag cc 22

<210> 14

<211> 18

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Обратный праймер TCL-ORF-1

<400> 14

tgtgaggtag caaagacg 18

<210> 15

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Прямой праймер TCL-M

<400> 15

gtgttcttac tgtggttgg 19

<210> 16

<211> 22

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Taqman зонд TCL-M

<400> 16

cattagggca tatcgaaggg tc 22

<210> 17

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Обратный праймер TCL-M

<400> 17

tgagttccag caagtagag 19

<210> 18

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Прямой праймер TCL-S

<400> 18

tcaaaactct caacctcaac 20

<210> 19

<211> 24

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Taqman зонд TCL-S

<400> 19

aagatgtaat actggcaaaa cctg 24

<210> 20

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Обратный праймер TCL-S

<400> 20

acgactccta aacctgaag 19

<210> 21

<211> 18

<212> ДНК

<213> Искусственная последовательность

<220>

<223> SEQ ID NO:21

<400> 21

taatttgact gactatag 18

<210> 22

<211> 25

<212> ДНК

<213> Искусственная последовательность

<220>

<223> SEQ ID NO:22

<400> 22

taagaaacta taccagtcca tgtcg 25

<210> 23

<211> 12

<212> ДНК

<213> Искусственная последовательность

<220>

<223> SEQ ID NO:23

<400> 23

agtttaagtg ag 12

<210> 24

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F1

<400> 24

cagtccacca acacaacgtg 20

<210> 25

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R1

<400> 25

cccaagtgtc gctttgcatc 20

<210> 26

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F2

<400> 26

ccaacaaagg agccgcaatc 20

<210> 27

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R2

<400> 27

gcacatgttt ggtgggtgtc 20

<210> 28

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F3

<400> 28

gacacccacc aaacatgtgc 20

<210> 29

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R3

<400> 29

gccaaacgga ggtctggatt 20

<210> 30

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F4

<400> 30

aatccagacc tccgtttggc 20

<210> 31

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R4

<400> 31

tcaatacctc gagcgcagac 20

<210> 32

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F5

<400> 32

tgtctgcgct cgaggtattg 20

<210> 33

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R5

<400> 33

tttgttcagg ggtggtgtcc 20

<210> 34

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F6

<400> 34

tctgacgaca aaccggacac 20

<210> 35

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R6

<400> 35

agccgctggg attacttcac 20

<210> 36

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F7

<400> 36

ttcctagcaa cccgctttca 20

<210> 37

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R7

<400> 37

agcggttttc ttttccgtcg 20

<210> 38

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F8

<400> 38

cgacggaaaa gaaaaccgct 20

<210> 39

<211> 19

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R8

<400> 39

actacggcta ctggggttc 19

<210> 40

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F9

<400> 40

ccccagtagc cgtagttgac 20

<210> 41

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R9

<400> 41

tcatgccgga gattttgcct 20

<210> 42

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F10

<400> 42

aggcaaaatc tccggcatga 20

<210> 43

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R10

<400> 43

agatgagccg tcagcaaaca 20

<210> 44

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F11

<400> 44

tgtttgctga cggctcatct 20

<210> 45

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R11

<400> 45

tgcgtttgct ctgtcgtagt 20

<210> 46

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F12

<400> 46

actacgacag agcaaacgca 20

<210> 47

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R12

<400> 47

atagagcgca agccgtagac 20

<210> 48

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F13

<400> 48

gtctacggct tgcgctctat 20

<210> 49

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R13

<400> 49

gccagtaaca ccatgtccca 20

<210> 50

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F14

<400> 50

tgggacatgg tgttactggc 20

<210> 51

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R14

<400> 51

aacgctgtta cgcggttttc 20

<210> 52

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F15

<400> 52

gaaaaccgcg taacagcgtt 20

<210> 53

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R15

<400> 53

ctggcatcgt gttgtgtgtg 20

<210> 54

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F16

<400> 54

cacacacaac acgatgccag 20

<210> 55

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R16

<400> 55

tagacccgca ctaccacact 20

<210> 56

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F17

<400> 56

agtgtggtag tgcgggtcta 20

<210> 57

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R17

<400> 57

ttttatgacc acgtccgcca 20

<210> 58

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F18

<400> 58

tggcggacgt ggtcataaaa 20

<210> 59

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R18

<400> 59

ctgcagctcc tctggtttca 20

<210> 60

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F19

<400> 60

tgaaaccaga ggagctgcag 20

<210> 61

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R19

<400> 61

gccgaagcta ttgtgagggt 20

<210> 62

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F20

<400> 62

accctcacaa tagcttcggc 20

<210> 63

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R20

<400> 63

cggaaaaaca acagccgagg 20

<210> 64

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F21

<400> 64

cctcggctgt tgtttttccg 20

<210> 65

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R21

<400> 65

tgggtcagta ggtgcgagta 20

<210> 66

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F22

<400> 66

tactcgcacc tactgaccca 20

<210> 67

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R22

<400> 67

ggagccaacc gaggataagg 20

<210> 68

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F23

<400> 68

tggcatgggt tcgtcctttt 20

<210> 69

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R23

<400> 69

ggtacctttc gcaatgacgc 20

<210> 70

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F24

<400> 70

gcgtcattgc gaaaggtacc 20

<210> 71

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R24

<400> 71

accctccgcc attgttgaat 20

<210> 72

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F25

<400> 72

attccaacca tcgcggttct 20

<210> 73

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R25

<400> 73

ttcgccttga taccagcgtt 20

<210> 74

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F26

<400> 74

acgctggtat caaggcgaaa 20

<210> 75

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R26

<400> 75

atccaggagt taacgtcggc 20

<210> 76

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_F27

<400> 76

gccgacgtta actcctggat 20

<210> 77

<211> 21

<212> ДНК

<213> Искусственная последовательность

<220>

<223> TCL_R27

<400> 77

aggtcagaac aagggaggct a 21

<210> 78

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Анализ 1 мембраны праймер 1

<400> 78

catctacctc tcccatactc 20

<210> 79

<211> 23

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Анализ 1 мембраны праймер 2

<400> 79

actgcttcca aaactgatta cct 23

<210> 80

<211> 20

<212> ДНК

<213> Искусственная последовательность

<220>

<223> Анализ 1 мембраны праймер 3

<400> 80

gggcgtaaag agaatgtaag 20

<---

Claims

1. Олигонуклеотидный праймер, который:

(a) включает по меньшей мере 18 последовательных нуклеотидов последовательности, которая представляет собой часть или комплементарна части, референсной последовательности нуклеиновой кислоты, выбранной из группы, состоящей из SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5 или SEQ ID NO: 6, или

(b) включает по меньшей мере 18 последовательных нуклеотидов последовательности, которая по меньшей мере на 80% идентична последовательности, которая представляет собой или комплементарна последовательности, выбранной из группы, состоящей из SEQ ID NO: 12 - SEQ ID NO: 80;

при условии, что указанный олигонуклеотидный праймер не включает последовательность, выбранную из группы, состоящей из SEQ ID NO: 21 - SEQ ID NO: 23.

2. Применение по меньшей мере одного олигонуклеотидного праймера по п.1 в способе обнаружения вируса, который инфицирует и способен вызывать гибель пинагора (Cyclopterus lumpus), где вирусный геном включает последовательность нуклеиновой кислоты, которая по меньшей мере на 90% идентична любой из SEQ ID NO: 1, 2, 3, 4, 5, 6, и где указанная последовательность нуклеиновой кислоты содержит основание урацил (U) вместо основания тимин (T).

3. Способ обнаружения вируса, который инфицирует и способен вызывать гибель рыбы, включающий следующие стадии:

(a) контакт нуклеиновой кислоты, выделенной из биологического образца рыбы, по меньшей мере с одним олигонуклеотидным праймером по п.1 с получением смеси,

(b) определение, присутствует ли после амплификации смеси a) продукт амплификации, где присутствие продукта амплификации указывает на присутствие РНК, ассоциированной с вирусом, и, следовательно, на присутствие вируса в биологическом образце.

4. Набор для обнаружения вируса в биологическом образце рыбы, где набор включает олигонуклеотидный праймер по п.1.

5. Набор по п.4, где указанный набор является тестом ОТ-ПЦР в реальном времени.