RU2801708C2 - Hemaglutinin mutants of the influenza virus - Google Patents

Hemaglutinin mutants of the influenza virus Download PDF

Info

Publication number
RU2801708C2
RU2801708C2 RU2020143526A RU2020143526A RU2801708C2 RU 2801708 C2 RU2801708 C2 RU 2801708C2 RU 2020143526 A RU2020143526 A RU 2020143526A RU 2020143526 A RU2020143526 A RU 2020143526A RU 2801708 C2 RU2801708 C2 RU 2801708C2
Authority
RU
Russia
Prior art keywords
plant
ile
substitution
amino acid
protein
Prior art date
Application number
RU2020143526A
Other languages
Russian (ru)
Other versions
RU2020143526A (en
Inventor
Пьер-Оливье Лавуа
Орельен ЛОРИН
Ален ДУСЕ
Марк-Андре Д'АУСТ
Манон КУТЮР
Original Assignee
Медикаго Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Медикаго Инк. filed Critical Медикаго Инк.
Publication of RU2020143526A publication Critical patent/RU2020143526A/en
Application granted granted Critical
Publication of RU2801708C2 publication Critical patent/RU2801708C2/en

Links

Abstract

FIELD: biotechnology.
SUBSTANCE: following is described: a modified influenza H3 hemagglutinin (HA) protein for producing a virus-like particle (VLP), wherein the HA protein contains an amino acid sequence containing at least one substitution compared to the corresponding wild-type amino acid sequence, wherein at least one substitution is a substitution of one or more than one amino acid corresponding to amino acids at position 382, 384, 392, or 431 of the reference sequence of SEQ ID NO: 92. Also a nucleic acid for producing a modified influenza H3 HA protein, wherein the nucleic acid contains a nucleotide sequence encoding the modified influenza H3 HA protein is described. Also the following is provided: a virus-like particle (VLP) for inducing an immune response to influenza infection in a subject, the VLP comprising a modified influenza H3 hemagglutinin (HA) protein and a method of producing such a VLP in a plant, a plant part, or a plant cell. Such a plant or a part of a plant or a plant cell is represented. The use of VLP to induce immunity to influenza infection in a subject is described, including in the form of a composition. Also a method of increasing the production yield of influenza virus-like particles (VLPs) in a plant, a plant part, or a plant cell is provided.
EFFECT: invention expands the arsenal of agents to prevent influenza.
17 cl, 9 dwg, 7 tbl, 4 ex

Description

Область техники, к которой относится настоящее изобретениеThe field of technology to which the present invention relates

[0001] Настоящее изобретение относится к производству мутантных вирусных белков в растениях. Более конкретно, настоящее изобретение относится к производству и увеличению продукции подобных вирусу гриппа частиц в растениях.[0001] The present invention relates to the production of mutant viral proteins in plants. More specifically, the present invention relates to the production and enhancement of the production of influenza virus-like particles in plants.

Предшествующий уровень техники настоящего изобретенияBackground of the Invention

[0002] Вирусы гриппа представляют собой оболочечные вирусы с одноцепочечной РНК семейства Orthomyxoviridae. Вирусы гриппа очень заразны и могут вызывать легкие или серьезные заболевания во всех возрастных группах.[0002] Influenza viruses are enveloped single-stranded RNA viruses of the Orthomyxoviridae family. Influenza viruses are highly contagious and can cause mild to severe illness in all age groups.

[0003] Вакцинация остается наиболее эффективным способом предотвращения инфекции гриппа. Как правило, вакцинацию проводят с использованием живых аттенуированных или целых инактивированных форм вируса, которые вызывают иммунный ответ при введении пациенту. Чтобы исключить потенциальный риск того, что живые аттенуированные и целые инактивированные вирусы вновь приобретут способность к репликации и станут заразными, также использовались вакцины, содержащие рекомбинантные вирусные белки, чтобы вызвать защитный иммунитет к инфекции гриппа.[0003] Vaccination remains the most effective way to prevent influenza infection. Typically, vaccination is carried out using live attenuated or whole inactivated forms of the virus that elicit an immune response when administered to a patient. To eliminate the potential risk of live attenuated and whole inactivated viruses re-acquiring the ability to replicate and become infectious, vaccines containing recombinant viral proteins have also been used to induce protective immunity to influenza infection.

[0004] Однако применение рекомбинантных вирусных белков в качестве иммуногенного компонента вакцин характеризуется рядом ограничений. Во-первых, в отсутствие полного набора вирусных белков и генетических компонентов, необходимых для оптимальной экспрессии и правильного сворачивания белков, выход рекомбинантных вирусных белков в стандартных системах экспрессии in vitro может быть недостаточным для цели производства вакцины. Во-вторых, вакцины с рекомбинантными вирусными белками могут проявлять низкую иммуногенность из-за неправильного сворачивания, плохой презентации антигена и/или генерации преимущественно гуморального иммунного ответа, который неэффективен для обеспечения длительного защитного иммунитета.[0004] However, the use of recombinant viral proteins as an immunogenic component of vaccines has a number of limitations. First, in the absence of a complete set of viral proteins and genetic components necessary for optimal expression and proper folding of proteins, the yield of recombinant viral proteins in standard in vitro expression systems may not be sufficient for the purpose of vaccine production. Second, vaccines with recombinant viral proteins may exhibit low immunogenicity due to misfolding, poor antigen presentation, and/or generation of a predominantly humoral immune response that is ineffective in conferring long-term protective immunity.

[0005] Существует четыре типа вируса гриппа: А, В, С и D, из которых грипп А и В являются возбудителями сезонных эпидемий заболеваний у людей.[0005] There are four types of influenza virus: A, B, C and D, of which influenza A and B are the causative agents of seasonal epidemics of diseases in humans.

[0006] Вирусы гриппа А дополнительно подразделяются на основе экспрессии подтипов гликопротеинов гемагглютинина (НА) и нейраминидазы (NA) на поверхности вируса. Существует 18 различных подтипов НА (H1-H18).[0006] Influenza A viruses are further subdivided based on the expression of hemagglutinin (HA) and neuraminidase (NA) glycoprotein subtypes on the surface of the virus. There are 18 different subtypes of HA (H1-H18).

[0007] НА представляет собой тримерный лектин, который облегчает связывание частицы вируса гриппа с содержащими сиаловую кислоту белками на поверхности клеток-мишеней и опосредует высвобождение вирусного генома в клетку-мишень. Белки НА содержат два структурных элемента: головку, которая представляет собой основную мишень серопротективных антител, и ножку. НА транслируется как отдельный полипептид НА0 (собранный в виде тримеров), который должен расщепляться сериновой эндопротеазой между субдоменами НА1 (~40 кДа) и НА2 (~20 кДа). После расщепления два домена белка с дисульфидной связью принимают необходимую конформацию, необходимую для вирусной инфекционности. НА1 образует глобулярный головной домен, содержащий рецептор-связывающий сайт (RBS), и RBS представляет собой наименее консервативный сегмент вируса гриппа. НА2 представляет собой однопроходный интегральный мембранный белок со слитым пептидом (FP), растворимым эктодоменом (SE), трансмембранным (ТМ) и цитоплазматическим хвостом (СТ) с соответствующей длиной приблизительно 25, 160, 25 и 10 остатков. НА2 вместе с N- и С-концевыми остатками НА1 образует домен «ножки», который включает в себя трансмембранную область и является относительно консервативным.[0007] HA is a trimeric lectin that facilitates binding of the influenza virus particle to sialic acid-containing proteins on the surface of target cells and mediates the release of the viral genome into the target cell. HA proteins contain two structural elements: a head, which is the main target of seroprotective antibodies, and a stem. HA is translated as a single HA0 polypeptide (assembled as trimers) that must be cleaved by a serine endoprotease between the HA1 (~40 kDa) and HA2 (~20 kDa) subdomains. After cleavage, the two domains of the disulfide-linked protein assume the necessary conformation required for viral infectivity. HA1 forms a globular head domain containing a receptor binding site (RBS) and RBS is the least conserved segment of the influenza virus. HA2 is a single-pass integral membrane protein with a fusion peptide (FP), soluble ectodomain (SE), transmembrane (TM) and cytoplasmic tail (CT) with corresponding lengths of approximately 25, 160, 25 and 10 residues. HA2, together with the N- and C-terminal residues of HA1, forms a "leg" domain that includes the transmembrane region and is relatively conserved.

[0008] Были исследованы различные мутации в белках вируса гриппа, особенно в НА гриппа.[0008] Various mutations have been investigated in influenza virus proteins, especially in influenza HA.

[0009] Например, Castelán-Vega et al. (Adv Appl Bioinform Chem. 2014; 7:37-44) использовали алгоритм прогнозирования стабильности для сравнения 7479 полноразмерных аминокислотных последовательностей НА из вируса гриппа А (H1N1)pdm09 и идентифицировали, что мутации D104N, А259Т, S124N и Е172К приводили к прогнозируемому повышению стабильности НА гриппа. Напротив, мутации S206T, K285Е и Е47K характеризовались предсказанным дестабилизирующим эффектом на НА.[0009] For example, Castelán-Vega et al. (Adv Appl Bioinform Chem. 2014; 7:37-44) used a stability prediction algorithm to compare 7479 full-length amino acid sequences of HA from influenza A (H1N1)pdm09 virus and identified that D104N, A259T, S124N and E172K mutations resulted in the predicted increase in stability ON the flu. On the contrary, mutations S206T, K285E and E47K were characterized by a predicted destabilizing effect on HA.

[0010] При сравнении последовательностей исходного гриппа A (H1N1)pdm [A/California/7/2009] и более позднего штамма гриппа [A/Brisbane/10/2010], Cotter et al. (PLoS Pathog. 2014; 10(1):e1003831) идентифицировали, что мутация E47K в области ножки A/California/07/09 НА стабилизировала структуру тримера, понижала рН для слияния мембран и увеличивала термическую и кислотную стабильность вируса. Cotter et al. дополнительно наблюдали, что НА мутанта Е47K A/California/7/2009 был более заразным для хорьков, чем его аналог дикого типа.[0010] In comparing the sequences of the original influenza A (H1N1)pdm [A/California/7/2009] and the later influenza strain [A/Brisbane/10/2010], Cotter et al. (PLoS Pathog. 2014; 10(1):e1003831) identified that the E47K mutation in the A/California/07/09 HA stem region stabilized the trimer structure, lowered the pH for membrane fusion, and increased the thermal and acidic stability of the virus. Cotter et al. further observed that the E47K A/California/7/2009 HA mutant was more infectious to ferrets than its wild-type counterpart.

[0011] Antanasijevic et al. (J Biol Chem. 2014;289(32):22237-45) исследовали структурно-функциональные свойства области «петли-на-стебле» НА Н5 посредством сайт-направленного мутагенеза в 14 различных положениях. Мутанты A/Vietnam/1203/04 (H5N1) экспрессировались в клетках НЕК 293Т, и Antanasijevic сообщил, что большинство мутаций в области «петли-на-стебле» не нарушают экспрессию, протеолитический процессинг, сборку вируса или связывание рецептора. Однако Antanasijevic наблюдал, что мутанты HA1-D26K, HA1-M102L, HA2-V52A и HA2-I55A (на основе нумерации Н3) демонстрируют значительно сниженные уровни общего НА, что предполагает снижение экспрессии и/или сборки НА в вирусные частицы. Мутанты НА1-D26K, НА2-Т49А и HA2-M102L также проявляли более низкие титры гемагглютинации по сравнению с вирусом дикого типа. Antanasijevic дополнительно наблюдал, что все одиночные мутанты демонстрируют пониженное проникновение в клетки легких А549, причем наиболее выраженное нарушение проявляется у мутантов HA1-D26K и HA2-I55A. Antanasijevic также продемонстрировал, что мутант HA2-L99A был более чувствителен к ингибированию клеток легких А549 нейтрализующим антителом С179 по сравнению с вирусом дикого типа, предполагая, что мутация усиливает связывание антитела и/или способ нейтрализующего действия. Напротив, мутанты HA1-I28A, НА1-М31А, НА1-M31L, HA2-I45A и HA2-I55V оказались менее чувствительными к ингибированию проникновения нейтрализующим антителом С179.[0011] Antanasijevic et al. (J Biol Chem. 2014;289(32):22237-45) examined the structural-functional properties of the loop-on-stem region of H5 HA by site-directed mutagenesis at 14 different positions. A/Vietnam/1203/04 (H5N1) mutants were expressed in HEK 293T cells, and Antanasijevic reported that most mutations in the loop-on-stem region did not impair expression, proteolytic processing, virus assembly, or receptor binding. However, Antanasijevic observed that the mutants HA1-D26K, HA1-M102L, HA2-V52A and HA2-I55A (based on H3 numbering) show significantly reduced levels of total HA, suggesting reduced expression and/or assembly of HA into viral particles. The HA1-D26K, HA2-T49A and HA2-M102L mutants also showed lower hemagglutination titers compared to the wild-type virus. Antanasijevic additionally observed that all single mutants show reduced A549 cell uptake into lung cells, with the HA1-D26K and HA2-I55A mutants being the most affected. Antanasijevic also demonstrated that the HA2-L99A mutant was more sensitive to inhibition of A549 lung cells by neutralizing C179 antibody compared to wild-type virus, suggesting that the mutation enhances antibody binding and/or neutralizing mode of action. In contrast, the HA1-I28A, HA1-M31A, HA1-M31L, HA2-I45A and HA2-I55V mutants were less sensitive to entry inhibition by the neutralizing antibody C179.

[0012] В публикации международной заявки WO 2013/177444 и сопутствующей публикации Lu et al. (Proc Natl Acad Sci USA. 2014; 111(1): 125-30) сообщается о способе получения правильно свернутого домена стебля НА из A/California/05/2009 (H1N1) с использованием системы экспрессии бесклеточного белка на основе Escherichia coli и простого протокола рефолдинга. Для индукции тримеризации домена стебля НА либо хлорамфеникол-ацетилтрансферазу (CAT), либо домен сборки сливали с С-концом НА. Для уменьшения вновь выявленной гидрофобности и/или образования пар межмолекулярных ионов, вызывающих агрегацию экспрессированного белка стебля НА, оценивали пять групп мутаций: M1 (I69T + I72E + I74T + С77Т); М2 (I69T + I72E + I74T + С77Т + F164D); М3 (I69T + I72E + I74T + С77Т + F164D + L174D); М4 (F164D) и М5 (F164D + L174D). Lu наблюдал, что мутации М5 (F164D + L174D) оказались наиболее влиятельными мутациями для улучшения растворимости белков стебля НА. Дополнительные делеции (от Н38 до С43 и от С49 до N61) и мутации С77Т были внесены в мутанты М5, чтобы избежать образования нежелательных дисульфидных связей, уменьшить гидрофобность поверхности и pI и избежать областей с неупорядоченной структурой.[0012] International application publication WO 2013/177444 and companion publication Lu et al. (Proc Natl Acad Sci USA. 2014; 111(1): 125-30) reports a method for obtaining a properly folded HA stem domain from A/California/05/2009 (H1N1) using an Escherichia coli cell-free protein expression system and a simple refolding protocol. To induce trimerization of the HA stem domain, either chloramphenicol acetyltransferase (CAT) or the assembly domain was fused to the C-terminus of HA. To reduce the newly revealed hydrophobicity and/or the formation of pairs of intermolecular ions causing aggregation of the expressed HA stem protein, five groups of mutations were evaluated: M1 (I69T + I72E + I74T + C77T); M2 (I69T + I72E + I74T + C77T + F164D); M3 (I69T + I72E + I74T + C77T + F164D + L174D); M4 (F164D) and M5 (F164D + L174D). Lu observed that the M5 mutations (F164D + L174D) were the most influential mutations for improving the solubility of HA stem proteins. Additional deletions (H38 to C43 and C49 to N61) and C77T mutations were introduced into the M5 mutants to avoid formation of unwanted disulfide bonds, reduce surface hydrophobicity and pI, and avoid regions of disordered structure.

[0013] В заявке США №13/838796 и сопутствующей публикации Holtz et al. (ВМС Biotechnology. 2014; 14:111) сообщается о повышенной стабильности и сохранении активности рекомбинантного НА за счет мутации остатков цистеина в карбоксиконцевой области белка НА, включая в себя трансмембранный (ТМ) и цитозольный домен (СТ). В частности, Holtz et al. демонстрируют мутации С539А, С546А, С549А, C524S и С528А в рекомбинантном НА Perth/16/2009 (H3N2). Мутация всех пяти остатков цистеина или различных их подмножеств приводила к выходам, чистоте, размеру частиц, активности гемагглютинации и термостабильности НА, сравнимым с рекомбинантным белком НА дикого типа. Напротив, мутации C64S и C76S приводили к значительному снижению экспрессии НА, что указывает на критическую роль этих остатков в собственном сворачивании НА. Используя анализ простой радиальной иммунодиффузии (SRID), Holtz et al. также показывают, что пять мутаций остатков цистеина улучшают активность рекомбинантного НА по сравнению с белком дикого типа, предотвращая перекрестное связывание дисульфидов в доменах ТМ и СТ. Мутантные белки НА сохраняют активность в течение по меньшей мере 12 месяцев при температуре 25°С, тогда как белок НА дикого типа проявлял активность менее 40% только через 50 дней после очистки.[0013] U.S. Application No. 13/838796 and related publication Holtz et al. (ВМС Biotechnology. 2014; 14:111) it is reported about the increased stability and preservation of the activity of recombinant HA due to the mutation of cysteine residues in the carboxy-terminal region of the HA protein, including the transmembrane (TM) and cytosolic domain (CT). In particular, Holtz et al. show mutations C539A, C546A, C549A, C524S and C528A in recombinant HA Perth/16/2009 (H3N2). Mutation of all five cysteine residues, or various subsets thereof, resulted in yields, purity, particle size, hemagglutination activity, and thermal stability of HA comparable to wild-type recombinant HA protein. On the contrary, mutations in C64S and C76S led to a significant decrease in HA expression, which indicates the critical role of these residues in intrinsic HA folding. Using a simple radial immunodiffusion (SRID) assay, Holtz et al. also show that five mutations of cysteine residues improve the activity of recombinant HA compared to the wild-type protein by preventing cross-linking of disulfides in the TM and CT domains. The mutant HA proteins remain active for at least 12 months at 25° C., while the wild-type HA protein showed less than 40% activity only 50 days after purification.

[0014] В публикации международной заявки WO 2015/020913 сообщается о мутации конкретных остатков в одном или более положениях, выбранных из группы из 403, 406, 411, 422, 429, 432, 433 и 435 вируса гриппа A/Puerto Rico/8/1934 (H1N1), в тирозин. Эти мутации способствуют образованию дитирозиновых поперечных сшивок, которые стабилизируют или «блокируют» домен ножки НА гриппа в его нативной тримерной конформации.[0014] International application publication WO 2015/020913 reports the mutation of specific residues at one or more positions selected from the group of 403, 406, 411, 422, 429, 432, 433 and 435 of influenza A virus /Puerto Rico/8/ 1934 (H1N1), to tyrosine. These mutations promote the formation of dityrosine crosslinks that stabilize or "lock" the influenza HA stem domain in its native trimeric conformation.

[0015] В публикации международной заявки WO 2013/079473 раскрыт модифицированный НА гриппа, лишенный глобулярного головного домена. Полипептид, описанный в публикации международной заявки WO 2013/079473, содержит домен НА1, в котором аминокислоты с 53 по 620 (со ссылкой на нумерацию A/Brisbane/59/2007 [H1N1]) удалены и заменены ковалентно связанной последовательностью из 0-10 аминокислот, и домен НА2, где С-концевая аминокислота домена НА1 представляет собой аминокислоту, отличную от аргинина или лизина, и где одна или более аминокислот в положениях 406, 409, 413 и 416 мутированы в аминокислоту, выбранную из группы, состоящей из серина, треонина, аспарагина, глутамина, аргинина, гистидина, лизина, аспарагиновой кислоты, глутаминовой кислоты и глицина.[0015] WO 2013/079473 discloses a modified influenza HA lacking the globular head domain. The polypeptide described in the publication of international application WO 2013/079473 contains a HA1 domain in which amino acids 53 to 620 (with reference to the numbering A/Brisbane/59/2007 [H1N1]) are deleted and replaced by a covalently linked sequence of 0-10 amino acids , and a HA2 domain, wherein the C-terminal amino acid of the HA1 domain is an amino acid other than arginine or lysine, and wherein one or more amino acids at positions 406, 409, 413, and 416 are mutated to an amino acid selected from the group consisting of serine, threonine , asparagine, glutamine, arginine, histidine, lysine, aspartic acid, glutamic acid and glycine.

[0016] В публикации международной заявки WO 2014/191435 аналогичным образом описан модифицированный НА гриппа, содержащий домен НА1, в котором удаленный сегмент заменен ковалентно связанной последовательностью от 0 до 50 аминокислот, и домен НА2, причем НА устойчив к расщеплению на стыке между НА1 и НА2 и причем одна или более аминокислот в положениях 337, 340, 352, 353, 402, 406, 409, 413 и/или 416 были мутированы.[0016] WO 2014/191435 similarly describes a modified influenza HA comprising a HA1 domain in which the deleted segment is replaced by a covalently linked sequence of 0 to 50 amino acids and a HA2 domain, wherein the HA is resistant to cleavage at the junction between HA1 and HA2 and wherein one or more amino acids at positions 337, 340, 352, 353, 402, 406, 409, 413 and/or 416 have been mutated.

[0017] Вирусоподобные частицы (VLP) представляют собой потенциальных кандидатов для включения в иммуногенные композиции. VLP очень похожи на зрелые вирионы, но они не содержат вирусного геномного материала. Следовательно, VLP нерепликативны по своей природе, что делает их безопасными для введения в качестве вакцины. Кроме того, VLP могут быть сконструированы для экспрессии вирусных гликопротеинов на поверхности VLP, которая является их наиболее естественной физиологической конфигурацией. Более того, поскольку VLP похожи на интактные вирионы и представляют собой поливалентные структуры в виде частиц, VLP могут быть более эффективными в индукции нейтрализующих антител к гликопротеину, чем антигены растворимых белков оболочки.[0017] Virus-like particles (VLPs) are potential candidates for inclusion in immunogenic compositions. VLPs are very similar to mature virions, but they do not contain viral genomic material. Therefore, VLPs are non-replicating in nature, making them safe to administer as a vaccine. In addition, VLPs can be engineered to express viral glycoproteins on the surface of the VLP, which is their most natural physiological configuration. Moreover, since VLPs are similar to intact virions and are multivalent particulate structures, VLPs may be more effective in inducing neutralizing anti-glycoprotein antibodies than soluble envelope protein antigens.

[0018] VLP были произведены в растениях (смотрите, например, публикации международных заявок WO 2009/076778; WO 2009/009876; WO 2009/076778; WO 2010/003225; WO 2010/003235; WO 2010/006452; WO 2011/03522; WO 2010/148511 и WO 2014153674, которые включены в настоящий документ посредством ссылки).[0018] VLPs have been produced in plants (see, for example, International Application Publications WO 2009/076778; WO 2009/009876; WO 2009/076778; WO 2010/003225; WO 2010/003235; WO 2010/006452; WO 2011/03 522 ; WO 2010/148511 and WO 2014153674, which are incorporated herein by reference).

[0019] В публикации международной заявки WO 2009/076778 описан способ получения VLP гриппа в растениях, предусматривающий введение нуклеиновой кислоты, содержащей регуляторную область, активную в растении, функционально связанную с нуклеотидной последовательностью, кодирующей НА гриппа из гриппа типа А или типа В.[0019] International application WO 2009/076778 describes a method for producing influenza VLPs in plants, which involves the introduction of a nucleic acid containing a regulatory region active in a plant, operably linked to a nucleotide sequence encoding influenza HA from influenza type A or type B.

[0020] В публикации международной заявки WO 2009/009876 описан способ получения VLP НА гриппа в растениях, при котором НА гриппа самоорганизуется в VLP в клетках растений и почках из мембран растительных клеток.[0020] WO 2009/009876 describes a method for producing influenza HA VLPs in plants, in which influenza HA self-assembles into VLPs in plant cells and buds from plant cell membranes.

[0021] В публикации международной заявки WO 2010/003225 раскрыт способ получения VLP НА гриппа в растениях, предусматривающий введение нуклеиновой кислоты, содержащей регуляторную область, активную в растении, функционально связанную с нуклеотидной последовательностью, кодирующей НА гриппа из A/California/04/09 (H1N1).[0021] International application WO 2010/003225 discloses a method for producing influenza HA VLPs in plants, comprising introducing a nucleic acid containing a regulatory region active in a plant operably linked to a nucleotide sequence encoding influenza HA from A/California/04/09 (H1N1).

[0022] В публикации международной заявки WO 2010/006452 сообщается о получении VLP, содержащих модифицированные белки НА гриппа, причем сайты гликозилирования в положениях 154, 165, 286 или их комбинации (со ссылкой на нумерацию A/Vietnam/1194/04 [H5N1]) были отменены путем мутации остатков в указанных положениях в аминокислоты, отличные от аспарагина. В публикации международной заявки WO 2010/006452 также сообщается, что аминокислоты в положениях 156, 167, 288 или их комбинации могут быть мутированы в остатки, отличные от серина или треонина, чтобы аналогичным образом отменить N-связанную триаду сигнала гликозилирования «N-X-S/Т». Путем избирательного удаления сайтов гликозилирования, расположенных в глобулярной головке белка НА, в публикации международной заявки WO 2010/006452 продемонстрировано, что полученный белок НА характеризуется повышенной антигенностью и более широкой перекрестной реактивностью.[0022] International application WO 2010/006452 reports the production of VLPs containing modified influenza HA proteins with glycosylation sites at positions 154, 165, 286, or combinations thereof (with reference to numbering A/Vietnam/1194/04 [H5N1] ) were abolished by mutating the residues at the indicated positions into amino acids other than asparagine. WO 2010/006452 also teaches that the amino acids at positions 156, 167, 288, or combinations thereof, can be mutated to residues other than serine or threonine to similarly abolish the N-linked "N-X-S/T" glycosylation signal triad . By selectively removing glycosylation sites located in the globular head of the HA protein, WO 2010/006452 demonstrates that the resulting HA protein is characterized by increased antigenicity and broader cross-reactivity.

[0023] В публикации международной заявки WO 2011/035422 сообщается о способе получения VLP растительного происхождения, предусматривающем: получение растения или растительного вещества, содержащего VLP, локализованные в апопласте; получение фракции протопласта/сферопласта и фракции апопласта; и выделение фракции апопласта, содержащей VLP растительного происхождения.[0023] In the publication of the international application WO 2011/035422, a method for obtaining VLPs of plant origin is reported, including: obtaining a plant or plant substance containing VLPs localized in the apoplast; obtaining a protoplast/spheroplast fraction and an apoplast fraction; and isolating the apoplast fraction containing plant VLPs.

[0024] В публикации международной заявки WO 2010/148511 раскрыт способ получения VLP гриппа в растениях, причем VLP содержат химерные белки НА. Химерные белки НА содержат кластер домена стебля, содержащий субдомены F'1, F'2 и F; кластер головного домена, содержащий субдомены RB, Е1 и Е2; и кластер транс мембранного домена, содержащий транс мембранный домен и С-концевой хвостовой домен, причем по меньшей мере один субдомен происходит от первого штамма гриппа, а другие субдомены происходят от одного или более вторых штаммов гриппа.[0024] International application WO 2010/148511 discloses a method for producing influenza VLPs in plants, the VLPs containing chimeric HA proteins. Chimeric HA proteins contain a stem domain cluster containing subdomains F'1, F'2 and F; a head domain cluster containing subdomains RB, E1 and E2; and a trans membrane domain cluster comprising a trans membrane domain and a C-terminal tail domain, wherein at least one subdomain is derived from a first influenza strain and the other subdomains are derived from one or more second influenza strains.

[0025] В публикации международной заявки WO 2014/153674 сообщается о способе получения VLP вируса гриппа в растении, причем VLP содержат модифицированный НА гриппа, содержащий модифицированную протеолитическую петлю. Модифицированная протеолитическая петля содержит удаление сайта протеолитического расщепления между доменами НА1 и НА2 предшественника НА0. Таким образом, белок НА стабилизируется, и достигаются повышенные выходы белка по сравнению с нативным белком НА.[0025] WO 2014/153674 discloses a process for producing influenza VLPs in a plant, wherein the VLPs comprise a modified influenza HA containing a modified proteolytic loop. The modified proteolytic loop comprises the removal of a proteolytic cleavage site between the HA1 and HA2 domains of the HA0 precursor. Thus, the HA protein is stabilized and higher protein yields are achieved compared to native HA protein.

Сущность настоящего изобретенияThe essence of the present invention

[0026] Настоящее изобретение относится к производству модифицированных белков вируса гриппа в растениях. Более конкретно, настоящее изобретение относится к производству и увеличению продукции подобных вирусу гриппа частиц (VLP) в растениях, причем VLP содержат модифицированные вирусные белки гриппа, например, модифицированный белок гемагглютинин (НА).[0026] The present invention relates to the production of modified influenza virus proteins in plants. More specifically, the present invention relates to the production and enhancement of the production of influenza virus-like particles (VLPs) in plants, the VLPs containing modified influenza viral proteins, for example, a modified haemagglutinin (HA) protein.

[0027] Цель настоящего изобретения заключается в создании улучшенного способа увеличения производства VLP вируса гриппа в растениях.[0027] The purpose of the present invention is to provide an improved method for increasing the production of influenza VLPs in plants.

[0028] В соответствии с настоящим изобретением предусмотрено следующее:[0028] In accordance with the present invention, the following is provided:

[0029] А. Нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный белок гемагглютинина (НА) Н3 вируса гриппа, причем белок НА содержит аминокислотную последовательность, содержащую по меньшей мере одну замену по сравнению с соответствующей аминокислотной последовательностью дикого типа, причем указанная по меньшей мере одна замена представляет собой замену одной или более чем одной аминокислоты, соответствующей аминокислотам в положении 382, 384, 392 или 431 A/Hong Kong/4801/14 НА.[0029] A. A nucleic acid comprising a nucleotide sequence encoding a modified influenza H3 hemagglutinin (HA) protein, wherein the HA protein comprises an amino acid sequence containing at least one substitution compared to the corresponding wild-type amino acid sequence, wherein at least one substitution is a substitution of one or more amino acids corresponding to amino acids at position 382, 384, 392, or 431 of A/Hong Kong/4801/14 HA.

[0030] Белок НА может содержать аминокислотную последовательность с заменой на не аспарагин по аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА. Белок НА может содержать аминокислотную последовательность с заменой на аланин или консервативную замену аланина в аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА.[0030] The HA protein may comprise an amino acid sequence with a non-asparagine substitution at the amino acid corresponding to the amino acid at position 382 of A/Hong Kong/4801/14 HA. The HA protein may comprise an amino acid sequence with an alanine substitution or a conservative alanine substitution at the amino acid corresponding to the amino acid at position 382 of A/Hong Kong/4801/14 HA.

[0031] Белок НА может содержать аминокислотную последовательность с заменой на не лейцин по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА. Белок НА может содержать аминокислотную последовательность с заменой на валин или консервативную замену валина по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА.[0031] The HA protein may comprise an amino acid sequence with a non-leucine substitution at the amino acid corresponding to the amino acid at position 384 of A/Hong Kong/4801/14 HA. The HA protein may comprise an amino acid sequence with a valine substitution or a conservative valine substitution at the amino acid corresponding to the amino acid at position 384 of A/Hong Kong/4801/14 HA.

[0032] Белок НА может содержать аминокислотную последовательность с заменой на не фенилаланин по аминокислоте, соответствующей аминокислоте в положении 392 A/Hong Kong/4801/14 НА. Белок НА может содержать аминокислотную последовательность с заменой на аспарагиновую кислоту или консервативную замену аспарагиновой кислоты по аминокислоте, соответствующей аминокислоте в положении 392 A/Hong Kong/4801/14 НА.[0032] The HA protein may comprise an amino acid sequence with a non-phenylalanine substitution at the amino acid corresponding to the amino acid at position 392 of A/Hong Kong/4801/14 HA. The HA protein may comprise an amino acid sequence substituted with aspartic acid or a conservative substitution of aspartic acid at the amino acid corresponding to the amino acid at position 392 of A/Hong Kong/4801/14 HA.

[0033] Белок НА может содержать аминокислотную последовательность с заменой на не лейцин по аминокислоте, соответствующей аминокислоте в положении 431 A/Hong Kong/4801/14 НА. Белок НА может содержать аминокислотную последовательность с заменой на метионин или консервативную замену метионина по аминокислоте, соответствующей аминокислоте в положении 431 A/Hong Kong/4801/14 НА.[0033] The HA protein may comprise an amino acid sequence with a non-leucine substitution at the amino acid corresponding to the amino acid at position 431 of A/Hong Kong/4801/14 HA. The HA protein may comprise an amino acid sequence with a methionine substitution or a conservative methionine substitution at the amino acid corresponding to the amino acid at position 431 of A/Hong Kong/4801/14 HA.

[0034] Также предусмотрено:[0034] Also provided:

[0035] В. Нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный белок гемагглютинин (НА) вируса гриппа Н3, причем белок НА содержит аминокислотную последовательность, содержащую по меньшей мере одну замену, по сравнению с соответствующей аминокислотной последовательностью дикого типа, причем указанная по меньшей мере одна замена представляет собой замену одной или более чем одной аминокислоты, соответствующей аминокислотам в положениях 382, 384, 392, 431, 524, 525, 526 или 528 A/Hong Kong/4801/14 НА.[0035] C. A nucleic acid comprising a nucleotide sequence encoding a modified H3 influenza virus hemagglutinin (HA) protein, wherein the HA protein comprises an amino acid sequence containing at least one substitution, as compared to the corresponding wild-type amino acid sequence, wherein at least at least one substitution is a substitution of one or more amino acids corresponding to amino acids at positions 382, 384, 392, 431, 524, 525, 526, or 528 of A/Hong Kong/4801/14 HA.

[0036] Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на не аспарагин по аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА, второй заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА. Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на аланин или консервативную замену аланина по аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА, второй заменой на серин или консервативную замену серина по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на лейцин или консервативную замену лейцина по аминокислоте, соответствующей аминокислоте в положении 528 из A/Hong Kong/4801/14 НА.[0036] The HA protein may further comprise an amino acid sequence with a first substitution for a non-asparagine at the amino acid corresponding to the amino acid at position 382 A/Hong Kong/4801/14 HA, a second substitution for a non-cysteine at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a third non-cysteine substitution at the amino acid corresponding to the amino acid at position 528 A/Hong Kong/4801/14 HA. The HA protein may further comprise an amino acid sequence with a first substitution for alanine or a conservative substitution of alanine at the amino acid corresponding to the amino acid at position 382 of A/Hong Kong/4801/14 HA, a second substitution for serine or a conservative substitution of serine at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a third substitution for leucine or a conservative leucine substitution at the amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA.

[0037] Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на не лейцин по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА, второй заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА. Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на валин или консервативную замену валина по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА, второй заменой на серин или консервативную замену серина по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на лейцин или консервативную замену лейцина по аминокислоте, соответствующей аминокислоте в положении 528 из A/Hong Kong/4801/14 НА.[0037] The HA protein may further comprise an amino acid sequence with a first non-leucine substitution at the amino acid corresponding to the amino acid at position 384 A/Hong Kong/4801/14 HA, a second non-cysteine substitution at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a third non-cysteine substitution at the amino acid corresponding to the amino acid at position 528 A/Hong Kong/4801/14 HA. The HA protein may further comprise an amino acid sequence with a first substitution for valine or a conservative substitution for valine at the amino acid corresponding to the amino acid at position 384 of A/Hong Kong/4801/14 HA, a second substitution for serine or a conservative substitution for serine at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a third substitution for leucine or a conservative leucine substitution at the amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA.

[0038] Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на не фенилаланин по аминокислоте, соответствующей аминокислоте в положении 392 A/Hong Kong/4801/14 НА, второй заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА. Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на аспарагиновую кислоту или консервативную замену аспарагиновой кислоты по аминокислоте, соответствующей аминокислоте в положении 392 A/Hong Kong/4801/14 НА, второй заменой на серин или консервативную замену серина по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на лейцин или консервативную замену лейцина по аминокислоте, соответствующей аминокислоте в положении 528 из A/Hong Kong/4801/14 НА.[0038] The HA protein may further comprise an amino acid sequence with a first non-phenylalanine substitution at the amino acid corresponding to the amino acid at position 392 A/Hong Kong/4801/14 HA, a second non-cysteine substitution at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a third non-cysteine substitution at the amino acid corresponding to the amino acid at position 528 A/Hong Kong/4801/14 HA. The HA protein may further comprise an amino acid sequence with a first substitution for aspartic acid or a conservative substitution of aspartic acid for the amino acid corresponding to the amino acid at position 392 of A/Hong Kong/4801/14 HA, a second substitution for serine or a conservative substitution of serine for the amino acid corresponding to the amino acid in position 524 of A/Hong Kong/4801/14 HA, and a third substitution for leucine or a conservative leucine substitution at the amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA.

[0039] Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на не лейцин по аминокислоте, соответствующей аминокислоте в положении 431 A/Hong Kong/4801/14 НА, второй заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА. Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на метионин или консервативную замену метионина по аминокислоте, соответствующей аминокислоте в положении 431 A/Hong Kong/4801/14 НА, второй заменой на серин или консервативную замену серина по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на лейцин или консервативную замену лейцина по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА.[0039] The HA protein may further comprise an amino acid sequence with a first non-leucine substitution at the amino acid corresponding to the amino acid at position 431 A/Hong Kong/4801/14 HA, a second non-cysteine substitution at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a third non-cysteine substitution at the amino acid corresponding to the amino acid at position 528 A/Hong Kong/4801/14 HA. The HA protein may further comprise an amino acid sequence with a first substitution for methionine or a conservative substitution of methionine at the amino acid corresponding to the amino acid at position 431 of A/Hong Kong/4801/14 HA, a second substitution for serine or a conservative substitution of serine at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a third substitution for leucine or a conservative leucine substitution at the amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA.

[0040] Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на не аспарагин по аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА, второй заменой на не лейцин по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА, третьей заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и четвертой заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА. Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на аланин или консервативную замену аланина на аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА, второй заменой на валин или консервативную замену валина по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА, третьей заменой на серин или консервативную замену серина по аминокислоте, соответствующей аминокислоте в положение 524 A/Hong Kong/4801/14 НА, и четвертой заменой на лейцин или консервативную замену лейцина по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА.[0040] The HA protein may further comprise an amino acid sequence with a first substitution for non-asparagine at the amino acid corresponding to the amino acid at position 382 A/Hong Kong/4801/14 HA, a second substitution for non-leucine at the amino acid corresponding to the amino acid at position 384 A/Hong Kong/4801/14 HA, a third non-cysteine substitution at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a fourth non-cysteine substitution at the amino acid corresponding to the amino acid at position 528 A/Hong Kong/4801 /14 ON. The HA protein may further comprise an amino acid sequence with a first substitution for alanine or a conservative substitution of alanine for the amino acid corresponding to the amino acid at position 382 of A/Hong Kong/4801/14 HA, a second substitution for valine or a conservative substitution of valine for the amino acid corresponding to the amino acid at position 384 A/Hong Kong/4801/14 HA, a third substitution with serine or a conservative substitution of serine at the amino acid corresponding to the amino acid at position 524 of A/Hong Kong/4801/14 HA, and a fourth substitution with leucine or a conservative substitution of leucine at the amino acid corresponding to the amino acid at position 528 A/Hong Kong/4801/14 ON.

[0041] Белок НА может дополнительно содержать аминокислотную последовательность с заменой по аминокислотам, соответствующим аминокислотам в положениях 525, 526 или 525 и 526 A/Hong Kong/4801/14 НА, причем замена аминокислоты в положении 525 представляет собой замену на не фенилаланин, а замена аминокислоты в положении 526 представляет собой замену на не лейцин. Белок НА может дополнительно содержать аминокислотную последовательность с заменой по аминокислотам, соответствующим аминокислотам в положениях 525, 526 или 525 и 526 A/Hong Kong/4801/14 НА, причем замена аминокислоты в положении 525 представляет собой замену на лейцин или консервативную замену лейцина, а замена аминокислоты в положении 526 представляет собой замену на валин или консервативную замену валина.[0041] The HA protein may further comprise an amino acid sequence with amino acid substitutions corresponding to amino acids at positions 525, 526 or 525 and 526 of A/Hong Kong/4801/14 HA, wherein the amino acid substitution at position 525 is not phenylalanine but the amino acid change at position 526 is a non-leucine change. The HA protein may further comprise an amino acid sequence with amino acid substitutions corresponding to amino acids at positions 525, 526, or 525 and 526 of A/Hong Kong/4801/14 HA, wherein the amino acid substitution at position 525 is a substitution for leucine or a conservative substitution for leucine, and the amino acid substitution at position 526 is a valine substitution or a conservative valine substitution.

[0042] Дополнительно предоставлен белок НА, кодируемый рекомбинантными нуклеиновыми кислотами, как описано в разделах А или В, и вирусоподобная частица (VLP), содержащая белок НА, кодируемый рекомбинантными нуклеиновыми кислотами, как описано в разделах А или В.[0042] Additionally provided is a HA protein encoded by recombinant nucleic acids as described in sections A or B, and a virus-like particle (VLP) containing a HA protein encoded by recombinant nucleic acids as described in sections A or B.

[0043] Таким образом, дополнительно предусмотрен модифицированный белок НА, содержащий аминокислотную последовательность, содержащую по меньшей мере одну замену по сравнению с соответствующей аминокислотной последовательностью дикого типа, причем указанная по меньшей мере одна замена представляет собой замену по одной или более чем одной аминокислоте, соответствующей аминокислотам в положении 382, 384, 392 или 431 в A/Hong Kong/4801/14 НА.[0043] Thus, a modified HA protein is further provided, comprising an amino acid sequence containing at least one substitution compared to the corresponding wild-type amino acid sequence, wherein said at least one substitution is a substitution at one or more than one amino acid corresponding to amino acids at position 382, 384, 392 or 431 in A/Hong Kong/4801/14 HA.

[0044] Согласно другому аспекту предусмотрен модифицированный белок гемагглютинин (НА) вируса гриппа Н3, причем белок НА содержит аминокислотную последовательность, содержащую по меньшей мере одну замену, по сравнению с соответствующей аминокислотной последовательностью дикого типа, причем указанная по меньшей мере одна замена представляет собой замену по одной или более чем одной аминокислоте, соответствующей аминокислотам в положениях 382, 384, 392, 431, 524, 525, 526 или 528 A/Hong Kong/4801/14 НА.[0044] According to another aspect, a modified H3 influenza virus hemagglutinin (HA) protein is provided, wherein the HA protein comprises an amino acid sequence containing at least one substitution compared to the corresponding wild-type amino acid sequence, wherein said at least one substitution is a substitution one or more amino acids corresponding to amino acids at positions 382, 384, 392, 431, 524, 525, 526 or 528 A/Hong Kong/4801/14 HA.

[0045] Кроме того, представлен способ получения вирусоподобной частицы (VLP) в растении, части растения или растительной клетке, предусматривающий:[0045] Also provided is a method for producing a virus-like particle (VLP) in a plant, plant part, or plant cell, comprising:

a) введение рекомбинантной нуклеиновой кислоты, как описано в разделе А или В, в растение, часть растения или растительную клетку; а такжеa) introducing the recombinant nucleic acid, as described in section A or B, into a plant, plant part, or plant cell; and

b) инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию белка НА, кодируемого рекомбинантной нуклеиновой кислотой, с получением VLP. Способ может дополнительно предусматривать стадию с) сбора растения, части растения или растительной клетки и очистки VLP.b) incubating the plant, plant part or plant cell under conditions that allow expression of the HA protein encoded by the recombinant nucleic acid to produce a VLP. The method may further comprise step c) collecting the plant, plant part or plant cell and purifying the VLP.

[0046] Кроме того, представлен способ получения подобной вирусу гриппа частицы (VLP) в растении, части растения или растительной клетке, предусматривающий:[0046] Also provided is a method for producing an influenza virus-like particle (VLP) in a plant, plant part, or plant cell, comprising:

a) предоставление растения, части растения или растительной клетки, содержащих рекомбинантную нуклеиновую кислоту, как описано в разделе А или В; а такжеa) providing a plant, plant part or plant cell containing the recombinant nucleic acid as described in section A or B; and

b) инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию белка НА, кодируемого рекомбинантной нуклеиновой кислотой, с получением VLP. Способ может дополнительно предусматривать стадию с) сбора растения, части растения или растительной клетки и очистки VLP.b) incubating the plant, plant part or plant cell under conditions that allow expression of the HA protein encoded by the recombinant nucleic acid to produce a VLP. The method may further comprise step c) collecting the plant, plant part or plant cell and purifying the VLP.

[0047] Кроме того, представлен способ увеличения выхода продукции вирусоподобных частиц (VLP) в растении, части растения или растительной клетке, предусматривающий: а) введение рекомбинантной нуклеиновой кислоты А или В в растение, часть растения или растительную клетку или предоставление растения, части растения или растительной клетки, содержащих рекомбинантную нуклеиновую кислоту А или В; и b) инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию белка НА, кодируемого рекомбинантной нуклеиновой кислотой, тем самым производя VLP с более высоким выходом по сравнению с растением, частью растения или растительной клеткой, экспрессирующей немодифицированный белок НА гриппа. Способ может дополнительно предусматривать стадию с) сбора растения, части растения или растительной клетки и очистки VLP.[0047] In addition, a method is provided for increasing the production yield of virus-like particles (VLPs) in a plant, plant part, or plant cell, comprising: a) introducing a recombinant nucleic acid A or B into a plant, plant part, or plant cell, or providing a plant, plant part or a plant cell containing recombinant nucleic acid A or B; and b) incubating the plant, plant part, or plant cell under conditions that allow expression of the HA protein encoded by the recombinant nucleic acid, thereby producing VLPs in higher yield than a plant, plant part, or plant cell expressing unmodified influenza HA protein. The method may further comprise step c) collecting the plant, plant part or plant cell and purifying the VLP.

[0048] Способы могут дополнительно предусматривать введение второй нуклеиновой кислоты, кодирующей белок протонного канала; причем растение, часть растения или растительную клетку инкубируют в условиях, которые допускают экспрессию белка протонного канала, кодируемого второй нуклеиновой кислотой. Белок протонного канала может представлять собой белок М2 подтипа А.[0048] The methods may further comprise introducing a second nucleic acid encoding a proton channel protein; wherein the plant, plant part, or plant cell is incubated under conditions that allow expression of the proton channel protein encoded by the second nucleic acid. The proton channel protein may be an M2 subtype A protein.

[0049] Кроме того, предусмотрена VLP, полученная описанным ниже способом.[0049] In addition, a VLP obtained by the method described below is provided.

[0050] VLP может содержать один или более липидов, полученных из растения, части растения или растительной клетки, специфические для растений N-гликаны, модифицированные N-гликаны или их комбинации.[0050] The VLP may comprise one or more lipids derived from a plant, plant part, or plant cell, plant-specific N-glycans, modified N-glycans, or combinations thereof.

[0051] Кроме того, представлен способ получения антитела или фрагмента антитела, предусматривающий введение описанной VLP субъекту или животному-хозяину, тем самым производя антитело или фрагмент антитела. Также предусмотрены антитела или фрагменты антител, полученные данным способом.[0051] Also provided is a method for producing an antibody or antibody fragment, comprising administering the described VLP to a subject or host animal, thereby producing an antibody or antibody fragment. Also provided are antibodies or antibody fragments obtained by this method.

[0052] Кроме того, предусмотрено растение, часть растения или растительная клетка, содержащие рекомбинантную нуклеиновую кислоту А или В или белок НА, кодируемый рекомбинантной нуклеиновой кислотой А или В. Белок НА может образовывать VLP. Соответственно, также предусмотрено растение, часть растения или растительная клетка, содержащая VLP, содержащую белок НА, кодируемый рекомбинантной нуклеиновой кислотой А или В.[0052] Also provided is a plant, plant part, or plant cell containing a recombinant nucleic acid A or B, or a HA protein encoded by a recombinant nucleic acid A or B. The HA protein can form a VLP. Accordingly, a plant, plant part, or plant cell is also provided, containing a VLP containing a HA protein encoded by a recombinant nucleic acid A or B.

[0053] Кроме того, предусмотрена композиция для индукции иммунного ответа, содержащая эффективную дозу VLP, как описано в настоящем документе, и фармацевтически приемлемый носитель, адъювант, наполнитель или вспомогательное вещество. Также представлен способ индукции иммунитета к инфекции гриппа у субъекта, предусматривающий введение описанной VLP. VLP можно вводить субъекту перорально, интраназально, внутримышечно, внутрибрюшинно, внутривенно или подкожно.[0053] Also provided is a composition for inducing an immune response comprising an effective dose of VLP as described herein and a pharmaceutically acceptable carrier, adjuvant, excipient, or excipient. Also provided is a method for inducing immunity to influenza infection in a subject, comprising administering the described VLP. VLP can be administered to a subject orally, intranasally, intramuscularly, intraperitoneally, intravenously, or subcutaneously.

[0054] Кроме того, предусмотрен модифицированный белок гемагглютинина (НА) гриппа, содержащий аминокислотную последовательность, характеризующуюся идентичностью последовательности или сходством последовательности, составляющим от приблизительно 30% до приблизительно 100% по отношению к последовательности, выбранной из последовательностей SEQ ID NO: 21, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 53, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 98, при условии, что белок НА гриппа содержит по меньшей мере одну замену, как описано в настоящем документе, и способен образовывать VLP, индуцирует иммунный ответ при введении субъекту, индуцирует гемагглютинацию или их комбинацию.[0054] In addition, a modified influenza hemagglutinin (HA) protein is provided, comprising an amino acid sequence characterized by sequence identity or sequence similarity of from about 30% to about 100% with respect to a sequence selected from the sequences of SEQ ID NO: 21, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO : 47, SEQ ID NO: 49, SEQ ID NO: 53, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86 , SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 98, provided that the influenza HA protein contains at least one substitution as described herein and is capable of forming a VLP, induces an immune response when administered to a subject , induces hemagglutination, or a combination thereof.

[0055] Это краткое раскрытие настоящего изобретения не обязательно описывает все особенности настоящего изобретения.[0055] This brief disclosure of the present invention does not necessarily describe all the features of the present invention.

Краткое описание графических материаловBrief description of graphic materials

[0056] Эти и другие особенности настоящего изобретения станут более очевидными из следующего описания, в котором сделана ссылка на прилагаемые графические материалы, где:[0056] These and other features of the present invention will become more apparent from the following description, in which reference is made to the accompanying drawings, where:

[0057] На фиг. 1 показано выравнивание аминокислотных последовательностей гемагглютинина (НА) A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96); A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97); выделенные остатки совпадают с аминокислотами N382, L384, F392, L431 НА из штаммов гриппа Н3 (H3N2), например, A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92).[0057] FIG. 1 shows the alignment of the amino acid sequences of hemagglutinin (HA) A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96); A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97); isolated residues match the amino acids N382, L384, F392, L431 of HA from strains of influenza H3 (H3N2), for example, A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92).

[0058] На фиг. 2 показаны титры гемагглютинации A/Switzerland/9715293/13 Н3 дикого типа, мутанта N382A A/Switzerland/9715293/13 НЗ, мутанта L384V A/Switzerland/9715293/13 НЗ, мутанта F392D A/Switzerland/9715293/13 Н3 и мутанта L431M A/Switzerland/9715293/13 Н3.[0058] FIG. 2 shows hemagglutination titers of A/Switzerland/9715293/13 H3 wild type, N382A A/Switzerland/9715293/13 H3 mutant, L384V A/Switzerland/9715293/13 H3 mutant, F392D A/Switzerland/9715293/13 H3 mutant and mutant L431M A/Switzerland/9715293/13 H3.

[0059] На фиг. 3 показаны титры гемагглютинации A/Indonesia/5/2005 Н5 дикого типа, A/Egypt/N04915/2014 Н5 дикого типа, мутанта F393D A/Indonesia/5/2005 Н5, мутанта F393D A/Egypt/N04915/2014 Н5, мутанта N383 A A/Indonesia/5/2005 Н5 и мутанта N383 A A/Egypt/N04915/2014 Н5. Нумерация в соответствии с A/Indonesia/5/2005.[0059] FIG. 3 shows hemagglutination titers of A/Indonesia/5/2005 H5 wt, A/Egypt/N04915/2014 H5 wt, F393D A/Indonesia/5/2005 H5 mutant, F393D A/Egypt/N04915/2014 H5 mutant, N383 mutant A A/Indonesia/5/2005 H5 and mutant N383 A A/Egypt/N04915/2014 H5. Numbering according to A/Indonesia/5/2005.

[0060] На фиг. 4А показано схематическое представление вектора 3045 (Н3 A-Swi-9715293-13 (F392D)). На фиг. 4В показано схематическое представление вектора 3022 (Н3 A-Swi-9715293-13 (L431M)). На фиг. 4С показано схематическое представление вектора 3023 (Н3 A-Swi-9715293-13 (N382A)). На фиг. 4D показано схематическое представление вектора 3034 (Н3 A-Swi-9715293-13 (L384V)).[0060] FIG. 4A shows a schematic representation of vector 3045 (H3 A-Swi-9715293-13 (F392D)). In FIG. 4B shows a schematic representation of vector 3022 (H3 A-Swi-9715293-13 (L431M)). In FIG. 4C shows a schematic representation of vector 3023 (H3 A-Swi-9715293-13 (N382A)). In FIG. 4D shows a schematic representation of vector 3034 (H3 A-Swi-9715293-13 (L384V)).

[0061] На фиг. 5А показано схематическое представление вектора 3556 (вектор для клонирования In-Fusion в кассету экспрессии на основе CPMV 160 в дополнение к вспомогательному белку М2 под контролем промотора и терминатора пластоцианина люцерны). На фиг. 5В показано схематическое представление вектора 1190 (вектор для клонирования In-Fusion в кассету экспрессии на основе CPMV 160).[0061] In FIG. 5A shows a schematic representation of the 3556 vector (an In-Fusion cloning vector into an expression cassette based on CPMV 160 in addition to the M2 accessory protein under the control of the alfalfa plastocyanin promoter and terminator). In FIG. 5B shows a schematic representation of vector 1190 (an In-Fusion cloning vector into an expression cassette based on CPMV 160).

[0062] На фиг. 6А показаны титры гемагглютинации A/Switzerland/9715293/13 Н3 дикого типа и мутанта CysTM A/Switzerland/9715293/13 Н3.[0062] In FIG. 6A shows hemagglutination titers of A/Switzerland/9715293/13 H3 wild-type and CysTM A/Switzerland/9715293/13 H3 mutant.

[0063] На фиг. 6В показаны титры гемагглютинации A/Pennsylvania/09/2015 Н3 дикого типа и мутанта CysTM A/Pennsylvania/09/2015 Н3.[0063] FIG. 6B shows hemagglutination titers of A/Pennsylvania/09/2015 H3 wild-type and CysTM A/Pennsylvania/09/2015 H3 mutant.

[0064] На фиг. 7А показаны титры гемагглютинации A/Switzerland/9715293/13 Н3 дикого типа, мутанта N382A A/Switzerland/9715293/13 Н3, мутанта L384V A/Switzerland/9715293/13 НЗ, мутанта F392D A/Switzerland/9715293/13 Н3, мутанта L431M A/Switzerland/9715293/13 НЗ, A/Switzerland/9715293/13 Н3 с модификацией CysTM, мутанта N382A + CysTM A/Switzerland/9715293/13 Н3, мутанта L384V + CysTM A/Switzerland/9715293/13 Н3, мутанта F392D + CysTM A/Switzerland/9715293/13 Н3 и мутанта L431M + CysTM A/Switzerland/9715293/13 Н3. На фиг. 7В показаны выходы VLP после градиента плотности мутанта CysTM A/Switzerland/9715293/13 Н3, мутанта N382A + CysTM A/Switzerland/9715293/13 Н3, мутанта L384V + CysTM A/Switzerland/9715293/13 Н3, мутанта F392D + CysTM A/Switzerland/9715293/13 Н3 и мутанта L431M + CysTM A/Switzerland/9715293/13 Н3, выраженные в процентах по отношению к мутанту CysTM A/Switzerland/9715293/13 Н3. На фиг. 7С показаны титры гемагглютинации A/Pennsylvania/09/2015 Н3 дикого типа, мутанта CysTM A/Pennsylvania/09/2015 Н3, мутанта N382A + CysTM A/Pennsylvania/09/2015 Н3 и мутанта L384V + CysTM A/Pennsylvania/09/2015 Н3. На фиг. 7D показаны титры гемагглютинации мутанта CysTM A/S. Australia/1/16 Н3 и мутанта N382A + L384V + CysTM A/S. Australia/1/16 Н3. На фиг. 7Е показаны титры гемагглютинации мутанта CysTM A/Hong Kong/4801/14 Н3 и мутанта N382A + L384V + CysTM A/Hong Kong/4801/14 Н3; мутанта CysTM A/Minnesota/40/15 Н3 и мутанта N382A + L384V + CysTM A/Minnesota/40/15 Н3; мутанта CysTM A/S. Australia/1/16 Н3 и мутанта N382A + L384V + CysTM A/S. Australia/1/16 Н3; мутанта CysTM A/Bangkok/3007/15 Н3 и мутанта N382A + L384V + CysTM A/Bangkok/3007/15 Н3; мутанта CysTM A/Switzerland/9715293/13 Н3 и мутанта L384V + CysTM A/Switzerland/9715293/13 Н3; мутанта CysTM A/Mississippi/16/16 Н3 и мутанта N382A + L384V + CysTM A/Mississippi/16/16 Н3.[0064] FIG. 7A shows hemagglutination titers of A/Switzerland/9715293/13 H3 wild type, N382A A/Switzerland/9715293/13 H3 mutant, L384V A/Switzerland/9715293/13 H3 mutant, F392D A/Switzerland/9715293/13 H mutant 3, mutant L431M A/Switzerland/9715293/13 H3, A/Switzerland/9715293/13 H3 with modification of CysTM, mutant N382A + CysTM A/Switzerland/9715293/13 H3, mutant L384V + CysTM A/Switzerland/9715293/13 H3, mutant F392 D+ CysTM A/Switzerland/9715293/13 H3 and mutant L431M + CysTM A/Switzerland/9715293/13 H3. In FIG. 7B shows VLP yields after density gradient of CysTM A/Switzerland/9715293/13 H3 mutant, N382A + CysTM A/Switzerland/9715293/13 H3 mutant, L384V + CysTM A/Switzerland/9715293/13 H3 mutant, F392D + CysTM A/ mutant. Switzerland/9715293/13 H3 and the L431M + CysTM A/Switzerland/9715293/13 H3 mutant, expressed as a percentage of the CysTM A/Switzerland/9715293/13 H3 mutant. In FIG. 7C shows hemagglutination titers of A/Pennsylvania/09/2015 H3 wild-type, CysTM A/Pennsylvania/09/2015 H3 mutant, N382A + CysTM A/Pennsylvania/09/2015 H3 mutant, and L384V + CysTM A/Pennsylvania/09/2015 mutant. H3. In FIG. 7D shows the hemagglutination titers of the CysTM A/S mutant. Australia/1/16 H3 and mutant N382A + L384V + CysTM A/S. Australia/1/16 H3. In FIG. 7E shows the hemagglutination titers of the CysTM A/Hong Kong/4801/14 H3 mutant and the N382A + L384V + CysTM A/Hong Kong/4801/14 H3 mutant; mutant CysTM A/Minnesota/40/15 H3 and mutant N382A + L384V + CysTM A/Minnesota/40/15 H3; mutant CysTM A/S. Australia/1/16 H3 and mutant N382A + L384V + CysTM A/S. Australia/1/16 H3; mutant CysTM A/Bangkok/3007/15 H3 and mutant N382A + L384V + CysTM A/Bangkok/3007/15 H3; mutant CysTM A/Switzerland/9715293/13 H3 and mutant L384V + CysTM A/Switzerland/9715293/13 H3; mutant CysTM A/Mississippi/16/16 H3 and mutant N382A + L384V + CysTM A/Mississippi/16/16 H3.

[0065] На фиг. 8А показано схематическое представление вектора 3340 (Н3 А-НК-4801-14). На фиг. 8В показано схематическое представление вектора 3341 (Н3 А-НК-4801-14). На фиг. 8С показано схематическое представление вектора 3375 (Н3 А-НК-4801-14 (N382A+L384V)). На фиг.8D показано схематическое представление вектора 3914 (Н3 A-Minn-40-15). На фиг. 8Е показано схематическое представление вектора 3915 (Н3 A-Minn-40-15 (N382A + L384V)). На фиг. 8F показано схематическое представление вектора 3924 (Н3 A-SAus-1-16). На фиг. 8G показано схематическое представление вектора 3925 (Н3 A-SAus-1-16 (N382A + L384V)). На фиг. 8Н показано схематическое представление вектора 3904 (Н3 A-Bang-3007-15). На фиг. 8I показано схематическое представление вектора 3905 (Н3 A-Bang-3007-15 (N382A + L384V)). На фиг. 8J показано схематическое представление вектора 2801 (Н3 A-Swi-9715293-13). На фиг. 8K показано схематическое представление вектора 2811 (Н3 A-Swi-9715293-13). На фиг. 8L показано схематическое представление вектора 3063 (Н3 A-Swi-9715293-13 (N382A)). На фиг. 8М показано схематическое представление вектора 3074 (Н3 A-Swi-9715293-13 (L384V)). На фиг. 8N показано схематическое представление вектора 3085 (Н3 A-Swi-9715293-13 (F392D)). На фиг. 80 показано схематическое представление вектора 3062 (Н3 A-Swi-9715293-13 (L431M)). На фиг. 8Р показано схематическое представление вектора 3312 (Н3 А-Penn-09-15). На фиг. 8Q показано схематическое представление вектора 3313 (Н3 А-Penn-09-15). На фиг. 8R показано схематическое представление вектора 3314 (Н3 А-Penn-09-15 (N382A)). На фиг. 8S показано схематическое представление вектора 3315 (Н3 A-Penn-09-15 (L384V)).[0065] FIG. 8A shows a schematic representation of vector 3340 (H3 A-HK-4801-14). In FIG. 8B shows a schematic representation of vector 3341 (H3 A-HK-4801-14). In FIG. 8C shows a schematic representation of vector 3375 (H3 A-HK-4801-14 (N382A+L384V)). On fig.8D shows a schematic representation of the vector 3914 (H3 A-Minn-40-15). In FIG. 8E shows a schematic representation of vector 3915 (H3 A-Minn-40-15 (N382A + L384V)). In FIG. 8F shows a schematic representation of vector 3924 (H3 A-SAus-1-16). In FIG. 8G shows a schematic representation of vector 3925 (H3 A-SAus-1-16 (N382A + L384V)). In FIG. 8H shows a schematic representation of vector 3904 (H3 A-Bang-3007-15). In FIG. 8I shows a schematic representation of vector 3905 (H3 A-Bang-3007-15 (N382A + L384V)). In FIG. 8J shows a schematic representation of vector 2801 (H3 A-Swi-9715293-13). In FIG. 8K shows a schematic representation of vector 2811 (H3 A-Swi-9715293-13). In FIG. 8L shows a schematic representation of vector 3063 (H3 A-Swi-9715293-13 (N382A)). In FIG. 8M shows a schematic representation of vector 3074 (H3 A-Swi-9715293-13 (L384V)). In FIG. 8N shows a schematic representation of vector 3085 (H3 A-Swi-9715293-13 (F392D)). In FIG. 80 shows a schematic representation of vector 3062 (H3 A-Swi-9715293-13 (L431M)). In FIG. 8P shows a schematic representation of vector 3312 (H3 A-Penn-09-15). In FIG. 8Q shows a schematic representation of vector 3313 (H3 A-Penn-09-15). In FIG. 8R shows a schematic representation of vector 3314 (H3 A-Penn-09-15 (N382A)). In FIG. 8S shows a schematic representation of vector 3315 (H3 A-Penn-09-15 (L384V)).

[0066] На фиг. 9А показано схематическое представление вектора 2295 (Н5 A-Indo-5-05). На фиг. 9В показано схематическое представление вектора 3680 (Н5 A-Indo-5-05 (F393D)). На фиг. 9С показано схематическое представление вектора 3645 (Н5 A-Egypt-N04915-14). На фиг. 9D показано схематическое представление вектора 3690 (Н5 A-Egypt-N04915-14 (F392D)).[0066] FIG. 9A shows a schematic representation of vector 2295 (H5 A-Indo-5-05). In FIG. 9B shows a schematic representation of a 3680 vector (H5 A-Indo-5-05 (F393D)). In FIG. 9C shows a schematic representation of vector 3645 (H5 A-Egypt-N04915-14). In FIG. 9D shows a schematic representation of the vector 3690 (H5 A-Egypt-N04915-14 (F392D)).

Подробное описание настоящего изобретенияDetailed description of the present invention

[0067] Следующее описание относится к предпочтительному варианту осуществления.[0067] The following description relates to the preferred embodiment.

[0068] Используемые в настоящем документе термины «содержащий», «имеющий», «включающий в себя», «состоящий» и их грамматические вариации являются включающими или открытыми и не исключают дополнительные, непроцитированные элементы и/или стадии способа. Термин «состоящий по существу из», когда он используется в настоящем документе в связи с продуктом, применением или способом, означает, что могут присутствовать дополнительные элементы и/или стадии способа, но эти добавления не оказывают существенного влияния на способ, посредством которого функционирует изложенный способ или применения. Термин «состоящий из», когда он используется в настоящем документе в связи с продуктом, применением или способом, исключает присутствие дополнительных элементов и/или стадий способа. Продукт, применение или способ, описанные в настоящем документе как содержащие определенные элементы и/или стадии, могут также, согласно определенным вариантам осуществления, состоять по существу из этих элементов и/или стадий, а согласно другим вариантам осуществления состоять из этих элементов и/или стадий, независимо от того, упомянуты ли конкретные варианты осуществления. Кроме того, использование единственного числа включает в себя множественное число, а «или» означает «и/или», если не указано иное. Если в настоящем документе не указано иное, все технические и научные термины, используемые в настоящем документе, характеризуются тем же значением, которое обычно понимается специалистом в настоящей области техники. Используемый в настоящем документе термин «приблизительно» относится к отклонению приблизительно на +/- 10% от заданного значения. Следует понимать, что такое изменение всегда включается в любое данное значение, предоставленное в настоящем документе, независимо от того, упоминается ли оно конкретно или нет. Использование единственного числа при использовании в настоящем документе вместе с термином «содержащий» может означать «один», но это также согласуется со значением «один или более», «по меньшей мере один» и «один или более чем один».[0068] As used herein, the terms "comprising", "having", "including", "consisting of" and their grammatical variations are inclusive or open-ended and do not exclude additional, uncited elements and/or method steps. The term "consisting essentially of" when used herein in connection with a product, application, or method, means that additional elements and/or method steps may be present, but these additions do not significantly affect the method by which the set forth functions. method or application. The term "consisting of" when used herein in connection with a product, application or method excludes the presence of additional elements and/or method steps. A product, use, or method described herein as comprising certain elements and/or steps may also, in certain embodiments, consist essentially of those elements and/or steps, and in other embodiments, consist of these elements and/or steps, whether or not specific embodiments are mentioned. In addition, the use of the singular includes the plural, and "or" means "and/or" unless otherwise noted. Unless otherwise indicated herein, all technical and scientific terms used in this document have the same meaning as generally understood by a person skilled in the art. As used herein, the term "approximately" refers to a deviation of approximately +/- 10% from the set value. It should be understood that such a change is always included in any given meaning provided herein, whether specifically mentioned or not. The use of the singular when used herein with the term "comprising" can mean "one", but it is also consistent with the meaning of "one or more", "at least one", and "one or more than one".

[0069] Термин «растение», «часть растения», «растительная часть», «растительное вещество», «растительная биомасса», «растительный материал», растительный экстракт» или «листья растения», как они используются в настоящем документе, может включать в себя все растение, ткань, клетки или любую их фракцию, внутриклеточные компоненты растений, внеклеточные компоненты растений, жидкие или твердые экстракты растений или их комбинацию, которые способны обеспечивать транскрипционный, трансляционный и посттрансляционный аппарат для экспрессии одной или более нуклеиновых кислот, описанных в настоящем документе, и/или из которых можно экстрагировать и очищать экспрессируемый белок или VLP. Растения могут включать в себя, без ограничения, травянистые растения. Кроме того, растения могут включать в себя, без ограничения, сельскохозяйственные культуры, включая в себя, например, канолу, виды Brassica, кукурузу, виды Nicotiana, (табак), например, Nicotiana benthamiana, Nicotiana rustica, Nicotiana, tabacum, Nicotiana alata, Arabidopsis thaliana, люцерну, картофель, сладкий картофель (Ipomoea batatus), женьшень, горох, овес, рис, сою, пшеницу, ячмень, подсолнечник, хлопок, кукурузу, рожь (Secale cereale), сорго (Sorghum bicolor, Sorghum vulgare), сафлор (Carthamus tinctorius).[0069] The term "plant", "plant part", "plant part", "plant matter", "plant biomass", "plant material", plant extract" or "plant leaves", as used herein, may include an entire plant, tissue, cells, or any fraction thereof, intracellular plant components, extracellular plant components, liquid or solid plant extracts, or a combination thereof, that is capable of providing a transcriptional, translational, and post-translational apparatus for the expression of one or more of the nucleic acids described in herein, and/or from which the expressed protein or VLP can be extracted and purified. Plants may include, without limitation, herbaceous plants. In addition, plants may include, without limitation, crops including, for example, canola, Brassica spp., corn, Nicotiana spp., (tobacco), e.g., Nicotiana benthamiana, Nicotiana rustica, Nicotiana, tabacum, Nicotiana alata, Arabidopsis thaliana, alfalfa, potato, sweet potato (Ipomoea batatus), ginseng, pea, oats, rice, soybean, wheat, barley, sunflower, cotton, corn, rye (Secale cereale), sorghum (Sorghum bicolor, Sorghum vulgare), safflower (Carthamus tinctorius).

[0070] Используемый в настоящем документе термин «часть растения» относится к любой части растения, включая в себя, без ограничения, листья, стебель, корень, цветы, плоды, растительную клетку, полученную из листьев, стебля, корня, цветов, плодов, растительный экстракт, полученный из листьев, стебля, корня, цветов, плодов, или их комбинации. Используемый в настоящем документе термин «растительный экстракт» относится к продукту растительного происхождения, который получают после обработки растения, части растения, растительной клетки или их комбинации физически (например, замораживанием с последующей экстракцией в подходящем буфере), механически (например, путем измельчения или гомогенизации растения или части растения с последующей экстракцией в подходящем буфере), ферментативно (например, с использованием ферментов, разрушающих клеточную стенку), химически (например, с использованием одного или более хелаторов или буферов) или их комбинации. Растительный экстракт можно дополнительно обработать для удаления нежелательных растительных компонентов, например, остатков клеточной стенки. Растительный экстракт может быть получен для помощи в извлечении одного или более компонентов из растения, части растения или растительной клетки, например, белка (включая в себя белковые комплексы, белковые поверхностные структуры и/или VLP), нуклеиновой кислоты, липида, углевода или их комбинации из растения, части растения или растительной клетки. Если растительный экстракт содержит белки, он может называться белковым экстрактом. Белковый экстракт может представлять собой неочищенный растительный экстракт, частично очищенный растительный или белковый экстракт или очищенный продукт, который содержит один или более белков, белковых комплексов, белковых супраструктур и/или VLP из растительной ткани. При желании белковый экстракт или растительный экстракт можно частично очистить с использованием технологий, известных специалистам в настоящей области техники, например, экстракт можно подвергнуть осаждению солью или рН, центрифугированию, центрифугированию в градиенте плотности, фильтрации, хроматографии, например, эксклюзионной хроматографии, ионообменной хроматографии, аффинной хроматографии или их комбинации. Белковый экстракт также можно очистить с использованием технологий, известных специалисту в настоящей области техники.[0070] As used herein, the term "plant part" refers to any part of a plant, including, but not limited to, leaves, stem, root, flowers, fruits, plant cells derived from leaves, stem, root, flowers, fruits, a plant extract obtained from leaves, stem, root, flower, fruit, or a combination thereof. As used herein, the term "plant extract" refers to a plant product that is obtained after processing a plant, plant part, plant cell, or combination thereof, physically (for example, by freezing followed by extraction in a suitable buffer), mechanically (for example, by grinding or homogenizing plant or plant parts followed by extraction in a suitable buffer), enzymatically (eg using cell wall degrading enzymes), chemically (eg using one or more chelators or buffers), or combinations thereof. The plant extract can be further processed to remove unwanted plant components such as cell wall debris. A plant extract may be prepared to aid in the extraction of one or more components from a plant, plant part, or plant cell, such as a protein (including protein complexes, protein surface structures, and/or VLPs), a nucleic acid, a lipid, a carbohydrate, or a combination thereof. from a plant, plant part, or plant cell. If a plant extract contains proteins, it may be referred to as a protein extract. The protein extract may be a crude plant extract, a partially purified plant or protein extract, or a purified product that contains one or more proteins, protein complexes, protein suprastructures, and/or VLPs from plant tissue. If desired, the protein extract or plant extract may be partially purified using techniques known to those skilled in the art, e.g., the extract may be subjected to salt or pH precipitation, centrifugation, density gradient centrifugation, filtration, chromatography, e.g. size exclusion chromatography, ion exchange chromatography, affinity chromatography or a combination thereof. The protein extract can also be purified using techniques known to those skilled in the art.

[0071] Используемый в настоящем документе термин «конструкция», «вектор» или «вектор экспрессии» относится к рекомбинантной нуклеиновой кислоте для переноса последовательностей экзогенных нуклеиновых кислот в клетки-хозяева (например, клетки растений) и направления экспрессии последовательности экзогенной нуклеиновой кислоты в клетках-хозяевах. «Кассета экспрессии» относится к нуклеотидной последовательности, содержащей представляющую интерес нуклеиновую кислоту, находящуюся под контролем и функционально (или оперативно) связанную с подходящим промотором или другими регуляторными элементами для транскрипции представляющей интерес нуклеиновой кислоты в клетке-хозяине. Как будет понятно специалисту в настоящей области техники, кассета экспрессии может содержать последовательность терминации (терминатор), которая представляет собой любую последовательность, которая активна для растения-хозяина. Например, последовательность терминации может происходить из сегмента генома РНК-2 двудольного РНК вируса, например, комовируса, последовательность терминации может представлять собой терминатор NOS, или последовательность терминатора может быть получена из 3'UTR гена пластоцианина люцерны.[0071] As used herein, the term "construct", "vector", or "expression vector" refers to a recombinant nucleic acid for transferring exogenous nucleic acid sequences into host cells (e.g., plant cells) and directing expression of the exogenous nucleic acid sequence in cells -owners. "Expression cassette" refers to a nucleotide sequence containing a nucleic acid of interest that is under the control of and operably (or operably) linked to a suitable promoter or other regulatory elements for transcription of the nucleic acid of interest in a host cell. As will be appreciated by one of skill in the art, an expression cassette may contain a termination sequence (terminator), which is any sequence that is active in the host plant. For example, the termination sequence may be derived from the RNA-2 genome segment of a bipartite RNA virus, such as comovirus, the termination sequence may be the NOS terminator, or the terminator sequence may be derived from the 3'UTR of the alfalfa plastocyanin gene.

[0072] Конструкции по настоящему раскрытию могут дополнительно содержать 3'-нетранслируемую область (UTR). 3'-нетранслируемая область содержит сигнал полиаденилирования и любые другие регуляторные сигналы, способные влиять на процессинг мРНК или экспрессию гена. Сигнал полиаденилирования, как правило, характеризуется добавлением треков полиадениловой кислоты к 3'-концу предшественника мРНК. Сигналы полиаденилирования, как правило, распознаются по наличию гомологии с канонической формой 5' ААТААА-3', хотя вариации не являются редкостью. Неограничивающими примерами подходящих 3'-областей являются 3' транскрибируемые нетранслируемые области, содержащие сигнал полиаденилирования индуцирующих опухоль плазмидных генов (Ti) Agrobacterium, таких как нопалинсинтаза (ген Nos), и генов растений, таких как гены запасного белка сои, ген рибулозо-1,5-бисфосфаткарбоксилазы малой субъединицы (ssRUBISCO; US 4962028; который включен в настоящий документ посредством ссылки), промотора, используемого для регуляции экспрессии пластоцианина.[0072] The constructs of the present disclosure may further comprise a 3' untranslated region (UTR). The 3' untranslated region contains the polyadenylation signal and any other regulatory signals capable of influencing mRNA processing or gene expression. The polyadenylation signal is typically characterized by the addition of polyadenylic acid tracks to the 3' end of the mRNA precursor. Polyadenylation signals are generally recognized by the presence of homology to the canonical form 5'AATAAA-3', although variations are not uncommon. Non-limiting examples of suitable 3' regions are 3' transcribed untranslated regions containing the polyadenylation signal of Agrobacterium tumor-inducing plasmid (Ti) genes such as nopaline synthase (Nos gene) and plant genes such as soybean storage protein genes, ribulose-1 gene, Small subunit 5-bisphosphate carboxylase (ssRUBISCO; US 4962028; which is incorporated herein by reference), a promoter used to regulate the expression of plastocyanin.

[0073] Под «регуляторной областью», «регуляторным элементом» или «промотором» подразумевается часть нуклеиновой кислоты, как правило, но не всегда, перед кодирующей белок областью гена, которая может состоять из ДНК или РНК, или как ДНК, так и РНК. Когда регуляторная область активна и функционально связана или оперативно связана с представляющей интерес нуклеотидной последовательностью, это может привести к экспрессии представляющей интерес нуклеотидной последовательности. Регуляторный элемент может быть способен опосредовать специфичность органа или контролировать активацию генов в процессе развития или во времени. «Регуляторная область» включает в себя элементы промотора, основные элементы промотора, проявляющие базальную промоторную активность, элементы, которые индуцируются в ответ на внешний стимул, элементы, которые опосредуют активность промотора, такие как негативные регуляторные элементы или усилители транскрипции. Используемая в настоящем документе «регуляторная область» также включает в себя элементы, которые активны после транскрипции, например, регуляторные элементы, которые модулируют экспрессию генов, такие как энхансеры трансляции и транскрипции, репрессоры трансляции и транскрипции, активирующие последовательности выше против хода транскрипции и детерминанты нестабильности мРНК. Некоторые из этих последних элементов могут быть расположены вблизи кодирующей области.[0073] By "regulatory region", "regulatory element", or "promoter" is meant the portion of a nucleic acid, usually, but not always, before the protein-coding region of a gene, which may be composed of DNA or RNA, or both DNA and RNA . When the regulatory region is active and operably linked or operably linked to a nucleotide sequence of interest, this can result in the expression of the nucleotide sequence of interest. A regulatory element may be able to mediate organ specificity or control gene activation during development or over time. "Regulatory region" includes promoter elements, basic promoter elements that exhibit basal promoter activity, elements that are induced in response to an external stimulus, elements that mediate promoter activity such as negative regulatory elements or transcriptional enhancers. As used herein, "regulatory region" also includes elements that are active after transcription, such as regulatory elements that modulate gene expression, such as translational and transcriptional enhancers, translational and transcriptional repressors, activating sequences upstream of transcription, and instability determinants. mRNA. Some of these last elements may be located near the coding region.

[0074] В контексте настоящего раскрытия термин «регуляторный элемент» или «регуляторная область», как правило, относится к последовательности ДНК, как правило, но не всегда, выше против хода транскрипции (5') от кодирующей последовательности структурного гена, который контролирует экспрессию кодирующей области, обеспечивая распознавание для РНК-полимеразы и/или других факторов, необходимых для начала транскрипции в конкретном сайте. Однако следует понимать, что другие нуклеотидные последовательности, расположенные внутри интронов, или 3' последовательности также могут вносить вклад в регуляцию экспрессии представляющей интерес кодирующей области. Примером регуляторного элемента, который обеспечивает распознавание для РНК-полимеразы или других факторов транскрипции для обеспечения инициации в конкретном сайте, является элемент промотора. Большинство, но не все эукариотические промоторные элементы содержат ТАТА-бокс, консервативную последовательность нуклеиновой кислоты, состоящую из аденозиновых и тимидиновых пар нуклеотидных оснований, как правило, расположенных приблизительно на 25 пар оснований выше против хода транскрипции от сайта начала транскрипции. Промоторный элемент может содержать базальный промоторный элемент, ответственный за инициацию транскрипции, а также другие регуляторные элементы, которые изменяют экспрессию гена.[0074] In the context of the present disclosure, the term "regulatory element" or "regulatory region" generally refers to a DNA sequence, usually, but not always, upstream of transcription (5') from the coding sequence of a structural gene that controls expression coding region, providing recognition for RNA polymerase and/or other factors necessary to initiate transcription at a particular site. However, it should be understood that other nucleotide sequences located within the introns or 3' sequences may also contribute to the regulation of expression of the coding region of interest. An example of a regulatory element that provides recognition for RNA polymerase or other transcription factors to allow initiation at a particular site is a promoter element. Most, but not all, eukaryotic promoter elements contain a TATA box, a conserved nucleic acid sequence consisting of adenosine and thymidine base pairs, typically located about 25 base pairs upstream of the transcription start site. The promoter element may contain a basal promoter element responsible for initiating transcription, as well as other regulatory elements that alter gene expression.

[0075] Существует несколько типов регуляторных областей, включая в себя те, которые регулируются в процессе развития, индуцибельные или конститутивные. Регуляторная область, которая регулируется в процессе развития или контролирует дифференциальную экспрессию гена, находящегося под его контролем, активируется в определенных органах или тканях органа в определенные моменты времени во время развития этого органа или ткани. Однако некоторые регуляторные области, которые регулируются в процессе развития, могут предпочтительно быть активными в определенных органах или тканях на определенных стадиях развития, они также могут быть активными в рамках регулируемого в процессе развития способа или на базальном уровне в других органах или тканях растения. Примеры тканеспецифических регуляторных областей, например, специфических регуляторных областей, включают в себя промотор напина и промотор круциферина (Rask et al., 1998, J. Plant Physiol. 152: 595-599; Bilodeau et al., 1994, Plant Cell 14: 125-130). Пример специфического для листа промотора включает в себя промотор пластоцианина (смотрите патент США 7125978, который включен в настоящий документ посредством ссылки).[0075] There are several types of regulatory regions, including those that are developmentally regulated, inducible, or constitutive. A regulatory region that is developmentally regulated or controls the differential expression of a gene under its control is activated in certain organs or tissues of an organ at certain times during the development of that organ or tissue. However, some regulatory regions that are developmentally regulated may preferentially be active in certain organs or tissues at certain developmental stages, they may also be active in a developmentally regulated manner or at a basal level in other plant organs or tissues. Examples of tissue-specific regulatory regions, such as specific regulatory regions, include the napin promoter and the cruciferin promoter (Rask et al., 1998, J. Plant Physiol. 152: 595-599; Bilodeau et al., 1994, Plant Cell 14: 125 -130). An example of a leaf-specific promoter includes the plastocyanin promoter (see US Pat. No. 7,125,978, which is incorporated herein by reference).

[0076] Индуцибельная регуляторная область представляет собой область, которая способна прямо или косвенно активировать транскрипцию одной или более последовательностей ДНК или генов в ответ на индуктор. В отсутствие индуктора последовательности ДНК или гены не будут транскрибироваться. Как правило, белковый фактор, который специфически связывается с индуцибельной регуляторной областью для активации транскрипции, может присутствовать в неактивной форме, которая затем прямо или косвенно превращается в активную форму посредством индуктора. Однако белковый фактор также может отсутствовать. Индуктор может представлять собой химическое средство, такое как белок, метаболит, регулятор роста, гербицид или фенольное соединение, или физиологический стресс, вызываемый непосредственно теплом, холодом, солью или токсическими элементами, или опосредованно через действие патогена или агента заболевания, такого как вирус. Растительная клетка, содержащая индуцибельную регуляторную область, может подвергаться действию индуктора путем внешнего воздействия индуктора на клетку или растение, например, путем опрыскивания, полива, нагревания или аналогичных способов. Индуцибельные регуляторные элементы могут происходить как из растительных, так и не растительных генов (например, Gatz, С. and Lenk, I.R.P., 1998, Trends Plant Sci. 3, 352-358). Примеры потенциальных индуцибельных промоторов включают в себя, без ограничения, индуцируемый тетрациклином промотор (Gatz, С., 1997, Ann. Rev. Plant Physiol. Plant Mol. Biol. 48, 89-108), индуцируемый стероидом промотор (Aoyama, Т. and Chua, N.H., 1997, Plant J. 2, 397-404) и индуцируемый этанолом промотор (Salter, M.G., et al, 1998, Plant Journal 16, 127-132; Caddick, M.X., et al., 1998, Nature Biotech. 16, 177-180), индуцируемые цитокинином гены IB6 и CKI1 (Brandstatter, I. and Kieber, J.J., 1998, Plant Cell 10, 1009-1019; Kakimoto, Т., 1996, Science 274, 982-985) и индуцируемый ауксином элемент DR5 (Ulmasov, Т., et al., 1997, Plant Cell 9, 1963-1971).[0076] An inducible regulatory region is a region that is capable of directly or indirectly activating the transcription of one or more DNA sequences or genes in response to an inducer. In the absence of an inducer, DNA sequences or genes will not be transcribed. Typically, a protein factor that specifically binds to an inducible regulatory region to activate transcription may be present in an inactive form, which is then directly or indirectly converted to an active form by an inducer. However, the protein factor may also be absent. The inducer may be a chemical agent such as a protein, metabolite, growth regulator, herbicide, or phenolic compound, or physiological stress caused directly by heat, cold, salt, or toxic elements, or indirectly through the action of a pathogen or disease agent, such as a virus. A plant cell containing an inducible regulatory region can be exposed to the inducer by externally exposing the cell or plant to the inducer, for example, by spraying, watering, heating, or the like. Inducible regulatory elements can be derived from both plant and non-plant genes (eg, Gatz, C. and Lenk, I.R.P., 1998, Trends Plant Sci. 3, 352-358). Examples of potential inducible promoters include, without limitation, tetracycline inducible promoter (Gatz, C., 1997, Ann. Rev. Plant Physiol. Plant Mol. Biol. 48, 89-108), steroid inducible promoter (Aoyama, T. and Chua, N.H., 1997, Plant J. 2, 397-404) and an ethanol inducible promoter (Salter, M.G., et al, 1998, Plant Journal 16, 127-132; Caddick, M.X., et al., 1998, Nature Biotech. 16, 177-180), cytokinin-induced IB6 and CKI1 genes (Brandstatter, I. and Kieber, J.J., 1998, Plant Cell 10, 1009-1019; Kakimoto, T., 1996, Science 274, 982-985) and auxin-induced element DR5 (Ulmasov, T., et al., 1997, Plant Cell 9, 1963-1971).

[0077] Конститутивная регуляторная область направляет экспрессию гена в различных частях растения и непрерывно на протяжении всего развития растения. Примеры известных конститутивных регуляторных элементов включают в себя промоторы, связанные с транскриптом 35S CaMV (p35S; Odell et al., 1985, Nature, 313: 810-812; который включен в настоящий документ посредством ссылки), актин 1 риса (Zhang et al., 1991, Plant Cell, 3: 1155-1165), актин 2 (An et al., 1996, Plant J., 10: 107-121) или tms 2 (US 5428147), и гены триозофосфат-изомеразы 1 (Xu et. Al., 1994, Plant Physiol. 106: 459-467), ген убиквитина 1 кукурузы (Cornejo et al, 1993, Plant Mol. Biol. 29: 637-646), гены убиквитина 1 и 6 Arabidopsis (Holtorf et al., 1995, Plant Mol. Biol. 29: 637-646), ген фактора инициации трансляции табака 4А (Mandel et al., 1995 Plant Mol. Biol. 29: 995-1004), промотор вируса мозаики прожилок виноградного листа, pCAS (Verdaguer et al., 1996); промотор малой субъединицы рибулозобифосфаткарбоксилазы, pRbcS: (Outchkourov et al., 2003), pUbi (для однодольных и двудольных).[0077] The constitutive regulatory region directs gene expression in various parts of the plant and continuously throughout plant development. Examples of known constitutive regulatory elements include promoters associated with the CaMV 35S transcript (p35S; Odell et al., 1985, Nature, 313: 810-812; which is incorporated herein by reference), rice actin 1 (Zhang et al. , 1991, Plant Cell, 3: 1155-1165), actin 2 (An et al., 1996, Plant J., 10: 107-121) or tms 2 (US 5428147), and triose phosphate isomerase 1 genes (Xu et Al., 1994, Plant Physiol. 106: 459-467), maize ubiquitin 1 gene (Cornejo et al, 1993, Plant Mol. Biol. 29: 637-646), Arabidopsis ubiquitin 1 and 6 genes (Holtorf et al. , 1995, Plant Mol. Biol. 29: 637-646), tobacco translation initiation factor 4A gene (Mandel et al., 1995 Plant Mol. Biol. 29: 995-1004), grape leaf vein mosaic virus promoter, pCAS (Verdaguer et al., 1996); ribulose bisphosphate carboxylase small subunit promoter, pRbcS: (Outchkourov et al., 2003), pUbi (for monocots and dicots).

[0078] Используемый в настоящем документе термин «конститутивный» не обязательно означает, что нуклеотидная последовательность, находящаяся под контролем конститутивной регуляторной области, экспрессируется на одном уровне во всех типах клеток, но что последовательность экспрессируется в широком диапазоне типов клеток, хотя часто наблюдается колебание численности.[0078] As used herein, the term "constitutive" does not necessarily mean that the nucleotide sequence under the control of the constitutive regulatory region is expressed at the same level in all cell types, but that the sequence is expressed in a wide range of cell types, although fluctuation in abundance is often observed. .

[0079] Конструкции экспрессии, как описано выше, могут присутствовать в векторе. Вектор может содержать граничные последовательности, которые позволяют переносить и интегрировать кассету экспрессии в геном организма или хозяина. Конструкция может представлять собой растительный бинарный вектор, например, бинарный вектор трансформации на основе pPZP (Hajdukiewicz, et al., 1994). Другие иллюстративные конструкции включают в себя pBin19 (смотрите Frisch, D.A., L.W. Harris-Haller, et al., 1995, Plant Molecular Biology 27: 405-409).[0079] Expression constructs as described above may be present in the vector. The vector may contain border sequences that allow the transfer and integration of the expression cassette into the genome of the organism or host. The construct may be a plant binary vector, for example a pPZP-based binary transformation vector (Hajdukiewicz, et al., 1994). Other illustrative constructs include pBin19 (see Frisch, D.A., L.W. Harris-Haller, et al., 1995, Plant Molecular Biology 27: 405-409).

[0080] Используемый в настоящем документе термин «нативный», «нативный белок» или «нативный домен» относится к белку или домену, имеющему первичную аминокислотную последовательность, идентичную дикому типу. Нативные белки или домены могут кодироваться нуклеотидными последовательностями, характеризующимися 100% сходством последовательности с последовательностью дикого типа. Нативная аминокислотная последовательность также может кодироваться нуклеотидной последовательностью, оптимизированной для кодонов человека (hCod), или нуклеотидной последовательностью, содержащей повышенное содержание GC по сравнению с нуклеотидной последовательностью дикого типа при условии, что аминокислотная последовательность, кодируемая нуклеотидной последовательностью hCod, проявляет 100% идентичность последовательности по отношению к природной аминокислотной последовательности.[0080] As used herein, the term "native", "native protein" or "native domain" refers to a protein or domain having a primary amino acid sequence identical to the wild type. Native proteins or domains can be encoded by nucleotide sequences having 100% sequence similarity to the wild type sequence. The native amino acid sequence may also be encoded by a human codon-optimized (hCod) nucleotide sequence or a nucleotide sequence containing increased GC content compared to a wild-type nucleotide sequence, provided that the amino acid sequence encoded by the hCod nucleotide sequence exhibits 100% sequence identity to relative to the natural amino acid sequence.

[0081] Под нуклеотидной последовательностью, которая является «оптимизированной кодонами человека» или нуклеотидной последовательностью «hCod», подразумевается выбор подходящих нуклеотидов ДНК для синтеза олигонуклеотидной последовательности или ее фрагмента, который приближается к частоте использования кодонов, как правило, встречающемуся в олигонуклеотидной последовательности нуклеотидной последовательности человека. Под «повышенным содержанием GC» подразумевается выбор соответствующих нуклеотидов ДНК для синтеза олигонуклеотидной последовательности или ее фрагмента, чтобы приблизиться к частоте использования кодона, которое по сравнению с соответствующей природной олигонуклеотидной последовательностью характеризуется увеличением содержания GC в отношении, например, от приблизительно 1 до приблизительно 30% или любого числа между ними, длины кодирующей части олигонуклеотидной последовательности. Например, приблизительно от 1, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30% или любого числа между ними по длине участка кодирования олигонуклеотидной последовательности. Как описано ниже, нуклеотидная последовательность с оптимизированным кодоном человека или нуклеотидная последовательность, содержащая увеличенный контакт GC (по сравнению с нуклеотидной последовательностью дикого типа), демонстрирует повышенную экспрессию в растении, части растения или растительной клетке по сравнению с экспрессией отличной от человеческой оптимизированной (или с более низким содержанием GC) нуклеотидной последовательности.[0081] By a nucleotide sequence that is "human codon-optimized" or "hCod" nucleotide sequence, is meant the selection of suitable DNA nucleotides for the synthesis of an oligonucleotide sequence or fragment thereof that approximates the codon usage typically found in the oligonucleotide sequence of the nucleotide sequence person. By "increased GC content" is meant the selection of appropriate DNA nucleotides for synthesizing an oligonucleotide sequence or fragment thereof to approximate a codon usage frequency that, compared to a corresponding natural oligonucleotide sequence, is characterized by an increase in GC content in a ratio of, for example, from about 1 to about 30%. or any number in between, the length of the coding portion of the oligonucleotide sequence. For example, from about 1, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30%, or any number in between, along the length of the coding region of the oligonucleotide sequence. As described below, a nucleotide sequence with an optimized human codon or a nucleotide sequence containing an increased GC contact (compared to a wild-type nucleotide sequence) shows increased expression in a plant, plant part, or plant cell compared to non-human optimized (or with lower GC content) nucleotide sequence.

[0082] Модифицированные белки гемагглютинина (НА) гриппа (также называемые модифицированным белком НА, модифицированным белком НА гриппа, модифицированным НА, модифицированным НА гриппа, мутантным НА, мутантным НА гриппа, вариантами НА гриппа или вариантами НА) и способы получения модифицированных белков НА гриппа в растениях описаны в настоящем документе. Описанные в настоящем документе модифицированные белки НА гриппа содержат модификации или мутации, которые, как было обнаружено, приводят к улучшенным характеристикам НА по сравнению с НА дикого типа или немодифицированными белками НА. Например, модифицированный белок НА гриппа может содержать аминокислотную последовательность по меньшей мере с одной заменой аминокислоты по сравнению с соответствующей аминокислотной последовательностью дикого типа.[0082] Modified influenza hemagglutinin (HA) proteins (also referred to as modified HA protein, modified influenza HA protein, modified HA, modified influenza HA, HA mutant, influenza HA mutant, influenza HA variants, or HA variants) and methods for producing modified influenza HA proteins in plants are described in this document. The modified influenza HA proteins described herein contain modifications or mutations that have been found to result in improved HA performance over wild-type or unmodified HA proteins. For example, the modified influenza HA protein may contain an amino acid sequence with at least one amino acid substitution compared to the corresponding wild-type amino acid sequence.

[0083] Примеры улучшенных характеристик модифицированного белка НА включают в себя повышенный выход белка НА при экспрессии в растительных клетках по сравнению с НА дикого типа или немодифицированным НА того же штамма или подтипа гриппа, который не содержит модификацию(и) или мутацию(и); улучшенный титр гемагглютинации модифицированного белка НА по сравнению с белком НА дикого типа или немодифицированным белком НА; улучшенную целостность, стабильность или как целостность, так и стабильность вирусоподобных частиц (VLP), которые состоят из модифицированных белков НА, по сравнению с целостностью, стабильностью или и тем и другим VLP, содержащими НА дикого типа, которые не содержат модификацию(и) или мутацию(и); повышенный выход VLP при экспрессии в растительных клетках по сравнению с уровнем продукции VLP дикого типа, который не содержит модификацию(и) или мутацию(и); и их комбинация.[0083] Examples of improved performance of the modified HA protein include increased yield of the HA protein when expressed in plant cells compared to wild-type or unmodified HA of the same influenza strain or subtype that does not contain the modification(s) or mutation(s); improved haemagglutination titer of the modified HA protein compared to wild-type HA protein or unmodified HA protein; improved integrity, stability, or both integrity and stability of virus-like particles (VLPs) that are composed of modified HA proteins, compared to the integrity, stability, or both, of VLPs containing wild-type HA that do not contain the modification(s) or mutation(s); increased yield of VLP when expressed in plant cells compared to the level of production of wild-type VLP, which does not contain the modification(s) or mutation(s); and their combination.

Подтипы и штаммы гриппаSubtypes and strains of influenza

[0084] Используемый в настоящем документе термин «подтип вируса гриппа» относится к вариантам вируса гриппа А, которые характеризуются различными комбинациями вирусных поверхностных белков гемагглютинина (Н или НА) и нейрамидазы (N). В соответствии с настоящим описанием подтипы вируса гриппа и гемагглютинин (НА) из таких подтипов вируса могут упоминаться по их номеру Н, например, «НА подтипа Н3», «НА Н3» или «грипп Н3». Термин «подтип», в частности, включает в себя все индивидуальные «штаммы» внутри каждого подтипа, которые обычно возникают в результате мутаций и могут проявлять различные патогенные профили. Такие штаммы можно также называть различными «изолятами» вирусного подтипа. Соответственно, в контексте настоящего описания термины «штаммы» и «изоляты» могут использоваться взаимозаменяемо.[0084] As used herein, the term "influenza virus subtype" refers to variants of the influenza A virus that are characterized by different combinations of the viral surface proteins hemagglutinin (H or HA) and neuramidase (N). As used herein, influenza virus subtypes and haemagglutinin (HA) from such virus subtypes may be referred to by their H number, eg, "H3 subtype HA", "H3 HA" or "H3 influenza". The term "subtype", in particular, includes all individual "strains" within each subtype, which usually result from mutations and can show different pathogenic profiles. Such strains may also be referred to as various "isolates" of the viral subtype. Accordingly, in the context of the present description, the terms "strains" and "isolates" can be used interchangeably.

[0085] Традиционно различные штаммы гриппа классифицируются на основании, например, способности гриппа агглютинировать красные клетки крови (RBC или эритроциты). Антитела, специфические для определенных штаммов гриппа, могут связываться с вирусом и, таким образом, предотвращать такую агглютинацию. Анализы, определяющие типы штаммов на основе такого ингибирования, как правило, известны как анализы ингибирования гемагглютинина (анализы HI или анализы HAI), и они представляют собой стандартные и хорошо известные способы для характеристики штаммов гриппа.[0085] Traditionally, different strains of influenza are classified based on, for example, the ability of influenza to agglutinate red blood cells (RBCs or erythrocytes). Antibodies specific to certain influenza strains can bind to the virus and thus prevent such agglutination. Assays that define strain types based on such inhibition are generally known as hemagglutinin inhibition assays (HI assays or HAI assays) and are standard and well known methods for characterizing influenza strains.

[0086] Однако белки НА из разных штаммов вирусов также демонстрируют значительное сходство последовательностей как на уровне нуклеиновой кислоты, так и на уровне аминокислот. Этот уровень сходства варьируется при сравнении штаммов разных подтипов, причем некоторые штаммы явно демонстрируют более высокие уровни сходства, чем другие (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643). Уровни аминокислотного сходства варьируются между вирусными штаммами одного подтипа и вирусными штаммами других подтипов (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643). Этой вариации достаточно для установления дискретных подтипов и эволюционного происхождения различных штаммов, но ДНК и аминокислотные последовательности разных штаммов все еще легко выравниваются с использованием обычных способов биоинформатики (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643; Suzuki and Nei, Mol. Biol. Evol. 2002, 19:501).[0086] However, HA proteins from different virus strains also show significant sequence similarity at both the nucleic acid and amino acid levels. This level of similarity varies when strains of different subtypes are compared, with some strains clearly showing higher levels of similarity than others (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643). Levels of amino acid similarity vary between viral strains of one subtype and viral strains of other subtypes (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643). This variation is sufficient to establish discrete subtypes and evolutionary origins of different strains, but the DNA and amino acid sequences of different strains are still easily aligned using conventional bioinformatics techniques (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643; Suzuki and Nei, Mol. Biol. Evol. 2002, 19:501).

[0087] Множественные нуклеотидные последовательности или соответствующие полипептидные последовательности гемагглютинина (НА) могут быть выровнены для определения «консенсуса» или «консенсусной последовательности» подтипа (смотрите фиг. 1).[0087] Multiple nucleotide sequences or corresponding hemagglutinin (HA) polypeptide sequences can be aligned to determine a "consensus" or "consensus sequence" subtype (see FIG. 1).

[0088] Основываясь на сходстве последовательностей, подтипы вируса гриппа могут быть дополнительно классифицированы по их филогенетической группе. Филогенетический анализ (Fouchier et al., J Virol. 2005 Mar; 79(5):2814-22) продемонстрировал подразделение НА, которое представляет собой деление на две основные группы (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643): среди прочего, подтипы H1, H2, H5 и Н9 в филогенетической группе 1 и, среди прочего, подтипы Н3, Н4 и Н7 в филогенетической группе 2.[0088] Based on sequence similarity, influenza virus subtypes can be further classified by their phylogenetic group. Phylogenetic analysis (Fouchier et al., J Virol. 2005 Mar; 79(5):2814-22) has demonstrated a subdivision of HA, which is a division into two main groups (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643): among others, subtypes H1, H2, H5 and H9 in phylogenetic group 1 and, inter alia, subtypes H3, H4 and H7 in phylogenetic group 2.

[0089] Новые белки НА гриппа, модификации НА, варианты и мутанты белка НА создаются путем внесения изменений в аминокислотную последовательность белка НА, что приводит к улучшенным характеристикам НА, как описано выше. Выделение нуклеиновых кислот, кодирующих такие молекулы НА, является обычным делом, как и модификация нуклеиновой кислоты для внесения изменений в аминокислотную последовательность, например, посредством сайт-направленного мутагенеза.[0089] New influenza HA proteins, HA modifications, variants, and HA protein mutants are created by making changes to the amino acid sequence of the HA protein, resulting in improved HA characteristics, as described above. Isolation of nucleic acids encoding such HA molecules is commonplace, as is modification of the nucleic acid to introduce changes in the amino acid sequence, for example, by site-directed mutagenesis.

[0090] В настоящем документе описаны модифицированные белки НА гриппа и способы получения модифицированных белков НА гриппа в растениях. Было замечено, что модификация, например, путем замены определенных аминокислот в белках НА, например, НА из подтипа Н3, приводит к улучшенным характеристикам модифицированного белка НА по сравнению с белком НА дикого типа или немодифицированным белком НА.[0090] This document describes modified influenza HA proteins and methods for producing modified influenza HA proteins in plants. It has been observed that modification, for example by substitution of certain amino acids in HA proteins, eg HA from the H3 subtype, results in improved performance of the modified HA protein compared to wild-type HA protein or unmodified HA protein.

[0091] Одна или более модификаций, мутаций или замен белка НА, как описано в настоящем документе, не расположены в глобулярном головном домене белка НА, не расположены в известных эпитопных областях белка НА, и эти модификации, мутации или замены не добавляют или не удаляют сайты гликозилирования в белке НА.[0091] One or more modifications, mutations, or substitutions of the HA protein, as described herein, are not located in the globular head domain of the HA protein, are not located in known epitope regions of the HA protein, and these modifications, mutations, or substitutions do not add or remove glycosylation sites in the HA protein.

[0092] Белок НА, мутантный белок НА или модифицированный белок НА, как описано в настоящем документе, модифицирован и содержит одну или более мутаций, модификаций или замен в своей аминокислотной последовательности в любой одной или более аминокислотах, которые соответствуют одной или более чем одной мутации или модификации по любой одной или более аминокислотам, которые соответствуют положениям 382, 384, 392, 431, 524, 525, 526, 527 или 528 аминокислотной последовательности A/Hong Kong/4801/14 (SEQ ID NO: 92; смотрите фиг. 1).[0092] An HA protein, a mutant HA protein, or a modified HA protein, as described herein, is modified and contains one or more mutations, modifications, or substitutions in its amino acid sequence at any one or more amino acids that correspond to one or more than one mutation or modifications at any one or more amino acids that correspond to positions 382, 384, 392, 431, 524, 525, 526, 527 or 528 of the amino acid sequence A/Hong Kong/4801/14 (SEQ ID NO: 92; see Fig. 1 ).

[0093] Под «соответствовать аминокислоте» или «соответствующей аминокислоте» подразумевается, что аминокислота соответствует аминокислоте в выравнивании последовательности с эталонным штаммом гриппа, как описано ниже.[0093] By "corresponding to an amino acid" or "corresponding to an amino acid" is meant that an amino acid corresponds to an amino acid in a sequence alignment with a reference influenza strain, as described below.

[0094] Номер аминокислотного остатка или положение остатка НА соответствует нумерации НА эталонного штамма гриппа. Например, в случае гриппа Н3 эталонным штаммом может быть A/Hong Kong/4801/14 [SEQ ID NO: 92 смотрите фиг. 1]. Соответствующие аминокислотные положения могут быть определены путем выравнивания последовательностей НА (например, Н3 НА) с последовательностью НА их соответствующего эталонного штамма. Способы выравнивания последовательностей для сравнения хорошо известны в настоящей области техники. Оптимальное выравнивание последовательностей для сравнения можно проводить, например, с помощью алгоритма локальной гомологии Smith & Waterman, Adv. Appl. Math. 2:482 (1981), с помощью алгоритма выравнивания гомологии Needleman & Wunsch a, J. Mol. Biol. 48:443 (1970), способом поиска сходства Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988), с помощью компьютеризированных реализаций этих алгоритмов (GAP, BESTFIT, FASTA и TFASTA в пакете программного обеспечения Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI) или путем ручного выравнивания и визуальной проверки (смотрите, например, Current Protocols in Molecular Biology (Ausubel et al., eds. 1995, приложение)). Выравнивание аминокислотных последовательностей нескольких доменов НА вируса гриппа А, которые не следует рассматривать как ограничивающие, показано на фиг.1.[0094] The amino acid residue number or residue position of the HA corresponds to the HA numbering of the influenza reference strain. For example, in the case of H3 influenza, the reference strain could be A/Hong Kong/4801/14 [SEQ ID NO: 92 see FIG. 1]. The corresponding amino acid positions can be determined by aligning the HA sequences (eg H3 HA) with the HA sequence of their respective reference strain. Methods for aligning sequences for comparison are well known in the art. Optimal alignment of sequences for comparison can be performed, for example, using the local homology algorithm of Smith & Waterman, Adv. Appl. Math. 2:482 (1981), using the homology alignment algorithm of Needleman & Wunsch a, J. Mol. Biol. 48:443 (1970), Pearson & Lipman, Proc. Nat'l. Acad. sci. USA 85:2444 (1988), using computerized implementations of these algorithms (GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI) or by manual alignment and visual checks (see, for example, Current Protocols in Molecular Biology (Ausubel et al., eds. 1995, appendix)). Alignment of the amino acid sequences of several influenza A virus HA domains, which should not be considered limiting, is shown in FIG.

[0095] При упоминании модификаций, мутантов или вариантов за аминокислотным остатком дикого типа (также называемым просто «аминокислотой») следует номер остатка и новая или замещенная аминокислота. Например, замена аспарагина (N, Asn) на аланин (A, Ala) в остатке или аминокислоте в положении 382 обозначается как N382A (смотрите таблицу 1). 382 (N382A).[0095] When referring to modifications, mutants, or variants, the wild-type amino acid residue (also referred to simply as "amino acid") is followed by the residue number and the new or substituted amino acid. For example, a substitution of asparagine (N, Asn) for alanine (A, Ala) at residue or amino acid position 382 is designated N382A (see Table 1). 382(N382A).

[0096] Модифицированные НА, мутанты или варианты НА, например, модифицированные Н3 НА, обозначаются таким же образом с использованием однобуквенного аминокислотного кода для остатка дикого типа, за которым следует его положение и однобуквенный аминокислотный код остатка замены. Множественные мутанты обозначены компонентными одиночными мутантами, разделенными косой чертой (/) или плюсом (+). Мутации или модификации транс мембранного (ТМ) домена или области обозначены как (CysTM). Так, например, мутант Н3 НА N382A + L384V (CysTM) представляет собой мутант, в котором аланин (A, Ala) замещает аспарагин (N, Asp) в положении остатка 382, а валин (V, Val) замещает лейцин (L, Leu) в положении остатка 384, а мутант Н3 НА содержит дополнительные мутации в трансмембранном домене.[0096] Modified HAs, HA mutants, or variants, such as H3 modified HAs, are designated in the same way using the one letter amino acid code for the wild-type residue followed by its position and the one letter amino acid code for the substitution residue. Multiple mutants are indicated by component single mutants separated by a slash (/) or a plus sign (+). Mutations or modifications of the trans membrane (TM) domain or region are designated as (CysTM). For example, the H3 HA mutant N382A + L384V (CysTM) is a mutant in which alanine (A, Ala) replaces asparagine (N, Asp) at residue position 382, and valine (V, Val) replaces leucine (L, Leu ) at residue position 384, and the H3 HA mutant contains additional mutations in the transmembrane domain.

[0098] Модифицированный белок гемагглютинин (НА) гриппа может содержать аминокислотную последовательность, содержащую по меньшей мере одну аминокислотную замену по сравнению с соответствующей аминокислотной последовательностью дикого типа.[0098] The modified influenza hemagglutinin (HA) protein may comprise an amino acid sequence containing at least one amino acid substitution compared to the corresponding wild-type amino acid sequence.

[0099] Под «аминокислотной заменой» или «заменой» подразумевается замена аминокислоты в аминокислотной последовательности белка другой аминокислотой. Термины «аминокислота», «аминокислотный остаток» или «остаток» используются в настоящем раскрытии как взаимозаменяемые. Одна или более аминокислот могут быть замещены одной или более аминокислотами, которые отличаются от исходной аминокислоты или аминокислоты дикого типа в этом положении, без изменения общей длины аминокислотной последовательности белка. Замена или замещение могут быть экспериментально индуцированы изменением последовательности кодона в нуклеотидной последовательности, кодирующей белок, на последовательность кодона другой аминокислоты по сравнению с исходной аминокислотой или аминокислотой дикого типа. Полученный белок представляет собой модифицированный белок, например, модифицированный белок НА гриппа. Модифицированный белок НА гриппа не встречается в природе.[0099] By "amino acid substitution" or "substitution" is meant the replacement of an amino acid in the amino acid sequence of a protein with another amino acid. The terms "amino acid", "amino acid residue" or "residue" are used interchangeably in this disclosure. One or more amino acids can be replaced with one or more amino acids that differ from the original or wild-type amino acid at that position without changing the overall length of the amino acid sequence of the protein. The substitution or substitution can be experimentally induced by changing the codon sequence in the nucleotide sequence encoding the protein to the codon sequence of a different amino acid compared to the original or wild-type amino acid. The resulting protein is a modified protein, such as a modified influenza HA protein. The modified influenza HA protein does not occur naturally.

[00100] Модифицированный НА включает в себя не встречающийся в природе белок НА, содержащий по меньшей мере одну модификацию природного НА и обладающий улучшенными характеристиками по сравнению с природным белком НА, от которого происходит аминокислотная последовательность модифицированного НА. Модифицированные белки НА содержат аминокислотную последовательность, не встречающуюся в природе, которая образована замещением одного или более аминокислотных остатков белка НА одной или более различными аминокислотами.[00100] The modified HA includes a non-naturally occurring HA protein containing at least one modification of natural HA and having improved characteristics compared to the natural HA protein from which the amino acid sequence of the modified HA is derived. Modified HA proteins contain an amino acid sequence that is not naturally occurring, which is formed by replacing one or more amino acid residues of the HA protein with one or more different amino acids.

[00101] Соответственно, модифицированный НА, мутантный НА или рекомбинантный НА относится к НА, в котором последовательность ДНК, кодирующая природный НА, модифицирована для получения модифицированной или мутантной последовательности ДНК, которая кодирует модификацию, мутацию или замену одной или более аминокислот в аминокислотной последовательности НА.[00101] Accordingly, modified HA, mutant HA, or recombinant HA refers to HA in which the DNA sequence encoding natural HA is modified to produce a modified or mutated DNA sequence that encodes a modification, mutation, or substitution of one or more amino acids in the amino acid sequence of HA .

[00102] Некоторые из остатков, идентифицированных для модификации, мутации или замены, соответствуют консервативным остаткам, тогда как другие нет. В случае остатков, которые являются неконсервативными, замещение одной или более аминокислот ограничивается заменами, которые производят модифицированный НА, аминокислотная последовательность которого не соответствует обнаруженной в природе. В случае консервативных остатков такая модификация, замена или замещения также не должны приводить к природным последовательностям НА.[00102] Some of the residues identified for modification, mutation, or substitution correspond to conservative residues, while others do not. In the case of residues that are non-conservative, substitution of one or more amino acids is limited to substitutions that produce a modified HA whose amino acid sequence does not match that found in nature. In the case of conservative residues, such modification, substitution or substitutions should also not result in natural HA sequences.

Консервативные заменыConservative substitutions

[00103] Как описано в настоящем документе, остатки в белках НА могут быть идентифицированы и модифицированы, заменены или мутированы для получения модифицированного белка НА или вариантов белка НА. Замены или мутации в конкретных положениях не ограничиваются аминокислотными заменами, описанными в настоящем документе или приведенными в примерах. Например, варианты НА могут содержать консервативные замены описанных аминокислотных замен.[00103] As described herein, residues in HA proteins can be identified and modified, replaced, or mutated to produce a modified HA protein or variants of the HA protein. Substitutions or mutations at specific positions are not limited to the amino acid substitutions described herein or exemplified. For example, HA variants may contain conservative substitutions of the described amino acid substitutions.

[00104] Используемый в настоящем документе термин «консервативная замена» и его грамматические вариации относятся к присутствию аминокислотного остатка в последовательности белка НА, который отличается, но принадлежит к тому же классу аминокислоты в качестве описанной замены или описанного остатка (т.е. неполярный остаток, заменяющий неполярный остаток, ароматический остаток, заменяющий ароматический остаток, полярно-незаряженный остаток, заменяющий полярно-незаряженный остаток, заряженный остаток, заменяющий заряженный остаток). Кроме того, консервативные замены могут охватывать остаток, имеющий значение межфазной гидропатии того же знака и, как правило, такой же величины, что и остаток, заменяющий остаток дикого типа.[00104] As used herein, the term "conservative substitution" and its grammatical variations refer to the presence of an amino acid residue in a HA protein sequence that is different from but belongs to the same amino acid class as the described substitution or the described residue (i.e., a non-polar residue , replacing a non-polar residue, an aromatic residue replacing an aromatic residue, a polar-uncharged residue replacing a polar-uncharged residue, a charged residue replacing a charged residue). In addition, conservative substitutions may include a residue having an interfacial hydropathy value of the same sign and, as a rule, the same magnitude as the residue replacing the wild-type residue.

[00105] Используемый в настоящем документе термин «неполярный остаток» относится к глицину (G, Gly), аланину (A, Ala), валину (V, Val), лейцину (L, Leu), изолейцину (I, Ile) и пролину (Р, Pro); термин «ароматический остаток» относится к фенилаланину (F, Phe), тирозину (Y, Tyr) и триптофану (W, Trp); термин «полярный незаряженный остаток» относится к серину (S, Ser), треонину (Т, Thr), цистеину (С, Cys), метионину (М, Met), аспарагину (N, Asn) и глутамину (Q, Gln); термин «заряженный остаток» относится к отрицательно заряженным аминокислотам аспарагиновой кислоте (D, Asp) и глутаминовой кислоте (Е, Glu), а также к положительно заряженным аминокислотам лизину (K, Lys), аргинину (R, Arg) и гистидину (Н, His). Другая классификация аминокислот может быть следующей:[00105] As used herein, the term "non-polar residue" refers to glycine (G, Gly), alanine (A, Ala), valine (V, Val), leucine (L, Leu), isoleucine (I, Ile), and proline (P, Pro); the term "aromatic residue" refers to phenylalanine (F, Phe), tyrosine (Y, Tyr) and tryptophan (W, Trp); the term "polar uncharged residue" refers to serine (S, Ser), threonine (T, Thr), cysteine (C, Cys), methionine (M, Met), asparagine (N, Asn) and glutamine (Q, Gln); the term "charged residue" refers to the negatively charged amino acids aspartic acid (D, Asp) and glutamic acid (E, Glu), as well as the positively charged amino acids lysine (K, Lys), arginine (R, Arg), and histidine (H, his). Another classification of amino acids may be as follows:

• аминокислоты с гидрофобной боковой цепью (алифатические): аланин (А, Ala), изолейцин (I, Не), лейцин (L, Leu), метионин (М, Met) и валин (V, Val);• amino acids with a hydrophobic side chain (aliphatic): alanine (A, Ala), isoleucine (I, He), leucine (L, Leu), methionine (M, Met) and valine (V, Val);

• аминокислоты с гидрофобной боковой цепью (ароматические): фенилаланин (F, Phe), триптофан (W, Тгр), тирозин (Y, Туг);• amino acids with a hydrophobic side chain (aromatic): phenylalanine (F, Phe), tryptophan (W, Tgr), tyrosine (Y, Tyr);

• аминокислоты с полярно-нейтральной боковой цепью: аспарагин (N, Asn), цистеин (С, Cys), глутамин (Q, Gin), серин (S, Ser) и треонин (Т, Thr);• amino acids with a polar neutral side chain: asparagine (N, Asn), cysteine (C, Cys), glutamine (Q, Gin), serine (S, Ser) and threonine (T, Thr);

• аминокислоты с электрически заряженными боковыми цепями (кислотные): аспарагиновая кислота (D, Asp), глутаминовая кислота (Е, Glu);• amino acids with electrically charged side chains (acid): aspartic acid (D, Asp), glutamic acid (E, Glu);

• аминокислоты с электрически заряженными боковыми цепями (основные): аргинин (R, Arg); гистидин (Н, His); лизин (K, Lys), глицин (G, Gly) и пролин (Р, Pro).• amino acids with electrically charged side chains (basic): arginine (R, Arg); histidine (H, His); lysine (K, Lys), glycine (G, Gly) and proline (P, Pro).

[00106] Консервативные аминокислотные замены, вероятно, будут иметь такой же эффект на активность полученного варианта белка НА или модифицированного белка НА, как и исходная замена или модификация. Дополнительную информацию о консервативных заменах можно найти, например, в Ben Bassat et al. (J. Bacteriol, 169:751-757, 1987), O'Regan et al. (Gene, 77:237-251, 1989), Sahin-Toth et al. (Protein ScL, 3:240-247, 1994), Hochuli et al. (Bio/Technology, 6:1321-1325, 1988) и в широко используемых учебниках генетики и молекулярной биологии.[00106] Conservative amino acid substitutions are likely to have the same effect on the activity of the resulting HA protein variant or modified HA protein as the original substitution or modification. Further information on conservative substitutions can be found, for example, in Ben Bassat et al. (J. Bacteriol, 169:751-757, 1987), O'Regan et al. (Gene, 77:237-251, 1989), Sahin-Toth et al. (Protein ScL, 3:240-247, 1994), Hochuli et al. (Bio/Technology, 6:1321-1325, 1988) and widely used textbooks in genetics and molecular biology.

[00107] Матрицы Blosum, как правило, используются для определения родства полипептидных последовательностей. Матрицы Blosum были созданы с использованием большой базы данных надежных выравниваний (база данных BLOCKS), в которой подсчитывались попарные выравнивания последовательностей, связанные с идентичностью менее некоторого порогового процента (Henikoff et al., Proc. Natl. Acad. Sci. USA, 89: 10915-10919, 1992). Для высококонсервативных целевых частот матрицы BLOSUM90 использовали порог идентичности 90%. Для матрицы BLOSUM65 использовали порог идентичности 65%. Баллы от нуля и выше в матрицах Blosum считаются «консервативными заменами» при выбранной процентной идентичности. В следующей таблице показаны примеры консервативных аминокислотных замен: таблица 2.[00107] Blosum arrays are typically used to determine the relationship of polypeptide sequences. Blosum matrices were generated using a large database of robust alignments (BLOCKS database) that counted pairwise sequence alignments associated with identity less than some threshold percentage (Henikoff et al., Proc. Natl. Acad. Sci. USA, 89: 10915 -10919, 1992). For the highly conservative target frequencies of the BLOSUM90 matrix, an identity threshold of 90% was used. For the BLOSUM65 matrix, an identity threshold of 65% was used. Scores of zero and above in the Blosum matrices are considered "conservative substitutions" for the chosen percentage identity. The following table shows examples of conservative amino acid substitutions: Table 2.

[00108] Нуклеотидная последовательность, кодирующая модифицированный белок НА, может быть оптимизирована для частоты использования кодонов человека, для увеличения содержания GC или их комбинации. Модифицированный белок НА может быть экспрессирован в растении, части растения или растительной клетке.[00108] The nucleotide sequence encoding the modified HA protein can be optimized for human codon usage, to increase GC content, or a combination thereof. The modified HA protein may be expressed in a plant, plant part, or plant cell.

А. МОДИФИКАЦИИ Н3 НА IA. MODIFICATIONS H3 ON I

[00109] Модифицированные белки НА гриппа Н3 и способы получения модифицированных белков НА гриппа Н3 в растениях описаны в настоящем документе. Было замечено, что модификация специфических аминокислот в белках НА из подтипа Н3 приводит к улучшенным характеристикам модифицированного белка Н3 НА по сравнению с белком Н3 НА дикого типа или немодифицированным белком Н3 НА.[00109] Modified influenza H3 HA proteins and methods for producing modified influenza H3 HA proteins in plants are described herein. It has been observed that modification of specific amino acids in HA proteins from the H3 subtype results in improved performance of the modified HA H3 protein compared to wild-type H3 HA protein or unmodified HA H3 protein.

[00110] Всего было исследовано 33 одинарных, двойных и/или тройных модификаций остатков, которые не представляют собой часть транс мембранного (ТМ) и цитозольного домена НА (ТМ), и/или модификаций остатков, которые представляют собой часть транс мембранного (ТМ) и цитозольного домена (СТ) НА, в отношении улучшения характеристик белка Н3 НА. Как описано ниже и как показано в примерах, только модификации или комбинации модификаций в определенных положениях улучшают характеристики белка Н3 НА. Модификации в 13 положениях или комбинациях положений отрицательно влияли на характеристики белка Н3 НА (данные не показаны).[00110] A total of 33 single, double and/or triple residue modifications that are not part of the transmembrane (TM) and cytosolic HA domain (TM) and/or residue modifications that are part of the transmembrane (TM) domain were investigated. and the cytosolic domain (CT) of HA, in relation to improving the characteristics of the H3 protein of HA. As described below and as shown in the examples, only modifications or combinations of modifications at certain positions improve the performance of the H3 HA protein. Modifications at 13 positions or combinations of positions adversely affected the characteristics of the H3 HA protein (data not shown).

[00111] Примеры улучшенных характеристик мутантного белка Н3 НА или модифицированного белка Н3 НА включают в себя повышенный выход или накопление белка НА при экспрессии в растительных клетках по сравнению с НА дикого типа или немодифицированным НА того же штамма или подтипа гриппа, который не содержит модификацию(и) или мутацию(и); улучшенный титр гемагглютинации модифицированного или мутированного белка НА по сравнению с белком НА дикого типа или немодифицированным НА; улучшенную целостность, стабильность или как целостность, так и стабильность VLP, которые состоят из модифицированных белков НА, по сравнению с целостностью, стабильностью или и тем и другим VLP, содержащими НА дикого типа, которые не содержат мутацию(и); повышенный выход VLP при экспрессии в растительных клетках по сравнению с уровнем продукции VLP дикого типа, которая не содержит модификацию(и) или мутацию(и); и их комбинацию.[00111] Examples of improved performance of a HA mutant H3 protein or modified HA H3 protein include increased yield or accumulation of HA protein when expressed in plant cells compared to wild-type or unmodified HA of the same influenza strain or subtype that does not contain the modification( i) or mutation(s); improved hemagglutination titer of the modified or mutated HA protein compared to wild-type or unmodified HA protein; improved integrity, stability, or both the integrity and stability of VLPs that are composed of modified HA proteins, compared to the integrity, stability, or both, of wild-type HA-containing VLPs that do not contain the mutation(s); increased yield of VLP when expressed in plant cells compared to the level of production of wild-type VLP, which does not contain the modification(s) or mutation(s); and their combination.

[00112] Модифицированный белок Н3 НА или мутантный белок Н3 НА, как описано в настоящем документе, модифицирован и содержит одну или более мутаций или модификаций в любом одном или более остатках при выравнивании последовательностей с положениям 382, 384, 392 и/или 431 эталонного штамма A/Hong Kong/4801/14 (SEQ ID NO: 92; смотрите фиг. 1). Поэтому предусмотрены полипептиды, белки и/или белковые комплексы НА гриппа НЗ, такие как, например, вирусоподобные частицы (VLP), которые содержат модификации или мутации в одном или более положениях аминокислот 382, 384, 392 и 431, причем такая нумерация аминокислот основана на последовательности A/Hong Kong/4801/14, как показано на фиг. 1 (SEQ ID NO: 92), или на положениях аминокислот, которые соответствуют таким положениям аминокислот, например, как определено выравниванием аминокислотной последовательности НА с SEQ ID NO: 92. Неограничивающие примеры аминокислотных последовательностей НА гриппа Н3, которые содержат одну или более таких мутаций, включают в себя SEQ ID NO: 91, 92, 93, 94, 95, 96 и 97.[00112] A modified H3 HA protein or a mutant H3 HA protein as described herein is modified and contains one or more mutations or modifications at any one or more residues when aligned to positions 382, 384, 392 and/or 431 of the reference strain A/Hong Kong/4801/14 (SEQ ID NO: 92; see Fig. 1). Therefore, influenza H3 HA polypeptides, proteins and/or protein complexes, such as, for example, virus-like particles (VLPs), are provided that contain modifications or mutations at one or more amino acid positions 382, 384, 392, and 431, such amino acid numbering being based on sequence A/Hong Kong/4801/14 as shown in FIG. 1 (SEQ ID NO: 92), or at amino acid positions that correspond to such amino acid positions, for example, as determined by aligning the HA amino acid sequence with SEQ ID NO: 92. Non-limiting examples of influenza H3 HA amino acid sequences that contain one or more of these mutations , include SEQ ID NOs: 91, 92, 93, 94, 95, 96, and 97.

[00113] Модифицированный белок Н3 НА, описанный в настоящем документе, включает в себя белок Н3 НА с аминокислотными последовательностями, которые характеризуются идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности, кодирующей НА из Н3 (SEQ ID NO: 91-97), причем аминокислотная последовательность содержит одну или более мутаций или модификаций в любом одном или более остатках при выравнивании последовательностей с положениями 382, 384, 392 и 431 A/Hong Kong/4801/14 НА (SEQ ID NO: 92).[00113] The modified H3 HA protein described herein includes an H3 HA protein with amino acid sequences that are characterized by sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100%, or any number in between, relative to the amino acid sequence encoding HA from H3 (SEQ ID NOs: 91-97), wherein the amino acid sequence contains one or more mutations or modifications at any one or more residues in the alignment of sequences at positions 382, 384, 392 and 431 of A/Hong Kong/4801/14 HA (SEQ ID NO: 92).

[00114] Кроме того, белок Н3 НА может кодироваться нуклеотидными последовательностями, которые характеризуются идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 (SEQ ID NO: 91-97), причем белок Н3 НА содержит одну или более чем одну мутацию или модификацию в любом одном или более остатках при выравнивании последовательностей с положениями 382, 384, 392 и 431 A/Hong Kong/4801/14 НА (SEQ ID NO: 92), причем нуклеотидная последовательность кодирует белок гемагглютинин, который при экспрессии образует VLP.[00114] In addition, the H3 HA protein can be encoded by nucleotide sequences that are characterized by sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, with respect to the nucleotide sequence encoding HA from H3 (SEQ ID NOs: 91-97), wherein the H3 protein of HA contains one or more mutations or modifications at any one or more residues when aligning the sequences at positions 382, 384, 392 and 431 of A/Hong Kong/4801/14 HA (SEQ ID NO: 92), the nucleotide sequence encodes a hemagglutinin protein which, when expressed, forms a VLP.

[00115] Неограничивающими примерами штаммов, из которых может происходить Н3 НА, являются A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96) и A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97).[00115] Non-limiting examples of strains from which H3 HA may originate are A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96) and A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97).

Модификация в позиции 382Modification in position 382

[00116] Согласно одному аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 382 (нумерация в соответствии с нумерацией A/Hong Kong/4801/14 НА, SEQ ID NO: 92).[00116] In one aspect, an H3 HA is provided that may contain a modified residue at position 382 (numbered as A/Hong Kong/4801/14 HA, SEQ ID NO: 92).

[00117] Antanasijevic et al. (J Biol Chem. 2014; 289(32):22237-45) исследовали структурно-функциональные свойства области петли-на-стебле Н5 НА посредством сайт-направленного мутагенеза в 14 различных положениях. Мутировавшие положения Thr41, Gln42, Ile45, Asn53 и Leu99 НА2 являются высококонсервативными и были разработаны для анализа важности этих остатков для функции НА. Antanasijevic наблюдал, что консервативные мутации в положениях HA1-I28V, НА2-Т41А, НА2-Т49А, HA2-N53A и HA2-D57E нарушают проникновение вируса. В случае мутационного эффекта на ингибирование входа малой молекулой МВХ2329 наибольшее влияние оказали замены на HA2-Ile45, HA2-Val52, HA2-Asn53 и HA2-Ser54 на внешней поверхности и HA2-Leu99 на внутренней поверхности. Эти остатки высококонсервативны в НА группы 1 (например, H1 и Н5). Положение 53 в НА Н5 Antanasijevic соответствует положению 380 в H1 НА и положению 382 в Н3 НА текущего раскрытия.[00117] Antanasijevic et al. (J Biol Chem. 2014; 289(32):22237-45) investigated the structural-functional properties of the H5 loop-on-stem region of HA by site-directed mutagenesis at 14 different positions. The mutated positions Thr 41 , Gln 42 , Ile 45 , Asn 53 and Leu 99 of HA2 are highly conserved and were designed to analyze the importance of these residues for HA function. Antanasijevic observed that conserved mutations at positions HA1-I28V, HA2-T41A, HA2-T49A, HA2-N53A and HA2-D57E impair viral entry. In the case of a mutational effect on entry inhibition by the small MBX2329 molecule, substitutions for HA2-Ile 45 , HA2-Val 52 , HA2-Asn 53 , and HA2-Ser 54 on the outer surface and HA2-Leu 99 on the inner surface had the greatest effect. These residues are highly conserved in group 1 HA (eg H1 and H5). Position 53 in Antanasijevic's H5 HA corresponds to position 380 in the H1 HA and position 382 in the H3 HA of the current disclosure.

[00118] Неожиданно было обнаружено, что модификация консервативного остатка в положении 380 в H1 НА из аспарагина в аланин приводит к приблизительно 80%-ному снижению титра гемагглютинации модифицированного H1 НА по сравнению с H1 НА дикого типа (данные не показаны). Эквивалентная модификация НА из Н5 также приводит к снижению титра гемагглютинации (смотрите фиг. 3, таблица 7). Однако изменение эквивалентного положения в НА из Н3 (N382A) из аспарагина в аланин приводит к приблизительно 130%-ному увеличению титра гемагглютинации по сравнению с НА дикого типа (смотрите фиг. 2, таблицу 5).[00118] Surprisingly, modification of the conserved residue at position 380 in H1 HA from asparagine to alanine resulted in an approximately 80% reduction in the hemagglutination titer of the modified HA H1 compared to wild-type H1 HA (data not shown). An equivalent modification of HA from H5 also leads to a decrease in hemagglutination titer (see Fig. 3, table 7). However, changing the equivalent position in HA from H3 (N382A) from asparagine to alanine resulted in an approximately 130% increase in hemagglutination titer compared to wild-type HA (see Figure 2, Table 5).

[00119] Соответственно, остаток в положении 382 Н3 НА может быть модифицирован так, чтобы он не представлял собой аспарагин. Например, остаток в положении 382 может быть модифицирован, чтобы представлять собой гидрофобную аминокислоту, например, аланин или консервативную замену аланина, например, серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val).[00119] Accordingly, the residue at position 382 of the H3 of HA can be modified so that it is not asparagine. For example, the residue at position 382 can be modified to be a hydrophobic amino acid, e.g., alanine, or a conservative alanine substitution, e.g., serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C , Cys) or valine (V, Val).

[00120] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382 и причем последовательность не встречается в природе. Консервативная замена аланина может, например, представлять собой серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val).[00120] For example, the modified H3 HA protein may comprise an amino acid sequence that has sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, relative to the amino acid sequence HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains alanine (A, Ala) or a conservative alanine substitution ( A, Ala) at position 382 and the sequence is not found in nature. A conservative alanine substitution may, for example, be serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val).

[00121] В настоящем описании также представлена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 382, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00121] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with a substitution at positions 382 as described above, operably linked to a regulatory region active in a plant.

[00122] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, и причем последовательность не встречается в природе. Консервативная замена может, например, представлять собой серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val).[00122] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding the HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains alanine (A, Ala) or a conservative substitution alanine (A, Ala) at position 382, and the sequence is not found in nature. A conservative substitution may, for example, be serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val).

[00123] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, и причем последовательность не встречается в природе. Консервативная замена может, например, представлять собой серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val).[00123] Nucleotide sequences can be characterized by sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains an alanine (A, Ala) or a conservative substitution of alanine (A, Ala) at position 382, and the sequence does not occur at nature. A conservative substitution may, for example, be serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val).

[00124] Помимо остатка в положении 382, в Н3 НА могут быть модифицированы остатки в положениях 384, 524, 525, 526, 527, 528 или любая их комбинация.[00124] In addition to the residue at position 382, residues at positions 384, 524, 525, 526, 527, 528, or any combination thereof, may be modified in H3 HA.

[00125] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положении 382 и, необязательно, в положении 384, 524, 525, 526, 527, 528 или любой их комбинации, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые обеспечивают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00125] In addition, a method is provided for obtaining VLPs that contain a modified H3 HA substitution at least at position 382 and optionally at position 384, 524, 525, 526, 527, 528, or any combination thereof, in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00126] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положении 382 и, необязательно, заменами в положениях 384, 524, 525, 526, 527, 528 или любой их комбинации, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые обеспечивают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00126] In addition, a method is provided to increase the yield of VLPs that contain a modified H3 HA with a substitution at least at position 382, and optionally substitutions at positions 384, 524, 525, 526, 527, 528, or any combination thereof, in a plant . The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00127] Настоящее описание дополнительно предусматривает VLP, содержащую Н3 НА с заменой по меньшей мере в положении 382 и, необязательно, заменами в положениях 384, 524, 525, 526, 527, 528 или любую их комбинацию. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00127] The present description further provides for a VLP containing H3 HA with a substitution at least at position 382 and optionally substitutions at positions 384, 524, 525, 526, 527, 528, or any combination thereof. VLP can be obtained by the method provided by the present description. VLPs containing modified H3 HA show improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 384Modification in position 384

[00128] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 384 (нумерация A/Hong Kong/4801/14 НА, SEQ ID NO: 92).[00128] According to another aspect, an H3 HA is provided that may contain a modified residue at position 384 (numbering A/Hong Kong/4801/14 HA, SEQ ID NO: 92).

[00129] Как показано, например, на фиг. 2 и в таблице 5, наличие остатка в положении 384, модифицированного из лейцина в валин, приводит к приблизительно 200%-ному увеличению титра гемагглютинации по сравнению с Н3 НА дикого типа.[00129] As shown, for example, in FIG. 2 and Table 5, the presence of a residue at position 384 modified from leucine to valine results in an approximately 200% increase in hemagglutination titer compared to wild-type H3 HA.

[00130] Соответственно, остаток в положении 384 Н3 НА может быть модифицирован так, чтобы он представлял собой не лейцин. Например, остаток в положении 384 может быть модифицирован, чтобы представлять собой, например, валин или консервативную замену валина, которая не представляет собой лейцин, например, изолейцин, метионин, аланин или треонин.[00130] Accordingly, the residue at position 384 of the H3 of HA can be modified to be non-leucine. For example, the residue at position 384 can be modified to be, for example, a valine or a conservative valine substitution that is not a leucine, such as isoleucine, methionine, alanine, or threonine.

[00131] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит валин (V, Val) или консервативную замену валина, которая не представляет собой лейцин, в положении 384, причем последовательность не встречается в природе и причем белок НА при экспрессии образует VLP. Консервативная замена валина может представлять собой, например, изолейцин, метионин, аланин или треонин.[00131] For example, a modified H3 HA protein may contain an amino acid sequence that is characterized by sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, relative to the amino acid sequence HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains valine (V, Val) or a conservative valine substitution, which is not a leucine at position 384, the sequence is not naturally occurring, and the HA protein, when expressed, forms a VLP. A conservative replacement for valine may be, for example, isoleucine, methionine, alanine or threonine.

[00132] В настоящем описании также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 384, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00132] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with a substitution at positions 384 as described above, operably linked to a regulatory region active in a plant.

[00133] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок НА Н3, который содержит валин (V, Val) или консервативную замену валина (V, Val), которая не представляет собой лейцин, в положении 384, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует белок НА, который при экспрессии образует VLP. Консервативная замена валина может представлять собой, например, изолейцин, метионин, аланин или треонин.[00133] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding the HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains valine (V, Val) or a conservative substitution valine (V, Val), which is not a leucine, at position 384, the sequence is not naturally occurring, and the nucleotide sequence encodes an HA protein which, when expressed, forms a VLP. A conservative replacement for valine may be, for example, isoleucine, methionine, alanine or threonine.

[00134] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит валин (V, Val) или консервативную замену валина (V, Val), которая не представляет собой лейцин, в положении 384, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует белок НА, который при экспрессии образует VLP. Консервативная замена валина может представлять собой, например, изолейцин, метионин, аланин или треонин.[00134] Nucleotide sequences can be characterized by sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains valine (V, Val) or a conservative valine (V, Val) substitution that is not leucine at position 384 , wherein the sequence is not naturally occurring, and wherein the nucleotide sequence encodes an HA protein which, when expressed, forms a VLP. A conservative replacement for valine may be, for example, isoleucine, methionine, alanine or threonine.

[00135] Помимо остатка в положении 384, в Н3 НА могут быть модифицированы остатки в положениях 382, 524, 525, 526, 527, 528 или любая их комбинация.[00135] In addition to the residue at position 384, residues at positions 382, 524, 525, 526, 527, 528, or any combination thereof, may be modified in H3 HA.

[00136] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 384 и, необязательно, заменами в положениях 382, 524, 525, 526, 527, 528 или любой их комбинации, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00136] In addition, a method is provided for obtaining VLPs that contain a modified H3 HA with a substitution at least at positions 384, and optionally substitutions at positions 382, 524, 525, 526, 527, 528, or any combination thereof, in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00137] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере по 384 и необязательно с заменами в положениях 382, 524, 525, 526, 527, 528 или любой их комбинации, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00137] In addition, a method is provided for increasing the yield of VLPs that contain a modified H3 HA with a substitution at least at 384, and optionally with substitutions at positions 382, 524, 525, 526, 527, 528, or any combination thereof, as described above, in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00138] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положении 384 и, необязательно, заменами в положениях 382, 524, 525, 526, 527, 528 или любой их комбинации. VLP может быть получена способом, предусмотренным в настоящем описании. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00138] Provided herein is a VLP comprising an H3 HA with a substitution at least at position 384 and optionally substitutions at positions 382, 524, 525, 526, 527, 528, or any combination thereof. VLP can be obtained by the method provided in the present description. VLPs containing modified H3 HA show improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 392Modification in position 392

[00139] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 392 (нумерация Н3 A/Hong Kong/4801/14 НА, SEQ ID NO: 92).[00139] According to another aspect, an H3 HA is provided which may contain a modified residue at position 392 (numbering H3 A/Hong Kong/4801/14 HA, SEQ ID NO: 92).

[00140] Как показано, например, на фиг. 2 и в таблице 5, наличие остатка в положении 392, модифицированного из фенилаланина в аспарагиновую кислоту, приводит к приблизительно 140%-ному увеличению титра гемагглютинации по сравнению с Н3 НА дикого типа.[00140] As shown, for example, in FIG. 2 and Table 5, the presence of a residue at position 392 modified from phenylalanine to aspartic acid results in an approximately 140% increase in hemagglutination titer compared to wild-type H3 HA.

[00141] Соответственно, остаток в положении 392 в Н3 НА может быть модифицирован так, чтобы он не представлял собой фенилаланин. Например, остаток в положении 392 может быть модифицирован, например, чтобы представлять собой аспарагиновую кислоту или консервативную замену аспарагиновой кислоты, например, глутаминовую кислоту, аспарагин, глутамин или серин.[00141] Accordingly, the residue at position 392 in H3 of HA can be modified so that it is not phenylalanine. For example, the residue at position 392 may be modified, for example, to be aspartic acid or a conservative substitution for aspartic acid, such as glutamic acid, asparagine, glutamine, or serine.

[00142] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты, например, глутаминовую кислоту, аспарагин, глутамин или серин в положении 392, причем последовательность не встречается в природе и причем белок НА при экспрессии образует VLP. Консервативная замена аспарагиновой кислоты может, например, представлять собой глутаминовую кислоту, аспарагин, глутамин или серин.[00142] For example, a modified H3 HA protein may contain an amino acid sequence that is characterized by sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, with respect to the amino acid sequence HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains aspartic acid or a conservative substitution for aspartic acid, e.g., glutamic acid, asparagine, glutamine or serine at position 392, the sequence is not naturally occurring and the HA protein, when expressed, forms a VLP. A conservative substitution for aspartic acid may, for example, be glutamic acid, asparagine, glutamine or serine.

[00143] В настоящем документе также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 392, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00143] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with a substitution at positions 392 as described above, operably linked to a regulatory region active in a plant.

[00144] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты в положении 392, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует белок НА, который при экспрессии образует VLP. Консервативная замена аспарагиновой кислоты может, например, представлять собой глутаминовую кислоту, аспарагин, глутамин или серин.[00144] For example, nucleotide sequences may have sequence identity or sequence similarity of about 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding the HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains aspartic acid or a conservative substitution of aspartic acid at position 392, wherein the sequence is not naturally occurring, and wherein the nucleotide sequence encodes an HA protein which, when expressed, forms a VLP. A conservative substitution for aspartic acid may, for example, be glutamic acid, asparagine, glutamine or serine.

[00145] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты в положении 392, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует белок НА, который при экспрессии образует VLP. Консервативная замена аспарагиновой кислоты может, например, представлять собой глутаминовую кислоту, аспарагин, глутамин или серин.[00145] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any the number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains aspartic acid or a conservative substitution of aspartic acid at position 392, wherein the sequence is not naturally occurring, and wherein the nucleotide sequence encodes an HA protein , which, when expressed, forms a VLP. A conservative substitution for aspartic acid may, for example, be glutamic acid, asparagine, glutamine or serine.

[00146] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 392, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00146] In addition, a method is provided for obtaining VLPs that contain a modified H3 HA with a substitution at least at 392 positions as described above in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00147] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере по 392, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00147] In addition, a method is provided to increase the yield of VLPs that contain a modified H3 HA with a substitution of at least 392 as described above in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00148] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положении 392. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00148] Provided herein is a VLP comprising an H3 HA with a substitution at least at position 392. A VLP can be produced by the method provided herein. VLPs containing modified H3 HA show improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 431Modification in position 431

[00149] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 431 (нумерация Н3 A/Hong Kong/4801/14 НА, SEQ ID NO: 92).[00149] According to another aspect, an H3 HA is provided which may contain a modified residue at position 431 (numbering H3 A/Hong Kong/4801/14 HA, SEQ ID NO: 92).

[00150] Как показано, например, на фиг. 2 и в таблице 5, наличие остатка в положении 431, модифицированного из лейцина в метионин, приводит к приблизительно 170%-ному увеличению титра гемагглютинации по сравнению с Н3 НА дикого типа.[00150] As shown, for example, in FIG. 2 and Table 5, the presence of a residue at position 431 modified from leucine to methionine results in an approximately 170% increase in hemagglutination titer compared to wild-type H3 HA.

[00151] Соответственно, остаток в положении 431 в Н3 НА может быть модифицирован так, чтобы он представлял собой не лейцин. Например, остаток в положении 431 может быть модифицирован, например, чтобы представлять собой метионин или консервативную замену метионина, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00151] Accordingly, the residue at position 431 in H3 of HA can be modified to be non-leucine. For example, the residue at position 431 may be modified, for example, to be methionine or a conservative replacement for methionine, such as leucine, isoleucine, glutamine, valine, or phenylalanine.

[00152] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит метионин или консервативную замену метионина в положении 431, причем последовательность не встречается в природе и причем белок НА при экспрессии образует VLP. Консервативная замена метионина может представлять собой, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00152] For example, a modified H3 HA protein may contain an amino acid sequence that is characterized by sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, with respect to the amino acid sequence HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains methionine or a conservative methionine substitution at position 431, wherein the sequence does not occur in nature and moreover, the HA protein, when expressed, forms a VLP. A conservative methionine substitution may be, for example, leucine, isoleucine, glutamine, valine or phenylalanine.

[00153] В настоящем описании также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положении 431, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00153] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with a substitution at position 431 as described above, operably linked to a regulatory region active in a plant.

[00154] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит метионин или консервативную замену метионина в положении 431, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует белок НА, который при экспрессии образует VLP. Консервативная замена метионина может представлять собой, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00154] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any the number between them, with respect to the nucleotide sequence encoding the HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains methionine or a conservative substitution of methionine at position 431, moreover, the sequence does not occur in nature and moreover, the nucleotide sequence encodes a HA protein, which, when expressed, forms a VLP. A conservative methionine substitution may be, for example, leucine, isoleucine, glutamine, valine or phenylalanine.

[00155] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит метионин или консервативную замену метионина в положении 431, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует НА белок, который при экспрессии образует VLP. Консервативная замена аспарагиновой кислоты может, например, представлять собой лейцин, изолейцин, глутамин, валин или фенилаланин.[00155] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any the number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains methionine or a conservative methionine substitution at position 431, the sequence is not naturally occurring, and the nucleotide sequence encodes a HA protein that forms a VLP when expressed. A conservative replacement for aspartic acid may, for example, be leucine, isoleucine, glutamine, valine or phenylalanine.

[00156] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положении 431, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00156] In addition, a method is provided for obtaining VLPs that contain a modified H3 HA with a substitution at least at position 431, as described above, in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00157] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере по 431, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00157] In addition, a method is provided to increase the yield of VLPs that contain a modified H3 HA with a substitution of at least 431 as described above in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00158] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положении 431. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00158] Provided herein is a VLP comprising an H3 HA with a substitution at least at position 431. A VLP can be produced by the method provided herein. VLPs containing modified H3 HA show improved performance compared to VLPs that contain unmodified H3 HA protein.

В. МОДИФИКАЦИИ Н3 НА IIB. MODIFICATIONS H3 ON II

Модификация в положении 382, 384, 392, 431 и/или 524-528 («CysTM»)Modification at position 382, 384, 392, 431 and/or 524-528 ("CysTM")

[00159] Модифицированные белки НА гриппа Н3 и способы получения модифицированных белков НА гриппа Н3 в растениях описаны в настоящем документе. Было замечено, что модификация конкретных аминокислот в белках НА из подтипа Н3 приводит к улучшенным характеристикам модифицированного белка Н3 НА по сравнению с белком Н3 НА дикого типа или немодифицированным белком Н3 НА.[00159] Modified influenza H3 HA proteins and methods for producing modified influenza H3 HA proteins in plants are described herein. It has been observed that modification of specific amino acids in HA proteins from the H3 subtype results in improved performance of the modified HA H3 protein compared to wild-type H3 HA protein or unmodified HA H3 protein.

[00160] Согласно одному аспекту остатки цистеина в положении 524 и/или 528 (нумерация Н3 A/Hong Kong/4801/14, SEQ ID NO: 92) или остатки, эквивалентные этим положениям, как определено посредством выравнивания, могут быть заменены на остатки не цистеина в этих положениях. Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hong Kong/4801/14 НА) также могут быть модифицированы. Эти модификации или замены могут называться «модификация CysTM», «CysTM», «мутация CysTM», «замена CysTM» или «замещение CysTM» или грамматически эквивалентные выражения.[00160] In one aspect, cysteine residues at position 524 and/or 528 (numbering H3 A/Hong Kong/4801/14, SEQ ID NO: 92) or residues equivalent to these positions, as determined by alignment, can be replaced by residues no cysteine in these positions. In addition, the residues at position 525, 526 and/or 527 (numbering H3 A/Hong Kong/4801/14 HA) can also be modified. These modifications or substitutions may be referred to as "CysTM modification", "CysTM", "CysTM mutation", "CysTM replacement", or "CysTM substitution" or grammatically equivalent expressions.

[00161] В заявке США №13/838796 и сопутствующей публикации Holtz et al. (ВМС Biotechnology. 2014; 14: 111) сообщают о повышенной стабильности и сохранении активности рекомбинантного НА за счет мутации остатков цистеина в карбоксиконцевой области белка НА, включая в себя трансмембранный (ТМ) и цитозольный домен (СТ). В частности, Holtz et al. демонстрируют мутации С539А, С546А, С549А, C524S и С528А в рекомбинантном НА Perth/16/2009 (H3N2). Мутация всех пяти остатков цистеина или различных их подмножеств привела к выходам, чистоте, размеру частиц, активности гемагглютинации и термостабильности НА, сравнимым с рекомбинантным белком НА дикого типа. Напротив, мутации пары консервативных остатков цистеина в эктодомене, о которых известно, что они образуют дисульфидную связь (C64S и C76S), приводили к значительному снижению экспрессии НА, что указывает на критическую роль этих остатков в собственном укладывании НА. Используя анализ простой одномерной радиальной иммунодиффузии (SRID), Holtz et al. также показывают, что пять мутаций остатков цистеина улучшают эффективность рекомбинантного НА по сравнению с белком дикого типа, предотвращая перекрестное сшивание дисульфидов в доменах ТМ и СТ. Мутантные белки НА сохраняют активность в течение по меньшей мере 12 месяцев при температуре 25°С, тогда как белок НА дикого типа проявляет активность менее чем 40% только через 50 дней после очистки.[00161] U.S. Application No. 13/838796 and related publication Holtz et al. (BMC Biotechnology. 2014; 14: 111) report increased stability and activity of recombinant HA due to mutation of cysteine residues in the carboxy-terminal region of the HA protein, including the transmembrane (TM) and cytosolic domain (CT). In particular, Holtz et al. show mutations C539A, C546A, C549A, C524S and C528A in recombinant HA Perth/16/2009 (H3N2). Mutation of all five cysteine residues, or various subsets thereof, resulted in yields, purity, particle size, hemagglutination activity, and thermal stability of HA comparable to wild-type recombinant HA protein. In contrast, mutations of a pair of conserved cysteine residues in the ectodomain known to form a disulfide bond (C64S and C76S) resulted in a significant decrease in HA expression, indicating a critical role for these residues in HA self-folding. Using a simple one-dimensional radial immunodiffusion (SRID) assay, Holtz et al. also show that five cysteine residue mutations improve the performance of recombinant HA compared to wild-type protein by preventing disulfide cross-linking in the TM and CT domains. Mutant HA proteins remain active for at least 12 months at 25° C., while wild-type HA protein exhibits less than 40% activity only 50 days after purification.

[00162] Xu et al. (Virus Genes (2013) 47: 20-26) показали, что мутантные Н3 НА с мутациями одного или двух цистеинов ТМ (С540/544) могут правильно экспрессироваться в клетках, однако мутант проявляет более низкую термостойкость и повышенную активность слияния по сравнению с белками Н3 НА дикого типа.[00162] Xu et al. (Virus Genes (2013) 47: 20-26) showed that mutant H3 HA with mutations of one or two TM cysteines (C540/544) can be correctly expressed in cells, however, the mutant exhibits lower heat resistance and increased fusion activity compared to proteins H3 HA wild type.

[00163] Всего 33 одиночных, двойных или тройных модификаций в сочетании с модификациями трансмембраны (ТМ), как описано в настоящем документе («модификация Cys ТМ»), исследовали для улучшения характеристик белка Н3 НА. Как описано ниже и как показано в примерах, только модификации или комбинации модификаций в определенных положениях улучшают характеристики белка Н3 НА. Модификации в 13 положениях или комбинациях положений отрицательно влияли на характеристики белка Н3 НА (данные не показаны).[00163] A total of 33 single, double or triple modifications in combination with transmembrane (TM) modifications as described herein ("TM Cys modification") were investigated to improve the performance of the H3 HA protein. As described below and as shown in the examples, only modifications or combinations of modifications at certain positions improve the performance of the H3 HA protein. Modifications at 13 positions or combinations of positions adversely affected the characteristics of the H3 HA protein (data not shown).

[00164] Примеры улучшенных характеристик мутантного белка Н3 НА включают в себя повышенный выход белка НА при экспрессии в растительных клетках по сравнению с НА дикого типа или немодифицированным НА того же штамма или подтипа гриппа, который не содержит модификацию(и) или мутацию(и); улучшенный титр гемагглютинации модифицированного или мутированного белка НА по сравнению с белком НА дикого типа или немодифицированным белком НА; улучшенную целостность, стабильность или как целостность, так и стабильность VLP, которые состоят из модифицированных белков НА, по сравнению с целостностью, стабильностью или и тем и другим VLP, содержащими НА дикого типа, которые не содержат мутацию(й); повышенный выход VLP при экспрессии в растительных клетках по сравнению с уровнем продукции VLP дикого типа, которая не содержит модификацию(и) или мутацию(и); и их комбинацию.[00164] Examples of improved characteristics of the H3 HA mutant protein include increased yield of the HA protein when expressed in plant cells compared to wild-type or unmodified HA of the same influenza strain or subtype that does not contain the modification(s) or mutation(s) ; improved hemagglutination titer of the modified or mutated HA protein compared to wild-type HA protein or unmodified HA protein; improved integrity, stability, or both the integrity and stability of VLPs that are composed of modified HA proteins, compared to the integrity, stability, or both, of wild-type HA-containing VLPs that do not contain the mutation(s); increased yield of VLP when expressed in plant cells compared to the level of production of wild-type VLP, which does not contain the modification(s) or mutation(s); and their combination.

[00165] Согласно одному аспекту предусмотрен модифицированный Н3 НА, содержащий остатки цистеина в положении 524 и/или 528 (нумерация A/Hong Kong/4801/14) или остатки, эквивалентные этим положениям, как определено выравниванием, замененные на остатки не цистеина в этих положениях. Например, остатки цистеина в положении 524 могут быть заменены на серин (S, Ser) или консервативную замену серина или цистеин в положении 528 может быть заменен на лейцин (L, Leu) или консервативную замену лейцина.[00165] In one aspect, a modified H3 HA is provided containing cysteine residues at position 524 and/or 528 (numbering A/Hong Kong/4801/14) or residues equivalent to these positions, as determined by alignment, replaced with non-cysteine residues at these provisions. For example, cysteine residues at position 524 may be replaced with a serine (S, Ser) or a conservative serine substitution, or a cysteine at position 528 may be replaced with a leucine (L, Leu) or a conservative leucine substitution.

[00166] Кроме того, последовательность между двумя цистеинами в положениях 524 и 528 (нумерация A/Hong Kong/4801/14, SEQ ID NO: 92) также может быть модифицирована. Например, в последовательности «С524Х525Х526Х527С528» С524 (положение 524) может быть заменен серином (S, Ser) или консервативной заменой серина; если Х525 (положение 525) не представляет собой лейцин, остаток Х525 может быть замещен лейцином (L, Leu) или консервативной заменой лейцина; если Х526 (положение 526) не представляет собой валин, Х526 может быть замещен валином (V, Val) или консервативной заменой валина; если Х527 (положение 527) не представляет собой лейцин, остаток в положении Х527 может быть замещен лейцином (L, Leu) или консервативной заменой лейцина и С528 (положение 528) может быть заменен лейцином (L, Leu) или консервативной заменой лейцина. Например, согласно одному варианту осуществления последовательность «CFLLC» в положениях с 524 по 528 может быть заменена последовательностью «SLVLL» (SEQ ID NO: 98).[00166] In addition, the sequence between the two cysteines at positions 524 and 528 (numbered A/Hong Kong/4801/14, SEQ ID NO: 92) can also be modified. For example, in the sequence "C 524 X 525 X 526 X 527 C 528 " C524 (position 524) may be replaced by serine (S, Ser) or a conservative serine substitution; if X 525 (position 525) is not leucine, the X 525 residue may be substituted with leucine (L, Leu) or a conservative leucine substitution; if X 526 (position 526) is not valine, X 526 may be substituted by valine (V, Val) or a conservative valine substitution; if X 527 (position 527) is not leucine, the residue at position X 527 may be substituted with leucine (L, Leu) or a conservative leucine substitution and C 528 (position 528) may be substituted with leucine (L, Leu) or a conservative leucine substitution . For example, in one embodiment, the sequence "CFLLC" at positions 524 to 528 may be replaced by the sequence "SLVLL" (SEQ ID NO: 98).

[00167] Белки НА из других штаммов, отличных от Н3 вируса гриппа, которые содержат остатки цистеина в положении 524 и/или 528 или остатки, эквивалентные этим положениям, как определено выравниванием, также могут быть модифицированы, как описано ниже. Например, белки НА из штаммов вируса гриппа В, которые содержат остатки цистеина в положениях, которые эквивалентны положению 524 и/или 528 Н3 НА, могут быть модифицированы до остатков не цистеина, как описано ниже.[00167] HA proteins from strains other than H3 influenza virus that contain cysteine residues at position 524 and/or 528 or residues equivalent to these positions, as determined by alignment, can also be modified as described below. For example, HA proteins from strains of influenza B virus that contain cysteine residues at positions that are equivalent to position 524 and/or 528 H3 of HA can be modified to non-cysteine residues as described below.

[00168] В дополнение к мутации трансмембранного домена, как описано в настоящем документе, модифицированные белки Н3 НА могут дополнительно содержать одну или более замен аминокислот в положениях 382, 384, 392 и/или 431, что приводило к улучшенной характеристике модифицированного белка НА3 или VLP, полученных с использованием модифицированного белка НА. Следует понимать, что улучшенная характеристика не ограничивается заменой конкретной аминокислоты в определенных сайтах, поскольку специалист в настоящей области техники поймет, что аминокислоты с аналогичными свойствами могут быть заменены на аминокислоты в идентифицированных положениях.[00168] In addition to transmembrane domain mutation as described herein, the modified HA H3 proteins may additionally contain one or more amino acid substitutions at positions 382, 384, 392, and/or 431, resulting in improved characterization of the modified HA3 or VLP protein. obtained using the modified HA protein. It should be understood that improved characterization is not limited to substitution of a particular amino acid at certain sites, as one skilled in the art will appreciate that amino acids with similar properties can be substituted for amino acids at the identified positions.

[00169] Соответственно, модифицированный белок Н3 НА или мутантный белок Н3 НА, как описано в настоящем документе, может содержать одну или более мутаций или модификаций в любом одном или более остатках при выравнивании последовательностей с положениями 382, 384, 392, 431, 524, 525, 526, 527 или 528 эталонного штамма Н3 A/Hong Kong/4801/14 (SEQ ID NO: 92; смотрите фиг. 1). Поэтому предусмотрены полипептиды НА гриппа Н3, белки и/или белковые комплексы, такие как, например, вирусоподобные частицы (VLP), которые содержат модификации или мутации в одном или более положениях аминокислот 382, 384, 392, 431, 524, 525, 526, 527 или 528, причем такая нумерация аминокислот основана на последовательности Н3 A/Hong Kong/4801/14, как показано на фиг. 1 (SEQ ID NO: 92), или в положениях аминокислот, которые соответствуют таким положениям аминокислот, например, как определено выравниванием аминокислотной последовательности НА с SEQ ID NO: 92. Неограничивающие примеры аминокислотных последовательностей НА вируса гриппа НЗ, которые содержат одну или более таких мутаций, включают в себя SEQ ID NO: 91, 92, 93, 94, 95, 96 и 97.[00169] Accordingly, a modified H3 HA protein or a mutant H3 HA protein as described herein may contain one or more mutations or modifications at any one or more residues when aligned with sequences at positions 382, 384, 392, 431, 524, 525, 526, 527 or 528 of reference strain H3 A/Hong Kong/4801/14 (SEQ ID NO: 92; see FIG. 1). Therefore, influenza H3 HA polypeptides, proteins and/or protein complexes, such as, for example, virus-like particles (VLPs), are provided that contain modifications or mutations at one or more amino acid positions 382, 384, 392, 431, 524, 525, 526, 527 or 528, with such amino acid numbering based on the H3 sequence of A/Hong Kong/4801/14 as shown in FIG. 1 (SEQ ID NO: 92), or at amino acid positions that correspond to such amino acid positions, for example, as determined by aligning the HA amino acid sequence with SEQ ID NO: 92. Non-limiting examples of H3 influenza virus HA amino acid sequences that contain one or more of these mutations include SEQ ID NOS: 91, 92, 93, 94, 95, 96 and 97.

[00170] Описанный в настоящем документе модифицированный белок Н3 НА включает в себя белок Н3 НА с аминокислотными последовательностями, которые характеризуются идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности, кодирующей НА из Н3 (SEQ ID NO: 91-97), причем аминокислотная последовательность содержит одну или более чем одну мутацию или модификацию в любом одном или более остатках в выравнивании последовательностей с положениями 382, 384, 392, 431, 524, 525, 526, 527 или 528 A/Hong Kong/4801/14 НА (SEQ ID NO: 92).[00170] The modified HA H3 protein described herein includes the HA H3 protein with amino acid sequences that are characterized by sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100%, or any number in between, with respect to the amino acid sequence encoding HA from H3 (SEQ ID NOs: 91-97), wherein the amino acid sequence contains one or more mutations or modifications at any one or more residues in a sequence alignment at positions 382, 384, 392, 431, 524, 525, 526, 527, or 528 A/Hong Kong/4801/14 HA (SEQ ID NO: 92).

[00171] Кроме того, белок Н3 НА может кодироваться нуклеотидными последовательностями, которые характеризуются идентичностью последовательностей или сходством последовательностей, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 (SEQ ID NO: 91-97 последовательностей штаммов Н3), причем белок Н3 НА содержит одну или более мутаций или модификаций в любом одном или более остатках в выравнивании последовательностей с положениями 382, 384, 392, 431, 524, 525, 526, 527 или 528 Н3 A/Hong Kong/4801/14 HA (SEQ ID NO: 92) и причем нуклеотидная последовательность кодирует белок гемагглютинин, который при экспрессии образует VLP.[00171] In addition, the H3 HA protein can be encoded by nucleotide sequences that are characterized by sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, with respect to the nucleotide sequence encoding HA from H3 (SEQ ID NO: 91-97 sequences of H3 strains), wherein the H3 protein of the HA contains one or more mutations or modifications in any one or more residues in the alignment of sequences at positions 382, 384, 392, 431, 524, 525, 526, 527, or 528 H3 A/Hong Kong/4801/14 HA (SEQ ID NO: 92) and wherein the nucleotide sequence encodes a hemagglutinin protein that, when expression forms a VLP.

[00172] Неограничивающими примерами штаммов, из которых может происходить Н3 НА, являются A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96) и A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97).[00172] Non-limiting examples of strains from which H3 HA may originate are A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96) and A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97).

Модификация в положении 524-528 (CysTM) и 382Modification at position 524-528 (CysTM) and 382

[00173] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 382 и может быть модифицирована так, чтобы содержать остаток цистеина в положениях 524 и/или 528 (нумерация Н3 A/Hongkong/4801/14, SEQ ID NO: 92). Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hongkong/4801/14) также могут быть модифицированы.[00173] In another aspect, an H3 HA is provided that may contain a modified residue at position 382 and may be modified to contain a cysteine residue at positions 524 and/or 528 (H3 numbering A/Hongkong/4801/14, SEQ ID NO: 92). In addition, the residues at position 525, 526 and/or 527 (numbering H3 A/Hongkong/4801/14) can also be modified.

[00174] Как показано, например, на фиг. 7А, 7В и 7С, Н3 НА, содержащий модифицированные в не цистеин остатки цистеина в положениях 524 и 528 и содержащий остаток в положении 382, модифицированный из аспарагина в аланин, приводит к приблизительно 260%-ному увеличению в титре гемагглютинации по сравнению с Н3 НА дикого типа.[00174] As shown, for example, in FIG. 7A, 7B and 7C, H3 HA containing non-cysteine modified cysteine residues at positions 524 and 528 and containing a residue at position 382 modified from asparagine to alanine results in an approximately 260% increase in hemagglutination titer compared to H3 HA. wild type.

[00175] Соответственно, предусмотрен модифицированный белок Н3 НА, который содержит одну или более чем одну модификацию в положении 524, 525, 526, 527 или 528 и модификацию в положении 382. В неограничивающем примере модифицированный Н3 НА содержит модификации по меньшей мере в положениях 382, 524 и 528.[00175] Accordingly, a modified H3 HA protein is provided that contains one or more modifications at position 524, 525, 526, 527, or 528 and a modification at position 382. In a non-limiting example, a modified H3 HA contains modifications at least at positions 382 , 524 and 528.

[00176] Остаток в положении 382 Н3 НА может быть модифицирован так, чтобы он не представлял собой аспарагин. Например, остаток в положении 382 может быть модифицирован, чтобы представлять собой гидрофобную аминокислоту, например, аланин или консервативную замену аланина, например, серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Остаток в положении 524 может быть модифицирован в не цистеин, серин или консервативную замену серина (S, Ser), а остаток в положении 528 может быть модифицирован в не цистеин, лейцин (L, Leu) или консервативную замену лейцина.[00176] The residue at position 382 of H3 of HA can be modified so that it is not asparagine. For example, the residue at position 382 can be modified to be a hydrophobic amino acid, e.g., alanine, or a conservative alanine substitution, e.g., serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C , Cys) or valine (V, Val). The residue at position 524 may be modified to a non-cysteine, serine, or conservative serine substitution (S, Ser) and the residue at position 528 may be modified to a non-cysteine, leucine (L, Leu) or conservative leucine substitution.

[00177] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена аланина может, например, представлять собой серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Не цистеин в положении 524 может представлять собой серин (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (А, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00177] For example, a modified H3 HA protein may contain an amino acid sequence that is characterized by sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, with respect to the amino acid sequence HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains alanine (A, Ala) or a conservative alanine substitution (A , Ala) at position 382, does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature, and moreover, when expressed, it forms a VLP. A conservative alanine substitution may, for example, be serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val). The non-cysteine at position 524 may be a serine (S, Ser) or a conservative serine substitution, and the non-cysteine at position 528 may be a leucine (L, Leu) or a conservative leucine substitution. A conservative substitution for serine (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu), or lysine (L, Lys). A conservative leucine replacement may be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00178] В настоящем документе также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 382, 524 и 528, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00178] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with substitutions at positions 382, 524 and 528 as described above, operably linked to a regulatory region active in a plant.

[00179] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена для аланина может, например, представлять собой серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Не цистеин в положении 524 может представлять собой серин (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00179] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, relative to the nucleotide sequence encoding the HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 102), the nucleotide sequence encoding a modified H3 HA protein that contains alanine (A, Ala) or a conservative alanine substitution (A, Ala) at position 382, does not contain a cysteine residue at positions 524 and 528, the sequence is not naturally occurring and the HA when expressed forms a VLP. A conservative substitution for alanine may, for example, be serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val). The non-cysteine at position 524 may be a serine (S, Ser) or a conservative serine substitution, and the non-cysteine at position 528 may be a leucine (L, Leu) or a conservative leucine substitution. A conservative substitution for serine (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu), or lysine (L, Lys). A conservative leucine replacement may be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00180] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена аланина может, например, представлять собой серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val).[00180] Nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains an alanine (A, Ala) or a conservative substitution of alanine (A, Ala) at position 382, does not contain a cysteine residue at positions 524 and 528, wherein the sequence is not naturally occurring and wherein the HA, when expressed, forms a VLP. A conservative alanine substitution may, for example, be serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val).

[00181] Помимо остатков в положениях 382, 524 и 528, модифицированный Н3 НА может содержать дополнительные модифицированные остатки. Например, могут быть модифицированы один или более остатков в положении 384, 525, 526 и 527. В неограничивающем примере модифицированный Н3 НА может содержать замещенные остатки в положениях 382, 524, 528 и одну или более замен в положениях 384, 525, 526, 527 или их комбинацию.[00181] In addition to the residues at positions 382, 524, and 528, the modified H3 HA may contain additional modified residues. For example, one or more residues at positions 384, 525, 526, and 527 may be modified. In a non-limiting example, a modified H3 HA may contain substituted residues at positions 382, 524, 528 and one or more substitutions at positions 384, 525, 526, 527 or a combination of them.

[00182] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 382, 524 и 528 и, необязательно, заменами в положениях 384, 525, 526, 527 выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00182] Also provided is a method for producing VLPs that contain a modified H3 HA with substitutions at least at positions 382, 524, and 528, and optionally substitutions at positions 384, 525, 526, 527 above, in the plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00183] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 382, 524 и 528 и, необязательно, с заменами в положениях 384, 525, 526, 527, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые обеспечивают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00183] In addition, a method is provided for increasing the yield of VLPs that contain a modified H3 HA with substitutions at least at positions 382, 524, and 528, and optionally with substitutions at positions 384, 525, 526, 527, as described above, in plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00184] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положениях 382, 524 и 528 и, необязательно, заменами в положениях 384, 525, 526, 527. VLP может быть получена способом, предусмотренным в настоящем описании. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00184] Provided herein is a VLP comprising an H3 HA with substitutions at least at positions 382, 524, and 528, and optionally substitutions at positions 384, 525, 526, 527. A VLP can be prepared by the method provided herein. . VLPs containing modified H3 HA show improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 524-528 (CysTM) и 384Modification at position 524-528 (CysTM) and 384

[00185] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 384 и может быть модифицирован так, чтобы не содержать остатка цистеина в положениях 524 и 528 (нумерация Н3 A/Hongkong/4801/14, SEQ ID NO: 92). Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hongkong/4801/14) также могут быть модифицированы.[00185] In another aspect, an H3 HA is provided that may contain a modified residue at position 384 and may be modified to not contain a cysteine residue at positions 524 and 528 (numbering H3 A/Hongkong/4801/14, SEQ ID NO: 92 ). In addition, the residues at position 525, 526 and/or 527 (numbering H3 A/Hongkong/4801/14) can also be modified.

[00186] Как показано, например, на фиг. 7А, 7В и 7С, Н3 НА, содержащий остатки цистеина в положениях 524 и 528, модифицированные в остатки не цистеина, и содержащий остаток в положении 384, модифицированный из лейцина в валин, приводит к приблизительно 270%-ному увеличению титра гемагглютинации по сравнению с Н3 НА дикого типа.[00186] As shown, for example, in FIG. 7A, 7B and 7C, H3 HA containing cysteine residues at positions 524 and 528 modified to non-cysteine residues and containing a residue at position 384 modified from leucine to valine resulted in an approximately 270% increase in hemagglutination titer compared to H3 HA wild type.

[00187] Соответственно, предусмотрен модифицированный белок Н3 НА, который содержит одну или более модификаций в положении 524, 525, 526, 527 или 528 и модификацию в положении 384. В неограничивающем примере модифицированный Н3 НА содержит модификации по меньшей мере в положениях 384, 524 и 528.[00187] Accordingly, a modified H3 HA protein is provided that contains one or more modifications at position 524, 525, 526, 527, or 528 and a modification at position 384. In a non-limiting example, a modified H3 HA contains modifications at least at positions 384, 524 and 528.

[00188] Остаток в положении 384 Н3 НА может быть модифицирован так, чтобы он не представлял собой лейцин. Например, остаток в положении 384 может быть модифицирован в другую гидрофобную аминокислоту, например, валин или консервативную замену валина, например, изолейцин, лейцин, метионин, аланин или треонин.[00188] The residue at position 384 of H3 of HA can be modified so that it is not leucine. For example, the residue at position 384 may be modified to another hydrophobic amino acid, such as valine or a conservative valine substitution, such as isoleucine, leucine, methionine, alanine, or threonine.

[00189] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит валин или консервативную замену валина в положении 384, не содержит остатка цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена валина может представлять собой, например, изолейцин, лейцин, метионин, аланин или треонин.[00189] For example, a modified H3 HA protein may contain an amino acid sequence that is characterized by sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, relative to the amino acid sequence HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains valine or a conservative valine substitution at position 384, does not contain a residue cysteine at positions 524 and 528, and the sequence is not found in nature, and moreover, when expressed, it forms a VLP. A conservative valine replacement may be, for example, isoleucine, leucine, methionine, alanine or threonine.

[00190] В настоящем описании также представлена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 384, 524 и 528, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00190] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA substitution at positions 384, 524 and 528 as described above, operably linked to a regulatory region active in a plant.

[00191] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит валин или консервативную замену валина в положении 384, не содержит остаток цистеина в положениях 524 и 528 и причем последовательность не встречается в природе. Консервативная замена может представлять собой, например, изолейцин, лейцин, метионин, аланин или треонин.[00191] For example, nucleotide sequences may have sequence identity or sequence similarity of about 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, relative to the nucleotide sequence encoding the HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains a valine or a conservative valine substitution at position 384, not contains a cysteine residue at positions 524 and 528 and the sequence is not naturally occurring. A conservative substitution may be, for example, isoleucine, leucine, methionine, alanine or threonine.

[00192] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит валин или консервативную замену валина в положении 384, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречаются в природе и причем НА при экспрессии образует VLP. Консервативная замена валина может представлять собой, например, изолейцин, лейцин, метионин, аланин или треонин.[00192] Nucleotide sequences can be characterized by sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains valine or a conservative valine substitution at position 384, does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature and moreover, when expressed, it forms a VLP. A conservative valine replacement may be, for example, isoleucine, leucine, methionine, alanine or threonine.

[00193] Помимо остатков в положениях 384, 524 и 528, модифицированный Н3 НА может содержать дополнительные модифицированные остатки. Например, могут быть модифицированы один или более остатков в положении 382, 525, 526 и 527. В неограничивающем примере модифицированный Н3 НА может содержать замещенные остатки в положениях 384, 524, 528 и одну или более замен в положениях 382, 525, 526, 527 или их комбинацию.[00193] In addition to the residues at positions 384, 524, and 528, the modified H3 HA may contain additional modified residues. For example, one or more residues at positions 382, 525, 526, and 527 may be modified. In a non-limiting example, a modified H3 HA may contain substituted residues at positions 384, 524, 528 and one or more substitutions at positions 382, 525, 526, 527 or a combination of them.

[00194] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 384, 524 и 528 и, необязательно, заменами в положениях 382, 525, 526, 527 выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые допускают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00194] In addition, a method is provided for obtaining VLPs that contain a modified H3 HA with substitutions at least at positions 384, 524, and 528, and optionally substitutions at positions 382, 525, 526, 527 above, in the plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00195] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 384, 524 и 528 и, необязательно, с заменами в положениях 382, 525, 526, 527, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые допускают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00195] In addition, a method is provided for increasing the yield of VLPs that contain modified H3 HA with substitutions at least at positions 384, 524, and 528, and optionally with substitutions at positions 382, 525, 526, 527, as described above, in plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00196] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положениях 384, 524 и 528 и, необязательно, заменами в положениях 382, 525, 526, 527. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00196] Provided herein is a VLP comprising an H3 HA with a substitution at at least positions 384, 524, and 528, and optionally substitutions at positions 382, 525, 526, 527. A VLP can be produced by the method provided herein. VLPs containing modified H3 HA show improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 524-528 (CysTM) и 392Modification at position 524-528 (CysTM) and 392

[00197] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 392 и может не содержать остатка цистеина в положениях 524 и 528 (нумерация Н3 A/Hongkong/4801/14, SEQ ID NO: 92). Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hongkong/4801/14) также могут быть модифицированы.[00197] According to another aspect, H3 HA is provided which may contain a modified residue at position 392 and may not contain a cysteine residue at positions 524 and 528 (numbering H3 A/Hongkong/4801/14, SEQ ID NO: 92). In addition, the residues at position 525, 526 and/or 527 (numbering H3 A/Hongkong/4801/14) can also be modified.

[00198] Как показано, например, на фиг. 7А и 7В, Н3 НА, содержащий остатки цистеина в положениях 524 и 528, модифицированные в не цистеин, и содержащий остаток в положении 392, модифицированный из фенилаланина в аспарагиновую кислоту, дает от 200% до 270% увеличение титра гемагглютинации по сравнению с Н3 НА дикого типа.[00198] As shown, for example, in FIG. 7A and 7B, H3 HA containing cysteine residues at positions 524 and 528 modified to non-cysteine and containing a residue at position 392 modified from phenylalanine to aspartic acid gives a 200% to 270% increase in hemagglutination titer compared to H3 HA. wild type.

[00199] Соответственно, предусмотрен модифицированный белок Н3 НА, который содержит одну или более модификаций в положении 524, 525, 526, 527 или 528 и модификацию в положении 392. В неограничивающем примере модифицированный Н3 НА содержит модификации по меньшей мере в положениях 392, 524 и 528.[00199] Accordingly, a modified H3 HA protein is provided that contains one or more modifications at position 524, 525, 526, 527, or 528 and a modification at position 392. In a non-limiting example, a modified H3 HA contains modifications at least at positions 392, 524 and 528.

[00200] Остаток в положении 392 Н3 НА может быть модифицирован, чтобы не представлять собой фенилаланин. Например, остаток в положении 392 может быть модифицирован в заряженную аминокислоту, например, аспарагиновую кислоту или консервативную замену аспарагиновой кислоты, например, глутамин, аспарагин, глутаминовую кислоту или серин.[00200] The residue at position 392 of the H3 of HA can be modified to not be phenylalanine. For example, the residue at position 392 can be modified to a charged amino acid, such as aspartic acid or a conservative substitution of aspartic acid, such as glutamine, asparagine, glutamic acid, or serine.

[00201] Например, модифицированный белок НА Н3 может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты в положении 392, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена аспарагиновой кислоты может, например, представлять собой глутамин, аспарагин, глутаминовую кислоту или серин. Не цистеин в положении 524 может представлять собой серин (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (А, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00201] For example, a modified H3 HA protein may contain an amino acid sequence that is characterized by sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, relative to the amino acid sequence HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains aspartic acid or a conservative substitution of aspartic acid at position 392, not contains a cysteine residue at positions 524 and 528, and the sequence is not found in nature, and moreover, when expressed, it forms a VLP. A conservative substitution for aspartic acid may, for example, be glutamine, asparagine, glutamic acid, or serine. The non-cysteine at position 524 may be a serine (S, Ser) or a conservative serine substitution, and the non-cysteine at position 528 may be a leucine (L, Leu) or a conservative leucine substitution. A conservative substitution for serine (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu), or lysine (L, Lys). A conservative leucine replacement may be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00202] В настоящем описании также представлена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 392, 524 и 528, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00202] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA substitution at positions 392, 524 and 528 as described above, operably linked to a regulatory region active in a plant.

[00203] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты в положении 392, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена может представлять собой, например, глутамин, аспарагин, глутаминовую кислоту или серин.[00203] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, relative to the nucleotide sequence encoding the HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains aspartic acid or a conservative substitution of aspartic acid at position 392 , does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature, and moreover, when expressed, it forms a VLP. A conservative substitution may be, for example, glutamine, asparagine, glutamic acid or serine.

[00204] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты в положении 392, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена может представлять собой, например, глутамин, аспарагин, глутаминовая кислота или серин.[00204] Nucleotide sequences can be characterized by sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains aspartic acid or a conservative substitution of aspartic acid at position 392, does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature and moreover, when expressed, HA forms a VLP. A conservative substitution may be, for example, glutamine, asparagine, glutamic acid or serine.

[00205] Помимо остатков в положениях 392, 524 и 528, модифицированный Н3 НА может содержать дополнительные модифицированные остатки. Например, могут быть модифицированы один или более остатков в положении 525, 526 и 527. В неограничивающем примере модифицированный Н3 НА может содержать замещенные остатки в положениях 392, 524, 528 и одну или более замен в положениях 525, 526, 527 или их комбинацию.[00205] In addition to the residues at positions 392, 524, and 528, the modified H3 HA may contain additional modified residues. For example, one or more residues at position 525, 526, and 527 may be modified. In a non-limiting example, the modified H3 HA may contain substituted residues at positions 392, 524, 528 and one or more substitutions at positions 525, 526, 527, or a combination thereof.

[00206] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 392, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527 выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые допускают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00206] Also provided is a method for producing VLPs that contain a modified H3 HA with substitutions at least at positions 392, 524, and 528, and optionally substitutions at positions 525, 526, 527 above, in the plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00207] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 392, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный НА Н3, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00207] In addition, a method is provided to increase the yield of VLPs that contain modified H3 HA with substitutions at least at positions 392, 524, and 528, and optionally substitutions at positions 525, 526, 527, as described above, in a plant. The method involves introducing a nucleic acid encoding a modified HA H3 operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00208] В настоящем описании дополнительно предусмотрены VLP, содержащие Н3 НА с заменой по меньшей мере в положениях 392, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00208] Provided herein are VLPs containing H3 HA with substitutions at least at positions 392, 524, and 528, and optionally substitutions at positions 525, 526, 527. VLPs can be produced by the method provided herein. VLPs containing modified H3 HA show improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 524-528 (CysTM) и 431Modification at position 524-528 (CysTM) and 431

[00209] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 431 и может не содержать остаток цистеина в положениях 524 и 528 (нумерация Н3 A/Hongkong/4801/14, SEQ ID NO: 92). Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hongkong/4801/14) также могут быть модифицированы.[00209] According to another aspect, an H3 HA is provided which may contain a modified residue at position 431 and may not contain a cysteine residue at positions 524 and 528 (numbering H3 A/Hongkong/4801/14, SEQ ID NO: 92). In addition, the residues at position 525, 526 and/or 527 (numbering H3 A/Hongkong/4801/14) can also be modified.

[00210] Как показано, например, на фиг. 7А и 7В, Н3 НА, содержащий остатки цистеина в положениях 524 и 528, модифицированные в не цистеин, и содержащий остаток в положении 431, модифицированный из лейцина в метионин, приводит к приблизительно 250%-ному увеличению титра гемагглютинации по сравнению с Н3 НА дикого типа.[00210] As shown, for example, in FIG. 7A and 7B, H3 HA containing cysteine residues at positions 524 and 528 modified to non-cysteine and containing residue at position 431 modified from leucine to methionine results in an approximately 250% increase in hemagglutination titer compared to wild H3 HA. type.

[00211] Соответственно, предусмотрен модифицированный белок НА Н3, который содержит одну или более модификаций в положении 524, 525, 526, 527 или 528 и модификацию в положении 431. В неограничивающем примере модифицированный Н3 НА содержит модификации по меньшей мере в положениях 431, 524 и 528.[00211] Accordingly, a modified H3 HA protein is provided that contains one or more modifications at position 524, 525, 526, 527, or 528 and a modification at position 431. In a non-limiting example, a modified H3 HA contains modifications at least at positions 431, 524 and 528.

[00212] Остаток в положении 431 Н3 НА может быть модифицирован так, чтобы он не представлял собой лейцин. Например, остаток в положении 431 может быть модифицирован в метионин или консервативную замену метионина, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00212] The residue at position 431 H3 of HA can be modified so that it is not leucine. For example, the residue at position 431 may be modified to methionine or a conservative methionine substitution such as leucine, isoleucine, glutamine, valine, or phenylalanine.

[00213] Например, модифицированный белок H1 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит метионин или консервативную замену метионина в положении 431, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативной заменой метионина может быть, например, лейцин, изолейцин, глутамин, валин или фенилаланин. Не цистеин в положении 524 может представлять собой серин (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gin), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00213] For example, a modified HA H1 protein may comprise an amino acid sequence that has sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, relative to the amino acid sequence HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains methionine or a conservative methionine substitution at position 431, does not contain a residue cysteine at positions 524 and 528, and the sequence is not found in nature, and moreover, when expressed, it forms a VLP. A conservative substitute for methionine may be, for example, leucine, isoleucine, glutamine, valine or phenylalanine. The non-cysteine at position 524 may be a serine (S, Ser) or a conservative serine substitution, and the non-cysteine at position 528 may be a leucine (L, Leu) or a conservative leucine substitution. A conservative substitution for serine (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gin), glycine (G, Gly), glutamic acid (E, Glu), or lysine (L, Lys). A conservative leucine replacement may be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00214] В настоящем описании также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 431, 524 и 528, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00214] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA substitution at positions 431, 524 and 528 as described above, operably linked to a regulatory region active in a plant.

[00215] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит метионин или консервативную замену метионина в положении 431, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена может представлять собой, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00215] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding the HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains methionine or a conservative substitution of methionine at position 431, not contains a cysteine residue at positions 524 and 528, and the sequence is not found in nature, and moreover, when expressed, it forms a VLP. A conservative substitution may be, for example, leucine, isoleucine, glutamine, valine or phenylalanine.

[00216] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит метионин или консервативную замену метионина в положении 431, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена может представлять собой, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00216] Nucleotide sequences can be characterized by sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains methionine or a conservative methionine substitution at position 431, does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature and moreover, when expressed, it forms a VLP. A conservative substitution may be, for example, leucine, isoleucine, glutamine, valine or phenylalanine.

[00217] Помимо остатков в положениях 431, 524 и 528, модифицированный Н3 НА может содержать дополнительные модифицированные остатки. Например, могут быть модифицированы один или более остатков в положении 525, 526 и 527. В неограничивающем примере модифицированный Н3 НА может содержать замещенные остатки в положениях 431, 524, 528 и одну или более замен в положениях 525, 526, 527 или их комбинацию.[00217] In addition to the residues at positions 431, 524, and 528, the modified H3 HA may contain additional modified residues. For example, one or more residues at positions 525, 526, and 527 may be modified. In a non-limiting example, a modified H3 HA may contain substituted residues at positions 431, 524, 528 and one or more substitutions at positions 525, 526, 527, or a combination thereof.

[00218] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 431, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527 выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00218] Also provided is a method for producing VLPs that contain a modified H3 HA with substitutions at least at positions 431, 524, and 528, and optionally substitutions at positions 525, 526, 527 above, in the plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00219] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 431, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00219] In addition, a method is provided to increase the yield of VLPs that contain modified H3 HA with substitutions at least at positions 431, 524, and 528, and optionally substitutions at positions 525, 526, 527, as described above, in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00220] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положениях 431, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА. Модификация в положении 524-528 (CysTM), 382 и 384[00220] Provided herein is a VLP containing H3 HA with substitutions at least at positions 431, 524, and 528, and optionally substitutions at positions 525, 526, 527. A VLP can be produced by the method provided herein. VLPs containing modified H3 HA show improved performance compared to VLPs that contain unmodified H3 HA protein. Modification at position 524-528 (CysTM), 382 and 384

[00221] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированные остатки в положениях 382 и 384 и может не содержать остаток цистеина в положениях 524 и 528 (нумерация Н3 A/Hongkong/4801/14, SEQ ID NO: 92). Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hongkong/4801/14) также могут быть модифицированы.[00221] According to another aspect, H3 HA is provided which may contain modified residues at positions 382 and 384 and may not contain a cysteine residue at positions 524 and 528 (numbering H3 A/Hongkong/4801/14, SEQ ID NO: 92). In addition, the residues at position 525, 526 and/or 527 (numbering H3 A/Hongkong/4801/14) can also be modified.

[00222] Как показано, например, на фиг. 7Е, Н3 НА, содержащий остатки цистеина в положениях 524 и 528, модифицированные в не цистеин, и содержащий остаток в положении 382, модифицированный из аспарагина в аланин, и остаток в положении 384, модифицированный из лейцина в валин, дает увеличение титра гемагглютинации приблизительно на 400-500% по сравнению с Н3 НА дикого типа.[00222] As shown, for example, in FIG. 7E, H3 HA containing cysteine residues at positions 524 and 528 modified to non-cysteine, and containing a residue at position 382 modified from asparagine to alanine and a residue at position 384 modified from leucine to valine, gives an increase in hemagglutination titer of approximately 400-500% compared to wild-type H3 HA.

[00223] Соответственно, предусмотрен модифицированный белок Н3 НА, который содержит одну или более модификаций в положении 524, 525, 526, 527 или 528 и модификацию в положениях 382 и 384. В неограничивающем примере модифицированный Н3 НА содержит модификации по меньшей мере в положениях 382, 384, 524 и 528.[00223] Accordingly, a modified H3 HA protein is provided that contains one or more modifications at position 524, 525, 526, 527, or 528 and a modification at positions 382 and 384. In a non-limiting example, a modified H3 HA contains modifications at least at positions 382 , 384, 524 and 528.

[00224] Остаток в положении 382 Н3 НА может быть модифицирован так, чтобы он не представлял собой аспарагин. Например, остаток в положении 382 может быть модифицирован, чтобы представлять собой гидрофобную аминокислоту, например, аланин или консервативную замену аланина, например, серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Остаток в положении 384 Н3 НА может быть модифицирован так, чтобы он не представлял собой лейцин. Например, остаток в положении 384 может быть модифицирован в другую гидрофобную аминокислоту, например, валин или консервативную замену валина, например, изолейцин, лейцин, метионин, аланин или треонин.[00224] The residue at position 382 of H3 of HA can be modified so that it is not asparagine. For example, the residue at position 382 can be modified to be a hydrophobic amino acid, e.g., alanine, or a conservative alanine substitution, e.g., serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C , Cys) or valine (V, Val). The residue at position 384 of the H3 of HA can be modified so that it is not leucine. For example, the residue at position 384 may be modified to another hydrophobic amino acid, such as valine, or a conservative valine substitution, such as isoleucine, leucine, methionine, alanine, or threonine.

[00225] Например, модифицированный белок H1 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, валин или консервативную замену валина в положении 384, не содержит остаток цистеина в положениях 524 и 528 и причем последовательность не встречается в природе, и причем НА при экспрессии образует VLP. Консервативная замена аланина может, например, представлять собой серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Консервативная замена валина может представлять собой, например, изолейцин (I, Не), лейцин (L, Leu), метионин (М, Met), аланин A, Ala) или треонин (Т, Thr). Не цистеин в положении 524 может представлять собой серин (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00225] For example, the modified HA H1 protein may comprise an amino acid sequence that has sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98 , 99, 100%, or any number in between, with respect to the amino acid sequence HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains alanine (A, Ala) or a conservative alanine substitution (A , Ala) at position 382, a valine or a conservative valine substitution at position 384, does not contain a cysteine residue at positions 524 and 528, and the sequence is not naturally occurring, and moreover, HA when expressed forms a VLP. A conservative alanine substitution may, for example, be serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val). A conservative valine replacement may be, for example, isoleucine (I, He), leucine (L, Leu), methionine (M, Met), alanine A, Ala) or threonine (T, Thr). The non-cysteine at position 524 may be a serine (S, Ser) or a conservative serine substitution, and the non-cysteine at position 528 may be a leucine (L, Leu) or a conservative leucine substitution. A conservative substitution for serine (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu), or lysine (L, Lys). A conservative leucine replacement may be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00226] В настоящем описании также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 382, 384, 524 и 528, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00226] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA substitution at positions 382, 384, 524 and 528 as described above, operably linked to a regulatory region active in a plant.

[00227] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок НА Н3, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, валин или консервативную замену валина в положении 384, не содержит остаток цистеина в положениях 524 и 528, и причем последовательность не встречается в природе, и причем НА при экспрессии образует VLP. Консервативная замена аланина может, например, представлять собой серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Консервативная замена валина может представлять собой, например, изолейцин (I, Не), лейцин (L, Leu), метионин (М, Met), аланин A, Ala) или треонин (Т, Thr). Не цистеин в положении 524 может представлять собой серин (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00227] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any the number between them, with respect to the nucleotide sequence encoding the HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 102), the nucleotide sequence encoding a modified H3 HA protein that contains alanine (A, Ala) or a conservative substitution of alanine (A, Ala) at position 382, a valine or a conservative valine substitution at position 384, does not contain a cysteine residue at positions 524 and 528, and the sequence is not naturally occurring, and the HA when expressed forms a VLP. A conservative alanine substitution may, for example, be serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val). A conservative valine replacement may be, for example, isoleucine (I, He), leucine (L, Leu), methionine (M, Met), alanine A, Ala) or threonine (T, Thr). The non-cysteine at position 524 may be a serine (S, Ser) or a conservative serine substitution, and the non-cysteine at position 528 may be a leucine (L, Leu) or a conservative leucine substitution. A conservative substitution for serine (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu), or lysine (L, Lys). A conservative leucine replacement may be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00228] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, валин или консервативную замену валина в положении 384, не содержит остаток цистеина в положениях 524 и 528 и причем последовательность не встречается в природе, и причем НА при экспрессии образует VLP. Консервативная замена аланина может, например, представлять собой серин (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Консервативная замена валина может представлять собой, например, изолейцин (I, Ile), лейцин (L, Leu), метионин (М, Met), аланин A, Ala) или треонин (Т, Thr). Не цистеин в положении 524 может представлять собой серин (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00228] Nucleotide sequences can be characterized by sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains an alanine (A, Ala) or a conservative alanine (A, Ala) substitution at position 382, a valine or a conservative valine substitution at position 384, does not contain a cysteine residue at positions 524 and 528, and moreover, the sequence does not occur in nature, and moreover, HA, when expressed, forms a VLP. A conservative alanine substitution may, for example, be serine (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val). A conservative valine replacement may be, for example, isoleucine (I, Ile), leucine (L, Leu), methionine (M, Met), alanine A, Ala) or threonine (T, Thr). The non-cysteine at position 524 may be a serine (S, Ser) or a conservative serine substitution, and the non-cysteine at position 528 may be a leucine (L, Leu) or a conservative leucine substitution. A conservative substitution for serine (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu), or lysine (L, Lys). A conservative replacement for leucine can be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00229] В дополнение к остаткам в положении 382, 384, 524 и 528, модифицированный Н3 НА может содержать дополнительные модифицированные остатки. Например, могут быть модифицированы один или более остатков в положениях 525, 526 и 527. В неограничивающем примере модифицированный Н3 НА может содержать замещенные остатки в положениях 382, 384, 524, 528 и одну или более замен в положениях 525, 526, 527 или их комбинацию.[00229] In addition to the residues at position 382, 384, 524, and 528, the modified H3 HA may contain additional modified residues. For example, one or more residues at positions 525, 526, and 527 may be modified. In a non-limiting example, a modified H3 HA may contain substituted residues at positions 382, 384, 524, 528 and one or more substitutions at positions 525, 526, 527, or their combination.

[00230] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 382, 384, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527 выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00230] In addition, a method is provided for obtaining VLPs that contain a modified H3 HA with substitutions at least at positions 382, 384, 524, and 528, and optionally substitutions at positions 525, 526, 527 above, in the plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00231] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 382, 384, 524 и 528 и, необязательно, с заменами в положениях 525, 526, 527, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00231] In addition, a method is provided for increasing the yield of VLPs that contain a modified H3 HA with substitutions at least at positions 382, 384, 524, and 528, and optionally with substitutions at positions 525, 526, 527, as described above, in plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a regulatory region active in a plant into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00232] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положениях 382, 384, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527. VLP может быть получена способом, как предусмотрено согласно данному описанию. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00232] Provided further herein is a VLP comprising H3 HA with substitutions at least at positions 382, 384, 524, and 528, and optionally substitutions at positions 525, 526, 527. A VLP may be prepared by the method as provided herein. description. VLPs containing modified H3 HA show improved performance compared to VLPs that contain unmodified H3 HA protein.

[00233] В настоящем документе также представлены способы увеличения производства или выхода VLP, содержащих мутантные НА гриппа, в растениях. Например, способ может предусматривать введение нуклеиновой кислоты, кодирующей мутантный НА гриппа, как описано в настоящем документе, в растение, часть растения или растительную клетку. Нуклеиновая кислота, кодирующая мутантный НА гриппа, может быть оптимизирована в отношении частоты использования кодонов человека, повышенного содержания GC или их комбинации. Один или более чем один мутантный белок НА гриппа может быть экспрессирован в растении, части растения или растительной клетке, чтобы производить VLP, содержащую один или более чем один мутантный белок НА гриппа. Альтернативно, способ может предусматривать получение растения, части растения или растительной клетки, которые содержат нуклеиновую кислоту, кодирующую мутантный белок НА гриппа, для получения VLP, содержащей один или более чем один мутантный белок НА гриппа.[00233] This document also provides methods for increasing the production or yield of VLPs containing influenza HA mutants in plants. For example, the method may include introducing a nucleic acid encoding a mutant influenza HA, as described herein, into a plant, plant part, or plant cell. The nucleic acid encoding the influenza HA mutant can be optimized for human codon usage, increased GC content, or a combination thereof. One or more mutant influenza HA proteins may be expressed in a plant, plant part, or plant cell to produce a VLP containing one or more mutated influenza HA proteins. Alternatively, the method may include obtaining a plant, plant part, or plant cell that contains a nucleic acid encoding a mutant influenza HA protein to obtain a VLP containing one or more mutant influenza HA proteins.

[00234] Способы получения VLP, содержащей мутантный НА гриппа, могут дополнительно предусматривать стадию введения второй последовательности нуклеиновой кислоты в растение, часть растения или растительную клетку, причем вторая нуклеиновая кислота кодирует белок протонного канала, который коэкспрессируется с мутантным НА гриппа. Например, белок протонного канала может представлять собой белок М2 подтипа гриппа А, такой как A/New Caledonia/20/99 М2. Коэкспрессия белка протонного канала может приводить к повышенному накоплению мутантного белка НА гриппа и/или VLP, содержащих мутантный белок НА гриппа, как, например, описано в публикации международной заявки WO 2013/044390, которая включена в настоящий документ посредством ссылки.[00234] Methods for producing a VLP comprising mutant influenza HA may further comprise the step of introducing a second nucleic acid sequence into a plant, plant part, or plant cell, wherein the second nucleic acid encodes a proton channel protein that is co-expressed with the mutant influenza HA. For example, the proton channel protein may be an influenza A subtype M2 protein, such as A/New Caledonia/20/99 M2. Co-expression of the proton channel protein can lead to increased accumulation of mutant influenza HA protein and/or VLPs containing mutant influenza HA protein, as for example described in WO 2013/044390, which is incorporated herein by reference.

[00235] Кроме того, мутантный НА гриппа может дополнительно содержать модифицированную протеолитическую петлю или сайт расщепления, как описано в публикациях международных заявок WO 2013/044390 и WO 2014/153674 и которые включены в настоящий документ посредством ссылки.[00235] In addition, mutant influenza HA may further comprise a modified proteolytic loop or cleavage site, as described in International Application Publications WO 2013/044390 and WO 2014/153674, which are incorporated herein by reference.

[00236] Под «коэкспрессией» подразумевается введение и экспрессия двух или более нуклеотидных последовательностей, причем каждая из двух или более нуклеотидных последовательностей кодирует представляющий интерес белок или фрагмент представляющего интерес белка, в растении, части растения или растительной клетке. Две или более нуклеотидных последовательностей могут быть введены в растение, часть растения или растительную клетку в одном векторе, так что каждая из двух или более нуклеотидных последовательностей находится под контролем отдельной регуляторной области (например, содержащей двойную конструкцию). Альтернативно, две или более нуклеотидных последовательностей могут быть введены в растение, часть растения или растительную клетку в отдельных векторах (например, содержащих одиночные конструкции), и каждый вектор содержит соответствующие регуляторные области для экспрессии соответствующей нуклеиновой кислоты. Например, две нуклеотидные последовательности, каждая в отдельном векторе и введенная отдельным хозяевам Agrobacterium tumefaciens, могут быть совместно экспрессированы путем смешивания суспензий каждого хозяина A. tumefaciens в желаемом объеме (например, равный объем или соотношении каждого хозяина A. tumefaciens может быть изменено) перед вакуумной инфильтрацией. Таким образом, совместная инфильтрация множества суспензий А. tumifaciens позволяет коэкспрессию множества трансгенов.[00236] By "co-expression" is meant the introduction and expression of two or more nucleotide sequences, where the two or more nucleotide sequences each encode a protein of interest, or a fragment of a protein of interest, in a plant, plant part, or plant cell. Two or more nucleotide sequences can be introduced into a plant, plant part, or plant cell in a single vector, such that each of the two or more nucleotide sequences is under the control of a separate regulatory region (eg, containing a binary construct). Alternatively, two or more nucleotide sequences may be introduced into the plant, plant part, or plant cell in separate vectors (eg, containing single constructs), and each vector contains appropriate regulatory regions for the expression of the respective nucleic acid. For example, two nucleotide sequences, each in a separate vector and introduced to separate hosts of Agrobacterium tumefaciens, can be co-expressed by mixing suspensions of each A. tumefaciens host at the desired volume (e.g., equal volume or ratio of each A. tumefaciens host can be varied) prior to vacuum infiltration. Thus, co-infiltration of multiple suspensions of A. tumifaciens allows the co-expression of multiple transgenes.

[00237] Нуклеиновая кислота, кодирующая мутантный НА гриппа, как описано в настоящем документе, может дополнительно содержать последовательности, которые усиливают экспрессию мутантного НА гриппа в растении, части растения или растительной клетке. Последовательности, которые усиливают экспрессию, могут включать в себя энхансерный элемент вируса мозаики коровьего гороха (CPMV), функционально связанный с нуклеиновой кислотой, кодирующей мутантный белок НА гриппа.[00237] A nucleic acid encoding a mutant influenza HA as described herein may further comprise sequences that enhance expression of the mutant influenza HA in a plant, plant part, or plant cell. Sequences that enhance expression may include a cowpea mosaic virus (CPMV) enhancer element operably linked to a nucleic acid encoding a mutant influenza HA protein.

[00238] Нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный белок гемагглютинин (НА) гриппа, как описано в настоящем документе, может дополнительно содержать последовательности, которые усиливают экспрессию белка НА в растении, части растения или растительной клетке. Последовательности, которые усиливают экспрессию, могут включать в себя элемент энхансера CPMV или энхансер экспрессии растительного происхождения в функциональной связи с нуклеиновой кислотой, кодирующей модифицированный белок гемагглютинин гриппа (НА). Последовательность, кодирующая модифицированный гемагглютинин (НА) гриппа, также может быть оптимизирована в отношении частоты использования кодонов человека, повышенного содержания GC или их комбинации.[00238] A nucleic acid comprising a nucleotide sequence encoding a modified influenza hemagglutinin (HA) protein as described herein may further comprise sequences that enhance expression of the HA protein in a plant, plant part, or plant cell. Sequences that enhance expression may include a CPMV enhancer element or a plant derived expression enhancer operably linked to a nucleic acid encoding a modified influenza hemagglutinin (HA) protein. The modified influenza hemagglutinin (HA) coding sequence can also be optimized for human codon usage, increased GC content, or a combination thereof.

[00239] Используемый в настоящем документе термин «энхансерный элемент CPMV» относится к нуклеотидной последовательности, кодирующей 5'UTR, регулирующую полипептид RNA2 вируса мозаики коровьего гороха (CPMV) или модифицированную последовательность CPMV, как известно в настоящей области техники. Например, энхансерный элемент CPMV или энхансер экспрессии CPMV включает в себя нуклеотидную последовательность, как описано в публикации международной заявки WO 2015/14367; WO 2015/103704; WO 2007/135480; WO 2009/087391; Sainsbury F., and Lomonossoff G.P., (2008, Plant Physiol. 148: pp. 1212-1218), каждая из которых включена в настоящий документ посредством ссылки. Последовательность энхансера CPMV может усиливать экспрессию гетерологичной открытой рамки считывания (ORF) ниже по ходу транскрипции, к которой они присоединены. Энхансер экспрессии CPMV может включать в себя CPMV НТ, CPMVX (где X=160, 155, 150, 114), например, CPMV 160, CPMVX+ (где X=160, 155, 150, 114), например, CPMV 160+, CPMV-HT+, CPMV HT+ [WT115] или CPMV HT+ [511] (публикации международной заявки WO 2015/143567; WO 2015/103704, которые включены в настоящий документ посредством ссылки). Энхансер экспрессии CPMV можно использовать в системе экспрессии растений, содержащей регуляторную область, которая функционально связана с последовательностью энхансера экспрессии CPMV и представляющей интерес нуклеотидной последовательностью.[00239] As used herein, the term "CPMV enhancer element" refers to a nucleotide sequence encoding a 5'UTR regulating cowpea mosaic virus (CPMV) RNA2 polypeptide or a modified CPMV sequence as is known in the art. For example, a CPMV enhancer element or CPMV expression enhancer includes a nucleotide sequence as described in WO 2015/14367; WO2015/103704; WO 2007/135480; W02009/087391; Sainsbury F., and Lomonossoff G.P., (2008, Plant Physiol. 148: pp. 1212-1218), each of which is incorporated herein by reference. The CPMV enhancer sequence can enhance the expression of a heterologous open reading frame (ORF) downstream of the transcription to which they are attached. CPMV expression enhancer may include CPMV HT, CPMVX (where X=160, 155, 150, 114), e.g. CPMV 160, CPMVX+ (where X=160, 155, 150, 114), e.g. CPMV 160+, CPMV -HT+, CPMV HT+ [WT115] or CPMV HT+ [511] (International Application Publications WO 2015/143567; WO 2015/103704, which are incorporated herein by reference). The CPMV expression enhancer can be used in a plant expression system containing a regulatory region that is operably linked to a CPMV expression enhancer sequence and a nucleotide sequence of interest.

[00240] Используемый в настоящем документе термин «энхансерный элемент CPMV» относится к нуклеотидной последовательности, кодирующей 5'UTR, регулирующую полипептид RNA2 вируса мозаики коровьего гороха (CPMV) или модифицированную последовательность CPMV, как известно в настоящей области техники. Например, энхансерный элемент CPMV или энхансер экспрессии CPMV включает в себя нуклеотидную последовательность, как описано в публикации международной заявки WO 2015/14367; WO 2015/103704; WO 2007/135480; WO 2009/087391; Sainsbury F., and Lomonossoff G.P., (2008, Plant Physiol. 148: pp. 1212-1218), каждая из которых включена в настоящий документ посредством ссылки. Последовательность энхансера CPMV может усиливать экспрессию гетерологичной открытой рамки считывания (ORF) ниже по ходу транскрипции, к которой они присоединены. Энхансер экспрессии CPMV может включать в себя CPMV НТ, CPMVX, CPMVX+, CPMV-HT+, CPMV HT+ [WT115] или CPMV НТ+ [511] (публикации международной заявки WO 2015/14367; WO 2015/103704, которые включены в настоящий документ посредством ссылки). Энхансер экспрессии CPMV можно использовать в системе экспрессии растений, содержащей регуляторную область, которая функционально связана с последовательностью энхансера экспрессии CPMV и представляющей интерес нуклеотидной последовательностью.[00240] As used herein, the term "CPMV enhancer element" refers to a nucleotide sequence encoding a 5'UTR regulating cowpea mosaic virus (CPMV) RNA2 polypeptide or a modified CPMV sequence as known in the art. For example, a CPMV enhancer element or CPMV expression enhancer includes a nucleotide sequence as described in WO 2015/14367; WO2015/103704; WO 2007/135480; W02009/087391; Sainsbury F., and Lomonossoff G.P., (2008, Plant Physiol. 148: pp. 1212-1218), each of which is incorporated herein by reference. The CPMV enhancer sequence can enhance the expression of a heterologous open reading frame (ORF) downstream of the transcription to which they are attached. The CPMV expression enhancer may include CPMV HT, CPMVX, CPMVX+, CPMV-HT+, CPMV HT+ [WT115] or CPMV HT+ [511] (International Application Publications WO 2015/14367; WO 2015/103704, which are incorporated herein by links). The CPMV expression enhancer can be used in a plant expression system containing a regulatory region that is operably linked to a CPMV expression enhancer sequence and a nucleotide sequence of interest.

[00241] Термин «5'UTR» или «5'-нетранслируемая область», или «5'-лидерная последовательность» относится к участкам мРНК, которые не транслируются. 5'UTR, как правило, начинается в сайте старта транскрипции и заканчивается непосредственно перед сайтом инициации трансляции или стартовым кодоном кодирующей области. 5'-UTR может модулировать стабильность и/или трансляцию транскрипта мРНК.[00241] The term "5'UTR" or "5'-untranslated region", or "5'-leader sequence" refers to areas of mRNA that are not translated. The 5'UTR typically starts at the transcription start site and ends just before the translation start site or the start codon of the coding region. The 5'UTR can modulate the stability and/or translation of an mRNA transcript.

[00242] Используемый в настоящем документе термин «энхансер экспрессии растительного происхождения» относится к нуклеотидной последовательности, полученной из растения, нуклеотидной последовательности, кодирующей 5'UTR. Примеры энхансера экспрессии растительного происхождения описаны в предварительной заявке на патент США №62/643053 (поданной 14 марта 2018 г.; которая включена в настоящий документ посредством ссылки) или в публикации Diamos A.G. et al. (2016, Front Plt Sci. 7: 1-15; которая включена в настоящий документ посредством ссылки). Энхансер экспрессии растительного происхождения может быть выбран из nbMT78, nbATL75, nbDJ46, nbCHP79, nbEN42, atHSP69, atGRP62, atPK65, atRP46, nb30S72, nbGT61, nbPV55, nbPPI43, nbPM64 и nbH2A, как описано в US 62/533A). Энхансер экспрессии растительного происхождения может использоваться в системе экспрессии растений, содержащей регуляторную область, которая функционально связана с последовательностью энхансера экспрессии растительного происхождения и представляющей интерес нуклеотидной последовательностью.[00242] As used herein, the term "plant derived expression enhancer" refers to a nucleotide sequence derived from a plant, a nucleotide sequence encoding a 5'UTR. Examples of a plant derived expression enhancer are described in U.S. Provisional Application No. 62/643053 (filed March 14, 2018; incorporated herein by reference) or Diamos A.G. et al. (2016, Front Plt Sci. 7: 1-15; which is incorporated herein by reference). The plant derived expression enhancer can be selected from nbMT78, nbATL75, nbDJ46, nbCHP79, nbEN42, atHSP69, atGRP62, atPK65, atRP46, nb30S72, nbGT61, nbPV55, nbPPI43, nbPM64, and nbH2A, as described in US 62/533A). A plant derived expression enhancer can be used in a plant expression system comprising a regulatory region that is operably linked to a plant derived expression enhancer sequence and a nucleotide sequence of interest.

[00243] Под «функционально связанными» подразумевается, что конкретные последовательности взаимодействуют либо прямо, либо опосредованно для выполнения намеченной функции, такой как опосредование или модуляция экспрессии последовательности нуклеиновой кислоты. Взаимодействие функционально связанных последовательностей может, например, опосредоваться белками, которые взаимодействуют с функционально связанными последовательностями.[00243] By "operably linked" is meant that particular sequences interact either directly or indirectly to perform an intended function, such as mediating or modulating the expression of a nucleic acid sequence. The interaction of operably linked sequences may, for example, be mediated by proteins that interact with operably linked sequences.

[00244] Когда один или более чем один мутантный белок НА гриппа экспрессируется в растении, части растения или растительной клетке, один или более чем один мутантный белок НА гриппа самособирается в VLP. Растение, часть растения или растительную клетку можно собирать в подходящих условиях экстракции и очистки для поддержания целостности VLP, и VLP, содержащие один или более чем один мутантный НА гриппа, можно очищать.[00244] When one or more mutant influenza HA proteins are expressed in a plant, plant part, or plant cell, the one or more mutant influenza HA proteins self-assemble into VLPs. The plant, plant part, or plant cell can be harvested under suitable extraction and purification conditions to maintain the integrity of the VLP, and VLPs containing one or more influenza HA mutants can be purified.

[00245] В настоящем изобретение также предусмотрено применение мутантного НА гриппа или VLP, содержащей мутантный НА гриппа, как описано в настоящем документе, для индукции иммунитета к инфекции гриппа у субъекта. В настоящем документе также раскрыто антитело или фрагмент антитела, полученные путем введения мутантного НА гриппа или VLP, содержащего мутантный НА гриппа, субъекту или животному-хозяину. Кроме того, предусмотрена композиция, содержащая эффективную дозу мутантного НА гриппа или VLP, содержащей мутантный НА гриппа, как описано в настоящем документе, и фармацевтически приемлемый носитель, адъювант, наполнитель или вспомогательное вещество для индукции иммунного ответа у субъекта. Также предусмотрена вакцина для индукции иммунного ответа у субъекта, которая содержит эффективную дозу мутантного НА гриппа.[00245] The present invention also contemplates the use of a mutant influenza HA, or a VLP containing a mutant influenza HA, as described herein, to induce immunity to influenza infection in a subject. Also disclosed herein is an antibody or antibody fragment obtained by introducing a mutant influenza HA or a VLP containing a mutant influenza HA into a subject or host animal. Also provided is a composition comprising an effective dose of a mutant influenza HA or a VLP comprising a mutant influenza HA as described herein and a pharmaceutically acceptable carrier, adjuvant, excipient or excipient for inducing an immune response in a subject. Also provided is a vaccine for inducing an immune response in a subject that contains an effective dose of HA mutant influenza.

[00246] В настоящем документе также представлены способы индукции иммунитета к инфекции гриппа у субъекта, предусматривающие введение субъекту мутантного НА гриппа или VLP, содержащей мутантный НА гриппа, перорально, интраназально, внутримышечно, внутрибрюшинно, внутривенно или подкожно.[00246] Also provided herein are methods of inducing immunity to influenza infection in a subject, comprising administering to the subject an influenza HA mutant, or a VLP containing the influenza HA mutant, orally, intranasally, intramuscularly, intraperitoneally, intravenously, or subcutaneously.

[00247] Используемый в настоящем документе термин «вирус гриппа» относится к штамму оболочечных вирусов семейства Orthomyxoviridae, который характеризуется геномом отрицательно направленной одноцепочечной РНК. Геном вируса гриппа содержит восемь генных сегментов, кодирующих 12-14 белков в зависимости от штамма.[00247] As used herein, the term "influenza virus" refers to a strain of enveloped viruses in the Orthomyxoviridae family that is characterized by a negatively directed single-stranded RNA genome. The influenza virus genome contains eight gene segments encoding 12-14 proteins, depending on the strain.

[00248] Существует четыре типа вируса гриппа: А, В, С и D, из которых грипп А или В являются возбудителями сезонных эпидемий заболеваний у людей. Грипп А дополнительно классифицируется на основе экспрессии подтипов гликопротеинов НА и нейраминидазы (NA).[00248] There are four types of influenza virus: A, B, C and D, of which influenza A or B are the causative agents of seasonal epidemics of diseases in humans. Influenza A is further classified based on the expression of HA and neuraminidase (NA) glycoprotein subtypes.

[00249] Используемый в настоящем документе термин «гемагглютинин» или «НА» относится к тримерному лектину, который облегчает связывание частицы вируса гриппа с белками, содержащими сиаловую кислоту, на поверхности клеток-мишеней и опосредует высвобождение вирусного генома в клетку-мишень. Существует 18 различных подтипов НА (Н1-Н18). Белки НА состоят из двух структурных элементов: головки, которая является основной мишенью серопротекторных антител; и ножки. НА транслируется как единый полипептид, НАО (собранный в виде тримеров), который должен расщепляться сериновой эндопротеазой между субдоменами НА1 (~40 кДа) и НА2 (~20 кДа). После расщепления два домена белка с дисульфидной связью принимают необходимую конформацию, необходимую для вирусной инфекционности.[00249] As used herein, the term "hemagglutinin" or "HA" refers to a trimeric lectin that facilitates the binding of an influenza virus particle to sialic acid-containing proteins on the surface of target cells and mediates the release of the viral genome into the target cell. There are 18 different subtypes of HA (H1-H18). HA proteins consist of two structural elements: the head, which is the main target of seroprotective antibodies; and legs. HA is translated as a single polypeptide, HAO (assembled as trimers), which must be cleaved by a serine endoprotease between the HA1 (~40 kDa) and HA2 (~20 kDa) subdomains. After cleavage, the two domains of the disulfide-linked protein assume the necessary conformation required for viral infectivity.

[00250] Белки НА гриппа А или модифицированные белки НА гриппа А, как раскрыто в настоящем документе, включают в себя любые известные белки НА, полученные из любого известного штамма гриппа А, а также модификации известных штаммов гриппа А, которые развиваются с течением времени. Например, НА гриппа может происходить из A/Hong Kong/4801/14 (H3N2), A/Minnesota/40/15 (H3N2), A/South Australia/1/16 (H3N2), A/Bangkok/3007/15 (H3N2), A/Switzerland/9715293/13 (H3N2), A/Mississippi/16/16 (H3N2) или A/Pennsylvania/09/2015 (H3N2). НА гриппа А может включать в себя НА, полученный из штаммов, где НА характеризуется идентичностью аминокислотной последовательности, составляющей приблизительно 30-100% или любое число между ними, по отношению к любому НА, полученному из штаммов гриппа А, перечисленных выше, при условии, что белок НА гриппа содержит по меньшей мере одну замену, как описано в настоящем документе, и способен образовывать VLP, индуцирует иммунный ответ при введении субъекту, индуцирует гемагглютинацию или их комбинацию.[00250] Influenza A HA proteins or modified influenza A HA proteins as disclosed herein include any known HA proteins derived from any known influenza A strain, as well as modifications of known influenza A strains that evolve over time. For example, influenza HA may be derived from A/Hong Kong/4801/14 (H3N2), A/Minnesota/40/15 (H3N2), A/South Australia/1/16 (H3N2), A/Bangkok/3007/15 ( H3N2), A/Switzerland/9715293/13 (H3N2), A/Mississippi/16/16 (H3N2) or A/Pennsylvania/09/2015 (H3N2). Influenza A HA may include HA derived from strains where the HA has an amino acid sequence identity of approximately 30-100%, or any number in between, to any HA derived from the influenza A strains listed above, provided that the influenza HA protein contains at least one substitution as described herein and is capable of forming a VLP, inducing an immune response when administered to a subject, inducing hemagglutination, or a combination thereof.

[00251] Например, белки НА гриппа могут характеризоваться идентичностью аминокислотной последовательности (сходством последовательности, процентом идентичности, процентом сходства), составляющим 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100% или любое число между ними, по отношению к любым НА, полученным из перечисленных выше штаммов гриппа А, и содержать по меньшей мере одну замену, как описано в настоящем документе, и способны образовывать VLP, индуцировать иммунный ответ при введении субъекту, индуцировать гемагглютинацию или их комбинацию. Выравнивание аминокислотных последовательностей нескольких доменов НА гриппа А, которые не следует рассматривать как ограничивающие, показано на фиг. 1.[00251] For example, influenza HA proteins can have an amino acid sequence identity (sequence similarity, percent identity, percent similarity) of 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54 , 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100% or any number between them, with respect to any HA derived from the influenza A strains listed above, and contain at least one substitution, as described herein, and are capable of forming a VLP, inducing an immune response when administered to a subject, inducing hemagglutination, or a combination of both. An alignment of the amino acid sequences of several influenza A HA domains, which should not be considered limiting, is shown in FIG. 1.

[00252] Термины «процент сходства», «сходство последовательностей», «процент идентичности» или «идентичность последовательностей», когда они относятся к конкретной последовательности, используются, например, как изложено в программном обеспечении GCG Университета Висконсина, или путем выравнивания вручную и визуального осмотра (смотрите, например, Current Protocols in Molecular Biology, Ausubel et al., eds. 1995, приложение). Способы выравнивания последовательностей для сравнения хорошо известны в настоящей области техники. Оптимальное выравнивание последовательностей для сравнения может быть проведено, например, с использованием алгоритма локальной гомологии Smith & Waterman, (1981, Adv. Appl. Math. 2:482), с помощью алгоритма выравнивания гомологии Needleman & Wunsch, (1970, J. Mol. Biol. 48:443), способом поиска сходства Pearson & Lipman, (1988, Proc. Natl. Acad. Sci. USA 85:2444), с помощью компьютеризированных реализаций этих алгоритмов (например, GAP, BESTFIT, FASTA и TFASTA в пакете программного обеспечения Wisconsin Genetics Software Package, Genetics Computer Group (GCG), 575 Science Dr., Madison, Wis.).[00252] The terms "percent similarity", "sequence similarity", "percent identity", or "sequence identity", when referring to a particular sequence, are used, for example, as set forth in the University of Wisconsin GCG software, or by manual and visual alignment. inspection (see, for example, Current Protocols in Molecular Biology, Ausubel et al., eds. 1995, appendix). Methods for aligning sequences for comparison are well known in the art. Optimal sequence alignment for comparison can be performed, for example, using the local homology algorithm of Smith & Waterman, (1981, Adv. Appl. Math. 2:482), using the homology alignment algorithm of Needleman & Wunsch, (1970, J. Mol. Biol. 48:443), the Pearson & Lipman similarity search method, (1988, Proc. Natl. Acad. Sci. USA 85:2444), using computerized implementations of these algorithms (for example, GAP, BESTFIT, FASTA and TFASTA in a software package Wisconsin Genetics Software Package, Genetics Computer Group (GCG), 575 Science Dr., Madison, Wis.).

[00253] Примером алгоритма, подходящего для определения процента идентичности последовательностей и сходства последовательностей, являются алгоритмы BLAST и BLAST 2.0, которые описаны в Altschul et al., (1977, Nuc. Acids Res. 25: 3389-3402) и Altschul et al. (1990, J. Mol. Biol. 215: 403-410), соответственно. BLAST и BLAST 2.0 используются с параметрами, описанными в настоящем документе, для определения процента идентичности последовательностей нуклеиновых кислот и белков по настоящему изобретению. Например, программа BLASTN (для нуклеотидных последовательностей) может использовать по умолчанию длину слова (W), равную 11, математическое ожидание (Е), равное 10, М=5, N=-4 и сравнение обеих цепей. Для аминокислотных последовательностей программа BLASTP может использовать по умолчанию длину слова 3 и математическое ожидание (Е) 10, а также оценочную матрицу BLOSUM62 (смотрите Henikoff & Henikoff, 1989, Proc. Natl. Acad. Sci. USA 89: 10915) выравнивания (В) 50, математическое ожидание (Е) 10, М=5, N=-4, и сравнение обеих цепей. Программное обеспечение для проведения анализов BLAST общедоступно через Национальный центр биотехнологической информации (смотрите URL: ncbi.nlm.nih.gov/).[00253] An example of an algorithm suitable for determining percent sequence identity and sequence similarity are the BLAST and BLAST 2.0 algorithms, which are described in Altschul et al., (1977, Nuc. Acids Res. 25: 3389-3402) and Altschul et al. (1990, J. Mol. Biol. 215: 403-410), respectively. BLAST and BLAST 2.0 are used with the parameters described herein to determine the percent sequence identity of the nucleic acids and proteins of the present invention. For example, the BLASTN program (for nucleotide sequences) may default to a word length (W) of 11, an expectation value (E) of 10, M=5, N=-4, and a comparison of both strands. For amino acid sequences, BLASTP can use a default word length of 3 and a mean (E) of 10, as well as a BLOSUM62 scoring matrix (see Henikoff & Henikoff, 1989, Proc. Natl. Acad. Sci. USA 89: 10915) of alignment (B) 50, expectation value (E) 10, M=5, N=-4, and comparison of both circuits. BLAST analysis software is publicly available through the National Center for Biotechnology Information (see URL: ncbi.nlm.nih.gov/).

[00254] Используемый в настоящем документе термин «вирусоподобная частица», VLP, «вирусоподобные частицы» или «VLP» относится к частицам вируса гриппа, которые содержат один или более чем один белок НА гриппа и которые самособираются в нереплицирующиеся, неинфекционные структуры вирусного капсида, лишенные всех частей генома гриппа.[00254] As used herein, the term "virus-like particle", VLP, "virus-like particles", or "VLP" refers to influenza virus particles that contain one or more influenza HA proteins and that self-assemble into non-replicating, non-infectious viral capsid structures, stripped of all parts of the influenza genome.

Производство белка НА гриппа в растенияхInfluenza HA protein production in plants

Белок НА гриппа А включает в себя любой белок НА, содержащий аминокислотную последовательность, характеризующуюся идентичностью последовательности или сходством последовательности, составляющим от приблизительно 30 до приблизительно 100%, от приблизительно 40 до приблизительно 100%, от приблизительно 50 до приблизительно 100%, от приблизительно 60 до приблизительно 100%, от приблизительно 70 до приблизительно 100%, от приблизительно 80 до приблизительно 100%, от приблизительно 85 до приблизительно 100%, от приблизительно 90 до приблизительно 100%, от 95 до приблизительно 100% или от приблизительно 97 до приблизительно 100%, от приблизительно 98 до приблизительно 100% или любое число между ними, по отношению к последовательности НА гриппа А из A/Hong Kong/4801/14 (H3N2, SEQ ID NO: 92), A/Minnesota/40/15 (H3N2, SEQ ID NO: 93), A/South Australia/1/16 (H3N2, SEQ ID NO: 94), A/Bangkok/3007/15 (H3N2, SEQ ID NO: 91), A/Switzerland/9715293/13 (H3N2, SEQ ID NO: 96), A/Mississippi/16/16 (H3N2, SEQ ID NO: 97) и A/Pennsylvania/09/2015 (H3N2, SEQ ID NO: 95), при условии, что белок НА гриппа содержит по меньшей мере одну замену, как описано в настоящем документе, и способен образовывать VLP, вызывает иммунный ответ при введении субъекту, вызывает гемагглютинацию или их комбинацию.The influenza A HA protein includes any HA protein containing an amino acid sequence having sequence identity or sequence similarity of about 30% to about 100%, about 40% to about 100%, about 50% to about 100%, about 60% to about 100%, from about 70 to about 100%, from about 80 to about 100%, from about 85 to about 100%, from about 90 to about 100%, from 95 to about 100%, or from about 97 to about 100 %, from about 98 to about 100%, or any number in between, relative to the influenza A HA sequence of A/Hong Kong/4801/14 (H3N2, SEQ ID NO: 92), A/Minnesota/40/15 (H3N2 , SEQ ID NO: 93), A/South Australia/1/16 (H3N2, SEQ ID NO: 94), A/Bangkok/3007/15 (H3N2, SEQ ID NO: 91), A/Switzerland/9715293/13 (H3N2, SEQ ID NO: 96), A/Mississippi/16/16 (H3N2, SEQ ID NO: 97) and A/Pennsylvania/09/2015 (H3N2, SEQ ID NO: 95), provided that the HA protein influenza contains at least one substitution, as described herein, and is capable of forming a VLP, inducing an immune response when administered to a subject, inducing hemagglutination, or a combination thereof.

[00255] Кроме того, модифицированный белок НА гриппа включает в себя любой белок НА, содержащий аминокислотную последовательность, характеризующуюся идентичностью последовательности или сходством последовательности, составляющим от приблизительно 30% до приблизительно 100%, от приблизительно 40% до приблизительно 100%, от приблизительно 50% до приблизительно 100%, от приблизительно 60%. до приблизительно 100%, от приблизительно 70% до приблизительно 100%, от приблизительно 80% до приблизительно 100%, от приблизительно 85% до приблизительно 100%, от приблизительно 90% до приблизительно 100%, от 95% до приблизительно 100% или от приблизительно 97% до приблизительно 100%, от приблизительно 98% до приблизительно 100% или любое число между ними, по отношению к последовательности из последовательностей SEQ ID NO: 25, SEQ ID NO: 30, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 53, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, при условии, что белок НА гриппа содержит по меньшей мере одну замену, как описано в настоящем документе, и способен образовывать VLP, вызывает иммунный ответ при введении субъекту, индуцирует гемагглютинацию или их комбинацию.[00255] In addition, the modified influenza HA protein includes any HA protein containing an amino acid sequence characterized by sequence identity or sequence similarity of from about 30% to about 100%, from about 40% to about 100%, from about 50 % to about 100%, from about 60%. to about 100%, from about 70% to about 100%, from about 80% to about 100%, from about 85% to about 100%, from about 90% to about 100%, from 95% to about 100%, or from about 97% to about 100%, about 98% to about 100%, or any number in between, relative to the sequence of SEQ ID NO: 25, SEQ ID NO: 30, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 53, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, provided that the influenza HA protein contains at least one substitution as described herein and is capable of forming a VLP, causes an immune response, when administered to a subject, induces hemagglutination, or a combination thereof.

[00256] Как описано в настоящем документе, одна или более специфических мутаций или модификаций НА гриппа приводит к повышенному накоплению белка НА и увеличению продукции VLP в растениях по сравнению с НА гриппа дикого типа.[00256] As described herein, one or more specific mutations or modifications in influenza HA result in increased accumulation of HA protein and increased VLP production in plants compared to wild-type influenza HA.

[00257] Примеры мутантных белков НА гриппа А, характеризующихся повышенной продукцией НА и/или VLP вируса гриппа в растениях, включают в себя, без ограничения, следующие:[00257] Examples of mutant influenza A HA proteins characterized by increased production of influenza A HA and/or VLP in plants include, without limitation, the following:

мутант CysTM A/Hong Kong/4801/14 Н3 (конструкция №3341, SEQ ID NO: 21), мутант N382A + L384V + CysTM A/Hong Kong/4801/14 Н3 (конструкция №3375, SEQ ID NO: 25); мутант CysTM A/Minnesota/40/15 Н3 (конструкция №3914, SEQ ID NO: 27); мутант N382A + L384V + CysTM A/Minnesota/40/15 Н3 (конструкция №3915, SEQ ID NO: 30); мутант CysTM A/S. Australia/1/16 Н3 (конструкция №3924, SEQ ID NO: 33); мутант N382A + L384V + CysTM A/S. Australia/1/16 Н3 (конструкция №3925, SEQ ID NO: 35); мутант N382A + L384V + CysTM A/Bangkok/3007/15 Н3 (конструкция №3905, SEQ ID NO: 39); мутант N382A A/Switzerland/9715293/13 Н3 (конструкция №3023, SEQ ID NO: 82); мутант L384V A/Switzerland/9715293/13 Н3 (конструкция №3034, SEQ ID NO: 84); мутант F392D A/Switzerland/9715293/13 Н3 (конструкция №3045, SEQ ID NO: 43; мутант L431M A/Switzerland/9715293/13 Н3 (конструкция №3022, SEQ ID NO: 47); мутант CysTM A/Switzerland/9715293/13 Н3 (конструкция №2811, SEQ ID NO: 49); мутант N382A + CysTM A/Switzerland/9715293/13 Н3 (конструкция №3063, SEQ ID NO: 53); мутант L384V + CysTM A/Switzerland/9715293/13 Н3 (конструкция №3074, SEQ ID NO: 57); мутант F392D + CysTM A/Switzerland/9715293/13 Н3 (конструкция №3085, SEQ ID NO: 59) и мутант L431M + CysTM A/Switzerland/9715293/13 Н3 (конструкция №3062, SEQ ID NO: 61), мутант CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3313, SEQ ID NO: 86), мутант N382A + CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3314, SEQ ID NO: 88) и мутант L384V + CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3315, SEQ ID NO: 90).mutant CysTM A/Hong Kong/4801/14 H3 (construct No. 3341, SEQ ID NO: 21), mutant N382A + L384V + CysTM A/Hong Kong/4801/14 H3 (construct No. 3375, SEQ ID NO: 25); mutant CysTM A/Minnesota/40/15 H3 (construct No. 3914, SEQ ID NO: 27); mutant N382A + L384V + CysTM A/Minnesota/40/15 H3 (construct #3915, SEQ ID NO: 30); CysTM A/S mutant. Australia/1/16 H3 (design #3924, SEQ ID NO: 33); mutant N382A + L384V + CysTM A/S. Australia/1/16 H3 (design #3925, SEQ ID NO: 35); mutant N382A + L384V + CysTM A/Bangkok/3007/15 H3 (construct No. 3905, SEQ ID NO: 39); mutant N382A A/Switzerland/9715293/13 H3 (construct No. 3023, SEQ ID NO: 82); mutant L384V A/Switzerland/9715293/13 H3 (construct No. 3034, SEQ ID NO: 84); mutant F392D A/Switzerland/9715293/13 H3 (construct #3045, SEQ ID NO: 43; mutant L431M A/Switzerland/9715293/13 H3 (construct #3022, SEQ ID NO: 47); mutant CysTM A/Switzerland/9715293 /13 H3 (construct #2811, SEQ ID NO: 49), mutant N382A + CysTM A/Switzerland/9715293/13 H3 (construct #3063, SEQ ID NO: 53), mutant L384V + CysTM A/Switzerland/9715293/13 H3 (construct #3074, SEQ ID NO: 57), mutant F392D + CysTM A/Switzerland/9715293/13 H3 (construct #3085, SEQ ID NO: 59) and mutant L431M + CysTM A/Switzerland/9715293/13 H3 ( construct No. 3062, SEQ ID NO: 61), CysTM A/Pennsylvania/09/2015 H3 mutant (construct No. 3313, SEQ ID NO: 86), N382A + CysTM A/Pennsylvania/09/2015 H3 mutant (construct No. 3314, SEQ ID NO: 88) and the L384V + CysTM A/Pennsylvania/09/2015 H3 mutant (construct #3315, SEQ ID NO: 90).

Индукция иммунитета против инфекции гриппаInduction of immunity against influenza infection

[00258] «Иммунный ответ», как правило, относится к ответу адаптивной иммунной системы субъекта. Адаптивная иммунная система, как правило, включает в себя гуморальный ответ и клеточно-опосредованный ответ. Гуморальный ответ представляет собой аспект иммунитета, который опосредуется секретируемыми антителами, производимыми клетками линии В-лимфоцитов (В-клетками). Секретируемые антитела связываются с антигенами на поверхности вторгающихся микробов (таких как вирусы или бактерии), что указывает на их уничтожение. Гуморальный иммунитет, как правило, используется для обозначения производства антител и процессов, которые его сопровождают, а также эффекторных функций антител, включая в себя активацию Th2-клеток и продукцию цитокинов, образование клеток памяти, опсониновую стимуляцию фагоцитоза, элиминацию патогенов и т.п. Термины «модулировать» или «модуляция» или подобные относятся к увеличению или уменьшению конкретного ответа или параметра, как определено любым из нескольких общеизвестных или используемых анализов, некоторые из которых приведены в настоящем документе в качестве примеров.[00258] "Immune response" generally refers to the response of the subject's adaptive immune system. The adaptive immune system typically includes a humoral response and a cell-mediated response. The humoral response is an aspect of immunity that is mediated by secreted antibodies produced by the B-lymphocyte lineage (B-cells). Secreted antibodies bind to antigens on the surface of invading microbes (such as viruses or bacteria), indicating their destruction. Humoral immunity is generally used to refer to the production of antibodies and the processes that accompany it, as well as the effector functions of antibodies, including Th2 cell activation and cytokine production, memory cell formation, opsonin stimulation of phagocytosis, pathogen elimination, and the like. The terms "modulate" or "modulation" or the like refer to an increase or decrease in a particular response or parameter, as defined by any of several commonly known or used assays, some of which are provided herein as examples.

[00259] Клеточно-опосредованный ответ представляет собой иммунный ответ, который не включает в себя антитела, а скорее включает в себя активацию макрофагов, естественных клеток-киллеров (NK), антигенспецифических цитотоксических Т-лимфоцитов и высвобождение различных цитокинов в ответ на антиген. Клеточно-опосредованный иммунитет, как правило, используется для обозначения некоторой активации Th-клеток, активации Тс-клеток и опосредованных Т-клетками ответов. Клеточный иммунитет может иметь особое значение в ответ на вирусные инфекции.[00259] A cell-mediated response is an immune response that does not involve antibodies, but rather includes the activation of macrophages, natural killer (NK) cells, antigen-specific cytotoxic T lymphocytes, and the release of various cytokines in response to an antigen. Cell mediated immunity is generally used to refer to some Th cell activation, Tc cell activation, and T cell mediated responses. Cellular immunity may be of particular importance in response to viral infections.

[00260] Например, индукцию антигенспецифических CD8-положительных Т-лимфоцитов можно измерить с помощью анализа ELISPOT; стимуляцию CD4-положительных Т-лимфоцитов можно измерить с помощью анализа пролиферации. Титры антител к НА гриппа можно количественно определить с помощью анализа ELISA; изотипы антигенспецифических или перекрестно-реактивных антител также можно измерить с использованием антиизотипических антител (например, к IgG, IgA, IgE или IgM). Способы и технологии проведения таких анализов хорошо известны в настоящей области техники.[00260] For example, the induction of antigen-specific CD8-positive T-lymphocytes can be measured using an ELISPOT assay; stimulation of CD4-positive T-lymphocytes can be measured using a proliferation assay. Influenza HA antibody titers can be quantified using an ELISA assay; isotypes of antigen-specific or cross-reactive antibodies can also be measured using anti-isotypic antibodies (for example, to IgG, IgA, IgE or IgM). Methods and techniques for performing such assays are well known in the art.

[00261] Присутствие или уровни цитокинов также могут быть определены количественно. Например, ответ Т-хелперных клеток (Th1/Th2) будет охарактеризован путем измерения клеток, секретирующих IFN-β и IL-4, с использованием ELISA (например, наборов BD Biosciences OptEIA). Мононуклеарные клетки периферической крови (РВМС) или спленоциты, полученные от субъекта, можно культивировать, а супернатант анализировать. Т-лимфоциты также могут быть количественно определены с помощью сортировки активируемых флуоресценцией клеток (FACS) с использованием маркерных флуоресцентных меток и способов, известных в настоящей области техники.[00261] The presence or levels of cytokines can also be quantified. For example, T helper cell (Th1/Th2) response will be characterized by measuring IFN-β and IL-4 secreting cells using ELISA (eg, BD Biosciences OptEIA kits). Peripheral blood mononuclear cells (PBMCs) or splenocytes obtained from a subject can be cultured and the supernatant analyzed. T lymphocytes can also be quantified by fluorescence activated cell sorting (FACS) using marker fluorescent labels and methods known in the art.

[00262] Анализ микронейтрализации также может быть проведен для характеристики иммунного ответа у субъекта, смотрите, например, способы Rowe et al., 1973. Титры нейтрализации вируса могут быть определены количественно несколькими способами, включая в себя: подсчет гемолитических бляшек лизиса (анализ бляшкообразования) после фиксации/окрашивания клеток кристаллическим фиолетовым; исследование под микроскопом лизиса клеток в культуре in vitro и 2) ELISA и спектрофотометрическое определение вируса гриппа.[00262] A microneutralization assay can also be performed to characterize the immune response in a subject, see e.g. methods of Rowe et al., 1973. Virus neutralization titers can be quantified in several ways, including: hemolytic plaque lysis count (plaque assay) after fixation/staining of cells with crystal violet; microscopic examination of cell lysis in in vitro culture; and 2) ELISA and spectrophotometric detection of influenza virus.

[00263] Используемый в настоящем документе термин «эпитоп» или «эпитопы» относится к структурной части антигена, с которой специфически связывается антитело.[00263] As used herein, the term "epitope" or "epitopes" refers to the structural portion of an antigen to which an antibody specifically binds.

[00264] Иммунные ответы, вызванные в ответ на введение белков НА гриппа дикого типа или VLP или мутантных белков НА гриппа или VLP растительного происхождения, могут, например, наблюдаться у мышей Balb/C. Образцы сыворотки крови, взятой у животных, могут быть проанализированы с помощью ELISA на Н3-специфические общие антитела IgG и IgA. Мыши, иммунизированные белками НА гриппа дикого типа или мутантными белками НА гриппа растительного происхождения, могут проявлять титры НА-специфических антител IgG в сыворотках для каждой группы лечения.[00264] Immune responses elicited in response to administration of wild-type influenza HA proteins or VLPs or mutant influenza HA proteins or plant-derived VLPs can, for example, be observed in Balb/C mice. Animal serum samples can be analyzed by ELISA for H3-specific total IgG and IgA antibodies. Mice immunized with wild-type influenza HA proteins or plant-derived mutated influenza HA proteins may exhibit HA-specific IgG antibody titers in sera for each treatment group.

Экспрессия в растенияхExpression in plants

[00265] Конструкции по настоящему изобретению могут быть введены в клетки растений с использованием плазмид Ti, плазмид Ri, векторов растительных вирусов, прямой трансформации ДНК, микроинъекции, электропорации и т.д. Для обзоров таких способов смотрите, например, Weissbach and Weissbach, Methods for Plant Molecular Biology, Academy Press, New York VIII, pp. 421-463 (1988); Geierson and Corey, Plant Molecular Biology, 2d Ed. (1988) и Miki and Iyer, Fundamentals of Gene Transfer in Plants. In Plant Metabolism, 2d Ed. DT. Dennis, DH Turpin, DD Lefebrvre, DB Layzell (eds), Addison Wesly, Langmans Ltd. London, pp. 561-579 (1997). Другие способы предусматривают прямое поглощение ДНК, использование липосом, электропорацию, например, с использованием протопластов, микроинъекцию, микрочастицы или нитевидные кристаллы и вакуумную инфильтрацию. Смотрите, например, Bilang, et al. (1991, Gene 100: 247-250), Scheid et al. (1991, Mol. Gen. Genet. 228: 104-112), Guerche et al. (1987, Plant Science 52: 111-116), Neuhause et al. (1987, Theor. Appl Genet. 75: 30-36), Klein et al. (2987, Nature 327: 70-73); Freeman et al. (1984, Plant Cell Physiol. 29: 1353), Howell et al. (1985, Science 227: 1229-1231), DeBlock et al. (1989, Plant Physiology 91: 694-701), Способы молекулярной биологии растений (Weissbach and Weissbach, eds., Academic Press Inc., 1988), Способы в молекулярной биологии растений (Schuler and Zielinski, eds., Academic Press Inc., 1989), публикации международной заявки WO 92/09696, WO 94/00583, Европейские патенты ЕР 331083, ЕР 175966, Liu and Lomonossoff (2002, J Virol Meth, 105: 343-348), Европейский патент ЕР 290395; публикацию международной заявки WO 8706614; патенты США №4945050; 5036006 и 5100792, заявку на патент США №08/438666, поданную 10 мая 1995 г., и 07/951715, поданную 25 сентября 1992 г. (все они включены в настоящий документ посредством ссылки).[00265] The constructs of the present invention can be introduced into plant cells using Ti plasmids, Ri plasmids, plant virus vectors, direct DNA transformation, microinjection, electroporation, etc. For reviews of such methods see, for example, Weissbach and Weissbach, Methods for Plant Molecular Biology, Academy Press, New York VIII, pp. 421-463 (1988); Geierson and Corey, Plant Molecular Biology, 2d Ed. (1988) and Miki and Iyer, Fundamentals of Gene Transfer in Plants. In Plant Metabolism, 2d Ed. D.T. Dennis, D.H. Turpin, D.D. Lefebrvre, D.B. Layzell (eds), Addison Wesly, Langmans Ltd. London, pp. 561-579 (1997). Other methods include direct DNA uptake, the use of liposomes, electroporation, for example using protoplasts, microinjection, microparticles or whiskers, and vacuum infiltration. See, for example, Bilang, et al. (1991, Gene 100: 247-250), Scheid et al. (1991, Mol. Gen. Genet. 228: 104-112), Guerche et al. (1987, Plant Science 52: 111-116), Neuhause et al. (1987, Theor. Appl Genet. 75: 30-36), Klein et al. (2987, Nature 327:70-73); Freeman et al. (1984, Plant Cell Physiol. 29: 1353), Howell et al. (1985, Science 227: 1229-1231), DeBlock et al. (1989, Plant Physiology 91: 694-701), Methods in Plant Molecular Biology (Weissbach and Weissbach, eds., Academic Press Inc., 1988), Methods in Plant Molecular Biology (Schuler and Zielinski, eds., Academic Press Inc., 1989), international patent publications WO 92/09696, WO 94/00583, EP 331083, EP 175966, Liu and Lomonossoff (2002, J Virol Meth, 105: 343-348), EP 290395; publication of international application WO 8706614; US patents No. 4945050; 5,036,006 and 5,100,792, US Patent Application No. 08/438666 filed May 10, 1995, and 07/951715 filed September 25, 1992 (all incorporated herein by reference).

[00266] Способы временной экспрессии могут быть использованы для экспрессии конструкций по настоящему изобретению (смотрите публикации D'Aoust et al., 2009, Methods in molecular biology, Vol 483, pages41-50; Liu and Lomonossoff, 2002, Journal of Virological Methods, 105:343-348, которые включены в настоящий документ посредством ссылки). Альтернативно, способ временной экспрессии на основе вакуума, как описано в публикации Kapila et al. (1997, Plant Sci. 122, 101-108; которая включена в настоящий документ посредством ссылки) или публикациях международных заявок WO 00/063400, WO 00/037663 (которые включены в настоящий документ посредством ссылки). Эти способы могут включать в себя, например, без ограничения, способ агроинокуляции или агроинфильтрации, шприцевой инфильтрации, однако, как указано выше, могут также использоваться другие временные способы. При агроинокуляции, агроинфильтрации или шприцевой инфильтрации смесь агробактерий, содержащая желаемую нуклеиновую кислоту, проникает в межклеточные пространства ткани, например, в листья, надземную часть растения (включая в себя стебель, листья и цветок), другие часть растения (стебель, корень, цветок) или все растение. После пересечения эпидермиса агробактерий инфицируют и переносят копии т-ДНК в клетки. т-ДНК транскрибируется эписомально, а мРНК транслируется, что приводит к производству представляющего интерес белка в инфицированных клетках, однако прохождение т-ДНК внутри ядра является временным.[00266] Transient expression methods can be used to express constructs of the present invention (see D'Aoust et al., 2009, Methods in molecular biology, Vol 483, pages 41-50; Liu and Lomonossoff, 2002, Journal of Virological Methods, 105:343-348, which are incorporated herein by reference). Alternatively, the vacuum-based transient expression method as described in Kapila et al. (1997, Plant Sci. 122, 101-108; which is incorporated herein by reference) or International Application Publications WO 00/063400, WO 00/037663 (which are incorporated herein by reference). These methods may include, for example, without limitation, the method of agroinoculation or agroinfiltration, syringe infiltration, however, as indicated above, other temporary methods can also be used. In agroinoculation, agroinfiltration or syringe infiltration, a mixture of agrobacteria containing the desired nucleic acid penetrates into the intercellular spaces of the tissue, for example, into the leaves, the aerial part of the plant (including the stem, leaves and flower), other parts of the plant (stem, root, flower) or the whole plant. After crossing the epidermis, agrobacteria are infected and copies of the t-DNA are transferred into cells. t-DNA is transcribed episomal and mRNA is translated, resulting in the production of a protein of interest in infected cells, however, the passage of t-DNA within the nucleus is transient.

[00267] Также рассматриваемой частью настоящего изобретения являются трансгенные растения, растительные клетки или семена, содержащие генную конструкцию по настоящему изобретению, которые можно использовать в качестве платформенных растений, подходящих для описанной в настоящем документе временной экспрессии белка. Способы регенерации целых растений из растительных клеток также известны в настоящей области техники (например, смотрите Guerineau and Mullineaux (1993, Plant transformation and expression vectors. In: Plant Molecular Biology Labfax (Croy RRD ed) Oxford, BIOS Scientific Publishers, pp 121-148). Как правило, трансформированные растительные клетки культивируют в подходящей среде, которая может содержать селективные средства, такие как антибиотики, причем селектируемые маркеры используются для облегчения идентификации трансформированных растительных клеток. После образования каллуса образование побегов можно стимулировать с помощью соответствующих гормонов растений в соответствии с известными способами, и побеги переносят в среду для укоренения для регенерации растений. Затем растения можно использовать для создания повторяющихся поколений либо из семян, либо с использованием способов вегетативного размножения. Трансгенные растения также могут быть получены без использования культуры ткани. Способы стабильной трансформации и регенерации этих организмов известны в настоящей области техники и известны специалисту в настоящей области техники. Доступные способы рассмотрены в Vasil et al. (Cell Culture and Somatic Cell Genetics of Plants, Vol I, Il and III, Laboratory Procedures and Their Applications, Academic Press, 1984) и Weissbach and Weissbach (Methods for Plant Molecular Biology, Academic Press, 1989). Способ получения трансформированных и регенерированных растений не является критическим для настоящего изобретения.[00267] Also contemplated by the present invention are transgenic plants, plant cells or seeds containing the gene construct of the present invention, which can be used as platform plants suitable for transient protein expression as described herein. Methods for regenerating whole plants from plant cells are also known in the art (for example, see Guerineau and Mullineaux (1993, Plant transformation and expression vectors. In: Plant Molecular Biology Labfax (Croy RRD ed) Oxford, BIOS Scientific Publishers, pp 121-148 Generally, the transformed plant cells are cultured in a suitable medium which may contain selective agents such as antibiotics, selectable markers being used to facilitate the identification of the transformed plant cells. methods, and the shoots are transferred to a rooting medium for plant regeneration.Plants can then be used to create repeat generations, either from seeds or using vegetative propagation methods.Transgenic plants can also be obtained without the use of tissue culture. Methods for stable transformation and regeneration of these organisms are known in the present technical field and known to the person skilled in the present technical field. Available methods are discussed in Vasil et al. (Cell Culture and Somatic Cell Genetics of Plants, Vol I, Il and III, Laboratory Procedures and Their Applications, Academic Press, 1984) and Weissbach and Weissbach (Methods for Plant Molecular Biology, Academic Press, 1989). The method of obtaining transformed and regenerated plants is not critical to the present invention.

[00268] Если растения, части растений или растительные клетки должны быть трансформированы или котрансформированы двумя или более конструкциями нуклеиновых кислот, конструкция нуклеиновой кислоты может быть введена в Agrobacterium за один этап трансфекции, так что нуклеиновые кислоты объединяются и бактериальные клетки трансфицируются. В качестве альтернативы конструкции можно вводить серийно. В этом случае первую конструкцию вводят в Agrobacterium, как описано, клетки выращивают в селективных условиях (например, в присутствии антибиотика), где могут расти только однократно трансформированные бактерии. После этого первого этапа отбора в Agrobacterium вводят вторую конструкцию нуклеиновой кислоты, как описано, и клетки выращивают в условиях двойной селекции, при которых могут расти только дважды трансформированные бактерии. Затем дважды трансформированные бактерии могут быть использованы для трансформации растения, части растения или растительной клетки, как описано в настоящем документе, или могут быть подвергнуты дополнительной стадии трансформации для размещения третьей конструкции нуклеиновой кислоты.[00268] If plants, plant parts, or plant cells are to be transformed or co-transformed with two or more nucleic acid constructs, the nucleic acid construct can be introduced into Agrobacterium in a single transfection step such that the nucleic acids are combined and the bacterial cells are transfected. As an alternative, the constructs can be entered serially. In this case, the first construct is introduced into Agrobacterium as described, the cells are grown under selective conditions (eg in the presence of an antibiotic) where only singly transformed bacteria can grow. After this first selection step, a second nucleic acid construct is introduced into Agrobacterium as described and the cells are grown under double selection conditions where only doubly transformed bacteria can grow. The doubly transformed bacteria can then be used to transform a plant, plant part, or plant cell as described herein, or can be subjected to an additional transformation step to accommodate a third nucleic acid construct.

[00269] Альтернативно, если растения, части растений или растительные клетки должны быть трансформированы или котрансформированы двумя или более конструкциями нуклеиновых кислот, конструкция нуклеиновой кислоты может быть введена в растение путем совместной инфильтрации смеси клеток Agrobacterium растения, части растения или растительной клетки, каждая клетка Agrobacterium может содержать одну или более конструкций для введения в растение. Для изменения относительных уровней экспрессии в растении, части растения или растительной клетке представляющей интерес нуклеотидной последовательности внутри конструкции во время стадии инфильтрации можно варьировать концентрацию различных популяций Agrobacteria, содержащих желаемые конструкции.[00269] Alternatively, if plants, plant parts, or plant cells are to be transformed or co-transformed with two or more nucleic acid constructs, the nucleic acid construct can be introduced into the plant by co-infiltrating a mixture of Agrobacterium cells of the plant, plant part, or plant cell, each Agrobacterium cell may contain one or more structures for introduction into the plant. To change the relative levels of expression in the plant, plant part, or plant cell of the nucleotide sequence of interest within the construct during the infiltration step, the concentration of different populations of Agrobacteria containing the desired constructs can be varied.

[00270] Настоящее изобретение будет дополнительно проиллюстрировано следующими примерами.[00270] The present invention will be further illustrated by the following examples.

Пример 1. Конструкции НА гриппаExample 1 Influenza HA Constructs

[00271] Конструкции НА гриппа получали с использованием способов, хорошо известных в настоящей области техники. Например, Н3 A-Switzerland/9715293/13 НА дикого типа, N382A A/Switzerland/9715293/13 Н3 НА и CysTM A-Switzerland-9715293-13 клонировали, как описано ниже. Других мутантов Н3 НА получали с использованием аналогичных способов, и праймеры, матрицы и продукты последовательностей НА описаны в примере 3 (производство НА и VLP гриппа в растениях) и в таблице 4.[00271] Influenza HA constructs were prepared using methods well known in the art. For example, wild type H3 A-Switzerland/9715293/13 HA, N382A A/Switzerland/9715293/13 H3 HA, and CysTM A-Switzerland-9715293-13 were cloned as described below. Other H3 HA mutants were generated using similar methods, and primers, templates, and HA sequence products are described in Example 3 (Influenza HA and VLP production in plants) and Table 4.

[00272] Краткое описание белков НА дикого типа и мутантов, праймеров, матриц и продуктов представлено в таблице 4 ниже. Для конструкций Н3 гриппа, отличных от белков Н3 A/Switzerland/9715293/13 НА, которые клонировали в клонирующий вектор 1190 без М2, используемый клонирующий вектор интегрирует ген ионного канала гриппа М2 под контролем промотора и терминатора пластоцианина люцерны в дополнение к кассете экспрессии на основе промотора 2X35S/CPMV 160 + CPMV 3'UTR/NOS. Плазмиду номер 3556 (SEQ ID NO: 66; фиг. 5А) расщепляли рестрикционными эндонуклеазами SacII и Still и использовали для реакции In-Fusion.[00272] A brief description of wild-type and mutant HA proteins, primers, templates, and products is provided in Table 4 below. For influenza H3 constructs other than the H3 A/Switzerland/9715293/13 HA proteins that were cloned into the 1190 M2-free cloning vector, the cloning vector used integrates the influenza M2 ion channel gene under the control of the alfalfa plastocyanin promoter and terminator in addition to the M2-based expression cassette. promoter 2X35S/CPMV 160 + CPMV 3'UTR/NOS. Plasmid number 3556 (SEQ ID NO: 66; FIG. 5A) was digested with restriction endonucleases SacII and Still and used for the In-Fusion reaction.

Модификация Н3 НАModification H3 ON

2X35S/CPMV 160/PDISP-HA0 Н3 A-Switzerland-9715293-13/NOS (конструкция номер 2801)2X35S/CPMV 160/PDISP-HA0 H3 A-Switzerland-9715293-13/NOS (design number 2801)

[00273] Последовательность, кодирующую зрелый НА0 из НА гриппа из Н3 A/Switzerland/9715293/13, слитую с сигнальным пептидом секреции PDI люцерны (PDISP), клонировали в систему экспрессии 2X35S/CPMV 160/NOS с использованием следующего способа на основе ПЦР. Фрагмент, содержащий кодирующую последовательность PDISP-H3 A/Switzerland/9715293/13, амплифицировали с использованием праймеров IF-CPMV (f15'UTR)_SpPDI.c (SEQ ID NO: 15) и IF-H3A-Ala.r (SEQ ID NO: 17), используя последовательность гена PDISP-H1 A/Switzerland/9715293/13 (SEQ ID NO: 9) в качестве матрицы. Продукт ПЦР клонировали в системе экспрессии 2X35S/CPMV 160/NOS с использованием системы клонирования In-Fusion (Clontech, Mountain View, CA). Конструкцию номер 1190 (фиг. 5В) расщепляли рестрикционными эндонуклеазами SacII и StuL и линеаризованную плазмиду использовали для реакции сборки In-Fusion. Конструкция номер 1190 представляет собой акцепторную плазмиду, предназначенную для клонирования «In Fusion» представляющих интерес генов в кассете экспрессии на основе 2X35S/CPMV 160/NOS. Она также включает в себя генную конструкцию для коэкспрессии супрессора сайленсинга TBSV Р19 под промотором и терминатором гена пластоцианина люцерны. Каркас представляет собой бинарную плазмиду pCAMBIA, а последовательность от левой границы к правой границе т-ДНК представлена в SEQ ID NO: 62. Полученной конструкции был присвоен номер 2801 (SEQ ID NO: 103). Аминокислотная последовательность зрелого НАО из НА гриппа из A/Switzerland/9715293/13, слитого с сигнальным пептидом секреции PDI люцерны (PDISP), представлена в SEQ ID NO: 10. Представление плазмиды 2801 представлено на фиг. 8J.[00273] The coding sequence for mature HA0 from influenza HA from H3 A/Switzerland/9715293/13 fused to alfalfa PDI secretion signal peptide (PDISP) was cloned into the 2X35S/CPMV 160/NOS expression system using the following PCR-based method. The fragment containing the PDISP-H3 A/Switzerland/9715293/13 coding sequence was amplified using primers IF-CPMV (f15'UTR)_SpPDI.c (SEQ ID NO: 15) and IF-H3A-Ala.r (SEQ ID NO : 17) using the A/Switzerland/9715293/13 PDISP-H1 gene sequence (SEQ ID NO: 9) as a template. The PCR product was cloned into a 2X35S/CPMV 160/NOS expression system using an In-Fusion cloning system (Clontech, Mountain View, CA). Construct number 1190 (FIG. 5B) was digested with restriction endonucleases SacII and StuL and the linearized plasmid was used for the In-Fusion assembly reaction. Construct number 1190 is an acceptor plasmid for "In Fusion" cloning of genes of interest in an expression cassette based on 2X35S/CPMV 160/NOS. It also includes a gene construct for co-expression of the TBSV silencing suppressor P19 under the promoter and terminator of the alfalfa plastocyanin gene. The framework is the pCAMBIA binary plasmid and the left-to-right t-DNA sequence is shown in SEQ ID NO: 62. The resulting construct was numbered 2801 (SEQ ID NO: 103). The amino acid sequence of mature HAO from influenza HA from A/Switzerland/9715293/13 fused to alfalfa PDI secretion signal peptide (PDISP) is shown in SEQ ID NO: 10. A representation of plasmid 2801 is shown in FIG. 8J.

2X35S/CPMV 160/PDISP-HA0 Н3 A-Switzerland-9715293-13 (N382AYNOS (конструкция номер 3023)2X35S/CPMV 160/PDISP-HA0 H3 A-Switzerland-9715293-13 (N382AYNOS (design number 3023)

[00274] Последовательность, кодирующую зрелый НАО из НА гриппа из A/Switzerland/9715293/13 (N382A), слитую с сигнальным пептидом секреции PDI люцерны (PDISP), клонировали в систему экспрессии 2X35S/CPMV 160/NOS с использованием следующего способа на основе ПЦР. В первом раунде ПЦР фрагмент, содержащий PDISP-H3 A/Switzerland/9715293/13 с мутированной аминокислотой N382A, амплифицировали с использованием праймеров IF-CPMV (f15'UTR) SpPDI.c (SEQ ID NO: 15) и Н3 Swi (N382A).r (SEQ ID NO: 50), используя последовательность гена PDISP-H3 A/Switzerland/9715293/13 (SEQ ID NO: 9) в качестве матрицы. Второй фрагмент, содержащий мутацию N382A с оставшейся частью Н3 A/Switzerland/9715293/13, амплифицировали с использованием H3_Swi (N382A).c (SEQ ID NO: 51) и IF-H3A-Ala.r (SEQ ID NO: 17), используя последовательность гена PDISP-H3 A/Switzerland/9715293/13 (SEQ ID NO: 9) в качестве матрицы. Затем продукты ПЦР из обеих амплификаций смешивали и использовали в качестве матрицы для второго раунда амплификации с использованием IF-CPMV (f15'UTR)_SpPDI.c (SEQ ID NO: 15) и IF-H3A-Ala.r (SEQ ID NO: 17) в качестве праймеров. Конечный продукт ПЦР клонировали в системе экспрессии 2X35S/CPMV 160/NOS с использованием системы клонирования In-Fusion (Clontech, Mountain View, CA). Конструкцию номер 1190 (фиг. 5В) расщепляли рестрикционными эндонуклеазами SacII и StuI, и линеаризованную плазмиду использовали для реакции сборки In-Fusion. Конструкция номер 1190 представляет собой акцепторную плазмиду, предназначенную для клонирования «In Fusion» представляющих интерес генов в кассете экспрессии на основе 2X35S/CPMV 160/NOS. Она также включает в себя генную конструкцию для коэкспрессии супрессора сайленсинга TBSV Р19 под промотором и терминатором гена пластоцианина люцерны. Каркас представляет собой бинарную плазмиду pCAMBIA, а последовательность от левой границы к правой границе т-ДНК представлена в SEQ ID NO: 62. Полученной конструкции был присвоен номер 3023 (SEQ ID NO: 104). Аминокислотная последовательность мутированного PDISP-H3 А-Switzerland-9715293-13 (N382A) представлена в SEQ ID NO: 82. Представление плазмиды 3023 представлено на фиг. 4С.[00274] The sequence encoding mature HAO from influenza HA from A/Switzerland/9715293/13 (N382A) fused to alfalfa PDI secretion signal peptide (PDISP) was cloned into the 2X35S/CPMV 160/NOS expression system using the following method based on PCR. In the first round of PCR, a fragment containing PDISP-H3 A/Switzerland/9715293/13 with mutated amino acid N382A was amplified using primers IF-CPMV (f15'UTR) SpPDI.c (SEQ ID NO: 15) and H3 Swi (N382A) .r (SEQ ID NO: 50) using the A/Switzerland/9715293/13 PDISP-H3 gene sequence (SEQ ID NO: 9) as a template. A second fragment containing the N382A mutation with the remainder of H3 A/Switzerland/9715293/13 was amplified using H3_Swi (N382A).c (SEQ ID NO: 51) and IF-H3A-Ala.r (SEQ ID NO: 17), using the PDISP-H3 gene sequence A/Switzerland/9715293/13 (SEQ ID NO: 9) as a template. The PCR products from both amplifications were then mixed and used as template for the second round of amplification using IF-CPMV (f15'UTR)_SpPDI.c (SEQ ID NO: 15) and IF-H3A-Ala.r (SEQ ID NO: 17 ) as primers. The final PCR product was cloned into a 2X35S/CPMV 160/NOS expression system using an In-Fusion cloning system (Clontech, Mountain View, CA). Construct number 1190 (FIG. 5B) was digested with restriction endonucleases SacII and StuI and the linearized plasmid was used for the In-Fusion assembly reaction. Construct number 1190 is an acceptor plasmid for "In Fusion" cloning of genes of interest in an expression cassette based on 2X35S/CPMV 160/NOS. It also includes a gene construct for co-expression of the TBSV silencing suppressor P19 under the promoter and terminator of the alfalfa plastocyanin gene. The framework is the pCAMBIA binary plasmid and the left-to-right t-DNA sequence is shown in SEQ ID NO: 62. The resulting construct was numbered 3023 (SEQ ID NO: 104). The amino acid sequence of the mutated PDISP-H3 A-Switzerland-9715293-13 (N382A) is shown in SEQ ID NO: 82. A representation of plasmid 3023 is shown in FIG. 4C.

2X35S/CPMV 160/PDISP-HA0 Н3 A-Switzerland-9715293-13 (CvsTM)/NOS (конструкция номер 2811)2X35S/CPMV 160/PDISP-HA0 H3 A-Switzerland-9715293-13 (CvsTM)/NOS (design number 2811)

[00275] Последовательность, кодирующую зрелый НАО из НА гриппа из A/Switzerland/9715293/13 (CysTM), слитую с сигнальным пептидом секреции PDI люцерны (PDISP), клонировали в систему экспрессии 2X35S/CPMV 160/NOS с использованием следующего способа на основе ПЦР. В первом раунде ПЦР фрагмент, содержащий PDISP-H3 A/Switzerland/9715293/13 с мутированными аминокислотами CysTM, амплифицировали с использованием праймеров IF-CPMV (f15'UTR)_SpPDI.c (SEQ ID NO: 15) и H3_Swi_SLVLL.r (SEQ ID NO: 18), используя последовательность гена PDISP-H3 A/Switzerland/9715293/13 (SEQ ID NO: 9) в качестве матрицы. Второй фрагмент, содержащий мутации CysTm с оставшейся частью Н3 A/Switzerland/9715293/13, амплифицировали с использованием H3_Swi_SLVLL.c (SEQ ID NO: 19) и IF-H3A-Ala.r (SEQ ID NO: 17), используя последовательность гена PDISP-H3 A/Switzerland/9715293/13 (SEQ ID NO: 9) в качестве матрицы. Затем продукты ПЦР из обеих амплификаций смешивали и использовали в качестве матрицы для второго раунда амплификации с использованием IF-CPMV (fl5TJTR)_SpPDI.c (SEQ ID NO: 15) и IF-H3A-Ala.r (SEQ ID NO: 17) в качестве праймеров. Конечный продукт ПЦР клонировали в системе экспрессии 2X35S/CPMV 160/NOS с использованием системы клонирования In-Fusion (Clontech, Mountain View, CA). Конструкцию номер 1190 (фиг. 5B) расщепляли рестрикционными эндонуклеазами SacII и StuI, и линеаризованную плазмиду использовали для реакции сборки In-Fusion. Конструкция номер 1190 представляет собой акцепторную плазмиду, предназначенную для клонирования «In Fusion» представляющих интерес генов в кассете экспрессии на основе 2X35S/CPMV 160/NOS. Она также включает в себя генную конструкцию для совместной экспрессии супрессора сайленсинга TBSV Р19 под промотором и терминатором гена пластоцианина люцерны. Каркас представляет собой бинарную плазмиду pCAMBIA, а последовательность от левой границы к правой границе т-ДНК представлена в SEQ ID NO: 62. Полученной конструкции был присвоен номер 2811 (SEQ ID NO: 105). Аминокислотная последовательность мутированного PDISP-H3 А-Switzerland-9715293-13 (CysTM) представлена в SEQ ID NO: 49. Представление плазмиды 2811 представлено на фиг. 8K.[00275] The coding sequence for mature HAO from influenza HA from A/Switzerland/9715293/13 (CysTM) fused to alfalfa PDI secretion signal peptide (PDISP) was cloned into the 2X35S/CPMV 160/NOS expression system using the following method based on PCR. In the first round of PCR, a fragment containing PDISP-H3 A/Switzerland/9715293/13 with mutated CysTM amino acids was amplified using primers IF-CPMV (f15'UTR)_SpPDI.c (SEQ ID NO: 15) and H3_Swi_SLVLL.r (SEQ ID NO: 18) using the A/Switzerland/9715293/13 PDISP-H3 gene sequence (SEQ ID NO: 9) as a template. A second fragment containing CysTm mutations with the remainder of H3 A/Switzerland/9715293/13 was amplified using H3_Swi_SLVLL.c (SEQ ID NO: 19) and IF-H3A-Ala.r (SEQ ID NO: 17) using the gene sequence PDISP-H3 A/Switzerland/9715293/13 (SEQ ID NO: 9) as a matrix. The PCR products from both amplifications were then mixed and used as template for a second round of amplification using IF-CPMV (fl5TJTR)_SpPDI.c (SEQ ID NO: 15) and IF-H3A-Ala.r (SEQ ID NO: 17) in as primers. The final PCR product was cloned into a 2X35S/CPMV 160/NOS expression system using an In-Fusion cloning system (Clontech, Mountain View, CA). Construct number 1190 (FIG. 5B) was digested with restriction endonucleases SacII and StuI and the linearized plasmid was used for the In-Fusion assembly reaction. Construct number 1190 is an acceptor plasmid for "In Fusion" cloning of genes of interest in an expression cassette based on 2X35S/CPMV 160/NOS. It also includes a gene construct for co-expression of the TBSV silencing suppressor P19 under the promoter and terminator of the alfalfa plastocyanin gene. The framework is the pCAMBIA binary plasmid and the left-to-right t-DNA sequence is shown in SEQ ID NO: 62. The resulting construct was numbered 2811 (SEQ ID NO: 105). The amino acid sequence of the mutated PDISP-H3 A-Switzerland-9715293-13 (CysTM) is shown in SEQ ID NO: 49. A representation of plasmid 2811 is shown in FIG. 8K.

Пример 2: СпособыExample 2: Ways

Трансфекция Agrobacterium tumefaciensTransfection of Agrobacterium tumefaciens

[00276] Штамм AGL1 Agrobacterium tumefaciens трансфицировали электропорацией векторами экспрессии НА гриппа дикого типа или мутантного НА гриппа с использованием способов, описанных D'Aoust et al., 2008 (Plant Biotech. J. 6:930-40). Трансфицированные Agrobacterium выращивали в среде YEB с добавлением 10 мМ 2-(N-морфолино)этансульфоновой кислоты (MES), 20 мкМ ацетосирингона, 50 мкг/мл канамицина и 25 мкг/мл карбенициллина с рН 5,6 до OD600 от 0,6 до 1,6. Суспензии Agrobacterium перед использованием центрифугировали и ресуспендировали в среде для инфильтрации (10 мМ MgCl2 и 10 мМ MES рН 5,6).[00276] The AGL1 strain of Agrobacterium tumefaciens was transfected by electroporation with wild type or HA mutant influenza HA expression vectors using the methods described by D'Aoust et al., 2008 (Plant Biotech. J. 6:930-40). Transfected Agrobacterium were grown in YEB medium supplemented with 10 mM 2-(N-morpholino)ethanesulfonic acid (MES), 20 μM acetosyringone, 50 μg/ml kanamycin and 25 μg/ml carbenicillin with pH 5.6 to OD 600 from 0.6 up to 1.6. Agrobacterium suspensions were centrifuged and resuspended in infiltration medium (10 mM MgCl 2 and 10 mM MES pH 5.6) before use.

Приготовление растительной биомассы, инокулята и агроинфильтрацияPreparation of plant biomass, inoculum and agroinfiltration

[00277] Растения N. benthamiana выращивали из семян на ровных поверхностях, заполненных коммерческим субстратом из торфяного мха. Растениям позволяли расти в теплице при фотопериоде 16/8 и температурном режиме 25°С днем/20°С ночью. Через три недели после посева собирали отдельные ростки, пересаживали в горшки и оставляли для роста в теплице еще на три недели при тех же условиях окружающей среды.[00277] N. benthamiana plants were grown from seed on flat surfaces filled with commercial peat moss substrate. The plants were allowed to grow in the greenhouse with a photoperiod of 16/8 and a temperature regime of 25°C during the day/20°C at night. Three weeks after sowing, individual shoots were harvested, transplanted into pots and left to grow in the greenhouse for another three weeks under the same environmental conditions.

[00278] Агробактерии, трансфицированные каждым экспрессирующим вектором НА гриппа дикого типа или мутантным НА гриппа, выращивали в среде YEB с добавлением 10 мМ 2-(N-морфолино)этансульфоновой кислоты (MES), 20 мкМ ацетосирингона, 50 мкг/мл канамицина и 25 мкМ мкг/мл карбенициллина рН 5,6 до тех пор, пока они не достигали OD600 от 0,6 до 1,6. Суспензии Agrobacterium центрифугировали перед использованием и ресуспендировали в среде для инфильтрации (10 мМ MgCl2 и 10 мМ MES рН 5,6) и хранили в течение ночи при температуре 4°С. В день инфильтрации партии культур разводили в 2,5 объемах культур и давали нагреться перед использованием. Целые растения N. benthamiana помещали вверх дном в бактериальную суспензию в герметичный резервуар из нержавеющей стали под вакуумом 20-40 мм рт.ст. на 2 мин. Растения возвращали в теплицу на 6 или 9 дней инкубационного периода до сбора урожая.[00278] Agrobacteria transfected with each wild-type or mutant influenza HA HA expression vector were grown in YEB medium supplemented with 10 mM 2-(N-morpholino)ethanesulfonic acid (MES), 20 μM acetosyringone, 50 μg/ml kanamycin, and 25 μM μg/ml carbenicillin pH 5.6 until they reached an OD 600 of 0.6 to 1.6. Agrobacterium suspensions were centrifuged prior to use and resuspended in infiltration medium (10 mM MgCl 2 and 10 mM MES pH 5.6) and stored overnight at 4°C. On the day of infiltration, batches of cultures were diluted in 2.5 culture volumes and allowed to warm before use. Whole N. benthamiana plants were placed upside down in the bacterial suspension in a sealed stainless steel tank under a vacuum of 20-40 mm Hg. for 2 min. Plants were returned to the greenhouse for a 6 or 9 day incubation period prior to harvest.

Сбор листьев и экстракция общего белкаLeaf collection and total protein extraction

[00279] Белки экстрагировали из свежей биомассы, разрезанной на части размером ~1 см2, путем ферментативной экстракции в течение ночи при комнатной температуре с использованием орбитального шейкера. Затем суспензию фильтровали через нейлоновый фильтр с большими порами для удаления грубой нерасщепленной растительной ткани.[00279] Proteins were extracted from fresh biomass, cut into pieces of ~1 cm 2 by enzymatic extraction overnight at room temperature using an orbital shaker. The suspension was then filtered through a large pore nylon filter to remove coarse undigested plant tissue.

[00280] Для получения «полных технологических выходов» суспензию центрифугировали для удаления протопластов и внутриклеточных загрязнений. Супернатант очищали глубокой фильтрацией. Осветленную фракцию затем загружали через катионообменную колонку со стадией ступенчатого элюирования с увеличивающимися концентрациями NaCl. Очищенные VLP концентрировали с помощью TFF, подвергали диафильтрации против буфера для состава и пропускали через фильтр. Содержание белка в очищенных VLP анализировали с помощью анализа ВСА, а активность анализировали с помощью анализа гемагглютинации. Относительные выходы получали путем сравнения выходов белков из новой конструкции и нативной конструкции (или с CysTM для штаммов Н3), использованной в качестве контроля[00280] To obtain "total process yields", the suspension was centrifuged to remove protoplasts and intracellular contaminants. The supernatant was purified by deep filtration. The clarified fraction was then loaded through a cation exchange column with a stepwise elution step with increasing concentrations of NaCl. Purified VLPs were concentrated with TFF, diafiltered against formulation buffer and passed through a filter. The protein content of the purified VLPs was analyzed by BCA assay, and the activity was analyzed by hemagglutination assay. Relative yields were obtained by comparing protein yields from the novel construct and the native construct (or with CysTM for H3 strains) used as a control.

[00281] Для получения «выходов после градиента плотности» суспензию центрифугировали для удаления протопластов и внутриклеточных загрязнений. Супернатант дополнительно центрифугировали для удаления дополнительных частиц. Супернатант осветляли глубокой фильтрацией с использованием стекловолоконного фильтра. Затем осветленную фракцию загружали в прерывистый градиент плотности йодиксанола. Центрифугирование в градиенте плотности разделения выполняли следующим образом: готовили пробирки объемом 38 мл, содержащие прерывистый градиент плотности йодиксанола в Трис-буфере (последовательные слои из 35%, 30%, 25%, 20%, 15, 10% и 5%), которые покрывали осветленным экстрактом. Градиенты центрифугировали при 120000 g в течение 2 часов (4°С). После центрифугирования первые 5 мл, собранные снизу вверх, отбрасывали, а следующие 5 мл собирали для анализа содержания белка (ВСА), измерения активности (анализ гемагглютинации) и измерения интенсивности полосы НАО на ДСН-ПААГ в восстановленных условиях (денситометрия). Относительные выходы получали путем сравнения интенсивности полосы НАО от новой конструкции с нативной конструкцией (или CysTM для штаммов Н3), использованной в качестве контроля.[00281] To obtain "density gradient yields", the suspension was centrifuged to remove protoplasts and intracellular contaminants. The supernatant was further centrifuged to remove additional particles. The supernatant was clarified by deep filtration using a glass fiber filter. The clarified fraction was then loaded into a discontinuous iodixanol density gradient. Density gradient centrifugation was performed as follows: 38 ml tubes were prepared containing a discontinuous density gradient of iodixanol in Tris buffer (successive layers of 35%, 30%, 25%, 20%, 15, 10% and 5%), which covered with the clarified extract. The gradients were centrifuged at 120,000 g for 2 hours (4°C). After centrifugation, the first 5 ml, collected from bottom to top, were discarded, and the next 5 ml were collected for protein content analysis (BCA), activity measurement (haemagglutination assay) and HAE band intensity measurement on SDS-PAGE under reduced conditions (densitometry). Relative yields were obtained by comparing the intensity of the HAO band from the new construct with the native construct (or CysTM for H3 strains) used as a control.

Анализ гемагглютинацииHemagglutination analysis

[00282] Анализ гемагглютинации основывался на способе, описанном Nayak and Reichl (2004). Вкратце, последовательные двойные разведения исследуемых образцов (100 мкл) проводили в 96-луночных микротитрационных планшетах с V-образным дном, содержащих 100 мкл PBS, оставляя 100 мкл разбавленного образца на лунку. В каждую лунку добавляли сто микролитров 0,5% суспензии эритроцитов морской свинки (Bio Link Inc., Сиракузы, Нью-Йорк), и планшеты инкубировали в течение 2 часов при комнатной температуре. Обратную величину наивысшего разведения, показывающую полную гемагглютинацию, регистрировали как активность НА. Параллельно, рекомбинантный стандарт НА (A/Vietnam/1203/2004 H5N1) (Protein Science Corporation, Мериден, Коннектикут) разводили в PBS и использовали в качестве контроля на каждом планшете.[00282] The haemagglutination assay was based on the method described by Nayak and Reichl (2004). Briefly, serial duplicate dilutions of test samples (100 µl) were performed in 96-well V-bottomed microtiter plates containing 100 µl PBS, leaving 100 µl diluted sample per well. One hundred microliters of a 0.5% guinea pig erythrocyte suspension (Bio Link Inc., Syracuse, NY) was added to each well and the plates were incubated for 2 hours at room temperature. The reciprocal of the highest dilution, indicating complete haemagglutination, was recorded as HA activity. In parallel, a recombinant HA standard (A/Vietnam/1203/2004 H5N1) (Protein Science Corporation, Meriden, Conn.) was diluted in PBS and used as a control on each plate.

Анализ белков и иммуноблоттингProtein analysis and immunoblotting

[00283] Иммуноблоттинг выполняли при первой инкубации с первичным моноклональным антителом, разведенным 1/500 в 2% обезжиренном молоке в 0,1% TBS-Tween 20. Конъюгированные с пероксидазой козьи антитела к мышиным (Jackson Immunoresearch, номер по каталогу 115-035-146), разведенные 1/10000, использовали в качестве вторичных антител для обнаружения хемилюминесценции в 2% обезжиренном молоке в TBS-Tween 20 0,1%. Иммунореактивные комплексы определяли хемилюминесценцией с использованием люминола в качестве субстрата (Roche Diagnostics Corporation). Конъюгацию человеческого антитела IgG с ферментом пероксидазой хрена проводили с использованием набора для конъюгации активированной пероксидазы EZ-Link Plus® (Pierce, Rockford, Ill.).[00283] Immunoblotting was performed at the first incubation with the primary monoclonal antibody diluted 1/500 in 2% skim milk in 0.1% TBS-Tween 20. Peroxidase-conjugated goat anti-mouse antibody (Jackson Immunoresearch, catalog number 115-035- 146) diluted 1/10000 were used as secondary antibodies to detect chemiluminescence in 2% skim milk in TBS-Tween 20 0.1%. Immunoreactive complexes were determined by chemiluminescence using luminol as a substrate (Roche Diagnostics Corporation). Conjugation of human IgG antibody to horseradish peroxidase enzyme was performed using the EZ-Link Plus® Activated Peroxidase Conjugation Kit (Pierce, Rockford, Ill.).

Пример 3: Производство НА и VLP гриппа в растенияхExample 3 Production of Influenza HA and VLP in Plants

Модификация Н3 НА IModification H3 ON I

[00284] Конструкции НА гриппа получали с использованием способов, хорошо известных в настоящей области техники (смотрите пример 1). Краткое описание белков НА дикого типа и мутировавших белков НА, праймеров, матриц и продуктов представлено в таблице 4 ниже. Используемые последовательности представлены в примере 4 и в списке последовательностей.[00284] Influenza HA constructs were prepared using methods well known in the art (see Example 1). A brief description of wild-type and mutated HA proteins, primers, templates and products is provided in Table 4 below. The sequences used are shown in Example 4 and in the sequence listing.

Мутант N382A A/Switzerland/9715293/13 Н3Mutant N382A A/Switzerland/9715293/13 H3

Мутант N382A A/Switzerland/9715293/13 Н3 (конструкция №3023) конструировали путем мутации аспарагина в положении 382 A/Switzerland/9715293/13 Н3 дикого типа в аланин. Как показано на фиг. 2, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3023, показали приблизительно 30%-ное увеличение титра гемагглютинации экстрактами из растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).The N382A A/Switzerland/9715293/13 H3 mutant (design #3023) was constructed by mutating the asparagine at position 382 of the wild type A/Switzerland/9715293/13 H3 to alanine. As shown in FIG. 2, purified N. benthamiana plant extracts agroinfiltrated with construct #3023 showed an approximately 30% increase in haemagglutination titer with extracts from N. benthamiana plants agroinfiltrated with A/Switzerland/9715293/13 H3 wt (design #2801) .

Мутант L384VA/Switzerland/9715293/13 Н3Mutant L384VA/Switzerland/9715293/13 H3

[00285] Мутант L384V A/Switzerland/9715293/13 Н3 (конструкция №3034) конструировали путем мутации лейцина в положении 384 A/Switzerland/9715293/13 Н3 дикого типа в валин. Как показано на фиг. 2, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3034, демонстрировали приблизительно 100%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованными с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).[00285] Mutant L384V A/Switzerland/9715293/13 H3 (design #3034) was constructed by mutating wild type leucine at position 384 of A/Switzerland/9715293/13 H3 to valine. As shown in FIG. 2, purified N. benthamiana plant extracts agroinfiltrated using construct #3034 showed an approximately 100% increase in haemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated with wild type A/Switzerland/9715293/13 H3 (construct # 2801).

Мутант F392D A/Switzerland/9715293/13 Н3Mutant F392D A/Switzerland/9715293/13 H3

[00286] Мутант F392D A/Switzerland/9715293/13 Н3 конструировали путем мутации фенилаланина в положении 392 A/Switzerland/9715293/13 Н3 дикого типа в аспарагиновую кислоту (конструкция №3045). Как показано на фиг. 2, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3045, демонстрировали приблизительно 40%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованными с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).[00286] The F392D A/Switzerland/9715293/13 H3 mutant was constructed by mutating wild-type phenylalanine at position 392 of A/Switzerland/9715293/13 H3 to aspartic acid (design #3045). As shown in FIG. 2, purified N. benthamiana plant extracts agroinfiltrated using construct #3045 showed an approximately 40% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using A/Switzerland/9715293/13 H3 wt (construct # 2801).

Мутант L431M A/Switzerland/9715293/13 Н3Mutant L431M A/Switzerland/9715293/13 H3

[00287] Мутант L431M A/Switzerland/9715293/13 Н3 конструировали путем мутации лейцина в положении 431 A/Switzerland/9715293/13 Н3 дикого типа в метионин (конструкция №3022). Как показано на фиг. 2, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3022, демонстрировали приблизительно 70%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованными с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2811).[00287] Mutant L431M A/Switzerland/9715293/13 H3 was constructed by mutating wild-type leucine at position 431 A/Switzerland/9715293/13 H3 to methionine (design #3022). As shown in FIG. 2, purified N. benthamiana plant extracts agroinfiltrated using construct #3022 showed an approximately 70% increase in haemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated with wild type A/Switzerland/9715293/13 H3 (construct # 2811).

[00288] Одна или более описанных в настоящем документе мутаций специфически увеличивают продукцию белка НА гриппа и выход VLP у растений. Было замечено, что мутации в других положениях значительно снижали или не оказывали значительного влияния на накопление белка НА гриппа или продукцию VLP в растительных клетках.[00288] One or more of the mutations described herein specifically increase influenza HA protein production and VLP yield in plants. It was observed that mutations at other positions significantly reduced or had no significant effect on influenza HA protein accumulation or VLP production in plant cells.

[00289] Повышенные титры гемагглютинации, достигаемые с белками НА гриппа, содержащими одну или более описанных в настоящем документе мутаций, также наблюдались как специфические для НА гриппа. Подобное увеличение не наблюдалось у растений, агроинфильтрованных конструкциями, кодирующими мутантные НА гриппа, полученные из штаммов, не относящихся к Н3.[00289] Elevated hemagglutination titers achievable with influenza HA proteins containing one or more of the mutations described herein have also been observed to be specific for influenza HA. Such an increase was not observed in plants agroinfiltrated with constructs encoding mutant influenza HA derived from non-H3 strains.

[00290] Например, мутант Н5 F393D A/Indonesia/5/2005 конструировали путем мутации фенилаланина в положении 393 A/Indonesia/5/2005 Н5 дикого типа в аспарагиновую кислоту (конструкция №3680). Как показано на фиг. 3, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3680, демонстрировали приблизительно 98%-ное снижение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Indonesia/5/2005 Н5 дикого типа (конструкция №2295).[00290] For example, the F393D A/Indonesia/5/2005 H5 mutant was constructed by mutating wild type phenylalanine at position 393 A/Indonesia/5/2005 H5 to aspartic acid (design #3680). As shown in FIG. 3, purified extracts of N. benthamiana plants agroinfiltrated using construct #3680 showed an approximately 98% reduction in haemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using wild type A/Indonesia/5/2005 H5 (construct # 2295).

[00291] Точно так же очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием мутанта F392D A/Egypt/N04915/2014 Н5 (конструкция №3690), демонстрировали приблизительно 99%-ное снижение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Egypt/N04915/2014 Н5 дикого типа (конструкция №3645) (смотрите фиг. 3, таблицу 7).[00291] Similarly, purified N. benthamiana plant extracts agroinfiltrated using the F392D A/Egypt/N04915/2014 H5 mutant (design #3690) showed an approximately 99% reduction in hemagglutination titer compared to N. benthamiana plant extracts, agroinfiltrated using A/Egypt/N04915/2014 wild type H5 (design #3645) (see Figure 3, Table 7).

Модификация Н3 НА IIModification H3 ON II

Мутант CysTM A/Switzerland/9715293/13 Н3Mutant CysTM A/Switzerland/9715293/13 H3

[00292] Мутант CysTM A/Switzerland/9715293/13 Н3 (конструкция №2811) конструировали путем замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) A/Switzerland/9715293/13 Н3 дикого типа на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 6А, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №2811, показали приблизительно 60%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).[00292] The CysTM A/Switzerland/9715293/13 H3 mutant (design #2811) was constructed by replacing the "CFLLC" sequence at positions 524-528 (SEQ ID NO: 99) of A/Switzerland/9715293/13 H3 wild type with "SLVLL » (SEQ ID NO: 98). As shown in FIG. 6A, purified extracts of N. benthamiana plants agroinfiltrated using construct #2811 showed an approximately 60% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated with wild type A/Switzerland/9715293/13 H3 (construct # 2801).

Мутант CysTM A/Pennsylvania/09/2015 Н3Mutant CysTM A/Pennsylvania/09/2015 H3

[00293] Мутант CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3313) конструировали путем замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) A/Pennsylvania/09/2015 Н3 дикого типа на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7С, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3313, демонстрировали приблизительно 100%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Pennsylvania/09/2015 Н3 дикого типа (конструкция №3312).[00293] The CysTM A/Pennsylvania/09/2015 H3 mutant (design #3313) was constructed by substituting the sequence "CFLLC" at positions 524-528 (SEQ ID NO: 99) of A/Pennsylvania/09/2015 H3 wild-type with "SLVLL » (SEQ ID NO: 98). As shown in FIG. 7C, purified N. benthamiana plant extracts agroinfiltrated using construct #3313 showed an approximately 100% increase in haemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using A/Pennsylvania/09/2015 WT H3 (construct # 3312).

Мутант N382A + CysTM A/Switzerland/9715293/13 Н3Mutant N382A + CysTM A/Switzerland/9715293/13 H3

[00294] Мутант N382A + CysTM A/Switzerland/9715293/13 Н3 (конструкция №3063) конструировали путем мутации аспарагина в положении 382 A/Switzerland/9715293/13 Н3 дикого типа в аланин и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7А, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3063, демонстрировали приблизительно 160%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801). Как дополнительно показано на фиг. 7В, растения N. benthamiana, агроинфильтрованные с использованием конструкции №3063, показали приблизительно 30%-ное увеличение выхода VLP после очистки в градиенте йодиксанола по сравнению с растениями, инфильтрованными с использованием мутанта CysTM A/Switzerland/9715293/13 Н3 (конструкция №2811).[00294] The N382A + CysTM A/Switzerland/9715293/13 H3 mutant (design #3063) was constructed by mutating asparagine at position 382 of A/Switzerland/9715293/13 H3 wild type to alanine and replacing the "CFLLC" sequence at positions 524-528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7A, purified N. benthamiana plant extracts agroinfiltrated using construct #3063 showed an approximately 160% increase in haemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using wild type A/Switzerland/9715293/13 H3 (construct # 2801). As further shown in FIG. 7B, N. benthamiana plants agroinfiltrated with construct #3063 showed an approximately 30% increase in VLP yield after iodixanol gradient purification compared to plants infiltrated with CysTM A/Switzerland/9715293/13 H3 mutant (construct #2811 ).

Мутант N382A + CysTM A/Pennsylvania/09/2015 Н3Mutant N382A + CysTM A/Pennsylvania/09/2015 H3

[00295] Мутант N382A + CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3314) конструировали путем мутации аспарагина в положении 382 A/Pennsylvania/09/2015 Н3 дикого типа в аланин и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7С, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3314, показали приблизительно 300%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Pennsylvania/09/2015 Н3 дикого типа (конструкция №3312).[00295] The N382A + CysTM A/Pennsylvania/09/2015 H3 mutant (design #3314) was constructed by mutating asparagine at position 382 of A/Pennsylvania/09/2015 H3 wild type to alanine and replacing the "CFLLC" sequence at positions 524-528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7C, purified extracts of N. benthamiana plants agroinfiltrated using construct #3314 showed an approximately 300% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated using wild type A/Pennsylvania/09/2015 H3 (construct # 3312).

Мутант L384V + CysTM A/Switzerland/9715293/13 Н3Mutant L384V + CysTM A/Switzerland/9715293/13 H3

[00296] Мутант L384V + CysTM A/Switzerland/9715293/13 Н3 (конструкция №3074) конструировали путем мутации лейцина в положении 384 A/Switzerland/9715293/13 Н3 дикого типа в валин и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7С, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3074, продемонстрировали приблизительно 380%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801). Кроме того, как показано на фиг. 7В, растения N. benthamiana, агроинфильтрованные с использованием конструкции №3074, показали приблизительно 50%-ное увеличение выхода VLP после очистки градиентом сахарозы по сравнению с растениями, инфильтрованными с использованием мутанта CysTM A/Switzerland/9715293/13 Н3 (конструкция №2811).[00296] Mutant L384V + CysTM A/Switzerland/9715293/13 H3 (design #3074) was constructed by mutating wild-type leucine at position 384 A/Switzerland/9715293/13 H3 to valine and replacing the "CFLLC" sequence at positions 524-528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7C, purified N. benthamiana plant extracts agroinfiltrated with construct #3074 showed an approximately 380% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated with wild type A/Switzerland/9715293/13 H3 (construct #3074). 2801). In addition, as shown in FIG. 7B, N. benthamiana plants agroinfiltrated with construct #3074 showed an approximately 50% increase in VLP yield after sucrose gradient purification compared to plants infiltrated with CysTM A/Switzerland/9715293/13 H3 mutant (construct #2811) .

Мутант L384V + CysTM A/Pennsylvania/09/2015 Н3Mutant L384V + CysTM A/Pennsylvania/09/2015 H3

[00297] Мутант L384V + CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3315) конструировали путем мутации лейцина в положении 384 A/Pennsylvania/09/2015 Н3 дикого типа в валин и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7С, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3315, демонстрировали приблизительно 380%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованными с использованием A/Pennsylvania/09/2015 Н3 дикого типа (конструкция №3312).[00297] Mutant L384V + CysTM A/Pennsylvania/09/2015 H3 (design #3315) was constructed by mutating wild-type leucine at position 384 A/Pennsylvania/09/2015 H3 to valine and replacing the "CFLLC" sequence at positions 524-528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7C, purified N. benthamiana plant extracts agroinfiltrated using construct #3315 showed an approximately 380% increase in haemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using wild type A/Pennsylvania/09/2015 H3 (construct # 3312).

Мутант F392D + CysTM A/Switzerland/9715293/13 Н3Mutant F392D + CysTM A/Switzerland/9715293/13 H3

[00298] Мутант F392D + CysTM A/Switzerland/9715293/13 Н3 (конструкция №3085) конструировали путем мутации фенилаланина в положении 392 A/Switzerland/9715293/13 Н3 дикого типа в аспарагиновую кислоту и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7А, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3085, демонстрировали приблизительно 170%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).[00298] The F392D + CysTM A/Switzerland/9715293/13 H3 mutant (design #3085) was constructed by mutating wild-type phenylalanine at position 392 of A/Switzerland/9715293/13 H3 to aspartic acid and replacing the "CFLLC" sequence at positions 524- 528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7A, purified N. benthamiana plant extracts agroinfiltrated using construct #3085 showed an approximately 170% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using A/Switzerland/9715293/13 H3 wt (construct # 2801).

Мутант L431M + CysTM A/Switzerland/9715293/13 Н3Mutant L431M + CysTM A/Switzerland/9715293/13 H3

[00299] Мутант L431M + CysTM A/Switzerland/9715293/13 Н3 (конструкция №3062) конструировали путем мутации лейцина в положении 431 A/Switzerland/9715293/13 Н3 дикого типа в метионин и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7А, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3062, демонстрировали приблизительно 150%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).[00299] Mutant L431M + CysTM A/Switzerland/9715293/13 H3 (design #3062) was constructed by mutating wild-type leucine at position 431 A/Switzerland/9715293/13 H3 to methionine and replacing the "CFLLC" sequence at positions 524-528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7A, purified N. benthamiana plant extracts agroinfiltrated using construct #3062 showed an approximately 150% increase in haemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using wild type A/Switzerland/9715293/13 H3 (construct # 2801).

Мутант N382A + L384V + CysTM A/Hong Kong/4801/14 Н3Mutant N382A + L384V + CysTM A/Hong Kong/4801/14 H3

[00300] Мутант N382A + L384V + CysTM A/Hong Kong/4801/14 Н3 (конструкция №3375) конструировали путем мутации аспарагина в положении 382 A/Hong Kong/4801/14 дикого типа в остаток аланина, лейцина в положении 384 в остаток валина и последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) в «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7Е, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3375, демонстрировали приблизительно 300%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием мутанта CysTM A/Hong Kong/4801/14 Н3 (конструкция №3341).[00300] Mutant N382A + L384V + CysTM A/Hong Kong/4801/14 H3 (design #3375) was constructed by mutating asparagine at position 382 A/Hong Kong/4801/14 wt to an alanine residue, leucine at position 384 to a residue valine and the "CFLLC" sequences at positions 524-528 (SEQ ID NO: 99) in "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7E, purified extracts of N. benthamiana plants agroinfiltrated using construct #3375 showed an approximately 300% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated with the CysTM A/Hong Kong/4801/14 H3 mutant (construct No. 3341).

Мутант N382A + L384V + CysTM A/Minnesota/40/15 Н3Mutant N382A + L384V + CysTM A/Minnesota/40/15 H3

[00301] Мутант N382A + L384V + CysTM A/Minnesota/40/15 Н3 (конструкция №3915) конструировали путем мутации аспарагина в положении 382 A/Minnesota/40/15 дикого типа в остаток аланина, лейцин в положении 384 в остаток валина и последовательность «CFLLC» в положениях 524-528 (SEQ ID NO: 99) в «SLVLL» (SEQ ID NO: 98). Как показано на фиг.7Е, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3915, демонстрировали приблизительно 400%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием мутанта CysTM A/Minnesota/40/15 Н3 (конструкция №3914).[00301] Mutant N382A + L384V + CysTM A/Minnesota/40/15 H3 (design #3915) was constructed by mutating asparagine at position 382 A/Minnesota/40/15 wild type to an alanine residue, leucine at position 384 to a valine residue, and the sequence "CFLLC" at positions 524-528 (SEQ ID NO: 99) in "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7E, purified N. benthamiana plant extracts agroinfiltrated using construct #3915 exhibited an approximately 400% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using the CysTM A/Minnesota/40/ mutant. 15 H3 (design No. 3914).

Мутант N382A + L384V + CysTMA/S. Australia/1/1 6 Н3Mutant N382A + L384V + CysTMA/S. Australia/1/1 6 H3

[00302] Мутант N382A + L384V + CysTM A/S. Australia/1/16 Н3 (конструкция №3925) конструировали путем мутации аспарагина в положении 382 A/S. Australia/1/16 дикого типа в остаток аланина, лейцин в положении 384 в остаток валина и последовательность «CFLLC» в положениях 524-528 (SEQ ID NO: 99) в «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7D и 7Е, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3925, демонстрировали приблизительно 400%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием мутанта CysTM A/S. Australia/1/16 Н3 (конструкция №3924).[00302] Mutant N382A + L384V + CysTM A/S. Australia/1/16 H3 (design #3925) was constructed by mutating asparagine at position 382 A/S. Australia/1/16 wild type to an alanine residue, leucine at position 384 to a valine residue, and the "CFLLC" sequence at positions 524-528 (SEQ ID NO: 99) in "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7D and 7E, purified N. benthamiana plant extracts agroinfiltrated using construct #3925 showed an approximately 400% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using the CysTM A/S mutant. Australia/1/16 H3 (design no. 3924).

Мутант N382A + L384V + CysTM A/Bangkok/3007/15 Н3Mutant N382A + L384V + CysTM A/Bangkok/3007/15 H3

[00303] Мутант N382A + L384V + CysTM A/Bangkok/3007/15 Н3 (конструкция №3905) конструировали путем мутации аспарагина в положении 382 A/Bangkok/3007/15 дикого типа в остаток аланина, лейцин в положении 384 в остаток валина и последовательность «CFLLC» в положениях 524-528 (SEQ ID NO: 99) в «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7Е, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3905, показали приблизительно 400%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием мутанта CysTM A/Bangkok/3007/15 Н3 (конструкция №3904).[00303] Mutant N382A + L384V + CysTM A/Bangkok/3007/15 H3 (design #3905) was constructed by mutating asparagine at position 382 of A/Bangkok/3007/15 wild type to an alanine residue, leucine at position 384 to a valine residue, and the sequence "CFLLC" at positions 524-528 (SEQ ID NO: 99) in "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7E, purified N. benthamiana plant extracts agroinfiltrated using construct #3905 showed an approximately 400% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using the CysTM A/Bangkok/3007/15 H3 mutant (construct # 3904).

[00304] Одна или более описанных в настоящем документе мутаций специфически увеличивают продукцию белка НА гриппа и выход VLP у растений. Было замечено, что мутации в других положениях значительно снижали или не оказывали значительного влияния на накопление белка НА гриппа или продукцию VLP в растительных клетках.[00304] One or more of the mutations described herein specifically increase influenza HA protein production and VLP yield in plants. It was observed that mutations at other positions significantly reduced or had no significant effect on influenza HA protein accumulation or VLP production in plant cells.

[00305] Повышенные титры гемагглютинации, достигнутые с белками НА гриппа, содержащими одну или более описанных в настоящем документе мутаций, также были специфичны для НА гриппа. Подобное увеличение не наблюдалось у растений, агроинфильтрованных конструкциями, кодирующими мутантные НА гриппа, полученные из штаммов, не относящихся к Н3.[00305] Elevated hemagglutination titers achieved with influenza HA proteins containing one or more of the mutations described herein were also specific for influenza HA. Such an increase was not observed in plants agroinfiltrated with constructs encoding mutant influenza HA derived from non-H3 strains.

[00306] Например, мутант Н5 F393D A/Indonesia/5/2005 конструировали путем мутации фенилаланина в положении 393 A/Indonesia/5/2005 Н5 дикого типа в аспарагиновую кислоту (конструкция №3680). Как показано на фиг. 3, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3680, демонстрировали приблизительно 98%-ное снижение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Indonesia/5/2005 Н5 дикого типа (конструкция №2295).[00306] For example, the F393D A/Indonesia/5/2005 H5 mutant was constructed by mutating the wild-type phenylalanine at position 393 A/Indonesia/5/2005 H5 to aspartic acid (design #3680). As shown in FIG. 3, purified extracts of N. benthamiana plants agroinfiltrated using construct #3680 showed an approximately 98% reduction in haemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using wild type A/Indonesia/5/2005 H5 (construct # 2295).

[00307] Точно так же очищенные экстракты растений N. benthamiana, агроинфильтрованных с использованием мутанта F392D A/Egypt/N04915/2014 Н5 (конструкция №3690), демонстрировали приблизительно 99%-ное снижение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Egypt/N04915/2014 Н5 дикого типа (конструкция №3690) (смотрите фиг. 3).[00307] Similarly, purified extracts of N. benthamiana plants agroinfiltrated using the F392D A/Egypt/N04915/2014 H5 mutant (design #3690) showed an approximately 99% reduction in hemagglutination titer compared to N. benthamiana plant extracts, agroinfiltrated using A/Egypt/N04915/2014 wild type H5 (design #3690) (see Fig. 3).

Пример 3: Титр гемагглютинации, выходы после градиентов плотности и полные технологические выходыExample 3: Haemagglutination Titer, Density Gradient Yields, and Total Process Yields

[00308] Сводная информация измеренного титра гемагглютинации представлена в таблицах 5 и 6А. Титр гемагглютинации измеряли, как описано в примере 2. Относительный титр гемагглютинации получали путем сравнения титра гемагглютинации мутированного или модифицированного белка НА либо с НА дикого типа (таблица 5), либо с мутантным белком НА CysTM (таблица 6А).[00308] A summary of the measured hemagglutination titer is presented in Tables 5 and 6A. Hemagglutination titer was measured as described in Example 2. Relative hemagglutination titer was obtained by comparing the hemagglutination titer of the mutated or modified HA protein with either wild-type HA (Table 5) or the mutant CysTM HA protein (Table 6A).

[00309] Сводная информация измеренных выходов после градиентов плотности приведена в таблицах А 5В и С5В. Выходы после градиентов плотности измеряли, как описано в примере 2. Относительные выходы получали путем сравнения интенсивности полосы НА0 от мутированного или модифицированного белка НА либо с интенсивностью полосы НА0 НА дикого типа (таблица А 5В), либо с интенсивностью полосы НА0 мутантного белка НА CysTM (таблица 6В).[00309] A summary of measured yields after density gradients is shown in Tables A 5B and C5B. Yields after density gradients were measured as described in Example 2. Relative yields were obtained by comparing the intensity of the HA0 band from the mutated or modified HA protein to either that of the wild-type HA0 band (Table A-5B) or the intensity of the HA0 band of the CysTM mutant HA protein ( table 6B).

[00310] Сводная информация измеренного полного технологического выхода приведена в таблице 6С. Полный технологический выход получали, как описано выше в примере 2. Относительные выходы получали путем сравнения выхода белка из мутированного или модифицированного белка НА либо с выходом белка НА дикого типа, либо с выходом мутантного белка НА CysTM (таблица 6С).[00310] A summary of the measured total process yield is shown in Table 6C. Overall process yields were obtained as described in Example 2 above. Relative yields were obtained by comparing the protein yield from the mutated or modified HA protein to either the wild type HA protein yield or the CysTM mutant HA protein yield (Table 6C).

Пример 4: ПоследовательностиExample 4: Sequences

[00311] Использовали следующие последовательности (смотрите также таблицу 4):[00311] The following sequences were used (see also Table 4):

[00312] Все цитаты включены в настоящий документ посредством ссылки.[00312] All citations are incorporated herein by reference.

[00313] Настоящее изобретение было описано в отношении одного или более вариантов осуществления. Однако специалистам в настоящей области техники будет очевидно, что можно сделать ряд вариаций и модификаций, не выходя за пределы объема настоящего изобретения, определенного в формуле изобретения.[00313] The present invention has been described in relation to one or more embodiments. However, it will be apparent to those skilled in the art that a number of variations and modifications can be made without departing from the scope of the present invention as defined in the claims.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST

<110> МЕДИКАГО ИНК.<110> MEDICAGO INC.

<120> МУТАНТЫ ГЕМАГГЛЮТИНИНА ВИРУСА ГРИППА<120> HEMAGLUTININ MUTANTS OF INFLUENZA VIRUS

<130> V811304WO1<130> V811304WO1

<150> US 62/690,780<150> US 62/690,780

<151> 2018-06-27<151> 2018-06-27

<160> 105<160> 105

<170> PatentIn version 3.5<170>PatentIn version 3.5

<210> 1<210> 1

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 HK<223> DNA PDI-H3 HK

<400> 1<400> 1

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 2<210> 2

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 HK<223> AK PDI-H3 HK

<400> 2<400> 2

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 3<210> 3

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Minn<223> DNA PDI-H3 Minn

<400> 3<400> 3

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 4<210> 4

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Minn<223> AK PDI-H3 Minn

<400> 4<400> 4

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 5<210> 5

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 SAus<223> DNA PDI-H3 SAus

<400> 5<400> 5

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 6<210> 6

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 SAus<223> AK PDI-H3 SAus

<400> 6<400> 6

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Lys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerLys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 7<210> 7

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Bang<223> DNA PDI-H3 Bang

<400> 7<400> 7

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 8<210> 8

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Bang<223> AK PDI-H3 Bang

<400> 8<400> 8

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr ValTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Val

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 9<210> 9

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz<223> DNA PDI-H3 Switz

<400> 9<400> 9

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 10<210> 10

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz<223> AK PDI-H3 Switz

<400> 10<400> 10

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 11<210> 11

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Miss<223> DNA PDI-H3 Miss

<400> 11<400> 11

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcagagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcagagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

aaaccatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720aaaccatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 12<210> 12

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Miss<223> AK PDI-H3 Miss

<400> 12<400> 12

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Arg Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Arg Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Lys Pro Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Lys Pro Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln AsnVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Asn

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 13<210> 13

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Penn<223> DNA PDI-H3 Penn

<400> 13<400> 13

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta 1560tgcataggat tggaacttat gaccacgatg tatacaggga tgaagcttta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 14<210> 14

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Penn<223> AK PDI-H3 Penn

<400> 14<400> 14

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 15<210> 15

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер IF-CPMV(fl5'UTR)_SpPDI.c<223> Primer IF-CPMV(fl5'UTR)_SpPDI.c

<400> 15<400> 15

tcgtgcttcg gcaccagtac aatggcgaaa aacgttgcga ttttcggct 49tcgtgcttcg gcaccagtac aatggcgaaa aacgttgcga ttttcggct 49

<210> 16<210> 16

<211> 46<211> 46

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер IF-H1cTMCT.S1-4r<223> Primer IF-H1cTMCT.S1-4r

<400> 16<400> 16

actaaagaaa ataggccttt aaatacatat tctacactgt agagac 46actaaagaaa ataggccttt aaatacatat tctacactgt agagac 46

<210> 17<210> 17

<211> 55<211> 55

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер IF-H3A-Ala.r<223> Primer IF-H3A-Ala.r

<400> 17<400> 17

actaaagaaa ataggccttc aaatgcaaat gttgcaccta atgttgccct tttgg 55actaaagaaa ataggccttc aaatgcaaat gttgcaccta atgttgccct tttgg 55

<210> 18<210> 18

<211> 51<211> 51

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi_SLVLL.r<223> Primer H3_Swi_SLVLL.r

<400> 18<400> 18

agcaactaac agtacaaggg atgatatggc aaaggaaatc cataggatcc a 51agcaactaac agtacaaggg atgatatggc aaaggaaatc cataggatcc a 51

<210> 19<210> 19

<211> 53<211> 53

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> H3_Swi_SLVLL.c<223> H3_Swi_SLVLL.c

<400> 19<400> 19

tcctttgcca tatcatccct tgtactgtta gttgctttgt tggggttcat cat 53cat 53 tcctttgcca tatcatccct tgtactgtta gttgctttgt

<210> 20<210> 20

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 HK-CysTm<223> DNA PDI-H3 HK-CysTm

<400> 20<400> 20

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 21<210> 21

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 HK-CysTm<223> AK PDI-H3 HK-CysTm

<400> 21<400> 21

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 22<210> 22

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_HK480114(N382A+L384V).r<223> Primer H3_HK480114(N382A+L384V).r

<400> 22<400> 22

ttggttttcc cgatcactcg agccagcttc ccattgattt gatcgatt 48ttggttttcc cgatcactcg agccagcttc ccattgattt gatcgatt 48

<210> 23<210> 23

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_HK480114(N382A+L384V).c<223> Primer H3_HK480114(N382A+L384V).c

<400> 23<400> 23

gggaagctgg ctcgagtgat cgggaaaacc aacgagaaat tccatcag 48gggaagctgg ctcgagtgat cgggaaaacc aacgagaaat tccatcag 48

<210> 24<210> 24

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 HK-N382A+L384V-CysTm<223> DNA PDI-H3 HK-N382A+L384V-CysTm

<400> 24<400> 24

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctggctcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctggctcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 25<210> 25

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 HK-N382A+L384V-CysTm<223> AK PDI-H3 HK-N382A+L384V-CysTm

<400> 25<400> 25

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 26<210> 26

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Minn-CysTm<223> DNA PDI-H3 Minn-CysTm

<400> 26<400> 26

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 27<210> 27

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Minn-CysTm<223> AC PDI-H3 Minn-CysTm

<400> 27<400> 27

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 28<210> 28

<211> 60<211> 60

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3Minn(N382A+L384V).r<223> Primer H3Minn(N382A+L384V).r

<400> 28<400> 28

gttggttttc ccgatcaccc gagccagctt cccattgatt tgatcgattg ctgcttgagt 60gttggttttc ccgatcaccc gagccagctt cccattgatt tgatcgattg ctgcttgagt 60

<210> 29<210> 29

<211> 56<211> 56

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3Minn(N382A+L384V).c<223> Primer H3Minn(N382A+L384V).c

<400> 29<400> 29

aatcaatggg aagctggctc gggtgatcgg gaaaaccaac gagaaattcc atcaga 56aatcaatggg aagctggctc gggtgatcgg gaaaaccaac gagaaattcc atcaga 56

<210> 30<210> 30

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Minn-N382A+L384V-CysTm<223> DNA PDI-H3 Minn-N382A+L384V-CysTm

<400> 30<400> 30

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctggctcg ggtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctggctcg ggtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 31<210> 31

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Minn-N382A+L384V-CysTm<223> AK PDI-H3 Minn-N382A+L384V-CysTm

<400> 31<400> 31

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 32<210> 32

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 SAus-CysTm<223> DNA PDI-H3 SAus-CysTm

<400> 32<400> 32

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 33<210> 33

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 SAus-CysTm<223> AC PDI-H3 SAus-CysTm

<400> 33<400> 33

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Lys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerLys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 34<210> 34

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 SAus-N382A+L384V-CysTm<223> DNA PDI-H3 SAus-N382A+L384V-CysTm

<400> 34<400> 34

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctggctcg ggtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctggctcg ggtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 35<210> 35

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 SAus-N382A+L384V-CysTm<223> AK PDI-H3 SAus-N382A+L384V-CysTm

<400> 35<400> 35

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Lys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerLys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 36<210> 36

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Bang-CysTm<223> DNA PDI-H3 Bang-CysTm

<400> 36<400> 36

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 37<210> 37

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Bang-CysTm<223> AK PDI-H3 Bang-CysTm

<400> 37<400> 37

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr ValTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Val

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 38<210> 38

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Bang-N382A+L384V-CysTm<223> DNA PDI-H3 Bang-N382A+L384V-CysTm

<400> 38<400> 38

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660660

cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctggctcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctggctcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 39<210> 39

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Bang-N382A+L384V-CysTm<223> AK PDI-H3 Bang-N382A+L384V-CysTm

<400> 39<400> 39

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr ValTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Val

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 40<210> 40

<211> 54<211> 54

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(F392D).r<223> Primer H3_Swi(F392D).r

<400> 40<400> 40

ttttcaatct gatggtcttt ctcgttggtt ttcccgatca atcgattcag cttc 54ttttcaatct gatggtcttt ctcgttggtt ttcccgatca atcgattcag cttc 54

<210> 41<210> 41

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(F392D).c<223> Primer H3_Swi(F392D).c

<400> 41<400> 41

tcgggaaaac caacgagaaa gaccatcaga ttgaaaaaga attctcag 48tcgggaaaac caacgagaaa gaccatcaga ttgaaaaaga attctcag 48

<210> 42<210> 42

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-F392D<223> DNA PDI-H3 Switz-F392D

<400> 42<400> 42

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaagacca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaagacca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 43<210> 43

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-F392D<223> AK PDI-H3 Switz-F392D

<400> 43<400> 43

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys AspIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Asp

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 44<210> 44

<211> 50<211> 50

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(L431M).r<223> Primer H3_Swi(L431M).r

<400> 44<400> 44

ttgtatgttg gttctccatg gcaacaagaa gctccgcgtt gtatgaccag 50ttgtatgttg gttctccatg gcaacaagaa gctccgcgtt gtatgaccag 50

<210> 45<210> 45

<211> 54<211> 54

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(L431M).c<223> Primer H3_Swi(L431M).c

<400> 45<400> 45

ggagcttctt gttgccatgg agaaccaaca tacaattgat ctaactgact caga 54ggagcttctt gttgccatgg agaaccaaca tacaattgat ctaactgact caga 54

<210> 46<210> 46

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-L431M<223> DNA PDI-H3 Switz-L431M

<400> 46<400> 46

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccatggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccatggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 47<210> 47

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-L431M<223> AK PDI-H3 Switz-L431M

<400> 47<400> 47

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Met Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Met Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 48<210> 48

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-CysTm<223> DNA PDI-H3 Switz-CysTm

<400> 48<400> 48

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 49<210> 49

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-CysTm<223> AK PDI-H3 Switz-CysTm

<400> 49<400> 49

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 50<210> 50

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(N382A).r<223> Primer H3_Swi(N382A).r

<400> 50<400> 50

tttcccgatc aatcgagcca gcttcccatt gatttgatcg attgctgc 48ttttcccgatc aatcgagcca gcttcccatt gatttgatcg attgctgc 48

<210> 51<210> 51

<211> 54<211> 54

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(N382A).c<223> Primer H3_Swi(N382A).c

<400> 51<400> 51

tcaaatcaat gggaagctgg ctcgattgat cgggaaaacc aacgagaaat tcca 54tcaaatcaat gggaagctgg ctcgattgat cgggaaaacc aacgagaaat tcca 54

<210> 52<210> 52

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-N382A-CysTm<223> DNA PDI-H3 Switz-N382A-CysTm

<400> 52<400> 52

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 53<210> 53

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-N382A-CysTm<223> AK PDI-H3 Switz-N382A-CysTm

<400> 53<400> 53

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 54<210> 54

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(L384V).r<223> Primer H3_Swi(L384V).r

<400> 54<400> 54

ttggttttcc cgatcactcg attcagcttc ccattgattt gatcgatt 48ttggttttcc cgatcactcg attcagcttc ccattgattt gatcgatt 48

<210> 55<210> 55

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(L384V).c<223> Primer H3_Swi(L384V).c

<400> 55<400> 55

gggaagctga atcgagtgat cgggaaaacc aacgagaaat tccatcag 48gggaagctga atcgagtgat cgggaaaacc aacgagaaat tccatcag 48

<210> 56<210> 56

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-L384V-CysTm<223> DNA PDI-H3 Switz-L384V-CysTm

<400> 56<400> 56

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 57<210> 57

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-L384V-CysTm<223> AK PDI-H3 Switz-L384V-CysTm

<400> 57<400> 57

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 58<210> 58

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-F392D-CysTm<223> DNA PDI-H3 Switz-F392D-CysTm

<400> 58<400> 58

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaagacca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaagacca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 59<210> 59

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-F392D-CysTm<223> AK PDI-H3 Switz-F392D-CysTm

<400> 59<400> 59

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys AspIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Asp

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 60<210> 60

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-L431M-CysTm<223> DNA PDI-H3 Switz-L431M-CysTm

<400> 60<400> 60

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccatggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccatggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 61<210> 61

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-L431M-CysTm<223> AK PDI-H3 Switz-L431M-CysTm

<400> 61<400> 61

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Met Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Met Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 62<210> 62

<211> 4540<211> 4540

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Клонирующий вектор 1190 от левой границы T-ДНК к правой<223> Cloning vector 1190 from the left border of the T-DNA to the right

<400> 62<400> 62

tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60

gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120

aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180

aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240

ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300

gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360360

aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420

aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480

taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540

aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600

atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660

taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720

tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780

gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840

acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900

ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960

accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020

gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080

aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg 11401140

gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200

actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260

aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320

gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380

tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt 14401440

agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500

tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560

tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620

ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa 16801680

tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac 17401740

ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800

cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa 18601860

gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920

tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980

ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040

ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100

cgcgttggga attactagcg cgtgtcgaca agcttgcatg ccggtcaaca tggtggagca 21602160

cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 2220cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat 2220

tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 2280tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat 2280

ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 2340ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg 2340

cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 2400cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc 2400

cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt 24602460

ggattgatgt gataacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga 2520ggattgatgt gataacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga 2520

tacagtctca gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa 2580tacagtctca gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa 2580

cctcctcgga ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga 2640cctcctcgga ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga 2640

aggtggctcc tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc 2700aggtggctcc tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc 2700

tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga 2760tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga 2760

cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat atctccactg acgtaaggga 28202820

tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca 2880tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca 2880

tttggagagg tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa 2940tttggagagg tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa 2940

ccaaaccttc ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc 3000ccaaaccttc ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc 3000

ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg caccgcggat ggcgaaaaac 3060ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg caccgcggat ggcgaaaaac 3060

gttgcgattt tcggcttatt gttttctctt cttgtgttgg ttccttctca gatcttcgcc 3120gttgcgattt tcggcttatt gttttctctt cttgtgttgg ttccttctca gatcttcgcc 3120

tgcaggctcc tcagccaaaa cgacaccccc atctgtctat ccactggccc ctggatctgc 3180tgcaggctcc tcagccaaaa cgacaccccc atctgtctat ccactggccc ctggatctgc 3180

tgcccaaact aactccatgg tgaccctggg atgcctggtc aagggctatt tccctgagcc 3240tgcccaaact aactccatgg tgaccctggg atgcctggtc aagggctatt tccctgagcc 3240

agtgacagtg acctggaact ctggatccct gtccagcggt gtgcacacct tcccagctgt 3300agtgacagtg acctggaact ctggatccct gtccagcggt gtgcacacct tcccagctgt 3300

cctgcagtct gacctctaca ctctgagcag ctcagtgact gtcccctcca gcacctggcc 3360cctgcagtct gacctctaca ctctgagcag ctcagtgact gtcccctcca gcacctggcc 3360

cagcgagacc gtcacctgca acgttgccca cccggccagc agcaccaagg tggacaagaa 3420cagcgagacc gtcacctgca acgttgccca cccggccagc agcaccaagg tggacaagaa 3420

aattgtgccc agggattgtg gttgtaagcc ttgcatatgt acagtcccag aagtatcatc 3480aattgtgccc agggattgtg gttgtaagcc ttgcatatgt acagtcccag aagtatcatc 3480

tgtcttcatc ttccccccaa agcccaagga tgtgctcacc attactctga ctcctaaggt 3540tgtcttcatc ttccccccaa agcccaagga tgtgctcacc attactctga ctcctaaggt 3540

cacgtgtgtt gtggtagaca tcagcaagga tgatcccgag gtccagttca gctggtttgt 3600cacgtgtgtt gtggtagaca tcagcaagga tgatcccgag gtccagttca gctggtttgt 3600

agatgatgtg gaggtgcaca cagctcagac gcaaccccgg gaggagcagt tcaacagcac 3660agatgatgtg gaggtgcaca cagctcagac gcaaccccgg gaggagcagt tcaacagcac 3660

tttccgctca gtcagtgaac ttcccatcat gcaccaggac tggctcaatg gcaaggagcg 3720tttccgctca gtcagtgaac ttcccatcat gcaccaggac tggctcaatg gcaaggagcg 3720

atcgctcacc atcaccatca ccatcaccat caccattaaa ggcctatttt ctttagtttg 3780atcgctcacc atcaccatca ccatcaccat caccattaaa ggcctatttt ctttagtttg 3780

aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg tgctcagagt 3840aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg tgctcagagt 3840

gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt cgtcccttca 3900gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt cgtcccttca 3900

gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga ccgggaattc 39603960

gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt ttcttaagat 4020gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt ttcttaagat 4020

tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc 4080tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc 4080

atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag 41404140

tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata 4200tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata 4200

aattatcgcg cgcggtgtca tctatgttac tagatctcta gagtctcaag cttggcgcgc 4260aattatcgcg cgcggtgtca tctatgttac tagatctcta gagtctcaag cttggcgcgc 4260

ccacgtgact agtggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 4320ccacgtgact agtggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg 4320

ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 4380ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag 4380

aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tgctagagca 4440aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tgctagagca 4440

gcttgagctt ggatcagatt gtcgtttccc gccttcagtt taaactatca gtgtttgaca 4500gcttgagctt ggatcagatt gtcgtttccc gccttcagtt taaactatca gtgtttgaca 4500

ggatatattg gcgggtaaac ctaagagaaa agagcgttta 4540ggatatattg gcgggtaaac ctaagagaaa agagcgttta 4540

<210> 63<210> 63

<211> 3105<211> 3105

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 1314 от промотора 2X35S к терминатору NOS<223> Construct 1314 from 2X35S promoter to NOS terminator

<400> 63<400> 63

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct ccctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgctg acacattatg tataggttat catgcgaaca attcaacaga 1020tccttctcag atcttcgctg acacattatg tataggttat catgcgaaca attcaacaga 1020

cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga 1080cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga 1080

agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa 1140agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa 1140

atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag 1200atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag 1200

ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga 1260ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga 1260

tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt 1320tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt 1320

tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc 1380tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc 1380

agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa 1440agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa 1440

aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct 1500aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct 1500

cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa 1560cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa 1560

tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat 1620tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat 1620

agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt 1680agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt 1680

agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc 1740agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc 1740

attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga 1800attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga 1800

ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa 1860ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa 1860

tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact 1920tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact 1920

ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc 1980ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc 1980

cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca 2040cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca 2040

aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga 2100aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga 2100

gattactaac aaagtaaatt ctgttattga aaagatgaat acacagttca cagcagtagg 21602160

taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg 2220taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg 2220

tttcctggac atttggactt acaatgccga actgttggtt ctattggaaa atgaaagaac 2280tttcctggac atttggactt acaatgccga actgttggtt ctattggaaa atgaaagaac 2280

tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa 2340tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa 2340

aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac 2400aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac 2400

gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa 2460gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa 2460

attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt 2520attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt 2520

ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag 2580ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag 2580

tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt 2640tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt 2640

ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg 2700ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg 2700

tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt 27602760

cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga 28202820

ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt 2880ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt 2880

ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 2940ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 2940

tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt 30003000

atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 3060atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 3060

aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105

<210> 64<210> 64

<211> 3105<211> 3105

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 2980 от промотора 2X35S к терминатору NOS<223> Construct 2980 from 2X35S promoter to NOS terminator

<400> 64<400> 64

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct ccctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgcgg acacattatg tataggttat catgcgaaca attcaacaga 1020tccttctcag atcttcgcgg acacattatg tataggttat catgcgaaca attcaacaga 1020

cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga 1080cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga 1080

agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa 1140agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa 1140

atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag 1200atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag 1200

ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga 1260ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga 1260

tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt 1320tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt 1320

tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc 1380tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc 1380

agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa 1440agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa 1440

aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct 1500aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct 1500

cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa 1560cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa 1560

tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat 1620tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat 1620

agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt 1680agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt 1680

agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc 1740agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc 1740

attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga 1800attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga 1800

ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa 1860ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa 1860

tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact 1920tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact 1920

ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc 1980ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc 1980

cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca 2040cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca 2040

aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga 2100aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga 2100

gattactaac aaagtaaatt ctgttattga aaagatgaat acacaggaca cagcagtagg 21602160

taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg 2220taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg 2220

tttcctggac atttggactt acaatgccga actgttggtt ctattggaaa atgaaagaac 2280tttcctggac atttggactt acaatgccga actgttggtt ctattggaaa atgaaagaac 2280

tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa 2340tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa 2340

aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac 2400aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac 2400

gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa 2460gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa 2460

attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt 2520attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt 2520

ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag 2580ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag 2580

tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt 2640tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt 2640

ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg 2700ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg 2700

tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt 27602760

cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga 28202820

ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt 2880ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt 2880

ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 2940ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 2940

tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt 30003000

atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 3060atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 3060

aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105

<210> 65<210> 65

<211> 3105<211> 3105

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 2995 от промотора 2X35S к терминатору NOS<223> Construct 2995 from 2X35S promoter to NOS terminator

<400> 65<400> 65

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct ccctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgcgg acacattatg tataggttat catgcgaaca attcaacaga 1020tccttctcag atcttcgcgg acacattatg tataggttat catgcgaaca attcaacaga 1020

cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga 1080cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga 1080

agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa 1140agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa 1140

atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag 1200atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag 1200

ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga 1260ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga 1260

tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt 1320tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt 1320

tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc 1380tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc 1380

agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa 1440agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa 1440

aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct 1500aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct 1500

cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa 1560cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa 1560

tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat 1620tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat 1620

agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt 1680agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt 1680

agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc 1740agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc 1740

attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga 1800attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga 1800

ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa 1860ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa 1860

tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact 1920tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact 1920

ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc 1980ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc 1980

cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca 2040cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca 2040

aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga 2100aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga 2100

gattactaac aaagtaaatt ctgttattga aaagatgaat acacaggaca cagcagtagg 21602160

taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg 2220taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg 2220

tttcctggac atttggactt acaatgccga actgttggtt ctaatggaaa atgaaagaac 2280tttcctggac atttggactt acaatgccga actgttggtt ctaatggaaa atgaaagaac 2280

tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa 2340tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa 2340

aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac 2400aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac 2400

gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa 2460gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa 2460

attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt 2520attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt 2520

ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag 2580ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag 2580

tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt 2640tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt 2640

ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg 2700ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg 2700

tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt 27602760

cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga 28202820

ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt 2880ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt 2880

ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 2940ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat 2940

tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt 30003000

atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 3060atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca 3060

aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105

<210> 66<210> 66

<211> 6360<211> 6360

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Клонирующий вектор 3556 от левой границы T-ДНК к правой<223> Cloning vector 3556 from the left border of the T-DNA to the right

<400> 66<400> 66

tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60

gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120

aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180

aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240

ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300

gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360360

aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420

aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480

taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540

aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600

atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660

taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720

tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780

gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840

acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900

ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960

accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt 1020

gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag 1080

aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg 11401140

gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg 1200

actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc 1260

aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg 1320

gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca 1380

tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt 14401440

agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg 1500

tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga 1560

tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt 1620

ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa 16801680

tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac 17401740

ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg 1800

cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa 18601860

gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt 1920

tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct 1980

ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc 2040

ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg 2100

cgcgttggga attactagcg cgtgtcgaca cgcgtggcgc gccctggtat atttatatgt 21602160

tgtcaaataa ctcaaaaacc ataaaagttt aagttagcaa gtgtgtacat ttttacttga 22202220

acaaaaatat tcacctacta ctgttataaa tcattattaa acattagagt aaagaaatat 2280acaaaaatat tcacctacta ctgttataaa tcattattaa acattagagt aaagaaatat 2280

ggatgataag aacaagagta gtgatatttt gacaacaatt ttgttgcaac atttgagaaa 2340ggatgataag aacaagagta gtgatatttt gacaacaatt ttgttgcaac atttgagaaa 2340

attttgttgt tctctctttt cattggtcaa aaacaataga gagagaaaaa ggaagaggga 2400attttgttgt tctctctttt cattggtcaa aaacaataga gagagaaaaa ggaagaggga 2400

gaataaaaac ataatgtgag tatgagagag aaagttgtac aaaagttgta ccaaaatagt 24602460

tgtacaaata tcattgagga atttgacaaa agctacacaa ataagggtta attgctgtaa 25202520

ataaataagg atgacgcatt agagagatgt accattagag aatttttggc aagtcattaa 2580ataaataagg atgacgcatt agagagatgt accattagag aatttttggc aagtcattaa 2580

aaagaaagaa taaattattt ttaaaattaa aagttgagtc atttgattaa acatgtgatt 26402640

atttaatgaa ttgatgaaag agttggatta aagttgtatt agtaattaga atttggtgtc 27002700

aaatttaatt tgacatttga tcttttccta tatattgccc catagagtca gttaactcat 2760aaatttaatt tgacatttga tcttttccta tatattgccc catagagtca gttaactcat 2760

ttttatattt catagatcaa ataagagaaa taacggtata ttaatccctc caaaaaaaaa 2820ttttatattt catagatcaa ataagagaaa taacggtata ttaatccctc caaaaaaaaa 2820

aaacggtata tttactaaaa aatctaagcc acgtaggagg ataacaggat ccccgtagga 2880aaacggtata tttactaaaa aatctaagcc acgtaggagg ataacaggat ccccgtagga 2880

ggataacatc caatccaacc aatcacaaca atcctgatga gataacccac tttaagccca 2940ggataacatc caatccaacc aatcacaaca atcctgatga gataacccac tttaagccca 2940

cgcatctgtg gcacatctac attatctaaa tcacacattc ttccacacat ctgagccaca 3000cgcatctgtg gcacatctac attatctaaa tcacacattc ttccacacat ctgagccaca 3000

caaaaaccaa tccacatctt tatcacccat tctataaaaa atcacacttt gtgagtctac 3060caaaaaccaa tccacatctt tatcacccat tctataaaaa atcacacttt gtgagtctac 3060

actttgattc ccttcaaaca catacaaaga gaagagacta attaattaat taatcatctt 3120actttgattc ccttcaaaca catacaaaga gaagagacta attaattaat taatcatctt 3120

gagagaaaat gagtcttcta accgaggtcg aaacgcctat cagaaacgaa tgggggtgca 3180gagagaaaat gagtcttcta accgaggtcg aaacgcctat cagaaacgaa tgggggtgca 3180

gatgcaacga ttcaagtgat cctcttgttg ttgccgcaag tataattggg attgtgcacc 32403240

tgatattgtg gattattgat cgcctttttt ccaaaagcat ttatcgtatc tttaaacacg 3300tgatattgtg gattattgat cgcctttttt ccaaaagcat ttatcgtatc tttaaacacg 3300

gtttaaaaag agggccttct acggaaggag taccagagtc tatgagggaa gaatatcgag 33603360

aggaacagca gaatgctgtg gatgctgacg atggtcattt tgtcagcata gagctggagt 3420aggaacagca gaatgctgtg gatgctgacg atggtcattt tgtcagcata gagctggagt 3420

aagagctcta agttaaaatg cttcttcgtc tcctatttat aatatggttt gttattgtta 3480aagagctcta agttaaaatg cttcttcgtc tcctatttat aatatggttt gttattgtta 3480

attttgttct tgtagaagag cttaattaat cgttgttgtt atgaaatact atttgtatga 35403540

gatgaactgg tgtaatgtaa ttcatttaca taagtggagt cagaatcaga atgtttcctc 3600gatgaactgg tgtaatgtaa ttcatttaca taagtggagt cagaatcaga atgtttcctc 3600

cataactaac tagacatgaa gacctgccgc gtacaattgt cttatatttg aacaactaaa 3660cataactaac tagacatgaa gacctgccgc gtacaattgt cttatatttg aacaactaaa 3660

attgaacatc ttttgccaca actttataag tggttaatat agctcaaata tatggtcaag 37203720

ttcaatagat taataatgga aatatcagtt atcgaaattc attaacaatc aacttaacgt 37803780

tattaactac taattttata tcatcccctt tgataaatga tagtacacca attaggaagg 3840tattaactac taattttata tcatcccctt tgataaatga tagtacacca attaggaagg 3840

aactaggaga ttgtcgtttc ccgccttcag tttgcaagct gctctagccg tgtagccaat 3900aactaggaga ttgtcgtttc ccgccttcag tttgcaagct gctctagccg tgtagccaat 3900

acgcaaaccg cctctccccg cgcgttggga attactagcg cgtgtcgaca agcttgcatg 3960acgcaaaccg cctctccccg cgcgttggga attactagcg cgtgtcgaca agcttgcatg 3960

ccggtcaaca tggtggagca cgacacactt gtctactcca aaaatatcaa agatacagtc 4020ccggtcaaca tggtggagca cgacacactt gtctactcca aaaatatcaa agatacagtc 4020

tcagaagacc aaagggcaat tgagactttt caacaaaggg taatatccgg aaacctcctc 4080tcagaagacc aaagggcaat tgagactttt caacaaaggg taatatccgg aaacctcctc 4080

ggattccatt gcccagctat ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc 4140ggattccatt gcccagctat ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc 4140

tcctacaaat gccatcattg cgataaagga aaggccatcg ttgaagatgc ctctgccgac 4200tcctacaaat gccatcattg cgataaagga aaggccatcg ttgaagatgc ctctgccgac 4200

agtggtccca aagatggacc cccacccacg aggagcatcg tggaaaaaga agacgttcca 4260agtggtccca aagatggacc cccacccacg aggagcatcg tggaaaaaga agacgttcca 4260

accacgtctt caaagcaagt ggattgatgt gataacatgg tggagcacga cacacttgtc 4320accacgtctt caaagcaagt ggattgatgt gataacatgg tggagcacga cacacttgtc 4320

tactccaaaa atatcaaaga tacagtctca gaagaccaaa gggcaattga gacttttcaa 4380tactccaaaa atatcaaaga tacagtctca gaagaccaaa gggcaattga gacttttcaa 4380

caaagggtaa tatccggaaa cctcctcgga ttccattgcc cagctatctg tcactttatt 44404440

gtgaagatag tggaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag 4500gtgaagatag tggaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag 4500

gccatcgttg aagatgcctc tgccgacagt ggtcccaaag atggaccccc acccacgagg 4560gccatcgttg aagatgcctc tgccgacagt ggtcccaaag atggaccccc acccacgagg 4560

agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat 4620agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat 4620

atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct 4680atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct 4680

atataaggaa gttcatttca tttggagagg tattaaaatc ttaataggtt ttgataaaag 47404740

cgaacgtggg gaaacccgaa ccaaaccttc ttctaaactc tctctcatct ctcttaaagc 4800cgaacgtggg gaaacccgaa ccaaaccttc ttctaaactc tctctcatct ctcttaaagc 4800

aaacttctct cttgtctttc ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg 4860aaacttctct cttgtctttc ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg 4860

caccgcggat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt cttgtgttgg 4920caccgcggat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt cttgtgttgg 4920

ttccttctca gatcttcgcc tgcaggctcc tcagccaaaa cgacaccccc atctgtctat 4980ttccttctca gatcttcgcc tgcaggctcc tcagccaaaa cgacaccccc atctgtctat 4980

ccactggccc ctggatctgc tgcccaaact aactccatgg tgaccctggg atgcctggtc 5040ccactggccc ctggatctgc tgcccaaact aactccatgg tgaccctggg atgcctggtc 5040

aagggctatt tccctgagcc agtgacagtg acctggaact ctggatccct gtccagcggt 5100aagggctatt tccctgagcc agtgacagtg acctggaact ctggatccct gtccagcggt 5100

gtgcacacct tcccagctgt cctgcagtct gacctctaca ctctgagcag ctcagtgact 5160gtgcacacct tcccagctgt cctgcagtct gacctctaca ctctgagcag ctcagtgact 5160

gtcccctcca gcacctggcc cagcgagacc gtcacctgca acgttgccca cccggccagc 5220gtcccctcca gcacctggcc cagcgagacc gtcacctgca acgttgccca cccggccagc 5220

agcaccaagg tggacaagaa aattgtgccc agggattgtg gttgtaagcc ttgcatatgt 5280agcaccaagg tggacaagaa aattgtgccc agggattgtg gttgtaagcc ttgcatatgt 5280

acagtcccag aagtatcatc tgtcttcatc ttccccccaa agcccaagga tgtgctcacc 5340acagtcccag aagtatcatc tgtcttcatc ttccccccaa agcccaagga tgtgctcacc 5340

attactctga ctcctaaggt cacgtgtgtt gtggtagaca tcagcaagga tgatcccgag 5400attactctga ctcctaaggt cacgtgtgtt gtggtagaca tcagcaagga tgatcccgag 5400

gtccagttca gctggtttgt agatgatgtg gaggtgcaca cagctcagac gcaaccccgg 5460gtccagttca gctggtttgt agatgatgtg gaggtgcaca cagctcagac gcaaccccgg 5460

gaggagcagt tcaacagcac tttccgctca gtcagtgaac ttcccatcat gcaccaggac 5520gaggagcagt tcaacagcac tttccgctca gtcagtgaac ttcccatcat gcaccaggac 5520

tggctcaatg gcaaggagcg atcgctcacc atcaccatca ccatcaccat caccattaaa 5580tggctcaatg gcaaggagcg atcgctcacc atcaccatca ccatcaccat caccattaaa 5580

ggcctatttt ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag 5640ggcctatttt ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag 5640

cggttttctg tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg 5700cggttttctg tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg 5700

tttagcaggt cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa 57605760

aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg 5820aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg 5820

gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt 5880gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt 5880

tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag 5940tctgttgaat tacgttaagcatgtaataat taacatgtaa

atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat 6000atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat 6000

atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac tagatctcta 6060atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac tagatctcta 6060

gagtctcaag cttggcgcgc ccacgtgact agtggcactg gccgtcgttt tacaacgtcg 61206120

tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc 6180tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc 6180

cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct 6240cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct 6240

gaatggcgaa tgctagagca gcttgagctt ggatcagatt gtcgtttccc gccttcagtt 6300gaatggcgaa tgctagagca gcttgagctt ggatcagatt gtcgtttccc gccttcagtt 6300

taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa agagcgttta 63606360

<210> 67<210> 67

<211> 50<211> 50

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер IF-H5ITMCT.s1-4r<223> Primer IF-H5ITMCT.s1-4r

<400> 67<400> 67

actaaagaaa ataggccttt aaatgcaaat tctgcattgt aacgatccat 50actaaagaaa ataggccttt aaatgcaaat tctgcattgt aacgatccat 50

<210> 68<210> 68

<211> 1731<211> 1731

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H5 Indo<223> DNA PDI-H5 Indo

<400> 68<400> 68

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg ccgatcagat ttgcattggt taccatgcaa acaattcaac agagcaggtt 120cagatcttcg ccgatcagat ttgcattggt taccatgcaa acaattcaac agagcaggtt 120

gacacaatca tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 180gacacaatca tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 180

cacaacggga agctctgcga tctagatgga gtgaagcctc taattttaag agattgtagt 240cacaacggga agctctgcga tctagatgga gtgaagcctc taattttaag agattgtagt 240

gtagctggat ggctcctcgg gaacccaatg tgtgacgaat tcatcaatgt accggaatgg 300gtagctggat ggctcctcgg gaacccaatg tgtgacgaat tcatcaatgt accggaatgg 300

tcttacatag tggagaaggc caatccaacc aatgacctct gttacccagg gagtttcaac 360tcttacatag tggagaaggc caatccaacc aatgacctct gttacccagg gagtttcaac 360

gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcaaatc 420420

atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gagttagctc agcatgtcca 480atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gagttagctc agcatgtcca 480

tacctgggaa gtccctcctt ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca 540tacctgggaa gtccctcctt ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca 540

tacccaacaa taaagaaaag ctacaataat accaaccaag aggatctttt ggtactgtgg 600600

ggaattcacc atcctaatga tgcggcagag cagacaaggc tatatcaaaa cccaaccacc 660ggaattcacc atcctaatga tgcggcagag cagacaaggc tatatcaaaa cccaaccacc 660

tatatttcca ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 720tatatttcca ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 720

tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaacctaat 780tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaacctaat 780

gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 840gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 840

gtcaagaaag gggactcagc aattatgaaa agtgaattgg aatatggtaa ctgcaacacc 900gtcaagaaag gggactcagc aattatgaaa agtgaattgg aatatggtaa ctgcaacacc 900

aagtgtcaaa ctccaatggg ggcgataaac tctagtatgc cattccacaa catacaccct 960aagtgtcaaa ctccaatggg ggcgataaac tctagtatgc cattccacaa catacaccct 960

ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcaacaggg 1020ctcaccatcg gggaatgcc caaatatgtg aaatcaaaca gattagtcct tgcaacaggg 1020

ctcagaaata gccctcaaag agagagcaga agaaaaaaga gaggactatt tggagctata 1080ctcagaaata gccctcaaag agagagcaga agaaaaaaga gaggactatt tggagctata 1080

gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat 1140gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat 1140

agcaatgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat 1200agcaatgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat 1200

ggagtcacca ataaggtcaa ctcaatcatt gacaaaatga acactcagtt tgaggccgtt 1260ggagtcacca ataaggtcaa ctcaatcatt gacaaaatga acactcagtt tgaggccgtt 1260

ggaagggaat ttaataactt agaaaggaga atagagaatt taaacaagaa gatggaagac 13201320

gggtttctag atgtctggac ttataatgcc gaacttctgg ttctcatgga aaatgagaga 1380gggtttctag atgtctggac ttataatgcc gaacttctgg ttctcatgga aaatgagaga 1380

actctagact ttcatgactc aaatgttaag aacctctacg acaaggtccg actacagctt 1440actctagact ttcatgactc aaatgttaag aacctctacg acaaggtccg actacagctt 1440

agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcacaa atgtgataat 1500agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcacaa atgtgataat 1500

gaatgtatgg aaagtataag aaacggaacg tacaactatc cgcagtattc agaagaagca 1560gaatgtatgg aaagtataag aaacggaacg tacaactatc cgcagtattc agaagaagca 1560

agattaaaaa gagaggaaat aagtggggta aaattggaat caataggaac ttaccaaata 1620agattaaaaa gagaggaaat aagtggggta aaattggaat caataggaac ttaccaaata 1620

ctgtcaattt attcaacagt ggcgagttcc ctagcactgg caatcatgat ggctggtcta 1680ctgtcaattt attcaacagt ggcgagttcc ctagcactgg caatcatgat ggctggtcta 1680

tctttatgga tgtgctccaa tggatcgtta caatgcagaa tttgcattta a 1731tctttatgga tgtgctccaa tggatcgtta caatgcagaa tttgcattta a 1731

<210> 69<210> 69

<211> 576<211> 576

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H5 Indo<223> AK PDI-H5 Indo

<400> 69<400> 69

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr HisLeu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His

20 25 3020 25 30

Ala Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn ValAla Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn Val

35 40 4535 40 45

Thr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly LysThr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly Lys

50 55 6050 55 60

Leu Cys Asp Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys SerLeu Cys Asp Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys Ser

65 70 75 8065 70 75 80

Val Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Ile AsnVal Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Ile Asn

85 90 9585 90 95

Val Pro Glu Trp Ser Tyr Ile Val Glu Lys Ala Asn Pro Thr Asn AspVal Pro Glu Trp Ser Tyr Ile Val Glu Lys Ala Asn Pro Thr Asn Asp

100 105 110100 105 110

Leu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His LeuLeu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His Leu

115 120 125115 120 125

Leu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys SerLeu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys Ser

130 135 140130 135 140

Ser Trp Ser Asp His Glu Ala Ser Ser Gly Val Ser Ser Ala Cys ProSer Trp Ser Asp His Glu Ala Ser Ser Gly Val Ser Ser Ala Cys Pro

145 150 155 160145 150 155 160

Tyr Leu Gly Ser Pro Ser Phe Phe Arg Asn Val Val Trp Leu Ile LysTyr Leu Gly Ser Pro Ser Phe Phe Arg Asn Val Val Trp Leu Ile Lys

165 170 175165 170 175

Lys Asn Ser Thr Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr AsnLys Asn Ser Thr Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn

180 185 190180 185 190

Gln Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp AlaGln Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala

195 200 205195 200 205

Ala Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser IleAla Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Ile

210 215 220210 215 220

Gly Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr ArgGly Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg

225 230 235 240225 230 235 240

Ser Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr IleSer Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile

245 250 255245 250 255

Leu Lys Pro Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe IleLeu Lys Pro Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile

260 265 270260 265 270

Ala Pro Glu Tyr Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Ala IleAla Pro Glu Tyr Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Ala Ile

275 280 285275 280 285

Met Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn Thr Lys Cys Gln ThrMet Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn Thr Lys Cys Gln Thr

290 295 300290 295 300

Pro Met Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His ProPro Met Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro

305 310 315 320305 310 315 320

Leu Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu ValLeu Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val

325 330 335325 330 335

Leu Ala Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg LysLeu Ala Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg Lys

340 345 350340 345 350

Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly TrpLys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp

355 360 365355 360 365

Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu GlnGln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln

370 375 380370 375 380

Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala Ile AspGly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala Ile Asp

385 390 395 400385 390 395 400

Gly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr GlnGly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln

405 410 415405 410 415

Phe Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile GluPhe Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu

420 425 430420 425 430

Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr TyrAsn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr

435 440 445435 440 445

Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp PheAsn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe

450 455 460450 455 460

His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln LeuHis Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu

465 470 475 480465 470 475 480

Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr HisArg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His

485 490 495485 490 495

Lys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn Gly Thr Tyr AsnLys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn Gly Thr Tyr Asn

500 505 510500 505 510

Tyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile SerTyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser

515 520 525515 520 525

Gly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile TyrGly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr

530 535 540530 535 540

Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Met Ala Gly LeuSer Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Met Ala Gly Leu

545 550 555 560545 550 555 560

Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys IleSer Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile

565 570 575565 570 575

<210> 70<210> 70

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H5Ind(F393D).r<223> Primer H5Ind(F393D).r

<400> 70<400> 70

cttccaacgg cctcgtcctg agtgttcatt ttgtcaatga ttgagttga 49cttccaacgg cctcgtcctg agtgttcatt ttgtcaatga ttgagttga 49

<210> 71<210> 71

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> H5Ind(F393D).c<223> H5Ind(F393D).c

<400> 71<400> 71

caaaatgaac actcaggacg aggccgttgg aagggaattt aataactta 49caaaatgaac actcaggacg aggccgttgg aagggaattt aataactta 49

<210> 72<210> 72

<211> 1731<211> 1731

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H5 Indo-F393D<223> DNA PDI-H5 Indo-F393D

<400> 72<400> 72

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cggatcagat ttgcattggt taccatgcaa acaattcaac agagcaggtt 120cagatcttcg cggatcagat ttgcattggt taccatgcaa acaattcaac agagcaggtt 120

gacacaatca tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 180gacacaatca tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 180

cacaacggga agctctgcga tctagatgga gtgaagcctc taattttaag agattgtagt 240cacaacggga agctctgcga tctagatgga gtgaagcctc taattttaag agattgtagt 240

gtagctggat ggctcctcgg gaacccaatg tgtgacgaat tcatcaatgt accggaatgg 300gtagctggat ggctcctcgg gaacccaatg tgtgacgaat tcatcaatgt accggaatgg 300

tcttacatag tggagaaggc caatccaacc aatgacctct gttacccagg gagtttcaac 360tcttacatag tggagaaggc caatccaacc aatgacctct gttacccagg gagtttcaac 360

gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcaaatc 420420

atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gagttagctc agcatgtcca 480atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gagttagctc agcatgtcca 480

tacctgggaa gtccctcctt ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca 540tacctgggaa gtccctcctt ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca 540

tacccaacaa taaagaaaag ctacaataat accaaccaag aggatctttt ggtactgtgg 600600

ggaattcacc atcctaatga tgcggcagag cagacaaggc tatatcaaaa cccaaccacc 660ggaattcacc atcctaatga tgcggcagag cagacaaggc tatatcaaaa cccaaccacc 660

tatatttcca ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 720tatatttcca ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 720

tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaacctaat 780tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaacctaat 780

gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 840gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 840

gtcaagaaag gggactcagc aattatgaaa agtgaattgg aatatggtaa ctgcaacacc 900gtcaagaaag gggactcagc aattatgaaa agtgaattgg aatatggtaa ctgcaacacc 900

aagtgtcaaa ctccaatggg ggcgataaac tctagtatgc cattccacaa catacaccct 960aagtgtcaaa ctccaatggg ggcgataaac tctagtatgc cattccacaa catacaccct 960

ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcaacaggg 1020ctcaccatcg gggaatgcc caaatatgtg aaatcaaaca gattagtcct tgcaacaggg 1020

ctcagaaata gccctcaaag agagagcaga agaaaaaaga gaggactatt tggagctata 1080ctcagaaata gccctcaaag agagagcaga agaaaaaaga gaggactatt tggagctata 1080

gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat 1140gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat 1140

agcaatgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat 1200agcaatgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat 1200

ggagtcacca ataaggtcaa ctcaatcatt gacaaaatga acactcagga cgaggccgtt 1260ggagtcacca ataaggtcaa ctcaatcatt gacaaaatga acactcagga cgaggccgtt 1260

ggaagggaat ttaataactt agaaaggaga atagagaatt taaacaagaa gatggaagac 13201320

gggtttctag atgtctggac ttataatgcc gaacttctgg ttctcatgga aaatgagaga 1380gggtttctag atgtctggac ttataatgcc gaacttctgg ttctcatgga aaatgagaga 1380

actctagact ttcatgactc aaatgttaag aacctctacg acaaggtccg actacagctt 1440actctagact ttcatgactc aaatgttaag aacctctacg acaaggtccg actacagctt 1440

agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcacaa atgtgataat 1500agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcacaa atgtgataat 1500

gaatgtatgg aaagtataag aaacggaacg tacaactatc cgcagtattc agaagaagca 1560gaatgtatgg aaagtataag aaacggaacg tacaactatc cgcagtattc agaagaagca 1560

agattaaaaa gagaggaaat aagtggggta aaattggaat caataggaac ttaccaaata 1620agattaaaaa gagaggaaat aagtggggta aaattggaat caataggaac ttaccaaata 1620

ctgtcaattt attcaacagt ggcgagttcc ctagcactgg caatcatgat ggctggtcta 1680ctgtcaattt attcaacagt ggcgagttcc ctagcactgg caatcatgat ggctggtcta 1680

tctttatgga tgtgctccaa tggatcgtta caatgcagaa tttgcattta a 1731tctttatgga tgtgctccaa tggatcgtta caatgcagaa tttgcattta a 1731

<210> 73<210> 73

<211> 576<211> 576

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H5 Indo-F393D<223> AK PDI-H5 Indo-F393D

<400> 73<400> 73

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr HisLeu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His

20 25 3020 25 30

Ala Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn ValAla Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn Val

35 40 4535 40 45

Thr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly LysThr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly Lys

50 55 6050 55 60

Leu Cys Asp Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys SerLeu Cys Asp Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys Ser

65 70 75 8065 70 75 80

Val Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Ile AsnVal Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Ile Asn

85 90 9585 90 95

Val Pro Glu Trp Ser Tyr Ile Val Glu Lys Ala Asn Pro Thr Asn AspVal Pro Glu Trp Ser Tyr Ile Val Glu Lys Ala Asn Pro Thr Asn Asp

100 105 110100 105 110

Leu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His LeuLeu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His Leu

115 120 125115 120 125

Leu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys SerLeu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys Ser

130 135 140130 135 140

Ser Trp Ser Asp His Glu Ala Ser Ser Gly Val Ser Ser Ala Cys ProSer Trp Ser Asp His Glu Ala Ser Ser Gly Val Ser Ser Ala Cys Pro

145 150 155 160145 150 155 160

Tyr Leu Gly Ser Pro Ser Phe Phe Arg Asn Val Val Trp Leu Ile LysTyr Leu Gly Ser Pro Ser Phe Phe Arg Asn Val Val Trp Leu Ile Lys

165 170 175165 170 175

Lys Asn Ser Thr Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr AsnLys Asn Ser Thr Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn

180 185 190180 185 190

Gln Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp AlaGln Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala

195 200 205195 200 205

Ala Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser IleAla Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Ile

210 215 220210 215 220

Gly Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr ArgGly Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg

225 230 235 240225 230 235 240

Ser Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr IleSer Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile

245 250 255245 250 255

Leu Lys Pro Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe IleLeu Lys Pro Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile

260 265 270260 265 270

Ala Pro Glu Tyr Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Ala IleAla Pro Glu Tyr Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Ala Ile

275 280 285275 280 285

Met Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn Thr Lys Cys Gln ThrMet Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn Thr Lys Cys Gln Thr

290 295 300290 295 300

Pro Met Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His ProPro Met Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro

305 310 315 320305 310 315 320

Leu Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu ValLeu Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val

325 330 335325 330 335

Leu Ala Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg LysLeu Ala Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg Lys

340 345 350340 345 350

Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly TrpLys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp

355 360 365355 360 365

Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu GlnGln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln

370 375 380370 375 380

Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala Ile AspGly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala Ile Asp

385 390 395 400385 390 395 400

Gly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr GlnGly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln

405 410 415405 410 415

Asp Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile GluAsp Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu

420 425 430420 425 430

Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr TyrAsn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr

435 440 445435 440 445

Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp PheAsn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe

450 455 460450 455 460

His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln LeuHis Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu

465 470 475 480465 470 475 480

Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr HisArg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His

485 490 495485 490 495

Lys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn Gly Thr Tyr AsnLys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn Gly Thr Tyr Asn

500 505 510500 505 510

Tyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile SerTyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser

515 520 525515 520 525

Gly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile TyrGly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr

530 535 540530 535 540

Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Met Ala Gly LeuSer Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Met Ala Gly Leu

545 550 555 560545 550 555 560

Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys IleSer Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile

565 570 575565 570 575

<210> 74<210> 74

<211> 51<211> 51

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер IF-H5_Egy.r<223> Primer IF-H5_Egy.r

<400> 74<400> 74

actaaagaaa ataggccttt aaatgcaaat tctgcattgt agcgatccat t 51actaaagaaa ataggccttt aaatgcaaat tctgcattgt agcgatccat t 51

<210> 75<210> 75

<211> 1728<211> 1728

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H5 Egypt<223> DNA PDI-H5 Egypt

<400> 75<400> 75

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cggatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 120cagatcttcg cggatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 120

gacacaataa tggaaaagaa tgtcactgtt acacacgccc aagacatact ggaaaagaca 180gacacaataa tggaaaagaa tgtcactgtt acacacgccc aagacatact ggaaaagaca 180

cacaacggga aactctgcaa tctagatgga gtgaagcctc tcattttgag agattgtagt 240cacaacggga aactctgcaa tctagatgga gtgaagcctc tcattttgag agattgtagt 240

gtagctggat ggctcctcgg gaacccaatg tgcgatgaat tcctcaatgt gccggaatgg 300gtagctggat ggctcctcgg gaacccaatg tgcgatgaat tcctcaatgt gccggaatgg 300

tcttacatag tggagaaaat caatccagcc aatgacctct gttatccagg gaatttcaac 360tcttacatag tggagaaaat caatccagcc aatgacctct gttatccagg gaatttcaac 360

gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 420gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 420

attcccaaag attcttggtc agatcatgaa gcctcgggag tgagctcagc atgcccatac 480attcccaaag attcttggtc agatcatgaa gcctcgggag tgagctcagc atgcccatac 480

caaggaagat cctccttttt tagaaatgtt gtatggctta ccaaaaagaa cgatgcatac 540caaggaagat cctccttttt tagaaatgtt gtatggctta ccaaaaagaa cgatgcatac 540

ccaacaataa agaaaagtta caataatact aaccaagaag atcttttggt actatggggg 600ccaacaataa agaaaagtta caataatact aaccaagaag atcttttggt actatggggg 600

attcaccatc caaatgatgc tgcagagcag acaaggcttt atcaaaaccc aactacctat 660attcaccatc caaatgatgc tgcagagcag acaaggcttt atcaaaaccc aactacctat 660

atctccgttg ggacatcaac actaaaccag agattggtac ccaaaatagc tactagatct 720atctccgttg ggacatcaac actaaaccag agattggtac ccaaaatagc tactagatct 720

aaggtaaacg ggcaaagtgg aaggatggag ttcttttgga caattttaaa atcgaatgat 780aaggtaaacg ggcaaagtgg aaggatggag ttcttttgga caattttaaa atcgaatgat 780

gcaataaact ttgagagcaa tggaaacttc attgctccag aaaatgcata caaaattgtc 840gcaataaact ttgagagcaa tggaaacttc attgctccag aaaatgcata caaaattgtc 840

aagaaaggag attcaacaat tatgaaaagt gagttggaat atagtaactg caacaccaag 900aagaaaggag attcaacaat tatgaaaagt gagttggaat atagtaactg caacaccaag 900

tgtcagactc caataggggc gataaactcc agtatgccat tccacaacat ccaccctctc 960tgtcagactc caataggggc gataaactcc agtatgccat tccacaacat ccaccctctc 960

accatcgggg aatgccccaa atatgtgaaa tcaaacagat tagtccttgc tactgggctc 1020accatcgggg aatgccccaa atatgtgaaa tcaaacagat tagtccttgc tactgggctc 1020

aggaatagcc ctcaaggaga gaaaagaaga aaaaagagag gactattcgg agccatagca 1080aggaatagcc ctcaaggaga gaaaagaaga aaaaagagag gactattcgg agccatagca 1080

ggctttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc 1140ggctttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc 1140

aacgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaagggc tatagatgga 1200aacgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaagggc tatagatgga 1200

gtcaccaata aggtcaattc gatcattgac aaaatgaaca ctcagtttga ggctgttgga 1260gtcaccaata aggtcaattc gatcattgac aaaatgaaca ctcagtttga ggctgttgga 1260

agggaattta ataacttaga aaggagaata gaaaatttaa acaagaagat ggaagacgga 1320agggaattta ataacttaga aggagaata gaaaatttaa acaagaagat ggaagacgga 1320

ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact 1380ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact 1380

ctagactttc atgactcaaa tgtcaagaat ctttatgaca aggtccgact acagcttagg 1440ctagactttc atgactcaaa tgtcaagaat ctttatgaca aggtccgact acagcttagg 1440

gataatgcaa aggagcttgg taacggttgt ttcgagttct atcacagatg tgataatgaa 1500gataatgcaa aggagcttgg taacggttgt ttcgagttct atcacagatg tgataatgaa 1500

tgtatggaaa gtgtaagaaa cggaacgtat gactaccctc aatattcaga agaagcaaga 1560tgtatggaaa gtgtaagaaa cggaacgtat gactaccctc aatattcaga agaagcaaga 1560

ttaaaaagag aggaaataag tggagtaaaa ttggagtcaa taggaactta ccaaatactg 1620ttaaaaagag aggaaataag tggagtaaaa ttggagtcaa taggaactta ccaaatactg 1620

tcaatttatt caacagtggc gagctcccta gcactggcaa tcatggtggc tggtctatct 1680tcaatttatt caacagtggc gagctcccta gcactggcaa tcatggtggc tggtctatct 1680

ttatggatgt gctccaatgg atcgctacaa tgcagaattt gcatttaa 1728ttatggatgt gctccaatgg atcgctacaa tgcagaattt gcatttaa 1728

<210> 76<210> 76

<211> 575<211> 575

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H5 Egypt<223> AK PDI-H5 Egypt

<400> 76<400> 76

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr HisLeu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His

20 25 3020 25 30

Ala Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn ValAla Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn Val

35 40 4535 40 45

Thr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly LysThr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly Lys

50 55 6050 55 60

Leu Cys Asn Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys SerLeu Cys Asn Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys Ser

65 70 75 8065 70 75 80

Val Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Leu AsnVal Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Leu Asn

85 90 9585 90 95

Val Pro Glu Trp Ser Tyr Ile Val Glu Lys Ile Asn Pro Ala Asn AspVal Pro Glu Trp Ser Tyr Ile Val Glu Lys Ile Asn Pro Ala Asn Asp

100 105 110100 105 110

Leu Cys Tyr Pro Gly Asn Phe Asn Asp Tyr Glu Glu Leu Lys His LeuLeu Cys Tyr Pro Gly Asn Phe Asn Asp Tyr Glu Glu Leu Lys His Leu

115 120 125115 120 125

Leu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys AspLeu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys Asp

130 135 140130 135 140

Ser Trp Ser Asp His Glu Ala Ser Gly Val Ser Ser Ala Cys Pro TyrSer Trp Ser Asp His Glu Ala Ser Gly Val Ser Ser Ala Cys Pro Tyr

145 150 155 160145 150 155 160

Gln Gly Arg Ser Ser Phe Phe Arg Asn Val Val Trp Leu Thr Lys LysGln Gly Arg Ser Ser Phe Phe Arg Asn Val Val Trp Leu Thr Lys Lys

165 170 175165 170 175

Asn Asp Ala Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn GlnAsn Asp Ala Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn Gln

180 185 190180 185 190

Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala AlaGlu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala Ala

195 200 205195 200 205

Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Val GlyGlu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Val Gly

210 215 220210 215 220

Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg SerThr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg Ser

225 230 235 240225 230 235 240

Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile LeuLys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile Leu

245 250 255245 250 255

Lys Ser Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile AlaLys Ser Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile Ala

260 265 270260 265 270

Pro Glu Asn Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Thr Ile MetPro Glu Asn Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Thr Ile Met

275 280 285275 280 285

Lys Ser Glu Leu Glu Tyr Ser Asn Cys Asn Thr Lys Cys Gln Thr ProLys Ser Glu Leu Glu Tyr Ser Asn Cys Asn Thr Lys Cys Gln Thr Pro

290 295 300290 295 300

Ile Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro LeuIle Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro Leu

305 310 315 320305 310 315 320

Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val LeuThr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val Leu

325 330 335325 330 335

Ala Thr Gly Leu Arg Asn Ser Pro Gln Gly Glu Lys Arg Arg Lys LysAla Thr Gly Leu Arg Asn Ser Pro Gln Gly Glu Lys Arg Arg Lys Lys

340 345 350340 345 350

Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp GlnArg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Gln

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln GlyGly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln Gly

370 375 380370 375 380

Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Arg Ala Ile Asp GlySer Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Arg Ala Ile Asp Gly

385 390 395 400385 390 395 400

Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln PheVal Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln Phe

405 410 415405 410 415

Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu AsnGlu Ala Val Gly Arg Glu Phe Asn Leu Glu Arg Arg Ile Glu Asn

420 425 430420 425 430

Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr AsnLeu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe HisAla Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe His

450 455 460450 455 460

Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu ArgAsp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu Arg

465 470 475 480465 470 475 480

Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His ArgAsp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His Arg

485 490 495485 490 495

Cys Asp Asn Glu Cys Met Glu Ser Val Arg Asn Gly Thr Tyr Asp TyrCys Asp Asn Glu Cys Met Glu Ser Val Arg Asn Gly Thr Tyr Asp Tyr

500 505 510500 505 510

Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser GlyPro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser Gly

515 520 525515 520 525

Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr SerVal Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr Ser

530 535 540530 535 540

Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Val Ala Gly Leu SerThr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Val Ala Gly Leu Ser

545 550 555 560545 550 555 560

Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys IleLeu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile

565 570 575565 570 575

<210> 77<210> 77

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H5Egy(F392D).r<223> Primer H5Egy(F392D).r

<400> 77<400> 77

cttccaacag cctcgtcctg agtgttcatt ttgtcaatga tcgaattga 49cttccaacag cctcgtcctg agtgttcatt ttgtcaatga tcgaattga 49

<210> 78<210> 78

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H5Egy(F392D).c<223> Primer H5Egy(F392D).c

<400> 78<400> 78

caaaatgaac actcaggacg aggctgttgg aagggaattt aataactta 49caaaatgaac actcaggacg aggctgttgg aagggaattt aataactta 49

<210> 79<210> 79

<211> 1728<211> 1728

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H5 Egypt-F392D<223> DNA PDI-H5 Egypt-F392D

<400> 79<400> 79

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cggatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 120cagatcttcg cggatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 120

gacacaataa tggaaaagaa tgtcactgtt acacacgccc aagacatact ggaaaagaca 180gacacaataa tggaaaagaa tgtcactgtt acacacgccc aagacatact ggaaaagaca 180

cacaacggga aactctgcaa tctagatgga gtgaagcctc tcattttgag agattgtagt 240cacaacggga aactctgcaa tctagatgga gtgaagcctc tcattttgag agattgtagt 240

gtagctggat ggctcctcgg gaacccaatg tgcgatgaat tcctcaatgt gccggaatgg 300gtagctggat ggctcctcgg gaacccaatg tgcgatgaat tcctcaatgt gccggaatgg 300

tcttacatag tggagaaaat caatccagcc aatgacctct gttatccagg gaatttcaac 360tcttacatag tggagaaaat caatccagcc aatgacctct gttatccagg gaatttcaac 360

gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 420gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 420

attcccaaag attcttggtc agatcatgaa gcctcgggag tgagctcagc atgcccatac 480attcccaaag attcttggtc agatcatgaa gcctcgggag tgagctcagc atgcccatac 480

caaggaagat cctccttttt tagaaatgtt gtatggctta ccaaaaagaa cgatgcatac 540caaggaagat cctccttttt tagaaatgtt gtatggctta ccaaaaagaa cgatgcatac 540

ccaacaataa agaaaagtta caataatact aaccaagaag atcttttggt actatggggg 600ccaacaataa agaaaagtta caataatact aaccaagaag atcttttggt actatggggg 600

attcaccatc caaatgatgc tgcagagcag acaaggcttt atcaaaaccc aactacctat 660attcaccatc caaatgatgc tgcagagcag acaaggcttt atcaaaaccc aactacctat 660

atctccgttg ggacatcaac actaaaccag agattggtac ccaaaatagc tactagatct 720atctccgttg ggacatcaac actaaaccag agattggtac ccaaaatagc tactagatct 720

aaggtaaacg ggcaaagtgg aaggatggag ttcttttgga caattttaaa atcgaatgat 780aaggtaaacg ggcaaagtgg aaggatggag ttcttttgga caattttaaa atcgaatgat 780

gcaataaact ttgagagcaa tggaaacttc attgctccag aaaatgcata caaaattgtc 840gcaataaact ttgagagcaa tggaaacttc attgctccag aaaatgcata caaaattgtc 840

aagaaaggag attcaacaat tatgaaaagt gagttggaat atagtaactg caacaccaag 900aagaaaggag attcaacaat tatgaaaagt gagttggaat atagtaactg caacaccaag 900

tgtcagactc caataggggc gataaactcc agtatgccat tccacaacat ccaccctctc 960tgtcagactc caataggggc gataaactcc agtatgccat tccacaacat ccaccctctc 960

accatcgggg aatgccccaa atatgtgaaa tcaaacagat tagtccttgc tactgggctc 1020accatcgggg aatgccccaa atatgtgaaa tcaaacagat tagtccttgc tactgggctc 1020

aggaatagcc ctcaaggaga gaaaagaaga aaaaagagag gactattcgg agccatagca 1080aggaatagcc ctcaaggaga gaaaagaaga aaaaagagag gactattcgg agccatagca 1080

ggctttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc 1140ggctttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc 1140

aacgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaagggc tatagatgga 1200aacgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaagggc tatagatgga 1200

gtcaccaata aggtcaattc gatcattgac aaaatgaaca ctcaggacga ggctgttgga 1260gtcaccaata aggtcaattc gatcattgac aaaatgaaca ctcaggacga ggctgttgga 1260

agggaattta ataacttaga aaggagaata gaaaatttaa acaagaagat ggaagacgga 1320agggaattta ataacttaga aggagaata gaaaatttaa acaagaagat ggaagacgga 1320

ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact 1380ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact 1380

ctagactttc atgactcaaa tgtcaagaat ctttatgaca aggtccgact acagcttagg 1440ctagactttc atgactcaaa tgtcaagaat ctttatgaca aggtccgact acagcttagg 1440

gataatgcaa aggagcttgg taacggttgt ttcgagttct atcacagatg tgataatgaa 1500gataatgcaa aggagcttgg taacggttgt ttcgagttct atcacagatg tgataatgaa 1500

tgtatggaaa gtgtaagaaa cggaacgtat gactaccctc aatattcaga agaagcaaga 1560tgtatggaaa gtgtaagaaa cggaacgtat gactaccctc aatattcaga agaagcaaga 1560

ttaaaaagag aggaaataag tggagtaaaa ttggagtcaa taggaactta ccaaatactg 1620ttaaaaagag aggaaataag tggagtaaaa ttggagtcaa taggaactta ccaaatactg 1620

tcaatttatt caacagtggc gagctcccta gcactggcaa tcatggtggc tggtctatct 1680tcaatttatt caacagtggc gagctcccta gcactggcaa tcatggtggc tggtctatct 1680

ttatggatgt gctccaatgg atcgctacaa tgcagaattt gcatttaa 1728ttatggatgt gctccaatgg atcgctacaa tgcagaattt gcatttaa 1728

<210> 80<210> 80

<211> 575<211> 575

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H5 Egypt-F392D<223> AK PDI-H5 Egypt-F392D

<400> 80<400> 80

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr HisLeu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His

20 25 3020 25 30

Ala Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn ValAla Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn Val

35 40 4535 40 45

Thr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly LysThr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly Lys

50 55 6050 55 60

Leu Cys Asn Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys SerLeu Cys Asn Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys Ser

65 70 75 8065 70 75 80

Val Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Leu AsnVal Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Leu Asn

85 90 9585 90 95

Val Pro Glu Trp Ser Tyr Ile Val Glu Lys Ile Asn Pro Ala Asn AspVal Pro Glu Trp Ser Tyr Ile Val Glu Lys Ile Asn Pro Ala Asn Asp

100 105 110100 105 110

Leu Cys Tyr Pro Gly Asn Phe Asn Asp Tyr Glu Glu Leu Lys His LeuLeu Cys Tyr Pro Gly Asn Phe Asn Asp Tyr Glu Glu Leu Lys His Leu

115 120 125115 120 125

Leu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys AspLeu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys Asp

130 135 140130 135 140

Ser Trp Ser Asp His Glu Ala Ser Gly Val Ser Ser Ala Cys Pro TyrSer Trp Ser Asp His Glu Ala Ser Gly Val Ser Ser Ala Cys Pro Tyr

145 150 155 160145 150 155 160

Gln Gly Arg Ser Ser Phe Phe Arg Asn Val Val Trp Leu Thr Lys LysGln Gly Arg Ser Ser Phe Phe Arg Asn Val Val Trp Leu Thr Lys Lys

165 170 175165 170 175

Asn Asp Ala Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn GlnAsn Asp Ala Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn Gln

180 185 190180 185 190

Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala AlaGlu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala Ala

195 200 205195 200 205

Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Val GlyGlu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Val Gly

210 215 220210 215 220

Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg SerThr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg Ser

225 230 235 240225 230 235 240

Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile LeuLys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile Leu

245 250 255245 250 255

Lys Ser Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile AlaLys Ser Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile Ala

260 265 270260 265 270

Pro Glu Asn Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Thr Ile MetPro Glu Asn Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Thr Ile Met

275 280 285275 280 285

Lys Ser Glu Leu Glu Tyr Ser Asn Cys Asn Thr Lys Cys Gln Thr ProLys Ser Glu Leu Glu Tyr Ser Asn Cys Asn Thr Lys Cys Gln Thr Pro

290 295 300290 295 300

Ile Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro LeuIle Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro Leu

305 310 315 320305 310 315 320

Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val LeuThr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val Leu

325 330 335325 330 335

Ala Thr Gly Leu Arg Asn Ser Pro Gln Gly Glu Lys Arg Arg Lys LysAla Thr Gly Leu Arg Asn Ser Pro Gln Gly Glu Lys Arg Arg Lys Lys

340 345 350340 345 350

Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp GlnArg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Gln

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln GlyGly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln Gly

370 375 380370 375 380

Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Arg Ala Ile Asp GlySer Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Arg Ala Ile Asp Gly

385 390 395 400385 390 395 400

Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln AspVal Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln Asp

405 410 415405 410 415

Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu AsnGlu Ala Val Gly Arg Glu Phe Asn Leu Glu Arg Arg Ile Glu Asn

420 425 430420 425 430

Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr AsnLeu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe HisAla Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe His

450 455 460450 455 460

Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu ArgAsp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu Arg

465 470 475 480465 470 475 480

Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His ArgAsp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His Arg

485 490 495485 490 495

Cys Asp Asn Glu Cys Met Glu Ser Val Arg Asn Gly Thr Tyr Asp TyrCys Asp Asn Glu Cys Met Glu Ser Val Arg Asn Gly Thr Tyr Asp Tyr

500 505 510500 505 510

Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser GlyPro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser Gly

515 520 525515 520 525

Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr SerVal Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr Ser

530 535 540530 535 540

Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Val Ala Gly Leu SerThr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Val Ala Gly Leu Ser

545 550 555 560545 550 555 560

Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys IleLeu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile

565 570 575565 570 575

<210> 81<210> 81

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-N382A<223> DNA PDI-H3 Switz-N382A

<400> 81<400> 81

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 82<210> 82

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-N382A<223> AK PDI-H3 Switz-N382A

<400> 82<400> 82

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 83<210> 83

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-L384V<223> DNA PDI-H3 Switz-L384V

<400> 83<400> 83

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 84<210> 84

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-L384V<223> AK PDI-H3 Switz-L384V

<400> 84<400> 84

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 85<210> 85

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Penn-CysTm<223> DNA PDI-H3 Penn-CysTm

<400> 85<400> 85

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta 1560tgcataggat tggaacttat gaccacgatg tatacaggga tgaagcttta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 86<210> 86

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Penn-CysTm<223> AK PDI-H3 Penn-CysTm

<400> 86<400> 86

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 87<210> 87

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Penn-N382A-CysTm<223> DNA PDI-H3 Penn-N382A-CysTm

<400> 87<400> 87

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta 1560tgcataggat tggaacttat gaccacgatg tatacaggga tgaagcttta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 88<210> 88

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Penn-N382A-CysTm<223> AK PDI-H3 Penn-N382A-CysTm

<400> 88<400> 88

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 89<210> 89

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Penn-L384V-CysTm<223> DNA PDI-H3 Penn-L384V-CysTm

<400> 89<400> 89

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg 1020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg 1080gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaaatagcg 1080

ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa 1140ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa 1140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa 1200

atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa 1260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca 1320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca 1380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg 1440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc 1500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta 1560tgcataggat tggaacttat gaccacgatg tatacaggga tgaagcttta 1560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta 1620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg 1680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 90<210> 90

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Penn-L384V-CysTm<223> AK PDI-H3 Penn-L384V-CysTm

<400> 90<400> 90

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 91<210> 91

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 91<400> 91

Gln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp ThrAla Ser Ser Gly Thr Leu Glu Phe Asn Glu Ser Phe Asn Trp Thr

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Lys Ser SerGly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Lys Ser Ser

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr ThrSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr Thr

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Val Pro Asn Asn Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Val Pro Asn Asn Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Arg Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Arg Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Gly Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Gly Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 92<210> 92

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 92<400> 92

Gln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp ThrAla Ser Ser Gly Thr Leu Glu Phe Asn Glu Ser Phe Asn Trp Thr

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser SerGly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Ser

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr ThrSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr Thr

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Gly Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Gly Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 93<210> 93

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 93<400> 93

Gln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp ThrAla Ser Ser Gly Thr Leu Glu Phe Asn Glu Ser Phe Asn Trp Thr

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser SerGly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Ser

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr ThrSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr Thr

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Lys Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Lys Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Val Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Val Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Glu Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Glu Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 94<210> 94

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 94<400> 94

Gln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Lys Asn Glu Ser Phe Asn Trp ThrAla Ser Ser Gly Thr Leu Glu Phe Lys Asn Glu Ser Phe Asn Trp Thr

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser SerGly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Ser

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr ThrSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr Thr

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Lys Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Lys Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Val Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Val Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Glu Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Glu Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 95<210> 95

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 95<400> 95

Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Lys Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Lys Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Arg Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Arg Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asp Glu Ser Phe Asn Trp AlaAla Ser Ser Gly Thr Leu Glu Phe Asn Asp Glu Ser Phe Asn Trp Ala

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Gly Ser AsnGly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Gly Ser Asn

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Ser Asn Phe LysSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Ser Asn Phe Lys

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Gln Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Gln Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys Gln Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys Gln Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Lys Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Lys Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 96<210> 96

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 96<400> 96

Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp AlaAla Ser Ser Gly Thr Leu Glu Phe Asn Glu Ser Phe Asn Trp Ala

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ser Cys Ile Arg Gly Ser AsnGly Val Thr Gln Asn Gly Thr Ser Ser Ser Cys Ile Arg Gly Ser Asn

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Ser LysSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Ser Lys

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys Gln Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys Gln Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Arg Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Arg Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 97<210> 97

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 97<400> 97

Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Arg Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Arg Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp AlaAla Ser Ser Gly Thr Leu Glu Phe Asn Glu Ser Phe Asn Trp Ala

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ser Cys Ile Arg Gly Ser AsnGly Val Thr Gln Asn Gly Thr Ser Ser Ser Cys Ile Arg Gly Ser Asn

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Ser LysSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Ser Lys

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Lys Pro Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Lys Pro Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Arg Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Arg Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 98<210> 98

<211> 5<211> 5

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность CysTM (аминокислоты)<223> CysTM sequence (amino acids)

<400> 98<400> 98

Ser Leu Val Leu LeuSer Leu Val Leu Leu

1 515

<210> 99<210> 99

<211> 5<211> 5

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Нативная TMCT (аминокислоты)<223> Native TMCT (amino acids)

<400> 99<400> 99

Cys Phe Leu Leu CysCys Phe Leu Leu Cys

1 515

<210> 100<210> 100

<211> 15<211> 15

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность CysTM (нуклеотиды)<223> CysTM sequence (nucleotides)

<400> 100<400> 100

tcccttgtac tgtta 15tcccttgtac tgtta 15

<210> 101<210> 101

<211> 15<211> 15

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Нативная TMCT (нуклеотиды)<223> Native TMCT (nucleotides)

<400> 101<400> 101

tgttttttgc tttgt 15tgttttttgc tttgt 15

<210> 102<210> 102

<211> 1701<211> 1701

<212> ДНК<212> DNA

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 102<400> 102

atgaagacta tcattgcttt gagctacatt ctatgtctgg ttttcgctca aaaaattcct 60atgaagacta tcattgcttt gagctacatt ctatgtctgg ttttcgctca aaaaattcct 60

ggaaatgaca atagcacggc aacgctgtgc cttgggcacc atgcagtacc aaacggaacg 120ggaaatgaca atagcacggc aacgctgtgc cttgggcacc atgcagtacc aaacggaacg 120

atagtgaaaa caatcacgaa tgaccgaatt gaagttacta atgctactga gctggttcag 180atagtgaaaa caatcacgaa tgaccgaatt gaagttacta atgctactga gctggttcag 180

aattcctcaa taggtgaaat atgcgacagt cctcatcaga tccttgatgg agaaaactgc 240aattcctcaa taggtgaaat atgcgacagt cctcatcaga tccttgatgg agaaaactgc 240

acactaatag atgctctatt gggagaccct cagtgtgatg gctttcaaaa taagaaatgg 300acactaatag atgctctatt gggagaccct cagtgtgatg gctttcaaaa taagaaatgg 300

gacctttttg ttgaacgaag caaagcctac agcaactgtt acccttatga tgtgccggat 360gacctttttg ttgaacgaag caaagcctac agcaactgtt acccttatga tgtgccggat 360

tatgcctccc ttaggtcact agttgcctca tccggcacac tggagtttaa caatgaaagc 420tatgcctccc ttaggtcact agttgcctca tccggcacac tggagtttaa caatgaaagc 420

ttcaattgga ctggagtcac tcaaaacgga acaagttctg cttgcataag gagatctagt 480ttcaattgga ctggagtcac tcaaaacgga acaagttctg cttgcataag gagatctagt 480

agtagtttct ttagtagatt aaattggttg acccacttaa actacacata cccagcattg 540agtagtttct ttagtagatt aaattggttg acccacttaa actacacata cccagcattg 540

aacgtgacta tgccaaacaa tgaacaattt gacaaattgt acatttgggg ggttcaccac 600aacgtgacta tgccaaacaa tgaacaattt gacaaattgt acatttgggg ggttcaccac 600

ccgggtacgg acaaggacca aatcttcctg tatgctcaat catcaggaag aatcacagta 660ccgggtacgg acaaggacca aatcttcctg tatgctcaat catcaggaag aatcacagta 660

tctaccaaaa gaagccaaca agctgtaatc ccaaatatcg gatctagacc cagaataagg 720tctaccaaaa gaagccaaca agctgtaatc ccaaatatcg gatctagacc cagaataagg 720

gatatcccta gcagaataag catctattgg acaatagtaa aaccgggaga catacttttg 780gatatcccta gcagaataag catctattgg acaatagtaa aaccgggaga catacttttg 780

attaacagca cagggaatct aattgctcct aggggttact tcaaaatacg aagtgggaaa 840attaacagca cagggaatct aattgctcct aggggttact tcaaaatacg aagtgggaaa 840

agctcaataa tgagatcaga tgcacccatt ggcaaatgca agtctgaatg catcactcca 900agctcaataa tgagatcaga tgcacccatt ggcaaatgca agtctgaatg catcactcca 900

aatggaagca ttcccaatga caaaccattc caaaatgtaa acaggatcac atacggggcc 960aatggaagca ttcccaatga caaaccattc caaaatgtaa acaggatcac atacggggcc 960

tgtcccagat atgttaagca tagcactctg aaattggcaa caggaatgcg aaatgtacca 1020tgtcccagat atgttaagca tagcactctg aaattggcaa caggaatgcg aaatgtacca 1020

gagaaacaaa ctagaggcat atttggcgca atagcgggtt tcatagaaaa tggttgggag 1080gagaaacaaa ctagaggcat atttggcgca atagcgggtt tcatagaaaa tggttgggag 1080

ggaatggtgg atggttggta cggtttcagg catcaaaatt ctgagggaag aggacaagca 1140ggaatggtgg atggttggta cggtttcagg catcaaaatt ctgagggaag aggacaagca 1140

gcagatctca aaagcactca agcagcaatc gatcaaatca atgggaagct gaatcgattg 1200gcagatctca aaagcactca agcagcaatc gatcaaatca atgggaagct gaatcgattg 1200

atcgggaaaa ccaacgagaa attccatcag attgaaaaag aattctcaga agtagaagga 1260atcgggaaaa ccaacgagaa attccatcag attgaaaaag aattctcaga agtagaagga 1260

agaattcagg accttgagaa atatgttgag gacactaaaa tagatctctg gtcatacaac 1320agaattcagg accttgagaa atatgttgag gacactaaaa tagatctctg gtcatacaac 1320

gcggagcttc ttgttgccct ggagaaccaa catacaattg atctaactga ctcagaaatg 1380gcggagcttc ttgttgccct ggagaaccaa catacaattg atctaactga ctcagaaatg 1380

aacaaactgt ttgaaaaaac aaagaagcaa ctgagggaaa atgctgagga tatgggcaat 1440aacaaactgt ttgaaaaaac aaagaagcaa ctgagggaaa atgctgagga tatgggcaat 1440

ggttgtttca aaatatacca caaatgtgac aatgcctgca taggatcaat aagaaatgga 1500ggttgtttca aaatatacca caaatgtgac aatgcctgca taggatcaat aagaaatgga 1500

acttatgacc acaatgtgta cagggatgaa gcattaaaca accggttcca gatcaaggga 1560acttatgacc acaatgtgta cagggatgaa gcattaaaca accggttcca gatcaaggga 1560

gttgagctga agtcagggta caaagattgg atcctatgga tttcctttgc catatcatgt 1620catatcatgt 1620

tttttgcttt gtgttgcttt gttggggttc atcatgtggg cctgccaaaa gggcaacatt 1680tttttgcttt gtgttgcttt gttggggttc atcatgtggg cctgccaaaa gggcaacatt 1680

aggtgcaaca tttgcatttg a 1701aggtgcaaca tttgcatttg a 1701

<210> 103<210> 103

<211> 3108<211> 3108

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 2801 от промотора 2X35S к терминатору NOS<223> Construct 2801 from 2X35S promoter to NOS terminator

<400> 103<400> 103

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct ccctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg 1020tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg 1020

ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat 1080ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat 1080

tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag 1140tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag 1140

tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc 1200tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc 1200

tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta 1260tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta 1260

cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc 1320cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc 1320

atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg 1380atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg 1380

aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt 1440aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt 1440

gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt 1500gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt 1500

tgacaaattg tacatttggg gggttcacca cccgggtacg gacaaggacc aaatcttcct 15601560

gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat 1620gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat 1620

cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg 1680cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg 1680

gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc 1740gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc 1740

taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat 1800taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat 1800

tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt 1860tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt 1860

ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct 1920ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct 1920

gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tatttggcgc 1980gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tattggcgc 1980

aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag 2040aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag 2040

gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat 2100gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat 2100

cgatcaaatc aatgggaagc tgaatcgatt gatcgggaaa accaacgaga aattccatca 2160cgatcaaatc aatgggaagc tgaatcgatt gatcgggaaa accaacgaga aattccatca 2160

gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga 2220gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga 2220

ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca 2280ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca 2280

acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca 2340acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca 2340

actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga 2400actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga 2400

caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga 2460caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga 2460

agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcagggt acaaagattg 2520agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcaggggt acaaagattg 2520

gatcctatgg atttcctttg ccatatcatg ttttttgctt tgtgttgctt tgttggggtt 2580gatcctatgg atttcctttg ccatatcatg ttttttgctt tgtgttgctt tgttggggtt 2580

catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat 2640catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat 2640

tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt 2700tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt 2700

ctgtgctcag agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca 27602760

ggtcgtccct tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa 2820ggtcgtccct tcagcaagga cacaaaaaga ttttaattttt attaaaaaaa aaaaaaaaaa 2820

agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa 2880agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa 2880

agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg 2940agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg 2940

aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt 3000aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt 3000

tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc 3060tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc 3060

gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108

<210> 104<210> 104

<211> 3108<211> 3108

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 3023 от промотора 2X35S к терминатору NOS<223> Construct 3023 from 2X35S promoter to NOS terminator

<400> 104<400> 104

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct ccctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg 1020tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg 1020

ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat 1080ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat 1080

tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag 1140tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag 1140

tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc 1200tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc 1200

tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta 1260tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta 1260

cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc 1320cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc 1320

atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg 1380atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg 1380

aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt 1440aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt 1440

gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt 1500gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt 1500

tgacaaattg tacatttggg gggttcacca cccgggtacg gacaaggacc aaatcttcct 15601560

gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat 1620gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat 1620

cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg 1680cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg 1680

gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc 1740gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc 1740

taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat 1800taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat 1800

tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt 1860tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt 1860

ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct 1920ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct 1920

gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tatttggcgc 1980gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tattggcgc 1980

aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag 2040aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag 2040

gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat 2100gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat 2100

cgatcaaatc aatgggaagc tggctcgatt gatcgggaaa accaacgaga aattccatca 2160cgatcaaatc aatgggaagc tggctcgatt gatcgggaaa accaacgaga aattccatca 2160

gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga 2220gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga 2220

ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca 2280ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca 2280

acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca 2340acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca 2340

actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga 2400actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga 2400

caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga 2460caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga 2460

agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcagggt acaaagattg 2520agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcaggggt acaaagattg 2520

gatcctatgg atttcctttg ccatatcatg ttttttgctt tgtgttgctt tgttggggtt 2580gatcctatgg atttcctttg ccatatcatg ttttttgctt tgtgttgctt tgttggggtt 2580

catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat 2640catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat 2640

tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt 2700tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt 2700

ctgtgctcag agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca 27602760

ggtcgtccct tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa 2820ggtcgtccct tcagcaagga cacaaaaaga ttttaattttt attaaaaaaa aaaaaaaaaa 2820

agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa 2880agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa 2880

agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg 2940agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg 2940

aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt 3000aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt 3000

tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc 3060tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc 3060

gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108

<210> 105<210> 105

<211> 3108<211> 3108

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 2811 от промотора 2X35S к терминатору NOS<223> Construct 2811 from 2X35S promoter to NOS terminator

<400> 105<400> 105

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct ccctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg 1020tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg 1020

ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat 1080ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat 1080

tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag 1140tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag 1140

tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc 1200tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc 1200

tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta 1260tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta 1260

cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc 1320cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc 1320

atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg 1380atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg 1380

aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt 1440aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt 1440

gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt 1500gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt 1500

tgacaaattg tacatttggg gggttcacca cccgggtacg gacaaggacc aaatcttcct 15601560

gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat 1620gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat 1620

cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg 1680cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg 1680

gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc 1740gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc 1740

taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat 1800taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat 1800

tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt 1860tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt 1860

ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct 1920ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct 1920

gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tatttggcgc 1980gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tattggcgc 1980

aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag 2040aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag 2040

gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat 2100gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat 2100

cgatcaaatc aatgggaagc tgaatcgatt gatcgggaaa accaacgaga aattccatca 2160cgatcaaatc aatgggaagc tgaatcgatt gatcgggaaa accaacgaga aattccatca 2160

gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga 2220gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga 2220

ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca 2280ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca 2280

acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca 2340acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca 2340

actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga 2400actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga 2400

caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga 2460caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga 2460

agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcagggt acaaagattg 2520agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcaggggt acaaagattg 2520

gatcctatgg atttcctttg ccatatcatc ccttgtactg ttagttgctt tgttggggtt 2580gatcctatgg atttcctttg ccatatcatc ccttgtactg ttagttgctt tgttggggtt 2580

catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat 2640catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat 2640

tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt 2700tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt 2700

ctgtgctcag agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca 27602760

ggtcgtccct tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa 2820ggtcgtccct tcagcaagga cacaaaaaga ttttaattttt attaaaaaaa aaaaaaaaaa 2820

agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa 2880agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa 2880

agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg 2940agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg 2940

aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt 3000aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt 3000

tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc 3060tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc 3060

gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108

<---<---

Claims (41)

1. Модифицированный белок гемагглютинин (НА) гриппа H3 для получения вирусоподобной частицы (VLP), причем белок НА содержит аминокислотную последовательность, содержащую по меньшей мере одну замену по сравнению с соответствующей аминокислотной последовательностью дикого типа, причем указанная по меньшей мере одна замена представляет собой замену одной или более чем одной аминокислот, соответствующих аминокислотам в положении 382, 384, 392 или 431 эталонной последовательности SEQ ID NO: 92. 1. Modified influenza H3 hemagglutinin (HA) protein to produce a virus-like particle (VLP), wherein the HA protein contains an amino acid sequence containing at least one substitution compared to the corresponding wild-type amino acid sequence, wherein said at least one substitution is a substitution one or more amino acids corresponding to amino acids at position 382, 384, 392, or 431 of the reference sequence of SEQ ID NO: 92. 2. Модифицированный белок НА гриппа H3 по п. 1, причем: 2. Modified influenza H3 HA protein according to claim 1, moreover: по меньшей мере одна замена аминокислоты, соответствующей аминокислоте в положении 382 эталонной последовательности SEQ ID NO: 92 представляет собой замену на не аспарагин; at least one amino acid substitution corresponding to the amino acid at position 382 of the reference sequence of SEQ ID NO: 92 is a non-asparagine substitution; по меньшей мере одна замена аминокислоты, соответствующей аминокислоте в положении 382 эталонной последовательности SEQ ID NO: 92 представляет собой замену на аланин или консервативную замену аланина; at least one amino acid substitution corresponding to the amino acid at position 382 of the reference sequence of SEQ ID NO: 92 is an alanine substitution or a conservative alanine substitution; по меньшей мере одна замена аминокислоты, соответствующей аминокислоте в положении 384 эталонной последовательности SEQ ID NO: 92 представляет собой замену на не лейцин; at least one amino acid substitution corresponding to the amino acid at position 384 of the reference sequence of SEQ ID NO: 92 is a non-leucine substitution; по меньшей мере одна замена аминокислоты, соответствующей аминокислоте в положении 384 эталонной последовательности SEQ ID NO: 92 представляет собой замену на валин или консервативную замену валина; at least one amino acid substitution corresponding to the amino acid at position 384 of the reference sequence of SEQ ID NO: 92 is a valine substitution or a conservative valine substitution; по меньшей мере одна замена аминокислоты, соответствующей аминокислоте в положении 392 эталонной последовательности SEQ ID NO: 92 представляет собой замену на не фенилаланин; at least one amino acid substitution corresponding to the amino acid at position 392 of the reference sequence of SEQ ID NO: 92 is a non-phenylalanine substitution; по меньшей мере одна замена аминокислоты, соответствующей аминокислоте в положении 392 эталонной последовательности SEQ ID NO: 92 представляет собой замену на аспарагиновую кислоту или консервативную замену аспарагиновой кислоты; at least one amino acid substitution corresponding to the amino acid at position 392 of the reference sequence of SEQ ID NO: 92 is an aspartic acid substitution or a conservative aspartic acid substitution; по меньшей мере одна замена аминокислоты, соответствующей аминокислоте в положении 431 эталонной последовательности SEQ ID NO: 92 представляет собой замену на не лейцин и/или at least one amino acid substitution corresponding to the amino acid at position 431 of the reference sequence of SEQ ID NO: 92 is a non-leucine substitution and/or по меньшей мере одна замена аминокислоты, соответствующей аминокислоте в положении 431 эталонной последовательности SEQ ID NO: 92 представляет собой замену на метионин или консервативную замену метионина.at least one amino acid substitution corresponding to the amino acid at position 431 of the reference sequence of SEQ ID NO: 92 is a methionine substitution or a conservative methionine substitution. 3. Модифицированный белок НА гриппа H3 по п. 2, причем: 3. Modified influenza H3 HA protein according to claim 2, moreover: консервативная замена аланина представляет собой серин, глицин, треонин, цистеин или валин; a conservative alanine substitution is serine, glycine, threonine, cysteine, or valine; консервативная замена валина представляет собой изолейцин, метионин, аланин или треонин; a conservative valine replacement is isoleucine, methionine, alanine, or threonine; консервативная замена аспарагиновой кислоты представляет собой глутаминовую кислоту, глутамин или серин; и a conservative replacement for aspartic acid is glutamic acid, glutamine, or serine; And консервативная замена метионина представляет собой изолейцин, глутамин, валин или фенилаланин. a conservative replacement for methionine is isoleucine, glutamine, valine, or phenylalanine. 4. Нуклеиновая кислота для получения модифицированного белка НА гриппа H3, причем нуклеиновая кислота содержит нуклеотидную последовательность, кодирующую модифицированный белок НА гриппа H3 по любому из пп. 1-3. 4. Nucleic acid for producing a modified influenza H3 HA protein, wherein the nucleic acid contains a nucleotide sequence encoding a modified influenza H3 HA protein according to any one of paragraphs. 1-3. 5. Вирусоподобная частица (VLP) для индукции иммунного ответа к инфекции гриппа у субъекта, причем VLP содержит модифицированный белок гемагглютинин (HA) гриппа H3 по любому из пп. 1-3. 5. A virus-like particle (VLP) for inducing an immune response to an influenza infection in a subject, the VLP comprising a modified influenza H3 hemagglutinin (HA) protein according to any one of paragraphs. 1-3. 6. Способ получения вирусоподобной частицы гриппа (VLP) в растении, части растения или растительной клетке, предусматривающий: 6. A method for producing an influenza virus-like particle (VLP) in a plant, plant part or plant cell, comprising: а) i) введение нуклеиновой кислоты по п. 4 в растение, часть растения или растительную клетку и, необязательно, дополнительное введение второй нуклеиновой кислоты, кодирующей белок протонного канала, такой как белок М2 подтипа А гриппа; или a) i) introducing the nucleic acid of claim 4 into a plant, plant part, or plant cell, and optionally further introducing a second nucleic acid encoding a proton channel protein, such as influenza A subtype M2 protein; or ii) предоставление растения, части растения или растительной клетки, содержащей нуклеиновую кислоту по п. 4, необязательно, причем растение, часть растения или растительная клетка дополнительно содержит вторую нуклеиновую кислоту, кодирующую белок протонного канала, такой как белок М2 подтипа А гриппа; и ii) optionally providing a plant, plant part, or plant cell comprising the nucleic acid of claim 4, wherein the plant, plant part, or plant cell further comprises a second nucleic acid encoding a proton channel protein, such as influenza A subtype M2 protein; And b) инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию белка НА гриппа, кодируемого нуклеиновой кислотой, тем самым производя VLP, и, необязательно, дополнительную инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию белка протонного канала, кодируемого второй нуклеиновой кислотой, иb) incubating the plant, plant part, or plant cell under conditions that allow expression of the influenza HA protein encoded by the nucleic acid, thereby producing a VLP, and optionally further incubating the plant, plant part, or plant cell under conditions that allow expression of the proton protein. channel encoded by the second nucleic acid, and c) необязательно, сбор растения, части растения или растительной клетки и очистку VLP. c) optionally harvesting the plant, plant part or plant cell and purifying the VLP. 7. VLP, полученная способом по п. 6 для индукции иммунного ответа к инфекции гриппа у субъекта, причем VLP содержит модифицированный белок HA гриппа H3 по любому из пп. 1-3. 7. A VLP obtained by the method of claim 6 for inducing an immune response to an influenza infection in a subject, wherein the VLP comprises a modified influenza H3 HA protein according to any one of claims. 1-3. 8. VLP по п. 7, дополнительно содержащая один или более чем один липид, полученный из растения, части растения или растительной клетки, специфические для растений N-гликаны, модифицированные N-гликаны или их комбинацию. 8. A VLP according to claim 7, further comprising one or more lipids derived from a plant, plant part, or plant cell, plant-specific N-glycans, modified N-glycans, or a combination thereof. 9. Растение или часть растения для получения вирусоподобной частицы (VLP), причем растение или часть растения содержит нуклеиновую кислоту по п. 4. 9. A plant or plant part for producing a virus-like particle (VLP), wherein the plant or plant part contains the nucleic acid according to claim 4. 10. Растительная клетка для получения вирусоподобной частицы (VLP), причем растительная клетка содержит нуклеиновую кислоту по п. 4. 10. Plant cell for obtaining a virus-like particle (VLP), wherein the plant cell contains the nucleic acid according to claim 4. 11. Растение или часть растения для получения вирусоподобной частицы (VLP), причем растение или часть растения содержит модифицированный белок НА гриппа H3 по любому из пп. 1-3 или VLP по любому из пп. 5, 7 или 8. 11. A plant or plant part to obtain a virus-like particle (VLP), and the plant or plant part contains a modified influenza H3 H3 protein according to any one of paragraphs. 1-3 or VLP according to any one of paragraphs. 5, 7 or 8. 12. Растительная клетка для получения вирусоподобной частицы (VLP), причем растительная клетка содержит модифицированный белок НА гриппа H3 по любому из пп. 1-3 или VLP по любому из пп. 5, 7 или 8. 12. Plant cell to obtain a virus-like particle (VLP), and the plant cell contains a modified H3 influenza H3 protein according to any one of paragraphs. 1-3 or VLP according to any one of paragraphs. 5, 7 or 8. 13. Композиция для индукции иммунного ответа к инфекции гриппа у субъекта, причем композиция содержит эффективную дозу VLP по любому из пп. 5, 7 или 8 и фармацевтически приемлемый носитель, адъювант, наполнитель или вспомогательное вещество. 13. A composition for inducing an immune response to an influenza infection in a subject, the composition comprising an effective dose of VLP according to any one of paragraphs. 5, 7 or 8 and a pharmaceutically acceptable carrier, adjuvant, excipient or excipient. 14. Применение VLP по любому из пп. 5, 7 или 8 для индукции иммунитета к инфекции гриппа у субъекта. 14. The use of VLP according to any one of paragraphs. 5, 7, or 8 to induce immunity to influenza infection in a subject. 15. Применение по п.14 при котором VLP применяют субъекту перорально, интраназально, внутримышечно, внутрибрюшинно, внутривенно или подкожно. 15. Use according to claim 14, wherein the VLP is administered to the subject orally, intranasally, intramuscularly, intraperitoneally, intravenously, or subcutaneously. 16. Способ увеличения выхода продукции вирусоподобных частиц гриппа (VLP) в растении, части растения или растительной клетке, предусматривающий: 16. A method for increasing the production yield of influenza virus-like particles (VLP) in a plant, plant part or plant cell, comprising: а) i) введение нуклеиновой кислоты по п. 4 в растение, часть растения или растительную клетку или a) i) introducing a nucleic acid according to claim 4 into a plant, plant part or plant cell, or ii) предоставление растения, части растения или растительной клетки, содержащих нуклеиновую кислоту, по п. 4; а также ii) providing a plant, plant part or plant cell containing a nucleic acid according to claim 4; and b) инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию белка НА, кодируемого нуклеиновой кислотой, тем самым производя VLP с более высоким выходом по сравнению с растением, частью растения или растительной клеткой, экспрессирующей немодифицированный белок НА гриппа; и b) incubating the plant, plant part, or plant cell under conditions that allow expression of the HA protein encoded by the nucleic acid, thereby producing VLPs in higher yield compared to a plant, plant part, or plant cell expressing unmodified influenza HA protein; And с) необязательно сбор растения, части растения или растительной клетки и очистку VLP. c) optionally harvesting the plant, plant part or plant cell and purifying the VLP. 17. Белок гемагглютинин (НА) гриппа H3 для получения вирусоподобной частицы (VLP), причем НА содержит: 17. Protein hemagglutinin (HA) influenza H3 to obtain a virus-like particle (VLP), and HA contains: аминокислотную замену, соответствующую положению 382 эталонной последовательности SEQ ID NO: 92, причем аминокислотная замена представляет собой замену на аланин или консервативную замену аланина; an amino acid substitution corresponding to position 382 of the reference sequence of SEQ ID NO: 92, wherein the amino acid substitution is an alanine substitution or a conservative alanine substitution; аминокислотную замену, соответствующую положению 384 эталонной последовательности SEQ ID NO: 92, причем аминокислотная замена представляет собой замену на валин или консервативную замену валина; an amino acid substitution corresponding to position 384 of the reference sequence of SEQ ID NO: 92, wherein the amino acid substitution is a valine substitution or a conservative valine substitution; аминокислотную замену, соответствующую положению 392 эталонной последовательности SEQ ID NO: 92, причем аминокислотная замена представляет собой замену на аспарагиновую кислоту или консервативную замену аспарагиновой кислоты; и/или an amino acid substitution corresponding to position 392 of the reference sequence of SEQ ID NO: 92, wherein the amino acid substitution is an aspartic acid substitution or a conservative aspartic acid substitution; and/or аминокислотную замену, соответствующую положению 431 эталонной последовательности SEQ ID NO: 92, причем аминокислотная замена представляет собой замену на метионин или консервативную замену метионина.an amino acid substitution corresponding to position 431 of the reference sequence of SEQ ID NO: 92, wherein the amino acid substitution is a methionine substitution or a conservative methionine substitution.
RU2020143526A 2018-06-27 2019-06-27 Hemaglutinin mutants of the influenza virus RU2801708C2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US62/690,780 2018-06-27

Publications (2)

Publication Number Publication Date
RU2020143526A RU2020143526A (en) 2022-07-27
RU2801708C2 true RU2801708C2 (en) 2023-08-15

Family

ID=

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009009876A1 (en) * 2007-07-13 2009-01-22 Medicago Inc. Influenza virus-like particles (vlps) comprising hemagglutinin produced within a plant
RU2569195C2 (en) * 2009-06-24 2015-11-20 Медикаго Инк. Hemagglutinin-containing chimeric virus-like particles, similar to particles of flu virus

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009009876A1 (en) * 2007-07-13 2009-01-22 Medicago Inc. Influenza virus-like particles (vlps) comprising hemagglutinin produced within a plant
RU2569195C2 (en) * 2009-06-24 2015-11-20 Медикаго Инк. Hemagglutinin-containing chimeric virus-like particles, similar to particles of flu virus

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Щербинин Д.Н., Алексеева С.В., Анализ В-клеточных эпитопов гемагглютинина вирусов гриппа, ACTA NATURAE,ТОМ 8, N 1, (28) 2016, стр.14. Aleksandar Antanasijevic, Arnab Basu et al., Mutagenesis Studies of the H5 Influenza Hemagglutinin Stem Loop Region, J Biol Chem. 2014 Aug 8; 289(32): 22237-22245. *

Similar Documents

Publication Publication Date Title
DK2610345T3 (en) RECOMBINANT INFLUENZA VIRUS SIMULAR PARTICULARS (VLPS) MADE IN TRANSGENE PLANTS THAT EXPRESS HEMAGGLUTININ
KR102199018B1 (en) Influenza virus-like particle production in plants
EA034733B1 (en) Nucleic acid for increased expression of hemagglutinin of influenza virus in a plant and use thereof
KR101974017B1 (en) Increasing virus-like particle yield in plants
JP2024050650A (en) Influenza virus hemagglutinin mutants
RU2801708C2 (en) Hemaglutinin mutants of the influenza virus
RU2809237C2 (en) Hemaglutinin mutants of influenza virus
RU2800938C2 (en) Hemaglutinin mutants of the influenza virus
JP2023539356A (en) Modified coronavirus structural protein
WO2024040325A1 (en) Modified influenza b virus hemagglutinin
CN115956084A (en) Superstructure of modified influenza hemagglutinin comprising reduced interaction with sialic acid
RU2569195C9 (en) Hemagglutinin-containing chimeric virus-like particles, similar to particles of flu virus