RU2809237C2 - Hemaglutinin mutants of influenza virus - Google Patents

Hemaglutinin mutants of influenza virus Download PDF

Info

Publication number
RU2809237C2
RU2809237C2 RU2020143530A RU2020143530A RU2809237C2 RU 2809237 C2 RU2809237 C2 RU 2809237C2 RU 2020143530 A RU2020143530 A RU 2020143530A RU 2020143530 A RU2020143530 A RU 2020143530A RU 2809237 C2 RU2809237 C2 RU 2809237C2
Authority
RU
Russia
Prior art keywords
plant
substitution
amino acid
protein
ile
Prior art date
Application number
RU2020143530A
Other languages
Russian (ru)
Other versions
RU2020143530A (en
Inventor
Пьер-Оливье Лавуа
Орельен ЛОРИН
Ален ДУСЕ
Марк-Андре Д'АУСТ
Манон КУТЮР
Original Assignee
Медикаго Инк.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Медикаго Инк. filed Critical Медикаго Инк.
Publication of RU2020143530A publication Critical patent/RU2020143530A/en
Application granted granted Critical
Publication of RU2809237C2 publication Critical patent/RU2809237C2/en

Links

Abstract

FIELD: molecular biology; genetic engineering.
SUBSTANCE: following is described: modified influenza H3 hemagglutinin (HA) protein for producing a virus-like particle (VLP), wherein the HA protein contains an amino acid sequence with at least one substitution compared to the corresponding wild-type amino acid sequence, wherein at least one substitution is a substitution of one or more than one amino acid corresponding to amino acids at positions 382, 384, 524, or 528 of the reference sequence of the following SEQ ID NO: 92, and optionally amino acid substitutions corresponding to amino acids at positions 392, 431, 525 and/or 526 of the following reference sequence SEQ ID NO: 92, wherein the amino acid substitutions corresponding to positions 524 and 528 are non-cysteine substitutions. Also a nucleic acid for producing a modified influenza H3 HA protein, wherein the nucleic acid contains a nucleotide sequence encoding the modified influenza Н3 HA protein is described. A virus-like particle (VLP) for inducing an immune response in a subject is provided, wherein VLP contains a modified influenza H3 HA protein. A method of producing an influenza virus-like particle (VLP) in a plant, plant part, or plant cell, as well as the corresponding plant, plant part, and plant cell, is presented. The following is disclosed: a composition for inducing immunity to influenza infection in a subject, the composition comprising an effective dose of VLP and a pharmaceutically acceptable carrier, adjuvant or an excipient. A method of increasing the yield of VLP production in a plant, plant part or plant cell is presented.
EFFECT: invention makes it possible to increase the yield of VLP in the plant.
10 cl, 9 dwg, 7 tbl, 4 ex

Description

Область техники, к которой относится настоящее изобретениеField of technology to which the present invention relates

[0001] Настоящее изобретение относится к производству мутантных вирусных белков в растениях. Более конкретно, настоящее изобретение относится к производству и увеличению продукции подобных вирусу гриппа частиц в растениях.[0001] The present invention relates to the production of mutant viral proteins in plants. More specifically, the present invention relates to the production and enhancement of influenza virus-like particles in plants.

Предшествующий уровень техники настоящего изобретенияBACKGROUND OF THE INVENTION

[0002] Вирусы гриппа представляют собой оболочечные вирусы с одноцепочечной РНК семейства Orthomyxoviridae. Вирусы гриппа очень заразны и могут вызывать легкие или серьезные заболевания во всех возрастных группах.[0002] Influenza viruses are enveloped, single-stranded RNA viruses of the family Orthomyxoviridae. Influenza viruses are highly contagious and can cause mild to severe illness in all age groups.

[0003] Вакцинация остается наиболее эффективным способом предотвращения инфекции гриппа. Как правило, вакцинацию проводят с использованием живых аттенуированных или целых инактивированных форм вируса, которые вызывают иммунный ответ при введении пациенту. Чтобы исключить потенциальный риск того, что живые аттенуированные и целые инактивированные вирусы вновь приобретут способность к репликации и станут заразными, также использовались вакцины, содержащие рекомбинантные вирусные белки, чтобы вызвать защитный иммунитет к инфекции гриппа.[0003] Vaccination remains the most effective way to prevent influenza infection. Typically, vaccination is performed using live attenuated or whole inactivated forms of the virus, which produce an immune response when administered to a patient. To eliminate the potential risk of live attenuated and intact inactivated viruses regaining the ability to replicate and becoming infectious, vaccines containing recombinant viral proteins have also been used to induce protective immunity to influenza infection.

[0004] Однако применение рекомбинантных вирусных белков в качестве иммуногенного компонента вакцин характеризуется рядом ограничений. Во-первых, в отсутствие полного набора вирусных белков и генетических компонентов, необходимых для оптимальной экспрессии и правильного сворачивания белков, выход рекомбинантных вирусных белков в стандартных системах экспрессии in vitro может быть недостаточным для цели производства вакцины. Во-вторых, вакцины с рекомбинантными вирусными белками могут проявлять низкую иммуногенность из-за неправильного сворачивания, плохой презентации антигена и/или генерации преимущественно гуморального иммунного ответа, который неэффективен для обеспечения длительного защитного иммунитета.[0004] However, the use of recombinant viral proteins as an immunogenic component of vaccines is subject to a number of limitations. First, in the absence of the full complement of viral proteins and genetic components required for optimal expression and proper protein folding, the yield of recombinant viral proteins in standard in vitro expression systems may be insufficient for the purpose of vaccine production. Second, vaccines with recombinant viral proteins may exhibit poor immunogenicity due to misfolding, poor antigen presentation, and/or generation of a predominantly humoral immune response that is ineffective at providing long-lasting protective immunity.

[0005] Существует четыре типа вируса гриппа: А, В, С и D, из которых грипп А и В являются возбудителями сезонных эпидемий заболеваний у людей.[0005] There are four types of influenza virus: A, B, C and D, of which influenza A and B are the causative agents of seasonal epidemics of disease in humans.

[0006] Вирусы гриппа А дополнительно подразделяются на основе экспрессии подтипов гликопротеинов гемагглютинина (НА) и нейраминидазы (NA) на поверхности вируса. Существует 18 различных подтипов НА (H1-H18).[0006] Influenza A viruses are further subdivided based on the expression of hemagglutinin (HA) and neuraminidase (NA) glycoprotein subtypes on the surface of the virus. There are 18 different subtypes of AN (H1-H18).

[0007] НА представляет собой тримерный лектин, который облегчает связывание частицы вируса гриппа с содержащими сиаловую кислоту белками на поверхности клеток-мишеней и опосредует высвобождение вирусного генома в клетку-мишень. Белки НА содержат два структурных элемента: головку, которая представляет собой основную мишень серопротективных антител, и ножку. НА транслируется как отдельный полипептид НАО (собранный в виде тримеров), который должен расщепляться сериновой эндопротеазой между субдоменами НА1 (~40 кДа) и НА2 (~20 кДа). После расщепления два домена белка с дисульфидной связью принимают необходимую конформацию, необходимую для вирусной инфекционности. НА1 образует глобулярный головной домен, содержащий рецептор-связывающий сайт (RBS), и RBS представляет собой наименее консервативный сегмент вируса гриппа. НА2 представляет собой однопроходный интегральный мембранный белок со слитым пептидом (FP), растворимым эктодоменом (SE), трансмембранным (ТМ) и цитоплазматическим хвостом (СТ) с соответствующей длиной приблизительно 25, 160, 25 и 10 остатков. НА2 вместе с N- и С-концевыми остатками НА1 образует домен «ножки», который включает в себя трансмембранную область и является относительно консервативным.[0007] HA is a trimeric lectin that facilitates the binding of the influenza virus particle to sialic acid-containing proteins on the surface of target cells and mediates the release of the viral genome into the target cell. HA proteins contain two structural elements: a head, which is the main target of seroprotective antibodies, and a stalk. HA is translated as a single HAO polypeptide (assembled as trimers) that must be cleaved by a serine endoprotease between the HA1 (~40 kDa) and HA2 (~20 kDa) subdomains. After cleavage, the two disulfide-linked domains of the protein adopt the required conformation required for viral infectivity. HA1 forms a globular head domain containing the receptor binding site (RBS), and the RBS is the least conserved segment of the influenza virus. HA2 is a single-pass integral membrane protein with a fusion peptide (FP), a soluble ectodomain (SE), a transmembrane (TM), and a cytoplasmic tail (CT) with corresponding lengths of approximately 25, 160, 25, and 10 residues. HA2, together with the N- and C-terminal residues of HA1, forms a stem domain, which includes the transmembrane region and is relatively conserved.

[0008] Были исследованы различные мутации в белках вируса гриппа, особенно в НА гриппа.[0008] Various mutations in influenza virus proteins have been studied, especially in influenza HA.

[0009] Например, Castelan-Vega et al. (Adv Appl Bioinform Chem. 2014;7:37-44) использовали алгоритм прогнозирования стабильности для сравнения 7479 полноразмерных аминокислотных последовательностей НА из вируса гриппа А (H1N1)pdm09 и идентифицировали, что мутации D104N, А259Т, S124N и E172K приводили к прогнозируемому повышению стабильности НА гриппа. Напротив, мутации S206T, K285E и E47K характеризовались предсказанным дестабилизирующим эффектом на НА.[0009] For example, Castelan-Vega et al. (Adv Appl Bioinform Chem. 2014;7:37-44) used a stability prediction algorithm to compare 7,479 full-length HA amino acid sequences from influenza A (H1N1)pdm09 virus and identified that mutations D104N, A259T, S124N, and E172K resulted in predicted increases in stability ON flu. In contrast, mutations S206T, K285E, and E47K had the predicted destabilizing effect on HA.

[0010] При сравнении последовательностей исходного гриппа A (H1N1)pdm [A/California/7/2009] и более позднего штамма гриппа [A/Brisbane/10/2010], Cotter et al. (PLoSPathog. 2014; 10(1):e1003831) идентифицировали, что мутация E47K в области ножки A/California/07/09 НА стабилизировала структуру тримера, понижала рН для слияния мембран и увеличивала термическую и кислотную стабильность вируса. Cotter et al. дополнительно наблюдали, что НА мутанта Е47К A/California/7/2009 был более заразным для хорьков, чем его аналог дикого типа.[0010] In a comparison of the sequences of the original influenza A (H1N1)pdm [A/California/7/2009] and the more recent influenza strain [A/Brisbane/10/2010], Cotter et al. (PLoSPathog. 2014; 10(1):e1003831) identified that the E47K mutation in the A/California/07/09 HA stem region stabilized the trimer structure, decreased the pH for membrane fusion, and increased the thermal and acid stability of the virus. Cotter et al. additionally observed that the HA mutant E47K A/California/7/2009 was more infectious in ferrets than its wild-type counterpart.

[0011] Antanasijevic et al. (J Biol Chem. 2014;289(32):22237-45) исследовали структурно-функциональные свойства области «петли-на-стебле» НА Н5 посредством сайт-направленного мутагенеза в 14 различных положениях. Мутанты A/Vietnam/1203/04 (H5N1) экспрессировались в клетках НЕК 293Т, и Antanasijevic сообщил, что большинство мутаций в области «петли-на-стебле» не нарушают экспрессию, протеолитический процессинг, сборку вируса или связывание рецептора. Однако Antanasijevic наблюдал, что мутанты HA1-D26K, HA1-M102L, HA2-V52A и HA2-I55A (на основе нумерации Н3) демонстрируют значительно сниженные уровни общего НА, что предполагает снижение экспрессии и/или сборки НА в вирусные частицы. Мутанты HA1-D26K, НА2-Т49А и НА2-M102L также проявляли более низкие титры гемагглютинации по сравнению с вирусом дикого типа. Antanasijevic дополнительно наблюдал, что все одиночные мутанты демонстрируют пониженное проникновение в клетки легких А549, причем наиболее выраженное нарушение проявляется у мутантов HA1-D26K и HA2-I55A. Antanasijevic также продемонстрировал, что мутант HA2-L99A был более чувствителен к ингибированию клеток легких А549 нейтрализующим антителом С179 по сравнению с вирусом дикого типа, предполагая, что мутация усиливает связывание антитела и/или способ нейтрализующего действия. Напротив, мутанты HA1-I28A, НА1-М31А, HA1-M31L, HA2-I45A и HA2-I55V оказались менее чувствительными к ингибированию проникновения нейтрализующим антителом С179.[0011]Antanasijevic et al. (J Biol Chem. 2014;289(32):22237-45) investigated the structural and functional properties of the stem-loop region of H5 HA by site-directed mutagenesis at 14 different positions. The A/Vietnam/1203/04 (H5N1) mutant was expressed in HEK 293T cells, and Antanasijevic reported that most mutations in the stem-loop region did not impair expression, proteolytic processing, virus assembly, or receptor binding. However, Antanasijevic observed that mutants HA1-D26K, HA1-M102L, HA2-V52A, and HA2-I55A (based on H3 numbering) exhibited significantly reduced levels of total HA, suggesting reduced expression and/or assembly of HA into viral particles. The HA1-D26K, HA2-T49A, and HA2-M102L mutants also exhibited lower hemagglutination titers compared to the wild-type virus. Antanasijevic additionally observed that all single mutants showed reduced penetration into A549 lung cells, with the most pronounced impairment being seen in the HA1-D26K and HA2-I55A mutants. Antanasijevic also demonstrated that the HA2-L99A mutant was more sensitive to inhibition of A549 lung cells by the neutralizing antibody C179 compared with wild-type virus, suggesting that the mutation enhances antibody binding and/or mode of neutralizing action. In contrast, mutants HA1-I28A, HA1-M31A, HA1-M31L, HA2-I45A, and HA2-I55V were less sensitive to penetration inhibition by the neutralizing antibody C179.

[0012] В публикации международной заявки WO 2013/177444 и сопутствующей публикации Lu et at. (Proc Natl Acad Sci USA. 2014; 111(1): 125-30) сообщается о способе получения правильно свернутого домена стебля НА из A/California/05/2009 (H1N1) с использованием системы экспрессии бесклеточного белка на основе Escherichia coli и простого протокола рефолдинга. Для индукции тримеризации домена стебля НА либо хлорамфеникол-ацетилтрансферазу (CAT), либо домен сборки сливали с С-концом НА. Для уменьшения вновь выявленной гидрофобности и/или образования пар межмолекулярных ионов, вызывающих агрегацию экспрессированного белка стебля НА, оценивали пять групп мутаций: M1 (I69T+I72E+I74T+С77Т); М2 (I69T+I72E+I74T+С77Т+F164D); М3 (I69T+I72E+I74T+С77Т+F164D+L174D); М4 (F164D) и М5 (F164D+L174D). Lu наблюдал, что мутации М5 (F164D+L174D) оказались наиболее влиятельными мутациями для улучшения растворимости белков стебля НА. Дополнительные делеции (от Н38 до С43 и от С49 до N61) и мутации С77Т были внесены в мутанты М5, чтобы избежать образования нежелательных дисульфидных связей, уменьшить гидрофобность поверхности и pI и избежать областей с неупорядоченной структурой.[0012] In international application publication WO 2013/177444 and accompanying publication Lu et at. (Proc Natl Acad Sci USA. 2014; 111(1): 125-30) reports a method for producing a properly folded HA stem domain from A/California/05/2009 (H1N1) using an Escherichia coli-based cell-free protein expression system and a simple refolding protocol. To induce trimerization of the HA stem domain, either chloramphenicol acetyltransferase (CAT) or the assembly domain was fused to the C terminus of HA. To reduce the newly identified hydrophobicity and/or the formation of intermolecular ion pairs that cause aggregation of the expressed HA stem protein, five groups of mutations were evaluated: M1 (I69T+I72E+I74T+C77T); M2 (I69T+I72E+I74T+С77Т+F164D); M3 (I69T+I72E+I74T+С77Т+F164D+L174D); M4 (F164D) and M5 (F164D+L174D). Lu observed that M5 mutations (F164D+L174D) were found to be the most influential mutations for improving the solubility of HA stem proteins. Additional deletions (H38 to C43 and C49 to N61) and C77T mutations were introduced into the M5 mutants to avoid the formation of unwanted disulfide bonds, reduce surface hydrophobicity and pI, and avoid regions of disordered structure.

[0013] В заявке США №13/838796 и сопутствующей публикации Holtz et at. (ВМС Biotechnology. 2014; 14:111) сообщается о повышенной стабильности и сохранении активности рекомбинантного НА за счет мутации остатков цистеина в карбоксиконцевой области белка НА, включая в себя трансмембранный (ТМ) и цитозольный домен (СТ). В частности, Holtz et al. демонстрируют мутации С539А, С546А, С549А, C524S и С528А в рекомбинантном НА Perth/16/2009 (H3N2). Мутация всех пяти остатков цистеина или различных их подмножеств приводила к выходам, чистоте, размеру частиц, активности гемагглютинации и термостабильности НА, сравнимым с рекомбинантным белком НА дикого типа. Напротив, мутации C64S и C76S приводили к значительному снижению экспрессии НА, что указывает на критическую роль этих остатков в собственном сворачивании НА. Используя анализ простой радиальной иммунодиффузии (SRID), Holtz et al. также показывают, что пять мутаций остатков цистеина улучшают активность рекомбинантного НА по сравнению с белком дикого типа, предотвращая перекрестное связывание дисульфидов в доменах ТМ и СТ. Мутантные белки НА сохраняют активность в течение по меньшей мере 12 месяцев при температуре 25°С, тогда как белок НА дикого типа проявлял активность менее 40% только через 50 дней после очистки.[0013] In US application No. 13/838796 and accompanying publication Holtz et at. (BMC Biotechnology. 2014; 14:111) reported increased stability and preservation of the activity of recombinant HA due to mutation of cysteine residues in the carboxy-terminal region of the HA protein, including the transmembrane (TM) and cytosolic domain (CT). In particular, Holtz et al. demonstrate mutations C539A, C546A, C549A, C524S and C528A in recombinant HA Perth/16/2009 (H3N2). Mutation of all five cysteine residues or various subsets of them resulted in HA yields, purity, particle size, hemagglutination activity, and thermostability comparable to recombinant wild-type HA protein. In contrast, the C64S and C76S mutations resulted in a significant reduction in HA expression, indicating a critical role for these residues in the intrinsic folding of HA. Using a simple radial immunodiffusion (SRID) assay, Holtz et al. also show that five mutations of cysteine residues improve the activity of recombinant HA relative to the wild-type protein by preventing disulfide cross-linking in the TM and CT domains. Mutant HA proteins retained activity for at least 12 months at 25°C, whereas wild-type HA protein showed less than 40% activity only 50 days after purification.

[0014] В публикации международной заявки WO 2015/020913 сообщается о мутации конкретных остатков в одном или более положениях, выбранных из группы из 403, 406, 411, 422, 429, 432, 433 и 435 вируса гриппа A/Puerto Rico/8/1934 (H1N1), в тирозин. Эти мутации способствуют образованию дитирозиновых поперечных сшивок, которые стабилизируют или «блокируют» домен ножки НА гриппа в его нативной тримерной конформации.[0014] International Application Publication WO 2015/020913 reports mutation of specific residues at one or more positions selected from the group of 403, 406, 411, 422, 429, 432, 433 and 435 of the influenza A/Puerto Rico/8/ virus 1934 (H1N1), to tyrosine. These mutations promote the formation of dityrosine cross-links that stabilize or “lock” the influenza HA stem domain in its native trimeric conformation.

[0015] В публикации международной заявки WO 2013/079473 раскрыт модифицированный НА гриппа, лишенный глобулярного головного домена. Полипептид, описанный в публикации международной заявки WO 2013/079473, содержит домен НА1, в котором аминокислоты с 53 по 620 (со ссылкой на нумерацию A/Brisbane/59/2007 [H1N1]) удалены и заменены ковалентно связанной последовательностью из 0-10 аминокислот, и домен НА2, где С-концевая аминокислота домена НА1 представляет собой аминокислоту, отличную от аргинина или лизина, и где одна или более аминокислот в положениях 406, 409, 413 и 416 мутированы в аминокислоту, выбранную из группы, состоящей из серина, треонина, аспарагина, глутамина, аргинина, гистидина, лизина, аспарагиновой кислоты, глутаминовой кислоты и глицина.[0015] International application publication WO 2013/079473 discloses a modified influenza HA lacking the globular head domain. The polypeptide described in international application publication WO 2013/079473 contains a HA1 domain in which amino acids 53 to 620 (referring to numbering A/Brisbane/59/2007 [H1N1]) have been removed and replaced by a covalently linked sequence of 0-10 amino acids , and the HA2 domain, wherein the C-terminal amino acid of the HA1 domain is an amino acid other than arginine or lysine, and wherein one or more amino acids at positions 406, 409, 413, and 416 are mutated to an amino acid selected from the group consisting of serine, threonine , asparagine, glutamine, arginine, histidine, lysine, aspartic acid, glutamic acid and glycine.

[0016] В публикации международной заявки WO 2014/191435 аналогичным образом описан модифицированный НА гриппа, содержащий домен НА1, в котором удаленный сегмент заменен ковалентно связанной последовательностью от 0 до 50 аминокислот, и домен НА2, причем НА устойчив к расщеплению на стыке между НА1 и НА2 и причем одна или более аминокислот в положениях 337, 340, 352, 353, 402, 406, 409, 413 и/или 416 были мутированы.[0016] WO 2014/191435 similarly describes a modified influenza HA comprising a HA1 domain in which the deleted segment is replaced by a covalently linked sequence of 0 to 50 amino acids, and a HA2 domain, wherein the HA is resistant to cleavage at the junction between HA1 and HA2 and wherein one or more amino acids at positions 337, 340, 352, 353, 402, 406, 409, 413 and/or 416 have been mutated.

[0017] Вирусоподобные частицы (VLP) представляют собой потенциальных кандидатов для включения в иммуногенные композиции. VLP очень похожи на зрелые вирионы, но они не содержат вирусного геномного материала. Следовательно, VLP нерепликативны по своей природе, что делает их безопасными для введения в качестве вакцины. Кроме того, VLP могут быть сконструированы для экспрессии вирусных гликопротеинов на поверхности VLP, которая является их наиболее естественной физиологической конфигурацией. Более того, поскольку VLP похожи на интактные вирионы и представляют собой поливалентные структуры в виде частиц, VLP могут быть более эффективными в индукции нейтрализующих антител к гликопротеину, чем антигены растворимых белков оболочки.[0017] Virus-like particles (VLPs) are potential candidates for inclusion in immunogenic compositions. VLPs are very similar to mature virions, but they do not contain viral genomic material. Therefore, VLPs are non-replicative in nature, making them safe to administer as a vaccine. In addition, VLPs can be engineered to express viral glycoproteins on the surface of the VLP, which is their most natural physiological configuration. Moreover, because VLPs are similar to intact virions and are multivalent particulate structures, VLPs may be more effective in inducing neutralizing antibodies to the glycoprotein than soluble envelope protein antigens.

[0018] VLP были произведены в растениях (смотрите, например, публикации международных заявок WO 2009/076778; WO 2009/009876; WO 2009/076778; WO 2010/003225; WO 2010/003235; WO 2010/006452; WO 2011/03522; WO 2010/148511 и WO 2014153674, которые включены в настоящий документ посредством ссылки).[0018] VLPs have been produced in plants (see, for example, international application publications WO 2009/076778; WO 2009/009876; WO 2009/076778; WO 2010/003225; WO 2010/003235; WO 2010/006452; WO 2011/0 3522 ; WO 2010/148511 and WO 2014153674, which are incorporated herein by reference).

[0019] В публикации международной заявки WO 2009/076778 описан способ получения VLP гриппа в растениях, предусматривающий введение нуклеиновой кислоты, содержащей регуляторную область, активную в растении, функционально связанную с нуклеотидной последовательностью, кодирующей НА гриппа из гриппа типа А или типа В.[0019] International Application Publication WO 2009/076778 describes a method for producing influenza VLPs in plants, comprising introducing a nucleic acid containing a plant-active regulatory region operably linked to a nucleotide sequence encoding an influenza HA from influenza type A or type B.

[0020] В публикации международной заявки WO 2009/009876 описан способ получения VLP НА гриппа в растениях, при котором НА гриппа самоорганизуется в VLP в клетках растений и почках из мембран растительных клеток.[0020] International Application Publication WO 2009/009876 describes a method for producing influenza HA VLPs in plants, in which influenza HA self-assembles into VLPs in plant cells and buds from plant cell membranes.

[0021] В публикации международной заявки WO 2010/003225 раскрыт способ получения VLP НА гриппа в растениях, предусматривающий введение нуклеиновой кислоты, содержащей регуляторную область, активную в растении, функционально связанную с нуклеотидной последовательностью, кодирующей НА гриппа из A/California/04/09 (H1N1).[0021] International application publication WO 2010/003225 discloses a method for producing influenza HA VLPs in plants, comprising introducing a nucleic acid containing a plant-active regulatory region operably linked to a nucleotide sequence encoding influenza HA from A/California/04/09 (H1N1).

[0022] В публикации международной заявки WO 2010/006452 сообщается о получении VLP, содержащих модифицированные белки НА гриппа, причем сайты гликозилирования в положениях 154, 165, 286 или их комбинации (со ссылкой на нумерацию A/Vietnam/1194/04 [H5N1]) были отменены путем мутации остатков в указанных положениях в аминокислоты, отличные от аспарагина. В публикации международной заявки WO 2010/006452 также сообщается, что аминокислоты в положениях 156, 167, 288 или их комбинации могут быть мутированы в остатки, отличные от серина или треонина, чтобы аналогичным образом отменить N-связанную триаду сигнала гликозилирования «N-X-S/Т». Путем избирательного удаления сайтов гликозилирования, расположенных в глобулярной головке белка НА, в публикации международной заявки WO 2010/006452 продемонстрировано, что полученный белок НА характеризуется повышенной антигенностью и более широкой перекрестной реактивностью.[0022] International application publication WO 2010/006452 reports the preparation of VLPs containing modified influenza HA proteins, with glycosylation sites at positions 154, 165, 286 or combinations thereof (referring to numbering A/Vietnam/1194/04 [H5N1] ) were abolished by mutation of residues at the indicated positions to amino acids other than asparagine. International Application Publication WO 2010/006452 also discloses that amino acids at positions 156, 167, 288, or combinations thereof, can be mutated to residues other than serine or threonine to similarly abolish the N-linked triad of the "N-X-S/T" glycosylation signal. . By selectively removing glycosylation sites located in the globular head of the HA protein, WO 2010/006452 demonstrated that the resulting HA protein exhibits increased antigenicity and greater cross-reactivity.

[0023] В публикации международной заявки WO 2011/035422 сообщается о способе получения VLP растительного происхождения, предусматривающем: получение растения или растительного вещества, содержащего VLP, локализованные в апопласте; получение фракции протопласта/сферопласта и фракции апопласта; и выделение фракции апопласта, содержащей VLP растительного происхождения.[0023] International application publication WO 2011/035422 discloses a method for producing VLPs of plant origin, comprising: producing a plant or plant substance containing VLPs localized in the apoplast; obtaining the protoplast/spheroplast fraction and the apoplast fraction; and isolating an apoplast fraction containing plant-derived VLPs.

[0024] В публикации международной заявки WO 2010/148511 раскрыт способ получения VLP гриппа в растениях, причем VLP содержат химерные белки НА. Химерные белки НА содержат кластер домена стебля, содержащий субдомены F'1, F'2 и F; кластер головного домена, содержащий субдомены RB, Е1 и Е2; и кластер транс мембранного домена, содержащий трансмембранный домен и С-концевой хвостовой домен, причем по меньшей мере один субдомен происходит от первого штамма гриппа, а другие субдомены происходят от одного или более вторых штаммов гриппа.[0024] International Application Publication WO 2010/148511 discloses a method for producing influenza VLPs in plants, wherein the VLPs contain chimeric HA proteins. Chimeric HA proteins contain a stem domain cluster containing subdomains F'1, F'2, and F; head domain cluster containing subdomains RB, E1 and E2; and a transmembrane domain cluster comprising a transmembrane domain and a C-terminal tail domain, wherein at least one subdomain is derived from a first influenza strain and the other subdomains are derived from one or more second influenza strains.

[0025] В публикации международной заявки WO 2014/153674 сообщается о способе получения VLP вируса гриппа в растении, причем VLP содержат модифицированный НА гриппа, содержащий модифицированную протеолитическую петлю. Модифицированная протеолитическая петля содержит удаление сайта протеолитического расщепления между доменами НА1 и НА2 предшественника HA0. Таким образом, белок НА стабилизируется, и достигаются повышенные выходы белка по сравнению с нативным белком НА.[0025] International application publication WO 2014/153674 discloses a method for producing influenza virus VLPs in a plant, the VLPs containing a modified influenza HA containing a modified proteolytic loop. The modified proteolytic loop contains the removal of the proteolytic cleavage site between the HA1 and HA2 domains of the HA0 precursor. In this way, the HA protein is stabilized and increased protein yields are achieved compared to the native HA protein.

Сущность настоящего изобретенияSummary of the present invention

[0026] Настоящее изобретение относится к производству модифицированных белков вируса гриппа в растениях. Более конкретно, настоящее изобретение относится к производству и увеличению продукции подобных вирусу гриппа частиц (VLP) в растениях, причем VLP содержат модифицированные вирусные белки гриппа, например, модифицированный белок гемагглютинин (НА).[0026] The present invention relates to the production of modified influenza virus proteins in plants. More specifically, the present invention relates to the production and enhancement of production of influenza virus-like particles (VLPs) in plants, wherein the VLPs contain modified influenza viral proteins, for example, a modified hemagglutinin (HA) protein.

[0027] Цель настоящего изобретения заключается в создании улучшенного способа увеличения производства VLP вируса гриппа в растениях.[0027] An object of the present invention is to provide an improved method for increasing the production of influenza virus VLPs in plants.

[0028] В соответствии с настоящим изобретением предусмотрено следующее:[0028] In accordance with the present invention, the following is provided:

[0029] А. Нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный белок гемагглютинина (НА) Н3 вируса гриппа, причем белок НА содержит аминокислотную последовательность, содержащую по меньшей мере одну замену по сравнению с соответствующей аминокислотной последовательностью дикого типа, причем указанная по меньшей мере одна замена представляет собой замену одной или более чем одной аминокислоты, соответствующей аминокислотам в положении 382, 384, 392 или 431 A/Hong Kong/4801/14 НА.[0029] A. A nucleic acid comprising a nucleotide sequence encoding a modified influenza virus H3 hemagglutinin (HA) protein, wherein the HA protein contains an amino acid sequence containing at least one substitution compared to the corresponding wild-type amino acid sequence, wherein said at least one substitution is a substitution of one or more amino acids corresponding to amino acids at position 382, 384, 392 or 431 A/Hong Kong/4801/14 HA.

[0030] Белок НА может содержать аминокислотную последовательность с заменой на не аспарагин по аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА. Белок НА может содержать аминокислотную последовательность с заменой на аланин или консервативную замену аланина в аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА.[0030] The HA protein may contain an amino acid sequence with a non-asparagine amino acid substitution corresponding to the amino acid at position 382 of A/Hong Kong/4801/14 HA. The HA protein may contain an amino acid sequence with an alanine substitution or a conservative alanine substitution in the amino acid corresponding to the amino acid at position 382 of A/Hong Kong/4801/14 HA.

[0031] Белок НА может содержать аминокислотную последовательность с заменой на не лейцин по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА. Белок НА может содержать аминокислотную последовательность с заменой на валин или консервативную замену валина по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА.[0031] The HA protein may contain an amino acid sequence with a non-leucine amino acid substitution corresponding to the amino acid at position 384 of A/Hong Kong/4801/14 HA. The HA protein may contain an amino acid sequence with a valine substitution or a conservative valine substitution at the amino acid corresponding to the amino acid at position 384 of A/Hong Kong/4801/14 HA.

[0032] Белок НА может содержать аминокислотную последовательность с заменой на не фенилаланин по аминокислоте, соответствующей аминокислоте в положении 392 A/Hong Kong/4801/14 НА. Белок НА может содержать аминокислотную последовательность с заменой на аспарагиновую кислоту или консервативную замену аспарагиновой кислоты по аминокислоте, соответствующей аминокислоте в положении 392 A/Hong Kong/4801/14 НА.[0032] The HA protein may contain an amino acid sequence with a non-phenylalanine amino acid substitution corresponding to the amino acid at position 392 of A/Hong Kong/4801/14 HA. The HA protein may contain an amino acid sequence with an aspartic acid substitution or a conservative aspartic acid substitution at the amino acid corresponding to the amino acid at position 392 of A/Hong Kong/4801/14 HA.

[0033] Белок НА может содержать аминокислотную последовательность с заменой на не лейцин по аминокислоте, соответствующей аминокислоте в положении 431 A/Hong Kong/4801/14 НА. Белок НА может содержать аминокислотную последовательность с заменой на метионин или консервативную замену метионина по аминокислоте, соответствующей аминокислоте в положении 431 A/Hong Kong/4801/14 НА.[0033] The HA protein may contain an amino acid sequence with a non-leucine amino acid substitution corresponding to the amino acid at position 431 of A/Hong Kong/4801/14 HA. The HA protein may contain an amino acid sequence with a methionine substitution or a conservative methionine substitution at the amino acid corresponding to the amino acid at position 431 A/Hong Kong/4801/14 HA.

[0034] Также предусмотрено:[0034] It is also provided:

[0035] В. Нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный белок гемагглютинин (НА) вируса гриппа Н3, причем белок НА содержит аминокислотную последовательность, содержащую по меньшей мере одну замену, по сравнению с соответствующей аминокислотной последовательностью дикого типа, причем указанная по меньшей мере одна замена представляет собой замену одной или более чем одной аминокислоты, соответствующей аминокислотам в положениях 382, 384, 392, 431, 524, 525, 526 или 528 A/Hong Kong/4801/14 НА.[0035] B. A nucleic acid containing a nucleotide sequence encoding a modified hemagglutinin (HA) protein of an influenza H3 virus, wherein the HA protein contains an amino acid sequence containing at least one substitution compared to the corresponding wild-type amino acid sequence, said at least At least one substitution is a substitution of one or more amino acids corresponding to amino acids at positions 382, 384, 392, 431, 524, 525, 526 or 528 of A/Hong Kong/4801/14 HA.

[0036] Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на не аспарагин по аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА, второй заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА. Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на аланин или консервативную замену аланина по аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА, второй заменой на серии или консервативную замену серина по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на лейцин или консервативную замену лейцина по аминокислоте, соответствующей аминокислоте в положении 528 из A/Hong Kong/4801/14 НА.[0036] The HA protein may further comprise an amino acid sequence with a first non-asparagine amino acid substitution corresponding to the amino acid at position 382 of A/Hong Kong/4801/14 HA, a second non-cysteine amino acid substitution corresponding to the amino acid at position 524 of A/Hong Kong/4801/14 HA, and a third substitution with a non-cysteine amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA. The HA protein may further comprise an amino acid sequence with a first alanine substitution or a conservative amino acid substitution for alanine corresponding to the amino acid at position 382 of A/Hong Kong/4801/14 HA, a second substitution for a series or a conservative serine substitution at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a third substitution with leucine or a conservative leucine substitution at the amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA.

[0037] Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на не лейцин по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА, второй заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА. Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на валин или консервативную замену валина по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА, второй заменой на серии или консервативную замену серина по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на лейцин или консервативную замену лейцина по аминокислоте, соответствующей аминокислоте в положении 528 из A/Hong Kong/4801/14 НА.[0037] The HA protein may further comprise an amino acid sequence with a first non-leucine amino acid substitution corresponding to the amino acid at position 384 of A/Hong Kong/4801/14 HA, a second non-cysteine amino acid substitution corresponding to the amino acid at position 524 of A/Hong Kong/4801/14 HA, and a third substitution with a non-cysteine amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA. The HA protein may further comprise an amino acid sequence with a first valine substitution or a conservative valine amino acid substitution corresponding to the amino acid at position 384 of A/Hong Kong/4801/14 HA, a second serine substitution or a conservative serine amino acid substitution corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a third substitution with leucine or a conservative leucine substitution at the amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA.

[0038] Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на не фенилаланин по аминокислоте, соответствующей аминокислоте в положении 392 A/Hong Kong/4801/14 НА, второй заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА. Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на аспарагиновую кислоту или консервативную замену аспарагиновой кислоты по аминокислоте, соответствующей аминокислоте в положении 392 A/Hong Kong/4801/14 НА, второй заменой на серии или консервативную замену серина по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на лейцин или консервативную замену лейцина по аминокислоте, соответствующей аминокислоте в положении 528 из A/Hong Kong/4801/14 НА.[0038] The HA protein may further comprise an amino acid sequence with a first non-phenylalanine amino acid substitution corresponding to the amino acid at position 392 of A/Hong Kong/4801/14 HA, a second non-cysteine amino acid substitution corresponding to the amino acid at position 524 of A/Hong Kong/4801/14 HA, and a third substitution with a non-cysteine amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA. The HA protein may further comprise an amino acid sequence with a first substitution of aspartic acid or a conservative substitution of aspartic acid at the amino acid corresponding to the amino acid at position 392 of A/Hong Kong/4801/14 HA, a second substitution of a series or a conservative substitution of serine at the amino acid corresponding to the amino acid at position 524 of A/Hong Kong/4801/14 HA, and a third substitution with leucine or a conservative leucine substitution at the amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA.

[0039] Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на не лейцин по аминокислоте, соответствующей аминокислоте в положении 431 A/Hong Kong/4801/14 НА, второй заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА. Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на метионин или консервативную замену метионина по аминокислоте, соответствующей аминокислоте в положении 431 A/Hong Kong/4801/14 НА, второй заменой на серии или консервативную замену серина по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и третьей заменой на лейцин или консервативную замену лейцина по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА.[0039] The HA protein may further comprise an amino acid sequence with a first non-leucine amino acid substitution corresponding to the amino acid at position 431 of A/Hong Kong/4801/14 HA, a second non-cysteine amino acid substitution corresponding to the amino acid at position 524 of A/Hong Kong/4801/14 HA, and a third substitution with a non-cysteine amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA. The HA protein may further comprise an amino acid sequence with a first methionine substitution or a conservative amino acid substitution for methionine corresponding to the amino acid at position 431 of A/Hong Kong/4801/14 HA, a second substitution at serine or a conservative serine substitution at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a third substitution with leucine or a conservative leucine substitution at the amino acid corresponding to the amino acid at position 528 of A/Hong Kong/4801/14 HA.

[0040] Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на не аспарагин по аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА, второй заменой на не лейцин по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА, третьей заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 524 A/Hong Kong/4801/14 НА, и четвертой заменой на не цистеин по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА. Белок НА может дополнительно содержать аминокислотную последовательность с первой заменой на аланин или консервативную замену аланина на аминокислоте, соответствующей аминокислоте в положении 382 A/Hong Kong/4801/14 НА, второй заменой на валин или консервативную замену валина по аминокислоте, соответствующей аминокислоте в положении 384 A/Hong Kong/4801/14 НА, третьей заменой на серии или консервативную замену серина по аминокислоте, соответствующей аминокислоте в положение 524 A/Hong Kong/4801/14 НА, и четвертой заменой на лейцин или консервативную замену лейцина по аминокислоте, соответствующей аминокислоте в положении 528 A/Hong Kong/4801/14 НА.[0040] The HA protein may further comprise an amino acid sequence with a first non-asparagine amino acid substitution corresponding to the amino acid at position 382 of A/Hong Kong/4801/14 HA, a second non-leucine amino acid substitution corresponding to the amino acid at position 384 of A/Hong Kong/4801/14 HA, a third substitution with a non-cysteine at the amino acid corresponding to the amino acid at position 524 A/Hong Kong/4801/14 HA, and a fourth substitution with a non-cysteine at the amino acid corresponding to the amino acid at position 528 A/Hong Kong/4801 /14 NA. The HA protein may further comprise an amino acid sequence with a first substitution of alanine or a conservative substitution of alanine at an amino acid corresponding to the amino acid at position 382 of A/Hong Kong/4801/14 HA, a second substitution of valine or a conservative substitution of valine at an amino acid corresponding to the amino acid at position 384 A/Hong Kong/4801/14 HA, a third substitution of a series or a conservative substitution of serine at the amino acid corresponding to the amino acid at position 524 of A/Hong Kong/4801/14 HA, and a fourth substitution of leucine or a conservative substitution of leucine at the amino acid corresponding to the amino acid at position 528 A/Hong Kong/4801/14 NA.

[0041] Белок НА может дополнительно содержать аминокислотную последовательность с заменой по аминокислотам, соответствующим аминокислотам в положениях 525, 526 или 525 и 526 A/Hong Kong/4801/14 НА, причем замена аминокислоты в положении 525 представляет собой замену на не фенилаланин, а замена аминокислоты в положении 526 представляет собой замену на не лейцин. Белок НА может дополнительно содержать аминокислотную последовательность с заменой по аминокислотам, соответствующим аминокислотам в положениях 525, 526 или 525 и 526 A/Hong Kong/4801/14 НА, причем замена аминокислоты в положении 525 представляет собой замену на лейцин или консервативную замену лейцина, а замена аминокислоты в положении 526 представляет собой замену на валин или консервативную замену валина.[0041] The HA protein may further comprise an amino acid substitution sequence corresponding to amino acids at positions 525, 526, or 525 and 526 of A/Hong Kong/4801/14 HA, wherein the amino acid substitution at position 525 is a substitution other than phenylalanine. the amino acid change at position 526 is a non-leucine change. The HA protein may further comprise an amino acid substitution sequence corresponding to amino acids at positions 525, 526, or 525 and 526 of A/Hong Kong/4801/14 HA, wherein the amino acid substitution at position 525 is a leucine substitution or a conservative leucine substitution, and the amino acid substitution at position 526 is a valine substitution or a conservative valine substitution.

[0042] Дополнительно предоставлен белок НА, кодируемый рекомбинантными нуклеиновыми кислотами, как описано в разделах А или В, и вирусоподобная частица (VLP), содержащая белок НА, кодируемый рекомбинантными нуклеиновыми кислотами, как описано в разделах А или В.[0042] Additionally provided is an HA protein encoded by recombinant nucleic acids as described in sections A or B, and a virus-like particle (VLP) containing an HA protein encoded by recombinant nucleic acids as described in sections A or B.

[0043] Таким образом, дополнительно предусмотрен модифицированный белок НА, содержащий аминокислотную последовательность, содержащую по меньшей мере одну замену по сравнению с соответствующей аминокислотной последовательностью дикого типа, причем указанная по меньшей мере одна замена представляет собой замену по одной или более чем одной аминокислоте, соответствующей аминокислотам в положении 382, 384, 392 или 431 в A/Hong Kong/4801/14 НА.[0043] Thus, a modified HA protein is further provided comprising an amino acid sequence containing at least one substitution relative to the corresponding wild-type amino acid sequence, wherein said at least one substitution is a substitution at one or more amino acids corresponding to amino acids at position 382, 384, 392 or 431 in A/Hong Kong/4801/14 HA.

[0044] Согласно другому аспекту предусмотрен модифицированный белок гемагглютинин (НА) вируса гриппа Н3, причем белок НА содержит аминокислотную последовательность, содержащую по меньшей мере одну замену, по сравнению с соответствующей аминокислотной последовательностью дикого типа, причем указанная по меньшей мере одна замена представляет собой замену по одной или более чем одной аминокислоте, соответствующей аминокислотам в положениях 382, 384, 392, 431, 524, 525, 526 или 528 A/Hong Kong/4801/14 НА.[0044] In another aspect, a modified H3 influenza virus hemagglutinin (HA) protein is provided, wherein the HA protein comprises an amino acid sequence containing at least one substitution from the corresponding wild-type amino acid sequence, wherein said at least one substitution is a substitution one or more amino acids each corresponding to amino acids at positions 382, 384, 392, 431, 524, 525, 526 or 528 of A/Hong Kong/4801/14 HA.

[0045] Кроме того, представлен способ получения вирусоподобной частицы (VLP) в растении, части растения или растительной клетке, предусматривающий:[0045] Also provided is a method for producing a virus-like particle (VLP) in a plant, plant part, or plant cell, comprising:

a) введение рекомбинантной нуклеиновой кислоты, как описано в разделе А или В, в растение, часть растения или растительную клетку; а такжеa) introducing a recombinant nucleic acid, as described in section A or B, into a plant, part of a plant or plant cell; and

b) инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию белка НА, кодируемого рекомбинантной нуклеиновой кислотой, с получением VLP. Способ может дополнительно предусматривать стадию с) сбора растения, части растения или растительной клетки и очистки VLP.b) incubating the plant, plant part or plant cell under conditions that allow expression of the HA protein encoded by the recombinant nucleic acid to produce a VLP. The method may further comprise the step c) of collecting the plant, plant part or plant cell and purifying the VLP.

[0046] Кроме того, представлен способ получения подобной вирусу гриппа частицы (VLP) в растении, части растения или растительной клетке, предусматривающий:[0046] Also provided is a method for producing an influenza virus-like particle (VLP) in a plant, plant part, or plant cell, comprising:

a) предоставление растения, части растения или растительной клетки, содержащих рекомбинантную нуклеиновую кислоту, как описано в разделе А или В; а такжеa) providing a plant, plant part or plant cell containing a recombinant nucleic acid as described in section A or B; and

b) инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию белка НА, кодируемого рекомбинантной нуклеиновой кислотой, с получением VLP. Способ может дополнительно предусматривать стадию с) сбора растения, части растения или растительной клетки и очистки VLP.b) incubating the plant, plant part or plant cell under conditions that allow expression of the HA protein encoded by the recombinant nucleic acid to produce a VLP. The method may further comprise the step c) of collecting the plant, plant part or plant cell and purifying the VLP.

[0047] Кроме того, представлен способ увеличения выхода продукции вирусоподобных частиц (VLP) в растении, части растения или растительной клетке, предусматривающий: а) введение рекомбинантной нуклеиновой кислоты А или В в растение, часть растения или растительную клетку или предоставление растения, части растения или растительной клетки, содержащих рекомбинантную нуклеиновую кислоту А или В; и b) инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию белка НА, кодируемого рекомбинантной нуклеиновой кислотой, тем самым производя VLP с более высоким выходом по сравнению с растением, частью растения или растительной клеткой, экспрессирующей немодифицированный белок НА гриппа. Способ может дополнительно предусматривать стадию с) сбора растения, части растения или растительной клетки и очистки VLP.[0047] In addition, a method is provided for increasing the production of virus-like particles (VLPs) in a plant, plant part or plant cell, comprising: a) introducing recombinant nucleic acid A or B into the plant, plant part or plant cell or providing the plant, plant part or a plant cell containing recombinant nucleic acid A or B; and b) incubating the plant, plant part or plant cell under conditions that allow expression of the HA protein encoded by the recombinant nucleic acid, thereby producing VLPs in higher yield compared to a plant, plant part or plant cell expressing unmodified influenza HA protein. The method may further comprise the step c) of collecting the plant, plant part or plant cell and purifying the VLP.

[0048] Способы могут дополнительно предусматривать введение второй нуклеиновой кислоты, кодирующей белок протонного канала; причем растение, часть растения или растительную клетку инкубируют в условиях, которые допускают экспрессию белка протонного канала, кодируемого второй нуклеиновой кислотой. Белок протонного канала может представлять собой белок М2 подтипа А.[0048] The methods may further comprise introducing a second nucleic acid encoding a proton channel protein; wherein the plant, plant part, or plant cell is incubated under conditions that allow expression of the proton channel protein encoded by the second nucleic acid. The proton channel protein may be an M2 subtype A protein.

[0049] Кроме того, предусмотрена VLP, полученная описанным ниже способом.[0049] In addition, a VLP obtained by the method described below is provided.

[0050] VLP может содержать один или более липидов, полученных из растения, части растения или растительной клетки, специфические для растений N-гликаны, модифицированные N-гликаны или их комбинации.[0050] The VLP may contain one or more lipids derived from a plant, a plant part, or a plant cell, plant-specific N-glycans, modified N-glycans, or combinations thereof.

[0051] Кроме того, представлен способ получения антитела или фрагмента антитела, предусматривающий введение описанной VLP субъекту или животному-хозяину, тем самым производя антитело или фрагмент антитела. Также предусмотрены антитела или фрагменты антител, полученные данным способом.[0051] In addition, a method for producing an antibody or antibody fragment is provided, comprising administering the disclosed VLP to a subject or animal host, thereby producing the antibody or antibody fragment. Antibodies or antibody fragments produced by this method are also provided.

[0052] Кроме того, предусмотрено растение, часть растения или растительная клетка, содержащие рекомбинантную нуклеиновую кислоту А или В или белок НА, кодируемый рекомбинантной нуклеиновой кислотой А или В. Белок НА может образовывать VLP. Соответственно, также предусмотрено растение, часть растения или растительная клетка, содержащая VLP, содержащую белок НА, кодируемый рекомбинантной нуклеиновой кислотой А или В.[0052] In addition, a plant, plant part, or plant cell is provided containing a recombinant nucleic acid A or B or an HA protein encoded by a recombinant nucleic acid A or B. The HA protein may form a VLP. Accordingly, a plant, plant part, or plant cell is also provided containing a VLP containing an HA protein encoded by a recombinant nucleic acid A or B.

[0053] Кроме того, предусмотрена композиция для индукции иммунного ответа, содержащая эффективную дозу VLP, как описано в настоящем документе, и фармацевтически приемлемый носитель, адъювант, наполнитель или вспомогательное вещество. Также представлен способ индукции иммунитета к инфекции гриппа у субъекта, предусматривающий введение описанной VLP. VLP можно вводить субъекту перорально, интраназально, внутримышечно, внутрибрюшинно, внутривенно или подкожно.[0053] In addition, a composition for inducing an immune response is provided comprising an effective dose of a VLP as described herein and a pharmaceutically acceptable carrier, adjuvant, excipient or excipient. Also provided is a method for inducing immunity to influenza infection in a subject, comprising administering the described VLP. The VLP can be administered to a subject orally, intranasally, intramuscularly, intraperitoneally, intravenously, or subcutaneously.

[0054] Кроме того, предусмотрен модифицированный белок гемагглютинина (НА) гриппа, содержащий аминокислотную последовательность, характеризующуюся идентичностью последовательности или сходством последовательности, составляющим от приблизительно 30% до приблизительно 100% по отношению к последовательности, выбранной из последовательностей SEQ ID NO: 21, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 53, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 98, при условии, что белок НА гриппа содержит по меньшей мере одну замену, как описано в настоящем документе, и способен образовывать VLP, индуцирует иммунный ответ при введении субъекту, индуцирует гемагглютинацию или их комбинацию.[0054] In addition, a modified influenza hemagglutinin (HA) protein is provided comprising an amino acid sequence having sequence identity or sequence similarity of from about 30% to about 100% to a sequence selected from SEQ ID NO: 21, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 35, SEQ ID NO: 37, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO : 47, SEQ ID NO: 49, SEQ ID NO: 53, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86 , SEQ ID NO: 88, SEQ ID NO: 90, SEQ ID NO: 98, provided that the influenza HA protein contains at least one substitution as described herein and is capable of forming a VLP, induces an immune response when administered to a subject , induces hemagglutination or a combination thereof.

[0055] Это краткое раскрытие настоящего изобретения не обязательно описывает все особенности настоящего изобретения.[0055] This summary of the present invention does not necessarily describe all features of the present invention.

Краткое описание графических материаловBrief description of graphic materials

[0056] Эти и другие особенности настоящего изобретения станут более очевидными из следующего описания, в котором сделана ссылка на прилагаемые графические материалы, где:[0056] These and other features of the present invention will become more apparent from the following description, in which reference is made to the accompanying drawings, in which:

[0057] На фиг. 1 показано выравнивание аминокислотных последовательностей гемагглютинина (НА) A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96); A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97); выделенные остатки совпадают с аминокислотами N382, L384, F392, L431 НА из штаммов гриппа Н3 (H3N2), например, A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92).[0057] In FIG. 1 shows the amino acid sequence alignment of hemagglutinin (HA) A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96); A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97); the isolated residues coincide with amino acids N382, L384, F392, L431 HA from influenza strains H3 (H3N2), for example, A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92).

[0058] На фиг. 2 показаны титры гемагглютинации A/Switzerland/9715293/13 Н3 дикого типа, мутанта N382A A/Switzerland/9715293/13 Н3, мутанта L384V A/Switzerland/9715293/13 Н3, мутанта F392D A/Switzerland/9715293/13 Н3 и мутанта L431M A/Switzerland/9715293/13 Н3.[0058] In FIG. Figure 2 shows the hemagglutination titers of wild type A/Switzerland/9715293/13 H3, mutant N382A A/Switzerland/9715293/13 H3, mutant L384V A/Switzerland/9715293/13 H3, mutant F392D A/Switzerland/9715293/13 H3 and mutant L 431M A/Switzerland/9715293/13 H3.

[0059] На фиг. 3 показаны титры гемагглютинации A/Indonesia/5/2005 Н5 дикого типа, A/Egypt/N04915/2014 Н5 дикого типа, мутанта F393D A/Indonesia/5/2005 Н5, мутанта F393D A/Egypt/N04915/2014 Н5, мутанта N383A A/Indonesia/5/2005 Н5 и мутанта N383A A/Egypt/N04915/2014 Н5. Нумерация в соответствии с A/Indonesia/5/2005.[0059] In FIG. Figure 3 shows the hemagglutination titers of A/Indonesia/5/2005 H5 wild type, A/Egypt/N04915/2014 H5 wild type, mutant F393D A/Indonesia/5/2005 H5, mutant F393D A/Egypt/N04915/2014 H5, mutant N383A A/Indonesia/5/2005 H5 and mutant N383A A/Egypt/N04915/2014 H5. Numbering according to A/Indonesia/5/2005.

[0060] На фиг. 4А показано схематическое представление вектора 3045 (Н3 A-Swi-9715293-13 (F392D)). На фиг. 4В показано схематическое представление вектора 3022 (Н3 A-Swi-9715293-13 (L431M)). На фиг. 4С показано схематическое представление вектора 3023 (Н3 A-Swi-9715293-13 (N382A)). На фиг. 4D показано схематическое представление вектора 3034 (Н3 A-Swi-9715293-13 (L384V)).[0060] In FIG. 4A shows a schematic representation of vector 3045 (H3 A-Swi-9715293-13 (F392D)). In fig. 4B shows a schematic representation of vector 3022 (H3 A-Swi-9715293-13 (L431M)). In fig. 4C shows a schematic representation of vector 3023 (H3 A-Swi-9715293-13 (N382A)). In fig. 4D shows a schematic representation of vector 3034 (H3 A-Swi-9715293-13 (L384V)).

[0061] На фиг. 5А показано схематическое представление вектора 3556 (вектор для клонирования In-Fusion в кассету экспрессии на основе CPMV 160 в дополнение к вспомогательному белку М2 под контролем промотора и терминатора пластоцианина люцерны). На фиг. 5 В показано схематическое представление вектора 1190 (вектор для клонирования bi-Fusion в кассету экспрессии на основе CPMV 160).[0061] In FIG. 5A shows a schematic representation of vector 3556 (an In-Fusion cloning vector into a CPMV 160-based expression cassette in addition to the M2 accessory protein under the control of the alfalfa plastocyanin promoter and terminator). In fig. 5B shows a schematic representation of vector 1190 (bi-Fusion cloning vector into a CPMV 160-based expression cassette).

[0062] На фиг. 6А показаны титры гемагглютинации A/Switzerland/9715293/13 Н3 дикого типа и мутанта CysTM A/Switzerland/9715293/13 Н3.[0062] In FIG. 6A shows the hemagglutination titers of wild type A/Switzerland/9715293/13 H3 and the CysTM mutant A/Switzerland/9715293/13 H3.

[0063] На фиг. 6 В показаны титры гемагглютинации A/Permsylvania/09/2015 Н3 дикого типа и мутанта CysTM A/Permsylvania/09/2015 Н3.[0063] In FIG. 6 B shows the hemagglutination titers of wild type A/Permsylvania/09/2015 H3 and the CysTM mutant A/Permsylvania/09/2015 H3.

[0064] На фиг. 7А показаны титры гемагглютинации A/Switzerland/9715293/13 Н3 дикого типа, мутанта N382A A/Switzerland/9715293/13 Н3, мутанта L384V A/Switzerland/9715293/13 Н3, мутанта F392D A/Switzerland/9715293/13 Н3, мутанта L431M A/Switzerland/9715293/13 Н3, A/Switzerland/9715293/13 Н3 с модификацией CysTM, мутанта N382A+CysTM A/Switzerland/9715293/13 Н3, мутанта L384V+CysTM A/Switzerland/9715293/13 Н3, мутанта F392D+CysTM A/Switzerland/9715293/13 Н3 и мутанта L431M+CysTM A/Switzerland/9715293/13 Н3. На фиг. 7 В показаны выходы VLP после градиента плотности мутанта CysTM A/Switzerland/9715293/13 Н3, мутанта N382A+CysTM A/Switzerland/9715293/13 Н3, мутанта L384V+CysTM A/Switzerland/9715293/13 Н3, мутанта F392D+CysTM A/Switzerland/9715293/13 Н3 и мутанта L431M+CysTM A/Switzerland/9715293/13 Н3, выраженные в процентах по отношению к мутанту CysTM A/Switzerland/9715293/13 Н3. На фиг. 7С показаны титры гемагглютинации A/Pennsylvania/09/2015 Н3 дикого типа, мутанта CysTM A/Pennsylvania/09/2015 Н3, мутанта N382A+CysTM A/Pennsylvania/09/2015 Н3 и мутанта L384V+CysTM A/Pennsylvania/09/2015 Н3. На фиг. 7D показаны титры гемагглютинации мутанта CysTM A/S. Australia/1/16 Н3 и мутанта N382A+L384V+CysTM A/S. Australia/1/16 Н3. На фиг. 7Е показаны титры гемагглютинации мутанта CysTM A/Hong Kong/4801/14 Н3 и мутанта N382A+L384V+CysTM A/Hong Kong/4801/14 Н3; мутанта CysTM A/Minnesota/40/15 Н3 и мутанта N382A+L384V+CysTM A/Minnesota/40/15 Н3; мутанта CysTM A/S. Australia/1/16 Н3 и мутанта N382A+L384V+CysTM A/S. Australia/1/16 Н3; мутанта CysTM A/Bangkok/3007/15 Н3 и мутанта N382A+L384V+CysTM A/Bangkok/3007/15 Н3; мутанта CysTM A/Switzerland/9715293/13 Н3 и мутанта L384V+CysTM A/Switzerland/9715293/13 Н3; мутанта CysTM A/Mississippi/16/16 Н3 и мутанта N382A+L384V+CysTM A/Mississippi/16/16 Н3.[0064] In FIG. 7A shows the hemagglutination titers of wild type A/Switzerland/9715293/13 H3, mutant N382A A/Switzerland/9715293/13 H3, mutant L384V A/Switzerland/9715293/13 H3, mutant F392D A/Switzerland/9715293/13 H3, mutant L431M A/Switzerland/9715293/13 H3, A/Switzerland/9715293/13 H3 with CysTM modification, mutant N382A+CysTM A/Switzerland/9715293/13 H3, mutant L384V+CysTM A/Switzerland/9715293/13 H3, mutant F392 D+ CysTM A/Switzerland/9715293/13 H3 and mutant L431M+CysTM A/Switzerland/9715293/13 H3. In fig. 7 B shows the VLP yields after a density gradient of the mutant CysTM A/Switzerland/9715293/13 H3, mutant N382A+CysTM A/Switzerland/9715293/13 H3, mutant L384V+CysTM A/Switzerland/9715293/13 H3, mutant F392D+CysTM A /Switzerland/9715293/13 H3 and the L431M+CysTM A/Switzerland/9715293/13 H3 mutant, expressed as a percentage relative to the CysTM A/Switzerland/9715293/13 H3 mutant. In fig. 7C shows the hemagglutination titers of the wild type A/Pennsylvania/09/2015 H3, the CysTM A/Pennsylvania/09/2015 H3 mutant, the N382A+CysTM A/Pennsylvania/09/2015 H3 mutant and the L384V+CysTM A/Pennsylvania/09/2015 mutant H3. In fig. 7D shows the hemagglutination titers of the CysTM A/S mutant. Australia/1/16 H3 and mutant N382A+L384V+CysTM A/S. Australia/1/16 H3. In fig. 7E shows the hemagglutination titers of the CysTM A/Hong Kong/4801/14 H3 mutant and the N382A+L384V+CysTM A/Hong Kong/4801/14 H3 mutant; mutant CysTM A/Minnesota/40/15 H3 and mutant N382A+L384V+CysTM A/Minnesota/40/15 H3; CysTM A/S mutant. Australia/1/16 H3 and mutant N382A+L384V+CysTM A/S. Australia/1/16 H3; mutant CysTM A/Bangkok/3007/15 H3 and mutant N382A+L384V+CysTM A/Bangkok/3007/15 H3; mutant CysTM A/Switzerland/9715293/13 H3 and mutant L384V+CysTM A/Switzerland/9715293/13 H3; mutant CysTM A/Mississippi/16/16 H3 and mutant N382A+L384V+CysTM A/Mississippi/16/16 H3.

[0065] На фиг. 8А показано схематическое представление вектора 3340 (Н3 А-НК-4801-14). На фиг. 8 В показано схематическое представление вектора 3341 (Н3 А-НК-4801-14). На фиг. 8С показано схематическое представление вектора 3375 (Н3 А-НК-4801-14 (N382A+L384V)). На фиг. 8D показано схематическое представление вектора 3914 (Н3 А-Minn-40-15). На фиг. 8Е показано схематическое представление вектора 3915 (Н3 A-Minn-40-15 (N382A+L384V)). На фиг. 8F показано схематическое представление вектора 3924 (Н3 A-SAus-1-16). На фиг. 8G показано схематическое представление вектора 3925 (Н3 А-SAus-1-16 (N382A+L384V)). На фиг. 8Н показано схематическое представление вектора 3904 (Н3 A-Bang-3007-15). На фиг. 8I показано схематическое представление вектора 3905 (Н3 A-Bang-3007-15 (N382A+L384V)). На фиг. 8J показано схематическое представление вектора 2801 (Н3 A-Swi-9715293-13). На фиг. 8K показано схематическое представление вектора 2811 (Н3 A-Swi-9715293-13). На фиг. 8L показано схематическое представление вектора 3063 (Н3 A-Swi-9715293-13 (N382A)). На фиг. 8М показано схематическое представление вектора 3074 (Н3 A-Swi-9715293-13 (L384V)). На фиг. 8N показано схематическое представление вектора 3085 (Н3 A-Swi-9715293-13 (F392D)). На фиг. 8O показано схематическое представление вектора 3062 (Н3 A-Swi-9715293-13 (L431M)). На фиг. 8Р показано схематическое представление вектора 3312 (Н3 А-Penn-09-15). На фиг. 8Q показано схематическое представление вектора 3313 (Н3 А-Penn-09-15). На фиг. 8R показано схематическое представление вектора 3314 (Н3 A-Penn-09-15 (N382A)). На фиг. 8S показано схематическое представление вектора 3315 (Н3 A-Penn-09-15 (L384V)).[0065] In FIG. 8A shows a schematic representation of vector 3340 (H3 A-NK-4801-14). In fig. 8 B shows a schematic representation of vector 3341 (H3 A-NK-4801-14). In fig. 8C shows a schematic representation of vector 3375 (H3 A-NK-4801-14 (N382A+L384V)). In fig. 8D shows a schematic representation of vector 3914 (H3 A-Minn-40-15). In fig. 8E shows a schematic representation of vector 3915 (H3 A-Minn-40-15 (N382A+L384V)). In fig. 8F shows a schematic representation of vector 3924 (H3 A-SAus-1-16). In fig. 8G shows a schematic representation of vector 3925 (H3 A-SAus-1-16 (N382A+L384V)). In fig. 8H shows a schematic representation of vector 3904 (H3 A-Bang-3007-15). In fig. 8I shows a schematic representation of vector 3905 (H3 A-Bang-3007-15 (N382A+L384V)). In fig. 8J shows a schematic representation of vector 2801 (H3 A-Swi-9715293-13). In fig. 8K shows a schematic representation of vector 2811 (H3 A-Swi-9715293-13). In fig. 8L shows a schematic representation of vector 3063 (H3 A-Swi-9715293-13 (N382A)). In fig. 8M shows a schematic representation of vector 3074 (H3 A-Swi-9715293-13 (L384V)). In fig. 8N shows a schematic representation of vector 3085 (H3 A-Swi-9715293-13 (F392D)). In fig. 8O shows a schematic representation of vector 3062 (H3 A-Swi-9715293-13 (L431M)). In fig. 8P shows a schematic representation of vector 3312 (H3 A-Penn-09-15). In fig. 8Q shows a schematic representation of vector 3313 (H3 A-Penn-09-15). In fig. 8R shows a schematic representation of vector 3314 (H3 A-Penn-09-15 (N382A)). In fig. 8S shows a schematic representation of vector 3315 (H3 A-Penn-09-15 (L384V)).

[0066] На фиг. 9А показано схематическое представление вектора 2295 (Н5 A-Indo-5-05). На фиг. 9В показано схематическое представление вектора 3680 (Н5 A-Indo-5-05 (F393D)). На фиг. 9С показано схематическое представление вектора 3645 (Н5 A-Egypt-N04915-14). На фиг. 9D показано схематическое представление вектора 3690 (Н5 A-Egypt-N04915-14 (F392D)).[0066] In FIG. 9A shows a schematic representation of vector 2295 (H5 A-Indo-5-05). In fig. 9B shows a schematic representation of vector 3680 (H5 A-Indo-5-05 (F393D)). In fig. 9C shows a schematic representation of vector 3645 (H5 A-Egypt-N04915-14). In fig. 9D shows a schematic representation of vector 3690 (H5 A-Egypt-N04915-14 (F392D)).

Подробное описание настоящего изобретенияDetailed Description of the Present Invention

[0067] Следующее описание относится к предпочтительному варианту осуществления.[0067] The following description relates to the preferred embodiment.

[0068] Используемые в настоящем документе термины «содержащий», «имеющий», «включающий в себя», «состоящий» и их грамматические вариации являются включающими или открытыми и не исключают дополнительные, непроцитированные элементы и/или стадии способа. Термин «состоящий по существу из», когда он используется в настоящем документе в связи с продуктом, применением или способом, означает, что могут присутствовать дополнительные элементы и/или стадии способа, но эти добавления не оказывают существенного влияния на способ, посредством которого функционирует изложенный способ или применения. Термин «состоящий из», когда он используется в настоящем документе в связи с продуктом, применением или способом, исключает присутствие дополнительных элементов и/или стадий способа. Продукт, применение или способ, описанные в настоящем документе как содержащие определенные элементы и/или стадии, могут также, согласно определенным вариантам осуществления, состоять по существу из этих элементов и/или стадий, а согласно другим вариантам осуществления состоять из этих элементов и/или стадий, независимо от того, упомянуты ли конкретные варианты осуществления. Кроме того, использование единственного числа включает в себя множественное число, а «или» означает «и/или», если не указано иное. Если в настоящем документе не указано иное, все технические и научные термины, используемые в настоящем документе, характеризуются тем же значением, которое обычно понимается специалистом в настоящей области техники. Используемый в настоящем документе термин «приблизительно» относится к отклонению приблизительно на +/- 10% от заданного значения. Следует понимать, что такое изменение всегда включается в любое данное значение, предоставленное в настоящем документе, независимо от того, упоминается ли оно конкретно или нет. Использование единственного числа при использовании в настоящем документе вместе с термином «содержащий» может означать «один», но это также согласуется со значением «один или более», «по меньшей мере один» и «один или более чем один».[0068] As used herein, the terms “comprising,” “having,” “including,” “consisting,” and grammatical variations thereof are inclusive or open-ended and do not exclude additional, uncited elements and/or method steps. The term "consisting essentially of", when used herein in connection with a product, application or method, means that additional elements and/or steps of the method may be present, but these additions do not significantly affect the manner in which the set forth operates method or application. The term “consisting of,” when used herein in connection with a product, application, or method, excludes the presence of additional elements and/or process steps. A product, use, or method described herein as containing certain elements and/or steps may also, in certain embodiments, consist essentially of those elements and/or steps, and in other embodiments, consist of those elements and/or steps steps, whether or not specific embodiments are mentioned. In addition, the use of the singular includes the plural, and “or” means “and/or” unless otherwise noted. Unless otherwise defined herein, all technical and scientific terms used herein have the same meaning as commonly understood by one skilled in the art. As used herein, the term “approximately” refers to a deviation of approximately +/- 10% from the specified value. It should be understood that such modification is always included in any given value provided herein, whether specifically mentioned or not. The singular when used herein in conjunction with the term “comprising” may mean “one,” but is also consistent with the meaning of “one or more,” “at least one,” and “one or more than one.”

[0069] Термин «растение», «часть растения», «растительная часть», «растительное вещество», «растительная биомасса», «растительный материал», растительный экстракт» или «листья растения», как они используются в настоящем документе, может включать в себя все растение, ткань, клетки или любую их фракцию, внутриклеточные компоненты растений, внеклеточные компоненты растений, жидкие или твердые экстракты растений или их комбинацию, которые способны обеспечивать транскрипционный, трансляционный и посттрансляционный аппарат для экспрессии одной или более нуклеиновых кислот, описанных в настоящем документе, и/или из которых можно экстрагировать и очищать экспрессируемый белок или VLP. Растения могут включать в себя, без ограничения, травянистые растения. Кроме того, растения могут включать в себя, без ограничения, сельскохозяйственные культуры, включая в себя, например, канолу, виды Brassica, кукурузу, виды Nicotiana, (табак), например, Nicotiana benthamiana, Nicotiana rustica, Nicotiana, tabacum, Nicotiana alata, Arabidopsis thaliana, люцерну, картофель, сладкий картофель (Ipomoea batatus), женьшень, горох, овес, рис, сою, пшеницу, ячмень, подсолнечник, хлопок, кукурузу, рожь (Secale cereale), сорго {Sorghum bicolor, Sorghum vulgare), сафлор (Carthamus tinctorius).[0069] The term "plant", "plant part", "plant part", "plant matter", "plant biomass", "plant material", plant extract" or "plant leaves" as used herein may include the entire plant, tissue, cells or any fraction thereof, intracellular plant components, extracellular plant components, liquid or solid plant extracts, or a combination thereof, which are capable of providing the transcriptional, translational and post-translational machinery for the expression of one or more of the nucleic acids described in herein, and/or from which the expressed protein or VLP can be extracted and purified. Plants may include, but are not limited to, herbaceous plants. In addition, plants may include, but are not limited to, crops including, for example, canola, Brassica spp., corn, Nicotiana spp., (tobacco), e.g., Nicotiana benthamiana, Nicotiana rustica, Nicotiana, tabacum, Nicotiana alata, Arabidopsis thaliana, alfalfa, potato, sweet potato (Ipomoea batatus), ginseng, peas, oats, rice, soybeans, wheat, barley, sunflower, cotton, corn, rye (Secale cereale), sorghum {Sorghum bicolor, Sorghum vulgare), safflower (Carthamus tinctorius).

[0070] Используемый в настоящем документе термин «часть растения» относится к любой части растения, включая в себя, без ограничения, листья, стебель, корень, цветы, плоды, растительную клетку, полученную из листьев, стебля, корня, цветов, плодов, растительный экстракт, полученный из листьев, стебля, корня, цветов, плодов, или их комбинации. Используемый в настоящем документе термин «растительный экстракт» относится к продукту растительного происхождения, который получают после обработки растения, части растения, растительной клетки или их комбинации физически (например, замораживанием с последующей экстракцией в подходящем буфере), механически (например, путем измельчения или гомогенизации растения или части растения с последующей экстракцией в подходящем буфере), ферментативно (например, с использованием ферментов, разрушающих клеточную стенку), химически (например, с использованием одного или более хелаторов или буферов) или их комбинации. Растительный экстракт можно дополнительно обработать для удаления нежелательных растительных компонентов, например, остатков клеточной стенки. Растительный экстракт может быть получен для помощи в извлечении одного или более компонентов из растения, части растения или растительной клетки, например, белка (включая в себя белковые комплексы, белковые поверхностные структуры и/или VLP), нуклеиновой кислоты, липида, углевода или их комбинации из растения, части растения или растительной клетки. Если растительный экстракт содержит белки, он может называться белковым экстрактом. Белковый экстракт может представлять собой неочищенный растительный экстракт, частично очищенный растительный или белковый экстракт или очищенный продукт, который содержит один или более белков, белковых комплексов, белковых супраструктур и/или VLP из растительной ткани. При желании белковый экстракт или растительный экстракт можно частично очистить с использованием технологий, известных специалистам в настоящей области техники, например, экстракт можно подвергнуть осаждению солью или рН, центрифугированию, центрифугированию в градиенте плотности, фильтрации, хроматографии, например, эксклюзионной хроматографии, ионообменной хроматографии, аффинной хроматографии или их комбинации. Белковый экстракт также можно очистить с использованием технологий, известных специалисту в настоящей области техники.[0070] As used herein, the term “plant part” refers to any part of a plant, including, but not limited to, leaves, stem, root, flowers, fruit, plant cell derived from leaves, stem, root, flowers, fruit, a plant extract obtained from leaves, stem, root, flowers, fruits, or a combination thereof. As used herein, the term “plant extract” refers to a plant product that is obtained by processing a plant, a plant part, a plant cell, or a combination thereof, physically (e.g., by freezing followed by extraction in a suitable buffer), mechanically (e.g., by grinding or homogenizing plant or plant part followed by extraction in a suitable buffer), enzymatically (eg using cell wall degrading enzymes), chemically (eg using one or more chelators or buffers) or combinations thereof. The plant extract can be further processed to remove unwanted plant components, such as cell wall debris. A plant extract may be prepared to aid in the extraction of one or more components from a plant, plant part, or plant cell, for example, a protein (including protein complexes, protein surface structures, and/or VLPs), a nucleic acid, a lipid, a carbohydrate, or a combination thereof. from a plant, part of a plant or plant cell. If a plant extract contains proteins, it may be called a protein extract. The protein extract may be a crude plant extract, a partially purified plant or protein extract, or a purified product that contains one or more proteins, protein complexes, protein superstructures, and/or VLPs from plant tissue. If desired, the protein extract or plant extract can be partially purified using techniques known to those skilled in the art, for example, the extract can be subjected to salt or pH precipitation, centrifugation, density gradient centrifugation, filtration, chromatography, e.g. size exclusion chromatography, ion exchange chromatography, affinity chromatography or a combination thereof. The protein extract can also be purified using techniques known to one of ordinary skill in the art.

[0071] Используемый в настоящем документе термин «конструкция», «вектор» или «вектор экспрессии» относится к рекомбинантной нуклеиновой кислоте для переноса последовательностей экзогенных нуклеиновых кислот в клетки-хозяева (например, клетки растений) и направления экспрессии последовательности экзогенной нуклеиновой кислоты в клетках-хозяевах. «Кассета экспрессии» относится к нуклеотидной последовательности, содержащей представляющую интерес нуклеиновую кислоту, находящуюся под контролем и функционально (или оперативно) связанную с подходящим промотором или другими регуляторными элементами для транскрипции представляющей интерес нуклеиновой кислоты в клетке-хозяине. Как будет понятно специалисту в настоящей области техники, кассета экспрессии может содержать последовательность терминации (терминатор), которая представляет собой любую последовательность, которая активна для растения-хозяина. Например, последовательность терминации может происходить из сегмента генома РНК-2 двудольного РНК вируса, например, комовируса, последовательность терминации может представлять собой терминатор NOS, или последовательность терминатора может быть получена из 3'UTR гена пластоцианина люцерны.[0071] As used herein, the term “construct,” “vector,” or “expression vector” refers to a recombinant nucleic acid for transferring exogenous nucleic acid sequences into host cells (e.g., plant cells) and directing expression of the exogenous nucleic acid sequence in the cells -the owners. "Expression cassette" refers to a nucleotide sequence containing a nucleic acid of interest under the control of and operably (or operably) linked to a suitable promoter or other regulatory elements for transcription of the nucleic acid of interest in a host cell. As will be appreciated by one skilled in the art, an expression cassette may contain a termination sequence (terminator), which is any sequence that is active in the host plant. For example, the termination sequence may be derived from the RNA-2 genome segment of a dicotyledonous RNA virus, such as a comovirus, the termination sequence may be a NOS terminator, or the terminator sequence may be derived from the 3'UTR of the alfalfa plastocyanin gene.

[0072] Конструкции по настоящему раскрытию могут дополнительно содержать 3'-нетранслируемую область (UTR). 3'-нетранслируемая область содержит сигнал полиаденилирования и любые другие регуляторные сигналы, способные влиять на процессинг мРНК или экспрессию гена. Сигнал полиаденилирования, как правило, характеризуется добавлением треков полиадениловой кислоты к 3'-концу предшественника мРНК. Сигналы полиаденилирования, как правило, распознаются по наличию гомологии с канонической формой 5' ААТААА-3', хотя вариации не являются редкостью. Неограничивающими примерами подходящих 3'-областей являются 3' транскрибируемые нетранслируемые области, содержащие сигнал полиаденилирования индуцирующих опухоль плазмидных генов (Ti) Agrobacterium, таких как нопалинсинтаза (ген Nos), и генов растений, таких как гены запасного белка сои, ген рибулозо-1,5-бисфосфаткарбоксилазы малой субъединицы (ssRUBISCO; US 4962028; который включен в настоящий документ посредством ссылки), промотора, используемого для регуляции экспрессии пластоцианина.[0072] The constructs of the present disclosure may further comprise a 3' untranslated region (UTR). The 3' untranslated region contains the polyadenylation signal and any other regulatory signals that can affect mRNA processing or gene expression. The polyadenylation signal is typically characterized by the addition of polyadenylic acid tracks to the 3' end of the precursor mRNA. Polyadenylation signals are generally recognized by the presence of homology to the canonical 5' AATAAAA-3' form, although variations are not uncommon. Non-limiting examples of suitable 3' regions include 3' transcribed untranslated regions containing the polyadenylation signal of Agrobacterium tumor-inducing (Ti) plasmid genes, such as nopaline synthase (Nos gene), and plant genes, such as soybean storage protein genes, ribulose-1 gene, Small subunit 5-bisphosphate carboxylase (ssRUBISCO; US 4,962,028; which is incorporated herein by reference), a promoter used to regulate plastocyanin expression.

[0073] Под «регуляторной областью», «регуляторным элементом» или «промотором» подразумевается часть нуклеиновой кислоты, как правило, но не всегда, перед кодирующей белок областью гена, которая может состоять из ДНК или РНК, или как ДНК, так и РНК. Когда регуляторная область активна и функционально связана или оперативно связана с представляющей интерес нуклеотидной последовательностью, это может привести к экспрессии представляющей интерес нуклеотидной последовательности. Регуляторный элемент может быть способен опосредовать специфичность органа или контролировать активацию генов в процессе развития или во времени. «Регуляторная область» включает в себя элементы промотора, основные элементы промотора, проявляющие базальную промоторную активность, элементы, которые индуцируются в ответ на внешний стимул, элементы, которые опосредуют активность промотора, такие как негативные регуляторные элементы или усилители транскрипции. Используемая в настоящем документе «регуляторная область» также включает в себя элементы, которые активны после транскрипции, например, регуляторные элементы, которые модулируют экспрессию генов, такие как энхансеры трансляции и транскрипции, репрессоры трансляции и транскрипции, активирующие последовательности выше против хода транскрипции и детерминанты нестабильности мРНК. Некоторые из этих последних элементов могут быть расположены вблизи кодирующей области.[0073] By “regulatory region,” “regulatory element,” or “promoter” is meant a portion of a nucleic acid, typically, but not always, upstream of the protein-coding region of a gene, which may consist of DNA or RNA, or both DNA and RNA . When the regulatory region is active and operably linked or operably linked to a nucleotide sequence of interest, it may result in expression of the nucleotide sequence of interest. A regulatory element may be able to mediate organ specificity or control gene activation during development or over time. "Regulatory region" includes promoter elements, core promoter elements that exhibit basal promoter activity, elements that are induced in response to an external stimulus, elements that mediate promoter activity, such as negative regulatory elements or transcriptional enhancers. As used herein, a “regulatory region” also includes elements that are active downstream of transcription, for example, regulatory elements that modulate gene expression, such as translational and transcriptional enhancers, translational and transcriptional repressors, upstream activating sequences, and instability determinants mRNA. Some of these latter elements may be located near the coding region.

[0074] В контексте настоящего раскрытия термин «регуляторный элемент» или «регуляторная область», как правило, относится к последовательности ДНК, как правило, но не всегда, выше против хода транскрипции (5') от кодирующей последовательности структурного гена, который контролирует экспрессию кодирующей области, обеспечивая распознавание для РНК-полимеразы и/или других факторов, необходимых для начала транскрипции в конкретном сайте. Однако следует понимать, что другие нуклеотидные последовательности, расположенные внутри интронов, или 3' последовательности также могут вносить вклад в регуляцию экспрессии представляющей интерес кодирующей области. Примером регуляторного элемента, который обеспечивает распознавание для РНК-полимеразы или других факторов транскрипции для обеспечения инициации в конкретном сайте, является элемент промотора. Большинство, но не все эукариотические промоторные элементы содержат ТАТА-бокс, консервативную последовательность нуклеиновой кислоты, состоящую из аденозиновых и тимидиновых пар нуклеотидных оснований, как правило, расположенных приблизительно на 25 пар оснований выше против хода транскрипции от сайта начала транскрипции. Промоторный элемент может содержать базальный промоторный элемент, ответственный за инициацию транскрипции, а также другие регуляторные элементы, которые изменяют экспрессию гена.[0074] As used herein, the term "regulatory element" or "regulatory region" generally refers to a DNA sequence, typically, but not always, upstream (5') of the coding sequence of a structural gene that controls expression coding region, providing recognition for RNA polymerase and/or other factors necessary to initiate transcription at a particular site. However, it should be understood that other nucleotide sequences located within the introns or 3' sequences may also contribute to the regulation of expression of the coding region of interest. An example of a regulatory element that provides recognition for RNA polymerase or other transcription factors to ensure initiation at a specific site is a promoter element. Most, but not all, eukaryotic promoter elements contain a TATA box, a conserved nucleic acid sequence consisting of adenosine and thymidine nucleotide base pairs typically located approximately 25 base pairs upstream of the transcription start site. The promoter element may contain a basal promoter element responsible for initiating transcription, as well as other regulatory elements that alter gene expression.

[0075] Существует несколько типов регуляторных областей, включая в себя те, которые регулируются в процессе развития, индуцибельные или конститутивные. Регуляторная область, которая регулируется в процессе развития или контролирует дифференциальную экспрессию гена, находящегося под его контролем, активируется в определенных органах или тканях органа в определенные моменты времени во время развития этого органа или ткани. Однако некоторые регуляторные области, которые регулируются в процессе развития, могут предпочтительно быть активными в определенных органах или тканях на определенных стадиях развития, они также могут быть активными в рамках регулируемого в процессе развития способа или на базальном уровне в других органах или тканях растения. Примеры тканеспецифических регуляторных областей, например специфических регуляторных областей, включают в себя промотор напина и промотор круциферина (Rask et al., 1998, J. Plant Physiol. 152: 595-599; Bilodeau et al., 1994, Plant Cell 14: 125-130). Пример специфического для листа промотора включает в себя промотор пластоцианина (смотрите патент США 7125978, который включен в настоящий документ посредством ссылки).[0075] There are several types of regulatory regions, including those that are developmentally regulated, inducible, or constitutive. A regulatory region that is developmentally regulated or controls differential expression of a gene under its control is activated in specific organs or tissues of an organ at specific times during the development of that organ or tissue. However, certain regulatory regions that are developmentally regulated may preferentially be active in certain organs or tissues at certain stages of development, and they may also be active in a developmentally regulated manner or at a basal level in other organs or tissues of the plant. Examples of tissue-specific regulatory regions, such as specific regulatory regions, include the napin promoter and the cruciferin promoter (Rask et al., 1998, J. Plant Physiol. 152: 595-599; Bilodeau et al., 1994, Plant Cell 14: 125-599). 130). An example of a leaf-specific promoter includes the plastocyanin promoter (see US Pat. No. 7,125,978, which is incorporated herein by reference).

[0076] Индуцибельная регуляторная область представляет собой область, которая способна прямо или косвенно активировать транскрипцию одной или более последовательностей ДНК или генов в ответ на индуктор. В отсутствие индуктора последовательности ДНК или гены не будут транскрибироваться. Как правило, белковый фактор, который специфически связывается с индуцибельной регуляторной областью для активации транскрипции, может присутствовать в неактивной форме, которая затем прямо или косвенно превращается в активную форму посредством индуктора. Однако белковый фактор также может отсутствовать. Индуктор может представлять собой химическое средство, такое как белок, метаболит, регулятор роста, гербицид или фенольное соединение, или физиологический стресс, вызываемый непосредственно теплом, холодом, солью или токсическими элементами, или опосредованно через действие патогена или агента заболевания, такого как вирус. Растительная клетка, содержащая индуцибельную регуляторную область, может подвергаться действию индуктора путем внешнего воздействия индуктора на клетку или растение, например, путем опрыскивания, полива, нагревания или аналогичных способов. Индуцибельные регуляторные элементы могут происходить как из растительных, так и не растительных генов (например, Gatz, С. and Lenk, I.R.P., 1998, Trends Plant Sci. 3, 352-358). Примеры потенциальных индуцибельных промоторов включают в себя, без ограничения, индуцируемый тетрациклином промотор (Gatz, С, 1997, Ann. Rev. Plant Physiol. Plant Mol. Biol. 48, 89-108), индуцируемый стероидом промотор (Aoyama, Т. and Chua, N.H.,1997, Plant J. 2, 397-404) и индуцируемый этанолом промотор (Salter, M.G., et al., 1998, Plant Journal 16, 127-132; Caddick, M.X., et al.,1998, Nature Biotech. 16, 177-180), индуцируемые цитокинином гены IB6 и СКП (Brandstatter, I. and Kieber, J.J., 1998, Plant Cell 10, 1009-1019; Kakimoto, Т., 1996, Science 274, 982-985) и индуцируемый ауксином элемент DR5 (Ulmasov, Т., et al., 1997, Plant Cell 9, 1963-1971).[0076] An inducible regulatory region is a region that is capable of directly or indirectly activating the transcription of one or more DNA sequences or genes in response to an inducer. In the absence of an inducer, DNA sequences or genes will not be transcribed. Typically, a protein factor that specifically binds to an inducible regulatory region to activate transcription may be present in an inactive form, which is then directly or indirectly converted to an active form by an inducer. However, the protein factor may also be absent. The inducer may be a chemical such as a protein, metabolite, growth regulator, herbicide or phenolic compound, or a physiological stress caused directly by heat, cold, salt or toxic elements, or indirectly through the action of a pathogen or disease agent such as a virus. A plant cell containing an inducible regulatory region can be exposed to the inducer by exposing the inducer to the cell or plant, for example, by spraying, watering, heating, or similar methods. Inducible regulatory elements can be derived from both plant and non-plant genes (eg, Gatz, C. and Lenk, I.R.P., 1998, Trends Plant Sci. 3, 352-358). Examples of potential inducible promoters include, but are not limited to, tetracycline inducible promoter (Gatz, C, 1997, Ann. Rev. Plant Physiol. Plant Mol. Biol. 48, 89-108), steroid inducible promoter (Aoyama, T. and Chua , N.H., 1997, Plant J. 2, 397-404) and an ethanol-inducible promoter (Salter, M.G., et al., 1998, Plant Journal 16, 127-132; Caddick, M.X., et al., 1998, Nature Biotech. 16, 177-180), cytokinin-inducible IB6 and SKP genes (Brandstatter, I. and Kieber, J.J., 1998, Plant Cell 10, 1009-1019; Kakimoto, T., 1996, Science 274, 982-985) and auxin-inducible element DR5 (Ulmasov, T., et al., 1997, Plant Cell 9, 1963-1971).

[0077] Конститутивная регуляторная область направляет экспрессию гена в различных частях растения и непрерывно на протяжении всего развития растения. Примеры известных конститутивных регуляторных элементов включают в себя промоторы, связанные с транскриптом 35S CaMV (p35S; Odell et al., 1985, Nature, 313: 810-812; который включен в настоящий документ посредством ссылки), актин 1 риса (Zhang et al., 1991, Plant Cell, 3: 1155-1165), актин 2 (An et al., 1996, Plant J., 10: 107-121) или tms 2 (US 5428147), и гены триозофосфат-изомеразы 1 (Xu et al., 1994, Plant Physiol. 106: 459-467), ген убиквитина 1 кукурузы (Comejo et al, 1993, Plant Mol. Biol. 29: 637-646), гены убиквитина 1 и 6 Arabidopsis (Holtorf et al., 1995, Plant Mol. Biol. 29: 637-646), ген фактора инициации трансляции табака 4А (Mandel et al., 1995 Plant Mol. Biol. 29: 995-1004), промотор вируса мозаики прожилок виноградного листа, pCAS (Verdaguer et al., 1996); промотор малой субъединицы рибулозобифосфаткарбоксилазы, pRbcS: (Outchkourov et al., 2003), pUbi (для однодольных и двудольных).[0077] A constitutive regulatory region directs gene expression in different parts of the plant and continuously throughout plant development. Examples of known constitutive regulatory elements include the promoters associated with the CaMV 35S transcript (p35S; Odell et al., 1985, Nature, 313: 810-812; which is incorporated herein by reference), rice actin 1 (Zhang et al. , 1991, Plant Cell, 3: 1155-1165), actin 2 (An et al., 1996, Plant J., 10: 107-121) or tms 2 (US 5428147), and triose phosphate isomerase 1 genes (Xu et al., 1994, Plant Physiol. 106: 459-467), maize ubiquitin 1 gene (Comejo et al., 1993, Plant Mol. Biol. 29: 637-646), Arabidopsis ubiquitin 1 and 6 genes (Holtorf et al., 1995, Plant Mol. Biol. 29: 637-646), tobacco translation initiation factor 4A gene (Mandel et al., 1995 Plant Mol. Biol. 29: 995-1004), grape leaf vein mosaic virus promoter, pCAS (Verdaguer et al., 1996); promoter of the small subunit of ribulose biphosphate carboxylase, pRbcS: (Outchkourov et al., 2003), pUbi (for monocots and dicots).

[0078] Используемый в настоящем документе термин «конститутивный» не обязательно означает, что нуклеотидная последовательность, находящаяся под контролем конститутивной регуляторной области, экспрессируется на одном уровне во всех типах клеток, но что последовательность экспрессируется в широком диапазоне типов клеток, хотя часто наблюдается колебание численности.[0078] As used herein, the term “constitutive” does not necessarily mean that the nucleotide sequence under the control of the constitutive regulatory region is expressed at the same level in all cell types, but that the sequence is expressed in a wide range of cell types, although fluctuations in abundance are often observed .

[0079] Конструкции экспрессии, как описано выше, могут присутствовать в векторе. Вектор может содержать граничные последовательности, которые позволяют переносить и интегрировать кассету экспрессии в геном организма или хозяина. Конструкция может представлять собой растительный бинарный вектор, например, бинарный вектор трансформации на основе pPZP (Hajdukiewicz, et al., 1994). Другие иллюстративные конструкции включают в себя pBin19 (смотрите Frisch, D. A., L. W. Harris-Haller, et al., 1995, Plant Molecular Biology 27: 405-409).[0079] Expression constructs as described above may be present in the vector. The vector may contain border sequences that allow the expression cassette to be transferred and integrated into the genome of the organism or host. The construct may be a plant binary vector, for example, a pPZP-based binary transformation vector (Hajdukiewicz, et al., 1994). Other exemplary constructs include pBin19 (see Frisch, D. A., L. W. Harris-Haller, et al., 1995, Plant Molecular Biology 27: 405-409).

[0080] Используемый в настоящем документе термин «нативный», «нативный белок» или «нативный домен» относится к белку или домену, имеющему первичную аминокислотную последовательность, идентичную дикому типу. Нативные белки или домены могут кодироваться нуклеотидными последовательностями, характеризующимися 100% сходством последовательности с последовательностью дикого типа. Нативная аминокислотная последовательность также может кодироваться нуклеотидной последовательностью, оптимизированной для кодонов человека (hCod), или нуклеотидной последовательностью, содержащей повышенное содержание GC по сравнению с нуклеотидной последовательностью дикого типа при условии, что аминокислотная последовательность, кодируемая нуклеотидной последовательностью hCod, проявляет 100% идентичность последовательности по отношению к природной аминокислотной последовательности.[0080] As used herein, the term “native,” “native protein,” or “native domain” refers to a protein or domain having a primary amino acid sequence identical to the wild type. Native proteins or domains can be encoded by nucleotide sequences that have 100% sequence similarity to the wild type sequence. A native amino acid sequence may also be encoded by a human codon optimized (hCod) nucleotide sequence or a nucleotide sequence containing increased GC content compared to the wild type nucleotide sequence, provided that the amino acid sequence encoded by the hCod nucleotide sequence exhibits 100% sequence identity to relative to the natural amino acid sequence.

[0081] Под нуклеотидной последовательностью, которая является «оптимизированной кодонами человека» или нуклеотидной последовательностью «hCod», подразумевается выбор подходящих нуклеотидов ДНК для синтеза олигонуклеотидной последовательности или ее фрагмента, который приближается к частоте использования кодонов, как правило, встречающемуся в олигонуклеотидной последовательности нуклеотидной последовательности человека. Под «повышенным содержанием GC» подразумевается выбор соответствующих нуклеотидов ДНК для синтеза олигонуклеотидной последовательности или ее фрагмента, чтобы приблизиться к частоте использования кодона, которое по сравнению с соответствующей природной олигонуклеотидной последовательностью характеризуется увеличением содержания GC в отношении, например, от приблизительно 1 до приблизительно 30% или любого числа между ними, длины кодирующей части олигонуклеотидной последовательности. Например, приблизительно от 1, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30% или любого числа между ними по длине участка кодирования олигонуклеотидной последовательности. Как описано ниже, нуклеотидная последовательность с оптимизированным кодоном человека или нуклеотидная последовательность, содержащая увеличенный контакт GC (по сравнению с нуклеотидной последовательностью дикого типа), демонстрирует повышенную экспрессию в растении, части растения или растительной клетке по сравнению с экспрессией отличной от человеческой оптимизированной (или с более низким содержанием GC) нуклеотидной последовательности.[0081] By a nucleotide sequence that is a “human codon optimized” or “hCod” nucleotide sequence is meant the selection of suitable DNA nucleotides for the synthesis of an oligonucleotide sequence or fragment thereof that approximates the frequency of codon usage typically found in the oligonucleotide sequence of the nucleotide sequence person. By “increased GC content” is meant the selection of appropriate DNA nucleotides for the synthesis of an oligonucleotide sequence or fragment thereof to approach a codon usage frequency that, compared to the corresponding natural oligonucleotide sequence, is characterized by an increase in GC content by a ratio of, for example, from about 1 to about 30% or any number between them, the length of the coding part of the oligonucleotide sequence. For example, from about 1, 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30%, or any number therebetween, along the length of the coding region of the oligonucleotide sequence. As described below, a human codon optimized nucleotide sequence or a nucleotide sequence containing an increased GC contact (compared to a wild type nucleotide sequence) exhibits increased expression in a plant, plant part or plant cell compared to non-human optimized (or non-human optimized) expression. lower GC content) nucleotide sequence.

[0082] Модифицированные белки гемагглютинина (НА) гриппа (также называемые модифицированным белком НА, модифицированным белком НА гриппа, модифицированным НА, модифицированным НА гриппа, мутантным НА, мутантным НА гриппа, вариантами НА гриппа или вариантами НА) и способы получения модифицированных белков НА гриппа в растениях описаны в настоящем документе. Описанные в настоящем документе модифицированные белки НА гриппа содержат модификации или мутации, которые, как было обнаружено, приводят к улучшенным характеристикам НА по сравнению с НА дикого типа или модифицированными белками НА. Например, модифицированный белок НА гриппа может содержать аминокислотную последовательность по меньшей мере с одной заменой аминокислоты по сравнению с соответствующей аминокислотной последовательностью дикого типа.[0082] Modified influenza hemagglutinin (HA) proteins (also referred to as modified HA protein, modified influenza HA protein, modified HA, modified influenza HA, mutant HA, mutant influenza HA, influenza HA variants or HA variants) and methods for producing modified influenza HA proteins in plants are described herein. The modified influenza HA proteins described herein contain modifications or mutations that have been found to result in improved HA characteristics compared to wild-type HA or modified HA proteins. For example, the modified influenza HA protein may contain an amino acid sequence with at least one amino acid substitution compared to the corresponding wild-type amino acid sequence.

[0083] Примеры улучшенных характеристик модифицированного белка НА включают в себя повышенный выход белка НА при экспрессии в растительных клетках по сравнению с НА дикого типа или немодифицированным НА того же штамма или подтипа гриппа, который не содержит модификацию(и) или мутацию(и); улучшенный титр гемагглютинации модифицированного белка НА по сравнению с белком НА дикого типа или немодифицированным белком НА; улучшенную целостность, стабильность или как целостность, так и стабильность вирусоподобных частиц (VLP), которые состоят из модифицированных белков НА, по сравнению с целостностью, стабильностью или и тем и другим VLP, содержащими НА дикого типа, которые не содержат модификацию(и) или мутацию(и); повышенный выход VLP при экспрессии в растительных клетках по сравнению с уровнем продукции VLP дикого типа, который не содержит модификацию(и) или мутацию(и); и их комбинация.[0083] Examples of improved characteristics of a modified HA protein include increased yield of HA protein when expressed in plant cells compared to wild-type HA or unmodified HA of the same influenza strain or subtype that does not contain the modification(s) or mutation(s); improved hemagglutination titer of the modified HA protein compared to wild-type HA protein or unmodified HA protein; improved integrity, stability, or both the integrity and stability of virus-like particles (VLPs) that consist of modified HA proteins compared to the integrity, stability, or both of VLPs containing wild-type HA that do not contain the modification(s) or mutation(s); increased yield of VLPs when expressed in plant cells compared to the production level of wild-type VLPs that do not contain the modification(s) or mutation(s); and their combination.

Подтипы и штаммы гриппаInfluenza subtypes and strains

[0084] Используемый в настоящем документе термин «подтип вируса гриппа» относится к вариантам вируса гриппа А, которые характеризуются различными комбинациями вирусных поверхностных белков гемагглютинина (Н или НА) и нейрамидазы (N). В соответствии с настоящим описанием подтипы вируса гриппа и гемагглютинин (НА) из таких подтипов вируса могут упоминаться по их номеру Н, например, «НА подтипа Н3», «НА Н3» или «грипп Н3». Термин «подтип», в частности, включает в себя все индивидуальные «штаммы» внутри каждого подтипа, которые обычно возникают в результате мутаций и могут проявлять различные патогенные профили. Такие штаммы можно также называть различными «изолятами» вирусного подтипа. Соответственно, в контексте настоящего описания термины «штаммы» и «изоляты» могут использоваться взаимозаменяемо.[0084] As used herein, the term “influenza virus subtype” refers to variants of influenza A virus that are characterized by different combinations of the viral surface proteins hemagglutinin (H or HA) and neuramidase (N). As used herein, influenza virus subtypes and hemagglutinin (HA) of such virus subtypes may be referred to by their H number, for example, “H3 subtype HA,” “H3 HA,” or “H3 influenza.” The term "subtype" specifically includes all individual "strains" within each subtype, which typically arise from mutations and may exhibit different pathogenic profiles. Such strains may also be referred to as different "isolates" of a viral subtype. Accordingly, as used herein, the terms “strains” and “isolates” may be used interchangeably.

[0085] Традиционно различные штаммы гриппа классифицируются на основании, например, способности гриппа агглютинировать красные клетки крови (RBC или эритроциты). Антитела, специфические для определенных штаммов гриппа, могут связываться с вирусом и, таким образом, предотвращать такую агглютинацию. Анализы, определяющие типы штаммов на основе такого ингибирования, как правило, известны как анализы ингибирования гемагглютинина (анализы HI или анализы HAI), и они представляют собой стандартные и хорошо известные способы для характеристики штаммов гриппа.[0085] Traditionally, different strains of influenza are classified based on, for example, the ability of influenza to agglutinate red blood cells (RBC or red blood cells). Antibodies specific for certain strains of influenza can bind to the virus and thus prevent such agglutination. Assays that determine strain types based on such inhibition are generally known as hemagglutinin inhibition assays (HI assays or HAI assays), and they are standard and well-known methods for characterizing influenza strains.

[0086] Однако белки НА из разных штаммов вирусов также демонстрируют значительное сходство последовательностей как на уровне нуклеиновой кислоты, так и на уровне аминокислот. Этот уровень сходства варьируется при сравнении штаммов разных подтипов, причем некоторые штаммы явно демонстрируют более высокие уровни сходства, чем другие (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643). Уровни аминокислотного сходства варьируются между вирусными штаммами одного подтипа и вирусными штаммами других подтипов (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643). Этой вариации достаточно для установления дискретных подтипов и эволюционного происхождения различных штаммов, но ДНК и аминокислотные последовательности разных штаммов все еще легко выравниваются с использованием обычных способов биоинформатики (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643; Suzuki andNei, Mol. Biol. Evol. 2002, 19:501).[0086] However, HA proteins from different viral strains also show significant sequence similarity at both the nucleic acid and amino acid levels. This level of similarity varies when strains of different subtypes are compared, with some strains clearly exhibiting higher levels of similarity than others (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643). Levels of amino acid similarity vary between viral strains of one subtype and viral strains of other subtypes (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643). This variation is sufficient to establish discrete subtypes and evolutionary origins of different strains, but the DNA and amino acid sequences of different strains are still easily aligned using conventional bioinformatics techniques (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643; Suzuki and Nei , Mol Biol Evol 2002, 19:501).

[0087] Множественные нуклеотидные последовательности или соответствующие полипептидные последовательности гемагглютинина (НА) могут быть выровнены для определения «консенсуса» или «консенсусной последовательности» подтипа (смотрите фиг. 1).[0087] Multiple nucleotide sequences or corresponding hemagglutinin (HA) polypeptide sequences can be aligned to determine a “consensus” or “consensus sequence” subtype (see FIG. 1).

[0088] Основываясь на сходстве последовательностей, подтипы вируса гриппа могут быть дополнительно классифицированы по их филогенетической группе. Филогенетический анализ (Fouchier et al., J Virol. 2005 Mar; 79(5):2814-22) продемонстрировал подразделение НА, которое представляет собой деление на две основные группы (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643): среди прочего, подтипы H1, H2, H5 и H9 в филогенетической группе 1 и, среди прочего, подтипы Н3, Н4 и Н7 в филогенетической группе 2.[0088] Based on sequence similarity, influenza virus subtypes can be further classified by their phylogenetic group. Phylogenetic analysis (Fouchier et al., J Virol. 2005 Mar; 79(5):2814-22) has demonstrated a subdivision of HA that represents a division into two main groups (Air, Proc. Natl. Acad. Sci. USA, 1981, 78:7643): among others, subtypes H1, H2, H5 and H9 in phylogenetic group 1 and, among others, subtypes H3, H4 and H7 in phylogenetic group 2.

[0089] Новые белки НА гриппа, модификации НА, варианты и мутанты белка НА создаются путем внесения изменений в аминокислотную последовательность белка НА, что приводит к улучшенным характеристикам НА, как описано выше. Выделение нуклеиновых кислот, кодирующих такие молекулы НА, является обычным делом, как и модификация нуклеиновой кислоты для внесения изменений в аминокислотную последовательность, например, посредством сайт-направленного мутагенеза.[0089] New influenza HA proteins, HA modifications, variants and mutants of the HA protein are created by making changes to the amino acid sequence of the HA protein, resulting in improved HA characteristics as described above. Isolation of nucleic acids encoding such HA molecules is common, as is modification of the nucleic acid to introduce changes in the amino acid sequence, for example, through site-directed mutagenesis.

[0090] В настоящем документе описаны модифицированные белки НА гриппа и способы получения модифицированных белков НА гриппа в растениях. Было замечено, что модификация, например, путем замены определенных аминокислот в белках НА, например, НА из подтипа Н3, приводит к улучшенным характеристикам модифицированного белка НА по сравнению с белком НА дикого типа или немодифицированным белком НА.[0090] Described herein are modified influenza HA proteins and methods for producing modified influenza HA proteins in plants. It has been observed that modification, for example by substitution of certain amino acids in HA proteins, such as HA from the H3 subtype, results in improved performance of the modified HA protein compared to wild-type HA protein or unmodified HA protein.

[0091] Одна или более модификаций, мутаций или замен белка НА, как описано в настоящем документе, не расположены в глобулярном головном домене белка НА, не расположены в известных эпитопных областях белка НА, и эти модификации, мутации или замены не добавляют или не удаляют сайты гликозилирования в белке НА.[0091] One or more modifications, mutations or substitutions of the HA protein as described herein are not located in the globular head domain of the HA protein, are not located in known epitope regions of the HA protein, and the modifications, mutations or substitutions do not add or delete glycosylation sites in the HA protein.

[0092] Белок НА, мутантный белок НА или модифицированный белок НА, как описано в настоящем документе, модифицирован и содержит одну или более мутаций, модификаций или замен в своей аминокислотной последовательности в любой одной или более аминокислотах, которые соответствуют одной или более чем одной мутации или модификации по любой одной или более аминокислотам, которые соответствуют положениям 382, 384, 392, 431, 524, 525, 526, 527 или 528 аминокислотной последовательности A/Hong Kong/4801/14 (SEQ ID NO: 92; смотрите фиг. 1).[0092] An HA protein, a mutant HA protein, or a modified HA protein, as described herein, is modified to contain one or more mutations, modifications, or substitutions in its amino acid sequence at any one or more amino acids that correspond to one or more mutations or modifications at any one or more amino acids that correspond to positions 382, 384, 392, 431, 524, 525, 526, 527 or 528 of the amino acid sequence A/Hong Kong/4801/14 (SEQ ID NO: 92; see FIG. 1 ).

[0093] Под «соответствовать аминокислоте» или «соответствующей аминокислоте» подразумевается, что аминокислота соответствует аминокислоте в выравнивании последовательности с эталонным штаммом гриппа, как описано ниже.[0093] By “matching an amino acid” or “corresponding amino acid” is meant that the amino acid corresponds to an amino acid in a sequence alignment with a reference influenza strain, as described below.

[0094] Номер аминокислотного остатка или положение остатка НА соответствует нумерации НА эталонного штамма гриппа. Например, в случае гриппа Н3 эталонным штаммом может быть A/Hong Kong/4801/14 [SEQ ID NO: 92 смотрите фиг. 1]. Соответствующие аминокислотные положения могут быть определены путем выравнивания последовательностей НА (например, Н3 НА) с последовательностью НА их соответствующего эталонного штамма. Способы выравнивания последовательностей для сравнения хорошо известны в настоящей области техники. Оптимальное выравнивание последовательностей для сравнения можно проводить, например, с помощью алгоритма локальной гомологии Smith & Waterman, Adv. Appl. Math. 2:482 (1981), с помощью алгоритма выравнивания гомологии Needleman & Wunsch a, J. Mol. Biol. 48:443 (1970), способом поиска сходства Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988), с помощью компьютеризированных реализаций этих алгоритмов (GAP, BESTFIT, FASTA и TFASTA в пакете программного обеспечения Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI) или путем ручного выравнивания и визуальной проверки (смотрите, например, Current Protocols in Molecular Biology (Ausubel et al., eds. 1995, приложение)). Выравнивание аминокислотных последовательностей нескольких доменов НА вируса гриппа А, которые не следует рассматривать как ограничивающие, показано на фиг. 1.[0094] The amino acid residue number or position of the HA residue corresponds to the HA numbering of the reference influenza strain. For example, in the case of H3 influenza, the reference strain may be A/Hong Kong/4801/14 [SEQ ID NO: 92 see FIG. 1]. The corresponding amino acid positions can be determined by aligning the HA sequences (eg, H3 HA) with the HA sequence of their corresponding reference strain. Methods for aligning sequences for comparison are well known in the art. Optimal alignment of sequences for comparison can be done, for example, using the local homology algorithm of Smith & Waterman, Adv. Appl. Math. 2:482 (1981), using the Needleman & Wunsch homology alignment algorithm, J. Mol. Biol. 48:443 (1970), the similarity search method of Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85:2444 (1988), using computerized implementations of these algorithms (GAP, BESTFIT, FASTA and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Dr., Madison, WI) or by manual alignment and visual checks (see, for example, Current Protocols in Molecular Biology (Ausubel et al., eds. 1995, appendix)). An amino acid sequence alignment of several influenza A virus HA domains, which should not be considered limiting, is shown in FIG. 1.

[0095] При упоминании модификаций, мутантов или вариантов за аминокислотным остатком дикого типа (также называемым просто «аминокислотой») следует номер остатка и новая или замещенная аминокислота. Например, замена аспарагина (N, Asn) на аланин (A, Ala) в остатке или аминокислоте в положении 382 обозначается как N382A (смотрите таблицу 1). 382 (N382A).[0095] When modifications, mutants, or variants are mentioned, the wild-type amino acid residue (also referred to simply as an “amino acid”) is followed by the residue number and the new or substituted amino acid. For example, a change from asparagine (N, Asn) to alanine (A, Ala) at the residue or amino acid position 382 is designated N382A (see Table 1). 382 (N382A).

[0096] Модифицированные НА, мутанты или варианты НА, например, модифицированные Н3 НА, обозначаются таким же образом с использованием однобуквенного аминокислотного кода для остатка дикого типа, за которым следует его положение и однобуквенный аминокислотный код остатка замены. Множественные мутанты обозначены компонентными одиночными мутантами, разделенными косой чертой (/) или плюсом (+). Мутации или модификации трансмембранного (ТМ) домена или области обозначены как (CysTM). Так, например, мутант Н3 НА N382A+L384V (CysTM) представляет собой мутант, в котором аланин (A, Ala) замещает аспарагин (N, Asp) в положении остатка 382, а валин (V, Val) замещает лейцин (L, Leu) в положении остатка 384, а мутант Н3 НА содержит дополнительные мутации в трансмембранном домене.[0096] Modified HA, mutants or variants of HA, for example, modified H3 HA, are designated in the same manner using a single letter amino acid code for the wild type residue, followed by its position and a single letter amino acid code for the substitution residue. Multiple mutants are indicated by component single mutants separated by a slash (/) or plus (+). Mutations or modifications of the transmembrane (TM) domain or region are designated as (CysTM). For example, the H3 HA mutant N382A+L384V (CysTM) is a mutant in which alanine (A, Ala) replaces asparagine (N, Asp) at residue 382, and valine (V, Val) replaces leucine (L, Leu ) at residue position 384, and the H3 HA mutant contains additional mutations in the transmembrane domain.

[0098] Модифицированный белок гемагглютинин (НА) гриппа может содержать аминокислотную последовательность, содержащую по меньшей мере одну аминокислотную замену по сравнению с соответствующей аминокислотной последовательностью дикого типа.[0098] The modified influenza hemagglutinin (HA) protein may comprise an amino acid sequence containing at least one amino acid substitution compared to the corresponding wild-type amino acid sequence.

[0099] Под «аминокислотной заменой» или «заменой» подразумевается замена аминокислоты в аминокислотной последовательности белка другой аминокислотой. Термины «аминокислота», «аминокислотный остаток» или «остаток» используются в настоящем раскрытии как взаимозаменяемые. Одна или более аминокислот могут быть замещены одной или более аминокислотами, которые отличаются от исходной аминокислоты или аминокислоты дикого типа в этом положении, без изменения общей длины аминокислотной последовательности белка. Замена или замещение могут быть экспериментально индуцированы изменением последовательности кодона в нуклеотидной последовательности, кодирующей белок, на последовательность кодона другой аминокислоты по сравнению с исходной аминокислотой или аминокислотой дикого типа. Полученный белок представляет собой модифицированный белок, например, модифицированный белок НА гриппа. Модифицированный белок НА гриппа не встречается в природе.[0099] By "amino acid substitution" or "substitution" is meant the replacement of an amino acid in the amino acid sequence of a protein with another amino acid. The terms "amino acid", "amino acid residue" or "residue" are used interchangeably in the present disclosure. One or more amino acids may be replaced by one or more amino acids that differ from the parent or wild-type amino acid at that position without changing the overall length of the amino acid sequence of the protein. A substitution or substitution can be experimentally induced by changing the codon sequence in a protein-encoding nucleotide sequence to a different amino acid codon sequence from the original or wild-type amino acid. The resulting protein is a modified protein, for example a modified influenza HA protein. The modified influenza HA protein does not occur naturally.

[00100] Модифицированный НА включает в себя не встречающийся в природе белок НА, содержащий по меньшей мере одну модификацию природного НА и обладающий улучшенными характеристиками по сравнению с природным белком НА, от которого происходит аминокислотная последовательность модифицированного НА. Модифицированные белки НА содержат аминокислотную последовательность, не встречающуюся в природе, которая образована замещением одного или более аминокислотных остатков белка НА одной или более различными аминокислотами.[00100] The modified HA includes a non-naturally occurring HA protein containing at least one modification of the natural HA and having improved characteristics compared to the natural HA protein from which the amino acid sequence of the modified HA is derived. Modified HA proteins contain an amino acid sequence not found in nature, which is formed by replacing one or more amino acid residues of the HA protein with one or more different amino acids.

[00101] Соответственно, модифицированный НА, мутантный НА или рекомбинантный НА относится к НА, в котором последовательность ДНК, кодирующая природный НА, модифицирована для получения модифицированной или мутантной последовательности ДНК, которая кодирует модификацию, мутацию или замену одной или более аминокислот в аминокислотной последовательности НА.[00101] Accordingly, modified HA, mutant HA, or recombinant HA refers to HA in which the DNA sequence encoding natural HA is modified to produce a modified or mutant DNA sequence that encodes a modification, mutation, or substitution of one or more amino acids in the amino acid sequence of HA .

[00102] Некоторые из остатков, идентифицированных для модификации, мутации или замены, соответствуют консервативным остаткам, тогда как другие нет. В случае остатков, которые являются неконсервативными, замещение одной или более аминокислот ограничивается заменами, которые производят модифицированный НА, аминокислотная последовательность которого не соответствует обнаруженной в природе. В случае консервативных остатков такая модификация, замена или замещения также не должны приводить к природным последовательностям НА.[00102] Some of the residues identified for modification, mutation or substitution correspond to conserved residues, while others do not. For residues that are non-conserved, substitution of one or more amino acids is limited to substitutions that produce a modified HA whose amino acid sequence does not correspond to that found in nature. In the case of conserved residues, such modification, replacement or substitutions should also not result in natural HA sequences.

Консервативные заменыConservative substitutions

[00103] Как описано в настоящем документе, остатки в белках НА могут быть идентифицированы и модифицированы, заменены или мутированы для получения модифицированного белка НА или вариантов белка НА. Замены или мутации в конкретных положениях не ограничиваются аминокислотными заменами, описанными в настоящем документе или приведенными в примерах. Например, варианты НА могут содержать консервативные замены описанных аминокислотных замен.[00103] As described herein, residues in HA proteins can be identified and modified, replaced or mutated to produce a modified HA protein or variants of the HA protein. Substitutions or mutations at specific positions are not limited to the amino acid substitutions described herein or shown in the examples. For example, HA variants may contain conservative substitutions of the described amino acid substitutions.

[00104] Используемый в настоящем документе термин «консервативная замена» и его грамматические вариации относятся к присутствию аминокислотного остатка в последовательности белка НА, который отличается, но принадлежит к тому же классу аминокислоты в качестве описанной замены или описанного остатка (т.е. неполярный остаток, заменяющий неполярный остаток, ароматический остаток, заменяющий ароматический остаток, полярно-незаряженный остаток, заменяющий полярно-незаряженный остаток, заряженный остаток, заменяющий заряженный остаток). Кроме того, консервативные замены могут охватывать остаток, имеющий значение межфазной гидропатии того же знака и, как правило, такой же величины, что и остаток, заменяющий остаток дикого типа.[00104] As used herein, the term “conservative substitution” and its grammatical variations refer to the presence of an amino acid residue in the HA protein sequence that is different but belongs to the same amino acid class as the described substitution or the described residue (i.e., a nonpolar residue , replacing a non-polar residue, an aromatic residue, replacing an aromatic residue, a polar-uncharged residue, replacing a polar-uncharged residue, a charged residue, replacing a charged residue). In addition, conservative substitutions may involve a residue having an interfacial hydropathy value of the same sign and generally the same magnitude as the residue replacing the wild-type residue.

[00105] Используемый в настоящем документе термин «неполярный остаток» относится к глицину (G, Gly), аланину (A, Ala), валину (V, Val), лейцину (L, Leu), изолейцину (I, Ile) и пролину (Р, Pro); термин «ароматический остаток» относится к фенилаланину (F, Phe), тирозину (Y, Tyr) и триптофану (W, Trp); термин «полярный незаряженный остаток» относится к серину (S, Ser), треонину (Т, Thr), цистеину (С, Cys), метионину (М, Met), аспарагину (N, Asn) и глутамину (Q, Gln); термин «заряженный остаток» относится к отрицательно заряженным аминокислотам аспарагиновой кислоте (D, Asp) и глутаминовой кислоте (Е, Glu), а также к положительно заряженным аминокислотам лизину (K, Lys), аргинину (R, Arg) и гистидину (Н, His). Другая классификация аминокислот может быть следующей:[00105] As used herein, the term “non-polar residue” refers to glycine (G, Gly), alanine (A, Ala), valine (V, Val), leucine (L, Leu), isoleucine (I, Ile) and proline (P, Pro); the term "aromatic residue" refers to phenylalanine (F, Phe), tyrosine (Y, Tyr) and tryptophan (W, Trp); the term “polar uncharged residue” refers to serine (S, Ser), threonine (T, Thr), cysteine (C, Cys), methionine (M, Met), asparagine (N, Asn) and glutamine (Q, Gln); the term "charged residue" refers to the negatively charged amino acids aspartic acid (D, Asp) and glutamic acid (E, Glu), as well as the positively charged amino acids lysine (K, Lys), arginine (R, Arg) and histidine (H, His). Another classification of amino acids may be as follows:

- аминокислоты с гидрофобной боковой цепью (алифатические): аланин (А, Ala), изолейцин (I, Ile), лейцин (L, Leu), метионин (М, Met) и валин (V, Val);- amino acids with a hydrophobic side chain (aliphatic): alanine (A, Ala), isoleucine (I, Ile), leucine (L, Leu), methionine (M, Met) and valine (V, Val);

- аминокислоты с гидрофобной боковой цепью (ароматические): фенилаланин (F, Phe), триптофан (W, Trp), тирозин (Y, Tyr);- amino acids with a hydrophobic side chain (aromatic): phenylalanine (F, Phe), tryptophan (W, Trp), tyrosine (Y, Tyr);

- аминокислоты с полярно-нейтральной боковой цепью: аспарагин (N, Asn), цистеин (С, Cys), глутамин (Q, Gln), серии (S, Ser) и треонин (Т, Thr);- amino acids with a polar-neutral side chain: asparagine (N, Asn), cysteine (C, Cys), glutamine (Q, Gln), series (S, Ser) and threonine (T, Thr);

- аминокислоты с электрически заряженными боковыми цепями (кислотные): аспарагиновая кислота (D, Asp), глутаминовая кислота (Е, Glu);- amino acids with electrically charged side chains (acidic): aspartic acid (D, Asp), glutamic acid (E, Glu);

- аминокислоты с электрически заряженными боковыми цепями (основные): аргинин (R, Arg); гистидин (Н, His); лизин (K, Lys), глицин (G, Gly) и пролин (Р, Pro).- amino acids with electrically charged side chains (basic): arginine (R, Arg); histidine (H, His); lysine (K, Lys), glycine (G, Gly) and proline (P, Pro).

[00106] Консервативные аминокислотные замены, вероятно, будут иметь такой же эффект на активность полученного варианта белка НА или модифицированного белка НА, как и исходная замена или модификация. Дополнительную информацию о консервативных заменах можно найти, например, в Ben Bassat et al. (J. Bacteriol, 169:751-757, 1987), O'Regan et al. (Gene, 77:237-251, 1989), Sahin-Toth et al. (Protein ScL, 3:240-247, 1994), Hochuli et al (Bio/Technology, 6:1321-1325, 1988) и в широко используемых учебниках генетики и молекулярной биологии.[00106] Conservative amino acid substitutions are likely to have the same effect on the activity of the resulting variant HA protein or modified HA protein as the original substitution or modification. Additional information on conservative substitutions can be found, for example, in Ben Bassat et al. (J. Bacteriol, 169:751-757, 1987), O'Regan et al. (Gene, 77:237-251, 1989), Sahin-Toth et al. (Protein ScL, 3:240-247, 1994), Hochuli et al (Bio/Technology, 6:1321-1325, 1988) and in widely used genetics and molecular biology textbooks.

[00107] Матрицы Blosum, как правило, используются для определения родства полипептидных последовательностей. Матрицы Blosum были созданы с использованием большой базы данных надежных выравниваний (база данных BLOCKS), в которой подсчитывались попарные выравнивания последовательностей, связанные с идентичностью менее некоторого порогового процента (Henikoff et al., Proc. Natl. Acad. Sci. USA, 89: 10915-10919, 1992). Для высококонсервативных целевых частот матрицы BLOSUM90 использовали порог идентичности 90%. Для матрицы BLOSUM65 использовали порог идентичности 65%. Баллы от нуля и выше в матрицах Blosum считаются «консервативными заменами» при выбранной процентной идентичности. В следующей таблице показаны примеры консервативных аминокислотных замен: таблица 2.[00107] Blosum matrices are typically used to determine the relationship of polypeptide sequences. Blosum matrices were generated using a large database of robust alignments (BLOCKS database), which counted pairwise sequence alignments associated with identities less than a certain threshold percentage (Henikoff et al., Proc. Natl. Acad. Sci. USA, 89: 10915 -10919, 1992). For highly conserved target frequencies of the BLOSUM90 matrix, a 90% identity threshold was used. For the BLOSUM65 matrix, an identity threshold of 65% was used. Scores of zero and above in the Blosum matrices are considered “conservative replacements” at the selected percent identity. The following table shows examples of conservative amino acid substitutions: Table 2.

[00108] Нуклеотидная последовательность, кодирующая модифицированный белок НА, может быть оптимизирована для частоты использования кодонов человека, для увеличения содержания GC или их комбинации. Модифицированный белок НА может быть экспрессирован в растении, части растения или растительной клетке.[00108] The nucleotide sequence encoding the modified HA protein may be optimized for human codon frequency, to increase GC content, or a combination thereof. The modified HA protein may be expressed in a plant, part of a plant, or a plant cell.

А. МОДИФИКАЦИИ Н3 НА IA. MODIFICATIONS OF H3 TO I

[00109] Модифицированные белки НА гриппа Н3 и способы получения модифицированных белков НА гриппа Н3 в растениях описаны в настоящем документе. Было замечено, что модификация специфических аминокислот в белках НА из подтипа Н3 приводит к улучшенным характеристикам модифицированного белка Н3 НА по сравнению с белком Н3 НА дикого типа или немодифицированным белком Н3 НА.[00109] Modified influenza H3 HA proteins and methods for producing modified influenza H3 HA proteins in plants are described herein. It has been observed that modification of specific amino acids in HA proteins from the H3 subtype results in improved performance of the modified H3 HA protein compared to wild-type H3 HA protein or unmodified H3 HA protein.

[00110] Всего было исследовано 33 одинарных, двойных и/или тройных модификаций остатков, которые не представляют собой часть транс мембранного (ТМ) и цитозольного домена НА (ТМ), и/или модификаций остатков, которые представляют собой часть транс мембранного (ТМ) и цитозольного домена (СТ) НА, в отношении улучшения характеристик белка Н3 НА. Как описано ниже и как показано в примерах, только модификации или комбинации модификаций в определенных положениях улучшают характеристики белка Н3 НА. Модификации в 13 положениях или комбинациях положений отрицательно влияли на характеристики белка Н3 НА (данные не показаны).[00110] A total of 33 single, double and/or triple modifications of residues that are not part of the transmembrane (TM) and cytosolic domain of HA (TM) and/or modifications of residues that are part of the transmembrane (TM) were examined. and the cytosolic domain (CT) of HA, in relation to improving the characteristics of the H3 HA protein. As described below and as shown in the examples, only modifications or combinations of modifications at certain positions improve the performance of the H3 HA protein. Modifications at 13 positions or combinations of positions negatively affected the characteristics of the H3 HA protein (data not shown).

[00111] Примеры улучшенных характеристик мутантного белка Н3 НА или модифицированного белка Н3 НА включают в себя повышенный выход или накопление белка НА при экспрессии в растительных клетках по сравнению с НА дикого типа или немодифицированным НА того же штамма или подтипа гриппа, который не содержит модификацию(и) или мутацию(и); улучшенный титр гемагглютинации модифицированного или мутированного белка НА по сравнению с белком НА дикого типа или немодифицированным НА; улучшенную целостность, стабильность или как целостность, так и стабильность VLP, которые состоят из модифицированных белков НА, по сравнению с целостностью, стабильностью или и тем и другим VLP, содержащими НА дикого типа, которые не содержат мутацию(и); повышенный выход VLP при экспрессии в растительных клетках по сравнению с уровнем продукции VLP дикого типа, которая не содержит модификацию(и) или мутацию(и); и их комбинацию.[00111] Examples of improved characteristics of a mutant H3 HA protein or a modified H3 HA protein include increased yield or accumulation of HA protein when expressed in plant cells compared to wild-type HA or unmodified HA of the same influenza strain or subtype that does not contain the modification( i) or mutation(s); improved hemagglutination titer of modified or mutated HA protein compared to wild-type or unmodified HA protein; improved integrity, stability, or both the integrity and stability of VLPs that consist of modified HA proteins compared to the integrity, stability, or both of VLPs containing wild-type HA that do not contain the mutation(s); increased yield of VLPs when expressed in plant cells compared to the level of production of wild-type VLPs that do not contain the modification(s) or mutation(s); and their combination.

[00112] Модифицированный белок Н3 НА или мутантный белок Н3 НА, как описано в настоящем документе, модифицирован и содержит одну или более мутаций или модификаций в любом одном или более остатках при выравнивании последовательностей с положениям 382, 384, 392 и/или 431 эталонного штамма A/Hong Kong/4801/14 (SEQ ID NO: 92; смотрите фиг. 1). Поэтому предусмотрены полипептиды, белки и/или белковые комплексы НА гриппа Н3, такие как, например, вирусоподобные частицы (VLP), которые содержат модификации или мутации в одном или более положениях аминокислот 382, 384, 392 и 431, причем такая нумерация аминокислот основана на последовательности A/Hong Kong/4801/14, как показано на фиг. 1 (SEQ ID NO: 92), или на положениях аминокислот, которые соответствуют таким положениям аминокислот, например, как определено выравниванием аминокислотной последовательности НА с SEQ ID NO: 92. Неограничивающие примеры аминокислотных последовательностей НА гриппа Н3, которые содержат одну или более таких мутаций, включают в себя SEQ ID NO: 91, 92, 93, 94, 95, 96 и 97.[00112] A modified H3 HA protein or mutant H3 HA protein, as described herein, is modified to contain one or more mutations or modifications at any one or more residues in a sequence alignment to positions 382, 384, 392 and/or 431 of the reference strain A/Hong Kong/4801/14 (SEQ ID NO: 92; see FIG. 1). Therefore, influenza H3 HA polypeptides, proteins and/or protein complexes are provided, such as, for example, virus-like particles (VLPs), which contain modifications or mutations at one or more of amino acid positions 382, 384, 392 and 431, such amino acid numbering being based on sequence A/Hong Kong/4801/14, as shown in FIG. 1 (SEQ ID NO: 92), or at amino acid positions that correspond to such amino acid positions, for example, as determined by alignment of the HA amino acid sequence to SEQ ID NO: 92. Non-limiting examples of H3 influenza HA amino acid sequences that contain one or more such mutations , include SEQ ID NOs: 91, 92, 93, 94, 95, 96 and 97.

[00113] Модифицированный белок Н3 НА, описанный в настоящем документе, включает в себя белок Н3 НА с аминокислотными последовательностями, которые характеризуются идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности, кодирующей НА из Н3 (SEQ ID NO: 91-97), причем аминокислотная последовательность содержит одну или более мутаций или модификаций в любом одном или более остатках при выравнивании последовательностей с положениями 382, 384, 392 и 431 A/Hong Kong/4801/14 НА (SEQ ID NO: 92).[00113] The modified H3 HA protein described herein includes an H3 HA protein with amino acid sequences that have sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100%, or any number therebetween, with respect to the amino acid sequence encoding HA from H3 (SEQ ID NO: 91-97), wherein the amino acid sequence contains one or more mutations or modifications at any one or more residues in the sequence alignment to positions 382, 384, 392 and 431 of A/Hong Kong/4801/14 HA (SEQ ID NO: 92).

[00114] Кроме того, белок Н3 НА может кодироваться нуклеотидными последовательностями, которые характеризуются идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 (SEQ ID NO: 91-97), причем белок Н3 НА содержит одну или более чем одну мутацию или модификацию в любом одном или более остатках при выравнивании последовательностей с положениями 382, 384, 392 и 431 A/Hong Kong/4801/14 НА (SEQ ID NO: 92), причем нуклеотидная последовательность кодирует белок гемагглютинин, который при экспрессии образует VLP.[00114] In addition, the H3 HA protein may be encoded by nucleotide sequences that have sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 , 99, 100%, or any number therebetween, with respect to the nucleotide sequence encoding HA from H3 (SEQ ID NO: 91-97), wherein the H3 HA protein contains one or more mutations or modifications at any one or more residues when aligning the sequences with positions 382, 384, 392 and 431 A/Hong Kong/4801/14 HA (SEQ ID NO: 92), and the nucleotide sequence encodes the hemagglutinin protein, which when expressed forms a VLP.

[00115] Неограничивающими примерами штаммов, из которых может происходить Н3 НА, являются A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96) и A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97).[00115] Non-limiting examples of strains from which H3 HA may originate include A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96) and A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97).

Модификация в позиции 382Modification at position 382

[00116] Согласно одному аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 382 (нумерация в соответствии с нумерацией A/Hong Kong/4801/14 НА, SEQ ID NO: 92).[00116] In one aspect, an H3 HA is provided which may contain a modified residue at position 382 (numbering as per A/Hong Kong/4801/14 HA numbering, SEQ ID NO: 92).

[00117] Antanasijevic et al. (J Biol Chem. 2014;289(32):22237-45) исследовали структурно-функциональные свойства области петли-на-стебле Н5 НА посредством сайт-направленного мутагенеза в 14 различных положениях. Мутировавшие положения Thr41, Gln42, Ile45, Asn53 и Leu99 НА2 являются высококонсервативными и были разработаны для анализа важности этих остатков для функции НА. Antanasijevic наблюдал, что консервативные мутации в положениях HA1-I28V, НА2-Т41А, НА2-Т49А, HA2-N53A и HA2-D57E нарушают проникновение вируса. В случае мутационного эффекта на ингибирование входа малой молекулой МВХ2329 наибольшее влияние оказали замены на HA2-Ile45, HA2-Val52, HA2-Asn53 и HA2-Ser54 на внешней поверхности и HA2-Leu99 на внутренней поверхности. Эти остатки высоко консервативны в НА группы 1 (например, H1 и Н5). Положение 53 в НА Н5 Antanasijevic соответствует положению 380 в HI НА и положению 382 в Н3 НА текущего раскрытия.[00117] Antanasijevic et al. (J Biol Chem. 2014;289(32):22237-45) investigated the structure-function properties of the H5 stem-loop region of HA by site-directed mutagenesis at 14 different positions. The mutated positions Thr 41 , Gln 42 , Ile 45 , Asn 53 and Leu 99 of HA2 are highly conserved and were designed to analyze the importance of these residues for HA function. Antanasijevic observed that conservative mutations at positions HA1-I28V, HA2-T41A, HA2-T49A, HA2-N53A and HA2-D57E impair viral entry. In the case of mutational effect on entry inhibition by the small molecule MBX2329, substitutions to HA2-Ile 45 , HA2-Val 52 , HA2-Asn 53 and HA2-Ser 54 on the outer surface and HA2-Leu 99 on the inner surface had the greatest impact. These residues are highly conserved in group 1 HAs (eg, H1 and H5). Position 53 in the H5 Antanasijevic HA corresponds to position 380 in the HI HA and position 382 in the H3 HA of the current deployment.

[00118] Неожиданно было обнаружено, что модификация консервативного остатка в положении 380 в HI НА из аспарагина в аланин приводит к приблизительно 80%-ному снижению титра гемагглютинации модифицированного HI НА по сравнению с HI НА дикого типа (данные не показаны). Эквивалентная модификация НА из Н5 также приводит к снижению титра гемагглютинации (смотрите фиг. 3, таблица 7). Однако изменение эквивалентного положения в НА из Н3 (N382A) из аспарагина в аланин приводит к приблизительно 130%-ному увеличению титра гемагглютинации по сравнению с НА дикого типа (смотрите фиг. 2, таблицу 5).[00118] Surprisingly, it was found that modification of the conserved residue at position 380 in HI HA from asparagine to alanine resulted in an approximately 80% reduction in the hemagglutination titer of the modified HI HA compared to wild-type HI HA (data not shown). An equivalent modification of HA from H5 also leads to a decrease in the hemagglutination titer (see Fig. 3, table 7). However, changing the equivalent position in HA from H3 (N382A) from asparagine to alanine results in an approximately 130% increase in hemagglutination titer compared to wild-type HA (see Fig. 2, Table 5).

[00119] Соответственно, остаток в положении 382 Н3 НА может быть модифицирован так, чтобы он не представлял собой аспарагин. Например, остаток в положении 382 может быть модифицирован, чтобы представлять собой гидрофобную аминокислоту, например, аланин или консервативную замену аланина, например, серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val).[00119] Accordingly, the residue at position 382 of H3 HA may be modified so that it is not an asparagine. For example, the residue at position 382 can be modified to be a hydrophobic amino acid, such as alanine, or a conservative alanine substitution, such as series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C , Cys) or valine (V, Val).

[00120] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382 и причем последовательность не встречается в природе. Консервативная замена аланина может, например, представлять собой серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val).[00120] For example, a modified H3 HA protein may contain an amino acid sequence that has a sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 . A, Ala) at position 382 and the sequence does not occur in nature. The conservative substitution for alanine may, for example, be series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val).

[00121] В настоящем описании также представлена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 382, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00121] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA substitution at position 382 as described above, operably linked to a regulatory region active in a plant.

[00122] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, и причем последовательность не встречается в природе. Консервативная замена может, например, представлять собой серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val).[00122] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains alanine (A, Ala) or a conservative substitution alanine (A, Ala) at position 382, and the sequence does not occur in nature. The conservative substitution may, for example, be series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val).

[00123] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, и причем последовательность не встречается в природе. Консервативная замена может, например, представлять собой серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val).[00123] Nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number. between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains an alanine (A, Ala) or a conservative alanine substitution (A, Ala) at position 382, and wherein the sequence does not occur in nature. The conservative substitution may, for example, be series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val).

[00124] Помимо остатка в положении 382, в Н3 НА могут быть модифицированы остатки в положениях 384, 524, 525, 526, 527, 528 или любая их комбинация.[00124] In addition to the residue at position 382, residues at positions 384, 524, 525, 526, 527, 528, or any combination thereof, can be modified in H3 HA.

[00125] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положении 382 и, необязательно, в положении 384, 524, 525, 526, 527, 528 или любой их комбинации, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые обеспечивают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00125] Also provided is a method for producing VLPs that contain a modified H3 HA substitution at least at position 382 and optionally at position 384, 524, 525, 526, 527, 528, or any combination thereof, in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00126] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положении 382 и, необязательно, заменами в положениях 384, 524, 525, 526, 527, 528 или любой их комбинации, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые обеспечивают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00126] Also provided is a method for increasing the yield of VLPs that contain a modified H3 HA with a substitution at at least position 382, and optionally substitutions at positions 384, 524, 525, 526, 527, 528, or any combination thereof, in a plant . The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00127] Настоящее описание дополнительно предусматривает VLP, содержащую Н3 НА с заменой по меньшей мере в положении 382 и, необязательно, заменами в положениях 384, 524, 525, 526, 527, 528 или любую их комбинацию. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00127] The present disclosure further provides a VLP comprising an H3 HA with a substitution at at least position 382 and optionally substitutions at positions 384, 524, 525, 526, 527, 528, or any combination thereof. VLP can be obtained by the method provided herein. VLPs containing modified H3 HA exhibit improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 384Modification in position 384

[00128] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 384 (нумерация A/Hong Kong/4801/14 НА, SEQ ID NO: 92).[00128] In another aspect, there is provided an H3 HA that may contain a modified residue at position 384 (numbering A/Hong Kong/4801/14 HA, SEQ ID NO: 92).

[00129] Как показано, например, на фиг. 2 и в таблице 5, наличие остатка в положении 384, модифицированного из лейцина в валин, приводит к приблизительно 200%-ному увеличению титра гемагглютинации по сравнению с Н3 НА дикого типа.[00129] As shown, for example, in FIG. 2 and Table 5, the presence of a residue at position 384 modified from leucine to valine results in an approximately 200% increase in hemagglutination titer compared to wild-type H3 HA.

[00130] Соответственно, остаток в положении 384 Н3 НА может быть модифицирован так, чтобы он представлял собой не лейцин. Например, остаток в положении 384 может быть модифицирован, чтобы представлять собой, например, валин или консервативную замену валина, которая не представляет собой лейцин, например, изолейцин, метионин, аланин или треонин.[00130] Accordingly, the residue at position 384 of H3 HA may be modified to be non-leucine. For example, the residue at position 384 may be modified to be, for example, valine or a conservative valine substitution that is not leucine, such as isoleucine, methionine, alanine or threonine.

[00131] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит валин (V, Val) или консервативную замену валина, которая не представляет собой лейцин, в положении 384, причем последовательность не встречается в природе и причем белок НА при экспрессии образует VLP. Консервативная замена валина может представлять собой, например, изолейцин, метионин, аланин или треонин.[00131] For example, a modified H3 HA protein may contain an amino acid sequence that has a sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 , 99, 100%, or any number therebetween, with respect to the amino acid sequence HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains valine (V, Val) or a conservative valine substitution, which is not leucine, at position 384, wherein the sequence does not occur in nature and wherein the HA protein, when expressed, forms a VLP. The conservative replacement for valine may be, for example, isoleucine, methionine, alanine or threonine.

[00132] В настоящем описании также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 384, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00132] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA substitution at position 384 as described above, operably linked to a regulatory region active in a plant.

[00133] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок НА Н3, который содержит валин (V, Val) или консервативную замену валина (V, Val), которая не представляет собой лейцин, в положении 384, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует белок НА, который при экспрессии образует VLP. Консервативная замена валина может представлять собой, например, изолейцин, метионин, аланин или треонин.[00133] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains valine (V, Val) or a conservative substitution valine (V, Val), which is not leucine, at position 384, wherein the sequence does not occur in nature and wherein the nucleotide sequence encodes the HA protein, which when expressed forms a VLP. The conservative replacement for valine may be, for example, isoleucine, methionine, alanine or threonine.

[00134] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит валин (V, Val) или консервативную замену валина (V, Val), которая не представляет собой лейцин, в положении 384, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует белок НА, который при экспрессии образует VLP. Консервативная замена валина может представлять собой, например, изолейцин, метионин, аланин или треонин.[00134] Nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains valine (V, Val) or a conservative valine substitution (V, Val), which is not leucine, at position 384 , wherein the sequence does not occur in nature and wherein the nucleotide sequence encodes an HA protein that, when expressed, forms a VLP. The conservative replacement for valine may be, for example, isoleucine, methionine, alanine or threonine.

[00135] Помимо остатка в положении 384, в Н3 НА могут быть модифицированы остатки в положениях 382, 524, 525, 526, 527, 528 или любая их комбинация.[00135] In addition to the residue at position 384, residues at positions 382, 524, 525, 526, 527, 528, or any combination thereof, can be modified in H3 HA.

[00136] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 384 и, необязательно, заменами в положениях 382, 524, 525, 526, 527, 528 или любой их комбинации, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00136] Also provided is a method for producing VLPs that contain a modified H3 HA with substitution at at least positions 384, and optionally substitutions at positions 382, 524, 525, 526, 527, 528, or any combination thereof, in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00137] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере по 384 и необязательно с заменами в положениях 382, 524, 525, 526, 527, 528 или любой их комбинации, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00137] Also provided is a method for increasing the yield of VLPs that contain a modified H3 HA with substitutions at at least 384 and optionally with substitutions at positions 382, 524, 525, 526, 527, 528, or any combination thereof, as described above, in the plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00138] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положении 384 и, необязательно, заменами в положениях 382, 524, 525, 526, 527, 528 или любой их комбинации. VLP может быть получена способом, предусмотренным в настоящем описании. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00138] Further provided herein is a VLP comprising an H3 HA with a substitution at at least position 384 and optionally substitutions at positions 382, 524, 525, 526, 527, 528, or any combination thereof. VLP can be obtained by the method provided in the present description. VLPs containing modified H3 HA exhibit improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 392Modification in position 392

[00139] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 392 (нумерация Н3 A/Hong Kong/4801/14 НА, SEQ ID NO: 92).[00139] In another aspect, there is provided an H3 HA that may contain a modified residue at position 392 (H3 numbering A/Hong Kong/4801/14 HA, SEQ ID NO: 92).

[00140] Как показано, например, на фиг. 2 и в таблице 5, наличие остатка в положении 392, модифицированного из фенилаланина в аспарагиновую кислоту, приводит к приблизительно 140%-ному увеличению титра гемагглютинации по сравнению с Н3 НА дикого типа.[00140] As shown, for example, in FIG. 2 and Table 5, the presence of a residue at position 392 modified from phenylalanine to aspartic acid results in an approximately 140% increase in hemagglutination titer compared to wild-type H3 HA.

[00141] Соответственно, остаток в положении 392 в Н3 НА может быть модифицирован так, чтобы он не представлял собой фенилаланин. Например, остаток в положении 392 может быть модифицирован, например, чтобы представлять собой аспарагиновую кислоту или консервативную замену аспарагиновой кислоты, например, глутаминовую кислоту, аспарагин, глутамин или серии.[00141] Accordingly, the residue at position 392 in H3 of HA can be modified so that it is not a phenylalanine. For example, the residue at position 392 may be modified, for example, to be aspartic acid or a conservative replacement for aspartic acid, eg glutamic acid, asparagine, glutamine or series.

[00142] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты, например, глутаминовую кислоту, аспарагин, глутамин или серии в положении 392, причем последовательность не встречается в природе и причем белок НА при экспрессии образует VLP. Консервативная замена аспарагиновой кислоты может, например, представлять собой глутаминовую кислоту, аспарагин, глутамин или серии.[00142] For example, a modified H3 HA protein may contain an amino acid sequence that has a sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 . acid, asparagine, glutamine or series at position 392, wherein the sequence does not occur in nature and wherein the HA protein, when expressed, forms a VLP. The conservative replacement for aspartic acid may, for example, be glutamic acid, asparagine, glutamine, or series.

[00143] В настоящем документе также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 392, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00143] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA substitution at position 392 as described above, operably linked to a regulatory region active in a plant.

[00144] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты в положении 392, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует белок НА, который при экспрессии образует VLP. Консервативная замена аспарагиновой кислоты может, например, представлять собой глутаминовую кислоту, аспарагин, глутамин или серии.[00144] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains aspartic acid or a conservative substitution of aspartic acid at position 392, wherein the sequence does not occur in nature and wherein the nucleotide sequence encodes an HA protein that, when expressed, forms a VLP. The conservative replacement for aspartic acid may, for example, be glutamic acid, asparagine, glutamine, or series.

[00145] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты в положении 392, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует белок НА, который при экспрессии образует VLP. Консервативная замена аспарагиновой кислоты может, например, представлять собой глутаминовую кислоту, аспарагин, глутамин или серии.[00145] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number in between, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains aspartic acid or a conservative substitution of aspartic acid at position 392, wherein the sequence does not occur in nature, and wherein the nucleotide sequence encodes an HA protein , which when expressed forms a VLP. The conservative replacement for aspartic acid may, for example, be glutamic acid, asparagine, glutamine, or series.

[00146] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 392, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00146] Also provided is a method for producing VLPs that contain a modified H3 HA substitution at least at positions 392 as described above in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00147] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере по 392, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00147] Also provided is a method for increasing the yield of VLPs that contain an H3-modified HA with at least 392 substitutions as described above in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00148] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положении 392. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00148] The present specification further provides a VLP comprising an H3 HA with a substitution at at least position 392. The VLP can be prepared by the method provided herein. VLPs containing modified H3 HA exhibit improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 431Modification in position 431

[00149] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 431 (нумерация Н3 A/Hong Kong/4801/14 НА, SEQ ID NO: 92).[00149] In another aspect, there is provided an H3 HA that may contain a modified residue at position 431 (H3 numbering A/Hong Kong/4801/14 HA, SEQ ID NO: 92).

[00150] Как показано, например, на фиг. 2 и в таблице 5, наличие остатка в положении 431, модифицированного из лейцина в метионин, приводит к приблизительно 170%-ному увеличению титра гемагглютинации по сравнению с Н3 НА дикого типа.[00150] As shown, for example, in FIG. 2 and Table 5, the presence of a residue at position 431 modified from leucine to methionine results in an approximately 170% increase in hemagglutination titer compared to wild-type H3 HA.

[00151] Соответственно, остаток в положении 431 в Н3 НА может быть модифицирован так, чтобы он представлял собой не лейцин. Например, остаток в положении 431 может быть модифицирован, например, чтобы представлять собой метионин или консервативную замену метионина, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00151] Accordingly, the residue at position 431 in H3 HA can be modified to be non-leucine. For example, the residue at position 431 may be modified, for example, to be methionine or a conservative substitution for methionine, for example leucine, isoleucine, glutamine, valine or phenylalanine.

[00152] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит метионин или консервативную замену метионина в положении 431, причем последовательность не встречается в природе и причем белок НА при экспрессии образует VLP. Консервативная замена метионина может представлять собой, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00152] For example, a modified H3 HA protein may contain an amino acid sequence that has a sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 . does not occur in nature, and the HA protein, when expressed, forms a VLP. A conservative replacement for methionine may be, for example, leucine, isoleucine, glutamine, valine or phenylalanine.

[00153] В настоящем описании также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положении 431, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00153] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with a substitution at position 431 as described above, operably linked to a regulatory region active in a plant.

[00154] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hong Kong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит метионин или консервативную замену метионина в положении 431, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует белок НА, который при экспрессии образует VLP. Консервативная замена метионина может представлять собой, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00154] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any the number between them, with respect to the nucleotide sequence encoding HA from H3 A/Hong Kong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains methionine or a conservative substitution of methionine at position 431, wherein the sequence does not occur in nature and wherein the nucleotide sequence encodes an HA protein that, when expressed, forms a VLP. A conservative replacement for methionine may be, for example, leucine, isoleucine, glutamine, valine or phenylalanine.

[00155] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит метионин или консервативную замену метионина в положении 431, причем последовательность не встречается в природе и причем нуклеотидная последовательность кодирует НА белок, который при экспрессии образует VLP. Консервативная замена аспарагиновой кислоты может, например, представлять собой лейцин, изолейцин, глутамин, валин или фенилаланин.[00155] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number in between, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains methionine or a conservative methionine substitution at position 431, wherein the sequence does not occur in nature, and wherein the nucleotide sequence encodes an HA protein that when expressed, forms VLP. The conservative replacement for aspartic acid may, for example, be leucine, isoleucine, glutamine, valine or phenylalanine.

[00156] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положении 431, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00156] Also provided is a method for producing VLPs that contain a modified H3 HA substitution at least at position 431 as described above in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00157] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере по 431, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00157] Also provided is a method for increasing the yield of VLPs that contain an H3-modified HA with at least 431 substitution as described above in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00158] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положении 431. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00158] The present specification further provides a VLP comprising an H3 HA with a substitution at at least position 431. The VLP can be prepared by the method provided herein. VLPs containing modified H3 HA exhibit improved performance compared to VLPs that contain unmodified H3 HA protein.

В. МОДИФИКАЦИИ Н3 НА IIB. MODIFICATIONS H3 ON II

Модификация в положении 382, 384, 392, 431 и/или 524-528 («CysTM»)Modification at position 382, 384, 392, 431 and/or 524-528 (“CysTM”)

[00159] Модифицированные белки НА гриппа Н3 и способы получения модифицированных белков НА гриппа Н3 в растениях описаны в настоящем документе. Было замечено, что модификация конкретных аминокислот в белках НА из подтипа Н3 приводит к улучшенным характеристикам модифицированного белка Н3 НА по сравнению с белком Н3 НА дикого типа или немодифицированным белком Н3 НА.[00159] Modified influenza H3 HA proteins and methods for producing modified influenza H3 HA proteins in plants are described herein. It has been observed that modification of specific amino acids in HA proteins from the H3 subtype results in improved performance of the modified H3 HA protein compared to wild-type H3 HA protein or unmodified H3 HA protein.

[00160] Согласно одному аспекту остатки цистеина в положении 524 и/или 528 (нумерация Н3 A/Hong Kong/4801/14, SEQ ID NO: 92) или остатки, эквивалентные этим положениям, как определено посредством выравнивания, могут быть заменены на остатки не цистеина в этих положениях. Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hong Kong/4801/14 НА) также могут быть модифицированы. Эти модификации или замены могут называться «модификация CysTM», «CysTM», «мутация CysTM», «замена CysTM» или «замещение CysTM» или грамматически эквивалентные выражения.[00160] In one aspect, cysteine residues at position 524 and/or 528 (H3 numbering A/Hong Kong/4801/14, SEQ ID NO: 92) or residues equivalent to these positions, as determined by alignment, can be replaced by residues no cysteine at these positions. In addition, residues at positions 525, 526 and/or 527 (numbering H3 A/Hong Kong/4801/14 HA) may also be modified. These modifications or substitutions may be referred to as "CysTM modification", "CysTM", "CysTM mutation", "CysTM substitution" or "CysTM substitution" or grammatically equivalent expressions.

[00161] В заявке США №13/838796 и сопутствующей публикации Holtz et al. (ВМС Biotechnology. 2014; 14:111) сообщают о повышенной стабильности и сохранении активности рекомбинантного НА за счет мутации остатков цистеина в карбоксиконцевой области белка НА, включая в себя трансмембранный (ТМ) и цитозольный домен (СТ). В частности, Holtz et al. демонстрируют мутации С539А, С546А, С549А, C524S и С528А в рекомбинантном НА Perth/16/2009 (H3N2). Мутация всех пяти остатков цистеина или различных их подмножеств привела к выходам, чистоте, размеру частиц, активности гемагглютинации и термостабильности НА, сравнимым с рекомбинантным белком НА дикого типа. Напротив, мутации пары консервативных остатков цистеина в эктодомене, о которых известно, что они образуют дисульфидную связь (C64S и C76S), приводили к значительному снижению экспрессии НА, что указывает на критическую роль этих остатков в собственном укладывании НА. Используя анализ простой одномерной радиальной иммунодиффузии (SRID), Holtz et al. также показывают, что пять мутаций остатков цистеина улучшают эффективность рекомбинантного НА по сравнению с белком дикого типа, предотвращая перекрестное сшивание дисульфидов в доменах ТМ и СТ. Мутантные белки НА сохраняют активность в течение по меньшей мере 12 месяцев при температуре 25°С, тогда как белок НА дикого типа проявляет активность менее чем 40% только через 50 дней после очистки.[00161] In US application No. 13/838796 and accompanying publication Holtz et al. (BMC Biotechnology. 2014; 14:111) report increased stability and retention of activity of recombinant HA due to mutation of cysteine residues in the carboxy-terminal region of the HA protein, including the transmembrane (TM) and cytosolic domain (CT). In particular, Holtz et al. demonstrate mutations C539A, C546A, C549A, C524S and C528A in recombinant HA Perth/16/2009 (H3N2). Mutation of all five cysteine residues or various subsets of them resulted in HA yields, purity, particle size, hemagglutination activity, and thermostability comparable to recombinant wild-type HA protein. In contrast, mutations of a pair of conserved cysteine residues in the ectodomain known to form a disulfide bond (C64S and C76S) resulted in a significant reduction in HA expression, indicating a critical role for these residues in the intrinsic folding of HA. Using simple one-dimensional radial immunodiffusion (SRID) analysis, Holtz et al. also show that five mutations of cysteine residues improve the efficiency of recombinant HA compared to the wild-type protein by preventing disulfide cross-linking in the TM and CT domains. Mutant HA proteins remain active for at least 12 months at 25°C, whereas wild-type HA protein exhibits less than 40% activity only 50 days after purification.

[00162] Xu et al. (Virus Genes (2013) 47: 20-26) показали, что мутантные Н3 НА с мутациями одного или двух цистеинов ТМ (С540/544) могут правильно экспрессироваться в клетках, однако мутант проявляет более низкую термостойкость и повышенную активность слияния по сравнению с белками Н3 НА дикого типа.[00162] Xu et al. (Virus Genes (2013) 47: 20-26) showed that H3 HA mutants with mutations in one or two TM cysteines (C540/544) can be correctly expressed in cells, but the mutant exhibits lower heat resistance and increased fusion activity compared to proteins H3 HA wild type.

[00163] Всего 33 одиночных, двойных или тройных модификаций в сочетании с модификациями трансмембраны (ТМ), как описано в настоящем документе («модификация Cys ТМ»), исследовали для улучшения характеристик белка Н3 НА. Как описано ниже и как показано в примерах, только модификации или комбинации модификаций в определенных положениях улучшают характеристики белка Н3 НА. Модификации в 13 положениях или комбинациях положений отрицательно влияли на характеристики белка Н3 НА (данные не показаны).[00163] A total of 33 single, double or triple modifications in combination with transmembrane (TM) modifications as described herein (“Cys TM modification”) were investigated to improve the performance of the H3 HA protein. As described below and as shown in the examples, only modifications or combinations of modifications at certain positions improve the performance of the H3 HA protein. Modifications at 13 positions or combinations of positions negatively affected the characteristics of the H3 HA protein (data not shown).

[00164] Примеры улучшенных характеристик мутантного белка Н3 НА включают в себя повышенный выход белка НА при экспрессии в растительных клетках по сравнению с НА дикого типа или немодифицированным НА того же штамма или подтипа гриппа, который не содержит модификацию(и) или мутацию(и); улучшенный титр гемагглютинации модифицированного или мутированного белка НА по сравнению с белком НА дикого типа или немодифицированным белком НА; улучшенную целостность, стабильность или как целостность, так и стабильность VLP, которые состоят из модифицированных белков НА, по сравнению с целостностью, стабильностью или и тем и другим VLP, содержащими НА дикого типа, которые не содержат мутацию(й); повышенный выход VLP при экспрессии в растительных клетках по сравнению с уровнем продукции VLP дикого типа, которая не содержит модификацию(и) или мутацию(и); и их комбинацию.[00164] Examples of improved characteristics of mutant H3 HA protein include increased yield of HA protein when expressed in plant cells compared to wild-type HA or unmodified HA of the same influenza strain or subtype that does not contain the modification(s) or mutation(s) ; improved hemagglutination titer of modified or mutated HA protein compared to wild-type HA protein or unmodified HA protein; improved integrity, stability, or both the integrity and stability of VLPs that consist of modified HA proteins compared to the integrity, stability, or both of VLPs containing wild-type HA that do not contain the mutation(s); increased yield of VLPs when expressed in plant cells compared to the level of production of wild-type VLPs that do not contain the modification(s) or mutation(s); and their combination.

[00165] Согласно одному аспекту предусмотрен модифицированный Н3 НА, содержащий остатки цистеина в положении 524 и/или 528 (нумерация A/Hong Kong/4801/14) или остатки, эквивалентные этим положениям, как определено выравниванием, замененные на остатки не цистеина в этих положениях. Например, остатки цистеина в положении 524 могут быть заменены на серии (S, Ser) или консервативную замену серина или цистеин в положении 528 может быть заменен на лейцин (L, Leu) или консервативную замену лейцина.[00165] In one aspect, a modified H3 HA is provided containing cysteine residues at positions 524 and/or 528 (numbering A/Hong Kong/4801/14) or residues equivalent to these positions, as determined by alignment, replaced by non-cysteine residues at these provisions. For example, cysteine residues at position 524 can be replaced by serine (S, Ser) or a conservative serine substitution, or the cysteine at position 528 can be replaced by leucine (L, Leu) or a conservative leucine substitution.

[00166] Кроме того, последовательность между двумя цистеинами в положениях 524 и 528 (нумерация A/Hong Kong/4801/14, SEQ ID NO: 92) также может быть модифицирована. Например, в последовательности «С524Х525Х526Х527С528» С524 (положение 524) может быть заменен серином (S, Ser) или консервативной заменой серина; если Х525 (положение 525) не представляет собой лейцин, остаток Х525 может быть замещен лейцином (L, Leu) или консервативной заменой лейцина; если Х526 (положение 526) не представляет собой валин, Х526 может быть замещен валином (V, Val) или консервативной заменой валина; если Х527 (положение 527) не представляет собой лейцин, остаток в положении Х527 может быть замещен лейцином (L, Leu) или консервативной заменой лейцина и С528 (положение 528) может быть заменен лейцином (L, Leu) или консервативной заменой лейцина. Например, согласно одному варианту осуществления последовательность «CFLLC» в положениях с 524 по 528 может быть заменена последовательностью «SLVLL» (SEQ ID NO: 98).[00166] In addition, the sequence between the two cysteines at positions 524 and 528 (numbering A/Hong Kong/4801/14, SEQ ID NO: 92) can also be modified. For example, in the sequence "C524X525X526X527C528" C524 (position 524) can be replaced by serine (S, Ser) or a conservative serine substitution; if X525 (position 525) is not leucine, the X525 residue may be replaced by leucine (L, Leu) or a conservative leucine substitution; if X526 (position 526) is not valine, X526 may be replaced by valine (V, Val) or a conservative valine substitution; if X527 (position 527) is not leucine, the residue at position X527 may be replaced by leucine (L, Leu) or a conservative leucine substitution, and C528 (position 528) may be replaced by leucine (L, Leu) or a conservative leucine substitution. For example, in one embodiment, the sequence "CFLLC" at positions 524 to 528 may be replaced with the sequence "SLVLL" (SEQ ID NO: 98).

[00167] Белки НА из других штаммов, отличных от Н3 вируса гриппа, которые содержат остатки цистеина в положении 524 и/или 528 или остатки, эквивалентные этим положениям, как определено выравниванием, также могут быть модифицированы, как описано ниже. Например, белки НА из штаммов вируса гриппа В, которые содержат остатки цистеина в положениях, которые эквивалентны положению 524 и/или 528 Н3 НА, могут быть модифицированы до остатков не цистеина, как описано ниже.[00167] HA proteins from strains other than H3 influenza virus that contain cysteine residues at position 524 and/or 528 or residues equivalent to these positions, as determined by alignment, can also be modified as described below. For example, HA proteins from influenza B virus strains that contain cysteine residues at positions that are equivalent to position 524 and/or 528 of H3 HA can be modified to non-cysteine residues, as described below.

[00168] В дополнение к мутации трансмембранного домена, как описано в настоящем документе, модифицированные белки Н3 НА могут дополнительно содержать одну или более замен аминокислот в положениях 382, 384, 392 и/или 431, что приводило к улучшенной характеристике модифицированного белка НА3 или VLP, полученных с использованием модифицированного белка НА. Следует понимать, что улучшенная характеристика не ограничивается заменой конкретной аминокислоты в определенных сайтах, поскольку специалист в настоящей области техники поймет, что аминокислоты с аналогичными свойствами могут быть заменены на аминокислоты в идентифицированных положениях.[00168] In addition to mutation of the transmembrane domain as described herein, modified H3 HA proteins may additionally contain one or more amino acid substitutions at positions 382, 384, 392 and/or 431, resulting in improved characterization of the modified HA3 protein or VLP , obtained using a modified HA protein. It should be understood that improved characterization is not limited to replacing a specific amino acid at certain sites, as one skilled in the art will appreciate that amino acids with similar properties can be replaced by amino acids at the identified positions.

[00169] Соответственно, модифицированный белок Н3 НА или мутантный белок Н3 НА, как описано в настоящем документе, может содержать одну или более мутаций или модификаций в любом одном или более остатках при выравнивании последовательностей с положениями 382, 384, 392, 431, 524, 525, 526, 527 или 528 эталонного штамма Н3 A/Hong Kong/4801/14 (SEQ ID NO: 92; смотрите фиг. 1). Поэтому предусмотрены полипептиды НА гриппа Н3, белки и/или белковые комплексы, такие как, например, вирусоподобные частицы (VLP), которые содержат модификации или мутации в одном или более положениях аминокислот 382, 384, 392, 431, 524, 525, 526, 527 или 528, причем такая нумерация аминокислот основана на последовательности Н3 A/Hong Kong/4801/14, как показано на фиг. 1 (SEQ ID NO: 92), или в положениях аминокислот, которые соответствуют таким положениям аминокислот, например, как определено выравниванием аминокислотной последовательности НА с SEQ ID NO: 92. Неограничивающие примеры аминокислотных последовательностей НА вируса гриппа Н3, которые содержат одну или более таких мутаций, включают в себя SEQ ID NO: 91, 92, 93, 94, 95, 96 и 97.[00169] Accordingly, a modified H3 HA protein or a mutant H3 HA protein as described herein may contain one or more mutations or modifications at any one or more residues in the sequence alignment to positions 382, 384, 392, 431, 524. 525, 526, 527 or 528 of the H3 reference strain A/Hong Kong/4801/14 (SEQ ID NO: 92; see FIG. 1). Therefore, influenza H3 HA polypeptides, proteins and/or protein complexes are provided, such as, for example, virus-like particles (VLPs), which contain modifications or mutations at one or more amino acid positions 382, 384, 392, 431, 524, 525, 526, 527 or 528, which amino acid numbering is based on the H3 sequence A/Hong Kong/4801/14, as shown in FIG. 1 (SEQ ID NO: 92), or at amino acid positions that correspond to such amino acid positions, for example, as determined by alignment of the HA amino acid sequence to SEQ ID NO: 92. Non-limiting examples of H3 influenza virus HA amino acid sequences that contain one or more such mutations include SEQ ID NOs: 91, 92, 93, 94, 95, 96 and 97.

[00170] Описанный в настоящем документе модифицированный белок Н3 НА включает в себя белок Н3 НА с аминокислотными последовательностями, которые характеризуются идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности, кодирующей НА из Н3 (SEQ ID NO: 91-97), причем аминокислотная последовательность содержит одну или более чем одну мутацию или модификацию в любом одном или более остатках в выравнивании последовательностей с положениями 382, 384, 392, 431, 524, 525, 526, 527 или 528 A/Hong Kong/4801/14 НА (SEQ ID NO: 92).[00170] The modified H3 HA protein described herein includes an H3 HA protein with amino acid sequences that have sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94. 95, 96, 97, 98, 99, 100%, or any number therebetween, with respect to the amino acid sequence encoding HA from H3 (SEQ ID NO: 91-97), wherein the amino acid sequence contains one or more than one mutation or modification at any one or more residues in the sequence alignment to positions 382, 384, 392, 431, 524, 525, 526, 527 or 528 A/Hong Kong/4801/14 HA (SEQ ID NO: 92).

[00171] Кроме того, белок Н3 НА может кодироваться нуклеотидными последовательностями, которые характеризуются идентичностью последовательностей или сходством последовательностей, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 (SEQ ID NO: 91-97 последовательностей штаммов Н3), причем белок Н3 НА содержит одну или более мутаций или модификаций в любом одном или более остатках в выравнивании последовательностей с положениями 382, 384, 392, 431, 524, 525, 526, 527 или 528 Н3 A/Hong Kong/4801/14 НА (SEQ ID NO: 92) и причем нуклеотидная последовательность кодирует белок гемагглютинин, который при экспрессии образует VLP.[00171] In addition, the H3 HA protein may be encoded by nucleotide sequences that have sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 , 99, 100%, or any number therebetween, with respect to the nucleotide sequence encoding HA from H3 (SEQ ID NO: 91-97 sequences of H3 strains), wherein the H3 HA protein contains one or more mutations or modifications in any one or more residues in the sequence alignment at positions 382, 384, 392, 431, 524, 525, 526, 527 or 528 H3 A/Hong Kong/4801/14 HA (SEQ ID NO: 92) and wherein the nucleotide sequence encodes a hemagglutinin protein, which expression forms a VLP.

[00172] Неограничивающими примерами штаммов, из которых может происходить Н3 НА, являются A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96) и A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97).[00172] Non-limiting examples of strains from which H3 HA may originate include A/Bangkok/3007/15 (H3N2) (SEQ ID NO: 91); A/Hongkong/4801/14 (H3N2) (SEQ ID NO: 92); A/Minnesota/40/15 (H3N2) (SEQ ID NO: 93); A/South Australia/1/16 (H3N2) (SEQ ID NO: 94); A/Pennsylvania/09/15 (H3N2) (SEQ ID NO: 95); A/Switzerland/9715293/13 (H3N2) (SEQ ID NO: 96) and A/Mississippi/16/16 (H3N2) (SEQ ID NO: 97).

Модификация в положении 524-528 (CysTM) и 382Modification at position 524-528 (CysTM) and 382

[00173] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 382 и может быть модифицирована так, чтобы содержать остаток цистеина в положениях 524 и/или 528 (нумерация Н3 A/Hongkong/4801/14, SEQ ID NO: 92). Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hongkong/4801/14) также могут быть модифицированы.[00173] In another aspect, there is provided an H3 HA that may contain a modified residue at position 382 and may be modified to contain a cysteine residue at positions 524 and/or 528 (H3 numbering A/Hongkong/4801/14, SEQ ID NO: 92). In addition, residues at positions 525, 526 and/or 527 (H3 numbering A/Hongkong/4801/14) may also be modified.

[00174] Как показано, например, на фиг. 7А, 7В и 7С, Н3 НА, содержащий модифицированные в не цистеин остатки цистеина в положениях 524 и 528 и содержащий остаток в положении 382, модифицированный из аспарагина в аланин, приводит к приблизительно 260%-ному увеличению в титре гемагглютинации по сравнению с Н3 НА дикого типа.[00174] As shown, for example, in FIG. 7A, 7B and 7C, H3 HA containing cysteine residues at positions 524 and 528 modified to non-cysteine and containing a residue at position 382 modified from asparagine to alanine resulted in an approximately 260% increase in hemagglutination titer compared to H3 HA wild type.

[00175] Соответственно, предусмотрен модифицированный белок Н3 НА, который содержит одну или более чем одну модификацию в положении 524, 525, 526, 527 или 528 и модификацию в положении 382. В неограничивающем примере модифицированный Н3 НА содержит модификации по меньшей мере в положениях 382, 524 и 528.[00175] Accordingly, a modified H3 HA protein is provided that contains one or more modifications at position 524, 525, 526, 527, or 528 and a modification at position 382. In a non-limiting example, the modified H3 HA contains modifications at at least positions 382 , 524 and 528.

[00176] Остаток в положении 382 Н3 НА может быть модифицирован так, чтобы он не представлял собой аспарагин. Например, остаток в положении 382 может быть модифицирован, чтобы представлять собой гидрофобную аминокислоту, например, аланин или консервативную замену аланина, например, серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Остаток в положении 524 может быть модифицирован в не цистеин, серии или консервативную замену серина (S, Ser), а остаток в положении 528 может быть модифицирован в не цистеин, лейцин (L, Leu) или консервативную замену лейцина.[00176] The residue at position 382 of H3 HA may be modified so that it is not an asparagine. For example, the residue at position 382 may be modified to be a hydrophobic amino acid, such as alanine, or a conservative alanine substitution, such as series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C , Cys) or valine (V, Val). The residue at position 524 can be modified to a non-cysteine, serine, or conservative serine substitution (S, Ser), and the residue at position 528 can be modified to a non-cysteine, leucine (L, Leu) or conservative leucine substitution.

[00177] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена аланина может, например, представлять собой серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Не цистеин в положении 524 может представлять собой серии (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Ile), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00177] For example, a modified H3 HA protein may contain an amino acid sequence that has a sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 . , Ala) at position 382, does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature and where HA forms a VLP when expressed. The conservative substitution for alanine may, for example, be series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val). The non-cysteine at position 524 may be a serine (S, Ser) or conservative substitution for serine, and the non-cysteine at position 528 may be a leucine (L, Leu) or conservative substitution for leucine. The conservative serine substitution (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu) or lysine (L, Lys). The conservative substitution for leucine can be, for example, isoleucine (I, Ile), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00178] В настоящем документе также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 382, 524 и 528, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00178] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with substitution at positions 382, 524 and 528 as described above, operably linked to a regulatory region active in a plant.

[00179] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена для аланина может, например, представлять собой серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Не цистеин в положении 524 может представлять собой серии (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00179] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains alanine (A, Ala) or a conservative alanine substitution (A, Ala) at position 382, does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature and where HA forms a VLP when expressed. A conservative substitution for alanine may, for example, be series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val). The non-cysteine at position 524 may be a serine (S, Ser) or conservative substitution for serine, and the non-cysteine at position 528 may be a leucine (L, Leu) or conservative substitution for leucine. The conservative serine substitution (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu) or lysine (L, Lys). The conservative substitution for leucine may be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00180] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена аланина может, например, представлять собой серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val).[00180] Nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains an alanine (A, Ala) or a conservative alanine substitution (A, Ala) at position 382, does not contain a cysteine residue at positions 524 and 528, wherein the sequence does not occur in nature and wherein HA, when expressed, forms a VLP. The conservative substitution for alanine may, for example, be series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val).

[00181] Помимо остатков в положениях 382, 524 и 528, модифицированный Н3 НА может содержать дополнительные модифицированные остатки. Например, могут быть модифицированы один или более остатков в положении 384, 525, 526 и 527. В неограничивающем примере модифицированный Н3 НА может содержать замещенные остатки в положениях 382, 524, 528 и одну или более замен в положениях 384, 525, 526, 527 или их комбинацию.[00181] In addition to residues at positions 382, 524 and 528, modified H3 HA may contain additional modified residues. For example, one or more residues at positions 384, 525, 526, and 527 may be modified. In a non-limiting example, the modified H3 HA may contain substituted residues at positions 382, 524, 528 and one or more substitutions at positions 384, 525, 526, 527 or a combination thereof.

[00182] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 382, 524 и 528 и, необязательно, заменами в положениях 384, 525, 526, 527 выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00182] Also provided is a method for producing VLPs that contain a modified H3 HA with substitution at at least positions 382, 524 and 528 and optionally substitutions at positions 384, 525, 526, 527 upstream in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00183] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 382, 524 и 528 и, необязательно, с заменами в положениях 384, 525, 526, 527, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые обеспечивают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00183] Also provided is a method for increasing the yield of VLPs that contain modified H3 HA with substitutions at least at positions 382, 524 and 528 and optionally with substitutions at positions 384, 525, 526, 527 as described above in plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00184] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положениях 382, 524 и 528 и, необязательно, заменами в положениях 384, 525, 526, 527. VLP может быть получена способом, предусмотренным в настоящем описании. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00184] The present specification further provides a VLP comprising H3 HA with substitution at at least positions 382, 524 and 528 and optionally substitutions at positions 384, 525, 526, 527. The VLP can be prepared by the method provided herein . VLPs containing modified H3 HA exhibit improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 524-528 (CysTM) и 384Modification at position 524-528 (CysTM) and 384

[00185] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 384 и может быть модифицирован так, чтобы не содержать остатка цистеина в положениях 524 и 528 (нумерация Н3 A/Hongkong/4801/14, SEQ ID NO: 92). Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hongkong/4801/14) также могут быть модифицированы.[00185] In another aspect, there is provided an H3 HA that may contain a modified residue at position 384 and may be modified to not contain a cysteine residue at positions 524 and 528 (H3 numbering A/Hongkong/4801/14, SEQ ID NO: 92 ). In addition, residues at positions 525, 526 and/or 527 (H3 numbering A/Hongkong/4801/14) may also be modified.

[00186] Как показано, например, на фиг. 7А, 7В и 7С, Н3 НА, содержащий остатки цистеина в положениях 524 и 528, модифицированные в остатки не цистеина, и содержащий остаток в положении 384, модифицированный из лейцина в валин, приводит к приблизительно 270%-ному увеличению титра гемагглютинации по сравнению с Н3 НА дикого типа.[00186] As shown, for example, in FIG. 7A, 7B and 7C, H3 HA containing cysteine residues at positions 524 and 528 modified to non-cysteine residues and containing a residue at position 384 modified from leucine to valine resulted in an approximately 270% increase in hemagglutination titer compared to H3 HA wild type.

[00187] Соответственно, предусмотрен модифицированный белок Н3 НА, который содержит одну или более модификаций в положении 524, 525, 526, 527 или 528 и модификацию в положении 384. В неограничивающем примере модифицированный Н3 НА содержит модификации по меньшей мере в положениях 384, 524 и 528.[00187] Accordingly, a modified H3 HA protein is provided that contains one or more modifications at position 524, 525, 526, 527, or 528 and a modification at position 384. In a non-limiting example, the modified H3 HA contains modifications at at least positions 384, 524 and 528.

[00188] Остаток в положении 384 Н3 НА может быть модифицирован так, чтобы он не представлял собой лейцин. Например, остаток в положении 384 может быть модифицирован в другую гидрофобную аминокислоту, например, валин или консервативную замену валина, например, изолейцин, лейцин, метионин, аланин или треонин.[00188] The residue at position 384 of H3 HA may be modified so that it is not a leucine. For example, the residue at position 384 can be modified to another hydrophobic amino acid, such as valine, or a conservative valine substitution, such as isoleucine, leucine, methionine, alanine or threonine.

[00189] Например, модифицированный белок Н3 НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит валин или консервативную замену валина в положении 384, не содержит остатка цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена валина может представлять собой, например, изолейцин, лейцин, метионин, аланин или треонин.[00189] For example, a modified H3 HA protein may contain an amino acid sequence that has a sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 , 99, 100%, or any number therebetween, with respect to the amino acid sequence HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains a valine or a conservative valine substitution at position 384, containing no residue cysteine at positions 524 and 528, wherein the sequence does not occur in nature and wherein HA forms a VLP when expressed. The conservative replacement for valine may be, for example, isoleucine, leucine, methionine, alanine or threonine.

[00190] В настоящем описании также представлена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 384, 524 и 528, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00190] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with substitution at positions 384, 524 and 528 as described above, operably linked to a regulatory region active in a plant.

[00191] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит валин или консервативную замену валина в положении 384, не содержит остаток цистеина в положениях 524 и 528 и причем последовательность не встречается в природе. Консервативная замена может представлять собой, например, изолейцин, лейцин, метионин, аланин или треонин.[00191] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding the H3 HA from A/Hongkong/4801/14 (SEQ ID NO: 102), the nucleotide sequence encoding a modified H3 HA protein that contains a valine or a conservative valine substitution at position 384, not contains a cysteine residue at positions 524 and 528 and the sequence does not occur in nature. The conservative substitution may be, for example, isoleucine, leucine, methionine, alanine or threonine.

[00192] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит валин или консервативную замену валина в положении 384, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречаются в природе и причем НА при экспрессии образует VLP. Консервативная замена валина может представлять собой, например, изолейцин, лейцин, метионин, аланин или треонин.[00192] Nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number. between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains a valine or a conservative valine substitution at position 384, does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature and wherein HA, when expressed, forms a VLP. The conservative replacement for valine may be, for example, isoleucine, leucine, methionine, alanine or threonine.

[00193] Помимо остатков в положениях 384, 524 и 528, модифицированный Н3 НА может содержать дополнительные модифицированные остатки. Например, могут быть модифицированы один или более остатков в положении 382, 525, 526 и 527. В неограничивающем примере модифицированный Н3 НА может содержать замещенные остатки в положениях 384, 524, 528 и одну или более замен в положениях 382, 525, 526, 527 или их комбинацию.[00193] In addition to residues at positions 384, 524 and 528, modified H3 HA may contain additional modified residues. For example, one or more residues at positions 382, 525, 526, and 527 may be modified. In a non-limiting example, the modified H3 HA may contain substituted residues at positions 384, 524, 528 and one or more substitutions at positions 382, 525, 526, 527 or a combination thereof.

[00194] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 384, 524 и 528 и, необязательно, заменами в положениях 382, 525, 526, 527 выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые допускают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00194] Also provided is a method for producing VLPs that contain a modified H3 HA with substitutions at least at positions 384, 524, and 528, and optionally substitutions at positions 382, 525, 526, 527 upstream, in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00195] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 384, 524 и 528 и, необязательно, с заменами в положениях 382, 525, 526, 527, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые допускают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00195] Also provided is a method for increasing the yield of VLPs that contain a modified H3 HA with substitutions at least at positions 384, 524, and 528, and optionally with substitutions at positions 382, 525, 526, 527, as described above, in plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00196] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положениях 384, 524 и 528 и, необязательно, заменами в положениях 382, 525, 526, 527. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00196] The present specification further provides a VLP comprising H3 HA with substitution at at least positions 384, 524, and 528, and optionally substitutions at positions 382, 525, 526, 527. The VLP can be prepared by the method provided herein. VLPs containing modified H3 HA exhibit improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 524-528 (CysTM) и 392Modification at position 524-528 (CysTM) and 392

[00197] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 392 и может не содержать остатка цистеина в положениях 524 и 528 (нумерация Н3 A/Hongkong/4801/14, SEQ ID NO: 92). Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hongkong/4801/14) также могут быть модифицированы.[00197] In another aspect, there is provided an H3 HA that may contain a modified residue at position 392 and may not contain a cysteine residue at positions 524 and 528 (H3 numbering A/Hongkong/4801/14, SEQ ID NO: 92). In addition, residues at positions 525, 526 and/or 527 (H3 numbering A/Hongkong/4801/14) may also be modified.

[00198] Как показано, например, на фиг. 7А и 7В, Н3 НА, содержащий остатки цистеина в положениях 524 и 528, модифицированные в не цистеин, и содержащий остаток в положении 392, модифицированный из фенилаланина в аспарагиновую кислоту, дает от 200% до 270% увеличение титра гемагглютинации по сравнению с Н3 НА дикого типа.[00198] As shown, for example, in FIG. 7A and 7B, H3 HA containing cysteine residues at positions 524 and 528 modified to a non-cysteine and containing a residue at position 392 modified from phenylalanine to aspartic acid gave a 200% to 270% increase in hemagglutination titer compared to H3 HA wild type.

[00199] Соответственно, предусмотрен модифицированный белок Н3 НА, который содержит одну или более модификаций в положении 524, 525, 526, 527 или 528 и модификацию в положении 392. В неограничивающем примере модифицированный Н3 НА содержит модификации по меньшей мере в положениях 392, 524 и 528.[00199] Accordingly, a modified H3 HA protein is provided that contains one or more modifications at position 524, 525, 526, 527, or 528 and a modification at position 392. In a non-limiting example, the modified H3 HA contains modifications at at least positions 392, 524 and 528.

[00200] Остаток в положении 392 Н3 НА может быть модифицирован, чтобы не представлять собой фенилаланин. Например, остаток в положении 392 может быть модифицирован в заряженную аминокислоту, например, аспарагиновую кислоту или консервативную замену аспарагиновой кислоты, например, глутамин, аспарагин, глутаминовую кислоту или серии.[00200] The residue at position 392 of H3 HA may be modified so as not to be a phenylalanine. For example, the residue at position 392 can be modified to a charged amino acid, such as aspartic acid, or a conservative substitution of aspartic acid, such as glutamine, asparagine, glutamic acid or series.

[00201] Например, модифицированный белок НА Н3 может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты в положении 392, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена аспарагиновой кислоты может, например, представлять собой глутамин, аспарагин, глутаминовую кислоту или серии. Не цистеин в положении 524 может представлять собой серии (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00201] For example, a modified H3 HA protein may contain an amino acid sequence that has a sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 , 99, 100%, or any number therebetween, with respect to the amino acid sequence HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains aspartic acid or a conservative substitution of aspartic acid at position 392, not contains a cysteine residue at positions 524 and 528, wherein the sequence does not occur in nature and wherein HA forms a VLP when expressed. The conservative replacement for aspartic acid may, for example, be glutamine, asparagine, glutamic acid, or series. The non-cysteine at position 524 may be a serine (S, Ser) or conservative substitution for serine, and the non-cysteine at position 528 may be a leucine (L, Leu) or conservative substitution for leucine. The conservative serine substitution (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu) or lysine (L, Lys). The conservative substitution for leucine may be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00202] В настоящем описании также представлена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 392, 524 и 528, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00202] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with substitution at positions 392, 524 and 528 as described above, operably linked to a regulatory region active in a plant.

[00203] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты в положении 392, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена может представлять собой, например, глутамин, аспарагин, глутаминовую кислоту или серии.[00203] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains aspartic acid or a conservative substitution of aspartic acid at position 392 , does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature and where HA forms a VLP when expressed. The conservative substitution may be, for example, glutamine, asparagine, glutamic acid or series.

[00204] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аспарагиновую кислоту или консервативную замену аспарагиновой кислоты в положении 392, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена может представлять собой, например, глутамин, аспарагин, глутаминовая кислота или серии.[00204] Nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number. between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains aspartic acid or a conservative substitution of aspartic acid at position 392, does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature and where HA, when expressed, forms a VLP. The conservative substitution may be, for example, glutamine, asparagine, glutamic acid or series.

[00205] Помимо остатков в положениях 392, 524 и 528, модифицированный Н3 НА может содержать дополнительные модифицированные остатки. Например, могут быть модифицированы один или более остатков в положении 525, 526 и 527. В неограничивающем примере модифицированный Н3 НА может содержать замещенные остатки в положениях 392, 524, 528 и одну или более замен в положениях 525, 526, 527 или их комбинацию.[00205] In addition to residues at positions 392, 524 and 528, modified H3 HA may contain additional modified residues. For example, one or more residues at positions 525, 526, and 527 may be modified. In a non-limiting example, the modified H3 HA may contain substituted residues at positions 392, 524, 528 and one or more substitutions at positions 525, 526, 527, or a combination thereof.

[00206] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 392, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527 выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые допускают экспрессию нуклеиновой кислоты, тем самым производя VLP.[00206] Also provided is a method for producing VLPs that contain a modified H3 HA with substitution at at least positions 392, 524 and 528 and optionally substitutions at positions 525, 526, 527 upstream in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00207] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 392, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный НА Н3, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00207] Also provided is a method for increasing the yield of VLPs that contain H3-modified HA with substitutions at least at positions 392, 524, and 528, and optionally substitutions at positions 525, 526, 527, as described above, in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00208] В настоящем описании дополнительно предусмотрены VLP, содержащие Н3 НА с заменой по меньшей мере в положениях 392, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00208] The present specification further provides VLPs comprising H3 HA with substitutions at least at positions 392, 524, and 528, and optionally substitutions at positions 525, 526, 527. The VLP can be prepared by the method provided herein. VLPs containing modified H3 HA exhibit improved performance compared to VLPs that contain unmodified H3 HA protein.

Модификация в положении 524-528 (CysTM) и 431Modification at position 524-528 (CysTM) and 431

[00209] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированный остаток в положении 431 и может не содержать остаток цистеина в положениях 524 и 528 (нумерация Н3 A/Hongkong/4801/14, SEQ ID NO: 92). Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hongkong/4801/14) также могут быть модифицированы.[00209] In another aspect, there is provided an H3 HA that may contain a modified residue at position 431 and may not contain a cysteine residue at positions 524 and 528 (H3 numbering A/Hongkong/4801/14, SEQ ID NO: 92). In addition, residues at positions 525, 526 and/or 527 (H3 numbering A/Hongkong/4801/14) may also be modified.

[00210] Как показано, например, на фиг. 7А и 7В, Н3 НА, содержащий остатки цистеина в положениях 524 и 528, модифицированные в не цистеин, и содержащий остаток в положении 431, модифицированный из лейцина в метионин, приводит к приблизительно 250%-ному увеличению титра гемагглютинации по сравнению с Н3 НА дикого типа.[00210] As shown, for example, in FIG. 7A and 7B, H3 HA containing cysteine residues at positions 524 and 528 modified to non-cysteine and containing residue at position 431 modified from leucine to methionine resulted in an approximately 250% increase in hemagglutination titer compared to wild H3 HA type.

[00211] Соответственно, предусмотрен модифицированный белок НА Н3, который содержит одну или более модификаций в положении 524, 525, 526, 527 или 528 и модификацию в положении 431. В неограничивающем примере модифицированный Н3 НА содержит модификации по меньшей мере в положениях 431, 524 и 528.[00211] Accordingly, a modified H3 HA protein is provided that contains one or more modifications at position 524, 525, 526, 527, or 528 and a modification at position 431. In a non-limiting example, the modified H3 HA contains modifications at at least positions 431, 524 and 528.

[00212] Остаток в положении 431 Н3 НА может быть модифицирован так, чтобы он не представлял собой лейцин. Например, остаток в положении 431 может быть модифицирован в метионин или консервативную замену метионина, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00212] The residue at position 431 of H3 HA may be modified so that it is not a leucine. For example, the residue at position 431 can be modified to methionine or a conservative methionine substitution such as leucine, isoleucine, glutamine, valine or phenylalanine.

[00213] Например, модифицированный белок HI НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит метионин или консервативную замену метионина в положении 431, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативной заменой метионина может быть, например, лейцин, изолейцин, глутамин, валин или фенилаланин. Не цистеин в положении 524 может представлять собой серии (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (E, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Ile), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00213] For example, a modified HI HA protein may contain an amino acid sequence that has a sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 , 99, 100% or any number therebetween, with respect to the amino acid sequence HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 92), wherein the amino acid sequence contains methionine or a conservative substitution of methionine at position 431, does not contain the residue cysteine at positions 524 and 528, wherein the sequence does not occur in nature and wherein HA forms a VLP when expressed. A conservative replacement for methionine can be, for example, leucine, isoleucine, glutamine, valine or phenylalanine. The non-cysteine at position 524 may be a serine (S, Ser) or conservative substitution for serine, and the non-cysteine at position 528 may be a leucine (L, Leu) or conservative substitution for leucine. The conservative serine substitution (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu) or lysine (L, Lys). The conservative substitution for leucine may be, for example, isoleucine (I, Ile), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00214] В настоящем описании также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 431, 524 и 528, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00214] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with substitution at positions 431, 524 and 528 as described above, operably linked to a regulatory region active in a plant.

[00215] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит метионин или консервативную замену метионина в положении 431, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена может представлять собой, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00215] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains methionine or a conservative substitution of methionine at position 431, not contains a cysteine residue at positions 524 and 528, wherein the sequence does not occur in nature and wherein HA forms a VLP when expressed. The conservative substitution may be, for example, leucine, isoleucine, glutamine, valine or phenylalanine.

[00216] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит метионин или консервативную замену метионина в положении 431, не содержит остаток цистеина в положениях 524 и 528, причем последовательность не встречается в природе и причем НА при экспрессии образует VLP. Консервативная замена может представлять собой, например, лейцин, изолейцин, глутамин, валин или фенилаланин.[00216] Nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains methionine or a conservative methionine substitution at position 431, does not contain a cysteine residue at positions 524 and 528, and the sequence does not occur in nature and wherein HA, when expressed, forms a VLP. The conservative substitution may be, for example, leucine, isoleucine, glutamine, valine or phenylalanine.

[00217] Помимо остатков в положениях 431, 524 и 528, модифицированный Н3 НА может содержать дополнительные модифицированные остатки. Например, могут быть модифицированы один или более остатков в положении 525, 526 и 527. В неограничивающем примере модифицированный Н3 НА может содержать замещенные остатки в положениях 431, 524, 528 и одну или более замен в положениях 525, 526, 527 или их комбинацию.[00217] In addition to residues at positions 431, 524 and 528, modified H3 HA may contain additional modified residues. For example, one or more residues at positions 525, 526, and 527 may be modified. In a non-limiting example, the modified H3 HA may contain substituted residues at positions 431, 524, 528 and one or more substitutions at positions 525, 526, 527, or a combination thereof.

[00218] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 431, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527 выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00218] Also provided is a method for producing VLPs that contain a modified H3 HA with substitutions at at least positions 431, 524 and 528 and optionally substitutions at positions 525, 526, 527 upstream in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00219] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 431, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00219] Also provided is a method for increasing the yield of VLPs that contain H3-modified HA with substitutions at least at positions 431, 524, and 528, and optionally substitutions at positions 525, 526, 527, as described above, in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00220] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положениях 431, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527. VLP может быть получена способом, предусмотренным настоящим описанием. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА. Модификация в положении 524-528 (CysTM), 382 и 384[00220] The present specification further provides a VLP comprising H3 HA with substitutions at least at positions 431, 524 and 528 and optionally substitutions at positions 525, 526, 527. The VLP can be prepared by the method provided herein. VLPs containing modified H3 HA exhibit improved performance compared to VLPs that contain unmodified H3 HA protein. Modification at position 524-528 (CysTM), 382 and 384

[00221] Согласно другому аспекту предусмотрен Н3 НА, который может содержать модифицированные остатки в положениях 382 и 384 и может не содержать остаток цистеина в положениях 524 и 528 (нумерация Н3 A/Hongkong/4801/14, SEQ ID NO: 92). Кроме того, остатки в положении 525, 526 и/или 527 (нумерация Н3 A/Hongkong/4801/14) также могут быть модифицированы.[00221] In another aspect, an H3 HA is provided that may contain modified residues at positions 382 and 384 and may not contain a cysteine residue at positions 524 and 528 (H3 numbering A/Hongkong/4801/14, SEQ ID NO: 92). In addition, residues at positions 525, 526 and/or 527 (H3 numbering A/Hongkong/4801/14) may also be modified.

[00222] Как показано, например, на фиг. 7Е, Н3 НА, содержащий остатки цистеина в положениях 524 и 528, модифицированные в не цистеин, и содержащий остаток в положении 382, модифицированный из аспарагина в аланин, и остаток в положении 384, модифицированный из лейцина в валин, дает увеличение титра гемагглютинации приблизительно на 400-500% по сравнению с Н3 НА дикого типа.[00222] As shown, for example, in FIG. 7E, H3 HA, containing cysteine residues at positions 524 and 528 modified to non-cysteine, and containing a residue at position 382 modified from asparagine to alanine, and a residue at position 384 modified from leucine to valine, increases the hemagglutination titer by approximately 400-500% compared to wild type H3HA.

[00223] Соответственно, предусмотрен модифицированный белок Н3 НА, который содержит одну или более модификаций в положении 524, 525, 526, 527 или 528 и модификацию в положениях 382 и 384. В неограничивающем примере модифицированный Н3 НА содержит модификации по меньшей мере в положениях 382, 384, 524 и 528.[00223] Accordingly, a modified H3 HA protein is provided that contains one or more modifications at position 524, 525, 526, 527, or 528 and a modification at positions 382 and 384. In a non-limiting example, the modified H3 HA contains modifications at at least positions 382 , 384, 524 and 528.

[00224] Остаток в положении 382 Н3 НА может быть модифицирован так, чтобы он не представлял собой аспарагин. Например, остаток в положении 382 может быть модифицирован, чтобы представлять собой гидрофобную аминокислоту, например, аланин или консервативную замену аланина, например, серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Остаток в положении 384 Н3 НА может быть модифицирован так, чтобы он не представлял собой лейцин. Например, остаток в положении 384 может быть модифицирован в другую гидрофобную аминокислоту, например, валин или консервативную замену валина, например, изолейцин, лейцин, метионин, аланин или треонин.[00224] The residue at position 382 of H3 HA may be modified so that it is not an asparagine. For example, the residue at position 382 may be modified to be a hydrophobic amino acid, such as alanine, or a conservative alanine substitution, such as series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C , Cys) or valine (V, Val). The residue at position 384 of H3 HA may be modified so that it is not a leucine. For example, the residue at position 384 can be modified to another hydrophobic amino acid, such as valine, or a conservative valine substitution, such as isoleucine, leucine, methionine, alanine or threonine.

[00225] Например, модифицированный белок HI НА может содержать аминокислотную последовательность, которая характеризуется идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к аминокислотной последовательности НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 92), причем аминокислотная последовательность содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, валин или консервативную замену валина в положении 384, не содержит остаток цистеина в положениях 524 и 528 и причем последовательность не встречается в природе, и причем НА при экспрессии образует VLP. Консервативная замена аланина может, например, представлять собой серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Консервативная замена валина может представлять собой, например, изолейцин (I, Не), лейцин (L, Leu), метионин (М, Met), аланин A, Ala) или треонин (Т, Thr). Не цистеин в положении 524 может представлять собой серии (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00225] For example, a modified HI HA protein may contain an amino acid sequence that has a sequence identity or sequence similarity of approximately 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98 . , Ala) at position 382, valine or a conservative valine substitution at position 384, does not contain a cysteine residue at positions 524 and 528, and wherein the sequence does not occur in nature, and wherein HA forms a VLP when expressed. The conservative substitution for alanine may, for example, be series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val). The conservative replacement for valine may be, for example, isoleucine (I, He), leucine (L, Leu), methionine (M, Met), alanine A, Ala) or threonine (T, Thr). The non-cysteine at position 524 may be a serine (S, Ser) or conservative substitution for serine, and the non-cysteine at position 528 may be a leucine (L, Leu) or conservative substitution for leucine. The conservative serine substitution (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu) or lysine (L, Lys). The conservative substitution for leucine may be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00226] В настоящем описании также предусмотрена нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный Н3 НА с заменой в положениях 382, 384, 524 и 528, как описано выше, функционально связанную с регуляторной областью, активной в растении.[00226] Also provided herein is a nucleic acid comprising a nucleotide sequence encoding a modified H3 HA with substitution at positions 382, 384, 524 and 528 as described above, operably linked to a regulatory region active in a plant.

[00227] Например, нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности, кодирующей НА из Н3 A/Hongkong/4801/14 (SEQ ID NO: 102), причем нуклеотидная последовательность кодирует модифицированный белок НА Н3, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, валин или консервативную замену валина в положении 384, не содержит остаток цистеина в положениях 524 и 528, и причем последовательность не встречается в природе, и причем НА при экспрессии образует VLP. Консервативная замена аланина может, например, представлять собой серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Консервативная замена валина может представлять собой, например, изолейцин (I, Не), лейцин (L, Leu), метионин (М, Met), аланин A, Ala) или треонин (Т, Thr). Не цистеин в положении 524 может представлять собой серии (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Не), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00227] For example, nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence encoding HA from H3 A/Hongkong/4801/14 (SEQ ID NO: 102), wherein the nucleotide sequence encodes a modified H3 HA protein that contains alanine (A, Ala) or a conservative alanine substitution (A, Ala) at position 382, valine or a conservative valine substitution at position 384, does not contain a cysteine residue at positions 524 and 528, and wherein the sequence does not occur in nature, and wherein HA forms a VLP when expressed. The conservative substitution for alanine may, for example, be series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val). The conservative replacement for valine may be, for example, isoleucine (I, He), leucine (L, Leu), methionine (M, Met), alanine A, Ala) or threonine (T, Thr). The non-cysteine at position 524 may be a serine (S, Ser) or conservative substitution for serine, and the non-cysteine at position 528 may be a leucine (L, Leu) or conservative substitution for leucine. The conservative serine substitution (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu) or lysine (L, Lys). The conservative substitution for leucine may be, for example, isoleucine (I, He), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00228] Нуклеотидные последовательности могут характеризоваться идентичностью последовательности или сходством последовательности, составляющим приблизительно 70, 75, 80, 85, 87, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100% или любое число между ними, по отношению к нуклеотидной последовательности SEQ ID NO: 102, причем нуклеотидная последовательность кодирует модифицированный белок Н3 НА, который содержит аланин (A, Ala) или консервативную замену аланина (A, Ala) в положении 382, валин или консервативную замену валина в положении 384, не содержит остаток цистеина в положениях 524 и 528 и причем последовательность не встречается в природе, и причем НА при экспрессии образует VLP. Консервативная замена аланина может, например, представлять собой серии (S, Ser), глицин (G, Gly), треонин (Т, Thr), цистеин (С, Cys) или валин (V, Val). Консервативная замена валина может представлять собой, например, изолейцин (I, Не), лейцин (L, Leu), метионин (М, Met), аланин A, Ala) или треонин (Т, Thr). Не цистеин в положении 524 может представлять собой серии (S, Ser) или консервативную замену серина, а не цистеин в положении 528 может представлять собой лейцин (L, Leu) или консервативную замену лейцина. Консервативная замена серина (Se, Ser) может представлять собой, например, треонин (Т, Thr), аланин (A, Ala), аспарагин (N, Asn), аспарагиновую кислоту (D, Asp), глутамин (Q, Gln), глицин (G, Gly), глутаминовую кислоту (Е, Glu) или лизин (L, Lys). Консервативная замена лейцина может представлять собой, например, изолейцин (I, Ile), валин (V, Val), метионин (М, Met), фенилаланин (F, Phe) или валин (V, Val).[00228] Nucleotide sequences may have sequence identity or sequence similarity of approximately 70%, 75%, 80%, 85%, 87%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%, or any number between them, with respect to the nucleotide sequence of SEQ ID NO: 102, wherein the nucleotide sequence encodes a modified H3 HA protein that contains an alanine (A, Ala) or a conservative alanine substitution (A, Ala) at position 382, a valine or a conservative valine substitution at position 384, does not contain a cysteine residue at positions 524 and 528, and wherein the sequence does not occur in nature, and wherein HA forms a VLP when expressed. The conservative substitution for alanine may, for example, be series (S, Ser), glycine (G, Gly), threonine (T, Thr), cysteine (C, Cys) or valine (V, Val). The conservative replacement for valine may be, for example, isoleucine (I, He), leucine (L, Leu), methionine (M, Met), alanine A, Ala) or threonine (T, Thr). The non-cysteine at position 524 may be a serine (S, Ser) or conservative substitution for serine, and the non-cysteine at position 528 may be a leucine (L, Leu) or conservative substitution for leucine. The conservative serine substitution (Se, Ser) may be, for example, threonine (T, Thr), alanine (A, Ala), asparagine (N, Asn), aspartic acid (D, Asp), glutamine (Q, Gln), glycine (G, Gly), glutamic acid (E, Glu) or lysine (L, Lys). The conservative substitution for leucine can be, for example, isoleucine (I, Ile), valine (V, Val), methionine (M, Met), phenylalanine (F, Phe) or valine (V, Val).

[00229] В дополнение к остаткам в положении 382, 384, 524 и 528, модифицированный Н3 НА может содержать дополнительные модифицированные остатки. Например, могут быть модифицированы один или более остатков в положениях 525, 526 и 527. В неограничивающем примере модифицированный Н3 НА может содержать замещенные остатки в положениях 382, 384, 524, 528 и одну или более замен в положениях 525, 526, 527 или их комбинацию.[00229] In addition to residues at positions 382, 384, 524 and 528, modified H3 HA may contain additional modified residues. For example, one or more residues at positions 525, 526, and 527 may be modified. In a non-limiting example, the modified H3 HA may contain substituted residues at positions 382, 384, 524, 528 and one or more substitutions at positions 525, 526, 527, or thereof combination.

[00230] Кроме того, представлен способ получения VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 382, 384, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527 выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00230] Also provided is a method for producing VLPs that contain a modified H3 HA with substitution at at least positions 382, 384, 524 and 528 and optionally substitutions at positions 525, 526, 527 upstream in a plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00231] Кроме того, представлен способ увеличения выхода VLP, которые содержат модифицированный Н3 НА с заменой по меньшей мере в положениях 382, 384, 524 и 528 и, необязательно, с заменами в положениях 525, 526, 527, как описано выше, в растении. Способ предусматривает введение нуклеиновой кислоты, кодирующей модифицированный Н3 НА, функционально связанной с регуляторной областью, активной в растении, в растение или часть растения, и инкубацию растения или части растения в условиях, которые позволяют экспрессию нуклеиновой кислоты, тем самым производя VLP.[00231] Also provided is a method for increasing the yield of VLPs that contain a modified H3 HA with substitutions at least at positions 382, 384, 524, and 528, and optionally with substitutions at positions 525, 526, 527, as described above, in plant. The method involves introducing a nucleic acid encoding a modified H3 HA operably linked to a plant-active regulatory region into a plant or plant part, and incubating the plant or plant part under conditions that allow expression of the nucleic acid, thereby producing a VLP.

[00232] В настоящем описании дополнительно предусмотрена VLP, содержащая Н3 НА с заменой по меньшей мере в положениях 382, 384, 524 и 528 и, необязательно, заменами в положениях 525, 526, 527. VLP может быть получена способом, как предусмотрено согласно данному описанию. VLP, содержащие модифицированный Н3 НА, демонстрируют улучшенные характеристики по сравнению с VLP, которые содержат немодифицированный белок Н3 НА.[00232] Further provided herein is a VLP comprising H3 HA with substitutions at least at positions 382, 384, 524 and 528 and optionally substitutions at positions 525, 526, 527. The VLP can be prepared by a method as provided herein description. VLPs containing modified H3 HA exhibit improved performance compared to VLPs that contain unmodified H3 HA protein.

[00233] В настоящем документе также представлены способы увеличения производства или выхода VLP, содержащих мутантные НА гриппа, в растениях. Например, способ может предусматривать введение нуклеиновой кислоты, кодирующей мутантный НА гриппа, как описано в настоящем документе, в растение, часть растения или растительную клетку. Нуклеиновая кислота, кодирующая мутантный НА гриппа, может быть оптимизирована в отношении частоты использования кодонов человека, повышенного содержания GC или их комбинации. Один или более чем один мутантный белок НА гриппа может быть экспрессирован в растении, части растения или растительной клетке, чтобы производить VLP, содержащую один или более чем один мутантный белок НА гриппа. Альтернативно, способ может предусматривать получение растения, части растения или растительной клетки, которые содержат нуклеиновую кислоту, кодирующую мутантный белок НА гриппа, для получения VLP, содержащей один или более чем один мутантный белок НА гриппа.[00233] Also provided herein are methods for increasing the production or yield of VLPs containing mutant influenza HAs in plants. For example, the method may involve introducing a nucleic acid encoding a mutant influenza HA, as described herein, into a plant, plant part, or plant cell. The nucleic acid encoding the mutant influenza HA may be optimized for human codon frequency, increased GC content, or a combination of both. One or more mutant influenza HA proteins can be expressed in a plant, part of a plant, or plant cell to produce a VLP containing one or more mutant influenza HA proteins. Alternatively, the method may involve obtaining a plant, plant part, or plant cell that contains a nucleic acid encoding a mutant influenza HA protein to produce a VLP containing one or more mutant influenza HA proteins.

[00234] Способы получения VLP, содержащей мутантный НА гриппа, могут дополнительно предусматривать стадию введения второй последовательности нуклеиновой кислоты в растение, часть растения или растительную клетку, причем вторая нуклеиновая кислота кодирует белок протонного канала, который коэкспрессируется с мутантным НА гриппа. Например, белок протонного канала может представлять собой белок М2 подтипа гриппа А, такой как A/New Caledonia/20/99 М2. Коэкспрессия белка протонного канала может приводить к повышенному накоплению мутантного белка НА гриппа и/или VLP, содержащих мутантный белок НА гриппа, как, например, описано в публикации международной заявки WO 2013/044390, которая включена в настоящий документ посредством ссылки.[00234] Methods for producing a VLP containing mutant influenza HA may further comprise the step of introducing a second nucleic acid sequence into a plant, plant part, or plant cell, wherein the second nucleic acid encodes a proton channel protein that is coexpressed with the mutant influenza HA. For example, the proton channel protein may be an influenza A subtype M2 protein, such as A/New Caledonia/20/99 M2. Co-expression of a proton channel protein can lead to increased accumulation of mutant influenza HA protein and/or VLPs containing mutant influenza HA protein, as, for example, described in international application publication WO 2013/044390, which is incorporated herein by reference.

[00235] Кроме того, мутантный НА гриппа может дополнительно содержать модифицированную протеолитическую петлю или сайт расщепления, как описано в публикациях международных заявок WO 2013/044390 и WO 2014/153674 и которые включены в настоящий документ посредством ссылки.[00235] In addition, the mutant influenza HA may further comprise a modified proteolytic loop or cleavage site, as described in International Application Publications WO 2013/044390 and WO 2014/153674, which are incorporated herein by reference.

[00236] Под «коэкспрессией» подразумевается введение и экспрессия двух или более нуклеотидных последовательностей, причем каждая из двух или более нуклеотидных последовательностей кодирует представляющий интерес белок или фрагмент представляющего интерес белка, в растении, части растения или растительной клетке. Две или более нуклеотидных последовательностей могут быть введены в растение, часть растения или растительную клетку в одном векторе, так что каждая из двух или более нуклеотидных последовательностей находится под контролем отдельной регуляторной области (например, содержащей двойную конструкцию). Альтернативно, две или более нуклеотидных последовательностей могут быть введены в растение, часть растения или растительную клетку в отдельных векторах (например, содержащих одиночные конструкции), и каждый вектор содержит соответствующие регуляторные области для экспрессии соответствующей нуклеиновой кислоты. Например, две нуклеотидные последовательности, каждая в отдельном векторе и введенная отдельным хозяевам Agrobacterium tumefaciens, могут быть совместно экспрессированы путем смешивания суспензий каждого хозяина A. tumefaciens в желаемом объеме (например, равный объем или соотношении каждого хозяина A. tumefaciens может быть изменено) перед вакуумной инфильтрацией. Таким образом, совместная инфильтрация множества суспензий А. tumifaciens позволяет коэкспрессию множества трансгенов.[00236] By “coexpression” is meant the introduction and expression of two or more nucleotide sequences, each of the two or more nucleotide sequences encoding a protein of interest, or a fragment of a protein of interest, in a plant, part of a plant, or plant cell. Two or more nucleotide sequences may be introduced into a plant, plant part, or plant cell in a single vector such that each of the two or more nucleotide sequences is under the control of a separate regulatory region (eg, containing a dual construct). Alternatively, two or more nucleotide sequences may be introduced into a plant, plant part, or plant cell in separate vectors (eg, containing single constructs), and each vector contains corresponding regulatory regions for expression of the corresponding nucleic acid. For example, two nucleotide sequences, each in a separate vector and introduced into separate Agrobacterium tumefaciens hosts, can be co-expressed by mixing suspensions of each A. tumefaciens host in the desired volume (for example, the equal volume or ratio of each A. tumefaciens host can be changed) before vacuum infiltration. Thus, co-infiltration of multiple A. tumifaciens suspensions allows the coexpression of multiple transgenes.

[00237] Нуклеиновая кислота, кодирующая мутантный НА гриппа, как описано в настоящем документе, может дополнительно содержать последовательности, которые усиливают экспрессию мутантного НА гриппа в растении, части растения или растительной клетке. Последовательности, которые усиливают экспрессию, могут включать в себя энхансерный элемент вируса мозаики коровьего гороха (CPMV), функционально связанный с нуклеиновой кислотой, кодирующей мутантный белок НА гриппа.[00237] A nucleic acid encoding a mutant influenza HA as described herein may further comprise sequences that enhance expression of the mutant influenza HA in a plant, part of a plant, or plant cell. Sequences that enhance expression may include a cowpea mosaic virus (CPMV) enhancer element operably linked to a nucleic acid encoding a mutant influenza HA protein.

[00238] Нуклеиновая кислота, содержащая нуклеотидную последовательность, кодирующую модифицированный белок гемагглютинин (НА) гриппа, как описано в настоящем документе, может дополнительно содержать последовательности, которые усиливают экспрессию белка НА в растении, части растения или растительной клетке. Последовательности, которые усиливают экспрессию, могут включать в себя элемент энхансера CPMV или энхансер экспрессии растительного происхождения в функциональной связи с нуклеиновой кислотой, кодирующей модифицированный белок гемагглютинин гриппа (НА). Последовательность, кодирующая модифицированный гемагглютинин (НА) гриппа, также может быть оптимизирована в отношении частоты использования кодонов человека, повышенного содержания GC или их комбинации.[00238] A nucleic acid containing a nucleotide sequence encoding a modified influenza hemagglutinin (HA) protein, as described herein, may further contain sequences that enhance expression of the HA protein in a plant, part of a plant, or plant cell. Sequences that enhance expression may include a CPMV enhancer element or a plant-derived expression enhancer in operative association with a nucleic acid encoding a modified influenza hemagglutinin (HA) protein. The modified influenza hemagglutinin (HA) coding sequence may also be optimized for human codon frequency, increased GC content, or a combination of both.

[00239] Используемый в настоящем документе термин «энхансерный элемент CPMV» относится к нуклеотидной последовательности, кодирующей 5'UTR, регулирующую полипептид RNA2 вируса мозаики коровьего гороха (CPMV) или модифицированную последовательность CPMV, как известно в настоящей области техники. Например, энхансерный элемент CPMV или энхансер экспрессии CPMV включает в себя нуклеотидную последовательность, как описано в публикации международной заявки WO 2015/14367; WO 2015/103704; WO 2007/135480; WO 2009/087391; Sainsbury F., and Lomonossoff G.P., (2008, Plant Physiol. 148: pp. 1212-1218), каждая из которых включена в настоящий документ посредством ссылки. Последовательность энхансера CPMV может усиливать экспрессию гетерологичной открытой рамки считывания (ORF) ниже по ходу транскрипции, к которой они присоединены. Энхансер экспрессии CPMV может включать в себя CPMV НТ, CPMVX (где X=160, 155, 150, 114), например, CPMV 160, CPMVX+(где X=160, 155, 150, 114), например, CPMV 160+, CPMV-HT+, CPMV HT+[WT115] или CPMV НТ+[511] (публикации международной заявки WO 2015/143567; WO 2015/103704, которые включены в настоящий документ посредством ссылки). Энхансер экспрессии CPMV можно использовать в системе экспрессии растений, содержащей регуляторную область, которая функционально связана с последовательностью энхансера экспрессии CPMV и представляющей интерес нуклеотидной последовательностью.[00239] As used herein, the term “CPMV enhancer element” refers to a nucleotide sequence encoding the 5'UTR regulating cowpea mosaic virus (CPMV) RNA2 polypeptide or a modified CPMV sequence, as is known in the art. For example, a CPMV enhancer element or a CPMV expression enhancer includes a nucleotide sequence as described in international application publication WO 2015/14367; WO 2015/103704; WO 2007/135480; WO 2009/087391; Sainsbury F., and Lomonossoff G.P., (2008, Plant Physiol. 148: pp. 1212-1218), each of which is incorporated herein by reference. CPMV enhancer sequences can enhance the expression of a heterologous open reading frame (ORF) downstream to which they are attached. The CPMV expression enhancer may include CPMV HT, CPMVX (where X=160, 155, 150, 114), e.g. CPMV 160, CPMVX+ (where X=160, 155, 150, 114), e.g. CPMV 160+, CPMV -HT+, CPMV HT+[WT115] or CPMV HT+[511] (International Application Publications WO 2015/143567; WO 2015/103704, which are incorporated herein by reference). The CPMV expression enhancer can be used in a plant expression system comprising a regulatory region that is operably linked to a CPMV expression enhancer sequence and a nucleotide sequence of interest.

[00240] Используемый в настоящем документе термин «энхансерный элемент CPMV» относится к нуклеотидной последовательности, кодирующей 5'UTR, регулирующую полипептид RNA2 вируса мозаики коровьего гороха (CPMV) или модифицированную последовательность CPMV, как известно в настоящей области техники. Например, энхансерный элемент CPMV или энхансер экспрессии CPMV включает в себя нуклеотидную последовательность, как описано в публикации международной заявки WO 2015/14367; WO 2015/103704; WO 2007/135480; WO 2009/087391; Sainsbury F., and Lomonossoff G.P., (2008, Plant Physiol. 148: pp. 1212-1218), каждая из которых включена в настоящий документ посредством ссылки. Последовательность энхансера CPMV может усиливать экспрессию гетерологичной открытой рамки считывания (ORF) ниже по ходу транскрипции, к которой они присоединены. Энхансер экспрессии CPMV может включать в себя CPMV НТ, CPMVX, CPMVX+, CPMV-HT+, CPMV HT+[WT115] или CPMV НТ+[511] (публикации международной заявки WO 2015/14367; WO 2015/103704, которые включены в настоящий документ посредством ссылки). Энхансер экспрессии CPMV можно использовать в системе экспрессии растений, содержащей регуляторную область, которая функционально связана с последовательностью энхансера экспрессии CPMV и представляющей интерес нуклеотидной последовательностью.[00240] As used herein, the term “CPMV enhancer element” refers to a nucleotide sequence encoding the 5'UTR regulating cowpea mosaic virus (CPMV) RNA2 polypeptide or a modified CPMV sequence, as is known in the art. For example, a CPMV enhancer element or a CPMV expression enhancer includes a nucleotide sequence as described in international application publication WO 2015/14367; WO 2015/103704; WO 2007/135480; WO 2009/087391; Sainsbury F., and Lomonossoff G.P., (2008, Plant Physiol. 148: pp. 1212-1218), each of which is incorporated herein by reference. CPMV enhancer sequences can enhance the expression of a heterologous open reading frame (ORF) downstream to which they are attached. The CPMV expression enhancer may include CPMV HT, CPMVX, CPMVX+, CPMV-HT+, CPMV HT+[WT115] or CPMV HT+[511] (International Application Publications WO 2015/14367; WO 2015/103704, which are incorporated herein by links). The CPMV expression enhancer can be used in a plant expression system comprising a regulatory region that is operably linked to a CPMV expression enhancer sequence and a nucleotide sequence of interest.

[00241] Термин «5'UTR» или «5'-нетранслируемая область», или «5'-лидерная последовательность» относится к участкам мРНК, которые не транслируются. 5'UTR, как правило, начинается в сайте старта транскрипции и заканчивается непосредственно перед сайтом инициации трансляции или стартовым кодоном кодирующей области. 5'-UTR может модулировать стабильность и/или трансляцию транскрипта мРНК.[00241] The term "5'UTR" or "5' untranslated region" or "5' leader sequence" refers to regions of mRNA that are not translated. The 5'UTR typically begins at the transcription start site and ends immediately before the translation start site or start codon of the coding region. The 5'UTR can modulate the stability and/or translation of an mRNA transcript.

[00242] Используемый в настоящем документе термин «энхансер экспрессии растительного происхождения» относится к нуклеотидной последовательности, полученной из растения, нуклеотидной последовательности, кодирующей 5'UTR. Примеры энхансера экспрессии растительного происхождения описаны в предварительной заявке на патент США №62/643053 (поданной 14 марта 2018 г.; которая включена в настоящий документ посредством ссылки) или в публикации Diamos A.G. et al. (2016, Front Pit Sci. 7: 1-15; которая включена в настоящий документ посредством ссылки). Энхансер экспрессии растительного происхождения может быть выбран из nbMT78, nbATL75, nbDJ46, nbCHP79, nbEN42, atHSP69, atGRP62, atPK65, atRP46, nb30S72, nbGT61, nbPV55, nbPPI43, nbPM64 и nbH2A, как описано в US 62/533 A). Энхансер экспрессии растительного происхождения может использоваться в системе экспрессии растений, содержащей регуляторную область, которая функционально связана с последовательностью энхансера экспрессии растительного происхождения и представляющей интерес нуклеотидной последовательностью.[00242] As used herein, the term “plant-derived expression enhancer” refers to a nucleotide sequence derived from a plant, a nucleotide sequence encoding a 5'UTR. Examples of a plant-derived expression enhancer are described in US Provisional Application No. 62/643,053 (filed March 14, 2018; which is incorporated herein by reference) or Diamos A.G. et al. (2016, Front Pit Sci. 7: 1-15; which is incorporated herein by reference). The plant-derived expression enhancer may be selected from nbMT78, nbATL75, nbDJ46, nbCHP79, nbEN42, atHSP69, atGRP62, atPK65, atRP46, nb30S72, nbGT61, nbPV55, nbPPI43, nbPM64 and nbH2A, as described in US 62/533 A). A plant-derived expression enhancer may be used in a plant expression system comprising a regulatory region that is operably linked to a plant-derived expression enhancer sequence and a nucleotide sequence of interest.

[00243] Под «функционально связанными» подразумевается, что конкретные последовательности взаимодействуют либо прямо, либо опосредованно для выполнения намеченной функции, такой как опосредование или модуляция экспрессии последовательности нуклеиновой кислоты. Взаимодействие функционально связанных последовательностей может, например, опосредоваться белками, которые взаимодействуют с функционально связанными последовательностями.[00243] By “operably linked” is meant that the particular sequences interact either directly or indirectly to perform an intended function, such as mediating or modulating the expression of a nucleic acid sequence. Interactions of operably linked sequences may, for example, be mediated by proteins that interact with operably linked sequences.

[00244] Когда один или более чем один мутантный белок НА гриппа экспрессируется в растении, части растения или растительной клетке, один или более чем один мутантный белок НА гриппа самособирается в VLP. Растение, часть растения или растительную клетку можно собирать в подходящих условиях экстракции и очистки для поддержания целостности VLP, и VLP, содержащие один или более чем один мутантный НА гриппа, можно очищать.[00244] When one or more mutant influenza HA proteins are expressed in a plant, part of a plant, or plant cell, the one or more mutant influenza HA proteins self-assemble into a VLP. A plant, plant part, or plant cell can be collected under suitable extraction and purification conditions to maintain the integrity of the VLP, and VLPs containing one or more mutant influenza HAs can be purified.

[00245] В настоящем изобретение также предусмотрено применение мутантного НА гриппа или VLP, содержащей мутантный НА гриппа, как описано в настоящем документе, для индукции иммунитета к инфекции гриппа у субъекта. В настоящем документе также раскрыто антитело или фрагмент антитела, полученные путем введения мутантного НА гриппа или VLP, содержащего мутантный НА гриппа, субъекту или животному-хозяину. Кроме того, предусмотрена композиция, содержащая эффективную дозу мутантного НА гриппа или VLP, содержащей мутантный НА гриппа, как описано в настоящем документе, и фармацевтически приемлемый носитель, адъювант, наполнитель или вспомогательное вещество для индукции иммунного ответа у субъекта. Также предусмотрена вакцина для индукции иммунного ответа у субъекта, которая содержит эффективную дозу мутантного НА гриппа.[00245] The present invention also provides for the use of mutant influenza HA or a VLP containing mutant influenza HA, as described herein, to induce immunity to influenza infection in a subject. Also disclosed herein is an antibody or antibody fragment produced by administering a mutant influenza HA or a VLP containing a mutant influenza HA to a subject or animal host. In addition, a composition is provided containing an effective dose of mutant influenza HA or a VLP containing mutant influenza HA, as described herein, and a pharmaceutically acceptable carrier, adjuvant, excipient or excipient for inducing an immune response in a subject. Also provided is a vaccine for inducing an immune response in a subject that contains an effective dose of mutant HA influenza.

[00246] В настоящем документе также представлены способы индукции иммунитета к инфекции гриппа у субъекта, предусматривающие введение субъекту мутантного НА гриппа или VLP, содержащей мутантный НА гриппа, перорально, интраназально, внутримышечно, внутрибрюшинно, внутривенно или подкожно.[00246] Also provided herein are methods of inducing immunity to influenza infection in a subject comprising administering to the subject a mutant influenza HA or a VLP containing a mutant influenza HA orally, intranasally, intramuscularly, intraperitoneally, intravenously or subcutaneously.

[00247] Используемый в настоящем документе термин «вирус гриппа» относится к штамму оболочечных вирусов семейства Orthomyxoviridae, который характеризуется геномом отрицательно направленной одноцепочечной РНК. Геном вируса гриппа содержит восемь генных сегментов, кодирующих 12-14 белков в зависимости от штамма.[00247] As used herein, the term “influenza virus” refers to a strain of enveloped viruses of the family Orthomyxoviridae that is characterized by a negative-directed single-stranded RNA genome. The influenza virus genome contains eight gene segments encoding 12-14 proteins, depending on the strain.

[00248] Существует четыре типа вируса гриппа: А, В, С и D, из которых грипп А или В являются возбудителями сезонных эпидемий заболеваний у людей. Грипп А дополнительно классифицируется на основе экспрессии подтипов гликопротеинов НА и нейраминидазы (NA).[00248] There are four types of influenza virus: A, B, C and D, of which influenza A or B are the causative agents of seasonal epidemics of disease in humans. Influenza A is further classified based on the expression of HA and neuraminidase (NA) glycoprotein subtypes.

[00249] Используемый в настоящем документе термин «гемагглютинин» или «НА» относится к тримерному лектину, который облегчает связывание частицы вируса гриппа с белками, содержащими сиаловую кислоту, на поверхности клеток-мишеней и опосредует высвобождение вирусного генома в клетку-мишень. Существует 18 различных подтипов НА (H1-H18). Белки НА состоят из двух структурных элементов: головки, которая является основной мишенью серопротекторных антител; и ножки. НА транслируется как единый полипептид, НА0 (собранный в виде тримеров), который должен расщепляться сериновой эндопротеазой между субдоменами НА1 (~40 кДа) и НА2 (~20 кДа). После расщепления два домена белка с дисульфидной связью принимают необходимую конформацию, необходимую для вирусной инфекционности.[00249] As used herein, the term “hemagglutinin” or “HA” refers to a trimeric lectin that facilitates the binding of an influenza virus particle to sialic acid-containing proteins on the surface of target cells and mediates the release of the viral genome into the target cell. There are 18 different subtypes of AN (H1-H18). HA proteins consist of two structural elements: the head, which is the main target of seroprotective antibodies; and legs. HA is translated as a single polypeptide, HA0 (assembled as trimers), which must be cleaved by a serine endoprotease between the HA1 (~40 kDa) and HA2 (~20 kDa) subdomains. After cleavage, the two disulfide-linked domains of the protein adopt the required conformation required for viral infectivity.

[00250] Белки НА гриппа А или модифицированные белки НА гриппа А, как раскрыто в настоящем документе, включают в себя любые известные белки НА, полученные из любого известного штамма гриппа А, а также модификации известных штаммов гриппа А, которые развиваются с течением времени. Например, НА гриппа может происходить из A/Hong Kong/4801/14 (H3N2), A/Minnesota/40/15 (H3N2), A/South Australia/1/16 (H3N2), A/Bangkok/3007/15 (H3N2), A/Switzerland/9715293/13 (H3N2), A/Mississippi/16/16 (H3N2) или A/Pennsylvania/09/2015 (H3N2). НА гриппа А может включать в себя НА, полученный из штаммов, где НА характеризуется идентичностью аминокислотной последовательности, составляющей приблизительно 30-100% или любое число между ними, по отношению к любому НА, полученному из штаммов гриппа А, перечисленных выше, при условии, что белок НА гриппа содержит по меньшей мере одну замену, как описано в настоящем документе, и способен образовывать VLP, индуцирует иммунный ответ при введении субъекту, индуцирует гемагглютинацию или их комбинацию.[00250] Influenza A HA proteins or modified influenza A HA proteins, as disclosed herein, include any known HA proteins derived from any known influenza A strain, as well as modifications of known influenza A strains that have evolved over time. For example, influenza HA may originate from A/Hong Kong/4801/14 (H3N2), A/Minnesota/40/15 (H3N2), A/South Australia/1/16 (H3N2), A/Bangkok/3007/15 ( H3N2), A/Switzerland/9715293/13 (H3N2), A/Mississippi/16/16 (H3N2) or A/Pennsylvania/09/2015 (H3N2). Influenza A HA may include HA derived from strains wherein the HA has amino acid sequence identity of approximately 30-100%, or any number therebetween, to any HA derived from influenza A strains listed above, provided that that the influenza HA protein contains at least one substitution as described herein and is capable of forming a VLP, inducing an immune response when administered to a subject, inducing hemagglutination, or a combination thereof.

[00251] Например, белки НА гриппа могут характеризоваться идентичностью аминокислотной последовательности (сходством последовательности, процентом идентичности, процентом сходства), составляющим 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100% или любое число между ними, по отношению к любым НА, полученным из перечисленных выше штаммов гриппа А, и содержать по меньшей мере одну замену, как описано в настоящем документе, и способны образовывать VLP, индуцировать иммунный ответ при введении субъекту, индуцировать гемагглютинацию или их комбинацию. Выравнивание аминокислотных последовательностей нескольких доменов НА гриппа А, которые не следует рассматривать как ограничивающие, показано на фиг. 1.[00251] For example, influenza HA proteins may have amino acid sequence identities (sequence similarity, percent identity, percent similarity) of 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54 , 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100% or any number between them, with respect to any HA derived from the above influenza A strains, and contain at least one substitution as described herein, and are capable of forming VLPs, inducing an immune response when administered to a subject, inducing hemagglutination, or a combination thereof. An amino acid sequence alignment of several influenza A HA domains, which should not be considered limiting, is shown in FIG. 1.

[00252] Термины «процент сходства», «сходство последовательностей», «процент идентичности» или «идентичность последовательностей», когда они относятся к конкретной последовательности, используются, например, как изложено в программном обеспечении GCG Университета Висконсина, или путем выравнивания вручную и визуального осмотра (смотрите, например, Current Protocols in Molecular Biology, Ausubel et al., eds. 1995, приложение). Способы выравнивания последовательностей для сравнения хорошо известны в настоящей области техники. Оптимальное выравнивание последовательностей для сравнения может быть проведено, например, с использованием алгоритма локальной гомологии Smith & Waterman, (1981, Adv. Appl. Math. 2:482), с помощью алгоритма выравнивания гомологии Needleman & Wunsch, (1970, J. Mol. Biol. 48:443), способом поиска сходства Pearson & Lipman, (1988, Proc. Natl. Acad. Sci. USA 85:2444), с помощью компьютеризированных реализаций этих алгоритмов (например, GAP, BESTFIT, FASTA и TFASTA в пакете программного обеспечения Wisconsin Genetics Software Package, Genetics Computer Group (GCG), 575 Science Dr., Madison, Wis.).[00252] The terms "percentage similarity", "sequence similarity", "percentage identity" or "sequence identity" when they refer to a specific sequence are used, for example, as set forth in the University of Wisconsin GCG software, or by manual and visual alignment inspection (see, for example, Current Protocols in Molecular Biology, Ausubel et al., eds. 1995, appendix). Methods for aligning sequences for comparison are well known in the art. Optimal sequence alignment for comparison can be made, for example, using the local homology algorithm of Smith & Waterman, (1981, Adv. Appl. Math. 2:482), using the homology alignment algorithm of Needleman & Wunsch, (1970, J. Mol. Biol. 48:443), the similarity search method of Pearson & Lipman, (1988, Proc. Natl. Acad. Sci. USA 85:2444), using computerized implementations of these algorithms (for example, GAP, BESTFIT, FASTA and TFASTA in a software package Wisconsin Genetics Software Package, Genetics Computer Group (GCG), 575 Science Dr., Madison, Wis.).

[00253] Примером алгоритма, подходящего для определения процента идентичности последовательностей и сходства последовательностей, являются алгоритмы BLAST и BLAST 2.0, которые описаны в Altschul et al., (1977, Nuc. Acids Res. 25: 3389-3402) и Altschul et al. (1990, J. Mol. Biol. 215: 403-410), соответственно. BLAST и BLAST 2.0 используются с параметрами, описанными в настоящем документе, для определения процента идентичности последовательностей нуклеиновых кислот и белков по настоящему изобретению. Например, программа BLASTN (для нуклеотидных последовательностей) может использовать по умолчанию длину слова (W), равную 11, математическое ожидание (Е), равное 10, Μ=5, N=-4 и сравнение обеих цепей. Для аминокислотных последовательностей программа BLASTP может использовать по умолчанию длину слова 3 и математическое ожидание (Е) 10, а также оценочную матрицу BLOSUM62 (смотрите Henikoff & Henikoff, 1989, Proc. Natl. Acad. Sci. USA 89: 10915) выравнивания (В) 50, математическое ожидание (Ε) 10, Μ=5, Ν=-4, и сравнение обеих цепей. Программное обеспечение для проведения анализов BLAST общедоступно через Национальный центр биотехнологической информации (смотрите URL: ncbi.nlm.nih.gov/).[00253] An example of an algorithm suitable for determining percent sequence identity and sequence similarity is the BLAST and BLAST 2.0 algorithms, which are described in Altschul et al., (1977, Nuc. Acids Res. 25: 3389-3402) and Altschul et al. (1990, J. Mol. Biol. 215: 403-410), respectively. BLAST and BLAST 2.0 are used with the parameters described herein to determine the percent sequence identity of nucleic acids and proteins of the present invention. For example, the BLASTN program (for nucleotide sequences) might use a default word length (W) of 11, expected value (E) of 10, M=5, N=-4, and comparison of both strands. For amino acid sequences, the BLASTP program may use a default word length of 3 and an expectation (E) of 10, as well as a BLOSUM62 scoring matrix (see Henikoff & Henikoff, 1989, Proc. Natl. Acad. Sci. USA 89: 10915) alignment (B) 50, mathematical expectation (Ε) 10, Μ=5, Ν=-4, and comparison of both circuits. BLAST analysis software is publicly available through the National Center for Biotechnology Information (see URL: ncbi.nlm.nih.gov/).

[00254] Используемый в настоящем документе термин «вирусоподобная частица», VLP, «вирусоподобные частицы» или «VLP» относится к частицам вируса гриппа, которые содержат один или более чем один белок НА гриппа и которые самособираются в нереплицирующиеся, неинфекционные структуры вирусного капсида, лишенные всех частей генома гриппа.[00254] As used herein, the term "virus-like particle", VLP, "virus-like particles" or "VLP" refers to influenza virus particles that contain one or more influenza HA proteins and that self-assemble into non-replicating, non-infectious viral capsid structures, lacking all parts of the influenza genome.

Производство белка НА гриппа в растениях Белок НА гриппа А включает в себя любой белок НА, содержащий аминокислотную последовательность, характеризующуюся идентичностью последовательности или сходством последовательности, составляющим от приблизительно 30 до приблизительно 100%, от приблизительно 40 до приблизительно 100%, от приблизительно 50 до приблизительно 100%, от приблизительно 60 до приблизительно 100%, от приблизительно 70 до приблизительно 100%, от приблизительно 80 до приблизительно 100%, от приблизительно 85 до приблизительно 100%, от приблизительно 90 до приблизительно 100%, от 95 до приблизительно 100% или от приблизительно 97 до приблизительно 100%, от приблизительно 98 до приблизительно 100% или любое число между ними, по отношению к последовательности НА гриппа А из A/Hong Kong/4801/14 (H3N2, SEQ ID NO: 92), A/Minnesota/40/15 (H3N2, SEQ ID NO: 93), A/South Australia/1/16 (H3N2, SEQ ID NO: 94), A/Bangkok/3007/15 (H3N2, SEQ ID NO: 91), A/Switzerland/9715293/13 (H3N2, SEQ ID NO: 96), A/Mississippi/16/16 (H3N2, SEQ ID NO: 97) и A/Pennsylvania/09/2015 (H3N2, SEQ ID NO: 95), при условии, что белок НА гриппа содержит по меньшей мере одну замену, как описано в настоящем документе, и способен образовывать VLP, вызывает иммунный ответ при введении субъекту, вызывает гемагглютинацию или их комбинацию.Production of Influenza HA Protein in Plants Influenza A HA protein includes any HA protein containing an amino acid sequence having sequence identity or sequence similarity of from about 30 to about 100%, from about 40 to about 100%, from about 50 to about 100%, from about 60 to about 100%, from about 70 to about 100%, from about 80 to about 100%, from about 85 to about 100%, from about 90 to about 100%, from 95 to about 100%, or from about 97 to about 100%, from about 98 to about 100%, or any number therebetween, relative to the influenza A HA sequence of A/Hong Kong/4801/14 (H3N2, SEQ ID NO: 92), A/Minnesota /40/15 (H3N2, SEQ ID NO: 93), A/South Australia/1/16 (H3N2, SEQ ID NO: 94), A/Bangkok/3007/15 (H3N2, SEQ ID NO: 91), A /Switzerland/9715293/13 (H3N2, SEQ ID NO: 96), A/Mississippi/16/16 (H3N2, SEQ ID NO: 97) and A/Pennsylvania/09/2015 (H3N2, SEQ ID NO: 95), provided that the influenza HA protein contains at least one substitution as described herein and is capable of forming a VLP, causes an immune response when administered to a subject, causes hemagglutination, or a combination thereof.

[00255] Кроме того, модифицированный белок НА гриппа включает в себя любой белок НА, содержащий аминокислотную последовательность, характеризующуюся идентичностью последовательности или сходством последовательности, составляющим от приблизительно 30% до приблизительно 100%, от приблизительно 40% до приблизительно 100%, от приблизительно 50% до приблизительно 100%, от приблизительно 60%. до приблизительно 100%, от приблизительно 70% до приблизительно 100%, от приблизительно 80% до приблизительно 100%, от приблизительно 85% до приблизительно 100%, от приблизительно 90% до приблизительно 100%, от 95% до приблизительно 100% или от приблизительно 97% до приблизительно 100%, от приблизительно 98% до приблизительно 100% или любое число между ними, по отношению к последовательности из последовательностей SEQ ID NO: 25, SEQ ID NO: 30, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 53, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, при условии, что белок НА гриппа содержит по меньшей мере одну замену, как описано в настоящем документе, и способен образовывать VLP, вызывает иммунный ответ при введении субъекту, индуцирует гемагглютинацию или их комбинацию.[00255] Additionally, a modified influenza HA protein includes any HA protein comprising an amino acid sequence having sequence identity or sequence similarity of from about 30% to about 100%, from about 40% to about 100%, from about 50 % to about 100%, from about 60%. to about 100%, from about 70% to about 100%, from about 80% to about 100%, from about 85% to about 100%, from about 90% to about 100%, from 95% to about 100%, or from about 97% to about 100%, about 98% to about 100%, or any number therebetween, relative to the sequence of SEQ ID NO: 25, SEQ ID NO: 30, SEQ ID NO: 35, SEQ ID NO: 39, SEQ ID NO: 43, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 53, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 82, SEQ ID NO: 84, SEQ ID NO: 86, SEQ ID NO: 88, SEQ ID NO: 90, provided that the influenza HA protein contains at least one substitution as described herein and is capable of forming VLPs, causes an immune response, when administered to a subject, induces hemagglutination or a combination thereof.

[00256] Как описано в настоящем документе, одна или более специфических мутаций или модификаций НА гриппа приводит к повышенному накоплению белка НА и увеличению продукции VLP в растениях по сравнению с НА гриппа дикого типа.[00256] As described herein, one or more specific mutations or modifications of influenza HA result in increased accumulation of HA protein and increased VLP production in plants compared to wild-type influenza HA.

[00257] Примеры мутантных белков НА гриппа А, характеризующихся повышенной продукцией НА и/или VLP вируса гриппа в растениях, включают в себя, без ограничения, следующие:[00257] Examples of mutant influenza A HA proteins characterized by increased production of influenza virus HA and/or VLPs in plants include, but are not limited to, the following:

мутант CysTM A/Hong Kong/4801/14 Н3 (конструкция №3341, SEQ ID NO: 21), мутант N382A+L384V+CysTM A/Hong Kong/4801/14 Н3 (конструкция №3375, SEQ ID NO: 25); мутант CysTM A/Minnesota/40/15 Н3 (конструкция №3914, SEQ ID NO: 27); мутант N382A+L384V+CysTM A/Minnesota/40/15 Н3 (конструкция №3915, SEQ ID NO: 30); мутант CysTM A/S. Australia/1/16 Н3 (конструкция №3924, SEQ ID NO: 33); мутант N382A+L384V+CysTM A/S. Australia/1/16 Н3 (конструкция №3925, SEQ ID NO: 35); мутант N382A+L384V+CysTM A/Bangkok/3007/15 Н3 (конструкция №3905, SEQ ID NO: 39); мутант N382A A/Switzerland/9715293/13 Н3 (конструкция №3023, SEQ ID NO: 82); мутант L384V A/Switzerland/9715293/13 Н3 (конструкция №3034, SEQ ID NO: 84); мутант F392D A/Switzerland/9715293/13 Н3 (конструкция №3045, SEQ ID NO: 43; мутант L431M A/Switzerland/9715293/13 Н3 (конструкция №3022, SEQ ID NO: 47); мутант CysTM A/Switzerland/9715293/13 Н3 (конструкция №2811, SEQ ID NO: 49); мутант N382A+CysTM A/Switzerland/9715293/13 Н3 (конструкция №3063, SEQ ID NO: 53); мутант L384V+CysTM A/Switzerland/9715293/13 Н3 (конструкция №3074, SEQ ID NO: 57); мутант F392D+CysTM A/Switzerland/9715293/13 Н3 (конструкция №3085, SEQ ID NO: 59) и мутант L431M+CysTM A/Switzerland/9715293/13 Н3 (конструкция №3062, SEQ ID NO: 61), мутант CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3313, SEQ ID NO: 86), мутант N382A+CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3314, SEQ ID NO: 88) и мутант L384V+CysTM A/Pennsylvania/09/2015 Н3 (конструкциям 3315, SEQ ID NO: 90).mutant CysTM A/Hong Kong/4801/14 H3 (design No. 3341, SEQ ID NO: 21), mutant N382A+L384V+CysTM A/Hong Kong/4801/14 H3 (design No. 3375, SEQ ID NO: 25); mutant CysTM A/Minnesota/40/15 H3 (design No. 3914, SEQ ID NO: 27); mutant N382A+L384V+CysTM A/Minnesota/40/15 H3 (design No. 3915, SEQ ID NO: 30); CysTM A/S mutant. Australia/1/16 H3 (design No. 3924, SEQ ID NO: 33); mutant N382A+L384V+CysTM A/S. Australia/1/16 H3 (design No. 3925, SEQ ID NO: 35); mutant N382A+L384V+CysTM A/Bangkok/3007/15 H3 (design No. 3905, SEQ ID NO: 39); mutant N382A A/Switzerland/9715293/13 H3 (design no. 3023, SEQ ID NO: 82); mutant L384V A/Switzerland/9715293/13 H3 (design no. 3034, SEQ ID NO: 84); mutant F392D A/Switzerland/9715293/13 H3 (design no. 3045, SEQ ID NO: 43; mutant L431M A/Switzerland/9715293/13 H3 (design no. 3022, SEQ ID NO: 47); mutant CysTM A/Switzerland/9715293 /13 H3 (design No. 2811, SEQ ID NO: 49); mutant N382A+CysTM A/Switzerland/9715293/13 H3 (design No. 3063, SEQ ID NO: 53); mutant L384V+CysTM A/Switzerland/9715293/13 H3 (design no. 3074, SEQ ID NO: 57); mutant F392D+CysTM A/Switzerland/9715293/13 H3 (design no. 3085, SEQ ID NO: 59) and mutant L431M+CysTM A/Switzerland/9715293/13 H3 ( construct No. 3062, SEQ ID NO: 61), mutant CysTM A/Pennsylvania/09/2015 H3 (construct No. 3313, SEQ ID NO: 86), mutant N382A+CysTM A/Pennsylvania/09/2015 H3 (construct No. 3314, SEQ ID NO: 88) and mutant L384V+CysTM A/Pennsylvania/09/2015 H3 (construct 3315, SEQ ID NO: 90).

Индукция иммунитета против инфекции гриппаInduction of immunity against influenza infection

[00258] «Иммунный ответ», как правило, относится к ответу адаптивной иммунной системы субъекта. Адаптивная иммунная система, как правило, включает в себя гуморальный ответ и клеточно-опосредованный ответ. Гуморальный ответ представляет собой аспект иммунитета, который опосредуется секретируемыми антителами, производимыми клетками линии В-лимфоцитов (В-клетками). Секретируемые антитела связываются с антигенами на поверхности вторгающихся микробов (таких как вирусы или бактерии), что указывает на их уничтожение. Гуморальный иммунитет, как правило, используется для обозначения производства антител и процессов, которые его сопровождают, а также эффекторных функций антител, включая в себя активацию Th2-клеток и продукцию цитокинов, образование клеток памяти, опсониновую стимуляцию фагоцитоза, элиминацию патогенов и т.п. Термины «модулировать» или «модуляция» или подобные относятся к увеличению или уменьшению конкретного ответа или параметра, как определено любым из нескольких общеизвестных или используемых анализов, некоторые из которых приведены в настоящем документе в качестве примеров.[00258] “Immune response” generally refers to the response of the adaptive immune system of a subject. The adaptive immune system generally includes a humoral response and a cell-mediated response. The humoral response is an aspect of immunity that is mediated by secreted antibodies produced by cells of the B lymphocyte lineage (B cells). Secreted antibodies bind to antigens on the surface of invading microbes (such as viruses or bacteria), indicating their destruction. Humoral immunity is generally used to refer to the production of antibodies and the processes that accompany it, as well as the effector functions of antibodies, including Th2 cell activation and cytokine production, memory cell formation, opsonin stimulation of phagocytosis, pathogen elimination, etc. The terms “modulate” or “modulation” or the like refer to an increase or decrease in a particular response or parameter, as determined by any of several commonly known or used assays, some of which are provided herein as examples.

[00259] Клеточно-опосредованный ответ представляет собой иммунный ответ, который не включает в себя антитела, а скорее включает в себя активацию макрофагов, естественных клеток-киллеров (NK), антигенспецифических цитотоксических Т-лимфоцитов и высвобождение различных цитокинов в ответ на антиген. Клеточно-опосредованный иммунитет, как правило, используется для обозначения некоторой активации Th-клеток, активации Тс-клеток и опосредованных Т-клетками ответов. Клеточный иммунитет может иметь особое значение в ответ на вирусные инфекции.[00259] A cell-mediated response is an immune response that does not involve antibodies, but rather involves the activation of macrophages, natural killer (NK) cells, antigen-specific cytotoxic T lymphocytes, and the release of various cytokines in response to an antigen. Cell-mediated immunity is generally used to refer to some Th cell activation, Tc cell activation, and T cell-mediated responses. Cellular immunity may be of particular importance in response to viral infections.

[00260] Например, индукцию антигенспецифических CD8-положительных Т-лимфоцитов можно измерить с помощью анализа ELISPOT; стимуляцию CD4-положительных Т-лимфоцитов можно измерить с помощью анализа пролиферации. Титры антител к НА гриппа можно количественно определить с помощью анализа ELISA; изотипы антигенспецифических или перекрестно-реактивных антител также можно измерить с использованием антиизотипических антител (например, к IgG, IgA, IgE или IgM). Способы и технологии проведения таких анализов хорошо известны в настоящей области техники.[00260] For example, the induction of antigen-specific CD8-positive T lymphocytes can be measured using an ELISPOT assay; stimulation of CD4-positive T lymphocytes can be measured using a proliferation assay. Influenza HA antibody titers can be quantified using an ELISA assay; Isotypes of antigen-specific or cross-reactive antibodies can also be measured using anti-isotype antibodies (eg, IgG, IgA, IgE, or IgM). Methods and techniques for performing such assays are well known in the art.

[00261] Присутствие или уровни цитокинов также могут быть определены количественно. Например, ответ Т-хелперных клеток (Th1/Th2) будет охарактеризован путем измерения клеток, секретирующих IFN-β и IL-4, с использованием ELISA (например, наборов BD Biosciences OptEIA). Мононуклеарные клетки периферической крови (РВМС) или спленоциты, полученные от субъекта, можно культивировать, а супернатант анализировать. Т-лимфоциты также могут быть количественно определены с помощью сортировки активируемых флуоресценцией клеток (FACS) с использованием маркерных флуоресцентных меток и способов, известных в настоящей области техники.[00261] The presence or levels of cytokines can also be quantified. For example, the T helper cell (Th1/Th2) response will be characterized by measuring cells secreting IFN-β and IL-4 using ELISA (eg, BD Biosciences OptEIA kits). Peripheral blood mononuclear cells (PBMCs) or splenocytes obtained from the subject can be cultured and the supernatant analyzed. T lymphocytes can also be quantified by fluorescence activated cell sorting (FACS) using fluorescent marker tags and methods known in the art.

[00262] Анализ микронейтрализации также может быть проведен для характеристики иммунного ответа у субъекта, смотрите, например, способы Rowe et al., 1973. Титры нейтрализации вируса могут быть определены количественно несколькими способами, включая в себя: подсчет гемолитических бляшек лизиса (анализ бляшкообразования) после фиксации/окрашивания клеток кристаллическим фиолетовым; исследование под микроскопом лизиса клеток в культуре in vitro и 2) ELISA и спектрофотометрическое определение вируса гриппа.[00262] Microneutralization assays can also be performed to characterize the immune response in a subject, see, for example, the methods of Rowe et al., 1973. Viral neutralization titers can be quantified in several ways, including: counting hemolytic plaque lysis (plaque assay) after cell fixation/staining with crystal violet; study under a microscope of cell lysis in culture in vitro and 2) ELISA and spectrophotometric determination of the influenza virus.

[00263] Используемый в настоящем документе термин «эпитоп» или «эпитопы» относится к структурной части антигена, с которой специфически связывается антитело.[00263] As used herein, the term “epitope” or “epitopes” refers to the structural portion of an antigen to which an antibody specifically binds.

[00264] Иммунные ответы, вызванные в ответ на введение белков НА гриппа дикого типа или VLP или мутантных белков НА гриппа или VLP растительного происхождения, могут, например, наблюдаться у мышей Balb/C. Образцы сыворотки крови, взятой у животных, могут быть проанализированы с помощью ELISA на Н3-специфические общие антитела IgG и IgA. Мыши, иммунизированные белками НА гриппа дикого типа или мутантными белками НА гриппа растительного происхождения, могут проявлять титры НА-специфических антител IgG в сыворотках для каждой группы лечения.[00264] Immune responses elicited in response to administration of wild-type influenza HA proteins or VLPs or mutant influenza HA proteins or plant-derived VLPs can, for example, be observed in Balb/C mice. Serum samples collected from animals can be analyzed by ELISA for H3-specific total IgG and IgA antibodies. Mice immunized with wild-type influenza HA proteins or mutant plant-derived influenza HA proteins can exhibit HA-specific IgG antibody titers in the sera for each treatment group.

Экспрессия в растенияхExpression in plants

[00265] Конструкции по настоящему изобретению могут быть введены в клетки растений с использованием плазмид Ti, плазмид Ri, векторов растительных вирусов, прямой трансформации ДНК, микроинъекции, электропорации и т.д. Для обзоров таких способов смотрите, например, Weissbach and Weissbach, Methods for Plant Molecular Biology, Academy Press, New York VIII, pp. 421-463 (1988); Geierson and Corey, Plant Molecular Biology, 2d Ed. (1988) и Miki and Iyer, Fundamentals of Gene Transfer in Plants. In Plant Metabolism, 2d Ed. DT. Dennis, DH Turpin, DD Lefebrvre, DB Layzell (eds), Addison Wesly, Langmans Ltd. London, pp. 561-579 (1997). Другие способы предусматривают прямое поглощение ДНК, использование липосом, электропорацию, например, с использованием протопластов, микроинъекцию, микрочастицы или нитевидные кристаллы и вакуумную инфильтрацию. Смотрите, например, Bilang, et al. (1991, Gene 100: 247-250), Scheid et al. (1991, Mol. Gen. Genet. 228: 104-112), Guerche et al. (1987, Plant Science 52: 111-116), Neuhause et al. (1987, Theor. Appl Genet. 75: 30-36), Klein et al. (2987, Nature 327: 70-73); Freeman et al. (1984, Plant Cell Physiol. 29: 1353), Howell et al. (1985, Science 227: 1229-1231), DeBlock et al. (1989, Plant Physiology 91: 694-701), Способы молекулярной биологии растений (Weissbach and Weissbach, eds., Academic Press Inc., 1988), Способы в молекулярной биологии растений (Schuler and Zielinski, eds., Academic Press Inc., 1989), публикации международной заявки WO 92/09696, WO 94/00583, Европейские патенты ЕР 331083, ЕР 175966, Liu and Lomonossoff (2002, J Virol Meth, 105: 343-348), Европейский патент ЕР 290395; публикацию международной заявки WO 8706614; патенты США №4945050; 5036006 и 5100792, заявку на патент США №08/438666, поданную 10 мая 1995 г., и 07/951715, поданную 25 сентября 1992 г. (все они включены в настоящий документ посредством ссылки).[00265] The constructs of the present invention can be introduced into plant cells using Ti plasmids, Ri plasmids, plant virus vectors, direct DNA transformation, microinjection, electroporation, etc. For reviews of such methods, see, for example, Weissbach and Weissbach, Methods for Plant Molecular Biology, Academy Press, New York VIII, pp. 421-463 (1988); Geierson and Corey, Plant Molecular Biology, 2d Ed. (1988) and Miki and Iyer, Fundamentals of Gene Transfer in Plants. In Plant Metabolism, 2d Ed. D.T. Dennis, D. H. Turpin, D. D. Lefebrevre, D. B. Layzell (eds), Addison Wesly, Langmans Ltd. London, pp. 561-579 (1997). Other methods include direct DNA uptake, liposomes, electroporation such as using protoplasts, microinjection, microparticles or whiskers, and vacuum infiltration. See, for example, Bilang, et al. (1991, Gene 100: 247-250), Scheid et al. (1991, Mol. Gen. Genet. 228: 104-112), Guerche et al. (1987, Plant Science 52: 111-116), Neuhause et al. (1987, Theor. Appl Genet. 75: 30-36), Klein et al. (2987, Nature 327: 70-73); Freeman et al. (1984, Plant Cell Physiol. 29: 1353), Howell et al. (1985, Science 227: 1229-1231), DeBlock et al. (1989, Plant Physiology 91: 694-701), Techniques in Plant Molecular Biology (Weissbach and Weissbach, eds., Academic Press Inc., 1988), Techniques in Plant Molecular Biology (Schuler and Zielinski, eds., Academic Press Inc., 1989), publication of international application WO 92/09696, WO 94/00583, European patents EP 331083, EP 175966, Liu and Lomonossoff (2002, J Virol Meth, 105: 343-348), European patent EP 290395; publication of international application WO 8706614; US Patents No. 4,945,050; 5,036,006 and 5,100,792, US Patent Application No. 08/438666, filed May 10, 1995, and 07/951715, filed September 25, 1992 (all of which are incorporated herein by reference).

[00266] Способы временной экспрессии могут быть использованы для экспрессии конструкций по настоящему изобретению (смотрите публикации D'Aoust et al., 2009, Methods in molecular biology, Vol 483, pages 41-50; Liu and Lomonossoff, 2002, Journal of Virological Methods, 105:343-348, которые включены в настоящий документ посредством ссылки). Альтернативно, способ временной экспрессии на основе вакуума, как описано в публикации Kapila et al. (1997, Plant Sci. 122, 101-108; которая включена в настоящий документ посредством ссылки) или публикациях международных заявок WO 00/063400, WO 00/037663 (которые включены в настоящий документ посредством ссылки). Эти способы могут включать в себя, например, без ограничения, способ агроинокуляции или агроинфильтрации, шприцевой инфильтрации, однако, как указано выше, могут также использоваться другие временные способы. При агроинокуляции, агроинфильтрации или шприцевой инфильтрации смесь агробактерий, содержащая желаемую нуклеиновую кислоту, проникает в межклеточные пространства ткани, например, в листья, надземную часть растения (включая в себя стебель, листья и цветок), другие часть растения (стебель, корень, цветок) или все растение. После пересечения эпидермиса агробактерий инфицируют и переносят копии т-ДНК в клетки. т-ДНК транскрибируется эписомально, а мРНК транслируется, что приводит к производству представляющего интерес белка в инфицированных клетках, однако прохождение т-ДНК внутри ядра является временным.[00266] Transient expression methods can be used to express constructs of the present invention (see D'Aoust et al., 2009, Methods in molecular biology, Vol 483, pages 41-50; Liu and Lomonossoff, 2002, Journal of Virological Methods , 105:343-348, which are incorporated herein by reference). Alternatively, a vacuum-based transient expression method as described in Kapila et al. (1997, Plant Sci. 122, 101-108; which is incorporated herein by reference) or international application publications WO 00/063400, WO 00/037663 (which are incorporated herein by reference). These methods may include, for example, without limitation, agroinoculation or agroinfiltration, syringe infiltration, however, as noted above, other temporary methods may also be used. During agroinoculation, agroinfiltration or syringe infiltration, a mixture of agrobacteria containing the desired nucleic acid penetrates into the intercellular spaces of the tissue, for example, into the leaves, the aerial part of the plant (including the stem, leaves and flower), and other parts of the plant (stem, root, flower) or the whole plant. After crossing the epidermis, Agrobacterium infects and transfers copies of t-DNA into cells. t-DNA is transcribed episomally and mRNA is translated, resulting in the production of the protein of interest in infected cells, but passage of t-DNA within the nucleus is transient.

[00267] Также рассматриваемой частью настоящего изобретения являются трансгенные растения, растительные клетки или семена, содержащие генную конструкцию по настоящему изобретению, которые можно использовать в качестве платформенных растений, подходящих для описанной в настоящем документе временной экспрессии белка. Способы регенерации целых растений из растительных клеток также известны в настоящей области техники (например, смотрите Guerineau and Mullineaux (1993, Plant transformation and expression vectors. In: Plant Molecular Biology Labfax (Croy RRD ed) Oxford, BIOS Scientific Publishers, pp. 121-148). Как правило, трансформированные растительные клетки культивируют в подходящей среде, которая может содержать селективные средства, такие как антибиотики, причем селектируемые маркеры используются для облегчения идентификации трансформированных растительных клеток. После образования каллуса образование побегов можно стимулировать с помощью соответствующих гормонов растений в соответствии с известными способами, и побеги переносят в среду для укоренения для регенерации растений. Затем растения можно использовать для создания повторяющихся поколений либо из семян, либо с использованием способов вегетативного размножения. Трансгенные растения также могут быть получены без использования культуры ткани. Способы стабильной трансформации и регенерации этих организмов известны в настоящей области техники и известны специалисту в настоящей области техники. Доступные способы рассмотрены в Vasil et al. (Cell Culture and Somatic Cell Genetics of Plants, VoI I, II and III, Laboratory Procedures and Their Applications, Academic Press, 1984) и Weissbach and Weissbach (Methods for Plant Molecular Biology, Academic Press, 1989). Способ получения трансформированных и регенерированных растений не является критическим для настоящего изобретения.[00267] Also contemplated by the present invention are transgenic plants, plant cells or seeds containing a gene construct of the present invention that can be used as platform plants suitable for the transient protein expression described herein. Methods for regenerating whole plants from plant cells are also known in the art (for example, see Guerineau and Mullineaux (1993, Plant transformation and expression vectors. In: Plant Molecular Biology Labfax (Croy RRD ed) Oxford, BIOS Scientific Publishers, pp. 121- 148) Typically, the transformed plant cells are cultured in a suitable medium, which may contain selective agents such as antibiotics, with selectable markers being used to facilitate identification of the transformed plant cells.Once callus is formed, shoot formation can be stimulated using appropriate plant hormones according to known methods, and the shoots are transferred to a rooting medium to regenerate the plants.The plants can then be used to create repeat generations either from seed or using vegetative propagation methods.Transgenic plants can also be produced without the use of tissue culture. Methods for stable transformation and regeneration of these organisms are known in the art and are known to one skilled in the art. Available methods are reviewed in Vasil et al. (Cell Culture and Somatic Cell Genetics of Plants, VoI I, II and III, Laboratory Procedures and Their Applications, Academic Press, 1984) and Weissbach and Weissbach (Methods for Plant Molecular Biology, Academic Press, 1989). The method of obtaining transformed and regenerated plants is not critical to the present invention.

[00268] Если растения, части растений или растительные клетки должны быть трансформированы или котрансформированы двумя или более конструкциями нуклеиновых кислот, конструкция нуклеиновой кислоты может быть введена в Agrobacterium за один этап трансфекции, так что нуклеиновые кислоты объединяются и бактериальные клетки трансфицируются. В качестве альтернативы конструкции можно вводить серийно. В этом случае первую конструкцию вводят в Agrobacterium, как описано, клетки выращивают в селективных условиях (например, в присутствии антибиотика), где могут расти только однократно трансформированные бактерии. После этого первого этапа отбора в Agrobacterium вводят вторую конструкцию нуклеиновой кислоты, как описано, и клетки выращивают в условиях двойной селекции, при которых могут расти только дважды трансформированные бактерии. Затем дважды трансформированные бактерии могут быть использованы для трансформации растения, части растения или растительной клетки, как описано в настоящем документе, или могут быть подвергнуты дополнительной стадии трансформации для размещения третьей конструкции нуклеиновой кислоты.[00268] If plants, plant parts, or plant cells are to be transformed or cotransformed with two or more nucleic acid constructs, the nucleic acid construct can be introduced into Agrobacterium in a single transfection step such that the nucleic acids are combined and the bacterial cells are transfected. Alternatively, constructs can be introduced serially. In this case, the first construct is introduced into Agrobacterium as described, and the cells are grown under selective conditions (eg, in the presence of an antibiotic) where only singly transformed bacteria can grow. After this first selection step, a second nucleic acid construct is introduced into the Agrobacterium as described, and the cells are grown under double selection conditions in which only the doubly transformed bacteria can grow. The doubly transformed bacteria can then be used to transform a plant, part of a plant, or a plant cell as described herein, or may be subjected to an additional transformation step to accommodate a third nucleic acid construct.

[00269] Альтернативно, если растения, части растений или растительные клетки должны быть трансформированы или котрансформированы двумя или более конструкциями нуклеиновых кислот, конструкция нуклеиновой кислоты может быть введена в растение путем совместной инфильтрации смеси клеток Agrobacterium растения, части растения или растительной клетки, каждая клетка Agrobacterium может содержать одну или более конструкций для введения в растение. Для изменения относительных уровней экспрессии в растении, части растения или растительной клетке представляющей интерес нуклеотидной последовательности внутри конструкции во время стадии инфильтрации можно варьировать концентрацию различных популяций Agrobacteria, содержащих желаемые конструкции.[00269] Alternatively, if plants, plant parts, or plant cells are to be transformed or cotransformed with two or more nucleic acid constructs, the nucleic acid construct can be introduced into the plant by co-infiltrating a mixture of Agrobacterium cells of the plant, plant part, or plant cell, each Agrobacterium cell may contain one or more structures for introduction into the plant. To change the relative levels of expression in a plant, plant part, or plant cell of a nucleotide sequence of interest within a construct during the infiltration step, the concentration of different populations of Agrobacteria containing the desired constructs can be varied.

[00270] Настоящее изобретение будет дополнительно проиллюстрировано следующими примерами.[00270] The present invention will be further illustrated by the following examples.

Пример 1. Конструкции НА гриппаExample 1. Influenza HA constructs

[00271] Конструкции НА гриппа получали с использованием способов, хорошо известных в настоящей области техники. Например, Н3 A-Switzerland/9715293/13 НА дикого типа, N382A A/Switzerland/9715293/13 Н3 НА и CysTM A-Switzerland-9715293-13 клонировали, как описано ниже. Других мутантов Н3 НА получали с использованием аналогичных способов, и праймеры, матрицы и продукты последовательностей НА описаны в примере 3 (производство НА и VLP гриппа в растениях) и в таблице 4.[00271] Influenza HA constructs were prepared using methods well known in the art. For example, wild-type H3 A-Switzerland/9715293/13 HA, N382A A/Switzerland/9715293/13 H3 HA, and CysTM A-Switzerland-9715293-13 were cloned as described below. Other H3 HA mutants were produced using similar methods, and the primers, templates and HA sequence products are described in Example 3 (Production of HA and Influenza VLPs in Plants) and Table 4.

[00272] Краткое описание белков НА дикого типа и мутантов, праймеров, матриц и продуктов представлено в таблице 4 ниже. Для конструкций Н3 гриппа, отличных от белков Н3 A/Switzerland/9715293/13 НА, которые клонировали в клонирующий вектор 1190 без М2, используемый клонирующий вектор интегрирует ген ионного канала гриппа М2 под контролем промотора и терминатора пластоцианина люцерны в дополнение к кассете экспрессии на основе промотора 2X35S/CPMV 160+CPMV 3'UTR/NOS. Плазмиду номер 3556 (SEQ ID NO: 66; фиг. 5А) расщепляли рестрикционными эндонуклеазами SacII и StuI и использовали для реакции In-Fusion.[00272] A summary of wild-type and mutant HA proteins, primers, templates, and products is presented in Table 4 below. For influenza H3 constructs other than the A/Switzerland/9715293/13 HA H3 proteins that are cloned into the M2-less 1190 cloning vector, the cloning vector used integrates the influenza M2 ion channel gene under the control of the alfalfa plastocyanin promoter and terminator in addition to the expression cassette based on promoter 2X35S/CPMV 160+CPMV 3'UTR/NOS. Plasmid number 3556 (SEQ ID NO: 66; Fig. 5A) was digested with restriction endonucleases SacII and StuI and used for the In-Fusion reaction.

Модификация Н3 НАModification N3 NA

2X35S/CPMV 160/PDISP-HA0 Н3 A-Switzerland-9715293-13/NOS (конструкция номер 2801)2X35S/CPMV 160/PDISP-HA0 Н3 A-Switzerland-9715293-13/NOS (design number 2801)

[00273] Последовательность, кодирующую зрелый НА0 из НА гриппа из Н3 A/Switzerland/9715293/13, слитую с сигнальным пептидом секреции PDI люцерны (PDISP), клонировали в систему экспрессии 2X35S/CPMV 160/NOS с использованием следующего способа на основе ПЦР. Фрагмент, содержащий кодирующую последовательность PDISP-Н3 A/Switzerland/9715293/13, амплифицировали с использованием праймеров IF-CPMV (fl5'UTR) _SpPDI.c (SEQ ID NO: 15) и IF-H3A-Ala.r (SEQ ID NO: 17), используя последовательность гена PDISP-H1 A/Switzerland/9715293/13 (SEQ ID NO: 9) в качестве матрицы. Продукт ПЦР клонировали в системе экспрессии 2X35S/CPMV 160/NOS с использованием системы клонирования In-Fusion (Clontech, Mountain View, CA). Конструкцию номер 1190 (фиг. 5В) расщепляли рестрикционными эндонуклеазами SacII и StuI, и линеаризованную плазмиду использовали для реакции сборки In-Fusion. Конструкция номер 1190 представляет собой акцепторную плазмиду, предназначенную для клонирования «In Fusion» представляющих интерес генов в кассете экспрессии на основе 2X35S/CPMV 160/NOS. Она также включает в себя генную конструкцию для коэкспрессии супрессора сайленсинга TBSV Ρ19 под промотором и терминатором гена пластоцианина люцерны. Каркас представляет собой бинарную плазмиду pCAMBIA, а последовательность от левой границы к правой границе т-ДНК представлена в SEQ ID NO: 62. Полученной конструкции был присвоен номер 2801 (SEQ ID NO: 103). Аминокислотная последовательность зрелого НА0 из НА гриппа из A/Switzerland/9715293/13, слитого с сигнальным пептидом секреции PDI люцерны (PDISP), представлена в SEQ ID NO: 10. Представление плазмиды 2801 представлено на фиг. 8J.[00273] The coding sequence for mature HA0 from influenza HA from H3 A/Switzerland/9715293/13 fused to alfalfa PDI secretion signal peptide (PDISP) was cloned into the 2X35S/CPMV 160/NOS expression system using the following PCR-based method. The fragment containing the coding sequence PDISP-H3 A/Switzerland/9715293/13 was amplified using primers IF-CPMV (fl5'UTR) _SpPDI.c (SEQ ID NO: 15) and IF-H3A-Ala.r (SEQ ID NO : 17) using the PDISP-H1 gene sequence A/Switzerland/9715293/13 (SEQ ID NO: 9) as a template. The PCR product was cloned into the 2X35S/CPMV 160/NOS expression system using the In-Fusion cloning system (Clontech, Mountain View, CA). Construct number 1190 (Fig. 5B) was digested with the restriction endonucleases SacII and StuI, and the linearized plasmid was used for the In-Fusion assembly reaction. Construct number 1190 is an acceptor plasmid designed for In Fusion cloning of genes of interest into a 2X35S/CPMV 160/NOS based expression cassette. It also includes a gene construct for co-expression of the TBSV P19 silencing suppressor under the alfalfa plastocyanin gene promoter and terminator. The scaffold is the binary plasmid pCAMBIA, and the sequence from the left border to the right border of the t-DNA is shown in SEQ ID NO: 62. The resulting construct was assigned number 2801 (SEQ ID NO: 103). The amino acid sequence of mature HA0 from influenza HA from A/Switzerland/9715293/13 fused to alfalfa PDI secretion signal peptide (PDISP) is shown in SEQ ID NO: 10. A representation of plasmid 2801 is shown in FIG. 8J.

2X35S/CPMV 160/PDISP-HA0 Н3 A-Switzerland-9715293-13 (N382A)/NOS (конструкция номер 3023)2X35S/CPMV 160/PDISP-HA0 Н3 A-Switzerland-9715293-13 (N382A)/NOS (design number 3023)

[00274] Последовательность, кодирующую зрелый НА0 из НА гриппа из A/Switzerland/9715293/13 (N382A), слитую с сигнальным пептидом секреции PDI люцерны (PDISP), клонировали в систему экспрессии 2X35S/CPMV 160/NOS с использованием следующего способа на основе ПЦР. В первом раунде ПЦР фрагмент, содержащий PDISP-Н3 A/Switzerland/9715293/13 с мутированной аминокислотой N382A, амплифицировали с использованием праймеров IF-CPMV (fl5'UTR) SpPDI.c (SEQ ID NO: 15) и Н3_Swi (N382A).r (SEQ ID NO: 50), используя последовательность гена PDISP-H3 A/Switzerland/9715293/13 (SEQ ID NO: 9) в качестве матрицы. Второй фрагмент, содержащий мутацию N382A с оставшейся частью Н3 A/Switzerland/9715293/13, амплифицировали с использованием H3_Swi (N382A).c (SEQ ID NO: 51) и IF-H3A-Ala.r (SEQ ID NO: 17), используя последовательность гена PDISP-H3 A/Switzerland/9715293/13 (SEQ ID NO: 9) в качестве матрицы. Затем продукты ПЦР из обеих амплификации смешивали и использовали в качестве матрицы для второго раунда амплификации с использованием IF-CPMV (fl5'UTR)_SpPDI.c (SEQ ID NO: 15) и IF-H3A-Ala.r (SEQ ID NO: 17) в качестве праймеров. Конечный продукт ПЦР клонировали в системе экспрессии 2X35S/CPMV 160/NOS с использованием системы клонирования In-Fusion (Clontech, Mountain View, CA). Конструкцию номер 1190 (фиг. 5В) расщепляли рестрикционными эндонуклеазами SacII и StuI, и линеаризованную плазмиду использовали для реакции сборки In-Fusion. Конструкция номер 1190 представляет собой акцепторную плазмиду, предназначенную для клонирования «In Fusion» представляющих интерес генов в кассете экспрессии на основе 2X35S/CPMV 160/NOS. Она также включает в себя генную конструкцию для коэкспрессии супрессора сайленсинга TBSV Ρ19 под промотором и терминатором гена пластоцианина люцерны. Каркас представляет собой бинарную плазмиду pCAMBIA, а последовательность от левой границы к правой границе т-ДНК представлена в SEQ ID NO: 62. Полученной конструкции был присвоен номер 3023 (SEQ ID NO: 104). Аминокислотная последовательность мутированного PDISP-H3 A-Switzerland-9715293-13 (N382A) представлена в SEQ ID NO: 82. Представление плазмиды 3023 представлено на фиг. 4С.[00274] The sequence encoding mature HA0 from influenza HA from A/Switzerland/9715293/13 (N382A) fused to alfalfa PDI secretion signal peptide (PDISP) was cloned into the 2X35S/CPMV 160/NOS expression system using the following method based on PCR. In the first round of PCR, a fragment containing PDISP-H3 A/Switzerland/9715293/13 with the mutated amino acid N382A was amplified using primers IF-CPMV (fl5'UTR) SpPDI.c (SEQ ID NO: 15) and H3_Swi (N382A). r (SEQ ID NO: 50) using the PDISP-H3 gene sequence A/Switzerland/9715293/13 (SEQ ID NO: 9) as a template. A second fragment containing the N382A mutation with the remainder of H3 A/Switzerland/9715293/13 was amplified using H3_Swi (N382A).c (SEQ ID NO: 51) and IF-H3A-Ala.r (SEQ ID NO: 17), using the PDISP-H3 gene sequence A/Switzerland/9715293/13 (SEQ ID NO: 9) as a template. The PCR products from both amplifications were then mixed and used as template for a second round of amplification using IF-CPMV (fl5'UTR)_SpPDI.c (SEQ ID NO: 15) and IF-H3A-Ala.r (SEQ ID NO: 17 ) as primers. The final PCR product was cloned into the 2X35S/CPMV 160/NOS expression system using the In-Fusion cloning system (Clontech, Mountain View, CA). Construct number 1190 (Fig. 5B) was digested with the restriction endonucleases SacII and StuI, and the linearized plasmid was used for the In-Fusion assembly reaction. Construct number 1190 is an acceptor plasmid designed for In Fusion cloning of genes of interest into a 2X35S/CPMV 160/NOS based expression cassette. It also includes a gene construct for co-expression of the TBSV P19 silencing suppressor under the alfalfa plastocyanin gene promoter and terminator. The scaffold is the binary plasmid pCAMBIA, and the sequence from the left border to the right border of the t-DNA is shown in SEQ ID NO: 62. The resulting construct was assigned number 3023 (SEQ ID NO: 104). The amino acid sequence of the mutated PDISP-H3 A-Switzerland-9715293-13 (N382A) is shown in SEQ ID NO: 82. A representation of plasmid 3023 is shown in FIG. 4C.

2X35S/CPMV 160/PDISP-HA0 Н3 A-Switzerland-9715293-13 (CysTM)/NOS (конструкция номер 2811)2X35S/CPMV 160/PDISP-HA0 H3 A-Switzerland-9715293-13 (CysTM)/NOS (design number 2811)

[00275] Последовательность, кодирующую зрелый НА0 из НА гриппа из A/Switzerland/9715293/13 (CysTM), слитую с сигнальным пептидом секреции PDI люцерны (PDISP), клонировали в систему экспрессии 2X35S/CPMV 160/NOS с использованием следующего способа на основе ПЦР. В первом раунде ПЦР фрагмент, содержащий PDISP-Н3 A/Switzerland/9715293/13 с мутированными аминокислотами CysTM, амплифицировали с использованием праймеров IF-CPMV (fl5'UTR) SpPDI.c (SEQ ID NO: 15) и Н3_Swi_SLVLL.r (SEQ ID NO: 18), используя последовательность гена PDISP-H3 A/Switzerland/9715293/13 (SEQ ID NO: 9) в качестве матрицы. Второй фрагмент, содержащий мутации CysTm с оставшейся частью Н3 A/Switzerland/9715293/13, амплифицировали с использованием Н3_Swi_SLVLL.c (SEQ ID NO: 19) и IF-H3A-Ala.r (SEQ ID NO: 17), используя последовательность гена PDISP-H3 A/Switzerland/9715293/13 (SEQ ID NO: 9) в качестве матрицы. Затем продукты ПЦР из обеих амплификации смешивали и использовали в качестве матрицы для второго раунда амплификации с использованием IF-CPMV (fl5TJTR)_SpPDI.c (SEQ ID NO: 15) и IF-H3A-Ala.r (SEQ ID NO: 17) в качестве праймеров. Конечный продукт ПЦР клонировали в системе экспрессии 2X35S/CPMV 160/NOS с использованием системы клонирования In-Fusion (Clontech, Mountain View, CA). Конструкцию номер 1190 (фиг. 5В) расщепляли рестрикционными эндонуклеазами SacII и StuI, и линеаризованную плазмиду использовали для реакции сборки In-Fusion. Конструкция номер 1190 представляет собой акцепторную плазмиду, предназначенную для клонирования «In Fusion» представляющих интерес генов в кассете экспрессии на основе 2X35S/CPMV 160/NOS. Она также включает в себя генную конструкцию для совместной экспрессии супрессора сайленсинга TBSV Ρ19 под промотором и терминатором гена пластоцианина люцерны. Каркас представляет собой бинарную плазмиду pCAMBIA, а последовательность от левой границы к правой границе т-ДНК представлена в SEQ ID NO: 62. Полученной конструкции был присвоен номер 2811 (SEQ ID NO: 105). Аминокислотная последовательность мутированного PDISP-H3 А-Switzerland-9715293-13 (CysTM) представлена в SEQ ID NO: 49. Представление плазмиды 2811 представлено на фиг. 8K.[00275] The sequence encoding mature HA0 from influenza HA from A/Switzerland/9715293/13 (CysTM) fused to alfalfa PDI secretion signal peptide (PDISP) was cloned into the 2X35S/CPMV 160/NOS expression system using the following method based on PCR. In the first round of PCR, a fragment containing PDISP-H3 A/Switzerland/9715293/13 with mutated CysTM amino acids was amplified using primers IF-CPMV (fl5'UTR) SpPDI.c (SEQ ID NO: 15) and H3_Swi_SLVLL.r (SEQ ID NO: 18) using the PDISP-H3 gene sequence A/Switzerland/9715293/13 (SEQ ID NO: 9) as a template. A second fragment containing the CysTm mutations with the remainder of H3 A/Switzerland/9715293/13 was amplified using H3_Swi_SLVLL.c (SEQ ID NO: 19) and IF-H3A-Ala.r (SEQ ID NO: 17) using the gene sequence PDISP-H3 A/Switzerland/9715293/13 (SEQ ID NO: 9) as a matrix. The PCR products from both amplifications were then mixed and used as a template for a second round of amplification using IF-CPMV (fl5TJTR)_SpPDI.c (SEQ ID NO: 15) and IF-H3A-Ala.r (SEQ ID NO: 17) in as primers. The final PCR product was cloned into the 2X35S/CPMV 160/NOS expression system using the In-Fusion cloning system (Clontech, Mountain View, CA). Construct number 1190 (Fig. 5B) was digested with the restriction endonucleases SacII and StuI, and the linearized plasmid was used for the In-Fusion assembly reaction. Construct number 1190 is an acceptor plasmid designed for In Fusion cloning of genes of interest into a 2X35S/CPMV 160/NOS based expression cassette. It also includes a gene construct for co-expression of the TBSV P19 silencing suppressor under the alfalfa plastocyanin gene promoter and terminator. The scaffold is the binary plasmid pCAMBIA, and the sequence from the left border to the right border of the t-DNA is shown in SEQ ID NO: 62. The resulting construct was assigned number 2811 (SEQ ID NO: 105). The amino acid sequence of the mutated PDISP-H3 A-Switzerland-9715293-13 (CysTM) is shown in SEQ ID NO: 49. A representation of plasmid 2811 is shown in FIG. 8K.

Пример 2: СпособыExample 2: Methods

Трансфекция Agrobacterium tumefaciensTransfection of Agrobacterium tumefaciens

[00276] Штамм AGL1 Agrobacterium tumefaciens трансфицировали электропорацией векторами экспрессии НА гриппа дикого типа или мутантного НА гриппа с использованием способов, описанных D'Aoust et al., 2008 (Plant Biotech. J. 6:930-40). Трансфицированные Agrobacterium выращивали в среде YEB с добавлением 10 мМ 2-(N-морфолино)этансульфоновой кислоты (MES), 20 мкМ ацетосирингона, 50 мкг/мл канамицина и 25 мкг/мл карбенициллина с рН 5,6 до OD600 от 0,6 до 1,6. Суспензии Agrobacterium перед использованием центрифугировали и ресуспендировали в среде для инфильтрации (10 мМ MgCl2 и 10 мМ MES рН 5,6).[00276] Agrobacterium tumefaciens strain AGL1 was transfected by electroporation with wild-type influenza HA or mutant influenza HA expression vectors using methods described by D'Aoust et al., 2008 (Plant Biotech. J. 6:930-40). Transfected Agrobacterium were grown in YEB medium supplemented with 10 mM 2-(N-morpholino)ethanesulfonic acid (MES), 20 μM acetosyringone, 50 μg/ml kanamycin and 25 μg/ml carbenicillin with pH 5.6 to OD 600 from 0.6 up to 1.6. Agrobacterium suspensions were centrifuged and resuspended in infiltration medium (10 mM MgCl 2 and 10 mM MES pH 5.6) before use.

Приготовление растительной биомассы, инокулята и агроинфильтрацияPreparation of plant biomass, inoculum and agroinfiltration

[00277] Растения N. benthamiana выращивали из семян на ровных поверхностях, заполненных коммерческим субстратом из торфяного мха. Растениям позволяли расти в теплице при фотопериоде 16/8 и температурном режиме 25°С днем/20°С ночью. Через три недели после посева собирали отдельные ростки, пересаживали в горшки и оставляли для роста в теплице еще на три недели при тех же условиях окружающей среды.[00277] N. benthamiana plants were grown from seeds on level surfaces filled with a commercial peat moss substrate. Plants were allowed to grow in a greenhouse with a photoperiod of 16/8 and a temperature regime of 25°C during the day/20°C at night. Three weeks after sowing, individual seedlings were collected, transplanted into pots, and left to grow in the greenhouse for a further three weeks under the same environmental conditions.

[00278] Агробактерии, трансфицированные каждым экспрессирующим вектором НА гриппа дикого типа или мутантным НА гриппа, выращивали в среде YEB с добавлением 10 мМ 2-(N-морфолино)этансульфоновой кислоты (MES), 20 мкМ ацетосирингона, 50 мкг/мл канамицина и 25 мкМ мкг/мл карбенициллина рН 5,6 до тех пор, пока они не достигали OD600 от 0,6 до 1,6. Суспензии Agrobacterium центрифугировали перед использованием и ресуспендировали в среде для инфильтрации (10 мМ MgCl2 и 10 мМ MES рН 5,6) и хранили в течение ночи при температуре 4°С. В день инфильтрации партии культур разводили в 2,5 объемах культур и давали нагреться перед использованием. Целые растения N. benthamiana помещали вверх дном в бактериальную суспензию в герметичный резервуар из нержавеющей стали под вакуумом 20-40 мм рт.ст. на 2 мин. Растения возвращали в теплицу на 6 или 9 дней инкубационного периода до сбора урожая.[00278] Agrobacteria transfected with each wild-type influenza HA or mutant influenza HA expression vector were grown in YEB medium supplemented with 10 mM 2-(N-morpholino)ethanesulfonic acid (MES), 20 μM acetosyringone, 50 μg/ml kanamycin, and 25 µM µg/ml carbenicillin pH 5.6 until they reached an OD 600 of 0.6 to 1.6. Agrobacterium suspensions were centrifuged before use and resuspended in infiltration medium (10 mM MgCl 2 and 10 mM MES pH 5.6) and stored overnight at 4°C. On the day of infiltration, batches of cultures were diluted to 2.5 culture volumes and allowed to warm before use. Whole N. benthamiana plants were placed upside down in a bacterial suspension in a sealed stainless steel tank under a vacuum of 20–40 mmHg. for 2 min. Plants were returned to the greenhouse for a 6- or 9-day incubation period before harvest.

Сбор листьев и экстракция общего белкаLeaf collection and total protein extraction

[00279] Белки экстрагировали из свежей биомассы, разрезанной на части размером ~1 см2, путем ферментативной экстракции в течение ночи при комнатной температуре с использованием орбитального шейкера. Затем суспензию фильтровали через нейлоновый фильтр с большими порами для удаления грубой нерасщепленной растительной ткани.[00279] Proteins were extracted from fresh biomass cut into ~1 cm 2 pieces by enzymatic extraction overnight at room temperature using an orbital shaker. The suspension was then filtered through a large pore nylon filter to remove coarse, undegraded plant tissue.

[00280] Для получения «полных технологических выходов» суспензию центрифугировали для удаления протопластов и внутриклеточных загрязнений. Супернатант очищали глубокой фильтрацией. Осветленную фракцию затем загружали через катионообменную колонку со стадией ступенчатого элюирования с увеличивающимися концентрациями NaCl. Очищенные VLP концентрировали с помощью TFF, подвергали диафильтрации против буфера для состава и пропускали через фильтр. Содержание белка в очищенных VLP анализировали с помощью анализа ВСА, а активность анализировали с помощью анализа гемагглютинации. Относительные выходы получали путем сравнения выходов белков из новой конструкции и нативной конструкции (или с CysTM для штаммов Н3), использованной в качестве контроля[00280] To obtain “full process yields,” the suspension was centrifuged to remove protoplasts and intracellular contaminants. The supernatant was purified by deep filtration. The clarified fraction was then loaded through a cation exchange column with a stepwise elution step of increasing concentrations of NaCl. Purified VLPs were concentrated with TFF, diafiltered against formulation buffer, and passed through a filter. The protein content of the purified VLPs was analyzed by BCA assay, and activity was analyzed by hemagglutination assay. Relative yields were obtained by comparing protein yields from the new construct and the native construct (or with CysTM for H3 strains) used as a control

[00281] Для получения «выходов после градиента плотности» суспензию центрифугировали для удаления протопластов и внутриклеточных загрязнений. Супернатант дополнительно центрифугировали для удаления дополнительных частиц. Супернатант осветляли глубокой фильтрацией с использованием стекловолоконного фильтра. Затем осветленную фракцию загружали в прерывистый градиент плотности йодиксанола. Центрифугирование в градиенте плотности разделения выполняли следующим образом: готовили пробирки объемом 38 мл, содержащие прерывистый градиент плотности йодиксанола в Трис-буфере (последовательные слои из 35%, 30%, 25%, 20%, 15, 10% и 5%), которые покрывали осветленным экстрактом. Градиенты центрифугировали при 120000 g в течение 2 часов (4°С). После центрифугирования первые 5 мл, собранные снизу вверх, отбрасывали, а следующие 5 мл собирали для анализа содержания белка (ВСА), измерения активности (анализ гемагглютинации) и измерения интенсивности полосы НА0 на ДСН-ПААГ в восстановленных условиях (денситометрия). Относительные выходы получали путем сравнения интенсивности полосы НА0 от новой конструкции с нативной конструкцией (или CysTM для штаммов Н3), использованной в качестве контроля.[00281] To obtain “density gradient yields,” the suspension was centrifuged to remove protoplasts and intracellular contaminants. The supernatant was further centrifuged to remove additional particles. The supernatant was clarified by deep filtration using a glass fiber filter. The clarified fraction was then loaded onto a discontinuous iodixanol density gradient. Density gradient centrifugation was performed as follows: Prepare 38 ml tubes containing a discontinuous density gradient of iodixanol in Tris buffer (successive layers of 35%, 30%, 25%, 20%, 15, 10% and 5%) which covered with clarified extract. The gradients were centrifuged at 120,000 g for 2 hours (4°C). After centrifugation, the first 5 ml collected from bottom to top were discarded and the next 5 ml were collected for protein content analysis (BCA), activity measurement (hemagglutination assay) and measurement of the intensity of the HA0 band on SDS-PAGE under reduced conditions (densitometry). Relative yields were obtained by comparing the intensity of the HA0 band from the new construct with the native construct (or CysTM for H3 strains) used as a control.

Анализ гемагглютинацииHemagglutination assay

[00282] Анализ гемагглютинации основывался на способе, описанном Nayak and Reichl (2004). Вкратце, последовательные двойные разведения исследуемых образцов (100 мкл) проводили в 96-луночных микротитрационных планшетах с V-образным дном, содержащих 100 мкл PBS, оставляя 100 мкл разбавленного образца на лунку. В каждую лунку добавляли сто микролитров 0,5% суспензии эритроцитов морской свинки (Bio Link Inc., Сиракузы, Нью-Йорк), и планшеты инкубировали в течение 2 часов при комнатной температуре. Обратную величину наивысшего разведения, показывающую полную гемагглютинацию, регистрировали как активность НА. Параллельно, рекомбинантный стандарт НА (A/Vietnam/1203/2004 H5N1) (Protein Science Corporation, Мериден, Коннектикут) разводили в PBS и использовали в качестве контроля на каждом планшете.[00282] The hemagglutination assay was based on the method described by Nayak and Reichl (2004). Briefly, serial twofold dilutions of test samples (100 μl) were performed in 96-well V-bottom microtiter plates containing 100 μl PBS, leaving 100 μl of diluted sample per well. One hundred microliters of 0.5% guinea pig red blood cell suspension (Bio Link Inc., Syracuse, NY) was added to each well, and the plates were incubated for 2 hours at room temperature. The reciprocal of the highest dilution indicating complete hemagglutination was recorded as HA activity. In parallel, recombinant HA standard (A/Vietnam/1203/2004 H5N1) (Protein Science Corporation, Meriden, CT) was diluted in PBS and used as a control on each plate.

Анализ белков и иммуноблоттингProtein analysis and immunoblotting

[00283] Иммуноблоттинг выполняли при первой инкубации с первичным моноклональным антителом, разведенным 1/500 в 2% обезжиренном молоке в 0,1% TBS-Tween 20. Конъюгированные с пероксидазой козьи антитела к мышиным (Jackson Immunoresearch, номер по каталогу 115-035-146), разведенные 1/10000, использовали в качестве вторичных антител для обнаружения хемилюминесценции в 2% обезжиренном молоке в TBS-Tween 20 0,1%. Иммунореактивные комплексы определяли хемилюминесценцией с использованием люминола в качестве субстрата (Roche Diagnostics Corporation). Конъюгацию человеческого антитела IgG с ферментом пероксидазой хрена проводили с использованием набора для конъюгации активированной пероксидазы EZ-Link Plus® (Pierce, Rockford, Ill.).[00283] Immunoblotting was performed on the first incubation with the primary monoclonal antibody diluted 1/500 in 2% skim milk in 0.1% TBS-Tween 20. Peroxidase-conjugated goat anti-mouse antibody (Jackson Immunoresearch, catalog number 115-035- 146), diluted 1/10,000, were used as secondary antibodies to detect chemiluminescence in 2% skim milk in TBS-Tween 20 0.1%. Immunoreactive complexes were detected by chemiluminescence using luminol as a substrate (Roche Diagnostics Corporation). Conjugation of human IgG antibody to horseradish peroxidase enzyme was performed using the EZ-Link Plus® Activated Peroxidase Conjugation Kit (Pierce, Rockford, Ill.).

Пример 3: Производство НА и VLP гриппа в растенияхExample 3: Production of influenza HA and VLP in plants

Модификация Н3 НА IModification N3 NA I

[00284] Конструкции НА гриппа получали с использованием способов, хорошо известных в настоящей области техники (смотрите пример 1). Краткое описание белков НА дикого типа и мутировавших белков НА, праймеров, матриц и продуктов представлено в таблице 4 ниже. Используемые последовательности представлены в примере 4 и в списке последовательностей.[00284] Influenza HA constructs were prepared using methods well known in the art (see Example 1). A summary of wild-type and mutated HA proteins, primers, templates, and products is presented in Table 4 below. The sequences used are presented in example 4 and in the sequence list.

Мутант N382A A/Switzerland/9715293/13 Н3Mutant N382A A/Switzerland/9715293/13 H3

Мутант N382A A/Switzerland/9715293/13 Н3 (конструкция №3023) конструировали путем мутации аспарагина в положении 382 A/Switzerland/9715293/13 Н3 дикого типа в аланин. Как показано на фиг. 2, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3023, показали приблизительно 30%-ное увеличение титра гемагглютинации экстрактами из растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).The N382A A/Switzerland/9715293/13 H3 mutant (design #3023) was constructed by mutating the asparagine at position 382 of wild-type A/Switzerland/9715293/13 H3 to alanine. As shown in FIG. 2, purified extracts of N. benthamiana plants agroinfiltrated using design #3023 showed an approximately 30% increase in hemagglutination titer with extracts from N. benthamiana plants agroinfiltrated with wild type A/Switzerland/9715293/13 H3 (design #2801) .

Мутант L384VA/Switzerland/9715293/13 Н3Mutant L384VA/Switzerland/9715293/13 H3

[00285] Мутант L384V A/Switzerland/9715293/13 Н3 (конструкция №3034) конструировали путем мутации лейцина в положении 384 A/Switzerland/9715293/13 Н3 дикого типа в валин. Как показано на фиг. 2, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3034, демонстрировали приблизительно 100%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованными с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).[00285] The L384V A/Switzerland/9715293/13 H3 mutant (design #3034) was constructed by mutating the leucine at position 384 of the wild-type A/Switzerland/9715293/13 H3 to valine. As shown in FIG. 2, purified N. benthamiana plant extracts agroinfiltrated using construct #3034 showed an approximately 100% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using wild type A/Switzerland/9715293/13 H3 (design no. 2801).

Мутант F392D A/Switzerland/9715293/13 Н3Mutant F392D A/Switzerland/9715293/13 H3

[00286] Мутант F392D A/Switzerland/9715293/13 Н3 конструировали путем мутации фенилаланина в положении 392 A/Switzerland/9715293/13 Н3 дикого типа в аспарагиновую кислоту (конструкция №3045). Как показано на фиг. 2, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3045, демонстрировали приблизительно 40%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованными с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).[00286] The F392D A/Switzerland/9715293/13 H3 mutant was constructed by mutating the phenylalanine at position 392 of the wild type A/Switzerland/9715293/13 H3 to aspartic acid (design #3045). As shown in FIG. 2, purified N. benthamiana plant extracts agroinfiltrated using construct #3045 showed an approximately 40% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using wild type A/Switzerland/9715293/13 H3 (design no. 2801).

Мутант L431M A/Switzerland/9715293/13 Н3Mutant L431M A/Switzerland/9715293/13 H3

[00287] Мутант L431M A/Switzerland/9715293/13 Н3 конструировали путем мутации лейцина в положении 431 A/Switzerland/9715293/13 Н3 дикого типа в метионин (конструкция №3022). Как показано на фиг. 2, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3022, демонстрировали приблизительно 70%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованными с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2811).[00287] The L431M A/Switzerland/9715293/13 H3 mutant was constructed by mutating the leucine at position 431 of wild-type A/Switzerland/9715293/13 H3 to methionine (design #3022). As shown in FIG. 2, purified N. benthamiana plant extracts agroinfiltrated using construct #3022 showed an approximately 70% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using wild type A/Switzerland/9715293/13 H3 (design no. 2811).

[00288] Одна или более описанных в настоящем документе мутаций специфически увеличивают продукцию белка НА гриппа и выход VLP у растений. Было замечено, что мутации в других положениях значительно снижали или не оказывали значительного влияния на накопление белка НА гриппа или продукцию VLP в растительных клетках.[00288] One or more mutations described herein specifically increase influenza HA protein production and VLP yield in plants. It was observed that mutations at other positions significantly reduced or had no significant effect on influenza HA protein accumulation or VLP production in plant cells.

[00289] Повышенные титры гемагглютинации, достигаемые с белками НА гриппа, содержащими одну или более описанных в настоящем документе мутаций, также наблюдались как специфические для НА гриппа. Подобное увеличение не наблюдалось у растений, агроинфильтрованных конструкциями, кодирующими мутантные НА гриппа, полученные из штаммов, не относящихся к Н3.[00289] Increased hemagglutination titers achieved with influenza HA proteins containing one or more of the mutations described herein have also been observed to be specific for influenza HA. A similar increase was not observed in plants agroinfiltrated with constructs encoding mutant influenza HAs derived from non-H3 strains.

[00290] Например, мутант Н5 F393D A/Indonesia/5/2005 конструировали путем мутации фенилаланина в положении 393 A/Indonesia/5/2005 Н5 дикого типа в аспарагиновую кислоту (конструкция №3680). Как показано на фиг. 3, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3680, демонстрировали приблизительно 98%-ное снижение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Indonesia/5/2005 Н5 дикого типа (конструкция №2295).[00290] For example, the H5 mutant F393D A/Indonesia/5/2005 was constructed by mutating the phenylalanine at position 393 of wild-type A/Indonesia/5/2005 H5 to aspartic acid (design #3680). As shown in FIG. 3, purified N. benthamiana plant extracts agroinfiltrated with construct #3680 exhibited approximately 98% reduction in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated with wild type A/Indonesia/5/2005 H5 (design no. 2295).

[00291] Точно так же очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием мутанта F392D A/Egypt/N04915/2014 Н5 (конструкция №3690), демонстрировали приблизительно 99%-ное снижение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Egypt/N04915/2014 Н5 дикого типа (конструкция №3645) (смотрите фиг. 3, таблицу 7).[00291] Similarly, purified N. benthamiana plant extracts agroinfiltrated with the F392D A/Egypt/N04915/2014 H5 mutant (design #3690) showed an approximately 99% reduction in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated using wild type A/Egypt/N04915/2014 H5 (design no. 3645) (see Fig. 3, table 7).

Модификация Н3 НА IIModification N3 NA II

Мутант CysTM A/Switzerland/9715293/13 Н3Mutant CysTM A/Switzerland/9715293/13 H3

[00292] Мутант CysTM A/Switzerland/9715293/13 Н3 (конструкция №2811) конструировали путем замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) A/Switzerland/9715293/13 Н3 дикого типа на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 6А, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №2811, показали приблизительно 60%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).[00292] The CysTM mutant A/Switzerland/9715293/13 H3 (design #2811) was constructed by replacing the sequence "CFLLC" at positions 524-528 (SEQ ID NO: 99) of wild type A/Switzerland/9715293/13 H3 with "SLVLL" " (SEQ ID NO: 98). As shown in FIG. 6A, purified extracts of N. benthamiana plants agroinfiltrated with construct #2811 showed an approximately 60% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated with wild type A/Switzerland/9715293/13 H3 (design no. 2801).

Мутант CysTM A/Pennsylvania/09/2015 Н3Mutant CysTM A/Pennsylvania/09/2015 H3

[00293] Мутант CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3313) конструировали путем замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) A/Pennsylvania/09/2015 Н3 дикого типа на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7С, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3313, демонстрировали приблизительно 100%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Pennsylvania/09/2015 Н3 дикого типа (конструкция №3312).[00293] The CysTM mutant A/Pennsylvania/09/2015 H3 (design #3313) was constructed by replacing the sequence "CFLLC" at positions 524-528 (SEQ ID NO: 99) A/Pennsylvania/09/2015 H3 wild type with "SLVLL" " (SEQ ID NO: 98). As shown in FIG. 7C, purified N. benthamiana plant extracts agroinfiltrated with construct #3313 exhibited an approximately 100% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated with wild type A/Pennsylvania/09/2015 H3 (design no. 3312).

Мутант N382A+CysTM A/Switzerland/9715293/13 Н3Mutant N382A+CysTM A/Switzerland/9715293/13 H3

[00294] Мутант N382A+CysTM A/Switzerland/9715293/13 Н3 (конструкция №3063) конструировали путем мутации аспарагина в положении 382 A/Switzerland/9715293/13 Н3 дикого типа в аланин и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7А, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3063, демонстрировали приблизительно 160%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801). Как дополнительно показано на фиг. 7В, растения N. benthamiana, агроинфильтрованные с использованием конструкции №3063, показали приблизительно 30%-ное увеличение выхода VLP после очистки в градиенте йодиксанола по сравнению с растениями, инфильтрованными с использованием мутанта CysTM A/Switzerland/9715293/13 Н3 (конструкция №2811).[00294] The N382A+CysTM A/Switzerland/9715293/13 H3 mutant (design #3063) was constructed by mutating the asparagine at position 382 of wild type A/Switzerland/9715293/13 H3 to alanine and replacing the sequence “CFLLC” at positions 524-528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7A, purified extracts of N. benthamiana plants agroinfiltrated using construct #3063 showed an approximately 160% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated with wild type A/Switzerland/9715293/13 H3 (design no. 2801). As further shown in FIG. 7B, N. benthamiana plants agroinfiltrated with construct #3063 showed an approximately 30% increase in VLP yield after iodixanol gradient purification compared to plants infiltrated with the CysTM mutant A/Switzerland/9715293/13 H3 (design #2811 ).

Мутант N382A+CysTM A/Pennsylvania/09/2015 Н3Mutant N382A+CysTM A/Pennsylvania/09/2015 H3

[00295] Мутант N382A+CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3314) конструировали путем мутации аспарагина в положении 382 A/Pennsylvania/09/2015 Н3 дикого типа в аланин и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7С, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3314, показали приблизительно 300%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Pennsylvania/09/2015 Н3 дикого типа (конструкция №3312).[00295] The N382A+CysTM A/Pennsylvania/09/2015 H3 mutant (design #3314) was constructed by mutating the asparagine at position 382 of wild type A/Pennsylvania/09/2015 H3 to alanine and replacing the sequence “CFLLC” at positions 524-528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7C, purified extracts of N. benthamiana plants agroinfiltrated with construct #3314 showed an approximately 300% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated with wild type A/Pennsylvania/09/2015 H3 (design no. 3312).

Мутант L384V+CysTM A/Switzerland/9715293/13 Н3Mutant L384V+CysTM A/Switzerland/9715293/13 H3

[00296] Мутант L384V+CysTM A/Switzerland/9715293/13 Н3 (конструкция №3074) конструировали путем мутации лейцина в положении 384 A/Switzerland/9715293/13 Н3 дикого типа в валин и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7С, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3074, продемонстрировали приблизительно 380%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801). Кроме того, как показано на фиг. 7В, растения N. benthamiana, агроинфильтрованные с использованием конструкции №3074, показали приблизительно 50%-ное увеличение выхода VLP после очистки градиентом сахарозы по сравнению с растениями, инфильтрованными с использованием мутанта CysTM A/Switzerland/9715293/13 Н3 (конструкциям 2811).[00296] The L384V+CysTM A/Switzerland/9715293/13 H3 mutant (design #3074) was constructed by mutating the leucine at position 384 of wild type A/Switzerland/9715293/13 H3 to valine and replacing the sequence “CFLLC” at positions 524-528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7C, purified extracts of N. benthamiana plants agroinfiltrated with construct #3074 showed an approximately 380% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated with wild type A/Switzerland/9715293/13 H3 (design no. 2801). Moreover, as shown in FIG. 7B, N. benthamiana plants agroinfiltrated with construct #3074 showed an approximately 50% increase in VLP yield after sucrose gradient purification compared to plants infiltrated with the CysTM mutant A/Switzerland/9715293/13 H3 (construct 2811).

Мутант L384V+CysTM A/Pennsylvania/09/2015 Н3Mutant L384V+CysTM A/Pennsylvania/09/2015 H3

[00297] Мутант L384V+CysTM A/Pennsylvania/09/2015 Н3 (конструкция №3315) конструировали путем мутации лейцина в положении 384 A/Pennsylvania/09/2015 Н3 дикого типа в валин и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7С, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3315, демонстрировали приблизительно 380%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованными с использованием A/Pennsylvania/09/2015 Н3 дикого типа (конструкция №3312).[00297] The L384V+CysTM A/Pennsylvania/09/2015 H3 mutant (design #3315) was constructed by mutating the leucine at position 384 of wild type A/Pennsylvania/09/2015 H3 to valine and replacing the sequence “CFLLC” at positions 524-528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7C, purified N. benthamiana plant extracts agroinfiltrated with construct #3315 exhibited an approximately 380% increase in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated with wild type A/Pennsylvania/09/2015 H3 (design no. 3312).

Мутант F392D+CysTM A/Switzerland/9715293/13 Н3Mutant F392D+CysTM A/Switzerland/9715293/13 H3

[00298] Мутант F392D+CysTM A/Switzerland/9715293/13 Н3 (конструкция №3085) конструировали путем мутации фенилаланина в положении 392 A/Switzerland/9715293/13 Н3 дикого типа в аспарагиновую кислоту и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7А, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3085, демонстрировали приблизительно 170%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).[00298] The F392D+CysTM A/Switzerland/9715293/13 H3 mutant (design #3085) was constructed by mutating the phenylalanine at position 392 of wild type A/Switzerland/9715293/13 H3 to aspartic acid and replacing the sequence “CFLLC” at positions 524- 528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7A, purified N. benthamiana plant extracts agroinfiltrated with construct #3085 showed an approximately 170% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated with wild type A/Switzerland/9715293/13 H3 (design no. 2801).

Мутант L431M+CysTM A/Switzerland/9715293/13 Н3Mutant L431M+CysTM A/Switzerland/9715293/13 H3

[00299] Мутант L431M+CysTM A/Switzerland/9715293/13 Н3 (конструкция №3062) конструировали путем мутации лейцина в положении 431 A/Switzerland/9715293/13 Н3 дикого типа в метионин и замещения последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) на «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7А, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3062, демонстрировали приблизительно 150%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Switzerland/9715293/13 Н3 дикого типа (конструкция №2801).[00299] The L431M+CysTM A/Switzerland/9715293/13 H3 mutant (design #3062) was constructed by mutating leucine at position 431 of wild type A/Switzerland/9715293/13 H3 to methionine and replacing the sequence “CFLLC” at positions 524-528 (SEQ ID NO: 99) to "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7A, purified extracts of N. benthamiana plants agroinfiltrated with construct #3062 showed an approximately 150% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated with wild type A/Switzerland/9715293/13 H3 (design no. 2801).

Мутант N382A+L384V+CysTM A/Hong Kong/4801/14 Н3Mutant N382A+L384V+CysTM A/Hong Kong/4801/14 H3

[00300] Мутант N382A+L384V+CysTM A/Hong Kong/4801/14 Н3 (конструкция №3375) конструировали путем мутации аспарагина в положении 382 A/Hong Kong/4801/14 дикого типа в остаток аланина, лейцина в положении 384 в остаток валина и последовательности «CFLLC» в положениях 524-528 (SEQ ID NO: 99) в «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7Е, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3375, демонстрировали приблизительно 300%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием мутанта CysTM A/Hong Kong/4801/14 Н3 (конструкция №3341).[00300] Mutant N382A+L384V+CysTM A/Hong Kong/4801/14 H3 (design no. 3375) was constructed by mutation of asparagine at position 382 of wild type A/Hong Kong/4801/14 to an alanine residue, leucine at position 384 to a residue valine and the sequence "CFLLC" at positions 524-528 (SEQ ID NO: 99) in "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7E, purified extracts of N. benthamiana plants agroinfiltrated using construct #3375 showed an approximately 300% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated using the CysTM A/Hong Kong/4801/14 H3 mutant (construct No. 3341).

Мутант N382A+L384V+CysTM A/Minnesota/40/15 Н3Mutant N382A+L384V+CysTM A/Minnesota/40/15 H3

[00301] Мутант N382A+L384V+CysTM A/Minnesota/40/15 Н3 (конструкция №3915) конструировали путем мутации аспарагина в положении 382 A/Minnesota/40/15 дикого типа в остаток аланина, лейцин в положении 384 в остаток валина и последовательность «CFLLC» в положениях 524-528 (SEQ ID NO: 99) в «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7Е, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3915, демонстрировали приблизительно 400%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием мутанта CysTM A/Minnesota/40/15 Н3 (конструкция №3914).[00301] Mutant N382A+L384V+CysTM A/Minnesota/40/15 H3 (design #3915) was constructed by mutating wild-type asparagine at position 382 of A/Minnesota/40/15 to an alanine residue, leucine at position 384 to a valine residue, and the sequence "CFLLC" at positions 524-528 (SEQ ID NO: 99) in "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7E, purified extracts of N. benthamiana plants agroinfiltrated using construct #3915 showed an approximately 400% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated using the CysTM A/Minnesota/40/15 H3 mutant (design no. 3914).

Мутант N382A+L384V+CysTM A/S. Australia/171 6 Н3Mutant N382A+L384V+CysTM A/S. Australia/171 6 H3

[00302] Мутант N382A+L384V+CysTM A/S. Australia/1/16 Н3 (конструкция №3925) конструировали путем мутации аспарагинав положении 382 A/S. Australia/1/16 дикого типа в остаток аланина, лейцин в положении 384 в остаток валина и последовательность «CFLLC» в положениях 524-528 (SEQ ID NO: 99) в «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7D и 7Е, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3925, демонстрировали приблизительно 400%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием мутанта CysTM A/S. Australia/1/16 Н3 (конструкция №3924).[00302] Mutant N382A+L384V+CysTM A/S. Australia/1/16 H3 (design no. 3925) was constructed by mutation of asparagine at position 382 A/S. Australia/1/16 wild type to an alanine residue, a leucine at position 384 to a valine residue, and the sequence “CFLLC” at positions 524-528 (SEQ ID NO: 99) to “SLVLL” (SEQ ID NO: 98). As shown in FIG. 7D and 7E, purified extracts of N. benthamiana plants agroinfiltrated with construct #3925 showed an approximately 400% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated with the CysTM A/S mutant. Australia/1/16 H3 (design No. 3924).

Мутант N382A+L384V+CysTM A/Bangkok/3007/15 Н3Mutant N382A+L384V+CysTM A/Bangkok/3007/15 H3

[00303] Мутант N382A+L384V+CysTM A/Bangkok/3007/15 Н3 (конструкция №3905) конструировали путем мутации аспарагина в положении 382 A/Bangkok/3007/15 дикого типа в остаток аланина, лейцин в положении 384 в остаток валина и последовательность «CFLLC» в положениях 524-528 (SEQ ID NO: 99) в «SLVLL» (SEQ ID NO: 98). Как показано на фиг. 7Е, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3905, показали приблизительно 400%-ное увеличение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием мутанта CysTM A/Bangkok/3007/15 Н3 (конструкция №3904).[00303] Mutant N382A+L384V+CysTM A/Bangkok/3007/15 H3 (design #3905) was constructed by mutating wild-type asparagine at position 382 of A/Bangkok/3007/15 to an alanine residue, leucine at position 384 to a valine residue, and the sequence "CFLLC" at positions 524-528 (SEQ ID NO: 99) in "SLVLL" (SEQ ID NO: 98). As shown in FIG. 7E, purified extracts of N. benthamiana plants agroinfiltrated using construct #3905 showed an approximately 400% increase in hemagglutination titer compared to extracts of N. benthamiana plants agroinfiltrated using the CysTM A/Bangkok/3007/15 H3 mutant (design no. 3904).

[00304] Одна или более описанных в настоящем документе мутаций специфически увеличивают продукцию белка НА гриппа и выход VLP у растений. Было замечено, что мутации в других положениях значительно снижали или не оказывали значительного влияния на накопление белка НА гриппа или продукцию VLP в растительных клетках.[00304] One or more mutations described herein specifically increase influenza HA protein production and VLP yield in plants. It was observed that mutations at other positions significantly reduced or had no significant effect on influenza HA protein accumulation or VLP production in plant cells.

[00305] Повышенные титры гемагглютинации, достигнутые с белками НА гриппа, содержащими одну или более описанных в настоящем документе мутаций, также были специфичны для НА гриппа. Подобное увеличение не наблюдалось у растений, агроинфильтрованных конструкциями, кодирующими мутантные НА гриппа, полученные из штаммов, не относящихся к Н3.[00305] The increased hemagglutination titers achieved with influenza HA proteins containing one or more of the mutations described herein were also specific for influenza HA. A similar increase was not observed in plants agroinfiltrated with constructs encoding mutant influenza HAs derived from non-H3 strains.

[00306] Например, мутант Н5 F393D A/Indonesia/5/2005 конструировали путем мутации фенилаланина в положении 393 A/Indonesia/5/2005 Н5 дикого типа в аспарагиновую кислоту (конструкция №3680). Как показано на фиг. 3, очищенные экстракты растений N. benthamiana, агроинфильтрованные с использованием конструкции №3680, демонстрировали приблизительно 98%-ное снижение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Indonesia/5/2005 Н5 дикого типа (конструкция №2295).[00306] For example, the H5 mutant F393D A/Indonesia/5/2005 was constructed by mutating the phenylalanine at position 393 of wild-type A/Indonesia/5/2005 H5 to aspartic acid (design #3680). As shown in FIG. 3, purified N. benthamiana plant extracts agroinfiltrated with construct #3680 exhibited approximately 98% reduction in hemagglutination titer compared to N. benthamiana plant extracts agroinfiltrated with wild type A/Indonesia/5/2005 H5 (design no. 2295).

[00307] Точно так же очищенные экстракты растений N. benthamiana, агроинфильтрованных с использованием мутанта F392D A/Egypt/N04915/2014 Н5 (конструкция №3690), демонстрировали приблизительно 99%-ное снижение титра гемагглютинации по сравнению с экстрактами растений N. benthamiana, агроинфильтрованных с использованием A/Egypt/N04915/2014 Н5 дикого типа (конструкция №3690) (смотрите фиг. 3).[00307] Similarly, purified extracts of N. benthamiana plants agroinfiltrated with the F392D A/Egypt/N04915/2014 H5 mutant (design #3690) showed an approximately 99% reduction in hemagglutination titer compared to extracts of N. benthamiana plants. agroinfiltrated using wild type A/Egypt/N04915/2014 H5 (design #3690) (see Fig. 3).

Пример 3: Титр гемагглютинации, выходы после градиентов плотности и полные технологические выходыExample 3: Hemagglutination titer, yields after density gradients and overall process yields

[00308] Сводная информация измеренного титра гемагглютинации представлена в таблицах 5 и 6А. Титр гемагглютинации измеряли, как описано в примере 2. Относительный титр гемагглютинации получали путем сравнения титра гемагглютинации мутированного или модифицированного белка НА либо с НА дикого типа (таблица 5), либо с мутантным белком НА CysTM (таблица 6А).[00308] A summary of the measured hemagglutination titer is presented in Tables 5 and 6A. The hemagglutination titer was measured as described in Example 2. The relative hemagglutination titer was obtained by comparing the hemagglutination titer of the mutated or modified HA protein with either wild-type HA (Table 5) or the CysTM mutant HA protein (Table 6A).

[00309] Сводная информация измеренных выходов после градиентов плотности приведена в таблицах А 5В и С5В. Выходы после градиентов плотности измеряли, как описано в примере 2. Относительные выходы получали путем сравнения интенсивности полосы НА0 от мутированного или модифицированного белка НА либо с интенсивностью полосы НА0 НА дикого типа (таблица А 5В), либо с интенсивностью полосы НА0 мутантного белка НА CysTM (таблица 6В).[00309] A summary of the measured yields after density gradients is given in Tables A 5B and C5B. Yields following density gradients were measured as described in Example 2. Relative yields were obtained by comparing the intensity of the HA0 band from the mutated or modified HA protein to either the intensity of the wild-type HA HA band (Table A 5B) or the intensity of the HA0 band of the CysTM mutant HA protein (Table A 5B). table 6B).

[00310] Сводная информация измеренного полного технологического выхода приведена в таблице 6С. Полный технологический выход получали, как описано выше в примере 2. Относительные выходы получали путем сравнения выхода белка из мутированного или модифицированного белка НА либо с выходом белка НА дикого типа, либо с выходом мутантного белка НА CysTM (таблица 6С).[00310] A summary of the measured total process output is shown in Table 6C. Overall production yields were obtained as described above in Example 2. Relative yields were obtained by comparing the protein yield of the mutated or modified HA protein to either the wild-type HA protein yield or the CysTM mutant HA protein yield (Table 6C).

Пример 4: ПоследовательностиExample 4: Sequences

[00311] Использовали следующие последовательности (смотрите также таблицу 4):[00311] The following sequences were used (see also Table 4):

[00312] Все цитаты включены в настоящий документ посредством ссылки.[00312] All quotations are incorporated herein by reference.

[00313] Настоящее изобретение было описано в отношении одного или более вариантов осуществления. Однако специалистам в настоящей области техники будет очевидно, что можно сделать ряд вариаций и модификаций, не выходя за пределы объема настоящего изобретения, определенного в формуле изобретения.[00313] The present invention has been described with respect to one or more embodiments. However, it will be apparent to those skilled in the art that a number of variations and modifications can be made without departing from the scope of the present invention as defined by the claims.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙLIST OF SEQUENCES

<110> МЕДИКАГО ИНК.<110> MEDICAGO INC.

<120> МУТАНТЫ ГЕМАГГЛЮТИНИНА ВИРУСА ГРИППА<120> MUTANTS OF HEMAGGLUTIININ OF THE INFLUENZA VIRUS

<130> V811304WO2<130> V811304WO2

<150> US 62/690,780<150> US 62/690,780

<151> 2018-06-27<151> 2018-06-27

<160> 105<160> 105

<170> PatentIn version 3.5<170> Patent In version 3.5

<210> 1<210> 1

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 HK<223> DNA PDI-H3 HK

<400> 1<400> 1

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 2<210> 2

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> AК PDI-H3 HK<223> AK PDI-H3 HK

<400> 2<400> 2

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 3<210> 3

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Minn<223> DNA PDI-H3 Minn

<400> 3<400> 3

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 4<210> 4

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Minn<223> AK PDI-H3 Minn

<400> 4<400> 4

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 5<210> 5

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 SAus<223> DNA PDI-H3 SAus

<400> 5<400> 5

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 6<210> 6

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 SAus<223> AK PDI-H3 SAus

<400> 6<400> 6

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnVal Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Lys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerLys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 7<210> 7

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Bang<223> DNA PDI-H3 Bang

<400> 7<400> 7

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 8<210> 8

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Bang<223> AK PDI-H3 Bang

<400> 8<400> 8

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr ValTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Val

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 9<210> 9

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz<223> DNA PDI-H3 Switz

<400> 9<400> 9

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 10<210> 10

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz<223> AK PDI-H3 Switz

<400> 10<400> 10

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 11<210> 11

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Miss<223> DNA PDI-H3 Miss

<400> 11<400> 11

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcagagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcagagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

aaaccatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720aaaccatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaaacac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 12<210> 12

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Miss<223> AK PDI-H3 Miss

<400> 12<400> 12

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Arg Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Arg Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Lys Pro Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Lys Pro Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln AsnVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Asn

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 13<210> 13

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Penn<223> DNA PDI-H3 Penn

<400> 13<400> 13

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 14<210> 14

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Penn<223> AK PDI-H3 Penn

<400> 14<400> 14

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 15<210> 15

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер IF-CPMV(fl5'UTR)_SpPDI.c<223> Primer IF-CPMV(fl5'UTR)_SpPDI.c

<400> 15<400> 15

tcgtgcttcg gcaccagtac aatggcgaaa aacgttgcga ttttcggct 49tcgtgcttcg gcaccagtac aatggcgaaa aacgttgcga ttttcggct 49

<210> 16<210> 16

<211> 46<211> 46

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер IF-H1cTMCT.S1-4r<223> Primer IF-H1cTMCT.S1-4r

<400> 16<400> 16

actaaagaaa ataggccttt aaatacatat tctacactgt agagac 46actaaagaaa ataggccttt aaatacatat tctacactgt agagac 46

<210> 17<210> 17

<211> 55<211> 55

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер IF-H3A-Ala.r<223> Primer IF-H3A-Ala.r

<400> 17<400> 17

actaaagaaa ataggccttc aaatgcaaat gttgcaccta atgttgccct tttgg 55actaaagaaa ataggccttc aaatgcaaat gttgcaccta atgttgccct tttgg 55

<210> 18<210> 18

<211> 51<211> 51

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi_SLVLL.r<223> Primer H3_Swi_SLVLL.r

<400> 18<400> 18

agcaactaac agtacaaggg atgatatggc aaaggaaatc cataggatcc a 51agcaactaac agtacaaggg atgatatggc aaaggaaatc cataggatcc a 51

<210> 19<210> 19

<211> 53<211> 53

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> H3_Swi_SLVLL.c<223> H3_Swi_SLVLL.c

<400> 19<400> 19

tcctttgcca tatcatccct tgtactgtta gttgctttgt tggggttcat cat 53tcctttgcca tatcatccct tgtactgtta gttgctttgt tggggttcat cat 53

<210> 20<210> 20

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 HK-CysTm<223> DNA PDI-H3 HK-CysTm

<400> 20<400> 20

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 21<210> 21

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 HK-CysTm<223> AK PDI-H3 HK-CysTm

<400> 21<400> 21

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 22<210> 22

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_HK480114(N382A+L384V).r<223> Primer H3_HK480114(N382A+L384V).r

<400> 22<400> 22

ttggttttcc cgatcactcg agccagcttc ccattgattt gatcgatt 48ttggttttcc cgatcactcg agccagcttc ccattgattt gatcgatt 48

<210> 23<210> 23

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_HK480114(N382A+L384V).c<223> Primer H3_HK480114(N382A+L384V).c

<400> 23<400> 23

gggaagctgg ctcgagtgat cgggaaaacc aacgagaaat tccatcag 48gggaagctgg ctcgagtgat cgggaaaacc aacgagaaat tccatcag 48

<210> 24<210> 24

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 HK-N382A+L384V-CysTm<223> DNA PDI-H3 HK-N382A+L384V-CysTm

<400> 24<400> 24

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180catcatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg tgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctggctcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctggctcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 25<210> 25

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 HK-N382A+L384V-CysTm<223> AK PDI-H3 HK-N382A+L384V-CysTm

<400> 25<400> 25

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 26<210> 26

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Minn-CysTm<223> DNA PDI-H3 Minn-CysTm

<400> 26<400> 26

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 27<210> 27

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Minn-CysTm<223> AK PDI-H3 Minn-CysTm

<400> 27<400> 27

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 28<210> 28

<211> 60<211> 60

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3Minn(N382A+L384V).r<223> Primer H3Minn(N382A+L384V).r

<400> 28<400> 28

gttggttttc ccgatcaccc gagccagctt cccattgatt tgatcgattg ctgcttgagt 60gttggttttc ccgatcaccc gagccagctt cccattgatt tgatcgattg ctgcttgagt 60

<210> 29<210> 29

<211> 56<211> 56

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3Minn(N382A+L384V).c<223> Primer H3Minn(N382A+L384V).c

<400> 29<400> 29

aatcaatggg aagctggctc gggtgatcgg gaaaaccaac gagaaattcc atcaga 56aatcaatggg aagctggctc gggtgatcgg gaaaaccaac gagaaattcc atcaga 56

<210> 30<210> 30

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Minn-N382A+L384V-CysTm<223> DNA PDI-H3 Minn-N382A+L384V-CysTm

<400> 30<400> 30

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctggctcg ggtgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctggctcg ggtgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 31<210> 31

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Minn-N382A+L384V-CysTm<223> AK PDI-H3 Minn-N382A+L384V-CysTm

<400> 31<400> 31

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 32<210> 32

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 SAus-CysTm<223> DNA PDI-H3 SAus-CysTm

<400> 32<400> 32

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg gttgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 33<210> 33

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 SAus-CysTm<223> AK PDI-H3 SAus-CysTm

<400> 33<400> 33

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Lys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerLys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 34<210> 34

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 SAus-N382A+L384V-CysTm<223> DNA PDI-H3 SAus-N382A+L384V-CysTm

<400> 34<400> 34

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagttggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagagaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaaaaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggagatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600ttaaactaca catatccagc attgaacgtg actatgccaa acaaggaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctggctcg ggtgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctggctcg ggtgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagagtt caagaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tgaaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattagatgc aacatttgca tttga 1725

<210> 35<210> 35

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 SAus-N382A+L384V-CysTm<223> AK PDI-H3 SAus-N382A+L384V-CysTm

<400> 35<400> 35

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Lys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerLys Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Arg Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Lys Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Val Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Glu Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 36<210> 36

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Bang-CysTm<223> DNA PDI-H3 Bang-CysTm

<400> 36<400> 36

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 37<210> 37

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Bang-CysTm<223> AK PDI-H3 Bang-CysTm

<400> 37<400> 37

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr ValTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Val

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 38<210> 38

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Bang-N382A+L384V-CysTm<223> DNA PDI-H3 Bang-N382A+L384V-CysTm

<400> 38<400> 38

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaaat tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca caaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tggactggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggaaatc tagtagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600ttaaactaca catacccagc attgaacgtg actgtgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgct 660

cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720cgatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccaaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcatagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctggctcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctggctcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact aaagaattct cagaagtaga aggaagaatt caggaccttg agaaatatgt tgaggacact

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa tcaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg aaatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta tgcataggat caataagaaa tggaacttat gaccacaatg tgtacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 39<210> 39

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Bang-N382A+L384V-CysTm<223> AK PDI-H3 Bang-N382A+L384V-CysTm

<400> 39<400> 39

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Ile Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Thr Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Lys Ser Ser Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr ValTrp Leu Thr His Leu Asn Tyr Thr Tyr Pro Ala Leu Asn Val Thr Val

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Arg Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys His Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsn Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 40<210> 40

<211> 54<211> 54

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(F392D).r<223> Primer H3_Swi(F392D).r

<400> 40<400> 40

ttttcaatct gatggtcttt ctcgttggtt ttcccgatca atcgattcag cttc 54ttttcaatct gatggtcttt ctcgttggtt ttcccgatca atcgattcag cttc 54

<210> 41<210> 41

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(F392D).c<223> Primer H3_Swi(F392D).c

<400> 41<400> 41

tcgggaaaac caacgagaaa gaccatcaga ttgaaaaaga attctcag 48tcgggaaaac caacgagaaa gaccatcaga ttgaaaaaga attctcag 48

<210> 42<210> 42

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-F392D<223> DNA PDI-H3 Switz-F392D

<400> 42<400> 42

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaagacca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaagacca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 43<210> 43

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-F392D<223> AK PDI-H3 Switz-F392D

<400> 43<400> 43

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys AspIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Asp

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 44<210> 44

<211> 50<211> 50

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(L431M).r<223> Primer H3_Swi(L431M).r

<400> 44<400> 44

ttgtatgttg gttctccatg gcaacaagaa gctccgcgtt gtatgaccag 50ttgtatgttg gttctccatg gcaacaagaa gctccgcgtt gtatgaccag 50

<210> 45<210> 45

<211> 54<211> 54

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(L431M).c<223> Primer H3_Swi(L431M).c

<400> 45<400> 45

gttgccatgg agaaccaaca tacaattgat ctaactgact caga 54gttgccatgg agaaccaaca tacaattgat ctaactgact caga 54

<210> 46<210> 46

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-L431M<223> DNA PDI-H3 Switz-L431M

<400> 46<400> 46

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccatggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccatggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 47<210> 47

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-L431M<223> AK PDI-H3 Switz-L431M

<400> 47<400> 47

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheGly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Met Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Met Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 48<210> 48

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-CysTm<223> DNA PDI-H3 Switz-CysTm

<400> 48<400> 48

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 49<210> 49

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-CysTm<223> AK PDI-H3 Switz-CysTm

<400> 49<400> 49

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 50<210> 50

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(N382A).r<223> Primer H3_Swi(N382A).r

<400> 50<400> 50

tttcccgatc aatcgagcca gcttcccatt gatttgatcg attgctgc 48tttcccgatc aatcgagcca gcttcccatt gatttgatcg attgctgc 48

<210> 51<210> 51

<211> 54<211> 54

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(N382A).c<223> Primer H3_Swi(N382A).c

<400> 51<400> 51

tcaaatcaat gggaagctgg ctcgattgat cgggaaaacc aacgagaaat tcca 54tcaaatcaat gggaagctgg ctcgattgat cgggaaaacc aacgagaaat tcca 54

<210> 52<210> 52

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-N382A-CysTm<223> DNA PDI-H3 Switz-N382A-CysTm

<400> 52<400> 52

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 53<210> 53

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-N382A-CysTm<223> AK PDI-H3 Switz-N382A-CysTm

<400> 53<400> 53

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 54<210> 54

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(L384V).r<223> Primer H3_Swi(L384V).r

<400> 54<400> 54

ttggttttcc cgatcactcg attcagcttc ccattgattt gatcgatt 48ttggttttcc cgatcactcg attcagcttc ccattgattt gatcgatt 48

<210> 55<210> 55

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H3_Swi(L384V).c<223> Primer H3_Swi(L384V).c

<400> 55<400> 55

gggaagctga atcgagtgat cgggaaaacc aacgagaaat tccatcag 48gggaagctga atcgagtgat cgggaaaacc aacgagaaat tccatcag 48

<210> 56<210> 56

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-L384V-CysTm<223> DNA PDI-H3 Switz-L384V-CysTm

<400> 56<400> 56

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 57<210> 57

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-L384V-CysTm<223> AK PDI-H3 Switz-L384V-CysTm

<400> 57<400> 57

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 58<210> 58

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-F392D-CysTm<223> DNA PDI-H3 Switz-F392D-CysTm

<400> 58<400> 58

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaagacca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaagacca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 59<210> 59

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-F392D-CysTm<223> AK PDI-H3 Switz-F392D-CysTm

<400> 59<400> 59

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys AspIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Asp

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 60<210> 60

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-L431M-CysTm<223> DNA PDI-H3 Switz-L431M-CysTm

<400> 60<400> 60

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccatggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccatggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 61<210> 61

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-L431M-CysTm<223> AK PDI-H3 Switz-L431M-CysTm

<400> 61<400> 61

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Met Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Met Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 62<210> 62

<211> 4540<211> 4540

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Клонирующий вектор 1190 от левой границы T-ДНК к правой<223> Cloning vector 1190 from the left border of the T-DNA to the right

<400> 62<400> 62

tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60

gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120gacgttttta atgtactgaa ttaacgccga atcccggggct ggtatattta tatgttgtca 120

aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180

aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240

ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300

gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggaata 360

aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420

aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480

taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540

aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600

atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660

taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720

tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780

gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840

acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900

ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960

accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt

10201020

gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag

10801080

aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg

11401140

gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg

12001200

actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc

12601260

aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg

13201320

gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca

13801380

tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt

14401440

agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg

15001500

tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga

15601560

tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt

16201620

ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa

16801680

tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac

17401740

ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg

18001800

cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa

18601860

gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt

19201920

tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct

19801980

ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc

20402040

ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg

21002100

cgcgttggga attactagcg cgtgtcgaca agcttgcatg ccggtcaaca tggtggagca cgcgttggga attactagcg cgtgtcgaca agcttgcatg ccggtcaaca tggtggagca

21602160

cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat cgacacactt gtctactcca aaaatatcaa agatacagtc tcagaagacc aaagggcaat

22202220

tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat tgagactttt caacaaaggg taatatccgg aaacctcctc ggattccatt gcccagctat

22802280

ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc tcctacaaat gccatcattg

23402340

cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc cgataaagga aaggccatcg ttgaagatgc ctctgccgac agtggtccca aagatggacc

24002400

cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt cccacccacg aggagcatcg tggaaaaaga agacgttcca accacgtctt caaagcaagt

24602460

ggattgatgt gataacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga ggattgatgt gataacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga

25202520

tacagtctca gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa tacagtctca gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa

25802580

cctcctcgga ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga cctcctcgga ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga

26402640

aggtggctcc tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc aggtggctcc tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc

27002700

tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga

27602760

cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat atctccactg acgtaaggga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat atctccactg acgtaaggga

28202820

tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca

28802880

tttggagagg tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa tttggagagg tattaaaatc ttaataggtt ttgataaaag cgaacgtggg gaaacccgaa

29402940

ccaaaccttc ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc ccaaaccttc ttctaaactc tctctcatct ctcttaaagc aaacttctct cttgtctttc

30003000

ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg caccgcggat ggcgaaaaac ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg caccgcggat ggcgaaaaac

30603060

gttgcgattt tcggcttatt gttttctctt cttgtgttgg ttccttctca gatcttcgcc gttgcgattt tcggcttatt gttttctctt cttgtgttgg ttccttctca gatcttcgcc

31203120

tgcaggctcc tcagccaaaa cgacaccccc atctgtctat ccactggccc ctggatctgc tgcaggctcc tcagccaaaa cgacaccccc atctgtctat ccactggccc ctggatctgc

31803180

tgcccaaact aactccatgg tgaccctggg atgcctggtc aagggctatt tccctgagcc tgcccaaact aactccatgg tgaccctggg atgcctggtc aagggctatt tccctgagcc

32403240

agtgacagtg acctggaact ctggatccct gtccagcggt gtgcacacct tcccagctgt agtgacagtg acctggaact ctggatccct gtccagcggt gtgcacacct tcccagctgt

33003300

cctgcagtct gacctctaca ctctgagcag ctcagtgact gtcccctcca gcacctggcc cctgcagtct gacctctaca ctctgagcag ctcagtgact gtcccctcca gcacctggcc

33603360

cagcgagacc gtcacctgca acgttgccca cccggccagc agcaccaagg tggacaagaa cagcgagacc gtcacctgca acgttgccca cccggccagc agcaccaagg tggacaagaa

34203420

aattgtgccc agggattgtg gttgtaagcc ttgcatatgt acagtcccag aagtatcatc aattgtgccc agggattgtg gttgtaagcc ttgcatatgt acagtcccag aagtatcatc

34803480

tgtcttcatc ttccccccaa agcccaagga tgtgctcacc attactctga ctcctaaggt tgtcttcatc ttccccccaa agcccaagga tgtgctcacc attactctga ctcctaaggt

35403540

cacgtgtgtt gtggtagaca tcagcaagga tgatcccgag gtccagttca gctggtttgt cacgtgtgtt gtggtagaca tcagcaagga tgatcccgag gtccagttca gctggtttgt

36003600

agatgatgtg gaggtgcaca cagctcagac gcaaccccgg gaggagcagt tcaacagcac agatgatgtg gaggtgcaca cagctcagac gcaaccccgg gaggagcagt tcaacagcac

36603660

tttccgctca gtcagtgaac ttcccatcat gcaccaggac tggctcaatg gcaaggagcg tttccgctca gtcagtgaac ttcccatcat gcaccaggac tggctcaatg gcaaggagcg

37203720

atcgctcacc atcaccatca ccatcaccat caccattaaa ggcctatttt ctttagtttg atcgctcacc atcaccatca ccatcaccat caccattaaa ggcctatttt ctttagtttg

37803780

aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg tgctcagagt aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg tgctcagagt

38403840

gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt cgtcccttca gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt cgtcccttca

39003900

gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga ccgggaattc gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga ccgggaattc

39603960

gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt ttcttaagat gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt ttcttaagat

40204020

tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat tacgttaagc

40804080

atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt atgattagag

41404140

tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca aactaggata

42004200

aattatcgcg cgcggtgtca tctatgttac tagatctcta gagtctcaag cttggcgcgc aattatcgcg cgcggtgtca tctatgttac tagatctcta gagtctcaag cttggcgcgc

42604260

ccacgtgact agtggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ccacgtgact agtggcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg

43204320

ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag ttacccaact taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag

43804380

aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tgctagagca aggcccgcac cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tgctagagca

44404440

gcttgagctt ggatcagatt gtcgtttccc gccttcagtt taaactatca gtgtttgaca gcttgagctt ggatcagatt gtcgtttccc gccttcagtt taaactatca gtgtttgaca

45004500

ggatatattg gcgggtaaac ctaagagaaa agagcgttta 4540ggatatattg gcgggtaaac ctaagagaaa agagcgttta 4540

<210> 63<210> 63

<211> 3105<211> 3105

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 1314 от промотора 2X35S к терминатору NOS<223> Construct 1314 from 2X35S promoter to NOS terminator

<400> 63<400> 63

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgctg acacattatg tataggttat catgcgaaca attcaacaga tccttctcag atcttcgctg acacattatg tataggttat catgcgaaca attcaacaga

10201020

cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga

10801080

agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa

11401140

atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag

12001200

ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga

12601260

tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt

13201320

tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc

13801380

agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa

14401440

aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct

15001500

cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa

15601560

tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat

16201620

agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt

16801680

agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc

17401740

attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga

18001800

ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa

18601860

tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact

19201920

ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc

19801980

cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca

20402040

aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga

21002100

gattactaac aaagtaaatt ctgttattga aaagatgaat acacagttca cagcagtagg gattactaac aaagtaaatt ctgttattga aaagatgaat acacagttca cagcagtagg

21602160

taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg

22202220

tttcctggac atttggactt acaatgccga actgttggtt ctattggaaa atgaaagaac tttcctggac atttggactt acaatgccga actgttggtt ctattggaaa atgaaagaac

22802280

tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa

23402340

aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac

24002400

gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa

24602460

attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt

25202520

ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag

25802580

tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt

26402640

ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg

27002700

tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt

27602760

cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga

28202820

ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt

28802880

ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat

29402940

tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt

30003000

atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca

30603060

aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105

<210> 64<210> 64

<211> 3105<211> 3105

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 2980 от промотора 2X35S к терминатору NOS<223> Construct 2980 from 2X35S promoter to NOS terminator

<400> 64<400> 64

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgcgg acacattatg tataggttat catgcgaaca attcaacaga tccttctcag atcttcgcgg acacattatg tataggttat catgcgaaca attcaacaga

10201020

cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga

10801080

agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa

11401140

atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag

12001200

ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga

12601260

tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt

13201320

tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc

13801380

agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa

14401440

aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct

15001500

cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa

15601560

tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat

16201620

agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt

16801680

agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc

17401740

attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga

18001800

ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa

18601860

tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact

19201920

ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc

19801980

cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca

20402040

aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga

21002100

gattactaac aaagtaaatt ctgttattga aaagatgaat acacaggaca cagcagtagg gattactaac aaagtaaatt ctgttattga aaagatgaat acacaggaca cagcagtagg

21602160

taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg

22202220

tttcctggac atttggactt acaatgccga actgttggtt ctattggaaa atgaaagaac tttcctggac atttggactt acaatgccga actgttggtt ctattggaaa atgaaagaac

22802280

tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa

23402340

aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac

24002400

gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa

24602460

attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt

25202520

ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag

25802580

tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt

26402640

ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg

27002700

tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt

27602760

cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga

28202820

ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt

28802880

ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat

29402940

tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt

30003000

atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca

30603060

aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105

<210> 65<210> 65

<211> 3105<211> 3105

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 2995 от промотора 2X35S к терминатору NOS<223> Construct 2995 from 2X35S promoter to NOS terminator

<400> 65<400> 65

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgcgg acacattatg tataggttat catgcgaaca attcaacaga tccttctcag atcttcgcgg acacattatg tataggttat catgcgaaca attcaacaga

10201020

cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga cactgtagac acagtactag aaaagaatgt aacagtaaca cactctgtta accttctaga

10801080

agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa agacaagcat aacgggaaac tatgcaaact aagaggggta gccccattgc atttgggtaa

11401140

atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag atgtaacatt gctggctgga tcctgggaaa tccagagtgt gaatcactct ccacagcaag

12001200

ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga ctcatggtcc tacattgtgg aaacacctag ttcagacaat ggaacgtgtt acccaggaga

12601260

tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt tttcatcgat tatgaggagc taagagagca attgagctca gtgtcatcat ttgaaaggtt

13201320

tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc tgagatattc cccaagacaa gttcatggcc caatcatgac tcgaacaaag gtgtaacggc

13801380

agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa agcatgtcct catgctggag caaaaagctt ctacaaaaat ttaatatggc tagttaaaaa

14401440

aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct aggaaattca tacccaaagc tcagcaaatc ctacattaat gataaaggga aagaagtcct

15001500

cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa cgtgctatgg ggcattcacc atccatctac tagtgctgac caacaaagtc tctatcagaa

15601560

tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat tgcagatgca tatgtttttg tggggtcatc aagatacagc aagaagttca agccggaaat

16201620

agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt agcaataaga cccaaagtga gggatcaaga agggagaatg aactattact ggacactagt

16801680

agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc agagccggga gacaaaataa cattcgaagc aactggaaat ctagtggtac cgagatatgc

17401740

attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga attcgcaatg gaaagaaatg ctggatctgg tattatcatt tcagatacac cagtccacga

18001800

ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa ttgcaataca acttgtcaaa cacccaaggg tgctataaac accagcctcc catttcagaa

18601860

tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact tatacatccg atcacaattg gaaaatgtcc aaaatatgta aaaagcacaa aattgagact

19201920

ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc ggccacagga ttgaggaata tcccgtctat tcaatctaga ggactatttg gggccattgc

19801980

cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca cggtttcatt gaaggggggt ggacagggat ggtagatgga tggtacggtt atcaccatca

20402040

aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga aaatgagcag gggtcaggat atgcagccga cctgaagagc acacagaatg ccattgacga

21002100

gattactaac aaagtaaatt ctgttattga aaagatgaat acacaggaca cagcagtagg gattactaac aaagtaaatt ctgttattga aaagatgaat acacaggaca cagcagtagg

21602160

taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg taaagagttc aaccacctgg aaaaaagaat agagaattta aataaaaaag ttgatgatgg

22202220

tttcctggac atttggactt acaatgccga actgttggtt ctaatggaaa atgaaagaac tttcctggac atttggactt acaatgccga actgttggtt ctaatggaaa atgaaagaac

22802280

tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa tttggactac cacgattcaa atgtgaagaa cttatatgaa aaggtaagaa gccagctaaa

23402340

aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac aaacaatgcc aaggaaattg gaaacggctg ctttgaattt taccacaaat gcgataacac

24002400

gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa gtgcatggaa agtgtcaaaa atgggactta tgactaccca aaatactcag aggaagcaaa

24602460

attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt attaaacaga gaagaaatag atggggtaaa gctggaatca acaaggattt accagatttt

25202520

ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag ggcgatctat tcaactgtcg ccagttcatt ggtactggta gtctccctgg gggcaatcag

25802580

tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt tttctggatg tgctctaatg ggtctctaca gtgtagaata tgtatttaaa ggcctatttt

26402640

ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag cggttttctg

27002700

tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg tttagcaggt

27602760

cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa aaaaaaaaga

28202820

ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg gcaataaagt

28802880

ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt tctgttgaat

29402940

tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag atgggttttt

30003000

atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atagcgcgca

30603060

aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105aactaggata aattatcgcg cgcggtgtca tctatgttac tagat 3105

<210> 66<210> 66

<211> 6360<211> 6360

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Клонирующий вектор 3556 от левой границы T-ДНК к правой<223> Cloning vector 3556 from the left border of the T-DNA to the right

<400> 66<400> 66

tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60tggcaggata tattgtggtg taaacaaatt gacgcttaga caacttaata acacattgcg 60

gacgttttta atgtactgaa ttaacgccga atcccgggct ggtatattta tatgttgtca 120gacgttttta atgtactgaa ttaacgccga atcccggggct ggtatattta tatgttgtca 120

aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180aataactcaa aaaccataaa agtttaagtt agcaagtgtg tacattttta cttgaacaaa 180

aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240aatattcacc tactactgtt ataaatcatt attaaacatt agagtaaaga aatatggatg 240

ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300ataagaacaa gagtagtgat attttgacaa caattttgtt gcaacatttg agaaaatttt 300

gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggagaata 360gttgttctct cttttcattg gtcaaaaaca atagagagag aaaaaggaag agggaata 360

aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420aaaacataat gtgagtatga gagagaaagt tgtacaaaag ttgtaccaaa atagttgtac 420

aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480aaatatcatt gaggaatttg acaaaagcta cacaaataag ggttaattgc tgtaaataaa 480

taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540taaggatgac gcattagaga gatgtaccat tagagaattt ttggcaagtc attaaaaaga 540

aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600aagaataaat tatttttaaa attaaaagtt gagtcatttg attaaacatg tgattattta 600

atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660atgaattgat gaaagagttg gattaaagtt gtattagtaa ttagaatttg gtgtcaaatt 660

taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720taatttgaca tttgatcttt tcctatatat tgccccatag agtcagttaa ctcattttta 720

tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780tatttcatag atcaaataag agaaataacg gtatattaat ccctccaaaa aaaaaaaacg 780

gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840gtatatttac taaaaaatct aagccacgta ggaggataac aggatccccg taggaggata 840

acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900acatccaatc caaccaatca caacaatcct gatgagataa cccactttaa gcccacgcat 900

ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960ctgtggcaca tctacattat ctaaatcaca cattcttcca cacatctgag ccacacaaaa 960

accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt accaatccac atctttatca cccattctat aaaaaatcac actttgtgag tctacacttt

10201020

gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag gattcccttc aaacacatac aaagagaaga gactaattaa ttaattaatc atcttgagag

10801080

aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg aaaatggaac gagctataca aggaaacgac gctagggaac aagctaacag tgaacgttgg

11401140

gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg gatggaggat caggaggtac cacttctccc ttcaaacttc ctgacgaaag tccgagttgg

12001200

actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc actgagtggc ggctacataa cgatgagacg aattcgaatc aagataatcc ccttggtttc

12601260

aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg aaggaaagct ggggtttcgg gaaagttgta tttaagagat atctcagata cgacaggacg

13201320

gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca gaagcttcac tgcacagagt ccttggatct tggacgggag attcggttaa ctatgcagca

13801380

tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt tctcgatttt tcggtttcga ccagatcgga tgtacctata gtattcggtt tcgaggagtt

14401440

agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg agtatcaccg tttctggagg gtcgcgaact cttcagcatc tctgtgagat ggcaattcgg

15001500

tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga tctaagcaag aactgctaca gcttgcccca atcgaagtgg aaagtaatgt atcaagagga

15601560

tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt tgccctgaag gtactcaaac cttcgaaaaa gaaagcgagt aagttaaaat gcttcttcgt

16201620

ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa ctcctattta taatatggtt tgttattgtt aattttgttc ttgtagaaga gcttaattaa

16801680

tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac tcgttgttgt tatgaaatac tatttgtatg agatgaactg gtgtaatgta attcatttac

17401740

ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg ataagtggag tcagaatcag aatgtttcct ccataactaa ctagacatga agacctgccg

18001800

cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa cgtacaattg tcttatattt gaacaactaa aattgaacat cttttgccac aactttataa

18601860

gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt gtggttaata tagctcaaat atatggtcaa gttcaataga ttaataatgg aaatatcagt

19201920

tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct tatcgaaatt cattaacaat caacttaacg ttattaacta ctaattttat atcatcccct

19801980

ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc ttgataaatg atagtacacc aattaggaag gagcatgctc gcctaggaga ttgtcgtttc

20402040

ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg ccgccttcag tttgcaagct gctctagccg tgtagccaat acgcaaaccg cctctccccg

21002100

cgcgttggga attactagcg cgtgtcgaca cgcgtggcgc gccctggtat atttatatgt cgcgttggga attactagcg cgtgtcgaca cgcgtggcgc gccctggtat atttatatgt

21602160

tgtcaaataa ctcaaaaacc ataaaagttt aagttagcaa gtgtgtacat ttttacttga tgtcaaataa ctcaaaaacc ataaaagttt aagttagcaa gtgtgtacat ttttacttga

22202220

acaaaaatat tcacctacta ctgttataaa tcattattaa acattagagt aaagaaatat acaaaaatat tcacctacta ctgttataaa tcattattaa acattagagt aaagaaatat

22802280

ggatgataag aacaagagta gtgatatttt gacaacaatt ttgttgcaac atttgagaaa ggatgataag aacaagagta gtgatatttt gacaacaatt ttgttgcaac atttgagaaa

23402340

attttgttgt tctctctttt cattggtcaa aaacaataga gagagaaaaa ggaagaggga attttgttgt tctctctttt cattggtcaa aaacaataga gagagaaaaa ggaagaggga

24002400

gaataaaaac ataatgtgag tatgagagag aaagttgtac aaaagttgta ccaaaatagt gaataaaaac ataatgtgag tatgagagag aaagttgtac aaaagttgta ccaaaatagt

24602460

tgtacaaata tcattgagga atttgacaaa agctacacaa ataagggtta attgctgtaa tgtacaaata tcattgagga atttgacaaa agctacacaa ataagggtta attgctgtaa

25202520

ataaataagg atgacgcatt agagagatgt accattagag aatttttggc aagtcattaa ataaataagg atgacgcatt agagagatgt accattagag aatttttggc aagtcattaa

25802580

aaagaaagaa taaattattt ttaaaattaa aagttgagtc atttgattaa acatgtgatt aaagaaagaa taaattattt ttaaaattaa aagttgagtc atttgattaa acatgtgatt

26402640

atttaatgaa ttgatgaaag agttggatta aagttgtatt agtaattaga atttggtgtc atttaatgaa ttgatgaaag agttggatta aagttgtatt agtaattaga atttggtgtc

27002700

aaatttaatt tgacatttga tcttttccta tatattgccc catagagtca gttaactcat aaatttaatt tgacatttga tcttttccta tatattgccc catagagtca gttaactcat

27602760

ttttatattt catagatcaa ataagagaaa taacggtata ttaatccctc caaaaaaaaa ttttatattt catagatcaa ataagagaaa taacggtata ttaatccctc caaaaaaaaa

28202820

aaacggtata tttactaaaa aatctaagcc acgtaggagg ataacaggat ccccgtagga aaacggtata tttactaaaa aatctaagcc acgtaggagg ataacaggat ccccgtagga

28802880

ggataacatc caatccaacc aatcacaaca atcctgatga gataacccac tttaagccca ggataacatc caatccaacc aatcacaaca atcctgatga gataacccac tttaagccca

29402940

cgcatctgtg gcacatctac attatctaaa tcacacattc ttccacacat ctgagccaca cgcatctgtg gcacatctac attatctaaa tcacacattc ttccacacat ctgagccaca

30003000

caaaaaccaa tccacatctt tatcacccat tctataaaaa atcacacttt gtgagtctac caaaaaccaa tccacatctt tatcacccat tctataaaaa atcacacttt gtgagtctac

30603060

actttgattc ccttcaaaca catacaaaga gaagagacta attaattaat taatcatctt actttgattc ccttcaaaca catacaaaga gaagagacta attaattaat taatcatctt

31203120

gagagaaaat gagtcttcta accgaggtcg aaacgcctat cagaaacgaa tgggggtgca gagagaaaat gagtcttcta accgaggtcg aaacgcctat cagaaacgaa tggggggtgca

31803180

gatgcaacga ttcaagtgat cctcttgttg ttgccgcaag tataattggg attgtgcacc gatgcaacga ttcaagtgat cctcttgttg ttgccgcaag tataattggg attgtgcacc

32403240

tgatattgtg gattattgat cgcctttttt ccaaaagcat ttatcgtatc tttaaacacg tgatattgtg gattattgat cgcctttttt ccaaaagcat ttatcgtatc tttaaacacg

33003300

gtttaaaaag agggccttct acggaaggag taccagagtc tatgagggaa gaatatcgag gtttaaaaag agggccttct acggaaggag taccagagtc tatgagggaa gaatatcgag

33603360

aggaacagca gaatgctgtg gatgctgacg atggtcattt tgtcagcata gagctggagt aggaacagca gaatgctgtg gatgctgacg atggtcattt tgtcagcata gagctggagt

34203420

aagagctcta agttaaaatg cttcttcgtc tcctatttat aatatggttt gttattgtta aagagctcta agttaaaatg cttcttcgtc tcctatttat aatatggttt gttattgtta

34803480

attttgttct tgtagaagag cttaattaat cgttgttgtt atgaaatact atttgtatga attttgttct tgtagaagag cttaattaat cgttgttgtt atgaaatact atttgtatga

35403540

gatgaactgg tgtaatgtaa ttcatttaca taagtggagt cagaatcaga atgtttcctc gatgaactgg tgtaatgtaa ttcatttaca taagtggagt cagaatcaga atgtttcctc

36003600

cataactaac tagacatgaa gacctgccgc gtacaattgt cttatatttg aacaactaaa cataactaac tagacatgaa gacctgccgc gtacaattgt cttatatttg aacaactaaa

36603660

attgaacatc ttttgccaca actttataag tggttaatat agctcaaata tatggtcaag attgaacatc ttttgccaca actttataag tggttaatat agctcaaata tatggtcaag

37203720

ttcaatagat taataatgga aatatcagtt atcgaaattc attaacaatc aacttaacgt ttcaatagat taataatgga aatatcagtt atcgaaattc attaacaatc aacttaacgt

37803780

tattaactac taattttata tcatcccctt tgataaatga tagtacacca attaggaagg tattaactac taattttata tcatcccctt tgataaatga tagtacacca attaggaagg

38403840

aactaggaga ttgtcgtttc ccgccttcag tttgcaagct gctctagccg tgtagccaat aactaggaga ttgtcgtttc ccgccttcag tttgcaagct gctctagccg tgtagccaat

39003900

acgcaaaccg cctctccccg cgcgttggga attactagcg cgtgtcgaca agcttgcatg acgcaaaccg cctctccccg cgcgttggga attactagcg cgtgtcgaca agcttgcatg

39603960

ccggtcaaca tggtggagca cgacacactt gtctactcca aaaatatcaa agatacagtc ccggtcaaca tggtggagca cgacacactt gtctactcca aaaatatcaa agatacagtc

40204020

tcagaagacc aaagggcaat tgagactttt caacaaaggg taatatccgg aaacctcctc tcagaagacc aaagggcaat tgagactttt caacaaaggg taatatccgg aaacctcctc

40804080

ggattccatt gcccagctat ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc ggattccatt gcccagctat ctgtcacttt attgtgaaga tagtggaaaa ggaaggtggc

41404140

tcctacaaat gccatcattg cgataaagga aaggccatcg ttgaagatgc ctctgccgac tcctacaaat gccatcattg cgataaagga aaggccatcg ttgaagatgc ctctgccgac

42004200

agtggtccca aagatggacc cccacccacg aggagcatcg tggaaaaaga agacgttcca agtggtccca aagatggacc cccacccacg aggagcatcg tggaaaaaga agacgttcca

42604260

accacgtctt caaagcaagt ggattgatgt gataacatgg tggagcacga cacacttgtc accacgtctt caaagcaagt ggattgatgt gataacatgg tggagcacga cacacttgtc

43204320

tactccaaaa atatcaaaga tacagtctca gaagaccaaa gggcaattga gacttttcaa tactccaaaa atatcaaaga tacagtctca gaagaccaaa gggcaattga gacttttcaa

43804380

caaagggtaa tatccggaaa cctcctcgga ttccattgcc cagctatctg tcactttatt caaagggtaa tatccggaaa cctcctcgga ttccattgcc cagctatctg tcactttatt

44404440

gtgaagatag tggaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag gtgaagatag tggaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag

45004500

gccatcgttg aagatgcctc tgccgacagt ggtcccaaag atggaccccc acccacgagg gccatcgttg aagatgcctc tgccgacagt ggtcccaaag atggaccccc acccacgagg

45604560

agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat

46204620

atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct

46804680

atataaggaa gttcatttca tttggagagg tattaaaatc ttaataggtt ttgataaaag atataaggaa gttcatttca tttggagagg tattaaaatc ttaataggtt ttgataaaag

47404740

cgaacgtggg gaaacccgaa ccaaaccttc ttctaaactc tctctcatct ctcttaaagc cgaacgtggg gaaacccgaa ccaaaccttc ttctaaactc tctctcatct ctcttaaagc

48004800

aaacttctct cttgtctttc ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg aaacttctct cttgtctttc ttgcgtgagc gatcttcaac gttgtcagat cgtgcttcgg

48604860

caccgcggat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt cttgtgttgg caccgcggat ggcgaaaaac gttgcgattt tcggcttatt gttttctctt cttgtgttgg

49204920

ttccttctca gatcttcgcc tgcaggctcc tcagccaaaa cgacaccccc atctgtctat ttccttctca gatcttcgcc tgcaggctcc tcagccaaaa cgacaccccc atctgtctat

49804980

ccactggccc ctggatctgc tgcccaaact aactccatgg tgaccctggg atgcctggtc ccactggccc ctggatctgc tgcccaaact aactccatgg tgaccctggg atgcctggtc

50405040

aagggctatt tccctgagcc agtgacagtg acctggaact ctggatccct gtccagcggt aagggctatt tccctgagcc agtgacagtg acctggaact ctggatccct gtccagcggt

51005100

gtgcacacct tcccagctgt cctgcagtct gacctctaca ctctgagcag ctcagtgact gtgcacacct tcccagctgt cctgcagtct gacctctaca ctctgagcag ctcagtgact

51605160

gtcccctcca gcacctggcc cagcgagacc gtcacctgca acgttgccca cccggccagc gtcccctcca gcacctggcc cagcgagacc gtcacctgca acgttgccca cccggccagc

52205220

agcaccaagg tggacaagaa aattgtgccc agggattgtg gttgtaagcc ttgcatatgt agcaccaagg tggacaagaa aattgtgccc agggattgtg gttgtaagcc ttgcatatgt

52805280

acagtcccag aagtatcatc tgtcttcatc ttccccccaa agcccaagga tgtgctcacc acagtcccag aagtatcatc tgtcttcatc ttccccccaa agcccaagga tgtgctcacc

53405340

attactctga ctcctaaggt cacgtgtgtt gtggtagaca tcagcaagga tgatcccgag attactctga ctcctaaggt cacgtgtgtt gtggtagaca tcagcaagga tgatcccgag

54005400

gtccagttca gctggtttgt agatgatgtg gaggtgcaca cagctcagac gcaaccccgg gtccagttca gctggtttgt agatgatgtg gaggtgcaca cagctcagac gcaaccccgg

54605460

gaggagcagt tcaacagcac tttccgctca gtcagtgaac ttcccatcat gcaccaggac gaggagcagt tcaacagcac tttccgctca gtcagtgaac ttcccatcat gcaccaggac

55205520

tggctcaatg gcaaggagcg atcgctcacc atcaccatca ccatcaccat caccattaaa tggctcaatg gcaaggagcg atcgctcacc atcaccatca ccatcaccat caccattaaa

55805580

ggcctatttt ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag ggcctatttt ctttagtttg aatttactgt tattcggtgt gcatttctat gtttggtgag

56405640

cggttttctg tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg cggttttctg tgctcagagt gtgtttattt tatgtaattt aatttctttg tgagctcctg

57005700

tttagcaggt cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa tttagcaggt cgtcccttca gcaaggacac aaaaagattt taattttatt aaaaaaaaaa

57605760

aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg aaaaaaaaga ccgggaattc gatatcaagc ttatcgacct gcagatcgtt caaacatttg

58205820

gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt gcaataaagt ttcttaagat tgaatcctgt tgccggtctt gcgatgatta tcatataatt

58805880

tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag tctgttgaat tacgttaagc atgtaataat taacatgtaa tgcatgacgt tatttatgag

59405940

atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat atgggttttt atgattagag tcccgcaatt atacatttaa tacgcgatag aaaacaaaat

60006000

atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac tagatctcta atagcgcgca aactaggata aattatcgcg cgcggtgtca tctatgttac tagatctcta

60606060

gagtctcaag cttggcgcgc ccacgtgact agtggcactg gccgtcgttt tacaacgtcg gagtctcaag cttggcgcgc ccacgtgact agtggcactg gccgtcgttt tacaacgtcg

61206120

tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc cccctttcgc

61806180

cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt tgcgcagcct

62406240

gaatggcgaa tgctagagca gcttgagctt ggatcagatt gtcgtttccc gccttcagtt gaatggcgaa tgctagagca gcttgagctt ggatcagatt gtcgtttccc gccttcagtt

63006300

taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa agagcgttta taaactatca gtgtttgaca ggatatattg gcgggtaaac ctaagagaaa agagcgttta

63606360

<210> 67<210> 67

<211> 50<211> 50

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер IF-H5ITMCT.s1-4r<223> Primer IF-H5ITMCT.s1-4r

<400> 67<400> 67

actaaagaaa ataggccttt aaatgcaaat tctgcattgt aacgatccat 50actaaagaaa ataggccttt aaatgcaaat tctgcattgt aacgatccat 50

<210> 68<210> 68

<211> 1731<211> 1731

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H5 Indo<223> DNA PDI-H5 Indo

<400> 68<400> 68

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg ccgatcagat ttgcattggt taccatgcaa acaattcaac agagcaggtt 120cagatcttcg ccgatcagat ttgcattggt taccatgcaa acaattcaac agagcaggtt 120

gacacaatca tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 180gacacaatca tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 180

cacaacggga agctctgcga tctagatgga gtgaagcctc taattttaag agattgtagt 240cacaacggga agctctgcga tctagatgga gtgaagcctc taattttaag agattgtagt 240

gtagctggat ggctcctcgg gaacccaatg tgtgacgaat tcatcaatgt accggaatgg 300gtagctggat ggctcctcgg gaacccaatg tgtgacgaat tcatcaatgt acggaatgg 300

tcttacatag tggagaaggc caatccaacc aatgacctct gttacccagg gagtttcaac 360tcttacatag tggagaaggc caatccaacc aatgacctct gttacccagg gagtttcaac 360

gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcaaatc 420gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcaaatc 420

atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gagttagctc agcatgtcca 480atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gagttagctc agcatgtcca 480

tacctgggaa gtccctcctt ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca 540tacctgggaa gtccctcctt ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca 540

tacccaacaa taaagaaaag ctacaataat accaaccaag aggatctttt ggtactgtgg 600tacccaacaa taaagaaaag ctacaataat accaaccaag aggatctttt ggtactgtgg 600

ggaattcacc atcctaatga tgcggcagag cagacaaggc tatatcaaaa cccaaccacc 660ggaattcacc atcctaatga tgcggcagag cagacaaggc tatatcaaaa cccaaccacc 660

tatatttcca ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 720tatatttcca ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 720

tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaacctaat 780tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaacctaat 780

gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 840gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 840

gtcaagaaag gggactcagc aattatgaaa agtgaattgg aatatggtaa ctgcaacacc 900gtcaagaaag gggactcagc aattatgaaa agtgaattgg aatatggtaa ctgcaacacc 900

aagtgtcaaa ctccaatggg ggcgataaac tctagtatgc cattccacaa catacaccct 960aagtgtcaaa ctccaatggg ggcgataaac tctagtatgc cattccacaa catacaccct 960

ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcaacaggg ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcaacaggg

10201020

ctcagaaata gccctcaaag agagagcaga agaaaaaaga gaggactatt tggagctata ctcagaaata gccctcaaag agagagcaga agaaaaaaga gaggactatt tggagctata

10801080

gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat

11401140

agcaatgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat agcaatgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat

12001200

ggagtcacca ataaggtcaa ctcaatcatt gacaaaatga acactcagtt tgaggccgtt ggagtcacca ataaggtcaa ctcaatcatt gacaaaatga acactcagtt tgaggccgtt

12601260

ggaagggaat ttaataactt agaaaggaga atagagaatt taaacaagaa gatggaagac ggaagggaat ttaataactt agaaaggaga atagagaatt taaacaagaa gatggaagac

13201320

gggtttctag atgtctggac ttataatgcc gaacttctgg ttctcatgga aaatgagaga gggtttctag atgtctggac ttataatgcc gaacttctgg ttctcatgga aaatgagaga

13801380

actctagact ttcatgactc aaatgttaag aacctctacg acaaggtccg actacagctt actctagact ttcatgactc aaatgttaag aacctctacg acaaggtccg actacagctt

14401440

agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcacaa atgtgataat agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcacaa atgtgataat

15001500

gaatgtatgg aaagtataag aaacggaacg tacaactatc cgcagtattc agaagaagca gaatgtatgg aaagtataag aaacggaacg tacaactatc cgcagtattc agaagaagca

15601560

agattaaaaa gagaggaaat aagtggggta aaattggaat caataggaac ttaccaaata agattaaaaa gagaggaaat aagtggggta aaattggaat caataggaac ttaccaaata

16201620

ctgtcaattt attcaacagt ggcgagttcc ctagcactgg caatcatgat ggctggtcta ctgtcaattt attcaacagt ggcgagttcc ctagcactgg caatcatgat ggctggtcta

16801680

tctttatgga tgtgctccaa tggatcgtta caatgcagaa tttgcattta a 1731tctttatgga tgtgctccaa tggatcgtta caatgcagaa tttgcattta a 1731

<210> 69<210> 69

<211> 576<211> 576

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H5 Indo<223> AK PDI-H5 Indo

<400> 69<400> 69

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr HisLeu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His

20 25 3020 25 30

Ala Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn ValAla Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn Val

35 40 4535 40 45

Thr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly LysThr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly Lys

50 55 6050 55 60

Leu Cys Asp Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys SerLeu Cys Asp Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys Ser

65 70 75 8065 70 75 80

Val Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Ile AsnVal Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Ile Asn

85 90 9585 90 95

Val Pro Glu Trp Ser Tyr Ile Val Glu Lys Ala Asn Pro Thr Asn AspVal Pro Glu Trp Ser Tyr Ile Val Glu Lys Ala Asn Pro Thr Asn Asp

100 105 110100 105 110

Leu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His LeuLeu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His Leu

115 120 125115 120 125

Leu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys SerLeu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys Ser

130 135 140130 135 140

Ser Trp Ser Asp His Glu Ala Ser Ser Gly Val Ser Ser Ala Cys ProSer Trp Ser Asp His Glu Ala Ser Ser Gly Val Ser Ser Ala Cys Pro

145 150 155 160145 150 155 160

Tyr Leu Gly Ser Pro Ser Phe Phe Arg Asn Val Val Trp Leu Ile LysTyr Leu Gly Ser Pro Ser Phe Phe Arg Asn Val Val Trp Leu Ile Lys

165 170 175165 170 175

Lys Asn Ser Thr Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr AsnLys Asn Ser Thr Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn

180 185 190180 185 190

Gln Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp AlaGln Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala

195 200 205195 200 205

Ala Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser IleAla Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Ile

210 215 220210 215 220

Gly Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr ArgGly Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg

225 230 235 240225 230 235 240

Ser Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr IleSer Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile

245 250 255245 250 255

Leu Lys Pro Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe IleLeu Lys Pro Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile

260 265 270260 265 270

Ala Pro Glu Tyr Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Ala IleAla Pro Glu Tyr Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Ala Ile

275 280 285275 280 285

Met Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn Thr Lys Cys Gln ThrMet Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn Thr Lys Cys Gln Thr

290 295 300290 295 300

Pro Met Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His ProPro Met Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro

305 310 315 320305 310 315 320

Leu Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu ValLeu Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val

325 330 335325 330 335

Leu Ala Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg LysLeu Ala Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg Lys

340 345 350340 345 350

Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly TrpLys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp

355 360 365355 360 365

Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu GlnGln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln

370 375 380370 375 380

Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala Ile AspGly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala Ile Asp

385 390 395 400385 390 395 400

Gly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr GlnGly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln

405 410 415405 410 415

Phe Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile GluPhe Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu

420 425 430420 425 430

Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr TyrAsn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr

435 440 445435 440 445

Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp PheAsn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe

450 455 460450 455 460

His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln LeuHis Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu

465 470 475 480465 470 475 480

Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr HisArg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His

485 490 495485 490 495

Lys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn Gly Thr Tyr AsnLys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn Gly Thr Tyr Asn

500 505 510500 505 510

Tyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile SerTyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser

515 520 525515 520 525

Gly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile TyrGly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr

530 535 540530 535 540

Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Met Ala Gly LeuSer Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Met Ala Gly Leu

545 550 555 560545 550 555 560

Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys IleSer Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile

565 570 575565 570 575

<210> 70<210> 70

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H5Ind(F393D).r<223> Primer H5Ind(F393D).r

<400> 70<400> 70

cttccaacgg cctcgtcctg agtgttcatt ttgtcaatga ttgagttga 49cttccaacgg cctcgtcctg agtgttcatt ttgtcaatga ttgagttga 49

<210> 71<210> 71

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> H5Ind(F393D).c<223> H5Ind(F393D).c

<400> 71<400> 71

caaaatgaac actcaggacg aggccgttgg aagggaattt aataactta 49caaaatgaac actcaggacg aggccgttgg aagggaattt aataactta 49

<210> 72<210> 72

<211> 1731<211> 1731

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H5 Indo-F393D<223> DNA PDI-H5 Indo-F393D

<400> 72<400> 72

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cggatcagat ttgcattggt taccatgcaa acaattcaac agagcaggtt 120cagatcttcg cggatcagat ttgcattggt taccatgcaa acaattcaac agagcaggtt 120

gacacaatca tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 180gacacaatca tggaaaagaa cgttactgtt acacatgccc aagacatact ggaaaagaca 180

cacaacggga agctctgcga tctagatgga gtgaagcctc taattttaag agattgtagt 240cacaacggga agctctgcga tctagatgga gtgaagcctc taattttaag agattgtagt 240

gtagctggat ggctcctcgg gaacccaatg tgtgacgaat tcatcaatgt accggaatgg 300gtagctggat ggctcctcgg gaacccaatg tgtgacgaat tcatcaatgt acggaatgg 300

tcttacatag tggagaaggc caatccaacc aatgacctct gttacccagg gagtttcaac 360tcttacatag tggagaaggc caatccaacc aatgacctct gttacccagg gagtttcaac 360

gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcaaatc 420gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcaaatc 420

atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gagttagctc agcatgtcca 480atccccaaaa gttcttggtc cgatcatgaa gcctcatcag gagttagctc agcatgtcca 480

tacctgggaa gtccctcctt ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca 540tacctgggaa gtccctcctt ttttagaaat gtggtatggc ttatcaaaaa gaacagtaca 540

tacccaacaa taaagaaaag ctacaataat accaaccaag aggatctttt ggtactgtgg 600tacccaacaa taaagaaaag ctacaataat accaaccaag aggatctttt ggtactgtgg 600

ggaattcacc atcctaatga tgcggcagag cagacaaggc tatatcaaaa cccaaccacc 660ggaattcacc atcctaatga tgcggcagag cagacaaggc tatatcaaaa cccaaccacc 660

tatatttcca ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 720tatatttcca ttgggacatc aacactaaac cagagattgg taccaaaaat agctactaga 720

tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaacctaat 780tccaaagtaa acgggcaaag tggaaggatg gagttcttct ggacaatttt aaaacctaat 780

gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 840gatgcaatca acttcgagag taatggaaat ttcattgctc cagaatatgc atacaaaatt 840

gtcaagaaag gggactcagc aattatgaaa agtgaattgg aatatggtaa ctgcaacacc 900gtcaagaaag gggactcagc aattatgaaa agtgaattgg aatatggtaa ctgcaacacc 900

aagtgtcaaa ctccaatggg ggcgataaac tctagtatgc cattccacaa catacaccct 960aagtgtcaaa ctccaatggg ggcgataaac tctagtatgc cattccacaa catacaccct 960

ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcaacaggg ctcaccatcg gggaatgccc caaatatgtg aaatcaaaca gattagtcct tgcaacaggg

10201020

ctcagaaata gccctcaaag agagagcaga agaaaaaaga gaggactatt tggagctata ctcagaaata gccctcaaag agagagcaga agaaaaaaga gaggactatt tggagctata

10801080

gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat gcaggtttta tagagggagg atggcaggga atggtagatg gttggtatgg gtaccaccat

11401140

agcaatgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat agcaatgagc aggggagtgg gtacgctgca gacaaagaat ccactcaaaa ggcaatagat

12001200

ggagtcacca ataaggtcaa ctcaatcatt gacaaaatga acactcagga cgaggccgtt ggagtcacca ataaggtcaa ctcaatcatt gacaaaatga acactcagga cgaggccgtt

12601260

ggaagggaat ttaataactt agaaaggaga atagagaatt taaacaagaa gatggaagac ggaagggaat ttaataactt agaaaggaga atagagaatt taaacaagaa gatggaagac

13201320

gggtttctag atgtctggac ttataatgcc gaacttctgg ttctcatgga aaatgagaga gggtttctag atgtctggac ttataatgcc gaacttctgg ttctcatgga aaatgagaga

13801380

actctagact ttcatgactc aaatgttaag aacctctacg acaaggtccg actacagctt actctagact ttcatgactc aaatgttaag aacctctacg acaaggtccg actacagctt

14401440

agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcacaa atgtgataat agggataatg caaaggagct gggtaacggt tgtttcgagt tctatcacaa atgtgataat

15001500

gaatgtatgg aaagtataag aaacggaacg tacaactatc cgcagtattc agaagaagca gaatgtatgg aaagtataag aaacggaacg tacaactatc cgcagtattc agaagaagca

15601560

agattaaaaa gagaggaaat aagtggggta aaattggaat caataggaac ttaccaaata agattaaaaa gagaggaaat aagtggggta aaattggaat caataggaac ttaccaaata

16201620

ctgtcaattt attcaacagt ggcgagttcc ctagcactgg caatcatgat ggctggtcta ctgtcaattt attcaacagt ggcgagttcc ctagcactgg caatcatgat ggctggtcta

16801680

tctttatgga tgtgctccaa tggatcgtta caatgcagaa tttgcattta a 1731tctttatgga tgtgctccaa tggatcgtta caatgcagaa tttgcattta a 1731

<210> 73<210> 73

<211> 576<211> 576

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H5 Indo-F393D<223> AK PDI-H5 Indo-F393D

<400> 73<400> 73

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr HisLeu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His

20 25 3020 25 30

Ala Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn ValAla Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn Val

35 40 4535 40 45

Thr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly LysThr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly Lys

50 55 6050 55 60

Leu Cys Asp Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys SerLeu Cys Asp Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys Ser

65 70 75 8065 70 75 80

Val Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Ile AsnVal Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Ile Asn

85 90 9585 90 95

Val Pro Glu Trp Ser Tyr Ile Val Glu Lys Ala Asn Pro Thr Asn AspVal Pro Glu Trp Ser Tyr Ile Val Glu Lys Ala Asn Pro Thr Asn Asp

100 105 110100 105 110

Leu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His LeuLeu Cys Tyr Pro Gly Ser Phe Asn Asp Tyr Glu Glu Leu Lys His Leu

115 120 125115 120 125

Leu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys SerLeu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys Ser

130 135 140130 135 140

Ser Trp Ser Asp His Glu Ala Ser Ser Gly Val Ser Ser Ala Cys ProSer Trp Ser Asp His Glu Ala Ser Ser Gly Val Ser Ser Ala Cys Pro

145 150 155 160145 150 155 160

Tyr Leu Gly Ser Pro Ser Phe Phe Arg Asn Val Val Trp Leu Ile LysTyr Leu Gly Ser Pro Ser Phe Phe Arg Asn Val Val Trp Leu Ile Lys

165 170 175165 170 175

Lys Asn Ser Thr Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr AsnLys Asn Ser Thr Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn

180 185 190180 185 190

Gln Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp AlaGln Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala

195 200 205195 200 205

Ala Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser IleAla Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Ile

210 215 220210 215 220

Gly Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr ArgGly Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg

225 230 235 240225 230 235 240

Ser Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr IleSer Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile

245 250 255245 250 255

Leu Lys Pro Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe IleLeu Lys Pro Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile

260 265 270260 265 270

Ala Pro Glu Tyr Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Ala IleAla Pro Glu Tyr Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Ala Ile

275 280 285275 280 285

Met Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn Thr Lys Cys Gln ThrMet Lys Ser Glu Leu Glu Tyr Gly Asn Cys Asn Thr Lys Cys Gln Thr

290 295 300290 295 300

Pro Met Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His ProPro Met Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro

305 310 315 320305 310 315 320

Leu Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu ValLeu Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val

325 330 335325 330 335

Leu Ala Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg LysLeu Ala Thr Gly Leu Arg Asn Ser Pro Gln Arg Glu Ser Arg Arg Lys

340 345 350340 345 350

Lys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly TrpLys Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp

355 360 365355 360 365

Gln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu GlnGln Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln

370 375 380370 375 380

Gly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala Ile AspGly Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Lys Ala Ile Asp

385 390 395 400385 390 395 400

Gly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr GlnGly Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln

405 410 415405 410 415

Asp Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile GluAsp Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu

420 425 430420 425 430

Asn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr TyrAsn Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr

435 440 445435 440 445

Asn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp PheAsn Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe

450 455 460450 455 460

His Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln LeuHis Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu

465 470 475 480465 470 475 480

Arg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr HisArg Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His

485 490 495485 490 495

Lys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn Gly Thr Tyr AsnLys Cys Asp Asn Glu Cys Met Glu Ser Ile Arg Asn Gly Thr Tyr Asn

500 505 510500 505 510

Tyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile SerTyr Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser

515 520 525515 520 525

Gly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile TyrGly Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr

530 535 540530 535 540

Ser Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Met Ala Gly LeuSer Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Met Ala Gly Leu

545 550 555 560545 550 555 560

Ser Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys IleSer Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile

565 570 575565 570 575

<210> 74<210> 74

<211> 51<211> 51

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер IF-H5_Egy.r<223> Primer IF-H5_Egy.r

<400> 74<400> 74

actaaagaaa ataggccttt aaatgcaaat tctgcattgt agcgatccat t 51actaaagaaa ataggccttt aaatgcaaat tctgcattgt agcgatccat t 51

<210> 75<210> 75

<211> 1728<211> 1728

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H5 Egypt<223> DNA PDI-H5 Egypt

<400> 75<400> 75

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cggatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 120cagatcttcg cggatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 120

gacacaataa tggaaaagaa tgtcactgtt acacacgccc aagacatact ggaaaagaca 180gacacaataa tggaaaagaa tgtcactgtt acaacgccc aagacatact ggaaaagaca 180

cacaacggga aactctgcaa tctagatgga gtgaagcctc tcattttgag agattgtagt 240cacaacggga aactctgcaa tctagatgga gtgaagcctc tcattttgag agattgtagt 240

gtagctggat ggctcctcgg gaacccaatg tgcgatgaat tcctcaatgt gccggaatgg 300gtagctggat ggctcctcgg gaacccaatg tgcgatgaat tcctcaatgt gccggaatgg 300

tcttacatag tggagaaaat caatccagcc aatgacctct gttatccagg gaatttcaac 360tcttacatag tggagaaaat caatccagcc aatgacctct gttatccagg gaatttcaac 360

gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 420gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 420

attcccaaag attcttggtc agatcatgaa gcctcgggag tgagctcagc atgcccatac 480attcccaaag attcttggtc agatcatgaa gcctcgggag tgagctcagc atgcccatac 480

caaggaagat cctccttttt tagaaatgtt gtatggctta ccaaaaagaa cgatgcatac 540caaggaagat cctccttttt tagaaatgtt gtatggctta ccaaaaagaa cgatgcatac 540

ccaacaataa agaaaagtta caataatact aaccaagaag atcttttggt actatggggg 600ccaacaataa agaaaagtta caataatact aaccaagaag atcttttggt actatggggg 600

attcaccatc caaatgatgc tgcagagcag acaaggcttt atcaaaaccc aactacctat 660attcaccatc caaatgatgc tgcagagcag acaaggcttt atcaaaaccc aactacctat 660

atctccgttg ggacatcaac actaaaccag agattggtac ccaaaatagc tactagatct 720atctccgttg ggacatcaac actaaaccag agattggtac ccaaaatagc tactagatct 720

aaggtaaacg ggcaaagtgg aaggatggag ttcttttgga caattttaaa atcgaatgat 780aaggtaaacg ggcaaagtgg aaggatggag ttcttttgga caattttaaa atcgaatgat 780

gcaataaact ttgagagcaa tggaaacttc attgctccag aaaatgcata caaaattgtc 840gcaataaact ttgagagcaa tggaaacttc attgctccag aaaatgcata caaaattgtc 840

aagaaaggag attcaacaat tatgaaaagt gagttggaat atagtaactg caacaccaag 900aagaaaggag attcaacaat tatgaaaagt gagttggaat atagtaactg caacaccaag 900

tgtcagactc caataggggc gataaactcc agtatgccat tccacaacat ccaccctctc 960tgtcagactc caataggggc gataaactcc agtatgccat tccacaacat ccaccctctc 960

accatcgggg aatgccccaa atatgtgaaa tcaaacagat tagtccttgc tactgggctc accatcgggg aatgccccaa atatgtgaaa tcaaacagat tagtccttgc tactgggctc

10201020

aggaatagcc ctcaaggaga gaaaagaaga aaaaagagag gactattcgg agccatagca aggaatagcc ctcaaggaga gaaaagaaga aaaaagagag gactattcgg agccatagca

10801080

ggctttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc ggctttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc

11401140

aacgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaagggc tatagatgga aacgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaagggc tatagatgga

12001200

gtcaccaata aggtcaattc gatcattgac aaaatgaaca ctcagtttga ggctgttgga gtcaccaata aggtcaattc gatcattgac aaaatgaaca ctcagtttga ggctgttgga

12601260

agggaattta ataacttaga aaggagaata gaaaatttaa acaagaagat ggaagacgga agggaattta ataacttaga aaggagaata gaaaatttaa acaagaagat ggaagacgga

13201320

ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact

13801380

ctagactttc atgactcaaa tgtcaagaat ctttatgaca aggtccgact acagcttagg ctagactttc atgactcaaa tgtcaagaat ctttatgaca aggtccgact acagcttagg

14401440

gataatgcaa aggagcttgg taacggttgt ttcgagttct atcacagatg tgataatgaa gataatgcaa aggagcttgg taacggttgt ttcgagttct atcacagatg tgataatgaa

15001500

tgtatggaaa gtgtaagaaa cggaacgtat gactaccctc aatattcaga agaagcaaga tgtatggaaa gtgtaagaaa cggaacgtat gactaccctc aatattcaga agaagcaaga

15601560

ttaaaaagag aggaaataag tggagtaaaa ttggagtcaa taggaactta ccaaatactg ttaaaaagag aggaaataag tggagtaaaa ttggagtcaa taggaactta ccaaatactg

16201620

tcaatttatt caacagtggc gagctcccta gcactggcaa tcatggtggc tggtctatct tcaatttatt caacagtggc gagctcccta gcactggcaa tcatggtggc tggtctatct

16801680

ttatggatgt gctccaatgg atcgctacaa tgcagaattt gcatttaa 1728ttatggatgt gctccaatgg atcgctacaa tgcagaattt gcatttaa 1728

<210> 76<210> 76

<211> 575<211> 575

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H5 Egypt<223> AK PDI-H5 Egypt

<400> 76<400> 76

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr HisLeu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His

20 25 3020 25 30

Ala Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn ValAla Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn Val

35 40 4535 40 45

Thr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly LysThr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly Lys

50 55 6050 55 60

Leu Cys Asn Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys SerLeu Cys Asn Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys Ser

65 70 75 8065 70 75 80

Val Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Leu AsnVal Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Leu Asn

85 90 9585 90 95

Val Pro Glu Trp Ser Tyr Ile Val Glu Lys Ile Asn Pro Ala Asn AspVal Pro Glu Trp Ser Tyr Ile Val Glu Lys Ile Asn Pro Ala Asn Asp

100 105 110100 105 110

Leu Cys Tyr Pro Gly Asn Phe Asn Asp Tyr Glu Glu Leu Lys His LeuLeu Cys Tyr Pro Gly Asn Phe Asn Asp Tyr Glu Glu Leu Lys His Leu

115 120 125115 120 125

Leu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys AspLeu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys Asp

130 135 140130 135 140

Ser Trp Ser Asp His Glu Ala Ser Gly Val Ser Ser Ala Cys Pro TyrSer Trp Ser Asp His Glu Ala Ser Gly Val Ser Ser Ala Cys Pro Tyr

145 150 155 160145 150 155 160

Gln Gly Arg Ser Ser Phe Phe Arg Asn Val Val Trp Leu Thr Lys LysGln Gly Arg Ser Ser Phe Phe Arg Asn Val Val Trp Leu Thr Lys Lys

165 170 175165 170 175

Asn Asp Ala Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn GlnAsn Asp Ala Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn Gln

180 185 190180 185 190

Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala AlaGlu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala Ala

195 200 205195 200 205

Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Val GlyGlu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Val Gly

210 215 220210 215 220

Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg SerThr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg Ser

225 230 235 240225 230 235 240

Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile LeuLys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile Leu

245 250 255245 250 255

Lys Ser Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile AlaLys Ser Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile Ala

260 265 270260 265 270

Pro Glu Asn Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Thr Ile MetPro Glu Asn Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Thr Ile Met

275 280 285275 280 285

Lys Ser Glu Leu Glu Tyr Ser Asn Cys Asn Thr Lys Cys Gln Thr ProLys Ser Glu Leu Glu Tyr Ser Asn Cys Asn Thr Lys Cys Gln Thr Pro

290 295 300290 295 300

Ile Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro LeuIle Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro Leu

305 310 315 320305 310 315 320

Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val LeuThr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val Leu

325 330 335325 330 335

Ala Thr Gly Leu Arg Asn Ser Pro Gln Gly Glu Lys Arg Arg Lys LysAla Thr Gly Leu Arg Asn Ser Pro Gln Gly Glu Lys Arg Arg Lys Lys

340 345 350340 345 350

Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp GlnArg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Gln

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln GlyGly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln Gly

370 375 380370 375 380

Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Arg Ala Ile Asp GlySer Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Arg Ala Ile Asp Gly

385 390 395 400385 390 395 400

Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln PheVal Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln Phe

405 410 415405 410 415

Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu AsnGlu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu Asn

420 425 430420 425 430

Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr AsnLeu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe HisAla Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe His

450 455 460450 455 460

Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu ArgAsp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu Arg

465 470 475 480465 470 475 480

Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His ArgAsp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His Arg

485 490 495485 490 495

Cys Asp Asn Glu Cys Met Glu Ser Val Arg Asn Gly Thr Tyr Asp TyrCys Asp Asn Glu Cys Met Glu Ser Val Arg Asn Gly Thr Tyr Asp Tyr

500 505 510500 505 510

Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser GlyPro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser Gly

515 520 525515 520 525

Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr SerVal Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr Ser

530 535 540530 535 540

Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Val Ala Gly Leu SerThr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Val Ala Gly Leu Ser

545 550 555 560545 550 555 560

Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys IleLeu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile

565 570 575565 570 575

<210> 77<210> 77

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H5Egy(F392D).r<223> Primer H5Egy(F392D).r

<400> 77<400> 77

cttccaacag cctcgtcctg agtgttcatt ttgtcaatga tcgaattga 49cttccaacag cctcgtcctg agtgttcatt ttgtcaatga tcgaattga 49

<210> 78<210> 78

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Праймер H5Egy(F392D).c<223> Primer H5Egy(F392D).c

<400> 78<400> 78

caaaatgaac actcaggacg aggctgttgg aagggaattt aataactta 49caaaatgaac actcaggacg aggctgttgg aagggaattt aataactta 49

<210> 79<210> 79

<211> 1728<211> 1728

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H5 Egypt-F392D<223> DNA PDI-H5 Egypt-F392D

<400> 79<400> 79

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cggatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 120cagatcttcg cggatcagat ttgcattggt taccatgcaa acaactcgac agagcaggtt 120

gacacaataa tggaaaagaa tgtcactgtt acacacgccc aagacatact ggaaaagaca 180gacacaataa tggaaaagaa tgtcactgtt acaacgccc aagacatact ggaaaagaca 180

cacaacggga aactctgcaa tctagatgga gtgaagcctc tcattttgag agattgtagt 240cacaacggga aactctgcaa tctagatgga gtgaagcctc tcattttgag agattgtagt 240

gtagctggat ggctcctcgg gaacccaatg tgcgatgaat tcctcaatgt gccggaatgg 300gtagctggat ggctcctcgg gaacccaatg tgcgatgaat tcctcaatgt gccggaatgg 300

tcttacatag tggagaaaat caatccagcc aatgacctct gttatccagg gaatttcaac 360tcttacatag tggagaaaat caatccagcc aatgacctct gttatccagg gaatttcaac 360

gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 420gactatgaag aactgaaaca cctattgagc agaataaacc attttgagaa aattcagatc 420

attcccaaag attcttggtc agatcatgaa gcctcgggag tgagctcagc atgcccatac 480attcccaaag attcttggtc agatcatgaa gcctcgggag tgagctcagc atgcccatac 480

caaggaagat cctccttttt tagaaatgtt gtatggctta ccaaaaagaa cgatgcatac 540caaggaagat cctccttttt tagaaatgtt gtatggctta ccaaaaagaa cgatgcatac 540

ccaacaataa agaaaagtta caataatact aaccaagaag atcttttggt actatggggg 600ccaacaataa agaaaagtta caataatact aaccaagaag atcttttggt actatggggg 600

attcaccatc caaatgatgc tgcagagcag acaaggcttt atcaaaaccc aactacctat 660attcaccatc caaatgatgc tgcagagcag acaaggcttt atcaaaaccc aactacctat 660

atctccgttg ggacatcaac actaaaccag agattggtac ccaaaatagc tactagatct 720atctccgttg ggacatcaac actaaaccag agattggtac ccaaaatagc tactagatct 720

aaggtaaacg ggcaaagtgg aaggatggag ttcttttgga caattttaaa atcgaatgat 780aaggtaaacg ggcaaagtgg aaggatggag ttcttttgga caattttaaa atcgaatgat 780

gcaataaact ttgagagcaa tggaaacttc attgctccag aaaatgcata caaaattgtc 840gcaataaact ttgagagcaa tggaaacttc attgctccag aaaatgcata caaaattgtc 840

aagaaaggag attcaacaat tatgaaaagt gagttggaat atagtaactg caacaccaag 900aagaaaggag attcaacaat tatgaaaagt gagttggaat atagtaactg caacaccaag 900

tgtcagactc caataggggc gataaactcc agtatgccat tccacaacat ccaccctctc 960tgtcagactc caataggggc gataaactcc agtatgccat tccacaacat ccaccctctc 960

accatcgggg aatgccccaa atatgtgaaa tcaaacagat tagtccttgc tactgggctc accatcgggg aatgccccaa atatgtgaaa tcaaacagat tagtccttgc tactgggctc

10201020

aggaatagcc ctcaaggaga gaaaagaaga aaaaagagag gactattcgg agccatagca aggaatagcc ctcaaggaga gaaaagaaga aaaaagagag gactattcgg agccatagca

10801080

ggctttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc ggctttatag agggaggatg gcagggaatg gtagatggtt ggtatgggta ccaccatagc

11401140

aacgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaagggc tatagatgga aacgagcagg ggagtgggta cgctgcagac aaagaatcca ctcaaagggc tatagatgga

12001200

gtcaccaata aggtcaattc gatcattgac aaaatgaaca ctcaggacga ggctgttgga gtcaccaata aggtcaattc gatcattgac aaaatgaaca ctcaggacga ggctgttgga

12601260

agggaattta ataacttaga aaggagaata gaaaatttaa acaagaagat ggaagacgga agggaattta ataacttaga aaggagaata gaaaatttaa acaagaagat ggaagacgga

13201320

ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact ttcctagatg tctggactta taatgctgaa cttctggttc tcatggaaaa tgagagaact

13801380

ctagactttc atgactcaaa tgtcaagaat ctttatgaca aggtccgact acagcttagg ctagactttc atgactcaaa tgtcaagaat ctttatgaca aggtccgact acagcttagg

14401440

gataatgcaa aggagcttgg taacggttgt ttcgagttct atcacagatg tgataatgaa gataatgcaa aggagcttgg taacggttgt ttcgagttct atcacagatg tgataatgaa

15001500

tgtatggaaa gtgtaagaaa cggaacgtat gactaccctc aatattcaga agaagcaaga tgtatggaaa gtgtaagaaa cggaacgtat gactaccctc aatattcaga agaagcaaga

15601560

ttaaaaagag aggaaataag tggagtaaaa ttggagtcaa taggaactta ccaaatactg ttaaaaagag aggaaataag tggagtaaaa ttggagtcaa taggaactta ccaaatactg

16201620

tcaatttatt caacagtggc gagctcccta gcactggcaa tcatggtggc tggtctatct tcaatttatt caacagtggc gagctcccta gcactggcaa tcatggtggc tggtctatct

16801680

ttatggatgt gctccaatgg atcgctacaa tgcagaattt gcatttaa 1728ttatggatgt gctccaatgg atcgctacaa tgcagaattt gcatttaa 1728

<210> 80<210> 80

<211> 575<211> 575

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H5 Egypt-F392D<223> AK PDI-H5 Egypt-F392D

<400> 80<400> 80

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr HisLeu Val Pro Ser Gln Ile Phe Ala Asp Gln Ile Cys Ile Gly Tyr His

20 25 3020 25 30

Ala Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn ValAla Asn Asn Ser Thr Glu Gln Val Asp Thr Ile Met Glu Lys Asn Val

35 40 4535 40 45

Thr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly LysThr Val Thr His Ala Gln Asp Ile Leu Glu Lys Thr His Asn Gly Lys

50 55 6050 55 60

Leu Cys Asn Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys SerLeu Cys Asn Leu Asp Gly Val Lys Pro Leu Ile Leu Arg Asp Cys Ser

65 70 75 8065 70 75 80

Val Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Leu AsnVal Ala Gly Trp Leu Leu Gly Asn Pro Met Cys Asp Glu Phe Leu Asn

85 90 9585 90 95

Val Pro Glu Trp Ser Tyr Ile Val Glu Lys Ile Asn Pro Ala Asn AspVal Pro Glu Trp Ser Tyr Ile Val Glu Lys Ile Asn Pro Ala Asn Asp

100 105 110100 105 110

Leu Cys Tyr Pro Gly Asn Phe Asn Asp Tyr Glu Glu Leu Lys His LeuLeu Cys Tyr Pro Gly Asn Phe Asn Asp Tyr Glu Glu Leu Lys His Leu

115 120 125115 120 125

Leu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys AspLeu Ser Arg Ile Asn His Phe Glu Lys Ile Gln Ile Ile Pro Lys Asp

130 135 140130 135 140

Ser Trp Ser Asp His Glu Ala Ser Gly Val Ser Ser Ala Cys Pro TyrSer Trp Ser Asp His Glu Ala Ser Gly Val Ser Ser Ala Cys Pro Tyr

145 150 155 160145 150 155 160

Gln Gly Arg Ser Ser Phe Phe Arg Asn Val Val Trp Leu Thr Lys LysGln Gly Arg Ser Ser Phe Phe Arg Asn Val Val Trp Leu Thr Lys Lys

165 170 175165 170 175

Asn Asp Ala Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn GlnAsn Asp Ala Tyr Pro Thr Ile Lys Lys Ser Tyr Asn Asn Thr Asn Gln

180 185 190180 185 190

Glu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala AlaGlu Asp Leu Leu Val Leu Trp Gly Ile His His Pro Asn Asp Ala Ala

195 200 205195 200 205

Glu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Val GlyGlu Gln Thr Arg Leu Tyr Gln Asn Pro Thr Thr Tyr Ile Ser Val Gly

210 215 220210 215 220

Thr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg SerThr Ser Thr Leu Asn Gln Arg Leu Val Pro Lys Ile Ala Thr Arg Ser

225 230 235 240225 230 235 240

Lys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile LeuLys Val Asn Gly Gln Ser Gly Arg Met Glu Phe Phe Trp Thr Ile Leu

245 250 255245 250 255

Lys Ser Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile AlaLys Ser Asn Asp Ala Ile Asn Phe Glu Ser Asn Gly Asn Phe Ile Ala

260 265 270260 265 270

Pro Glu Asn Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Thr Ile MetPro Glu Asn Ala Tyr Lys Ile Val Lys Lys Gly Asp Ser Thr Ile Met

275 280 285275 280 285

Lys Ser Glu Leu Glu Tyr Ser Asn Cys Asn Thr Lys Cys Gln Thr ProLys Ser Glu Leu Glu Tyr Ser Asn Cys Asn Thr Lys Cys Gln Thr Pro

290 295 300290 295 300

Ile Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro LeuIle Gly Ala Ile Asn Ser Ser Met Pro Phe His Asn Ile His Pro Leu

305 310 315 320305 310 315 320

Thr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val LeuThr Ile Gly Glu Cys Pro Lys Tyr Val Lys Ser Asn Arg Leu Val Leu

325 330 335325 330 335

Ala Thr Gly Leu Arg Asn Ser Pro Gln Gly Glu Lys Arg Arg Lys LysAla Thr Gly Leu Arg Asn Ser Pro Gln Gly Glu Lys Arg Arg Lys Lys

340 345 350340 345 350

Arg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp GlnArg Gly Leu Phe Gly Ala Ile Ala Gly Phe Ile Glu Gly Gly Trp Gln

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln GlyGly Met Val Asp Gly Trp Tyr Gly Tyr His His Ser Asn Glu Gln Gly

370 375 380370 375 380

Ser Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Arg Ala Ile Asp GlySer Gly Tyr Ala Ala Asp Lys Glu Ser Thr Gln Arg Ala Ile Asp Gly

385 390 395 400385 390 395 400

Val Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln AspVal Thr Asn Lys Val Asn Ser Ile Ile Asp Lys Met Asn Thr Gln Asp

405 410 415405 410 415

Glu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu AsnGlu Ala Val Gly Arg Glu Phe Asn Asn Leu Glu Arg Arg Ile Glu Asn

420 425 430420 425 430

Leu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr AsnLeu Asn Lys Lys Met Glu Asp Gly Phe Leu Asp Val Trp Thr Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe HisAla Glu Leu Leu Val Leu Met Glu Asn Glu Arg Thr Leu Asp Phe His

450 455 460450 455 460

Asp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu ArgAsp Ser Asn Val Lys Asn Leu Tyr Asp Lys Val Arg Leu Gln Leu Arg

465 470 475 480465 470 475 480

Asp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His ArgAsp Asn Ala Lys Glu Leu Gly Asn Gly Cys Phe Glu Phe Tyr His Arg

485 490 495485 490 495

Cys Asp Asn Glu Cys Met Glu Ser Val Arg Asn Gly Thr Tyr Asp TyrCys Asp Asn Glu Cys Met Glu Ser Val Arg Asn Gly Thr Tyr Asp Tyr

500 505 510500 505 510

Pro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser GlyPro Gln Tyr Ser Glu Glu Ala Arg Leu Lys Arg Glu Glu Ile Ser Gly

515 520 525515 520 525

Val Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr SerVal Lys Leu Glu Ser Ile Gly Thr Tyr Gln Ile Leu Ser Ile Tyr Ser

530 535 540530 535 540

Thr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Val Ala Gly Leu SerThr Val Ala Ser Ser Leu Ala Leu Ala Ile Met Val Ala Gly Leu Ser

545 550 555 560545 550 555 560

Leu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys IleLeu Trp Met Cys Ser Asn Gly Ser Leu Gln Cys Arg Ile Cys Ile

565 570 575565 570 575

<210> 81<210> 81

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-N382A<223> DNA PDI-H3 Switz-N382A

<400> 81<400> 81

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 82<210> 82

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-N382A<223> AK PDI-H3 Switz-N382A

<400> 82<400> 82

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 83<210> 83

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Switz-L384V<223> DNA PDI-H3 Switz-L384V

<400> 83<400> 83

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggagaaaa ctgcacacta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagaa atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacaatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tcttcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600ttaaactcca aatacccagc attaaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660ttgtacattt ggggggttca ccacccgggt acggacaagg accaaatctt cctgtatgca 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aagggatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacgaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaga caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa ggtttcatag aaaatggttg ggagggaatg gtggatggtt ggtacggctt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcatta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atgttttttg ctttgtgttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 84<210> 84

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Switz-L384V<223> AK PDI-H3 Switz-L384V

<400> 84<400> 84

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Glu Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Lys Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asn Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ser Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Leu Asn Ser Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asp Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Arg Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Arg Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Val Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Cys Phe Leu Leu Cys Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 85<210> 85

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Penn-CysTm<223> DNA PDI-H3 Penn-CysTm

<400> 85<400> 85

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 86<210> 86

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Penn-CysTm<223> AK PDI-H3 Penn-CysTm

<400> 86<400> 86

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 87<210> 87

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Penn-N382A-CysTm<223> DNA PDI-H3 Penn-N382A-CysTm

<400> 87<400> 87

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctggctcg attgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 88<210> 88

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Penn-N382A-CysTm<223> AK PDI-H3 Penn-N382A-CysTm

<400> 88<400> 88

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Ala Arg Leu Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 89<210> 89

<211> 1725<211> 1725

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> ДНК PDI-H3 Penn-L384V-CysTm<223> DNA PDI-H3 Penn-L384V-CysTm

<400> 89<400> 89

atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60atggcgaaaa acgttgcgat tttcggctta ttgttttctc ttcttgtgtt ggttccttct 60

cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120cagatcttcg cgcaaaaact tcctggaaat gacaatagca cggcaacgct gtgccttggg 120

caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180caccatgcag taccaaacgg aacgatagtg aaaacaatca cgaatgaccg aattgaagtt 180

actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240actaatgcta ctgagctggt tcagaattcc tcaataggtg aaatatgcga cagtcctcat 240

cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300cagatccttg atggaaaaaa ctgcactcta atagatgctc tattgggaga ccctcagtgt 300

gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360gatggctttc aaaataagag atgggacctt tttgttgaac gaagcaaagc ctacagcaac 360

tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420tgttaccctt atgatgtgcc ggattatgcc tcccttaggt cactagttgc ctcatccggc 420

acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480acactggagt ttaacgatga aagcttcaat tgggctggag tcactcaaaa cggaacaagt 480

tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540tctgcttgca taaggggatc taatagtagt ttctttagta gattaaattg gttgacccac 540

tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600tcaaacttca aatacccagc attgaacgtg actatgccaa acaatgaaca atttgacaaa 600

ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660ttgtacattt ggggggttca ccacccgggt acagacaagg accaaatctt cctgtacgct 660

caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720caatcatcag gaagaatcac agtatctacc aaaagaagcc aacaagctgt aatcccgaat 720

atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780atcggatcta gacccagaat aaggaatatc cctagcagaa taagcatcta ttggacaata 780

gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840gtaaaaccgg gagacatact tttgattaac agcacaggga atctaattgc tcctaggggt 840

tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900tacttcaaaa tacaaagtgg gaaaagctca ataatgagat cagatgcacc cattggcaaa 900

tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960tgcaagtctg aatgcatcac tccaaatgga agcattccca atgacaaacc attccaaaat 960

gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg gtaaacagga tcacatacgg ggcctgtccc agatatgtta agcaaagcac tctgaaattg

10201020

gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg gcaacaggaa tgcgaaatgt accagagaaa caaactagag gcatatttgg cgcaatagcg

10801080

ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa ggtttcatag aaaatggttg ggagggaatg aaggatggtt ggtacggttt caggcatcaa

11401140

aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa aattctgagg gaagaggaca agcagcagat ctcaaaagca ctcaagcagc aatcgatcaa

12001200

atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa atcaatggga agctgaatcg agtgatcggg aaaaccaacg agaaattcca tcagattgaa

12601260

aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca aaagaattct cagaagtaga agggagaatt caggaccttg agaaatatgt tgaggacaca

13201320

aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca aaaatagatc tctggtcata caacgcggag cttcttgttg ccctggagaa ccaacataca

13801380

attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg attgatctaa ctgactcaga aatgaacaaa ctgtttgaaa aaacaaagaa gcaactgagg

14401440

gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc gaaaatgctg aggatatggg caatggttgt ttcaaaatat accacaaatg tgacaatgcc

15001500

tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta tgcataggat caatcagaaa tggaacttat gaccacgatg tatacaggga tgaagcttta

15601560

aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta aacaaccggt tccagatcaa gggagttgag ctgaagtcag ggtacaaaga ttggatccta

16201620

tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg tggatttcct ttgccatatc atcccttgta ctgttagttg ctttgttggg gttcatcatg

16801680

tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725tgggcctgcc aaaagggcaa cattaggtgc aacatttgca tttga 1725

<210> 90<210> 90

<211> 574<211> 574

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> АК PDI-H3 Penn-L384V-CysTm<223> AK PDI-H3 Penn-L384V-CysTm

<400> 90<400> 90

Met Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu ValMet Ala Lys Asn Val Ala Ile Phe Gly Leu Leu Phe Ser Leu Leu Val

1 5 10 151 5 10 15

Leu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp AsnLeu Val Pro Ser Gln Ile Phe Ala Gln Lys Leu Pro Gly Asn Asp Asn

20 25 3020 25 30

Ser Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly ThrSer Thr Ala Thr Leu Cys Leu Gly His His Ala Val Pro Asn Gly Thr

35 40 4535 40 45

Ile Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala ThrIle Val Lys Thr Ile Thr Asn Asp Arg Ile Glu Val Thr Asn Ala Thr

50 55 6050 55 60

Glu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro HisGlu Leu Val Gln Asn Ser Ser Ile Gly Glu Ile Cys Asp Ser Pro His

65 70 75 8065 70 75 80

Gln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu GlyGln Ile Leu Asp Gly Lys Asn Cys Thr Leu Ile Asp Ala Leu Leu Gly

85 90 9585 90 95

Asp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe ValAsp Pro Gln Cys Asp Gly Phe Gln Asn Lys Arg Trp Asp Leu Phe Val

100 105 110100 105 110

Glu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro AspGlu Arg Ser Lys Ala Tyr Ser Asn Cys Tyr Pro Tyr Asp Val Pro Asp

115 120 125115 120 125

Tyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu PheTyr Ala Ser Leu Arg Ser Leu Val Ala Ser Ser Gly Thr Leu Glu Phe

130 135 140130 135 140

Asn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr SerAsn Asp Glu Ser Phe Asn Trp Ala Gly Val Thr Gln Asn Gly Thr Ser

145 150 155 160145 150 155 160

Ser Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu AsnSer Ala Cys Ile Arg Gly Ser Asn Ser Ser Phe Phe Ser Arg Leu Asn

165 170 175165 170 175

Trp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr MetTrp Leu Thr His Ser Asn Phe Lys Tyr Pro Ala Leu Asn Val Thr Met

180 185 190180 185 190

Pro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His HisPro Asn Asn Glu Gln Phe Asp Lys Leu Tyr Ile Trp Gly Val His His

195 200 205195 200 205

Pro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser GlyPro Gly Thr Asp Lys Asp Gln Ile Phe Leu Tyr Ala Gln Ser Ser Gly

210 215 220210 215 220

Arg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro AsnArg Ile Thr Val Ser Thr Lys Arg Ser Gln Gln Ala Val Ile Pro Asn

225 230 235 240225 230 235 240

Ile Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser IleIle Gly Ser Arg Pro Arg Ile Arg Asn Ile Pro Ser Arg Ile Ser Ile

245 250 255245 250 255

Tyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser ThrTyr Trp Thr Ile Val Lys Pro Gly Asp Ile Leu Leu Ile Asn Ser Thr

260 265 270260 265 270

Gly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly LysGly Asn Leu Ile Ala Pro Arg Gly Tyr Phe Lys Ile Gln Ser Gly Lys

275 280 285275 280 285

Ser Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser GluSer Ser Ile Met Arg Ser Asp Ala Pro Ile Gly Lys Cys Lys Ser Glu

290 295 300290 295 300

Cys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln AsnCys Ile Thr Pro Asn Gly Ser Ile Pro Asn Asp Lys Pro Phe Gln Asn

305 310 315 320305 310 315 320

Val Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln SerVal Asn Arg Ile Thr Tyr Gly Ala Cys Pro Arg Tyr Val Lys Gln Ser

325 330 335325 330 335

Thr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln ThrThr Leu Lys Leu Ala Thr Gly Met Arg Asn Val Pro Glu Lys Gln Thr

340 345 350340 345 350

Arg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp GluArg Gly Ile Phe Gly Ala Ile Ala Gly Phe Ile Glu Asn Gly Trp Glu

355 360 365355 360 365

Gly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu GlyGly Met Lys Asp Gly Trp Tyr Gly Phe Arg His Gln Asn Ser Glu Gly

370 375 380370 375 380

Arg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp GlnArg Gly Gln Ala Ala Asp Leu Lys Ser Thr Gln Ala Ala Ile Asp Gln

385 390 395 400385 390 395 400

Ile Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys PheIle Asn Gly Lys Leu Asn Arg Val Ile Gly Lys Thr Asn Glu Lys Phe

405 410 415405 410 415

His Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln AspHis Gln Ile Glu Lys Glu Phe Ser Glu Val Glu Gly Arg Ile Gln Asp

420 425 430420 425 430

Leu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr AsnLeu Glu Lys Tyr Val Glu Asp Thr Lys Ile Asp Leu Trp Ser Tyr Asn

435 440 445435 440 445

Ala Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu ThrAla Glu Leu Leu Val Ala Leu Glu Asn Gln His Thr Ile Asp Leu Thr

450 455 460450 455 460

Asp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu ArgAsp Ser Glu Met Asn Lys Leu Phe Glu Lys Thr Lys Lys Gln Leu Arg

465 470 475 480465 470 475 480

Glu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His LysGlu Asn Ala Glu Asp Met Gly Asn Gly Cys Phe Lys Ile Tyr His Lys

485 490 495485 490 495

Cys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp HisCys Asp Asn Ala Cys Ile Gly Ser Ile Arg Asn Gly Thr Tyr Asp His

500 505 510500 505 510

Asp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys GlyAsp Val Tyr Arg Asp Glu Ala Leu Asn Asn Arg Phe Gln Ile Lys Gly

515 520 525515 520 525

Val Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser PheVal Glu Leu Lys Ser Gly Tyr Lys Asp Trp Ile Leu Trp Ile Ser Phe

530 535 540530 535 540

Ala Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile MetAla Ile Ser Ser Leu Val Leu Leu Val Ala Leu Leu Gly Phe Ile Met

545 550 555 560545 550 555 560

Trp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys IleTrp Ala Cys Gln Lys Gly Asn Ile Arg Cys Asn Ile Cys Ile

565 570565 570

<210> 91<210> 91

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 91<400> 91

Gln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp ThrAla Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Thr

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Lys Ser SerGly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Lys Ser Ser

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr ThrSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr Thr

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Val Pro Asn Asn Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Val Pro Asn Asn Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Arg Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Arg Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Gly Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Gly Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 92<210> 92

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 92<400> 92

Gln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp ThrAla Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Thr

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser SerGly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Ser

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr ThrSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr Thr

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Gly Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Gly Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 93<210> 93

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 93<400> 93

Gln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp ThrAla Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Thr

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser SerGly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Ser

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr ThrSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr Thr

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Lys Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Lys Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Val Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Val Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Glu Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Glu Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 94<210> 94

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 94<400> 94

Gln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Ile Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Lys Asn Glu Ser Phe Asn Trp ThrAla Ser Ser Gly Thr Leu Glu Phe Lys Asn Glu Ser Phe Asn Trp Thr

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser SerGly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Arg Ser Ser

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr ThrSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Tyr Thr

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Lys Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Lys Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys His Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Val Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Val Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Glu Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Glu Thr Tyr Asp His Asn Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 95<210> 95

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 95<400> 95

Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Lys Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Lys Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Arg Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Arg Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asp Glu Ser Phe Asn Trp AlaAla Ser Ser Gly Thr Leu Glu Phe Asn Asp Glu Ser Phe Asn Trp Ala

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Gly Ser AsnGly Val Thr Gln Asn Gly Thr Ser Ser Ala Cys Ile Arg Gly Ser Asn

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Ser Asn Phe LysSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Ser Asn Phe Lys

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsn Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Gln Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Gln Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys Gln Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys Gln Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Lys Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Lys Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Lys Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 96<210> 96

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 96<400> 96

Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Lys Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp AlaAla Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Ala

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ser Cys Ile Arg Gly Ser AsnGly Val Thr Gln Asn Gly Thr Ser Ser Ser Cys Ile Arg Gly Ser Asn

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Ser LysSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Ser Lys

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Gln Ser Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys Gln Ser Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys Gln Ser Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Arg Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Arg Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 97<210> 97

<211> 550<211> 550

<212> Белок<212> Protein

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 97<400> 97

Gln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu GlyGln Lys Leu Pro Gly Asn Asp Asn Ser Thr Ala Thr Leu Cys Leu Gly

1 5 10 151 5 10 15

His His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn AspHis His Ala Val Pro Asn Gly Thr Ile Val Lys Thr Ile Thr Asn Asp

20 25 3020 25 30

Arg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser IleArg Ile Glu Val Thr Asn Ala Thr Glu Leu Val Gln Asn Ser Ser Ile

35 40 4535 40 45

Gly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn CysGly Glu Ile Cys Asp Ser Pro His Gln Ile Leu Asp Gly Glu Asn Cys

50 55 6050 55 60

Thr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe GlnThr Leu Ile Asp Ala Leu Leu Gly Asp Pro Gln Cys Asp Gly Phe Gln

65 70 75 8065 70 75 80

Asn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Arg Ala Tyr Ser AsnAsn Lys Lys Trp Asp Leu Phe Val Glu Arg Ser Arg Ala Tyr Ser Asn

85 90 9585 90 95

Cys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu ValCys Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Leu Arg Ser Leu Val

100 105 110100 105 110

Ala Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp AlaAla Ser Ser Gly Thr Leu Glu Phe Asn Asn Glu Ser Phe Asn Trp Ala

115 120 125115 120 125

Gly Val Thr Gln Asn Gly Thr Ser Ser Ser Cys Ile Arg Gly Ser AsnGly Val Thr Gln Asn Gly Thr Ser Ser Ser Cys Ile Arg Gly Ser Asn

130 135 140130 135 140

Ser Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Ser LysSer Ser Phe Phe Ser Arg Leu Asn Trp Leu Thr His Leu Asn Ser Lys

145 150 155 160145 150 155 160

Tyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp LysTyr Pro Ala Leu Asn Val Thr Met Pro Asn Asn Glu Gln Phe Asp Lys

165 170 175165 170 175

Leu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln IleLeu Tyr Ile Trp Gly Val His His Pro Gly Thr Asp Lys Asp Gln Ile

180 185 190180 185 190

Phe Leu Tyr Ala Lys Pro Ser Gly Arg Ile Thr Val Ser Thr Lys ArgPhe Leu Tyr Ala Lys Pro Ser Gly Arg Ile Thr Val Ser Thr Lys Arg

195 200 205195 200 205

Ser Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile ArgSer Gln Gln Ala Val Ile Pro Asn Ile Gly Ser Arg Pro Arg Ile Arg

210 215 220210 215 220

Asp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro GlyAsp Ile Pro Ser Arg Ile Ser Ile Tyr Trp Thr Ile Val Lys Pro Gly

225 230 235 240225 230 235 240

Asp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg GlyAsp Ile Leu Leu Ile Asn Ser Thr Gly Asn Leu Ile Ala Pro Arg Gly

245 250 255245 250 255

Tyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp AlaTyr Phe Lys Ile Arg Ser Gly Lys Ser Ser Ile Met Arg Ser Asp Ala

260 265 270260 265 270

Pro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser IlePro Ile Gly Lys Cys Lys Ser Glu Cys Ile Thr Pro Asn Gly Ser Ile

275 280 285275 280 285

Pro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly AlaPro Asn Asp Lys Pro Phe Gln Asn Val Asn Arg Ile Thr Tyr Gly Ala

290 295 300290 295 300

Cys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly MetCys Pro Arg Tyr Val Lys Gln Asn Thr Leu Lys Leu Ala Thr Gly Met

305 310 315 320305 310 315 320

Arg Asn Val Pro Glu Arg Gln Thr Arg Gly Ile Phe Gly Ala Ile AlaArg Asn Val Pro Glu Arg Gln Thr Arg Gly Ile Phe Gly Ala Ile Ala

325 330 335325 330 335

Gly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr GlyGly Phe Ile Glu Asn Gly Trp Glu Gly Met Val Asp Gly Trp Tyr Gly

340 345 350340 345 350

Phe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu LysPhe Arg His Gln Asn Ser Glu Gly Arg Gly Gln Ala Ala Asp Leu Lys

355 360 365355 360 365

Ser Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg LeuSer Thr Gln Ala Ala Ile Asp Gln Ile Asn Gly Lys Leu Asn Arg Leu

370 375 380370 375 380

Ile Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe SerIle Gly Lys Thr Asn Glu Lys Phe His Gln Ile Glu Lys Glu Phe Ser

385 390 395 400385 390 395 400

Glu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp ThrGlu Val Glu Gly Arg Ile Gln Asp Leu Glu Lys Tyr Val Glu Asp Thr

405 410 415405 410 415

Lys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu GluLys Ile Asp Leu Trp Ser Tyr Asn Ala Glu Leu Leu Val Ala Leu Glu

420 425 430420 425 430

Asn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu PheAsn Gln His Thr Ile Asp Leu Thr Asp Ser Glu Met Asn Lys Leu Phe

435 440 445435 440 445

Glu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly AsnGlu Lys Thr Lys Lys Gln Leu Arg Glu Asn Ala Glu Asp Met Gly Asn

450 455 460450 455 460

Gly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly SerGly Cys Phe Lys Ile Tyr His Lys Cys Asp Asn Ala Cys Ile Gly Ser

465 470 475 480465 470 475 480

Ile Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala LeuIle Arg Asn Gly Thr Tyr Asp His Asp Val Tyr Arg Asp Glu Ala Leu

485 490 495485 490 495

Asn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr LysAsn Asn Arg Phe Gln Ile Lys Gly Val Glu Leu Lys Ser Gly Tyr Lys

500 505 510500 505 510

Asp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu CysAsp Trp Ile Leu Trp Ile Ser Phe Ala Ile Ser Cys Phe Leu Leu Cys

515 520 525515 520 525

Val Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn IleVal Ala Leu Leu Gly Phe Ile Met Trp Ala Cys Gln Lys Gly Asn Ile

530 535 540530 535 540

Arg Cys Asn Ile Cys IleArg Cys Asn Ile Cys Ile

545 550545 550

<210> 98<210> 98

<211> 5<211> 5

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность CysTM (аминокислоты)<223> CysTM sequence (amino acids)

<400> 98<400> 98

Ser Leu Val Leu LeuSer Leu Val Leu Leu

1 515

<210> 99<210> 99

<211> 5<211> 5

<212> Белок<212> Protein

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Нативная TMCT (аминокислоты)<223> Native TMCT (amino acids)

<400> 99<400> 99

Cys Phe Leu Leu CysCys Phe Leu Leu Cys

1 515

<210> 100<210> 100

<211> 15<211> 15

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Последовательность CysTM (нуклеотиды)<223> CysTM sequence (nucleotides)

<400> 100<400> 100

tcccttgtac tgtta 15tcccttgtac tgtta 15

<210> 101<210> 101

<211> 15<211> 15

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Нативная TMCT (нуклеотиды)<223> Native TMCT (nucleotides)

<400> 101<400> 101

tgttttttgc tttgt 15tgttttttgc tttgt 15

<210> 102<210> 102

<211> 1701<211> 1701

<212> ДНК<212> DNA

<213> Вирус Alphainfluenza A<213> Alphainfluenza A virus

<400> 102<400> 102

atgaagacta tcattgcttt gagctacatt ctatgtctgg ttttcgctca aaaaattcct 60atgaagacta tcattgcttt gagctacatt ctatgtctgg ttttcgctca aaaaattcct 60

ggaaatgaca atagcacggc aacgctgtgc cttgggcacc atgcagtacc aaacggaacg 120ggaaatgaca atagcacggc aacgctgtgc cttgggcacc atgcagtacc aaacggaacg 120

atagtgaaaa caatcacgaa tgaccgaatt gaagttacta atgctactga gctggttcag 180atagtgaaaa caatcacgaa tgaccgaatt gaagttacta atgctactga gctggttcag 180

aattcctcaa taggtgaaat atgcgacagt cctcatcaga tccttgatgg agaaaactgc 240aattcctcaa taggtgaaat atgcgacagt cctcatcaga tccttgatgg agaaaactgc 240

acactaatag atgctctatt gggagaccct cagtgtgatg gctttcaaaa taagaaatgg 300acactaatag atgctctatt gggagaccct cagtgtgatg gctttcaaaa taagaaatgg 300

gacctttttg ttgaacgaag caaagcctac agcaactgtt acccttatga tgtgccggat 360gacctttttg ttgaacgaag caaagcctac agcaactgtt acccttatga tgtgccggat 360

tatgcctccc ttaggtcact agttgcctca tccggcacac tggagtttaa caatgaaagc 420tatgcctccc ttaggtcact agttgcctca tccggcacac tggagtttaa caatgaaagc 420

ttcaattgga ctggagtcac tcaaaacgga acaagttctg cttgcataag gagatctagt 480ttcaattgga ctggagtcac tcaaaacgga acaagttctg cttgcataag gagatctagt 480

agtagtttct ttagtagatt aaattggttg acccacttaa actacacata cccagcattg 540agtagtttct ttagtagatt aaattggttg acccacttaa actacacata cccagcattg 540

aacgtgacta tgccaaacaa tgaacaattt gacaaattgt acatttgggg ggttcaccac 600aacgtgacta tgccaaacaa tgaacaattt gacaaattgt acatttgggg ggttcaccac 600

ccgggtacgg acaaggacca aatcttcctg tatgctcaat catcaggaag aatcacagta 660ccgggtacgg acaaggacca aatcttcctg tatgctcaat catcaggaag aatcacagta 660

tctaccaaaa gaagccaaca agctgtaatc ccaaatatcg gatctagacc cagaataagg 720tctaccaaaa gaagccaaca agctgtaatc ccaaatatcg gatctagacc cagaataagg 720

gatatcccta gcagaataag catctattgg acaatagtaa aaccgggaga catacttttg 780gatatcccta gcagaataag catctattgg acaatagtaa aaccgggaga catacttttg 780

attaacagca cagggaatct aattgctcct aggggttact tcaaaatacg aagtgggaaa 840attaacagca cagggaatct aattgctcct aggggttact tcaaaatacg aagtgggaaa 840

agctcaataa tgagatcaga tgcacccatt ggcaaatgca agtctgaatg catcactcca 900agctcaataa tgagatcaga tgcacccatt ggcaaatgca agtctgaatg catcactcca 900

aatggaagca ttcccaatga caaaccattc caaaatgtaa acaggatcac atacggggcc 960aatggaagca ttcccaatga caaaccattc caaaatgtaa acaggatcac atacggggcc 960

tgtcccagat atgttaagca tagcactctg aaattggcaa caggaatgcg aaatgtacca tgtcccagat atgttaagca tagcactctg aaattggcaa caggaatgcg aaatgtacca

10201020

gagaaacaaa ctagaggcat atttggcgca atagcgggtt tcatagaaaa tggttgggag gagaaacaaa ctagaggcat atttggcgca atagcggggtt tcatagaaaa tggttggggag

10801080

ggaatggtgg atggttggta cggtttcagg catcaaaatt ctgagggaag aggacaagca ggaatggtgg atggttggta cggtttcagg catcaaaatt ctgagggaag aggacaagca

11401140

gcagatctca aaagcactca agcagcaatc gatcaaatca atgggaagct gaatcgattg gcagatctca aaagcactca agcagcaatc gatcaaatca atgggaagct gaatcgattg

12001200

atcgggaaaa ccaacgagaa attccatcag attgaaaaag aattctcaga agtagaagga atcgggaaaa ccaacgagaa attccatcag attgaaaaag aattctcaga agtagaagga

12601260

agaattcagg accttgagaa atatgttgag gacactaaaa tagatctctg gtcatacaac agaattcagg accttgagaa atatgttgag gacactaaaa tagatctctg gtcatacaac

13201320

gcggagcttc ttgttgccct ggagaaccaa catacaattg atctaactga ctcagaaatg gcggagcttc ttgttgccct ggagaaccaa catacaattg atctaactga ctcagaaatg

13801380

aacaaactgt ttgaaaaaac aaagaagcaa ctgagggaaa atgctgagga tatgggcaat aacaaactgt ttgaaaaaac aaagaagcaa ctgagggaaa atgctgagga tatgggcaat

14401440

ggttgtttca aaatatacca caaatgtgac aatgcctgca taggatcaat aagaaatgga ggttgtttca aaatatacca caaatgtgac aatgcctgca taggatcaat aagaaatgga

15001500

acttatgacc acaatgtgta cagggatgaa gcattaaaca accggttcca gatcaaggga acttatgacc acaatgtgta cagggatgaa gcattaaaca accggttcca gatcaaggga

15601560

gttgagctga agtcagggta caaagattgg atcctatgga tttcctttgc catatcatgt gttgagctga agtcagggta caaagattgg atcctatgga tttcctttgc catatcatgt

16201620

tttttgcttt gtgttgcttt gttggggttc atcatgtggg cctgccaaaa gggcaacatt tttttgcttt gtgttgcttt gttggggttc atcatgtggg cctgccaaaa gggcaacatt

16801680

aggtgcaaca tttgcatttg a 1701aggtgcaaca tttgcatttg a 1701

<210> 103<210> 103

<211> 3108<211> 3108

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 2801 от промотора 2X35S к терминатору NOS<223> Construct 2801 from 2X35S promoter to NOS terminator

<400> 103<400> 103

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg

10201020

ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat

10801080

tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag

11401140

tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc

12001200

tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta

12601260

cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc

13201320

atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg

13801380

aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt

14401440

gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt

15001500

tgacaaattg tacatttggg gggttcacca cccgggtacg gacaaggacc aaatcttcct tgacaaattg tacatttggg gggttcacca cccgggtacg gacaaggacc aaatcttcct

15601560

gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat

16201620

cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg

16801680

gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc

17401740

taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat

18001800

tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt

18601860

ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct

19201920

gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tatttggcgc gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tatttggcgc

19801980

aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag

20402040

gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat

21002100

cgatcaaatc aatgggaagc tgaatcgatt gatcgggaaa accaacgaga aattccatca cgatcaaatc aatgggaagc tgaatcgatt gatcgggaaa accaacgaga aattccatca

21602160

gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga

22202220

ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca

22802280

acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca

23402340

actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga

24002400

caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga

24602460

agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcagggt acaaagattg agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcagggt acaaagattg

25202520

gatcctatgg atttcctttg ccatatcatg ttttttgctt tgtgttgctt tgttggggtt gatcctatgg atttcctttg ccatatcatg ttttttgctt tgtgttgctt tgttggggtt

25802580

catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat

26402640

tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt

27002700

ctgtgctcag agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca ctgtgctcag agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca

27602760

ggtcgtccct tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa ggtcgtccct tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa

28202820

agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa

28802880

agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg

29402940

aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt

30003000

tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc

30603060

gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108

<210> 104<210> 104

<211> 3108<211> 3108

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 3023 от промотора 2X35S к терминатору NOS<223> Construct 3023 from 2X35S promoter to NOS terminator

<400> 104<400> 104

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg

10201020

ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat

10801080

tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag

11401140

tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc

12001200

tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta

12601260

cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc

13201320

atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg

13801380

aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt

14401440

gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt

15001500

tgacaaattg tacatttggg gggttcacca cccgggtacg gacaaggacc aaatcttcct tgacaaattg tacatttggg gggttcacca cccgggtacg gacaaggacc aaatcttcct

15601560

gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat

16201620

cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg

16801680

gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc

17401740

taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat

18001800

tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt

18601860

ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct

19201920

gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tatttggcgc gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tatttggcgc

19801980

aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag

20402040

gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat

21002100

cgatcaaatc aatgggaagc tggctcgatt gatcgggaaa accaacgaga aattccatca cgatcaaatc aatgggaagc tggctcgatt gatcgggaaa accaacgaga aattccatca

21602160

gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga

22202220

ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca

22802280

acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca

23402340

actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga

24002400

caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga

24602460

agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcagggt acaaagattg agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcagggt acaaagattg

25202520

gatcctatgg atttcctttg ccatatcatg ttttttgctt tgtgttgctt tgttggggtt gatcctatgg atttcctttg ccatatcatg ttttttgctt tgtgttgctt tgttggggtt

25802580

catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat

26402640

tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt

27002700

ctgtgctcag agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca ctgtgctcag agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca

27602760

ggtcgtccct tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa ggtcgtccct tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa

28202820

agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa

28802880

agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg

29402940

aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt

30003000

tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc

30603060

gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108

<210> 105<210> 105

<211> 3108<211> 3108

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> Конструкция 2811 от промотора 2X35S к терминатору NOS<223> Construct 2811 from 2X35S promoter to NOS terminator

<400> 105<400> 105

gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60gtcaacatgg tggagcacga cacacttgtc tactccaaaa atatcaaaga tacagtctca 60

gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120gaagaccaaa gggcaattga gacttttcaa caaagggtaa tatccggaaa cctcctcgga 120

ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180ttccattgcc cagctatctg tcactttatt gtgaagatag tggaaaagga aggtggctcc 180

tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240tacaaatgcc atcattgcga taaaggaaag gccatcgttg aagatgcctc tgccgacagt 240

ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc 300

acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360acgtcttcaa agcaagtgga ttgatgtgat aacatggtgg agcacgacac acttgtctac 360

tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420tccaaaaata tcaaagatac agtctcagaa gaccaaaggg caattgagac ttttcaacaa 420

agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480agggtaatat ccggaaacct cctcggattc cattgcccag ctatctgtca ctttattgtg 480

aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540aagatagtgg aaaaggaagg tggctcctac aaatgccatc attgcgataa aggaaaggcc 540

atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600atcgttgaag atgcctctgc cgacagtggt cccaaagatg gacccccacc cacgaggagc 600

atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660atcgtggaaa aagaagacgt tccaaccacg tcttcaaagc aagtggattg atgtgatatc 660

tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720tccactgacg taagggatga cgcacaatcc cactatcctt cgcaagaccc ttcctctata 720

taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780taaggaagtt catttcattt ggagaggtat taaaatctta ataggttttg ataaaagcga 780

acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840acgtggggaa acccgaacca aaccttcttc taaactctct ctcatctctc ttaaagcaaa 840

cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900cttctctctt gtctttcttg cgtgagcgat cttcaacgtt gtcagatcgt gcttcggcac 900

cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960cagtacaatg gcgaaaaacg ttgcgatttt cggcttattg ttttctcttc ttgtgttggt 960

tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg tccttctcag atcttcgcgc aaaaacttcc tggaaatgac aatagcacgg caacgctgtg

10201020

ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat ccttgggcac catgcagtac caaacggaac gatagtgaaa acaatcacga atgaccgaat

10801080

tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag tgaagttact aatgctactg agctggttca gaattcctca ataggtgaaa tatgcgacag

11401140

tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc tcctcatcag atccttgatg gagaaaactg cacactaata gatgctctat tgggagaccc

12001200

tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta tcagtgtgat ggctttcaaa ataagaaatg ggaccttttt gttgaacgaa gcaaagccta

12601260

cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc cagcaactgt tacccttatg atgtgccgga ttatgcctcc cttaggtcac tagttgcctc

13201320

atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg atccggcaca ctggagttta acaatgaaag cttcaattgg gctggagtca ctcaaaacgg

13801380

aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt aacaagttct tcttgcataa ggggatctaa tagtagtttc tttagtagat taaattggtt

14401440

gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt gacccactta aactccaaat acccagcatt aaacgtgact atgccaaaca atgaacaatt

15001500

tgacaaattg tacatttggg gggttcacca cccgggtacg gacaaggacc aaatcttcct tgacaaattg tacatttggg gggttcacca cccgggtacg gacaaggacc aaatcttcct

15601560

gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat gtatgcacaa tcatcaggaa gaatcacagt atctaccaaa agaagccaac aagctgtaat

16201620

cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg cccgaatatc ggatctagac ccagaataag ggatatccct agcagaataa gcatctattg

16801680

gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc gacaatagta aaaccgggag acatactttt gattaacagc acagggaatc taattgctcc

17401740

taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat taggggttac ttcaaaatac gaagtgggaa aagctcaata atgagatcag atgcacccat

18001800

tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt tggcaaatgc aagtctgaat gcatcactcc aaatggaagc attcccaatg acaaaccatt

18601860

ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct ccaaaatgta aacaggatca catacggggc ctgtcccaga tatgttaagc aaagcactct

19201920

gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tatttggcgc gaaattggca acaggaatgc gaaatgtacc agagagacaa actagaggca tatttggcgc

19801980

aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag aatagcgggt ttcatagaaa atggttggga gggaatggtg gatggttggt acggcttcag

20402040

gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat gcatcaaaat tctgagggaa gaggacaagc agcagatctc aaaagcactc aagcagcaat

21002100

cgatcaaatc aatgggaagc tgaatcgatt gatcgggaaa accaacgaga aattccatca cgatcaaatc aatgggaagc tgaatcgatt gatcgggaaa accaacgaga aattccatca

21602160

gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga gattgaaaaa gaattctcag aagtagaagg gagaattcag gaccttgaga aatatgttga

22202220

ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca ggacacaaaa atagatctct ggtcatacaa cgcggagctt cttgttgccc tggagaacca

22802280

acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca acatacaatt gatctaactg actcagaaat gaacaaactg tttgaaaaaa caaagaagca

23402340

actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga actgagggaa aatgctgagg atatgggcaa tggttgtttc aaaatatacc acaaatgtga

24002400

caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga caatgcctgc ataggatcaa tcagaaatgg aacttatgac cacgatgtat acagggatga

24602460

agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcagggt acaaagattg agcattaaac aaccggttcc agatcaaggg agttgagctg aagtcagggt acaaagattg

25202520

gatcctatgg atttcctttg ccatatcatc ccttgtactg ttagttgctt tgttggggtt gatcctatgg atttcctttg ccatatcatc ccttgtactg ttagttgctt tgttggggtt

25802580

catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat catcatgtgg gcctgccaaa agggcaacat taggtgcaac atttgcattt gaaggcctat

26402640

tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt tttctttagt ttgaatttac tgttattcgg tgtgcatttc tatgtttggt gagcggtttt

27002700

ctgtgctcag agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca ctgtgctcag agtgtgttta ttttatgtaa tttaatttct ttgtgagctc ctgtttagca

27602760

ggtcgtccct tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa ggtcgtccct tcagcaagga cacaaaaaga ttttaatttt attaaaaaaa aaaaaaaaaa

28202820

agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa agaccgggaa ttcgatatca agcttatcga cctgcagatc gttcaaacat ttggcaataa

28802880

agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg agtttcttaa gattgaatcc tgttgccggt cttgcgatga ttatcatata atttctgttg

29402940

aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt aattacgtta agcatgtaat aattaacatg taatgcatga cgttatttat gagatgggtt

30003000

tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc tttatgatta gagtcccgca attatacatt taatacgcga tagaaaacaa aatatagcgc

30603060

gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108_gcaaactagg ataaattatc gcgcgcggtg tcatctatgt tactagat 3108_

<---<---

Claims (36)

1. Модифицированный белок гемагглютинин (НА) гриппа H3 для получения вирусоподобной частицы (VLP), причем модифицированный белок H3 НА содержит аминокислотную последовательность, содержащую по меньшей мере одну замену по сравнению с соответствующей аминокислотной последовательностью дикого типа, причем указанная по меньшей мере одна замена соответствует аминокислотам в положениях 382, 384, 524, и 528 эталонной последовательности SEQ ID NO: 92, и необязательно аминокислотные замены, соответствующие аминокислотам в положениях 392, 431, 525 и/или 526 эталонной последовательности SEQ ID NO: 92, причем аминокислотные замены, соответствующие положениям 524 и 528, представляют собой замены на не цистеин. 1. A modified influenza H3 hemagglutinin (HA) protein to produce a virus-like particle (VLP), wherein the modified H3 HA protein contains an amino acid sequence containing at least one substitution compared to the corresponding wild-type amino acid sequence, wherein said at least one substitution corresponds to amino acids at positions 382, 384, 524, and 528 of reference sequence SEQ ID NO: 92, and optionally amino acid substitutions corresponding to amino acid positions 392, 431, 525 and/or 526 of reference sequence SEQ ID NO: 92, and amino acid substitutions corresponding to provisions 524 and 528 are substitutions for non-cysteine. 2. Модифицированный белок НА гриппа Н3 по п. 1, причем аминокислотная замена, соответствующая аминокислоте в положении 382 эталонной последовательности SEQ ID NO: 92, представляет собой замену на не аспарагин, например, на аланин или консервативную замену аланина, аминокислотная замена, соответствующая аминокислоте в положении 524 эталонной последовательности SEQ ID NO: 92, представляет собой замену на серин или консервативную замену серина, и аминокислотная замена, соответствующая аминокислоте в положении 528 эталонной последовательности SEQ ID NO: 92, представляет собой замену на лейцин или консервативную замену лейцина. 2. The modified H3 influenza HA protein according to claim 1, wherein the amino acid substitution corresponding to the amino acid at position 382 of the reference sequence SEQ ID NO: 92 is a non-asparagine substitution, for example, alanine or a conservative alanine substitution, an amino acid substitution corresponding to the amino acid at position 524 of the reference sequence SEQ ID NO: 92 is a serine substitution or a conservative serine substitution, and the amino acid substitution corresponding to the amino acid at position 528 of the reference sequence SEQ ID NO: 92 is a leucine substitution or a conservative leucine substitution. 3. Модифицированный белок НА гриппа Н3 по п. 1, причем аминокислотная замена, соответствующая аминокислоте в положении 384 эталонной последовательности SEQ ID NO: 92, представляет собой замену на не лейцин, например, на валин или консервативную замену валина, аминокислотная замена, соответствующая аминокислоте в положении 524 эталонной последовательности SEQ ID NO: 92, представляет собой замену на серин или консервативную замену серина, и аминокислотная замена, соответствующая аминокислоте в положении 528 эталонной последовательности SEQ ID NO: 92, представляет собой замену на лейцин или консервативную замену лейцина. 3. The modified H3 influenza HA protein according to claim 1, wherein the amino acid substitution corresponding to the amino acid at position 384 of the reference sequence SEQ ID NO: 92 is a non-leucine substitution, for example, a valine or a conservative valine substitution, an amino acid substitution corresponding to the amino acid at position 524 of the reference sequence SEQ ID NO: 92 is a serine substitution or a conservative serine substitution, and the amino acid substitution corresponding to the amino acid at position 528 of the reference sequence SEQ ID NO: 92 is a leucine substitution or a conservative leucine substitution. 4. Модифицированный белок НА гриппа Н3 по п. 1, причем аминокислотная замена, соответствующая аминокислоте в положении 392 эталонной последовательности SEQ ID NO: 92, представляет собой замену на не фенилаланин, например, на аспарагиновую кислоту или консервативную замену аспарагиновой кислоты. 4. The modified H3 influenza HA protein of claim 1, wherein the amino acid substitution corresponding to the amino acid at position 392 of the reference sequence SEQ ID NO: 92 is a non-phenylalanine substitution, for example, aspartic acid or a conservative aspartic acid substitution. 5. Модифицированный белок НА гриппа Н3 по п. 1, причем аминокислотная замена, соответствующая аминокислоте в положении 431 эталонной последовательности SEQ ID NO: 92, представляет собой замену на не лейцин, например, на метионин или консервативную замену метионина. 5. The modified H3 influenza HA protein according to claim 1, wherein the amino acid substitution corresponding to the amino acid at position 431 of the reference sequence SEQ ID NO: 92 is a non-leucine substitution, for example, methionine or a conservative methionine substitution. 6. Модифицированный белок НА гриппа Н3 по п. 1, причем аминокислотная замена, соответствующая аминокислоте в положении 382 эталонной последовательности SEQ ID NO: 92, представляет собой замену на не аспарагин, например, на аланин или консервативную замену аланина, аминокислотная замена, соответствующая аминокислоте в положении 384 эталонной последовательности SEQ ID NO: 92, представляет собой замену на не лейцин, например, на валин или консервативную замену валина, аминокислотная замена, соответствующая аминокислоте в положении 524 эталонной последовательности SEQ ID NO: 92, представляет собой замену на серин или консервативную замену серина, и аминокислотная замена, соответствующая аминокислоте в положении 528 эталонной последовательности SEQ ID NO: 92, представляет собой замену на лейцин или консервативную замену лейцина. 6. The modified H3 influenza HA protein according to claim 1, wherein the amino acid substitution corresponding to the amino acid at position 382 of the reference sequence SEQ ID NO: 92 is a non-asparagine substitution, for example, alanine or a conservative alanine substitution, an amino acid substitution corresponding to the amino acid at position 384 of the reference sequence SEQ ID NO: 92, is a non-leucine substitution, such as valine or a conservative valine substitution, an amino acid substitution corresponding to the amino acid at position 524 of the reference sequence SEQ ID NO: 92, is a serine or conservative substitution a serine substitution, and an amino acid substitution corresponding to the amino acid at position 528 of the reference sequence SEQ ID NO: 92 is a leucine substitution or a conservative leucine substitution. 7. Модифицированный белок НА гриппа Н3 по любому из пп. 1-6, причем белок HA дополнительно содержит замену по аминокислотам, соответствующих аминокислотам в положениях 525, 526 или 525 и 526 эталонной последовательности SEQ ID NO: 92, причем замена аминокислоты в положении 525 представляет собой замену на не фенилаланин, например, на лейцин или консервативную замену лейцина, а замена аминокислоты в положении 526 представляет собой замену на не лейцин, например, на валин или консервативную замену валина. 7. Modified influenza H3 HA protein according to any one of paragraphs. 1-6, wherein the HA protein further comprises an amino acid substitution corresponding to amino acids at positions 525, 526, or 525 and 526 of the reference sequence SEQ ID NO: 92, wherein the amino acid substitution at position 525 is a non-phenylalanine substitution, such as leucine or a conservative substitution for leucine, and the amino acid substitution at position 526 is a non-leucine substitution, such as valine or a conservative valine substitution. 8. Модифицированный белок НА гриппа Н3 по любому из пп. 1-7, причем: 8. Modified influenza H3 HA protein according to any one of paragraphs. 1-7, and: консервативная замена аланина представляет собой серин, глицин, треонин, цистеин или валин; the conservative replacement for alanine is serine, glycine, threonine, cysteine or valine; консервативная замена валина представляет собой изолейцин, метионин, аланин или треонин; a conservative replacement for valine is isoleucine, methionine, alanine or threonine; консервативная замена аспарагиновой кислоты представляет собой глутаминовую кислоту, глутамин или серин; a conservative replacement for aspartic acid is glutamic acid, glutamine or serine; консервативная замена метионина представляет собой изолейцин, глутамин, валин или фенилаланин; a conservative replacement for methionine is isoleucine, glutamine, valine or phenylalanine; консервативная замена серина представляет собой треонин, аланин, аспарагин, аспарагиновую кислоту, глутамин, глицин, глутаминовую кислоту или лизин; и/или the conservative serine substitution is threonine, alanine, asparagine, aspartic acid, glutamine, glycine, glutamic acid or lysine; and/or консервативная замена лейцина представляет собой изолейцин, валин, метионин, фенилаланин или валин. conservative replacements for leucine are isoleucine, valine, methionine, phenylalanine or valine. 9. Нуклеиновая кислота для получения модифицированного белка НА гриппа H3, причем нуклеиновая кислота содержит нуклеотидную последовательность, кодирующую модифицированный белок НА гриппа Н3 по любому из пп. 1-8. 9. Nucleic acid for producing a modified influenza H3 HA protein, wherein the nucleic acid contains a nucleotide sequence encoding a modified influenza H3 HA protein according to any one of claims. 1-8. 10. Вирусоподобная частица (VLP) для индукции иммунного ответа у субъекта, причем VLP содержит модифицированный белок HA гриппа H3 по любому из пп. 1-8. 10. A virus-like particle (VLP) for inducing an immune response in a subject, wherein the VLP contains a modified influenza H3 HA protein according to any one of claims. 1-8. 11. Способ получения вирусоподобной частицы (VLP) гриппа в растении, части растения или растительной клетке, предусматривающий: 11. A method for producing an influenza virus-like particle (VLP) in a plant, part of a plant or plant cell, comprising: а) i) введение нуклеиновой кислоты по п. 9 в растение, часть растения или растительную клетку; и, необязательно, введение второй нуклеиновой кислоты, кодирующей белок протонного канала, такой как белок М2 подтипа А гриппа; или a) i) introducing the nucleic acid according to claim 9 into a plant, part of a plant or plant cell; and, optionally, introducing a second nucleic acid encoding a proton channel protein, such as influenza subtype A M2 protein; or ii) предоставление растения, части растения или растительной клетки, содержащих нуклеиновую кислоту по п. 9, причем необязательно растение, часть растения или растительная клетка дополнительно содержит вторую нуклеиновую кислоту, кодирующую белок протонного канала, такой как белок М2 подтипа А гриппа; а также ii) providing a plant, plant part, or plant cell containing the nucleic acid of claim 9, wherein optionally the plant, plant part, or plant cell further comprises a second nucleic acid encoding a proton channel protein, such as influenza subtype A M2 protein; and b) инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию белка НА, кодируемого нуклеиновой кислотой, и, необязательно, белка протонного канала, кодируемого второй нуклеиновой кислотой, тем самым производя VLP; и b) incubating the plant, plant part or plant cell under conditions that allow expression of the HA protein encoded by the nucleic acid, and optionally a proton channel protein encoded by the second nucleic acid, thereby producing a VLP; And с) необязательно, сбор растения, части растения или растительной клетки и очистку VLP. c) optionally, collecting the plant, plant part or plant cell and purifying the VLP. 12. VLP для индукции иммунного ответа на инфекцию гриппа у субъекта, причем VLP получена способом по п. 11, и причем VLP содержит модифицированный белок HA гриппа H3 и один или более липидов, полученных из растения, части растения или растительной клетки. 12. A VLP for inducing an immune response to influenza infection in a subject, wherein the VLP is prepared by the method of claim 11, and wherein the VLP comprises a modified influenza H3 HA protein and one or more lipids derived from a plant, part of a plant, or plant cell. 13. Растение, или часть растения, для получения вирусоподобных частиц (VLP), причем растение или часть растения содержит модифицированный белок HA гриппа H3 по любому из пп. 1-8, нуклеиновую кислоту по п. 9 или VLP по п. 10 или 12. 13. A plant, or part of a plant, for producing virus-like particles (VLPs), wherein the plant or part of a plant contains a modified influenza H3 HA protein according to any one of paragraphs. 1-8, nucleic acid according to claim 9 or VLP according to claim 10 or 12. 14. Растительная клетка для получения вирусоподобных частиц (VLP), причем растительная клетка содержит модифицированный белок HA гриппа H3 по любому из пп. 1-8, нуклеиновую кислоту по п. 9 или VLP по п. 10 или 12. 14. A plant cell for producing virus-like particles (VLPs), wherein the plant cell contains a modified influenza H3 HA protein according to any one of claims. 1-8, nucleic acid according to claim 9 or VLP according to claim 10 or 12. 15. Композиция для индукции иммунитета к инфекции гриппа у субъекта, причем композиция содержит эффективную дозу VLP по любому из пп. 10 или 12 и фармацевтически приемлемый носитель, адъювант, наполнитель или вспомогательное вещество. 15. A composition for inducing immunity to influenza infection in a subject, wherein the composition contains an effective dose of VLP according to any one of claims. 10 or 12 and a pharmaceutically acceptable carrier, adjuvant, excipient or excipient. 16. VLP по любому из пп. 10 или 12 для применения для индукции иммунитета к инфекции гриппа у субъекта, причем VLP, необязательно, вводят субъекту перорально, интраназально, внутримышечно, внутрибрюшинно, внутривенно или подкожно. 16. VLP according to any one of paragraphs. 10 or 12 for use in inducing immunity to influenza infection in a subject, wherein the VLP is optionally administered to the subject orally, intranasally, intramuscularly, intraperitoneally, intravenously or subcutaneously. 17. Способ увеличения выхода продуцирования вирусоподобных частиц (VLP) гриппа в растении, части растения или растительной клетке, предусматривающий: 17. A method for increasing the production yield of influenza virus-like particles (VLPs) in a plant, part of a plant or plant cell, comprising: а) введение нуклеиновой кислоты по п. 9 в растение, часть растения или растительную клетку или предоставление растения, части растения или растительной клетки, содержащих нуклеиновую кислоту, по п. 9; а также a) introducing the nucleic acid of claim 9 into a plant, part of a plant or plant cell, or providing a plant, part of a plant or plant cell containing the nucleic acid of claim 9; and b) инкубацию растения, части растения или растительной клетки в условиях, которые допускают экспрессию модифицированного белка НА гриппа, кодируемого нуклеиновой кислотой, тем самым производя VLP с более высоким выходом по сравнению с растением, частью растения или растительной клеткой, экспрессирующей немодифицированный белок НА гриппа, и b) incubating the plant, plant part or plant cell under conditions that allow expression of the modified influenza HA protein encoded by the nucleic acid, thereby producing VLPs in higher yield compared to a plant, plant part or plant cell expressing an unmodified influenza HA protein, And с) необязательно, сбор растения, части растения или растительной клетки и очистку VLP. c) optionally, collecting the plant, plant part or plant cell and purifying the VLP. 18. Применение нуклеиновой кислоты по п. 9 для увеличения выхода продуцирования вирусоподобных частиц (VLP) гриппа в растении, части растения или растительной клетке. 18. The use of a nucleic acid according to claim 9 to increase the production yield of influenza virus-like particles (VLPs) in a plant, part of a plant or plant cell. 19. Модифицированный белок гемагглютинин (НА) гриппа H3 для получения вирусоподобной частицы (VLP), причем модифицированный белок H3 НА содержит аминокислотные замены, соответствующие положениям 382, 384, 524 и 528 эталонной последовательности SEQ ID NO: 92, причем: 19. Modified influenza H3 hemagglutinin (HA) protein to produce a virus-like particle (VLP), wherein the modified H3 HA protein contains amino acid substitutions corresponding to positions 382, 384, 524 and 528 of the reference sequence SEQ ID NO: 92, and: аминокислотная замена, соответствующая положению 382, является заменой на аланин или на консервативную замену аланина; the amino acid substitution corresponding to position 382 is an alanine substitution or a conservative alanine substitution; аминокислотная замена, соответствующая положению 384, является заменой на валин или на консервативную замену валина; the amino acid substitution corresponding to position 384 is a valine substitution or a conservative valine substitution; аминокислотная замена, соответствующая положению 524, является заменой на серин или на консервативную замену серина; и the amino acid substitution corresponding to position 524 is a serine substitution or a conservative serine substitution; And аминокислотная замена, соответствующая положению 528, является заменой на лейцин или на консервативную замену лейцина.the amino acid substitution corresponding to position 528 is a leucine substitution or a conservative leucine substitution.
RU2020143530A 2018-06-27 2019-06-27 Hemaglutinin mutants of influenza virus RU2809237C2 (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US62/690,780 2018-06-27

Publications (2)

Publication Number Publication Date
RU2020143530A RU2020143530A (en) 2022-08-29
RU2809237C2 true RU2809237C2 (en) 2023-12-08

Family

ID=

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012177760A1 (en) * 2011-06-20 2012-12-27 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Computationally optimized broadly reactive antigens for h1n1 influenza
WO2014085616A1 (en) * 2012-11-27 2014-06-05 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Computationally optimized broadly reactive antigens for h1n1 influenza
RU2569195C2 (en) * 2009-06-24 2015-11-20 Медикаго Инк. Hemagglutinin-containing chimeric virus-like particles, similar to particles of flu virus
RU2653756C2 (en) * 2012-02-07 2018-05-14 Юниверсити Оф Питтсбург - Оф Зе Коммонвэлс Систем Оф Хайе Эдьюкейшн Computationally optimized broadly reactive antigens for h3n2 viruses

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2569195C2 (en) * 2009-06-24 2015-11-20 Медикаго Инк. Hemagglutinin-containing chimeric virus-like particles, similar to particles of flu virus
WO2012177760A1 (en) * 2011-06-20 2012-12-27 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Computationally optimized broadly reactive antigens for h1n1 influenza
RU2653756C2 (en) * 2012-02-07 2018-05-14 Юниверсити Оф Питтсбург - Оф Зе Коммонвэлс Систем Оф Хайе Эдьюкейшн Computationally optimized broadly reactive antigens for h3n2 viruses
WO2014085616A1 (en) * 2012-11-27 2014-06-05 University Of Pittsburgh-Of The Commonwealth System Of Higher Education Computationally optimized broadly reactive antigens for h1n1 influenza

Similar Documents

Publication Publication Date Title
KR102199018B1 (en) Influenza virus-like particle production in plants
KR101974017B1 (en) Increasing virus-like particle yield in plants
EA034733B1 (en) Nucleic acid for increased expression of hemagglutinin of influenza virus in a plant and use thereof
KR20120133371A (en) Chimeric influenza virus-like particles comprising hemagglutinin
JP2024050650A (en) Influenza virus hemagglutinin mutants
RU2809237C2 (en) Hemaglutinin mutants of influenza virus
RU2801708C2 (en) Hemaglutinin mutants of the influenza virus
JP2023539356A (en) Modified coronavirus structural protein
RU2800938C2 (en) Hemaglutinin mutants of the influenza virus
WO2024040325A1 (en) Modified influenza b virus hemagglutinin
CN115956084A (en) Superstructure of modified influenza hemagglutinin comprising reduced interaction with sialic acid
CN116457008A (en) Modified coronavirus structural proteins