RU2774415C1

RU2774415C1 - Artificial nucleic acid molecules

Info

Publication number: RU2774415C1
Application number: RU2020111527A
Authority: RU
Inventors: Андреас ТЕСС
Original assignee: Куревак Аг
Priority date: 2013-12-30
Filing date: 2014-12-30
Publication date: 2022-06-21

Abstract

FIELD: biotechnology.

SUBSTANCE: artificial nucleic acid molecule for increasing protein yield is described, containing: a. at least one open reading frame (ORF); and b. at least one element of 3’-untranslated region (hereinafter – 3’-UTR element) that contains a nucleotide sequence originating from 3’-UTR ribosomal protein gene or from an option of 3’-UTR ribosomal protein gene selected from a group that consists of ribosomal protein S9 (RPS9), ribosomal protein S19 (RPS19), ribosomal protein S21 (RPS21), ribosomal protein S27 (RPS27), ribosomal protein S28 (RPS28), ribosomal protein S29 (RPS29) and ribosomal protein L35a (RPL35A). In addition, a vector containing the specified nucleic acid, and a cell containing the specified nucleic acid or vector are described in the claim. An appropriate method for increasing protein yield is also described.

EFFECT: invention makes it possible to increase, stabilize and/or prolong the expression of a protein with a nucleotide sequence containing 3'-UTR element.

35 cl, 9 dwg, 5 tbl, 1 ex

Description

Настоящее изобретение относится к искусственным молекулам нуклеиновой кислоты, которые содержат открытую рамку считывания, элемент 3'-нетранслируемой области (3'-UTR-элемент) и необязательно поли(А)-последовательность и/или сигнал полиаденилирования. Изобретение относится также к вектору, содержащему 3'-UTR-элемент, к клетке, содержащей искусственную молекулу нуклеиновой кислоты или вектор, к фармацевтической композиции, содержащей искусственную молекулу нуклеиновой кислоты или вектор, и к набору, содержащему искусственную молекулу нуклеиновой кислоты, вектор и/или фармацевтическую композицию, предпочтительно предназначенным для применения в области генной терапии и/или генетической вакцинации.The present invention relates to artificial nucleic acid molecules that contain an open reading frame, a 3'-untranslated region element (3'-UTR element), and optionally a poly(A) sequence and/or a polyadenylation signal. The invention also relates to a vector containing a 3'-UTR element, to a cell containing an artificial nucleic acid molecule or a vector, to a pharmaceutical composition containing an artificial nucleic acid molecule or a vector, and to a kit containing an artificial nucleic acid molecule, a vector and/ or a pharmaceutical composition, preferably for use in the field of gene therapy and/or genetic vaccination.

Генная терапия и генетическая вакцинация относятся к наиболее перспективным и быстро развивающимся методам современной медицины. Они позволяют разрабатывать высокоспецифические и индивидуальные подходы для терапии широкого разнообразия заболеваний. Мишенью для таких подходов к лечению могут являться, прежде всего, врожденные генетические заболевания, злокачественные или связанные с опухолью заболевания, а также воспалительные заболевания. Подразумевается, что с помощью указанных подходов можно предупреждать раннее начало таких заболеваний.Gene therapy and genetic vaccination are among the most promising and rapidly developing methods of modern medicine. They allow the development of highly specific and individual approaches for the treatment of a wide variety of diseases. Such treatment approaches may primarily target congenital genetic diseases, malignant or tumor-related diseases, and inflammatory diseases. It is understood that these approaches can prevent the early onset of such diseases.

Основная концептуальная идея генной терапии заключается в осуществлении соответствующей модуляции нарушенной генной экспрессии, ассоциированной с патологическими состояниями при конкретных заболеваниях. Патологически измененная генная экспрессия может приводить к недостатку или сверхпродуцированию имеющих важное значение генных продуктов, например, сигнальных факторов, таких как гормоны, факторы, обусловленные генами «домашнего хозяйства», метаболические ферменты, структурные белки или т.п. Измененная генная экспрессия может быть обусловлена не только нарушением регуляции транскрипции и/или трансляции, но также и мутациями в ОРС, кодирующей конкретный белок. Патологические мутации могут вызываться, например, хромосомной аберрацией или более специфическими мутациями, такими как точечные мутации или мутации, приводящие к сдвигу рамки считывания, которые все приводят к ограничению функциональности и возможно к полной потере функции генного продукта. Однако нарушение регуляции транскрипции или трансляции может иметь место также в том случае, если мутации воздействуют на гены, кодирующие белки, которые участвуют в механизме транскрипции или трансляции в клетке. Такие мутации могут приводить к патологической повышающей или понижающей регуляции генов, которые сами по себе являются функциональными. Гены, кодирующие генные продукты, которые обладают такими регуляторными функциями, могут представлять собой, например, факторы транскрипции, сигнальные рецепторы, белки-мессенджеры или т.п. Однако, потеря функции таких генов, кодирующих регуляторные белки, при определенных обстоятельствах может быть восстановлена путем искусственной интродукции других факторов, функционирующих в прямом направлении относительно нарушенного генного продукта. Такие дефекты генов можно компенсировать также с помощью генной терапии посредством замены самого поврежденного гена.The main conceptual idea of gene therapy is the implementation of appropriate modulation of impaired gene expression associated with pathological conditions in specific diseases. Pathologically altered gene expression may result in a deficiency or overproduction of important gene products, for example, signaling factors such as hormones, housekeeping gene factors, metabolic enzymes, structural proteins, or the like. Altered gene expression may be due not only to dysregulation of transcription and/or translation, but also to mutations in the ORF encoding a particular protein. Pathological mutations can be caused, for example, by a chromosomal aberration or by more specific mutations such as point or frameshift mutations, all of which result in limited functionality and possibly complete loss of function of the gene product. However, dysregulation of transcription or translation can also occur if mutations affect genes encoding proteins that are involved in the mechanism of transcription or translation in the cell. Such mutations can lead to abnormal up- or down-regulation of genes that are themselves functional. Genes encoding gene products that have such regulatory functions may be, for example, transcription factors, signal receptors, messenger proteins, or the like. However, the loss of function of such genes encoding regulatory proteins can, under certain circumstances, be restored by the artificial introduction of other factors that function in a forward direction relative to the disturbed gene product. Such gene defects can also be compensated by gene therapy by replacing the damaged gene itself.

Генетическая вакцинация позволяет вызывать требуемый иммунный ответ на выбранные антигены, такие как обладающие определенными характеристиками компоненты бактериальных поверхностей, вирусные частицы, опухолевые антигены или т.п. В целом, вакцинация представляет собой одно из наиболее важных достижений современной медицины. Однако в настоящее время эффективные вакцины доступны только для ограниченного количества заболеваний. Поэтому инфекции, которые нельзя предупреждать путем вакцинации, все еще поражают каждый год миллионы людей.Genetic vaccination makes it possible to induce the desired immune response to selected antigens, such as characteristic components of bacterial surfaces, viral particles, tumor antigens, or the like. In general, vaccination represents one of the most important achievements of modern medicine. However, effective vaccines are currently only available for a limited number of diseases. Therefore, infections that cannot be prevented by vaccination still affect millions of people every year.

Обычно вакцины можно подразделять на вакцины «первого», «второго» и «третьего» поколения. Вакцины «первого поколения», как правило, представляют собой вакцины, содержащие цельные организмы. Они основаны либо на живых и ослабленных, либо на убитых патогенах, например, вирусах, бактериях или т.п. Основным недостатком живых и ослабленных вакцин является риск реверсии с образованием угрожающих жизни вариантов. Таким образом, указанные патогены, хотя они и являются ослабленными, все еще могут нести присущие им непредсказуемые риски. Убитые патогены могут не являться достаточно эффективными для создания специфического иммунного ответа. Для того чтобы минимизировать указанные риски, были разработаны вакцины «второго поколения». Как правило, они представляют собой субъединичные вакцины, состоящие из компонентов определенных антигенов или рекомбинантных белков, происходящих из патогенов.In general, vaccines can be classified into "first", "second" and "third" generation vaccines. "First generation" vaccines are generally vaccines containing whole organisms. They are based either on live and attenuated or killed pathogens such as viruses, bacteria or the like. The main disadvantage of live and attenuated vaccines is the risk of reversion to form life-threatening variants. Thus, these pathogens, although attenuated, may still carry inherent unpredictable risks. Killed pathogens may not be effective enough to create a specific immune response. In order to minimize these risks, "second generation" vaccines have been developed. As a rule, they are subunit vaccines, consisting of components of certain antigens or recombinant proteins derived from pathogens.

Генетические вакцины, т.е. вакцины для генетической вакцинации, как правило, называют вакцинами «третьего поколения». Они, как правило, состоят из созданных методами генной инженерии молекул нуклеиновой кислоты, которые обеспечивают экспрессию in vivo фрагментов пептида или белка (антигена), характерных для патогена или опухолевого антигена. При введении пациенту экспрессия генетических вакцин происходит после поглощения клетками-мишенями. Экспрессия введенных нуклеиновых кислот приводит к производству кодируемых белков. В том случае, когда эти белки распознаются иммунной системой пациента как чужие, запускается иммунный ответ.Genetic vaccines, i.e. vaccines for genetic vaccination are generally referred to as "third generation" vaccines. They typically consist of genetically engineered nucleic acid molecules that provide in vivo expression of peptide or protein (antigen) fragments characteristic of a pathogen or tumor antigen. When administered to a patient, expression of genetic vaccines occurs after uptake by target cells. Expression of the introduced nucleic acids results in the production of encoded proteins. When these proteins are recognized by the patient's immune system as foreign, an immune response is triggered.

Как следует из вышеизложенного, оба метода, и генная терапия, и генетическая вакцинация, по существу основаны на введении молекул нуклеиновой кислоты пациенту и последующей транскрипции и/или трансляции кодируемой генетической информации. Альтернативно этому, генетическая вакцинация или генная терапия может включать также методы, которые предусматривают выделение специфических клеток из организма пациента, подлежащего лечению, последующую трансфекцию ex vivo указанных клеток и повторное введение обработанных клеток пациенту.As follows from the above, both methods, and gene therapy, and genetic vaccination, essentially based on the introduction of nucleic acid molecules to the patient and subsequent transcription and/or translation of encoded genetic information. Alternatively, genetic vaccination or gene therapy may also include methods that involve the isolation of specific cells from the body of the patient to be treated, the subsequent ex vivo transfection of these cells and reintroduction of the treated cells to the patient.

В контексте генной терапии или генетической вакцинации в качестве молекул нуклеиновой кислоты можно вводить как ДНК, так и РНК. Известно, что ДНК является относительно стабильной и с ней проще манипулировать. Однако применение ДНК сопряжено с риском нежелательного встраивания введенных ДНК-фрагментов в геном пациента, что может приводить к мутагенным действиям, таким как потеря функции нарушенных генов. Другим риском является то, что происходит нежелательное возникновение антител к ДНК. Еще одним недостатком является ограниченный уровень экспрессии кодируемого пептида или белка, достигаемый при введении ДНК, поскольку ДНК должна проникнуть в ядро для того, чтобы произошла ее транскрипция перед тем, как могла осуществляться трансляция полученной в результате этого мРНК. Уровень экспрессии введенной ДНК может зависеть, среди прочего, от присутствия специфических факторов транскрипции, которые регулируют транскрипцию ДНК. В случае отсутствия таких факторов транскрипция ДНК не приводит к получению ДНК в достаточных количествах. В результате достигаемый уровень транслированного пептида или белка является ограниченным.In the context of gene therapy or genetic vaccination, both DNA and RNA can be administered as nucleic acid molecules. DNA is known to be relatively stable and easier to manipulate. However, the use of DNA carries the risk of undesirably inserting the introduced DNA fragments into the patient's genome, which can lead to mutagenic effects such as loss of function of the disrupted genes. Another risk is that an undesirable occurrence of antibodies to DNA occurs. Another disadvantage is the limited level of expression of the encoded peptide or protein achievable with the introduction of DNA, since the DNA must enter the nucleus in order for it to be transcribed before the resulting mRNA can be translated. The level of expression of the introduced DNA may depend, inter alia, on the presence of specific transcription factors that regulate DNA transcription. In the absence of such factors, DNA transcription does not result in DNA in sufficient quantities. As a result, the level of translated peptide or protein achievable is limited.

При использовании РНК вместо ДНК для генной терапии или генетической вакцинации риск нежелательной интеграции в геном и образования антител к ДНК сводится к минимуму или устраняется. Однако считается, что РНК являться относительно нестабильной молекулой, которая может легко расщепляться под действием повсеместно присутствующих РНКаз.When using RNA instead of DNA for gene therapy or genetic vaccination, the risk of unwanted integration into the genome and the formation of antibodies to DNA is minimized or eliminated. However, RNA is considered to be a relatively unstable molecule that can be easily cleaved by the ubiquitous RNases.

Расщепление РНК in vivo вносит вклад в регулирование времени полужизни РНК. Этот эффект был изучен и было установлено, что он строго регулирует экспрессию эукариотических генов (Friedel и др., Conserved principles of mammalian transcriptional regulation revealed by RNA half-life, Nucleic Acid Research 37(17), 2009, cc. 1-12). Таким образом, каждая встречающаяся в естественных условиях мРНК имеет свое индивидуальное время полужизни, зависящее от гена, из которого происходит мРНК, и от типа клетки, в которой происходит экспрессия. Оно вносит вклад в регуляцию уровня экспрессии рассматриваемого гена. Нестабильные РНК важны для реализации кратковременной генной экспрессии в определенные моменты времени. Однако РНК с продолжительным временем жизни могут ассоциироваться с накоплением различных белков или с непрерывной экспрессией генов. Время полужизни мРНК in vivo может зависеть также от факторов окружающей среды, таких как обработка гормонами, что продемонстрировано, например, для мРНК инсулин-подобного фактора роста I, актина, и альбумина (Johnson и др., Newly synthesized RNA: Simultaneous measurement in intact cells of transcription rates and RNA stability of insulin-like growth factor I, actin, and albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. Sci., Vol. 88, 1991, cc. 5287-5291).Cleavage of RNA in vivo contributes to the regulation of RNA half-life. This effect has been studied and found to strongly regulate eukaryotic gene expression (Friedel et al., Conserved principles of mammalian transcriptional regulation revealed by RNA half-life, Nucleic Acid Research 37(17), 2009, pp. 1-12) . Thus, each naturally occurring mRNA has its own individual half-life, depending on the gene from which the mRNA originates and on the type of cell in which expression occurs. It contributes to the regulation of the level of expression of the gene in question. Unstable RNAs are important for transient gene expression at specific time points. However, long-lived RNAs may be associated with the accumulation of various proteins or with continuous gene expression. The in vivo half-life of mRNAs may also depend on environmental factors such as hormone treatment, as demonstrated for example for mRNAs of insulin-like growth factor I, actin, and albumin (Johnson et al., Newly synthesized RNA: Simultaneous measurement in intact cells of transcription rates and RNA stability of insulin-like growth factor I, actin, and albumin in growth hormone-stimulated hepatocytes, Proc. Natl. Acad. Sci., Vol. 88, 1991, pp. 5287-5291).

Для генной терапии и генетической вакцинации, как правило, требуется стабильная РНК. Это обусловлено, с одной стороны, тем фактом, что, как правило, требуется, чтобы in vivo происходило накопление продукта, кодируемого последовательностью РНК. С другой стороны, РНК должна сохранять свою структурную и функциональную целостность при приготовлении пригодной лекарственной формы, в процессе ее хранения и при введении. Таким образом, предпринимались усилия для создания стабильных молекул РНК для генной терапии или генетической вакцинации с целью предупреждения их от раннего разложения или расщепления.Gene therapy and genetic vaccination generally require stable RNA. This is due, on the one hand, to the fact that, as a rule, it is required that in vivo accumulation of the product encoded by the RNA sequence takes place. On the other hand, RNA must maintain its structural and functional integrity during the preparation of a suitable dosage form, during its storage and administration. Thus, efforts have been made to create stable RNA molecules for gene therapy or genetic vaccination in order to prevent them from early degradation or cleavage.

Опубликованы данные о том, что содержание G/C в молекулах нуклеиновой кислоты может оказывать влияние на ее стабильность. Так, нуклеиновые кислоты, содержащие в большем количестве остатки гуанина (G) и/или цитозина (С), могут быть функционально более стабильными, чем нуклеиновые кислоты, содержащие большое количество адениновых (А) и тиминовых (Т) или урациловых (U) нуклеотидов. В этом контексте в WO 02/098443 предложена фармацевтическая композиция, содержащая мРНК, которая стабилизирована посредством модификаций последовательности в кодирующей области. Такая модификация является возможной благодаря вырожденности генетического кода. В соответствии с этим кодоны, содержащие менее предпочтительную комбинацию нуклеотидов (менее предпочтительную с точки зрения стабильности РНК), быть заменены на альтернативные кодоны без изменения кодируемой аминокислотной последовательности. Такой метод стабилизации РНК ограничен тем, что для каждой отдельной молекулы РНК нужно получать конкретную нуклеотидную последовательность, которая не приводит к получению аминокислотной последовательности, отклоняющейся от требуемой. Указанный подход ограничен также тем, что его применяют к кодирующим областям РНК.Data have been published that the content of G/C in nucleic acid molecules can affect its stability. Thus, nucleic acids containing a greater amount of guanine (G) and/or cytosine (C) residues may be functionally more stable than nucleic acids containing a large number of adenine (A) and thymine (T) or uracil (U) nucleotides. . In this context, WO 02/098443 proposes a pharmaceutical composition containing mRNA that is stabilized by sequence modifications in the coding region. Such modification is possible due to the degeneracy of the genetic code. Accordingly, codons containing a less preferred combination of nucleotides (less preferred in terms of RNA stability) can be replaced with alternative codons without changing the encoded amino acid sequence. This method of RNA stabilization is limited by the fact that for each individual RNA molecule it is necessary to obtain a specific nucleotide sequence that does not lead to an amino acid sequence that deviates from the required one. This approach is also limited in that it is applied to RNA coding regions.

При поиске альтернативного подхода к стабилизации мРНК было установлено, что встречающиеся в естественных условиях молекулы эукариотической мРНК содержат характерные стабилизирующие элементы. Например, они могут содержать так называемые нетранслируемые области (UTR) на своем 5'-конце (5'-UTR) и/или на своем 3'-конце (3'-UTR), а также другие структурные особенности, такие как 5'-кэп-структура или 3'-поли(А)-хвост. Как 5'-UTR, так и 3'-UTR, как правило, транскрибируются с геномной ДНК и, следовательно, представляют собой элемент незрелой мРНК. Характерные структурные особенности зрелой мРНК, такие как 5'-кэп и 3'-поли(А)-хвост (которые обозначают также, как поли(А)-хвост или поли(А)-последовательность), как правило, добавляют к транскрибированной (незрелой) мРНК в ходе процессинга мРНК.In the search for an alternative approach to mRNA stabilization, it was found that naturally occurring eukaryotic mRNA molecules contain characteristic stabilizing elements. For example, they may contain so-called untranslated regions (UTRs) at their 5' end (5'-UTR) and/or at their 3' end (3'-UTR), as well as other structural features such as 5' -cap-structure or 3'-poly(A)-tail. Both the 5'-UTR and the 3'-UTR are typically transcribed from genomic DNA and are therefore an immature mRNA element. Structural features of the mature mRNA, such as a 5' cap and a 3' poly(A) tail (also referred to as the poly(A) tail or poly(A) sequence), are usually added to the transcribed ( immature) mRNA during mRNA processing.

3'-поли(А)-хвост, как правило, представляет собой монотонный участок последовательности, который состоит из аденозиновых нуклеотидов, добавленный к 3'-концу транскрибированной мРНК. Он может содержать вплоть до примерно 400 аденозиновых нуклеотидов. Установлено, что длина такого 3'-поли(А)-хвоста может являться элементом, имеющим решающее значение для стабильности индивидуальной мРНК.The 3'-poly(A) tail is typically a monotonic stretch of sequence that consists of adenosine nucleotides added to the 3' end of the transcribed mRNA. It may contain up to about 400 adenosine nucleotides. It has been found that the length of such a 3'-poly(A)-tail may be an element of decisive importance for the stability of an individual mRNA.

Было продемонстрировано также, что 3'-UTR мРНК α-глобина может являться важным фактором, обеспечивающим хорошо известную стабильность мРНК α-глобина (Rodgers и др., Regulated α-globin mRNA decay is a cytoplasmic event proceeding through 3'-to-5' exosome-dependent decapping, RNA, 8, 2002, cc. 1526-1537). 3'-UTR мРНК α-глобина, по-видимому, участвует в формировании специфического рибонуклеопротеинового комплекса, α-комплекса, присутствие которого коррелирует со стабильностью мРНК in vitro (Wang и др., An mRNA stability complex functions with poly(A)-binding protein to stabilize mRNA in vitro, Molecular and Cellular biology, том 19, №7, июль 1999 г., cc. 4552-4560).It has also been demonstrated that the 3'-UTR of α-globin mRNA may be an important contributor to the well-known stability of α-globin mRNA (Rodgers et al., Regulated α-globin mRNA decay is a cytoplasmic event proceeding through 3'-to-5 'exosome-dependent decapping, RNA, 8, 2002, pp. 1526-1537). The 3'-UTR of α-globin mRNA appears to be involved in the formation of a specific ribonucleoprotein complex, the α-complex, whose presence correlates with in vitro mRNA stability (Wang et al., An mRNA stability complex functions with poly(A)-binding protein to stabilize mRNA in vitro, Molecular and Cellular Biology, Volume 19, No. 7, July 1999, pp. 4552-4560).

Кроме того, для UTR в мРНК рибосомального белка была выявлена важная регуляторная функция: хотя 5'-UTR мРНК рибосомального белка контролирует ассоциированную с ростом трансляцию мРНК, строгость указанной регулировки обеспечивается соответствующей 3'-UTR в мРНК рибосомального белка (Ledda и др., Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, том 344, 2005, cc. 213-220). Этот механизм оказывает влияние на специфическую схему экспрессии рибосомальных белков, которые, как правило, транскрибируются постоянным образом, вследствие чего мРНК некоторых рибосомальных белков, таких как рибосомальный белок S9 или рибосомальный белок L32, называют генами «домашнего хозяйства» (Janovick-Guretzky и др., Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, and Dietary Treatment, J. Dairy Sci., том 90, 2007, cc. 2246-2252). Таким образом, ассоциированная с ростом схема экспрессии рибосомальных белков в основном обусловлена регуляцией на уровне трансляции.In addition, an important regulatory function has been identified for the UTR in ribosomal protein mRNA: although the 5'-UTR of ribosomal protein mRNA controls growth-associated mRNA translation, the rigor of this regulation is provided by the corresponding 3'-UTR in ribosomal protein mRNA (Ledda et al., Effect of the 3'-UTR length on the translational regulation of 5'-terminal oligopyrimidine mRNAs, Gene, Volume 344, 2005, pp. 213-220). This mechanism affects the specific expression pattern of ribosomal proteins, which are usually transcribed in a constant manner, as a result of which the mRNA of some ribosomal proteins, such as the S9 ribosomal protein or the L32 ribosomal protein, are called housekeeping genes (Janovick-Guretzky et al. , Housekeeping Gene Expression in Bovine Liver is Affected by Physiological State, Feed Intake, and Dietary Treatment, J. Dairy Sci., Volume 90, 2007, pp. 2246-2252). Thus, the expression pattern of ribosomal proteins associated with growth is mainly due to regulation at the level of translation.

Вне зависимости от факторов, влияющих на стабильность мРНК, эффективность трансляции введенных молекул нуклеиновой кислоты клетками-мишенями или тканью имеет решающее значение для любого подхода с использованием молекул нуклеиновой кислоты для генной терапии или генетической вакцинации. Как следует из процитированных выше примеров, структурные особенности, такие как UTR, 5'-кэп и 3'-поли(А)-хвост, наряду с регуляцией стабильности, регулируют также трансляцию большинства мРНК. В этом контексте, опубликованы данные о том, что длина поли(А)-хвоста может играть важную роль также и для эффективности трансляции. Однако стабилизирующие 3'-элементы могут оказывать также ослабляющее действие на трансляцию.Regardless of the factors affecting mRNA stability, the efficiency of translation of the introduced nucleic acid molecules by the target cells or tissue is critical to any approach using nucleic acid molecules for gene therapy or genetic vaccination. As follows from the examples cited above, structural features such as UTR, 5'-cap and 3'-poly(A)-tail, along with the regulation of stability, also regulate the translation of most mRNA. In this context, published data suggest that the length of the poly(A) tail may also play an important role in the efficiency of translation. However, 3' stabilizing elements can also have a translational dampening effect.

В основу настоящего изобретения была положена задача создать молекулы нуклеиновой кислоты, которые можно применять для генной терапии и/или генетической вакцинации. Задача изобретения заключалась, прежде всего, в том, чтобы создать виды мРНК, которые стабилизированы для защиты от преждевременного разложения или расщепления, но которые не характеризуются значительной функциональной потерей с точки зрения эффективности трансляции. Задачей изобретения являлось также создание искусственной молекулы нуклеиновой кислоты, предпочтительно мРНК, отличающейся повышенной экспрессией соответствующего белка, кодируемого указанной молекулой нуклеиновой кислоты. Одна из конкретных задач изобретения заключалась в создании мРНК, позволяющей повышать эффективность трансляции соответствующего кодируемого белка. Другая задача настоящего изобретения заключалась в том, чтобы создать молекулы нуклеиновой кислоты, кодирующие такие обладающие преимуществами виды мРНК, которые могут быть пригодными для применения в генной терапии и/или генетической вакцинации. Следующая задача настоящего изобретения заключалась в том, чтобы создать фармацевтическую композицию для применения в генной терапии и/или генетической вакцинации. В целом, задача настоящего изобретения заключалась в создании усовершенствованных видов нуклеиновой кислоты, которые позволяют преодолевать указанные выше недостатки существующего уровня техники с использованием экономичного и простого подхода.The present invention was based on the task of creating nucleic acid molecules that can be used for gene therapy and/or genetic vaccination. The objective of the invention was primarily to create mRNA species that are stabilized to protect against premature degradation or cleavage, but which do not suffer from a significant functional loss in terms of translation efficiency. It was also an object of the invention to provide an artificial nucleic acid molecule, preferably an mRNA, characterized by increased expression of the corresponding protein encoded by said nucleic acid molecule. One of the specific objectives of the invention was to create mRNA, allowing to increase the efficiency of translation of the corresponding encoded protein. Another object of the present invention was to provide nucleic acid molecules encoding advantageous mRNA species that may be suitable for use in gene therapy and/or genetic vaccination. A further object of the present invention was to provide a pharmaceutical composition for use in gene therapy and/or genetic vaccination. In general, the aim of the present invention was to provide improved nucleic acid species that overcome the above disadvantages of the prior art using an economical and simple approach.

Задачи, положенные в основу настоящего изобретения, решаются с помощью объектов изобретения, представленных в формуле изобретения.The problems underlying the present invention are solved with the help of the objects of the invention presented in the claims.

Настоящее изобретение было создано при поддержке правительства в рамках соглашения № HR0011-11-3-0001, подписанного DARPA (Агентство передовых оборонных исследовательских проектов). Правительство обладает определенными правами на изобретение.The present invention was made with government support under Agreement No. HR0011-11-3-0001 signed by DARPA (Defense Advanced Research Projects Agency). The government has certain rights to the invention.

Для целей ясности и удобочитаемости ниже даны следующие определения. Все технические характеристики, указанные в этих определениях, применимы к каждому и всем вариантам осуществления изобретения. В контексте этих вариантов осуществления изобретения могут быть даны дополнительные определения и пояснения.For purposes of clarity and readability, the following definitions are given below. All specifications specified in these definitions apply to each and all embodiments of the invention. In the context of these embodiments, further definitions and explanations may be given.

Адаптивный иммунный ответ: Как правило, под адаптивным иммунным ответом понимают антигенспецифический ответ иммунной системы. Специфичность в отношении антигена позволяет вырабатывать ответы, приспособленные к специфическим патогенам или инфицированным патогеном клеткам. Способность создавать такие приспособленные ответы, как правило, поддерживается в организме «клетками памяти». Если патоген инфицирует организм более одного раза, то указанные специфические клетки памяти используются для его быстрой элиминации. В этом контексте первая стадия адаптивного иммунного ответа представляет собой активацию наивных антигенспецифических Т-клеток или других иммунных клеток, способных индуцировать антигенспецифический иммунный ответ, антигенпрезентирующими клетками. Это происходит в лимфоидных тканях и органах, через которые постоянно проходят наивные Т-клетки. Три типа клеток, которые могут служить в качестве антигенпрезентирующих клеток, представляют собой дендритные клетки, макрофаги и В-клетки. Каждая из указанных клеток выполняет отдельную функцию при вызывании иммунных ответов. Дендритные клетки могут поглощать антигены посредством фагоцитоза и макропиноцитоза, и они могут стимулироваться при контакте, например, с чужим антигеном, к миграции в местную лимфоидную ткань, где может происходить их дифференцировка в зрелые дендритные клетки. Макрофаги поглощают находящиеся в форме частиц антигены, такие как бактерии, и могут индуцироваться инфекционными агентами или другими соответствующими стимулами и экспрессировать в результате этого молекулы ГКГС. Уникальная способность В-клеток к связыванию и интернализации растворимых белковых антигенов посредством своих рецепторов также может иметь важное значение для индукции Т-клеток. ГКГС-молекулы, как правило, ответственны за презентацию антигена Т-клеткам. При этом презентация антигена на молекулах ГКГС приводит к активации Т-клеток, что индуцирует их пролиферацию и дифференцировку в «вооруженные» эффекторные Т-клетки. Наиболее важной функцией эффекторных Т-клеток является уничтожение (цитолиз) инфицированных клеток цитотоксическими CD8⁺-T-клетками и активация макрофагов Th1-клетками, что в совокупности создает опосредованный клетками (клеточный) иммунитет, а активация В-клеток как Th2-, так и Th1-клетками, приводящая к образованию различных классов антител, запускает гуморальный иммунный ответ. Т-клетки распознают антиген посредством своих Т-клеточных рецепторов, которые не распознают антиген и не связываются с ним непосредственно, но вместо этого распознают короткие пептидные фрагменты, например, выведенных из патогена белковых антигенов, например, так называемые эпитопы, которые связываются с молекулами ГКГС на поверхностях других клеток.Adaptive immune response: Typically, adaptive immune response refers to an antigen-specific response of the immune system. Antigen specificity allows for responses tailored to specific pathogens or pathogen-infected cells. The ability to create such adapted responses is usually maintained in the body by "memory cells". If the pathogen infects the body more than once, then these specific memory cells are used for its rapid elimination. In this context, the first stage of an adaptive immune response is the activation of naïve antigen-specific T cells or other immune cells capable of inducing an antigen-specific immune response by antigen-presenting cells. This occurs in lymphoid tissues and organs through which naive T cells constantly pass. Three cell types that can serve as antigen presenting cells are dendritic cells, macrophages, and B cells. Each of these cells performs a separate function in inducing immune responses. Dendritic cells can take up antigens via phagocytosis and macropinocytosis, and they can be stimulated upon contact with, for example, a foreign antigen, to migrate to the local lymphoid tissue where they can differentiate into mature dendritic cells. Macrophages engulf particulate antigens such as bacteria and can be induced by infectious agents or other appropriate stimuli and thereby express MHC molecules. The unique ability of B cells to bind and internalize soluble protein antigens through their receptors may also be important for T cell induction. MHC molecules are generally responsible for antigen presentation to T cells. At the same time, antigen presentation on MHC molecules leads to the activation of T cells, which induces their proliferation and differentiation into “armed” effector T cells. The most important function of effector T cells is the destruction (cytolysis) of infected cells by cytotoxic CD8 ⁺ -T cells and the activation of macrophages by Th1 cells, which together creates cell-mediated (cellular) immunity, and the activation of B cells by both Th2- and Th1 cells, leading to the formation of various classes of antibodies, triggers a humoral immune response. T cells recognize an antigen through their T cell receptors, which do not recognize the antigen and do not bind to it directly, but instead recognize short peptide fragments, such as pathogen-derived protein antigens, such as so-called epitopes, which bind to MHC molecules on the surfaces of other cells.

Адаптивная иммунная система: Адаптивная иммунная система в основном предназначена для устранения или предупреждения роста патогенов. Как правило, она регулирует адаптивный иммунный ответ, придавая иммунной системе позвоночных способность распознавать и запоминать специфические патогены (для создания иммунитета) и организовывать более сильную атаку в каждом случае при обнаружении патогена. Система обладает высокой способностью к адаптации вследствие соматической гипермутации (процесс ускоренных соматических мутаций) и V(D)J-рекомбинации (необратимая генетическая рекомбинация сегментов гена рецептора антигена). Этот механизм позволяет небольшому количеству генов создавать огромное количество различных рецепторов антигенов, которые затем уникальным образом экспрессируются на каждом индивидуальном лимфоците. Поскольку реаранжировка гена приводит к необратимому изменению ДНК каждой клетки, то все потомство такой клетки должно затем наследовать гены, кодирующие ту же самую рецепторную специфичность, включая В-клетки памяти и Т-клетки памяти, которые имеют решающее значение для долговременного специфического иммунитета.Adaptive immune system: The adaptive immune system is primarily designed to eliminate or prevent the growth of pathogens. Typically, it regulates the adaptive immune response, giving the vertebrate immune system the ability to recognize and remember specific pathogens (to build immunity) and mount a stronger attack each time a pathogen is detected. The system is highly adaptable due to somatic hypermutation (a process of accelerated somatic mutations) and V(D)J recombination (irreversible genetic recombination of antigen receptor gene segments). This mechanism allows a small number of genes to create a huge number of different antigen receptors, which are then uniquely expressed on each individual lymphocyte. Since the rearrangement of a gene results in an irreversible change in the DNA of each cell, then all progeny of such a cell must then inherit genes encoding the same receptor specificity, including memory B cells and memory T cells, which are critical for long-term specific immunity.

Адъювант/адъювантный компонент: Адъювант или адъювантный компонент в наиболее широком смысле, как правило, представляет собой фармакологический и/или иммунологический агент, который может модифицировать, например, усиливать, действие других агентов, таких как лекарственное средство или вакцина. Это понятие следует рассматривать в широком смысле, и оно относится к широкому спектру субстанций. Как правило, указанные субстанции обладают способностью повышать иммуногенность антигенов. Например, адъюванты могут распознаваться врожденными иммунными системами и, например, могут вызывать врожденный иммунный ответ.«Адъюванты», как правило, не вызывают адаптивный иммунный ответ. Таким образом, «адъюванты» нельзя классифицировать как антигены. Механизм их действия отличен от механизма действий, запускаемых антигенами, которые приводят к адаптивному иммунному ответу.Adjuvant/Adjuvant Component: An adjuvant, or adjuvant component in the broadest sense, is generally a pharmacological and/or immunological agent that can modify, for example enhance, the effect of other agents such as a drug or vaccine. This concept should be considered in a broad sense, and it refers to a wide range of substances. As a rule, these substances have the ability to increase the immunogenicity of antigens. For example, adjuvants may be recognized by innate immune systems and, for example, may elicit an innate immune response. "Adjuvants" generally do not elicit an adaptive immune response. Thus, "adjuvants" cannot be classified as antigens. Their mechanism of action is different from that triggered by antigens that lead to an adaptive immune response.

Антиген: В контексте настоящего изобретения понятие «антиген» относится, как правило, к субстанции, которая может распознаваться иммунной системой, предпочтительно адаптивной иммунной системой, и которая обладает способностью запускать антигенспецифический иммунный ответ, например, посредством образования антител и/или антигенспецифических Т-клеток, в качестве компонента адаптивного иммунного ответа. Как правило, антиген может представлять собой или содержать пептид или белок, который может презентоваться ГКГС Т-клеткам. В контексте настоящего изобретения антиген может представлять собой продукт трансляции предложенной молекулы нуклеиновой кислоты, предпочтительно мРНК, представленной в настоящем описании. В этом контексте под антигенами подразумевают также фрагменты, варианты и производные пептидов и белков, содержащие по меньшей мере один эпитоп. В контексте настоящего изобретения наиболее предпочтительными являются опухолевые антигены и патогенные антигены.Antigen: In the context of the present invention, the term "antigen" refers generally to a substance that can be recognized by the immune system, preferably the adaptive immune system, and which has the ability to trigger an antigen-specific immune response, for example, through the formation of antibodies and/or antigen-specific T cells , as a component of the adaptive immune response. Typically, an antigen may be or contain a peptide or protein that can be presented to MHC T cells. In the context of the present invention, the antigen may be a translation product of the proposed nucleic acid molecule, preferably mRNA, presented in the present description. In this context, antigens also include fragments, variants and derivatives of peptides and proteins containing at least one epitope. In the context of the present invention, tumor antigens and pathogenic antigens are most preferred.

Искусственная молекула нуклеиновой кислоты: Под искусственной молекулой нуклеиновой кислоты, как правило, понимают молекулу нуклеиновой кислоты, например, ДНК или РНК, которая не встречается в естественных условиях. Иными словами, искусственную молекулу нуклеиновой кислоты можно рассматривать как молекулу нуклеиновой кислоты, не встречающуюся в естественных условиях. Такая молекула нуклеиновой кислоты может не встречаться в естественных условиях из-за своей индивидуальной последовательности (которая не встречается в естественных условиях) и/или из-за других модификаций, например, структурных модификаций нуклеотидов, которые не встречаются в естественных условиях. Искусственная молекула нуклеиновой кислоты может представлять собой молекулу ДНК, молекулу РНК или гибридную молекулу, содержащую участки ДНК и РНК. Как правило, искусственные молекулы нуклеиновой кислоты можно конструировать и/или создавать методами генетической инженерии так, чтобы они соответствовали требуемой искусственной последовательности нуклеотидов (гетерологичной последовательности). В этом контексте искусственная последовательность, как правило, представляет собой последовательность, которая не может встречаться в естественных условиях, т.е. отличается от последовательности дикого типа по меньшей мере одним нуклеотидом. Можно считать, что понятие «дикий тип» относится к последовательности, встречающейся в природе. Кроме того, не следует понимать, что понятие «искусственная молекула нуклеиновой кислоты» обозначает «одну единственную молекулу», как правило, оно включает группу идентичных молекул. Следовательно, оно может относиться к множеству идентичных молекул, содержащихся в аликвоте.Artificial nucleic acid molecule: An artificial nucleic acid molecule is generally understood to mean a nucleic acid molecule, such as DNA or RNA, that does not occur naturally. In other words, an artificial nucleic acid molecule can be considered as a nucleic acid molecule that does not occur naturally. Such a nucleic acid molecule may not occur naturally due to its individual sequence (which does not occur naturally) and/or due to other modifications, such as structural modifications of nucleotides, which do not occur naturally. The artificial nucleic acid molecule may be a DNA molecule, an RNA molecule, or a hybrid molecule containing portions of DNA and RNA. Generally, artificial nucleic acid molecules can be designed and/or genetically engineered to match the desired artificial nucleotide sequence (heterologous sequence). In this context, an artificial sequence is generally one that cannot occur naturally, i.e. differs from the wild-type sequence by at least one nucleotide. We can consider that the concept of "wild type" refers to a sequence found in nature. In addition, it should not be understood that the term "artificial nucleic acid molecule" means "one single molecule", as a rule, it includes a group of identical molecules. Therefore, it may refer to a plurality of identical molecules contained in an aliquot.

Бицистронная РНК, полицистронная РНК: Бицистронная или полицистронная РНК, как правило, представляет собой РНК, предпочтительно мРНК, которая, как правило, может иметь две (бицистронная) или большее количество (полицистронная) открытых рамок считывания (ОРС). В этом контексте открытая рамка считывания представляет собой последовательность, состоящую из нескольких кодонов, которые могут транслироваться в пептид или белок.Bicistronic RNA, Polycistronic RNA: Bicistronic or polycistronic RNA is generally an RNA, preferably an mRNA, which can typically have two (bicistronic) or more (polycistronic) open reading frames (ORFs). In this context, an open reading frame is a sequence of multiple codons that can be translated into a peptide or protein.

Носитель/полимерный носитель: В контексте изобретения носитель, как правило, может представлять собой соединение, которое облегчает транспорт и/или включение в комплекс другого соединения (карго, полезный груз). Полимерный носитель, как правило, представляет собой носитель, образующий полимер. Носитель может быть связан со своим полезным грузом посредством ковалентного или нековалентного взаимодействия. Носитель может транспортировать нуклеиновые кислоты, например, РНК или ДНК, к клеткам-мишеням. Носитель может (в некоторых вариантах осуществления изобретения) представлять собой катионный компонент.Carrier/Polymer Carrier: In the context of the invention, a carrier can generally be a compound that facilitates the transport and/or incorporation of another compound (cargo, payload). The polymeric carrier, as a rule, is a carrier that forms a polymer. The carrier may be associated with its payload through a covalent or non-covalent interaction. The carrier can transport nucleic acids, such as RNA or DNA, to target cells. The carrier may (in some embodiments of the invention) be a cationic component.

Катионный компонент: Понятие «катионный компонент», как правило, относится к заряженной молекуле, которая является положительно заряженной (катион) при значении рН, составляющем, как правило, от 1 до 9, предпочтительно при значении рН, равном или ниже 9 (например, от 5 до 9), равном или ниже 8 (например, от 5 до 8), равном или ниже 7 (например, от 5 до 7), наиболее предпочтительно при физиологическом значении рН, например, от 7,3 до 7.4. Таким образом, катионный компонент может представлять собой любое положительно заряженное соединение или полимер, предпочтительно катионный пептид или белок, который является положительно заряженным в физиологических условиях, прежде всего в физиологических условиях in vivo. «Катионный пептид или белок» может содержать по меньшей мере одну положительно заряженную аминокислоту, или более чем одну положительно заряженную аминокислоту, например, выбранную из Arg, His, Lys или Orn. Следовательно, «поликатионные» соединения также подпадают под указанное определение, если они несут более одного положительного заряда в указанных условиях.Cationic component: The term "cationic component" generally refers to a charged molecule that is positively charged (cation) at a pH value typically between 1 and 9, preferably at or below pH 9 (e.g., 5 to 9) equal to or less than 8 (eg 5 to 8), equal to or less than 7 (eg 5 to 7), most preferably at physiological pH, eg 7.3 to 7.4. Thus, the cationic component may be any positively charged compound or polymer, preferably a cationic peptide or protein, which is positively charged under physiological conditions, especially in vivo physiological conditions. A "cationic peptide or protein" may contain at least one positively charged amino acid, or more than one positively charged amino acid, for example selected from Arg, His, Lys, or Orn. Therefore, "polycationic" compounds also fall under the specified definition if they carry more than one positive charge under the specified conditions.

5'-Кэп: 5'-Кэп представляет собой структуру, как правило, модифицированную нуклеотидную структуру, которая обычно «завершает» 5'-конец зрелой мРНК. 5'-кэп может, как правило, быть образован модифицированным нуклеотидом, прежде всего производным гуанинового нуклеотида. Предпочтительно 5'-кэп связан с 5'-концом через 5'-5'-трифосфатную связь. 5'-кэп может быть метилирован, например, может представлять собой m7GpppN, где N обозначает концевой 5'-нуклеотид нуклеиновой кислоты, несущей 5'-кэп, как правило, 5'-конец РНК. Другими примерами структур 5'-кэпа являются глицерил, инвертированная дезоксигруппа (фрагмент), лишенная азотистого основания, 4',5'-метиленовой нуклеотид, 1-(бета-D-эритрофуранозильный) нуклеотид, 4'-тионуклеотид, карбоциклический нуклеотид, 1,5-ангидрогекситольный нуклеотид, L-нуклеотиды, альфа-нуклеотид, нуклеотид с модифицированным основанием, треопентофуранозильный нуклеотид, ациклический 3',4'-секонуклеотид, ациклический 3,4-дигидроксибутильный нуклеотид, ациклический 3,5-дигидроксипентильный нуклеотид, 3'-3'-инвертированный нуклеотидный фрагмент, 3'-3'-инвертированный лишенный азотистого основания фрагмент, 3'-2'-инвертированный нуклеотидный фрагмент, 3'-2'-инвертированный лишенный азотистого основания фрагмент, 1,4-бутандиолфосфатный, 3'-фосфороамидатный, гексилфосфатный, аминогексилфосфатный, 3'-фосфатный, 3'-фосфоротиоатный, фосфородитиоатный или связанный мостиком или несвязанный мостиком метилфосфонатный фрагмент.5'-Cap: The 5'-Cap is a structure, usually a modified nucleotide structure, that normally "terminates" the 5' end of a mature mRNA. The 5' cap can generally be formed by a modified nucleotide, primarily a derivative of a guanine nucleotide. Preferably the 5' cap is linked to the 5' end via a 5'-5' triphosphate bond. The 5' cap may be methylated, eg m7GpppN, where N is the 5' terminal nucleotide of the nucleic acid carrying the 5' cap, typically the 5' end of the RNA. Other examples of 5'-cap structures are glyceryl, inverted deoxy group (fragment) devoid of a nitrogenous base, 4',5'-methylene nucleotide, 1-(beta-D-erythrofuranosyl) nucleotide, 4'-thionucleotide, carbocyclic nucleotide, 1, 5-anhydrohexitol nucleotide, L-nucleotides, alpha-nucleotide, base-modified nucleotide, treopentofuranosyl nucleotide, acyclic 3',4'-seconucleotide, acyclic 3,4-dihydroxybutyl nucleotide, acyclic 3,5-dihydroxypentyl nucleotide, 3'-3 '-Inverted Nucleotide Fragment, 3'-3'-Inverted Nucleotide Fragment, 3'-2'-Inverted Nucleotide Fragment, 3'-2'-Inverted Nucleotide Fragment, 1,4-Butanediol Phosphate, 3'-Phosphoramidate , hexylphosphate, aminohexylphosphate, 3'-phosphate, 3'-phosphorothioate, phosphorodithioate, or a bridged or unbridged methylphosphonate moiety.

Клеточный иммунитет/клеточный иммунный ответ: Клеточный иммунитет относится, как правило, к активации макрофагов, естественных клеток-киллеров (NK), антигенспецифических цитотоксических Т-лимфоцитов и высвобождению различных цитокинов в ответ на антиген. В более общем смысле клеточный иммунитет основан не на антителах, а на активации клеток иммунной системы. Как правило, клеточный иммунный ответ может характеризоваться, например, активацией антигенспецифических цитотоксических Т-лимфоцитов, которые способны индуцировать апоптоз клеток, например, специфических иммунных клеток типа дендритных клеток или других клеток, экспонирующих эпитопы чужих генов на своей поверхности. Такие клетки могут представлять собой инфицированные вирусом или инфицированные внутриклеточными бактериями, или раковые клетки, экспонирующие опухолевые антигены. Другими характеристиками могут являться активация макрофагов и естественных клеток-киллеров, позволяющая им разрушать патогены, и стимуляция клеток к секреции различных цитокинов, которые влияют на функцию других клеток, участвующих в адаптивных иммунных ответах и врожденных иммунных ответах.Cellular Immunity/Cellular Immune Response: Cellular immunity generally refers to the activation of macrophages, natural killer (NK) cells, antigen-specific cytotoxic T lymphocytes, and the release of various cytokines in response to an antigen. In a more general sense, cellular immunity is not based on antibodies, but on the activation of cells of the immune system. Typically, a cellular immune response may be characterized, for example, by the activation of antigen-specific cytotoxic T-lymphocytes that are capable of inducing cell apoptosis, for example, specific immune cells such as dendritic cells or other cells displaying foreign gene epitopes on their surface. Such cells may be virus-infected or intracellular bacteria-infected, or cancer cells displaying tumor antigens. Other characteristics may be the activation of macrophages and natural killer cells, allowing them to destroy pathogens, and the stimulation of cells to secrete various cytokines that affect the function of other cells involved in adaptive immune responses and innate immune responses.

ДНК: ДНК является общепринятым сокращением дезоксирибонуклеиновой кислоты. Она представляет собой молекулу нуклеиновой кислоты, т.е. полимер, состоящий из нуклеотидов. Указанные нуклеотиды, как правило, представляют собой мономеры дезоксиаденозинмонофосфата, дезокситимидинмонофосфата, дезоксигуанозинмонофосфата и дезоксицитидинмонофосфата, которые сами состоят из сахарного фрагмента (дезоксирибоза), фрагмента, представляющего собой основание, и фосфатного фрагмента, и образуют полимеры с характерной каркасной структурой. Каркасная структура, как правило, образована с помощью фосфодиэфирных связей между сахарным фрагментом нуклеотида, т.е. дезоксирибозы, первого мономера и фосфатным фрагментом второго смежного мономера. Специфический порядок мономеров, т.е. порядок оснований, сцепленных с сахарным/фосфатным каркасом, называют ДНК-последовательностью. ДНК может быть одноцепочечной или двухцепочечной. В двухцепочечной форме нуклеотиды первой цепи, как правило, гибридизуются с нуклеотидами второй цепи, например, путем спаривания оснований А/Т и спаривания оснований G/C.DNA: DNA is the common abbreviation for deoxyribonucleic acid. It is a nucleic acid molecule, i.e. a polymer made up of nucleotides. These nucleotides are typically deoxyadenosine monophosphate, deoxythymidine monophosphate, deoxyguanosine monophosphate and deoxycytidine monophosphate monomers, which themselves consist of a sugar moiety (deoxyribose), a base moiety and a phosphate moiety, and form polymers with a characteristic backbone structure. The framework structure, as a rule, is formed by phosphodiester bonds between the sugar fragment of the nucleotide, i.e. deoxyribose, the first monomer and a phosphate fragment of the second adjacent monomer. The specific order of the monomers, i.e. the order of bases linked to the sugar/phosphate backbone is called the DNA sequence. DNA can be single stranded or double stranded. In the double stranded form, first strand nucleotides typically hybridize to second strand nucleotides, for example, by A/T base pairing and G/C base pairing.

Эпитоп: Эпитопы (которые называют также «антигенными детерминантами») можно подразделить на Т-клеточные эпитопы и В-клеточные эпитопы. В контексте настоящего изобретения Т-клеточные эпитопы или части белков могут содержать фрагменты, предпочтительно имеющие длину от примерно 6 до примерно 20 аминокислот или даже более, например, фрагменты, процессируемые и презентируемые молекулами ГКГС класса I, предпочтительно имеют длину от примерно 8 до примерно 10 аминокислот, например, 8, 9 или 10, (или даже 11 или 12 аминокислот), или фрагменты, процессируемые и презентируемые молекулами ГКГС класса II, предпочтительно имеют длину примерно 13 аминокислот или более, например, 13, 14, 15, 16, 17, 18, 19, 20 или даже большее количество аминокислот, при этом указанные фрагменты можно выбирать из любой части аминокислотной последовательности. Указанные фрагменты, как правило, распознаются Т-клетками в форме комплекса, состоящего из пептидного фрагмента и молекулы ГКГС, т.е. фрагменты, как правило, не распознаются в их нативной форме. В-клеточные эпитопы, как правило, представляют собой фрагменты, локализованные на внешней поверхности (нативных) белковых или пептидных антигенов, указанных в настоящем описании, предпочтительно состоящих из 5-15 аминокислот, более предпочтительно состоящих из 5-12 аминокислот, еще более предпочтительно состоящих из 6-9 аминокислот, которые могут распознаваться антителами, т.е. в их нативной форме.Epitope: Epitopes (also referred to as "antigenic determinants") can be divided into T-cell epitopes and B-cell epitopes. In the context of the present invention, T-cell epitopes or portions of proteins may contain fragments, preferably having a length of from about 6 to about 20 amino acids or even more, for example, fragments processed and presented by MHC class I molecules, preferably have a length of from about 8 to about 10 amino acids, e.g. 8, 9 or 10, (or even 11 or 12 amino acids), or fragments processed and presented by MHC class II molecules are preferably about 13 amino acids or more in length, e.g. 13, 14, 15, 16, 17 , 18, 19, 20, or even more amino acids, and these fragments can be selected from any part of the amino acid sequence. These fragments are usually recognized by T cells in the form of a complex consisting of a peptide fragment and an MHC molecule, i.e. fragments are generally not recognized in their native form. B-cell epitopes are typically fragments located on the outer surface of the (native) protein or peptide antigens described herein, preferably consisting of 5-15 amino acids, more preferably consisting of 5-12 amino acids, even more preferably consisting of of 6-9 amino acids that can be recognized by antibodies, i.e. in their native form.

Такие эпитопы белков или пептидов можно, кроме того, выбирать из любых указанных вариантов таких белков или пептидов. В этом контексте антигенные детерминанты могут представлять собой конформационные или прерывистые эпитопы, состоящие из сегментов указанных в настоящем описании белков или пептидов, которые расположены с перерывами в аминокислотной последовательности белков или пептидов, указанных в настоящем описании, но которые находятся вблизи друг от друга в трехмерной структуре, или непрерывные или линейные эпитопы, состоящие из одной полипептидной цепи.Such protein or peptide epitopes may furthermore be selected from any of the recited variants of such proteins or peptides. In this context, antigenic determinants may be conformational or discontinuous epitopes consisting of segments of proteins or peptides as defined herein that are located at intervals in the amino acid sequence of proteins or peptides as described herein, but which are close to each other in a three-dimensional structure. , or continuous or linear epitopes consisting of a single polypeptide chain.

Фрагмент последовательности: фрагмент последовательности, как правило, представляет собой укороченный участок полноразмерной последовательности, например, молекулы нуклеиновой кислоты или аминокислотной последовательности. Следовательно, фрагмент, как правило, состоит из последовательности, которая идентична соответствующему сегменту полноразмерной последовательности. В контексте настоящего изобретения предпочтительный фрагмент последовательности состоит из непрерывного сегмента, содержащего такие элементы, как нуклеотиды или аминокислоты, который соответствует непрерывному состоящему из указанных элементов сегменту молекулы, из которой происходит фрагмент, длина которого составляет по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, и наиболее предпочтительно по меньшей мере 80% от всей (т.е. полноразмерной) молекулы, из которой происходит фрагмент.Sequence Fragment: A sequence fragment is typically a shortened portion of a full-length sequence, such as a nucleic acid molecule or an amino acid sequence. Therefore, a fragment typically consists of a sequence that is identical to the corresponding segment of the full-length sequence. In the context of the present invention, a preferred sequence fragment consists of a contiguous segment containing elements such as nucleotides or amino acids, which corresponds to a contiguous segment of these elements of the molecule from which the fragment is derived, the length of which is at least 30%, more preferably at least 40%, more preferably at least 50%, even more preferably at least 60%, even more preferably at least 70%, and most preferably at least 80% of the total (i.e. full length) molecule from which fragment occurs.

G/C-модифицированная: G/C-модифицированная нуклеиновая кислота, как правило, может представлять собой нуклеиновую кислоту, предпочтительно молекулу РНК, указанную в настоящем описании, созданную на основе модифицированной последовательности дикого типа, которая содержит предпочтительно повышенное количество гуанозиновых и/или цитозиновых нуклеотидов по сравнению с последовательностью дикого типа. Для получения указанного повышенного количества можно осуществлять замену кодонов, содержащих аденозиновые или тимидиновые нуклеотиды, на кодоны, содержащие гуанозиновые или цитозиновые нуклеотиды. При повышенном содержании G/C в кодирующей области ДНК или РНК, при заменах можно использовать вырожденность генетического кода. Таким образом, замены кодонов предпочтительно не изменяют кодируемые аминокислотные остатки, но исключительно увеличивают содержание G/C в молекуле нуклеиновой кислоты.G/C-modified: G/C-modified nucleic acid, as a rule, can be a nucleic acid, preferably an RNA molecule, specified in the present description, created on the basis of a modified wild-type sequence, which preferably contains an increased amount of guanosine and/or cytosine nucleotides compared to the wild type sequence. To obtain this increased number, it is possible to carry out the replacement of codons containing adenosine or thymidine nucleotides with codons containing guanosine or cytosine nucleotides. With an increased content of G / C in the coding region of DNA or RNA, the degeneracy of the genetic code can be used for substitutions. Thus, codon changes preferably do not change the encoded amino acid residues, but only increase the G/C content of the nucleic acid molecule.

Генная терапия: Генная терапия, как правило, может представлять собой лечение организма пациента или выделенных элементов организма пациента, например, выделенных тканей/клеток, с помощью нуклеиновых кислот, кодирующих пептид или белок. Как правило, она может включать по меньшей мере одну из следующих стадий а) введение нуклеиновой кислоты, предпочтительно молекулы РНК, указанной в настоящем описании, непосредственно пациенту - любым путем введения - либо in vitro в выделенные клетки/ткани пациента, что приводит к трансфекции клеток пациента, либо in vivo/ex vivo, либо in vitro; б) транскрипция и/или трансляция интродуцированной молекулы нуклеиновой кислоты; и необязательно в) повторное введение выделенных трансфектированных клеток пациенту, если нуклеиновую кислоту не вводили непосредственно пациенту.Gene Therapy: Gene therapy can generally be the treatment of a patient's body or isolated elements of the patient's body, eg, isolated tissues/cells, with nucleic acids encoding a peptide or protein. Typically, it may include at least one of the following steps a) introducing a nucleic acid, preferably an RNA molecule, as defined herein, directly to a patient - by any route of administration - or in vitro into isolated cells/tissues of a patient, resulting in transfection of the cells patient, either in vivo/ex vivo or in vitro; b) transcription and/or translation of the introduced nucleic acid molecule; and optionally c) re-administering the isolated transfected cells to the patient if the nucleic acid was not administered directly to the patient.

Генетическая вакцинация: Генетическая вакцинация, как правило, может представлять собой вакцинацию, осуществляемую путем введения молекулы нуклеиновой кислоты, кодирующей антиген или иммуноген или его фрагмент. Молекулу нуклеиновой кислоты можно вводить в организм индивидуума или в выделенные клетки индивидуума. После трансфекции определенных клеток организма или после трансфекции выделенных клеток антиген или иммуноген может экспрессироваться указанными клетками и затем презентоваться иммунной системе, вызывая адаптивный, т.е. антигенспецифический иммунный ответ. Таким образом, генетическая вакцинация, как правило, включает по меньшей мере одну из следующих стадий: а) введение нуклеиновой кислоты, предпочтительно искусственной молекулы нуклеиновой кислоты, указанной в настоящем описании, индивидууму, предпочтительно пациенту, или в выделенные клетки индивидуума, предпочтительно пациента, что обычно приводит к трансфекции клеток индивидуума in vivo или in vitro; б) транскрипцию и/или трансляцию интродуцированной молекулы нуклеиновой кислоты; и необязательно в) повторное введение выделенных трансфектированных клеток индивидууму, предпочтительно пациенту, если нуклеиновую кислоту не вводили непосредственно пациенту.Genetic vaccination: Genetic vaccination, as a rule, can be a vaccination carried out by introducing a nucleic acid molecule encoding an antigen or immunogen, or a fragment thereof. The nucleic acid molecule can be introduced into the body of an individual or into isolated cells of an individual. After transfection of certain cells of the body or after transfection of isolated cells, the antigen or immunogen can be expressed by these cells and then presented to the immune system, causing an adaptive, i. antigen-specific immune response. Thus, genetic vaccination typically comprises at least one of the following steps: a) introducing a nucleic acid, preferably an artificial nucleic acid molecule as defined herein, into an individual, preferably a patient, or into isolated cells of an individual, preferably a patient, which usually results in transfection of the individual's cells in vivo or in vitro; b) transcription and/or translation of the introduced nucleic acid molecule; and optionally c) re-administering the isolated transfected cells to an individual, preferably a patient, if the nucleic acid was not administered directly to the patient.

Гетерологичная последовательность: Как правило, считается, что две последовательности являются «гетерологичными», если они не происходят из одного и того же гена. Это означает, что, хотя гетерологичные последовательности могут происходить из одного и того же организма, они в естественных условиях (в природе) не встречаются в одной и той же молекуле, например, в одной и той же мРНК.Heterologous sequence: Generally, two sequences are considered to be "heterologous" if they do not come from the same gene. This means that although heterologous sequences may originate from the same organism, they do not naturally occur in the same molecule, for example, in the same mRNA.

Гуморальный иммунитет/гуморальный иммунный ответ: Гуморальный иммунитет, как правило, относится к производству антител и необязательно к второстепенным процессам, которые могут сопровождать его. Гуморальный иммунный ответ, как правило, может характеризоваться, например, активацией Th2 и производством цитокинов, образованием зародышевого центра и переключением изотипа, созреванием аффинности и образованием клеток памяти. Гуморальный иммунитет, как правило, может относиться также к эффекторным функциям антител, включая нейтрализацию патогенов и токсинов, классическую активацию комплемента и стимулирование опсонинами фагоцитоза и элиминации патогенов.Humoral Immunity/Humoral Immune Response: Humoral immunity generally refers to the production of antibodies and not necessarily the secondary processes that may accompany it. The humoral immune response can typically be characterized by, for example, Th2 activation and cytokine production, germinal center formation and isotype switching, affinity maturation, and memory cell formation. Humoral immunity, as a rule, can also refer to the effector functions of antibodies, including the neutralization of pathogens and toxins, classical complement activation, and the stimulation of phagocytosis and elimination of pathogens by opsonins.

Иммуноген: В контексте настоящего изобретения под иммуногеном, как правило, понимают соединение, которое обладает способностью стимулировать иммунный ответ. Предпочтительно иммуноген представляет собой пептид, полипептид или белок. В наиболее предпочтительном варианте осуществления изобретения иммуноген в контексте настоящего изобретения представляет собой продукт трансляции применяемой молекулы нуклеиновой кислоты, предпочтительно искусственной молекулы нуклеиновой кислоты, указанной в настоящем описании. Как правило, иммуноген вызывает по меньшей мере адаптивный иммунный ответ.Immunogen: In the context of the present invention, an immunogen is generally understood to mean a compound that has the ability to stimulate an immune response. Preferably the immunogen is a peptide, polypeptide or protein. In the most preferred embodiment of the invention, the immunogen in the context of the present invention is a translation product of the nucleic acid molecule used, preferably the artificial nucleic acid molecule referred to in the present description. Typically, the immunogen elicits at least an adaptive immune response.

Иммуностимулирующая композиция: В контексте изобретения иммуностимулирующая композиция, как правило, может представлять собой композицию, содержащую по меньшей мере один компонент, который обладает способностью индуцировать иммунный ответ или из которого может происходить компонент, обладающий способностью индуцировать иммунный ответ. Такой иммунный ответ предпочтительно может представлять собой врожденный иммунный ответ или комбинацию адаптивного и врожденного иммунного ответа. В контексте настоящего описания иммуностимулирующая композиция предпочтительно содержит по меньшей мере одну искусственную молекулу нуклеиновой кислоты, более предпочтительно РНК, например, молекулу мРНК. Иммуностимулирующий компонент, такой как мРНК, может находиться в составе комплекса с пригодным носителем. Таким образом, иммуностимулирующая композиция может содержать комплекс мРНК/носитель. Кроме того, иммуностимулирующая композиция может содержать адъювант и/или пригодный наполнитель для иммуностимулирующего компонента, такого как мРНК.Immunostimulatory composition: In the context of the invention, an immunostimulatory composition can generally be a composition containing at least one component that has the ability to induce an immune response or from which a component that has the ability to induce an immune response can be derived. Such an immune response may preferably be an innate immune response or a combination of an adaptive and an innate immune response. In the context of the present description, the immunostimulatory composition preferably contains at least one artificial nucleic acid molecule, more preferably RNA, for example, an mRNA molecule. An immunostimulatory component, such as mRNA, may be complexed with a suitable carrier. Thus, the immunostimulatory composition may comprise an mRNA/carrier complex. In addition, the immunostimulatory composition may contain an adjuvant and/or a suitable excipient for the immunostimulatory component, such as mRNA.

Иммунный ответ: Иммунный ответ может, как правило, представлять собой либо специфическую реакцию адаптивной иммунной системы на конкретный антиген (так называемый специфический или адаптивный иммунный ответ), либо неспецифическую реакцию врожденной иммунной системы (так называемый неспецифический или врожденный иммунный ответ).Immune Response: An immune response can generally be either a specific reaction of the adaptive immune system to a particular antigen (so-called specific or adaptive immune response) or a non-specific reaction of the innate immune system (so-called non-specific or innate immune response).

Иммунная система: Иммунная система может защищать организмы от инфекции. Если патогену удалось преодолеть физический барьер организма и попасть в указанный организм, то врожденная иммунная система обеспечивает немедленный, но неспецифический ответ. Если патоген ускользает от этого врожденного ответа, у позвоночных имеется второй уровень защиты, представляющий собой адаптивную иммунную систему. В этом случае иммунная система адаптирует свой ответ в процессе инфекции для улучшения распознавания патогена. Затем этот улучшенный ответ сохраняется после элиминации патогена в форме иммунологической памяти и позволяет адаптивной иммунной системе организовывать более быстрые и сильные атаки каждый раз при проникновении указанного патогена. Таким образом, иммунная система включает врожденную и адаптивную иммунную систему. Каждая из этих двух частей, как правило, включает так называемые гуморальный и клеточный компоненты.Immune System: The immune system can protect organisms from infection. If the pathogen has managed to overcome the physical barrier of the organism and enter the specified organism, then the innate immune system provides an immediate, but non-specific response. If the pathogen eludes this innate response, vertebrates have a second layer of defense, which is the adaptive immune system. In this case, the immune system adapts its response during infection to improve recognition of the pathogen. This improved response is then stored after elimination of the pathogen in the form of an immunological memory and allows the adaptive immune system to mount faster and stronger attacks each time that pathogen enters. Thus, the immune system includes the innate and adaptive immune systems. Each of these two parts, as a rule, includes the so-called humoral and cellular components.

Иммуностимулирующая РНК: Иммуностимулирующая РНК (isPHK) в контексте изобретения, как правило, может представлять собой РНК, которая обладает способностью индуцировать врожденный иммунный ответ. Обычно она не имеет открытой рамки считывания и, таким образом, не кодирует пептид-антиген или иммуноген, но вызывает иммунный ответ, например, посредством связывания со специфическим типом Толл-подобного рецептора (TLR) или другими приемлемыми рецепторами. Однако, естественно, также и мРНК, имеющие открытую рамку считывания и кодирующие пептид/белок, могут индуцировать врожденный иммунный ответ и, следовательно, могут являться иммуностимулирующими РНК.Immunostimulatory RNA: Immunostimulatory RNA (isRNA) in the context of the invention, as a rule, can be an RNA that has the ability to induce an innate immune response. It usually does not have an open reading frame and thus does not encode an antigen peptide or immunogen, but elicits an immune response, for example by binding to a specific type of Toll-like receptor (TLR) or other suitable receptors. However, of course, also mRNAs having an open reading frame and encoding a peptide/protein can induce an innate immune response and can therefore be immunostimulatory RNAs.

Врожденная иммунная система: Врожденная иммунная система, которую называют также неспецифической иммунной системой, как правило, включает клетки и механизмы, которые неспецифически защищают хозяина от заражения другими организмами. Это означает, что клетки врожденной системы могут распознавать патогены и реагировать на них обычным путем, но, в отличие от адаптивной иммунной системы, она не обеспечивает долговременный или защитный иммунитет хозяину. Врожденная иммунная система может, например, активироваться лигандами патоген-ассоциированных распознающих молекулярные паттерны (РАМР) рецепторов, например, Толл-подобных рецепторов (TLR), или другими вспомогательными субстанциями, такими как липополисахариды, TNF-альфа, лиганд CD40 или цитокины, монокины, лимфокины, интерлейкины или хемокины, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL-24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-альфа, IFN-бета, IFN-гамма, GM-CSF, G-CSF, M-CSF, LT-бета, TNF-альфа, факторы роста и hGH, лиганд человеческого Толл-подобного рецептора TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, лиганд мышиного Толл-подобного рецептора TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12 или TLR13, лиганд NOD-подобного рецептора, лиганд RIG-I-подобного рецептора, иммуностимулирующая нуклеиновая кислота, иммуностимулирующая РНК (isPHK), CpG-ДНК, антибактериальный агент или противовирусный агент. Как правило, ответ врожденной иммунной системы включает рекрутинг иммунных клеток к областям заражения посредством производства химических факторов, включая специализированные химические медиаторы, которые называют цитокинами; активацию каскада комплемента; идентификацию и удаление чужих субстанций, присутствующих в органах, тканях, крови и лимфе, специализированными лейкоцитами; активацию адаптивной иммунной системы посредством процесса, известного как презентация антигена; и/или функционирование в качестве физического и химического барьера для инфекционных агентов.Innate immune system: The innate immune system, also referred to as the non-specific immune system, typically includes cells and mechanisms that non-specifically protect the host from infection by other organisms. This means that the cells of the innate system can recognize and respond to pathogens in the usual way, but, unlike the adaptive immune system, it does not provide long-term or protective immunity to the host. The innate immune system can, for example, be activated by ligands of pathogen-associated molecular pattern recognition (PAMP) receptors, such as Toll-like receptors (TLRs), or other accessory substances such as lipopolysaccharides, TNF-alpha, CD40 ligand, or cytokines, monokines, lymphokines, interleukins or chemokines, IL-1, IL-2, IL-3, IL-4, IL-5, IL-6, IL-7, IL-8, IL-9, IL-10, IL-11, IL-12, IL-13, IL-14, IL-15, IL-16, IL-17, IL-18, IL-19, IL-20, IL-21, IL-22, IL-23, IL- 24, IL-25, IL-26, IL-27, IL-28, IL-29, IL-30, IL-31, IL-32, IL-33, IFN-alpha, IFN-beta, IFN-gamma, GM-CSF, G-CSF, M-CSF, LT-beta, TNF-alpha, growth factors and hGH, human Toll-like receptor ligand TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10 , mouse Toll-like receptor ligand TLR1, TLR2, TLR3, TLR4, TLR5, TLR6, TLR7, TLR8, TLR9, TLR10, TLR11, TLR12, or TLR13, NOD-like receptor ligand, RIG-I-like receptor ligand, immunostimulatory nucleic acid that is, an immunostimulatory RNA (isRNA), CpG DNA, an antibacterial agent, or an antiviral agent. Typically, the response of the innate immune system involves the recruitment of immune cells to areas of infection through the production of chemical factors, including specialized chemical mediators called cytokines; activation of the complement cascade; identification and removal of foreign substances present in organs, tissues, blood and lymph by specialized leukocytes; activation of the adaptive immune system through a process known as antigen presentation; and/or functioning as a physical and chemical barrier to infectious agents.

Сайт клонирования: Под сайтом клонирования, как правило, понимают сегмент молекулы нуклеиновой кислоты, пригодный для встраивания нуклеотидной последовательности, например, нуклеотидной последовательности, содержащей открытую рамку считывания. Встраивание можно осуществлять с помощью любого метода молекулярной биологии, известного специалисту в данной области, например, посредством рестрикции и лигирования. Сайт клонирования, как правило, содержит один или несколько сайтов, распознаваемых рестриктазами (сайты рестрикции). Указанные один или несколько сайтов рестрикции могут распознаваться рестриктазами, расщепляющими ДНК в этих сайтах. Сайт клонирования, который содержит более одного сайта рестрикции, можно обозначать также как множественный сайт клонирования (MCS) или полилинкер.Cloning site: A cloning site is generally understood to mean a segment of a nucleic acid molecule suitable for insertion of a nucleotide sequence, for example a nucleotide sequence containing an open reading frame. Insertion can be accomplished by any molecular biology technique known to one of skill in the art, such as restriction and ligation. The cloning site typically contains one or more sites recognized by restriction enzymes (restriction sites). These one or more restriction sites can be recognized by restriction enzymes that cleave DNA at these sites. A cloning site that contains more than one restriction site may also be referred to as a multiple cloning site (MCS) or polylinker.

Молекула нуклеиновой кислоты: Молекула нуклеиновой кислоты представляет собой молекулу, которая содержит, предпочтительно состоит из компонентов нуклеиновой кислоты. Понятие «молекула нуклеиновой кислоты» предпочтительно относится к молекулам ДНК или РНК. Его предпочтительно применяют в качестве синонима понятия «полинуклеотид». Предпочтительно молекула нуклеиновой кислоты представляет собой полимер, содержащий или состоящий из нуклеотидных мономеров, которые ковалентно связаны друг с другом фосфодиэфирными связями сахарного/фосфатного каркаса. Понятие «нуклеиновая кислота» включает также модифицированные молекулы нуклеиновой кислоты, такие как молекулы ДНК или РНК с модифицированным основанием, модифицированным сахарным фрагментом или модифицированным каркасом.Nucleic acid molecule: A nucleic acid molecule is a molecule that contains, preferably consists of nucleic acid components. The term "nucleic acid molecule" preferably refers to DNA or RNA molecules. It is preferably used as a synonym for the term "polynucleotide". Preferably, the nucleic acid molecule is a polymer containing or consisting of nucleotide monomers that are covalently linked to each other by sugar/phosphate backbone phosphodiester bonds. The term "nucleic acid" also includes modified nucleic acid molecules, such as DNA or RNA molecules with a modified base, a modified sugar moiety, or a modified backbone.

Открытая рамка считывания: Открытая рамка считывания (ОРС) в контексте изобретения, как правило, может представлять собой состоящую из нескольких нуклеотидных триплетов последовательность, которая может транслироваться в пептид или белок. Открытая рамка считывания предпочтительно содержит на своем 5'-конце стартовый кодон, т.е. комбинацию трех последовательно расположенных нуклеотидов, кодирующих, как правило, аминокислоту метионин (ATG или AUG), и следующую за ним область, длина которой, как правило, кратна 3 нуклеотидам. ОРС предпочтительно оканчивается стоп-кодоном (например, ТАА, TAG, TGA). Как правило, в открытой рамке считывания присутствует только один стоп-кодон. Таким образом, открытая рамка считывания в контексте настоящего изобретения предпочтительно представляет собой нуклеотидную последовательность, состоящую из кратного трем количества нуклеотидов, которая начинается стартовым кодоном (например, ATG или AUG), и которая предпочтительно заканчивается стоп-кодоном (например, ТАА, TGA или TAG, или UAA, UAG, UGA соответственно). Открытая рамка считывания может быть выделена или она может быть встроена в более длинную нуклеотидную последовательность, например, в вектор или мРНК. Открытую рамку считывания можно называть также «кодирующей белок областью».Open Reading Frame: An Open Reading Frame (ORF) in the context of the invention can typically be a multiple nucleotide triplet sequence that can be translated into a peptide or protein. The open reading frame preferably contains a start codon at its 5' end, i. e. a combination of three consecutive nucleotides encoding, as a rule, the amino acid methionine (ATG or AUG), and the region following it, the length of which, as a rule, is a multiple of 3 nucleotides. The ORF preferably ends with a stop codon (eg TAA, TAG, TGA). Typically, there is only one stop codon in an open reading frame. Thus, an open reading frame in the context of the present invention is preferably a nucleotide sequence consisting of a multiple of three nucleotides, which begins with a start codon (for example, ATG or AUG), and which preferably ends with a stop codon (for example, TAA, TGA or TAG , or UAA, UAG, UGA respectively). The open reading frame may be isolated or inserted into a longer nucleotide sequence, such as a vector or mRNA. An open reading frame may also be referred to as a "protein coding region".

Пептид: Пептид или полипептид, как правило, представляет собой полимер, состоящий из аминокислотных мономеров, связанных пептидными связями. Он, как правило, содержит менее 50 мономерных звеньев. Однако понятие «пептид» не исключает молекулы, имеющие более 50 мономерных звеньев. Длинные пептиды называют также полипептидами, как правило, они имеют от 50 до 600 мономерных звеньев.Peptide: A peptide or polypeptide is typically a polymer of amino acid monomers linked by peptide bonds. It usually contains less than 50 monomeric units. However, the term "peptide" does not exclude molecules having more than 50 monomeric units. Long peptides are also called polypeptides, as a rule, they have from 50 to 600 monomer units.

Фармацевтически эффективное количество: В контексте изобретения под фармацевтически эффективным количеством, как правило, понимают количество, достаточное для того, чтобы индуцировать фармацевтическое действие, такое как иммунный ответ, измененный патологический уровень экспрессируемого пептида или белка, или замену недостающего генного продукта, например, в случае наличия патологической ситуации.Pharmaceutically effective amount: In the context of the invention, a pharmaceutically effective amount is generally understood to mean an amount sufficient to induce a pharmaceutical effect, such as an immune response, an altered abnormal level of an expressed peptide or protein, or a replacement of a missing gene product, for example, in the case of the presence of a pathological situation.

Белок: Белок, как правило, содержит один или несколько пептидов или полипептидов. Белок, как правило, уложен с образованием 3-мерной структуры, которая может требоваться для проявления биологической функции белка.Protein: A protein typically contains one or more peptides or polypeptides. The protein is typically folded into a 3-dimensional structure, which may be required for the biological function of the protein.

Поли(А)-последовательность: Поли(А)-последовательность, которую называют также поли(А)-хвостом или 3'-поли(А)-хвостом, как правило, представляет собой последовательность адениновых нуклеотидов, содержащую, например, вплоть до примерно 400 аденозиновых нуклеотидов, например, от примерно 25 до примерно 400, предпочтительно от примерно 50 до примерно 400, более предпочтительно от примерно 50 до примерно 300, еще более предпочтительно от примерно 50 до примерно 250, наиболее предпочтительно от примерно 60 до примерно 250 аденозиновых нуклеотидов. Поли(А)-последовательность, как правило, локализована на 3'-конце мРНК. В контексте настоящего изобретения поли(А)-последовательность может быть локализована внутри мРНК или любой другой молекулы нуклеиновой кислоты, например, внутри вектора, например, вектора, служащего в качестве матрицы для создания РНК, предпочтительно мРНК, например, при транскрипции вектора.Poly(A) sequence: A poly(A) sequence, also referred to as a poly(A) tail or 3' poly(A) tail, is generally an adenine nucleotide sequence containing, for example, up to about 400 adenosine nucleotides, e.g., from about 25 to about 400, preferably from about 50 to about 400, more preferably from about 50 to about 300, even more preferably from about 50 to about 250, most preferably from about 60 to about 250 adenosine nucleotides . The poly(A) sequence is typically located at the 3' end of the mRNA. In the context of the present invention, the poly(A) sequence may be located within an mRNA or any other nucleic acid molecule, for example within a vector, for example a vector serving as a template for making an RNA, preferably an mRNA, for example, when the vector is transcribed.

Полиаденилирование: Под полиаденилированием, как правило, понимают добавление поли(А)-последовательности к молекуле нуклеиновой кислоты, такой как молекула РНК, например, незрелая мРНК. Полиаденилирование может индуцироваться так называемым сигналом полиаденилирования. Указанный сигнал предпочтительно локализован в сегменте нуклеотидов на 3'-конце молекулы нуклеиновой кислоты, такой как молекула РНК, подлежащая полиаденилированию. Сигнал полиаденилирования, как правило, содержит гексамер, состоящий из адениновых и/или урациловых/тиминовых нуклеотидов, предпочтительно последовательность гексамера AAUAAA. Также возможны другие последовательности, предпочтительно гексамерные последовательности. Полиаденилирование, как правило, имеет место во время процессинга пре-мРНК (которую называют также незрелой мРНК). Как правило, созревание РНК (превращение пре-мРНК в зрелую мРНК) включает стадию полиаденилирования.Polyadenylation: By polyadenylation is generally meant the addition of a poly(A) sequence to a nucleic acid molecule, such as an RNA molecule, eg immature mRNA. Polyadenylation can be induced by the so-called polyadenylation signal. Said signal is preferably located in a segment of nucleotides at the 3' end of the nucleic acid molecule, such as the RNA molecule to be polyadenylated. The polyadenylation signal typically contains a hexamer consisting of adenine and/or uracil/thymine nucleotides, preferably the hexamer sequence AAUAAA. Other sequences are also possible, preferably hexameric sequences. Polyadenylation typically takes place during the processing of pre-mRNA (also referred to as immature mRNA). Typically, RNA maturation (conversion of pre-mRNA to mature mRNA) includes a polyadenylation step.

Сайт рестрикции: Сайт рестрикции, который называют также как сайт, распознаваемый рестриктазой, представляет собой нуклеотидную последовательность, распознаваемую рестрктазой. Сайт рестрикции, как правило, представляет собой короткую, предпочтительно палиндромную нуклеотидную последовательность, например, последовательность, содержащую от 4 до 8 нуклеотидов. Сайт рестрикции предпочтительно специфически распознается рестриктазой. Рестриктаза, как правило, расщепляет нуклеотидную последовательность, содержащую сайт рестрикции, в этом сайте. В двухцепочечной нуклеотидной последовательности, такой как двухцепочечная последовательность ДНК, рестриктаза, как правило, расщепляет обе цепи нуклеотидной последовательности.Restriction site: A restriction site, also referred to as a restriction enzyme recognition site, is a nucleotide sequence recognized by a restriction enzyme. The restriction site is typically a short, preferably palindromic, nucleotide sequence, such as a sequence of 4 to 8 nucleotides. The restriction site is preferably specifically recognized by the restriction enzyme. The restriction enzyme typically cleaves a nucleotide sequence containing a restriction site at that site. In a double-stranded nucleotide sequence, such as a double-stranded DNA sequence, the restriction enzyme typically cleaves both strands of the nucleotide sequence.

РНК. мРНК: РНК является общепринятым сокращением для рибонуклеиновой кислоты. Она представляет собой молекулу нуклеиновой кислоты, т.е. полимер, состоящий из нуклеотидов. Указанные нуклеотиды представляют собой, как правило, мономеры аденозинмонофосфата, уридинмонофосфата, гуанозинмонофосфата и цитидинмонофосфата, соединенные друг с другом вдоль так называемого каркаса. Каркас формируется с помощью фосфодиэфирных связей между сахаром, т.е. рибозой, первого мономера и фосфатным фрагментом второго смежного мономера. Конкретную последовательность мономеров называют РНК-последовательностью. Как правило, РНК можно получать путем транскрипции ДНК-последовательности, например, внутри клетки. В эукариотических клетках транскрипция, как правило, происходит в ядре или в митохондрии. In vivo транскрипция ДНК, как правило, приводит к образованию так называемой незрелой РНК, которая в результате процессинга должна превратиться в так называемую матричную (информационную) РНК, которую сокращенно обозначают как мРНК. Процессинг незрелой РНК, например, в эукариотических организмах, включает ряд различных пост-транскрипционных модификаций, таких как сплайсинг, 5'-кэпирование, полиаденилирование, экспорт из ядра или митохондрии и т.п. Совокупность указанных процессов называют также созреванием РНК. Зрелая матричная РНК, как правило, представляет собой нуклеотидную последовательность, которая может транслироваться в аминокислотную последовательность конкретного пептида или белка. Как правило, зрелая мРНК содержит 5'-кэп, 5'UTR, открытую рамку считывания, необязательно 3'UTR и поли(А)-последовательность. Помимо матричной РНК существует несколько некодирующих типов РНК, которые могут участвовать в регуляции транскрипции и/или трансляции.RNA. mRNA: RNA is the common abbreviation for ribonucleic acid. It is a nucleic acid molecule, i.e. a polymer made up of nucleotides. Said nucleotides are, as a rule, monomers of adenosine monophosphate, uridine monophosphate, guanosine monophosphate and cytidine monophosphate, connected to each other along the so-called backbone. The framework is formed with the help of phosphodiester bonds between sugars, i.e. ribose, the first monomer and the phosphate fragment of the second adjacent monomer. A particular sequence of monomers is called an RNA sequence. Typically, RNA can be obtained by transcription of a DNA sequence, for example, within a cell. In eukaryotic cells, transcription usually occurs in the nucleus or mitochondria. In vivo transcription of DNA, as a rule, leads to the formation of the so-called immature RNA, which, as a result of processing, must turn into the so-called messenger (messenger) RNA, which is abbreviated as mRNA. Processing of immature RNA, for example in eukaryotic organisms, involves a number of different post-transcriptional modifications such as splicing, 5' capping, polyadenylation, nuclear or mitochondrial export, and the like. The combination of these processes is also called RNA maturation. Mature messenger RNA is typically a nucleotide sequence that can be translated into the amino acid sequence of a particular peptide or protein. Typically, the mature mRNA contains a 5'cap, a 5'UTR, an open reading frame, optionally a 3'UTR, and a poly(A) sequence. In addition to messenger RNA, there are several non-coding types of RNA that may be involved in the regulation of transcription and/or translation.

Последовательность молекулы нуклеиновой кислоты: Под последовательностью молекулы нуклеиновой кислоты, как правило, понимают конкретный и индивидуальный порядок расположения, т.е. последовательный ряд входящих в нее нуклеотидов. Под последовательностью белка или пептида, как правило, понимают порядок расположения, т.е. последовательный ряд входящих в него аминокислот.Sequence of a Nucleic Acid Molecule: Sequence of a nucleic acid molecule is generally understood to mean a specific and individual arrangement, i. a series of nucleotides in it. By the sequence of a protein or peptide, as a rule, is understood the order of arrangement, i. consecutive series of amino acids included in it.

Идентичность последовательности: Две или большее количество последовательностей являются идентичными, если они имеют одинаковую длину и порядок расположения нуклеотидов или аминокислот. Процент идентичности, как правило, характеризует степень идентичности двух последовательностей, т.е. он, как правило, характеризует процент нуклеотидов, которые соответствуют по своему положению идентичным нуклеотидам референс-последовательности. При определении степени идентичности считается, что подлежащие сравнению последовательности имеют одну и ту же длину, т.е. длину наиболее длинной последовательности из подлежащих сравнению последовательностей. Это означает, что первая последовательность, состоящая из 8 нуклеотидов, идентична на 80% второй последовательности, состоящей из 10 нуклеотидов, которая содержит первую последовательность. Другими словами, в контексте настоящего изобретения идентичность последовательностей предпочтительно относится к проценту нуклеотидов в последовательности, которые находятся в одних и тех же положениях в двух или большем количестве последовательностей, имеющих одинаковую длину. При сравнительном анализе первичной структуры последовательностей бреши обычно рассматривают как неидентичные положения безотносительно к их действительному положению.Sequence Identity: Two or more sequences are identical if they are the same length and nucleotide or amino acid order. Percent identity generally characterizes the degree of identity between two sequences, i.e. it usually characterizes the percentage of nucleotides that correspond in position to identical nucleotides in the reference sequence. When determining the degree of identity, the sequences to be compared are considered to be of the same length, i.e. the length of the longest sequence of the sequences to be compared. This means that the first 8 nucleotide sequence is 80% identical to the second 10 nucleotide sequence that contains the first sequence. In other words, in the context of the present invention, sequence identity preferably refers to the percentage of nucleotides in a sequence that are in the same positions in two or more sequences that are the same length. In a comparative analysis of the primary structure of sequences, gaps are usually considered as non-identical positions, regardless of their actual position.

Стабилизированная молекула нуклеиновой кислоты: Стабилизированная молекула нуклеиновой кислоты представляет собой молекулу нуклеиновой кислоты, предпочтительно молекулу ДНК или РНК, модифицированную таким образом, чтобы она обладала большей стабильностью к расщеплению или разрушению, например, факторами окружающей среды, или ферментативному расщеплению, такому как расщепление экзо- или эндонуклеазами, чем молекула нуклеиновой кислоты без модификации. Предпочтительно стабилизированная молекула нуклеиновой кислоты в контексте настоящего изобретения является стабилизированной в клетке, такой как прокариотическая или эукариотическая клетка, предпочтительно в клетке млекопитающего, такой как человеческая клетка. Стабилизирующее действие можно оказывать также вне клеток, например, в буферном растворе и т.д., например, в процессе производства фармацевтической композиции, которая содержит стабилизированную молекулу нуклеиновой кислоты.Stabilized Nucleic Acid Molecule: A stabilized nucleic acid molecule is a nucleic acid molecule, preferably a DNA or RNA molecule, modified to be more resistant to cleavage or degradation, for example by environmental factors, or to enzymatic cleavage, such as cleavage of exo- or endonucleases than the nucleic acid molecule without modification. Preferably, the stabilized nucleic acid molecule in the context of the present invention is stabilized in a cell, such as a prokaryotic or eukaryotic cell, preferably in a mammalian cell, such as a human cell. The stabilizing effect can also be exerted outside the cells, for example in a buffer solution, etc., for example during the production of a pharmaceutical composition which contains a stabilized nucleic acid molecule.

Трансфекция: Понятие «трансфекция» относится к интродукции молекул нуклеиновой кислоты, таких как молекулы ДНК или РНК (например, мРНК), в клетки, предпочтительно в эукариотические клетки. В контексте настоящего изобретения под понятие «трансфекция» подпадает любой известный специалисту в данной области метод интродукции молекул нуклеиновой кислоты в клетки, предпочтительно в эукариотические клетки, такие как клетки млекопитающих. Такие методы включают, например, электропорацию, липофекцию, например, на основе катионных липидов и/или липосом, осаждение фосфатом кальция, трансфекцию на основе наночастиц, трансфекцию на основе вирусов или трансфекцию на основе катионных полимеров, таких как ДЭАЭ-декстран или полиэтиленимин, и т.д. Предпочтительно интродукцию осуществляют без использования вирусов.Transfection: The term "transfection" refers to the introduction of nucleic acid molecules, such as DNA or RNA (eg mRNA) molecules, into cells, preferably eukaryotic cells. In the context of the present invention, "transfection" refers to any method known to the person skilled in the art for introducing nucleic acid molecules into cells, preferably eukaryotic cells, such as mammalian cells. Such methods include, for example, electroporation, lipofection, for example, based on cationic lipids and/or liposomes, calcium phosphate precipitation, nanoparticle-based transfection, virus-based transfection, or transfection based on cationic polymers, such as DEAE-dextran or polyethyleneimine, and etc. Preferably, the introduction is carried out without the use of viruses.

Вакцина: Под вакциной, как правило, понимают предназначенный для профилактики или терапии продукт, содержащий по меньшей мере один антиген, предпочтительно иммуноген. Антиген или иммуноген может иметь происхождение из любого материала, пригодного для вакцинации. Например, антиген или иммуноген может происходить из патогена, такого как бактерии или вирусные частицы и т.д., или из опухолевой или раковой ткани. Антиген или иммуноген стимулирует адаптивную иммунную систему организма вырабатывать адаптивный иммунный ответ.Vaccine: A vaccine is generally understood to mean a prophylactic or therapeutic product containing at least one antigen, preferably an immunogen. The antigen or immunogen may be derived from any material suitable for vaccination. For example, the antigen or immunogen may be derived from a pathogen such as bacteria or viral particles, etc., or from a tumor or cancer tissue. The antigen or immunogen stimulates the body's adaptive immune system to produce an adaptive immune response.

Вектор: Понятие «вектор» относится к молекуле нуклеиновой кислоты, предпочтительно к искусственной молекуле нуклеиновой кислоты. В контексте настоящего изобретения вектор можно применять для встраивания или хранения требуемой нуклеотидной последовательности, такой как нуклеотидная последовательность, содержащая открытую рамку считывания. Таким векторы могут представлять собой векторы для хранения, экспрессионные векторы, клонирующие векторы, векторы для переноса и т.д. Вектор для хранения представляет собой вектор, который позволяет удобно хранить молекулу нуклеиновой кислоты, например, молекулу мРНК. Так, вектор может содержать последовательность, соответствующую, например, требуемой последовательности мРНК или ее части, такой как последовательность, соответствующая открытой рамке считывания и 3'-UTR мРНК. Экспрессионный вектор можно применять для производства продуктов экспрессии, таких как РНК, например, мРНК, или пептиды, полипептиды или белки. Например, экспрессионный вектор может содержать последовательности, необходимые для транскрипции сегмента последовательности вектора, такой как промоторная последовательность, например, промоторная последовательность РНК-полимеразы. Клонирующий вектор, как правило, представляет собой вектор, который содержит сайт клонирования, который можно применять для встраивания нуклеотидных последовательностей в вектор. Клонирующий вектор может представлять собой, например, плазмидный вектор или вектор на основе бактериофага. Вектор для переноса может представлять собой вектор, который пригоден для переноса молекул нуклеиновой кислоты в клетки или организмы, например, вирусные векторы. В контексте настоящего изобретения вектор может представлять собой, например, РНК-вектор или ДНК-вектор. Предпочтительно вектор представляет собой молекулу ДНК. В контексте настоящего описания предпочтительно вектор содержит сайт клонирования, маркер для селекции, такой как фактор, обусловливающий устойчивость к антибиотикам, и последовательность, пригодную для размножения вектора, такую как сайт инициации репликации. В контексте настоящего описания предпочтительно вектор представляет собой плазмидный вектор.Vector: The term "vector" refers to a nucleic acid molecule, preferably an artificial nucleic acid molecule. In the context of the present invention, a vector can be used to insert or store a desired nucleotide sequence, such as a nucleotide sequence containing an open reading frame. Such vectors may be storage vectors, expression vectors, cloning vectors, transfer vectors, and the like. A storage vector is a vector that allows convenient storage of a nucleic acid molecule, such as an mRNA molecule. Thus, the vector may contain a sequence corresponding to, for example, the desired mRNA sequence or a portion thereof, such as the sequence corresponding to the open reading frame and 3' UTR of the mRNA. An expression vector can be used to produce expression products such as RNA, eg mRNA, or peptides, polypeptides or proteins. For example, the expression vector may contain sequences necessary for transcription of a segment of the vector's sequence, such as a promoter sequence, such as an RNA polymerase promoter sequence. A cloning vector is typically a vector that contains a cloning site that can be used to insert nucleotide sequences into the vector. The cloning vector may be, for example, a plasmid vector or a bacteriophage-based vector. The transfer vector may be a vector that is suitable for transferring nucleic acid molecules into cells or organisms, such as viral vectors. In the context of the present invention, the vector may be, for example, an RNA vector or a DNA vector. Preferably the vector is a DNA molecule. In the context of the present description, preferably the vector contains a cloning site, a selection marker, such as an antibiotic resistance factor, and a sequence suitable for propagating the vector, such as an origin of replication. In the context of the present description, preferably the vector is a plasmid vector.

Наполнитель: Под наполнителем, как правило, понимают материал, пригодный для хранения, транспортирования и/или введения соединения, такого как фармацевтически активное соединение. Он может представлять собой, например, физиологически приемлемую жидкость, пригодную для хранения, транспортирования и/или введения соединения, такого как фармацевтически активное соединение.Excipient: An excipient is generally understood to mean a material suitable for storing, transporting and/or administering a compound, such as a pharmaceutically active compound. It may be, for example, a physiologically acceptable liquid suitable for storing, transporting and/or administering a compound, such as a pharmaceutically active compound.

3'-нетранслируемая область (3'UTR): 3'UTR, как правило, является частью искусственной молекулы нуклеиновой кислоты, которая локализована с 3'-стороны (т.е. в прямом направлении) относительно открытой рамки считывания и которая не транслируется в белок. Как правило, 3'UTR представляет собой часть мРНК, которая локализована между кодирующей белок областью (открытой рамкой считывания (ОРС) или кодирующей последовательностью (CDS)) и поли(А)-последовательностью мРНК. В контексте изобретения понятие «3 'UTR» может включать также элементы, которые не кодируются в матрице, с которой транскрибируется РНК, но которые добавляются после транскрипции в процессе созревания, например, поли(А)-последовательность. 3'UTR мРНК не транслируется в аминокислотную последовательность. Последовательность 3'UTR, как правило, кодируется геном, который транскрибируется в соответствующую мРНК в процессе экспрессии гена. Геномная последовательность сначала транскрибируется в незрелую мРНК, которая содержит необязательные интроны. Незрелая мРНК затем дополнительно процессируется с образованием зрелой мРНК в процессе созревания. Указанный процесс созревания включает стадии 5'-кэпирования, сплайсинга незрелой мРНК с вырезанием необязательных интронов и модификаций 3'-конца, таких как полиаденилирование 3'-конца незрелой мРНК, и необязательные расщепления эндо-/или экзонуклеазами и т.д. В контексте настоящего изобретения 3'UTR соответствует последовательности зрелой мРНК, которая локализована между стоп-кодоном кодирующей области белка, предпочтительно непосредственно примыкает с 3'-стороны к стоп-кодону кодирующей белок области, и поли(А)-последовательностью мРНК. Понятие «соответствует» означает, что последовательность 3'UTR может представлять собой последовательность РНК, такую как в последовательности мРНК, указанной в определении последовательности 3'UTR, или последовательность ДНК, которая соответствует указанной последовательности РНК. В контексте настоящего изобретения понятие «3'UTR гена», например, «3'UTR гена рибосомального белка», означает последовательность, которая соответствует 3'UTR зрелой мРНК, полученной из указанного гена, т.е. мРНК, полученной путем транскрипции гена и созревания незрелой мРНК. Понятие «3'UTR гена» включает последовательность ДНК и последовательность РНК (как смысловую, так и антисмысловую цепи и как зрелые, так и незрелые последовательности) 3'UTR.3'-Untranslated Region (3'UTR): The 3'UTR is typically the portion of an artificial nucleic acid molecule that is located 3'-side (i.e., forward) of the open reading frame and that is not translated into protein. Typically, the 3'UTR is the portion of the mRNA that is located between the protein coding region (open reading frame (ORF) or coding sequence (CDS)) and the mRNA poly(A) sequence. In the context of the invention, the term "3 'UTR" may also include elements that are not encoded in the template from which the RNA is transcribed, but which are added after transcription during maturation, for example, a poly(A) sequence. The 3'UTR mRNA is not translated into an amino acid sequence. The 3'UTR sequence is typically encoded by a gene that is transcribed into the corresponding mRNA during gene expression. The genomic sequence is first transcribed into immature mRNA, which contains optional introns. The immature mRNA is then further processed into mature mRNA during maturation. Said maturation process includes the steps of 5' capping, splicing of the immature mRNA with excision of optional introns and 3' end modifications such as polyadenylation of the 3' end of the immature mRNA, and optional endo-/or exonuclease cleavages, etc. In the context of the present invention, the 3'UTR corresponds to a mature mRNA sequence that is located between the stop codon of the protein coding region, preferably immediately adjacent 3' to the stop codon of the protein coding region, and the mRNA poly(A) sequence. The term "corresponds" means that the 3'UTR sequence may be an RNA sequence, such as in the mRNA sequence specified in the definition of the 3'UTR sequence, or a DNA sequence that corresponds to the specified RNA sequence. In the context of the present invention, the term "3'UTR of a gene", for example, "3'UTR of a ribosomal protein gene", means a sequence that corresponds to the 3'UTR of a mature mRNA derived from said gene, i.e. mRNA obtained by transcription of a gene and maturation of immature mRNA. The term "3'UTR of a gene" includes a DNA sequence and an RNA sequence (both sense and antisense strands and both mature and immature sequences) 3'UTR.

5'-нетранслируемая область (5'UTR): Под 5'UTR, как правило, понимают конкретный сегмент матричной РНК (мРНК). Она локализована с 5'-стороны относительно открытой рамки считывания мРНК. Как правило, 5'UTR начинается с сайта инициации транскрипции и заканчивается за один нуклеотид до стартового кодона открытой рамки считывания. 5'UTR может содержать элементы, предназначенные для контроля генной экспрессии, так называемые регуляторные элементы. Указанные регуляторные элементы могут представлять собой, например, сайты связывания рибосом. 5'UTR может подвергаться посттранскрипционным модификациям, например, путем добавления 5'-кэпа. В контексте настоящего изобретения 5'UTR соответствует последовательности зрелой мРНК, локализованной между 5'-кэпом и стартовым кодоном. Предпочтительно 5'UTR соответствует последовательности, которая простирается от нуклеотида, расположенного с 3'-стороны 5'-кэпа, предпочтительно от расположенного с 3'-стороны нуклеотида, непосредственно примыкающего к 5'-кэпу, до нуклеотида, расположенного с 5'-стороны стартового кодона кодирующей белок области, предпочтительно до нуклеотида, непосредственно примыкающего с 5'-стороны к стартовому кодону кодирующей белок области. Нуклеотид, непосредственно примыкающий с 3'-стороны к 5'-кэпу зрелой мРНК, как правило, соответствует сайту инициации транскрипции. Понятие «соответствует» означает, что последовательность 5'UTR может представлять собой последовательность РНК, такую как в последовательности мРНК, указанной при определении последовательности 5'UTR, или последовательность ДНК, которая соответствует указанной последовательности РНК. В контексте настоящего изобретения понятие «5'UTR гена», например, «5'UTR ТОР-гена», обозначает последовательность, которая соответствует 5'UTR зрелой мРНК, полученной из этого гена, т.е. мРНК, полученной путем транскрипции гена и созревания незрелой мРНК. Понятие «5'UTR гена» включает последовательность ДНК и последовательность РНК 5'UTR. В вариантах осуществления изобретения указанная 5'-UTR может находиться на 5'-конце ОРС. Ее длина, как правило, составляет менее 500, 400, 300, 250 или менее 200 нуклеотидов. В других вариантах осуществления изобретения ее длина может находиться в пределах по меньшей мере от 10, 20, 30 или 40, предпочтительно вплоть до 100 или 150 нуклеотидов.5'-untranslated region (5'UTR): By 5'UTR, as a rule, understand a specific segment of messenger RNA (mRNA). It is located on the 5' side of the mRNA open reading frame. Typically, the 5'UTR starts at the site of transcription initiation and ends one nucleotide before the start codon of the open reading frame. The 5'UTR may contain elements designed to control gene expression, so-called regulatory elements. Said regulatory elements may be, for example, ribosome binding sites. The 5'UTR may be subject to post-transcriptional modifications, for example by adding a 5' cap. In the context of the present invention, the 5'UTR corresponds to the mature mRNA sequence located between the 5' cap and the start codon. Preferably, the 5'UTR corresponds to a sequence that extends from the nucleotide located on the 3' side of the 5' cap, preferably from the 3' side of the nucleotide immediately adjacent to the 5' cap, to the nucleotide located on the 5' side start codon of the protein coding region, preferably up to the nucleotide immediately adjacent on the 5' side of the start codon of the protein coding region. The nucleotide immediately adjacent on the 3' side to the 5' cap of the mature mRNA usually corresponds to the site of transcription initiation. The term "corresponds" means that the 5'UTR sequence may be an RNA sequence, such as in the mRNA sequence specified when determining the 5'UTR sequence, or a DNA sequence that corresponds to the specified RNA sequence. In the context of the present invention, the term "5'UTR of a gene", for example, "5'UTR of the TOP gene", means a sequence that corresponds to the 5'UTR of the mature mRNA derived from this gene, i.e. mRNA obtained by transcription of a gene and maturation of immature mRNA. The term "5'UTR of a gene" includes a DNA sequence and an RNA 5'UTR sequence. In embodiments of the invention, the specified 5'-UTR may be at the 5'end of the ORF. Its length is usually less than 500, 400, 300, 250 or less than 200 nucleotides. In other embodiments of the invention, its length may be in the range of at least 10, 20, 30 or 40, preferably up to 100 or 150 nucleotides.

5'-концевой олигопиримидиновый тракт (ТОР): 5'-концевой олигопиримидиновый тракт (ТОР), как правило, обозначает сегмент пиримидиновых нуклеотидов, локализованный в 5'-концевой области молекулы нуклеиновой кислоты, например, в 5'-концевой области некоторых молекул мРНК или в 5'-концевой области функционального элемента, например, транскрибируемой области некоторых генов. Последовательность начинается с цитидина, который, как правило, соответствует сайту инициации транскрипции, и за которым следует сегмент, как правило, состоящий примерно из 3-30 пиримидиновых нуклеотидов. Например, ТОР может содержать 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30 или даже большее количество нуклеотидов. Пиримидиновый сегмент и, следовательно, 5'-ТОР, заканчивается одним нуклеотидом, расположенным в 5'-направлении относительно первого пуринового нуклеотида, локализованного в прямом направлении относительно ТОР. Матричную РНК, которая содержит 5'-концевой олигопиримидиновый тракт, часто обозначают как ТОР-мРНК. Таким образом, гены, из которых получают указанные матричные РНК, обозначают как ТОР-гены. Последовательности ТОР, например, обнаружены в генах и мРНК, кодирующих пептидные факторы элонгации и рибосомальные белки.5' oligopyrimidine tract (TOR): The 5' oligopyrimidine tract (TOR) generally refers to a segment of pyrimidine nucleotides located at the 5' end of a nucleic acid molecule, such as the 5' end of some mRNA molecules. or in the 5'-terminal region of a functional element, for example, the transcribed region of some genes. The sequence begins with a cytidine, which typically corresponds to the site of transcription initiation, and is followed by a segment typically consisting of about 3-30 pyrimidine nucleotides. For example, TOP can contain 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 , 26, 27, 28, 29, 30 or even more nucleotides. The pyrimidine segment, and hence the 5'-TOP, terminates at one nucleotide located 5'-direction relative to the first purine nucleotide located upstream of the TOP. Messenger RNA that contains the 5' oligopyrimidine tract is often referred to as TOP mRNA. Thus, the genes from which these messenger RNAs are derived are referred to as TOP genes. TOP sequences, for example, are found in genes and mRNAs encoding peptide elongation factors and ribosomal proteins.

ТОР-мотив: В контексте настоящего изобретения ТОР-мотив обозначает нуклеотидную последовательность, которая соответствует 5'-ТОР, описанному выше. Таким образом, ТОР-мотив в контексте настоящего изобретения предпочтительно обозначает состоящий из пиримидиновых нуклеотидов сегмент длиной 3-30 нуклеотидов. Предпочтительно ТОР-мотив состоит по меньшей мере из 3 пиримидиновых нуклеотидов, предпочтительно по меньшей мере 4 пиримидиновых нуклеотидов, предпочтительно по меньшей мере 5 пиримидиновых нуклеотидов, более предпочтительно по меньшей мере 6 нуклеотидов, более предпочтительно по меньшей мере 7 нуклеотидов, наиболее предпочтительно по меньшей мере 8 пиримидиновых нуклеотидов, при этом сегмент пиримидиновых нуклеотидов предпочтительно начинается на его 5'-конце с цитозинового нуклеотида. В ТОР-генах и ТОР-мРНК ТОР-мотив предпочтительно начинается на его 5'-конце с сайта инициации транскрипции и заканчивается на расстоянии одного нуклеотида в 5'-направлении относительно первого пуринового остатка в указанном гене или мРНК. В контексте настоящего изобретения ТОР-мотив предпочтительно локализован на 5'-конце последовательности, которая представляет собой 5'UTR, или на 5'-конце последовательности, которая кодирует 5'UTR. Таким образом, в контексте настоящего изобретения сегмент из 3 или большего количества пиримидиновых нуклеотидов предпочтительно называют «ТОР-мотивом», если сегмент локализован на 5'-конце соответствующей последовательности, такой как мРНК, предлагаемая в изобретении, 5'UTR-элемент мРНК, предлагаемой в изобретении, или нуклеотидная последовательность, которая происходит из 5'UTR ТОР-гена, указанного в настоящем описании. Другими словами, сегмент, состоящий из 3 или большего количества пиримидиновых нуклеотидов, который не локализован на 5'-конце 5'UTR или 5'UTR-элемента, но локализован где-либо внутри 5'UTR или 5'UTR-элемента, предпочтительно не обозначают как «ТОР-мотив».TOP motif: In the context of the present invention, the TOP motif refers to a nucleotide sequence that corresponds to the 5'-TOP described above. Thus, the TOP motif in the context of the present invention preferably denotes a segment consisting of pyrimidine nucleotides of 3-30 nucleotides in length. Preferably the TOP motif consists of at least 3 pyrimidine nucleotides, preferably at least 4 pyrimidine nucleotides, preferably at least 5 pyrimidine nucleotides, more preferably at least 6 nucleotides, more preferably at least 7 nucleotides, most preferably at least 8 pyrimidine nucleotides, with the pyrimidine nucleotide segment preferably beginning at its 5' end with a cytosine nucleotide. In TOP genes and TOP mRNA, the TOP motif preferably starts at its 5' end from the site of transcription initiation and ends one nucleotide away in the 5' direction from the first purine residue in said gene or mRNA. In the context of the present invention, the TOP motif is preferably located at the 5'end of the sequence which is the 5'UTR or at the 5'end of the sequence which encodes the 5'UTR. Thus, in the context of the present invention, a segment of 3 or more pyrimidine nucleotides is preferably referred to as a "TOP motif" if the segment is located at the 5' end of an appropriate sequence such as an mRNA of the invention, the 5'UTR element of an mRNA of the invention in the invention, or a nucleotide sequence that is derived from the 5'UTR of the TOP gene as defined herein. In other words, a segment of 3 or more pyrimidine nucleotides that is not located at the 5' end of the 5'UTR or 5'UTR element, but is located somewhere within the 5'UTR or 5'UTR element, preferably not referred to as "TOP-motive".

ТОР-ген: ТОР-гены. как правило, характеризуются присутствием 5'-концевого олигопримидинового тракта. Кроме того, большинство ТОР-генов характеризуются связанной с ростом регуляцией трансляции. Однако известны также ТОР-гены с тканеспецифической регуляцией трансляции. Как указано выше, 5'UTR ТОР-гена соответствует последовательности 5'UTR зрелой мРНК, происходящей из ТОР-гена, которая предпочтительно простирается от нуклеотида, примыкающего с 3'-стороны к 5'-кэпу, до нуклеотида, примыкающего с 5'-стороны к стартовому кодону. 5'UTR ТОР-гена, как правило, не содержит никаких стартовых кодонов, предпочтительно не содержит расположенных в обратном направлении AUG (uAUG) или расположенных в обратном направлении открытых рамок считывания (uOPC). В данном контексте под расположенными в обратном направлении AUG и расположенными в обратном направлении открытыми рамками считывания, как правило, понимают AUG и открытые рамки считывания, которые находятся в 5'-направлении относительно стартового кодона (AUG) открытой рамки считывания, которая должна транслироваться. 5'UTR ТОР-генов, как правило, являются относительно короткими. Длины 5'UTR ТОР-генов могут варьироваться от 20 нуклеотидов вплоть до 500 нуклеотидов и, как правило, они содержат менее чем примерно 200 нуклеотидов, предпочтительно менее чем примерно 150 нуклеотидов, более предпочтительно менее чем примерно 100 нуклеотидов. Примерами 5'UTR ТОР-генов в контексте настоящего изобретения являются нуклеотидные последовательности, простирающиеся от нуклеотида в положении 5 до нуклеотида, непосредственно примыкающего к 5'-концу стартового кодона (например, ATG), указанные последовательности представлены в SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 14221-1363 заявки на патент PCT/EP 2012/002448 WO 2013/143700 или представляют собой их гомологи или варианты, описание указанных документов включено в настоящее описание в качестве ссылки. В этом контексте наиболее предпочтительным фрагментом 5'UTR ТОР-гена является 5'UTR ТОР-гена без 5'ТОР-мотива. Понятие «5'UTR ТОР-гена» предпочтительно относится к 5'UTR встречающегося в естественных условиях ТОР-гена.TOR gene: TOR genes. typically characterized by the presence of a 5'-terminal oligoprimidine tract. In addition, most TOP genes are characterized by growth-related regulation of translation. However, TOP genes with tissue-specific regulation of translation are also known. As indicated above, the 5'UTR of the TOP gene corresponds to the 5'UTR sequence of the mature mRNA derived from the TOP gene, which preferably extends from the nucleotide adjacent 3'-side of the 5'-cap to the nucleotide adjacent 5'- side to the start codon. The 5'UTR of the TOP gene generally does not contain any start codons, preferably no upstream AUG (uAUG) or upstream open reading frames (uOPC). In this context, reversed AUGs and reversed open reading frames are generally understood to mean AUGs and open reading frames that are 5' from the start codon (AUG) of the open reading frame to be translated. The 5'UTRs of TOP genes tend to be relatively short. The 5'UTR lengths of TOP genes can range from 20 nucleotides up to 500 nucleotides and are typically less than about 200 nucleotides, preferably less than about 150 nucleotides, more preferably less than about 100 nucleotides. Examples of the 5'UTR of TOP genes in the context of the present invention are nucleotide sequences extending from the nucleotide at position 5 to the nucleotide immediately adjacent to the 5' end of the start codon (e.g. ATG), these sequences are shown in SEQ ID NO: 1-1363 , SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 14221-1363 patent applications PCT/EP 2012/002448 WO 2013/143700 or are homologues or variants thereof, the description of these documents is included in this description as links. In this context, the most preferred fragment of the 5'UTR of the TOP gene is the 5'UTR of the TOP gene without the 5'TOP motif. The term "5'UTR of the TOP gene" preferably refers to the 5'UTR of the naturally occurring TOP gene.

Первый объект настоящего изобретения относится к искусственной молекуле нуклеиновой кислоты, содержащейThe first object of the present invention relates to an artificial nucleic acid molecule containing

а. по меньшей мере одну открытую рамку считывания (ОРС); иa. at least one open reading frame (ORF); and

б. по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR-элемент), содержащий или состоящий из нуклеотидной последовательности, которая происходит из 3'-UTR гена рибосомального белка.b. at least one element of the 3'-untranslated region (3'-UTR element) containing or consisting of a nucleotide sequence that is derived from the 3'-UTR of the ribosomal protein gene.

Понятие «3'-UTR-элемент» относится к нуклеотидной последовательности, которая содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR или из варианта 3'-UTR. Понятие «3'-UTR-элемент» предпочтительно относится к нуклеотидной последовательности, которая представляет собой 3'-UTR искусственной нуклеотидной последовательности, такой как искусственная мРНК, или которая кодирует 3'-UTR искусственной молекулы нуклеиновой кислоты. Следовательно, в контексте настоящего изобретения 3'-UTR-элемент предпочтительно может представлять собой 3'-UTR мРНК, предпочтительно искусственной мРНК, или может представлять собой матрицу для транскрипции 3'-UTR мРНК. Так, 3'-UTR-элемент предпочтительно представляет собой нуклеотидную последовательность, которая соответствует 3'-UTR мРНК, предпочтительно 3'-UTR искусственной мРНК, такой как мРНК, полученная в результате транскрипции созданной генетическими методами векторной конструкции. Предпочтительно 3'-UTR-элемент в контексте настоящего изобретения функционирует в качестве 3'-UTR или кодирует нуклеотидную последовательность, которая выполняет функцию 3'-UTR.The term "3'-UTR element" refers to a nucleotide sequence that contains or consists of a nucleotide sequence derived from a 3'-UTR or from a 3'-UTR variant. The term "3'UTR element" preferably refers to a nucleotide sequence which is the 3'UTR of an artificial nucleotide sequence, such as an artificial mRNA, or which encodes the 3'UTR of an artificial nucleic acid molecule. Therefore, in the context of the present invention, the 3'-UTR element may preferably be the 3'-UTR of an mRNA, preferably an artificial mRNA, or may be a template for transcription of the 3'-UTR of an mRNA. Thus, the 3'UTR element is preferably a nucleotide sequence that corresponds to the 3'UTR of an mRNA, preferably the 3'UTR of an artificial mRNA, such as an mRNA obtained by transcription of a genetically engineered vector construct. Preferably, the 3'UTR element in the context of the present invention functions as a 3'UTR or encodes a nucleotide sequence that functions as a 3'UTR.

Понятие «ген рибосомального белка», как правило, относится к гену, кодирующему рибосомальный белок. В контексте настоящего описания это понятие относится к любому гену рибосомального белка независимо от вида, из которого он происходит. Конкретно, понятие относится к гену эукариотического рибосомального белка. Кроме того, в контексте изобретения понятие «ген рибосомального белка» может относиться также к гену, сходному с геном рибосомального белка либо с точки зрения структуры, либо с точки зрения функции. В частности, понятие включает «подобные гену рибосомального белка», псевдогены и гены, обладающие характеристиками последовательности или структуры, прежде всего в их 3'-UTR-области, присущими гену рибосомального белка. Предпочтительно понятие относится к гену рибосомального белка позвоночных, более предпочтительно к гену рибосомального белка млекопитающих, еще более предпочтительно к гену рибосомального белка приматов, прежде всего к гену рибосомального белка человека. Кроме того, понятие «ген рибосомального белка» включает также ген рибосомального белка грызунов, прежде всего ген мышиного рибосомального белка. Примерами генов рибосомального белка в контексте изобретения являются (но, не ограничиваясь только ими) гены рибосомального белка L9 (RPL9), рибосомального белка L3 (RPL3), рибосомального белка L4 (RPL4), рибосомального белка L5 (RPL5), рибосомального белка L6 (RPL6), рибосомального белка L7 (RPL7), рибосомального белка L7a (RPL7A), рибосомального белка L11 (RPL11), рибосомального белка L12 (RPL12), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L18 (RPL18), рибосомального белка L18a (RPL18A), рибосомального белка L19 (RPL19), рибосомального белка L21 (RPL21), рибосомального белка L22 (RPL22), рибосомального белка L23a (RPL23A), рибосомального белка L17 (RPL17), рибосомального белка L24 (RPL24), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L30 (RPL30), рибосомального белка L27a (RPL27A), рибосомального белка L28 (RPL28), рибосомального белка L29 (RPL29), рибосомального белка L31 (RPL31), рибосомального белка L32 (RPL32), рибосомального белка L35a (RPL35A), рибосомального белка L37 (RPL37), рибосомального белка L37a (RPL37A), рибосомального белка L38 (RPL38), рибосомального белка L39 (RPL39), рибосомального белка большой субъединицы, Р0 (RPLP0), рибосомального белка большой субъединицы, Р1 (RPLP1), рибосомального белка, большой субъединицы, Р2 (RPLP2), рибосомального белка S3 (RPS3), рибосомального белка S3A (RPS3A), рибосомального белка S4, Х-сцепленного (RPS4X), рибосомального белка S4, Y-сцепленного 1 (RPS4Y1), рибосомального белка S5 (RPS5), рибосомального белка S6 (RPS6), рибосомального белка S7 (RPS7), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S10 (RPS10), рибосомального белка S11 (RPS11), рибосомального белка S12 (RPS12), рибосомального белка S13 (RPS13), рибосомального белка S15 (RPS15), рибосомального белка S15a (RPS15A), рибосомального белка S16 (RPS16), рибосомального белка S19 (RPS19), рибосомального белка S20 (RPS20), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S25 (RPS25), рибосомального белка S26 (RPS26), рибосомального белка S27 (RPS27), рибосомального белка S27a (RPS27a), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L15 (RPL15), рибосомального белка S2 (RPS2), рибосомального белка L14 (RPL14), рибосомального белка S14 (RPS14), рибосомального белка L10 (RPL10), рибосомального белка L10a (RPL10A), рибосомального белка L35 (RPL35), рибосомального белка L13a (RPL13A), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка L41 (RPL41), рибосомального белка S18 (RPS18), рибосомального белка S24 (RPS24), рибосомального белка L8 (RPL8), рибосомального белка L34 (RPL34), рибосомального белка S17 (RPS17), рибосомального белка SA (RPSA), продукта 1 слияния: остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемому гену (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли (FBR-MuSV), гену рибосомального белка L22-подобного 1 (RPL22L1), рибосомального белка S17 (RPS17), рибосомального белка L39-подобного (RPL39L), рибосомального белкаL10-подобного (RPL10L), рибосомального белка L36a-подобного (RPL36AL), рибосомального белка L3-подобного (RPL3L), рибосомального белка S27-подобного (RPS27L), рибосомального белка L26-подобного 1 (RPL26L1), рибосомального белка L7-подобного 1 (RPL7L1), псевдогена рибосомального белка L13a (RPL13AP), псевдогена 8 рибосомального белка L37a (RPL37AP8), псевдогена 5 рибосомального белка S10 (RPS10P5), псевдогена рибосомального белка 11 S26 (RPS26P11), псевдогена 5 рибосомального белка L39 (RPL39P5), псевдогена 6 рибосомального белка большой субъединицы Р0 (RPLP0P6) и псевдогена 14 рибосомального белка L36 (RPL36P14). Предпочтительно понятие «ген рибосомального белка» относится к одному из вышеуказанных генов, которые происходят из млекопитающих, предпочтительно из Homo sapiens или Mus musculus.The term "ribosomal protein gene" generally refers to a gene encoding a ribosomal protein. In the context of the present description, this concept refers to any ribosomal protein gene, regardless of the species from which it originates. Specifically, the term refers to a eukaryotic ribosomal protein gene. In addition, in the context of the invention, the term "ribosomal protein gene" can also refer to a gene similar to the ribosomal protein gene, either in terms of structure or in terms of function. In particular, the term includes "ribosomal protein gene-like", pseudogenes, and genes having sequence or structure characteristics, primarily in their 3'-UTR region, of a ribosomal protein gene. Preferably, the term refers to a vertebrate ribosomal protein gene, more preferably a mammalian ribosomal protein gene, even more preferably a primate ribosomal protein gene, especially a human ribosomal protein gene. In addition, the term "ribosomal protein gene" also includes a rodent ribosomal protein gene, especially a mouse ribosomal protein gene. Examples of ribosomal protein genes in the context of the invention are (but not limited to) ribosomal protein L9 (RPL9), ribosomal protein L3 (RPL3), ribosomal protein L4 (RPL4), ribosomal protein L5 (RPL5), ribosomal protein L6 (RPL6) genes. ), ribosomal protein L7 (RPL7), ribosomal protein L7a (RPL7A), ribosomal protein L11 (RPL11), ribosomal protein L12 (RPL12), ribosomal protein L13 (RPL13), ribosomal protein L23 (RPL23), ribosomal protein L18 (RPL18) , ribosomal protein L18a (RPL18A), ribosomal protein L19 (RPL19), ribosomal protein L21 (RPL21), ribosomal protein L22 (RPL22), ribosomal protein L23a (RPL23A), ribosomal protein L17 (RPL17), ribosomal protein L24 (RPL24), ribosomal protein L26 (RPL26), ribosomal protein L27 (RPL27), ribosomal protein L30 (RPL30), ribosomal protein L27a (RPL27A), ribosomal protein L28 (RPL28), ribosomal protein L29 (RPL29), ribosomal protein L31 (RPL31), ribosomal o protein L32 (RPL32), ribosomal protein L35a (RPL35A), ribosomal protein L37 (RPL37), ribosomal protein L37a (RPL37A), ribosomal protein L38 (RPL38), ribosomal protein L39 (RPL39), ribosomal protein large subunit, P0 (RPLP0 ), ribosomal large subunit protein, P1 (RPLP1), ribosomal protein, large subunit, P2 (RPLP2), ribosomal protein S3 (RPS3), ribosomal protein S3A (RPS3A), ribosomal protein S4, X-linked (RPS4X), ribosomal protein S4, Y-linked 1 (RPS4Y1), ribosomal protein S5 (RPS5), ribosomal protein S6 (RPS6), ribosomal protein S7 (RPS7), ribosomal protein S8 (RPS8), ribosomal protein S9 (RPS9), ribosomal protein S10 (RPS10) ), ribosomal protein S11 (RPS11), ribosomal protein S12 (RPS12), ribosomal protein S13 (RPS13), ribosomal protein S15 (RPS15), ribosomal protein S15a (RPS15A), ribosomal protein S16 (RPS16), ribosomal protein S19 (RPS19) , ribosomal protein S20 (RPS20), ribosomal ribosomal protein S21 (RPS21), ribosomal protein S23 (RPS23), ribosomal protein S25 (RPS25), ribosomal protein S26 (RPS26), ribosomal protein S27 (RPS27), ribosomal protein S27a (RPS27a), ribosomal protein S28 (RPS28), ribosomal ribosomal protein S29 (RPS29), ribosomal protein L15 (RPL15), ribosomal protein S2 (RPS2), ribosomal protein L14 (RPL14), ribosomal protein S14 (RPS14), ribosomal protein L10 (RPL10), ribosomal protein L10a (RPL10A), ribosomal protein L35 (RPL35), ribosomal protein L13a (RPL13A), ribosomal protein L36 (RPL36), ribosomal protein L36a (RPL36A), ribosomal protein L41 (RPL41), ribosomal protein S18 (RPS18), ribosomal protein S24 (RPS24), ribosomal protein L8 (RPL8), ribosomal protein L34 (RPL34), ribosomal protein S17 (RPS17), ribosomal protein SA (RPSA), fusion product 1: ubiquitin residue A-52-ribosomal protein (UBA52), ubiquitously expressed gene (FAU) of mouse sarcoma virus Finkel-Biskis-Reilly (FBR-MuSV), ribosomal protein L22-like 1 (RPL22L1), ribosomal protein S17 (RPS17), ribosomal protein L39-like (RPL39L), ribosomal protein L10-like (RPL10L), ribosomal protein L36a-like (RPL36AL), ribosomal protein L3-like (RPL3L), ribosomal protein S27-like (RPS27L), ribosomal protein L26-like 1 (RPL26L1), ribosomal protein L7-like 1 (RPL7L1), ribosomal protein L13a pseudogene (RPL13AP), ribosomal protein pseudogene 8 L37a (RPL37AP8), ribosomal protein S10 pseudogene 5 (RPS10P5), ribosomal protein 11 S26 pseudogene (RPS26P11), ribosomal protein L39 pseudogene 5 (RPL39P5), ribosomal protein P0 large subunit pseudogene 6 (RPLP0P6), and ribosomal protein L36 pseudogene 14 (RPL36P14) ). Preferably, the term "ribosomal protein gene" refers to one of the above genes that is derived from mammals, preferably from Homo sapiens or Mus musculus.

Предпочтительно по меньшей мере одна открытая рамка считывания и по меньше мере один 3'-UTR-элемент являются гетерологичными. В контексте настоящего описания понятие «гетерологичный» означает, что два элемента последовательности, содержащиеся в искусственной молекуле нуклеиновой кислоты, такие как открытая рамка считывания и 3'-UTR-элемент, не встречаются в естественных условиях (в природе) в рассматриваемой комбинации. Предпочтительно 3'-UTR-элемент происходит из гена, отличного от гена, из которого происходит открытая рамка считывания. Например, ОРС может происходить из гена, отличного от гена, из которого происходит 3'-UTR-элемент, например, кодирующего другой белок или такой же белок, но из другого вида, и т.д. Предпочтительно открытая рамка считывания не кодирует рибосомальный белок. В предпочтительном варианте осуществления изобретения ОРС не кодирует человеческий рибосомальный белок или растительный рибосомальный белок (прежде всего, из Arabidopsis), прежде всего человеческий рибосомальный белок S6 (RPS6), белок, подобный человеческому рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 Arabidopsis (RPS16). В другом предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует рибосомальный белок S6 (RPS6), белок, подобный рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 (RPS16).Preferably, at least one open reading frame and at least one 3'UTR element are heterologous. In the context of the present description, the term "heterologous" means that two sequence elements contained in an artificial nucleic acid molecule, such as an open reading frame and a 3'-UTR element, do not occur naturally (in nature) in the considered combination. Preferably the 3'-UTR element is from a different gene from the gene from which the open reading frame is derived. For example, the ORF may be derived from a gene other than the gene from which the 3'UTR element is derived, such as encoding a different protein or the same protein but from a different species, and so on. Preferably, the open reading frame does not encode a ribosomal protein. In a preferred embodiment, the ORF does not encode a human ribosomal protein or a plant ribosomal protein (primarily from Arabidopsis), especially human ribosomal protein S6 (RPS6), human ribosomal protein L36a-like protein (RPL36AL) or Arabidopsis ribosomal protein S16 (RPS16). ). In another preferred embodiment of the invention, the open reading frame (ORF) does not encode ribosomal S6 protein (RPS6), ribosomal protein L36a like protein (RPL36AL) or ribosomal protein S16 (RPS16).

В конкретных вариантах осуществления изобретения предпочтительно открытая рамка считывания не кодирует репортерный белок, например, выбранный из группы, состоящей из глобиновых белков (прежде всего, бета-глобина), белка люциферазы, белков GFP или их вариантов, например, вариантов, последовательности которых идентичны по меньшей мере на 70% последовательности белка глобина, белка люциферазы или белка GFP. В наиболее предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует репортерный ген или не происходит из репортерного гена, где репортерный ген предпочтительно не выбирают из группы, состоящей из (генов) глобиновых белков (прежде всего бета-глобина), белка люциферазы, бета-глюкуронидазы (GUS) и белков GFP или их вариантов, предпочтительно не выбирают из EGFP или из вариантов любого из вышеуказанных генов, последовательности которых, как правило, идентичны по меньшей мере на 70% последовательности любого из вышеуказанных репортерных генов, предпочтительно генов белка глобина, белка люциферазы или белка GFP.In specific embodiments of the invention, preferably the open reading frame does not encode a reporter protein, for example, selected from the group consisting of globin proteins (primarily beta-globin), luciferase protein, GFP proteins, or variants thereof, for example, variants whose sequences are identical in at least 70% of the globin protein, luciferase protein or GFP protein sequence. In the most preferred embodiment of the invention, the open reading frame (ORF) does not encode a reporter gene or is not derived from a reporter gene, where the reporter gene is preferably not selected from the group consisting of (genes) globin proteins (primarily beta-globin), luciferase protein, beta-glucuronidase (GUS) and GFP proteins or variants thereof, preferably not selected from EGFP or from variants of any of the above genes, the sequences of which are generally at least 70% identical to the sequence of any of the above reporter genes, preferably globin protein genes , luciferase protein or GFP protein.

Еще более предпочтительно 3'-UTR-элемент является гетерологичным любому другому элементу, содержащемуся в искусственной нуклеиновой кислоте, представленной в настоящем описании. Например, если искусственная нуклеиновая кислота, предлагаемая в изобретении, содержит 3'-UTR-элемент из рассматриваемого гена, то она предпочтительно не содержит никакой другой нуклеотидной последовательности, прежде всего никакой функциональной нуклеотидной последовательности (например, элемента кодирующей или регуляторной последовательности) из этого же гена, включая его регуляторные последовательности на 5'- и 3'-конце ОРС гена. В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты содержит ОРС, 3'-UTR и 5'-UTR, которые все являются гетерологичными друг другу, например, они являются рекомбинантными, поскольку каждый из указанных элементов происходит из различных генов (и их 5'- и 3'-UTR). В другом предпочтительном варианте осуществления изобретения 3'-UTR не происходит из 3'-UTR вирусного гена или происходит не из вируса.Even more preferably, the 3'-UTR element is heterologous to any other element contained in the artificial nucleic acid provided herein. For example, if an artificial nucleic acid according to the invention contains a 3'-UTR element from the gene in question, then it preferably does not contain any other nucleotide sequence, in particular any functional nucleotide sequence (for example, a coding or regulatory sequence element) from the same gene, including its regulatory sequences at the 5'- and 3'-end of the ORF gene. In the most preferred embodiment of the invention, the artificial nucleic acid molecule contains an ORF, a 3'-UTR and a 5'-UTR, which are all heterologous to each other, for example, they are recombinant, since each of these elements comes from different genes (and their 5' - and 3'-UTR). In another preferred embodiment of the invention, the 3'UTR is not derived from a 3'UTR of a viral gene or is not derived from a virus.

Предпочтительно по меньшей мере один 3'-UTR-элемент функционально связан с ОРС. Это означает, что предпочтительно 3'-UTR-элемент ассоциирован с ОРС таким образом, что он может осуществлять функцию, такую как функция повышения или стабилизации экспрессии кодируемого пептида или белка, или функцию стабилизации искусственной молекулы нуклеиновой кислоты. Предпочтительно ОРС и 3'-UTR-элемент ассоциированы в направлении 5'→3'. Таким образом, предпочтительно искусственная молекула нуклеиновой кислоты содержит структуру 5'-ОРС-(необязательно)-линкер-3'-UTR-элемент-3', в которой линкер может присутствовать или отсутствовать. Например, линкер может состоять из одного или нескольких нуклеотидов, например, представлять собой сегмент, состоящий из 1-50 или 1-20 нуклеотидов, например, содержащий или состоящий из одного или нескольких сайтов, распознаваемых рестриктазами (сайтов рестрикции).Preferably, at least one 3'UTR element is operably linked to the ORF. This means that preferably the 3'-UTR element is associated with the ORF in such a way that it can perform a function such as the function of increasing or stabilizing the expression of an encoded peptide or protein, or the function of stabilizing an artificial nucleic acid molecule. Preferably, the ORF and the 3'UTR element are associated in the 5'→3' direction. Thus, preferably, the artificial nucleic acid molecule contains the structure 5'-ORC-(optional)-linker-3'-UTR-element-3', in which the linker may or may not be present. For example, the linker may consist of one or more nucleotides, for example, be a segment consisting of 1-50 or 1-20 nucleotides, for example, containing or consisting of one or more sites recognized by restriction enzymes (restriction sites).

Предпочтительно по меньшей мере один 3'-UTR-элемент содержит нуклеотидную последовательность, происходящую из 3'-UTR гена эукариотического рибосомального белка, предпочтительно из 3'-UTR гена рибосомального белка позвоночных, более предпочтительно из 3'-UTR гена рибосомального белка млекопитающих, еще более предпочтительно из 3'-UTR гена рибосомального белка приматов, прежде всего гена рибосомального белка человека, или из 3'-UTR гена рибосомального белка грызунов, прежде всего гена мышиного рибосомального белка.Preferably, at least one 3'-UTR element contains a nucleotide sequence derived from a 3'-UTR of a eukaryotic ribosomal protein gene, preferably from a 3'-UTR of a vertebrate ribosomal protein gene, more preferably from a 3'-UTR of a mammalian ribosomal protein gene, still more preferably from a 3'UTR of a primate ribosomal protein gene, especially a human ribosomal protein gene, or from a 3'UTR of a rodent ribosomal protein gene, especially a mouse ribosomal protein gene.

В предпочтительном варианте осуществления изобретения по меньшей мере один 3'-UTR-элемент содержит или соответствует нуклеотидной последовательности, которая происходит из последовательности 3'-UTR транскрипта, выбранного из группы, состоящей из

In a preferred embodiment of the invention, at least one 3'-UTR element contains or corresponds to a nucleotide sequence that is derived from the 3'-UTR sequence of a transcript selected from the group consisting of

Фраза «нуклеотидная последовательность, которая происходит из 3'-UTR гена рибосомального белка» предпочтительно относится к нуклеотидной последовательности, основой которой является последовательность 3'-UTR гена рибосомального белка или ее фрагмент или участок. Указанная фраза включает последовательности, соответствующие полной последовательности 3'-UTR, т.е. полноразмерной последовательности 3'-UTR гена рибосомального белка, и последовательности, соответствующие фрагменту последовательности 3'-UTR гена рибосомального белка. Предпочтительно фрагмент 3'-UTR гена рибосомального белка состоит из непрерывного сегмента нуклеотидов, соответствующего непрерывному сегменту нуклеотидов полноразмерной последовательности 3'-UTR гена рибосомального белка, который включает по меньшей мере 5%, 10%, 20%, предпочтительно по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90% полноразмерной последовательности 3'-UTR гена рибосомального белка. В контексте настоящего изобретения такой фрагмент предпочтительно представляет собой функциональный фрагмент, представленный в настоящем описании. Предпочтительно фрагмент сохраняет функцию регулирования трансляции ОРС, сцепленной с 3'-UTR или его фрагментом. Понятие «3'-UTR гена рибосомального белка» предпочтительно относится к 3'-UTR встречающегося в естественных условиях гена рибосомального белка.The phrase "a nucleotide sequence which is derived from the 3'UTR of a ribosomal protein gene" preferably refers to a nucleotide sequence based on the 3'UTR of a ribosomal protein gene or a fragment or region thereof. Said phrase includes sequences corresponding to the entire 3'-UTR sequence, i.e. the full-length sequence of the 3'-UTR of the ribosomal protein gene, and sequences corresponding to a fragment of the sequence of the 3'-UTR of the ribosomal protein gene. Preferably, the 3'UTR fragment of the ribosomal protein gene consists of a contiguous segment of nucleotides corresponding to the contiguous segment of nucleotides of the full-length 3'UTR of the ribosomal protein gene, which comprises at least 5%, 10%, 20%, preferably at least 30%, more preferably at least 40%, more preferably at least 50%, even more preferably at least 60%, even more preferably at least 70%, even more preferably at least 80% and most preferably at least 90% full-length sequence of the 3'-UTR of the ribosomal protein gene. In the context of the present invention, such a fragment is preferably a functional fragment presented in the present description. Preferably, the fragment retains the function of regulating the translation of the ORF linked to the 3'UTR or a fragment thereof. The term "3'UTR of a ribosomal protein gene" preferably refers to the 3'UTR of a naturally occurring ribosomal protein gene.

Понятия «вариант 3'-UTR гена рибосомального белка» и «его вариант» в контексте 3'-UTR гена рибосомального белка относятся к варианту 3'-UTR встречающегося в естественных условиях гена рибосомального белка, предпочтительно к варианту 3'-UTR гена рибосомального белка позвоночных, более предпочтительно к варианту 3'-UTR гена рибосомального белка млекопитающих, еще более предпочтительно к варианту 3'-UTR варианту 3'-UTR гена рибосомального белка приматов, прежде всего гена рибосомального белка человека, представленного выше. Такой вариант может представлять собой модифицированный 3'-UTR гена рибосомального белка. Например, вариант 3'-UTR может иметь одну или несколько делеций, инсерций, добавлений и/или замен нуклеотидов по сравнению с встречающейся в естественных условиях 3'-UTR, из которой происходит вариант. Предпочтительно вариант 3'-UTR гена рибосомального белка по меньшей мере на 40%, предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, более предпочтительно по меньшей мере на 70%, еще более предпочтительно по меньшей мере на 80%, еще более предпочтительно по меньшей мере на 90%, наиболее предпочтительно по меньшей мере на 95% идентичен встречающейся в естественных условиях 3'-UTR, из которой происходит вариант. Предпочтительно вариант представляет собой функциональный вариант, представленный в настоящем описании.The terms "variant 3'-UTR of the ribosomal protein gene" and "variant thereof" in the context of the 3'-UTR of the ribosomal protein gene refer to the 3'-UTR variant of the naturally occurring ribosomal protein gene, preferably the 3'-UTR variant of the ribosomal protein gene vertebrates, more preferably the 3'UTR variant of the mammalian ribosomal protein gene, even more preferably the 3'UTR variant of the 3'UTR variant of the primate ribosomal protein gene, especially the human ribosomal protein gene shown above. Such a variant may be a modified 3'-UTR of a ribosomal protein gene. For example, a variant 3'-UTR may have one or more deletions, insertions, additions, and/or substitutions of nucleotides compared to the naturally occurring 3'-UTR from which the variant is derived. Preferably the variant 3'-UTR of the ribosomal protein gene is at least 40%, preferably at least 50%, more preferably at least 60%, more preferably at least 70%, even more preferably at least 80% %, even more preferably at least 90%, most preferably at least 95% identical to the naturally occurring 3'-UTR from which the variant originates. Preferably the variant is a functional variant presented in the present description.

Фраза «нуклеотидная последовательность, которая происходит из варианта 3'-UTR гена рибосомального белка» предпочтительно относится к нуклеотидной последовательности, основой которой является вариант последовательности 3'-UTR гена рибосомального белка или его фрагмент или участок, представленный выше. Фраза включает последовательности, соответствующие полной последовательности варианта 3'-UTR гена рибосомального белка, т.е. полноразмерной последовательности варианта 3'-UTR гена рибосомального белка, и последовательности, соответствующие фрагменту варианта последовательности 3'-UTR гена рибосомального белка. Предпочтительно фрагмент варианта 3'-UTR гена рибосомального белка состоит из непрерывного сегмента нуклеотидов, соответствующего непрерывному сегменту нуклеотидов полноразмерного варианта последовательности 3'-UTR гена рибосомального белка, который включает по меньшей мере 20%, предпочтительно по меньшей мере 30%, более предпочтительно по меньшей мере 40%, более предпочтительно по меньшей мере 50%, еще более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, и наиболее предпочтительно по меньшей мере 90% полноразмерного варианта 3'-UTR гена рибосомального белка. В контексте настоящего изобретения такой фрагмент варианта предпочтительно представляет собой функциональный фрагмент варианта, представленного в настоящем описании.The phrase "a nucleotide sequence which is derived from a ribosomal protein gene 3'-UTR variant" preferably refers to a nucleotide sequence based on a ribosomal protein gene 3'-UTR sequence variant or a fragment or region thereof as shown above. The phrase includes sequences corresponding to the complete sequence of the 3'-UTR variant of the ribosomal protein gene, i.e. the full-length sequence of the 3'-UTR variant of the ribosomal protein gene, and sequences corresponding to a fragment of the 3'-UTR sequence variant of the ribosomal protein gene. Preferably, the ribosomal protein gene variant 3'-UTR fragment consists of a contiguous segment of nucleotides corresponding to the contiguous nucleotide segment of the full-length ribosomal protein 3'-UTR gene sequence variant, which comprises at least 20%, preferably at least 30%, more preferably at least at least 40%, more preferably at least 50%, even more preferably at least 60%, even more preferably at least 70%, even more preferably at least 80%, and most preferably at least 90% of the full size option 3 '-UTR of the ribosomal protein gene. In the context of the present invention, such a variant fragment is preferably a functional fragment of the variant presented in the present description.

В контексте настоящего описания понятия «функциональный вариант» «функциональный фрагмент» и «функциональный фрагмент варианта» (который обозначают также как «функциональный вариантный фрагмент») означают, что фрагмент 3'-UTR, вариант 3'-UTR или фрагмент варианта 3'-UTR гена рибосомального белка выполняет по меньшей мере одну, предпочтительно более чем одну функцию встречающейся в естественных условиях 3'-UTR гена рибосомального белка, из которой происходит вариант, фрагмента или фрагмент варианта. Такая функция может заключаться, например, в стабилизации мРНК и/или увеличении, стабилизации и/или пролонгировании производства белка с мРНК, и/или увеличении экспрессии белка или общего производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка. Предпочтительно функция 3'-UTR касается трансляции белка, кодируемого ОРС. Более предпочтительно функция включает повышение эффективности трансляции ОРС, связанной с 3'-UTR или ее фрагментом или вариантом. В контексте настоящего изобретения наиболее предпочтительно, чтобы вариант, фрагмент и вариант фрагмента выполнял функцию стабилизации мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, и/или функцию увеличения, стабилизации и/или пролонгирования производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, и/или функцию увеличения производства белка с мРНК, предпочтительно в клетке млекопитающего, такой как человеческая клетка, по сравнению с мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. Референс-3'-UTR может представлять собой, например, 3'-UTR, встречающуюся в естественных условиях в комбинации с ОРС. Кроме того, функциональный вариант, функциональный фрагмент или функциональный вариант фрагмента 3'-UTR гена рибосомального белка предпочтительно не оказывает существенного понижающего действия на эффективность трансляции мРНК, которая содержит такой вариант, фрагмент или вариант фрагмента 3'-UTR, по сравнению с 3'-UTR дикого типа, из которой происходит вариант, фрагмент или вариант фрагмента. В контексте настоящего изобретения наиболее предпочтительная функция «функционального варианта», «функционального фрагмента» или «функционального варианта фрагмента» 3'-UTR гена рибосомального белка заключается в увеличении, стабилизации и/или пролонгировании производства белка посредством экспрессии мРНК, несущей функциональный вариант, функциональный фрагмент или функциональный вариант фрагмента, представленный выше.In the context of the present description, the terms "functional variant" "functional fragment" and "functional fragment of the variant" (which is also referred to as "functional variant fragment") mean that a 3'-UTR fragment, a 3'-UTR variant, or a 3'-variant fragment The UTR of the ribosomal protein gene performs at least one, preferably more than one, function of the naturally occurring 3' UTR of the ribosomal protein gene from which the variant, fragment, or fragment of the variant is derived. Such a function may be, for example, to stabilize the mRNA and/or increase, stabilize and/or prolong protein production from mRNA and/or increase protein expression or total protein production from mRNA, preferably in a mammalian cell such as a human cell. Preferably, the function of the 3'UTR is to translate the protein encoded by the ORF. More preferably, the function includes increasing the efficiency of translation of the ORF associated with the 3'UTR or a fragment or variant thereof. In the context of the present invention, it is most preferred that the variant, fragment, and fragment variant have the function of stabilizing the mRNA, preferably in a mammalian cell such as a human cell, compared to an mRNA that contains a reference 3'-UTR or lacks a 3'-UTR. , and/or the function of increasing, stabilizing and/or prolonging the production of a protein from an mRNA, preferably in a mammalian cell, such as a human cell, compared to an mRNA that contains a reference 3'-UTR or lacks a 3'-UTR, and /or the function of increasing protein production from an mRNA, preferably in a mammalian cell such as a human cell, compared to an mRNA that contains a reference 3'-UTR or lacks a 3'-UTR. The reference 3'-UTR may be, for example, the naturally occurring 3'-UTR in combination with the ORF. In addition, the functional variant, functional fragment or functional variant of the 3'-UTR fragment of the ribosomal protein gene preferably does not significantly reduce the efficiency of translation of mRNA that contains such a variant, fragment or variant of the 3'-UTR fragment, compared to the 3'- The wild-type UTR from which the variant, fragment, or fragment variant is derived. In the context of the present invention, the most preferred function of a "functional variant", "functional fragment" or "functional fragment variant" of the 3'-UTR of a ribosomal protein gene is to increase, stabilize and/or prolong protein production by expression of an mRNA carrying a functional variant, a functional fragment or the functional version of the snippet presented above.

Предпочтительно эффективность одной или нескольких функций, осуществляемых функциональным вариантом, функциональным фрагментом или функциональным вариантом фрагмента, такую как эффективность стабилизации производства мРНК и/или белка, и/или эффективность увеличения производства белка, повышают по меньшей мере на 5%, более предпочтительно по меньшей мере на 10%, более предпочтительно по меньшей мере на 20%, более предпочтительно по меньшей мере на 30%, более предпочтительно по меньшей мере на 40%, более предпочтительно по меньшей мере на 50%, более предпочтительно по меньшей мере на 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, наиболее предпочтительно по меньшей мере на 90% по сравнению с эффективностью стабилизации производства мРНК и/или белка, и/или эффективностью увеличения производства белка, обеспечиваемой встречающейся в естественных условиях 3'-UTR гена рибосомального белка, из которого происходит вариант, фрагмент или вариант фрагмента.Preferably, the efficiency of one or more functions performed by the functional variant, functional fragment, or functional fragment variant, such as the efficiency of stabilizing mRNA and/or protein production and/or the efficiency of increasing protein production, is increased by at least 5%, more preferably at least 10%, more preferably at least 20%, more preferably at least 30%, more preferably at least 40%, more preferably at least 50%, more preferably at least 60%, more more preferably at least 70%, even more preferably at least 80%, most preferably at least 90% compared to the mRNA and/or protein production stabilization efficiency and/or protein production enhancement efficiency provided by naturally occurring 3'-UTR of the ribosomal protein gene from which the variant, fragment, or variant is derived t fragment.

В контексте настоящего изобретения фрагмент 3'-UTR гена рибосомального белка или вариант 3'-UTR гена рибосомального белка предпочтительно имеет длину по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотидов, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. Предпочтительно такой фрагмент 3'-UTR гена рибосомального белка или вариант 3'-UTR гена рибосомального белка представляет собой функциональный фрагмент, описанный выше. В предпочтительном варианте осуществления изобретения 3'-UTR гена рибосомального белка или его фрагмент или вариант имеет длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов.In the context of the present invention, a 3'-UTR fragment of a ribosomal protein gene or a 3'-UTR variant of a ribosomal protein gene is preferably at least about 3 nucleotides in length, preferably at least about 5 nucleotides, more preferably at least about 10, 15, 20 , 25 or 30 nucleotides, even more preferably at least about 50 nucleotides, most preferably at least about 70 nucleotides. Preferably, such a ribosomal protein 3'UTR gene fragment or ribosomal protein 3'UTR gene variant is a functional fragment as described above. In a preferred embodiment, the 3'-UTR of the ribosomal protein gene, or fragment or variant thereof, is from 3 to about 500 nucleotides in length, preferably from 5 to about 150 nucleotides, more preferably from 10 to 100 nucleotides, even more preferably from 15 to 90, most preferably 20 to 70 nucleotides.

Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из «функционального фрагмента», «функционального варианта» или «функционального фрагмента варианта» 3'-UTR гена рибосомального белка.Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a "functional fragment", "functional variant", or "functional fragment of the variant" 3'-UTR of the ribosomal protein gene.

В предпочтительном варианте осуществления изобретения по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, повышает стабильность искусственной молекулы нуклеиновой кислоты, например, повышает стабильность мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой нуклеиновой референс-кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно, по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, повышает стабильность производства белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, пролонгирует производство белка из искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, повышает экспрессию белка и/или общее производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, по сравнению с соответствующей нуклеиновой кислотой, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, не оказывает отрицательного влияния на эффективность трансляции нуклеиновой кислоты по сравнению с эффективностью трансляции соответствующей нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях в комбинации с ОРС. Еще более предпочтительно с помощью 3'-UTR повышают эффективность трансляции по сравнению с эффективностью трансляции белка, кодируемого соответствующей ОРС в естественных условиях.In a preferred embodiment of the invention, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention improves the stability of the artificial nucleic acid molecule, for example, increases the stability of the mRNA of the present invention, compared with the corresponding nucleic nucleic reference -acid lacking a 3'UTR or containing a reference 3'UTR, such as the naturally occurring 3'UTR in combination with an ORF. Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention improves the stability of protein production from the artificial nucleic acid molecule of the present invention, for example, mRNA of the present invention, compared with an appropriate nucleic acid that lacks a 3'UTR or that contains a reference 3'UTR, such as a naturally occurring 3'UTR in combination with an ORF. Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention prolongs the production of protein from the artificial nucleic acid molecule of the present invention, for example, with the mRNA of the present invention, compared with the corresponding nucleic acid an acid that lacks a 3'UTR or that contains a reference 3'UTR, such as a naturally occurring 3'UTR in combination with an ORF. Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention increases protein expression and/or overall protein production from the artificial nucleic acid molecule of the present invention, for example, mRNA of the present invention , compared to a corresponding nucleic acid that lacks a 3'UTR or that contains a reference 3'UTR, such as a naturally occurring 3'UTR in combination with an ORF. Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention does not adversely affect the translation efficiency of the nucleic acid compared to the translation efficiency of the corresponding nucleic acid that lacks the 3'-UTR or contains the reference -3'UTR, such as the naturally occurring 3'UTR in combination with ORF. Even more preferably, the 3'-UTR increases the efficiency of translation compared to the efficiency of translation of the protein encoded by the corresponding ORF in natural conditions.

Понятие «соответствующая молекула нуклеиновой кислоты» или «референс-молекула нуклеиновой кислоты» в указанном контексте означает, что референс-молекула нуклеиновой кислоты, за исключением различий в 3'-UTR, сопоставима, предпочтительно идентична предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, содержащей 3'-UTR-элемент.The term "corresponding nucleic acid molecule" or "reference nucleic acid molecule" in this context means that the reference nucleic acid molecule, except for differences in the 3'-UTR, is comparable, preferably identical to the artificial nucleic acid molecule proposed in the present invention containing 3'-UTR element.

Понятие «стабилизирует и/или пролонгирует производство белка» с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, предпочтительно означает, что производство белка с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, стабилизируется и/или пролонгируется по сравнению с производством белка с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, например, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, предпочтительно в экспрессионной системе млекопитающих, такой как HeLa- или HDF-клетки. Так, белок, продуцируемый с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, поддается обнаружению в течение более длительного периода времени, чем время, в течение которого его можно обнаружить в случае белка, продуцируемого с референс-молекулы нуклеиновой кислоты. Иными словами, количество белка, продуцированного с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, измеряемое в зависимости от времени, снижается до уровня, находящегося ниже порогового значения, в более поздний момент времени, чем количество белка, продуцированного с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, измеряемое в зависимости от времени. Такое пороговое значение может представлять собой, например, количество белка, измеренное на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции молекулой нуклеиновой кислоты.The term "stabilizes and/or prolongs the production of a protein" from an artificial nucleic acid molecule, such as an artificial mRNA, preferably means that the production of a protein from an artificial nucleic acid molecule, such as an artificial mRNA, is stabilized and/or prolonged compared to the production of a reference protein. a nucleic acid molecule, such as a reference mRNA, for example, which contains a reference 3'UTR or lacks a 3'UTR, preferably in a mammalian expression system such as HeLa or HDF cells. Thus, a protein produced from an artificial nucleic acid molecule, such as an artificial mRNA, is detectable for a longer period of time than the time during which it can be detected in the case of a protein produced from a reference nucleic acid molecule. In other words, the amount of protein produced from an artificial nucleic acid molecule, such as an artificial mRNA, measured as a function of time, falls below a threshold value at a later point in time than the amount of protein produced from a reference nucleic acid molecule. , such as a reference mRNA measured over time. Such a threshold value can be, for example, the amount of protein measured at the initial phase of expression, for example, 1, 2, 3, 4, 5 or 6 hours after the initiation of expression, for example, after transfection with a nucleic acid molecule.

Например, производство белка с искусственной молекулы нуклеиновой кислоты, такой как искусственная мРНК, в количествах, равных по меньшей мере количеству, обнаруженному на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции молекулой нуклеиновой кислоты, пролонгируется по меньшей мере примерно на 5 ч, предпочтительно по меньшей мере примерно на 10 ч, более предпочтительно по меньшей мере примерно на 24 ч по сравнении с производством белка с референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, в экспрессионной системе, такой как клетки млекопитающих, например, в HeLa- или HDF-клетках. Так, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, предпочтительно позволяет пролонгировать производство белка в количестве, которое по меньшей мере равно количеству, обнаруженному на начальной фазе экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, после трансфекции молекулой нуклеиновой кислоты, по меньшей мере примерно на 5 ч, предпочтительно по меньшей мере примерно на 10 ч, более предпочтительно по меньшей мере примерно на 24 ч по сравнении с производством белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR.For example, the production of a protein from an artificial nucleic acid molecule, such as an artificial mRNA, in amounts equal to at least the amount found in the initial phase of expression, for example, 1, 2, 3, 4, 5, or 6 hours after initiation of expression, for example , after transfection with a nucleic acid molecule, is prolonged by at least about 5 hours, preferably at least about 10 hours, more preferably at least about 24 hours compared with the production of protein from a reference nucleic acid molecule, such as a reference mRNA, in an expression system such as in mammalian cells, for example in HeLa or HDF cells. Thus, the artificial nucleic acid molecule of the present invention preferably allows the prolongation of protein production in an amount that is at least equal to the amount found in the initial phase of expression, for example, 1, 2, 3, 4, 5 or 6 hours after initiation expression, e.g., after transfection with a nucleic acid molecule, for at least about 5 hours, preferably at least about 10 hours, more preferably at least about 24 hours, compared with the production of a protein from a reference nucleic acid molecule in which missing 3'-UTR or which contains a reference 3'-UTR.

В предпочтительных вариантах осуществления изобретения период производства белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, удлиняют по меньшей мере в 1,5 раза, предпочтительно по меньшей мере в 2 раза, более предпочтительно по меньшей мере в 2,5 раза по сравнению с периодом производства белка с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR.In preferred embodiments of the invention, the period of production of a protein from an artificial nucleic acid molecule of the present invention is extended by at least 1.5 times, preferably at least 2 times, more preferably at least 2.5 times compared to a period of protein production from a reference nucleic acid molecule that lacks a 3'-UTR or contains a reference 3'-UTR.

Указанный эффект пролонгирования производства белка можно оценивать на основе (I) измерения количеств белка, например, полученных в результате экспрессии кодируемого репортерного белка, такого как люцифераза, предпочтительно в экспрессионной системе млекопитающих, такой как HeLa-или HDF-клетки, в зависимости от времени, (II) определения момента времени, в который количество белка становится ниже количества белка, обнаруженного, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, например, через 1, 2, 3, 4, 5 или 6 ч после трансфекции искусственной молекулой нуклеиновой кислоты, и (III) сравнения момента времени, который количество белка становится ниже количества белка, обнаруженного, например, через 1, 2, 3, 4, 5 или 6 ч после инициации экспрессии, с указанным моментом времени, определенным для молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR.Said effect of prolonging protein production can be assessed based on (i) measuring the amounts of protein, for example, obtained from the expression of an encoded reporter protein such as luciferase, preferably in a mammalian expression system such as HeLa or HDF cells, as a function of time, (II) determining the point in time at which the amount of protein falls below the amount of protein detected, for example, 1, 2, 3, 4, 5, or 6 hours after initiation of expression, for example, 1, 2, 3, 4, 5 or 6 hours after transfection with the artificial nucleic acid molecule, and (iii) comparing the time point at which the amount of protein falls below the amount of protein detected, e.g. 1, 2, 3, 4, 5, or 6 hours after initiation of expression, with the indicated time point defined for a nucleic acid molecule that lacks a 3'-UTR or contains a reference 3'-UTR.

Предпочтительно указанное стабилизирующее и/или пролонгирующее действие на производство белка достигают, когда общее количество белка, продуцированное с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, в течение периода времени, составляющего 48 или 72 ч, по меньшей мере равно количеству белка, продуцированного с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты. Так, в настоящем изобретении предложена искусственная молекула нуклеиновой кислоты, которая обеспечивает пролонгированное и/или стабилизированное производство белка в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa- или HDF-клетках, как указано выше, при этом общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 48 или 72 ч, по меньшей мере равно общему количеству белка, продуцированного, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ORF искусственной молекулы нуклеиновой кислоты.Preferably, said stabilizing and/or prolonging effect on protein production is achieved when the total amount of protein produced from the artificial nucleic acid molecule of the present invention, for example, over a period of 48 or 72 hours, is at least equal to the amount of protein, produced from a reference nucleic acid molecule that lacks a 3'-UTR or that contains a reference 3'-UTR, such as a 3'-UTR that occurs naturally with the ORF of the artificial nucleic acid molecule. Thus, the present invention provides an artificial nucleic acid molecule that provides prolonged and/or stabilized protein production in a mammalian expression system, such as mammalian cells, for example, in HeLa or HDF cells, as described above, while the total amount of protein, produced from said artificial nucleic acid molecule, for example, over a period of 48 or 72 hours, is at least equal to the total amount of protein produced, for example, over a specified period of time, from a reference nucleic acid molecule that lacks 3 '-UTR or which contains a reference 3'-UTR, such as the 3'-UTR naturally occurring with the ORF of an artificial nucleic acid molecule.

Так, «стабилизированная экспрессия белка» предпочтительно означает, что имеет место более равномерное производство белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, в течение заранее определенного периода времени, например, в течение 24 ч, более предпочтительно в течение 48 ч, еще более предпочтительно в течение 72 ч, по сравнению с референс-молекулой нуклеиновой кислоты, например, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. Следовательно, уровень производства белка, например, в системе млекопитающих, с искусственной молекулы нуклеиновой кислоты, содержащей 3'-UTR-элемент, предлагаемый в настоящем изобретении, например, с мРНК, предлагаемой в настоящем изобретении, предпочтительно не снижается до уровня, обнаруженного для референс-молекулы нуклеиновой кислоты, такой как референс-мРНК, указанная выше. Например, количество белка (кодируемого ОРС), обнаруженное через 6 ч после инициации экспрессии, например, через 6 ч после трансфекции искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, клетки, такой как клетка млекопитающего, может быть сопоставимым с количеством белка, обнаруженного через 48 ч после инициации экспрессии, например, через 48 ч после трансфекции. Так, отношение количества белка, кодируемого ОРС, такого как репортерный белок, например, люцифераза, обнаруженное через 48 ч после инициации экспрессии, например, через 48 после трансфекции, к количеству белка, обнаруженному через 6 ч после инициации экспрессии, например, через 6 ч после трансфекции, предпочтительно составляет по меньшей мере примерно 0,4, более предпочтительно по меньшей мере примерно 0,5, более предпочтительно по меньшей мере примерно 0,6, еще более предпочтительно по меньшей мере примерно 0,7. Для молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении отношение предпочтительно составляет от примерно 0,4 до примерно 4, предпочтительно от примерно 0,65 до примерно 3, более предпочтительно от примерно 0,7 до 2. Для соответствующей референс-молекулы нуклеиновой кислоты, например, мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR, указанное отношение может составлять, например, от примерно 0,05 до примерно 0,3.Thus, "stabilized protein expression" preferably means that there is a more uniform production of protein from the artificial nucleic acid molecule of the present invention over a predetermined period of time, for example within 24 hours, more preferably within 48 hours, yet more preferably within 72 hours, compared to a reference nucleic acid molecule, for example, which contains a reference 3'-UTR or lacks a 3'-UTR. Therefore, the level of protein production, for example, in a mammalian system, from an artificial nucleic acid molecule containing a 3'-UTR element of the present invention, for example, from an mRNA of the present invention, preferably does not decrease to the level found for the reference a nucleic acid molecule, such as the reference mRNA mentioned above. For example, the amount of protein (encoded by ORF) detected 6 hours after initiation of expression, for example 6 hours after transfection of a cell, such as a mammalian cell, with an artificial nucleic acid molecule of the present invention, may be comparable to the amount of protein detected through 48 hours after initiation of expression, eg 48 hours after transfection. Thus, the ratio of the amount of a protein encoded by an ORF, such as a reporter protein, for example, luciferase, detected 48 hours after initiation of expression, for example, 48 hours after transfection, to the amount of protein detected 6 hours after initiation of expression, for example, after 6 hours after transfection, preferably at least about 0.4, more preferably at least about 0.5, more preferably at least about 0.6, even more preferably at least about 0.7. For a nucleic acid molecule of the present invention, the ratio is preferably from about 0.4 to about 4, preferably from about 0.65 to about 3, more preferably from about 0.7 to 2. For a corresponding reference nucleic acid molecule, for example , mRNA that contains a reference 3'-UTR or lacks a 3'-UTR, said ratio may be, for example, from about 0.05 to about 0.3.

Так, в настоящем изобретении предложена искусственная молекула нуклеиновой кислоты, содержащая ОРС и 3'-UTR-элемент, описанный выше, при этом отношение количества (репортерного) белка, например, количество люциферазы, обнаруженное через 48 ч после инициации экспрессии, к количеству (репортерного) белка, обнаруженному через 6 ч после инициации экспрессии, предпочтительно в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa-клетках, предпочтительно превышает примерно 0,4, более предпочтительно превышает примерно 0,5, более предпочтительно превышает примерно 0,6, еще более предпочтительно превышает примерно 0,7, например, составляет от примерно 0,4 до примерно 4, предпочтительно от примерно 0,65 до примерно 3, более предпочтительно от примерно 0,7 до 2, при этом предпочтительно общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 48 ч, по меньшей мере равно общему количеству белка, продуцированного, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты. В предпочтительном варианте осуществления настоящего изобретения предложена искусственная молекула нуклеиновой кислоты, содержащая ОРС и 3'-UTR-элемент, описанный выше, при этом отношение количества (репортерного) белка, например, количество люциферазы, обнаруженное через 72 ч после инициации экспрессии, к количеству (репортерного) белка, обнаруженному через 6 ч после инициации экспрессии, предпочтительно в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa-клетках, предпочтительно превышает примерно 0,4, более предпочтительно превышает примерно 0,5, более предпочтительно превышает примерно 0,6, еще более предпочтительно превышает примерно 0,7, например, составляет от примерно 0,4 до 1,5, предпочтительно от примерно 0,65 до примерно 1,15, более предпочтительно от примерно 0,7 до 1.0, при этом предпочтительно общее количество белка, продуцированного с указанной искусственной молекулы нуклеиновой кислоты, например, в течение периода времени, составляющего 72 ч, по меньшей мере равно общему количеству белка, продуцированному, например, в течение указанного периода времени, с референс-молекулы нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит 3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС искусственной молекулы нуклеиновой кислоты.Thus, the present invention provides an artificial nucleic acid molecule containing an ORF and a 3'-UTR element as described above, wherein the ratio of the amount of (reporter) protein, for example, the amount of luciferase detected 48 hours after initiation of expression, to the amount of (reporter) ) protein detected 6 hours after initiation of expression, preferably in a mammalian expression system such as mammalian cells, for example in HeLa cells, preferably greater than about 0.4, more preferably greater than about 0.5, more preferably greater than about 0, 6, even more preferably greater than about 0.7, for example, from about 0.4 to about 4, preferably from about 0.65 to about 3, more preferably from about 0.7 to 2, with the total amount of protein being preferred, produced from said artificial nucleic acid molecule, for example, over a period of 48 hours, at least equal to the total amount of protein produced, for example, during a specified period of time, from a reference nucleic acid molecule that lacks a 3'-UTR or that contains a reference 3'-UTR, such as a 3'-UTR naturally occurring with ORF of an artificial nucleic acid molecule. In a preferred embodiment, the present invention provides an artificial nucleic acid molecule comprising an ORF and a 3'-UTR element as described above, wherein the ratio of the amount of (reporter) protein, e.g., the amount of luciferase detected 72 hours after initiation of expression, to the amount reporter) protein detected 6 hours after initiation of expression, preferably in a mammalian expression system such as mammalian cells, e.g. in HeLa cells, preferably greater than about 0.4, more preferably greater than about 0.5, more preferably greater than about 0 ,6, even more preferably greater than about 0.7, for example, from about 0.4 to 1.5, preferably from about 0.65 to about 1.15, more preferably from about 0.7 to 1.0, with the total amount of protein produced from said artificial nucleic acid molecule, for example, over a period of time its 72 hours is at least equal to the total amount of protein produced, for example, during the specified time period, from a reference nucleic acid molecule that lacks a 3'-UTR or that contains a 3'-UTR, such as a 3'-UTR , which occurs naturally with the ORF of an artificial nucleic acid molecule.

«Увеличенная экспрессия белка» или «повышенная экспрессия белка» в контексте настоящего изобретения предпочтительно обозначает увеличенную/повышенную экспрессию белка в один из моментов времени после инициации экспрессии или увеличенное/повышенное общее количество экспрессированного белка, по сравнению с экспрессией, индуцированной референс-молекулой нуклеиновой кислоты. Так, уровень белка, обнаруженный в определенный момент времени после инициации экспрессии, например, после трансфекции искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, после трансфекции мРНК, предлагаемой в настоящем изобретении, например, через 6, 12, 24, 48 или 72 ч после трансфекции, предпочтительно превышает уровень белка, обнаруженный в этот же самый момент времени после инициации экспрессии, например, после трансфекции референс-молекулой нуклеиновой кислоты, такой как референс-мРНК, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. В предпочтительном варианте осуществления изобретения максимальное количество белка (определенное, например, по активности или массе белка), экспрессированного с искусственной молекулы нуклеиновой кислоты, увеличивают по сравнению с количеством белка, экспрессированного с нуклеиновой референс-кислоты, которая содержит референс-3'-UTR или в которой отсутствует 3'-UTR. Пиковые уровни экспрессии предпочтительно достигаются в пределах 48 ч, более предпочтительно в пределах 24 ч и еще более предпочтительно в пределах 12 ч после, например, трансфекции."Increased protein expression" or "increased protein expression" in the context of the present invention preferably means increased/increased protein expression at one of the time points after initiation of expression, or increased/increased total protein expressed, compared to expression induced by a reference nucleic acid molecule. . Thus, the level of protein detected at a certain point in time after the initiation of expression, for example, after transfection with an artificial nucleic acid molecule of the present invention, for example, after transfection of an mRNA of the present invention, for example, after 6, 12, 24, 48 or 72 hours after transfection, preferably greater than the level of protein found at the same time point after initiation of expression, e.g. after transfection with a nucleic acid reference molecule, such as a reference mRNA that contains or lacks a reference 3'-UTR 3 '-UTR. In a preferred embodiment of the invention, the maximum amount of protein (determined, for example, by activity or protein weight) expressed from an artificial nucleic acid molecule is increased compared to the amount of protein expressed from a reference nucleic acid that contains a reference 3'-UTR or in which there is no 3'-UTR. Peak expression levels are preferably reached within 48 hours, more preferably within 24 hours and even more preferably within 12 hours after, for example, transfection.

В одном из вариантов осуществления изобретения «увеличенное общее производство белка» или «повышенное общее производство белка» с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, относится к увеличенному/повышенному производству белка за период времени, в течение которого белок продуцируется с искусственной молекулы нуклеиновой кислоты, предпочтительно в экспрессионной системе млекопитающих, такой как клетки млекопитающих, например, в HeLa- или HDF-клетках, по сравнению с референс-молекулой нуклеиновой кислоты, в которой отсутствует 3'-UTR или которая содержит референс-3'-UTR. Согласно предпочтительному варианту осуществления изобретения кумулятивное количество белка, экспрессированного в течение периода времени, увеличивается, если применяют искусственную молекулу нуклеиновой кислоты, предлагаемую в изобретении.In one embodiment, "increased total protein production" or "increased total protein production" from an artificial nucleic acid molecule of the invention refers to increased/increased protein production over the period of time that protein is produced from an artificial nucleic acid molecule. , preferably in a mammalian expression system such as mammalian cells, eg HeLa or HDF cells, compared to a reference nucleic acid molecule lacking a 3'-UTR or containing a reference 3'-UTR. According to a preferred embodiment of the invention, the cumulative amount of protein expressed over a period of time is increased if an artificial nucleic acid molecule according to the invention is used.

В изобретении предложена искусственная молекула нуклеиновой кислоты, которая отличается увеличенной экспрессией кодируемого белка по сравнению с соответствующей молекулой нуклеиновой кислоты, в которой отсутствует по меньшей мере один 3'-UTR-элемент или которая содержит 3'-UTR («нуклеиновая референс-кислота»), содержащую нуклеотидную последовательность, происходящую из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка. Для оценки in vivo производства белка с предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, определяют экспрессию кодируемого белка после инъекции/трансфекции предлагаемой в изобретении искусственной молекулой нуклеиновой кислоты клеток-/ткани-мишени и сравнивают с экспрессией белка, индуцированной нуклеиновой референс-кислотой. В данной области известны количественные методы определения экспрессии белка (например, вестерн-блоттинг, FACS, ELISA, масс-спектрометрия). В рассматриваемом контексте наиболее пригодным является определение экспрессии репортерных белков типа люциферазы, зеленого флуоресцентного белка (GFP) или секретированной щелочной фосфатазы (SEAP). Для этого искусственную нуклеиновую кислоту, предлагаемую в изобретении, или нуклеиновую референс-кислоту интродуцируют в ткань-мишень или клетку-мишень, например, посредством трансфекции или инъекции. Через несколько часов или несколько дней (например, через 6, 12, 24, 48 или 72 ч) после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты берут образец клеток-мишеней и проводят измерения с помощью FACS и/или лизируют. После этого лизаты можно использовать для обнаружения экспрессированного белка (и определения тем самым эффективности экспрессии белка) с помощью нескольких методов, например, вестерн-блоттинга, FACS, ELISA, масс-спектрометрии или путем измерения флуоресценции или люминесценции.The invention provides an artificial nucleic acid molecule that is characterized by increased expression of the encoded protein compared to the corresponding nucleic acid molecule that lacks at least one 3'-UTR element or that contains a 3'-UTR ("nucleic reference acid") containing a nucleotide sequence derived from the 3'-UTR of the ribosomal protein gene or from the variant 3'-UTR of the ribosomal protein gene. To evaluate in vivo protein production from the artificial nucleic acid molecule of the invention, the expression of the encoded protein after injection/transfection of the target cell/tissue with the artificial nucleic acid molecule of the invention is determined and compared with protein expression induced by the reference nucleic acid. Quantitative methods for determining protein expression are known in the art (eg Western blotting, FACS, ELISA, mass spectrometry). In this context, the most suitable is the determination of the expression of reporter proteins such as luciferase, green fluorescent protein (GFP) or secreted alkaline phosphatase (SEAP). To do this, an artificial nucleic acid according to the invention or a reference nucleic acid is introduced into the target tissue or target cell, for example by transfection or injection. A few hours or a few days (eg, 6, 12, 24, 48, or 72 hours) after initiation of expression or after the introduction of the nucleic acid molecule, a sample of target cells is taken and measured by FACS and/or lysed. The lysates can then be used to detect the expressed protein (and thereby determine the efficiency of protein expression) by several methods, such as Western blotting, FACS, ELISA, mass spectrometry, or by measuring fluorescence or luminescence.

Следовательно, если экспрессию белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, сравнивают с экспрессией белка с референс-молекулы нуклеиновой кислоты в определенные моменты времени (например, через 6, 12, 24, 48 или 72 ч после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты), то обе молекулы нуклеиновой кислоты интродуцируют по отдельности в ткани-/клетки-мишени, берут образец ткани/клеток в определенный момент времени, приготавливают белковые лизаты согласно конкретному протоколу, скорректированному для конкретного метода обнаружения (например, для вестерн-блоттинга, ELISA и т.д., как это известно в данной области) и проводят обнаружение белка с помощью выбранного метода обнаружения. В качестве альтернативы измерениям количеств экспрессируемого белка в клеточных лизатах, или в дополнение к измерениям количеств экспрессируемого белка в клеточных лизатах, с помощью FACS-анализа можно определять количества белка также до лизиса собранных клеток или параллельно с использованием аликвот.Therefore, if the expression of a protein from an artificial nucleic acid molecule of the invention is compared with the expression of a protein from a reference nucleic acid molecule at certain time points (for example, 6, 12, 24, 48, or 72 hours after the initiation of expression or after the introduction of the molecule nucleic acid), then both nucleic acid molecules are introduced separately into target tissues/cells, a sample of tissue/cells is taken at a certain point in time, protein lysates are prepared according to a specific protocol adjusted for a specific detection method (for example, for Western blotting, ELISA, etc., as is known in the art) and carry out protein detection using the selected detection method. As an alternative to measuring the amounts of expressed protein in cell lysates, or in addition to measuring the amounts of expressed protein in cell lysates, FACS analysis can also determine the amount of protein prior to lysis of harvested cells or in parallel using aliquots.

Если нужно измерять общее количество белка в течение определенного периода времени, то можно собирать ткань или клетки в несколько моментов времени после интродукции искусственной молекулы нуклеиновой кислоты (например, через 6, 12, 24, 48 и 72 ч после инициации экспрессии или после интродукции молекулы нуклеиновой кислоты; как правило, взятой из организма других подопытных животных), и определять количество белка в каждый момент времени как описано выше. Для расчета кумулятивного количества белка можно применять математический метод определения общего количества белка, например, можно определять площадь под кривой (AUC) согласно следующей формуле:If you want to measure the total amount of protein over a certain period of time, then you can collect tissue or cells at several points in time after the introduction of an artificial nucleic acid molecule (for example, 6, 12, 24, 48 and 72 hours after the initiation of expression or after the introduction of the nucleic acid molecule acid; usually taken from the body of other experimental animals), and determine the amount of protein at each time point as described above. To calculate the cumulative amount of protein, a mathematical method for determining the total amount of protein can be used, for example, you can determine the area under the curve (AUC) according to the following formula:

Для расчета площади под кривой для общего количества белка вычисляют интеграл уравнения кривой экспрессии между каждыми конечными точками (а и b).To calculate the area under the curve for total protein, the integral of the equation of the expression curve between each endpoints (a and b) is calculated.

Таким образом, понятие «общее производство белка» предпочтительно относится к площади под кривой (AUC), описывающей производство белка в зависимости от времени.Thus, the term "total protein production" preferably refers to the area under the curve (AUC) describing protein production as a function of time.

Указанное увеличение стабильности искусственной молекулы нуклеиновой кислоты, указанное увеличение стабильности производства белка, указанное пролонгирование производства белка и/или указанное увеличение/повышение экспрессии белка и/или общего производства белка предпочтительно определяют путем сравнения с соответствующей референс-молекулой нуклеиновой кислоты, в которой отсутствует 3'-UTR, например, мРНК, в которой отсутствует 3'-UTR, или референс-молекулой нуклеиновой кислоты, которая содержит референс-3'-UTR, такую как 3'-UTR, встречающуюся в естественных условиях с ОРС, как описано выше.Said increase in the stability of the artificial nucleic acid molecule, said increase in protein production stability, said prolongation of protein production and/or said increase/increase in protein expression and/or total protein production are preferably determined by comparison with a corresponding reference nucleic acid molecule lacking the 3' -UTR, for example, an mRNA that lacks a 3'UTR, or a reference nucleic acid molecule that contains a reference 3'UTR, such as a naturally occurring 3'UTR with an ORF as described above.

Стабилизирующее действие на мРНК и/или производство белка и эффективность, и/или повышающее производство белка действие и эффективность вариантов, фрагментов и/или фрагментов вариантов 3'-UTR гена рибосомального белка, а также стабилизирующее действие на мРНК и/или производство белка и эффективность, и/или повышающее производство белка действие и эффективность по меньшей мере одного 3'-UTR-элемента искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно определять с помощью любого пригодного для этой цели метода, известного специалисту в данной области. Например, можно создавать искусственные молекулы мРНК, содержащие кодирующую последовательность/открытую рамку считывания (ОРС) для репортерного белка, такого как люцифераза, и не содержащие 3'-UTR, содержащие 3'-UTR, происходящую из встречающегося в естественных условиях гена рибосомального белка, 3'-UTR, происходящую из референс-гена (т.е. референс-3'-UTR, такую как 3'-UTR, встречающаяся в естественных условиях с ОРС), в качестве 3'-UTR вариант 3'-UTR гена рибосомального белка, в качестве 3'-UTR фрагмент гена встречающегося в естественных условиях рибосомального белка, или в качестве 3'-UTR фрагмент варианта 3'-UTR гена рибосомального белка. Такие мРНК можно создавать, например, путем транскрипции in vitro соответствующих векторов, таких как плазмидные векторы, например, содержащие промотор Т7 и последовательность, кодирующую соответствующие последовательности мРНК. Созданными молекулами мРНК можно трансфектировать клетки с помощью метода трансфекции, пригодного для трансфекции мРНК, например, их можно интродуцировать путем электропорации в клетки млекопитающих, такие как HELA-клетки, и можно анализировать образцы в определенные моменты времени после трансфекции, например, через 6, 24, 48 и 72 ч после трансфекции. Указанные образцы можно анализировать для оценки количеств мРНК и/или количеств белка с помощью методов, хорошо известных специалистам в данной области. Например, количества репортерной мРНК, присутствующей в клетках в моменты времени взятия образцов, можно определять с помощью методов количественной ПЦР. Количества репортерного белка, кодируемого соответствующими мРНК, можно определять, например, с помощью вестерн-блоттинга, ELISA, FACS-анализа или репортерных анализов, таких как анализы люциферазы, в зависимости от используемого репортерного белка. Эффект стабилизации экспрессии белка и/или пролонгирования экспрессии белка можно анализировать, например, путем определения отношения уровня белка, обнаруженного через 48 ч после трансфекции и уровня белка, обнаруженного через 6 ч после трансфекции. Предпочтительно величина такого отношения превышает 1, т.е. экспрессия белка в более поздний момент времени больше, чем экспрессия белка в более ранний момент времени. Если величина такого отношения меньше 1, то белок тем более стабилен, чем ближе указанная величина к 1. Такие измерения можно, конечно, проводить также и через 72 ч или более, и для определения стабильности экспрессии белка можно определять отношение уровня белка, обнаруженного через 72 ч после трансфекции к уровню белка, обнаруженному через 6 ч после трансфекции.Stabilizing effect on mRNA and/or protein production and efficiency, and/or increasing protein production effect and efficiency of variants, fragments and/or fragments of variants of the 3'-UTR gene of the ribosomal protein, as well as stabilizing effect on mRNA and/or protein production and efficiency , and/or the protein production-enhancing activity and potency of at least one 3'UTR element of the artificial nucleic acid molecule of the present invention can be determined by any suitable method known to one skilled in the art. For example, one can create artificial mRNA molecules containing the coding sequence/open reading frame (ORF) for a reporter protein such as luciferase and not containing a 3'-UTR, containing a 3'-UTR derived from a naturally occurring ribosomal protein gene, 3'-UTR derived from a reference gene (i.e., a reference 3'-UTR, such as the naturally occurring 3'-UTR with ORF), as a 3'-UTR variant of the 3'-UTR of the ribosomal gene protein, as a 3'-UTR fragment of a naturally occurring ribosomal protein gene, or as a 3'-UTR fragment of a 3'-UTR variant of a ribosomal protein gene. Such mRNAs can be generated, for example, by in vitro transcription of appropriate vectors, such as plasmid vectors, for example, containing the T7 promoter and a sequence encoding the corresponding mRNA sequences. The generated mRNA molecules can be transfected into cells using a transfection method suitable for mRNA transfection, for example, they can be introduced by electroporation into mammalian cells such as HELA cells, and samples can be analyzed at certain time points after transfection, for example, after 6, 24 , 48 and 72 h after transfection. These samples can be analyzed to estimate mRNA amounts and/or protein amounts using methods well known to those skilled in the art. For example, the amount of reporter mRNA present in the cells at the sampling times can be determined using quantitative PCR methods. The amounts of reporter protein encoded by the respective mRNAs can be determined, for example, by Western blotting, ELISA, FACS analysis, or reporter assays such as luciferase assays, depending on the reporter protein used. The effect of stabilizing protein expression and/or prolonging protein expression can be analyzed, for example, by determining the ratio of the protein level detected 48 hours after transfection to the protein level detected 6 hours after transfection. Preferably, the value of such a ratio is greater than 1, i. e. protein expression at a later time point is greater than protein expression at an earlier time point. If the value of this ratio is less than 1, then the protein is more stable the closer the indicated value is to 1. Such measurements can, of course, also be carried out after 72 hours or more, and to determine the stability of protein expression, the ratio of the protein level detected after 72 h after transfection to the protein level detected 6 h after transfection.

В предпочтительном варианте осуществления изобретения 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, происходит из 3'-UTR-области гена, кодирующего рибосомальный белок, предпочтительно из 3'-UTR-области гена рибосомального белка L9 (RPL9), рибосомального белка L3 (RPL3), рибосомального белка L4 (RPL4), рибосомального белка L5 (RPL5), рибосомального белка L6 (RPL6), рибосомального белка L7 (RPL7), рибосомального белка L7a (RPL7A), рибосомального белка L11 (RPL11), рибосомального белка L12 (RPL12), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L18 (RPL18), рибосомального белка L18a (RPL18A), рибосомального белка L19 (RPL19), рибосомального белка L21 (RPL21), рибосомального белка L22 (RPL22), рибосомального белка L23a (RPL23A), рибосомального белка L17 (RPL17), рибосомального белка L24 (RPL24), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L30 (RPL30), рибосомального белка L27a (RPL27A), рибосомального белка L28 (RPL28), рибосомального белка L29 (RPL29), рибосомального белка L31 (RPL31), рибосомального белка L32 (RPL32), рибосомального белка L35a (RPL35A), рибосомального белка L37 (RPL37), рибосомального белка L37a (RPL37A), рибосомального белка L38 (RPL38), рибосомального белка L39 (RPL39), рибосомального белка, большой субъединицы, РО (RPLP0), рибосомального белка, большой субъединицы, Р1 (RPLP1), рибосомального белка, большой субъединицы, Р2 (RPLP2), рибосомального белка S3 (RPS3), рибосомального белка S3A (RPS3A), рибосомального белка S4, Х-сцепленного (RPS4X), рибосомального белка S4, Y-сцепленного 1 (RPS4Y1), рибосомального белка S5 (RPS5), рибосомального белка S6 (RPS6), рибосомального белка S7 (RPS7), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S10 (RPS10), рибосомального белка S11 (RPS11), рибосомального белка S12 (RPS12), рибосомального белка S13 (RPS13), рибосомального белка S15 (RPS15), рибосомального белка S15a (RPS15A), рибосомального белка S16 (RPS16), рибосомального белка S19 (RPS19), рибосомального белка S20 (RPS20), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S25 (RPS25), рибосомального белка S26 (RPS26), рибосомального белка S27 (RPS27), рибосомального белка S27a (RPS27a), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L15 (RPL15), рибосомального белка S2 (RPS2), рибосомального белка L14 (RPL14), рибосомального белка S14 (RPS14), рибосомального белка L10 (RPL10), рибосомального белка LlOa (RPL10A), рибосомального белка L35 (RPL35), рибосомального белка L13a (RPL13A), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка L41 (RPL41), рибосомального белка S18 (RPS18), рибосомального белка S24 (RPS24), рибосомального белка L8 (RPL8), рибосомального белка L34 (RPL34), рибосомального белка S17 (RPS17), рибосомального белка SA (RPSA) или рибосомального белка S17 (RPS17). В альтернативном варианте осуществления изобретения 3'-UTR-элемент может происходить из гена, кодирующего рибосомальный белок, или из гена, выбранного из генов продукта 1 слияния остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемого (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли, белка 1, подобного рибосомальному белку L22 (RPL22L1), белка, подобного рибосомальному белку L39 (RPL39L), белка, подобного рибосомальному белку L10 (RPL10L), белка, подобного рибосомальному белку L36a (RPL36AL), белка, подобного рибосомальному белку L3 (RPL3L), белка, подобного рибосомальному белку S27 (RPS27L), белка 1, подобного рибосомальному белку L26 1 (RPL26L1), белка 1, подобного рибосомальному белку L7 (RPL7L1), псевдогена рибосомального белка ЫЗа (RPL13AP), псевдогена 8 рибосомального белка L37a (RPL37AP8), псевдогена 5 рибосомального белка S10 (RPS10P5), псевдогена 11 рибосомального белка S26 (RPS26P11), псевдогена 5 рибосомального белка L39 (RPL39P5), псевдогена 6 рибосомального белка, большой субъединицы, РО (RPLP0P6) и псевдогена 14 рибосомального белка L36 (RPL36P14). Кроме того, 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно происходит из 3'-UTR-области гена, выбранного из группы, состоящей из генов белка, подобного рибосомальному белку S4 (RPS41), предполагаемой субъединицы 60S рибосомального белка L13a, предполагаемой субъединицы 60S белка, подобного рибосомальному белку L37a, предполагаемой субъединицы 40S белка, подобного рибосомальному белку S10, предполагаемой субъединицы 40S белка 1, подобного рибосомальному белку S26, предполагаемой субъединицы 60S белка 5, подобного рибосомальному белку L39, или субъединицы 60S белка, подобного кислому рибосомальному белку Р0.In a preferred embodiment, the 3'UTR element of the artificial nucleic acid molecule of the present invention is derived from the 3'UTR region of a gene encoding a ribosomal protein, preferably from the 3'UTR region of a ribosomal protein L9 (RPL9) gene. , ribosomal protein L3 (RPL3), ribosomal protein L4 (RPL4), ribosomal protein L5 (RPL5), ribosomal protein L6 (RPL6), ribosomal protein L7 (RPL7), ribosomal protein L7a (RPL7A), ribosomal protein L11 (RPL11), ribosomal protein L12 (RPL12), ribosomal protein L13 (RPL13), ribosomal protein L23 (RPL23), ribosomal protein L18 (RPL18), ribosomal protein L18a (RPL18A), ribosomal protein L19 (RPL19), ribosomal protein L21 (RPL21), ribosomal protein L22 (RPL22), ribosomal protein L23a (RPL23A), ribosomal protein L17 (RPL17), ribosomal protein L24 (RPL24), ribosomal protein L26 (RPL26), ribosomal protein L27 (RPL27), ribosomal protein L30 (RPL30), ri bosomal protein L27a (RPL27A), ribosomal protein L28 (RPL28), ribosomal protein L29 (RPL29), ribosomal protein L31 (RPL31), ribosomal protein L32 (RPL32), ribosomal protein L35a (RPL35A), ribosomal protein L37 (RPL37), ribosomal protein L37a (RPL37A), ribosomal protein L38 (RPL38), ribosomal protein L39 (RPL39), ribosomal protein, large subunit, PO (RPLP0), ribosomal protein, large subunit, P1 (RPLP1), ribosomal protein, large subunit, P2 ( RPLP2), ribosomal protein S3 (RPS3), ribosomal protein S3A (RPS3A), ribosomal protein S4, X-linked (RPS4X), ribosomal protein S4, Y-linked 1 (RPS4Y1), ribosomal protein S5 (RPS5), ribosomal protein S6 (RPS6), ribosomal protein S7 (RPS7), ribosomal protein S8 (RPS8), ribosomal protein S9 (RPS9), ribosomal protein S10 (RPS10), ribosomal protein S11 (RPS11), ribosomal protein S12 (RPS12), ribosomal protein S13 ( RPS13), ribosomal protein S15 (RPS1 5), ribosomal protein S15a (RPS15A), ribosomal protein S16 (RPS16), ribosomal protein S19 (RPS19), ribosomal protein S20 (RPS20), ribosomal protein S21 (RPS21), ribosomal protein S23 (RPS23), ribosomal protein S25 (RPS25 ), ribosomal protein S26 (RPS26), ribosomal protein S27 (RPS27), ribosomal protein S27a (RPS27a), ribosomal protein S28 (RPS28), ribosomal protein S29 (RPS29), ribosomal protein L15 (RPL15), ribosomal protein S2 (RPS2) , ribosomal protein L14 (RPL14), ribosomal protein S14 (RPS14), ribosomal protein L10 (RPL10), ribosomal protein LlOa (RPL10A), ribosomal protein L35 (RPL35), ribosomal protein L13a (RPL13A), ribosomal protein L36 (RPL36), ribosomal protein L36a (RPL36A), ribosomal protein L41 (RPL41), ribosomal protein S18 (RPS18), ribosomal protein S24 (RPS24), ribosomal protein L8 (RPL8), ribosomal protein L34 (RPL34), ribosomal protein S17 (RPS17), ribosomal protein SA (RPSA) or rib osomal protein S17 (RPS17). In an alternative embodiment, the 3'-UTR element may be derived from a gene encoding a ribosomal protein or from a gene selected from the fusion product 1 genes of ubiquitin residue A-52-ribosomal protein (UBA52), a ubiquitously expressed (FAU) mouse sarcoma virus Finkel-Bisquis-Reilly protein 1, ribosomal protein L22 like (RPL22L1), ribosomal protein L39 like protein (RPL39L), ribosomal protein L10 like protein (RPL10L), ribosomal protein L36a like protein (RPL36AL), protein like ribosomal protein L3 (RPL3L), ribosomal protein S27 like protein (RPS27L), ribosomal protein L26 like protein 1 1 (RPL26L1), ribosomal protein 1 like protein L7 (RPL7L1), ribosomal protein n3a pseudogene (RPL13AP), pseudogene 8 ribosomal protein L37a (RPL37AP8), ribosomal protein S10 pseudogene 5 (RPS10P5), ribosomal protein S26 pseudogene 11 (RPS26P11), ribosomal protein L39 pseudogene 5 (RPL39P5), ri pseudogene 6 bosomal protein, large subunit, PO (RPLP0P6); and ribosomal protein L36 pseudogene 14 (RPL36P14). In addition, the 3'UTR element of the artificial nucleic acid molecule of the present invention is preferably derived from the 3'UTR region of a gene selected from the group consisting of genes for a protein like ribosomal protein S4 (RPS41), a putative 60S subunit. ribosomal protein L13a, putative subunit of the 60S protein like ribosomal protein L37a, putative subunit of the 40S protein like ribosomal protein S10, putative subunit of the 40S protein 1 like ribosomal protein S26, putative subunit of the 60S protein 5 like ribosomal protein L39, or subunit of the 60S protein , similar to the acidic ribosomal protein P0.

В наиболее предпочтительном варианте осуществления изобретения 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, происходит из 3'-UTR-области гена, кодирующего рибосомальный белок, предпочтительно из 3'-UTR-области гена рибосомального белка L3 (RPL3), рибосомального белка L11 (RPL11), рибосомального белка L13 (RPL13), рибосомального белка L23 (RPL23), рибосомального белка L23a (RPL23A), рибосомального белка L26 (RPL26), рибосомального белка L27 (RPL27), рибосомального белка L35a (RPL35A), рибосомального белка L38 (RPL38), рибосомального белка S4, Х-сцепленного (RPS4X), рибосомального белка S8 (RPS8), рибосомального белка S9 (RPS9), рибосомального белка S13 (RPS13), рибосомального белка S19 (RPS19), рибосомального белка S21 (RPS21), рибосомального белка S23 (RPS23), рибосомального белка S27 (RPS27), рибосомального белка S28 (RPS28), рибосомального белка S29 (RPS29), рибосомального белка L36 (RPL36), рибосомального белка L36a (RPL36A), рибосомального белка S18 (RPS18) или рибосомального белка S17 (RPS17). В другом предпочтительном варианте осуществления изобретения 3'-UTR-элемент может происходить из гена, кодирующего рибосомальный белок, или из гена, выбранного из генов продукта 1 слияния остаток убиквитина А-52-рибосомальный белок (UBA52), повсеместно экспрессируемого (FAU) вируса мышиной саркомы Финкеля-Бискиса-Рейли или белка 1, подобного рибосомальному белку L22 (RPL22L1).In the most preferred embodiment of the invention, the 3'UTR element of the artificial nucleic acid molecule of the present invention is derived from the 3'UTR region of the gene encoding the ribosomal protein, preferably from the 3'UTR region of the ribosomal protein L3 gene (RPL3 ), ribosomal protein L11 (RPL11), ribosomal protein L13 (RPL13), ribosomal protein L23 (RPL23), ribosomal protein L23a (RPL23A), ribosomal protein L26 (RPL26), ribosomal protein L27 (RPL27), ribosomal protein L35a (RPL35A) , ribosomal protein L38 (RPL38), ribosomal protein S4, X-linked (RPS4X), ribosomal protein S8 (RPS8), ribosomal protein S9 (RPS9), ribosomal protein S13 (RPS13), ribosomal protein S19 (RPS19), ribosomal protein S21 (RPS21), ribosomal protein S23 (RPS23), ribosomal protein S27 (RPS27), ribosomal protein S28 (RPS28), ribosomal protein S29 (RPS29), ribosomal protein L36 (RPL36), ribosomal protein L36a (RPL36A), ribosome omal protein S18 (RPS18) or ribosomal protein S17 (RPS17). In another preferred embodiment of the invention, the 3'-UTR element may be derived from a gene encoding a ribosomal protein or from a gene selected from the fusion product 1 genes of the ubiquitin residue A-52-ribosomal protein (UBA52), a ubiquitously expressed (FAU) mouse virus Finkel-Biskis-Reilly sarcoma or protein 1 like ribosomal protein L22 (RPL22L1).

Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, идентичной по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как нуклеотидная последовательность, представленная в SEQ ID NO: 10-115 или соответствующей последовательности РНК:Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 1, 2, 3, 4, 5, 10, 15, 20, 30% or 40%, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90% %, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 3'-UTR of the ribosomal protein gene, such as the nucleotide sequence shown in SEQ ID NO: 10-115 or the corresponding RNA sequence:

Кроме того, предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как нуклеотидная последовательность, представленная в SEQ ID NO: 116-205 или соответствующей последовательности РНК:Further preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 1, 2, 3, 4, 5, 10, 15%, 20%, 30% or 40%, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 3'-UTR of a ribosomal protein gene, such as the nucleotide sequence shown in SEQ ID NO: 116-205 or corresponding RNA sequence:

В предпочтительном варианте осуществления изобретения по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% последовательности 3'-UTR гена рибосомального белка малой субъединицы 9 (RPS9). Наиболее предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, содержит или состоит из нуклеотидной последовательности, которая идентична по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% SEQ ID NO: 1 или SEQ ID NO: 2:In a preferred embodiment of the invention, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 40%, preferably at least about 50% identical , preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the 3'-UTR sequence of the ribosomal small subunit protein 9 (RPS9) gene. Most preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention contains or consists of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% SEQ ID NO: 1 or SEQ ID NO: 2:

По меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, может также содержать или состоять из фрагмента нуклеотидной последовательности, который идентичен по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как 3'-UTR, имеющая последовательность, представленную в SEQ ID NO: 10-205, где фрагмент предпочтительно представляет собой функциональный фрагмент или функциональный фрагмент варианта, описанный выше. Такой фрагмент предпочтительно имеет длину, составляющую по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотида, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. В предпочтительном варианте осуществления изобретения фрагмент или его вариант имеет длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов.At least one 3'-UTR element of the artificial nucleic acid molecule of the present invention may also contain or consist of a nucleotide sequence fragment that is at least about 40% identical, preferably at least about 50% identical, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 3'UTR of a ribosomal protein gene, such as the 3'UTR having the sequence shown in SEQ ID NOs: 10-205, where the fragment is preferably functional fragment or functional fragment of the variant described above. Such a fragment is preferably at least about 3 nucleotides in length, preferably at least about 5 nucleotides, more preferably at least about 10, 15, 20, 25 or 30 nucleotides, even more preferably at least about 50 nucleotides, most preferably at least about 70 nucleotides. In a preferred embodiment, the fragment or variant thereof is 3 to about 500 nucleotides in length, preferably 5 to about 150 nucleotides, more preferably 10 to 100 nucleotides, even more preferably 15 to 90, most preferably 20 to 70 nucleotides.

Предпочтительно указанные варианты, фрагменты или фрагменты вариантов представляют собой функциональные варианты, функциональные фрагменты или функциональные фрагменты вариантов, описанные выше, которые обладают по меньшей мере одной функцией, присущей нуклеотидной последовательности, представленной в SEQ ID NO: 10-205, такой как стабилизация искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, стабилизация и/или пролонгирование экспрессии белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, и/или увеличение производства белка, предпочтительно с эффективностью, составляющей по меньшей мере 40%, более предпочтительно по меньшей мере 50%, более предпочтительно по меньшей мере 60%, еще более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80%, наиболее предпочтительно по меньшей мере 90% от эффективности стабилизации и/или эффективности увеличения производства белка с искусственной молекулы нуклеиновой кислоты, содержащей нуклеотидную последовательность, представленную в SEQ ID NO: 1 или SEQ ID NO: 2.Preferably, said variants, fragments or fragments of variants are functional variants, functional fragments or functional fragments of the variants described above, which have at least one function inherent in the nucleotide sequence shown in SEQ ID NO: 10-205, such as stabilization of an artificial molecule nucleic acid according to the invention, stabilization and/or prolongation of protein expression from an artificial nucleic acid molecule according to the invention, and/or increase in protein production, preferably with an efficiency of at least 40%, more preferably at least 50%, more preferably at least 60%, even more preferably at least 70%, even more preferably at least 80%, most preferably at least 90% of the stabilization efficiency and/or the efficiency of increasing protein production from the artificial nucleic acid molecule, with containing the nucleotide sequence shown in SEQ ID NO: 1 or SEQ ID NO: 2.

Предпочтительно по меньшей мере один 3'-UTR-элемент искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, имеет длину, составляющую по меньшей мере примерно 3 нуклеотида, предпочтительно по меньшей мере примерно 5 нуклеотида, более предпочтительно по меньшей мере примерно 10, 15, 20, 25 или 30 нуклеотидов, еще более предпочтительно по меньшей мере примерно 50 нуклеотидов, наиболее предпочтительно по меньшей мере примерно 70 нуклеотидов. Верхний предел длины 3'-UTR-элемента может составлять 500 нуклеотидов или менее, например, 400, 300, 200, 150 или 100 нуклеотидов. В других вариантах осуществления изобретения верхний предел может быть выбран из диапазона от 50 до 100 нуклеотидов. Например, фрагмент или вариант может иметь длину от 3 до примерно 500 нуклеотидов, предпочтительно от 5 до примерно 150 нуклеотидов, более предпочтительно от 10 до 100 нуклеотидов, еще более предпочтительно от 15 до 90, наиболее предпочтительно от 20 до 70 нуклеотидов.Preferably, at least one 3'-UTR element of the artificial nucleic acid molecule of the present invention is at least about 3 nucleotides in length, preferably at least about 5 nucleotides, more preferably at least about 10, 15, 20, 25 or 30 nucleotides, even more preferably at least about 50 nucleotides, most preferably at least about 70 nucleotides. The upper limit of the length of the 3'UTR element may be 500 nucleotides or less, such as 400, 300, 200, 150 or 100 nucleotides. In other embodiments, the upper limit may be selected from the range of 50 to 100 nucleotides. For example, a fragment or variant may be from 3 to about 500 nucleotides in length, preferably from 5 to about 150 nucleotides, more preferably from 10 to 100 nucleotides, even more preferably from 15 to 90, most preferably from 20 to 70 nucleotides.

Кроме того, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать более одного 3'-UTR-элемента, описанного выше. Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать один, два, три четыре или большее количество 3'-UTR-элементов, при этом индивидуальные 3'-UTR-элементы могут быть одинаковыми или могут быть различными. Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать два практически идентичных 3'-UTR-элемента, описанных выше, например, два 3'-UTR-элемента, содержащих или состоящих из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка, например, из последовательности, представленной в SEQ ID NO: 10-205, или из фрагмента или варианта 3'-UTR гена рибосомального белка, имеющего нуклеотидную последовательность, представленную в SEQ ID NO: 1 или 2, его функциональных вариантов, его функциональных фрагментов или функциональных фрагментов вариантов, описанных выше.In addition, the artificial nucleic acid molecule of the present invention may contain more than one 3'-UTR element as described above. For example, an artificial nucleic acid molecule of the present invention may contain one, two, three, four or more 3'-UTR elements, and the individual 3'-UTR elements may be the same or may be different. For example, an artificial nucleic acid molecule of the present invention may contain two substantially identical 3'-UTR elements as described above, for example, two 3'-UTR elements containing or consisting of a nucleotide sequence derived from the 3'-UTR a ribosomal protein gene, for example, from the sequence shown in SEQ ID NO: 10-205, or from a fragment or variant of the 3'-UTR of the ribosomal protein gene having the nucleotide sequence shown in SEQ ID NO: 1 or 2, its functional variants, its functional fragments or functional fragments of the variants described above.

При создании изобретения неожиданно было установлено, что искусственная молекула нуклеиновой кислоты, содержащая 3'-UTR-элемент, описанный выше, может представлять собой или позволяет создавать молекулу мРНК, которая обеспечивает повышенное, пролонгированное и/или стабилизированное производство белка. Так, 3'-UTR-элемент, представленный в настоящем описании, может повышать стабильность экспрессии белка с молекулы мРНК и/или повышать эффективность трансляции.The invention has surprisingly found that an artificial nucleic acid molecule containing the 3'-UTR element described above can be or allows the creation of an mRNA molecule that provides increased, prolonged and/or stabilized protein production. Thus, the 3'-UTR element provided herein can increase the stability of protein expression from an mRNA molecule and/or increase translation efficiency.

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может представлять собой РНК, такую как мРНК, ДНК, такую как векторная ДНК, или может представлять собой модифицированную молекулу РНК или ДНК. Она может находиться в виде двухцепочечной молекулы, имеющей смысловую цепь и антисмысловую цепь, например, в виде молекулы ДНК, имеющей смысловую цепь и антисмысловую цепь.The artificial nucleic acid molecule of the present invention may be RNA such as mRNA, DNA such as vector DNA, or may be a modified RNA or DNA molecule. It may be in the form of a double-stranded molecule having a sense strand and an antisense strand, such as a DNA molecule having a sense strand and an antisense strand.

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, кроме того, может необязательно содержать 5'-UTR и/или 5'-кэп. Необязательные 5'-кэп и/или 5'-UTR предпочтительно расположены с 5'-стороны относительно ОРС в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении.The artificial nucleic acid molecule of the present invention may also optionally contain a 5'-UTR and/or a 5'-cap. The optional 5' cap and/or 5' UTR are preferably located 5' to the ORF in the artificial nucleic acid molecule of the present invention.

Предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит также поли(А)-последовательность и/или сигнал полиаденилирования. Предпочтительно необязательная поли(А)-последовательность расположена с 3'-стороны относительно по меньшей мере одного 3'-UTR-элемента, предпочтительно необязательная поли(А)-последовательность присоединена к 3'-концу 3'-UTR-элемента. Соединение может осуществляться непосредственно или косвенным образом посредством сегмента, состоящего из 2, 4, 6, 8, 10, 20 и т.д. нуклеотидов, такой как линкер, состоящий из 1-50, предпочтительно из 1-20 нуклеотидов, например, содержащий или состоящий из одного или нескольких сайтов рестрикции.Preferably, the artificial nucleic acid molecule of the present invention also contains a poly(A) sequence and/or a polyadenylation signal. Preferably the optional poly(A) sequence is located 3' to the at least one 3' UTR element, preferably the optional poly(A) sequence is attached to the 3' end of the 3' UTR element. The connection may be made directly or indirectly by means of a segment consisting of 2, 4, 6, 8, 10, 20, etc. nucleotides, such as a linker consisting of 1-50, preferably 1-20 nucleotides, for example containing or consisting of one or more restriction sites.

В одном из вариантов осуществления изобретения необязательный сигнал полиаденилирования расположен в прямом направлении с 3'-стороны 3'-UTR-элемента. Предпочтительно сигнал полиаденилирования содержит консенсусную последовательность NN(U/T)ANA, в которой N обозначает А или U, предпочтительно AA(U/T)AAA или A(U/T)(U/T)AAA. Такая консенсусная последовательность может распознаваться большинством систем на основе клеток животных и бактериальных клеток, например, факторами полиаденилирования, такими как фактор специфичности расщепления/полиаденилирования (CPSF), в сочетании с CstF, PAP, РАВ2, CFI и/или CFII. Предпочтительно сигнал полиаденилирования, предпочтительно представляющий собой консенсусную последовательность NNUANA, расположен на расстоянии менее чем примерно 50 нуклеотидов, более предпочтительно менее чем примерно 30 оснований, наиболее предпочтительно менее чем примерно 25 оснований, например, на расстоянии 21 основания, в прямом направлении относительно 3'-конца 3'-UTR-элемента.In one embodiment, the optional polyadenylation signal is located downstream of the 3' side of the 3' UTR element. Preferably, the polyadenylation signal contains the NN(U/T)ANA consensus sequence in which N is A or U, preferably AA(U/T)AAA or A(U/T)(U/T)AAA. Such a consensus sequence can be recognized by most animal and bacterial cell systems, for example, polyadenylation factors such as cleavage/polyadenylation specificity factor (CPSF) in combination with CstF, PAP, PAB2, CFI and/or CFII. Preferably, the polyadenylation signal, preferably the NNUANA consensus sequence, is less than about 50 nucleotides away, more preferably less than about 30 bases, most preferably less than about 25 bases, e.g., 21 bases away, in the forward direction from 3'- end of the 3'-UTR element.

Транскрипция искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, искусственной молекулы ДНК, содержащей сигнал полиаденилирования, расположенный в прямом направлении относительно 3'-UTR-элемента, должна приводить к получению незрелой РНК, содержащей сигнал полиаденилирования, в прямом направлении относительно ее 3'-UTR-элемента. Например, транскрипция молекулы ДНК, содержащей 3'-UTR-элемент, имеющий SEQ ID NO: 1, должна приводить к получению РНК, несущей 3'-UTR-элемент, имеющий последовательность SEQ ID NO: 2.Transcription of an artificial nucleic acid molecule of the present invention, for example, an artificial DNA molecule containing a polyadenylation signal located in the forward direction relative to the 3'-UTR element, should result in an immature RNA containing a polyadenylation signal in the forward direction relative to its 3 '-UTR of element. For example, transcription of a DNA molecule containing a 3'UTR element having SEQ ID NO: 1 should result in an RNA carrying a 3'UTR element having the sequence of SEQ ID NO: 2.

Затем при использовании соответствующей системы транскрипции должно происходить присоединение поли(А)-последовательности к незрелой РНК. Например, предлагаемая в изобретении искусственная молекула нуклеиновой кислоты может представлять собой молекулу ДНК, содержащую 3'-UTR-элемент, описанный выше, и сигнал полиаденилирования, который может приводить к полиаденилированию РНК после транскрипции указанной молекулы ДНК. Следовательно, образовавшаяся РНК может содержать комбинацию предлагаемого в изобретении 3'-UTR-элемента, за которым располагается поли(А)-последовательность.The addition of the poly(A) sequence to the immature RNA must then occur using an appropriate transcription system. For example, an artificial nucleic acid molecule according to the invention may be a DNA molecule containing a 3'-UTR element as described above and a polyadenylation signal that can lead to RNA polyadenylation after transcription of said DNA molecule. Therefore, the resulting RNA may contain a combination of the 3'UTR element of the invention followed by the poly(A) sequence.

Возможными системами транскрипции являются системы транскрипции in vitro или клеточные системы транскрипции и т.д. Таким образом, транскрипция искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, например, транскрипции искусственной молекулы нуклеиновой кислоты, содержащей открытую рамку считывания, 3'-UTR-элемент и сигнал полиаденилирования, может приводить к получению молекулы мРНК, содержащей открытую рамку считывания, 3'-UTR-элемент и поли(А)-последовательность.Possible transcription systems are in vitro transcription systems or cellular transcription systems, etc. Thus, transcription of an artificial nucleic acid molecule of the invention, for example, transcription of an artificial nucleic acid molecule containing an open reading frame, a 3'-UTR element and a polyadenylation signal, can result in an mRNA molecule containing an open reading frame, 3' -UTR element and poly(A) sequence.

Таким образом, в изобретении предложена также искусственная молекула нуклеиновой кислоты, которая представляет собой молекулу мРНК, содержащую открытую рамку считывания, 3'-UTR-элемент, описанный выше, и поли(А)-последовательность.Thus, the invention also provides an artificial nucleic acid molecule, which is an mRNA molecule containing an open reading frame, a 3'-UTR element as described above, and a poly(A) sequence.

Один из вариантов осуществления изобретения относится к искусственной молекуле нуклеиновой кислоты, которая представляет собой искусственную молекулу ДНК, содержащую открытую рамку считывания и последовательность, представленную в SEQ ID NO: 1 или последовательность, идентичную по меньшей мере примерно на 40% или более SEQ ID NO: 1, или ее фрагмент, описанный выше. Кроме того, в изобретении предложена искусственная молекула нуклеиновой кислоты, которая представляет собой искусственную молекулу РНК, содержащую открытую рамку считывания и последовательность, представленную в SEQ ID NO: 2 или последовательность, идентичную по меньшей мере примерно на 40% или более SEQ ID NO: 2, или ее фрагмент, описанный выше.One embodiment of the invention relates to an artificial nucleic acid molecule, which is an artificial DNA molecule containing an open reading frame and a sequence shown in SEQ ID NO: 1 or a sequence that is at least about 40% or more identical to SEQ ID NO: 1, or its fragment described above. In addition, the invention provides an artificial nucleic acid molecule, which is an artificial RNA molecule containing an open reading frame and a sequence shown in SEQ ID NO: 2 or a sequence that is at least about 40% or more identical to SEQ ID NO: 2 , or its fragment described above.

Таким образом, в изобретении предложена также искусственная молекула нуклеиновой кислоты, которая может служить в качестве матрицы для молекулы РНК, предпочтительно для молекулы мРНК, которая стабилизирована и оптимизирована в отношении эффективности трансляции. Иными словами, искусственная молекула нуклеиновой кислоты может представлять собой ДНК, которую можно применять в качестве матрицы для получения мРНК. мРНК, которую можно получать таким путем, может, в свою очередь, транслироваться с получением требуемого пептида или белка, кодируемого открытой рамкой считывания. Если искусственная молекула нуклеиновой кислоты представляет собой ДНК, то ее можно, например, использовать в качестве двухцепочечной формы хранения для продолжения и повторения производства мРНК in vitro или in vivo.Thus, the invention also provides an artificial nucleic acid molecule that can serve as a template for an RNA molecule, preferably an mRNA molecule, which is stabilized and optimized for translation efficiency. In other words, the artificial nucleic acid molecule may be DNA, which can be used as a template to obtain mRNA. mRNA that can be obtained in this way can, in turn, be translated to obtain the desired peptide or protein encoded by the open reading frame. If the artificial nucleic acid molecule is DNA, then it can, for example, be used as a double-stranded storage form to continue and repeat the production of mRNA in vitro or in vivo.

В другом варианте осуществления изобретения 3'-UTR искусственной молекулы нуклеиновой кислоты, предлагаемая в изобретении, не содержит сигнал полиаденилирования или поли(А)-последовательность. Кроме того, предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, не содержит сигнал полиаденилирования или поли(А)-последовательность. Более предпочтительно 3'-UTR искусственной молекулы нуклеиновой кислоты или сама предлагаемая в изобретении искусственная молекула нуклеиновой кислоты не содержит сигнал полиаденилирования, прежде всего не содержит сигнал полиаденилирования AAU/TAAA.In another embodiment, the 3'UTR of the artificial nucleic acid molecule of the invention does not contain a polyadenylation signal or poly(A) sequence. In addition, preferably the artificial nucleic acid molecule of the invention does not contain a polyadenylation signal or a poly(A) sequence. More preferably, the 3'-UTR of the artificial nucleic acid molecule, or the artificial nucleic acid molecule itself according to the invention, does not contain a polyadenylation signal, in particular does not contain an AAU/TAAA polyadenylation signal.

В одном из вариантов осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит также поли(А)-последовательность. Например, молекула ДНК, содержащая ОРС, за которой следует рибосомальная 3'-UTR, может содержать состоящий из тимидиновых нуклеотидов сегмент, который может транскрибироваться в поли(А)-последовательность в образующейся мРНК. Длина поли(А)-последовательности может варьироваться. Например, поли(А)-последовательность может иметь длину от примерно 20 адениновых нуклеотидов вплоть до 300 адениновых нуклеотидов, предпочтительно от примерно 40 до примерно 200 адениновых нуклеотидов, более предпочтительно от примерно 50 до примерно 100 адениновых нуклеотидов, например, примерно 60, 70, 80, 90 или 100 адениновых нуклеотидов. Наиболее предпочтительно предлагаемая в изобретении нуклеиновая кислота содержит поли(А)-последовательность, содержащую от примерно 60 до примерно 70 нуклеотидов, наиболее предпочтительно 64 адениновых нуклеотида.In one embodiment, the artificial nucleic acid molecule of the present invention also contains a poly(A) sequence. For example, a DNA molecule containing an ORF followed by a ribosomal 3'-UTR may contain a thymidine nucleotide segment that can be transcribed into a poly(A) sequence in the resulting mRNA. The length of the poly(A) sequence may vary. For example, the poly(A) sequence may be from about 20 adenine nucleotides up to 300 adenine nucleotides in length, preferably from about 40 to about 200 adenine nucleotides, more preferably from about 50 to about 100 adenine nucleotides, for example, about 60, 70, 80, 90 or 100 adenine nucleotides. Most preferably, the inventive nucleic acid comprises a poly(A) sequence of about 60 to about 70 nucleotides, most preferably 64 adenine nucleotides.

Например, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать нуклеотидную последовательность, соответствующую последовательности ДНК:For example, an artificial nucleic acid molecule of the present invention may contain a nucleotide sequence corresponding to a DNA sequence:

Транскрипция указанных последовательностей может приводить к получению искусственных молекул нуклеиновой кислоты, содержащих последовательность:Transcription of these sequences can lead to the production of artificial nucleic acid molecules containing the sequence:

Такие искусственные молекулы РНК, т.е. искусственные молекулы нуклеиновой кислоты, содержащие последовательность, представленную в SEQ ID NO: 4, можно также получать in vitro с помощью обычных методов химического синтеза, при этом не требуется осуществлять транскрипцию с ДНК-предшественника.Such artificial RNA molecules, i.e. artificial nucleic acid molecules containing the sequence shown in SEQ ID NO: 4, can also be obtained in vitro using conventional methods of chemical synthesis, and it is not necessary to carry out transcription from the precursor DNA.

В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, представляет собой молекулу РНК, предпочтительно молекулу РНК, содержащую в 5'→3'-направлении открытую рамку считывания, 3'-UTR-элемент, описанный выше, и поли(А)-последовательность.In the most preferred embodiment of the invention, the artificial nucleic acid molecule of the present invention is an RNA molecule, preferably an RNA molecule containing in the 5'→3' direction an open reading frame, a 3'-UTR element as described above, and a poly (A)-sequence.

Предпочтительно открытая рамка считывания не кодирует рибосомальный белок. В предпочтительном варианте осуществления изобретения открытая рамка считывания не кодирует рибосомальный белок, из которого происходит 3'-UTR-элемент предлагаемой в изобретении нуклеиновой кислоты, прежде всего не кодирует рибосомальный белок млекопитающих, при условии, что 3'-UTR-элемент идентичен 3'-UTR гена рибосомального белка млекопитающих. В некоторых других вариантах осуществления изобретения открытая рамка считывания не кодирует RPS9 или его варианты, при условии, что 3'-UTR-элемент имеет последовательность, идентичную SEQ ID NO: 1 или SEQ ID NO: 2.Preferably, the open reading frame does not encode a ribosomal protein. In a preferred embodiment of the invention, the open reading frame does not encode the ribosomal protein from which the 3'-UTR element of the inventive nucleic acid is derived, primarily does not encode the mammalian ribosomal protein, provided that the 3'-UTR element is identical to the 3'- Mammalian ribosomal protein UTR. In some other embodiments, the open reading frame does not encode RPS9 or variants thereof, provided that the 3'-UTR element has a sequence identical to SEQ ID NO: 1 or SEQ ID NO: 2.

В предпочтительном варианте осуществления изобретения ОРС не кодирует рибосомальные белки человека или растения, прежде всего Arabidopsis, прежде всего не кодирует человеческий рибосомальный белок S6 (RPS6), белок, подобный человеческому рибосомальному белку L36a (RPL36AL), или рибосомальный белок Arabidopsis S16 (RPS16). В другом предпочтительном варианте осуществления изобретения открытая рамка считывания (ОРС) не кодирует рибосомальный белок S6 (RPS6), белок, подобный рибосомальному белку L36a (RPL36AL) или рибосомальный белок S16 (RPS16) вне зависимости от его происхождения.In a preferred embodiment of the invention, the ORF does not encode human or plant ribosomal proteins, especially Arabidopsis, primarily does not encode human ribosomal protein S6 (RPS6), human ribosomal protein L36a like protein (RPL36AL), or Arabidopsis ribosomal protein S16 (RPS16). In another preferred embodiment, the open reading frame (ORF) does not encode ribosomal protein S6 (RPS6), ribosomal protein L36a (RPL36AL) or ribosomal protein S16 (RPS16), regardless of its origin.

Один из вариантов осуществления изобретения относится к искусственной молекул ДНК, содержащей открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элемент, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 1; сигнал полиаденилирования и/или поли(А)-последовательность. Кроме того, в изобретении предложена искусственная молекула ДНК, содержащая открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует любой пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элемент, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 3.One embodiment of the invention relates to artificial DNA molecules containing an open reading frame, preferably an open reading frame, which encodes a peptide or protein other than the ribosomal protein from which the 3'-UTR is derived; 3'UTR element containing or consisting of at least about 60% sequence identity, preferably at least about 70% identity, more preferably at least about 80% identity, more preferably at least about 90% identity , even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of the sequence shown in SEQ ID NO: 1; polyadenylation signal and/or poly(A) sequence. In addition, the invention provides an artificial DNA molecule comprising an open reading frame, preferably an open reading frame, which encodes any peptide or protein other than the ribosomal protein from which the 3'-UTR is derived; 3'UTR element containing or consisting of at least about 60% sequence identity, preferably at least about 70% identity, more preferably at least about 80% identity, more preferably at least about 90% identity , even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of the sequence shown in SEQ ID NO: 3.

Кроме того, в изобретении предложена искусственная молекула РНК, предпочтительно искусственная молекула мРНК или искусственная вирусная молекула РНК, содержащая открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элемент, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 2; и сигнал полиаденилирования и/или поли(А)-последовательность. Кроме того, искусственная молекула РНК, предпочтительно искусственная молекула мРНК или искусственная вирусная молекула РНК, содержащая открытую рамку считывания, предпочтительно открытую рамку считывания, которая кодирует пептид или белок, отличный от рибосомального белка, из которого происходит 3'-UTR; 3'-UTR-элемент, содержащий или состоящий из последовательности, идентичной по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере на 99%; еще более предпочтительно на 100% последовательности, представленной в SEQ ID NO: 4.In addition, the invention provides an artificial RNA molecule, preferably an artificial mRNA molecule or an artificial viral RNA molecule, comprising an open reading frame, preferably an open reading frame, which encodes a peptide or protein other than the ribosomal protein from which the 3'-UTR is derived; 3'UTR element containing or consisting of at least about 60% sequence identity, preferably at least about 70% identity, more preferably at least about 80% identity, more preferably at least about 90% identity , even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of the sequence shown in SEQ ID NO: 2; and a polyadenylation signal and/or a poly(A) sequence. In addition, an artificial RNA molecule, preferably an artificial mRNA molecule or an artificial viral RNA molecule, comprising an open reading frame, preferably an open reading frame, which encodes a peptide or protein other than the ribosomal protein from which the 3'-UTR is derived; 3'UTR element containing or consisting of at least about 60% sequence identity, preferably at least about 70% identity, more preferably at least about 80% identity, more preferably at least about 90% identity , even more preferably at least about 95%; even more preferably at least 99%; even more preferably 100% of the sequence shown in SEQ ID NO: 4.

В изобретении предложена искусственная молекула нуклеиновой кислоты, предпочтительно искусственная мРНК, которая может отличаться тем, что обеспечивает повышенную стабильность и пролонгирование экспрессии кодируемого пептида или белка. Не выдаваясь в какую-либо конкретную теорию, можно считать, что повышенная стабильность экспрессии белка и также пролонгированная экспрессия белка могут быть обусловлены уменьшением разложения искусственной молекулы нуклеиновой кислоты, такой как искусственная молекула мРНК, предлагаемая в настоящем изобретении. Таким образом, предлагаемый в изобретении 3'-UTR-элемент может предупреждать разложение и расщепление искусственной нуклеиновой кислоты.The invention provides an artificial nucleic acid molecule, preferably an artificial mRNA, which may be characterized in that it provides increased stability and prolongation of the expression of the encoded peptide or protein. Without wishing to be bound by any particular theory, it is believed that the increased stability of protein expression and also prolonged protein expression may be due to reduced degradation of an artificial nucleic acid molecule, such as an artificial mRNA molecule of the present invention. Thus, the 3'UTR element of the invention can prevent degradation and cleavage of the artificial nucleic acid.

В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты может содержать гистоновую структуру типа «стебель-петля» в дополнение к нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка. Такая искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать, например, расположенные в 5'→3'-направлении ОРС, 3'-UTR-элемент, необязательную последовательность гистоновой структуры типа «стебель-петля», необязательную поли(А)-последовательность или сигнал полиаденилирования и необязательную поли(С)-последовательность. Она может содержать также расположенные в 5'→3'-направлении ОРС, 3'-UTR-элемент, необязательную поли(А)-последовательность, необязательную поли(С)-последовательность и необязательную последовательность гистоновой структуры типа «стебель-петля».In some embodiments, the artificial nucleic acid molecule may contain a histone stem-loop structure in addition to a nucleotide sequence derived from the 3'-UTR of the ribosomal protein gene. Such an artificial nucleic acid molecule of the present invention may contain, for example, 5'→3' ORFs, a 3'UTR element, an optional stem-loop histone sequence, an optional poly(A) a polyadenylation sequence or signal; and an optional poly(C) sequence. It may also contain a 5'→3' ORF, a 3'UTR element, an optional poly(A) sequence, an optional poly(C) sequence, and an optional stem-loop histone sequence.

В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемой в изобретении, содержит по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля».In a preferred embodiment of the invention, the artificial nucleic acid molecule of the invention contains at least one stem-loop histone sequence.

Последовательность гистоновой структуры типа «стебель-петля», которую можно применять в настоящем изобретении, предпочтительно выбирают по меньшей мере из одной из следующих формул (I) или (II):The stem-loop histone sequence that can be used in the present invention is preferably selected from at least one of the following formulas (I) or (II):

формула (I) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):formula (I) (stem-loop structure sequence without stem boundary elements):

формула (II) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):formula (II) (stem-loop structure sequence with stem boundary elements):

в которых:in which:

пограничные элементы «стебель1 или стебель2» N_1-6 обозначают непрерывную последовательность, состоящую из 1-6, предпочтительно 2-6, более предпочтительно 2-5, еще более предпочтительно 3-5, наиболее предпочтительно 4-5 или 5 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или их нуклеотидного аналога;stem1 or stem2 boundary elements N _1-6 denote a continuous sequence consisting of 1-6, preferably 2-6, more preferably 2-5, even more preferably 3-5, most preferably 4-5 or 5 N, where N each independently selected from a nucleotide selected from A, U, T, G, and C, or a nucleotide analogue thereof;

«стебель1» [n_0-2GN_3-5] обозначает последовательность, обратно комплементарную или частично обратно комплементарную элементу «стебель2», и представляет собой непрерывную последовательность, состоящую из 5-7 нуклеотидов;"stem1" [n _0-2 GN _3-5 ] denotes a sequence reversely complementary or partially reversely complementary to the element "stem2" and is a contiguous sequence of 5-7 nucleotides;

в которой N_0-2 обозначает непрерывную последовательность, состоящую из 0-2, предпочтительно 0-1, более предпочтительно 1 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога; в которой N_3-5 обозначает непрерывную последовательность, состоящую из 3-5, предпочтительно 4-5, более предпочтительно 4 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога, и в которой G обозначает гуанозин или его аналог и необязательно может быть заменен на цитидин или его аналог при условии, что комплементарный ему нуклеотид цитидин в «стебель2» заменен на гуанозин;in which N _0-2 denotes a contiguous sequence consisting of 0-2, preferably 0-1, more preferably 1 N, where N is each independently selected from a nucleotide selected from A, U, T, G and C or its nucleotide analog; in which N _3-5 denotes a contiguous sequence consisting of 3-5, preferably 4-5, more preferably 4 N, where N is each independently selected from a nucleotide selected from A, U, T, G and C or its a nucleotide analog, and in which G is guanosine or an analog thereof and may optionally be replaced by cytidine or an analog thereof, provided that its complementary nucleotide cytidine in stem2 is replaced by guanosine;

последовательность «петли» [N_0-4(U/T)N_0-4] локализована между элементами «стебель1» и «стебель2» и обозначает непрерывную последовательность, состоящую из 3-5 нуклеотидов, более предпочтительно 4 нуклеотидов;the sequence "loop" [N _0-4 (U/T)N _0-4 ] is located between the elements "stem1" and "stem2" and denotes a continuous sequence of 3-5 nucleotides, more preferably 4 nucleotides;

в которой N_0-4 каждый независимо друг от друга обозначает непрерывную последовательность, состоящую из 0-4, предпочтительно 1-3, более предпочтительно 1-2 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога; и в которой U/T обозначает уридин или необязательно тимидин;in which N _0-4 each independently of the other denotes a continuous sequence consisting of 0-4, preferably 1-3, more preferably 1-2 N, where N is each independently selected from a nucleotide selected from A, U, T, G and C or its nucleotide analogue; and wherein U/T is uridine or optionally thymidine;

«стебель2» [N_3-5CN_0-2] обозначает последовательность, обратно комплементарную или частично обратно комплементарную элементу «стебель1», и представляет собой непрерывную последовательность, состоящую из 5-7 нуклеотидов;"stem2" [N _3-5 CN _0-2 ] denotes a sequence reversely complementary or partially reversely complementary to the element "stem1" and is a contiguous sequence of 5-7 nucleotides;

в которой N_3-5 обозначает непрерывную последовательность, состоящую из 3-5, предпочтительно 4-5, более предпочтительно 4 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G и С или его нуклеотидного аналога; в которой N_0-2 обозначает непрерывную последовательность, состоящую из 0-2, предпочтительно 0-1, более предпочтительно 1 N, где N каждый независимо друг от друга выбран из нуклеотида, выбранного из A, U, Т, G или С или его нуклеотидного аналога; иin which N _3-5 denotes a contiguous sequence consisting of 3-5, preferably 4-5, more preferably 4 N, where N is each independently selected from a nucleotide selected from A, U, T, G and C or its nucleotide analog; in which N _0-2 denotes a contiguous sequence consisting of 0-2, preferably 0-1, more preferably 1 N, where N is each independently selected from a nucleotide selected from A, U, T, G or C or its nucleotide analog; and

в которой С обозначает цитидин или его аналог и необязательно может быть заменен на гуанозин или его аналог при условии, что комплементарный ему нуклеотид гуанозин в «стебель1.» заменен на цитидин;in which C denotes cytidine or its analogue and may optionally be replaced by guanosine or its analogue, provided that its complementary nucleotide guanosine in "stem1." replaced by cytidine;

гдеwhere

у элементов «стебель1» и «стебель2» может происходить спаривание оснований друг с другом с образованием обратно комплементарной последовательности, где спаривание оснований может иметь место между «стебель1» и «стебель2», например, посредством спаривания оснований по Уотсону-Крику нуклеотидов А и U/T или G и С, или посредством спаривания оснований не по Уотсону-Крику, например, посредством спаривания «качающихся» оснований («качающегося» спаривания оснований), обратного спариванию оснований по Уотсону-Крику, посредством хугстиновского спаривания оснований, посредством обратного хугстиновскому спаривания оснований, или у них может происходить спаривание оснований друг с другом с образованием частично обратно комплементарной последовательности, при этом неполное спаривание оснований может иметь место между «стебель1» и «стебель2», вследствие того, что для одного или нескольких оснований в одном стебле не имеется комплементарного основания в обратно комплементарной последовательности другого стебля.stem1 and stem2 elements can base-pair with each other to form a reverse complementary sequence, where base-pairing can take place between stem1 and stem2, for example, by Watson-Crick base-pairing of nucleotides A and U /T or G and C, or by non-Watson-Crick base-pairing, e.g., by "wobble" base-pairing ("wobble" base-pairing), the reverse of Watson-Crick base-pairing, by Hoogsteen base-pairing, by the reverse of Hoogsteen base-pairing bases, or they may base-pair with each other to form a partially reversed complementary sequence, with incomplete base-pairing occurring between stem1 and stem2, due to the fact that one or more bases in one stem do not have complementary base in the reverse complementary sequence of each oh stem.

Согласно другому предпочтительному варианту осуществления изобретения мРНК, предлагаемая в настоящем изобретении, может содержать или кодировать по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля», соответствующую по меньшей мере одной из следующих конкретных формул (Ia) или (IIa):According to another preferred embodiment of the invention, the mRNA of the present invention may contain or encode at least one stem-loop histone sequence corresponding to at least one of the following specific formulas (Ia) or (IIa):

формула (Ia) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):formula (Ia) (stem-loop structure sequence without stem boundary elements):

формула (IIa) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):formula (IIa) (stem-loop structure sequence with stem boundary elements):

в которой:wherein:

имеют указанные выше значения.

have the above meanings.

Согласно другому предпочтительному варианту осуществления изобретения мРНК, предлагаемая в настоящем изобретении, может содержать или кодировать по меньшей мере одну последовательность гистоновой структуры типа «стебель-петля», соответствующую по меньшей мере одной из следующих конкретных формул (Ib) или (IIb):According to another preferred embodiment of the invention, the mRNA of the present invention may contain or encode at least one stem-loop histone sequence corresponding to at least one of the following specific formulas (Ib) or (IIb):

формула (Ib) (последовательность структуры типа «стебель-петля» без пограничных элементов стебля):formula (Ib) (stem-loop structure sequence without stem boundary elements):

формула (IIb) (последовательность структуры типа «стебель-петля» с пограничными элементами стебля):formula (IIb) (stem-loop structure sequence with stem boundary elements):

в которой:wherein:

имеют указанные выше значения.

have the above meanings.

Наиболее предпочтительной последовательностью гистоновой структуры типа «стебель-петля» является последовательность, представленная в SEQ ID NO: 5 CAAAGGCTCTTTTCAGAGCCACCA, или более предпочтительно последовательность РНК, соответствующая нуклеотидной последовательности, представленной в SEQ ID NO: 5.The most preferred stem-loop histone sequence is that shown in SEQ ID NO: 5 CAAAGGCTCTTTTCAGAGCCACCA, or more preferably the RNA sequence corresponding to the nucleotide sequence shown in SEQ ID NO: 5.

Например, отдельные элементы могут присутствовать в искусственной молекуле нуклеиновой кислоты в следующем порядке:For example, individual elements may be present in an artificial nucleic acid molecule in the following order:

5'-кэп 5'-UTR - ОРС - 3'-UTR-элемент гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;5'-cap 5'-UTR - ORF - 3'-UTR-element histone stem-loop structure - poly(A)/(C)-sequence;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C) sequence - histone stem-loop structure;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - IRES - ORF 3'-UTR element - histone stem-loop structure - poly(A)/(C)-sequence;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - histone stem-loop structure - poly(A)/(C) sequence - poly(A)/(C )-subsequence;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - poly(A)/(C) sequence - histone stem-loop structure;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - poly(A)/(C)-sequence - poly(A)/(C)-sequence - histone stem structure -the loop";

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C)-sequence poly(A)/(C)-sequence;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля»; и т.д.5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C)-sequence - poly(A)/(C)-sequence - histone stem-loop structure; etc.

В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты содержит дополнительные элементы, такие как 5'-кэп, поли(С)-последовательность и/или IRES-мотив. 5'-кэп может быть добавлен в процессе транскрипции или после транскрипции к 5'-концу РНК. Кроме того, предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты, прежде всего в том случае, когда нуклеиновая кислота находится в форме мРНК или кодирует мРНК, можно модифицировать с помощью последовательности, состоящей по меньшей мере из 10 цитозинов, предпочтительно по меньшей мере из 20 цитозинов, более предпочтительно по меньшей мере из 30 цитозинов (так называемая «поли(С)-последовательность»). В частности, предлагаемая в изобретении искусственная молекула нуклеиновой кислоты может содержать, прежде всего в том случае, когда нуклеиновая кислота находится в форме мРНК или кодирует мРНК, поли(С)-последовательность которая, как правило, содержит примерно от 10 до 200 цитозиновых нуклеотидов, предпочтительно примерно от 10 до 100 цитидиновых нуклеотидов, более предпочтительно примерно от 10 до 70 цитидиновых нуклеотидов или еще более предпочтительно примерно от 20 до 50 или даже от 20 до 30 цитидиновых нуклеотидов. Наиболее предпочтительно, предлагаемая в изобретении нуклеиновая кислота содержит поли(С)-последовательность, состоящую из 30 цитидиновых оснований. Так, предпочтительно искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, содержит, предпочтительно в 5'→3' направлении ОРС, по меньшей мере один 3'-UTR-элемент, описанный выше, поли(А)-последовательность или сигнал полиаденилирования и поли(С)-последовательность.In some embodiments, the artificial nucleic acid molecule contains additional elements such as a 5' cap, a poly(C) sequence, and/or an IRES motif. The 5' cap can be added during or after transcription to the 5' end of the RNA. In addition, the artificial nucleic acid molecule according to the invention, especially in the case when the nucleic acid is in the form of mRNA or encodes mRNA, can be modified with a sequence consisting of at least 10 cytosines, preferably at least 20 cytosines, more preferably at least 30 cytosines (the so-called "poly(C)-sequence"). In particular, the artificial nucleic acid molecule according to the invention may contain, especially when the nucleic acid is in the form of an mRNA or encodes an mRNA, a poly(C)-sequence which, as a rule, contains from about 10 to 200 cytosine nucleotides, preferably about 10 to 100 cytidine nucleotides, more preferably about 10 to 70 cytidine nucleotides, or even more preferably about 20 to 50 or even 20 to 30 cytidine nucleotides. Most preferably, the inventive nucleic acid contains a poly(C) sequence consisting of 30 cytidine bases. Thus, preferably, the artificial nucleic acid molecule of the present invention contains, preferably in the 5'→3' direction of the ORF, at least one 3'-UTR element as described above, a poly(A) sequence or polyadenylation signal, and a poly (C)-sequence.

Последовательность внутреннего сайта связывания рибосом (IRES) или IRES-мотив может разделять несколько открытых рамок считывания, например в том случае, когда искусственная молекула нуклеиновой кислоты кодирует два или большее количество пептидов или белков. IRES-последовательность может быть наиболее полезной в том случае, когда искусственная молекула нуклеиновой кислоты представляет собой би- или полицистронную молекулу нуклеиновой кислоты.An internal ribosome binding site (IRES) sequence or IRES motif may share multiple open reading frames, such as when an artificial nucleic acid molecule encodes two or more peptides or proteins. The IRES sequence may be most useful when the artificial nucleic acid molecule is a bi- or polycistronic nucleic acid molecule.

Кроме того, искусственная молекула нуклеиновой кислоты может содержать дополнительные 5'-элементы, предпочтительно 5'-UTR, промотор или последовательность, содержащую 5'-UTR и промотор. Промотор может управлять транскрипцией или регулировать транскрипцию искусственной молекулы нуклеиновой кислоты предлагаемой в настоящем изобретении, например, искусственной молекулы ДНК, предлагаемой в настоящем изобретении. Кроме того, 5'-UTR может состоять или содержать 5'-UTR гена, представленную в настоящем описании. Кроме того, 5'-UTR может взаимодействовать с предлагаемым в изобретении 3,-UTR-элементом и тем самым может поддерживать стабилизирующее действие предлагаемого в изобретении 3'-UTR-элемента. Такие элементы могут дополнительно поддерживать стабильность и эффективность трансляции. Следовательно, в некоторых вариантах осуществления изобретения предложены искусственные молекулы нуклеиновой кислоты, предпочтительно молекулы мРНК, содержащие в 5'→3'-направлении по меньшей мере одну из следующих структурIn addition, the artificial nucleic acid molecule may contain additional 5'-elements, preferably a 5'-UTR, a promoter or a sequence containing a 5'-UTR and a promoter. A promoter may direct or regulate transcription of an artificial nucleic acid molecule of the present invention, such as an artificial DNA molecule of the present invention. In addition, the 5'-UTR may consist of or contain the 5'-UTR of the gene presented in the present description. In addition, the 5'-UTR can interact with the inventive 3,-UTR element and thus can support the stabilizing effect of the inventive 3'-UTR element. Such elements can further support the stability and efficiency of translation. Therefore, in some embodiments, the invention provides artificial nucleic acid molecules, preferably mRNA molecules, containing in the 5'→3' direction at least one of the following structures

5'-кэп - 5'-UTR - ORF - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - 3'-UTR element - histone stem-loop structure - poly(A)/(C)-sequence;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C)-sequence histone stem-loop structure;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - histone stem-loop structure - poly(A)/(C)-sequence;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3,-UTR-элемент - гистоновая структура типа «стебель-петля» - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - IRES - ORF - 3,-UTR element - histone stem-loop structure - poly(A)/(C) sequence - poly(A)/(C )-subsequence;

5'-кэп - 5'-UTR - ОРС - IRES - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность гистоновая структура типа «стебель-петля»;5'-cap - 5'-UTR - ORF - IRES - ORF - 3'-UTR element - poly(A)/(C)-sequence histone stem-loop structure;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность;5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C)-sequence - poly(A)/(C)-sequence;

5'-кэп - 5'-UTR - ОРС - 3'-UTR-элемент - поли(А)/(С)-последовательность - поли(А)/(С)-последовательность - гистоновая структура типа «стебель-петля».5'-cap - 5'-UTR - ORF - 3'-UTR element - poly(A)/(C)-sequence - poly(A)/(C)-sequence - stem-loop histone structure.

В наиболее предпочтительном варианте осуществления настоящего изобретения искусственная молекула нуклеиновой кислоты содержит по меньшей мере один элемент 5'-нетранслируемой области (5'UTR-элемент) длиной менее чем 500, 400, 300, 250, 200, 150 или 100 нуклеотидов и/или более чем 20, 30, 40, 50 или 60 нуклеотидов, который предпочтительно содержит или состоит из нуклеотидной последовательности, которая происходит из 5'UTR ТОР-гена, или которая происходит из фрагмента, гомолога или варианта 5'UTR ТОР-гена.In the most preferred embodiment of the present invention, the artificial nucleic acid molecule contains at least one element of the 5'-untranslated region (5'UTR element) with a length of less than 500, 400, 300, 250, 200, 150 or 100 nucleotides and/or more than 20, 30, 40, 50 or 60 nucleotides, which preferably contains or consists of a nucleotide sequence which is derived from the 5'UTR of the TOP gene, or which is derived from a fragment, homologue or variant of the 5'UTR of the TOP gene.

Наиболее предпочтительно 5'UTR-элемент не содержит ТОР-мотив или 5'-ТОР, указанный выше.Most preferably, the 5'UTR element does not contain the TOP motif or 5'TOP as defined above.

Нуклеотидная последовательность, которая происходит из 5'UTR ТОР-гена, происходит из эукараотического ТОР-гена, предпочтительно ТОР-гена растения или животного, более предпочтительно ТОР-гена хордовых, еще более предпочтительно ТОР-гена позвоночных, наиболее предпочтительно ТОР-гена млекопитающих, такого как ТОР-ген человека.The nucleotide sequence which is derived from the 5'UTR of the TOP gene is derived from a eukaraotic TOP gene, preferably a plant or animal TOP gene, more preferably a chordate TOP gene, even more preferably a vertebrate TOP gene, most preferably a mammalian TOP gene, such as the human TOP gene.

Например, 5'UTR-элемент предпочтительно выбирают из 5'-UTR-элементов, содержащих или состоящих из нуклеотидной последовательности, которая происходит из нуклеотидной последовательности, выбранной из группы, состоящей из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, описание которой включено в настоящее описание в качестве ссылки, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта или предпочтительно из соответствующей последовательности РНК. Понятие «гомологи SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленные в заявке на патент WO 2013/143700» относится к последовательностям из видов кроме человека, которые гомологичны последовательностям SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленным в заявке на патент WO 2013/143700.For example, the 5'UTR element is preferably selected from 5'UTR elements containing or consisting of a nucleotide sequence that is derived from a nucleotide sequence selected from the group consisting of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700, the description of which is incorporated herein by reference, from the homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700, from a variant thereof, or preferably from the corresponding RNA sequence. The term "homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700" refers to sequences from non-human species that are homologous to sequences SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 presented in patent application WO 2013/143700.

В предпочтительном варианте осуществления изобретения S'UTR-элемент содержит или состоит из нуклеотидной последовательности, которая происходит из нуклеотидной последовательности, простирающейся от нуклеотидного положения 5 (т.е. нуклеотида, находящегося в последовательности в положении 5) до нуклеотида, непосредственно примыкающего с 5'-стороны к стартовому кодону (находящемуся на 3'-конце последовательностей), например, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к последовательности ATG нуклеотидной последовательности, выбранной из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта, или соответствующей последовательности РНК. Наиболее предпочтительно 5' UTR-элемент происходит из нуклеотидной последовательности, простирающейся от нуклеотидного положения, непосредственно примыкающего с 3'-стороны к 5'-ТОР, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к стартовому кодону (находящемуся на 3'-конце последовательностей), например, до нуклеотидного положения, непосредственно примыкающего с 5'-стороны к последовательности ATG нуклеотидной последовательности выбранной из SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из гомологов SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 и SEQ ID NO: 1422, представленных в заявке на патент WO 2013/143700, из ее варианта, или соответствующей последовательности РНК.In a preferred embodiment of the invention, the S'UTR element contains or consists of a nucleotide sequence that is derived from a nucleotide sequence extending from nucleotide position 5 (i.e., the nucleotide located in position 5 in the sequence) to the nucleotide immediately adjacent to 5' - side to the start codon (located at the 3' end of the sequences), for example, to the nucleotide position immediately adjacent on the 5' side to the ATG sequence of the nucleotide sequence selected from SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422 of patent application WO 2013/143700 from homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422, presented in patent application WO 2013/143700, from its variant, or the corresponding RNA sequence. Most preferably, the 5' UTR element is derived from a nucleotide sequence extending from the nucleotide position immediately 3'-side adjacent to the 5'-TOP to the nucleotide position immediately adjacent 5'-side to the start codon (located on the 3'- the end of the sequences), for example, up to the nucleotide position immediately adjacent on the 5' side to the ATG sequence of the nucleotide sequence selected from SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422, presented in patent application WO 2013/143700, from the homologues of SEQ ID NO: 1-1363, SEQ ID NO: 1395, SEQ ID NO: 1421 and SEQ ID NO: 1422, presented in patent application WO 2013/143700, from its variant, or the corresponding RNA sequence.

В наиболее предпочтительном варианте осуществления изобретения 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR ТОР-гена, кодирующего рибосомальный белок, или из варианта 5'-UTR ТОР-гена, кодирующего рибосомальный белок. Например, 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR нуклеотидной последовательности, представленной в любой из SEQ ID NO: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359 или 1360, представленных в заявке на патент WO 2013/143700, соответствующей последовательности РНК, ее гомолога или ее варианта, представленного в настоящем описании, предпочтительно без 5'-ТОР-мотива. Как описано выше, последовательность, простирающаяся от положения 5 до нуклеотида, непосредственно примыкающего с 5'-стороны к ATG (который находится на 3'-конце последовательностей), соответствует 5'-UTR указанных последовательностей.In the most preferred embodiment of the invention, the 5'UTR element contains or consists of a nucleotide sequence derived from the 5'UTR of the TOP gene encoding the ribosomal protein or from the variant 5'UTR of the TOP gene encoding the ribosomal protein. For example, the 5'-UTR element contains or consists of a nucleotide sequence derived from the 5'-UTR nucleotide sequence shown in any of SEQ ID NOs: 170, 232, 244, 259, 1284, 1285, 1286, 1287, 1288, 1289, 1290, 1291, 1292, 1293, 1294, 1295, 1296, 1297, 1298, 1299, 1300, 1301, 1302, 1303, 1304, 1305, 1306, 1307, 1308, 1309, 1310, 1311, 1312, 1313, 1313, 1313. 1314, 1315, 1316, 1317, 1318, 1319, 1320, 1321, 1322, 1323, 1324, 1325, 1326, 1327, 1328, 1329, 1330, 1331, 1332, 1333, 1334, 1335, 1336, 1337, 1338, 1338, 1338, 1338. 1339, 1340, 1341, 1342, 1343, 1344, 1346, 1347, 1348, 1349, 1350, 1351, 1352, 1353, 1354, 1355, 1356, 1357, 1358, 1359 or 1360 pending in WO2 143700 corresponding to the RNA sequence, its homologue or its variant presented in the present description, preferably without the 5'-TOP motif. As described above, the sequence extending from position 5 to the nucleotide immediately adjacent 5' to the ATG (which is at the 3' end of the sequences) corresponds to the 5' UTR of the indicated sequences.

Предпочтительно 5'UTR-элемент содержит или состоит из нуклеотидной последовательности, которая происходит из 5'-UTR ТОР-гена, кодирующего рибосомальный белок большой субъединицы (RPL), или из гомолога или варианта 5'-UTR ТОР-гена, кодирующего рибосомальный белок большой субъединицы (RPL). Например, 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR нуклеотидной последовательности, представленной в любой из SEQ ID NO: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 и 1422, описанных в заявке на патент WO 2013/143700, соответствующей последовательности РНК, ее гомолога или ее варианта, представленного в настоящем описании, предпочтительно без 5'-ТОР-мотива.Preferably, the 5'UTR element contains or consists of a nucleotide sequence that is derived from the 5'UTR of the TOP gene encoding the ribosomal large subunit protein (RPL) or from a homologue or variant of the 5'UTR of the TOP gene encoding the ribosomal large subunit protein. subunits (RPL). For example, the 5'-UTR element contains or consists of a nucleotide sequence derived from the 5'-UTR nucleotide sequence shown in any of SEQ ID NOs: 67, 259, 1284-1318, 1344, 1346, 1348-1354, 1357, 1358, 1421 and 1422 described in patent application WO 2013/143700 corresponding to the RNA sequence, its homologue or its variant presented in the present description, preferably without a 5'-TOP motif.

В наиболее предпочтительном варианте осуществления изобретения 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR гена рибосомального белка большой субъединицы 32, предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) позвоночных, более предпочтительно гена рибосомального белка большой субъединицы 32 (L32) млекопитающих, наиболее предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) человека, или из варианта 5'-UTR гена рибосомального белка большой субъединицы 32, предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) позвоночных, более предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) млекопитающих, наиболее предпочтительно из гена рибосомального белка большой субъединицы 32 (L32) человека, где предпочтительно 5'-UTR-элемент не содержит 5'-ТОР указанного гена.In a most preferred embodiment, the 5'-UTR element comprises or consists of a nucleotide sequence derived from the 5'-UTR of the large subunit 32 ribosomal protein gene, preferably from the vertebrate large subunit 32 ribosomal protein (L32) gene, more preferably the ribosomal protein gene mammalian 32 large subunit (L32) ribosomal protein gene, most preferably from the human 32 large subunit ribosomal protein (L32) protein gene, or from the 5'-UTR variant of the 32 large subunit ribosomal protein gene, preferably from the vertebrate 32 large subunit ribosomal protein (L32) protein gene, more preferably from a mammalian ribosomal large subunit 32 (L32) protein gene, most preferably from a human ribosomal large subunit 32 (L32) protein gene, where preferably the 5'-UTR element does not contain the 5'-TOP of said gene.

Следовательно, в наиболее предпочтительном варианте осуществления изобретения, 5'-UTR-элемент содержит или состоит из нуклеотидной последовательности, идентичной по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 6 (5'-UTR рибосомального белка большой субъединицы 32 человека без 5'-концевого олигопиримидинового тракта:Therefore, in the most preferred embodiment of the invention, the 5'-UTR element contains or consists of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of the nucleotide sequence shown in SEQ ID NO: 6 (5'-UTR of the human large subunit 32 ribosomal protein without the 5'-oligopyrimidine tract:

GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC; соответствующая SEQ ID NO: 1368, представленной в заявке на патент WO 2013/143700) или предпочтительно соответствующей последовательности РНК, или где по меньшей мере один 5'UTR-элемент содержит или состоит из фрагмента нуклеотидной последовательности, идентичного по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 6, или более предпочтительно соответствующей последовательности РНК, где предпочтительно фрагмент представляет собой описанный выше фрагмент, непрерывный сегмент нуклеотидов, представляющий собой по меньшей мере 20% и т.д. полноразмерной 5'-UTR. Предпочтительно фрагмент имеет длину по меньшей мере примерно 20 нуклеотидов или более, предпочтительно по меньшей мере примерно 30 нуклеотидов или более, более предпочтительно по меньшей мере примерно 40 нуклеотидов или более. Предпочтительно фрагмент представляет собой функциональный фрагмент, представленный в настоящем описании.GGCGCTGCCTACGGAGGTGGCAGCCATCTCCTTCTCGGCATC; corresponding to SEQ ID NO: 1368 presented in patent application WO 2013/143700) or preferably the corresponding RNA sequence, or where at least one 5'UTR element contains or consists of a fragment of a nucleotide sequence that is at least about 40% identical , preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of the nucleotide sequence shown in SEQ ID NO: 6, or more preferably the corresponding RNA sequence, where preferably the fragment is the fragment described above, a continuous segment of nucleotides, representing at least 20%, etc. full-length 5'-UTR. Preferably, the fragment is at least about 20 nucleotides or more in length, preferably at least about 30 nucleotides or more, more preferably at least about 40 nucleotides or more. Preferably the fragment is a functional fragment, presented in the present description.

В некоторых вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты содержит S'-UTR-элемент, который содержит или состоит из нуклеотидной последовательности, происходящей из 5'-UTR ТОР-гена позвоночных, например, млекопитающих, например, ТОР-гена человека, выбранного из RPSA, RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25, RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A, RPL19, RPL21, RPL22, RPL23, RPL23A, RPL24, RPL26, RPL27, RPL27A, RPL28, RPL29, RPL30, RPL31, RPL32, RPL34, RPL35, RPL35A, RPL36, RPL36A, RPL37, RPL37A, RPL38, RPL39, RPL40, RPL41, RPLPO, RPLP1, RPLP2, RPLP3, RPLPO, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, РАВРС1, HNRNPA1, ТРТ1, TUBB1, UBA52, NPM1, ATP5G2, GNB2L1, NME2, UQCRB или из его гомолога или варианта, где предпочтительно 5'-UTR-элемент не содержит ТОР-мотив или 5'-ТОР указанных генов, и где необязательно 5'-UTR-элемент начинается на его 5'-конце с нуклеотида, находящегося в положении 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 в прямом направлении относительно 5'-концевого олигопиримидинового тракта (ТОР) и где необязательно также 5'-UTR-элемент, происходящий из 5'-UTR ТОР-гена, заканчивается на его 3'-конце нуклеотидом, находящимся в положении 1, 2, 3, 4, 5, 6, 7, 8, 9 или 10 в обратном направлении относительно стартового кодона (A(U/T)G) гена, из которого он происходит.In some embodiments, the artificial nucleic acid molecule comprises an S'-UTR element that contains or consists of a nucleotide sequence derived from the 5'-UTR of a vertebrate, e.g., mammalian TOP gene, e.g., a human TOP gene, selected from RPSA , RPS2, RPS3, RPS3A, RPS4, RPS5, RPS6, RPS7, RPS8, RPS9, RPS10, RPS11, RPS12, RPS13, RPS14, RPS15, RPS15A, RPS16, RPS17, RPS18, RPS19, RPS20, RPS21, RPS23, RPS24, RPS25 , RPS26, RPS27, RPS27A, RPS28, RPS29, RPS30, RPL3, RPL4, RPL5, RPL6, RPL7, RPL7A, RPL8, RPL9, RPL10, RPL10A, RPL11, RPL12, RPL13, RPL13A, RPL14, RPL15, RPL17, RPL18, RPL18A RPL27 , RPLPO, RPLP1, RPLP2, RPLP3, RPLPO, RPLP1, RPLP2, EEF1A1, EEF1B2, EEF1D, EEF1G, EEF2, EIF3E, EIF3F, EIF3H, EIF2S3, EIF3C, EIF3K, EIF3EIP, EIF4A2, PABPC1, HNRNPA1, TPT1, 2TUBB1, UBA5 , NPM1, ATP5G2, GNB2L1, NME2, UQCRB, or from a homologue or variant thereof, where preferably the 5'-UTR element does not contain the TOP motif or 5'-TOP of said genes, and where optionally the 5'-UTR element begins with it 5'-end from the nucleotide located at position 1, 2, 3, 4, 5, 6, 7, 8, 9 or 10 forward relative to the 5'-oligopyrimidine tract (TOP) and where optionally also the 5'-UTR -element derived from the 5'-UTR of the TOP gene ends at its 3'-end with a nucleotide located at position 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 in the opposite direction from the start codon (A(U/T)G) of the gene from which it comes.

Предпочтительно в искусственной молекуле нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно в открытой рамке считывания, модифицируют по меньшей мере содержание G/C. Так, предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты можно стабилизировать с точки зрения ее термодинамических характеристик путем модификации содержания G (гуанозин)/С (цитидин) в молекуле. Содержание G/C в открытой рамке считывания искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно повышать по сравнению с содержанием G/C в открытой рамке считывания соответствующей последовательности дикого типа, предпочтительно на основе вырожденности генетического кода. Так, аминокислотную последовательность, кодируемую искусственной молекулой нуклеиновой кислоты, предпочтительно не модифицируют посредством модификации содержания G/C по сравнению с конкретной кодируемой аминокислотной последовательностью дикого типа. Таким образом, можно варьировать кодоны кодирующей последовательности или всей искусственной молекулы нуклеиновой кислоты, например, мРНК, по сравнению с кодирующей последовательностью дикого типа таким образом, чтобы они содержали большее количество G/C-нуклеотидов, сохраняя при этом транслируемую аминокислотную последовательность. Благодаря тому факту, что несколько кодонов кодируют одну и ту же аминокислоту (так называемая вырожденность генетического кода), можно изменять кодоны, не изменяя кодируемую последовательность пептида/белка (использование так называемых альтернативных кодонов). Следовательно, можно специально интродуцировать определенные кодоны (осуществляя обмен соответствующих кодонов дикого типа, кодирующих ту же самую аминокислоту), которые являются более предпочтительными с точки зрения стабильности РНК и/или наиболее часто встречающихся кодонов в организме индивидуума (так называемая оптимизация кодонов).Preferably, at least the G/C content is modified in the artificial nucleic acid molecule of the present invention, preferably in the open reading frame. Thus, the artificial nucleic acid molecule according to the invention can be stabilized in terms of its thermodynamic characteristics by modifying the content of G (guanosine)/C (cytidine) in the molecule. The G/C content in the open reading frame of the artificial nucleic acid molecule of the present invention can be increased compared to the G/C content in the open reading frame of the corresponding wild-type sequence, preferably based on the degeneracy of the genetic code. Thus, the amino acid sequence encoded by the artificial nucleic acid molecule is preferably not modified by modifying the G/C content as compared to the particular wild type encoded amino acid sequence. Thus, it is possible to vary the codons of a coding sequence or of an entire artificial nucleic acid molecule, e.g. mRNA, compared to the wild-type coding sequence so that they contain more G/C nucleotides while maintaining the translated amino acid sequence. Due to the fact that several codons code for the same amino acid (so-called degeneracy of the genetic code), it is possible to change codons without changing the encoded sequence of the peptide/protein (use of so-called alternative codons). Therefore, it is possible to specifically introduce certain codons (by exchanging the corresponding wild-type codons encoding the same amino acid) that are more favorable in terms of RNA stability and/or the most frequently occurring codons in the individual's body (so-called codon optimization).

В зависимости от аминокислоты, которая должна кодироваться кодирующей областью предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, представленной в настоящем описании, существуют различные возможности для модификации нуклеотидной последовательности, например, открытой рамки считывания, по сравнению с ее кодирующей областью дикого типа. В случае аминокислот, которые кодируются кодонами, содержащими только нуклеотиды G или С, модификации кодонов не требуется. Таким образом, кодоны для Pro (ССС или CCG), Arg (CGC или CGG), Ala (GCC или GCG) и Gly (GGC или GGG) не требуют модификации, поскольку в них отсутствуют А или U/T.Depending on the amino acid to be encoded by the coding region of the artificial nucleic acid molecule of the invention provided herein, there are different possibilities for modifying the nucleotide sequence, such as the open reading frame, compared to its wild-type coding region. In the case of amino acids that are encoded by codons containing only G or C nucleotides, codon modification is not required. Thus, the codons for Pro (CCC or CCG), Arg (CGC or CGG), Ala (GCC or GCG), and Gly (GGC or GGG) do not require modification because they lack A or U/T.

В противоположность этому, кодоны, которые содержат нуклеотиды А и/или U, можно модифицировать путем замены на другие кодоны, которые кодируют эти же аминокислоты, но не содержат А и/или U.In contrast, codons that contain A and/or U nucleotides can be modified by substitution with other codons that code for the same amino acids but do not contain A and/or U.

Например,For example,

кодирующие Pro кодоны CC(U/T) или ССА можно модифицировать на ССС или CCG;encoding Pro codons CC(U/T) or CCA can be modified to CCC or CCG;

кодирующие Arg кодоны CG(U/T) или CGA, или AGA, или AGG можно модифицировать на CGC или CGG;Arg-coding codons CG(U/T) or CGA or AGA or AGG can be modified to CGC or CGG;

кодирующие Ala кодоны GC(U/T) или GCA можно модифицировать на GCC или GCG;Ala encoding GC(U/T) or GCA codons can be modified to GCC or GCG;

кодирующие Gly кодоны GG(U/T) или GGA можно модифицировать на GGC или GGG.codons encoding Gly GG(U/T) or GGA can be modified to GGC or GGG.

В других случаях, когда нуклеотиды А или U нельзя элиминировать из кодонов, можно снижать содержание А и U с использованием кодонов, которые содержат нуклеотиды А и/или U в более низком количестве. Примерами указанных колонов являются:In other cases where A or U nucleotides cannot be eliminated from codons, A and U content can be reduced by using codons that contain A and/or U nucleotides in a lower amount. Examples of said columns are:

кодирующие Phe кодоны (U/T)(U/T)(U/T) можно модифицировать на (U/T) (U/T)C;Phe encoding codons (U/T)(U/T)(U/T) can be modified to (U/T)(U/T)C;

кодирующие Leu кодоны (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) или C(U/T)A можно модифицировать на C(U/T)C или C(U/T)G;codons encoding Leu (U/T) (U/T)A, (U/T) (U/T)G, C(U/T) (U/T) or C(U/T)A can be modified to C (U/T)C or C(U/T)G;

кодирующие Ser кодоны (U/T)C(U/T) или (U/T)CA, или AG(U/T) можно модифицировать на (U/T)CC, (U/T)CG или AGC;Ser encoding codons (U/T)C(U/T) or (U/T)CA or AG(U/T) can be modified to (U/T)CC, (U/T)CG or AGC;

кодирующий Tyr кодон (U/T)A(U/T) можно модифицировать на (U/T)AC;Tyr encoding codon (U/T)A(U/T) can be modified to (U/T)AC;

кодирующий Cys кодон (U/T)G(U/T) можно модифицировать на (U/T)GC;the Cys coding codon (U/T)G(U/T) can be modified to (U/T)GC;

кодирующий His кодон CA(U/T) можно модифицировать на САС;His coding codon CA(U/T) can be modified to CAC;

кодирующий Gln кодон САА можно модифицировать на CAG;the Gln coding codon CAA can be modified to CAG;

кодирующие Ile кодоны A(U/T)(U/T) или A(U/T)A можно модифицировать на A(U/T)Ccodons encoding Ile A(U/T)(U/T) or A(U/T)A can be modified to A(U/T)C

кодирующие Thr кодоны AC(U/T) или АСА можно модифицировать на АСС или ACGcodons encoding Thr AC(U/T) or ACA can be modified to ACC or ACG

кодирующий Asn кодон AA(U/T) можно модифицировать на ААС;the Asn encoding codon AA(U/T) can be modified to AAC;

кодирующий Lys кодоны AAA можно модифицировать на AAG;Lys encoding AAA codons can be modified to AAG;

кодирующие Val кодоны G(U/T)(U/T) или G(U/T)A можно модифицировать на G(U/T)C или G(U/T)G;codons encoding Val G(U/T)(U/T) or G(U/T)A can be modified to G(U/T)C or G(U/T)G;

кодирующий Asp кодон GA(U/T) можно модифицировать на GAC;the Asp encoding codon GA(U/T) can be modified to GAC;

кодирующий Glu кодон GAA можно модифицировать на GAG;the Glu coding codon GAA can be modified to GAG;

стоп-кодон (U/T)AA можно модифицировать на (U/T)AG или (U/T)GA.the stop codon (U/T)AA can be modified to either (U/T)AG or (U/T)GA.

С другой стороны, в случае кодонов Met (AUG) и Trp (UGG), отсутствует возможность модификации последовательности без изменения кодируемой аминокислотной последовательности.On the other hand, in the case of Met (AUG) and Trp (UGG) codons, there is no possibility of modifying the sequence without changing the encoded amino acid sequence.

Перечисленные выше замены можно использовать либо индивидуально, либо в любых возможных комбинациях для повышения содержания G/C в открытой рамке считывания в предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, по сравнению с конкретной открытой рамкой считывания дикого типа (т.е. исходной последовательности). Так, например, все кодоны Thr, встречающиеся в последовательности дикого типа, можно модифицировать на АСС (или ACG).The substitutions listed above can be used either alone or in any possible combination to increase the G/C content in the open reading frame of the inventive artificial nucleic acid molecule provided herein, compared to a specific wild-type open reading frame (i.e., e. the original sequence). Thus, for example, all Thr codons occurring in the wild-type sequence can be modified to ACC (or ACG).

Предпочтительно содержание G/C в открытой рамке считывания в предлагаемой в настоящем изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, повышают по меньшей мере на 7%, более предпочтительно по меньшей мере на 15%, наиболее предпочтительно по меньшей мере на 20%, по сравнению с содержанием G/C в кодирующей области мРНК дикого типа без изменения кодируемой аминокислотной последовательности, т.е. используя вырожденность генетического кода. В конкретном варианте осуществления изобретения заменяют по меньшей мере 5%, 10%, 20%, 30%, 40%, 50%, 60%, более предпочтительно по меньшей мере 70%, еще более предпочтительно по меньшей мере 80% и наиболее предпочтительно по меньшей мере 90%, 95% или даже 100% пригодных для замены кодонов в открытой рамке считывания в предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты или ее фрагменте, варианте или производном, повышая тем самым содержание G/C в указанной открытой рамке считывания.Preferably, the open reading frame G/C content of the inventive artificial nucleic acid molecule described herein is increased by at least 7%, more preferably by at least 15%, most preferably by at least 20%, compared to the content of G/C in the coding region of the wild-type mRNA without changing the encoded amino acid sequence, i.e. using the degeneracy of the genetic code. In a particular embodiment of the invention, at least 5%, 10%, 20%, 30%, 40%, 50%, 60%, more preferably at least 70%, even more preferably at least 80%, and most preferably at least at least 90%, 95%, or even 100% of codon substitutions in the open reading frame of the inventive artificial nucleic acid molecule or fragment, variant or derivative thereof, thereby increasing the G/C content in said open reading frame.

В этом контексте наиболее предпочтительно повышать содержание G/C в открытая рамке считывания в предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, до максимума (т.е. до 100% пригодных для замещения кодонов) по сравнению с открытой рамкой считывания дикого типа без изменения кодируемой аминокислотной последовательности.In this context, it is most preferable to increase the content of G/C in the open reading frame of the inventive artificial nucleic acid molecule presented herein to a maximum (i.e. up to 100% usable codons) compared to the open reading frame of the wild type without changing the encoded amino acid sequence.

Кроме того, в открытой рамке считывания предпочтительно осуществляют по меньшей мере частично оптимизацию кодонов. Оптимизация кодонов основана на открытии того факта, что эффективность трансляции может определяться также различной частотой встречаемости транспортных РНК (тРНК) в клетках. Таким образом, если в кодирующей области, предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты, представленной в настоящем описании, присутствуют в повышенном количестве так называемые «редкие кодоны», то уровень трансляции соответствующей модифицированной нуклеотидной последовательности является более низким, чем в том случае, когда присутствуют кодоны, кодирующие относительно «часто встречающуюся» тРНК.In addition, the open reading frame preferably performs at least partially codon optimization. Codon optimization is based on the discovery that the efficiency of translation can also be determined by the different frequencies of transfer RNAs (tRNAs) in cells. Thus, if the so-called "rare codons" are present in the coding region of the artificial nucleic acid molecule according to the invention, the level of translation of the corresponding modified nucleotide sequence is lower than when there are codons that code for a relatively "frequent" tRNA.

Так, открытую рамку считывания предлагаемой в изобретении искусственной молекуле нуклеиновой кислоты предпочтительно модифицируют по сравнению с соответствующей кодирующей областью дикого типа таким образом, чтобы по меньшей мере один кодон в последовательности дикого типа, который кодирует тРНК, которая является относительно редкой в клетке, был заменен на кодон, который кодирует тРНК, которая встречается в клетке относительно часто и «несет» такую же аминокислоту, что и относительно редко встречающаяся тРНК. Посредством такой модификации открытую рамку считывания предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты, представленной в настоящем описании, модифицируют таким образом, чтобы кодонами, для которых доступны часто встречающиеся тРНК, заменять кодоны, которые соответствуют редким тРНК. Другими словами, согласно изобретению с помощью такой модификации все кодоны в открытой рамке считывания дикого типа, которые кодируют тРНК, являющуюся относительно редкой в клетке, можно заменять на кодоны, которые кодируют тРНК, относительно часто встречающуюся в клетке, и которая в каждом случае «несет» такую же аминокислоту, что и относительно редкая тРНК. тРНК, встречающиеся относительно часто в клетке, и наоборот, встречающиеся относительно редко, известны специалистам в данной области, см., например, Akashi, Curr. Opin. Genet. Dev., 11(6), 2001, cc. 660-666. Таким образом, предпочтительно открытая рамка считывания имеет оптимизированные кодоны, предпочтительно применительно к системе, в которой должна экспрессироваться искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, предпочтительно применительно к системе, в которой должна транслироваться искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении. Предпочтительно, оптимизацию кодонов для наиболее часто встречающихся кодонов в открытой рамке считывания осуществляют в соответствии с наиболее часто встречающимися кодонами млекопитающих, более предпочтительно в соответствии с наиболее часто встречающимися кодонами человека. Предпочтительно, в открытой рамке считывания осуществляют и оптимизацию кодонов, и модификацию содержания G/C.Thus, the open reading frame of the artificial nucleic acid molecule according to the invention is preferably modified in comparison with the corresponding wild-type coding region so that at least one codon in the wild-type sequence that codes for a tRNA that is relatively rare in the cell is changed to a codon that codes for a tRNA that is relatively common in the cell and "carries" the same amino acid as a relatively rare tRNA. By such modification, the open reading frame of the artificial nucleic acid molecule of the invention described herein is modified so that codons for which frequently occurring tRNAs are available are replaced with codons that correspond to rare tRNAs. In other words, according to the invention, with such a modification, all codons in the wild-type open reading frame that encode a tRNA that is relatively rare in the cell can be replaced with codons that encode a tRNA that is relatively common in the cell, and which in each case "carries » the same amino acid as a relatively rare tRNA. tRNAs that are relatively common in a cell, and vice versa, that are relatively rare, are known to those skilled in the art, see, for example, Akashi, Curr. Opin. Genet. Dev., 11(6), 2001, pp. 660-666. Thus, preferably the open reading frame has optimized codons, preferably in relation to the system in which the artificial nucleic acid molecule of the present invention is to be expressed, preferably in relation to the system in which the artificial nucleic acid molecule of the present invention is to be translated. Preferably, codon optimization for the most frequently occurring codons in the open reading frame is performed according to the most frequently occurring mammalian codons, more preferably according to the most frequently occurring human codons. Preferably, both codon optimization and G/C content modification are performed in the open reading frame.

Для дополнительного повышения устойчивости к расщеплению, например, устойчивости к расщеплению in vivo экзо- или эндонуклеазой, и/или для дополнительного повышения стабильности экспрессии белка с искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, можно осуществлять дополнительные модификации искусственной молекулы нуклеиновой кислоты, такие как модификации каркаса, модификации сахаров и/или модификации оснований, например, липидные модификации или т.п. Предпочтительно, такие модификации не приводят к значимому ухудшению транскрипции и/или трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.Further modifications to the artificial nucleic acid molecule can be made to further enhance resistance to cleavage, such as resistance to in vivo cleavage by exo- or endonuclease, and/or to further improve the stability of protein expression from the artificial nucleic acid molecule of the present invention, further modifications to the artificial nucleic acid molecule can be made, such as backbone modifications, sugar modifications and/or base modifications, eg lipid modifications or the like. Preferably, such modifications do not significantly impair transcription and/or translation of the artificial nucleic acid molecule of the present invention.

Как правило, искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, может содержать любой нативный (встречающийся в естественных условиях) нуклеотид, например, гуанозин, урацил, аденозин и/или цитозин, или их аналоги. В этом контексте нуклеотидные аналоги классифицируют как встречающиеся в естественных условиях и не встречающиеся в естественных условиях варианта встречающихся в естественных условиях нуклеотидов аденозина, цитозина, тимидина, гуанозина и уридина. Таким образом, аналоги представляют собой, например, химически модифицированные нуклеотиды, несущие не встречающиеся в естественных условиях функциональные группы, которые предпочтительно добавляют или изымают путем делеции из встречающегося в естественных условиях нуклеотида, или которыми заменяют встречающиеся в естественных условиях функциональные группы нуклеотида. Следовательно, можно модифицировать каждый компонент встречающегося в естественных условиях нуклеотида, а именно, компонент, представляющий собой основание, компонент, представляющий собой сахар (рибоза) компонент и/или компонент, представляющий собой фосфат, формирующий каркас (см. выше) последовательности РНК. Аналоги гуанозина, урацила, аденозина и цитозина включают (но, не ограничиваясь только ими) любой встречающийся в естественных условиях или не встречающийся в естественных условиях гуанозин, урацил, аденозин, тимидин или цитозин, который был изменен химически, например, ацетилированием, метилированием, гидроксилированием и т.д., включая, например, 1-метиладенозин, 1-метилгуанозин, 1-метилинозин, 2,2-диметилгуанозин, 2,6-диаминопурин, 2'-амино-2'-дезоксиаденозин, 2'-амино-2'-дезоксицитидин, 2'-амино-2'-дезоксигуанозин, 2'-амино-2'-дезоксиуридин, 2-амино-6-хлорпуринорибозид, 2-аминопуринрибозид, 2'-арааденозин, 2'-арацитидин, 2'-арауридин, 2'-азидо-2'-дезоксиаденозин, 2'-азидо-2'-дезоксицитидин, 2'-азидо-2'-дезоксигуанозин, 2'-азидо-2'-дезоксиуридин, 2-хлораденозин, 2'-фтор-2'-дезоксиаденозин, 2'-фтор-2'-дезоксицитидин, 2'-фтор-2'-дезоксигуанозин, 2'-фтор-2'-дезоксиуридин, 2'-фтортимидин, 2-метиладенозин, 2-метилгуанозин, 2-метилтио-N6-изопенениладенозин, 2'-O-метил-2-аминоаденозин, 2'-O-метил-2'-дезоксиаденозин, 2'-O-метил-2'-дезоксицитидин, 2'-O-метил-2'-дезоксигуанозин, 2'-O-метил-2'-дезоксиуридин, 2'-O-метил-5-метилуридин, 2'-O-метилинозин, 2'-O-метилпсевдоуридин, 2-тиоцитидин, 2-тиоцитозин, 3-метилцитозин, 4-ацетилцитозин, 4-тиоуридин, 5-(карбоксигидроксиметил)урацил, 5,6-дигидроуридин, 5-аминоаллилцитидин, 5-аминоаллилдезоксиуридин, 5-бромуридин, 5-карбоксиметиламинометил-2-тиоурацил, 5-карбоксиметиламинометилурацил, 5-хлор арацитозин, 5-фторуридин, 5-йодуридин, 5-метоксикарбонилметилуридин, 5-метоксиуридин, 5-метил-2-тиоуридин, 6-азацитидин, 6-азауридин, 6-хлор-7-деазагуанозин, 6-хлорпуринорибозид, 6-меркаптогуанозин, 6-метилмеркаптопуринрибозид, 7-деаза-2'-дезоксигуанозин, 7-деазааденозин, 7-метилгуанозин, 8-азааденозин, 8-броаденозин, 8-бромгуанозин, 8-меркапторгуанозин, 8-оксогуанозин, бензимидазолрибозид, бета-D-маннозилквеозин, дигидроурацил, инозин, N1-метиладенозин, N6-([6-аминогексил]карбамоилметил)аденозин, N6-изопентениладенозин, N6-метиладенозин, N7-метилксантозин, метиловый эфир N-урацил-5-оксиуксусной кислоты, пуромицин, квеозин, урацил-5-оксиуксусная кислота, метиловый эфир урацил-5-оксиуксусной кислоты, вибутоксозин, ксантозин и ксилоаденозин. Получение таких аналогов известно специалисту в данной области, например, описано в US 4373071, US 4401796, US 4415732, US 4458066, US 4500707, US 4668777, US 4973679, US 5047524, US 5132418, US 5153319, US 5262530 и 5700642. Касательно аналогов, описанных выше, наиболее предпочтительными согласно некоторым вариантам осуществления изобретения могут быть те аналоги, которые увеличивают белковую экспрессию кодируемого пептида или белка, или повышают иммуногенность искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, и/или не взаимодействуют с другой интродуцированной модификацией мРНК.Typically, the artificial nucleic acid molecule of the present invention may contain any native (naturally occurring) nucleotide, such as guanosine, uracil, adenosine and/or cytosine, or their analogues. In this context, nucleotide analogs are classified as naturally occurring and non-naturally occurring variants of the naturally occurring nucleotides of adenosine, cytosine, thymidine, guanosine, and uridine. Thus, analogs are, for example, chemically modified nucleotides bearing non-naturally occurring functional groups, which are preferably added or removed by deletion from a naturally occurring nucleotide, or by which a naturally occurring functional group of a nucleotide is substituted. Therefore, it is possible to modify each component of a naturally occurring nucleotide, namely the base component, the sugar (ribose) component, and/or the phosphate component forming the backbone (see above) of the RNA sequence. Guanosine, uracil, adenosine, and cytosine analogs include, but are not limited to, any naturally occurring or non-naturally occurring guanosine, uracil, adenosine, thymidine, or cytosine that has been altered chemically, e.g., by acetylation, methylation, hydroxylation etc., including, for example, 1-methyladenosine, 1-methylguanosine, 1-methylinosine, 2,2-dimethylguanosine, 2,6-diaminopurine, 2'-amino-2'-deoxyadenosine, 2'-amino-2 '-deoxycytidine, 2'-amino-2'-deoxyguanosine, 2'-amino-2'-deoxyuridine, 2-amino-6-chloropurine riboside, 2-aminopurine riboside, 2'-araadenosine, 2'-aracitidine, 2'-arauridine , 2'-azido-2'-deoxyadenosine, 2'-azido-2'-deoxycytidine, 2'-azido-2'-deoxyguanosine, 2'-azido-2'-deoxyuridine, 2-chloradenosine, 2'-fluoro- 2'-deoxyadenosine, 2'-fluoro-2'-deoxycytidine, 2'-fluoro-2'-deoxyguanosine, 2'-fluoro-2'-deoxyuridine, 2'-fluorothymidine, 2-methyladenosine, 2-methylguanosine, 2- methylthio-N6-isopenenyladenosine, 2'-O-methyl-2-aminoadenosine, 2'-O -methyl-2'-deoxyadenosine, 2'-O-methyl-2'-deoxycytidine, 2'-O-methyl-2'-deoxyguanosine, 2'-O-methyl-2'-deoxyuridine, 2'-O-methyl -5-methyluridine, 2'-O-methylinosine, 2'-O-methylpseudouridine, 2-thiocytidine, 2-thiocytosine, 3-methylcytosine, 4-acetylcytosine, 4-thiouridine, 5-(carboxyhydroxymethyl)uracil, 5,6- dihydrouridine, 5-aminoallylcytidine, 5-aminoallyldeoxyuridine, 5-bromuridine, 5-carboxymethylaminomethyl-2-thiouracil, 5-carboxymethylaminomethyluracil, 5-chloroaracytosine, 5-fluorouridine, 5-yoduridine, 5-methoxycarbonylmethyluridine, 5-methoxyuridine, 5-methyl -2-thiouridine, 6-azacytidine, 6-azauridine, 6-chloro-7-deazaguanosine, 6-chloropurinoribozide, 6-mercaptoguanosine, 6-methylmercaptopurine riboside, 7-deaza-2'-deoxyguanosine, 7-deazaadenosine, 7-methylguanosine, 8-azaadenosine, 8-broadenosine, 8-bromoguanosine, 8-mercaptorguanosine, 8-oxoguanosine, benzimidazole riboside, beta-D-mannosylqueosine, dihydrouracil, inosine, N1-methyladenosine, N6-([6-aminohexyl]carbamoylmethyl)adenosine, N6- isopentenyladenosine, N6-methyladenosine, N7- methylxanthosine, N-uracil-5-hydroxyacetic acid methyl ester, puromycin, queosin, uracil-5-hydroxyacetic acid, uracil-5-hydroxyacetic acid methyl ester, vibutoxosine, xanthosine, and xyladenosine. The preparation of such analogues is known to the person skilled in the art, for example, described in US 4373071, US 4401796, US 4415732, US 4458066, US 4500707, US 4668777, US 4973679, US 5047524, US 5132418, US 5153319, US 5262530 and 27 described above, most preferred analogs according to some embodiments of the invention may be those analogs that increase the protein expression of the encoded peptide or protein, or increase the immunogenicity of the artificial nucleic acid molecule of the invention, and/or do not interact with another introduced mRNA modification.

Согласно конкретному варианту осуществления изобретения мРНК в композиции, предлагаемой в настоящем изобретении, может содержать липидную модификацию.According to a specific embodiment of the invention, the mRNA in the composition of the present invention may contain a lipid modification.

В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты содержит, предпочтительно в 5'→3'-направлении, следующие элементы:In a preferred embodiment of the invention, the artificial nucleic acid molecule contains, preferably in the 5'→3' direction, the following elements:

5'-UTR;5'-UTR;

по меньшей мере одну открытую рамку считывания (ОРС), где ОРС предпочтительно содержит по меньшей мере одну модификацию по сравнению с последовательностью дикого типа;at least one open reading frame (ORF), where the ORF preferably contains at least one modification compared to the wild-type sequence;

3'-UTR, происходящую из 3'-UTR рибосомального белка, предпочтительно из нуклеотидной последовательности, представленной в любой из SEQ ID NO: 10-115, более предпочтительно 3'-UTR RPS9, более предпочтительно 3'-UTR RPS9 человека;a 3'-UTR derived from a ribosomal protein 3'-UTR, preferably from the nucleotide sequence shown in any of SEQ ID NOs: 10-115, more preferably RPS9 3'-UTR, more preferably human RPS9 3'-UTR;

поли(А)-последовательность, предпочтительно содержащую 64 аденилата;poly(A)-sequence, preferably containing 64 adenylate;

поли(С)-последовательность, предпочтительно содержащую 30 цитидилатов;poly(C)-sequence, preferably containing 30 cytidylates;

гистоновую структуру типа «стебель-петля».histone stem-loop structure.

В другом предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты содержит или состоит из нуклеотидной последовательности, представленной в SEQ ID NO: 7 (см. фиг.3) или комплементарной последовательности ДНК.In another preferred embodiment of the invention, the artificial nucleic acid molecule comprises or consists of the nucleotide sequence shown in SEQ ID NO: 7 (see FIG. 3) or a complementary DNA sequence.

В наиболее предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемая в изобретении, может содержать также одну или несколько описанных ниже модификаций:In the most preferred embodiment of the invention, the artificial nucleic acid molecule of the invention may also contain one or more of the following modifications:

Химические модификации:Chemical modifications:

В контексте настоящего описания понятие «модификация» применительно к искусственной молекуле нуклеиновой кислоты может относиться к химическим модификациям, включающим модификации каркаса, а также модификации сахара или модификации основания.In the context of the present description, the term "modification" in relation to an artificial nucleic acid molecule can refer to chemical modifications, including modifications of the backbone, as well as modifications of the sugar or modification of the base.

В этом контексте искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, представленная в настоящем описании, может содержать нуклеотидные аналоги/модификации, например, модификации каркаса, модификации сахара или модификации основания. Модификация каркаса согласно настоящему изобретению представляет собой модификацию, при которой химически модифицируют фосфаты каркаса нуклеотидов, содержащихся в молекуле нуклеиновой кислоты, представленной в настоящем описании. Модификация сахара согласно настоящему изобретению представляет собой химическую модификацию сахара нуклеотида в молекуле нуклеиновой кислоты, представленной в настоящем описании. Кроме того, модификация основания согласно настоящему изобретению представляет собой химическую модификацию основного фрагмента нуклеотидов в молекуле нуклеиновой кислоты. В этом контексте нуклеотидные аналоги или модификации предпочтительно выбирают из нуклеотидных аналогов, пригодных для транскрипции и/или трансляции.In this context, an artificial nucleic acid molecule, preferably an RNA molecule, as described herein, may contain nucleotide analogs/modifications, for example backbone modifications, sugar modifications, or base modifications. The backbone modification according to the present invention is a modification in which backbone phosphates of the nucleotides contained in the nucleic acid molecule described herein are chemically modified. A sugar modification according to the present invention is a chemical modification of the sugar of a nucleotide in a nucleic acid molecule as described herein. In addition, the modification of the base according to the present invention is a chemical modification of the main fragment of the nucleotides in the nucleic acid molecule. In this context, nucleotide analogs or modifications are preferably selected from nucleotide analogs suitable for transcription and/or translation.

Модификации сахара:Sugar modifications:

Модифицированные нуклеозиды и нуклеотиды, которые могут быть включены в искусственную молекулу нуклеиновой кислоты, предпочтительно РНК, представленную в настоящем описании, могут быть модифицированы в сахарном фрагменте. Например, 2'-гидроксигруппу (ОН) в молекуле РНК можно модифицировать или заменять многочисленными «окси»- или «дезокси»-заместителями. Примерами модификаций, включающих «окси»-2'-гидроксигруппы, являются (но, не ограничиваясь только ими) алкоксигруппы или арилоксигруппы (-OR, например, R=Н, алкил, циклоалкил, арил, аралкил, гетероарил или сахар); полиэтиленгликоли (PEG), -O(CH₂CH₂O)_nCH₂CH₂OR; «замкнутые» нуклеиновые кислоты (LNA), в которых 2'-гидроксил присоединен, например, с помощью метиленового мостика к 4'-углероду в том же самом сахарном фрагменте, представляющем собой рибозу; и аминогруппы (-О-аминогруппы, в которых аминогруппа, например, NRR, может представлять собой алкиламиногруппу, диалкиламиногруппу, гетероциклил, ариламиногруппу, диариламиногруппу, гетероариламиногруппу или дигетероариламиногруппу, этилендиамин, полиаминогруппу) или алкоксигруппу.Modified nucleosides and nucleotides that can be included in an artificial nucleic acid molecule, preferably RNA, as described herein, can be modified in the sugar moiety. For example, the 2'-hydroxy group (OH) in an RNA molecule can be modified or replaced by numerous "oxy" or "deoxy" substituents. Examples of modifications that include "oxy"-2'-hydroxy groups are (but not limited to) alkoxy or aryloxy groups (-OR, for example, R=H, alkyl, cycloalkyl, aryl, aralkyl, heteroaryl, or sugar); polyethylene glycols (PEG), -O(CH ₂ CH ₂ O) _n CH ₂ CH ₂ OR; "closed" nucleic acids (LNA), in which the 2'-hydroxyl is attached, for example, via a methylene bridge to the 4'-carbon in the same ribose sugar moiety; and amino groups (-O-amino groups, in which the amino group, for example, NRR, may be an alkylamino group, a dialkylamino group, a heterocyclyl, an arylamino group, a diarylamino group, a heteroarylamino group or a diheteroarylamino group, an ethylenediamine, a polyamino group) or an alkoxy group.

«Дезокси»-модификация включает водород, аминогруппу (например, NH₂; алкиламиногруппу, диалкиламиногруппу, гетероциклил, ариламиногруппу, диариламиногруппу, гетероариламиногруппу, дигетероариламиногруппу или аминокислоту); или аминогруппу можно присоединять к сахару через линкер, где линкер содержит один или несколько атомов С, N и О.The "deoxy" modification includes hydrogen, an amino group (eg, NH ₂ ; an alkylamino group, a dialkylamino group, a heterocyclyl, an arylamino group, a diarylamino group, a heteroarylamino group, a diheteroarylamino group, or an amino acid); or an amino group can be attached to the sugar through a linker, where the linker contains one or more C, N and O atoms.

Сахарная группа может содержать также один или несколько атомов углерода, которые могут находиться в стереохимической конфигурации, отличной от конфигурации соответствующего атома углерода в рибозе. Так, модифицированная молекула нуклеиновой кислоты может включать, например, в качестве сахара арабинозу.The sugar group may also contain one or more carbon atoms, which may be in a stereochemical configuration different from that of the corresponding carbon atom in the ribose. Thus, the modified nucleic acid molecule may include, for example, arabinose as a sugar.

Модификации каркаса:Frame mods:

Можно модифицировать также фосфатный каркас в модифицированных нуклеозидах и нуклеотидах, которые могут быть встроены в искусственную молекулу нуклеиновой кислоты, предпочтительно РНК, представленную в настоящем описании. Фосфатные группы в каркасе можно модифицировать посредством замены одного или нескольких атомов кислорода на различные заместители. Кроме того, в модифицированных нуклеозидах и нуклеотидах немодифицированный фосфатный фрагмент может быть полностью заменен на модифицированный фосфат, представленный в настоящем описании. Примеры модифицированных фосфатных групп включают (но, не ограничиваясь только ими) фосфоротиоаты, фосфороселенаты, боранофосфаты, сложные боранофосфатные эфиры, первичные фосфонаты, фосфороамидаты, алкил- или арилфосфонаты и сложные фосфотриэфиры. В фосфородитиоатах оба несвязывающих атома кислорода заменены серой. Фосфатный линкер также можно модифицировать путем замены связывающего атома кислорода на азот (мостиковые фосфороамидаты), серу (мостиковые фосфоротиоаты) и углерод (мостиковые метиленфосфонаты).It is also possible to modify the phosphate backbone in modified nucleosides and nucleotides, which can be inserted into an artificial nucleic acid molecule, preferably RNA, as described herein. Phosphate groups in the framework can be modified by replacing one or more oxygen atoms with various substituents. In addition, in modified nucleosides and nucleotides, the unmodified phosphate moiety can be completely replaced by a modified phosphate as described herein. Examples of modified phosphate groups include, but are not limited to, phosphorothioates, phosphoroselenates, boranophosphates, boranophosphate esters, primary phosphonates, phosphoramidates, alkyl or aryl phosphonates, and phosphotriesters. In phosphorodithioates, both non-bonding oxygen atoms are replaced by sulfur. The phosphate linker can also be modified by replacing the bonding oxygen atom with nitrogen (bridged phosphoroamidates), sulfur (bridged phosphorothioates), and carbon (bridged methylenephosphonates).

Модификации основания:Base modifications:

Модифицированные нуклеозиды и нуклеотиды, которые можно встраивать в искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, представленную в настоящем описании, можно модифицировать также в фрагменте, представляющем собой нуклеооснование. Примерами нуклеооснований, входящих в РНК, являются (но, не ограничиваясь только ими) аденин, гуанин, цитозин и урацил. Например, нуклеозиды и нуклеотиды, представленные в настоящем описании, можно химически модифицировать на поверхности большой бороздки. В некоторых вариантах осуществления изобретения химические модификации главной бороздки включают аминогруппу, тиольную групп алкильную группу или галогруппу.Modified nucleosides and nucleotides that can be inserted into an artificial nucleic acid molecule, preferably an RNA molecule as described herein, can also be modified in a nucleobase moiety. Examples of nucleobases included in RNA are (but not limited to) adenine, guanine, cytosine and uracil. For example, the nucleosides and nucleotides provided herein can be chemically modified on the surface of the major groove. In some embodiments, the major groove chemical modifications include an amino group, a thiol group, an alkyl group, or a halo group.

В наиболее предпочтительных вариантах осуществления настоящего изобретения нуклеотидные аналоги/модификации выбирают из модификаций основания, которые предпочтительно выбирают из 2-амино-6-хлорпуринрибозид-5'-трифосфат, 2-аминоаденозин-5'-трифосфат, 2-тиоцитидин-5'-трифосфат, 2-тиоуридин-5'-трифосфат, 4-тиоуридин-5'-трифосфат, 5-аминоаллилцитидин-5'-трифосфат, 5-аминоаллилуридин-5'-трифосфат, 5-бромцитидин-5'-трифосфат, 5-бромуридин-5'-трифосфат, 5-йодцитидин-5'-трифосфат, 5-йодуридин-5'-трифосфат, 5-метилцитидин-5'-трифосфат, 5-метилуридин-5'-трифосфат, 6-азацитидин-5'-трифосфат, 6-азауридин-5'-трифосфат, 6-хлорпуринрибозид-5'-трифосфат, 7-деазааденозин-5'-трифосфат, 7-деазагуанозин-5'-трифосфат, 8-азааденозин-5'-трифосфат, 8-азидоаденозин-5'-трифосфат, бензимидазолрибозид-5'-трифосфат, N1-метиладенозин-5'-трифосфат, N1-метилгуанозин-5'-трифосфат, N6-метиладенозин-5'-трифосфат, О6-метилгуанозин-5'-трифосфат, псевдоуридин-5'-трифосфат или пуромицин-5'-трифосфат, ксантозин-5'-трифосфат. Наиболее предпочтительные нуклеотиды для модификаций оснований выбирают из группы нуклеотидов с модифицированными основаниями, включающей 5-метилцитидин-5'-трифосфат, 7-деазагуанозин-5'-трифосфат, 5-бромцитидин-5'-трифосфат и псевдоуридин-5'-трифосфат.In the most preferred embodiments of the present invention, the nucleotide analogs/modifications are selected from base modifications, which are preferably selected from 2-amino-6-chloropurine riboside-5'-triphosphate, 2-aminoadenosine-5'-triphosphate, 2-thiocytidine-5'-triphosphate , 2-thiouridine-5'-triphosphate, 4-thiouridine-5'-triphosphate, 5-aminoallylcytidine-5'-triphosphate, 5-aminoallyluridine-5'-triphosphate, 5-bromocytidine-5'-triphosphate, 5-bromouridine- 5'-triphosphate, 5-iodcytidine-5'-triphosphate, 5-ioduridine-5'-triphosphate, 5-methylcytidine-5'-triphosphate, 5-methyluridine-5'-triphosphate, 6-azacytidine-5'-triphosphate, 6-azauridine-5'-triphosphate, 6-chloropurine riboside-5'-triphosphate, 7-deazaadenosine-5'-triphosphate, 7-deazaguanosine-5'-triphosphate, 8-azaadenosine-5'-triphosphate, 8-azidoadenosine-5 '-triphosphate, benzimidazole riboside-5'-triphosphate, N1-methyladenosine-5'-triphosphate, N1-methylguanosine-5'-triphosphate, N6-methyladenosine-5'-triphosphate, O6-methylguanosine-5'-triphosphate, pseudouridine-5 '-triphosphate or puromycin-5'-triphosphate, xanthosine-5'-triphosphate. The most preferred nucleotides for base modifications are selected from the group of base-modified nucleotides including 5-methylcytidine-5'-triphosphate, 7-deazaguanosine-5'-triphosphate, 5-bromocytidine-5'-triphosphate, and pseudouridine-5'-triphosphate.

В некоторых вариантах осуществления изобретения модифицированные нуклеозиды включают пиридин-4-оновый рибонуклеозид, 5-азауридин, 2-тио-5-азауридин, 2-тиоуридин, 4-тиопсевдоуридин, 2-тиопсевдоуридин, 5-гидроксиуридин,3-метилуридин, 5-карбоксиметилуридин,1-карбоксиметилпсевдоуридин, 5-пропинилуридин, 1-пропинилпсевдоуридин, 5-тауринометилуридин, 1-тауринометилпсевдоуридин, 5-тауринометил-2-тиоуридин, 1-тауринометил-4-тиоуридин, 5-метилуридин, 1-метилпсевдоуридин, 4-тио-1-метилпсевдоуридин, 2-тио- 1-метилпсевдоуридин, 1-метил-1-деазапсевдоуридин, 2-тио-1-метил-1-деазапсевдоуридин, дигидроуридин, дигидропсевдоуридин, 2-тиодигидроуридин, 2-тиодигидропсевдоуридин, 2-метоксиуридин, 2-метокси-4-тиоуридин, 4-метоксипсевдоуридин и 4-метокси-2-тиопсевдоуридин.In some embodiments, the modified nucleosides include pyridin-4-one ribonucleoside, 5-azauridine, 2-thio-5-azauridine, 2-thiouridine, 4-thiopseudouridine, 2-thiopseudouridine, 5-hydroxyuridine, 3-methyluridine, 5-carboxymethyluridine ,1-carboxymethylpseudouridine, 5-propynyluridine, 1-propynylpseudouridine, 5-taurinomethyluridine, 1-taurinomethylpseudouridine, 5-taurinomethyl-2-thiouridine, 1-taurinomethyl-4-thiouridine, 5-methyluridine, 1-methylpseudouridine, 4-thio-1 -methylpseudouridine, 2-thio-1-methylpseudouridine, 1-methyl-1-deazapseudouridine, 2-thio-1-methyl-1-deazapseudouridine, dihydrouridine, dihydropseudouridine, 2-thiodihydrouridine, 2-thiodihydropseudouridine, 2-methoxyuridine, 2-methoxy -4-thiouridine, 4-methoxypseudouridine and 4-methoxy-2-thiopseudouridine.

В некоторых вариантах осуществления изобретения модифицированные нуклеозиды включают 5-азацитидин, псевдоизоцитидин, 3-метилцитидин, N4-ацетилцитидин, 5-формилцитидин, N4-метилцитидин, 5-гидроксиметилцитидин, 1-метилпсевдоизоцитидин, пирролоцитидин, пирролопсевдоизоцитидин, 2-тиоцитидин, 2-тио-5-метилцитидин, 4-тиопсевдоизоцитидин, 4-тио-1-метилпсевдоизоцитидин, 4-тио-1-метил-1-деазапсевдоизоцитидин, 1-метил-1-деазапсевдоизоцитидин, зебуларин, 5-азазебуларин, 5-метилзебуларин, 5-аза-2-тиозебуларин, 2-тиозебуларин, 2-метоксицитидин, 2-метокси-5-метилцитидин, 4-метоксипсевдоизоцитидин и 4-метокси-1-метилпсевдоизоцитидин.In some embodiments, the modified nucleosides include 5-azacytidine, pseudoisocytidine, 3-methylcytidine, N4-acetylcytidine, 5-formylcytidine, N4-methylcytidine, 5-hydroxymethylcytidine, 1-methylpseudoisocytidine, pyrrolocytidine, pyrrolopseudoisocytidine, 2-thiocytidine, 2-thio- 5-methylcytidine, 4-thiopseudisocytidine, 4-thio-1-methylpseudoisocytidine, 4-thio-1-methyl-1-deazapseudoisocytidine, 1-methyl-1-deazapseudoisocytidine, zebularine, 5-azazebularine, 5-methylzebularine, 5-aza- 2-thiozebularine, 2-thiosebularine, 2-methoxycytidine, 2-methoxy-5-methylcytidine, 4-methoxypseudoisocytidine and 4-methoxy-1-methylpseudoisocytidine.

В других вариантах осуществления изобретения модифицированные нуклеозиды включают 2-аминопурин, 2, 6-диаминопурин, 7-деазааденин, 7-деаза-8-азааденин, 7-деаза-2-аминопурин, 7-деаза-8-аза-2-аминопурин, 7-деаза-2,6-диаминопурин, 7-деаза-8-аза-2,6-диаминопурин, 1-метиладенозин, N6-метиладенозин, N6-изопентениладенозин, N6-(цис-гидроксиизопентенил)аденозин, 2-метилтио-N6-(цис-гидроксиизопентенил) аденозин, N6-глицинилкарбомоиладенозин, N6-треонилкарбамоиладенозин, 2-метилтио-N6-треонилкарбамоиладенозин, N6,N6-диметиладенозин, 7-метиладенин, 2-метилтиоаденин и 2-метоксиаденин.In other embodiments, the modified nucleosides include 2-aminopurine, 2,6-diaminopurine, 7-deazaadenine, 7-deaza-8-azaadenine, 7-deaza-2-aminopurine, 7-deaza-8-aza-2-aminopurine, 7-deaza-2,6-diaminopurine, 7-deaza-8-aza-2,6-diaminopurine, 1-methyladenosine, N6-methyladenosine, N6-isopentenyladenosine, N6-(cis-hydroxyisopentenyl)adenosine, 2-methylthio-N6 -(cis-hydroxyisopentenyl)adenosine, N6-glycinylcarbamoyladenosine, N6-threonylcarbamoyladenosine, 2-methylthio-N6-threonylcarbamoyladenosine, N6,N6-dimethyladenosine, 7-methyladenine, 2-methylthioadenine and 2-methoxyadenine.

В других вариантах осуществления изобретения модифицированные нуклеозиды включают инозин, 1-метилинозин, виозин, вибутозин, 7-деазагуанозин, 7-деаза-8-азагуанозин, 6-тиогуанозин, 6-тио-7-деазагуанозин, 6-тио-7-деаза-8-азагуанозин, 7-метилгуанозин, 6-тио-7-метилгуанозин, 7-метилинозин, 6-метоксигуанозин, 1-метилгуанозин, N2-метилгуанозин, N2,N2-диметилгуанозин, 8-оксогуанозин, 7-метил-8-оксогуанозин, 1-метил-6-тиогуанозин, N2-метил-6-тиогуанозин и N2,N2-диметил-6-тиогуанозин.In other embodiments, the modified nucleosides include inosine, 1-methylinosine, viosin, vibutosin, 7-deazaguanosine, 7-deaza-8-azaguanosine, 6-thioguanosine, 6-thio-7-deazaguanosine, 6-thio-7-deaza- 8-azaguanosine, 7-methylguanosine, 6-thio-7-methylguanosine, 7-methylinosine, 6-methoxyguanosine, 1-methylguanosine, N2-methylguanosine, N2,N2-dimethylguanosine, 8-oxoguanosine, 7-methyl-8-oxoguanosine, 1-methyl-6-thioguanosine, N2-methyl-6-thioguanosine and N2,N2-dimethyl-6-thioguanosine.

В некоторых вариантах осуществления изобретения нуклеотид можно модифицировать на поверхности главной бороздки и модификация может включать замену атома водорода на С-5 урацила метальной группой или галогруппой.In some embodiments, the nucleotide may be modified at the surface of the major groove, and the modification may include replacing the hydrogen atom on the C-5 uracil with a methyl group or a halo group.

В конкретных вариантах осуществления изобретения модифицированный нуклеозид представляет собой 5'-O-(1-тиофосфат)-аденозин, 5'-O-(1-тиофосфат)-цитидин, 5'-O-(1-тиофосфат)-гуанозин, 5'-O-(1-тиофосфат)-уридин или 5'-O-(1-тиофосфат)-псевдоуридин.In specific embodiments, the modified nucleoside is 5'-O-(1-thiophosphate)-adenosine, 5'-O-(1-thiophosphate)-cytidine, 5'-O-(1-thiophosphate)-guanosine, 5' -O-(1-thiophosphate)-uridine or 5'-O-(1-thiophosphate)-pseudouridine.

В других конкретных вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, может содержать нуклеозидные модификации, выбранные из 6-азацитидина, 2-тиоцитидина, альфа-тиоцитидина, псевдоизоцитидина, 5-аминоаллилуридина, 5-йодуридина, N1-метилпсевдоуридина, 5,6-дигидроуридина, альфа-тиоуридина, 4-тиоуридина, 6-азауридина, 5-гидроксиуридина, дезокситимидина, 5-метилуридина, пирролоцитидина, инозина, альфа-тиогуанозина, 6-метилгуанозина, 5-метилцитидина, 8-оксогуанозина, 7-деазагуанозина, N1-метиладенозина, 2-амино-6-хлорпурина, N6-метил-2-аминопурина, псевдоизоцитидина, 6-хлорпурина, N6-метиладенозин, альфа-тиоаденозина, 8-азидоаденозина, 7-деазааденозина.In other specific embodiments, the artificial nucleic acid molecule, preferably an RNA molecule, may contain nucleoside modifications selected from 6-azacytidine, 2-thiocytidine, alpha-thiocytidine, pseudoisocytidine, 5-aminoallyluridine, 5-yoduridine, N1-methylpseudouridine, 5, 6-dihydrouridine, alpha-thiouridine, 4-thiouridine, 6-azauridine, 5-hydroxyuridine, deoxythymidine, 5-methyluridine, pyrrolocytidine, inosine, alpha-thioguanosine, 6-methylguanosine, 5-methylcytidine, 8-oxoguanosine, 7-deazaguanosine, N1-methyladenosine, 2-amino-6-chloropurine, N6-methyl-2-aminopurine, pseudoisocytidine, 6-chloropurine, N6-methyladenosine, alpha-thioadenosine, 8-azidoadenosine, 7-deazaadenosine.

Липидная модификация:Lipid modification:

Согласно следующему варианту осуществления изобретения искусственная молекула нуклеиновой кислоты, предпочтительно РНК, представленная в настоящем описании, может содержать липидную модификацию. Такая модифицированная липидами РНК, как правило, содержит РНК, представленную в настоящем описании. Такая модифицированная липидами молекула РНК, представленная в настоящем описании, как правило, дополнительно содержит по меньшей мере один линкер, ковалентно связанный с указанной молекулой РНК, и по меньшей мере один липид, ковалентно связанный с соответствующим линкером. Альтернативно этому, модифицированная липидами молекула РНК содержит (по меньшей мере одну) молекулу РНК, указанную в настоящем описании, и по меньшей мере один (бифункциональный) липид, ковалентно связанный (без линкера) с указанной молекулой РНК. Согласно третьей альтернативе модифицированная липидами молекула РНК содержит искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, указанную в настоящем описании, по меньшей мере один линкер, ковалентно связанный с указанной молекулой РНК, и по меньшей мере один липид, ковалентно связанный с соответствующим линкером, и также по меньшей мере один (бифункциональный) липид, ковалентно связанный (без линкера) с указанной мРНК. В этом контексте наиболее предпочтительно липидную модификацию осуществляют на концах линейной последовательности РНК.According to a further embodiment of the invention, the artificial nucleic acid molecule, preferably RNA, provided herein may contain a lipid modification. Such lipid-modified RNA typically contains the RNA described herein. Such a lipid-modified RNA molecule as described herein typically further comprises at least one linker covalently linked to said RNA molecule and at least one lipid covalently linked to the corresponding linker. Alternatively, a lipid-modified RNA molecule comprises (at least one) an RNA molecule as defined herein and at least one (bifunctional) lipid covalently linked (without a linker) to said RNA molecule. In a third alternative, the lipid-modified RNA molecule comprises an artificial nucleic acid molecule, preferably an RNA molecule, as defined herein, at least one linker covalently linked to said RNA molecule, and at least one lipid covalently linked to a corresponding linker, and also at least one (bifunctional) lipid covalently linked (without a linker) to said mRNA. In this context, most preferably the lipid modification is carried out at the ends of the linear RNA sequence.

Модификация 5'-конца модифицированной РНК:Modification of the 5'-end of the modified RNA:

Согласно другому предпочтительному варианту осуществления изобретения искусственную молекулу нуклеиновой кислоты, предпочтительно молекулу РНК, представленную в настоящем описании, можно модифицировать путем добавления так называемой «5'-кэп»-структуры.According to another preferred embodiment of the invention, the artificial nucleic acid molecule, preferably the RNA molecule described herein, can be modified by adding a so-called "5'-cap" structure.

5'-кэп представляет собой структуру, как правило, структуру, состоящую из модифицированных нуклеотидов, которая, как правило, завершает («кэпирует») 5'-конец зрелой мРНК. 5'-кэп, как правило, может быть сформирован модифицированным нуклеотидом, прежде всего производным гуанинового нуклеотида. Предпочтительно 5'-кэп связывают с 5'-концом с помощью 5'-5'-трифосфатной связи. 5'-кэп может быть метилирован, например, m7GpppN), где N представляет собой концевой 5'-нуклеотид нуклеиновой кислоты, несущей 5'-кэп, как правило, 5'-конец РНК. m7GpppN представляет собой 5'-кэп-структуру, которая встречается в естественных условиях в мРНК транскрибируемой полимеразой II, и, следовательно, не рассматривается как модификация, содержащаяся в модифицированной РНК, предлагаемой в изобретении. Это означает, что искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, предлагаемая в настоящем изобретении, может содержать m7GpppN в качестве 5'-кэпа, но при этом дополнительно искусственная молекула нуклеиновой кислоты, предпочтительно молекула РНК, содержит по меньшей мере одну дополнительную модификацию, представленную в настоящем описании.A 5' cap is a structure, typically a modified nucleotide structure, that typically terminates ("caps") the 5' end of a mature mRNA. The 5' cap can generally be formed by a modified nucleotide, primarily a derivative of a guanine nucleotide. Preferably, the 5' cap is linked to the 5' end via a 5'-5' triphosphate bond. The 5' cap may be methylated, eg m7GpppN), where N is the 5' terminal nucleotide of the nucleic acid bearing the 5' cap, typically the 5' end of the RNA. m7GpppN is a 5' cap structure that occurs naturally in mRNA transcribed by polymerase II and is therefore not considered as a modification contained in the modified RNA of the invention. This means that an artificial nucleic acid molecule, preferably an RNA molecule, according to the present invention may contain m7GpppN as a 5'-cap, but additionally, an artificial nucleic acid molecule, preferably an RNA molecule, contains at least one additional modification represented by in this description.

Другими примерами 5'-кэп-структур являются глицерил, инвертированная дезоксигруппа (фрагмент), лишенная азотистого основания, 4',5'-метиленовой нуклеотид, 1-(бета-D-эритрофуранозильный) нуклеотид, 4'-тионуклеотид, карбоциклический нуклеотид, 1,5-ангидрогекситольный нуклеотид, L-нуклеотиды, альфа-нуклеотид, нуклеотид с модифицированным основанием, треопентофуранозильный нуклеотид, ациклический 3',4'-секонуклеотид, ациклический 3,4-дигидроксибутильный нуклеотид, ациклический 3,5-дигидроксипентильный нуклеотид, 3'-3'-инвертированный нуклеотидный фрагмент, 3'-3'-инвертированный лишенный азотистого основания фрагмент, 3'-2'-инвертированный нуклеотидный фрагмент, 3'-2'-инвертированный лишенный азотистого основания фрагмент, 1,4-бутандиолфосфатный, 3'-фосфороамидатный, гексилфосфатный, аминогексилфосфатный, 3'-фосфатный, 3'-фосфоротиоатный, фосфородитиоатный или связанный мостиком или несвязанный мостиком метилфосфонатный фрагмент. Эти модифицированные 5'-кэп-структуры рассматриваются в качестве по меньшей мере одной модификации, содержащейся в искусственной молекуле нуклеиновой кислоты, предпочтительно в молекуле РНК, предлагаемой в настоящем изобретении.Other examples of 5'-cap structures are glyceryl, inverted deoxy group (fragment) devoid of a nitrogenous base, 4',5'-methylene nucleotide, 1-(beta-D-erythrofuranosyl) nucleotide, 4'-thionucleotide, carbocyclic nucleotide, 1 ,5-anhydrohexitol nucleotide, L-nucleotides, alpha-nucleotide, base-modified nucleotide, treopentofuranosyl nucleotide, acyclic 3',4'-seconucleotide, acyclic 3,4-dihydroxybutyl nucleotide, acyclic 3,5-dihydroxypentyl nucleotide, 3'- 3'-inverted nucleotide fragment, 3'-3'-inverted baseless fragment, 3'-2'-inverted nucleotide fragment, 3'-2'-inverted baseless fragment, 1,4-butanediolphosphate, 3'- a phosphoramidate, hexylphosphate, aminohexylphosphate, 3'-phosphate, 3'-phosphorothioate, phosphorodithioate or bridged or unbridged methylphosphonate moiety. These modified 5' cap structures are considered to be at least one modification contained in an artificial nucleic acid molecule, preferably an RNA molecule, according to the present invention.

Наиболее предпочтительными модифицированными 5'-кэп-структурами являются САР1 (метилирование рибозы соседнего с m7GpppN нуклеотида), САР2 (метилирование рибозы 2-ого нуклеотида, расположенного в прямом направлении относительно m7GpppN), САР3 (метилирование рибозы 3-его нуклеотида, расположенного в прямом направлении относительное m7GpppN), САР4 (метилирование рибозы 4-ого нуклеотида, расположенного в прямом направлении относительно m7GpppN), ARCA (аналог кэп-структуры с правильной ориентацией, модифицированный ARCA (например, модифицированный фосфотиоатом ARCA), инозин, N1-метилгуанозин, 2'-фторгуанозин, 7-деазагуанозин, 8-оксогуанозин, 2-аминогуанозин, ЗНК-гуанозин и 2-азидогуанозин.The most preferred modified 5'-cap structures are CAP1 (ribose methylation of the nucleotide adjacent to m7GpppN), CAP2 (methylation of the 2nd nucleotide ribose upstream of m7GpppN), CAP3 (methylation of the 3rd nucleotide ribose upstream of m7GpppN). relative m7GpppN), CAP4 (methylation of the ribose of the 4th nucleotide located in the forward direction relative to m7GpppN), ARCA (correctly oriented cap analog modified by ARCA (for example, modified by ARCA phosphothioate), inosine, N1-methylguanosine, 2'- fluoroguanosine, 7-deazaguanosine, 8-oxoguanosine, 2-aminoguanosine, LNA-guanosine and 2-azidoguanosine.

В предпочтительном варианте осуществления изобретения по меньшей мере одна открытая рамка считывания кодирует терапевтический белок или пептид. В другом варианте осуществления изобретения по меньшей мере одной открытой рамкой считывания кодируется антиген, такой как патогенный антиген, опухолевый антиген, аллергенный антиген или аутоиммунный антиген. Таким образом, введение искусственной молекулы нуклеиновой кислоты, кодирующей антиген, применяют в подходе, заключающемся в генетической вакцинации против заболевания, в котором участвует указанный антиген.In a preferred embodiment of the invention, at least one open reading frame encodes a therapeutic protein or peptide. In another embodiment, the at least one open reading frame encodes an antigen, such as a pathogenic antigen, a tumor antigen, an allergenic antigen, or an autoimmune antigen. Thus, the introduction of an artificial nucleic acid molecule encoding an antigen is used in the approach of genetic vaccination against a disease in which said antigen is involved.

В альтернативном варианте осуществления изобретения по меньшей мере одной открытой рамкой считывания искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении, кодируется антитело.In an alternative embodiment of the invention, at least one open reading frame of an artificial nucleic acid molecule of the invention encodes an antibody.

Антигены:Antigens:

Патогенные антигены:Pathogenic antigens:

Искусственная молекула нуклеиновой кислоты, предлагаемой в настоящем изобретении, может кодировать белок или пептид, который содержит патогенный антиген или его фрагмент, вариант или производное. Такие патогенные антигены происходят из патогенных организмов, прежде всего, бактерий, вирусов или простейших (многоклеточных) патогенных организмов, которые вызывают иммунологическую реакцию у индивидуума, прежде всего у млекопитающего, более предпочтительно у человека. Более конкретно, патогенные антигены предпочтительно представляют собой поверхностные антигены, например, белки (или фрагменты белков, например, находящуюся снаружи часть поверхностного антигена), локализованные на поверхности вируса или бактерии или простейшего.The artificial nucleic acid molecule of the present invention may encode a protein or peptide that contains a pathogenic antigen or fragment, variant or derivative thereof. Such pathogenic antigens are derived from pathogenic organisms, primarily bacteria, viruses or protozoan (multicellular) pathogenic organisms, which elicit an immunological response in an individual, primarily a mammal, more preferably a human. More specifically, pathogenic antigens are preferably surface antigens, eg proteins (or fragments of proteins, eg the exposed portion of a surface antigen) located on the surface of a virus or bacterium or protozoan.

Патогенные антигены представляют собой пептидные или белковые антигены, предпочтительно происходящие из патогенов, ассоциированных с инфекционным заболеванием, которые предпочтительно выбирают из антигенов, происходящих из патогенов Acinetobacter baumannii, рода Anaplasma, Anaplasma phagocytophilum, Ancylostoma braziliense, Ancylostoma duodenale, Arcanobacterium haemolyticum, Ascaris lumbricoides, рода Aspergillus, Astroviridae, рода Babesia, Bacillus anthracis, Bacillus cereus, Bartonella henselae, вируса BK, Blastocystis hominis, Blastomyces dermatitidis, Bordetella pertussis, Borrelia burgdorferi, рода Borrelia, Borrelia spp, рода Brucella, Brugia malayi, семейства Bunyaviridae, Burkholderia cepacia и других видов Burkholderia, Burkholderia mallei, Burkholderia pseudomallei, семейства Caliciviridae, рода Campylobacter, Candida albicans, Candida spp, Chlamydia trachomatis, Chlamydophila pneumoniae, Chlamydophila psittaci, приона CJD, Clonorchis sinensis, Clostridium botulinum, Clostridium difficile, Clostridium perfringens, Clostridium perfringens, Clostridium spp, Clostridium tetani, Coccidioides spp, коронавирусов, Corynebacterium diphtheriae, Coxiella burnetii, вируса геморрагической лихорадки Крым-Конго, Cryptococcus neoformans, рода Cryptosporidium, Cytomegalovirus (CMV), вирусов Денге (DEN-1, DEN-2, DEN-3 и DEN-4), Dientamoeba fragilis, вируса Эбола (EBOV), рода Echinococcus, Ehrlichia chaffeensis, Ehrlichia ewingii, рода Ehrlichia, Entamoeba histolytica, рода Enterococcus, рода Enterovirus, энтеровирусов, прежде всего вируса Коксаки А и энтеровируса 71 (EV71), Epidermophyton spp, вируса Эпштейна-Барра (EBV), Escherichia coli O157:Н7, О111 и О104:Н4, Fasciola hepatica и Fasciola gigantica, приона FFI, суперсемейства Filarioidea, флавивирусов, Francisella tularensis, рода Fusobacterium, Geotrichum candidum, Giardia intestinalis, Gnathostoma spp, приона GSS, вируса Гуанарито, Haemophilus ducreyi, Haemophilus influenzae, Helicobacter pylori, генипавируса (вирус Гендра и вирус Нипа), вируса гепатита А, вируса гепатита В (HBV), вируса гепатита С (HCV), вируса гепатита D, вируса гепатита, вируса герпеса простого 1 и 2 (HSV-1 и HSV-2), Histoplasma capsulatum, HIV (вирус иммунодефицита человека), Hortaea werneckii, человеческого бокавируса (HBoV), человеческого вируса герпеса 6 (HHV-6) и человеческого вируса герпеса 7 (HHV-7), человеческого вируса метапенвмонии (hMPV), вируса папилломы человека (HPV), человеческих вирусов парагриппа (HPIV), вируса японского энцефалита, вируса JC, вируса Джунин, Kingella kingae, Klebsiella granulomatis, приона Куру, вируса Ласса, Legionella pneumophila, рода Leishmania, рода Leptospira, Listeria monocytogenes, вируса лимфоцитарного хориоменингита (LCMV), вируса Мачупо, Malassezia spp, вируса Марбурга, вируса кори, Metagonimus yokagawai, Microsporidia phylum, вируса контагиозного моллюска (MCV), вируса паротита, Mycobacterium leprae и Mycobacterium lepromatosis, Mycobacterium tuberculosis, Mycobacterium ulcerans, Mycoplasma pneumoniae, Naegleria fowleri, Necator americanus, Neisseria gonorrhoeae, Neisseria meningitidis, Nocardia asteroides, Nocardia spp, Onchocerca volvulus, Orientia tsutsugamushi, семейства Orthomyxoviridae (грипп), Paracoccidioides brasiliensis, Paragonimus spp, Paragonimus westermani, парвовируса B19, рода Pasteurella, рода Plasmodium, Pneumocystis jirovecii, полиовируса, вируса бешенства, респираторно-синтициального вируса (RSV), риновируса, риновирусов, Rickettsia akari, рода Rickettsia, Rickettsia prowazekii, Rickettsia rickettsii, Rickettsia typhi, вируса долины Рифта, ротавируса, вируса краснухи, вируса Сабиа, рода Salmonella, Sarcoptes scabiei, коронавируса SARS, рода Schistosoma, рода Shigella, вируса Син Номбре, хантавируса, Sporothrix schenckii, рода Staphylococcus, Streptococcus agalactiae, Streptococcus pneumoniae, Streptococcus pyogenes, Strongyloides stercoralis, рода Taenia, Taenia solium, вируса клещевого энцефалита (TBEV), Toxocara canis или Toxocara cati, Toxoplasma gondii, Treponema pallidum, Trichinella spiralis, Trichomonas vaginalis, Trichophyton spp, Trichuris trichiura, Trypanosoma brucei, Trypanosoma cruzi, Ureaplasma urealyticum, вируса ветряной оспы (VZV), Variola major или Variola minor, приона vCJD, вируса венесуэльского энцефалита лошадей, Vibrio cholerae, вируса Западного Нила, вируса западного энцефалита лошадей, Wuchereria bancrofti, вируса желтой лихорадки, Yersinia enterocolitica, Yersinia pestis и Yersinia pseudotuberculosis.Pathogenic antigens are peptide or protein antigens, preferably derived from pathogens associated with an infectious disease, which are preferably selected from antigens derived from pathogens Acinetobacter baumannii, genus Anaplasma, Anaplasma phagocytophilum, Ancylostoma braziliense, Ancylostoma duodenale, Arcanobacterium haemolyticum, Ascaris lumbricoides, genus Aspergillus, Astroviridae, Babesia genus, Bacillus anthracis, Bacillus cereus, Bartonella henselae, BK virus, Blastocystis hominis, Blastomyces dermatitidis, Bordetella pertussis, Borrelia burgdorferi, Borrelia genus, Borrelia spp, Brucella genus, Brugia malayi, Bunyaviridae family, Burkholderia cepacia and others Burkholderia species, Burkholderia mallei, Burkholderia pseudomallei, Caliciviridae family, Campylobacter genus, Candida albicans, Candida spp, Chlamydia trachomatis, Chlamydophila pneumoniae, Chlamydophila psittaci, CJD prion, Clonorchis sinensis, Clostridium botulinum, Clostr idium difficile, Clostridium perfringens, Clostridium perfringens, Clostridium spp, Clostridium tetani, Coccidioides spp, coronaviruses, Corynebacterium diphtheriae, Coxiella burnetii, Crimean Congo hemorrhagic fever virus, Cryptococcus neoformans, Cryptosporidium genus, Cytomegalovirus (CMV), Dengue viruses (DEN-1) , DEN-2, DEN-3 and DEN-4), Dientamoeba fragilis, Ebola virus (EBOV), Echinococcus genus, Ehrlichia chaffeensis, Ehrlichia ewingii, Ehrlichia genus, Entamoeba histolytica, Enterococcus genus, Enterovirus genus, enteroviruses, especially Coxsackievirus A and enterovirus 71 (EV71), Epidermophyton spp, Epstein-Barr virus (EBV), Escherichia coli O157:H7, O111 and O104:H4, Fasciola hepatica and Fasciola gigantica, prion FFI, superfamily Filarioidea, flaviviruses, Francisella tularensis, genus Fusobacterium , Geotrichum candidum, Giardia intestinalis, Gnathostoma spp, GSS prion, Guanarito virus, Haemophilus ducreyi, Haemophilus influenzae, Helicobacter pylori, genipavirus (virus Gendra and Nipah virus), hepatitis A virus, hepatitis B virus (HBV), hepatitis C virus (HCV), hepatitis D virus, hepatitis virus, herpes simplex virus 1 and 2 (HSV-1 and HSV-2), Histoplasma capsulatum, HIV (human immunodeficiency virus), Hortaea werneckii, human bocavirus (HBoV), human herpes virus 6 (HHV-6) and human herpes virus 7 (HHV-7), human metapenummonia virus (hMPV), human papillomavirus (HPV), human parainfluenza viruses (HPIV), Japanese encephalitis virus, JC virus, Junin virus, Kingella kingae, Klebsiella granulomatis, Kuru prion, Lassa virus, Legionella pneumophila, Leishmania genus, Leptospira genus, Listeria monocytogenes, Lymphocytic choriomeningitis virus (LCMV), Machupo virus , Malassezia spp, Marburg virus, Measles virus, Metagonimus yokagawai, Microsporidia phylum, Molluscum contagiosum virus (MCV), Mumps virus, Mycobacterium leprae and Mycobacterium lepromatosis, Mycobacterium tuberculosis, Mycobacterium ulcerans, M ycoplasma pneumoniae Naegleria fowleri Necator americanus Neisseria gonorrhoeae Neisseria meningitidis Nocardia asteroides Nocardia spp , Pneumocystis jirovecii, poliovirus, rabies virus, respiratory syncytial virus (RSV), rhinovirus, rhinoviruses, Rickettsia akari, Rickettsia genus, Rickettsia prowazekii, Rickettsia rickettsii, Rickettsia typhi, Rift Valley virus, rotavirus, rubella virus, Sabia virus, Salmonella genus , Sarcoptes scabiei, SARS coronavirus, Schistosoma genus, Shigella genus, Sin Nombre virus, Hantavirus, Sporothrix schenckii, Staphylococcus genus, Streptococcus agalactiae, Streptococcus pneumoniae, Streptococcus pyogenes, Strongyloides stercoralis, Taenia genus, Taenia solium, tick-borne encephalitis virus (TBEV), Toxocara canis or Toxocara cati, Tox oplasma gondii, Treponema pallidum, Trichinella spiralis, Trichomonas vaginalis, Trichophyton spp, Trichuris trichiura, Trypanosoma brucei, Trypanosoma cruzi, Ureaplasma urealyticum, varicella zoster virus (VZV), Variola major or Variola minor, prion vCJD, Venezuelan equine encephalitis virus, Vibrio cholerae , West Nile virus, Western equine encephalitis virus, Wuchereria bancrofti, yellow fever virus, Yersinia enterocolitica, Yersinia pestis and Yersinia pseudotuberculosis.

В этом контексте наиболее предпочтительными являются антигены из патогенов, выбранных из вируса гриппа, респираторно-синтициального вируса (RSV), вируса герпеса простого (HSV), вируса папилломы человека (HPV), вируса иммунодефицита человека (HIV), Plasmodium, Staphylococcus aureus, вируса Денге, Chlamydia trachomatis, цитомегаловируса (CMV), вируса гепатита В (HBV), Mycobacterium tuberculosis, вируса бешенства и вируса желтой лихорадки.In this context, antigens from pathogens selected from influenza virus, respiratory syncytial virus (RSV), herpes simplex virus (HSV), human papillomavirus (HPV), human immunodeficiency virus (HIV), Plasmodium, Staphylococcus aureus, virus Dengue, Chlamydia trachomatis, cytomegalovirus (CMV), hepatitis B virus (HBV), Mycobacterium tuberculosis, rabies virus and yellow fever virus.

Опухолевые антигены:Tumor antigens:

В другом варианте осуществления изобретения искусственная молекула нуклеиновой кислоты, предлагаемой в настоящем изобретении, может кодировать белок или пептид, который содержит пептид или белок, содержащий опухолевый антиген, фрагмент, вариант или производное указанного опухолевого антигена, где предпочтительно, опухолевый антиген представляет собой меланоцит-специфический антиген, раково-тестикулярный антиген или опухоль-специфический антиген, предпочтительно СТ-Х-антиген, не-Х-СТ-антиген, партнер, связывающий СТ-Х-антиген или партнер, связывающий не-Х-СТ-антиген, или опухоль-специфический антиген, более предпочтительно СТ-Х-антиген, партнер, связывающий не-Х-СТ-антиген или опухоль-специфический антиген, или фрагмент, вариант или производное указанного опухолевого антигена; и где каждая из нуклеотидных последовательностей кодирует отличный от других пептид или белок; и где по меньшей мере одна из нуклеотидных последовательностей кодирует 5Т4, 707-АР, 9D7, AFP, AlbZIP HPG1, альфа-5-бета-1-интегрин, альфа-5-бета-6-интегрин, альфа-актинин-4/m, альфа-метилацил-кофермент А-рацемазу, ART-4, ARTC1/m, В7Н4, BAGE-1, BCL-2, bcr/abl, бета-катенин/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA27-29, CA19-9, CA72-4, CA125, калретикулин, CAMEL, CASP-8/m, катепсин В, катепсин L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52, CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, коактозин-подобный белок, коллаген XXIII, COX-2, CT-9/BRD6, Cten, циклин B1, циклин D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6-AML1, EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT-V, gp100, GPC3, GPNMB/m, HAGE, HAST-2, гепсин, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, гомеобокс NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HPV-E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, незрелый ламининовый рецептор, каллекреин-2, каллекреин-4, Ki67, KIAA0205, KIAA0205/m, KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE-A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3, MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, маммоглобин A, MART-1/мелан-А, MART-2, MART-2/m, матриксный белок 22, MC1R, M-CSF, ME1/m, мезотелин, MG50/PXDN, MMP11, MN/CA IX-антиген, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM-2/m, MUM-3/m, миозин класса I/m, NA88-A, N-ацетилглюкозаминилтрансферазу-V, Neo-PAP, Neo-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N-Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, остеокальцин, остеопонтин, p15, p190 минорный bcr-abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PART-1, PATE, PDEF, Pim-1-киназу, Pin-1, Pml/PARaльфa, POTE, PRAME, PRDX5/m, простеин, протеиназу-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART-3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP, сурвивин, сурвивин-2 В, SYT-SSX-1, SYT-SSX-2, TA-90, TAG-72, TARP, TEL-AML1, TGFбета, TGFбетаRII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP-p8, тирозиназу, UPA, VEGF, VEGFR-2/FLK-1, WT1 и иммуноглобулиновый идиотип лимфоидной кровяной клетки или идиотип Т-клеточного рецептора, или фрагмент, вариант или производное указанного опухолевого антигена; предпочтительно сурвивин или его гомолог, антиген семейства MAGE или его связывающий партнер или фрагмент, вариант или производное указанного опухолевого антигена. Наиболее предпочтительными в этом контексте являются опухолевые антигены NY-ESO-1, 5Т4, MAGE-C1, MAGE-C2, сурвивин, Muc-1, PSA, PSMA, PSCA, STEAP и РАР.In another embodiment of the invention, the artificial nucleic acid molecule of the present invention may encode a protein or peptide that contains a peptide or protein containing a tumor antigen, fragment, variant or derivative of said tumor antigen, where preferably the tumor antigen is melanocyte-specific antigen, cancer-testicular antigen or tumor-specific antigen, preferably CT-X antigen, non-X-CT antigen, CT-X antigen binding partner or non-X-CT antigen binding partner, or tumor- a specific antigen, more preferably a CT-X antigen, a non-X-CT antigen binding partner, or a tumor-specific antigen, or a fragment, variant or derivative of said tumor antigen; and where each of the nucleotide sequences encodes a different peptide or protein; and where at least one of the nucleotide sequences encodes 5T4, 707-AP, 9D7, AFP, AlbZIP HPG1, alpha-5-beta-1-integrin, alpha-5-beta-6-integrin, alpha-actinin-4/m , alpha-methylacyl-coenzyme A-racemase, ART-4, ARTC1/m, B7H4, BAGE-1, BCL-2, bcr/abl, beta-catenin/m, BING-4, BRCA1/m, BRCA2/m, CA 15-3/CA27-29, CA19-9, CA72-4, CA125, calreticulin, CAMEL, CASP-8/m, cathepsin B, cathepsin L, CD19, CD20, CD22, CD25, CDE30, CD33, CD4, CD52 , CD55, CD56, CD80, CDC27/m, CDK4/m, CDKN2A/m, CEA, CLCA2, CML28, CML66, COA-1/m, coactosin-like protein, collagen XXIII, COX-2, CT-9/BRD6 , Cten, cyclin B1, cyclin D1, cyp-B, CYPB1, DAM-10, DAM-6, DEK-CAN, EFTUD2/m, EGFR, ELF2/m, EMMPRIN, EpCam, EphA2, EphA3, ErbB3, ETV6-AML1 , EZH2, FGF-5, FN, Frau-1, G250, GAGE-1, GAGE-2, GAGE-3, GAGE-4, GAGE-5, GAGE-6, GAGE7b, GAGE-8, GDEP, GnT-V , gp100, GPC3, GPNMB/m, HAGE, HAST-2, hepsin, Her2/neu, HERV-K-MEL, HLA-A*0201-R17I, HLA-A11/m, HLA-A2/m, HNE, homeobox NKX3.1, HOM-TES-14/SCP-1, HOM-TES-85, HPV-E6, HPV -E7, HSP70-2M, HST-2, hTERT, iCE, IGF-1R, IL-13Ra2, IL-2R, IL-5, immature laminin receptor, kallecrein-2, kallecrein-4, Ki67, KIAA0205, KIAA0205/m , KK-LC-1, K-Ras/m, LAGE-A1, LDLR-FUT, MAGE-A1, MAGE-A2, MAGE-A3, MAGE-A4, MAGE-A6, MAGE-A9, MAGE-A10, MAGE -A12, MAGE-B1, MAGE-B2, MAGE-B3, MAGE-B4, MAGE-B5, MAGE-B6, MAGE-B10, MAGE-B16, MAGE-B17, MAGE-C1, MAGE-C2, MAGE-C3 , MAGE-D1, MAGE-D2, MAGE-D4, MAGE-E1, MAGE-E2, MAGE-F1, MAGE-H1, MAGEL2, mammoglobin A, MART-1/melan-A, MART-2, MART-2/ m, matrix protein 22, MC1R, M-CSF, ME1/m, mesothelin, MG50/PXDN, MMP11, MN/CA IX antigen, MRP-3, MUC-1, MUC-2, MUM-1/m, MUM -2/m, MUM-3/m, class I/m myosin, NA88-A, N-acetylglucosaminyltransferase-V, Neo-PAP, Neo-PAP/m, NFYC/m, NGEP, NMP22, NPM/ALK, N -Ras/m, NSE, NY-ESO-1, NY-ESO-B, OA1, OFA-iLRP, OGT, OGT/m, OS-9, OS-9/m, osteocalcin, osteopontin, p15, p190 minor bcr -abl, p53, p53/m, PAGE-4, PAI-1, PAI-2, PART-1, PATE, PDEF, Pim-1-kinase, Pin-1, Pml/PARalpha, POTE, PRAME, PRDX5/m , protein, protein azu-3, PSA, PSCA, PSGR, PSM, PSMA, PTPRK/m, RAGE-1, RBAF600/m, RHAMM/CD168, RU1, RU2, S-100, SAGE, SART-1, SART-2, SART- 3, SCC, SIRT2/m, Sp17, SSX-1, SSX-2/HOM-MEL-40, SSX-4, STAMP-1, STEAP, Survivin, Survivin-2 V, SYT-SSX-1, SYT-SSX -2, TA-90, TAG-72, TARP, TEL-AML1, TGFbeta, TGFbetaRII, TGM-4, TPI/m, TRAG-3, TRG, TRP-1, TRP-2/6b, TRP/INT2, TRP -p8, tyrosinase, UPA, VEGF, VEGFR-2/FLK-1, WT1 and an immunoglobulin idiotype of a lymphoid blood cell or an idiotype of a T-cell receptor, or a fragment, variant or derivative of said tumor antigen; preferably survivin or a homologue thereof, a MAGE family antigen or a binding partner or fragment, variant or derivative thereof of said tumor antigen. Most preferred in this context are the tumor antigens NY-ESO-1, 5T4, MAGE-C1, MAGE-C2, survivin, Muc-1, PSA, PSMA, PSCA, STEAP and PAP.

В предпочтительном варианте осуществления изобретения искусственная молекула нуклеиновой кислоты кодирует белок или пептид, который содержит терапевтический белок или его фрагмент, вариант или производное.In a preferred embodiment of the invention, the artificial nucleic acid molecule encodes a protein or peptide that contains a therapeutic protein or a fragment, variant or derivative thereof.

В контексте настоящего описания терапевтические белки представляют собой пептиды или белки, которые оказывают полезное действие при лечении любого врожденного или приобретенного заболевания или которые улучшают состояние индивидуума. В частности, терапевтические белки имеют важное значение для создания терапевтических средств, которые могут помимо осуществления других функций модифицировать и осуществлять репарацию генетических ошибок, разрушать раковые клетки или инфицированные патогеном клетки, лечить нарушения иммунной системы, лечить метаболические или эндокринные нарушения. Например, эритропоэтин (ЕРО), белковый гормон, можно применять для лечения пациентов с дефицитом эритроцитов, который является обычной причиной почечных осложнений. Кроме того, под понятие «терапевтические белки» подпадают адъювантные белки, терапевтические антитела, а также гормонзаместительная терапия, которую применяют, например, при лечении женщин в период менопаузы. В более современных подходах используют соматические клетки пациента для перепрограммирования их в плюрипотентные стволовые клетки, что является заменой спорной терапии на основе стволовых клеток. Такие белки, применяемые для перепрограммирования соматических клеток или применяемые для дифференцировки стволовых клеток, также рассматриваются как терапевтические белки в контексте настоящего описания. Кроме того, терапевтические белки можно применять и для других целей, например, для заживления ран, регенерации тканей, ангиогенеза и т.д. Кроме того, в контексте настоящего описания антигенпрезентирующие В-клеточные рецепторы и их фрагменты и варианты рассматриваются как терапевтические белки.In the context of the present description, therapeutic proteins are peptides or proteins that have a beneficial effect in the treatment of any congenital or acquired disease or that improve the condition of the individual. In particular, therapeutic proteins are important for the development of therapeutic agents that can, among other functions, modify and repair genetic errors, destroy cancer cells or pathogen-infected cells, treat immune system disorders, and treat metabolic or endocrine disorders. For example, erythropoietin (EPO), a protein hormone, can be used to treat patients with red blood cell deficiency, which is a common cause of renal complications. In addition, the term "therapeutic proteins" includes adjuvant proteins, therapeutic antibodies, as well as hormone replacement therapy, which is used, for example, in the treatment of women during menopause. More recent approaches use the patient's somatic cells to reprogram them into pluripotent stem cells, replacing controversial stem cell therapies. Such proteins used for reprogramming somatic cells or used for stem cell differentiation are also considered therapeutic proteins in the context of the present disclosure. In addition, therapeutic proteins can be used for other purposes, such as wound healing, tissue regeneration, angiogenesis, and so on. In addition, in the context of the present description, antigen-presenting B-cell receptors and their fragments and variants are considered as therapeutic proteins.

Таким образом, терапевтические белки можно применять для различных целей, включая лечение различных заболеваний, таких, например, как инфекционные заболевания, неоплазмы (например, раковые или опухолевые заболевания), заболевания крови или кроветворных органов, эндокринных, связанных с питанием или метаболических заболеваний, заболеваний нервной системы, заболеваний системы кровообращения, заболеваний дыхательной системы, заболеваний пищеварительной системы, заболеваний кожи и подкожной ткани, заболеваний скелето-мышечной системы и соединительной ткани, и заболеваний мочеполовой системы, независимо от того, являются ли они врожденными или приобретенными.Thus, therapeutic proteins can be used for various purposes, including the treatment of various diseases, such as, for example, infectious diseases, neoplasms (for example, cancer or tumor diseases), diseases of the blood or blood-forming organs, endocrine, nutritional or metabolic diseases, diseases diseases of the nervous system, diseases of the circulatory system, diseases of the respiratory system, diseases of the digestive system, diseases of the skin and subcutaneous tissue, diseases of the musculoskeletal system and connective tissue, and diseases of the genitourinary system, whether they are congenital or acquired.

В этом контексте наиболее предпочтительными терапевтическими белками, которые можно применять, среди прочего, для лечения метаболических или эндокринных нарушений, являются (в скобках указано конкретное заболевание, для лечения которого применяют терапевтический белок): кислая сфингомиелиназа (болезнь Нимана-Пика), адипотид (ожирение), агалзидаза-бета (человеческая галактозидаза А) (болезнь Фабри; препятствует накоплению липидов, которое может приводить к почечным и сердечно-сосудистым осложнениям), алглукозидаза (болезнь Помпе (гликогеноз (накопление гликогена) типа II)), альфа-галактозидаза А (альфа-GAL А, агалзидаза-альфа) (болезнь Фабри), альфа-глюкозидаза (гликогеноз (GSD), болезнь Помпе), альфа-L-идуронидаза (мукополисахаридоз (MPS), синдром Гурлер, синдром Шейе), альфа-N-ацетилглюкозаминидаза (синдром Санфилиппо), амфирегулин (рак, метаболическое нарушение), ангиопоэтин ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (ангиогенез, стабилизирует сосуды), бетацеллюлин (метаболическое нарушение), бета-глюкуронидаза (синдром Слая), костный морфогенетический белок BMP (ВМР1, ВМР2, ВМР3, ВМР4, ВМР5, ВМР6, ВМР7, ВМР8а, BMP8b, ВМР10, ВМР15) (регенеративное действие, состояния, связанные с костной тканью, хроническое заболевание почек (CKD)), белок CLN6 (болезнь, вызванная мутациями в локусе CLN6 атипичный поздний инфантилизм, вариант с поздним началом, ранний ювенильный, нейрональный цероид-липофусциноз (NCL)), эпидермальный фактор роста (EGF) (заживление ран, регуляция роста, пролиферации и дифференцировки клеток), эпиген (метаболическое нарушение), эпирегулин (метаболическое нарушение), фактор роста фибробластов (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5, FGF-6, FGF-7, FGF-8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF-18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (заживление ран, ангиогенез, эндокринные нарушения, регенерация ткани), галсульфаза (мукополисахаридоз типа VI), грелин (синдром раздраженного кишечника (IBS), ожирение, синдром Прадера-Вилли, сахарный диабет типа II), глюкоцереброзидаза (болезнь Гоше), GM-CSF (регенеративное действие, производство лейкоцитов, рак), гепаринсвязывающий EGF-подобный фактор роста (HB-EGF) (заживление ран, гипертрофия сердца и развитие и функция сердца), фактор роста гепатоцитов HGF (регенеративное действие, заживление ран), гепсидин (нарушения метаболизма железа, бета-талассемия), человеческий альбумин (пониженное производство альбумина (гипопротеинемия), повышенная потеря альбумина (нефротический синдром), гиповолемия, гипербилирубинемия), идурсульфаза (идуронат-2-сульфатаза) (мукополисахаридоз типа II (синдром Хантера)), интегрины αVβ3, αVβ5 и α5β1 (связывают матриксные макромолекулы и протеиназы, ангиогенез), идуронатсульфатаза (синдром Хантера), ларонидаза (мукополисахаридоз типа I, формы Гурлер и Гурлер-Шайе), N-ацетилгалактозамин-4-сульфатаза (rhASB; галсульфаза, арилсульфатаза A (ARSA), арилсульфатаза В (ARSB)) (дефицит арилсульфатазы В, синдром Марото-Лами, мукополисахаридоз типа VI), N-ацетилглюкозамин-6-сульфатаза (синдром Санфилиппо), фактор роста нервов (NGF, мозговой нейротрофический фактор (BDNF), нейротрофин-3 (NT-3) и нейротрофин 4/5 (NT-4/5) (регенеративное действие, сердечно-сосудистые заболевания, коронарный атеросклероз, ожирение, диабет типа 2, метаболический синдром, острые коронарные синдромы, деменция, депрессия, шизофрения, аутизм, синдром Ретта, нервная анорексия, нервная булимия, заживление ран, кожные язвы, изъязвления роговицы, болезнь Альцгеймера), нейрегулин (NRG1, NRG2, NRG3, NRG4) (метаболическое нарушение, шизофрения), нейропилин (NRP-1, NRP-2) (ангиогенез, управление аксонами, выживание, миграция клеток), обестатин (синдром раздраженного кишечника (IBS), ожирение, синдром Прадера-Вилли, сахарный диабет типа II), фактор роста тромбоцитов (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (регенеративное действие, заживление ран, нарушение ангиогенеза, артериосклероз, фиброз, рак), рецепторы TGF-бета (эндоглин, рецептор TGF-бета 1, рецептор TGF-бета 2, рецептор TGF-бета 3) (почечный фиброз, заболевание почек, диабет, терминальная стадия почечной болезни (ESRD), ангиогенез), тромбопоэтин (ТНРО) (фактор роста и развития мегакариоцитов (MGDF)) (тромбоцитарные нарушения, тромбоциты для донорской сдачи, восстановление уровня тромбоцитов после миелосупрессорной химиотерапии), трансформирующий фактор роста (TGF (TGF-альфа, TGF-бета (TGFбета1, TGFбета2 и TGFбета3))) (регенеративное действие, заживление ран, иммунитет, рак, заболевание сердца, диабет, синдром Марфана, синдром Лоеса-Дитца), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F и PIGF) (регенеративное действие, ангиогенез, заживление ран, рак, проницаемость), несритид (острая декомпенсированная застойная сердечная недостаточность), трипсин (декубитальная язва, варикозная язва, санация струпа, спонтанно раскрывающаяся рана, солнечный ожог, мекониевая непроходимость кишечника), адренокортикотропный гормон (АСТН) (болезнь Аддисона, мелкоклеточная саркома, адренолейкодистрофия, врожденная гиперплазия надпочечников, синдром Кушинга, синдром Нельсона, детские спазмы), предсердный натрийуретический пептид (ANP) (эндокринные нарушения), холецистокинин (различной длины), гастрин (гипогастринемия), лептин (диабет, гиперглицинемия, ожирение), окситоцин (стимулирует грудное кормление, ненаступление родов), соматостатин (симптоматическое лечение карционоидного синдрома, острое варикозное кровотечение и акромегалия, поликистозные заболевания печени и почек, акромегалия и симптомы, вызываемые нейроэндокринными опухолями), вазопрессин (антидиуретический гормон) (несахарный диабет), кальцитонин (постменопаузальный остеопороз, гиперкальциемия, болезнь Пэджета, метастазы в костную ткань, фантомная боль к конечностях, спинальный стеноз), экзенатид (диабет типа 2, устойчивый к обработке метформином и сульфонилмочевиной), гормон роста (GH), соматотропин (нарушение роста вследствие дефицита GH или хронической печеночной недостаточности, синдром Прадера-Вилли, синдром Турнера, обусловленное СПИДом истощение или кахексия при осуществлении противовирусной терапии), инсулин (сахарный диабет, диабетический кетоацидоз, гиперкалиемия), инсулиноподобный фактор роста 1 IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), мекасермин ринфабат, аналог IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), мегасермин, аналог IGF-1 (нарушение роста у детей с делецией гена GH или серьезным первичным дефицитом IGF1, нейродегенеративное заболевание, сердечно-сосудистые заболевания, сердечная недостаточность), пэгвисомант (акромегалия), прамлинтид (сахарный диабет, в комбинации с инсулином), терипаратид (человеческий паратиреоидный гормон, остатки 1-34) (серьезный остеопороз), бекаплермин (вспомогательное средство при санации диабетических язв), диботермин-альфа (костный морфогенный белок 2) (хирургическая операция по закреплению позвоночника (Spinal Fusion), восстановление кости при повреждении), гистрелина ацетат (гонадотропин-рилизинг гормон; GnRH) (преждевременное половое созревание), октреотид (акромегалия, симптоматическое ослабление VIP-секретирующей аденомы и метастатических карциноидных опухолей) ипалифермин (фактор роста кератиноцитов; KGF) (серьезный оральный мукозит у пациентов, подвергающихся химиотерапии, заживление ран).In this context, the most preferred therapeutic proteins that can be used, among others, for the treatment of metabolic or endocrine disorders are (in brackets the specific disease for which the therapeutic protein is used is indicated): acid sphingomyelinase (Niemann-Pick disease), adipotide (obesity ), agalsidase-beta (human galactosidase A) (Fabry disease; interferes with lipid accumulation, which can lead to kidney and cardiovascular complications), alglucosidase (Pompe disease (glycogenosis (accumulation of glycogen) type II)), alpha-galactosidase A ( alpha-GAL A, agalsidase-alpha) (Fabry disease), alpha-glucosidase (glycogenosis (GSD), Pompe disease), alpha-L-iduronidase (mucopolysaccharidosis (MPS), Hurler syndrome, Scheye syndrome), alpha-N-acetylglucosaminidase (Sanfilippo syndrome), amphiregulin (cancer, metabolic disorder), angiopoietin ((Ang1, Ang2, Ang3, Ang4, ANGPTL2, ANGPTL3, ANGPTL4, ANGPTL5, ANGPTL6, ANGPTL7) (angiogenesis, stabilizes cos uds), betacellulin (metabolic disorder), beta-glucuronidase (Sly syndrome), bone morphogenetic protein BMP (BMP1, BMP2, BMP3, BMP4, BMP5, BMP6, BMP7, BMP8a, BMP8b, BMP10, BMP15) (regenerative action, conditions, bone-related, chronic kidney disease (CKD)), CLN6 protein (disease caused by mutations at the CLN6 locus atypical late infantilism, late-onset variant, early juvenile, neuronal ceroid lipofuscinosis (NCL)), epidermal growth factor (EGF) (wound healing, regulation of cell growth, proliferation and differentiation), epigen (metabolic disorder), epiregulin (metabolic disorder), fibroblast growth factor (FGF, FGF-1, FGF-2, FGF-3, FGF-4, FGF-5 , FGF-6, FGF-7, FGF-8, FGF-9, FGF-10, FGF-11, FGF-12, FGF-13, FGF-14, FGF-16, FGF-17, FGF-17, FGF -18, FGF-19, FGF-20, FGF-21, FGF-22, FGF-23) (wound healing, angiogenesis, endocrine disruption, tissue regeneration), galsulfase (mucopolysaccharidosis type VI), ghrelin (irritable bowel syndrome (IBS), obesity, Prader-Willi syndrome, type II diabetes mellitus), glucocerebrosidase (Gaucher disease), GM-CSF (regenerative action, leukocyte production, cancer), heparin-binding EGF-like growth factor (HB-EGF) (healing wounds, cardiac hypertrophy and cardiac development and function), hepatocyte growth factor HGF (regenerative action, wound healing), hepcidin (iron metabolism disorders, beta-thalassemia), human albumin (decreased albumin production (hypoproteinemia), increased albumin loss (nephrotic syndrome ), hypovolemia, hyperbilirubinemia), idursulfase (iduronate-2-sulfatase) (mucopolysaccharidosis type II (Hunter syndrome)), αVβ3, αVβ5 and α5β1 integrins (bind matrix macromolecules and proteinases, angiogenesis), iduronate sulfatase (Hunter syndrome), laronidase (mucopolysaccharidosis type I, Hurler and Hurler-Shaie forms), N-acetylgalactosamine-4-sulfatase (rhASB; galsulfase, arylsulfatase A (ARSA), arylsulfatase B (ARSB)) (arylsulfatase B deficiency, Maroteau-Lami syndrome, mucopolysaccharidosis type VI), N-acetylglucosamine-6-sulfatase (Sanfilippo syndrome), nerve growth factor (NGF, brain-derived neurotrophic factor (BDNF), neurotrophin-3 (NT-3) and neurotrophin 4/5 (NT-4/5) (regenerative action, cardiovascular disease, coronary atherosclerosis, obesity, type 2 diabetes, metabolic syndrome, acute coronary syndromes, dementia , depression, schizophrenia, autism, Rett syndrome, anorexia nervosa, bulimia nervosa, wound healing, skin ulcers, corneal ulceration, Alzheimer's disease), neuregulin (NRG1, NRG2, NRG3, NRG4) (metabolic disorder, schizophrenia), neuropilin (NRP- 1, NRP-2) (angiogenesis, axonal guidance, survival, cell migration), obestatin (irritable bowel syndrome (IBS), obesity, Prader-Willi syndrome, type II diabetes mellitus), platelet growth factor (PDGF (PDFF-A, PDGF-B, PDGF-C, PDGF-D) (regenerative effect, for wound healing, angiogenesis disorder, arteriosclerosis, fibrosis, cancer), TGF-beta receptors (endoglin, TGF-beta 1 receptor, TGF-beta 2 receptor, TGF-beta 3 receptor) (renal fibrosis, kidney disease, diabetes, end-stage renal diseases (ESRD), angiogenesis), thrombopoietin (THRO) (megakaryocyte growth and development factor (MGDF)) (platelet disorders, platelets for donation, recovery of platelet levels after myelosuppressive chemotherapy), transforming growth factor (TGF (TGF-alpha, TGF -beta (TGFbeta1, TGFbeta2 and TGFbeta3))) (regenerative action, wound healing, immunity, cancer, heart disease, diabetes, Marfan syndrome, Loes-Dietz syndrome), VEGF (VEGF-A, VEGF-B, VEGF-C, VEGF-D, VEGF-E, VEGF-F and PIGF) (regenerative action, angiogenesis, wound healing, cancer, permeability), nesritide (acute decompensated congestive heart failure), trypsin (decubital ulcer, varicose ulcer, eschar debridement, spontaneous opening wound, sunburn, mek onium ileus), adrenocorticotropic hormone (ACTH) (Addison's disease, small cell sarcoma, adrenoleukodystrophy, congenital adrenal hyperplasia, Cushing's syndrome, Nelson's syndrome, infantile spasms), atrial natriuretic peptide (ANP) (endocrine disorders), cholecystokinin (various lengths), gastrin (hypogastrinemia), leptin (diabetes, hyperglycinemia, obesity), oxytocin (stimulates breastfeeding, non-delivery), somatostatin (symptomatic treatment of carcinoid syndrome, acute variceal bleeding and acromegaly, polycystic liver and kidney disease, acromegaly and symptoms caused by neuroendocrine tumors ), vasopressin (antidiuretic hormone) (diabetes insipidus), calcitonin (postmenopausal osteoporosis, hypercalcemia, Paget's disease, bone metastases, phantom limb pain, spinal stenosis), exenatide (type 2 diabetes resistant to metformin and sulfonylurea treatment), growth hormone (GH), som atotropin (growth failure due to GH deficiency or chronic liver failure, Prader-Willi syndrome, Turner syndrome, AIDS-related wasting or cachexia during antiviral therapy), insulin (diabetes mellitus, diabetic ketoacidosis, hyperkalemia), insulin-like growth factor 1 IGF-1 ( growth retardation in children with GH gene deletion or severe primary IGF1 deficiency, neurodegenerative disease, cardiovascular disease, heart failure), mecasermine rinfabate, IGF-1 analogue (growth failure in children with GH gene deletion or severe primary IGF1 deficiency, neurodegenerative disease , cardiovascular disease, heart failure), megasermin, IGF-1 analogue (growth failure in children with GH gene deletion or severe primary IGF1 deficiency, neurodegenerative disease, cardiovascular disease, heart failure), pegvisomant (acromegaly), pramlintide ( diabetes mellitus, in combination with insulin m), teriparatide (human parathyroid hormone, residues 1-34) (severe osteoporosis), becaplermin (adjuvant in the debridement of diabetic ulcers), dibotermin-alpha (bone morphogenic protein 2) (surgery to fix the spine (Spinal Fusion), recovery bones when damaged), histrelin acetate (gonadotropin-releasing hormone; GnRH) (precocious puberty), octreotide (acromegaly, symptomatic attenuation of VIP-secreting adenoma and metastatic carcinoid tumors) andalifermin (keratinocyte growth factor; KGF) (severe oral mucositis in patients undergoing chemotherapy, wound healing).

Указанные и другие белки рассматриваются как терапевтические, поскольку они предназначены для лечения индивидуума путем возмещения нарушенного эндогенного производства в его организме функционального белка в достаточных количествах. Следовательно, такие терапевтические белки, как правило, представляют собой белки млекопитающих, прежде всего человеческие белки.These and other proteins are considered therapeutic since they are intended to treat the individual by replacing the disturbed endogenous production in his body of a functional protein in sufficient quantities. Therefore, such therapeutic proteins are typically mammalian proteins, especially human proteins.

Для лечения нарушений крови, заболеваний системы кровообращения, заболеваний дыхательной системы, раковых или опухолевых заболеваний, инфекционных заболеваний или иммунодефицитов можно применять следующие терапевтические белки: альтерплаза (активатор тканевого плазминогена; tPA) (легочная эмболия, инфаркт миокарда, острый ишемический инсульт («удар»), окклюзия устройств центрального венозного доступа), анистреплаза (тромболизис), антитромбин III (АТ-III) (наследственный дефицит АТ-III, тромбоэмболия), бивалирудин (снижает риск свертывания крови при коронарной ангиопластике и индуцированной гепарином тромбоцитопении), дарбепоэтин-альфа (лечение анемии у пациентов с хронической почечной недостаточностью и хроническим почечным нарушением (+/- диализ)), дротрекогин-альфа (активированный белок С) (серьезный сепсис с высоким риском смерти), эритропоэтин, эпоэтин-альфа, эритропоэтин, эритропоетин (анемия при хроническом заболевании, миелодисплазия, анемия при почечной недостаточности или при осуществлении химиотерапии, предоперационная подготовка), фактор IX (гемофилия В), фактор VIIa (кровоизлияние у пациентов с гемофилией А или В и при применении ингибиторов фактора VIII или фактора IX), фактор VIII (гемофилия А), лепирудин (индуцируемая гепарином тромбоцитопения), концентрат белка С (венозный тромбоз, молниеносная пурпура), ретеплаза (делеция мутеина в tPA) (лечение острого инфаркта миокарда, улучшение функции желудочков), стрептокиназа (остро развивающийся трансмуральный инфаркт миокарда, легочная эмболия, тромбоз глубоких вен, артериальный тромбоз или эмболия, окклюзия артериовенозной канюли), тенестеплаза (острый инфаркт миокарда), урокиназа (легочная эмболия), ангиостатин (рак), анти-CD22 иммунотоксин (рецидивирующий острый миелоидный CD33⁺-лейкоз), денилейкин дифтитокс (кожная Т-клеточная лимфома (CTCL)), иммуноцианин (рак мочевого пузыря и предстательной железы), MPS (металлопанстимулин) (рак), афлиберцепт (немелкоклеточный рак легкого (NSCLC), метастатический колоректальный рак (mCRC), гормон-устойчивый метастатический рак предстательной железы, влажная форма дегенерации желтого пятна), эндостатин (рак, воспалительные заболевания типа ревматоидного артрита, а также болезнь Крона, диабетическая ретинопатияпсориаз и эндометриоз), коллагеназа (санация хронических кожных язв и областей серьезных ожогов, контрактура Дюпюитрена, болезнь Пейрони), человеческая дезоксирибонуклеаза I, дорназа (муковисцидоз; уменьшение инфекций респираторного тракта у выбранных пациентов с FVC, превышающим более чем на 40% предсказанную величину), гиалуронидаза (применяется в качестве адъюванта для повышения абсорбции и диспергирования инъецированных лекарственных средств, прежде всего анестезирующих средств при глазной хирургии и определенных визуализирующих агентов), папаин (санация некротической ткани или разжижение отторгающихся некротических масс при острых и хронических повреждениях, таких как пролежни, варикозные и диабетические язвы, ожоги, послеоперационные раны, пилонидальные кистозные раны, карбункулы и другие раны), L-аспарагиназа (острый лимфоцитарный лейкоз, требующий экзогенного аспарагина для пролиферации), пэг-аспарагиназа (острый лимфоцитарный лейкоз, требующий экзогенного аспарагина для пролиферации), расбуриказа (пациенты детского возраста с лейкозом, лимфомой и солидными опухолями, подвергающиеся противораковой терапии, которая может вызывать синдром лизиса опухоли), человеческий хорионный гонадотропин (HCG) (улучшает репродуктивную функцию), человеческий фолликулостимулирующий гормон (FSH) (улучшает репродуктивную функцию), лутропин-альфа (бесплодие, сопровождающееся дефицитом лютениизирующего гормона), пролактин (гипопролактинемия, дефицит сывороточного пролактина, дисфункция яичника у женщин, состояние страха, артериогенная эректильная дисфункция, преждевременное семяизвержение, олигозооспермия, астеноспермия, пониженная функция семенных пузырьков, гипоандрогенизм у мужчин), ингибитор альфа-1-протеиназы (врожденный дефицит антитрипсина), лактаза (газообразование, вздутие, спазмы и диарея вследствие неспособности расщеплять лактозу), панкреатические ферменты (липаза, амилаза, протеиназа) (муковисцидоз, хронический панкреатит, панкреатическая недостаточность, состояние после операции желудочного шунтирования по Билльрот типа II (Billroth II), обструкция протоков поджелудочной железы, стеаторрея, недостаточное пищеварение, газообразование, вздутие), аденозиндеаминаза (бычья пегадемаза, PEG-ADA) (заболевания с серьезным комбинированным иммунодефицитом вследствие дефицита аденозиндеаминазы), абатецепт (ревматоидный артрит (прежде всего, рефракторный в отношении ингибирования TNF-альфа)), алефацепт (бляшковидный псориаз), анакинра (ревматоидный артрит), этанецепт (ревматоидный артрит, многосуставной юношеский ревматоидный артрит, псориатический артрит, анкилоизирующий спондилит, бляшковидный псориаз, анкилоизирующий спондилит), анти\агонист рецептора интерлейкина-1 (IL-1), анакинра (воспаление и деградация хряща, ассоциированная с ревматоидным артритом), тимулин (нейродегенеративные заболевания, ревматизм, нервная анорексия), антагонист TNF-альфа (аутоиммунные заболевания, такие как ревматоидный артрит, анкилоизирующий спондилит, болезнь Крона, псориаз, гнойный гидраденит, рефрактерная астма), энфувиртид (HIV-1-инфекция) и тимозин α1 (гепатит В и С),The following therapeutic proteins can be used to treat blood disorders, circulatory system diseases, respiratory system diseases, cancer or neoplastic diseases, infectious diseases or immunodeficiencies: alterplase (tissue plasminogen activator; tPA) (pulmonary embolism, myocardial infarction, acute ischemic stroke ), occlusion of central venous access devices), anistreplase (thrombolysis), antithrombin III (AT-III) (hereditary deficiency of AT-III, thromboembolism), bivalirudin (reduces the risk of blood clotting in coronary angioplasty and heparin-induced thrombocytopenia), darbepoetin-alpha ( treatment of anemia in patients with chronic renal failure and chronic renal impairment (+/- dialysis)), drotrecogin-alpha (activated protein C) (serious sepsis with high risk of death), erythropoietin, epoetin-alpha, erythropoietin, erythropoietin (anemia in chronic disease, myelodysplasia, anemia in renal failure or in chemotherapy, preoperative preparation), factor IX (hemophilia B), factor VIIa (hemorrhage in patients with hemophilia A or B and the use of factor VIII or factor IX inhibitors), factor VIII (hemophilia A), lepirudin (heparin-induced thrombocytopenia), protein C concentrate (venous thrombosis, fulminant purpura), reteplase (mutein deletion in tPA) (treatment of acute myocardial infarction, improvement of ventricular function), streptokinase (acute transmural myocardial infarction, pulmonary embolism, deep vein thrombosis, arterial thrombosis or embolism, occlusion arteriovenous cannula), tenesteplase (acute myocardial infarction), urokinase (pulmonary embolism), angiostatin (cancer), anti-CD22 immunotoxin (recurrent acute myeloid CD33 ⁺ leukemia), denileukin diftitox (cutaneous T-cell lymphoma (CTCL)), immunocyanin (bladder and prostate cancer), MPS (metalopanstimulin) (cancer), aflibercept (non-small cell lung cancer (NSCLC), metastatic to olorectal cancer (mCRC), hormone-resistant metastatic prostate cancer, wet macular degeneration), endostatin (cancer, inflammatory diseases such as rheumatoid arthritis, as well as Crohn's disease, diabetic retinopathy, psoriasis and endometriosis), collagenase (debridement of chronic skin ulcers and areas severe burns, Dupuytren's contracture, Peyronie's disease), human deoxyribonuclease I, dornase (cystic fibrosis; reduction of respiratory tract infections in selected patients with an FVC greater than 40% predicted), hyaluronidase (used as an adjuvant to increase the absorption and dispersion of injected drugs, primarily anesthetics for eye surgery and certain imaging agents), papain ( debridement of necrotic tissue or liquefaction of sloughing necrotic masses in acute and chronic injuries such as bedsores, varicose and diabetic ulcers, burns, postoperative wounds, pilonidal cystic wounds, carbuncles and other wounds), L-asparaginase (acute lymphocytic leukemia requiring exogenous asparagine for proliferation), peg-asparaginase (acute lymphocytic leukemia requiring exogenous asparagine for proliferation), rasburicase (childhood patients with leukemia, lymphoma, and solid tumors undergoing anticancer therapy that can cause tumor lysis syndrome), human chorio gonadotropin (HCG) (improves reproductive function), human follicle stimulating hormone (FSH) (improves reproductive function), lutropin-alpha (infertility accompanied by luteinizing hormone deficiency), prolactin (hypoprolactinemia, serum prolactin deficiency, ovarian dysfunction in women, state of fear , arteriogenic erectile dysfunction, premature ejaculation, oligozoospermia, asthenospermia, reduced function of seminal vesicles, hypoandrogenism in men), alpha-1-proteinase inhibitor (congenital antitrypsin deficiency), lactase (gas formation, bloating, cramps and diarrhea due to inability to break down lactose), pancreatic enzymes (lipase, amylase, proteinase) (cystic fibrosis, chronic pancreatitis, pancreatic insufficiency, post-Billroth II gastric bypass, pancreatic duct obstruction, steatorrhoea, maldigestion, gas, bloating), adenosine deaminases a (bovine pegademase, PEG-ADA) (diseases with severe combined immunodeficiency due to adenosine deaminase deficiency), abathecept (rheumatoid arthritis (primarily refractory to TNF-alpha inhibition)), alefacept (plaque psoriasis), anakinra (rheumatoid arthritis), etanecept (rheumatoid arthritis, polyarticular juvenile rheumatoid arthritis, psoriatic arthritis, ankylosing spondylitis, plaque psoriasis, ankylosing spondylitis), interleukin-1 (IL-1) receptor anti/agonist, anakinra (inflammation and cartilage degradation associated with rheumatoid arthritis), thymulin (neurodegenerative diseases, rheumatism, anorexia nervosa), TNF-alpha antagonist (autoimmune diseases such as rheumatoid arthritis, ankylosing spondylitis, Crohn's disease, psoriasis, hidradenitis suppurativa, refractory asthma), enfuvirtide (HIV-1 infection), and thymosin α1 ( hepatitis B and C)

(в скобках указано конкретное заболевание, для лечения которого применяют терапевтический белок).(in parentheses is the specific disease for which the therapeutic protein is used).

Следующим объектом настоящего изобретения является вектор, содержащийThe next object of the present invention is a vector containing

а. открытую рамку считывания (ОРС) и/или сайт клонирования, например, предназначенный для встраивания открытой рамки считывания или последовательности, содержащей открытую рамку считывания; иa. an open reading frame (ORF) and/or a cloning site, for example, for inserting an open reading frame or a sequence containing an open reading frame; and

б. по меньшей мере один элемент 3'-нетранслируемой области (3'-UTR-элемент), содержащий нуклеотидную последовательность, которая происходит из 3'-UTR гена рибосомального белка.b. at least one element of the 3'-untranslated region (3'-UTR element) containing a nucleotide sequence that is derived from the 3'-UTR of the ribosomal protein gene.

По меньшей мере один 3'-UTR-элемент и ОРС представляют собой конструкции, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении. Сайт клонирования может представлять собой любую последовательность, пригодную для интродукции открытой рамки считывания или последовательности, содержащей открытую рамку считывания, такую как одни или несколько сайтов рестрикции. Так, вектор, содержащий сайт клонирования, предпочтительно является пригодным для встраивания открытой рамки считывания в вектор, предпочтительно для встраивания открытой рамки считывания с 5'-стороны относительно 3'-UTR -элемента. Предпочтительно, сайт клонирования или ОРС располагают с 5'-стороны относительно 3'-UTR-элемента, предпочтительно в непосредственной близости от 5'-конца 3'-UTR-элемента. Например, сайт клонирования или ОРС можно непосредственно присоединять к 5'-концу 3'-UTR-элемента или их можно присоединять посредством сегмента нуклеотидов, например, сегмента, состоящего из 2, 4, 6, 8, 10, 20 и т.д. нуклеотидов, как описано выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.At least one 3'-UTR element and the ORF are the constructs described above for the artificial nucleic acid molecule of the present invention. The cloning site can be any sequence suitable for the introduction of an open reading frame or a sequence containing an open reading frame, such as one or more restriction sites. Thus, a vector containing a cloning site is preferably suitable for inserting an open reading frame into the vector, preferably for inserting an open reading frame from the 5' side of the 3' UTR element. Preferably, the cloning site or ORF is located 5' to the 3' UTR element, preferably in close proximity to the 5' end of the 3' UTR element. For example, the cloning site or ORF may be directly attached to the 5'end of the 3'UTR element, or they may be attached via a segment of nucleotides, e.g., a segment consisting of 2, 4, 6, 8, 10, 20, etc. nucleotides as described above for the artificial nucleic acid molecule of the present invention.

Предпочтительно вектор, предлагаемой в настоящем изобретении, можно применять для производства искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, предпочтительно производства искусственной мРНК, предлагаемой в настоящем изобретении, например, необязательно путем встраивания открытой рамки считывания или последовательности, содержащей открытую рамку считывания, в вектор и транскрибирования вектора. Так, предпочтительно вектор содержит элементы, необходимые для транскрипции, такие как промотор, например, промотор РНК-полимеразы. Предпочтительно вектор пригоден для транскрипции с использованием эукариотической, прокариотической, вирусной или фаговой систем транскрипции, таких как эукариотические клетки, прокариотические клетки или эукариотические, прокариотические, вирусные или фаговые системы транскрипции in vitro. Так, например, вектор может содержать промоторную последовательность, которая распознается полимеразой, такой как РНК полимераза, например, эукариотической, прокариотической, вирусной или фаговой РНК-полимеразой. В предпочтительном варианте осуществления изобретения вектор содержит промотор РНК-полимеразы фага, такой как промотор SP6, Т3 или Т7, предпочтительно промотор Т7. Предпочтительно вектор пригоден для транскрипции in vitro с использованием системы транскрипции in vitro на основе фага, такой как система транскрипции in vitro на основе РНК-полимеразы Т7.Preferably, the vector of the present invention can be used to produce an artificial nucleic acid molecule of the present invention, preferably the production of an artificial mRNA of the present invention, for example, optionally by inserting an open reading frame or a sequence containing an open reading frame into the vector and transcribing the vector. Thus, preferably the vector contains elements necessary for transcription, such as a promoter, for example, an RNA polymerase promoter. Preferably, the vector is suitable for transcription using eukaryotic, prokaryotic, viral or phage transcription systems such as eukaryotic cells, prokaryotic cells or in vitro eukaryotic, prokaryotic, viral or phage transcription systems. Thus, for example, the vector may contain a promoter sequence that is recognized by a polymerase, such as an RNA polymerase, for example, a eukaryotic, prokaryotic, viral, or phage RNA polymerase. In a preferred embodiment, the vector contains a phage RNA polymerase promoter such as the SP6, T3 or T7 promoter, preferably the T7 promoter. Preferably, the vector is suitable for in vitro transcription using a phage based in vitro transcription system, such as a T7 RNA polymerase based in vitro transcription system.

В другом предпочтительном варианте осуществления изобретения вектор можно применять непосредственно для экспрессии кодируемого пептида или белка в клетках или ткани. Для этой цели вектор содержит конкретные элементы, необходимые для экспрессии в указанных клетках/ткани, например, конкретные последовательности промотора, такого как промотор CMV.In another preferred embodiment of the invention, the vector can be used directly to express the encoded peptide or protein in cells or tissue. For this purpose, the vector contains specific elements necessary for expression in said cells/tissue, for example specific promoter sequences such as the CMV promoter.

Вектор может содержать также поли(А)-последовательность и/или сигнал полиаденилирования, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении.The vector may also contain the poly(A) sequence and/or polyadenylation signal described above for the artificial nucleic acid molecule of the present invention.

Вектор может представлять собой РНК-вектор или ДНК-вектор. Предпочтительно вектор представляет собой ДНК-вектор. Вектор может представлять собой любой вектор, известный специалисту в данной области, такой как вирусный вектор или плазмидный вектор. Предпочтительно вектор представляет собой плазмидный вектор, предпочтительно плазмидный ДНК-вектор.The vector may be an RNA vector or a DNA vector. Preferably the vector is a DNA vector. The vector may be any vector known to the person skilled in the art, such as a viral vector or a plasmid vector. Preferably the vector is a plasmid vector, preferably a plasmid DNA vector.

В предпочтительном варианте осуществления изобретения вектор, предлагаемый в настоящем изобретении, содержит искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении.In a preferred embodiment of the invention, the vector of the present invention contains an artificial nucleic acid molecule of the present invention.

В одном из вариантов осуществления изобретения ДНК-вектор, предлагаемый в изобретении, содержит нуклеотидную последовательность, идентичную по меньшей мере примерно на 1, 2, 3, 4, 5, 10, 15, 20, 30 или 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%, еще более предпочтительно по меньшей мере примерно на 99%, наиболее предпочтительно на 100% нуклеотидной последовательности 3'-UTR гена рибосомального белка, такой как нуклеотидная последовательность, представленная в SEQ ID NO: 10-115.In one embodiment, the DNA vector of the invention contains a nucleotide sequence that is at least about 1, 2, 3, 4, 5, 10, 15, 20, 30, or 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99%, most preferably 100% of the nucleotide sequence of the 3'UTR of the ribosomal protein gene, such as the nucleotide sequence shown in SEQ ID NOs: 10-115.

Предпочтительно ДНК-вектор, предлагаемый в настоящем изобретении, содержит последовательность, представленную в SEQ ID NO: 1, SEQ ID NO: 3, последовательность, комплементарную SEQ ID NO: 7 или последовательности, идентичные по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, или ее фрагменту, описанному выше, предпочтительно ее функциональному фрагменту.Preferably, the DNA vector of the present invention contains a sequence shown in SEQ ID NO: 1, SEQ ID NO: 3, a sequence complementary to SEQ ID NO: 7, or sequences that are at least about 40% identical, preferably at least at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least by about 95%; even more preferably at least about 99% of the nucleotide sequence shown in SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 7, or a fragment thereof as described above, preferably a functional fragment thereof.

Предпочтительно РНК-вектор, предлагаемый в настоящем изобретении, содержит последовательность, представленную в SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 7 или последовательность, идентичную по меньшей мере примерно на 40%, предпочтительно по меньшей мере примерно на 50%, предпочтительно по меньшей мере примерно на 60%, предпочтительно по меньшей мере примерно на 70%, более предпочтительно по меньшей мере примерно на 80%, более предпочтительно по меньшей мере примерно на 90%, еще более предпочтительно по меньшей мере примерно на 95%; еще более предпочтительно по меньшей мере примерно на 99% нуклеотидной последовательности, представленной в SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 7 или ее фрагменту, предпочтительно ее функциональному фрагменту.Preferably, the RNA vector of the present invention contains the sequence shown in SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 7, or a sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95% %; even more preferably, at least about 99% of the nucleotide sequence shown in SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 7, or a fragment thereof, preferably a functional fragment thereof.

Предпочтительно вектор представляет собой кольцевую молекулу. Предпочтительно вектор представляет собой двухцепочечную молекулу, такую как двухцепочечная молекула ДНК. Такую кольцевую, предпочтительно двухцепочечную молекулу ДНК можно использовать в качестве удобной формы хранения предлагаемой в изобретении искусственной молекулы нуклеиновой кислоты. Кроме того, ее можно применять для трансфекции клеток, например, культивируемых клеток. Ее можно использовать также для транскрипции in vitro для получения искусственной молекулы РНК, предлагаемой в изобретении.Preferably the vector is a circular molecule. Preferably the vector is a double-stranded molecule, such as a double-stranded DNA molecule. Such a circular, preferably double-stranded, DNA molecule can be used as a convenient storage form for the artificial nucleic acid molecule according to the invention. In addition, it can be used to transfect cells, such as cultured cells. It can also be used for in vitro transcription to produce an artificial RNA molecule according to the invention.

Предпочтительно вектор, предпочтительно кольцевой вектор, можно линеаризовать, например, путем расщепления рестриктазой. В предпочтительном варианте осуществления изобретения вектор содержит сайт расщепления, такой как сайт рестрикции, предпочтительно уникальный сайт расщепления, непосредственно примыкающий с 3'-стороны к 3'-UTR-элементу, или с 3'-стороны к поли(А)-последовательности или сигналу полиаденилирования, если она/он присутствует, или с 3'-стороны к поли(С)-последовательности, если она присутствует, или с 3'-стороны к гистоновой структуре типа «стебель-петля», если она присутствует. Так, предпочтительно продукт, полученный в результате линеаризации вектора, заканчивается на 3'-конце 3'-концом 3'-UTR-элемента или 3'-концом поли(А)-последовательности или сигналом полиаденилирования, если она/он присутствует, или 3'-концом поли(С)-последовательности, если она присутствует. В варианте осуществления изобретения, в котором вектор, предлагаемый в настоящем изобретении, содержит искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, сайт рестрикции, предпочтительно уникальный сайт рестрикции, предпочтительно примыкающий непосредственно с 3'-стороны к 3'-концу искусственной молекулы нуклеиновой кислоты.Preferably the vector, preferably a circular vector, can be linearized, for example by restriction enzyme digestion. In a preferred embodiment of the invention, the vector contains a cleavage site, such as a restriction site, preferably a unique cleavage site immediately adjacent 3' to the 3' UTR element, or 3' to the poly(A) sequence or signal polyadenylation, if present, or 3' to the poly(C) sequence, if present, or 3' to the histone stem-loop structure, if present. Thus, preferably the product resulting from linearization of the vector ends at the 3' end with the 3' end of the 3' UTR element or the 3' end of the poly(A) sequence or polyadenylation signal, if present, or 3 the '-end of the poly(C)-sequence, if present. In an embodiment in which the vector of the present invention comprises the artificial nucleic acid molecule of the present invention, a restriction site, preferably a unique restriction site, preferably directly adjacent 3' to the 3' end of the artificial nucleic acid molecule .

Следующий объект настоящего изобретения относится к клетке, содержащей искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, или вектор, предлагаемый в настоящем изобретении. Клетка может представлять собой любую клетку, такую как бактериальная клетка, клетка насекомого, клетка растения, клетка позвоночного, например, клетка млекопитающего. Такую клетку можно применять, например, для репликации вектора, предлагаемого в настоящем изобретении, например, в клетке бактерии. Кроме того, клетку можно применять для осуществления транскрипции искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении, и/или для трансляции открытой рамки считывания искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении. Например, клетку можно применять для производства рекомбинантного белка.The next object of the present invention relates to a cell containing an artificial nucleic acid molecule of the present invention, or a vector of the present invention. The cell can be any cell, such as a bacterial cell, an insect cell, a plant cell, a vertebrate cell, for example a mammalian cell. Such a cell can be used, for example, to replicate the vector of the present invention, for example, in a bacterial cell. In addition, the cell can be used to transcribe the artificial nucleic acid molecule or vector of the present invention and/or to translate the open reading frame of the artificial nucleic acid molecule or vector of the present invention. For example, the cell can be used to produce a recombinant protein.

Согласно настоящему изобретению клетки можно получать, например, с помощью стандартных методов переноса нуклеиновой кислоты, таких как стандартные методы трансфекции, трансдукции или трансформации. Например, искусственную молекулу нуклеиновой кислоты или вектор, предлагаемую/предлагаемый в настоящем изобретении, можно переносить в клетку путем электропорации, липофекции, например, с использованием катионных липидов и/или липосом, осаждения фосфатом кальция, трансфекции на основе наночастиц, трансфекции, основанной на применении вирусов или на основе катионных полимеров, таких как DEAE-декстран или полиэтиленимин и т.д.According to the present invention, cells can be obtained, for example, using standard nucleic acid transfer methods, such as standard transfection, transduction or transformation methods. For example, an artificial nucleic acid molecule or a vector of the present invention can be transferred into a cell by electroporation, lipofection, for example, using cationic lipids and/or liposomes, calcium phosphate precipitation, nanoparticle-based transfection, transfection based on the use of viruses or based on cationic polymers such as DEAE-dextran or polyethyleneimine, etc.

Предпочтительно клетка представляет собой клетку млекопитающего, такую как клетка человека, домашнего животного, лабораторного животного, такую как клетка мыши или крысы. Предпочтительно клетка представляет собой человеческую клетку. Клетка может представлять собой клетку культивируемой клеточной линии, такой как СНО, BHK, 293Т, COS-7, HELA, HEK и т.д. или клетка может представлять собой первичную клетку, такую как человеческая кожная фибробластная (HDF) клетка и т.д., предпочтительно клетку, выделенную из организма. В предпочтительном варианте осуществления изобретения клетка представляет собой выделенную клетку млекопитающего, предпочтительно человека. Например, клетка может представлять собой иммунную клетку, такую как дендритная клетка, раковую или опухолевую клетку, или любую соматическую клетку и т.д., предпочтительно млекопитающего, предпочтительно человека.Preferably, the cell is a mammalian cell, such as a human cell, a domestic animal cell, a laboratory animal cell, such as a mouse or rat cell. Preferably the cell is a human cell. The cell may be a cell from a cultured cell line such as CHO, BHK, 293T, COS-7, HELA, HEK, etc. or the cell may be a primary cell such as a human dermal fibroblast (HDF) cell, etc., preferably a cell isolated from the body. In a preferred embodiment of the invention, the cell is an isolated cell of a mammal, preferably a human. For example, the cell may be an immune cell such as a dendritic cell, a cancer or tumor cell, or any somatic cell, etc., preferably a mammal, preferably a human.

Следующим объектом настоящего изобретения является фармацевтическая композиция, содержащая искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, или клетку, предлагаемую в настоящем изобретении. Фармацевтическую композицию, предлагаемую в изобретении, можно применять, например, в качестве вакцины, например, для генетической вакцинации. Так, ОРС может, например, кодировать антиген, предназначенный для введения пациенту с цель вакцинации. Так, в предпочтительном варианте осуществления изобретения фармацевтическая композиция, предлагаемая в настоящем изобретении, представляет собой вакцину. Кроме того, фармацевтическую композицию, предлагаемую в настоящем изобретении, можно применять, например, для генной терапии.Another object of the present invention is a pharmaceutical composition containing an artificial nucleic acid molecule of the present invention, a vector of the present invention, or a cell of the present invention. The pharmaceutical composition according to the invention can be used, for example, as a vaccine, for example, for genetic vaccination. Thus, the ORF may, for example, encode an antigen to be administered to a patient for the purpose of vaccination. Thus, in a preferred embodiment of the invention, the pharmaceutical composition of the present invention is a vaccine. In addition, the pharmaceutical composition of the present invention can be used, for example, for gene therapy.

Предпочтительно фармацевтическая композиция содержит также один или несколько фармацевтически приемлемых наполнителей, разбавителей и/или эксципиентов и/или один или несколько адъювантов. В контексте настоящего изобретения фармацевтически приемлемый наполнитель, как правило, включает жидкую или нежидкую основу предлагаемой в изобретении фармацевтической композиции. Если предлагаемая в изобретении фармацевтическая композиция находится в жидкой форме, но носитель, как правило, может представлять собой свободную от пирогенов воду; изотонический соляной раствор или забуференные (водные) растворы, например, растворы, забуференные фосфатом, цитратом и т.д. Предназначенный для инъекции буфер может быть гипертоническим, изотоническим или гипотоническим относительно конкретной референс-среды, т.е. содержание в буфере солей может быть выше, идентичным или ниже их содержания в конкретной референс-среде, при этом предпочтительно можно применять такие концентрации вышеуказанных солей, которые не приводят к повреждению клеток в результате осмоса или других связанных с концентрацией воздействий. Референс-среды могут представлять собой, например, жидкости, применяемые в методах «in vivo», такие как кровь, лимфа, цитозольные жидкости или другие жидкости организма, или, например, жидкости, которые можно использовать в качестве референс-сред в методах «in vitro», такие как обычные буферы или жидкости. Указанные обычные буферы или жидкости известны специалисту в данной области. Наиболее предпочтительной жидкой основой является лактированный раствор Рингера.Preferably, the pharmaceutical composition also contains one or more pharmaceutically acceptable excipients, diluents and/or excipients and/or one or more adjuvants. In the context of the present invention, a pharmaceutically acceptable excipient typically includes a liquid or non-liquid base proposed in the invention of the pharmaceutical composition. If the pharmaceutical composition according to the invention is in liquid form, but the carrier, as a rule, can be pyrogen-free water; isotonic saline or buffered (aqueous) solutions, such as solutions buffered with phosphate, citrate, etc. The buffer to be injected may be hypertonic, isotonic, or hypotonic with respect to the particular reference medium, i.e. the salt content of the buffer may be greater than, identical to, or less than that of the particular reference medium, and concentrations of the aforementioned salts may preferably be used which do not result in cell damage due to osmosis or other concentration-related influences. Reference media can be, for example, liquids used in in vivo methods, such as blood, lymph, cytosolic fluids, or other body fluids, or, for example, liquids that can be used as reference media in in vivo methods. vitro" such as conventional buffers or liquids. These conventional buffers or liquids are known to the person skilled in the art. The most preferred liquid base is lactated Ringer's solution.

В предлагаемой в изобретении фармацевтической композиции можно использовать также один или несколько совместимых твердых или жидких наполнителей или разбавителей или капсулирующих соединений, которые можно применять для введения пациенту, подлежащему лечению. Понятие «совместимые» в контексте настоящего описания означает, что указанные компоненты предлагаемой в изобретении фармацевтической композиции можно смешивать с предлагаемой в изобретении нуклеиновой кислотой, указанной в настоящем описании, таким образом, чтобы не происходило взаимодействия, которое могло бы существенно снижать фармацевтическую эффективность предлагаемой в изобретении фармацевтической композиции в обычных условиях применения.One or more compatible solid or liquid excipients or diluents or encapsulating compounds that can be used for administration to the patient to be treated can also be used in the pharmaceutical composition of the invention. The term "compatible" in the context of the present description means that these components of the pharmaceutical composition of the invention can be mixed with the nucleic acid of the invention specified in the present description, so that no interaction occurs that could significantly reduce the pharmaceutical effectiveness of the invention pharmaceutical composition under normal conditions of use.

Фармацевтическая композиция, предлагаемая в настоящем изобретении, может необязательно содержать также один или несколько дополнительных фармацевтически активных компонентов. В данном контексте фармацевтически активный компонент представляет собой соединение, которое обладает терапевтическим действием в отношении лечения, облегчения или предупреждения конкретного показания или заболевания. Такие соединения включают (но, не ограничиваясь только ими) пептиды или белки, нуклеиновые кислоты, (терапевтически активные) низкомолекулярные органические или неорганические соединения (с молекулярной массой менее 5000, предпочтительно менее 1000), сахара, антигены или антитела, терапевтические агенты, уже известные из существующего уровня техники, антигенные клетки, антигенные клеточные фрагменты, клеточные фракции; компоненты клеточной оболочки (например, полисахариды), модифицированные, ослабленные или дезактивированные (например, химическим путем или путем облучения) патогены (вирусы, бактерии и т.д.), адъюванты, предпочтительно указанные в настоящем описании, и т.д.The pharmaceutical composition of the present invention may optionally also contain one or more additional pharmaceutically active ingredients. In this context, a pharmaceutically active ingredient is a compound that has a therapeutic effect in relation to the treatment, alleviation or prevention of a particular indication or disease. Such compounds include, but are not limited to, peptides or proteins, nucleic acids, (therapeutically active) small organic or inorganic compounds (molecular weight less than 5000, preferably less than 1000), sugars, antigens or antibodies, therapeutic agents already known from the existing level of technology, antigenic cells, antigenic cell fragments, cell fractions; cell wall components (eg, polysaccharides), modified, attenuated or inactivated (eg, chemically or by radiation) pathogens (viruses, bacteria, etc.), adjuvants, preferably as described herein, etc.

Кроме того, предлагаемая в изобретении фармацевтическая композиция может содержать носитель для искусственной молекулы нуклеиновой кислоты или вектора. Такой носитель может быть пригоден для облегчения растворения в физиологически приемлемых жидкостях, транспортировки и поглощения клеткой фармацевтически активной искусственной молекулы нуклеиновой кислоты или вектора. Следовательно, такой носитель может представлять собой компонент, который может быть пригоден для хранения и доставки искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в изобретении. Такие компоненты могут представлять собой, например, катионные или поликатионные носители или соединения, которые могут служить в качестве агентов для трансфекции или комплексообразования.In addition, the pharmaceutical composition according to the invention may contain a carrier for an artificial nucleic acid molecule or a vector. Such a carrier may be useful for facilitating dissolution in physiologically acceptable fluids, transport and uptake by the cell of a pharmaceutically active artificial nucleic acid molecule or vector. Therefore, such a carrier may be a component that may be suitable for the storage and delivery of an artificial nucleic acid molecule or vector proposed/proposed in the invention. Such components may be, for example, cationic or polycationic carriers or compounds which may serve as transfection or complexing agents.

В этом контексте наиболее предпочтительными агентами для трансфекции или комплексообразования являются катионные или поликатионные соединения, включая протамин, нуклеолин, спермин или спермидин, или другие катионные пептиды или белки, такие как поли-L-лизин (PLL), полиаргинин,

полипептиды, обладающие способностью проникать в клетку пептиды (СРР), такие как ВИЧ-связывающие пептиды. Tat ВИЧ-1 (ВИЧ), выведенные из Tat пептиды, пенетратин, полученные из VP22 пептиды или аналоги, VP22 HSV (вирус герпеса простого), MAP, KALA или домены трансдукции белков (PTD), РрТ620, богатые пролином пептиды, богатые аргинином пептиды, богатые лизином пептиды, МРО-пептид(ы), Рер-1, L-олигомеры, пептид(ы) кальцитонина, выведенные из Antennapedia пептиды (прежде всего, выведенные из Drosophila antennapedia), pAntp, pIsl, FGF, лактоферрин, транспортан, буфорин-2, Вас715-24, SynB, SynB(1), pVEC, выведенные из hCT пептиды, SAP или гистоны.In this context, the most preferred transfection or complexation agents are cationic or polycationic compounds including protamine, nucleolin, spermine or spermidine, or other cationic peptides or proteins such as poly-L-lysine (PLL), polyarginine,

cell-penetrating peptide (CPP) polypeptides, such as HIV-binding peptides. Tat HIV-1 (HIV), Tat-derived peptides, penetratin, VP22-derived peptides or analogs, VP22 HSV (herpes simplex virus), MAP, KALA or protein transduction domains (PTDs), PpT620, proline-rich peptides, arginine-rich peptides , lysine-rich peptides, MPO peptide(s), Pep-1, L-oligomers, calcitonin peptide(s), Antennapedia derived peptides (primarily derived from Drosophila antennapedia), pAntp, pIsl, FGF, lactoferrin, transportan, buforin-2, Vas715-24, SynB, SynB(1), pVEC, hCT derived peptides, SAP or histones.

Кроме того, такие катионные или поликатионные соединения могут представлять собой катионные или поликатионные пептиды или белки, которые предпочтительно содержат или дополнительно модифицированы так, чтобы они содержали по меньшей мере одну SH-группу. Предпочтительно катионный или поликатионный носитель выбирают из катионных пептидов, имеющих следующую общую формулу (I):In addition, such cationic or polycationic compounds may be cationic or polycationic peptides or proteins that preferably contain or are further modified to contain at least one SH group. Preferably the cationic or polycationic carrier is selected from cationic peptides having the following general formula (I):

в которой l+m+n+0+x- 3-100 и l, m, n или о независимо друг от друга обозначают любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90 и 91-100, при условии, общее содержание Arg (аргинин), Lys (лизин), His (гистидин) и Orn (орнитин) составляет по меньшей мере 10% от общего содержания аминокислот в олигопептиде; а Хаа может обозначать любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или не встречающихся в естественных условиях аминокислот за исключением Arg, Lys, His или Orn; и х может обозначать любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13,14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90, при условии, что общее содержание Хаа не превышает 90% от общего содержания аминокислот в олигопептиде. Любую из аминокислот Arg, Lys, His, Orn и Хаа можно помещать в любое положение пептида. В этом контексте наиболее предпочтительными являются катионные пептиды или белки, содержащие 7-30 аминокислот.in which l+m+n+0+x- 3-100 and l, m, n or o independently of each other denote any number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8 , 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81 -90 and 91-100, provided that the total content of Arg (arginine), Lys (lysine), His (histidine) and Orn (ornithine) is at least 10% of the total amino acid content of the oligopeptide; and Xaa can be any amino acid selected from native (ie, naturally occurring) or non-naturally occurring amino acids with the exception of Arg, Lys, His, or Orn; and x can be any number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13.14, 15, 16, 17, 18, 19, 20 , 21-30, 31-40, 41-50, 51-60, 61-70, 71-80, 81-90, provided that the total Xaa content does not exceed 90% of the total amino acid content in the oligopeptide. Any of the amino acids Arg, Lys, His, Orn and Xaa can be placed at any position in the peptide. In this context, cationic peptides or proteins containing 7-30 amino acids are most preferred.

Кроме того, катионный или поликатионный пептид или белок, определяемый формулой {(Arg)_l;(Lys)_m;(His)_n;(Orn)_o;(Xaa)_x} (формула (I)), представленной выше, который содержит или дополнительно модифицирован так, что он содержал по меньшей мере одну SH-группу, можно выбирать (но, не ограничиваясь только этим) из соединений подформулы (Ia):In addition, a cationic or polycationic peptide or protein defined by the formula {(Arg) _l ;(Lys) _m ;(His) _n ;(Orn) _o ;(Xaa) _x } (formula (I)) presented above, which contains or further modified such that it contains at least one SH group, may be selected from (but not limited to) compounds of subformula (Ia):

в которой (Arg)_l;(Lys)_m;(His)_n;(Orn)_o; и х имеют указанные выше значения, Хаа' обозначает любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или не встречающихся в естественных условиях аминокислот за исключением Arg, Lys, His, Orn или Cys, и у обозначает любое число, выбранное из 0, 1, 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31-40, 41-50, 51-60, 61-70, 71-80 и 81-90, условии, что общее содержание Arg (аргинин), Lys (лизин). His (гистидин) и Orn (оринитин) составляет по меньшей мере 10% от общего содержания аминокислот в олигопептиде. Кроме того, катионный или поликатионный пептид можно выбирать из соединений подформулы (1б):in which (Arg) _l ;(Lys) _m ;(His) _n ;(Orn) _o ; and x are as defined above, Xaa' is any amino acid selected from native (i.e., naturally occurring) or non-naturally occurring amino acids with the exception of Arg, Lys, His, Orn, or Cys, and y is any number , selected from 0, 1, 1, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21-30, 31 -40, 41-50, 51-60, 61-70, 71-80 and 81-90, provided that the total content of Arg (arginine), Lys (lysine). His (histidine) and Orn (orinithine) make up at least 10% of the total amino acid content of the oligopeptide. In addition, the cationic or polycationic peptide can be selected from compounds of subformula (1b):

в которой эмпирическая формула {(Arg)_l;(Lys)_m;(His)_n;(Orn)_o;(Xaa)_x} (формула (III)) представлена в настоящем описании и образует ядро аминокислотной последовательности, представленной (полуэмприрической) формулой (III), и в которой Cys₁ и Cys₂ обозначают остатки цистеина, расположенные проксимально или терминально относительно (Arg)_l;(Lys)_m;(His)_n;(Orn)_o;(Xaa)_x.in which the empirical formula {(Arg) _l ;(Lys) _m ;(His) _n ;(Orn) _o ;(Xaa) _x } (formula (III)) is presented in the present description and forms the core of the amino acid sequence represented by the (semi-empirical) formula (III), and in which Cys ₁ and Cys ₂ denote cysteine residues located proximal or terminal relative to (Arg) _l ;(Lys) _m ;(His) _n ;(Orn) _o ;(Xaa) _x .

Другие предпочтительные катионные или поликатионные соединения, которые можно применять в качестве агентов для трансфекции, могут представлять собой катионные полисахариды, например, хитозан, полибрен, катионные полимеры, например, полиэтиленимин (PEI), катионные липиды, например, DOTMA: хлорид [1-(2,3-сиолеилокси)пропил)]-N,N,N-триметиламмония, DMRIE, ди-С14-амидин, DOTIM, SAINT, DC-Chol, BGTC, СТАР, DOPC, DODAP, DOPE: диолеилфосфатидилэтаноламин, DOSPA, DODAB, DOIC, DMEPC, DOGS: диоктадециламидоглицилспермин, DIMRI: бромид димиристооксипропилдиметилгидроксиэтиламмония, DOTAP: диолеоилокси-3-(триметиламмонио)пропан, DC-6-14: хлорид O,O-дитетрадеканоил-N-(α-триметиламмониоацетил)диэтаноламина, CLIP1: хлорид рац-[(2,3-диоктадецилоксипропил)(2-гидроксиэтил)]диметиламмония, CLIP6: рац-[2(2,3-дигексадецилоксипропилоксиметилокси)этил]триметиламмоний, CLIP9: рац-[2(2,3-дигексадецилоксипропилоксисукцинилокси)этил]триметиламмоний, олигофектамин, или катионные или поликатионные полимеры, например, модифицированные полиаминокислоты, такие как полимеры β-аминокислот, или обратимые полиамиды и т.д., модифицированные полиэтилены, такие как PVP (бромид поли(N-этил-4-винилпиридиния)) и т.д. модифицированные акрилаты, такие как pDMAEMA (поли(диметиламиноэтилметилакрилат)) и т.д., модифицированные амидоамины, такие как рАМАМ (поли(амидоамин)) и т.д., модифицированный сложный полибетааминоэфир (РВАЕ), например, с модифицированным диаминовым концом сополимеры 1,4-бутандиолдиакрилата и 5-амино-1-пентанола, и т.д. дендримеры, например, дендримеры полипропиламина или дендримеры на основе рАМАМ, и т.д. полиимин(ы), например, PEI: поли(этиленимин), поли(пропиленимин) и т.д., полиаллиламин, полимеры на основе сахарного каркаса, такие как полимеры на основе циклодекстрина, полимеры на основе декстрана, хитозан и т.д. полимеры на основе силанового каркаса, например, сополимеры PMOXA-PDMS и т.д., блок-сополимеры, состоящие из комбинации одного или несколько катионных блоков (например, выбранных из катионного полимера, указанного выше) и одного или нескольких гидрофильных или гидрофобных блоков (например, полиэтиленгликоль); и т.д.Other preferred cationic or polycationic compounds that can be used as transfection agents may be cationic polysaccharides, eg chitosan, polybrene, cationic polymers, eg polyethyleneimine (PEI), cationic lipids, eg DOTMA:chloride [1-( 2,3-sioleyloxy)propyl)]-N,N,N-trimethylammonium, DMRIE, di-C14-amidine, DOTIM, SAINT, DC-Chol, BGTC, STAR, DOPC, DODAP, DOPE: dioleylphosphatidylethanolamine, DOSPA, DODAB, DOIC, DMEPC, DOGS: dioctadecylamidoglycylspermine, DIMRI: dimyristooxypropyldimethylhydroxyethylammonium bromide, DOTAP: dioleoyloxy-3-(trimethylammonio)propane, DC-6-14: O,O-ditradecanoyl-N-(α-trimethylammonioacetyl)diethanolamine chloride, CLIP1: rac chloride -[(2,3-dioctadecyloxypropyl)(2-hydroxyethyl)]dimethylammonium, CLIP6: rac-[2(2,3-dihexadecyloxypropyloxymethyloxy)ethyl]trimethylammonium, CLIP9: rac-[2(2,3-dihexadecyloxypropyloxysuccinyloxy)ethyl]trimethylammonium , oligofectamine, or cationic or polycationic polymers, e.g. ep, modified polyamino acids such as β-amino acid polymers or reversible polyamides, etc., modified polyethylenes such as PVP (poly(N-ethyl-4-vinylpyridinium) bromide), etc. modified acrylates such as pDMAEMA (poly(dimethylaminoethyl methyl acrylate)) etc. modified amidoamines such as pAMAM (poly(amidoamine)) etc. modified polybetaaminoester (PBAE) e.g. modified diamine terminus copolymers 1,4-butanediol diacrylate and 5-amino-1-pentanol, etc. dendrimers, for example polypropylamine dendrimers or pAMAM based dendrimers, etc. polyimine(s), e.g. PEI: poly(ethyleneimine), poly(propyleneimine), etc., polyallylamine, sugar backbone polymers such as cyclodextrin-based polymers, dextran-based polymers, chitosan, etc. silane backbone polymers, e.g. PMOXA-PDMS copolymers, etc., block copolymers consisting of a combination of one or more cationic blocks (e.g. selected from the cationic polymer above) and one or more hydrophilic or hydrophobic blocks ( e.g. polyethylene glycol); etc.

Согласно другому варианту осуществления изобретения фармацевтическая композиция, предлагаемая в изобретении, может содержать адъювант для повышения иммуностимулирующих свойств фармацевтической композиции. В данном контексте под адъювантом можно понимать любое соединение, которое пригодно для облегчения введения и доставки компонентов, таких как искусственная молекула нуклеиновой кислоты или вектор, которая/который содержится в фармацевтической композиции, предлагаемой в изобретении. Кроме того, такой адъювант может (но, не ограничиваясь только этим) инициировать или усиливать иммунный ответ врожденной иммунной системы, т.е. неспецифический иммунный ответ. Иными словами, после введения фармацевтическая композиция, предлагаемая в изобретении, как правило, инициирует адаптивный иммунный ответ, направленный на антиген, кодируемый искусственной молекулой нуклеиновой кислоты. Кроме того, фармацевтическая композиция, предлагаемая в изобретении, может вызывать (поддерживающий) врожденный иммунный ответ благодаря добавлению адъюванта, указанного в настоящем описании, к фармацевтической композиции, предлагаемой в изобретении.According to another embodiment of the invention, the pharmaceutical composition according to the invention may contain an adjuvant to enhance the immunostimulatory properties of the pharmaceutical composition. In this context, an adjuvant can be understood to mean any compound that is suitable for facilitating the administration and delivery of components, such as an artificial nucleic acid molecule or a vector, which/which is contained in the pharmaceutical composition of the invention. In addition, such an adjuvant may (but not limited to) initiate or enhance the immune response of the innate immune system, i. nonspecific immune response. In other words, upon administration, the pharmaceutical composition of the invention typically initiates an adaptive immune response directed to the antigen encoded by the artificial nucleic acid molecule. In addition, the pharmaceutical composition of the invention can elicit a (supportive) innate immune response by adding an adjuvant as described herein to the pharmaceutical composition of the invention.

Такой адъювант можно выбирать из любого адъюванта, известного специалисту в данной области и пригодного для рассматриваемого случая, т.е. для поддержания индукции иммунного ответа у млекопитающего. Предпочтительно адъювант можно выбирать из группы, включающей (но, не ограничиваясь только ими) TDM, MDP, мурамилдипептид, плюроники, раствор квасцов, гидроксид алюминия, ADJUMER™ (полифосфазен); гель фосфата алюминия; глюканы, выделенные из водорослей; алгаммулин; гель гидроксид а алюминия (квасцы); высокоадсорбирующий белки гель гидроксида алюминия; обладающий низкой вязкостью гель гидроксида алюминия; AF или SPT (эмульсия, содержащая сквалан (5%), Твин 80 (0.2%), плюроник L121 (1,25%), забуференный фосфатом физиологический раствор, рН 7,4); AVRIDINE™ (пропандиамин); BAY R1005™ ((N-(2-дезокси-2-L-леуциламиноб-D-глюкопиранозил)-N-октадециламида гидроацетат); CALCITRIOL™ (1-альфа,25-дигидрокси-витамин D3); гель фосфата кальция; CAP™ (наночастицы фосфата кальция); холерный голотоксин, слитый белок холерный токсин-А1-белок-А-D-фрагмент, субъединица В холерного токсина; CRL 1005 (блок-сополимер Р1205); содержащие цитокин липосомы; DDA (диметилдиоктадециламмония бромид); DHEA (дегидроэпиандростерон); DMPC (димиристоилфосфатидилхолин); DMPG (димиристоилфосфатидилглицерин); комплекс DOC/квасцы (натриевая соль дезоксихолиновой кислоты); полный адъювант Фрейнда; неполный адъювант Фрейнда; инулин-гамма; адъювант Гербу (смесь, содержащая: I) N-ацетилглюкозаминил-(Р1-4)-N-ацетилмурамоил-L-аланил-035 глутамин (GMDP), II) диметилдиоктадециламмония хлорид (DDA), III) комплекс цинк-соль L-пролина (ZnPro-8); GM-CSF); GMDP (N-ацетилглюкозаминил-(b1-4)-N-ацетилмурамил-L47 аланил-D-изоглутамин); имиквимод (1-(2-метилпропил)-1Н-имидазо[4,5-с]хинолин-4-амин); ImmTher™ (N-ацетилглюкозаминил-N-ацетилмурамил-L-А1а-В-изоGlu-L-Ala-глицерина дипальмитат); DRV (иммунолипосомы, приготовленные из везикул, полученных методом гидратации-регидратации); интерферон-гамма; интерлейкин-1бета; интерлейкин-2; интерлейкин-7; интерлейкин-12; ISCOMSTM; ISCOPREP 7.0.3. ТМ; липосомы; LOXORIBINE™ (7-аллил-8-оксогуанозин); оральный адъювант LT 5 (лабильный энтеротоксин-протоксин из Е. coli); микросферы и микрочастицы любого состава; MF59TM; (водная эмульсия сквалена); MONTANIDE ISA 51™ (очищенный неполный адъювант Фрейнда); MONTANIDE ISA 720™ (метаболизируемый масляный адъювант); MPL™ (3-Q-дезацил-4'-монофосфорил-липид А); липосомы МТР-РЕ и МТР-РЕ ((N-ацетил-L-аланил-D-изоглутаминил-L-аланин-2-(1,2-дипальмитоил-sn-глицеро-3-(гидроксифосфорилокси))этиламид, однонатриевая соль); MURAMETIDE™ (Nac-Mur-L-Ala-D-Gln-OCH3); MURAPALMITINE™ и DMURAPALMITINE™ (Nac-Mur-L-Thr-D-изоGIn-sn-глицериндипальмитоил); NAGO (нейраминидаза-галактозооксидаза); наносферы или наночастицы любого состава; NISV (везикулы из неионогенного поверхностно-активного вещества); PLEURAN™ (β-глюкан); PLGA, PGA и PLA (гомо- и сополимеры молочной кислоты и гликолевой кислоты; микросферы/наносферы); ПЛЮРОНИК L121™; РММА (полиметилметакрилат); PODDS™ (протеноидные микросферы); полиэтиленкарбаматные производные; поли-rA:поли-rU (комплекс полиадениловая кислота-полиуридиновая кислота); полисорбат 80 (Твин 80); белковые кохлеаты (фирма Avanti Polar Lipids, Inc., Алабастер, шт. Алабама); STIMULON™ (QS-21); Quil-A (сапонин Quil-A); S-28463 (4-аминоотекдиметил-2-этоксиметил-1Н-имидазо[4,5-с]хинолин-1-этанол); SAF-1™ («композиция адъювантов фирмы Syntex»); протеолипосомы вируса Сендаи и липидные матрицы, содержащие вирус Сендаи; Спан-85 (сорбитантриолеат); Specol (эмульсия Marcol 52, Спан 85 и Твин 85); сквален или Robane® (2,6,10,15,19,23-гексаметилтетракозан и 2,6,10,15,19,23-гексаметил-2,6,10,14,18,22-тетракозагексан); стеарилтирозин (октадецилтирозина гидрохлорид); Theramid® (М-ацетилглюкозаминил-N-ацетилмурамил-L-Ala-D-isoGlu-L-Ala-дипальмитоксипропиламид); Theronyl-MDP (Termurtide™ или [thr 1]-MDP; N-ацетилмурамил-L-треонил-D-изоглутамин); Ту-частицы (Ту-ВПЧ или вирусоподобные частицы); липосомы Уолтера-Рида (липосомы, содержащие липид А, адсорбированный на гидроксиде алюминия) и липопептиды, включая Pam3Cys, прежде всего соли алюминия, такие как адъю-фос (Adju-phos), алгидрогель, регидрагель и т.д., эмульсии, такие как CFA, SAF, IFA, MF59, провакс, TiterMax, монтанид, ваксфектин и т.д., сополимеры, такие как оптивакс (Optivax, CRL1005), L121, полоксамер 4010) и т.д., липосомы, такие как «липосомы-невидимки (Stealth)» и т.д., кохлеаты, такие как BIORAL, и т.д., адъюванты растительного происхождения, такие как QS21, Quil A, Iscomatrix, ISCOM; адъюванты, пригодные для костимуляции, включая томатин, биополимеры, такие как PLG, РММ, инулин и т.д., адъюванты микробного происхождения, такие как ромуртид, DETOX, MPL, CWS, манноза, нуклеотидные последовательности CpG, CpG7909, лиганды человеческого TLR 1-13, ISS-1018, 35 IC31, имидазохинолины, амплиген, Ribi529, IMOxine, IRIV, ВПЧ, холерный токсин, термолабильный токсин, Pam3Cys, флагеллин, GPI (гликозилфосфатидилинозитол)-якорь, LNFPIII/Lewis X, противомикробные пептиды, UC-1V150, слитый белок RSV, cdiGMP; и адъюванты, пригодные в качестве антагонистов, включая нейропептид CGRP.Such an adjuvant can be selected from any adjuvant known to the person skilled in the art and suitable for the case in question, i. to maintain the induction of an immune response in a mammal. Preferably, the adjuvant can be selected from the group including (but not limited to) TDM, MDP, muramyl dipeptide, pluronics, alum solution, aluminum hydroxide, ADJUMER™ (polyphosphazene); aluminum phosphate gel; glucans isolated from algae; algammulin; aluminum hydroxide gel (alum); highly protein-absorbing aluminum hydroxide gel; a low viscosity aluminum hydroxide gel; AF or SPT (emulsion containing Squalane (5%), Tween 80 (0.2%), Pluronic L121 (1.25%), phosphate buffered saline, pH 7.4); AVRIDINE™ (propanediamine); BAY R1005™ ((N-(2-deoxy-2-L-leucylamino-D-glucopyranosyl)-N-octadecylamide hydroacetate); CALCITRIOL™ (1-alpha,25-dihydroxy vitamin D3); calcium phosphate gel; CAP™ (calcium phosphate nanoparticles); cholera holotoxin, fusion protein cholera toxin-A1 protein-A-D fragment, cholera toxin subunit B; CRL 1005 (P1205 block copolymer); cytokine-containing liposomes; DDA (dimethyldioctadecylammonium bromide); DHEA ( dehydroepiandrosterone); DMPC (dimyristoylphosphatidylcholine); DMPG (dimyristoylphosphatidylglycerol); DOC/alum complex (deoxycholic acid sodium salt); complete Freund's adjuvant; incomplete Freund's adjuvant; inulin-gamma; Gerbu's adjuvant (mixture containing: I) N-acetylglucosaminyl-( P1-4)-N-acetylmuramoyl-L-alanyl-035 glutamine (GMDP), II) dimethyldioctadecylammonium chloride (DDA), III) L-proline zinc salt complex (ZnPro-8); GM-CSF); GMDP (N-acetylglucosaminyl-(b1-4)-N-acetylmuramyl-L47 alanyl-D-isoglutamine); imiquimod (1-(2-methylpropyl)-1H-imidazo[4,5-c]quinoline-4-amine); ImmTher™ (N-acetylglucosaminyl-N-acetylmuramyl-L-A1a-B-isoGlu-L-Ala-glycerol dipalmitate); DRV (immunoliposomes prepared from vesicles obtained by the hydration-rehydration method); interferon-gamma; interleukin-1beta; interleukin-2; interleukin-7; interleukin-12; ISCOMSM; ISCOPREP 7.0.3. TM; liposomes; LOXORIBINE™ (7-allyl-8-oxoguanosine); oral adjuvant LT 5 (labile enterotoxin-protoxin from E. coli); microspheres and microparticles of any composition; MF59TM; (water emulsion of squalene); MONTANIDE ISA 51™ (purified incomplete Freund's adjuvant); MONTANIDE ISA 720™ (metabolizable oil adjuvant); MPL™ (3-Q-deacyl-4'-monophosphoryl lipid A); liposomes MTP-PE and MTP-PE ((N-acetyl-L-alanyl-D-isoglutaminyl-L-alanine-2-(1,2-dipalmitoyl-sn-glycero-3-(hydroxyphosphoryloxy)) ethylamide, single sodium salt) ; MURAMETIDE™ (Nac-Mur-L-Ala-D-Gln-OCH3); MURAPALMITINE™ and DMURAPALMITINE™ (Nac-Mur-L-Thr-D-isoGIn-sn-glycerindipalmitoyl); NAGO (neuraminidase-galactose oxidase); nanospheres or nanoparticles of any composition; NISV (nonionic surfactant vesicles); PLEURAN™ (β-glucan); PLGA, PGA and PLA (homo- and copolymers of lactic acid and glycolic acid; microspheres/nanospheres); PLURONIC L121™; PMMA (polymethyl methacrylate); PODDS™ (protenoid microspheres); polyethylene carbamate derivatives; poly-rA:poly-rU (polyadenylic acid-polyuridic acid complex); polysorbate 80 (Tween 80); protein cochleates (Avanti Polar Lipids, Inc., Alabaster, Alabama); STIMULON™ (QS-21); Quil-A (Quil-A saponin); S-28463 (4-aminootecdimethyl-2-ethoxymethyl-1H-imidazo[4,5-c]quinoline-1-ethanol ); SAF-1™ ("composition of adjuvants from Synte x"); Sendai virus proteoliposomes and lipid matrices containing Sendai virus; Span-85 (sorbitan trioleate); Specol (emulsion Marcol 52, Span 85 and Twin 85); squalene or Robane® (2,6,10,15,19,23-hexamethyltetracosane and 2,6,10,15,19,23-hexamethyl-2,6,10,14,18,22-tetracoshexane); stearyltyrosine (octadecyltyrosine hydrochloride); Theramid® (M-acetylglucosaminyl-N-acetylmuramyl-L-Ala-D-isoGlu-L-Ala-dipalmitoxypropylamide); Theronyl-MDP (Termurtide™ or [thr 1]-MDP; N-acetylmuramyl-L-threonyl-D-isoglutamine); Tu-particles (Tu-HPV or virus-like particles); Walter-Read liposomes (liposomes containing lipid A adsorbed on aluminum hydroxide) and lipopeptides, including Pam3Cys, especially aluminum salts such as Adju-phos, alhydrogel, rehydragel, etc., emulsions such as like CFA, SAF, IFA, MF59, provax, TiterMax, montanide, vaxfectin, etc., copolymers like optivax (Optivax, CRL1005), L121, poloxamer 4010) etc., liposomes like "liposomes stealth (Stealth), etc., cochleates such as BIORAL, etc., herbal adjuvants such as QS21, Quil A, Iscomatrix, ISCOM; adjuvants suitable for costimulation including tomatine, biopolymers such as PLG, PMM, inulin, etc., adjuvants of microbial origin such as romurtide, DETOX, MPL, CWS, mannose, CpG nucleotide sequences, CpG7909, human TLR 1 ligands -13, ISS-1018, 35 IC31, imidazoquinolines, ampligen, Ribi529, IMOxine, IRIV, HPV, cholera toxin, thermolabile toxin, Pam3Cys, flagellin, GPI (glycosylphosphatidylinositol)-anchor, LNFPIII/Lewis X, antimicrobial peptides, UC-1V150 , RSV fusion protein, cdiGMP; and adjuvants useful as antagonists, including the neuropeptide CGRP.

Пригодные адъюванты можно выбирать также из катионных или поликатионных соединений, при этом адъювант предпочтительно получают путем образования комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор, входящую/входящий в фармацевтическую композицию, и катионное или поликатионное соединение. Ассоциация или образование комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор входящую/входящий в фармацевтическую композицию, и катионные или поликатионные соединения, указанные в настоящем описании, предпочтительно обеспечивает присущие адъюванту свойства и оказывает стабилизирующее действие на искусственную молекулу нуклеиновой кислоты или вектор, входящую/входящий в фармацевтическую композицию. Наиболее предпочтительно такие катионные или поликатионные соединения выбирают из катионных или поликатионных пептидов или белков, включая протамин, нуклеолин, спермин или спермидин, или другие катионные пептиды или белки, такие как поли-L-лизин (PLL), полиаргинин, основные полипептиды, обладающие способностью проникать в клетку пептиды (СРР), такие как ВИЧ-связывающие пептиды. Tat ВИЧ-1 (ВИЧ), выведенные из Tat пептиды, пенетратин, полученные из VP22 пептиды или аналоги, VP22 HSV (вирус герпеса простого), MAP, KALA или домены трансдукции белков (PTD), РрТ620, богатые пролином пептиды, богатые аргинином пептиды, богатые лизином пептиды, МРС-пептид(ы), Рер-1, L-олигомеры, пептид(ы) кальцитонина, выведенные из Antennapedia пептиды (прежде всего, выведенные из Drosophila antennapedid), pAntp, pIsl, FGF, лактоферрин, транспортан, буфорин-2, Вас715-24, SynB, SynB(1), pVEC, выведенные из hCT пептиды, SAP или гистоны. Другими предпочтительными катионными или поликатионными соединениями могут являться катионные полисахариды, например хитозан, полибрен, катионные полимеры, например, полиэтиленимин (PEI), катионные липиды, например, DOTMA: хлорид [1-(2,3-сиолеилокси)пропил)]-N,N,N-триметиламмония, DMRIE, ди-С14-амидин, DOTIM, SAINT, DC-Chol, BGTC, СТАР, DOPC, DODAP, DOPE: диолеилфосфатидилэтаноламин, DOSPA, DODAB, DOIC, DMEPC, DOGS: диоктадециламидоглицилспермин, DIMRI: бромид димиристооксипропилдиметилгидроксиэтиламмония, DOTAP: диолеоилокси-3-(триметиламмонио)пропан, DC-6-14: хлорид O,O-дитетрадеканоил-N-(α-триметиламмониоацетил)диэтаноламина, CLIP1: хлорид рац-[(2,3-диоктадецилоксипропил)(2-гидроксиэтил)]диметиламмония, CLIP6: рац-[2(2,3-дигексадецилоксипропилоксиметилокси)этил]триметиламмоний, CLIP9: рац-[2(2,3-дигексадецилоксипропилоксисукцинилокси)этил]триметиламмоний, олигофектамин, или катионные или поликатионные полимеры, например, модифицированные полиаминокислоты, такие как полимеры β-аминокислот, или обратимые полиамиды и т.д., модифицированные полиэтилены, такие как PVP (бромид поли(N-этил-4-винилпиридиния)) и т.д. модифицированные акрилаты, такие как pDMAEMA (поли(диметиламиноэтилметилакрилат)) и т.д., модифицированные амидоамины, такие как рАМАМ (поли(амидоамин)) и т.д., модифицированный сложный полибетааминоэфир (РВАЕ), например, с модифицированным диаминовым концом сополимеры 1,4-бутандиолдиакрилата и 5-амино-1-пентанола, и т.д. дендримеры, например, дендримеры полипропиламина или дендримеры на основе рАМАМ, и т.д. полиимин(ы), например, PEI: поли(этиленимин), поли(пропиленимин) и т.д., полиаллиламин, полимеры на основе сахарного каркаса, такие как полимеры на основе циклодекстрина, полимеры на основе декстрана, хитозан и т.д. полимеры на основе силанового каркаса, например, сополимеры PMOXA-PDMS и т.д., блок-сополимеры, состоящие из комбинации одного или несколько катионных блоков (например, выбранных из катионного полимера, указанного выше) и одного или нескольких гидрофильных или гидрофобных блоков (например, полиэтиленгликоль); и т.д.Suitable adjuvants can also be selected from cationic or polycationic compounds, whereby the adjuvant is preferably prepared by forming a complex comprising an artificial nucleic acid molecule or vector included/included in a pharmaceutical composition and a cationic or polycationic compound. The association or formation of a complex comprising an artificial nucleic acid molecule or vector in/in a pharmaceutical composition and the cationic or polycationic compounds described herein preferably provides inherent adjuvant properties and has a stabilizing effect on the artificial nucleic acid molecule or vector in/in into a pharmaceutical composition. Most preferably, such cationic or polycationic compounds are selected from cationic or polycationic peptides or proteins, including protamine, nucleolin, spermine or spermidine, or other cationic peptides or proteins such as poly-L-lysine (PLL), polyarginine, basic polypeptides having the ability penetrate the cell peptides (CPP), such as HIV-binding peptides. Tat HIV-1 (HIV), Tat-derived peptides, penetratin, VP22-derived peptides or analogs, VP22 HSV (herpes simplex virus), MAP, KALA or protein transduction domains (PTDs), PpT620, proline-rich peptides, arginine-rich peptides , lysine-rich peptides, MPC peptide(s), Pep-1, L-oligomers, calcitonin peptide(s), Antennapedia derived peptides (primarily derived from Drosophila antennapedid), pAntp, pIsl, FGF, lactoferrin, transportan, buforin-2, Vas715-24, SynB, SynB(1), pVEC, hCT derived peptides, SAP or histones. Other preferred cationic or polycationic compounds may be cationic polysaccharides, eg chitosan, polybrene, cationic polymers, eg polyethyleneimine (PEI), cationic lipids, eg DOTMA:[1-(2,3-sioleyloxy)propyl)]-N chloride, N,N-trimethylammonium, DMRIE, di-C14-amidine, DOTIM, SAINT, DC-Chol, BGTC, STAR, DOPC, DODAP, DOPE: dioleylphosphatidylethanolamine, DOSPA, DODAB, DOIC, DMEPC, DOGS: dioctadecylamidoglycylspermine, DIMRI: dimyristooxypropyldimethylhydroxyethylammonium bromide , DOTAP: dioleoyloxy-3-(trimethylammonio)propane, DC-6-14: O,O-ditradecanoyl-N-(α-trimethylammonioacetyl)diethanolamine chloride, CLIP1: rac-[(2,3-dioctadecyloxypropyl)(2- hydroxyethyl)]dimethylammonium, CLIP6: rac-[2(2,3-dihexadecyloxypropyloxymethyloxy)ethyl]trimethylammonium, CLIP9: rac-[2(2,3-dihexadecyloxypropyloxysuccinyloxy)ethyl]trimethylammonium, oligofectamine, or cationic or polycationic polymers, e.g. polyamino acids such as β-amino polymers acid, or reversible polyamides, etc., modified polyethylenes such as PVP (poly(N-ethyl-4-vinylpyridinium) bromide), etc. modified acrylates such as pDMAEMA (poly(dimethylaminoethyl methyl acrylate)) etc. modified amidoamines such as pAMAM (poly(amidoamine)) etc. modified polybetaaminoester (PBAE) e.g. modified diamine terminus copolymers 1,4-butanediol diacrylate and 5-amino-1-pentanol, etc. dendrimers, for example polypropylamine dendrimers or pAMAM based dendrimers, etc. polyimine(s), e.g. PEI: poly(ethyleneimine), poly(propyleneimine), etc., polyallylamine, sugar backbone polymers such as cyclodextrin-based polymers, dextran-based polymers, chitosan, etc. silane backbone polymers, e.g. PMOXA-PDMS copolymers, etc., block copolymers consisting of a combination of one or more cationic blocks (e.g. selected from the cationic polymer above) and one or more hydrophilic or hydrophobic blocks ( e.g. polyethylene glycol); etc.

Кроме того, предпочтительные катионные или поликатионные белки или пептиды, которые можно применять в качестве адъюванта путем образования комплекса с искусственной молекулой нуклеиновой кислоты или вектором, предпочтительно РНК, включенной/включенным в композицию, можно выбирать из представленных ниже белков или пептидов, имеющих следующую общую формулу (I): (Arg)_l;(Lys)_m;(His)_n;(Orn)_o;(Xaa)_x, в которой l+m+n+o+х=8-15 и l, m, n или о независимо друг от друга могут обозначать любое число, выбранное из 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15, при условии, что общее содержание Arg, Lys, His и Orn составляет по меньшей мере 50% от общего содержания аминокислот в олигопептиде; и Хаа может обозначать любую аминокислоту, выбранную из нативных (т.е. встречающихся в естественных условиях) или ненативных аминокислот за исключением Arg, Lys, His или Orn; и х может обозначать любое число, выбранное из 0, 1, 2, 3 или 4, при условии, что общее содержание Хаа не должно превышать 50% от всех аминокислота олигопептиде. Наиболее предпочтительными олигоаргининами в данном контексте являются, например, Arg₇, Arg₈, Arg₉, Arg₇, H₃R₉, R₉H₃, H₃R₉H₃, YSSR₉SSY, (RKH)₄, Y(RKH)₂R и т.д.In addition, preferred cationic or polycationic proteins or peptides that can be used as an adjuvant by complexing with an artificial nucleic acid molecule or vector, preferably RNA included/included in the composition, can be selected from the following proteins or peptides having the following general formula (I): (Arg) _l ;(Lys) _m ;(His) _n ;(Orn) _o ;(Xaa) _x , where l+m+n+o+x=8-15 and l, m, n or o independently of each other can be any number selected from 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15, provided that the total the content of Arg, Lys, His and Orn is at least 50% of the total content of amino acids in the oligopeptide; and Xaa may be any amino acid selected from native (ie, naturally occurring) or non-native amino acids with the exception of Arg, Lys, His, or Orn; and x may be any number selected from 0, 1, 2, 3, or 4, provided that the total Xaa content should not exceed 50% of all amino acids in the oligopeptide. The most preferred oligoarginines in this context are, for example, Arg ₇ , Arg ₈ , Arg ₉ , Arg ₇ , H ₃ R ₉ , R ₉ H ₃ , H ₃ R ₉ H ₃ , YSSR ₉ SSY, (RKH) ₄ , Y( RKH) ₂ R etc.

Соотношение между искусственной нуклеиновой кислотой или вектором и катионным или поликатионным соединением можно рассчитывать на основе отношения содержания азота к содержанию фосфата (N/P-отношение) во всем включающем нуклеиновую кислоту комплексе. Например, 1 мкг РНК, как правило, содержит примерно 3 нмоля остатков фосфата, при условии, что для РНК характерно статистическое распределение оснований. Кроме того, 1 мл пептида, как правило, содержит примерно х нмолей остатков азота в зависимости от молекулярной массы и количества основных аминокислот. Если в качестве примера сделать расчет для (Arg)₉ (молекулярная масса 1424 г/моль, 9 атомов азота), то 1 мкг (Arg)₉ содержит примерно 700 пмолей (Arg)₉ и, следовательно, 700×9=6300 пмолей основных аминокислот, т.е. 6,3 нмолей атомов азота. Можно рассчитать, что для массового соотношения РНК/(Arg)₉, составляющего примерно 1:1, отношение N/P должно составлять примерно 2. Если в качестве примера сделать расчет для протамина (молекулярная масса примерно 4250 г/моль, 21 атом азота, если применяют протамин из лосося) при массовом соотношении, составляющем примерно 2:1, то для 2 мкг РНК РНК дает 6 нмолей фосфата; 1 мкг протамина содержит примерно 235 пмолей молекул протамина и, следовательно, 235×21=4935 пмолей

атомов азота, т.е. 4,9 нмолей атомов азота. Можно рассчитать, что для массового соотношения РНК/протамин, составляющего примерно 2:1, отношение N/P должно составлять примерно 0,81. Можно рассчитать, что для массового соотношения РНК/протамин, составляющего примерно 8:1, отношение N/P должно составлять примерно 0,2. В контексте настоящего изобретения касательно соотношения нуклеиновая кислота:пептид в комплексе N/P-отношение предпочтительно находится примерно в пределах 0,1-10, предпочтительно примерно в пределах 0,3-4, и наиболее предпочтительно примерно в пределах 0,5-2 или 0,7-2, и наиболее предпочтительно примерно в пределах 0,7-1,5.The ratio between the artificial nucleic acid or vector and the cationic or polycationic compound can be calculated based on the nitrogen to phosphate ratio (N/P ratio) of the entire nucleic acid complex. For example, 1 μg of RNA typically contains approximately 3 nmol of phosphate residues, provided that the RNA is characterized by a statistical distribution of bases. In addition, 1 ml of the peptide typically contains about x nmol of nitrogen residues, depending on the molecular weight and the number of basic amino acids. If, as an example, a calculation is made for (Arg) ₉ (molecular weight 1424 g / mol, 9 nitrogen atoms), then 1 μg of (Arg) ₉ contains approximately 700 pmoles (Arg) ₉ and, therefore, 700 × 9 = 6300 pmoles of basic amino acids, i.e. 6.3 nmol nitrogen atoms. It can be calculated that for an RNA/(Arg) ₉ weight ratio of about 1:1, the N/P ratio should be about 2. If, as an example, the calculation is made for protamine (molecular weight about 4250 g/mol, 21 nitrogen atoms, if protamine from salmon is used) at a weight ratio of approximately 2:1, then for 2 μg of RNA, RNA provides 6 nmol of phosphate; 1 µg of protamine contains approximately 235 pmoles of protamine molecules and therefore 235×21=4935 pmoles

nitrogen atoms, i.e. 4.9 nmol nitrogen atoms. It can be calculated that for an RNA/protamine weight ratio of about 2:1, the N/P ratio would be about 0.81. It can be calculated that for an RNA/protamine weight ratio of about 8:1, the N/P ratio would be about 0.2. In the context of the present invention, regarding the ratio of nucleic acid:peptide in the complex, the N/P ratio is preferably in the range of 0.1-10, preferably in the range of 0.3-4, and most preferably in the range of 0.5-2 or 0.7-2, and most preferably in the range of 0.7-1.5.

В заявке на патент WO 2010/037539, содержание которой включено в настоящее описание в качестве ссылки, описана иммуностимулирующая композиция и методы получения иммуностимулирующей композиции. Так, в предпочтительном варианте осуществления изобретения композицию получают, осуществляя две отдельные стадии для достижения и эффективного иммуностимулирующего действия, и эффективной трансляции искусственной молекулы нуклеиновой кислоты, предлагаемой в изобретении. Для этого на первой стадии получают так называемый «адъювантный компонент» путем образования комплекса, включающего искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно РНК, входящую в адъювантный компонент, и катионное или поликатионное соединение в конкретном соотношении для формирования стабильного комплекса. В этом контексте важно, чтобы в адъювантном компоненте отсутствовало или сохранялось лишь в ничтожно малых количествах свободное катионное или поликатионное соединение после образования комплекса с нуклеиновой кислотой. Таким образом, соотношение между нуклеиновой кислотой и катионным или поликатионным соединением в адъювантном компоненте, как правило, выбирают в таком диапазоне, чтобы нуклеиновая кислота была полностью включена в комплекс и отсутствовало или сохранялось лишь в ничтожно малых количествах свободное катионное или поликатионное соединение. Предпочтительно соотношение в адъювантном компоненте, т.е. соотношение между мРНК и катионным или поликатионным соединением, выбирают из диапазона, составляющего от примерно 6:1 (мас./мас.) до примерно 0,25:1 (мас./мас.), более предпочтительно от примерно 5:1 (мас./мас.) до примерно 0,5:1 (мас./мас.), еще более предпочтительно от примерно 4:1 (мас./мас.) до примерно 1:1 (мас./мас.) или от примерно 3:1 (мас./мас.) до примерно 1:1 (мас./мас.) и наиболее предпочтительно от примерно 3:1 (мас./мас.) до примерно 2:1 (мас./мас.).Patent application WO 2010/037539, the contents of which are incorporated herein by reference, describes an immunostimulatory composition and methods for preparing an immunostimulatory composition. Thus, in a preferred embodiment of the invention, the composition is prepared by performing two separate steps to achieve both an effective immunostimulatory effect and efficient translation of the artificial nucleic acid molecule of the invention. To do this, in the first stage, the so-called "adjuvant component" is obtained by forming a complex that includes an artificial nucleic acid molecule or a vector, preferably RNA, which is part of the adjuvant component, and a cationic or polycationic compound in a specific ratio to form a stable complex. In this context, it is important that the adjuvant component is free from or retains only negligible amounts of free cationic or polycationic compound after complexation with the nucleic acid. Thus, the ratio between the nucleic acid and the cationic or polycationic compound in the adjuvant component is generally chosen to be in the range such that the nucleic acid is completely incorporated into the complex and there is no or only negligible free cationic or polycationic compound present. Preferably the ratio in the adjuvant component, ie. the ratio between mRNA and cationic or polycationic compound is selected from the range of from about 6:1 (wt./wt.) to about 0.25:1 (wt./wt.), more preferably from about 5:1 (wt. ./wt.) to about 0.5:1 (wt./wt.), even more preferably from about 4:1 (wt./wt.) to about 1:1 (wt./wt.) or from about 3:1 (w/w) to about 1:1 (w/w) and most preferably from about 3:1 (w/w) to about 2:1 (w/w).

Согласно предпочтительному варианту осуществления изобретения искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно молекулу РНК, предлагаемую/предлагаемый в изобретении, добавляют на второй стадии к входящей в комплекс молекуле нуклеиновой кислоты, предпочтительно РНК, адъювантного компонента для получения (иммуностимулирующей) композиции, предлагаемой в изобретении. При этом искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно молекулу РНК, предлагаемую/предлагаемый в изобретении, добавляют в виде свободной нуклеиновой кислоты, т.е. нуклеиновой кислоты, которая не входит в комплекс с другими соединениями. Перед добавлением свободную искусственную молекулу нуклеиновой кислоты или вектор не включают в комплекс и предпочтительно после добавления адъювантного компонента она/он не должна/должен подвергаться какой-либо поддающейся обнаружению или значимой реакции комплексообразования.According to a preferred embodiment of the invention, an artificial nucleic acid molecule or a vector, preferably an RNA molecule according to the invention, is added in a second step to the complexed nucleic acid molecule, preferably RNA, of the adjuvant component to obtain an (immunostimulatory) composition according to the invention. In this case, an artificial nucleic acid molecule or a vector, preferably an RNA molecule according to the invention, is added in the form of a free nucleic acid, i.e. nucleic acid that is not complexed with other compounds. Prior to addition, the free artificial nucleic acid molecule or vector is not complexed, and preferably after addition of the adjuvant component, it/it should not undergo any detectable or significant complexation reaction.

Приемлемые адъюванты можно выбирать также из нуклеиновых кислот, имеющих формулу (II): G_lX_mG_n, в которой: G обозначает гуанозин, урацил или аналог гуанозина или урацила; Х обозначает гуанозин, урацил, аденозин, тимидин, цитозин или аналог вышеуказанных нуклеотидов; 1 обозначает целое число от 1 до 40, при этом, когда 1=1, то G представляет собой гуанозин или его аналог, когда 1>1, то по меньшей мере 50% нуклеотидов представляют собой гуанозин или его аналог; m обозначает целое число и обозначает по меньшей мере 3; при этом, когда m=3, то Х представляет собой урацил или его аналог, когда m>3, то по присутствуют меньшей мере 3 последовательно расположенных урацилов или аналогов урацила; n обозначает целое число от 1 до 40, при этом, когда n=1, то G представляет собой гуанозин или его аналог, когда n>1, то по меньшей мере 50% нуклеотидов представляет собой гуанозин или его аналог.Suitable adjuvants can also be selected from nucleic acids having the formula (II): G _l X _m G _n in which: G is guanosine, uracil or an analogue of guanosine or uracil; X is guanosine, uracil, adenosine, thymidine, cytosine, or an analogue of the above nucleotides; 1 denotes an integer from 1 to 40, while when 1=1, then G is guanosine or its analogue, when 1>1, then at least 50% of the nucleotides are guanosine or its analogue; m is an integer and is at least 3; when m=3, then X is uracil or its analogue, when m>3, then there are at least 3 consecutive uracils or analogues of uracil; n denotes an integer from 1 to 40, while when n=1, then G is guanosine or its analogue, when n>1, then at least 50% of the nucleotides is guanosine or its analogue.

Другие приемлемые адъюванты можно выбирать также из нуклеиновых кислот, имеющих формулу (III): C_lX_mC_n, в которой: С обозначает цитозин, урацил или аналог цитозина или урацила; Х обозначает гуанозин, урацил, аденозин, тимидин, цитозин или аналог вышеуказанных нуклеотидов; 1 обозначает целое число от 1 до 40, при этом, когда 1=1, то С представляет собой цитозин или его аналог, когда 1>1, то по меньшей мере 50% нуклеотидов представляют собой цитозин или его аналог; m обозначает целое число и обозначает по меньшей мере 3; когда m=3, Х представляет собой урацил или его аналог, когда m>3, то присутствуют по меньшей мере 3 последовательно расположенных урацила или аналогов урацила; n обозначает целое число от 1 до 40, при этом, когда n=1, то С представляет собой цитозин или его аналог, когда n>1, то по меньшей мере 50% нуклеотидов представляют собой цитозин или его аналог.Other suitable adjuvants can also be selected from nucleic acids having the formula (III): C _l X _m C _n in which: C is cytosine, uracil or analog of cytosine or uracil; X is guanosine, uracil, adenosine, thymidine, cytosine, or an analogue of the above nucleotides; 1 denotes an integer from 1 to 40, while when 1=1, then C is a cytosine or its analogue, when 1>1, then at least 50% of the nucleotides are cytosine or its analogue; m is an integer and is at least 3; when m=3, X is uracil or an analogue thereof; when m>3, then at least 3 consecutive uracil or analogues of uracil are present; n denotes an integer from 1 to 40, while when n=1, then C is a cytosine or its analogue, when n>1, then at least 50% of the nucleotides are cytosine or its analogue.

Предлагаемая в настоящем изобретении фармацевтическая композиция предпочтительно содержит в «безопасном и эффективном количестве» компоненты фармацевтической композиции, прежде всего предлагаемую в изобретении искусственную молекулу нуклеиновой кислоты, вектор и/или клетки, представленные в настоящем описании. В контексте настоящего описания понятие «безопасное и эффективное количество» обозначает количество, достаточное для значимой индукции положительной модификации заболевания или нарушения, указанного в настоящем описании. Однако в то же время «безопасное и эффективное количество» должно быть таким, чтобы избегать серьезных побочных действий и обеспечивать разумное соотношение между преимуществом и риском. Определение этих пределов, как правило, находится в компетенции осуществляющего лечение врача.The pharmaceutical composition according to the present invention preferably contains in a "safe and effective amount" the components of the pharmaceutical composition, especially the artificial nucleic acid molecule according to the invention, the vector and/or the cells presented in the present description. In the context of the present description, the term "safe and effective amount" means an amount sufficient to significantly induce a positive modification of the disease or disorder specified in the present description. However, at the same time, a "safe and effective amount" should be such as to avoid serious side effects and provide a reasonable balance between benefit and risk. The determination of these limits, as a rule, is within the competence of the treating physician.

Следующим объектом настоящего изобретения является искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, предназначенная/предназначенный для применения в качестве лекарственного средства, например, в качестве вакцины (для генетической вакцинации), или в генной терапии.Another object of the present invention is an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention intended/intended for use as a drug, for example, as a vaccine (for genetic vaccination), or in gene therapy.

Искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, наиболее пригодны для любого медицинского применения, в котором используется терапевтическое действие или эффект пептидов, полипептидов или белков, или в котором требуется добавление конкретного пептида или белка. Таким образом, в настоящем изобретении предложены искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, предназначенные для применения при лечении или предупреждении заболеваний или нарушений, поддающихся лечению посредством терапевтического действия или эффекта пептидов, полипептидов или белков, или поддающихся лечению путем добавления пептида, полипептида или белка. Например, искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно применять для лечения или предупреждения генетических заболеваний, аутоиммунных заболеваний, раковых или связанных с опухолью заболеваний, инфекционных заболеваний, хронических заболеваний или т.п., например, путем генетической вакцинации или генной терапии.The artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention are most suitable for any medical application that uses the therapeutic action or effect of peptides, polypeptides or proteins, or in which the addition of a particular peptide or protein is required. Thus, the present invention provides an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention for use in the treatment or prevention of diseases or disorders. treatable by the therapeutic action or effect of the peptides, polypeptides or proteins, or treatable by the addition of a peptide, polypeptide or protein. For example, an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention can be used to treat or prevent genetic diseases, autoimmune diseases, cancer, or related with tumor diseases, infectious diseases, chronic diseases or the like, for example, by genetic vaccination or gene therapy.

В частности, такие терапевтические обработки, польза от которых определяется стабильным и пролонгированным присутствием терапевтических пептидов, полипептидов или белков в организме индивидуума, подлежащего лечению, являются наиболее пригодными в качестве медицинского подхода в контексте настоящего изобретения, поскольку предлагаемый в изобретении 3'-UTR-элемент обеспечивает стабильную и пролонгированную экспрессию пептида или белка, кодируемого предлагаемой в изобретении искусственной молекулой нуклеиновой кислоты или предлагаемым в изобретении вектором. Так, наиболее пригодным медицинским применением искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, вектора, предлагаемого в настоящем изобретении, клетки, предлагаемой в настоящем изобретении, или фармацевтической композиции, предлагаемой в настоящем изобретении, является вакцинация. Таким образом, в настоящем изобретении предложены искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетка, предлагаемая в настоящем изобретении, или фармацевтическая композиция, предлагаемая в настоящем изобретении, для вакцинации индивидуума, предпочтительно млекопитающего, более предпочтительно человека. Предпочтительными видами вакцинации являются вакцинация против инфекционных заболеваний, таких как бактериальные, вызываемые простейшими или вирусные инфекции, и противоопухолевая вакцинация. Такие виды вакцинации можно осуществлять в профилактических или терапевтических целях.In particular, such therapeutic treatments, the benefit of which is determined by the stable and prolonged presence of therapeutic peptides, polypeptides or proteins in the body of the individual to be treated, are most suitable as a medical approach in the context of the present invention, since the inventive 3'-UTR element provides stable and prolonged expression of the peptide or protein encoded by the artificial nucleic acid molecule of the invention or the vector of the invention. Thus, the most suitable medical application of the artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention is vaccination. Thus, the present invention provides an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention for vaccinating a subject, preferably a mammal, more preferably a human. . The preferred types of vaccination are vaccination against infectious diseases such as bacterial, protozoan or viral infections and antitumor vaccination. Such types of vaccination can be carried out for prophylactic or therapeutic purposes.

Можно выбирать ОРС в зависимости от заболевания, подлежащего лечению. Например, открытая рамка считывания может кодировать белок, который требуется поставлять в организм пациента, страдающего от полной потери или по меньшей мере от частичной потери функции белка, например, в организм пациента, страдающего генетическим заболеванием. Кроме того, открытую рамку считывания можно выбирать из ОРС, кодирующих пептид или белок, который оказывает благоприятное действие на заболевание или состояние пациента. Кроме того, открытая рамка считывания может кодировать пептид или белок, который осуществляет понижающую регуляцию патологического сверхпроизводства встречающегося в естественных условиях пептида или белка или элиминацию клеток, патологически экспрессирующих белок или пептид. Такое отсутствие, потеря функции или сверхпроизводство могут иметь место, например, в случае опухоли или неоплазии, при аутоиммунных заболеваниях, аллергиях, инфекциях или хронических заболеваниях, или т.п.Кроме того, открытая рамка считывания может кодировать антиген или иммуноген, например, эпитоп патогена или опухолевого антигена. Так, в предпочтительных вариантах осуществления изобретения искусственная молекула нуклеиновой кислоты или вектор, предлагаемая/предлагаемый в настоящем изобретении, содержит ОРС, кодирующую аминокислотную последовательность, содержащую или состоящую из последовательности антигена или иммуногена, например, эпитопа патогена или опухоль-ассоциированного антигена, 3'-UTR-элемент, указанный выше, и необязательно другие компоненты, такие как поли(А)-последовательность и т.п.You can choose ORS depending on the disease to be treated. For example, the open reading frame may encode a protein that is to be delivered to a patient suffering from a complete loss or at least a partial loss of protein function, such as a patient suffering from a genetic disease. In addition, the open reading frame can be selected from ORFs encoding a peptide or protein that has a beneficial effect on the disease or condition of the patient. In addition, the open reading frame may encode a peptide or protein that down-regulates abnormal overproduction of a naturally occurring peptide or protein, or elimination of cells abnormally expressing the protein or peptide. Such absence, loss of function, or overproduction may occur, for example, in the case of a tumor or neoplasia, in autoimmune diseases, allergies, infections, or chronic diseases, or the like. pathogen or tumor antigen. Thus, in preferred embodiments of the invention, the artificial nucleic acid molecule or vector proposed / proposed in the present invention contains an ORF encoding an amino acid sequence containing or consisting of an antigen or immunogen sequence, for example, a pathogen epitope or tumor-associated antigen, 3'- The UTR element as above, and optionally other components such as a poly(A) sequence, and the like.

В контексте медицинского применения, прежде всего в контексте вакцинации, предпочтительно, чтобы искусственная молекула нуклеиновой кислоты, предлагаемая в настоящем изобретении, представляла собой РНК, предпочтительно мРНК, поскольку ДНК несет риск вызывания иммунного анти-ДНК-ответа и имеет тенденцию к встраиванию в геномную ДНК. Однако в некоторых вариантах осуществления изобретения, например, когда применяют вирусный носитель для доставки, такой как аденовирусный носитель для доставки, для доставки искусственной молекулы нуклеиновой кислоты или вектора, предлагаемой/предлагаемого в настоящем изобретении, например, в контексте различных видов генного терапии, может оказаться желательным, чтобы искусственная молекула нуклеиновой кислоты или вектор представляла/представлял собой молекулу ДНК.In the context of medical applications, especially in the context of vaccination, it is preferable that the artificial nucleic acid molecule of the present invention is RNA, preferably mRNA, since DNA carries the risk of inducing an immune anti-DNA response and tends to be integrated into genomic DNA . However, in some embodiments of the invention, for example, when a viral delivery vehicle, such as an adenoviral delivery vehicle, is used to deliver an artificial nucleic acid molecule or vector of the present invention, for example, in the context of various types of gene therapy, it may be desirably, the artificial nucleic acid molecule or vector is/is a DNA molecule.

Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить орально, парентерально, путем ингаляции с использованием спрея, местно, ректально, интраназально, трансбуккально, вагинально, с использованием имплантированного резервуара или посредством струйной инъекции. В контексте настоящего описания понятие «парентерально» включает методы подкожной, внутривенной, внутримышечной, внутрисуставной, интрасиновиальной, надчревной, внутриоболочечной, внутрипеченочной, осуществляемой в область повреждения, внутричерепной, трансдермальной (чрескожной), внутрикожной, внутрилегочной, внутрибрюшинной, внутрисердечной, внутриартериальной и подъязычной инъекции или инфузии. В предпочтительном варианте осуществления изобретения искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, вводят посредством безыгольной инъекции (например, струйной инъекции).The artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention can be administered orally, parenterally, by inhalation using a spray, topically, rectally, intranasally , buccally, vaginally, using an implanted reservoir, or by bolus injection. In the context of the present description, the term "parenteral" includes the methods of subcutaneous, intravenous, intramuscular, intraarticular, intrasynovial, epigastric, intrathecal, intrahepatic, carried out in the area of damage, intracranial, transdermal (percutaneous), intradermal, intrapulmonary, intraperitoneal, intracardiac, intraarterial and sublingual injection or infusion. In a preferred embodiment, the artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention are administered by needleless injection (e.g., jet injection).

Предпочтительно искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, вводят парентерально, например, путем парентеральной инъекции, более предпочтительно с помощью методов подкожной, внутривенной, внутримышечной, внутрисуставной, интрасиновиальной, надчревной, внутриоболочечной, внутрипеченочной, осуществляемой в область повреждения, внутричерепной, трансдермальной (чрескожной), внутрикожной, внутрилегочной, внутрибрюшинной, внутрисердечной, внутриартериальной и подъязычной инъекции или инфузии. Наиболее предпочтительными являются внутрикожная и внутримышечная инъекции. Стерильные инъекционные формы предлагаемой в изобретении фармацевтической композиции могут представлять собой водную или масляную суспензию. Такие суспензии можно приготавливать с помощью методов, известных в данной области, с применением пригодных диспергирующих или смачивающих средств. Предпочтительно, растворы или суспензии вводят посредством безыгольной инъекции (например, струйной инъекции).Preferably, the artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention are administered parenterally, such as by parenteral injection, more preferably by subcutaneous, intravenous, intramuscular, intraarticular, intrasynovial, epigastric, intrathecal, intrahepatic, carried out in the area of damage, intracranial, transdermal (percutaneous), intradermal, intrapulmonary, intraperitoneal, intracardiac, intraarterial and sublingual injection or infusion. Most preferred are intradermal and intramuscular injections. Sterile injectable forms of the pharmaceutical composition according to the invention may be an aqueous or oily suspension. Such suspensions can be prepared using methods known in the art using suitable dispersing or wetting agents. Preferably, solutions or suspensions are administered by needleless injection (eg, jet injection).

Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить также орально в любой пригодной для орального введения лекарственной форме, включая (но, не ограничиваясь только ими) капсулы, таблетки, водные суспензии или растворы.The artificial nucleic acid molecule of the present invention, the vector of the present invention, the cell of the present invention, or the pharmaceutical composition of the present invention may also be orally administered in any oral dosage form, including (but, not limited to) capsules, tablets, aqueous suspensions or solutions.

Искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно вводить также местно, прежде всего в тех случаях, когда мишень для лечения включает области или органы, легко доступные для местного нанесения, включая, например, заболевания кожи или любой другой доступной эпителиальной ткани. Для каждой из таких областей или органов можно легко приготавливать пригодные для местной обработки композиции. Для местного нанесения искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, можно приготавливать в виде пригодной мази, суспендированной или растворенной в одном или нескольких носителях.An artificial nucleic acid molecule according to the present invention, a vector according to the present invention, a cell according to the present invention, or a pharmaceutical composition according to the present invention can also be administered topically, especially in cases where the target for treatment includes areas or organs readily available for topical application, including, for example, diseases of the skin or any other accessible epithelial tissue. For each of these areas or organs, compositions suitable for topical treatment can be easily prepared. For topical application, an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition of the present invention may be formulated into a suitable ointment suspended or dissolved in one or more carriers.

В одном из вариантов осуществления изобретения применение в качестве лекарственного средства включает стадию трансфекции клеток млекопитающих, предпочтительно трансфекцию in vitro или ex vivo клеток млекопитающих, более предпочтительно трансфекцию in vitro клеток, выделенных из организма пациента, подлежащего лечению лекарственным средством. Если применение включает трансфекцию in vitro выделенных клеток, то применение может предусматривать также повторное введение трансфектированных клеток пациенту. Применение предлагаемых в изобретении искусственных молекул нуклеиновой кислоты или вектора в качестве лекарственного средства может включать также стадию отбора успешно трансфектированных выделенных клеток. Таким образом, может оказаться целесообразным, чтобы вектор содержал также маркер для селекции. Применение в качестве лекарственного средства может включать также трансфекцию in vitro выделенных клеток и очистку продукта экспрессии, т.е. кодируемого пептида или белка из указанных клеток. Этот очищенный пептид или белок можно затем вводить индивидууму, нуждающемуся в этом.In one embodiment, the use as a drug comprises the step of transfecting mammalian cells, preferably in vitro or ex vivo transfection of mammalian cells, more preferably in vitro transfection of cells isolated from the patient to be treated with the drug. If the use involves in vitro transfection of the isolated cells, then the use may also involve reintroduction of the transfected cells into the patient. The use of the artificial nucleic acid molecules or vector according to the invention as a drug may also include the step of selecting successfully transfected isolated cells. Thus, it may be desirable for the vector to also contain a selection marker. Use as a drug may also include in vitro transfection of isolated cells and purification of the expression product, i.e. encoded peptide or protein from said cells. This purified peptide or protein can then be administered to an individual in need thereof.

В настоящем изобретении предложен также способ лечения или предупреждения заболевания или нарушения, указанного выше, заключающийся в том, что вводят искусственную молекулу нуклеиновой кислоты, предлагаемую в настоящем изобретении, вектор, предлагаемый в настоящем изобретении, клетку, предлагаемую в настоящем изобретении, или фармацевтическую композицию, предлагаемую в настоящем изобретении, индивидууму, нуждающемуся в этом.The present invention also provides a method for treating or preventing a disease or disorder as defined above, comprising administering an artificial nucleic acid molecule of the present invention, a vector of the present invention, a cell of the present invention, or a pharmaceutical composition, proposed in the present invention, the individual in need of it.

Кроме того, предложен способ лечения или предупреждения заболевания или нарушения, заключающийся в том, что осуществляют трансфекцию клетки искусственной молекулой нуклеиновой кислоты, предлагаемой в настоящем изобретении, или вектором, предлагаемым в настоящем изобретении. Указанную трансфекцию можно осуществлять in vitro, ex vivo или in vivo. В предпочтительном варианте осуществления изобретения трансфекцию клетки осуществляют in vitro и трансфектированную клетку вводят индивидууму, нуждающемуся в этом, предпочтительно больному человеку. Предпочтительно клетка, которую требуется трансфектировать in vitro, представляет собой клетку, выделенную из организма индивидуума, предпочтительно больного человека. Таким образом, в настоящем изобретении предложен способ лечения, заключающийся в том, что осуществляют стадии, на которых выделяют клетку из организма индивидуума, предпочтительно из организма больного человека, трансфектируют выделенную клетку искусственной нуклеиновой кислотой, предлагаемой в настоящем изобретении, или вектором, предлагаемым в настоящем изобретении, и вводят трансфектированную клетку индивидууму, предпочтительно больному человеку.In addition, a method for treating or preventing a disease or disorder is provided, comprising transfecting a cell with an artificial nucleic acid molecule of the present invention or a vector of the present invention. Said transfection can be carried out in vitro, ex vivo or in vivo. In a preferred embodiment of the invention, the cell is transfected in vitro and the transfected cell is administered to an individual in need thereof, preferably a sick individual. Preferably, the cell to be transfected in vitro is a cell isolated from the body of an individual, preferably a diseased human. Thus, the present invention provides a method of treatment comprising the steps of isolating a cell from an individual, preferably from a sick person, transfecting the isolated cell with an artificial nucleic acid of the present invention or a vector of the present invention. of the invention and administering the transfected cell to an individual, preferably a sick individual.

Способ лечения или предупреждения нарушения, предлагаемый в настоящем изобретении, предпочтительно представляет собой способ вакцинации или способ генной терапии, описанный выше.The method for treating or preventing a disorder according to the present invention is preferably a vaccination method or a gene therapy method as described above.

Как описано выше, предлагаемый в изобретении 3'-UTR-элемент обладает способностью стабилизировать молекулу мРНК и/или усиливать, стабилизировать и/или пролонгировать производство белка с молекулы мРНК. Таким образом, следующий объект настоящего изобретения относится к способу стабилизации молекулы РНК, предпочтительно молекулы мРНК, заключающийся в том, что выполняют стадию, на которой осуществляют ассоциацию молекулы РНК, предпочтительно молекулы мРНК, или вектора, кодирующего молекулу РНК, с 3'-UTR-элементом, содержащим или состоящим из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка, предпочтительно с 3'-UTR-элементом, описанным выше.As described above, the 3'UTR element of the invention has the ability to stabilize an mRNA molecule and/or enhance, stabilize and/or prolong protein production from an mRNA molecule. Thus, a further object of the present invention relates to a method for stabilizing an RNA molecule, preferably an mRNA molecule, comprising the step of associating an RNA molecule, preferably an mRNA molecule, or a vector encoding an RNA molecule, with a 3'-UTR- an element containing or consisting of a nucleotide sequence derived from the 3'UTR of a ribosomal protein gene or from a variant 3'UTR of a ribosomal protein gene, preferably with a 3'UTR element as described above.

Кроме того, настоящее изобретение относится к способу повышения, стабилизации и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты или с вектора, предпочтительно с молекулы мРНК, и/или стабилизации и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты или с вектора, предпочтительно с молекулы мРНК, заключающемуся в том, что выполняют стадию, на которой осуществляют ассоциацию искусственной молекулы нуклеиновой кислоты или вектора, предпочтительно молекулы мРНК, с 3'-UTR-элементом, который содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка, предпочтительно с 3'-UTR-элементом, описанным выше.In addition, the present invention relates to a method for increasing, stabilizing and/or prolonging the production of a protein from an artificial nucleic acid molecule or from a vector, preferably from an mRNA molecule, and/or stabilizing and/or prolonging the production of a protein from an artificial nucleic acid molecule or from a vector, preferably from an mRNA molecule, comprising the step of associating an artificial nucleic acid molecule or vector, preferably an mRNA molecule, with a 3'-UTR element which contains or consists of a nucleotide sequence derived from the 3'-UTR a ribosomal protein gene or from a 3'UTR variant of a ribosomal protein gene, preferably with a 3'UTR element as described above.

Выражение «ассоциация искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом» в контексте настоящего изобретения предпочтительно означает функциональную ассоциацию или функциональное объединение искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом. Это означает, что осуществляют ассоциацию или связывание искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом, предпочтительно 3'-UTR-элементом, описанным выше, таким образом, чтобы осуществлялась функция 3'-UTR-элемента, например, функция стабилизации производства РНК и/или белка. Как правило, это означает, что 3'-UTR-элемент интегрируют в искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно в молекулу мРНК, с 3'-стороны относительно открытой рамки считывания, предпочтительно так, чтобы он непосредственно примыкал с 3'-стороны к открытой рамке считывания, предпочтительно располагался между открытой рамкой считывания и поли(А)-последовательностью или сигналом полиаденилирования. Предпочтительно 3'-UTR-элемент интегрируют в искусственную молекулу нуклеиновой кислоты или вектор, предпочтительно в мРНК, в качестве 3'-UTR, т.е. так, чтобы 3'-UTR-элемент представлял собой 3'-UTR искусственной молекулы нуклеиновой кислоты или вектора, предпочтительно мРНК, т.е. так, чтобы он простирался от 3'-стороны открытой рамки считывания до 5'-стороны поли(А)-последовательности или сигнала полиаденилирования, необязательно был присоединен посредством короткого линкера, такого как последовательность, содержащая или состоящая из одного или нескольких сайтов рестрикции. Таким образом, предпочтительно выражение «ассоциация искусственной молекулы нуклеиновой кислоты или вектора с 3'-UTR-элементом» означает функциональную ассоциацию 3'-UTR-элемента с открытой рамкой считывания, локализованной в искусственной молекуле нуклеиновой кислоты или векторе, предпочтительно в молекуле мРНК. 3'-UTR и ОРС представляют собой конструкции, описанные выше для искусственной молекулы нуклеиновой кислоты, предлагаемой в настоящем изобретении, например, предпочтительно ОРС и 3'-UTR являются гетерологичными, например, происходят из различных генов, как описано выше.The expression "association of an artificial nucleic acid molecule or vector with a 3'UTR element" in the context of the present invention preferably means the functional association or functional association of an artificial nucleic acid molecule or vector with a 3'UTR element. This means that an artificial nucleic acid molecule or vector is associated or linked to a 3'UTR element, preferably the 3'UTR element described above, in such a way that the function of the 3'UTR element is performed, for example, the stabilization function production of RNA and/or protein. Generally, this means that the 3'UTR element is integrated into an artificial nucleic acid molecule or vector, preferably into an mRNA molecule, on the 3' side of the open reading frame, preferably so that it is directly adjacent on the 3' side to open reading frame, preferably located between the open reading frame and the poly(A) sequence or polyadenylation signal. Preferably, the 3'UTR element is integrated into an artificial nucleic acid molecule or vector, preferably mRNA, as a 3'UTR, i. e. such that the 3'UTR element is the 3'UTR of an artificial nucleic acid molecule or vector, preferably mRNA, i. e. such that it extends from the 3' side of the open reading frame to the 5' side of the poly(A) sequence or polyadenylation signal, optionally attached via a short linker, such as a sequence containing or consisting of one or more restriction sites. Thus, preferably, the expression "association of an artificial nucleic acid molecule or vector with a 3'UTR element" means the functional association of a 3'UTR element with an open reading frame located in an artificial nucleic acid molecule or vector, preferably an mRNA molecule. The 3'-UTR and ORF are the constructs described above for the artificial nucleic acid molecule of the present invention, eg, preferably the ORF and 3'-UTR are heterologous, eg are from different genes as described above.

Следующим объектом настоящего изобретения является применение 3'-UTR-элемента, предпочтительно 3'-UTR-элемента, описанного выше, для повышения стабильности молекулы РНК, предпочтительно молекулы мРНК, где 3'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка.Another object of the present invention is the use of a 3'-UTR element, preferably the 3'-UTR element described above, to improve the stability of an RNA molecule, preferably an mRNA molecule, where the 3'-UTR element contains or consists of a nucleotide sequence derived from 3'UTR of a ribosomal protein gene or from a variant 3'UTR of a ribosomal protein gene.

Кроме того, в настоящем изобретении предложено применение 3'-UTR-элемента, предпочтительно 3'-UTR-элемента, описанного выше, для повышения производства белка с искусственной молекулы нуклеиновой кислоты или вектора, предпочтительно с молекулы мРНК, и/или для стабилизации и/или пролонгирования производства белка с искусственной молекулы нуклеиновой кислоты или векторной молекулы, предпочтительно с молекулы мРНК, где 3'-UTR-элемент содержит или состоит из нуклеотидной последовательности, происходящей из 3'-UTR гена рибосомального белка или из варианта 3'-UTR гена рибосомального белка.In addition, the present invention provides the use of a 3'-UTR element, preferably the 3'-UTR element described above, to increase protein production from an artificial nucleic acid molecule or vector, preferably from an mRNA molecule, and/or to stabilize and/ or prolonging protein production from an artificial nucleic acid molecule or a vector molecule, preferably from an mRNA molecule, where the 3'-UTR element contains or consists of a nucleotide sequence derived from the 3'-UTR of a ribosomal protein gene or from a variant of the 3'-UTR of a ribosomal gene squirrel.

Варианты применения, предлагаемые в настоящем изобретении, предпочтительно включают осуществление ассоциации искусственной молекулы нуклеиновой кислоты, вектора или РНК с 3'-UTR-элементом, описанным выше.The uses of the present invention preferably include the association of an artificial nucleic acid molecule, vector or RNA with a 3'UTR element as described above.

Соединения и ингредиенты предлагаемой в изобретении фармацевтической композиции можно также производить и продавать по отдельности друг от друга. Таким образом, изобретение относится также к набору или набору компонентов, содержащему искусственную молекулу нуклеиновой кислоты, предлагаемую в изобретении, вектор, предлагаемый в изобретении, клетку, предлагаемую в изобретении, и/или фармацевтическую композицию, предлагаемую в изобретении. Предпочтительно такой набор или набор компонентов может дополнительно содержать инструкции по применению, клетки для трансфекции, адъювант, средства для введения фармацевтической композиции, фармацевтически приемлемый носитель и/или фармацевтически приемлемый раствор для растворения или разведения искусственной молекулы нуклеиновой кислоты, вектора, клеток или фармацевтической композиции.The compounds and ingredients of the pharmaceutical composition according to the invention can also be produced and sold separately from each other. Thus, the invention also relates to a kit or kit of components comprising an artificial nucleic acid molecule according to the invention, a vector according to the invention, a cell according to the invention, and/or a pharmaceutical composition according to the invention. Preferably, such a kit or set of components may further comprise instructions for use, cells for transfection, an adjuvant, means for administering the pharmaceutical composition, a pharmaceutically acceptable carrier, and/or a pharmaceutically acceptable solution for dissolving or diluting the artificial nucleic acid molecule, vector, cells, or pharmaceutical composition.

Представленные ниже чертежи, последовательности и примеры предназначены для дополнительной иллюстрации изобретения. Они не направлены на ограничение сущности рассматриваемого изобретения.The following drawings, sequences and examples are intended to further illustrate the invention. They are not intended to limit the essence of the invention in question.

На чертежах показано:The drawings show:

На фиг. 1-3 последовательности, кодирующие мРНК, которые можно получать путем транскрипции in vitro. Используются следующие сокращения:In FIG. 1-3 mRNA coding sequences that can be obtained by in vitro transcription. The following abbreviations are used:

rpl32: 5'-UTR человеческого рибосомального белка большой субъединицы 32, в которой отсутствует 5'-концевой олигопиримидиновый тракт;rpl32: 5'-UTR of the human ribosomal protein large subunit 32, which lacks the 5'-terminal oligopyrimidine tract;

PpLuc (GC): последовательность мРНК с высоким содержанием GC (GC-обогащенная), кодирующая люциферазу Photinus pyralis;PpLuc (GC): high GC (GC-rich) mRNA sequence encoding Photinus pyralis luciferase;

• А64: поли(А)-последовательность, содержащая 64 аденилата;• A64: poly(A) sequence containing 64 adenylates;

• ag: центральная, α-комплекс-связывающая часть 3'-UTR человеческого α-глобина;• ag: central, α-complex-binding portion of the 3'-UTR of human α-globin;

• rps9: 3'-UTR-элемент, происходящий из 3'-UTR человеческого рибосомального белка малой субъединицы 9;• rps9: 3'UTR element derived from the 3'UTR of the human ribosomal small subunit protein 9;

• С30: поли(С)-последовательность, содержащая 30 цитидилатов;• C30: poly(C) sequence containing 30 cytidylates;

• гистонSL: последовательность гистоновой структуры типа «стебель-петля», взятая из публикации Cakmakci, Lerner, Wagner, Zheng и William F Marzluff, Mol. Cell. Biol. 28(3), 2008, сс. 1182-1194;• histone SL: histone stem-loop sequence taken from Cakmakci, Lerner, Wagner, Zheng and William F Marzluff, Mol. cell. Biol. 28(3), 2008, pp. 1182-1194;

альбумин: 3'-UTR человеческого альбумина;albumin: 3'-UTR of human albumin;

на фиг. 1 - представлена последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - А64 - С30 - гистонSL (SEQ ID NO: 8);in fig. 1 shows the sequence encoding mRNA rpl32 - PpLuc(GC) - A64 - C30 - histone SL (SEQ ID NO: 8);

на фиг. 2 - представлена последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - ag - А64 - С30 - гистонSL (SEQ ID NO: 9). Центральная, α-комплекс-связывающая часть 3'-UTR человеческого α-глобина встроена между ОРС и поли(А). ОРС PpLuc(GC) выделена курсивом. 3'-UTR-элемент, происходящий из α-глобина, подчеркнут;in fig. 2 shows the sequence encoding mRNA rpl32 - PpLuc(GC) - ag - A64 - C30 - histone SL (SEQ ID NO: 9). The central, α-complex-binding portion of the 3'-UTR of human α-globin is inserted between the ORF and poly(A). The PpLuc(GC) ORF is in italics. The 3'UTR element derived from α-globin is underlined;

на фиг. 3 - последовательность мРНК rpl32 - PpLuc(GC) - rps9 - А64 - С30 - hSL (SEQ ID NO: 7). 3'-UTR человеческого рибосомального белка малой субъединицы 9 встроена между ОРС и поли(А). ОРС PpLuc(GC) выделена курсивом, 3' UTR-элемент, происходящий из rps9, подчеркнут;in fig. 3 - mRNA sequence rpl32 - PpLuc(GC) - rps9 - A64 - C30 - hSL (SEQ ID NO: 7). The 3'UTR of the human ribosomal small subunit protein 9 is inserted between the ORF and poly(A). The PpLuc(GC) ORF is in italics, the 3' UTR element derived from rps9 is underlined;

на фиг. 4 - данные, демонстрирующие, что 3'-UTR рибосомального белка малой субъединицы 9 существенно повышает экспрессию белка с мРНК;in fig. 4 - data demonstrating that the 3'-UTR of the ribosomal protein of the small subunit 9 significantly increases the expression of the protein from mRNA;

Влияние предлагаемой в изобретении 3'-UTR человеческого рибосомального белка малой субъединицы 9 на экспрессию люциферазы с мРНК изучали в сравнении с экспрессией люциферазы с мРНК, в которой отсутствует 3'-UTR или которая содержит 3'-UTR человеческого α-глобина. Для этого различными мРНК трансфектировали путем липофекции человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 6, 24, 48 и 72 ч после трансфекции. Очевидно, что имела место экспрессия люциферазы с мРНК, в которой отсутствовала 3'-UTR. При этом экспрессия люциферазы не возрастала при включении хорошо известной 3'-UTR человеческого α-глобина. В отличие от этого, 3'-UTR рибосомального белка малой субъединицы 9 приводила к существенному повышению экспрессии люциферазы. Данные представлены на графике в виде средней величины для трех трансфекции, выраженной в относительных световых единицах (RLU)±SEM (стандартное отклонение). Результаты измерений в RLU обобщены в примере 5.1;The effect of the inventive human ribosomal small subunit 9 3'UTR on luciferase expression from mRNA was studied in comparison to luciferase expression from mRNA lacking the 3'UTR or containing the 3'UTR of human α-globin. For this, human dermal fibroblasts (HDFs) were transfected with various mRNAs by lipofection. Luciferase levels were measured 6, 24, 48 and 72 hours after transfection. Obviously, there was expression of luciferase with mRNA that lacked the 3'-UTR. At the same time, luciferase expression did not increase when the well-known 3'-UTR of human α-globin was included. In contrast, the 3'-UTR of the small subunit 9 ribosomal protein resulted in a significant increase in luciferase expression. Data are plotted as the average of three transfections expressed in relative light units (RLU)±SEM (standard deviation). The results of measurements in RLU are summarized in Example 5.1;

на фиг. 5 - последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - альбумин - А64 - С30 - гистонSL (SEQ ID NO: 206). 3'-UTR человеческого альбумина встраивали между ОРС и поли(А). OPC PpLuc(GC) выделена курсивом. 3'-UTR-элемент, происходящий из альбумина, подчеркнут;in fig. 5 - sequence encoding mRNA rpl32 - PpLuc(GC) - albumin - A64 - C30 - histone SL (SEQ ID NO: 206). The 3'UTR of human albumin was inserted between the ORF and poly(A). OPC PpLuc(GC) is in italics. The 3' UTR element derived from albumin is underlined;

на фиг. 6 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a повышают экспрессию белка с мРНК в HDF-клетках (человеческие кожные фибробласты) по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698);in fig. 6 - data demonstrating that 3'-UTRs derived from the mouse ribosomal protein genes rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 and rpl23a increase protein expression with mRNA in HDF cells (human skin fibroblasts). ) at least to the same extent as mRNA containing the 3'-UTR of the albumin gene, which has already been shown to increase protein expression from mRNA (WO 2013/143698);

на фиг. 7 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a, повышают экспрессию белка с мРНК в HeLa-клетках по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698);in fig. 7 - data demonstrating that 3'-UTRs derived from the mouse ribosomal protein genes rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 and rpl23a increase mRNA protein expression in HeLa cells at least to the same extent as mRNA containing the 3'-UTR of the albumin gene, which has already been shown to increase protein expression from mRNA (WO 2013/143698);

на фиг. 8 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rpl23, uba52, rpl2211, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38 повышают экспрессию белка с мРНК в HDF-клетках (человеческие кожные фибробласты) по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698);in fig. 8 - data showing that 3'-UTRs derived from the mouse ribosomal protein genes rpl23, uba52, rpl2211, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 and rpl38 upregulates mRNA protein expression in HDF cells (human skin fibroblasts) at least to the same extent as mRNA containing the 3'-UTR of the albumin gene, which has already been shown to increase protein c mRNA expression (WO 2013 /143698);

на фиг. 9 - данные, демонстрирующие, что 3'-UTR, происходящие из генов мышиного рибосомального белка rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38, повышают экспрессию белка с мРНК в HeLa- по меньшей мере в той же степени, что и мРНК, содержащая 3'-UTR гена альбумина, которая, как уже было продемонстрировано, повышает экспрессию белка с мРНК (WO 2013/143698).in fig. 9 - data showing that 3'-UTRs derived from the mouse ribosomal protein genes rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 and rpl38 increase mRNA protein expression in HeLa- at least to the same extent as mRNA containing the 3'-UTR of the albumin gene, which has already been shown to increase protein expression from mRNA (WO 2013/143698).

ПримерыExamples

1. Получение ДНК-матриц1. Obtaining DNA templates

Конструировали вектор для транскрипции in vitro, содержащий промотор Т7 и GC-обогащенную последовательность, кодирующую люциферазу Photinus pyralis (PpLuc(GC)). 5'-нетранслируемую область (5'-UTR) рибосомального белка большой субъединицы 32 встраивали с 5'-стороны относительно PpLuc(GC). Содержащую 64 аденина (А64) поли(А)-последовательность, за которой следовала последовательность, состоящая из 30 цитозинов (С30), и последовательность структуры типа «стебель-петля», встраивали с 3'-стороны относительно PpLuc(GC). За последовательностью структуры типа «стебель-петля» находился сайт рестрикции, который использовали для линеаризации вектора перед осуществлением транскрипции in vitro. мРНК, полученную с этого вектора после транскрипции in vitro обозначили как «rpl32 - PpLuc(GC) - А64 - С30 - гистонSL».A vector for in vitro transcription was constructed containing the T7 promoter and a GC-rich sequence encoding Photinus pyralis luciferase (PpLuc(GC)). The 5'-untranslated region (5'-UTR) of the 32 large subunit ribosomal protein was inserted 5'-side of PpLuc(GC). A 64-adenine (A64) poly(A) sequence followed by a 30-cytosine (C30) sequence and a stem-loop sequence was inserted 3' to PpLuc(GC). Behind the stem-loop sequence was a restriction site that was used to linearize the vector prior to in vitro transcription. The mRNA obtained from this vector after in vitro transcription was designated as "rpl32 - PpLuc(GC) - A64 - C30 - histone SL".

Указанный вектор модифицировали так, чтобы он включал нетранслируемые последовательности с 3'-стороны относительно открытой рамки считывания (3'-UTR). В целом, создавали векторы, которые содержали следующие кодирующие последовательности мРНК (некоторые из кодирующих последовательностей мРНК представлены в качестве примеров на фиг. 1-3):The specified vector was modified so that it included untranslated sequences from the 3'-side relative to the open reading frame (3'-UTR). In general, vectors were created that contained the following mRNA coding sequences (some of the mRNA coding sequences are shown as examples in Figures 1-3):

rpl32 - PpLuc(GC) - А64 - С30 - гистонSL (SEQ ID NO: 8, фиг. 1);rpl32 - PpLuc(GC) - A64 - C30 - histone SL (SEQ ID NO: 8, Fig. 1);

rpl32 - PpLuc(GC) - ag - А64 - С30 - гистонSL (SEQ ID NO: 9, фиг. 2);rpl32 - PpLuc(GC) - ag - A64 - C30 - histone SL (SEQ ID NO: 9, Fig. 2);

rpl32 - PpLuc(GC) - rps9 - А64 - С30 - гистонSL (SEQ ID NO: 7, фиг. 3);rpl32 - PpLuc(GC) - rps9 - A64 - C30 - histone SL (SEQ ID NO: 7, Fig. 3);

rpl32 - PpLuc(GC) - rps21 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps21 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rps29 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps29 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rps9 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps9 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rps27 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps27 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rps28 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps28 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rps19 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rps19 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl35a - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rpl35a - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl13 - А64 - С30 - гистонSL;rpl32 - PpLuc(GC) - rpl13 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl36 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl36 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl23a - A64 - C30 гистонSL;rpl32 - PpLuc(GC) - rpl23a - A64 - C30 histone SL;

rpl32 - PpLuc(GC) - rpl23 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl23 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - uba52 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - uba52 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl22l1 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl22l1 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl36a - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl36a - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rps4x - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps4x - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl27 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl27 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl3 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl3 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rps23 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps23 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rps13 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps13 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl26 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl26 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rps17 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps17 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rps18 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rps18 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - Fau - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - Fau - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl11 - A64 - C30 - гистонSL;rpl32 - PpLuc(GC) - rpl11 - A64 - C30 - histone SL;

rpl32 - PpLuc(GC) - rpl38 - A64 - C30 - гистонSL.rpl32 - PpLuc(GC) - rpl38 - A64 - C30 - histone SL.

2. Транскрипция in vitro2. Transcription in vitro

ДНК-матрицу, полученную согласно методу, описанному в примере 1, линеаризовали и транскрибировали in vitro с использованием Т7-РНК-полимеразы. Затем ДНК-матрицу расщепляли путем обработки ДНКазой. мРНК-транскрипты, содержащие 5'-кэп-структуру, получали путем добавления избытка N7-метил-гуанозин-5'-триптофосфат-5'-гуанозина в реакционную смесь для транскрипции. Полученную в результате этого мРНК очищали и ресуспендировали в воде.The template DNA prepared according to the method described in Example 1 was linearized and transcribed in vitro using T7 RNA polymerase. The template DNA was then digested by treatment with DNase. mRNA transcripts containing the 5' cap structure were generated by adding an excess of N7-methyl-guanosine-5'-tryptophosphate-5'-guanosine to the transcription reaction mixture. The resulting mRNA was purified and resuspended in water.

3. Экспрессия люциферазы после липофекции мРНК3. Luciferase expression after mRNA lipofection

Человеческие кожные фибробласты (HDF) или HeLa-клетки высевали в 24-луночные планшеты за три дня до трансфекции с плотностью 3×10⁴ клеток на лунку в среду (среда RPMI 1640, содержащая L-глутамин и 25 мМ Hepes (фирма Lonza, Базель, Швейцария), в которую добавляли 10% FCS, 1% Pen/Strep, 1% глутамина). Непосредственно перед осуществлением липофекции клетки промывали в среде Opti-MEM. Клетки подвергали липофекции с использованием 25 нг мРНК, кодирующей PpLuc, на лунку, включенной в комплекс с липофектамином 2000. Для контроля эффективности трансфекции наряду с мРНК PpLuc (2,5 нг мРНК RrLuc на лунку) осуществляли трансфекцию мРНК, кодирующей люциферазу Renilla reniformis (RrLuc). Через 90 мин после начала трансфекции среду заменяли на Opti-MEM. Через 6, 24, 48 и 72 ч после трансфекции среду удаляли путем аспирации и клетки лизировали в 100 мкл буфера для лизиса (буфер для пассивного лизиса, фирма Promega). Лизаты хранили при -80° до осуществления измерений люциферазной активности.Human dermal fibroblasts (HDF) or HeLa cells were seeded in 24-well plates three days prior to transfection at a density of 3×10 ⁴ cells per well on medium (RPMI 1640 medium containing L-glutamine and 25 mM Hepes (Lonza, Basel , Switzerland) supplemented with 10% FCS, 1% Pen/Strep, 1% glutamine). Immediately prior to lipofection, the cells were washed in Opti-MEM medium. Cells were lipofected with 25 ng mRNA encoding PpLuc per well, included in the complex with Lipofectamine 2000. To control the efficiency of transfection, along with mRNA PpLuc (2.5 ng mRNA RrLuc per well), mRNA encoding Renilla reniformis luciferase (RrLuc ). 90 min after the start of transfection, the medium was replaced with Opti-MEM. At 6, 24, 48 and 72 hours after transfection, the medium was removed by aspiration and the cells were lysed in 100 μl of lysis buffer (passive lysis buffer, Promega). The lysates were stored at -80° until the measurement of luciferase activity.

4. Измерение люциферазы4. Measurement of luciferase

Люциферазную активность измеряли в относительных световых единицах (RLU) с помощью ридера для планшетов Hidex Chameleon. Активность PpLuc измеряли в течение периода измерения, составлявшего 2 с, с использованием 20 мкл лизата и 50 мкл содержащего люциферин буфера (буфер Beetle-Juice, фирма PJK GmbH). Активность RrLuc измеряли в течение периода измерения, составлявшего 2 с, с использованием 20 мкл лизата и 50 мкл содержащего коэлентеразин буфера (буфер Renilla-Juice, фирма PJK GmbH).Luciferase activity was measured in relative light units (RLU) using a Hidex Chameleon plate reader. PpLuc activity was measured over a 2 second measurement period using 20 μl of lysate and 50 μl of luciferin-containing buffer (Beetle-Juice buffer, PJK GmbH). RrLuc activity was measured over a 2 second measurement period using 20 μl of lysate and 50 μl of buffer containing coelenterazine (Renilla-Juice buffer, PJK GmbH).

5. Результаты5. Results

5.1 3'-UTR генов рибосомального белка повышает экспрессию белка.5.1 The 3'-UTR of ribosomal protein genes increases protein expression.

Для изучения воздействия 3'-UTR генов рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК либо не содержали 3'-UTR, либо содержали центральную связывающую а-комплекс часть 3'-UTR человеческого α-глобина (ag), либо содержали 3'-UTR человеческого рибосомального белка малой субъединицы 9 (rps9). мРНК, кодирующими люциферазу, трансфектировали человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 6, 24, 48 и 72 ч после трансфекции. На основе этих данных рассчитывали общее количество экспрессированного белка в течение периода времени с 0 до 72 ч в виде площади под кривой (AUC) (см. представленную ниже таблицу 1 и фиг. 4).To study the effect of the 3'-UTR of ribosomal protein genes on protein expression from mRNA, mRNAs containing various UTRs were synthesized: mRNA either did not contain the 3'-UTR or contained the central α-complex-binding portion of the 3'-UTR of human α-globin (ag ) or contained the 3'-UTR of the human ribosomal small subunit protein 9 (rps9). mRNAs encoding luciferase were transfected into human dermal fibroblasts (HDF). Luciferase levels were measured 6, 24, 48 and 72 hours after transfection. Based on these data, the total amount of protein expressed over a period of time from 0 to 72 hours was calculated as area under the curve (AUC) (see Table 1 below and FIG. 4).

Очевидно, что имела место экспрессия люциферазы с мРНК, в которой отсутствует 3'-UTR. При этом экспрессия люциферазы не повышалась при наличии хорошо известной 3'-UTR α-глобина. В отличие от этого, 3'-UTR рибосомального белка малой субъединицы 9 существенно повышала экспрессию люциферазы.Clearly, luciferase was expressed with mRNA lacking the 3'-UTR. However, luciferase expression was not increased in the presence of the well-known α-globin 3'-UTR. In contrast, the 3'-UTR of the small subunit 9 ribosomal protein significantly increased luciferase expression.

5.2 3'-UTR генов мышиного рибосомального белка повышают экспрессию белка.5.2 The 3'-UTRs of mouse ribosomal protein genes increase protein expression.

Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a) и для сравнения 3'-UTR альбумина, которая, как известно, повышает экспрессию белка с мРНК (WO 2013/143698). мРНК, кодирующими люциферазу, трансфектировали человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 2 и фиг. 6).To study the effect of the 3'-UTR of mouse ribosomal protein genes on protein expression from mRNA, mRNAs containing various UTRs were synthesized: mRNAs containing 3'-UTRs of various mouse ribosomal proteins (rps21, rps29, rps9, rps27, rpl13, rpl36 and rpl23a) and for comparison the 3'-UTR of albumin, which is known to increase protein expression from mRNA (WO 2013/143698). mRNAs encoding luciferase were transfected into human dermal fibroblasts (HDF). Luciferase levels were measured 24, 48 and 72 hours after transfection (see Table 2 below and FIG. 6).

Результаты свидетельствуют о том, что с мРНК, содержащей 3'-UTR мышиных рибосомальных белков, люцифераза экспрессировалась в больших количествах, чем с мРНК, содержащей 3'-UTR альбумина, которая, как было описано, повышает производство белка.The results indicate that mRNA containing the 3'-UTR of mouse ribosomal proteins expressed luciferase in greater amounts than mRNA containing the 3'-UTR of albumin, which has been described to increase protein production.

5.3 3'-UTR генов мышиного рибосомального белка повышает экспрессию белка.5.3 The 3'-UTR of the mouse ribosomal protein genes increases protein expression.

Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rps21, rps29, rps9, rps27, rps28, rps19, rpl35a, rpl13, rpl36 и rpl23a) и для сравнения 3'-UTR альбумина. мРНК, кодирующими люциферазу, трансфектировали HeLa-клетки. Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 3 и фиг. 7).To study the effect of the 3'-UTR of mouse ribosomal protein genes on protein expression from mRNA, mRNAs containing various UTRs were synthesized: mRNAs containing 3'-UTRs of various mouse ribosomal proteins (rps21, rps29, rps9, rps27, rpl13, rpl36 and rpl23a) and, for comparison, albumin 3'-UTR. mRNAs encoding luciferase were transfected into HeLa cells. Luciferase levels were measured 24, 48 and 72 hours after transfection (see Table 3 below and Figure 7).

5.4 3'-UTR генов мышиного рибосомального белка повышает экспрессию белка.5.4 The 3'-UTR of the mouse ribosomal protein genes increases protein expression.

Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rpl23, uba52, rpl2211, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38) и для сравнения 3'-UTR альбумина. мРНК, кодирующими люциферазу, трансфектировали человеческие кожные фибробласты (HDF). Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 4 и фиг. 8).To study the effect of the 3'-UTR of mouse ribosomal protein genes on protein expression from mRNA, mRNAs containing various UTRs were synthesized: mRNAs containing 3'-UTRs of various mouse ribosomal proteins (rpl23, uba52, rpl2211, rpl36a, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 and rpl38) and albumin 3'-UTR for comparison. mRNAs encoding luciferase were transfected into human dermal fibroblasts (HDF). Luciferase levels were measured 24, 48 and 72 hours after transfection (see Table 4 below and FIG. 8).

5.5 3'-UTR генов мышиного рибосомального белка повышает экспрессию белка.The 5.5 3'-UTR of the mouse ribosomal protein genes increases protein expression.

Для изучения воздействия 3'-UTR генов мышиного рибосомального белка на экспрессию белка с мРНК, синтезировали мРНК, содержащие различные UTR: мРНК, содержащие 3'-UTR различных мышиных рибосомальных белков (rpl23, uba52, rpl22l1, rpl36a, rps4x, rpl27, rpl3, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 и rpl38) и для сравнения 3'-UTR альбумина. мРНК, кодирующими люциферазу, трансфектировали HeLa-клетки. Уровни люциферазы измеряли через 24, 48 и 72 ч после трансфекции (см. представленную ниже таблицу 5 и фиг. 9).To study the effect of the 3'-UTR of mouse ribosomal protein genes on protein expression from mRNA, mRNAs containing various UTRs were synthesized: mRNAs containing 3'-UTRs of various mouse ribosomal proteins (rpl23, uba52, rpl22l1, rpl36a, rps23, rps13, rpl26, rps17, rps18, rps8, Fau, rps13, rpl11 and rpl38) and albumin 3'-UTR for comparison. mRNAs encoding luciferase were transfected into HeLa cells. Luciferase levels were measured 24, 48 and 72 hours after transfection (see Table 5 below and Figure 9).

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙSEQUENCE LIST

<110> КуреВак ГмбХ<110> KureWack GmbH

<120> Искусственные молекулы нуклеиновой кислоты<120> Artificial nucleic acid molecules

<130> CU01P155WO1<130> CU01P155WO1

<160> 206 <160> 206

<170> PatentIn, версия 3.5<170> PatentIn version 3.5

<210> 1<210> 1

<211> 70<211> 70

<212> ДНК<212> DNA

<213> Искусственная последовательность<213> Artificial sequence

<220><220>

<223> 3-UTR-элемент рибосомального белка S9 (RPS9) Homo sapiens<223> Homo sapiens ribosomal protein S9 (RPS9) 3-UTR element

<400> 1<400> 1

gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60gtccacctgt ccctcctggg ctgctggatt gtctcgtttt cctgccaaat aaacaggatc 60

agcgctttac 70agcgctttac 70

<210> 2<210> 2

<211> 70<211> 70

<212> РНК<212> RNA

<220><220>

<400> 2<400> 2

guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60guccaccugu cccuccuggg cugcuggauu gucucguuuu ccugccaaau aaacaggauc 60

agcgcuuuac 70agcgcuuuac 70

<210> 3<210> 3

<211> 140<211> 140

<212> ДНК<212> DNA

<220><220>

<223> 3-UTR-элемент рибосомального белка S9 (RPS9) Homo sapiens + поли-А<223> Homo sapiens 3-UTR element of ribosomal protein S9 (RPS9) + poly-A

<400> 3<400> 3

agcgctttac agatctaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa

aaaaaaaaaa aaaaaaaaaa 140aaaaaaaaaaaaaaaaaaaa 140

<210> 4<210> 4

<211> 140<211> 140

<212> РНК<212> RNA

<220><220>

<400> 4<400> 4

agcgcuuuac agaucuaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 120aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa

aaaaaaaaaa aaaaaaaaaa 140aaaaaaaaaaaaaaaaaaaa 140

<210> 5<210> 5

<211> 24<211> 24

<212> ДНК<212> DNA

<220><220>

<223> наиболее предпочтительная последовательность гистоновой структуры типа<223> the most preferred sequence of histone structure type

«стебель-петля» "stem-loop"

<400> 5<400> 5

caaaggctct tttcagagcc acca 24caaaggctct tttcagagcc acca 24

<210> 6<210> 6

<211> 42<211> 42

<212> ДНК<212> DNA

<220><220>

<223> 5-UTR человеческого рибосомального белка большой субъединицы 32 без<223> 5-UTR of human ribosomal large subunit protein 32 without

5-концевого олигопиримидинового тракта 5-terminal oligopyrimidine tract

<400> 6<400> 6

ggcgctgcct acggaggtgg cagccatctc cttctcggca tc 42ggcgctgcct acggaggtgg cagccatctc cttctcggca tc 42

<210> 7<210> 7

<211> 1918<211> 1918

<212> ДНК<212> DNA

<220><220>

<223> rpl32 PpLuc(GC) rps9 A64 C30 гистонSL<223> rpl32 PpLuc(GC) rps9 A64 C30 histoneSL

<400> 7<400> 7

ggggcgctgc ctacggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60ggggcgctgc ctacgggaggt ggcagccatc tccttctcgg catcaagctt gaggatggag 60

gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120gacgccaaga acatcaagaa gggcccggcg cccttctacc cgctggagga cgggaccgcc 120

ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccgggcac gatcgccttc 180ggcgagcagc tccacaaggc catgaagcgg tacgccctgg tgccggggcac gatcgccttc 180

accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240accgacgccc acatcgaggt cgacatcacc tacgcggagt acttcgagat gagcgtgcgc 240

ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300ctggccgagg ccatgaagcg gtacggcctg aacaccaacc accggatcgt ggtgtgctcg 300

gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360gagaacagcc tgcagttctt catgccggtg ctgggcgccc tcttcatcgg cgtggccgtc 360

gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420gccccggcga acgacatcta caacgagcgg gagctgctga acagcatggg gatcagccag 420

ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480ccgaccgtgg tgttcgtgag caagaagggc ctgcagaaga tcctgaacgt gcagaagaag 480

ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540ctgcccatca tccagaagat catcatcatg gacagcaaga ccgactacca gggcttccag 540

tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600tcgatgtaca cgttcgtgac cagccacctc ccgccgggct tcaacgagta cgacttcgtc 600

ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660ccggagagct tcgaccggga caagaccatc gccctgatca tgaacagcag cggcagcacc 660

ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720ggcctgccga agggggtggc cctgccgcac cggaccgcct gcgtgcgctt ctcgcacgcc 720

cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780cgggacccca tcttcggcaa ccagatcatc ccggacaccg ccatcctgag cgtggtgccg 780

ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840ttccaccacg gcttcggcat gttcacgacc ctgggctacc tcatctgcgg cttccgggtg 840

gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900gtcctgatgt accggttcga ggaggagctg ttcctgcgga gcctgcagga ctacaagatc 900

cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960cagagcgcgc tgctcgtgcc gaccctgttc agcttcttcg ccaagagcac cctgatcgac 960

aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020aagtacgacc tgtcgaacct gcacgagatc gccagcgggg gcgccccgct gagcaaggag 1020

gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 10801080

accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140accgagacca cgagcgcgat cctgatcacc cccgaggggg acgacaagcc gggcgccgtg 1140

ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200ggcaaggtgg tcccgttctt cgaggccaag gtggtggacc tggacaccgg caagaccctg 1200

ggcgtgaacc agcggggcga gctgtgcgtg cgggggccga tgatcatgag cggctacgtg 1260ggcgtgaacc agcggggcga gctgtgcgtg cggggggccga tgatcatgag cggctacgtg 1260

aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320aacaacccgg aggccaccaa cgccctcatc gacaaggacg gctggctgca cagcggcgac 1320

atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380atcgcctact gggacgagga cgagcacttc ttcatcgtcg accggctgaa gtcgctgatc 1380

aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 14401440

aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500aacatcttcg acgccggcgt ggccgggctg ccggacgacg acgccggcga gctgccggcc 1500

gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560gcggtggtgg tgctggagca cggcaagacc atgacggaga aggagatcgt cgactacgtg 1560

gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620gccagccagg tgaccaccgc caagaagctg cggggcggcg tggtgttcgt ggacgaggtc 1620

ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680ccgaagggcc tgaccgggaa gctcgacgcc cggaagatcc gcgagatcct gatcaaggcc 1680

aagaagggcg gcaagatcgc cgtgtaagac tagtgtccac ctgtccctcc tgggctgctg 1740aagaagggcg gcaagatcgc cgtgtaagac tagtgtccac ctgtccctcc tgggctgctg 1740

gattgtctcg ttttcctgcc aaataaacag gatcagcgct ttacagatct aaaaaaaaaa 1800gattgtctcg ttttcctgcc 1800

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc 18601860

cccccccccc cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1918cccccccccc cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1918

<210> 8<210> 8

<211> 1848<211> 1848

<212> ДНК<212> DNA

<220><220>

<223> rpl32 PpLuc(GC) A64 C30 гистонSL<223> rpl32 PpLuc(GC) A64 C30 histoneSL

<400> 8<400> 8

gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 10801080

aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 14401440

aagaagggcg gcaagatcgc cgtgtaagac tagtagatct aaaaaaaaaa aaaaaaaaaa 1740aagaagggcg gcaagatcgc cgtgtaagac tagtagatct aaaaaaaaaa aaaaaaaaaa 1740

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc cccccccccc 1800aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaatgcatc cccccccccc 1800

cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1848cccccccccc cccccccccc aaaggctctt ttcagagcca ccagaatt 1848

<210> 9<210> 9

<211> 1914<211> 1914

<212> ДНК<212> DNA

<220><220>

<223> rpl32 PpLuc(GC) ag A64 C30 гистонSL<223> rpl32 PpLuc(GC) ag A64 C30 histoneSL

<400> 9<400> 9

gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 10801080

aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 14401440

aagaagggcg gcaagatcgc cgtgtaagac tagttataag actgactagc ccgatgggcc 1740aagaagggcg gcaagatcgc cgtgtaagac tagttataag actgactagc ccgatgggcc 1740

tcccaacggg ccctcctccc ctccttgcac cgagattaat agatctaaaa aaaaaaaaaa 1800tcccaacggg ccctcctccc ctccttgcac cgagattaat agatctaaaa aaaaaaaaaa 1800

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa tgcatccccc 18601860

cccccccccc cccccccccc ccccccaaag gctcttttca gagccaccag aatt 1914cccccccccc cccccccccc ccccccaaag gctcttttca gagccaccag aatt 1914

<210> 10<210> 10

<211> 109<211> 109

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 10<400> 10

gatctaagag ttacctggct acagaaagaa gatgccagat gacacttaag acctacttgt 60gatctaagag ttacctggct acagaaagaa gatgccagat gacacttaag acctacttgt 60

gatatttaaa tgatgcaata aaagacctat tgatttggac cttcttctt 109gatatttaaa tgatgcaata aaagacctat tgatttggac cttcttctt 109

<210> 11<210> 11

<211> 57<211> 57

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 11<400> 11

tgccaggaac agattttgca gttggtgggg tctcaataaa agttattttc cactgac 57tgccaggaac agattttgca gttggtgggg tctcaataaa agttatttttc cactgac 57

<210> 12<210> 12

<211> 91<211> 91

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 12<400> 12

actcttaaat ttgattattc cataaaggtc aaatcatttt ggacagcttc ttttgaataa 60actcttaaat ttgattattc cataaaggtc aaatcatttt ggacagcttc ttttgaataa 60

agacctgatt atacaggcag tgagaaacat g 91agacctgatt atacaggcag tgagaaacat g 91

<210> 13<210> 13

<211> 58<211> 58

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 13<400> 13

acccagcaat tttctatgat tttttcagat atagataata aacttatgaa cagcaact 58acccagcaat tttctatgat tttttcagat atagataata aacttatgaa cagcaact 58

<210> 14<210> 14

<211> 33<211> 33

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 14<400> 14

atgtcttaag aacctaatta aatagctgac tac 33atgtcttaag aacctaatta aatagctgac tac 33

<210> 15<210> 15

<211> 67<211> 67

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 15<400> 15

ggtgtctacc atgattattt ttctaagctg gttggttaat aaacagtacc tgctctcaaa 60ggtgtctacc atgattattt ttctaagctg gttggttaat aaacagtacc tgctctcaaa 60

ttgaaat 67ttgaaat 67

<210> 16<210> 16

<211> 59<211> 59

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 16<400> 16

atgtacactg ttgagttttc tgtacataaa aataattgaa ataatacaaa ttttccttc 59atgtacactg ttgagttttc tgtacataaa aataattgaa ataatacaaa ttttccttc 59

<210> 17<210> 17

<211> 50<211> 50

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 17<400> 17

attcccgttt ctatccaaaa gagcaataaa aagttttcag tgaaatgtgc 50attcccgttt ctatccaaaa gagcaataaa aagttttcag tgaaatgtgc 50

<210> 18<210> 18

<211> 46<211> 46

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 18<400> 18

gcacaaagga aaacatttca ataaaggatc atttgacaac tggtgg 46gcacaaagga aaacatttca ataaaggatc atttgacaac tggtgg 46

<210> 19<210> 19

<211> 3787<211> 3787

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 19<400> 19

agccctcctg gggacttgga atcagtcggc agtcatgctg ggtctccacg tggtgtgttt 60agccctcctg gggacttgga atcagtcggc agtcatgctg ggtctccacg tggtgtgttt 60

cgtgggaaca actgggcctg ggatggggct tcactgctgt gacttcctcc tgccagggga 120cgtgggaaca actgggcctg ggatggggct tcactgctgt gacttcctcc tgccagggga 120

tttggggctt tcttgaaaga cagtccaagc cctggataat gctttacttt ctgtgttgaa 180tttggggctt tcttgaaaga cagtccaagc cctggataat gctttacttt ctgtgttgaa 180

gcactgttgg ttgtttggtt agtgactgat gtaaaacggt tttcttgtgg ggaggttaca 240gcactgttgg ttgtttggtt agtgactgat gtaaaacggt tttcttgtgg ggaggttaca 240

gaggctgact tcagagtgga cttgtgtttt ttctttttaa agaggcaagg ttgggctggt 300gaggctgact tcagagtgga cttgtgtttt ttctttttaa agaggcaagg ttgggctggt 300

gctcacagct gtaatcccag cactttgagg ttggctggga gttcaagacc agcctggcca 360gctcacagct gtaatcccag cactttgagg ttggctggga gttcaagacc agcctggcca 360

acatgtcaga actactaaaa ataaagaaat cagccatgct tggtgctgca cacttgtagt 420acatgtcaga actactaaaa ataaagaaat cagccatgct tggtgctgca cacttgtagt 420

tgcagctcct gggaggcaga ggtgagggat cacttaaccc aggaggcaga ggctgcactg 480tgcagctcct gggaggcaga ggtgagggat cacttaaccc aggaggcaga ggctgcactg 480

agccaggatc acgccactgc actctagcct gggcaacagt gagactgtct caaaaaaaaa 540agccaggatc acgccactgc actctagcct gggcaacagt gagactgtct caaaaaaaaa 540

aaaagagaca gggtcttcgg cacccaggct ggagtacagt gccacaatca tggctcactg 600aaaagagaca gggtcttcgg cacccaggct ggagtacagt gccacaatca tggctcactg 600

cagtcttgaa ctcatggcct caagcagtcc tccctcagcc tcccaagtag aggggtttat 660cagtcttgaa ctcatggcct caagcagtcc tccctcagcc tcccaagtag aggggtttat 660

aggcacgaga ccctgcaccc aacctagagt tgcctttttt aagcaaagca gtttctagtt 720aggcacgaga ccctgcaccc aacctagagt tgcctttttt aagcaaagca gtttctagtt 720

aatgtagcat cttggacttt ggggcgtcat tcttaagctt gttgtgcccg gtaaccatgg 780aatgtagcat cttggacttt ggggcgtcat tcttaagctt gttgtgcccg gtaaccatgg 780

tcctcttgct ctgattaacc cttccttcaa tgggcttctt cacccagaca ccaaggtatg 840tcctcttgct ctgattaacc cttccttcaa tgggcttctt cacccagaca ccaaggtatg 840

agatggccct gccaagtgtc ggcctctcct gttaaacaaa aacattctaa agccattgtt 900agatggccct gccaagtgtc ggcctctcct gttaaacaaa aacattctaa agccattgtt 900

cttgcttcat ggacaagagg cagccagaga gagtgccagg gtgccctggt ctgagctggc 960cttgcttcat ggacaagagg cagccagaga gagtgccagg gtgccctggt ctgagctggc 960

atccccatgt cttctgtgtc cgagggcagc atggtttctc gtgcagtgct cagacacagc 1020atccccatgt cttctgtgtc cgagggcagc atggtttctc gtgcagtgct cagacacagc 1020

ctgccctagt cctaccagct cacagcagca cctgctctcc ttggcagcta tggccatgac 1080ctgccctagt cctaccagct cacagcagca cctgctctcc ttggcagcta tggccatgac 1080

aaccccagag aagcagcttc agggaccgag tcagattctg ttttgtctac atgcctctgc 1140aacccgag aagcagcttc agggaccgag tcagattctg ttttgtctac atgcctctgc 1140

cgggtgccgg tattgaggca cccagggagc tgttactggc gtggaaatag gtgatgctgc 1200cgggtgccgg tattgaggca cccagggagc tgttactggc gtggaaatag gtgatgctgc 1200

tacctctgct gctgcactca cagccacact tgatacacga tgacaccttg cttgtttgga 12601260

aacatctaaa catctagtag atgacttgca ggctgttggc taccagtttc ctgtctgagg 1320aacatctaaa catctagtag atgacttgca ggctgttggc taccagtttc ctgtctgagg 1320

tgtatatgtt aacttcgtga tcagtttgta tgtttgggac tcttgtccta tgtaaagtta 13801380

aggtgggccg ggtgcagtgg ctcacgcctg taatcctaac actgggaggc cgaggcgggt 1440aggtggggccg ggtgcagtgg ctcacgcctg taatcctaac actgggaggc cgaggcgggt 1440

ggatcacctg atggtgaaac ctcatctcta ctgaaaatac aaaaattagc tgagtggtga 1500ggatcacctg atggtgaaac ctcatctcta ctgaaaatac aaaaattagc tgagtggtga 1500

cacacgcctg taatcccagc tacttggtag gcttgaaccc aggaggcaga gattgcagtg 1560cacacgcctg taatcccagc tacttggtag gcttgaaccc aggaggcaga gattgcagtg 1560

agccgagctg caccactgtg ctccagcctg ggtgacagcg agactcagtc tcaaaaaaag 1620agccgagctg caccactgtg ctccagcctg ggtgacagcg agactcagtc tcaaaaaaag 1620

ttgtacaagg tggatggttg gaagcttgag cctaggctcg aatccctctc acgtgagagg 1680ttgtacaagg tggatggttg gaagcttgag cctaggctcg aatccctctc acgtgagagg 1680

gcctgaagat ttctggtgga ttccaacctg gctgaagact ggccgtgggg ggtgcagggg 1740gcctgaagat ttctggtgga ttccaacctg gctgaagact ggccgtgggg ggtgcagggg 1740

tctccagcgc tctgccctcc agcctgcttc ctccctgccc acaccgcact aggggaaggg 1800tctccagcgc tctgccctcc agcctgcttc ctccctgccc acaccgcact aggggaaggg 1800

cctttcctgc tgcctgcggg gccgcacctg gagtaggtaa tgccatgtgg tgacgtgaat 1860cctttcctgc tgcctgcggg gccgcacctg gagtaggtaa tgccatgtgg tgacgtgaat 1860

ggagcagagg tctgtgcccc atcacaccgc cttgctgttt ttactgtggg acaaaagcac 1920ggagcagagg tctgtgcccc atcacaccgc cttgctgttt ttactgtggg acaaaagcac 1920

tctgatctgc gtgttccggg ggccctccta ccagccgact tgacgggaag tcagggttca 1980tctgatctgc gtgttccggg ggccctccta ccagccgact tgacgggaag tcagggttca 1980

ggtatcatct gtgcacctgg ggcggggtag tctgcactga acctgccaga gtcccctcct 2040ggtatcatct gtgcacctgg ggcggggtag tctgcactga acctgccaga gtcccctcct 2040

catttcactg aaagtcacag tctccagggc tgtgttgcta accttacgtt ctctccgttt 2100catttcactg aaagtcacag tctccagggc tgtgttgcta accttacgtt ctctccgttt 2100

gcttaatcta ttaagagccc taacaggaga ggatgggctt tctctgttgt ctggggccct 21602160

gctgttggcc ggtgctctta gcaagaggtc atttttctag gttgcgctgg gacattgtga 2220gctgttggcc ggtgctctta gcaagaggtc atttttctag gttgcgctgg gacattgtga 2220

gtttggtgag ggtcatggat gtgggctggg ctgggctggg ctgggccggg ctgcctgctg 2280gtttggtgag ggtcatggat gtgggctggg ctgggctggg ctgggccggg ctgcctgctg 2280

cctgctgctc ccctacctga aatgcagcta gtgcggctct gcccttcctg gggctgagga 2340cctgctgctc ccctacctga aatgcagcta gtgcggctct gcccttcctg gggctgagga 2340

aggcttctgc aggatagctg gggggctggg caggtgggtg aggcagcctc cctgctgaca 2400aggcttctgc aggatagctg gggggctggg caggtggggtg aggcagcctc cctgctgaca 2400

ctcagtcctt gtagctggag caagatctcc tgatccaggt acgggcctgt ctgctccaag 2460ctcagtcctt gtagctggag caagatctcc tgatccaggt acgggcctgt ctgctccaag 2460

aaagactctg ccaccagatg caaaggggcc ctttgtttta acttagtccc tggggaccgc 2520aaagactctg ccaccagatg caaaggggcc ctttgtttta acttagtccc tggggaccgc 2520

ctgattcagc acctgtcggc ccaggatacc ccgctggtgg ggacaagtgc ctgagtgtgg 2580ctgattcagc acctgtcggc ccaggatacc ccgctggtgg ggacaagtgc ctgagtgtgg 2580

gccgtgcccg agtgtggcca tccctgagtg gggccgtcct gactaggaag tggcttttca 2640gccgtgcccg agtgtggcca tccctgagtg gggccgtcct gactaggaag tggcttttca 2640

gttgtgatgt gtgggcctga cctagggggc gctgtggaac ccgggctgga accagccctc 2700gttgtgatgt gtgggcctga cctagggggc gctgtggaac ccggggctgga accagccctc 2700

tgtgccaggc cgcagacagg ttccgccggc cctgaggggc agctgccatg gcgtgggtca 2760tgtgccaggc cgcagacagg ttccgccggc cctgaggggc agctgccatg gcgtggggtca 2760

ctgggagctg agaggaaggg cccccaccgc acctcaggca aagcggctct gggaacacct 2820ctgggagctg agaggaaggg cccccaccgc acctcaggca aagcggctct gggaacacct 2820

tgatttcgtc catgtgagcc gtcccaggga gggcagccaa gctgtgaagc ctgagaaact 2880tgatttcgtc catgtgagcc gtcccaggga gggcagccaa gctgtgaagc ctgagaaact 2880

gacctgtgtg ccacgagctt gtggtctgct gcccggtgga ggaagtgcag gtgcgcccag 2940gacctgtgtg cccacgagctt gtggtctgct gcccggtgga ggaagtgcag gtgcgcccag 2940

gctcctcatt ccgttttgca ggattccttc ggggtgtgag catttcctat tcagcctgtc 3000gctcctcatt ccgttttgca ggattccttc ggggtgtgag catttcctat tcagcctgtc 3000

gcccccgggg agcacgggct ggctctgtgg tgcccgtggc cttttgtaga agcgttggtt 30603060

ttacggcagg ttcatctctg gggcagcctc ccacagtggg tggggctttg ccagcagtgc 3120ttacggcagg ttcatctctg gggcagcctc ccacagtggg tggggctttg ccagcagtgc 3120

ccacgggggt catggggcca ggcgcgctcc ggcgcctgca gaactgatcg gggatagtct 3180ccacgggggt catggggcca ggcgcgctcc ggcgcctgca gaactgatcg gggatagtct 3180

caggaggcgc tagtcacgtg ccccggtgat cggggatagt ctcagaaggc gctagtctcc 3240caggaggcgc tagtcacgtg ccccggtgat cggggatagt ctcagaaggc gctagtctcc 3240

tgccccggtg atcggggata gtctcaggag gcacgagtcg cctgcctcgg tgatgcaccg 3300tgccccggtg atcggggata gtctcaggag gcacgagtcg cctgcctcgg tgatgcaccg 3300

tttctcacac cggctgctct ggcccgagct aaaggggaag acgtgtgcgg ataggagctg 3360tttctcacac cggctgctct ggcccgagct aaaggggaag acgtgtgcgg ataggagctg 3360

cacacaattt tcctccatgt attgtttatt ttgctttttc ttttggctag acattaggaa 3420cacacaattt tcctccatgt attgtttatt ttgctttttc ttttggctag acattaggaa 3420

tttcagtttt cccaagttgt atttttcctt ttctatttta aaattatcat gcagggctgg 3480tttcagtttt cccaagttgt atttttcctt ttctatttta aaattatcat gcagggctgg 3480

gtgaggtcgc tcacgcctat agtctcaaaa ctttgggagg ctgagggggg aggatggcat 3540gtgaggtcgc tcacgcctat agtctcaaaa ctttgggagg ctgagggggg aggatggcat 3540

gagcccagga gtttaaggct gcagtgagcc gagatcgctc cactgtcctc cagcctgcat 3600gagccgga gtttaaggct gcagtgagcc gagatcgctc cactgtcctc cagcctgcat 3600

gacagagcga gaccctatct caggaaaaaa aaaaacaaaa ctattatgca gtagtttcga 3660gacagagcga gaccctatct caggaaaaaa aaaaacaaaa ctattatgca gtagtttcga 3660

ccctggaaga cgagtgtgca tctttgagtt gtaacacgtg tacctcgccc atccaggcgt 3720ccctggaaga cgagtgtgca tctttgagtt gtaacacgtg tacctcgccc atccaggcgt 3720

agtttcattt ggaatctggt tatcctgtag ttgctttgtt aaaaatatat gtaattgcaa 3780agtttcattt ggaatctggt tatcctgtag ttgctttgtt aaaaatatat gtaattgcaa 3780

atcattt 3787atcattt 3787

<210> 20<210> 20

<211> 63<211> 63

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 20<400> 20

ttctccagta tatttgtaaa aaataaaaaa aaaaactaaa cccattaaaa agtatttgtt 60ttctccagta tatttgtaaa aaataaaaaa aaaaactaaa cccattaaaa agtatttgtt 60

tgc 63tgc 63

<210> 21<210> 21

<211> 45<211> 45

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 21<400> 21

ccctggatcc tactctctta ttaaaaagat ttttgctgac agtgc 45ccctggatcc tactctctta ttaaaaagat ttttgctgac agtgc 45

<210> 22<210> 22

<211> 61<211> 61

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 22<400> 22

gtgcagggcc ctcgtccggg tgtgccccaa ataaactcag gaacgccccg gtgctcgccg 60gtgcagggcc ctcgtccggg tgtgccccaa ataaactcag gaacgccccg gtgctcgccg 60

c 61c 61

<210> 23<210> 23

<211> 79<211> 79

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 23<400> 23

aacctcccac tttgtctgta catactggcc tctgtgatta catagatcag ccattaaaat 60aacctcccac tttgtctgta catactggcc tctgtgatta catagatcag ccattaaaat 60

aaaacaagcc ttaatctgc 79aaaacaagcc ttaatctgc 79

<210> 24<210> 24

<211> 38<211> 38

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 24<400> 24

taggtgttaa aaaaaaaaat aaaggacctc tgggctac 38taggtgttaa aaaaaaaaat aaaggacctc tgggctac 38

<210> 25<210> 25

<211> 1651<211> 1651

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 25<400> 25

atttcattta tctggaaaat tttgtatgag ttcttgaata aaacttggga accaaaatgg 60atttcattta tctggaaaat tttgtatgag ttcttgaata aaacttggga accaaaatgg 60

tggtttatcc ttgtatctct gcagtgtgga ttgaacagaa aattggaaat catagtcaaa 120tggtttatcc ttgtatctct gcagtgtgga ttgaacagaa aattggaaat catagtcaaa 120

gggcttccct tggttcgcca ctcatttatt tgtaacttga cttctttttt tttctgctta 180180

aaaatttcaa ttctcgtggt aataccagag tagaaggaga gggtgacttt accgaactga 240aaaatttcaa ttctcgtggt aataccagag tagaaggaga gggtgacttt accgaactga 240

cagccattgg ggaggcagat gcgggtgtgg aggtgtgggc tgaaggtagt gactgtttga 300cagccattgg ggaggcagat gcgggtgtgg aggtgtgggc tgaaggtagt gactgtttga 300

ttttaaaaag tgtgactgtc agttgtatct gttgcttttc tcaatgattc agggatacaa 360ttttaaaaag tgtgactgtc agttgtatct gttgcttttc tcaatgattc agggatacaa 360

atgggcttct ctcattcatt aaaagaaaac gcgacatctt tctaagattc tctgtgggaa 420atgggcttct ctcattcatt aaaagaaaac gcgacatctt tctaagattc tctgtgggaa 420

aatgactgtc aataaaatgc gggtttctgg gccattcgtc ttactttcat tttttgatta 480aatgactgtc aataaaatgc gggtttctgg gccattcgtc ttactttcat tttttgatta 480

caaatttctc ttgacgcaca caattatgtc tgctaatcct cttcttccta gagagagaaa 540caaatttctc ttgacgcaca caattatgtc tgctaatcct cttcttccta gagagagaaa 540

ctgtgctcct tcagtgttgc tgccataaag gggtttgggg aatcgattgt aaaagtccca 600ctgtgctcct tcagtgttgc tgccataaag gggtttgggg aatcgattgt aaaagtccca 600

ggttctaaat taactaaatg tgtacagaaa tgaacgtgta agtaatgttt ctacaggtct 660ggttctaaat taactaaatg tgtacagaaa tgaacgtgta agtaatgttt ctacaggtct 660

ttgcaacaaa ctgtcacttt cgtctccagc agagggagct gtaggaatag tgcttccaga 720ttgcaacaaa ctgtcacttt cgtctccagc agagggagct gtaggaatag tgcttccaga 720

tgtggtctcc cgtgtggggc ccagcaatgg gggcccctga tgccaagagc tctggaggtt 780tgtggtctcc cgtgtggggc ccagcaatgg gggcccctga tgccaagagc tctggaggtt 780

cttgaaagag gggacacgaa ggaggagtga ctgggaagcc tcccatgcca aggaggtggg 840cttgaaagag gggacacgaa ggaggagtga ctgggaagcc tcccatgcca aggagggtggg 840

aggtgccctg gaaatagctg cctcatgcca cttaggccat gactggattt aatgtcagtg 900aggtgccctg gaaatagctg cctcatgcca cttaggccat gactggattt aatgtcagtg 900

gtgtgccaca gtgcagaggc tagacaactg aaaggggcta ccaaggctgg gaaaaaaatg 960gtgtgccaca gtgcagaggc tagacaactg aaaggggcta ccaaggctgg gaaaaaaatg 960

caattgttgc tgtgagtgac tttgaaagac tctggtgcct tgtggtgccc ttctgaaatt 1020caattgttgc tgtgagtgac tttgaaagac tctggtgcct tgtggtgccc ttctgaaatt 1020

caaacagtaa tgcaaaagtg tctgcattag aatttacggt gtctaaaatt catgttttta 1080caaacagtaa tgcaaaagtg tctgcattag aatttacggt gtctaaaatt catgttttta 1080

aaagagcttg cctacagatg gtttccacac ttgaaattgt gccctgcgag ttgcatagct 11401140

ggaagttcaa tgctcagtcc taccttggct cccattaaac atttggtgct ctgtggattg 1200ggaagttcaa tgctcagtcc taccttggct cccattaaac atttggtgct ctgtggattg 1200

agttgaacgt gttgaggctt tgcaatttca cttgtgttaa aggctctggc atttttccat 1260agttgaacgt gttgaggctt tgcaatttca cttgtgttaa aggctctggc atttttccat 1260

ttctatgcaa atttctttga agcagaattg cttgcatatt tcttctctgc cgtcacagaa 1320ttctatgcaa atttctttga agcagaattg cttgcatatt tcttctctgc cgtcacagaa 1320

agcagagttt ctttcaaact tcactgaggc atcagttgct ctttggcaat gtcccttaac 1380agcagagttt ctttcaaact tcactgaggc atcagttgct ctttggcaat gtcccttaac 1380

catgattatt aactaagttt gtggcttgag tttacaaatt ctacttgttg cattgatgtt 1440catgattatt aactaagttt gtggcttgag tttacaaatt ctacttgttg cattgatgtt 1440

cccatgtagt aagtcatttt tagtttggtt gtgaaaaaac cctgggctga agttggcatt 1500cccatgtagt aagtcatttt tagtttggtt gtgaaaaaac cctgggctga agttggcatt 1500

tcagttaaaa gaaaaaaaga aactagtccc agatttgaaa acttgtaata aaattgaaac 1560tcagttaaaa gaaaaaaaga aactagtccc agatttgaaa acttgtaata aaattgaaac 1560

tcactggttt tctatgtctt tttgaactct tgtaatcgag ttttgatcat attttctatt 16201620

aaagtggcta acacctggct actcttactg t 1651aaagtggcta acacctggct actcttactg t 1651

<210> 26<210> 26

<211> 474<211> 474

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 26<400> 26

actgagtcca gctgcctaat tctgaatata tatatatata tatcttttca ccatatacat 60actgagtcca gctgcctaat tctgaatata tatatatata tatcttttca ccatatacat 60

gcctgtctgt caatttctgg ttgggctggg aggccacaca cacacactga catgacaggg 120gcctgtctgt caatttctgg ttgggctggg aggccacaca cacacactga catgacaggg 120

cttgggcaag actcctgttc tacttatcct tttgaaatac ctcaccctgc cactccacca 180cttgggcaag actcctgttc tacttatcct tttgaaatac ctcaccctgc cactccacca 180

tgtatgatca ttccagagat ctttgtgact agagttagtg tcctaggaaa accagaactc 240tgtatgatca ttccagagat ctttgtgact agagttagtg tcctaggaaa accagaactc 240

agaacttgcc tccatggttg agtaacaagc tgtacaagaa ccccttttat ccctggaaga 300agaacttgcc tccatggttg agtaacaagc tgtacaagaa ccccttttat ccctggaaga 300

ggctgtgtat gaaaccaatg cccagggttt gaagggtgtt agcatccatt tcaggggagt 360360

gtggattggc tggctctctg gtagcatttt gtcctcacac acccatctac tatgtccaac 420gtggattggc tggctctctg gtagcatttt gtcctcacac acccatctac tatgtccaac 420

cggtctgtct gcttccctca ccccttgccc aataaaggac aaggacttca gagg 474cggtctgtct gcttccctca ccccttgccc aataaaggac aaggacttca gagg 474

<210> 27<210> 27

<211> 36<211> 36

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 27<400> 27

attcagcatt aaaataaatg taattaaaag gaaaag 36attcagcatt aaaataaatg taattaaaag gaaaag 36

<210> 28<210> 28

<211> 45<211> 45

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 28<400> 28

actggcagat tagattttta aataaagatt ggattataac tctag 45actggcagat tagattttta aataaagatt ggattataac tctag 45

<210> 29<210> 29

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 29<400> 29

agtaatctta tatacaagct ttgattaaaa cttgaaacaa agagcctg 48agtaatctta tatacaagct ttgattaaaa cttgaaacaa agagcctg 48

<210> 30<210> 30

<211> 32<211> 32

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 30<400> 30

atgctttgtt ttgatcatta aaaattataa ag 32atgctttgtt ttgatcatta aaaattataa ag 32

<210> 31<210> 31

<211> 90<211> 90

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 31<400> 31

accttttcac ctacaaaatt tcacctgcaa accttaaacc tgcaaaattt tcctttaata 60accttttcac ctacaaaatt tcacctgcaa accttaaacc tgcaaaattt tcctttaata 60

aaatttgctt gttttaaaaa cattgtatct 90aaatttgctt gttttaaaaa cattgtatct 90

<210> 32<210> 32

<211> 4065<211> 4065

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 32<400> 32

agccacatgg agggagtttc attaaatgct aactactttt tccttgtggt gtgagtgtag 60agccacatgg agggagtttc attaaatgct aactactttt tccttgtggt gtgagtgtag 60

gttcttcagt ggcacctcta catcctgtgt gcattgggag cccaggttct agtacttagg 120gttcttcagt ggcacctcta catcctgtgt gcattgggag cccaggttct agtacttagg 120

gtatgaagac atggggtcct ctcctgactt ccctcaaata tatggtaaac gtaagaccaa 180gtatgaagac atggggtcct ctcctgactt ccctcaaata tatggtaaac gtaagaccaa 180

cacagacgtt ggccagttaa acatttctgt ttataaagtc agaataatac ctgttgatca 240cacagacgtt ggccagttaa acatttctgt ttataaagtc agaataatac ctgttgatca 240

ctgaaaggcc tgcatgtatt gtactctgaa ttttacagtg aatgagagaa tgtaccctaa 300ctgaaaggcc tgcatgtatt gtactctgaa ttttacagtg aatgagagaa tgtaccctaa 300

ttgttcaaca gggctcaaaa ggaaagattc cattttgatg ggtcacattc taaagagggg 360ttgttcaaca gggctcaaaa ggaaagattc cattttgatg ggtcacattc taaagagggg 360

cagtgtgata ggaatgagat ggtcctttag gacttaagtt ctcagcccaa ggtttttcca 420cagtgtgata ggaatgagat ggtcctttag gacttaagtt ctcagcccaa ggtttttcca 420

cgtggccccc tcatcttttt ttttttttta aacggagtct ctcttgccag gctggagtgc 480cgtggccccc tcatcttttt ttttttttta aacggagtct ctcttgccag gctggagtgc 480

agtggcacga tctcggctca ctgcagcctc cgcctcccag gttaagcgat tctcctgcct 540agtggcacga tctcggctca ctgcagcctc cgcctcccag gttaagcgat tctcctgcct 540

cagcttcctg actaactggg attacaggcg cccaccacca tgcccagcta atttttgtat 600cagcttcctg actaactggg attacaggcg cccaccacca tgcccagcta atttttgtat 600

tttcagtaga gatggggttt caccatgttg gccatgctgg tctctaactc ctaacctcaa 660tttcagtaga gatggggttt caccatgttg gccatgctgg tctctaactc ctaacctcaa 660

gtgatctgcc cacatcggcc tccaaaagtt ctgggattat agtgtgagcc actgcgcccg 720gtgatctgcc cacatcggcc tccaaaagtt ctgggattat agtgtgagcc actgcgcccg 720

gccatggctc cttaatcttg atccaaatta ttgttacatc cagaatgtga tgaatcaaaa 780gccatggctc cttaatcttg atccaaatta ttgttacatc cagaatgtga tgaatcaaaa 780

tctcgagatg ggggtccagc aatctgaaat ttcagtatgc cagggctttt ctgtatgtca 840tctcgagatg ggggtccagc aatctgaaat ttcagtatgc cagggctttt ctgtatgtca 840

aagtgggttt gaaatagtta atttttcttc tagtctgaaa tgtatcggga aaatttggaa 900aagtgggttt gaaatagtta atttttcttc tagtctgaaa tgtatcggga aaatttggaa 900

atcctgaagg ctggaaattg aaataagttt ttctaggatt tgtgtctctt gctattggaa 960atcctgaagg ctggaaattg aaataagttt ttctaggatt tgtgtctctt gctattggaa 960

aactgatggt gaccaattca tgtttacaaa taagatcctc atagatctcg gtaaattata 1020aactgatggt gaccaattca tgtttacaaa taagatcctc atagatctcg gtaaattata 1020

atttgctaca gttttatggt tcttcctgtg attttgagct ttttttgacc caaaataata 1080atttgctaca gttttatggt tcttcctgtg attttgagct ttttttgacc caaaataata 1080

cagtctaaaa ctatagacaa ataagatggc acttagactc ctgggtttta gttagtggag 1140cagtctaaaa ctatagacaa ataagatggc acttagactc ctgggtttta gttagtggag 1140

gtttccttag tgcactgtgg ggtcataata agccgagaac catggctgtc tatgggacac 1200gtttccttag tgcactgtgg ggtcataata agccgagaac catggctgtc tatgggacac 1200

atctgtcagg acaaccttta gaggatgttg gggatcaaat agaaggcaca gagaagcact 1260atctgtcagg acaaccttta gaggatgttg gggatcaaat agaaggcaca gagaagcact 1260

gaattggctt acataagaat aggctagaat tacaagtagt gaaacctcga ttcagctgga 1320gaattggctt acataagaat aggctagaat tacaagtagt gaaacctcga ttcagctgga 1320

caattttaaa caaatgtatc atttggcttg tatcttctgt tgtgctggag aagttagaaa 1380caattttaaa caaatgtatc atttggcttg tatcttctgt tgtgctggag aagttagaaa 1380

taagggctct ccagaccagc ctgaccaacc tggagaaacc ttgtctctac taaatacaca 1440taagggctct ccagaccagc ctgaccaacc tggagaaacc ttgtctctac taaatacaca 1440

aaattagcca ggcgtggtgg cacatgcctg taatcccagc tactttggag gctgagccag 1500aaattagcca ggcgtggtgg cacatgcctg taatcccagc tactttggag gctgagccag 1500

gagaatctcc aggaggcgga ggttgctgtg agccgagatc gtgccattgc actccagctt 1560gagaatctcc aggaggcggga ggttgctgtg agccgagatc gtgccattgc actccagctt 1560

gggcaacaag agtgaaactc tgtccacccc ccccaaaaaa agtaagggct ctccattagg 1620gggcaacaag agtgaaactc tgtccacccc ccccaaaaaa agtaagggct ctccattagg 1620

gcccatagag gacttgtaat atggaacctg aatccaagga tcccacaata agtggtcagt 1680gcccatagag gacttgtaat atggaacctg aatccaagga tcccacaata agtggtcagt 1680

agttcatgat gaattaaaag actcaatatt tggtcttcac ccaatacctg tgtgactttt 1740agttcatgat gaattaaaag actcaatatt tggtcttcac ccaatacctg tgtgactttt 1740

agtcctaatt tcctcatctt taaaatttca gtgaaagtgc ctacctgagg attgtgtaga 1800agtcctaatt tcctcatctt taaaatttca gtgaaagtgc ctacctgagg attgtgtaga 1800

ttaaaatgga aaccgtgcac ttaatttttt gttttgtttt gagacggagt ctcgctctgt 1860ttaaaatgga aaccgtgcac ttaatttttt gttttgtttt gagacggagt ctcgctctgt 1860

cgcccaggct ggagtgcagt ggtgcgatct cagatcactg caagctccgc ctcctaggtt 1920cgcccaggct ggagtgcagt ggtgcgatct cagatcactg caagctccgc ctcctaggtt 1920

cagaccattc tcctgcctca gcttcccaag tagctgggac tacaggcgcc cgccactgcg 1980cagaccattc tcctgcctca gcttcccaag tagctgggac tacaggcgcc cgccactgcg 1980

cccggctaat tttttgcatt tttagtagag acagggtttc accgtgttag ccaggatggt 2040accgtgttag ccaggatggt 2040

ctcgatctcc tgatctgccc gcctcagcct cccaaagtgc tgggattaca ggcatgagcc 2100ctcgatctcc tgatctgccc gcctcagcct cccaaagtgc tgggattaca ggcatgagcc 2100

accgcgcccg gcccaggcac ttaatttttg tgtttgactt agtaacttaa gtgcaaacta 2160accgcgcccg gcccaggcac ttaatttttg tgtttgactt agtaacttaa gtgcaaacta 2160

ttacgggagc agatggagtc aattggcctt catgtgattg tcagtgggaa attggtccaa 2220ttacgggagc agatggagtc aattggcctt catgtgattg tcagtgggaa attggtccaa 2220

gcagagggaa tactggttca ggaaactggt ttgggaaggt taggcaaacg ggaagtgcta 2280gcagagggaa tactggttca ggaaactggt ttgggaaggt taggcaaacg ggaagtgcta 2280

tggtggagag aaagattact ctggccgggc tgtaaaggac ggctacaatg ggaggctgaa 2340tggtggagag aaagattact ctggccgggc tgtaaaggac ggctacaatg ggaggctgaa 2340

ggcagaacca agaaaatggg agtgagtatg gaaaaggtac gattcagacg gcataatgga 2400ggcagaacca agaaaatggg agtgagtatg gaaaaggtac gattcagacg gcataatgga 2400

cgggacttgg agactgaatt gtagtgggcc gaccacaaaa tgataaggca tggaaggaag 24602460

tagagtttgg ggggaaggat ccctagtccc ttaatggcta ccttcttccc caggagttgt 2520tagagtttgg ggggaaggat ccctagtccc ttaatggcta ccttcttccc caggagttgt 2520

taggccatcc gatcccctgg cctgggaaag aaacactgat ttcgttgctg gcttgttcac 2580taggccatcc gatcccctgg cctgggaaag aaacactgat ttcgttgctg gcttgttcac 2580

tcaccagaag ctacagctac taacagttct aaaaactgtt tcatgtgatg aggaacagac 2640tcaccagaag ctacagctac taacagttct aaaaactgtt tcatgtgatg aggaacagac 2640

gaaaatagtt ttgagcccta agtccgccga ttccagtgct ttcttgaacc cgcatttact 2700gaaaatagtt ttgagccta agtccgccga ttccagtgct ttcttgaacc cgcatttact 2700

aaaatatttt catgactgcc aagctttgaa tagcctgctg tgttcatgga ggctcatact 2760aaaatatttt catgactgcc aagctttgaa tagcctgctg tgttcatgga ggctcatact 2760

ggcgatctct agtggctggc taaagcttga attgcaaaag atctaatttc tggtctaatg 2820ggcgatctct agtggctggc taaagcttga attgcaaaag atctaatttc tggtctaatg 2820

tatatatgcc ttaaatatag ttgcgttcaa acgtgggagc tgcaggtgca acttgatttt 2880tatatatgcc ttaaatatag ttgcgttcaa acgtgggagc tgcaggtgca acttgatttt 2880

atgacaaatg gctgccacat aatttgcaca agcagtgctc gtcaagggca gctaaatcag 2940atgacaaatg gctgccacat aatttgcaca agcagtgctc gtcaagggca gctaaatcag 2940

gcgagctttc aatcaaaata aatgtactac taaaccctac ttagcggcta actagcccaa 3000gcgagctttc aatcaaaata aatgtactac taaaccctac ttagcggcta actagcccaa 3000

gagcagacag cccacggacg gactgcaagt cggaagcgcg ggcggaagct gtgcagcgcc 30603060

cacctggtgg ctccatcggc cgcgttcatc agtcagcacg acccgacctc agtggcgtcc 3120cacctggtgg ctccatcggc cgcgttcatc agtcagcacg acccgacctc agtggcgtcc 3120

tcacaacaca gaccggacct tgggtcttac cccggcacct gagaaccact tccggtgagt 31803180

agcttctact tccggagacg atgactcccc cgcgtcccag accggaagaa gcccggcgga 3240agcttctact tccggagacg atgactcccc cgcgtcccag accggaagaa gcccggcgga 3240

gaccggcctc gctcggccac ttccggcaag ggcggagccg gccagtggtg cgcgagcgca 3300gaccggcctc gctcggccac ttccggcaag ggcggagccg gccagtggtg cgcgagcgca 3300

gataactccc ctggagaggc gggatgttca actccacccc tggtccttgg gcggccgtgg 3360gtaactccc ctggagaggc gggatgttca actccacccc tggtccttgg gcggccgtgg 3360

gtccccttcg aagcggagga atggccaacc tcgccgcact tcgagcccct ttagggtgcg 3420gtccccttcg aagcggagga atggccaacc tcgccgcact tcgagcccct ttagggtgcg 3420

tttaagaaca gtgggcgtgg cctttacgta aatcttcgag atgggaacct ccagaatttg 3480tttaagaaca gtgggcgtgg cctttacgta aatcttcgag atgggaacct ccagaatttg 3480

tctcaattgt ctaaaaggta atgagcgtca gcgacattca agggcacttt gggctaaaaa 3540tctcaattgt ctaaaaggta atgagcgtca gcgacattca agggcacttt gggctaaaaa 3540

agaaagtgct tgtacacgga tggaaatatt ctagaagaac ataaaaggaa tttcctctta 3600agaaagtgct tgtacacgga tggaaatatt ctagaagaac ataaaaggaa tttcctctta 3600

ggaggttagg gaaatgagca cgaagtatgt tttggtgcag ttttttgttc aacccaatgc 3660ggaggttagg gaaatgagca cgaagtatgt ttttggtgcag ttttttgttc aacccaatgc 3660

gtattttcat attgagaggc aatataaatg gagcgaaagt atcttgagaa aaaaaaaaaa 3720gtattttcat attgagaggc aatataaatg gagcgaaagt atcttgagaa aaaaaaaaaa 3720

actaccagaa cttgccgttg ctgaaaagta atattttctc tttcgagagt tttcatggcc 3780actaccagaa cttgccgttg ctgaaaagta atattttctc tttcgagagt tttcatggcc 3780

ttttaaatta cacccccacc tccacaggca aataaatttg ttttggaatg cataccacat 3840ttttaaatta cacccccacc tccacaggca aataaatttg ttttggaatg cataccacat 3840

catctggctc tagaaacgta ttttgtgtag ctcccctagc aagaatatag gttaaagcgt 3900catctggctc tagaaacgta ttttgtgtag ctcccctagc aagaatatag gttaaagcgt 3900

aaatttaatt cctggctcta ttttacatcc caatttttat tttcctctca ttcccacttt 39603960

acgttgtttc aaataaccta gtttgtgtat ccctgtaagt cattttggta taaagtaggt 4020acgttgtttc aaataaccta gtttgtgtat ccctgtaagt cattttggta taaagtaggt 4020

tataagtgta catgcgaaaa gatgttttta acaaaaatgt aactg 4065tataagtgta catgcgaaaa gatgttttta acaaaaatgt aactg 4065

<210> 33<210> 33

<211> 3865<211> 3865

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 33<400> 33

gccttgctct gctcccccgc ccccaggcag ccatccgcag ggccagcgcc atcctgcgca 60gccttgctct gctcccccgc ccccaggcag ccatccgcag ggccagcgcc atcctgcgca 60

gccagaagcc tgtgatggtg aagaggaagc ggacccgccc caccaagagc tcctgagccc 120gccagaagcc tgtgatggtg aagaggaagc ggacccgccc caccaagagc tcctgagccc 120

cctgccccca gagcaataaa gtcagctggc tttctcacct gcctcgactg ggcctccctt 180cctgccccca gagcaataaa gtcagctggc tttctcacct gcctcgactg ggcctccctt 180

tttgaaacgc tctggggagc tctggccctg tgtgttgtca ttcaggccat gtcatcaaaa 240tttgaaacgc tctggggagc tctggccctg tgtgttgtca ttcaggccat gtcatcaaaa 240

ctctgcatgt caccttgtcc atctggaggt gatgtcaatg gctggccatg caggaggggt 300ctctgcatgt caccttgtcc atctggaggt gatgtcaatg gctggccatg caggaggggt 300

ggggtagctg ccttgtccct ggtgagggca agggtcactg tcttcacaga aaaagtttgc 360ggggtagctg ccttgtccct ggtgagggca agggtcactg tcttcacaga aaaagtttgc 360

tgacttgtga ttgagaccta ctgtcccatt gtgaggtggc ctgaagaatc ccagctgggg 420tgacttgtga ttgagaccta ctgtcccatt gtgaggtggc ctgaagaatc ccagctgggg 420

cagtggcttc cattcagaag aagaaaggcc ttttctagcc cagaagggtg caggctgagg 480cagtggcttc cattcagaag aagaaaggcc ttttctagcc cagaagggtg caggctgagg 480

gctgggccct gggccctggt gctgtagcac ggtttgggga cttggggtgt tcccaagacc 540gctggggccct gggccctggt gctgtagcac ggtttgggga cttggggtgt tcccaagacc 540

tgggggacga cagacatcac gggaggaaga tgagatgact tttgcatcca gggagtgggt 600tgggggacga cagacatcac gggaggaaga tgagatgact tttgcatcca gggagtgggt 600

gcagccacat ttggagggga tgggctttac ttgatgcaac ctcatctctg agatgggcaa 660gcagccacat ttggagggga tgggctttac ttgatgcaac ctcatctctg agatgggcaa 660

cttggtgggt ggtggcttat aactgtaagg gagatggcag ccccagggta cagccagcag 720cttggtgggt ggtggcttat aactgtaagg gagatggcag ccccagggta cagccagcag 720

gcattgagca gccttagcat tgtcccccta ctcccgtcct ccaggtgtcc ccatccctcc 780gcattgagca gccttagcat tgtcccccta ctcccgtcct ccaggtgtcc ccatccctcc 780

cctgtctctt tgagctggct cttgtcactt aggtctcatc tcagtggccg ctcctgggcc 840cctgtctctt tgagctggct cttgtcactt aggtctcatc tcagtggccg ctcctgggcc 840

accctgtcac ccaagctttc ctgattgccc agccctcttg tttcctttgg cctgtttgct 900accctgtcac ccaagctttc ctgattgccc agccctcttg tttcctttgg cctgtttgct 900

ccctagtgtt tattacagct tgtgaggcca ggagtttgag accatcctag gcaacataat 960ccctagtgtt tattacagct tgtgaggcca ggagtttgag accatcctag gcaacataat 960

gagacaccgt ctctaaaata aaattagctg ggtgtggtgg tgcaccgcct gtggtcccag 1020gagacaccgt ctctaaaata aaattagctg ggtgtggtgg tgcaccgcct gtggtcccag 1020

ctcctcagag gttgagtaga ggctgaggtg agcggagcac ttgagccaag agtatgaggc 1080ctcctcagag gttgagtaga ggctgaggtg agcggagcac ttgagccaag agtatgaggc 1080

tgcagtgagc ccatgagccc caccactaca ctccagcctg gaagacacca tgacacacag 11401140

tgaggcctgg atggggaaag agtcctgctg ttgatcctca catgtttcct gggcacctaa 1200tgaggcctgg atggggaaag agtcctgctg ttgatcctca catgtttcct gggcacctaa 1200

ctctgtcagc cactgccagg gaccaaggat ccagcatcca tggcacccct ggttcctgcc 1260ctctgtcagc cactgccagg gaccaaggat ccagcatcca tggcacccct ggttcctgcc 1260

atcctggggt acccgattca aagaaggact ctgctccctg tctgagacca cccccggctc 1320atcctggggt acccgattca aagaaggact ctgctccctg tctgagacca cccccggctc 1320

tgactgagag taaggggact gtcagggcct cgacttgcca ttggttgggg tcgtacgggg 13801380

ctgggagccc tgcgttttga ggcagaccac tgcccttccg acctcagtcc tgtctgctcc 1440ctgggagccc tgcgttttga ggcagaccac tgcccttccg acctcagtcc tgtctgctcc 1440

agtcttgccc agctcgaagg agagcagatc tgaccacttg ccagcccctg tctgctgtga 1500agtcttgccc agctcgaagg agagcagatc tgaccacttg ccagcccctg tctgctgtga 1500

attaccattt cctttgtcct tcccttagtt gggtctatta gctcagattg agaggtgttg 1560attaccattt cctttgtcct tcccttagtt gggtctatta gctcagattg agaggtgttg 1560

ccttaaaact gagttgggtg acttggtacc tgctcaggac cccccgcact gtcccaatcc 1620ccttaaaact gagttgggtg acttggtacc tgctcaggac cccccgcact gtcccaatcc 1620

cactcaggcc cacctccagc tggcctcact ccgctggtga cttcgtacct gctcaggagc 1680cactcaggcc cacctccagc tggcctcact ccgctggtga cttcgtacct gctcaggagc 1680

ccccactgtc ccagtcccac tcaggcccat ctctggctgg cctcactgcg ctgggactcc 1740ccccactgtc ccagtcccac tcaggcccat ctctggctgg cctcactgcg ctgggactcc 1740

gccttcataa ggagagctca ctgctcacgt tagtagatgg ccccttctcg tgaggcctct 1800gccttcataa ggagagctca ctgctcacgt tagtagatgg ccccttctcg tgaggcctct 1800

cccctggcac ctgcttcagt tgtcctccac agcactgatt tgcagcccac aagctggcag 1860cccctggcac ctgcttcagt tgtcctccac agcactgatt tgcagcccac aagctggcag 1860

gtttatctgt ctcatgtttg tcttgtgctg gtgggcaagg ggtttgtcta gcacaccagc 19201920

atataatgag atgcttgatg aatggtgcat attgaatgta taaagcccac cggtcctgag 1980atataatgag atgcttgatg aatggtgcat attgaatgta taaagcccac cggtcctgag 1980

agtttgctca ctggagactt tctggagatg gagtctcgct ctgttgccca ggctggcgag 2040agtttgctca ctggagactt tctggagatg gagtctcgct ctgttgccca ggctggcgag 2040

tgcaatggcg cgatcttggc tcactgcagc ctccacctcc tgggttcaag cgattctcct 2100tgcaatggcg cgatcttggc tcactgcagc ctccacctcc tgggttcaag cgattctcct 2100

gcctcagcct cccgagtagc tgggattaca ggtgggtgtc accacaccca gctcagtatt 2160gcctcagcct cccgagtagc tgggattaca ggtgggtgtc accacaccca gctcagtatt 2160

gtatttttag cagagatggg gtttcaccat tttgcccagg ctggtttgga actcctgact 2220gtatttttag cagagatggg gtttcaccat tttgcccagg ctggtttgga actcctgact 2220

tcaaattacc cacctgcctc agcctcccaa agtgctggca ttacaggcgc tcgaggcttt 22802280

ctgatgtggc tgctgctgct cagaaggcct tgtccttaac cacctccttg cctgccctgg 2340ctgatgtggc tgctgctgct cagaaggcct tgtccttaac cacctccttg cctgccctgg 2340

aggcttgtgc ctctaggccc caccccctgt ggagtcctgc tggctttctc catccctatc 2400aggcttgtgc ctctaggccc caccccctgt ggagtcctgc tggctttctc catccctatc 2400

tgaatcctcc ctgctgtgtg gcctcccctg gtctcatccg taacacagcc cagcttagtg 2460tgaatcctcc ctgctgtgtg gcctcccctg gtctcatccg taacacagcc cagcttagtg 2460

ggcctctgtt cctgcgggtg gccagcctgt ctgtgtggct gggctgggga ggccacgtct 2520ggcctctgtt cctgcgggtg gccagcctgt ctgtgtggct gggctgggga ggccacgtct 2520

ggtatctgaa tgctatcggt gggttggggt ggaggaacca ggagagggct ggagggaggg 2580ggtatctgaa tgctatcggt gggttggggt ggaggaacca ggagaggggct ggagggaggg 2580

agatggtctc agccccacag agtttggagt cctcagtgtg ctgagcaaac gtggagacac 2640agatggtctc agccccacag agtttggagt cctcagtgtg ctgagcaaac gtggagacac 2640

catttccctc ctctagacct catcttggag agagagatgt tggatggggc catctattcc 2700catttccctc ctctagacct catcttggag agagagatgt tggatggggc catctattcc 2700

agctttattc acacaaatca tgtctgttgg cctggaaatt ggaaaaccag ttaaaccaaa 2760agcttttattc acacaaatca tgtctgttgg cctggaaatt ggaaaaccag ttaaaccaaa 2760

aacatgatat taagaaaaca ggcaggctca ccatagtaaa aatgctgaaa gccaaagaca 2820aacatgatat taagaaaaca ggcaggctca ccatagtaaa aatgctgaaa gccaaagaca 2820

aaattgggag aacaaaagaa aagcgtcttg tcacatacag aaggtccctg ataaagttag 2880aaattgggag aacaaaagaa aagcgtcttg tcacatacag aaggtccctg ataaagttag 2880

tagctgccct catcagaaac caggcccagg cagtggggac acatccagag tgctgaaaga 2940tagctgccct catcagaaac caggcccagg cagtggggac acatccagag tgctgaaaga 2940

acctccccca ggtcatccta tccccaagag tgatgcccgg cagcattccc agctcagggc 3000acctccccca ggtcatccta tccccaagag tgatgcccgg cagcattccc agctcaggggc 3000

taatggttca cggaagccag gaatcaaact gcctgggttc cagtcccagc tctgccagtt 30603060

atgcccagct gtggggactt gggcagctcg tttagtagca ccgtgcctca gtttcccata 3120atgcccagct gtggggactt gggcagctcg tttagtagca ccgtgcctca gtttcccata 3120

tgtaaaaggc cattttgagt gcctttcaca gccctgcata aggcaggtgt ctcagtgttc 3180tgtaaaaggc cattttgagt gcctttcaca gccctgcata aggcaggtgt ctcagtgttc 3180

actgctgtct ctccagctct tagtccagta gctgcatggt gagtgagcgt agggcgcacc 3240actgctgtct ctccagctct tagtccagta gctgcatggt gagtgagcgt agggcgcacc 3240

ctggaaggct gccaagccca aagttgtgca gagcgctggg gactccagac tccccacagc 3300ctggaaggct gccaagccca aagttgtgca gagcgctggg gactccagac tccccacagc 3300

agcagagact cgggactgag gcatcctctg ttcacaggac atgctggcat ctactgggtc 3360agcagagact cgggactgag gcatcctctg ttcacaggac atgctggcat ctactgggtc 3360

agggctctgc tgctcggtgg ctgtgcaacc ttgggcaagt tcctcaacct ctctgtgtct 3420agggctctgc tgctcggtgg ctgtgcaacc ttgggcaagt tcctcaacct ctctgtgtct 3420

tcgtaccctc atctgtaaca tgcgtgtcga tagaccctac tactcagggt tgatgagaag 3480tcgtaccctc atctgtaaca tgcgtgtcga tagaccctac tactcagggt tgatgagaag 3480

attaaatgtg caaaacctgc ttgactgtgc ccacaaatcc tgattgtagg aataaattaa 3540attaaatgtg caaaacctgc ttgactgtgc ccacaaatcc tgattgtagg aataaattaa 3540

tgacttttta taaatatttt gatcagatgg actcatgatc acagatgtct tcacatgcct 3600tgacttttta taaatatttt gatcagatgg actcatgatc acagatgtct tcacatgcct 3600

atgactaatt tgtacacaaa ctaatgctcg tgtttcccaa gcacctggaa gacatgccag 36603660

atccatgtgc agtaatgcct ggtggctcca ggtctgcccc gccgtcctgt ggggctgtga 3720atccatgtgc agtaatgcct ggtggctcca ggtctgcccc gccgtcctgt ggggctgtga 3720

gctttcccag cctcctgccc gtgtttgtga atatcattct gtcctcagct gcatttccag 3780gctttcccag cctcctgccg gtgtttgtga atatcattct gtcctcagct gcatttccag 3780

cccaggctgt ttggcgctgc ccaggaatgg tatcaattcc cctgtttctc ttgtagccag 3840cccaggctgt ttggcgctgc cgggaatgg tatcaattcc cctgtttctc ttgtagccag 3840

ttactagaat aaaatcatct acttt 3865ttactagaat aaaatcatct acttt 3865

<210> 34<210> 34

<211> 288<211> 288

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 34<400> 34

ttttttactg tcaggcagga agagcggtaa ctgccatcgc ggcgggcatc cctggcgcca 60ttttttactg tcaggcagga agagcggtaa ctgccatcgc ggcgggcatc cctggcgcca 60

gggtgttggt ctgggtaccg gcttccctct cggccgactt gtcagctctg tgagccgcgc 120gggtgttggt ctgggtaccg gcttccctct cggccgactt gtcagctctg tgagccgcgc 120

gcgtctgagc ccgtgtcctc acctgtaaag tggagaaatg aaaaaggacc tgaacttcct 180gcgtctgagc ccgtgtcctc acctgtaaag tggagaaatg aaaaaggacc tgaacttcct 180

cggtggttgt tgagagttaa ggcacggggt tgatgttttc agatgaaatt ctcaaagcaa 240240

gtcagggtgg ggatggatgg tttcatccca caggtgggaa gattgagg 288gtcagggtgg ggatggatgg tttcatccca caggtgggaa gattgagg 288

<210> 35<210> 35

<211> 430<211> 430

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 35<400> 35

gtttttctca ggtccttgat tggaactgcc tcagagccaa gggtcctttt actcagtggc 60gtttttctca ggtccttgat tggaactgcc tcagagccaa gggtcctttt actcagtggc 60

agcaacaaac gcagtctgtt ggctagtgat cctcctgtct cagggacacg tagtccaggg 120agcaacaaac gcagtctgtt ggctagtgat cctcctgtct cagggacacg tagtccaggg 120

agcagccaat tgcttggcac ttggggaccc cgttctgggg agtcctgaaa gctttcacct 180agcagccaat tgcttggcac ttggggaccc cgttctgggg agtcctgaaa gctttcacct 180

cttggattgc cgaatacatg ggtggccctt cctagactaa gggactggcc tgagtgaggc 240cttggattgc cgaatacatg ggtggccctt cctagactaa gggactggcc tgagtgaggc 240

tgggcctctc agccaagctg atgttgaacc actgctgtgg ggatgggcct ggggttcctg 300tgggcctctc agccaagctg atgttgaacc actgctgtgg ggatggggcct ggggttcctg 300

ggaagctgtt catacccatt gccaggagcg tgggctctgg ctggacctgg atcagatcct 360ggaagctgtt catacccatt gccaggagcg tgggctctgg ctggacctgg atcagatcct 360

aactgaagcg gcagctttct ggcatgagaa aggagtgttt tcatggtgga cagaattggg 420aactgaagcg gcagctttct ggcatgagaa aggagtgttt tcatggtgga cagaattgggg 420

ctatgagtgt 430ctatgagtgt 430

<210> 36<210> 36

<211> 120<211> 120

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 36<400> 36

atatctctgc caacatgagg acagaaggac tggtgcgacc ccccaccccc gcccctgggc 60atatctctgc caacatgagg acagaaggac tggtgcgacc ccccaccccc gcccctgggc 60

taccatctgc atggggctgg ggtcctcctg tgctatttgt acaaataaac ctgaggcagg 120taccatctgc atggggctgg ggtcctcctg tgctatttgt acaaataaac ctgaggcagg 120

<210> 37<210> 37

<211> 655<211> 655

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 37<400> 37

agggagccct cctggaagtg gatgaggcct tgggtctcgg ctcttcattg cttcctgagc 60agggagccct cctggaagtg gatgaggcct tgggtctcgg ctcttcattg cttcctgagc 60

tgcagcagat gcctttacaa ccaagctcac cgaggacgtc tgtctcccat attaccctgg 120tgcagcagat gcctttacaa ccaagctcac cgaggacgtc tgtctcccat attaccctgg 120

cagagggcca ggcctgttct acacggccgg ggtttcaaca aggtactgat gtcttctgcc 180cagaggggcca ggcctgttct acacggccgg ggtttcaaca aggtactgat gtcttctgcc 180

cttgcctctt cgacaggcaa gtaataagac ttaagtgaag agaattcttt aggcacacaa 240cttgcctctt cgacaggcaa gtaataagac ttaagtgaag agaattcttt aggcacacaa 240

attcacattt gatgtaatct cattatactt cctgatctgt gattgaaaac tttcatttcg 300attcacattt gatgtaatct cattatactt cctgatctgt gattgaaaac tttcatttcg 300

taactagtat gtctgtccca cctttaaaaa gtttttcatt atgaaagtaa gtatttgtta 360360

gaattaagtc tatttaaatg aaaaaaactt agatatgagt ctgcatggcc tcaggaaaat 420gaattaagtc tatttaaatg aaaaaaactt agatatgagt ctgcatggcc tcaggaaaat 420

gatgttttaa aatagagatt ttaggttgtc tgcactctag cttttttgtc gttttcttaa 480gatgttttaa aatagagatt ttaggttgtc tgcactctag cttttttgtc gttttcttaa 480

ggctttttta actgcatcaa aaattcagat acgaaacata cactaaaaaa taatacatca 540ggctttttta actgcatcaa aaattcagat acgaaacata cactaaaaaa taatacatca 540

tatcttaatt tccactgaac ttgatttaaa ttcagagtta cacagtatga atatcacaat 600600

cagatatgtt caaaaaggtc tgaacaattg attttctgaa accatgaagg actac 655cagatatgtt caaaaaggtc tgaacaattg attttctgaa accatgaagg actac 655

<210> 38<210> 38

<211> 331<211> 331

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 38<400> 38

agccatttaa attcattaga aaaatgtcct tacctcttaa aatgtgaatt catctgttaa 60agccatttaa attcattaga aaaatgtcct tacctcttaa aatgtgaatt catctgttaa 60

gctaggggtg acacacgtca ttgtaccctt tttaaattgt tggtgtggga agatgctaaa 120gctagggggtg acacacgtca ttgtaccctt tttaaattgt tggtgtggga agatgctaaa 120

gaatgcaaaa ctgatccata tctgggatgt aaaaaggttg tggaaaatag aatgcccaga 180gaatgcaaaa ctgatccata tctgggatgt aaaaaggttg tggaaaatag aatgcccaga 180

cccgtctaca aaaggttttt agagttgaaa tatgaaatgt gatgtgggta tggaaattga 240240

ctgttacttc ctttacagat ctacagacag tcaatgtgga tgagaactaa tcgctgatcg 300ctgttacttc ctttacagat ctacagacag tcaatgtgga tgagaactaa tcgctgatcg 300

tcagatcaaa taaagttata aaattgcctt c 331tcagatcaaa taaagttata aaattgcctt c 331

<210> 39<210> 39

<211> 1152<211> 1152

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 39<400> 39

gcagctcatg tgcacgtttt ctgtttaaat aaatgtaaaa actgccatct ggcatcttcc 60gcagctcatg tgcacgtttt ctgtttaaat aaatgtaaaa actgccatct ggcatcttcc 60

ttccttgatt ttaagtcttc agcttcttgg ccaacttagt ttgccacaga gattgttctt 120ttccttgatt ttaagtcttc agcttcttgg ccaacttagt ttgccacaga gattgttctt 120

ttgcttaagc ccctttggaa tctcccattt ggaggggatt tgtaaaggac actcagtcct 180ttgcttaagc ccctttggaa tctcccattt ggaggggatt tgtaaaggac actcagtcct 180

tgaacagggg aatgtggcct caagtgcaca gactagcctt agtcatctcc agttgaggct 240tgaacagggg aatgtggcct caagtgcaca gactagcctt agtcatctcc agttgaggct 240

gggtatgagg ggtacagact tggccctcac accaggtagg ttctgagaca cttgaagaag 300gggtatgagg ggtacagact tggccctcac accaggtagg ttctgagaca cttgaagaag 300

cttgtggctc ccaagccaca agtagtcatt cttagccttg cttttgtaaa gttaggtgac 360cttgtggctc ccaagccaca agtagtcatt cttagccttg cttttgtaaa gttaggtgac 360

aagttattcc atgtgatgct tgtgagaatt gagaaaatat gcatggaaat atccagatga 420aagttattcc atgtgatgct tgtgagaatt gagaaaatat gcatggaaat atccagatga 420

atttcttaca cagattctta cgggatgcct aaattgcatc ctgtaacttc tgtccaaaaa 480atttcttaca cagattctta cgggatgcct aaattgcatc ctgtaacttc tgtccaaaaa 480

gaacaggatg atgtacaaat tgctcttcca ggtaatccac cacggttaac tggaaaagca 540gaacaggatg atgtacaaat tgctcttcca ggtaatccac cacggttaac tggaaaagca 540

ctttcagtct cctataaccc tcccaccagc tgctgcttca ggtataatgt tacagcagtt 600ctttcagtct cctataaccc tcccaccagc tgctgcttca ggtataatgt tacagcagtt 600

tgccaaggcg gggacctaac tggtgacaat tgagcctctt gactggtact cagaatttag 660tgccaaggcg gggacctaac tggtgacaat tgagcctctt gactggtact cagaatttag 660

tgacacgtgg tcctgatttt ttttggagac ggggtcttgc tctcacccag gctgggagtg 720tgacacgtgg tcctgatttt ttttggagac ggggtcttgc tctcacccag gctgggagtg 720

cagtggcaca ctgactacag ccttgacctc cccaggctca ggtgatcttc ccacctcagc 780cagtggcaca ctgactacag ccttgacctc cccaggctca ggtgatcttc ccacctcagc 780

cttccaagta gctgggacta cagatgcaca cctccaaacc tgggtagttt ttgaagtttt 840cttccaagta gctgggacta cagatgcaca cctccaaacc tgggtagttt ttgaagtttt 840

tttgtagagg tggtctagcc atgttgccta ggctcccgaa ctcctgagct caagcaatcc 900tttgtagagg tggtctagcc atgttgccta ggctcccgaa ctcctgagct caagcaatcc 900

tgcttcagcc tcccaaagta ctgggattac aggcatcttc tgtagtatat aggtcatgag 960tgcttcagcc tcccaaagta ctgggattac aggcatcttc tgtagtatat aggtcatgag 960

ggatatggga tgtggtactt atgagacaga aatgcttaca ggatgttttt ctgtaaccat 1020ggatatggga tgtggtactt atgagacaga aatgcttaca ggatgttttt ctgtaaccat 1020

cctggtcaac ttagcagaaa tgctgcgctg ggtataataa agcttttcta cttctagtct 1080cctggtcaac ttagcagaaa tgctgcgctg ggtataataa agcttttcta cttctagtct 1080

agacaggaat cttacagatt gtctcctgtt caaaacctag tcataaatat ttataatgca 1140agacaggaat cttacagatt gtctcctgtt caaaacctag tcataaatat ttataatgca 1140

aactggtcct tc 1152aactggtcct tc 1152

<210> 40<210> 40

<211> 75<211> 75

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 40<400> 40

actaacgaaa aatcaataaa taaatgtgga tttgtgctct tgtattttta agtggattaa 60actaacgaaa aatcaataaa taaatgtgga tttgtgctct tgtattttta agtggattaa 60

aaaacttact acctt 75aaaacttact acctt 75

<210> 41<210> 41

<211> 1176<211> 1176

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 41<400> 41

gaatgtcaac gattagtcat gcaataaatg ttctggtttt aaaaaataca tatctggttt 60gaatgtcaac gattagtcat gcaataaatg ttctggtttt aaaaaataca tatctggttt 60

tggtaaggta tttttaatca attaggcttg tagtatcagt gaaatactgt aggtttaggg 120tggtaaggta tttttaatca attaggcttg tagtatcagt gaaatactgt aggtttaggg 120

actgggctag cttcatatca gatttacttg ttaagtgact gttttggaat gtttactttt 180actgggctag cttcatatca gatttacttg ttaagtgact gttttggaat gtttactttt 180

ggactgggtt tgtaacacgg ttaaaggcaa tgagaaacaa gcagaattcc aggagtcctt 240ggactgggtt tgtaacacgg ttaaaggcaa tgagaaacaa gcagaattcc aggagtcctt 240

gaagcagagg gcactggaag acaatatagc agattaaaat agcacagctc atgtggcata 300gaagcagagg gcactggaag acaatatagc agattaaaat agcacagctc atgtggcata 300

ggtgggtatt ttagatgttt gagtaaattt gaaagagtat gatgtttaaa ttacctttag 360ggtgggtatt ttagatgttt gagtaaattt gaaagagtat gatgtttaaa ttacctttag 360

caacatgttc atctgctatg ctgtcatgac tagggggatg attattagtc acatagagct 420caacatgttc atctgctatg ctgtcatgac tagggggatg attattagtc acatagagct 420

tgggagtacc actggaaacg tatgggtagg agtttaggtg gcttctgttt ttcaaaagat 480tgggagtacc actggaaacg tatgggtagg agtttaggtg gcttctgttt ttcaaaagat 480

gatcttatcc tagtatctgt aatgctcact tggcacacct gacttgtggg ctgtgtgtaa 540gatcttatcc tagtatctgt aatgctcact tggcacacct gacttgtggg ctgtgtgtaa 540

ggtggctagc taagtgaaaa aagcctgcta ggtgtgagtc aacttaagaa tatgtaaata 600ggtggctagc taagtgaaaa aagcctgcta ggtgtgagtc aacttaagaa tatgtaaata 600

ggtttgagaa aaagtagggc ttgggtgcaa gtaaagattg agcaggaaat aaaggaaaat 660ggtttgagaa aaagtagggc ttgggtgcaa gtaaagattg agcaggaaat aaaggaaaat 660

caagtataat ccctgagatt tgtagactaa aggcaatgat gtgggactac ttggtcgaat 720caagtataat ccctgagatt tgtagactaa aggcaatgat gtgggactac ttggtcgaat 720

ttttttagcc ctcaacttgg taattgggtg tttctgtgtt aaagcactga aacttgctgt 780ttttttagcc ctcaacttgg taattgggtg tttctgtgtt aaagcactga aacttgctgt 780

cgtgccttcc tagttttcgt ggtttattga cagggttggg ggtttttttt gtttttttaa 840cgtgccttcc tagttttcgt ggtttattga cagggttggg ggtttttttt gtttttttaa 840

aatgaaggga caaagtcaac tggactgctg agtgagaggg caggggcagt tgaagggaac 900aatgaaggga caaagtcaac tggactgctg agtgagaggg caggggcagt tgaagggaac 900

atgaattgct ggaacagcta cataaaatag tgatgtagcc aagtcatgct atttaaatta 960atgaattgct ggaacagcta cataaaatag tgatgtagcc aagtcatgct atttaaatta 960

taattctcca ctgtgtttag aataacatct gaggttctta acctggcctt ggaagggtat 1020taattctcca ctgtgtttag aataacatct gaggttctta acctggcctt ggaagggtat 1020

cacttttact tgtaacctgg aatggcttta taatgtgcta gctaattgct actctcatct 1080cacttttact tgtaacctgg aatggcttta taatgtgcta gctaattgct actctcatct 1080

tgtattttaa ctcctaattt acccttcagg tctcagcttc agaacattca cttataaaga 1140tgtattttaa ctcctaattt acccttcagg tctcagcttc agaacattca cttataaaga 1140

aaccctgctg attaaatctc tcttgggctt cctccc 1176aaccctgctg attaaatctc tcttgggctt cctccc 1176

<210> 42<210> 42

<211> 59<211> 59

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 42<400> 42

acgctcctct actctttgag acatcactgg cctataataa atgggttaat ttatgtaac 59acgctcctct actctttgag acatcactgg cctataataa atgggttaat ttatgtaac 59

<210> 43<210> 43

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 43<400> 43

accagacaca ctgattggaa ctgtattata ttaaaatact aaaaatcct 49accagacaca ctgattggaa ctgtattata ttaaaatact aaaaatcct 49

<210> 44<210> 44

<211> 178<211> 178

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 44<400> 44

ggaattgcac atgagatggc acacatattt atgctgtctg aaggtcacga tcatgttacc 60ggaattgcac atgagatggc acacatattt atgctgtctg aaggtcacga tcatgttacc 60

atatcaagct gaaaatgtca ccactatctg gagatttcga cgtgttttcc tctctgaatc 120atatcaagct gaaaatgtca ccactatctg gagatttcga cgtgttttcc tctctgaatc 120

tgttatgaac acgttggttg gctggattca gtaataaata tgtaaggcct ttcttttt 178tgttatgaac acgttggttg gctggattca gtaataaata tgtaaggcct ttcttttt 178

<210> 45<210> 45

<211> 73<211> 73

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 45<400> 45

tcaccaaaaa gcaaccaact tagccagttt tatttgcaaa acaaggaaat aaaggcttac 60tcaccaaaaa gcaaccaact tagccagttt tatttgcaaa acaaggaaat aaaggcttac 60

ttctttaaaa agt 73ttctttaaaa agt 73

<210> 46<210> 46

<211> 38<211> 38

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 46<400> 46

acctctttta taacatgttc aataaaaagc tgaacttt 38acctctttta taacatgttc aataaaaagc tgaacttt 38

<210> 47<210> 47

<211> 40<211> 40

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 47<400> 47

attcctgctc ccctgcaaat aaagcctttt tacacatctc 40attcctgctc ccctgcaaat aaagcctttt tacacatctc 40

<210> 48<210> 48

<211> 1301<211> 1301

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 48<400> 48

cagggtctcc ttggcagctg tattctggag tctggatgtt gctctctaaa gacctttaat 60cagggtctcc ttggcagctg tattctggag tctggatgtt gctctctaaa gacctttaat 60

aaaattttgt acaaagacac aaggtctgac tagactgttc agtattcaga ctgaggggca 120aaaattttgt acaaagacac aaggtctgac tagactgttc agtattcaga ctgaggggca 120

tgttggcctc tggagcatta catatcttct tggttttaac catacttgtg gtatttgcaa 180tgttggcctc tggagcatta catatcttct tggttttaac catacttgtg gtatttgcaa 180

gggccagaac agtaagaccc aagcagagcc aaccagagaa ataatatttg tgtgatagag 240gggccagaac agtaagaccc aagcagagcc aaccagagaa ataatatttg tgtgatagag 240

aaggctgata gcaagcaagg cagcaccttg attcgttgtc ctgtagttca ggattgtagg 300aaggctgata gcaagcaagg cagcaccttg attcgttgtc ctgtagttca ggattgtagg 300

tttagaagag ggatatgttt gagtttttcc tatgcataag gcgatccacg ttgcacatag 360360

aaagtgaata taaatggcca ttatattttg tgtcatgctg tgctctaagt gttctttaca 420aaagtgaata taaatggcca ttatattttg tgtcatgctg tgctctaagt gttctttaca 420

tatgtactcg ttaatcaacc tctctaaagt gtaaaggaaa tttgcttgca ccactgaagg 480tatgtactcg ttaatcaacc tctctaaagt gtaaaggaaa tttgcttgca ccactgaagg 480

cacataaggc tcagaagtaa atttgcctaa gcagtataaa gctatcatta gaatccacat 540cacataaggc tcagaagtaa atttgcctaa gcagtataaa gctatcatta gaatccacat 540

tcctaagttg tgttctctta ggggatcatg gaaccagtca ttggtactac aggctattat 600tcctaagttg tgttctctta ggggatcatg gaaccagtca ttggtactac aggctattat 600

gttctggaga actgtgaaga acatttaaat tgtctctgat tttatctatc aatgttttga 660gttctggaga actgtgaaga acatttaaat tgtctctgat tttatctatc aatgttttga 660

agtattttct accagtgtct gtacttcaca agaaattcgg cactattttt tcaggcaaaa 720agtattttct accagtgtct gtacttcaca agaaattcgg cactattttt tcaggcaaaa 720

ctagtgaggg acaggttggc ttgaaaatca tgagactgtt gttaaatcag atgctggttg 780ctagtgaggg acaggttggc ttgaaaatca tgagactgtt gttaaatcag atgctggttg 780

atcacagagg ggacttccag ggaaagctgt tatcaggtgg ctgcttcctg gtgatgcagc 840atcacagagg ggacttccag ggaaagctgt tatcaggtgg ctgcttcctg gtgatgcagc 840

ctggctgatg agataaccct ggctccacag atggcttagc aggtgctgtg atgatttggt 900ctggctgatg agataaccct ggctccacag atggcttagc aggtgctgtg atgatttggt 900

tttcttctca attagactga gctgcacatg gtgtttatat tgcttggcac atggtaaggg 960tttcttctca attagactga gctgcacatg gtgtttatat tgcttggcac atggtaaggg 960

cttaatattt gaggtaatta tgtagggcgt acactgacaa gtatctgacc cccccttcct 1020cttaatattt gaggtaatta tgtagggcgt acactgacaa gtatctgacc cccccttcct 1020

ttttgactca taaattggtc atcttaacca tttaagtgta cacttctata gtgacagagt 1080ttttgactca taaattggtc atcttaacca tttaagtgta cacttctata gtgacagagt 1080

tagccctctg tccaagggat ttgcatctgt ggattcaacc aactttgggt caaaaataat 1140tagccctctg tccaagggat ttgcatctgt ggattcaacc aactttggggt caaaaataat 1140

caaaaaggat ggttgtgtgt gtattgaaca tgtagactta tttttcttat tttcaaaata 12001200

ctatattttc ttgtcactta ttttcttgta cactgcagtt gtaacagcta tgtagcatgt 1260ctatattttc ttgtcactta ttttcttgta cactgcagtt gtaacagcta tgtagcatgt 1260

acattaggta ttaaaagtaa tccagtgaag attgaaagtc t 1301acattaggta ttaaaagtaa tccagtgaag attgaaagtc t 1301

<210> 49<210> 49

<211> 576<211> 576

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 49<400> 49

cagcctcttc catgagtggg gagcccgctg cttgtctcca gctcctagca gtgagtcctg 60cagcctcttc catgagtggg gagcccgctg cttgtctcca gctcctagca gtgagtcctg 60

ataatctcaa atttaaggac agtaactttg tctgggatga gtgtgggaaa ggatgtgttt 120ataatctcaa atttaaggac agtaactttg tctgggatga gtgtgggaaa ggatgtgttt 120

gggaacagac gcgagcctgc agaggtgttt gtaaccatct ctttctaagt ggtgggaagc 180gggaacagac gcgagcctgc agaggtgttt gtaaccatct ctttctaagt ggtgggaagc 180

agacatttta ttctttaact gttaatatat atagtgtgtg ttttttatgc atgaaatatt 240agacatttta ttctttaact gttaatatat atagtgtgtg ttttttatgc atgaaatatt 240

ttatagtttt taaaaatgcc cacactacta ttttgaaagt aaatgaggta atgtatgtgt 300ttatagtttt taaaaatgcc cacactacta ttttgaaagt aaatgaggta atgtatgtgt 300

cagaacccaa tacccaaagc gatcgtagta agaggtgggg cctttgggaa ggcattaaat 360cagaacccaa tacccaaagc gatcgtagta agaggtgggg cctttgggaa ggcattaaat 360

tgcttaggga atgagggtgg aaccctcatg aatgagatta gagccttata ggagaggttg 420tgcttaggga atgagggtgg aaccctcatg aatgagatta gagccttata ggagaggttg 420

gagggagttg cctggcctcc ctctcccatg tgaagactca gcaagaaaac attatttagg 480gagggagttg cctggcctcc ctctcccatg tgaagactca gcaagaaaac attatttagg 480

aagcagagag ccctcatcaa acaccagatc tgctggccac ctgatctggc actttccagc 540aagcagagag ccctcatcaa acaccagatc tgctggccac ctgatctggc actttccagc 540

cttcagaact gtgagaaata aatttctgtt gtctat 576cttcagaact gtgagaaata aatttctgtt gtctat 576

<210> 50<210> 50

<211> 57<211> 57

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 50<400> 50

agttcagact tcaaatagtg gcaaataaaa agtgctattt gtgatggttt gcttctg 57agttcagact tcaaatagtg gcaaataaaa agtgctattt gtgatggttt gcttctg 57

<210> 51<210> 51

<211> 1324<211> 1324

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 51<400> 51

agctcacgtt gatgtcaaga ctaccgatgg ttacttgctt cgtctgttct gtgttggttt 60agctcacgtt gatgtcaaga ctaccgatgg ttacttgctt cgtctgttct gtgttggttt 60

tactaaaaaa cgcaacaatc agatacggaa gacctcttat gctcagcacc aacaggtccg 120tactaaaaaa cgcaacaatc agatacggaa gacctcttat gctcagcacc aacaggtccg 120

ccaaatccgg aagaagatga tggaaatcat gacccgagag gtgcagacaa atgacttgaa 180ccaaatccgg aagaagatga tggaaatcat gacccgagag gtgcagacaa atgacttgaa 180

agaagtggtc aataaattgt aagtgtttct ttgcttcctc acacaacaca accttgagta 240agaagtggtc aataaattgt aagtgtttct ttgcttcctc acacaacaca accttgagta 240

ttggattatt cctgagatga gagaacgcat atgagacaag gtaaaggtct gttgaaatcc 300ttggattatt cctgagatga gagaacgcat atgagacaag gtaaaggtct gttgaaatcc 300

tgtctgtgaa tccttctagc tatatctctt taagtgaaag agtgttaagt actcagtaaa 360360

tatgattatt attactatta ttatttgagt cagagtcttg ctctgttgcc caggctcgag 420tatgattatt attactatta ttatttgagt cagagtcttg ctctgttgcc caggctcgag 420

tgcagtattg tgatcctcct tggctcactg taaccactgc ttcctgggtt caagcagttc 480tgcagtattg tgatcctcct tggctcactg taaccactgc ttcctggggtt caagcagttc 480

ttgagcctca gcctcctgag tatctgggaa tacaggggac tgccaccata cccagctaat 540ttgagcctca gcctcctgag tatctgggaa tacaggggac tgccaccata cccagctaat 540

ttttttaaat ttttagtaga gatggggttt catcatgttg gccaggctgg tcttgaactc 600ttttttaaat ttttagtaga gatggggttt catcatgttg gccaggctgg tcttgaactc 600

ctgacttcag gtgatctgcc agtactctaa atgataacag ttttttcgtg tttatttatt 660ctgacttcag gtgatctgcc agtactctaa atgataacag ttttttcgtg tttatttatt 660

ttgaatgaag ctgtctcaca gtagatggag ttgaaggaca ggaaatgttt ttcccctact 720ttgaatgaag ctgtctcaca gtagatggag ttgaaggaca ggaaatgttt ttccctact 720

tggaaaatac actgaataag ttgagtgggg tgggatgtgc ctggagtccc agctactcag 780tggaaaatac actgaataag ttgagtgggg tgggatgtgc ctggagtccc agctactcag 780

gaggctgagg tggtaggatt gtttgagccc aggagtttga ggccagcctg ggcaatatag 840gaggctgagg tggtaggatt gtttgagccc aggagtttga ggccagcctg ggcaatatag 840

ggagaccctg tcccaaaaaa taaaaaatat acgtatatat atatacacac acaaagaaaa 900ggagaccctg tcccaaaaaa taaaaaatat acgtatatat atatacacac acaaagaaaa 900

aatacactga atagacaaaa cctttcatga ttaatgatgc acgggaataa gtgatgaaaa 960aatacactga atagacaaaa cctttcatga ttaatgatgc acgggaataa gtgatgaaaa 960

aagtttcggt cccagatgat ggccagtgat aacaacattt ttctgatgtt cccatgcaat 1020aagtttcggt cccagatgat ggccagtgat aacaacattt ttctgatgtt cccatgcaat 1020

atacagttag ctaagagggt gtaatggaaa aagcataagg cttggactca gaagactcta 1080atacagttag ctaaaggggt gtaatggaaa aagcataagg cttggactca gaagactcta 1080

ctaactttgc cactagctag ctatgtaatt cagatcatct atcctttaca tgtgaaaggt 1140ctaactttgc cactagctag ctatgtaatt cagatcatct atcctttaca tgtgaaaggt 1140

aaataatggc ttatcttaac aggaggattt atgcaggtta aatgaggtag gtgttatgtg 1200aaataatggc ttatcttaac aggaggattt atgcaggtta aatgaggtag gtgttatgtg 1200

taggtttatt ccaaggcttc tctactttta aaggaaatgg cttatatctg agaactagga 1260taggtttatt ccaaggcttc tctactttta aaggaaatgg cttatatctg agaactagga 1260

cttttagaaa aaaatttact gttactggtt tgcaggattc cagacagcat tggaaaagac 1320cttttagaaa aaaatttact gttactggtt tgcaggattc cagacagcat tggaaaagac 1320

atag 1324atag 1324

<210> 52<210> 52

<211> 68<211> 68

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 52<400> 52

aatgggtccc tgggtgacat gtcagatctt tgtacgtaat taaaaatatt gtggcaggat 60aatgggtccc tgggtgacat gtcagatctt tgtacgtaat taaaaatatt gtggcaggat 60

taatagca 68taatagca 68

<210> 53<210> 53

<211> 60<211> 60

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 53<400> 53

attgcagtag cagcatatct ttttttcttt gcacaaataa acagtgaatt ctcgtttctt 60attgcagtag cagcatatct ttttttcttt gcacaaataa acagtgaatt ctcgtttctt 60

<210> 54<210> 54

<211> 53<211> 53

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 54<400> 54

ttttcccagc tgctgcccaa taaacctgtc tgccctttgg ggcagtccca gcc 53ttttcccagc tgctgcccaa taaacctgtc tgccctttgg ggcagtccca gcc 53

<210> 55<210> 55

<211> 37<211> 37

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 55<400> 55

gattttttga gtaacaaata aataagatca gactctg 37gattttttga gtaacaaata aataagatca gactctg 37

<210> 56<210> 56

<211> 36<211> 36

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 56<400> 56

acaaaaatga ctaaataaaa agtatatatt cacagt 36acaaaaatga ctaaataaaa agtatatatt cacagt 36

<210> 57<210> 57

<211> 55<211> 55

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 57<400> 57

atccttgttt tgtcttcacc catgtaataa aggtgtttat tgttttgttc ccaca 55atccttgttt tgtcttcacc catgtaataa aggtgtttat tgttttgttc ccaca 55

<210> 58<210> 58

<211> 70<211> 70

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 58<400> 58

agcgctttac 70agcgctttac 70

<210> 59<210> 59

<211> 50<211> 50

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 59<400> 59

aattggagag gattcttttg cattgaataa acttacagcc aaaaaacctt 50aattggagag gattcttttg cattgaataa acttacagcc aaaaaacctt 50

<210> 60<210> 60

<211> 77<211> 77

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 60<400> 60

ggctggacat cggcccgctc cccacaatga aataaagtta ttttctcatt cccaggccag 60ggctggacat cggcccgctc cccacaatga aataaagtta ttttctcatt cccaggccag 60

acttgggatc ttccgcg 77acttgggatc ttccgcg 77

<210> 61<210> 61

<211> 21<211> 21

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 61<400> 61

agaaataaat ctttggctca c 21agaaataaat ctttggctca c 21

<210> 62<210> 62

<211> 41<211> 41

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 62<400> 62

atttgtctgt gtactcaagc aataaaatga ttgtttaact a 41atttgtctgt gtactcaagc aataaaatga ttgtttaact a 41

<210> 63<210> 63

<211> 31<211> 31

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 63<400> 63

tggctcagct aataaaggcg cacatgactc c 31tggctcagct aataaaggcg cacatgactc c 31

<210> 64<210> 64

<211> 53<211> 53

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 64<400> 64

ggatgtaata catatattta caaataaaat gcctcatgga ctctggtgct tcc 53ggatgtaata catatattta caaataaaat gcctcatgga ctctggtgct tcc 53

<210> 65<210> 65

<211> 64<211> 64

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 65<400> 65

gcccatcgtg actcaaaact cacttgtata ataaacagtt tttgagggat tttaaagttt 60gcccatcgtg actcaaaact cacttgtata ataaacagtt tttgagggat tttaaagttt 60

caag 64caag 64

<210> 66<210> 66

<211> 37<211> 37

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 66<400> 66

aacaaaccat gctgggttaa taaattgcct cattcgt 37aacaaaccat gctgggttaa taaattgcct cattcgt 37

<210> 67<210> 67

<211> 386<211> 386

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 67<400> 67

ctgcattctc ctccgccaaa aaagtgacca agcagagtct ttctctgtca cccaggctgg 60ctgcattctc ctccgccaaa aaagtgacca agcagagtct ttctctgtca cccaggctgg 60

agtgcaatgg cgtgatctca gctcactgca acctctgcct cctgggttca agtgattctc 120agtgcaatgg cgtgatctca gctcactgca acctctgcct cctgggttca agtgattctc 120

gtgtctcagc ctcctgagta gctgagacta caggtgtgca ccagtgttcc cagctgattt 180gtgtctcagc ctcctgagta gctgagacta caggtgtgca ccagtgttcc cagctgatt 180

ttgtatttta tgtagagatg gggttatgcc attttggcca ggctagtctc gaactcctga 240ttgtatttta tgtagagatg gggttatgcc attttggcca ggctagtctc gaactcctga 240

gctcaggtga tacacacacc tcagcaaatc ttttaaatta tacattctgt gatatttcct 300gctcaggtga tacacacacc tcagcaaatc ttttaaatta tacattctgt gatatttcct 300

tgactttctt atccagcact tgtattgatt atttttcatt ttgataatgt tgggttttta 360360

aaaactcctt tatgatggaa aatttc 386aaaactcctt tatgatggaa aatttc 386

<210> 68<210> 68

<211> 281<211> 281

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 68<400> 68

gtcaactatt ttaataaatt gatgaccagt tgttaacttc tgttggtttt tattcagaat 60gtcaactatt ttaataaatt gatgaccagt tgttaacttc tgttggtttt tattcagaat 60

actggcagat tttaggaata taaaggtgta ctatgagact tccacttttc aggtggaata 120actggcagat tttaggaata taaaggtgta ctatgagact tccacttttc aggtggaata 120

tatgggtatc ttagagtggt ctatcctgtt ttcgttgtcg tttgagtcat ttgaaaactg 180180

gattccgtta actacataat atgtgagacc tgactggttt tattggacac tggcagttta 240gattccgtta actacataat atgtgagacc tgactggttt tattggacac tggcagttta 240

taactttggc atactctaga taaattctga ttggtatggg g 281taactttggc atactctaga taaattctga ttggtatggg g 281

<210> 69<210> 69

<211> 53<211> 53

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 69<400> 69

ctggagagaa tcacagatgt ggaatatttg tcataaataa ataatgaaaa cct 53ctggagagaa tcacagatgt ggaatatttg tcataaataa ataatgaaaa cct 53

<210> 70<210> 70

<211> 2785<211> 2785

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 70<400> 70

atattaatgg tgaaaacact gtagtaataa attttcatat gccaaaaaat gtttgtatct 60atattaatgg tgaaaacact gtagtaataa attttcatat gccaaaaaat gtttgtatct 60

tactgtcccc tgttctcacc acgaagatca tgttcattac caccaccacc cccccttatt 120tactgtcccc tgttctcacc acgaagatca tgttcattac caccaccacc cccccttatt 120

ttttttatcc taaaccagca aacgcaggac ctgtaccaat tttaggagac aataagacag 180ttttttatcc taaaccagca aacgcaggac ctgtaccaat tttaggagac aataagacag 180

ggttgtttca ggattctcta gagttaataa catttgtaac ctggcacagt ttccctcatc 240ggttgtttca ggattctcta gagttaataa catttgtaac ctggcacagt ttccctcatc 240

ctgtggaata agaaaatggg atagatctgg aataaatgtg cagtattgta gtattacttt 300ctgtggaata agaaaatggg atagatctgg aataaatgtg cagtattgta gtattacttt 300

aagaacttta agggaacttc aaaaactcac tgaaattcta gtgagatact ttctttttta 360aagaacttta agggaacttc aaaaactcac tgaaattcta gtgagatact ttctttttta 360

ttcttggtat tttccatatc gggtgcaaca cttcagttac caaatttcat tgcacataga 420ttcttggtat tttccatatc gggtgcaaca cttcagttac caaatttcat tgcacataga 420

ttatcttagg tacccttgga aatgcacatt cttgtatcca tcttacaggg gcccaagatg 480ttatcttagg tacccttgga aatgcacatt cttgtatcca tcttacaggg gcccaagatg 480

ataaatagta aactcaaaat tgctccccac tctgtttatt atttaaaggt gtcaggatct 540ataaatagta aactcaaaat tgctccccac tctgtttatt atttaaaggt gtcaggatct 540

gtgttgtaat gtgtctacat taatgtgttt aggagaatac aggcattgga tcatttagtt 600gtgttgtaat gtgtctacat taatgtgttt aggagaatac aggcattgga tcatttagtt 600

gatggaagta tatgccaggc aagggagata aggtatacga caagactgat gttttcagta 660gatggaagta tatgccaggc aagggagata aggtatacga caagactgat gttttcagta 660

tcttctcatg aggttgtcag agaccttcat gtcttcaaag actagtcagc aaatgaagtg 720tcttctcatg aggttgtcag agaccttcat gtcttcaaag actagtcagc aaatgaagtg 720

gtttagtgta gagacaagat tggttgtgtt ttgataattt aagctaggta ttgagtacat 780gtttagtgta gagacaagat tggttgtgtt ttgataattt aagctaggta ttgagtacat 780

gtggattttg ctgtccacaa atacttgttt cagagttttc atggatacag tggcatggtt 840gtggattttg ctgtccacaa atacttgttt cagagttttc atggatacag tggcatggtt 840

gaaatgaagc tgtgagcctt ctgctttaaa tctgatgtaa gaaactcctg ttaacaaata 900gaaatgaagc tgtgagcctt ctgctttaaa tctgatgtaa gaaactcctg ttaacaaata 900

gtaagtatgg gttaattagc cctttgatca aagcctagct ttacattgtt taggatcttt 960gtaagtatgg gttaattagc cctttgatca aagcctagct ttacattgtt taggatcttt 960

ggaaaacaat tggtttggtt gcccactttc cgtaggatca agagcagaac ctttcacatg 1020ggaaaacaat tggtttggtt gcccactttc cgtaggatca agagcagaac ctttcacatg 1020

gcacagaaga acccaggttg cgcttcatac ctgcatattc cagccttagc ctgccatttc 1080gcacagaaga acccaggttg cgcttcatac ctgcatattc cagccttagc ctgccatttc 1080

tctccttggc actttgtgct ccagcaacac tggtctcagt tggtcatcct caaacttggg 1140tctccttggc actttgtgct ccagcaacac tggtctcagt tggtcatcct caaacttggg 1140

ttccatatcc agcctcagga cctctgttcc tgttactatg gttccttgca tgtcgcctgc 1200ttccatatcc agcctcagga cctctgttcc tgttactatg gttccttgca tgtcgcctgc 1200

tcttactaaa gagctcgtgt gttttccagc acacttcggt ttatctcttg atgatgatgc 1260tcttactaaa gagctcgtgt gttttccagc acacttcggt ttatctcttg atgatgatgc 1260

tagtctctcc ctccgcaagg gcggaaaggc tgcctgttgg tttgtaccag tgtttcctaa 13201320

cgtgtagctg cagtcagtat ttggctaagc tgttcccagg ggctcaacag atgctttcgg 1380cgtgtagctg cagtcagtat ttggctaagc tgttcccagg ggctcaacag atgctttcgg 1380

atgagcctta actgacccaa tcctttgtga tgcgggagag attgctaggc ctcgctcacc 1440atgagcctta actgacccaa tcctttgtga tgcggggagag attgctaggc ctcgctcacc 1440

tggccagaac cagggaaaga ggccgcggtt gcagcgcgat tccaggccct gggcgtcagg 1500tggccagaac cagggaaaga ggccgcggtt gcagcgcgat tccaggccct gggcgtcagg 1500

cgcggggtgg gcagctctcc ccgggcggtg gggcccttgt gaccgcgagg cggggcgcac 15601560

caggaaggga gtgggacagc gcgggcgccc agggatgtgg cctggttacc tgccttctct 1620caggaaggga gtgggacagc gcgggcgccc agggatgtgg cctggttacc tgccttctct 1620

gatacgtcaa gacaccttca acaatggctt gcagctgtac cctgttggct gcacccagga 1680gatacgtcaa gacaccttca acaatggctt gcagctgtac cctgttggct gcaccagga 1680

cgcccttttc actgctaagc agtcctacct gaggcccagg ggctgccaga ttgacccata 1740cgcccttttc actgctaagc agtcctacct gaggcccagg ggctgccaga ttgacccata 1740

aataatctcc ggcgcctcag atccagaagc tgctgagcct gatcttagtg ccttctcctt 1800aataatctcc ggcgcctcag atccagaagc tgctgagcct gatcttagtg ccttctcctt 1800

tctctgtgtg gccccccagc ccctttcccc actgccttgt gtccaaggcc ctttccttca 1860tctctgtgtg gccccccagc ccctttcccc actgccttgt gtccaaggcc ctttccttca 1860

tgtatccatg gaggagagac aaaaatacac atcaataaaa taagataggg aatccataaa 1920tgtatccatg guggagagac aaaaatacac atcaataaaa taagataggg aatccataaa 1920

tagacattca gaagtatggc caacggattt atcttaaaac caatggagga agaagagttt 1980tagacattca gaagtatggc caacggattt atcttaaaac caatggagga agaagagttt 1980

caataaatgt tgtggacttc catttgtcaa agaccaaaac aaaggaaccc caaccttaca 2040caataaatgt tgtggacttc catttgtcaa agaccaaaac aaaggaaccc caaccttaca 2040

tgtaatacaa acttaactca aaatggatca tatatctaaa tgtaaaatgg aaagctataa 2100tgtaatacaa acttaactca aaatggatca tatatctaaa tgtaaaatgg aaagctataa 2100

aactgaaaac agactatctt tacaacctag gcgtaggtat agtttttaga cattacacca 2160aactgaaaac agactatctt tacaacctag gcgtaggtat agtttttaga cattacacca 2160

aaagcacatg ccgtaaaaga aaaaatagat aaattggtgg atttcattaa aattaaaaaa 2220aaagcacatg ccgtaaaaga aaaaatagat aaattggtgg atttcattaa aattaaaaaa 2220

ctttttctct ctgaaaaatc ctgttaagct gggcgctgtg gttcatgcct gtaatcccag 2280ctttttctct ctgaaaaatc ctgttaagct gggcgctgtg gttcatgcct gtaatcccag 2280

cactttggga ggctgagttg ggaagaaatt aatagcttga ggccaggagt tcaagatcat 2340cactttggga ggctgagttg ggaagaaatt aatagcttga ggccaggagt tcaagatcat 2340

cctgggcagc aaagtcatac actcttgagg gaagagagag accttctcat attgttttat 2400cctgggcagc aaagtcatac actcttgagg gaagagagag accttctcat attgttttat 2400

attgttttat actcagtacc tgttttaaga aaaaaacaag gaagtgaaat caaagacagg 2460attgttttat actcagtacc tgttttaaga aaaaaacaag gaagtgaaat caaagacagg 2460

cagcccggca ccaggcctga aaccagccct gggcctgcct ggcctaaacc tagtagttaa 2520cagccggca ccaggcctga aaccagccct gggcctgcct ggcctaaacc tagtagttaa 2520

aaatcaactt acgacttaga acctgatgtt atccgtagat tccaagcatt gtataaaaaa 2580aaatcaactt acgacttaga acctgatgtt atccgtagat tccaagcatt gtataaaaaa 2580

attgtgaaac tccctgttgt gttctgtacc agtgcatgaa acccctgtca catatcccct 2640attgtgaaac tccctgttgt gttctgtacc agtgcatgaa acccctgtca catatcccct 2640

agattgctca atcaatcacg accctttcat gtgaaatctt tagtgttgtg agcccttaaa 2700agattgctca atcaatcacg accctttcat gtgaaatctt tagtgttgtg agcccttaaa 2700

agggacagaa attgtgcact tgaggagctc agattttaag gctgtagctt gccgatgctc 2760agggacagaa attgtgcact tgaggagctc agattttaag gctgtagctt gccgatgctc 2760

ccagctgaat aaagcccttc cttct 2785ccagctgaat aaagcccttc cttct 2785

<210> 71<210> 71

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 71<400> 71

ataggtccaa ccagctgtac atttggaaaa ataaaacttt attaaatc 48ataggtccaa ccagctgtac atttggaaaa ataaaacttt attaaatc 48

<210> 72<210> 72

<211> 67<211> 67

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 72<400> 72

ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60ggagctgagt tcttaaagac tgaagacagg ctattctctg gagaaaaata aaatggaaat 60

tgtactt 67tgtactt 67

<210> 73<210> 73

<211> 62<211> 62

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 73<400> 73

aagcactctg agtcaagatg agtgggaaac catctcaata aacacatttt ggataaatcc 60aagcactctg agtcaagatg agtgggaaac catctcaata aacacatttt ggataaatcc 60

tg 62tg 62

<210> 74<210> 74

<211> 276<211> 276

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 74<400> 74

ctgtatgagt taataaaaga catgaactaa catttattgt tgggttttat tgcagtaaaa 6060

agaatggttt ttaagcacca aattgatggt cacaccattt ccttttagta gtgctactgc 120agaatggttt ttaagcacca aattgatggt cacaccattt ccttttagta gtgctactgc 120

tatcgctgtg tgaatgttgc ctctggggat tatgtgaccc agtggttctg tatacctgcc 180tatcgctgtg tgaatgttgc ctctggggat tatgtgaccc agtggttctg tatacctgcc 180

aggtgccaac cacttgtaaa ggtcttgata ttttcaattc ttagactacc tatactttgg 240aggtgccaac cacttgtaaa ggtcttgata ttttcaattc ttagactacc tatactttgg 240

cagaagttat atttaatgta agttgtctaa atataa 276cagaagttat atttaatgta agttgtctaa atataa 276

<210> 75<210> 75

<211> 139<211> 139

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 75<400> 75

gcttggctgc tcgctgggtc ttggatgtcg ggttcgacca cttggccgat gggaatggtc 60gcttggctgc tcgctgggtc ttggatgtcg ggttcgacca cttggccgat gggaatggtc 60

tgtcacagtc tgctcctttt ttttgtccgc cacacgtaac tgagatgctc ctttaaataa 120tgtcacagtc tgctcctttt ttttgtccgc cacacgtaac

agcgtttgtg tttcaagtt 139agcgtttgtg tttcaagtt 139

<210> 76<210> 76

<211> 94<211> 94

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 76<400> 76

atgctcttcc ttcagaggat tatccggggc atctactcaa tgaaaaacca tgataattct 60atgctcttcc ttcagaggat tatccggggc atctactcaa tgaaaaacca tgataattct 60

ttgtatataa aataaacatt tgaaaaaacc cttc 94ttgtatataa aataaacatt tgaaaaaacc cttc 94

<210> 77<210> 77

<211> 1355<211> 1355

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 77<400> 77

tataagtaaa gtttgtaaaa ttcatactta ataaacaatt taggacagtc atgtctgctt 60tataagtaaa gtttgtaaaa ttcatactta ataaacaatt taggacagtc atgtctgctt 60

acaggtgtta tttgtctgtt aaaactagtc tgcagatgtt tcttgaatgc tttgtcaaat 120120

taagaaagtt aaagtgcaat aatgtttgaa gacaataagt ggtggtgtat cttgtttcta 180taagaaagtt aaagtgcaat aatgtttgaa gacaataagt ggtggtgtat cttgtttcta 180

ataagataaa cttttttgtc tttgctttat cttattaggg agttgtatgt cagtgtataa 240ataagataaa cttttttgtc tttgctttat cttattaggg agttgtatgt cagtgtataa 240

aacatactgt gtggtataac aggcttaata aattctttaa aaggagagaa ctgaaactag 300aacatactgt gtggtataac aggcttaata aattctttaa aaggagagaa ctgaaactag 300

ccctgtagat ttgtctggtg catgtgatga aacctgcagc tttatcggag tgatggcaat 360ccctgtagat ttgtctggtg catgtgatga aacctgcagc tttatcggag tgatggcaat 360

gctctgctgg tttattttca agtggctgcg ttttttttag tttggcaggt gtagactttt 420gctctgctgg tttattttca agtggctgcg tttttttttag tttggcaggt gtagactttt 420

taagttgggc tttagaaaat ctgggttagc ctgaagaaaa ttgcctcagc ctccacagta 480taagttgggc tttgaaaat ctgggttagc ctgaagaaaa ttgcctcagc ctccacagta 480

ccattttaaa ttcacataaa aggtgaaagc tcctggttca gtgccatggc ttcatggcat 540ccattttaaa ttcacataaa aggtgaaagc tcctggttca gtgccatggc ttcatggcat 540

tcagtgatta gtggtaatgg taaacactgg tgtgttttga agttgaatgt gcgataaaat 600tcagtgatta gtggtaatgg taaacactgg tgtgttttga agttgaatgt gcgataaaat 600

tattagcctt aagattggta agctagcaat gaatgctagg gtgggaagct ggtgagccag 660tattagcctt aagattggta agctagcaat gaatgctagg gtgggaagct ggtgagccag 660

tggccattag ataaatacct ttcaagtgtg agcttagacg tcaaccctaa aatacttaac 720tggccattag ataaatacct ttcaagtgtg agcttagacg tcaaccctaa aatacttaac 720

cgtaatgcta attgtgatca ttatgaatcc cttcagtcac attaggggga aagtagttgg 780cgtaatgcta attgtgatca ttatgaatcc cttcagtcac attaggggga aagtagttgg 780

ctataagtac gtcattctta gtccagtcag tcttaaaaac atcttgggtt acccactctg 840ctataagtac gtcattctta gtccagtcag tcttaaaaac atcttgggtt acccactctg 840

tccactccca taggctacag aaaaagtcac aagcgcatgg tttccaacca tatgtgtttt 900tccactccca taggctacag aaaaagtcac aagcgcatgg tttccaacca tatgtgtttt 900

ctgcagttat ttctcttgtt ctggccaaac aaccctaaaa atccttacca ttccacaaag 960ctgcagttat ttctcttgtt ctggccaaac aaccctaaaa atccttacca ttccacaaag 960

ttggaccatc acttgtgcac ccactttgac tatgagtata ccaccacatt gcatttctgt 1020ttggaccatc acttgtgcac ccactttgac tatgagtata ccaccacatt gcatttctgt 1020

ttgcaccatg tcttccagga gactagacta ctgttgtcca gggtcaattt gagtgtaaag 1080ttgcaccatg tcttccagga gactagacta ctgttgtcca gggtcaattt gagtgtaaag 1080

aaaatgtaga caaggaattg cccaatttta aattctgact ttgctgactt aatttaaatg 1140aaaatgtaga caaggaattg cccaatttta aattctgact ttgctgactt aatttaaatg 1140

ctcgttctga accaattttc tcctatcttc tctaggggtt tcaaaagact cagttaattg 1200ctcgttctga accaattttc tcctatcttc tctaggggtt tcaaaagact cagttaattg 1200

atttccagga agtactcata gcaagttcat aaaagttctt gagacctaaa tttcttcaca 12601260

aaaaaagaaa agatcttaag tcatacattt taattgtgta gaggttgttc aactgaagga 13201320

ataaatgtct attaaactaa aacaaatgga ccttc 1355ataaatgtct attaaactaa aacaaatgga ccttc 1355

<210> 78<210> 78

<211> 2017<211> 2017

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 78<400> 78

gcaattcttc tgcctcggcc tcccaaatag ccaggactac aggcgcacac tgccatgccc 60gcaattcttc tgcctcggcc tcccaaatag ccaggactac aggcgcacac tgccatgccc 60

agctaagttt tgtattttta gtagagactg ggtttcacta tgttggccag gctggtctcg 120agctaagttt tgtattttta gtagagactg ggtttcacta tgttggccag gctggtctcg 120

aactcctgac ctcaagtgat ccacctgcct tggcctccca aagtgctggg attacaggcg 180aactcctgac ctcaagtgat ccacctgcct tggcctccca aagtgctggg attacaggcg 180

tgagccacca cccccagccc aatttttatt ttttgtacag acaggatctc actatgttgc 240tgagccacca cccccagccc aattttttatt ttttgtacag acaggatctc actatgttgc 240

ccaggttggt ctcaaactac tggcctcaag caatcctgcc ttggcctccc aaagtgctgg 300ccaggttggt ctcaaactac tggcctcaag caatcctgcc ttggcctccc aaagtgctgg 300

aattatagga atgagccacc acaccgggcc caaatttact ttagtaataa caacaattgg 360aattatagga atgagccacc acaccggggcc caaatttact ttagtaataa caacaattgg 360

ctgggtgcgg tggctcacgc ctgcaatccc aacactttcg gtaaccaagg tgggcttgag 420ctgggtgcgg tggctcacgc ctgcaatccc aacactttcg gtaaccaagg tgggcttgag 420

ctcatgagtt agagagcagc ctgagcaacg tggtgagagc ccatctcaca aaaaataaca 480ctcatgagtt agagagcagc ctgagcaacg tggtgagagc ccatctcaca aaaaataaca 480

aatcagctgg gcatggtgtt gcacgcctgt agtctccgaa atcacaccac tgcactccca 540aatcagctgg gcatggtgtt gcacgcctgt agtctccgaa atcacaccac tgcactccca 540

tcttgggtga tagagccaga acttgtctca aaaataacaa ttggtttctt acaatcccaa 600tcttgggtga tagagccaga acttgtctca aaaataacaa ttggtttctt acaatcccaa 600

aaggtgcagt tactagtatt aatccttttt tgccaatgag gaaacacaaa gatgaagcaa 660aaggtgcagt tactagtatt aatccttttt tgccaatgag gaaacacaaa gatgaagcaa 660

cttgctcaaa gtcatacagt gacagtctga attcaaatcc tatacactta aagtttattt 720cttgctcaaa gtcatacagt gacagtctga attcaaatcc tatacactta aagtttattt 720

gttttgtttt ggtttttttt gagatggagt ctcactgtgt cgcaaggctg gagtgcagtg 780gttttgtttt ggtttttttt gagatggagt ctcactgtgt cgcaaggctg gagtgcagtg 780

gcacgatctc agctcactgc aacccgggtt caagcgattc tcctgcctca gcctcccgag 840gcacgatctc agctcactgc aacccggggtt caagcgattc tcctgcctca gcctcccgag 840

tagctgggac tacaggcacg caccaccaca cccagctaat ttttgtattt ttagtagaga 900tagctgggac tacaggcacg caccaccaca cccagctaat ttttgtattt ttagtagaga 900

cggtttcacc atgttggcca ggatggtctc gagctcctga cctcaggtga tcctcccgcc 960cggtttcacc atgttggcca ggatggtctc gagctcctga cctcaggtga tcctcccgcc 960

ttggcctccc aaagtgccgg gattacaggt gtcagccact gcacgtggcc aacttaaagt 1020ttggcctccc aaagtgccgg gattacaggt gtcagccact gcacgtggcc aacttaaagt 1020

ttttgataga taatacatta acgttaaaaa ttcaaaagat aagtataggc tctacagtac 1080ttttgataga taatacatta acgttaaaaa ttcaaaagat aagtataggc tctacagtac 1080

aaacccttct gcctcctagt tcctctccct ggaggcaagg tgatcagttt aacaatattt 1140aaacccttct gcctcctagt tcctctccct ggaggcaagg tgatcagttt aacaatattt 1140

ttttattttg agacagggtc tcactgttgc ccaggctgga gtgtagtggc gcgttcacaa 1200ttttattttg agacagggtc tcactgttgc ccaggctgga gtgtagtggc gcgttcacaa 1200

cttactgtag cctcaacctc ctggctcaag caatcctccc acctcagcct gtcgagtagc 1260cttactgtag cctcaacctc ctggctcaag caatcctccc acctcagcct gtcgagtagc 1260

tggaaccaca ggtgcacacc accatgccag gctaattttt gtattttttg tagagacagg 1320tggaaccaca ggtgcacacc accatgccag gctaattttt gtattttttg tagagacagg 1320

gtttcaccat gttgttcagg ctggtctcaa agtcctgggc tcaagcaatc ttcctgtctc 13801380

tgcttcccaa agtgctggga ttacagatgt gggccacggt gcctggccta catatgtatt 1440tgcttcccaa agtgctggga ttacagatgt gggccacggt gcctggccta catatgtatt 1440

ttttcctttt cttccccaag tggtaggata tgatacacat tgttgatttt tttgtttagt 1500ttttcctttt cttccccaag tggtaggata tgatacacat tgttgatttt tttgtttagt 1500

tatgtatctc agagcttatt ctttatcagc tcatgaggaa cttcattttt tttttttttt 15601560

ttgagatgta gttttgctct tatagcccag gttggagtac agtaacacaa tcttggctcg 1620ttgagatgta gttttgctct tatagcccag gttggagtac agtaacacaa tcttggctcg 1620

cagcaacttc tgcctcccag gttcaagcga ttctcctgcc tcagcctccg agtagctagg 1680cagcaacttc tgcctcccag gttcaagcga ttctcctgcc tcagcctccg agtagctagg 1680

attacaggtg cctgccacta catccagcta tttttgtatt ttcagtagag acggggtttc 1740attacaggtg cctgccacta catccagcta tttttgtatt ttcagtagag acggggtttc 1740

accattttgg ccaagctggt ctcgaactcc tgacctcagg tgatccgccc atctcagcct 1800accattttgg ccaagctggt ctcgaactcc tgacctcagg tgatccgccc atctcagcct 1800

cccaaagtag tgggattaca ggcatgagca accgtgcccg gctggaactt cattcttttg 18601860

gtataactgc atggtatccc atcatgtgga tgtaccatga ttcattggat gtggaccctc 1920gtataactgc atggtatccc atcatgtgga tgtaccatga ttcattggat gtggaccctc 1920

ctgatggaca tttaaatttc ttccaatctg ttgctattac aaaaagaaaa atgtgtgcat 1980ctgatggaca tttaaatttc ttccaatctg ttgctattac aaaaagaaaa atgtgtgcat 1980

acatctttat tcatctgtag aataaattct tagaagt 2017acatctttat tcatctgtag aataaattct tagaagt 2017

<210> 79<210> 79

<211> 37<211> 37

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 79<400> 79

ggtttttata caagaaaaat aaagtgaatt aagcgtg 37ggtttttata caagaaaaat aaagtgaatt aagcgtg 37

<210> 80<210> 80

<211> 140<211> 140

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 80<400> 80

gtggcaatca taaaaagtaa taaaggttct ttttgacctg ttgacaaatg tatttaagcc 60gtggcaatca taaaaagtaa taaaggttct ttttgacctg ttgacaaatg tatttaagcc 60

tttggattta aagcctgttg aggctggagt taggaggcag attgatagta ggattataat 120tttggattta aagcctgttg aggctggagt taggaggcag attgatagta ggattataat 120

aaacattaaa taatcagttc 140aaacattaaataatcagttc 140

<210> 81<210> 81

<211> 55<211> 55

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 81<400> 81

acaagattcc tcaaaatatt ttctgttaat aaattgcctt catgtaaact gtttc 55acaagattcc tcaaaatatt ttctgttaat aaattgcctt catgtaaact gtttc 55

<210> 82<210> 82

<211> 1485<211> 1485

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 82<400> 82

gggcttccaa tgtgctgccc ccctcttaat actcaccaat aaattctact tcctgtccac 60gggcttccaa tgtgctgccc ccctcttaat actcaccaat aaattctact tcctgtccac 60

ctatgtcttt gtatctacat tcttgacggg gaaggaactt cctctgggaa cctttgggtc 120ctatgtcttt gtatctacat tcttgacggg gaaggaactt cctctgggaa ccttttgggtc 120

attgcccttt cacttcagaa acaggttgac aactcagccc tgctcatgag gcagcaaacc 180attgcccttt cacttcagaa acaggttgac aactcagccc tgctcatgag gcagcaaacc 180

ctgcaaaggg ctgggactgg tggccttatg tcagttgtct actctggagc ttgacttgga 240ctgcaaaggg ctgggactgg tggccttatg tcagttgtct actctggagc ttgacttgga 240

cctccccagg tcctaggcag taggttgaaa aacactgaag tgcttttcat gaagcacagc 300cctccccagg tcctagggcag taggttgaaa aacactgaag tgcttttcat gaagcacagc 300

tgcagcaaag ccttgcaatc ccaggctggg gtcagcctac agttgtgttg cttattacaa 360tgcagcaaag ccttgcaatc ccaggctggg gtcagcctac agttgtgttg cttattacaa 360

cacatgcgga ccaagagggg cttgtgggct agaggctgac cagcagcgtt tatttagcaa 420cacatgcgga ccaagagggg cttgtgggct agaggctgac cagcagcgtt tatttagcaa 420

gggtaggtgt gcatcacatt gggcttgttc tcacccatct ggtttggcca ttcctccttg 480gggtaggtgt gcatcacatt gggcttgttc tcacccatct ggtttggcca ttcctccttg 480

gtgggaatca tccaggtact gctgaggtca cctgcgattt gccccatttc ctatctctag 540gtgggaatca tccaggtact gctgaggtca cctgcgattt gccccatttc ctatctctag 540

caacctcctg ggccccatgc ccccacccct tctagaacct gcattcccag ggccttcacc 600caacctcctg ggccccatgc ccccacccct tctagaacct gcattcccag ggccttcacc 600

acctgaccaa aggtctaggc taacctttgg tcatttgtaa caagacctcg gaacagacac 660acctgaccaa aggtctaggc taacctttgg tcatttgtaa caagacctcg gaacagacac 660

gtgtgtggca tggtttggcc tggggatctt agatgtctga cctgaactat tgtagaacag 720gtgtgtggca tggtttggcc tggggatctt agatgtctga cctgaactat tgtagaacag 720

cgctggcttt tgggggagca gcaaaaatga gaggagtgct aggtgggtgg cctgagcatc 780cgctggcttt tgggggagca gcaaaaatga gaggagtgct aggtgggtgg cctgagcatc 780

tgtatccagg gacaggactc caaaggcttt tggtcccaga gctggggtat gttggcccca 840tgtatccagg gacaggactc caaaggcttt tggtcccaga gctggggtat gttggcccca 840

gcccccagcc tgtggctccc aaaaggcctc tggttttttg taatctcagt ttacagccat 900gcccccagcc tgtggctccc aaaaggcctc tggttttttg taatctcagt ttacagccat 900

ttcttaggtt tttaattacc tttattttat tttgccaaac atacctggga atacctttta 960ttcttaggtt tttaattacc tttattttat tttgccaaac atacctggga atacctttta 960

tttttttttt accttggggt gatggttcca aaccataaat gtgattatag ttaacacatg 1020tttttttttt accttggggt gatggttcca aaccataaat gtgattatag ttaacacatg 1020

acccttctag cgtcccagcc agtgtttttc ctgacctctg ttctttggag aggaggatgg 1080acccttctag cgtcccagcc agtgtttttc ctgacctctg ttctttggag aggaggatgg 1080

aagggagggg tccggcacgc tgctggcatt ttgctgtgtc ctgcagcccc tttccgggac 1140aagggagggg tccggcacgc tgctggcatt ttgctgtgtc ctgcagcccc tttccgggac 1140

acctgggttc acacagcttt ttagcttaca taactggtgc agattttctg tgtggagatg 1200acctgggttc acacagcttt ttagcttaca taactggtgc agattttctg tgtggagatg 1200

ttgccttgac cagccttggc tggactttac caggcatgca gaagcctgta ccaacacaga 1260ttgccttgac cagccttggc tggactttac caggcatgca gaagcctgta ccaacacaga 1260

ctacagcacc caggaggtgc gagtgtggct gctcagcggt tataacaggc ctgactgcat 1320ctacagcacc caggaggtgc gagtgtggct gctcagcggt tataacaggc ctgactgcat 1320

tgttcaccgg attataatga gccaaaatgt ttcccggtgt ttgctggttt cagggaagga 1380tgttcaccgg attataatga gccaaaatgt ttcccggtgt ttgctggttt cagggaagga 1380

gtttgatata gcagattaac caccctcctt gtagctattg gggcttaatg gtttcctggt 1440gtttgatata gcagattaac caccctcctt gtagctattg gggcttaatg gtttcctggt 1440

gattcttacc aatccacaat aaacatggcc cattggcata tctgc 1485gattcttacc aatccacaat aaacatggcc cattggcata tctgc 1485

<210> 83<210> 83

<211> 31<211> 31

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 83<400> 83

ggcacatttg aataaattct attaccagtt c 31ggcacatttg aataaattct attaccagtt c 31

<210> 84<210> 84

<211> 39<211> 39

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 84<400> 84

ggggcgcatt gtcaataaag cacagctggc tgagactgc 39ggggcgcatt gtcaataaag cacagctggc tgagactgc 39

<210> 85<210> 85

<211> 486<211> 486

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 85<400> 85

gcccaataaa gactgttaat tcctcatgcg ttgcctgccc ttcctccatt gttgccctgg 60gcccaataaa gactgttaat tcctcatgcg ttgcctgccc ttcctccatt gttgccctgg 60

aatgtacggg acccaggggc agcagcagtc caggtgccac aggcagccct gggacatagg 120aatgtacggg acccaggggc agcagcagtc caggtgccac aggcagccct gggacatagg 120

aagctgggag caaggaaagg gtcttagtca ctgcctcccg aagttgcttg aaagcactcg 180aagctgggag caaggaaagg gtcttagtca ctgcctcccg aagttgcttg aaagcactcg 180

gagaattgtg caggtgtcat ttatctatga ccaataggaa gagcaaccag ttactatgag 240gagaattgtg caggtgtcat ttatctatga ccaataggaa gagcaaccag ttactatgag 240

tgaaagggag ccagaagact gattggaggg ccctatcttg tgagtggggc atctgttgga 300tgaaagggag ccagaagact gattggaggg ccctatcttg tgagtggggc atctgttgga 300

ctttccacct ggtcatatac tctgcagctg ttagaatgtg caagcacttg gggacagcat 360ctttccacct ggtcatatac tctgcagctg ttagaatgtg caagcacttg gggacagcat 360

gagcttgctg ttgtacacag ggtatttcta gaagcagaaa tagactggga agatgcacaa 420gagcttgctg ttgtacacag ggtatttcta gaagcagaaa tagactggga agatgcacaa 420

ccaaggggtt acaggcatcg cccatgctcc tcacctgtat tttgtaatca gaaataaatt 480ccaaggggtt acaggcatcg cccatgctcc tcacctgtat tttgtaatca gaaataaatt 480

gctttt 486gctttt 486

<210> 86<210> 86

<211> 44<211> 44

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 86<400> 86

gcccctcccc tgccctctcc ctgaaataaa gaacagcttg acag 44gcccctcccc tgccctctcc ctgaaataaa gaacagcttg acag 44

<210> 87<210> 87

<211> 406<211> 406

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 87<400> 87

gtgtcatctt ttattatgaa gacaataaaa tcttgagttt atgttcactt catttgtttg 60gtgtcatctt ttattatgaa gacaataaaa tcttgagttt atgttcactt catttgtttg 60

ctgttcatct tttgggaggg aataagctag agccatcaat acaattccgc ttgtggggaa 120ctgttcatct tttgggggg aataagctag agccatcaat acaattccgc ttgtggggaa 120

atttatgcct cttactggta ctacttgttt tgcattgaag ctgactggtt gagttcacat 180180

catatgttgc aattttctaa tttggcactt caatcactag gggccttatg aggcagtttg 240catatgttgc aattttctaa tttggcactt caatcactag gggccttatg aggcagtttg 240

tcattatgca atggttattg gttatcatgt gagtagacac atttcaggct aatagggaga 300tcattatgca atggttattg gttatcatgt gagtagacac atttcaggct aatagggaga 300

agtcagtaac acattcatag tgaatatgag atgtctttgc taagagttaa gtgtcagatc 360agtcagtaac acattcatag tgaatatgag atgtctttgc taagagttaa gtgtcagatc 360

tttgttataa cagttaattt aataaagaat tttggcattg ttcttc 406tttgttataa cagttaattt aataaagaat tttggcattg ttcttc 406

<210> 88<210> 88

<211> 1994<211> 1994

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 88<400> 88

ttgccgtaag gatatgcact tgtctctagt ccacacactt catgatatag gtatagcgtt 60ttgccgtaag gatatgcact tgtctctagt ccacacactt catgatatag gtatagcgtt 60

agtttagcga agttttcact gcactgatat atctagtagg tgatggagct gggaatgcaa 120agtttagcga agttttcact gcactgatat atctagtagg tgatggagct gggaatgcaa 120

ctcatgtctg actagtccac aatactgcac tatttcagtg tttacgattt tttatccttt 180180

cccttctgaa gaggcaaaaa attgaggaat gtgccctgct ttcctaagaa ctgaagtgtg 240cccttctgaa gaggcaaaaa attgaggaat gtgccctgct ttcctaagaa ctgaagtgtg 240

agtacactgg taaatccttt catttgcctt gttccttatc tgtcaatatg tctgaatcct 300agtacactgg taaatccttt catttgcctt gttccttatc tgtcaatatg tctgaatcct 300

cgcttgttgg ttgcactaag aattgttctg ttgtttctca tcacagaaat ctgcagtcaa 360360

ctacctgttc tcgtgaagtc ttaaaactct tatagaatag ccatttaggc ctttctgcta 420ctacctgttc tcgtgaagtc ttaaaactct tatagaatag ccatttaggc ctttctgcta 420

gcctcctgaa ttctgtattc tcaggctgag cgagtttctg tttactctca aaccttaggt 480gcctcctgaa ttctgtattc tcaggctgag cgagtttctg tttactctca aaccttaggt 480

gatttggcta actcttaaag taattagcac gatgattgga acggagcatt ctctccaaca 540gatttggcta actcttaaag taattagcac gatgattgga acggagcatt ctctccaaca 540

cagcatttct tttggcactt tgcttcttgt gcagtttagc tccagaaagt attaaggaat 600cagcatttct tttggcactt tgcttcttgt gcagtttagc tccagaaagt attaaggaat 600

gactttagtg ctcatttgga tgcagtaagt ggtttgatct cagggtggca aaaagaatgc 660gactttagtg ctcatttgga tgcagtaagt ggtttgatct cagggtggca aaaagaatgc 660

tttttttata ccttttcaca ttcggataac ttgtttagaa gacagaggtt ctaactaggt 720tttttttata ccttttcaca ttcggataac ttgtttagaa gacagaggtt ctaactaggt 720

tttggcctat taagaactgc aaactagcag cagcagaact ctggctaaag gggcaagctt 780tttggcctat taagaactgc aaactagcag cagcagaact ctggctaaag gggcaagctt 780

attaggaaat tgagtattta aaagttgagc taccatatga tccaacaatc ccactgctgg 840attaggaaat tgagtattta aaagttgagc taccatatga tccaacaatc ccactgctgg 840

gtatataccc agaagaaaat cggtatatca aagagatatc tgcactccta tgtttgttgt 900gtatataccc agaagaaaat cggtatatca aagagatatc tgcactccta tgtttgttgt 900

agcactgttt ataatagcta agatttagaa gcaaccttag tgtccatcgg gatgaatgga 960agcactgttt ataatagcta agatttagaa gcaaccttag tgtccatcgg gatgaatgga 960

taaagaaaat gtacctatac gcggccaggc acggtggctt gtgcctagca ctttggaaag 1020taaagaaaat gtacctatac gcggccaggc acggtggctt gtgcctagca ctttggaaag 1020

ccgaggcggg tggatcacct gaggtcagga gttcgagacc agcctggcca agatagtgaa 1080ccgaggcggg tggatcacct gaggtcagga gttcgagacc agcctggcca agatagtgaa 1080

accccgtctc tagtaaaaat acaaaaatta gccgggcttg tggtgtgggc ctgtaatctc 1140accccgtctc tagtaaaaat acaaaaatta gccgggcttg tggtgtgggc ctgtaatctc 1140

agccacccgg gaggctgagg caggagaatc gctggaacct gggaggcaga ggctgcagtg 1200agccacccgg gaggctgagg caggagaatc gctggaacct gggaggcaga ggctgcagtg 1200

agccgagatc acgccactgt actccagcct gggcgacaga gcaagactcc atctcaaaaa 1260agccgagatc acgccactgt actccagcct gggcgacaga gcaagactcc atctcaaaaa 1260

aaaaaaaaaa aaaaagggaa aaagaaaatg cacctataca cagtggtact attcagccat 1320aaaaaaaaaa aaaaagggaa aaagaaaatg cacctataca cagtggtact attcagccat 1320

aaaaagaatg agatccagtc atttacaaca acatgggtgg aactggagat cgttatgtta 13801380

agtgaaatag gcacacaaag acaagcatca catgttcttg tttgtgggat ctaaaaatca 1440agtgaaatag gcacacaaag acaagcatca catgttcttg tttgtgggat ctaaaaatca 1440

aaacaagtgg acttgtcata tagagagtag aaggatggtt accagaagct gagaacttct 1500aaacaagtgg acttgtcata tagagagtag aaggatggtt accagaagct gagaacttct 1500

ggtggcggga ggtggggatg gttaatgggt acaaaaagaa aaaagaatga attagaccaa 1560ggtggcggga ggtggggatg gttaatggggt acaaaaagaa aaaagaatga attagaccaa 1560

ctatttgata gcacgacagc gtgactaaag tcaataactt agttacatat tttaaaataa 1620ctatttgata gcacgacagc gtgactaaag tcaataactt agttacatat tttaaaataa 1620

cttagagtgt aattggattg tttgtacctc aaagaaaaaa tgcaataaaa ctttacagtg 16801680

gagaaaccta acaagcacta cctcagccag gtaatcaagg ttaacatcaa cagtcacgag 1740gagaaaccta acaagcacta cctcagccag gtaatcaagg ttaacatcaa cagtcacgag 1740

tcatgttgat atataccctt gataaggtgt gatgaaaatg acacttaaac ctaaaaatcc 1800tcatgttgat atataccctt gataaggtgt gatgaaaatg acacttaaac ctaaaaatcc 1800

ataaccctat ctaatgagaa aaataacaaa tcccaagagg ggcattttac aaaatacttg 1860ataaccctat ctaatgagaa aaataacaaa tcccaagagg ggcattttac aaaatacttg 1860

accagtagtg cggaaattgt caaggtcatc aaaaaagtct gagaaattgc cacagccaaa 1920accagtagtg cggaaattgt caaggtcatc aaaaaagtct gagaaattgc cacagccaaa 1920

ggagtctaga gacatgatga ctaaatgtta ggtggtgtcc tgcgtggggt cctagaacag 1980ggagtctaga gacatgatga ctaaatgtta ggtggtgtcc tgcgtggggt cctagaacag 1980

aaaaaggaca ttag 1994aaaaaggaca ttag 1994

<210> 89<210> 89

<211> 307<211> 307

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 89<400> 89

accgctagct tgttgcaccg tggaggccac aggagcagaa acatggaatg ccagacgctg 60accgctagct tgttgcaccg tggaggccac aggagcagaa acatggaatg ccagacgctg 60

gggatgctgg tacaagttgt gggactgcat gctactgtct agagcttgtc tcaatggatc 120gggatgctgg tacaagttgt gggactgcat gctactgtct agagcttgtc tcaatggatc 120

tagaacttca tcgccctctg atcgccgatc acctctgaga cccaccttgc tcataaacaa 180tagaacttca tcgccctctg atcgccgatc acctctgaga cccaccttgc tcataaacaa 180

aatgcccatg ttggtcctct gccctggacc tgtgacattc tggactattt ctgtgtttat 240aatgcccatg ttggtcctct gccctggacc tgtgacattc tggactattt ctgtgtttat 240

ttgtggccga gtgtaacaac catataataa atcacctctt ccgctgtttt agctgaagaa 300ttgtggccga gtgtaacaac catataataa atcacctctt ccgctgtttt agctgaagaa 300

ttaaatc 307ttaaatc 307

<210> 90<210> 90

<211> 38<211> 38

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 90<400> 90

gtctgtaggc cttgtctgtt aataaatagt ttatatac 38gtctgtaggc cttgtctgtt aataaatagt ttatatac 38

<210> 91<210> 91

<211> 133<211> 133

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 91<400> 91

agtgtctagc agtgagctgg agattggatc acagccgaag gagtaaaggt gctgcaatga 60agtgtctagc agtgagctgg agattggatc acagccgaag gagtaaaggt gctgcaatga 60

tgttagctgt ggccactgtg gatttttcgc aagaacatta ataaactaaa aacttcatgt 120tgttagctgt ggccactgtg gatttttcgc aagaacatta ataaactaaa aacttcatgt 120

gtctggttgt ttg 133gtctggttgt ttg 133

<210> 92<210> 92

<211> 1802<211> 1802

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 92<400> 92

tgtcactgcc atggccgcct tgctgcattt ctgaggatgc ttcatctctc caccttcttc 60tgtcactgcc atggccgcct tgctgcattt ctgaggatgc ttcatctctc caccttcttc 60

tccactcagc agccagcagg gcactgtgga aatcggagtc acatgagctg gcacctctgt 120tccactcagc agccagcagg gcactgtgga aatcggagtc acatgagctg gcacctctgt 120

tcagaaccct ccagggctcc acatctctct cacccaaatg ccaaagacct ccccacgccc 180tcagaaccct ccagggctcc acatctctct cacccaaatg ccaaagacct cccccgccc 180

ccacaatccc ccacgacctg gccactggcc tcccaccacc ttccagctcc agcggctcct 240ccacaatccc ccacgacctg gccactggcc tcccaccacc ttccagctcc agcggctcct 240

accacattta aggctttcct tcctagtttt aatttttcct cgtcagcagt tgattttatt 300accacattta aggctttcct tcctagtttt aatttttcct cgtcagcagt tgattttatt 300

attttcttgt ttattggtat tttcccacta gaaatgaagc tgcgtgaagt tagagatttt 360360

tttttttggt ctgtgttcct aattagctca ttgctatacc cctggcgccc agaacaatgc 420tttttttggt ctgtgttcct aattagctca ttgctatacc cctggcgccc agaacaatgc 420

cttggacaca gtacgcagta gactaaataa atacttgttg aatgactgac tgacggaatg 480cttggacaca gtacgcagta gactaaataa atacttgttg aatgactgac tgacggaatg 480

acggctgtgt ggggagtgga ttgggtcgtg aggcagaggc tgcggtggaa actcaggcag 540acggctgtgt ggggagtgga ttgggtcgtg aggcagaggc tgcggtggaa actcaggcag 540

gaggtgatgg tggttcttgg ggctgcggaa tgccaagttt agaagctctt cctctgctgt 600gaggtgatgg tggttcttgg ggctgcggaa tgccaagttt agaagctctt cctctgctgt 600

ggcacatgaa ccggtcactc gagaaggctt ttagatttac tttgcctaat cccctcttag 660ggcacatgaa ccggtcactc gagaaggctt ttagatttac tttgcctaat cccctcttag 660

tgcatgtggg gaaactgagg tacacaaaag gaattcccca ccaagttagg ggcagaacct 720tgcatgtggg gaaactgagg tacacaaaag gaattcccca ccaagttagg ggcagaacct 720

agcccccttg tctcccagat ggatatcttc tttttttttt gagacggagt cttgctctgt 780agcccccttg tctcccagat ggatatcttc tttttttttt gagacggagt cttgctctgt 780

tgcccaggct ggagtgcagt ggtaccatct tggctcactg caacctctgc ttcccaggtt 840tgcccaggct ggagtgcagt ggtaccatct tggctcactg caacctctgc ttcccaggtt 840

caagcgattc tcctgcctca gcctcctgag tgtctgcgat tacaggtgca cacaaccacg 900caagcgattc tcctgcctca gcctcctgag tgtctgcgat tacaggtgca cacaaccacg 900

cctggctaat ttttgtattt ttagtagaga cggggtttca ccgtgttggt cagggtgacc 960cctggctaat ttttgtattt ttagtagaga cggggtttca ccgtgttggt cagggtgacc 960

tcaaactcct gacctcatga tccacccagc tcagcctccc aacgtgctgg gattacaggc 1020tcaaactcct gacctcatga tccacccagc tcagcctccc aacgtgctgg gattacaggc 1020

atgagccacc gtgcctggct ggacatcttg ttattaaagc ttcttctctc tttgtagggg 1080atgagccacc gtgcctggct ggacatcttg ttattaaagc ttcttctctc tttgtagggg 1080

agggggagat gcctctggtg gagaagacca gtgtggcagt gactgtgtct gttagtgaac 1140agggggagat gcctctggtg gagaagacca gtgtggcagt gactgtgtct gttagtgaac 1140

ctggtggctg gttgagggtc tgtcgtggtg actgaggaca catacaaagt gcttttctca 1200ctggtggctg gttgagggtc tgtcgtggtg actgaggaca catacaaagt gcttttctca 1200

gtggtcacct tggtgttggt gaataagggt cagaagatgg ctcctgtcct agggcactgc 1260gtggtcacct tggtgttggt gaataagggt cagaagatgg ctcctgtcct agggcactgc 1260

cagtcggttt ggaagctgaa atgcctgctt agcagtttga ggaaacacag accttggagg 1320cagtcggttt ggaagctgaa atgcctgctt agcagtttga ggaaacacag accttggagg 1320

atcttctggt tgcctcttca agaattcatt ctattcccct tctgctcccc aaatttgctt 1380atcttctggt tgcctcttca agaattcatt ctattcccct tctgctcccc aaatttgctt 1380

ttcttggggt gggtcttggt tggcctaagc caagaaagta tggcatctac tccttccata 1440ttcttggggt gggtcttggt tggcctaagc caagaaagta tggcatctac tccttccata 1440

gcaatagctc aggaataggc agtgacccag acctgaacca atcagtgcat ggaattaccc 1500gcaatagctc aggaataggc agtgacccag acctgaacca atcagtgcat ggaattaccc 1500

ctggccaaag tggttgattg aggctgggtg caagcagagt tgtgagaagg ctcccatttg 15601560

gtggttggag agatcgcact tgctccagag gtcataatgt gcagatctga ggcttggaac 1620gtggttggag agatcgcact tgctccagag gtcataatgt gcagatctga ggcttggaac 1620

tgctgcagac attttgctac cacaagtgaa gccaccctga cgacacagtt gacaatttgg 16801680

agcagggcag agctgagaga acagcaggga aacagccaga gtcttgctca agcctccctg 1740agcagggcag agctgagaga acagcaggga aacagccaga gtcttgctca agcctccctg 1740

aagtatctat acccctggac tctagttatg ggggctaata aatgttatat actgtttaag 1800aagtatctat acccctggac tctagttatg ggggctaata aatgttatat actgtttaag 1800

gt 1802gt 1802

<210> 93<210> 93

<211> 34<211> 34

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 93<400> 93

tgctgagggc ctcaataaag tttgtgttta tgcc 34tgctgagggc ctcaataaag tttgtgttta tgcc 34

<210> 94<210> 94

<211> 502<211> 502

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 94<400> 94

aaaaatgaaa cttttttgag taataaaaat gaaaagacgc tgtccaatag aaaaagttgg 6060

tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120tgtgctggag ctacctcacc tcagcttgag agagccagtt gtgtgcatct ctttccagtt 120

ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180ttgcatccag tgacgtctgc ttggcatctt gagattgtta tggtgagagt atttacacct 180

cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240cagcaaatgc tgcaaaatcc tgttttcccc cagagagctg gaggttaaat actaccagca 240

catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300catccctaga tactactcaa gttacagtat atgatcacta atatagtatg ctcttggtac 300

caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360caggagctct gatatatatc tggtacatgt ttgataatga cttgattgtt attataagta 360

cttattaata cttcgattct gtaaagagtt tagggtttga ttttataaaa tccaaaatga 420cttattaata cttcgattct gtaaaagtt tagggtttga ttttataaaa tccaaaatga 420

gccttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480gcctttttatt gaatccagtt ctctatgtga ccagttctct gtatgaatgg aagggaaaag 480

aattaaaaat cttgcaaagg gg 502aattaaaaat cttgcaaagg gg 502

<210> 95<210> 95

<211> 502<211> 502

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 95<400> 95

aaaaatgaaa cttttttgag taataaaaat gaaaagacgc tgtccaatag aaaaagttgg 6060

aattaaaaat cttgcaaagg gg 502aattaaaaat cttgcaaagg gg 502

<210> 96<210> 96

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 96<400> 96

attttttctg tagtgctgta ttattttcaa taaatctggg acaacagc 48attttttctg tagtgctgta ttatttttcaa taaatctggg acaacagc 48

<210> 97<210> 97

<211> 171<211> 171

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 97<400> 97

gctgttcttg cataggctct taagcagcat ggaaaaatgg ttgatggaaa ataaacatca 60gctgttcttg cataggctct taagcagcat ggaaaaatgg ttgatggaaa ataaacatca 60

gtttctaaaa gttgtcttca tttagtttgc tttttactcc agatcagaat acctgggatt 120gtttctaaaa gttgtcttca tttagtttgc tttttactcc agatcagaat acctgggatt 120

gcatatcaaa gcataataat aaatacatgt ctcgacatga gttgtacttc t 171gcatatcaaa gcataataat aaatacatgt ctcgacatga gttgtacttc t 171

<210> 98<210> 98

<211> 2309<211> 2309

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 98<400> 98

ggtggttctt tccttgaagg gcagcctcct gcccaggccc cgtggccctg gagcctcaat 60ggtggttctt tccttgaagg gcagcctcct gcccaggccc cgtggccctg gagcctcaat 60

aaagtgtccc tttcattgac tggagcagca attggtgtcc tcatggctga tctgtccagg 120aaagtgtccc tttcattgac tggagcagca attggtgtcc tcatggctga tctgtccagg 120

gaggtggctg aagagtgggc atctccctta gggactctac tcagcactcc attctgtgcc 180gaggtggctg aagagtgggc atctccctta gggactctac tcagcactcc attctgtgcc 180

acctgtgggg tcttctgtcc tagattctgt cacatcggca ttggtccctg ccctatgccc 240acctgtgggg tcttctgtcc tagattctgt cacatcggca ttggtccctg ccctatgccc 240

ctgactctgg atttgtcatc tgtaaaactg gagtaaaaac ctcagtcgtg taattggtgg 300ctgactctgg atttgtcatc tgtaaaactg gagtaaaaac ctcagtcgtg taattggtgg 300

gactgaggat cagttttgtc attgctggga tcctgtcagg cactttgagg tgtccctcag 360gactgaggat cagttttgtc attgctggga tcctgtcagg cactttgagg tgtccctcag 360

gccttggccc tgaagtgtct aggtgtgtgg agatgggtag aaaattaggt acacccaatg 420gccttggccc tgaagtgtct aggtgtgtgg agatgggtag aaaattaggt acacccaatg 420

gtgtagaacg ttgattctca aattttttta ttttatacaa atggggtctc actatgttgt 480gtgtagaacg ttgattctca aattttttta ttttatacaa atggggtctc actatgttgt 480

ccaggctggt cttgaactcc tgggctcaag ccatccgccc atctcagccc ctcaaagtgt 540ccaggctggt cttgaactcc tgggctcaag ccatccgccc atctcagccc ctcaaagtgt 540

tgggattaca agcaagaact gccatgcctg acccagttct cagttttttg tttgtttgtt 600tgggattaca agcaagaact gccatgcctg acccagttct cagttttttg tttgtttgtt 600

tgtttgtttg ttttgagacg gagtcttgct ctgtcgccca ggctggagtg cagtggcgca 660tgtttgtttg ttttgagacg gagtcttgct ctgtcgccca ggctggagtg cagtggcgca 660

gtctcggctt actacaacct ctgcctccgg ggttcacatc cttctcctgc ctcagcctcc 720gtctcggctt actacaacct ctgcctccgg ggttcacatc cttctcctgc ctcagcctcc 720

cgagtagctg ggactacagg tgcccgccac aactcctggc taattttttg tatttttagt 780cgagtagctg ggactacagg tgcccgccac aactcctggc taatttttttg tatttttagt 780

agagacgggg tttcactggg ttagccaggt tggtctcgat ctcctgacct tgtgatccat 840agagacgggg tttcactgggg ttagccaggt tggtctcgat ctcctgacct tgtgatccat 840

tcgccttggc ctcccagaat gctggtatta caggcgtgag ccagcacgcc tggcccagtt 900tcgccttggc ctcccagaat gctggtatta caggcgtgag ccagcacgcc tggcccagtt 900

actcagtttt gaatctgagg ccgtgacatc actcatggtc tgcagtcagt gctctgcccc 960actcagtttt gaatctgagg ccgtgacatc actcatggtc tgcagtcagt gctctgcccc 960

tgagctgtac cctctcctat gataatcact cttaagaagg gcaacccttg gtgttttccc 1020tgagctgtac cctctcctat gataatcact cttaagaagg gcaacccttg gtgttttccc 1020

cttaaggtca cccaggctgg aatgcagtgg tgtggtcatg gctccctgta ccctggaact 1080cttaaggtca cccaggctgg aatgcagtgg tgtggtcatg gctccctgta ccctggaact 1080

caggcttggg tgatcctctc tcctttgcct ccgaagtagc caggactaca ggtgtgcacc 1140caggcttggg tgatcctctc tcctttgcct ccgaagtagc caggactaca ggtgtgcacc 1140

caccaccaca ctcagataat tgctttggtg tttttaaagc ttgtaatgat cagtaggctg 1200caccaccaca ctcagataat tgctttggtg tttttaaagc ttgtaatgat cagtaggctg 1200

aggtgggcaa atcataaggt caagagtttt ttagatgggg tgagcacaga ccaattcctg 12601260

ttttatttac tgatttaaaa ttttgagaca gtctcactgt cacccaggtt ggggtgcagt 1320ttttatttac tgatttaaaa ttttgagaca gtctcactgt cacccaggtt ggggtgcagt 1320

ggtaggatca tagcttgctg cagccttgat ctcccaggat cttgcctcag cctcccgagt 1380ggtaggatca tagcttgctg cagccttgat ctcccaggat cttgcctcag cctcccgagt 1380

agctgggact gcatgcttgt gccaccacac tcggttaata ttttgtagag atggggtctt 1440agctgggact gcatgcttgt gccaccacac tcggttaata ttttgtagag atggggtctt 1440

gctatgttgc ccaggctggc ttcaaactcc tgaacttaaa agcctcctgt ttagttttgg 1500gctatgttgc ccaggctggc ttcaaactcc tgaacttaaa agcctcctgt ttagttttgg 1500

ttttttatca cttttttttt ttttttttga gatggagcct tgctcccatc gtgcaggctg 1560ttttttatca cttttttttt ttttttttga gatggagcct tgctcccatc gtgcaggctg 1560

gagtgcggtg gcgcagtctc ggctcactgc agcttctgcc tctcgggttc aagcgattct 1620gagtgcggtg gcgcagtctc ggctcactgc agcttctgcc tctcgggttc aagcgattct 1620

cctttctcag cctcttgagt agctggaatt accagtgtgc gccaccacca ccacgcctgg 1680cctttctcag cctcttgagt agctggaatt accagtgtgc gccaccacca ccacgcctgg 1680

ctagtttttc tgtttttagt agagacaggg ttttgctatg ttggccaggc tggtcttgaa 1740ctagtttttc tgtttttagt agagacaggg ttttgctatg ttggccaggc tggtcttgaa 1740

ctactgacct cttgtgatct acctgtcttg gccttccaaa gtgctaggat tacaagcgta 1800ctactgacct cttgtgatct acctgtcttg gccttccaaa gtgctaggat tacaagcgta 1800

agccacagcg cctggccttg ctacattttt tttttttttt ttttttttac agacatggtc 1860agccacagcg cctggccttg ctacattttt tttttttttt ttttttttac agacatggtc 1860

tcgctatgtt gcccagaatg gttttgcact gggtccaagc agttctgccg cagcctccca 1920tcgctatgtt gcccagaatg gttttgcact gggtccaagc agttctgccg cagcctccca 1920

aagtgctggg attacagggg tgaggcacct tgctggcccc tgttttgatt agggtgcagt 1980aagtgctggg attacagggg tgaggcacct tgctggcccc tgttttgatt agggtgcagt 1980

gctggtgaag ccggtgcacg aggccagtga tgcatcctaa tgaggggtgg agttggcggg 2040gctggtgaag ccggtgcacg aggccagtga tgcatcctaa tgaggggtgg agttggcggg 2040

acttcctggg ccagtttggg gactttcaca aaagaccccc atgactcagg gttttgagtt 2100acttcctggg ccagtttgggg gactttcaca aaagaccccc atgactcagg gttttgagtt 2100

cttaactgat cgaatgaagg attcaaaatt aaccactcca aggggggatt gaaggaagaa 2160cttaactgat cgaatgaagg attcaaaatt aaccactcca aggggggatt gaaggaagaa 2160

ccactcttaa tggacaaaaa gaaagaaagg ggagggagta acagggatat gagctctagc 2220ccactcttaa tggacaaaaa gaaagaaagg ggagggagta acagggatat gagctctagc 2220

cgcccaagct agcaatggca acccttctgg gtccccttcc agcatgtgga agctttcctt 2280cgccaagct agcaatggca acccttctgg gtccccttcc agcatgtgga agctttcctt 2280

tcgcttcatt caataaacag ctgctgctc 2309tcgcttcatt caataaacag ctgctgctc 2309

<210> 99<210> 99

<211> 58<211> 58

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 99<400> 99

gtcttttgta attctggctt tctctaataa aaaagccact tagttcagtc atcgaaaa 58gtcttttgta attctggctt tctctaataa aaaagccact tagttcagtc atcgaaaa 58

<210> 100<210> 100

<211> 1502<211> 1502

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 100<400> 100

gcaaaggctc cccttacagg gctttgctta ttaataaaat aaatgaagta tacatgagaa 60gcaaaggctc cccttacagg gctttgctta ttaataaaat aaatgaagta tacatgagaa 60

ataccaagaa attggctttt agtttatcag tgaataaaaa atattatact cttgaacttt 120ataccaagaa attggctttt agtttatcag tgaataaaaa atattatact cttgaacttt 120

tgtctcattt ttttgagtat gctgtttata tgattttgat ttccctctga taactatcaa 180tgtctcattt ttttgagtat gctgtttata tgattttgat ttccctctga taactatcaa 180

cagtatttaa atagcttata gctggtataa ttttttccca cgatttccaa aatcttttat 240cagtatttaa atagcttata gctggtataa ttttttccca cgatttccaa aatcttttat 240

gtactcaggt aaaagtagcg ttatatagga aatctttttt ttagacactc tcgttctgtc 300gtactcaggt aaaagtagcg ttatatagga aatctttttt ttagacactc tcgttctgtc 300

acccaggctg gagtgcagtg actcagcttc ctaaatagct ggaattacag gtgtgagcca 360acccaggctg gagtgcagtg actcagcttc ctaaatagct ggaattacag gtgtgagcca 360

ccatgcccgg ctaatttttt gtacttttag tagagtaggg tttggccatg ttggccaggc 420ccatgcccgg ctaatttttt gtacttttag tagagtaggg tttggccatg ttggccaggc 420

tggtttcaaa ctcctgacct caagtgatct acccacctcg gcttcccaaa gtgctgatta 480tggtttcaaa ctcctgacct caagtgatct acccacctcg gcttcccaaa gtgctgatta 480

tagctgtgaa ccaccatgcc cggccaggaa atcttactgt agaacaattt tttatatagc 540tagctgtgaa ccaccatgcc cggccaggaa atcttactgt agaacaattt tttatatagc 540

tgtataaaat gtatatgatt gtcttgacag tctcaaatac tgtttttaat agcttgtaaa 600tgtataaaat gtatatgatt gtcttgacag tctcaaatac tgtttttaat agcttgtaaa 600

tgtaatctca agtgcttaga acagttctta catataagtt gctctgtagt ttgctcttat 660tgtaatctca agtgcttaga acagttctta catataagtt gctctgtagt ttgctcttat 660

agttagccca aagactctgg gtgtgaggcc tgctgtaaac caatgttaaa ctgcttatta 720agttagccca aagactctgg gtgtgaggcc tgctgtaaac caatgttaaa ctgcttatta 720

gaaagcccta accacctgct ttgtaggcac cagaaactca aaaccaaatc tcaactcagc 780gaaagcccta accacctgct ttgtaggcac cagaaactca aaaccaaatc tcaactcagc 780

tacagaatct actgtggtcc ttgtctgaaa aaattagttc actcggttgg aatcttgtct 840tacagaatct actgtggtcc ttgtctgaaa aaattagttc actcggttgg aatcttgtct 840

cagagcatcc tcatctcttt ctcaaaagcc cctaccccaa caccggcgtg ttggttgtct 900cagagcatcc tcatctcttt ctcaaaagcc cctaccccaa caccggcgtg ttggttgtct 900

attgaaactt acaagtggat ggaccctttc tcccgaataa actggccttt gaaagctcta 960attgaaactt acaagtggat ggaccctttc tcccgaataa actggccttt gaaagctcta 960

atcgaaatgg tttggcaaaa tccatactgc aggagattag ggaggacaag aatgatgtgc 1020atcgaaatgg tttggcaaaa tccatactgc aggagattag ggaggacaag aatgatgtgc 1020

ctttttgtac tgctgagcct gatggtggtg ccactacttc aggtacttag atgagtcttg 1080ctttttgtac tgctgagcct gatggtggtg ccactacttc aggtacttag atgagtcttg 1080

atgctaatag aattgtgtcg ccaaacatat ctggacagtt acaacctaat ctatgcatta 1140atgctaatag aattgtgtcg ccaaacatat ctggacagtt acaacctaat ctatgcatta 1140

attggtttgg gaattgcttg aaattattgt ttaattcaat gttttaattc gttttcctaa 1200attggtttgg gaattgcttg aaattattgt ttaattcaat gttttaattc gttttcctaa 1200

aaatttaagt gcccccatca tcgtgcaata cctcagtgca gcaactcctt gattcttgga 1260aaatttaagt gcccccatca tcgtgcaata cctcagtgca gcaactcctt gattcttgga 1260

tgactgaact tcctaacttg gctctgcccc attgttccca tttttcatgt ttttcacaaa 1320tgactgaact tcctaacttg gctctgcccc attgttccca tttttcatgt ttttcacaaa 1320

tagttaacca ggtacctact actgtgcacc gctgcagagc attgaggatg tatgtgatga 1380tagttaacca ggtacctact actgtgcacc gctgcagagc attgaggatg tatgtgatga 1380

gtaaaaacac ccagcctgct ctgctgtgtt agtattatga cggaaactga tcaaatcaca 1440gtaaaaacac ccagcctgct ctgctgtgtt agtattatga cggaaactga tcaaatcaca 1440

tgtgaacaaa tttactgcta caaaagggag ggcttaataa aaggaatttc atctgggaag 1500tgtgaacaaa tttactgcta caaaagggag ggcttaataa aaggaatttc atctgggaag 1500

gc 1502gc 1502

<210> 101<210> 101

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 101<400> 101

<210> 102<210> 102

<211> 193<211> 193

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 102<400> 102

ggaattgcac atgagatggc acacatattt atgctgtatc aagttcacga tcatcttacg 60ggaattgcac atgagatggc acacatattt atgctgtatc aagttcacga tcatcttacg 60

atatcaagct gaaaatgtca ccactacctg gacagttgca catgttttac tgggaatatt 120atatcaagct gaaaatgtca ccactacctg gacagttgca catgttttac tgggaatatt 120

tttttctgtt tttctgtatg ctctgtgcta gtagggtgga ttcagtaata aatatgtgaa 180tttttctgtt tttctgtatg ctctgtgcta gtagggtgga ttcagtaata aatatgtgaa 180

agcttttgtt tcc 193agcttttgtt tcc 193

<210> 103<210> 103

<211> 73<211> 73

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 103<400> 103

aggttttggc agtactgtct ccttgggcca tgctggtctg acttatgctt actaataaat 60aggttttggc agtactgtct ccttgggcca tgctggtctg acttatgctt actaataaat 60

tctgtttact ggc 73tctgtttact ggc 73

<210> 104<210> 104

<211> 93<211> 93

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 104<400> 104

actttgggat atttttcttc aattttgaag agaaaatggt gaagccatag aaaagttacc 60actttgggat atttttcttc aattttgaag agaaaatggt gaagccatag aaaagttacc 60

cgagggaaaa taaatacagt gatattctta cgc 93cgagggaaaa taaatacagt gatattctta cgc 93

<210> 105<210> 105

<211> 257<211> 257

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 105<400> 105

gctgtgtggg gtggatgaac cctgaagcgc accgcactgt ctgccccaat gtctaacaaa 60gctgtgtggg gtggatgaac cctgaagcgc accgcactgt ctgccccaat gtctaacaaa 60

ggccggaggc gactcttcct gcgaggtctc agagcgctgt gtaaccgccc aaggggttca 120ggccgggaggc gactcttcct gcgaggtctc agagcgctgt gtaaccgccc aaggggttca 120

ccttgcctgc tgcctagaca aagccgattc attaagacag gggaattgca atagagaaag 180ccttgcctgc tgcctagaca aagccgattc attaagacag gggaattgca atagagaaag 180

agtaattcac acagagctgg ctgtgcggga gaccggagtt ttatgtttta ttattactca 240agtaattcac acagagctgg ctgtgcggga gaccggagtt ttatgtttta ttattactca 240

aatcgatctc tttgagc 257aatcgatctc tttgagc 257

<210> 106<210> 106

<211> 692<211> 692

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 106<400> 106

tgattcaaac agcttcctga attttaattt tgtgttgtct cacagaaagc cttatcataa 60tgattcaaac agcttcctga attttaattt tgtgttgtct cacagaaagc cttatcataa 60

attccataat tctaattaat ttaccaagat aatgtaatta catttggttt tgtaaggtat 120attccataat tctaattaat ttaccaagat aatgtaatta catttggttt tgtaaggtat 120

acagcagtaa tctcctattt tggtgtcagt ttttcaataa agttttgatt atgggcaaat 180acagcagtaa tctcctattt tggtgtcagt ttttcaataa agttttgatt atgggcaaat 180

cccctctttt tcttttttta aaatatattt gagtatgcca tacatttata tatatggtgt 240240

atatgaattt ggtttaaaca ttttaaaatt tattctgatt agtttgtgtc tttttttttt 300300

tttttgagag agagagtcct gctctgtcac tcaagctgga gtgcagtggt gcgatctcgg 360tttttgagag agagagtcct gctctgtcac tcaagctgga gtgcagtggt gcgatctcgg 360

ctcactgcaa cctccgcctc ccaggtccaa gcaattctct tgccttgtcc tcccaagtag 420ctcactgcaa ccctccgcctc ccaggtccaa gcaattctct tgccttgtcc tcccaagtag 420

ctgggattat aggcacacac caccatgcct ggctaatttg tgtctcattt tcaagagtag 480ctgggattat aggcacacac caccatgcct ggctaatttg tgtctcattt tcaagagtag 480

aaaccctaaa tattttattt tcattccttt tccaaattgc tatgaatggg attaaaggat 540aaaccctaaa tattttattt tcattccttt tccaaattgc tatgaatggg attaaaggat 540

tacagatgta aagtctatta tttgtgaatt ctaaatgtag ttctgctgtt gtacctgtgg 600tacagatgta aagtctatta tttgtgaatt ctaaatgtag ttctgctgtt gtacctgtgg 600

aaacatctta aagaagtaca tattttgcac gtcctgcacg tgtaccccag aacttaaact 660aaacatctta aagaagtaca tattttgcac gtcctgcacg tgtaccccag aacttaaact 660

ataattaaaa agaatagttt caaaaaaata ca 692ataattaaaa agaatagttt caaaaaaata ca 692

<210> 107<210> 107

<211> 228<211> 228

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 107<400> 107

atagaacctg ttgtgcaacc acggtttaac cggagatttt gaggctaggg tgtgtttctt 60atagaacctg ttgtgcaacc acggtttaac cggagatttt gaggctaggg tgtgtttctt 60

tcgaactttt cggaatgtct ggaacatttc atttcctgtt ttgttacctg tgcctctgta 120tcgaactttt cggaatgtct ggaacatttc atttcctgtt ttgttacctg tgcctctgta 120

aatctacttt tgcaatttta agtaataatt ttatgaataa aaatgggaaa tgcttcctaa 180aatctacttt tgcaatttta agtaataatt ttatgaataa aaatgggaaa tgcttcctaa 180

ttccacatag tatttgcatt gttttataaa taaattccac ttactatc 228ttccacatag tatttgcatt gttttataaa taaattccac ttactatc 228

<210> 108<210> 108

<211> 529<211> 529

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 108<400> 108

acccaggtga ggcagggctg aaaactgccc ttgggctgac ttttgatagg ccatgccttg 60acccaggtga ggcagggctg aaaactgccc ttgggctgac ttttgatagg ccatgccttg 60

ccactttaca agttcttttt gcatttacta gtatttaaga gtaaccttga gattgggagg 120ccactttaca agttcttttt gcatttacta gtatttaaga gtaaccttga gattgggagg 120

aatagaggag gctggtacaa atagatggag acctgctggg atcagtgaat gcctgattag 180aatagaggag gctggtacaa atagatggag acctgctggg atcagtgaat gcctgattag 180

gacatggggc tatgcatagc ctaagagtta taggcttaaa gatgtcgagt aactaaaaac 240gacatggggc tatgcatagc ctaagagtta taggcttaaa gatgtcgagt aactaaaaac 240

tgtattgctg gccgggcgcg gtggctcacg cctgtaatcc cagcactttg ggaggccaag 300tgtattgctg gccgggcgcg gtggctcacg cctgtaatcc cagcactttg ggaggccaag 300

gcgggcagac catgaggtca ggagattgag accatcctgg ccaacatggt gaaaccctgt 360gcgggcagac catgaggtca ggagattgag accatcctgg ccaacatggt gaaaccctgt 360

ctctactaaa aatacaaaaa tgagctgggt gtggtggcac gtgcctgtag tcccagctac 420ctctactaaa aatacaaaaa tgagctgggt gtggtggcac gtgcctgtag tcccagctac 420

tcgagaggct aaggcaggaa aatcgcttga acccaggagg cagagattgc agtgagccaa 480tcgagaggct aaggcaggaa aatcgcttga acccaggagg cagagattgc agtgagccaa 480

gattgcacca gtgcactcca gctgggcgac agagcgagac tccatctcg 529gattgcacca gtgcactcca gctgggcgac agagcgagac tccatctcg 529

<210> 109<210> 109

<211> 174<211> 174

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 109<400> 109

gtggaaaaga acatgaaaaa gaaaactgac aaatacacac aggtctcctc aagatccatg 60gtggaaaaga acatgaaaaa gaaaactgac aaatacacac aggtctcctc aagatccatg 60

gacttctggt ctgagcctaa taaagactgt ttgtttattc ctcaaaaaca aacaaacaaa 120gacttctggt ctgagcctaa taaagactgt ttgtttattc ctcaaaaaca aacaaacaaa 120

aaaaaaccct ctgtattata aattattctg tgtaatggtg tgttaccata catt 174aaaaaaccct ctgtattata aattattctg tgtaatggtg tgttaccata catt 174

<210> 110<210> 110

<211> 156<211> 156

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 110<400> 110

atgctcctct actctttgag acatctctgg cctataacaa atgggttaat ttatgttaaa 60atgctcctct actctttgag acatctctgg cctataacaa atgggttaat ttatgttaaa 60

aaaaaaaaaa gagagagaga gtgaaacaac aatctacaca atcagagaaa atatttgcaa 120aaaaaaaaaa gagagagaga gtgaaacaac aatctacaca atcagagaaa atatttgcaa 120

atcttatatc tgattagaaa ttagtatctg gaacat 156atcttatatc tgattagaaa ttagtatctg gaacat 156

<210> 111<210> 111

<211> 46<211> 46

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 111<400> 111

aattggagag gattatttca cattgaataa acttacagcc aaaaaa 46aattggagag gattatttca cattgaataa acttacagcc aaaaaa 46

<210> 112<210> 112

<211> 67<211> 67

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 112<400> 112

tgtactt 67tgtactt 67

<210> 113<210> 113

<211> 294<211> 294

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 113<400> 113

ggaattgaac atgagatggc acacatattt atgctgtcta aaggtcacaa tcatgttacc 60ggaattgaac atgagatggc acacatattt atgctgtcta aaggtcacaa tcatgttacc 60

atatcaagct gaaaatgtca ccactatctg gacagttgga catgtttttt tgggaatata 120atatcaagct gaaaatgtca ccactatctg gacagttgga catgtttttt tgggaatata 120

ctttttctct ctgaatctgt taggaacttt ctggttggct gggttccgta ataaatacat 180ctttttctct ctgaatctgt taggaacttt ctggttggct gggttccgta ataaatacat 180

gagacctttc atttcaaaaa aaagaaaaat aggcctcctt cccaggggct ccggatttca 240gagacctttc atttcaaaaa aaagaaaaat aggcctcctt cccaggggct ccggatttca 240

tcagccttct gtgcatgccc agccatacaa accacgcagg gatggctcca agtg 294tcagccttct gtgcatgccc agccatacaa accacgcagg gatggctcca agtg 294

<210> 114<210> 114

<211> 171<211> 171

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 114<400> 114

tcaccaaaaa gcaaccaact tagccagctt tatttgcaaa acaaggaaat aaaggcttac 60tcaccaaaaa gcaaccaact tagccagctt tatttgcaaa acaaggaaat aaaggcttac 60

ttctttaaaa aataaataaa taaataaata aataaataat aaataaataa ataaataaat 120ttctttaaaa aataaataaa taaataaata aataaataat aaataaataa ataaataaat 120

aaatagataa ataaataaaa agttttctac tcacactgaa gtgacgaagt c 171aaatagataa ataaataaaa agttttctac tcacactgaa gtgacgaagt c 171

<210> 115<210> 115

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Homo sapiens<213> Homo sapiens

<400> 115<400> 115

gcccccttcc cctgccctct ccctgaaata aagaatagct tgacagaaa 49gcccccttcc ccctgccctct ccctgaaata aagaatagct tgacagaaa 49

<210> 116<210> 116

<211> 88<211> 88

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 116<400> 116

ggaggcctca gttcctggcc ccagaaacga gatcctgacc acatgaacaa tttgggctct 60ggaggcctca gttcctggcc ccagaaacga gatcctgacc acatgaacaa tttgggctct 60

tttgggagaa taaaagactt atatattg 88tttgggagaa taaaagactt atatattg 88

<210> 117<210> 117

<211> 69<211> 69

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 117<400> 117

ttccaggacc actttgtgca gatggtgggg tctcaccaat aaaatatttc tactcacact 60ttccaggacc actttgtgca gatggtgggg tctcaccaat aaaatatttc tactcacact 60

ggttttccc 69ggttttccc 69

<210> 118<210> 118

<211> 118<211> 118

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 118<400> 118

actattaaaa attgttaaat tccagagagc aagtagagac cgcatatttc aataaatcaa 60actattaaaa attgttaaat tccagagagc aagtagagac cgcatatttc aataaatcaa 60

acatgtggtg acaaaccctt gtgtgactct taaattgtgg atgtttccaa gccccttg 118acatgtggtg acaaaccctt gtgtgactct taaattgtgg atgtttccaa gccccttg 118

<210> 119<210> 119

<211> 1008<211> 1008

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 119<400> 119

agcagttttc tatgaagatt ttttcataaa gacaataaac atattgatca agcagctttt 60agcagttttc tatgaagatt ttttcataaa gacaataaac atattgatca agcagctttt 60

tctgtgttaa gctgttatta atgagactat aggaaatagt gtgaaattac aaaagcaaag 120tctgtgttaa gctgttatta atgagactat aggaaatagt gtgaaattac aaaagcaaag 120

aagtagatag ttatttaatt aattaaatta attttacctt ttgtgttgca ccataaccta 180aagtagatag ttatttaatt aattaaatta attttacctt ttgtgttgca ccataaccta 180

ccactggtgg gattaagggc aagtattacc atgcctagct gagagtcttt ctccaggaaa 240ccactggtgg gattaagggc aagtattacc atgcctagct gagagtcttt ctccaggaaa 240

aaccagctta catgggttcc tgcaaatctc atgagtgttt cttgggtttc tagtcttcct 300aaccagctta catgggttcc tgcaaatctc atgagtgttt cttgggtttc tagtcttcct 300

gggaggtgtc cttatctttc agattttcag atctggtaat tagcatgatc atcaggacat 360gggaggtgtc cttatctttc agattttcag atctggtaat tagcatgatc atcaggacat 360

ttattacaaa caaattgatt agtgggaaga aagtatctca aggtcaatct tggaagtgaa 420ttattacaaa caaattgatt agtgggaaga aagtatctca aggtcaatct tggaagtgaa 420

caactggtgc taatccatgg ctttaaagat ttgagaacaa cggtgaaatt tggtttgagg 480caactggtgc taatccatgg ctttaaagat ttgagaacaa cggtgaaatt tggtttgagg 480

agaagggggt gtctaggacg tttcattttt atggtacatg ccagacatga atgtacatag 540agaaggggggt gtctaggacg tttcattttt atggtacatg ccagacatga atgtacatag 540

gaaaataact tgaaagggtc aaatattaaa ccttgaatat caggttcact tgggaaagca 600gaaaataact tgaaagggtc aaatattaaa ccttgaatat caggttcact tgggaaagca 600

ttaggtgctt atgcctctta gtaaatagcc cttcatccca gaaggagcaa gaattgtctt 660ttaggtgctt atgcctctta gtaaaatagcc cttcatccca gaaggagcaa gaattgtctt 660

cctgacttaa tccagtctta gctgaggtgc tgtgcatctt tatcatcttt gccttgcctc 720cctgacttaa tccagtctta gctgaggtgc tgtgcatctt tatcatcttt gccttgcctc 720

acagtgtcag gctctgtggt actggggcta cacaggtcag gtaaacagtt aactgcttac 780acagtgtcag gctctgtggt actggggcta cacaggtcag gtaaacagtt aactgcttac 780

ctacatcccc agcaaagata atgtgacgat actaagatga acctatcaga gcttaaagat 840ctacatcccc agcaaagata atgtgacgat actaagatga acctatcaga gcttaaagat 840

aatgagtttc agtcacagtg ataactgcat gctaacttca gcatgtagaa tatatgccga 900aatgagtttc agtcacagtg ataactgcat gctaacttca gcatgtagaa tatatgccga 900

agctaaaagc cattccacag ttgactccat ctgaagttaa agtgtgtaag tacacagtaa 960agtgtgtaag tacacagtaa 960

atcatgctat attaactgaa ctttttaata aatgagtcat ttgaattt 1008atcatgctat attaactgaa ctttttaata aatgagtcat ttgaattt 1008

<210> 120<210> 120

<211> 306<211> 306

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 120<400> 120

attgttaacc taattaaaca gcttcatagg ttcttttggt gtcctttttg tgtgttgtgt 6060 attgttaacc taattaaaca

gtgcacatgt ttgttgggtg ggtgttttgc tggtgtcttt tcctctgtgt cttcctctgg 120120

ccctttctgg aaagacctgc ttaatctgaa gcatgtgagc taggctagtc cactgggtcc 180ccctttctgg aaagacctgc ttaatctgaa gcatgtgagc taggctagtc cactgggtcc 180

tgctctctgc ccatccccag ctggctttgg attagaggca catacactgc catggctgcc 240tgctctctgc ccatccccag ctggctttgg attagaggca catacactgc catggctgcc 240

ttttactgtg gctgtggttt tgcccttttt ttttaagcaa atagaaaatg ctgctgacta 300ttttactgtg gctgtggttt tgcccttttt ttttaagcaa atagaaaatg ctgctgacta 300

tactgg 306tactgg 306

<210> 121<210> 121

<211> 63<211> 63

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 121<400> 121

ggtgtcaccc attgtatttt tgtaatctgg tcagttaata aacagtcaca gcttggcaaa 60ggtgtcaccc attgtatttt tgtaatctgg tcagttaata aacagtcaca gcttggcaaa 60

ttg 63ttg 63

<210> 122<210> 122

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 122<400> 122

atgtacacta aattttctgt acctaaatat aattacaaaa ttatcttga 49atgtacacta aattttctgt acctaaatat aattacaaaa ttatcttga 49

<210> 123<210> 123

<211> 39<211> 39

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 123<400> 123

acttgatcca aaaagctaat aaaattttct cagaaatgc 39acttgatcca aaaagctaat aaaattttct cagaaatgc 39

<210> 124<210> 124

<211> 47<211> 47

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 124<400> 124

gaagcaacaa gaaaatattc caataaaaga ctatctgata accagtg 47gaagcaacaa gaaaatattc caataaaaga ctatctgata accagtg 47

<210> 125<210> 125

<211> 42<211> 42

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 125<400> 125

ttctgtgttg gagagctgca ataaattttc cataaagcaa aa 42ttctgtgttg gagagctgca ataaattttc cataaagcaa aa 42

<210> 126<210> 126

<211> 556<211> 556

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 126<400> 126

ttctccagtg tatttgtaaa atatattcat taaagtctct gctctgagag ctggtcttct 60ttctccagtg tatttgtaaa atatattcat taaagtctct gctctgagag ctggtcttct 60

tgacaccttt tccaatatca gctttgcaga aggaaactta aatttcagtt cagggcatga 120tgacaccttt tccaatatca gctttgcaga aggaaactta aatttcagtt cagggcatga 120

ccttcatgac cttgcagaac ttcttcactt tccaggttaa gtaaaggcga tctttagggg 180ccttcatgac cttgcagaac ttcttcactt tccaggttaa gtaaaggcga tctttaggggg 180

ctgtccagat ggatcagcta taaagattca attgtagaag gttcacgtct caatgcccac 240ctgtccagat ggatcagcta taaagattca attgtagaag gttcacgtct caatgcccac 240

gtggtagctg taacttcaat taaaaaacaa aaacagccgg gcgtggtggt gcacgccttt 300gtggtagctg taacttcaat taaaaaacaa aaacagccgg gcgtggtggt gcacgccttt 300

aatcccagca cttgggaggc agaggcaggc ggatttctga ggccagcctg atctacagag 360aatcccagca cttgggaggc agaggcaggc ggatttctga ggccagcctg atctacagag 360

tgagttccag gacagccagg aatacacaga gaaacccttg tctccaaaaa ccaaaaaaaa 420tgagttccag gacagccagg aatacacaga gaaacccttg tctccaaaaa ccaaaaaaaa 420

caaaacacgc attcttttca ggtctttgct gggaccaggt acacataaca cagataaata 480caaaacacgc attcttttca ggtctttgct gggaccaggt acacataaca cagataaata 480

ttagagcaaa ccatgcacat atggtaaatt atctttgggt tttgggtccc taaaataaag 540ttagagcaaa ccatgcacat atggtaaatt atctttggggt tttggggtccc taaaataaag 540

tggtgtgttc attgtg 556tggtgtgttc attgtg 556

<210> 127<210> 127

<211> 47<211> 47

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 127<400> 127

ccctggatct taactgttaa taaaaaaaac attggatgat gatggta 47ccctggatct taactgttaa taaaaaaaac attggatgat gatggta 47

<210> 128<210> 128

<211> 693<211> 693

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 128<400> 128

acacagagac ccactgaata aaaacttgag actgtccttg cttgtttgct tctatgtccc 60acacagagac ccactgaata aaaacttgag actgtccttg cttgtttgct tctatgtccc 60

tggagaggtc ccagttggtc ccgtccctaa caacatgcta gccctgctca cctgcctgtc 120tggagaggtc ccagttggtc ccgtccctaa caacatgcta gccctgctca cctgcctgtc 120

agccttgctc agtggcatct ttccataggt gtgtatcccc ttagattagc ttcagcccca 180agccttgctc agtggcatct ttccataggt gtgtatcccc ttagattagc ttcagcccca 180

ctacgatttg tctaggacat agcctgagcc ctgcctgtga cactgagggg tagcagtctg 240ctacgatttg tctaggacat agcctgagcc ctgcctgtga cactgagggg tagcagtctg 240

tttctggact ccagggtgct gctgtctcag gcctaagaat tccagacatg actataatcc 300tttctggact ccagggtgct gctgtctcag gcctaagaat tccagacatg actataatcc 300

aagcctgggg acctggttga gctttttatc ctgctggctc taagcttcag ctaggtggaa 360aagcctgggg acctggttga gctttttatc ctgctggctc taagcttcag ctaggtggaa 360

atgaggccag ccaagcccca cagtgagctt gcaagcttta gatggggaca gggttacgct 420atgaggccag ccaagcccca cagtgagctt gcaagcttta gatggggaca gggttacgct 420

ttggtgaatg atggaggaaa catgggggtt ccttttgttg ggtgcagcca gcacggcatc 480ttggtgaatg atggaggaaa catgggggtt ccttttgttg ggtgcagcca gcacggcatc 480

atcatggtgc ccaatcttga aagggcacag gcctgaagct tcctgggact gttctgtcac 540atcatggtgc ccaatcttga aagggcacag gcctgaagct tcctgggact gttctgtcac 540

agggaggaac ctactgcagt tgcctacaat tgctacctct gagggacttg cctctggccc 600agggaggaac ctactgcagt tgcctacaat tgctacctct gagggacttg cctctggccc 600

cttgtagaca tttccatgtc tacacatggc ccagagtact ttcagggata gcaatgtgtg 660cttgtagaca tttccatgtc tacacatggc ccagagtact ttcagggata gcaatgtgtg 660

aatggcactt agaagataac atgtgaaagc cat 693aatggcactt agaagataac atgtgaaagc cat 693

<210> 129<210> 129

<211> 98<211> 98

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 129<400> 129

agcttccctc gtgtctgtac atagcggcct ggctgtggcc tcatgtggat cagtctttaa 60agcttccctc gtgtctgtac atagcggcct ggctgtggcc tcatgtggat cagtctttaa 60

aataaaacaa gcctttgtct gttgccctct tgtttagc 98aataaaacaa gcctttgtct gttgccctct tgtttagc 98

<210> 130<210> 130

<211> 1077<211> 1077

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 130<400> 130

tgtacacaaa gaaataaaat accagcacca ggactgtgaa gtgttttcct tagactgtag 60tgtacacaaa gaaataaaat accagcacca ggactgtgaa gtgttttcct tagactgtag 60

tgtggggttt gctcattggc tttcttgttc agattttact aattgttcta aatgatacag 120tgtggggttt gctcattggc tttcttgttc agattttact aattgttcta aatgatacag 120

cttagtgtgc agaaaatatc ctcttgattg gaaaatagcc aaatatttac aaaacaggta 180cttagtgtgc agaaaatatc ctcttgattg gaaaatagcc aaatatttac aaaacaggta 180

tactagtttg aagaggctct atatgggggg agggggtgct ggaaaacatt agtgggtgac 240tactagtttg aagaggctct atatgggggg agggggtgct ggaaaacatt agtgggtgac 240

cagtaatggt ggtacagctc taactcctag caccaggagt ccgaggcagg gggatcttca 300cagtaatggt ggtacagctc taactcctag caccaggagt ccgaggcagg gggatcttca 300

ggctgcatga tgtgcatagt agcatgctgg tattagggag tgggtatctg tggttcccac 360ggctgcatga tgtgcatagt agcatgctgg tattagggag tgggtatctg tggttcccac 360

tttgaaaata accaaaattc tccaaagtgg gcagacctaa gccaggagag ggctggccac 420tttgaaaata accaaaattc tccaaagtgg gcagacctaa gccaggagag ggctggccac 420

agacatttgg tactgcttgc tgagaaagca ctgattgttt tcctaaccta aagattatat 480agacatttgg tactgcttgc tgagaaagca ctgattgttt tcctaaccta aagattatat 480

atggcccacc ataccatctt tgaaacaatg tgtactggcc tttggttcac ctttcttgtc 540atggcccacc ataccatctt tgaaacaatg tgtactggcc tttggttcac ctttcttgtc 540

tttgaagttg tacttggtgg gtgcatttaa ccttgccaca gagtggggag gatagagtct 600tttgaagttg tacttggtgg gtgcatttaa ccttgccaca gagtggggag gatagagtct 600

aatggacctt aagtggtctc tggtggccat gtcggcagtg cttaggttgt agcccagggt 660aatggacctt aagtggtctc tggtggccat gtcggcagtg cttaggttgt agcccagggt 660

tggagtcggc agtgacaagc aaataactat attcttgctt gctgtggcag ctatacagaa 720tggagtcggc agtgacaagc aaataactat attcttgctt gctgtggcag ctatacagaa 720

atttacggta taggtaagag ggttctctag aagtactacc tgtcttagtg aaagagattg 780atttacggta taggtaagag ggttctctag aagtactacc tgtcttagtg aaagagattg 780

cttggttaac atcctgttat gtagtggggc tacttttaaa ctgtgtgaag tccccattag 840cttggttaac atcctgttat gtagtggggc tacttttaaa ctgtgtgaag tccccattag 840

ccacctccat aggcaatgga gctaacattc ttgctacagt ggccgcagct cattaacacc 900ccacctccat aggcaatgga gctaacattc ttgctacagt ggccgcagct cattaacacc 900

taatgatgtg tttaacatgt gtccacatgg tgtgaatgtg ggtacgcatg tgcccagtat 960taatgatgtg tttaacatgt gtccacatgg tgtgaatgtg ggtacgcatg tgcccagtat 960

tcagttcaca gaattgtcat catcttccat catgtcttca gtgagggact ctgcagatgc 1020tcagttcaca gaattgtcat catcttccat catgtcttca gtgagggact ctgcagatgc 1020

ccaccccagt ccttggttgt ggtgattctg ttagcattaa atgcactgga gagcttc 1077ccaccccagt ccttggttgt ggtgattctg ttagcattaa atgcactgga gagcttc 1077

<210> 131<210> 131

<211> 1658<211> 1658

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 131<400> 131

gacacattgg tctgcaatgt tttgtattaa ttcataaata aaatttagga acaaaaccgg 60gacacattgg tctgcaatgt tttgtattaa ttcataaata aaatttagga acaaaaccgg 60

tggtttatcc ttgcatctct gcagtgtgga ttggacagga agttggaaat gacagggact 120tggtttatcc ttgcatctct gcagtgtgga ttggacagga agttggaaat gacagggact 120

ttaactgggc tgctgctcct ttgtatatag acactttttt cctgctcaga aacttgagtt 180180

ctccagtagc aatggccaaa cagaagaacc aggctagggg gctgcatctg acagagcaag 240ctccagtagc aatggccaaa cagaagaacc aggctaggggg gctgcatctg acagagcaag 240

tagacgagag gctgggtggt gggctccggc cagcccgagt cttagagctg gtggttggtt 300tagacgagag gctgggtggt gggctccggc cagcccgagt cttagagctg gtggttggtt 300

atatctggtg cctgtctcga ggagggcttg agacacagtg tggtgctcct cagaagcaga 360atatctggtg cctgtctcga ggagggcttg agacacagtg tggtgctcct cagaagcaga 360

caggtgattt ctttgtgtga tttttctttt cccctgggac aatgacagtc agtaagacag 420caggtgattt ctttgtgtga ttttcttttt cccctgggac aatgacagtc agtaagacag 420

gtttcaggga cttttgtgtc caggtctgag cactagtcgc tcacagttgt gtgtactaac 480gtttcaggga cttttgtgtc caggtctgag cactagtcgc tcacagttgt gtgtactaac 480

cttcttcctt cctattgaaa tggcaggggt ctttgagtct cactgctgca tgttctgcct 540cttcttcctt cctattgaaa tggcaggggt ctttgagtct cactgctgca tgttctgcct 540

tcatagggat ctgtaagtat gctgggcatc tgggctttta gggggctctc tatagggtgt 600tcatagggat ctgtaagtat gctgggcatc tgggctttta gggggctctc tatagggtgt 600

ctgagataga ggtcaacaag ggcttataga caactcaaac aaagcccatg gcttgagcaa 660ctgagataga ggtcaacaag ggcttataga caactcaaac aaagcccatg gcttgagcaa 660

gtctgcaaca agctgtttgt ctagcctcca gcagagggcg agggagacag cttccagatg 720gtctgcaaca agctgtttgt ctagcctcca gcagagggcg agggagacag cttccagatg 720

ttcccagtag gtggagcccc tccaagccca gggctcagga ggcttacagg gtgggaactc 780ttcccagtag gtggagcccc tccaagccca gggctcagga ggcttacagg gtgggaactc 780

caatactggt ggagggagga gggcgtttga tgggaagata gggaagttgc tgcttcctaa 840caatactggt ggagggagga gggcgtttga tgggaagata gggaagttgc tgcttcctaa 840

actgtcacaa ctgggcttgg ataggagtca tagtctggga ccacagccct gtggtagaat 900actgtcacaa ctgggcttgg ataggagtca tagtctggga ccacagccct gtggtagaat 900

gctagcctgg tgtgctccag gtttaatctc catcactgca gaaatgagtc caagctgtgt 960gctagcctgg tgtgctccag gtttaatctc catcactgca gaaatgagtc caagctgtgt 960

gtacctccag ggcactgggc atggggttcc cttgccattg tgtgtgcccg gagaactggc 1020gtacctccag ggcactggggc atggggttcc cttgccattg tgtgtgcccg gagaactggc 1020

aggcgggaaa tgtctttatc aagggttacc ttggaagagg tcccaacact gtagggtgct 1080aggcgggaaa tgtctttatc aagggttacc ttggaagagg tcccaacact gtagggtgct 1080

cctgttgtca aaacctatgc agaggcatct gcttgctctc taataacagt atgcaatgct 1140cctgttgtca aaacctatgc agaggcatct gcttgctctc taataacagt atgcaatgct 1140

aaagggctcg cttacagccg gtggccacac tggaggcctg cacatcaggt ggccacaagt 1200aaagggctcg cttacagccg gtggccacac tggaggcctg cacatcaggt ggccacaagt 1200

tctgctgctg cgcctccgag gaaacacttg gtcctccgat cgattttaac ctgttgaggc 1260tctgctgctg cgcctccgag gaaacacttg gtcctccgat cgattttaac ctgttgaggc 1260

tttgcaatcc ccctgtggca aaggctccag tgttttctat ttctatgcaa atttcttgaa 1320tttgcaatcc ccctgtggca aaggctccag tgttttctat ttctatgcaa atttcttgaa 1320

gcagaactgt tactgtcttt ctcctctgcc ctgggaggag gcgctagcgt ttccttccaa 1380gcagaactgt tactgtcttt ctcctctgcc ctgggaggag gcgctagcgt ttccttccaa 1380

cttcaggtgc agcccccctc gtggttagcg gtcttaagtt cgtgacttgg gtttgcagat 1440cttcaggtgc agcccccctc gtggttagcg gtcttaagtt cgtgacttgg gtttgcagat 1440

cttttttgtt acatcgccgg accatgtggt ggtctttagc tgtaaacaac attaaccctg 1500cttttttgtt acatcgccgg accatgtggt ggtctttagc tgtaaacaac attaaccctg 1500

ggttgattag catatgcttc taaaagatgg tcccagattc tgcgacttgt aataaaatgg 1560ggttgattag catatgcttc taaaagatgg tcccagattc tgcgacttgt aataaaatgg 1560

aaacttgctg gtttttatgc ctttctaact cttgtatttg aatgaatgtt gatcactttt 16201620

tgtattaaag tggctgacac atggctactg tcactgtg 1658tgtattaaag tggctgacac atggctactg tcactgtg 1658

<210> 132<210> 132

<211> 1795<211> 1795

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 132<400> 132

aatatctcac caaaaaatat ttgaagaaga acaacctccg agactggctg cgtgttgtcg 60aatatctcac caaaaaatat ttgaagaaga acaacctccg agactggctg cgtgttgtcg 60

ccaacagcaa agagagttac gagctgcgtt acttccagat taaccaggat gaagaggagg 120ccaacagcaa agagagttac gagctgcgtt acttccagat taaccaggat gaagagggagg 120

aggaagacga ggattaggac acattggtct gcaatgtttt gtattaattc ataaataaaa 180aggaagacga ggattaggac acattggtct gcaatgtttt gtattaattc ataaataaaa 180

tttaggaaca aaaccggtgg tttatccttg catctctgca gtgtggattg gacaggaagt 240tttaggaaca aaaccggtgg tttatccttg catctctgca gtgtggattg gacaggaagt 240

tggaaatgac agggacttta actgggctgc tgctcctttg tatatagaca cttttttcct 300tggaaatgac agggacttta actgggctgc tgctcctttg tatatagaca cttttttcct 300

gctcagaaac ttgagttctc cagtagcaat ggccaaacag aagaaccagg ctagggggct 360gctcagaaac ttgagttctc cagtagcaat ggccaaacag aagaaccagg ctagggggct 360

gcatctgaca gagcaagtag acgagaggct gggtggtggg ctccggccag cccgagtctt 420gcatctgaca gagcaagtag acgagaggct gggtggtggg ctccggccag cccgagtctt 420

agagctggtg gttggttata tctggtgcct gtctcgagga gggcttgaga cacagtgtgg 480agagctggtg gttggttata tctggtgcct gtctcgagga gggcttgaga cacagtgtgg 480

tgctcctcag aagcagacag gtgatttctt tgtgtgattt ttcttttccc ctgggacaat 540tgctcctcag aagcagacag gtgatttctt tgtgtgattt ttcttttccc ctgggacaat 540

gacagtcagt aagacaggtt tcagggactt ttgtgtccag gtctgagcac tagtcgctca 600gacagtcagt aagacaggtt tcagggactt ttgtgtccag gtctgagcac tagtcgctca 600

cagttgtgtg tactaacctt cttccttcct attgaaatgg caggggtctt tgagtctcac 660cagttgtgtg tactaacctt cttccttcct attgaaatgg caggggtctt tgagtctcac 660

tgctgcatgt tctgccttca tagggatctg taagtatgct gggcatctgg gcttttaggg 720tgctgcatgt tctgccttca tagggatctg taagtatgct gggcatctgg gcttttaggg 720

ggctctctat agggtgtctg agatagaggt caacaagggc ttatagacaa ctcaaacaaa 780ggctctctat agggtgtctg agatagaggt caacaagggc ttatagacaa ctcaaacaaa 780

gcccatggct tgagcaagtc tgcaacaagc tgtttgtcta gcctccagca gagggcgagg 840gcccatggct tgagcaagtc tgcaacaagc tgtttgtcta gcctccagca gagggcgagg 840

gagacagctt ccagatgttc ccagtaggtg gagcccctcc aagcccaggg ctcaggaggc 900gagacagctt ccagatgttc ccagtaggtg gagcccctcc aagcccaggg ctcaggaggc 900

ttacagggtg ggaactccaa tactggtgga gggaggaggg cgtttgatgg gaagataggg 960ttacagggtg ggaactccaa tactggtgga gggaggaggg cgtttgatgg gaagataggg 960

aagttgctgc ttcctaaact gtcacaactg ggcttggata ggagtcatag tctgggacca 1020aagttgctgc ttcctaaact gtcacaactg ggcttggata ggagtcatag tctgggacca 1020

cagccctgtg gtagaatgct agcctggtgt gctccaggtt taatctccat cactgcagaa 1080cagccctgtg gtagaatgct agcctggtgt gctccaggtt taatctccat cactgcagaa 1080

atgagtccaa gctgtgtgta cctccagggc actgggcatg gggttccctt gccattgtgt 1140atgagtccaa gctgtgtgta cctccagggc actgggcatg gggttccctt gccattgtgt 1140

gtgcccggag aactggcagg cgggaaatgt ctttatcaag ggttaccttg gaagaggtcc 1200gtgcccggag aactggcagg cgggaaatgt ctttatcaag ggttaccttg gaagaggtcc 1200

caacactgta gggtgctcct gttgtcaaaa cctatgcaga ggcatctgct tgctctctaa 1260caacactgta gggtgctcct gttgtcaaaa cctatgcaga ggcatctgct tgctctctaa 1260

taacagtatg caatgctaaa gggctcgctt acagccggtg gccacactgg aggcctgcac 1320taacagtatg caatgctaaa gggctcgctt acagccggtg gccacactgg aggcctgcac 1320

atcaggtggc cacaagttct gctgctgcgc ctccgaggaa acacttggtc ctccgatcga 1380atcaggtggc cacaagttct gctgctgcgc ctccgaggaa acacttggtc ctccgatcga 1380

ttttaacctg ttgaggcttt gcaatccccc tgtggcaaag gctccagtgt tttctatttc 1440ttttaacctg ttgaggcttt gcaatccccc tgtggcaaag gctccagtgt tttctatttc 1440

tatgcaaatt tcttgaagca gaactgttac tgtctttctc ctctgccctg ggaggaggcg 1500tatgcaaatt tcttgaagca gaactgttac tgtctttctc ctctgccctg ggaggaggcg 1500

ctagcgtttc cttccaactt caggtgcagc ccccctcgtg gttagcggtc ttaagttcgt 15601560

gacttgggtt tgcagatctt ttttgttaca tcgccggacc atgtggtggt ctttagctgt 16201620

aaacaacatt aaccctgggt tgattagcat atgcttctaa aagatggtcc cagattctgc 1680aaacaacatt aaccctgggt tgattagcat atgcttctaa aagatggtcc cagattctgc 1680

gacttgtaat aaaatggaaa cttgctggtt tttatgcctt tctaactctt gtatttgaat 1740gacttgtaat aaaatggaaa cttgctggtt tttatgcctt tctaactctt gtatttgaat 1740

gaatgttgat cactttttgt attaaagtgg ctgacacatg gctactgtca ctgtg 1795gaatgttgat cactttttgt attaaagtgg ctgacacatg gctactgtca ctgtg 1795

<210> 133<210> 133

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 133<400> 133

actgagtcca gatggctaat tctaaatata tacttttttc accataaa 48actgagtcca gatggctaat tctaaatata tacttttttc accataaa 48

<210> 134<210> 134

<211> 140<211> 140

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 134<400> 134

attcagcata aaataaaggc agataaagtt aaaggtcttc tggtggtctt taatgagccc 60attcagcata aaataaaggc agataaagtt aaaggtcttc tggtggtctt taatgagccc 60

tgttgggagt gaggtgcttt aacatggaga agcatgttat taaacagtga aatagatggt 120tgttgggagt gaggtgcttt aacatggaga agcatgttat taaacagtga aatagatggt 120

tcaaaaccac gtgaccatgt 140tcaaaaccac gtgaccatgt 140

<210> 135<210> 135

<211> 46<211> 46

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 135<400> 135

tgtggtagag cagagttgga aataaagctc tatctttaac tctagg 46tgtggtagag cagagttgga aataaagctc tatctttaac tctagg 46

<210> 136<210> 136

<211> 40<211> 40

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 136<400> 136

agacatctcg tgcacggctt tcattaaaga ctgcttaagt 40agacatctcg tgcacggctt tcattaaaga ctgcttaagt 40

<210> 137<210> 137

<211> 109<211> 109

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 137<400> 137

gtatattttt gttttggtca ttaaaaatta aaaaaaaaaa aatacaagtg tctgcctatt 60gtatattttt gttttggtca ttaaaaatta aaaaaaaaaa aatacaagtg tctgcctatt 60

gcatttgtgt gggaagagac tggggaaata aaacaggtgt gctgttgtg 109gcatttgtgt gggaagagac tggggaaata aaacaggtgt gctgttgtg 109

<210> 138<210> 138

<211> 45<211> 45

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 138<400> 138

acaagaaagt tttcctttaa taaaactttg ccagagctcc ttttg 45acaagaaagt tttcctttaa taaaactttg ccagagctcc ttttg 45

<210> 139<210> 139

<211> 640<211> 640

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 139<400> 139

aagccacacc ggaggttaat taaatgctaa cattttccat gtggtctttg catccttcct 60aagccacacc ggaggttaat taaatgctaa cattttccat gtggtctttg catccttcct 60

tgtctgcatg ttggaaatct gcctaacatt ctaggaagag gtgaggtgtg ggcccttgag 120tgtctgcatg ttggaaatct gcctaacatt ctaggaagag gtgaggtgtg ggcccttgag 120

agtcagtctg tgggaataag tgtagcccaa ctatgcacag ttgtaaattc ctacatcccc 180agtcagtctg tgggaataag tgtagcccaa ctatgcacag ttgtaaattc ctacatcccc 180

gtgtgtattg gtcttgatat tcaaagaatt gatgaatgcc attactttca gtccaaagtg 240gtgtgtattg gtcttgatat tcaaagaatt gatgaatgcc attactttca gtccaaagtg 240

aagaaacctg gtctcaaaaa atcccgagga ccagaaatga gatgggtttt cctgaaaatc 300aagaaacctg gtctcaaaaa atcccgagga ccagaaatga gatgggtttt cctgaaaatc 300

taaagttctt gaaaaacctt gccatccaga ttgctagcaa ctgcctagct ttgtaagctt 360taaagttctt gaaaaacctt gccatccaga ttgctagcaa ctgcctagct ttgtaagctt 360

actgtgatgg acaggtagct caggacgact ggtcacttaa tactggacag attagcatgg 420actgtgatgg acaggtagct caggacgact ggtcacttaa tactggacag attagcatgg 420

aaaacttaag gggaggagga ggtagtaggt tccatccagc ttcgctttgt tggtggcatc 480aaaacttaag gggaggagga ggtagtaggt tccatccagc ttcgctttgt tggtggcatc 480

taggtgttgt tccaagggag catgcctacc tgcaacagga catcactggt tgggaatact 540taggtgttgt tccaagggag catgcctacc tgcaacagga catcactggt tgggaatact 540

gtagaaccag agctgtgacc tttgaactac tagaaagatg aaattttatg taaagagtac 600gtagaaccag agctgtgacc tttgaactac tagaaagatg aaattttatg taaaagagtac 600

cttggagtaa ataaataaag cccaagatcc tgattgtcta 640cttggagtaa ataaataaag cccaagatcc tgattgtcta 640

<210> 140<210> 140

<211> 40<211> 40

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 140<400> 140

gccccacacg cccgaagcaa taaagagtcc actgacttcc 40gccccacacg cccgaagcaa taaaagtcc actgacttcc 40

<210> 141<210> 141

<211> 124<211> 124

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 141<400> 141

aaaaggctcc tgccagtgtg aagacagacg gactgctgtg acacacctcc ccacacacta 60aaaaggctcc tgccagtgtg aagacagacg gactgctgtg acacacctcc ccacacacta 60

tttgcagatg accagtgtcc tatgctgttc ttacaaataa actcaggcaa gatctgttag 120tttgcagatg accagtgtcc tatgctgttc ttacaaataa actcaggcaa gatctgttag 120

cttg 124cttg 124

<210> 142<210> 142

<211> 575<211> 575

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 142<400> 142

cctgctcgtg tcaaataaag ttgcagaact gccttcaggg tttggttttc ctttctgttg 60cctgctcgtg tcaaataaag ttgcagaact gccttcaggg tttggttttc ctttctgttg 60

tctgcctcat gggtggaatt tttgggtcta cagggtgttg gaaattaatc tgagaatctc 120tctgcctcat gggtggaatt tttgggtcta cagggtgttg gaaattaatc tgagaatctc 120

tgttctgggt acatgggaaa ttagaaatac gtgaaacatt cttttcacag aagtcacttt 180tgttctgggt acatgggaaa ttagaaatac gtgaaacatt cttttcacag aagtcacttt 180

attaggattg tggatttggg ttggttttga aacagggttt cttgtggcac tgcttgttct 240attaggattg tggatttgggg ttggttttga aacagggttt cttgtggcac tgcttgttct 240

atagaatagg gtggccttga actcagaaat ccacctgcct tttcctccct agtattggca 300atagaatagg gtggccttga actcagaaat ccacctgcct ttttcctccct agtattggca 300

attaaatgcc cagcttgttt gtaagctctc attttcagtt ccaggtttat gtgtgagcct 360attaaatgcc cagcttgttt gtaagctctc attttcagtt ccaggtttat gtgtgagcct 360

aagattaggt aaagattgag gttataactt aaacgtactg aattaactta tgttgtgtgg 420aagattaggt aaagattgag gttataactt aaacgtactg aattaactta tgttgtgtgg 420

gtcccaggaa ttggacctgg gacatcaact ctgcctttcc agccatcttt gccaaccagt 480gtccggaa ttggacctgg gacatcaact ctgcctttcc agccatcttt gccaaccagt 480

agctcatctc tgggatgtgt ctgccctcaa aatgacattt taaaaaagtc agtacaaaag 540agctcatctc tgggatgtgt ctgccctcaa aatgacattt taaaaaagtc agtacaaaag 540

aacgattttt attaaaaacc ttgaggacaa acatt 575aacgattttt attaaaaacc ttgaggacaa acatt 575

<210> 143<210> 143

<211> 54<211> 54

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 143<400> 143

atggcttgtg tgcatgtttt atgtttaaat aaaatcacaa aacctgccgt cgta 54atggcttgtg tgcatgtttt atgtttaaat aaaatcacaa aacctgccgt cgta 54

<210> 144<210> 144

<211> 68<211> 68

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 144<400> 144

actaatggag agtaaataaa taaaagtaga tttgtgctct tgtatttttt tttcacatct 60actaatggag agtaaataaa taaaagtaga tttgtgctct tgtatttttt tttcacatct 60

gtcctaaa 68gtcctaaa 68

<210> 145<210> 145

<211> 504<211> 504

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 145<400> 145

ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aattctgtgg tgatctaagg 60ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aattctgtgg tgatctaagg 60

tactttaaca tcggttcaga gttcggttat atgattgctc tgggatccta cgcttcttcc 120tactttaaca tcggttcaga gttcggttat atgattgctc tgggatccta cgcttcttcc 120

ttcatagttc ctgtgggtcc gaagctggga ggggctgggt ggactctcgg gaaagatact 180ttcatagttc ctgtgggtcc gaagctggga ggggctgggt ggactctcgg gaaagatact 180

ctgagcctgt ctcggtcccc atcgtgtttg cttggccctg ggcatggaag tgggtgagtg 240ctgagcctgt ctcggtcccc atcgtgtttg cttggccctg ggcatggaag tgggtgagtg 240

atgagctgaa cgagcaggct tgctagagat gaggacagtt actggtgtgg ttatatcact 300atgagctgaa cgagcaggct tgctagagat gaggacagtt actggtgtgg ttatatcact 300

accatgccta cagtgtctta agacgcttac agtctgtaag ggacttaaat gatttgagct 360accatgccta cagtgtctta agacgcttac agtctgtaag ggacttaaat gatttgagct 360

cttacttatc ctgtagtttc tgatttttaa catttacttg aataaagcca agcaagataa 420cttacttatc ctgtagtttc tgatttttaa catttacttg aataaagcca agcaagataa 420

gcctttattc ccagcacttg gtgacaggtg gatctatgag ttggggatca gagctacaca 480gcctttattc ccagcacttg gtgacaggtg gatctatgag ttggggatca gagctacaca 480

ttaaaactct taattcatct tact 504ttaaaactct taattcatct tact 504

<210> 146<210> 146

<211> 306<211> 306

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 146<400> 146

ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aaaaaaaaaa attaatcctc 60ggatttcaat cagtcataaa ataaatgttc tgctttcaaa aaaaaaaaaa attaatcctc 60

tgtgatggcc agcagttaac attcaacagt ttctctctag gctcttgatt ctctgactat 120tgtgatggcc agcagttaac attcaacagt ttctctctag gctcttgatt ctctgactat 120

tgtagggatt cgatcagcac tcgcatacca gaagtgtgag atggtccgtc ctttttcaag 180tgtagggatt cgatcagcac tcgcatacca gaagtgtgag atggtccgtc ctttttcaag 180

acaagatttc tctgtgtagc cctggctgtc ctggaaccca ctctgtagac caggctggcc 240acaagatttc tctgtgtagc cctggctgtc ctggaaccca ctctgtagac caggctggcc 240

ttgaatttac agagatcccc ttgcctccgc ttgctgagtg ctaggattaa aggcatgcgc 300ttgaatttac aggatcccc ttgcctccgc ttgctgagtg ctaggattaa aggcatgcgc 300

actatg 306actatg 306

<210> 147<210> 147

<211> 246<211> 246

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 147<400> 147

aagccctgct gtctgagact tgcctagcct gcaataaacg ggttatttac gtaacttttt 60aagccctgct gtctgagact tgcctagcct gcaataaacg ggttatttac gtaacttttt 60

tttttttgcc ttgtttgtgg ttaattaaaa catttggtgt gtgttctatt ttttattttc 120tttttttgcc ttgtttgtgg ttaattaaaa catttggtgt gtgttctatt ttttattttc 120

gaaagatgct tgttttgaga catactgtgt gaccctggct ggccttgagt gcctggttct 180gaaagatgct tgttttgaga catactgtgt gaccctggct ggccttgagt gcctggttct 180

ccttacaagt gtagatacat ctggcttaag attttagtct ttcagaaata aaaatgttgc 240ccttacaagt gtagatacat ctggcttaag attttagtct ttcagaaata aaaatgttgc 240

taagac 246tagac 246

<210> 148<210> 148

<211> 41<211> 41

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 148<400> 148

accagccctc tgcgtgtgac tattaaaaac cctgaaaagt g 41accagccctc tgcgtgtgac tattaaaaac cctgaaaagt g 41

<210> 149<210> 149

<211> 181<211> 181

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 149<400> 149

ggattcacac aatggcaaga ctgaggattt atactgaatt gtcatcaatc agtcctacca 60ggattcacac aatggcaaga ctgaggattt atactgaatt gtcatcaatc agtcctacca 60

gatggatttc aacatttaaa cctggagact cttcgtgtct tgaattagga tgtttgtcca 120gatggatttc aacatttaaa cctggagact cttcgtgtct tgaattagga tgtttgtcca 120

gtaataaaat atagaacctt tcaaaatgct tttctggttt ataaagtact gaattgccct 180gtaataaaat atagaacctt tcaaaatgct tttctggttt ataaagtact gaattgccct 180

t 181t 181

<210> 150<210> 150

<211> 285<211> 285

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 150<400> 150

tcccgccaaa gcaaccaagt cagcctgctt aatttgagaa agatggaaat aaaggcttac 60tcccgccaaa gcaaccaagt cagcctgctt aatttgagaa agatggaaat aaaggcttac 60

ttctcttaaa actccggtct ggatttattt agtttgttca cttaagcagg atgaaaaagc 120ttctcttaaa actccggtct ggatttattt agtttgttca cttaagcagg atgaaaaagc 120

aaaaccgcta ctgtttactt tgtgttggca tctttgtttc taaaattaaa gctcctagtg 180180

tttttgtggg ctttgtttgt tttttgagac agtctcttga cttggtgcca tagctagtct 240tttttgtggg ctttgtttgt tttttgagac agtctcttga cttggtgcca tagctagtct 240

gggacaaaga ttttccaggt gtgaattaaa ggtgtatgtc atcaa 285gggacaaaga ttttccaggt gtgaattaaa ggtgtatgtc atcaa 285

<210> 151<210> 151

<211> 40<211> 40

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 151<400> 151

actgcttttg ttaagttggc taataaagag ctgaacctgt 40actgcttttg ttaagttggc taataaagag ctgaacctgt 40

<210> 152<210> 152

<211> 42<211> 42

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 152<400> 152

attcctgctc ccctgcaaat aaagtctttt tatgtatctt ga 42attcctgctc ccctgcaaat aaagtctttt tatgtatctt ga 42

<210> 153<210> 153

<211> 1059<211> 1059

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 153<400> 153

cagggtcttg gcagctgcat ctggaggcat ttaataaaat aaagacattt aataaaatct 60cagggtcttg gcagctgcat ctggaggcat ttaataaaat aaagacattt aataaaatct 60

tgaacaaaga caaggcctga ctggattgtg tccagtattc aactgagtta tgttgtctat 120tgaacaaaga caaggcctga ctggattgtg tccagtattc aactgagtta tgttgtctat 120

ggagccatgc ttattctgtt ggtttaagct ggagggcatg agcagagctg accagagaag 180ggagccatgc ttattctgtt ggtttaagct ggagggcatg agcagagctg accagagaag 180

tcatgaagtt ggtgaccctg tgttgaacaa ttgagggtta gaagagcagt ttggttttgg 240240

tgctcttgat ggaacccagg tgcttggaca tagtaagcac acataagaca gagtaagact 300tgctcttgat ggaacccagg tgcttggaca tagtaagcac acataagaca gagtaagact 300

gctgtgtctc tggcctggag tagtctttct tgcttttttt tttttttttt tttttctcta 360360

gaatgaaagc agatggccca gcgagttagg tgcttcctat gaaagcatgt gtgctggttt 420gaatgaaagc agatggccca gcgagttagg tgcttcctat gaaagcatgt gtgctggttt 420

gtcatgcaca cagccctgca ggagagagta tggcaacaca gccgctcagc atcccaagat 480gtcatgcaca cagccctgca ggagagagta tggcaacaca gccgctcagc atcccaagat 480

aaaaagggag tttctactgc cattttgagc ttgggagttt gaaatgtaaa gcctgtccat 540aaaaagggag tttctactgc cattttgagc ttgggagttt gaaatgtaaa gcctgtccat 540

atgttttaag gatccatgta tttctgtttt gtttgttttt caaaacaggg tttctctgta 600atgttttaag gatccatgta tttctgtttt gtttgttttt caaaacaggg tttctctgta 600

gccctggctg tcctggaacc cactctgtat gtagaccagg ctggccttga actcagaaat 660gccctggctg tcctggaacc cactctgtat gtagaccagg ctggccttga actcagaaat 660

ccacctgcct ctggcgatcc atatatttct aagtcctgta cttagacgct gttttggaaa 720ccacctgcct ctggcgatcc atatatttct aagtcctgta cttagacgct gttttggaaa 720

attcattttg gaagcattta ctgttggtgt gttttgtggg gaatgaatga tagcttggga 780attcattttg gaagcattta ctgttggtgt gttttgtggg gaatgaatga tagcttggga 780

attcttttct gtttggtgag agtgaagctg tcagcccggt tgtagcctgg ctggtgctca 840attcttttct gtttggtgag agtgaagctg tcagcccggt tgtagcctgg ctggtgctca 840

aaggctttct ctcattgtct tcacctacgt agctttacgt ggggtaagga cttaagttac 900aaggctttct ctcattgtct tcacctacgt agctttacgt ggggtaagga cttaagttac 900

ttaagttggg tgcacactga ccatgtccac aacctgttaa ccaactctac atgatgagta 960ttaagttggg tgcacactga ccatgtccac aacctgttaa ccaactctac atgatgagta 960

cagatgtacc tttttagaaa gtgttaatgt gtagccctgg ctggcctctg cctcagggta 1020cagatgtacc tttttagaaa gtgttaatgt gtagccctgg ctggcctctg cctcagggta 1020

ttatgaataa agtgtgcaac cttcatctgg ttgattaaa 1059ttatgaataa agtgtgcaac cttcatctgg ttgattaaa 1059

<210> 154<210> 154

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 154<400> 154

aatccagatt tttaatagtg acaaataaaa agtcctattt gtgatcgtt 49aatccagatt tttaatagtg acaaataaaa agtcctattt gtgatcgtt 49

<210> 155<210> 155

<211> 87<211> 87

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 155<400> 155

aatggtctct aggagacatg ctggaaaagt gtttgtacaa gcctttctag gcaacataca 60aatggtctct aggagacatg ctggaaaagt gtttgtacaa gcctttctag gcaacataca 60

tgctagatta aacagcatgg tgaaact 87tgctagatta aacagcatgg tgaaact 87

<210> 156<210> 156

<211> 100<211> 100

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 156<400> 156

agtggactct gagggacatt gcggggaagg ggcgtttacg tttgtttata cttaaaagtt 60agtggactct gagggacatt gcgggggaagg ggcgtttacg tttgtttata cttaaaagtt 60

ttttaagcag catgttgaat taaaaaagaa agcaagcttc 100ttttaagcag catgttgaat taaaaaagaa agcaagcttc 100

<210> 157<210> 157

<211> 45<211> 45

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 157<400> 157

tttcccagct gctgcctaat aaactgtgtc ctttggaaca actat 45tttcccagct gctgcctaat aaactgtgtc ctttggaaca actat 45

<210> 158<210> 158

<211> 603<211> 603

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 158<400> 158

gtctttaaga gcaacaaata aataatgacc ttgaatcttt cattggcttt cattaatagt 60gtctttaaga gcaacaaata aataatgacc ttgaatcttt cattggcttt cattaatagt 60

gtaactagat aaatgatggg aaagatgaga cagaagaagg aatacatcta taggactgct 120gtaactagat aaatgatggg aaagatgaga cagaagaagg aatacatcta taggactgct 120

agaatatggg gagagtgatt attttcaaat taatatgtat cgagcttcta ccccaaggta 180agaatatggg gagagtgatt attttcaaat taatatgtat cgagcttcta ccccaaggta 180

aataaataac atttggagac cattaaaatg taggatggca tagaagaggc ctttactaag 240aataaataac atttggagac cattaaaatg taggatggca tagaagaggc ctttactaag 240

attaataatt aaagaaacac agcctttaaa gtaaaaaaca cactgtgcct ttgaaacttg 300attaataatt aaagaaacac agcctttaaa gtaaaaaaca cactgtgcct ttgaaacttg 300

ctaaaaagat taacttctgt cccaaaaggt atcagccatg cgctaccagc ctccctgccc 360ctaaaaagat taacttctgt cccaaaaggt atcagccatg cgctaccagc ctccctgccc 360

ctacagtggc agtggctgca ttcttggtga atggtagtgg aagggattaa acctaggcct 420ctacagtggc agtggctgca ttcttggtga atggtagtgg aagggattaa acctaggcct 420

cagtcatgct tcccagtcac tggtactgat ttgtatgcac ccgcttaggt gtgaaggtag 480cagtcatgct tcccagtcac tggtactgat ttgtatgcac ccgcttaggt gtgaaggtag 480

ttttggtgtg tatcacaagt tagcctgtgt agcgaagaca ggttttctcc accgtgtttt 540ttttggtgtg tatcacaagt tagcctgtgt agcgaagaca ggttttctcc accgtgtttt 540

ttgttacaca tgactattca caaatgtgct gcagacagta aaatgagaaa tacccttcca 600ttgttacaca tgactattca caaatgtgct gcagacagta aaatgagaaa tacccttcca 600

agg 603agg 603

<210> 159<210> 159

<211> 269<211> 269

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 159<400> 159

agaaaatgac tgaataaagt gtcattcata gtatttggtt gtagtaactt gtcaaaatct 60agaaaatgac tgaataaagt gtcattcata gtatttggtt gtagtaactt gtcaaaatct 60

cagggccatg ggtgcacgac agcagtagct tcttgaatga actgaagttt tcaagaggtg 120cagggccatg ggtgcacgac agcagtagct tcttgaatga actgaagttt tcaagaggtg 120

cctggaaggt gaaaaacaca ctgaagccag tcatgttgat atgggggcat tctgctgctg 180cctggaaggt gaaaaacaca ctgaagccag tcatgttgat atgggggcat tctgctgctg 180

tgaaacagac tggggttcac acccaccttg cgggattaga acttcactgc cctccaactt 240tgaaacagac tggggttcac acccaccttg cgggattaga acttcactgc cctccaactt 240

ctttctttgt aaacaactgt ccacatttt 269ctttctttgt aaacaactgt ccacatttt 269

<210> 160<210> 160

<211> 42<211> 42

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 160<400> 160

gcctcatgtg tagtgtaata aaggtgtctg ctgttctatc tg 42gcctcatgtg tagtgtaata aaggtgtctg ctgttctatc tg 42

<210> 161<210> 161

<211> 69<211> 69

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 161<400> 161

ttaatacttg gctgaactgg aggattgtct agttttccag ctgaaaaata aaaaagaatt 60ttaatacttg gctgaactgg aggattgtct agttttccag ctgaaaaata aaaaagaatt 60

gatacttgg 69gatacttgg 69

<210> 162<210> 162

<211> 36<211> 36

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 162<400> 162

agttggagtt tatgttgtat tgaataaact ttaaag 36agttggagtt tatgttgtat tgaataaact ttaaag 36

<210> 163<210> 163

<211> 47<211> 47

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 163<400> 163

ggggactctg gccaatgccc tagaacaaat aaagttattt tccaacg 47ggggactctg gccaatgccc tagaacaaat aaagttattt tccaacg 47

<210> 164<210> 164

<211> 50<211> 50

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 164<400> 164

ataaattttg gctgattttt ctcttgtatt tcttgtttgc tggtataaaa 50ataaattttg gctgattttt ctcttgtatt tcttgtttgc tggtataaaaa 50

<210> 165<210> 165

<211> 43<211> 43

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 165<400> 165

atgctgttgt gtgcacaagc aataaaatca ctttgagtaa ctt 43atgctgttgt gtgcacaagc aataaaatca ctttgagtaa ctt 43

<210> 166<210> 166

<211> 34<211> 34

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 166<400> 166

ccgaggccaa taaagactgg ttttggtccc tgga 34ccgaggccaa taaagactgg ttttggtccc tgga 34

<210> 167<210> 167

<211> 3272<211> 3272

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 167<400> 167

acgtaaagca taaataaaaa gcctttgtgg actgtgctca gggtcagtcc ttttgaatct 60acgtaaagca taaataaaaa gcctttgtgg actgtgctca gggtcagtcc ttttgaatct 60

ctgcagcaga gtagctggct gtgctgactg gtgacacttc tggtgatgct cagctgtgag 120ctgcagcaga gtagctggct gtgctgactg gtgacacttc tggtgatgct cagctgtgag 120

gttttatgta gatattgaaa gcatgaccat tgtcttcact tcacctccag cttgggttgt 180180

atgccagtaa catcagcata aggtggttaa tgacaggatg gtcccttgag tgtgcagtga 240atgccagtaa catcagcata aggtggttaa tgacaggatg gtcccttgag tgtgcagtga 240

gtctggttta tttgccaatg agaagcacag gcctcctgta tgggtctttg cctacagccc 300gtctggttta tttgccaatg agaagcacag gcctcctgta tgggtctttg cctacagccc 300

cctttcatca cccagacttg gtagacttac attctgtcac actgttggct cttaatctca 360cctttcatca ccgacttg gtagacttac attctgtcac actgttggct cttaatctca 360

gccctgaaaa atgccatttc ttgggtatca aggctagtct agattcagaa accatataaa 420gccctgaaaa atgccatttc ttgggtatca aggctagtct agattcagaa accatataaa 420

ggttgacagc tggtttaaaa aaaaaaaggc ttggagcttg agttgggttc gcaggttatt 480ggttgacagc tggtttaaaa aaaaaaaggc ttggagcttg agttggggttc gcaggtttatt 480

ccagggtatc tgtctgcact ttgtctccca gatttaaagg taagtgccac catgcctagc 540ccagggtatc tgtctgcact ttgtctccca gatttaaagg taagtgccac catgcctagc 540

atggtgactt attagctttg ttgctgtgga acatacatca aatgaaacat tggtatggct 600atggtgactt attagctttg ttgctgtgga acatacatca aatgaaacat tggtatggct 600

ctggtttcac tgtccatggt tagtatctgg tgggtggaca cctggtggaa ccaagctgct 660660

catcccagaa ctaaggagcc attccccaga gacttgtctt cctactaagt tccatcccta 720catcccagaa ctaaggagcc attccccaga gacttgtctt cctactaagt tccatcccta 720

cagcttctag tagtagcttc agaggttgtg aattgtggac ttagtctgcc ataacattta 780cagcttctag tagtagcttc agaggttgtg aattgtggac ttagtctgcc ataacattta 780

aaataggtat taaattcaag tcatttggtc actcagcacc cacgtggctc ttcagaacaa 840aaataggtat taaattcaag tcatttggtc actcagcacc cacgtggctc ttcagaacaa 840

cagaagcccc tcggacttgt ctgttggaaa aaccagtttg aaataatgta cctgctttag 900cagaagcccc tcggacttgt ctgttggaaa aaccagtttg aaataatgta cctgctttag 900

ttgagaaaac gctacaactg gtgctgtgtc ctgccatgct gatgagctct gctctgcgac 960ttgagaaaac gctacaactg gtgctgtgtc ctgccatgct gatgagctct gctctgcgac 960

ctgccgaact tgggggatct ctacccccag actttgctca gatctgttga tgatttgtcc 1020ctgccgaact tgggggatct ctacccccag actttgctca gatctgttga tgatttgtcc 1020

atgcaggaaa gtttacaagg tctctgtgtg tctactactt actagttgct gtgacaaaaa 1080atgcaggaaa gtttacaagg tctctgtgtg tctactactt actagttgct gtgacaaaaa 1080

tactgaaagt gtttactgtg tgtgaggcac aaagtttgtg ggaagctgta ccctccctca 1140tactgaaagt gtttactgtg tgtgaggcac aaagtttgtg ggaagctgta ccctccctca 1140

ttttggtgct gctcctgcct tgactgacag gatgagctgc cccaaccatc gttgccatct 1200ttttggtgct gctcctgcct tgactgacag gatgagctgc cccaaccatc gttgccatct 1200

tccataagaa gcaggtggct ctattgagtt ccctggaggt gatcccaagg gaaggaggag 1260tccataagaa gcaggtggct ctattgagtt ccctggaggt gatcccaagg gaaggaggag 1260

cctgggaaag tggatctcaa gtcccctagt ctggcagttg gctgtttagg aaagtccagt 1320cctgggaaag tggatctcaa gtcccctagt ctggcagttg gctgtttagg aaagtccagt 1320

gtcagtgttt gatatgttgt aaggaaacaa attcagtttt atttagctta ttggctctgg 1380gtcagtgttt gatatgttgt aaggaaacaa attcagtttt atttagctta ttggctctgg 1380

ggaaatggca gttcccatta attggtgctg tctttctctt tgaggatcaa aattagcttc 1440ggaaatggca gttcccatta attggtgctg tctttctctt tgaggatcaa aattagcttc 1440

ctgttcagtt gttaagcata tttcatagtc aaataatcct cttatcttta caagtgaggt 1500ctgttcagtt gttaagcata tttcatagtc aaataatcct cttatcttta caagtgaggt 1500

tttccttcga gtggatatca gagtccctcc cacggcttct atccctccta tccttgtgta 1560tttccttcga gtggatatca gagtccctcc cacggcttct atccctccta tccttgtgta 1560

ggaagttaag cttgctcatt tgtagattag tggtcggtta cactgcaatt tagagtatca 16201620

tgtgtactct acacatgatt gattctaagc ccccttccct ttccatgtcc ttcaaaaatt 1680tgtgtactct acacatgatt gattctaagc ccccttccct ttccatgtcc ttcaaaaatt 1680

tttttattct gagacagtgt taggattttt cctgggctag ccaaatgcaa gaagtgttgg 1740tttttattct gagacagtgt taggattttt cctgggctag ccaaatgcaa gaagtgttgg 1740

tcccagactt gtaatctttc tgccttagcc tcccaaattc taggattata gatttatgtc 1800tcccagactt gtaatctttc tgccttagcc tcccaaattc taggattata gatttatgtc 1800

atgtgatgag tggtctttta aagattatct tttatttttt ttgagatggg gtttttctgt 18601860

gtagttttgg ctttcttggg acttgctctg tagacccagg atggtcttta ctcagatctg 1920gtagttttgg ctttcttggg acttgctctg tagacccagg atggtcttta ctcagatctg 1920

cttgcctctg cctcccaact gctaggatta aagcatgagc ctgagccttc atgcctggct 1980cttgcctctg cctcccaact gctaggatta aagcatgagc ctgagccttc atgcctggct 1980

gacaggtgaa ttctcaatac ctacctagcc atagggaaag tgattgtgtc cccttcctca 2040gacaggtgaa ttctcaatac ctacctagcc atagggaaag tgattgtgtc cccttcctca 2040

tagaggggca tagtcaccca ggccatacct ttagcttggg cttttggtca gtgaagaagt 2100tagaggggca tagtcaccca ggccatacct ttagcttggg cttttggtca gtgaagaagt 2100

atgaagggac aagaacacta tcaagagcct aatgtgctct ggcctggatg gtcagcacaa 2160atgaagggac aagaacacta tcaagagcct aatgtgctct ggcctggatg gtcagcacaa 2160

aatgaataga cttaccaaat tctgctgtct ccttggtaga tgtgaagttg ttggaagagt 22202220

cctaaattta gcagactata ctgtcagcct atcagactat aggctgccgg agggcaagtc 2280cctaaattta gcagactata ctgtcagcct atcagactat aggctgccgg agggcaagtc 2280

tgctacctat ttccatctca tgcctgcatt gttcatcccc ctatgtaacc cacctacctg 2340tgctacctat ttccatctca tgcctgcatt gttcatcccc ctatgtaacc cacctacctg 2340

tcactcattc ctccatccaa aaactattgt aggttcagtg gaaatttcaa gcttgcctgt 2400tcactcattc ctccatccaa aaactattgt aggttcagtg gaaatttcaa gcttgcctgt 2400

ctcagcatct ttcttacctt acccctaagg atggcatctc tcttggctac atctttggtt 2460ctcagcatct ttcttacctt acccctaagg atggcatctc tcttggctac atctttggtt 2460

tatctggaga tccttgatta atttgaacaa gagctacctt gggttatgca gtttatgcct 25202520

ccagtgtccc agagaccggc atttgagaga tccctgatag caaacccata gggtggcctt 2580ccagtgtccc agagaccggc atttgagaga tccctgatag caaacccata gggtggcctt 2580

tttttcatcc accccattct ccctcccacc tccctctttt gaccttgagt cctcaccaga 2640tttttcatcc accccattct ccctcccacc tccctctttt gaccttgagt cctcaccaga 2640

gagaaaccag gcccacttaa ttagttctac atgtgtacac tacatgggtg cagtgcccaa 2700gagaaaccag gcccacttaa ttagttctac atgtgtacac tacatgggtg cagtgcccaa 2700

gcaggagagg tgttagattc ccttttaact atagttaata gacagttttt aagccccagt 2760gcaggagagg tgttagattc ccttttaact atagttaata gacagttttt aagccccagt 2760

ggatgctggg aagcaaacct acatcctcta gaagagcagc tatttctctg agccatttct 2820ggatgctggg aagcaaacct acatcctcta gaagagcagc tatttctctg agccatttct 2820

ccagcaccat tttcccctct tttaaaagca ggtcttgcag tgtggcctag tctggccccc 2880ccagcaccat tttcccctct tttaaaagca ggtcttgcag tgtggcctag tctggccccc 2880

tgaggtgttt gcattgcatg gcaggcatgt ccacaggaac accatagttc tcaccactcg 2940tgaggtgttt gcattgcatg gcaggcatgt ccacaggaac accatagttc tcaccactcg 2940

tacagcacag caagtggggt gccgcagggg attatcactt gagtataaaa taagggttgc 3000tacagcacag caagtggggt gccgcagggg attatcactt gagtataaaa taagggttgc 3000

tttagattga ataggataac cacgcgttct cagaacaatc aaggaaggct ggggtgagcc 3060tttagattga ataggataac cacgcgttct cagaacaatc aaggaaggct ggggtgagcc 3060

agcaccgacc ttaattgttt acttagtaaa ctactaaatg tatgcacgtg taagcttttg 3120agcaccgacc ttaattgttt acttagtaaa ctactaaatg tatgcacgtg taagcttttg 3120

ccttgattga ggtcaagctg tcgagaaatg gttctcttta cagtggatcc agtcaggatt 31803180

ggcagcaagc acctttgcct gctgagccta catgttgtat agaatggcaa cgttgtgtag 3240ggcagcaagc acctttgcct gctgagccta catgttgtat agaatggcaa cgttgtgtag 3240

aatggcagta cattaaatgg gtttttcatt ta 3272aatggcagta cattaaatgg gtttttcatt ta 3272

<210> 168<210> 168

<211> 59<211> 59

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 168<400> 168

gcccatctca aggatcgggg tttacctttg taataaacat cctaggattt taacgttcc 59gcccatctca aggatcgggg tttacctttg taataaacat cctaggattt taacgttcc 59

<210> 169<210> 169

<211> 35<211> 35

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 169<400> 169

aacaaaggat gctgggttaa taaattgcct cattc 35aacaaaggat gctgggttaa taaattgcct cattc 35

<210> 170<210> 170

<211> 3167<211> 3167

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 170<400> 170

gacaactgaa taaatcgtct taatggtcaa attttgctgg cttttgttca ggtttttttt 60gacaactgaa taaatcgtct taatggtcaa attttgctgg cttttgttca ggtttttttt 60

ttttaattca tgtttatgag tgtaaatgtg tgtgtcacag gggtgtcaga tgttctttga 120ttttaattca tgtttatgag tgtaaatgtg tgtgtcacag gggtgtcaga tgttctttga 120

accaccatgt aggtgctgga aacccaacct gcatcctcgg agagaacagg ttccttaacc 180accaccatgt aggtgctgga aacccaacct gcatcctcgg agagaacagg ttccttaacc 180

actgagcaag tactgaagca ttaaactgct tttaaaaatg aaggtgtgct aacagattgg 240actgagcaag tactgaagca ttaaactgct tttaaaaatg aaggtgtgct aacagattgg 240

tcaggtgaaa aagagacgtt aggtttcctg cagggggcgc taagccaatt taaagactaa 300tcaggtgaaa aagagacgtt aggtttcctg cagggggcgc taagccaatt taaagactaa 300

gttgggttag aaaagagcag attgcatcct tgatctttta agcctgggga ttttgttttg 360gttgggttag aaaagagcag attgcatcct tgatctttta agcctgggga ttttgttttg 360

ttttgggata gggtcccaac acagaacagg ctgacctcat taaatatcaa tcttatttga 420ttttgggata gggtcccaac acagaacagg ctgacctcat taaatatcaa tcttatttga 420

ttgcctctgc tcccagagta ctggaattaa aggcagggac cactgtatta gccattctga 480ttgcctctgc tccgagta ctggaattaa aggcagggac cactgtatta gccattctga 480

gttatttgaa atggactctg caggccatac ttggtcaaaa ttctgccttc tcaattacag 540gttatttgaa atggactctg caggccatac ttggtcaaaa ttctgccttc tcaattacag 540

gcatgagcca ctatgcctgg tttacttact aatagatgtc caaagactag tgtatgaaaa 600gcatgagcca ctatgcctgg tttacttact aatagatgtc caaagactag tgtatgaaaa 600

ttttgctttt ccaggtgatt tgtgaaaggc agggtggcct ctcccatgtc acactacttg 660ttttgctttt ccaggtgatt tgtgaaaggc agggtggcct ctcccatgtc acactacttg 660

ggttactcat gttgcaacat atctgcaact ttaggttgag gggatttgag cctgcatgtg 720ggttactcat gttgcaacat atctgcaact ttaggttgag gggatttgag cctgcatgtg 720

ccactttggc caactgaact aatctttaat tccatctaaa acttttaaat ctcagtcatg 780ccactttggc caactgaact aatctttaat tccatctaaa acttttaaat ctcagtcatg 780

tgttcaactg gaaaataacc tagagtgtgc tatgttgact tcaggtacac atcaaagcag 840tgttcaactg gaaaataacc tagagtgtgc tatgttgact tcaggtacac atcaaagcag 840

gttttagtga tgtagaagct gtgtttgagt tgaactagtg ttgaggctag gcttaggtac 900gttttagtga tgtagaagct gtgtttgagt tgaactagtg ttgaggctag gcttaggtac 900

catagaactt tggtttttca agacagggtt tctctgtgta gccctggctg tcctggaact 960catagaactt tggtttttca agacagggtt tctctgtgta gccctggctg tcctggaact 960

cactgtagac caggctggcc ttgaactcag aaatctgcct gcctgtgcct cccaacacac 1020cactgtagac caggctggcc ttgaactcag aaatctgcct gcctgtgcct cccaacacac 1020

ccagctctag ctttaaattc cttgcaccaa gagatgcttt atccctccgc tgagaataca 1080ccagctctag ctttaaattc cttgcaccaa gagatgcttt atccctccgc tgagaataca 1080

ggtgcatgtc agcatgctaa actctagata aaatttcatc ttgtttgaaa ggacaataat 1140ggtgcatgtc agcatgctaa actctagata aaatttcatc ttgtttgaaa ggacaataat 1140

ataagaaaag tgtatttgca ctgtatacca tgcccttttg tgtttaaagt taaactggca 1200ataagaaaag tgtatttgca ctgtatacca tgcccttttg tgtttaaagt taaactggca 1200

acagtgtccc atagaggttc cagaagaaac tgcttctaag gggaggacca taaagggaaa 1260acagtgtccc atagaggttc cagaagaaac tgcttctaag gggaggacca taaagggaaa 1260

tgcttaccat agaacttttt aaatgttcct acaggttgta ctctggatag gtatatgaac 1320tgcttaccat agaacttttt aaatgttcct acaggttgta ctctggatag gtatatgaac 1320

acctttctat tagaacagtt ttatagtagt acttagtgaa tatgtaaata atactatttg 1380acctttctat tagaacagtt ttatagtagt acttagtgaa tatgtaaata atactatttg 1380

tgaaatagtt tgaggtttct ctatagtcct ggctggcttg agctctatac cagattggct 1440tgaaatagtt tgaggtttct ctatagtcct ggctggcttg agctctatac cagattggct 1440

tctaaatcag aaatctgcct ctatctcctg aatggttatg atagagatgc aagttactta 1500tctaaatcag aaatctgcct ctatctcctg aatggttatg atagagatgc aagttactta 1500

atttcttaca tgaattgcac tttgtacatg cttttggata tgggcctagg cttttgcttt 15601560

tggattagac tgtctttatt acatttactg gcttgatact ttacagtctt aagcccactt 1620tggattagac tgtctttatt acatttactg gcttgatact ttacagtctt aagcccactt 1620

gcctgggtgt gatgcacacc tttaatccca gcactttggg atttctgagt tccaggacag 1680gcctgggtgt gatgcacacc tttaatccca gcactttggg atttctgagt tccaggacag 1680

ccagggctac gcagagaaac cctgtcttgg aggggaaaaa aagaaacttt ggaaatcaaa 1740ccagggctac gcagagaaac cctgtcttgg aggggaaaaa aagaaacttt ggaaatcaaa 1740

acttcttgga aagccacttt tagagacttg aatctaagga taactaacca ggtagtaacc 1800acttcttgga aagccacttt tagagacttg aatctaagga taactaacca ggtagtaacc 1800

acgagtcatt gattctgtga atcttgtatg agtgggttac aggcagaaat taacttcctc 1860acgagtcatt gattctgtga atcttgtatg agtgggttac aggcagaaat taacttcctc 1860

tgagagcact gctgttttag aaatgcgacc tagtaattac caaaggcatt gaagccactt 1920tgagagcact gctgttttag aaatgcgacc tagtaattac caaaggcatt gaagccactt 1920

gactacagtc tcaggtttct gcatctgaca ttgctgggac tgtgtggggt ttatgggtgt 1980gactacagtc tcaggtttct gcatctgaca ttgctgggac tgtgtggggt ttatgggtgt 1980

aaaataaaac aggcgaaagg atgttgagtg gaaagctttg gcttcagaat caaattccaa 2040aaaataaaac aggcgaaagg atgttgagtg gaaagctttg gcttcagaat caaattccaa 2040

atcaattacc agatcaaatc aaatgccaga tcaaattaca agacttcctt atgactaaat 2100atcaattacc agatcaaatc aaatgccaga tcaaattaca agacttcctt atgactaaat 2100

tcttcagtga cttaggatac taatagtatc tgcctcaaaa gtgtatgtgg ttatttttgt 21602160

cccagtgaag ccaagattca catgctatgg gcatggattt cctgaggaca tgctagccta 2220cccagtgaag ccaagattca catgctatgg gcatggattt cctgaggaca tgctagccta 2220

tggtatgagt tacttgaaag gactctgaga aatcttagtc cccagctgtg aggtttttaa 2280tggtatgagt tacttgaaag gactctgaga aatcttagtc cccagctgtg aggtttttaa 2280

agatcatgct caatggaaag tggggcagta atttgagagc atggcacaaa tgaggtttta 2340agatcatgct caatggaaag tggggcagta atttgagagc atggcacaaa tgaggtttta 2340

tcttttgaaa ctaagtgaat ctatgtcctt ggactagcat attttaaatc acacatcaaa 2400tcttttgaaa ctaagtgaat ctatgtcctt ggactagcat attttaaatc acacatcaaa 2400

tgaaatttct gttcaattcc tataaacagt ttatttcata ttttgtagtt accattttca 2460tgaaatttct gttcaattcc tataaacagt ttatttcata ttttgtagtt accattttca 2460

ttaacagcat acacccttca attgtgttgc taaaactgag tcacattatt ctgtaagaac 2520ttaacagcat acacccttca attgtgttgc taaaactgag tcacattatt ctgtaagaac 2520

ttactccagt atcacaactt ggtgctcatc caatattttt attttcattc tattttccct 2580ttactccagt atcacaactt ggtgctcatc caatattttt attttcattc tattttccct 2580

gtctagccac gtatggccct attctctctt cttggattga ccctagcttc aacacaagaa 2640gtctagccac gtatggccct attctctctt cttggattga ccctagcttc aacacaagaa 2640

agcttgcagt attttttttt tgcgcctggt tcattgtttt gtcctcaagt tctatccatg 2700agcttgcagt attttttttt tgcgcctggt tcattgtttt gtcctcaagt tctatccatg 2700

tgtccagaaa ttcgaggatt ttttaaaatt tacttttctg cctaaatact ggtatgtgga 2760tgtccagaaa ttcgaggatt ttttaaaatt tacttttctg cctaaatact ggtatgtgga 2760

tagtctgtta tttttactgt tggttgcata tctgtagcat atttctgtat ttgcaatgac 2820tagtctgtta tttttactgt tggttgcata tctgtagcat atttctgtat ttgcaatgac 2820

tacattgaat gtcccttagt taacctcatt cttcttaact attttgtagg cgtttgctat 2880tacattgaat gtcccttagt taacctcatt cttcttaact attttgtagg cgtttgctat 2880

tcaaagcaca atctcaatta aaatgttttt aatagcatct ttccacttgg atgtgtaaag 2940tcaaagcaca atctcaatta aaatgttttt aatagcatct ttccacttgg atgtgtaaag 2940

aaagtatttc tagaagtctg aatttttgtt gcattgtaga tgtgtacaca atagggctgg 3000aaagtatttc tagaagtctg aatttttgtt gcattgtaga tgtgtacaca atagggctgg 3000

gaaagtagct cacagtgggt aaaagccatt tgttgccaat cctaacagcc tgagttcaat 30603060

cccagaatct ataaggtaga agaaaaaaac cccagctccc acaagttatc tggccctctg 3120cccagaatct ataaggtaga agaaaaaaac cccagctccc acaagttatc tggccctctg 3120

cacacatata aatagtgcaa taaaaattaa ccatttaaaa atataaa 3167cacacatata aatagtgcaa taaaaattaa ccatttaaaa atataaa 3167

<210> 171<210> 171

<211> 58<211> 58

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 171<400> 171

gcagaagaaa tcgggaattt gttacaaata aaagttttaa gtacctgtga cagttaag 58gcagaagaaa tcgggaattt gttacaaata aaagttttaa gtacctgtga cagttaag 58

<210> 172<210> 172

<211> 49<211> 49

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 172<400> 172

aatttgacaa tggaaacaca gtaataaatt ttcatattct gaaaaaata 49aatttgacaa tggaaacaca gtaataaatt ttcatattct gaaaaaata 49

<210> 173<210> 173

<211> 264<211> 264

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 173<400> 173

acaggttcaa tcagctgtac atttggaaaa ataaaacttt attgaatcaa atgaatgggt 60acaggttcaa tcagctgtac atttggaaaa ataaaacttt attgaatcaa atgaatgggt 60

gcatctgttt cctaaggcag ccggggagga tttggtctta ggaataatag ctggaattgg 120gcatctgttt cctaaggcag ccggggagga tttggtctta ggaataatag ctggaattgg 120

tttgttggcc atgaagtcag atgcaattgc gcctgggaac cttcagcttt tccctttacg 180tttgttggcc atgaagtcag atgcaattgc gcctgggaac cttcagcttt tccctttacg 180

tggttgcttg cttcttgttg cagcttcggt tttgaattga tgcctgaaag aaaataaaaa 240tggttgcttg cttcttgttg cagcttcggt tttgaattga tgcctgaaag aaaataaaaa 240

cttagcaaga ctaatggtaa atct 264cttagcaaga ctaatggtaa atct 264

<210> 174<210> 174

<211> 71<211> 71

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 174<400> 174

agaggccgtt ttgtaaggac ggaaggaaaa ttaccctgga aaaataaaat ggaagttgta 60agaggccgtt ttgtaaggac ggaaggaaaa ttaccctgga aaaataaaat ggaagttgta 60

ctttacatgg c 71ctttacatgg c 71

<210> 175<210> 175

<211> 56<211> 56

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 175<400> 175

aagcccctga ttgaagatga gtgggaacct tcccaataaa cacgttttgg atatat 56aagcccctga ttgaagatga gtgggaacct tcccaataaa cacgttttgg atatat 56

<210> 176<210> 176

<211> 38<211> 38

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 176<400> 176

ttgtgtatgc gttaataaaa agaaggaact cgtactta 38ttgtgtatgc gttaataaaa agaaggaact cgtactta 38

<210> 177<210> 177

<211> 92<211> 92

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 177<400> 177

tcttgcagct gggttctgga tatccactac ttagcccacg gaatgatctg caactgttaa 60tcttgcagct gggttctgga tatccactac ttagcccacg gaatgatctg caactgttaa 60

ataaagcatt tatattaatt cttgtctaga aa 92ataaagcatt tatattaatt cttgtctaga aa 92

<210> 178<210> 178

<211> 91<211> 91

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 178<400> 178

gcgaccttga atggattcga ctgactacta ccaagtggaa ccgatcatgc tagtctttgt 60gcgaccttga atggattcga ctgactacta ccaagtggaa ccgatcatgc tagtctttgt 60

acacaaagaa taaaaatgtg aagaacttta a 91acacaaagaa taaaaatgtg aagaacttta a 91

<210> 179<210> 179

<211> 1187<211> 1187

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 179<400> 179

tacacgtgat atttgtaaaa ttcatatcca ataaacaatt taggacagtc atttctgctt 60tacacgtgat atttgtaaaa ttcatatcca ataaacaatt taggacagtc atttctgctt 60

aaaggtgtta tttgttaaaa ctagtctaca gattgtcatg agtgttctgt gaaaatgtag 120aaaggtgtta tttgttaaaa ctagtctaca gattgtcatg agtgttctgt gaaaatgtag 120

aagttaagtg caataattga aaactgcagg tgatggcata tcttgtttct gatgtacttt 180aagttaagtg caataattga aaactgcagg tgatggcata tcttgtttct gatgtacttt 180

gcattatctg cttatgagat taagtgtata tagtgtttgt gccaagtggt gttctgtgtg 240240

taagaccctg taagaggtaa aaagtcctga aactgaccct ggatgtgttg gtgcatgaga 300taagaccctg taagaggtaa aaagtcctga aactgaccct ggatgtgttg gtgcatgaga 300

tagaatctac agctttacga tggcatcttt tggttcactg aagtggctgc ttgggagttt 360tagaatctac agctttacga tggcatcttt tggttcactg aagtggctgc ttgggagttt 360

gatgagtaca aactttatag agttggattt tgcttagaaa tgtgtaggaa gagagggttt 420gatgagtaca aactttatag agttggattt tgcttagaaa tgtgtaggaa gagagggttt 420

caaaacctgt tttgtgcata gaaaagtgag atcaactata acccacattt tgagaattga 480caaaacctgt tttgtgcata gaaaagtgag atcaactata acccacattt tgagaattga 480

atccagtgtt attttcagaa gaccaggtaa atttgttgga agaggtttca ctttctgttg 540atccagtgtt attttcagaa gaccaggtaa atttgttgga agaggtttca ctttctgttg 540

gatctagagt atggatttgg agatgaaggt tgaacattgg atgtagtagg gcttatttag 600gatctagagt atggatttgg agatgaaggt tgaacattgg atgtagtagg gcttatttag 600

ggcagattat ttccattaga tttgtaaact tggttgtggt tgcaagttaa tatcaaccaa 660ggcagattat ttccattaga tttgtaaact tggttgtggt tgcaagttaa tatcaaccaa 660

gcaaatataa gtttgattaa gcttgcagac attaagcttt tctagcagct ggtgtgtgca 720gcaaatataa gtttgattaa gcttgcagac attaagcttt tctagcagct ggtgtgtgca 720

gaggcagatg gctctctggt tccaggacta cctacaatat agagaaattt tctctattcc 780gaggcagatg gctctctggt tccaggacta cctacaatat agagaaattt tctctattcc 780

agtcaattca tcatgggtaa gaatagtcca ttttggtagt gttatttcat cgtttacaat 840agtcaattca tcatgggtaa gaatagtcca ttttggtagt gttatttcat cgtttacaat 840

ctacctatgg gtagtggctg gtaactgcct ggatgttgac atttcacaaa ggccatactt 900ctacctatgg gtagtggctg gtaactgcct ggatgttgac atttcacaaa ggccatactt 900

aaccacactt ttatttctat ttgtgcgatg ccttggagta gtttcccaaa gtgattttga 960aaccacactt ttatttctat ttgtgcgatg ccttggagta gtttcccaaa gtgattttga 960

gtgtggaaga aatggtattg tccccgaaca gctggcttgg tctcaaaatc taattgatgc 1020gtgtggaaga aatggtattg tccccgaaca gctggcttgg tctcaaaatc taattgatgc 1020

ttttattaaa ttggttttcc tttggagatt ttaaaaggat gatttgattt ccagaaaata 1080ttttattaaa ttggttttcc tttggagatt ttaaaaggat gatttgattt ccagaaaata 1080

ctagactcaa aatcttgata gctaaaattc ttttctattc agcaaaacaa gtcactgtat 1140ctagactcaa aatcttgata gctaaaattc ttttctattc agcaaaacaa gtcactgtat 1140

agaggttgtt caaatcaact aaagtaataa atgtcttaaa caagtgg 1187agaggttgtt caaatcaact aaagtaataa atgtcttaaa caagtgg 1187

<210> 180<210> 180

<211> 43<211> 43

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 180<400> 180

gggtttttat atgagaaaaa taaaagaatt aagtctgctg att 43gggtttttat atgagaaaaa taaaagaatt aagtctgctg att 43

<210> 181<210> 181

<211> 259<211> 259

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 181<400> 181

ggctacacag aataataaag gttctttttg acggtggtaa atctcatgtg tggactctaa 60ggctacacag aataataaag gttctttttg acggtggtaa atctcatgtg tggactctaa 60

gcttgtcgcc aagtgggaaa tagactggtg ggattgtaga taggatgggc tacttaaact 120gcttgtcgcc aagtgggaaa tagactggtg ggattgtaga taggatgggc tacttaaact 120

cattctaccc aggccttagt acttagcata cagccagagt caaactgatc ctttatacag 180cattctaccc aggccttagt acttagcata cagccagagt caaactgatc ctttatacag 180

ggggtaccat gacagtacaa cagtgtcgtt aaccctaaca aataaatttc ccaccaacgg 240ggggtaccat gacagtacaa cagtgtcgtt aaccctaaca aataaatttc ccaccaacgg 240

gtggaattcc ttcattttg 259gtggaattcc ttcattttg 259

<210> 182<210> 182

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 182<400> 182

acaggacttc tcattatttt ctgttaataa attgctttgt gtaagcta 48acaggacttc tcattatttt ctgttaataa attgctttgt gtaagcta 48

<210> 183<210> 183

<211> 67<211> 67

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 183<400> 183

aggcttcaat agttctccta taccctacca aatcgttcaa taataaaatc tcgcatcaag 60aggcttcaat agttctccta taccctacca aatcgttcaa taataaaatc tcgcatcaag 60

ttcgctt 67ttcgctt 67

<210> 184<210> 184

<211> 33<211> 33

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 184<400> 184

gatgctccaa taaacctcac tgctgccact cag 33gatgctccaa taaacctcac tgctgccact cag 33

<210> 185<210> 185

<211> 36<211> 36

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 185<400> 185

gatgacaacg acaataaagt gcgagactga ctggct 36gatgacaacg acaataaagt gcgagactga ctggct 36

<210> 186<210> 186

<211> 388<211> 388

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 186<400> 186

acccaataaa gactgtttgc ctcatgcctg cctggcctgc ccttcctccg ccgccaacta 60acccaataaa gactgtttgc ctcatgcctg cctggcctgc ccttcctccg ccgccaacta 60

gggaagtggg gaccaaaggt tccttaggca ctgctcctgt gggtagaggg gacattagag 120gggaagtggg gaccaaaggt tccttaggca ctgctcctgt gggtagaggg gacattagag 120

agctgacagc gcaccacctg catgagtttt tattaaagtg caaaccatgg gatgaatcag 180agctgacagc gcaccacctg catgagtttt tattaaagtg caaaccatgg gatgaatcag 180

ttgagcttca gtgttgaaaa tgagtagcag ggctgcccca cccacctgac caagtaccct 240ttgagcttca gtgttgaaaa tgagtagcag ggctgcccca cccacctgac caagtaccct 240

attctgcagc tatgaaaatg agatctgcac atgagctggg gttcacaagt gcacacttgg 300attctgcagc tatgaaaatg agatctgcac atgagctggg gttcacaagt gcacacttgg 300

agcactgcct tgctccttcc cagcagacca caaagcagta tttttctgga ggattttatg 360360

tgctaataaa ttatttgact taagtgtg 388tgctaataaa ttatttgact taagtgtg 388

<210> 187<210> 187

<211> 32<211> 32

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 187<400> 187

tgaaccctcc cccaataaaa gatggttcct ac 32tgaaccctcc cccaataaaa gatggttcct ac 32

<210> 188<210> 188

<211> 103<211> 103

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 188<400> 188

gcagattttg ttatgaagac aataaaatct tgacctttca acccctttga ttgcagttgt 6060

tcgtttggga gggaatacat taaaagcttt cagaaattac ctg 103tcgtttggga gggaatacat taaaagcttt cagaaattac ctg 103

<210> 189<210> 189

<211> 277<211> 277

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 189<400> 189

gccagcccgt gcacctacga cgcctgcagg agcagaagtg agggatgctg agggccggga 60gccagcccgt gcacctacga cgcctgcagg agcagaagtg agggatgctg agggccggga 60

caagctatcg gactgtgtgc tgccatcggt aatgagtctc agtagacctg gaacgtcacc 120caagctatcg gactgtgtgc tgccatcggt aatgagtctc agtagacctg gaacgtcacc 120

tcgccgcgat cgcctggaga aatgaccgcc tttcttacaa ccaaaacagt ccctctgccc 180tcgccgcgat cgcctggaga aatgaccgcc tttcttacaa ccaaaacagt ccctctgccc 180

tggacccccg gcactctgga ctagctctgt tctcttgtgg ccaagtgtag ctcgtgtaca 240tggacccccg gcactctgga ctagctctgt tctcttgtgg ccaagtgtag ctcgtgtaca 240

ataaaccctc ttgcagtcag ctgaagaatc aaactgc 277ataaaccctc ttgcagtcag ctgaagaatc aaactgc 277

<210> 190<210> 190

<211> 44<211> 44

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 190<400> 190

gtctctgggc ctttgctgtt aataaatagt ttatatacct atga 44gtctctggggc ctttgctgtt aataaatagt ttatatacct atga 44

<210> 191<210> 191

<211> 404<211> 404

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 191<400> 191

aatacctagc agtgagtgga gattggatac agccaaagga gtagatctgc ggtgacttga 60aatacctagc agtgagtgga gattggatac agccaaagga gtagatctgc ggtgacttga 60

tgttttgctg tgatgtgcag atttctgaga ggacaaataa actaaaaagc tcctacacgt 120tgttttgctg tgatgtgcag atttctgaga ggacaaataa actaaaaagc tcctacacgt 120

ctgctctgct gcttattggg cattagaaga atcaggtggc tgcttgggtg ttgatgcagt 180ctgctctgct gcttattggg cattagaaga atcaggtggc tgcttgggtg ttgatgcagt 180

caagtgcact gggcttggtg aaaagcccag tgtaagaggc cggtacagat ccttcctggc 240caagtgcact gggcttggtg aaaagcccag tgtaagaggc cggtacagat ccttcctggc 240

agagggtggt gatggagaga acataaataa ctacatgggc aaagtgtagg accaattacc 300agagggtggt gatggagaga acataaataa ctacatgggc aaagtgtagg accaattacc 300

ctgttagcat cgtctttgct caacaccttt ctgtgtccct agactctgag tttttttcta 360ctgttagcat cgtctttgct caacaccttt ctgtgtccct agactctgag tttttttcta 360

attgattttt attgaacact gagtgttttg aggttttatt tttt 404attgattttt attgaacact gagtgttttg aggttttatt tttt 404

<210> 192<210> 192

<211> 39<211> 39

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 192<400> 192

agttcaggag ctaataaagt acgtcctttg gctaatccg 39agttcaggag ctaataaagt acgtcctttg gctaatccg 39

<210> 193<210> 193

<211> 48<211> 48

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 193<400> 193

atatgcacat tttttaagta ataaaaatca agacttgatc tacgcttc 48atatgcacat tttttaagta ataaaaatca agacttgatc tacgcttc 48

<210> 194<210> 194

<211> 36<211> 36

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 194<400> 194

tctgttatgc catattttca ataaacctga aaacaa 36tctgttatgc catattttca ataaacctga aaacaa 36

<210> 195<210> 195

<211> 875<211> 875

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 195<400> 195

gctgctgtgc aggtgcctga gcaaagggaa aaaagatgga aggaaaataa agttgctaaa 60gctgctgtgc aggtgcctga gcaaagggaa aaaagatgga aggaaaataa agttgctaaa 60

agctgtctta tggtcctcac tgcagactgt acctggattg gcatttggct atacaacaga 120agctgtctta tggtcctcac tgcagactgt acctggattg gcatttggct atacaacaga 120

ggcatggtcc tactgacatg ttttgtgttg aatacttaag catgtgaaca catgggtttt 180ggcatggtcc tactgacatg ttttgtgttg aatacttaag catgtgaaca catgggtttt 180

tttttttttt aatgtaaaat gtagtaacac aatgtttagg tggctttggt gttagctctg 240tttttttttt aatgtaaaat gtagtaacac aatgtttagg tggctttggt gttagctctg 240

gagacttcat gtgtcatcta ggtgaggtgt tctttaacac agggtctctg ttctgtcatg 300gagacttcat gtgtcatcta ggtgaggtgt tctttaacac agggtctctg ttctgtcatg 300

cctcatagat ccttctacct ccagattgga gagggaaaag gcttatgtca ctgaacctgg 360cctcatagat ccttctacct ccagattgga gagggaaaag gcttatgtca ctgaacctgg 360

ccagattggg attttgtgtc ccaggaacaa agttaatgct aaaaagttaa tgccttggtg 420ccagattggg attttgtgtc cggaacaa agttaatgct aaaaagttaa tgccttggtg 420

agactgatag tctgatggtg tgaattcaca gtaagtggtt gggattgcca gatggaattc 480agactgatag tctgatggtg tgaattcaca gtaagtggtt gggattgcca gatggaattc 480

cctgagctgc cgtgacaggt ggcattgcag aagtgaagga ttcaggaatt tgagtgttgg 540cctgagctgc cgtgacaggt ggcattgcag aagtgaagga ttcaggaatt tgagtgttgg 540

gtgggggcct gtgaatagca cttgggctgg gaggggagac tgctgcccct gaatgtcctg 600gtggggggcct gtgaatagca cttgggctgg gaggggagac tgctgcccct gaatgtcctg 600

gaattcaagg acagtacctg gttaaatgtt tttctagctt ttctaaaaag tttgttaggc 660660

ctggcattgg cggcgcacac ctttaatccc agcacttggg agtcaggcag gtggatttct 720ctggcattgg cggcgcacac ctttaatccc agcacttggg agtcaggcag gtggatttct 720

ggcctggtct acagagagtt ccaggatagc cagggataca cagaaatcct gcctcaggaa 780ggcctggtct acagagagtt ccaggatagc cagggataca cagaaatcct gcctcaggaa 780

aaaaccaaaa agaagtttgc taaaaataag catttttgct tgatggtatt gaagattgta 840aaaaccaaaa agaagtttgc taaaaataag catttttgct tgatggtatt gaagattgta 840

agacattaaa ttgtgtcatt acttctccag gtact 875agacattaaa ttgtgtcatt acttctccag gtact 875

<210> 196<210> 196

<211> 67<211> 67

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 196<400> 196

agctgtggtc atacctggca tgtgaccccg ggaccaaata aagtcccctt ccatccactg 60agctgtggtc atacctggca tgtgaccccg ggaccaaata aagtcccctt ccatccactg 60

gagcagc 67gagcagc 67

<210> 197<210> 197

<211> 50<211> 50

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 197<400> 197

gtcctattgc caccctgcca tgctaataaa gccactgtgt ccagacttct 50gtcctattgc caccctgcca tgctaataaa gccactgtgt ccagacttct 50

<210> 198<210> 198

<211> 84<211> 84

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 198<400> 198

ttggcctctg cttgtaatac aatgaaagta ttctaaagaa atataaaatt ggactttatg 60ttggcctctg cttgtaatac aatgaaagta ttctaaagaa atataaaatt ggactttatg 60

agaaaataaa agtcatttca ctct 84agaaaataaa agtcatttca ctct 84

<210> 199<210> 199

<211> 36<211> 36

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 199<400> 199

<210> 200<210> 200

<211> 446<211> 446

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 200<400> 200

ggaaccacac gtacttatgc tgtaacttac tgtagcgttt acagcgttac cgctgtctgg 60ggaaccacac gtacttatgc tgtaacttac tgtagcgttt acagcgttac cgctgtctgg 60

acagctgagt gtgtttctta ggaatataag ttttctttct gtgctttagt gagttcattc 120acagctgagt gtgtttctta ggaatataag ttttctttct gtgctttagt gagttcattc 120

agcagttcag taataaatat gtgaaacctt ttgtttcgaa aaaaattgct tctgtgttac 180agcagttcag taataaatat gtgaaacctt ttgtttcgaa aaaaattgct tctgtgttac 180

aacttacttt gttttatggt tcaggatcat ctgcataata gacaagtatt ctatcagtga 240aacttacttt gttttatggt tcaggatcat ctgcataata gacaagtatt ctatcagtga 240

gcgatatcct ggatcttgtt tgtgtagttt ggggttgaga caagtccaga ctgccctaaa 300gcgatatcct ggatcttgtt tgtgtagttt ggggttgaga caagtccaga ctgccctaaa 300

actcacgatc ttccttcctc ggccttctaa atgattggag gactccaaac ctaagtgatg 360actcacgatc ttccttcctc ggccttctaa atgattggag gactccaaac ctaagtgatg 360

gaagtaaaaa gaaacttata tgtcaagact cattttctct atcatttcat gtgacaattg 420gaagtaaaaa gaaacttata tgtcaagact cattttctct atcatttcat gtgacaattg 420

aaattagatt atttcttttt tcaatc 446aaattagatt atttcttttt tcaatc 446

<210> 201<210> 201

<211> 332<211> 332

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 201<400> 201

ggactttgct ggcagaaaag aagtacagat gaggttatag tttgaaaaac gttaattccg 60ggactttgct ggcagaaaag aagtacagat gaggttatag tttgaaaaac gttaattccg 60

tttattgact ttagaatgtt actttgcata gtatagacca ttacaatgga aagtacctgc 120tttattgact ttagaatgtt actttgcata gtatagacca ttacaatgga aagtacctgc 120

cttaagaaac aagaaaactg cagtttatag agaaagaatt ttcaattttg acccatgtac 180cttaagaaac aagaaaactg cagtttatag agaaagaatt ttcaattttg acccatgtac 180

ttaaaatttt tggtgtatac tgcagtgtag caaatgtttt gtggtgacgg tataaatggt 240ttaaaatttt tggtgtatac tgcagtgtag caaatgtttt gtggtgacgg tataaatggt 240

actgtttgtt atcttggatt aagagtggct agagaagttg gaagacgtgt gagaagttct 300actgtttgtt atcttggatt aagagtggct agagaagttg gaagacgtgt gagaagttct 300

ttatagagaa ttaaacatga aaattacatc tc 332ttatagagaa ttaaacatga aaattacatc tc 332

<210> 202<210> 202

<211> 80<211> 80

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 202<400> 202

aacttgtgtt ctctgagagg aaaatactga agcagtagag aaatgacctg ctagagaata 60aacttgtgtt ctctgagagg aaaatactga agcagtagag aaatgacctg ctagagaata 60

aagttactgt taatgatacc 80aagttactgt taatgatacc 80

<210> 203<210> 203

<211> 93<211> 93

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 203<400> 203

gatgtctgga atggagcaca cctgggatgt agcactcttg ctatctgtcc ggtccttttt 60gatgtctgga atggagcaca cctgggatgt agcactcttg ctatctgtcc ggtccttttt 60

gttcaataaa gtcctgaggc aactctctct gtc 93gttcaataaa gtcctgaggc aactctctct gtc 93

<210> 204<210> 204

<211> 152<211> 152

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 204<400> 204

tgagctatga agttccggaa tttgtgtttt tcacagaaag ccttaccaac ttcagttact 60tgagctatga agttccggaa tttgtgtttt tcacagaaag ccttaccaac ttcagttact 60

ttaccaagac aatgtaatta ttgtttgatt ttataaagtc tacaacaatg atctcctatt 120ttaccaagac aatgtaatta ttgtttgatt ttataaagtc tacaacaatg atctcctatt 120

ttggtgtcag tttttcaata aagttttaat ta 152ttggtgtcag tttttcaata aagttttaat ta 152

<210> 205<210> 205

<211> 1841<211> 1841

<212> ДНК<212> DNA

<213> Mus musculus<213> Mus musculus

<400> 205<400> 205

agcaggagca ggttttccaa aagcacccct cggaagtgtt tttgtcgtcg tttaaaatta 60agcaggagca ggttttccaa aagcacccct cggaagtgtt tttgtcgtcg tttaaaatta 60

tcaagtatct tcagagaaga ttattttctg ccttcagaaa ctgaaggaag gcttgggcct 120tcaagtatct tcagagaaga ttatttttctg ccttcagaaa ctgaaggaag gcttgggcct 120

agagaacgac agtaaggtgc gagcaccgga gacacttaac acagctcagt ccatggaagg 180agagaacgac agtaaggtgc gagcaccggga gacacttaac acagctcagt ccatggaagg 180

acgagttccc tcattggctg cctgtctcga aatccacgca agctgtggag gaaagaatta 240acgagttccc tcattggctg cctgtctcga aatccacgca agctgtggag gaaagaatta 240

ccctgctcat cctgccttct atcttggtgt ttaatgttgg gtgggcaaca agcacaaacc 300ccctgctcat ccctgccttct atcttggtgt ttaatgttgg gtgggcaaca agcacaaacc 300

tccctcccac cccctccaag actgttagag cagtgggcca gaccaagcgg cgcacttgaa 360tccctcccac cccctccaag actgttagag cagtgggcca gaccaagcgg cgcacttgaa 360

catggatcaa gagggtcccg gttttacttt ttatttttgt cagggtaggc agtcttgtgt 420catggatcaa gagggtcccg gttttacttt ttatttttgt cagggtaggc agtcttgtgt 420

ttgctttgtt caaagcaggg tctccctgtt ggccctggct ggccttatac tccacagcag 480ttgctttgtt caaagcaggg tctccctgtt ggccctggct ggccttatac tccacagcag 480

tcctgcctcc tcctcctagg tgctgggatt aaaggcgtgc gccaccacgc ccggctacag 540tcctgcctcc tcctcctagg tgctgggatt aaaggcgtgc gccaccacgc ccggctacag 540

cctgcatttt tatgcacatt ggtctgttaa gctagttgca ttctgtgcta ccggagggga 600cctgcatttt tatgcacatt ggtctgttaa gctagttgca ttctgtgcta ccggagggga 600

ctgaagttta atcacttgtc ttctattaaa aactagtgtt tgcctgggcc tggtgtgtat 660aactagtgtt tgcctgggcc tggtgtgtat 660

acctttagtt gcagcgcttg ggaggcagag gcaggcagac ttcatgagtt cagggacagg 720acctttagtt gcagcgcttg ggaggcagag gcaggcagac ttcatgagtt cagggacagg 720

caagcctgct ctacagattt ccaggatacc cagggctaca catagagaaa atgttaaaga 780caagcctgct ctacagattt ccaggatacc cagggctaca catagagaaa atgttaaaga 780

taaacaaaaa gctggacagt gggggagcac acctttaatc ccagcactcg ggaggcagag 840taaacaaaaa gctggacagt gggggagcac acctttaatc ccagcactcg ggaggcagag 840

gcaggcggat ttctgagttc gaggccagcc tggtctacag agtgagttcc aggacagcca 900gcaggcggat ttctgagttc gaggccagcc tggtctacag agtgagttcc aggacagcca 900

ggactacaca gagaaaccct gtctcagaaa aaaaacaaaa caaaaaccaa tgcagtgata 960ggactacaca gagaaaccct gtctcagaaa aaaaacaaaa caaaaaccaa tgcagtgata 960

gattgttgtt tcctaaacca catgtaccca ggaaatgccc actaaatttc acctggatca 1020gattgttgtt tcctaaacca catgtaccca ggaaatgccc actaaatttc acctggatca 1020

gtgttaactg atcattggga aatgaggtga ccaaaaatgc atcgcaacct tggacaaaca 1080gtgttaactg atcattggga aatgaggtga ccaaaaatgc atcgcaacct tggacaaaca 1080

gcatggctat ttaacattct gggatcctgc agaatcctgc atcttcctaa gtagggaagc 1140gcatggctat ttaacattct gggatcctgc agaatcctgc atcttcctaa gtagggaagc 1140

actgtagcat tggagagagg cctgggcgag cagagctaag gcttccattt ctggcttgct 1200actgtagcat tggagagagg cctgggcgag cagagctaag gcttccattt ctggcttgct 1200

tggaatttaa aacaagcttt tttctatata gtaaaagatt gtttttaaga tttttgcgtg 12601260

tgagtacatg ccaaagtagc caggaagtgt cacttgccct ggagctagaa ttactggcaa 1320tgagtacatg ccaaagtagc caggaagtgt cacttgccct ggagctagaa ttactggcaa 1320

atgaaggctc agaggtggat gctgggacca attctaggcc ctctgagaaa gcaggtgcac 1380atgaaggctc agaggtggat gctgggacca attctaggcc ctctgagaaa gcaggtgcac 1380

ttggcttgtg cctccagccc caaaggcgat ggcttattgt gagcctgagg ccagccaggg 1440ttggcttgtg cctccagccc caaaggcgat ggcttattgt gagcctgagg cgccaggg 1440

ttacagagac tcaagaaaca agtggggttg tccatgttgc tggagatgac ccaggtctat 1500tcagagac tcaagaaaca agtggggttg tccatgttgc tggagatgac ccaggtctat 1500

taggaccttg actacatgga tagacattct ggcagctagt atactgccat tggggcctat 1560taggaccttg actacatgga tagacattct ggcagctagt atactgccat tggggcctat 1560

ggagaagtag ccaccgagcc tatttagaaa gaaggactgc tggcaagctt ggtgtcacta 1620ggagaagtag ccaccgagcc tatttagaaa gaaggactgc tggcaagctt ggtgtcacta 1620

tgaaggcaga caaagatcga tgtattaacg accccgactc caaaaacact cgagggggcc 1680tgaaggcaga caaagatcga tgtattaacg accccgactc caaaaacact cgaggggggcc 1680

caaggtgggc tcagtggtta agagccgttc gcccaggggc tggagagttg gctcagtggt 1740caaggtgggc tcagtggtta agagccgttc gcccaggggc tggagagttg gctcagtggt 1740

accacatggt ggctcacaac catctgtaat gagatctgac gccctcttct ggtgtatctg 1800accacatggt ggctcacaac catctgtaat gagatctgac gccctcttct ggtgtatctg 1800

aagacagcta cagtgtactt acataaaata aataaatctt t 1841aagacagcta cagtgtactt acataaaata aataaatctt t 1841

<210> 206<210> 206

<211> 2035<211> 2035

<212> ДНК<212> DNA

<220><220>

<223> последовательность, кодирующая мРНК rpl32 - PpLuc(GC) - альбумин - A64<223> mRNA coding sequence rpl32 - PpLuc(GC) - albumin - A64

- C30 - гистонSL - C30 - histoneSL

<400> 206<400> 206

gtgggcgagg ccgtggccaa gcggttccac ctcccgggca tccgccaggg ctacggcctg 10801080

aagtacaagg gctaccaggt ggcgccggcc gagctggaga gcatcctgct ccagcacccc 14401440

aagaagggcg gcaagatcgc cgtgtaagac tagtgcatca catttaaaag catctcagcc 1740aagaagggcg gcaagatcgc cgtgtaagac tagtgcatca catttaaaag catctcagcc 1740

taccatgaga ataagagaaa gaaaatgaag atcaatagct tattcatctc tttttctttt 1800taccatgaga ataagagaaa gaaaatgaag atcaatagct tattcatctc tttttctttt 1800

tcgttggtgt aaagccaaca ccctgtctaa aaaacataaa tttctttaat cattttgcct 1860tcgttggtgt aaagccaaca ccctgtctaa aaaacataaa tttctttaat cattttgcct 1860

cttttctctg tgcttcaatt aataaaaaat ggaaagaacc tagatctaaa aaaaaaaaaa 1920cttttctctg tgcttcaatt aataaaaaat ggaaagaacc tagatctaaa aaaaaaaaaa 1920

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa atgcatcccc 1980aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa atgcatcccc 1980

cccccccccc cccccccccc cccccccaaa ggctcttttc agagccacca gaatt 2035cccccccccc cccccccccc cccccccaaa ggctcttttc agagccacca gaatt 2035

<---<---

Claims

1. An artificial nucleic acid molecule for increasing protein yield, comprising:

a. at least one open reading frame (ORF); and

b. at least one element of the 3'-untranslated region (3'-UTR element), which contains a nucleotide sequence derived from the 3'-UTR of a ribosomal protein gene or from a variant of the 3'-UTR of a ribosomal protein gene selected from the group consisting of from ribosomal protein S9 (RPS9), ribosomal protein S19 (RPS19), ribosomal protein S21 (RPS21), ribosomal protein S27 (RPS27), ribosomal protein S28 (RPS28), ribosomal protein S29 (RPS29) and ribosomal protein L35a (RPL35A).

2. An artificial nucleic acid molecule according to claim 1, wherein the 3'-UTR is heterologous to ORF.

3. An artificial nucleic acid molecule according to claim 1 or 2, in which the open reading frame (ORF) does not encode a reporter gene or is not derived from a reporter gene, where the reporter gene is preferably not selected from the group consisting of globin proteins (primarily beta- globin), luciferase protein, beta-glucuronidase (GUS) proteins and GFP or variants thereof, preferably not from EGFP, or variants whose sequences are at least 70% identical to the sequence of the globin protein, luciferase protein or GFP protein.

4. Artificial nucleic acid molecule according to one of paragraphs. 1-3, in which the open reading frame (ORF) does not encode a ribosomal protein, preferably does not encode a eukaryotic ribosomal protein.

5. Artificial nucleic acid molecule according to one of paragraphs. 1-4, in which the open reading frame (ORF) does not encode a human or plant ribosomal protein, in particular human ribosomal protein S6 (RPS6), human ribosomal protein L36a-like (RPL36AL), or Arabidopsis ribosomal protein S16 (RPS16).

6. Artificial nucleic acid molecule according to one of paragraphs. 1-5, in which the open reading frame (ORF) does not encode ribosomal protein S6 (RPS6), ribosomal protein L36a-like (RPL36AL), or ribosomal protein S16 (RPS16).

7. Artificial nucleic acid molecule according to one of paragraphs. 1-6, in which the 3'-UTR, preferably an artificial nucleic acid molecule, does not contain a poly(A)-sequence or polyadenylation signal, or in which the 3'-UTR, preferably an artificial nucleic acid molecule, additionally contains a poly(A)- polyadenylation sequence and/or signal.

8. An artificial nucleic acid molecule according to claim 7, wherein the poly(A) sequence or polyadenylation signal is/is localized at the 3'-end of the 3'-UTR element.

9. An artificial nucleic acid molecule according to claim 7 or 8, wherein the polyadenylation signal contains the consensus sequence NN(U/T)ANA, where N is A or U, preferably AA(U/T)AAA or A(U/T) (U/T)AAA.

10. Artificial nucleic acid molecule according to one of paragraphs. 7-9 in which the polyadenylation signal, preferably the NNUANA consensus sequence, is located less than about 50 nucleotides downstream of the 3' end of the 3' UTR element.

11. Artificial nucleic acid molecule according to one of paragraphs. 7-10, wherein the poly(A) sequence is from about 20 to about 300 adenine nucleotides in length, preferably from about 40 to about 200 adenine nucleotides, more preferably from about 50 to about 100 adenine nucleotides, even more preferably from about 60 up to about 70 adenine nucleotides.

12. An artificial nucleic acid molecule according to one of paragraphs. 1-11, in which the nucleic acid contains an additional 5'-terminal element, preferably a 5'-UTR, a promoter, or a sequence containing a 5'-UTR and a promoter.

13. An artificial nucleic acid molecule according to claim 12, wherein the 5'-UTR is a 5'-UTR of 5'-TOP.

14. An artificial nucleic acid molecule according to claim 12 or 13, in which the 5'-UTR does not contain a 5'-TOP motif.

15. Artificial nucleic acid molecule according to one of paragraphs. 1-14, in which the artificial nucleic acid molecule also contains a 5'-UTR and in which all 3'-UTRs, ORFs, and 5'-UTRs are heterologous to each other.

16. An artificial nucleic acid molecule according to one of paragraphs. 1-15, in which at least one 3'-UTR element contains or consists of a nucleotide sequence identical to at least about 1, 2, 3, 4, 5, 10, 15, 20, 30, or 40%, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of a nucleotide sequence selected from the group consisting of SEQ ID NOs: 40, 58, 66, 69, 73, 75, 76, 144, 161, 169 , 171, 175, 177 and 178, or in which at least one 3'-UTR element contains or consists of a fragment of a nucleotide sequence that is at least about 40% identical, preferably at least about 50%, preferably at least about 60%, preferably at least an example but 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of the nucleotide sequence selected from the group consisting of SEQ ID NOs: 40, 58, 66, 69, 73, 75, 76, 144, 161, 169, 171, 175, 177 and 178.

17. The artificial nucleic acid molecule of claim 16, wherein the fragment is 3 to about 500 nucleotides in length, preferably 5 to about 150 nucleotides, more preferably 10 to 100 nucleotides, even more preferably 15 to 90, most preferably 20 to 70 nucleotides.

18. Artificial nucleic acid molecule according to one of paragraphs. 1-17, in which at least one 3'-UTR element has a length of 3 to about 500 nucleotides, preferably from 5 to about 150 nucleotides, more preferably from 10 to 100 nucleotides, even more preferably from 15 to 90, most preferably 20 to 70 nucleotides.

19. Artificial nucleic acid molecule according to one of paragraphs. 1-18, additionally containing a 5' cap structure, a poly(C) sequence, a histone stem-loop structure, and/or an IRES motif.

20. An artificial nucleic acid molecule according to one of paragraphs. 1-19, in which the histone stem-loop structure contains the sequence shown in SEQ ID NO: 5.

21. An artificial nucleic acid molecule according to one of paragraphs. 1-20, wherein the artificial nucleic acid molecule, preferably an open reading frame, has at least partially modified G/C content, wherein preferably the G/C content of the open reading frame is increased compared to the wild-type open reading frame.

22. An artificial nucleic acid molecule according to one of paragraphs. 1-21, wherein the open reading frame contains a codon-optimized region, wherein the open reading frame preferably has optimized codons.

23. An artificial nucleic acid molecule according to one of paragraphs. 1-22, which is an RNA, preferably an mRNA molecule.

24. An expression vector containing an artificial nucleic acid molecule according to one of paragraphs. 1-23.

25. The vector according to claim 24, which is a DNA vector.

26. Vector according to one of paragraphs. 24-25, which is a plasmid vector or a viral vector, preferably a plasmid vector.

27. Vector according to one of paragraphs. 24-26, which is a circular molecule.

28. The vector of claim 27, wherein the poly(A) sequence, poly(C) sequence, stem-loop histone structure, or 3'-UTR element in the coding strand is located 5'→3' direction of a restriction site intended to linearize a circular vector molecule.

29. Cell for obtaining the target protein containing an artificial nucleic acid molecule according to one of paragraphs. 1-23 or a vector according to one of paragraphs. 24-28.

30. A cell according to claim 29, which is a mammalian cell.

31. A cell according to claim 29 or 30, which is a mammalian cell, preferably an isolated mammalian cell, preferably a human.

32. A method for increasing protein yield from an artificial nucleic acid molecule, preferably from an mRNA molecule or a vector, comprising the step of associating the nucleic acid molecule, preferably an mRNA molecule or vector, with a 3'-UTR element, where the 3'-UTR element contains or consists from a nucleotide sequence derived from the 3'-UTR of a ribosomal protein gene or from a 3'-UTR variant of a ribosomal protein gene selected from the group consisting of ribosomal protein S9 (RPS9), ribosomal protein S1 (RPS19), ribosomal protein S21 (RPS21 ), ribosomal protein S27 (RPS27), ribosomal protein S28 (RPS28), ribosomal protein S29 (RPS29), and ribosomal protein L35a (RPL35A).

33. The method according to p. 32, in which the 3'-UTR element contains or consists of a nucleotide sequence identical to at least about 40%, preferably at least about 50%, preferably at least about 60%, preferably at least about 70%, more preferably at least about 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% a nucleotide sequence selected from the group consisting of SEQ ID NOs: 40, 58, 66, 69, 73, 75, 76, 144, 161, 169, 171, 175, 177 and 178, or in which the 3'-UTR element contains or consists of a nucleotide sequence fragment that is at least about 40% identical, preferably at least about 50% identical, preferably at least about 60% identical, preferably at least about 70% identical, more preferably at least about on the 80%, more preferably at least about 90%, even more preferably at least about 95%, even more preferably at least about 99% of a nucleotide sequence selected from the group consisting of SEQ ID NOs: 40, 58 , 66, 69, 73, 75, 76, 144, 161, 169, 171, 175, 177 and 178.

34. The method of claim 33, wherein the fragment is 3 to about 500 nucleotides in length, preferably 5 to about 150 nucleotides, more preferably 10 to about 100 nucleotides, even more preferably 15 to 90, most preferably 20 to 70 nucleotides.

35. The method according to one of paragraphs. 32-34, wherein the 3'UTR element is 3 to about 500 nucleotides in length, preferably 5 to about 150 nucleotides, more preferably 10 to 100 nucleotides, even more preferably 15 to 90, most preferably 20 to 70 nucleotides.